本發(fā)明屬于社交網(wǎng)絡(luò)與智能體系統(tǒng)領(lǐng)域,具體涉及一種對于社交網(wǎng)絡(luò)中錯誤信息影響最小化的動態(tài)方法。
背景技術(shù):
1、近年來,隨著網(wǎng)絡(luò)技術(shù)和社交媒體的快速發(fā)展,像twitter、facebook、微博、微信這樣的社交網(wǎng)絡(luò)的規(guī)模和受歡迎程度顯著增加。在這些社交網(wǎng)絡(luò)中,每天有大量信息可以迅速而廣泛地在用戶之間傳播。社交網(wǎng)絡(luò)的這些特點吸引了更多研究者關(guān)注社交網(wǎng)絡(luò)中的影響擴(kuò)散模型。影響擴(kuò)散模型可以通過識別和選擇社交網(wǎng)絡(luò)中最具影響力的用戶來加速和擴(kuò)大信息的傳播速度和覆蓋范圍。然而,由于用戶可以在社交網(wǎng)絡(luò)中自由發(fā)布信息,很多用戶出于不同目的發(fā)布大量虛假信息。虛假信息的廣泛傳播可能導(dǎo)致嚴(yán)重的公眾輿論偏差,并對社會產(chǎn)生負(fù)面影響。如今,社交網(wǎng)絡(luò)中的虛假信息已成為一個主要的社會問題。
2、為了最小化虛假信息對社會的影響,早期的檢測和預(yù)防至關(guān)重要。許多研究者建議識別社交網(wǎng)絡(luò)中的重要節(jié)點(即用戶)和連接,并在必要時進(jìn)行封鎖,以防止虛假信息的傳播。然而,隨著社交網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大,尋找和監(jiān)控重要節(jié)點變得極其耗費時間和資源。此外,社交網(wǎng)絡(luò)的動態(tài)變化也可能導(dǎo)致重要節(jié)點和連接的變化,這些檢測方法不能及時應(yīng)對動態(tài)改變的社交網(wǎng)絡(luò)。一些研究者利用有影響力的用戶來防止其他用戶傳播虛假信息,以最小化虛假信息的影響。然而,社交網(wǎng)絡(luò)中有影響力的用戶數(shù)量有限,他們的分布對虛假信息的檢測和預(yù)防有很大影響。
3、近年來,轉(zhuǎn)移目標(biāo)用戶的注意力,使其不再關(guān)注虛假信息,被證明是一種快速阻止虛假信息傳播的實際有效方法。研究人員提出了一個影響最小化模型,該模型可以通過發(fā)送與用戶感興趣的其他主題相關(guān)的信息來轉(zhuǎn)移目標(biāo)用戶的注意力。但是他們的模型只關(guān)注不同信息內(nèi)容對目標(biāo)用戶注意力轉(zhuǎn)移的影響。而實際的社交網(wǎng)絡(luò)中,由于網(wǎng)絡(luò)結(jié)構(gòu)的大規(guī)模和復(fù)雜性,信息發(fā)送路徑對目標(biāo)用戶的注意力轉(zhuǎn)移效果也有重大影響。
技術(shù)實現(xiàn)思路
1、針對上述尚沒有解決的關(guān)鍵問題,本發(fā)明提出了一種去中心化的方法來最小化社交網(wǎng)絡(luò)中虛假信息的影響。首先,該方法使用智能代理來模擬社交網(wǎng)絡(luò)中的用戶,利用一種信息發(fā)送路徑探索機(jī)制,使得檢測到持有虛假信息的目標(biāo)用戶的用戶能夠以去中心化的方式探索高效有效的信息發(fā)送路徑。此外,還提出了一種動態(tài)注意力轉(zhuǎn)移機(jī)制,使得用戶能夠根據(jù)目標(biāo)用戶的厭倦感動態(tài)更新和選擇合適的信息及其發(fā)送路徑。并在不同的成本約束下對其有效性進(jìn)行了解釋。
2、為實現(xiàn)上述目的,本發(fā)明采用如下的技術(shù)方案:
3、一種對于社交網(wǎng)絡(luò)中錯誤信息影響最小化的動態(tài)方法包括以下步驟:
4、步驟1、首先根據(jù)真實的數(shù)據(jù)集構(gòu)建用戶社交網(wǎng)絡(luò)圖s,以及信息集msg。圖s中的信息包含用戶唯一標(biāo)識符id,用戶的個人影響力infi,以及用戶之間的關(guān)系強(qiáng)度ri,j。
5、步驟2、定義用戶對不同信息的興趣度prei,以及用戶的注意力空間mepi,為后續(xù)分析提供基礎(chǔ);
6、步驟3、確定影響用戶注意力值的因素。結(jié)合社會學(xué)知識,確定用戶對不同信息的注意力值主要受用戶自身對該信息的興趣度intei,k,以及信息傳播者對被傳播者的影響度effei,j兩個主要因素的影響。effei,j受用戶i和用戶j之間的偏好相似度presi,j,關(guān)系強(qiáng)度ri,j,以及相對影響力infdi,j的影響;
7、步驟4、制定信息發(fā)送路徑的探索策略。根據(jù)用戶之間的相對影響力,逐層探索信息發(fā)送路徑,并計算最終路徑對目標(biāo)用戶的影響力值和路徑傳播成功的概率值。這一步保證我們選擇的信息傳播路徑是對用戶影響力較大的路徑;
8、步驟5、為不同的路徑動態(tài)匹配有效的信息。根據(jù)目標(biāo)用戶注意力空間的情況,選擇要傳播的信息,并加入?yún)捑胍蜃觔i,k來動態(tài)調(diào)整路徑每輪匹配的信息,以達(dá)到最佳的效率。
9、步驟6、通過多輪次信息傳播,改變目標(biāo)用戶的注意力,最終將錯誤信息從其注意力空間中移除;在ic獨立級聯(lián)擴(kuò)散模型下進(jìn)行測試,獲得將錯誤信息從目標(biāo)用戶的注意力空間中移除所需要的信息傳播輪次,來評估方法的有效性;
10、作為優(yōu)選,步驟1中的構(gòu)建社交網(wǎng)絡(luò)s的步驟如下:
11、步驟1-1:在社交網(wǎng)絡(luò)中,有大量的用戶,這些用戶之間存在不同的關(guān)系。通常,社交網(wǎng)絡(luò)可以用無向圖來表示,其中節(jié)點和邊分別用來代表用戶和他們之間的關(guān)系。社交網(wǎng)絡(luò)s可以定義如下:
12、s={u,r}
13、其中u={u1,u2,...ui,...}表示用戶集合,ui是s中的第i個用戶;r={r1,2,r1,3,...,ri,j,...}表示關(guān)系集合,ri,j是用戶ui和uj之間的關(guān)系程度。ri,j的值在0到1之間,其中0和1分別代表用戶之間最遠(yuǎn)和最近的關(guān)系。由于s由無向圖表示,所以ri,j=rj,i·。
14、步驟1-2:信息集msg由多個信息組成,一個信息msgk可以根據(jù)其主題和關(guān)鍵詞來定義如下:
15、msgk={topick}
16、其中topick={kw1,kw2,...,kwn}是信息msgk的主題kwt是主題中的第t個關(guān)鍵詞。
17、步驟1-3:社交網(wǎng)絡(luò)s中的定義如下:
18、ui={id,prei,infi,nui,mepi}
19、其中,id是用戶ui的唯一標(biāo)識,prei是用戶ui的偏好,infi是用戶ui的個人影響力,nui是用戶ui的鄰居用戶集合,而mepi是用戶ui的消息池,它包括用戶ui收到的所有消息。
20、作為優(yōu)選,步驟2中的定義信息包括包括:
21、步驟2-1:用戶的興趣度prei可以描述如下:
22、prei={kw1,kw2,...,kwt,...}
23、其中,kwt是描述用戶i偏好的第t個關(guān)鍵詞。
24、步驟2-2:用戶的注意力空間mepi如下:
25、mepi=(msg1,msg2,...,msgk,...}
26、mepi是用戶i的消息池,它包括其收到的所有消息。
27、作為優(yōu)選,步驟3的用戶注意力值的影響因素計算如下:
28、步驟3-1:用戶ui對信息msgk的注意力主要受用戶自身對該信息的興趣度intei,k,以及信息傳播者uj對ui的影響度effei,j兩個主要因素的影響。
29、步驟3-2:用戶i對消息k的興趣intei,k通過從i的偏好prei和k的主題topick之間的jaccard相似度中得出,計算方法如下:
30、
31、其中,prei={kw1,kw2,...,kwt,...}是用戶i的偏好關(guān)鍵詞的集合,topick={kw1,kw2,...,kwn}是消息k的主題關(guān)鍵詞的集合,取兩個集合的交集元素數(shù)量和并集元素數(shù)量之比。
32、步驟3-3:用戶j對i的相對個人影響力effei,j計算方法如下:
33、effei,j=(ri,j+presi,j+infdi,j)/3,
34、其中,ri,j是用戶i和j之間的聯(lián)系緊密度,通過對數(shù)據(jù)集中信息處理獲得,presi,j是用戶i和j之間的偏好相似度,infdi,j是用戶j對i的個人相對影響力,兩者的計算方法如下:
35、
36、
37、其中,prei和prej分別是用戶i和j的個人偏好,infj和infi分別是用戶j和i的個人影響力值,取兩個集合的交集元素數(shù)量和并集元素數(shù)量之比,λ是相對系數(shù),取值在0到1之間。
38、作為優(yōu)選,步驟4所述的信息發(fā)送路徑選擇策略包括:
39、步驟4-1:將當(dāng)前用戶d設(shè)置為錯誤信息的檢測者,并遍歷其鄰域用戶。如果遇到目標(biāo)用戶t,計算影響效果effe和路徑傳播成功的概率pl,并將這些信息添加到當(dāng)前路徑中。
40、路徑的信息傳播成功概率pl計算公式如下:
41、
42、步驟4-2:如果沒有遇到目標(biāo)用戶且當(dāng)前路徑的長度沒有超過最大探索層數(shù)max,繼續(xù)探索鄰域用戶的鄰域用戶,逐步構(gòu)建路徑path。如果路徑長度達(dá)到限制即大于最大探索層數(shù)max,將放棄當(dāng)前路徑。
43、步驟4-3:在探索完所有可能的路徑后,檢查路徑集合中是否有影響效果相同的路徑。如果有,比較這些路徑的傳播成功概率,保留概率最大的路徑,移除概率較小的路徑。
44、最終,返回經(jīng)過篩選的路徑集合,這些路徑代表了從錯誤信息檢測者到目標(biāo)用戶的傳播效果最好的影響路徑。這個過程確保了信息傳播的效率和效果,同時考慮了信息傳播的深度限制。
45、作為優(yōu)選,步驟5所所述的動態(tài)信息匹配策略如下:
46、步驟5-1:選擇目標(biāo)用戶注意力空間中的信息集作為要傳播的信息,增強(qiáng)其注意力。
47、步驟5-2:遍歷路徑集合,對選擇的路徑,計算通過這條路徑l傳播信息k對目標(biāo)用戶的潛在注意力變化,計算公式如下:
48、δatti,k,l=pintei,kbi,k+qeffei,j+mpl
49、其中p,q,m是各因素的平衡系數(shù),取值在0到1之間,bi,k是用戶i當(dāng)前對信息k的厭倦度,其值隨用戶收到該信息次數(shù)的增加而減小,值越小厭倦度越高,對注意力變化的影響越小,計算如下:
50、bi,k=1-n×numk
51、其中numk是用戶收到該信息的次數(shù),n是放縮因子,根據(jù)整數(shù)numk的取值范圍將其放縮到0到1之間。
52、通過計算,為每條路徑匹配當(dāng)前發(fā)送輪次傳播效果最好的信息。
53、步驟5-3:更新目標(biāo)用戶對該消息的注意力。
54、這個過程可以一直持續(xù),直到目標(biāo)用戶對該錯誤信息的注意力值降至低于注意力空間中所有信息,認(rèn)為該錯誤信息淡出用戶的注意力空間,影響消除。
55、作為優(yōu)選,步驟6所述在ic獨立級聯(lián)擴(kuò)散模型下選擇目標(biāo)節(jié)點及其注意力空間中的錯誤信息,根據(jù)目標(biāo)節(jié)點及其周圍鄰域用戶,確定源節(jié)點,其檢測到目標(biāo)節(jié)點被污染,開始探索傳播正確信息的可能路徑,并確定傳播的正確信息。直至目標(biāo)用戶對錯誤信息的注意力值低于注意力空間中所有信息,退出目標(biāo)的注意力空間,影響消除。獲取影響消除所需要的信息傳播輪次,輪次越少,證明方法的效果越好。
56、本發(fā)明采用以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下技術(shù)效果:
57、本發(fā)明相對于以往的方法,最大的優(yōu)勢在于一定程度上解決了網(wǎng)絡(luò)結(jié)構(gòu)多變和網(wǎng)絡(luò)規(guī)模過大帶來的問題。無論是傳統(tǒng)的屏蔽用戶節(jié)點或者切斷用戶之間聯(lián)系的中心化方法還是之前的利用信息環(huán)境來降低虛假信息影響的方法,都存在受網(wǎng)絡(luò)結(jié)構(gòu)和規(guī)模限制,導(dǎo)致方法計算復(fù)雜度和結(jié)果不穩(wěn)定的問題,而我們所提出的方法是去中心化的,目標(biāo)的檢測和行為的發(fā)起都是在局部區(qū)域內(nèi)的?;谏鲜鲆蛩?,所提出的方法的貢獻(xiàn)可以總結(jié)如下:1、所提出方法的信息發(fā)送路徑探索機(jī)制,使用戶能夠在去中心化的方式中探索到目標(biāo)用戶的高效和有效的信息發(fā)送路徑;2、所提出方法的動態(tài)注意力轉(zhuǎn)移機(jī)制,使用戶能夠根據(jù)目標(biāo)用戶的厭倦感動態(tài)更新和選擇合適的信息及其發(fā)送路徑;3、在真實社交網(wǎng)絡(luò)數(shù)據(jù)集上的比較實驗表明,所提出方法在虛假信息影響最小化方面具有高效率、高效能和低成本的良好表現(xiàn)。