最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

基于大語言模型和節(jié)點(diǎn)糾纏的圖對比學(xué)習(xí)謠言檢測方法

文檔序號:41948938發(fā)布日期:2025-05-16 14:06閱讀:4來源:國知局
基于大語言模型和節(jié)點(diǎn)糾纏的圖對比學(xué)習(xí)謠言檢測方法

本發(fā)明屬于計算機(jī)應(yīng)用,具體涉及到圖對比學(xué)習(xí)。


背景技術(shù):

1、隨著互聯(lián)網(wǎng)的快速發(fā)展,社交媒體已成為人們獲取信息的主要途徑。然而,社交媒體上的信息質(zhì)量參差不齊,一些用戶故意散布謠言,使得信息的真實(shí)性難以保證。謠言的傳播不僅會擾亂社會秩序,還可能損害公眾的利益。因此,開發(fā)高效且準(zhǔn)確的謠言檢測技術(shù)顯得尤為重要。

2、大多數(shù)現(xiàn)有的謠言檢測方法通常采用監(jiān)督學(xué)習(xí)的框架,但這種方法存在兩個主要問題。首先,它依賴于大量的人工標(biāo)注數(shù)據(jù),這不僅成本高昂,而且非常耗費(fèi)時間。其次,由于模型容易過擬合,其泛化能力較弱,并且在面對與標(biāo)簽相關(guān)的攻擊時,模型的魯棒性也較差。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明所要解決的技術(shù)問題在于克服上述現(xiàn)有技術(shù)的缺點(diǎn),提供一種泛化能力和魯棒性強(qiáng)、檢測準(zhǔn)確的基于大語言模型和節(jié)點(diǎn)糾纏的圖對比學(xué)習(xí)謠言檢測方法。

2、解決上述技術(shù)問題所采用的技術(shù)方案由下述步驟組成:

3、(1)劃分?jǐn)?shù)據(jù)集

4、在https://www.dropbox.com/s/7ewzdrbelpmrnxu/rumdetect2017.zip?dl=0網(wǎng)址下載twitter15作為謠言數(shù)據(jù)集,將謠言數(shù)據(jù)集按照8:2劃分為訓(xùn)練集和測試集。

5、(2)構(gòu)建謠言傳播圖

6、按下式構(gòu)建謠言傳播圖gi:

7、gi=(vi,ei)

8、

9、ei={e1,e2,…,em}

10、其中,vi表示推文節(jié)點(diǎn)集合,ri表示第i個謠言事件的源推文,表示第i個謠言事件的源推文中第ni-1個轉(zhuǎn)發(fā)或評論推文,ni表示節(jié)點(diǎn)個數(shù),ei表示邊集合,em表示第m條邊;源推文和轉(zhuǎn)發(fā)或評論推文構(gòu)成原始推文內(nèi)容so。

11、(3)構(gòu)建特征增強(qiáng)視圖

12、1)構(gòu)建大語言模型提示模板

13、大語言模型提示模板t由原始推文內(nèi)容so、推文是否為謠言構(gòu)成。

14、2)構(gòu)建最終的文本屬性

15、選擇大語言模型gpt3.5,調(diào)用大語言模型gpt3.5的應(yīng)用程序編程接口,將大語言模型提示模板t輸入至大語言模型gpt3.5中,獲取模型輸出結(jié)果,該結(jié)果包含對推文的謠言類別判斷c以及對該判斷的文本解釋e,將輸出結(jié)果以json格式保存,用json庫解析json格式的輸出結(jié)果,從中提取對該判斷的文本解釋e作為增強(qiáng)屬性sa。

16、采用python語言中的append函數(shù),將提取得到的增強(qiáng)屬性sa添加到原始推文內(nèi)容so的末尾,得到最終的文本屬性sf。

17、3)確定節(jié)點(diǎn)特征

18、按下式確定節(jié)點(diǎn)特征x:

19、x=fbert(s)

20、其中,s表示需要編碼的文本信息,s∈{so,sf},fbert表示bert模型。

21、4)構(gòu)建特征增強(qiáng)視圖

22、分別將原始推文內(nèi)容so和最終的文本屬性sf輸入bert模型,得到對應(yīng)的節(jié)點(diǎn)特征xo和節(jié)點(diǎn)特征xf,xo∈rn×d,xf∈rn×d,即為具有節(jié)點(diǎn)特征xo的謠言事件原始圖gk和具有節(jié)點(diǎn)特征xf的特征增強(qiáng)視圖

23、(4)構(gòu)建結(jié)構(gòu)增強(qiáng)視圖

24、1)將原始圖g轉(zhuǎn)換為線圖lg

25、采用networkx庫中的line_graph函數(shù)將原始圖g轉(zhuǎn)換為線圖lg。

26、2)確定重要的節(jié)點(diǎn)

27、按式(1)確定重要節(jié)點(diǎn)

28、

29、l1=d1-a1

30、l2=d2-a2

31、

32、其中,β是超參數(shù),β取值為有限正整數(shù),z1和z2是中間變量,d1表示刪除線圖中的節(jié)點(diǎn)v后的圖lg_v的度矩陣,a1表示lg_v的鄰接矩陣,d2表示lg的度矩陣,a2表示lg的鄰接矩陣,n1表示拉普拉斯矩陣l1的特征值數(shù)量,n1∈[1,ni-1],n2表示拉普拉斯矩陣l2的特征值數(shù)量,n2∈[1,ni],ni為有限的正整數(shù),表示拉普拉斯矩陣l1的第i個特征值,表示拉普拉斯矩陣l2的第i個特征值。

33、3)構(gòu)建結(jié)構(gòu)增強(qiáng)視圖

34、按式(2)原始邊集e中采樣修改的子集的概率p:

35、

36、其中,pc為一個超參數(shù),ps為截止概率。

37、保留子集的概率p最大的邊構(gòu)成修改的子集得到具有節(jié)點(diǎn)特征xo的結(jié)構(gòu)增強(qiáng)視圖

38、(5)構(gòu)建謠言檢測模型

39、謠言檢測模型包括編碼模型和圖神經(jīng)網(wǎng)絡(luò)分類器。

40、所述的編碼模型由圖卷積層1與圖卷積層2串聯(lián)構(gòu)成。

41、所述的圖神經(jīng)網(wǎng)絡(luò)分類器由全連接層與softmax層串聯(lián)構(gòu)成。

42、(6)訓(xùn)練謠言檢測模型

43、1)構(gòu)建圖級嵌入向量

44、分別將無向的謠言事件原始圖gk、增強(qiáng)視圖增強(qiáng)視圖輸入編碼模型,得到對應(yīng)的圖級嵌入向量,分別為hk,

45、2)映射到對比空間

46、按下式將圖級嵌入向量映射到對比空間。

47、z=g(h)

48、其中,g(·)是一個由兩層感知機(jī)組成的非線性變換,h表示圖級嵌入向量。

49、將圖級嵌入向量和圖級嵌入向量映射到對比空間,得到對比空間中的圖級嵌入向量和圖級嵌入向量

50、3)構(gòu)建圖對比損失函數(shù)

51、按式(3)構(gòu)建圖對比損失函數(shù)lgcl:

52、

53、其中,τ是溫度系數(shù),sim(·)表示相似度度量函數(shù),表示正樣本對,表示負(fù)樣本對。

54、4)構(gòu)建分類損失函數(shù)

55、按式(4)構(gòu)建分類損失函數(shù)lclass:

56、

57、其中,yi表示第i個謠言事件的真實(shí)值,表示第i個謠言事件的預(yù)測值,n表示謠言事件的數(shù)量,w和b是參數(shù),σ表示激活函數(shù),hi是將第i個謠言事件原始圖gk_i輸入編碼模型得到的嵌入向量。

58、5)構(gòu)建謠言檢測模型損失函數(shù)

59、按式(5)構(gòu)建謠言檢測模型損失函數(shù):

60、l=λlgcl+lclass????????????????????????????????????????????(5)

61、其中,λ表示權(quán)重系數(shù);

62、6)訓(xùn)練謠言檢測模型

63、將訓(xùn)練集輸入到訓(xùn)練謠言檢測模型中進(jìn)行訓(xùn)練,訓(xùn)練參數(shù)為:初始學(xué)習(xí)率為0.0001,權(quán)重衰減為0.00001,迭代次數(shù)為3000,采用adam優(yōu)化器優(yōu)化模型參數(shù),訓(xùn)練至謠言檢測模型損失函數(shù)l收斂。

64、(7)測試謠言檢測模型

65、將測試集輸入謠言檢測模型進(jìn)行測試,輸出謠言檢測結(jié)果。

66、在本發(fā)明的步驟(4)增強(qiáng)結(jié)構(gòu)空間的式(1)中,所述的β是超參數(shù),β∈[1,200],n1表示l1的特征值數(shù)量,n1∈[1,ni-1],n2表示l2的特征值數(shù)量,n2∈[1,ni],ni的具體取值與謠言數(shù)據(jù)集中節(jié)點(diǎn)的個數(shù)相同。

67、在本發(fā)明的步驟(4)增強(qiáng)結(jié)構(gòu)空間的式(2)中,所述的pc為一個超參數(shù),pc∈(0,1),ps為截止概率,ps∈(0,1)。

68、在本發(fā)明的步驟(6)訓(xùn)練謠言檢測模型的式(3)中,所述的τ為溫度系數(shù),τ∈(0,1)。

69、在本發(fā)明的步驟(6)訓(xùn)練謠言檢測模型的式(4)中,所述的n表示樣本的數(shù)量,n取值至少為1;所述的w是參數(shù),w取值為(0,1),b是參數(shù),b取值為[0,1)。

70、在本發(fā)明的步驟(6)訓(xùn)練謠言檢測模型的式(5)中,所述的λ表示權(quán)重系數(shù),λ取值為(0,1)。

71、由于本發(fā)明采用基于大語言模型的特征空間增強(qiáng)和基于節(jié)點(diǎn)糾纏的結(jié)構(gòu)空間增強(qiáng),使得編碼模型能夠捕捉謠言更本質(zhì)的圖結(jié)構(gòu)特征,有效緩解了現(xiàn)有謠言檢測方法依賴大量標(biāo)簽數(shù)據(jù)的技術(shù)問題,增強(qiáng)了謠言檢測模型的泛化能力和魯棒性。通過使用大語言模型對句子屬性的強(qiáng)大理解能力,使得節(jié)點(diǎn)特征更加豐富、準(zhǔn)確,實(shí)現(xiàn)了更精準(zhǔn)的謠言檢測。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1