最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

基于多尺度語義知識獲取的一體化情感隱喻識別方法、裝置、設(shè)備和介質(zhì)

文檔序號:41946841發(fā)布日期:2025-05-16 14:04閱讀:4來源:國知局
基于多尺度語義知識獲取的一體化情感隱喻識別方法、裝置、設(shè)備和介質(zhì)

本發(fā)明涉及自然語言處理,具體而言,涉及一種基于多尺度語義知識獲取的一體化情感隱喻識別方法。


背景技術(shù):

1、情感隱喻作為一種特殊的語言表達形式,在人類交際和文化傳承中扮演著重要角色。隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,社交媒體和在線交流平臺產(chǎn)生了大量包含情感隱喻的文本內(nèi)容。這些文本數(shù)據(jù)中蘊含的情感隱喻信息對于用戶情感分析和智能交互等領(lǐng)域具有重要的應(yīng)用價值。

2、然而,由于情感隱喻表達方式的多樣性和復(fù)雜性,以及其強烈的語境依賴特征,準(zhǔn)確識別和分析文本中的情感隱喻仍然面臨著巨大挑戰(zhàn)。特別是在當(dāng)前信息高度碎片化的背景下,如何從海量文本數(shù)據(jù)中精確捕捉情感隱喻特征,已成為自然語言處理領(lǐng)域亟待解決的關(guān)鍵問題。

3、現(xiàn)有的情感隱喻識別方法往往將隱喻識別和情感識別割裂開來,忽視了兩者之間的內(nèi)在聯(lián)系和相互影響。傳統(tǒng)的單一尺度分析方法難以全面把握文本的語義特征,而簡單的特征疊加又容易導(dǎo)致信息冗余和噪聲干擾。

4、同時,由于缺乏對多尺度語義知識的有效整合和利用,現(xiàn)有方法在處理復(fù)雜語境和細(xì)微情感差異時往往表現(xiàn)不佳。這些問題嚴(yán)重制約了情感隱喻識別技術(shù)的實際應(yīng)用效果。


技術(shù)實現(xiàn)思路

1、本發(fā)明提供了一種基于多尺度語義知識獲取的一體化情感隱喻識別方法,以改善上述技術(shù)問題中的至少一個。

2、第一方面、本發(fā)明提供了一種基于多尺度語義知識獲取的一體化情感隱喻識別方法,其包含步驟s1至步驟s5。

3、s1、獲取文本數(shù)據(jù),并根據(jù)所述文本數(shù)據(jù)構(gòu)建情感隱喻語料庫。

4、s2、根據(jù)所述文本數(shù)據(jù),對所述情感隱喻語料庫進行多尺度標(biāo)記,獲取多尺度特征矩陣。

5、s3、根據(jù)決策集合對多尺度特征矩陣進行多尺度語義特征提取,獲取最優(yōu)尺度語義矩陣。

6、s4、從所述最優(yōu)尺度語義矩陣分離原型模式向量和測試模式向量,并通過內(nèi)積法構(gòu)造反映兩個向量的相似度的隱喻序參量和情感序參量。然后通過一體化動力學(xué)演化模型重構(gòu)序參量,并從重構(gòu)后的序參量中篩選出待識別句子的情感隱喻標(biāo)注模式。

7、s5、根據(jù)所述情感隱喻標(biāo)注模式識別文本中的隱喻標(biāo)簽和情感類別,得到情感隱喻識別結(jié)果。

8、在一可選的實施方式中,步驟s3包括步驟s31至步驟s34。

9、s31、根據(jù)決策集合將數(shù)據(jù)集中的所有樣本進行劃分,記為劃分。其中,所述數(shù)據(jù)集為所述文本數(shù)據(jù)中的集合。

10、s32、取特征集合將數(shù)據(jù)集中的所有樣本進行劃分,記為劃分。若,則為最優(yōu)尺度組合,終止多尺度語義知識獲取過程,輸出最優(yōu)尺度語義矩陣。其中,表示第個尺度的語義特征集合、表示第個特征的第個尺度的值。

11、s33、若,則取特征集合將數(shù)據(jù)集中的所有樣本進行劃分,記為劃分。若,則為最優(yōu)尺度組合,終止多尺度語義知識獲取過程,輸出最優(yōu)尺度語義矩陣。其中,表示第1個特征的第個尺度的值。

12、s34、依次類推,直到取了所有特征的最細(xì)尺度的特征集合,則終止多尺度語義知識獲取過程,得到最優(yōu)尺度組合,輸出最優(yōu)尺度語義矩陣。

13、在一可選的實施方式中,步驟s4具體包括步驟s41至步驟s44。

14、s41、從最優(yōu)尺度語義矩陣中提取符合訓(xùn)練集樣本已知隱喻和情感類別的對應(yīng)的行向量作為原型模式向量。其中,表示原型、表示原型模式向量中行向量的數(shù)量。

15、s42、從最優(yōu)尺度語義矩陣中提取測試集樣本的行向量作為測試模式向量。其中,表示測試、表示測試模式向量中行向量的數(shù)量。

16、s43、根據(jù)所述原型模式向量和所述測試模式向量,通過內(nèi)積法構(gòu)造反映原型模式向量和測試模式向量相似度的隱喻序參量和情感序參量。

17、s44、基于協(xié)同學(xué)原理構(gòu)建一體化動力學(xué)演化模型,根據(jù)所述隱喻序參量和情感序參量,通過隱喻序參量的一體化動力學(xué)演化模型和情感序參量的一體化動力學(xué)演化模型對序參量進行重構(gòu)。并對重構(gòu)后的序參量進行排序,選出最高序參量對應(yīng)的原型模式向量,判定待識別句子屬于該原型模式,獲取待識別句子的情感隱喻標(biāo)注模式。

18、在一可選的實施方式中,隱喻序參量的計算模型為:。

19、在一可選的實施方式中,情感序參量的計算模型為:。

20、其中,表示隱喻、表示情感、為測試集中句子的數(shù)量、表示原型、表示原型模式向量中行向量的數(shù)量、表示測試、表示測試模式向量中行向量的數(shù)量、表示隱喻相關(guān)特征對應(yīng)的原型模式部分向量、表示隱喻相關(guān)特征對應(yīng)的測試模式部分向量、表示情感相關(guān)特征對應(yīng)的原型模式部分向量、表示情感相關(guān)特征對應(yīng)的測試模式部分向量。

21、在一可選的實施方式中,隱喻序參量的一體化動力學(xué)演化模型為:

22、。

23、在一可選的實施方式中,情感序參量的一體化動力學(xué)演化模型為:

24、。

25、其中,表示隱喻序參量、表示情感序參量、表示序參量、表示隱喻、表示情感、為測試集中句子的數(shù)量、為注意參數(shù),用以控制待測試模式變化的速度、為側(cè)抑制系數(shù)、為自抑制系數(shù)、為模式索引、為激勵參數(shù)。

26、一體化動力學(xué)演化模型中,參數(shù)組合共同決定了協(xié)同模式識別的識別性能。和為自激勵項,代表了模式對自身的反饋激勵作用。和為自抑制項,體現(xiàn)模式對自身過度增長的抑制。和為側(cè)抑制項,體現(xiàn)模式之間的相互抑制作用,相當(dāng)一個懲罰項。

27、在一可選的實施方式中,步驟s2具體包括步驟s21至步驟s22。

28、s21、根據(jù)所述文本數(shù)據(jù),提取語言學(xué)特征。其中,語言學(xué)特征包括詞義,和/或語義角色,和/或情感,和/或音韻。

29、s22、根據(jù)所述語言學(xué)特征,分別判斷各個句子的不同尺度的分類,并進行標(biāo)記,獲取多尺度特征矩陣。

30、在一可選的實施方式中,步驟s1具體包括步驟s11至步驟s13。

31、s11、獲取文本數(shù)據(jù)。

32、s12、對所述文本數(shù)據(jù)進行標(biāo)注,獲取情感隱喻語料庫。其中,標(biāo)注內(nèi)容包括是否有隱喻,以及隱喻情感類別。所述隱喻情感類別包括:樂、好、怒、哀、懼、惡和驚。

33、s13、對所述情感隱喻語料庫進行預(yù)處理。其中,預(yù)處理包括:通過正則表達式匹配字符串的方法過濾文本數(shù)據(jù)中的表情和特殊字符,和/或進行分詞,和/或去停用詞。

34、第二方面、本發(fā)明提供了一種基于多尺度語義知識獲取的一體化情感隱喻識別裝置,其包含語料庫模塊、多尺度模塊、特征提取模塊、重構(gòu)模塊和輸出模塊。

35、語料庫模塊,用于獲取文本數(shù)據(jù),并根據(jù)所述文本數(shù)據(jù)構(gòu)建情感隱喻語料庫。

36、多尺度模塊,用于根據(jù)所述文本數(shù)據(jù),對所述情感隱喻語料庫進行多尺度標(biāo)記,獲取多尺度特征矩陣。

37、特征提取模塊,用于根據(jù)決策集合對多尺度特征矩陣進行多尺度語義特征提取,獲取最優(yōu)尺度語義矩陣。

38、重構(gòu)模塊,用于從所述最優(yōu)尺度語義矩陣分離原型模式向量和測試模式向量,并通過內(nèi)積法構(gòu)造反映兩個向量的相似度的隱喻序參量和情感序參量。然后通過一體化動力學(xué)演化模型重構(gòu)序參量,并從重構(gòu)后的序參量中篩選出待識別句子的情感隱喻標(biāo)注模式。

39、輸出模塊,用于根據(jù)所述情感隱喻標(biāo)注模式識別文本中的隱喻標(biāo)簽和情感類別,得到情感隱喻識別結(jié)果。

40、第三方面、本發(fā)明提供了一種基于多尺度語義知識獲取的一體化情感隱喻識別設(shè)備,其包括處理器、存儲器,以及存儲在所述存儲器內(nèi)的計算機程序。所述計算機程序能夠被所述處理器執(zhí)行,以實現(xiàn)如第一方面任意一段所述的一種基于多尺度語義知識獲取的一體化情感隱喻識別方法。

41、第四方面、本發(fā)明提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)包括存儲的計算機程序,其中,在所述計算機程序運行時控制所述計算機可讀存儲介質(zhì)所在設(shè)備執(zhí)行如第一方面任意一段所述的一種基于多尺度語義知識獲取的一體化情感隱喻識別方法。

42、通過采用上述技術(shù)方案,本發(fā)明可以取得以下技術(shù)效果:

43、本發(fā)明實施例提供的一種基于多尺度語義知識獲取的一體化情感隱喻識別方法,通過構(gòu)建情感隱喻語料庫并進行預(yù)處理,對語料進行多尺度標(biāo)注得到多尺度特征矩陣,利用多尺度語義知識獲取方法提取最優(yōu)尺度組合得到最優(yōu)尺度語義矩陣,基于最優(yōu)尺度語義矩陣輸出原型模式向量和測試模式向量,構(gòu)造隱喻序參量和情感序參量進行一體化情感隱喻識別,最終得到情感隱喻標(biāo)注模式并輸出隱喻標(biāo)簽和情感類別。

44、通過這樣的技術(shù)方案,創(chuàng)新性地將多尺度知識獲取與一體化識別相結(jié)合,考慮了隱喻識別與情感識別之間的協(xié)同互動和相互制約關(guān)系,有效提高了情感隱喻識別的準(zhǔn)確性和魯棒性。通過多尺度分析方法,更全面地分析了不同尺度的文本信息,避免了單一尺度可能帶來的信息損失,為情感隱喻識別提供了更準(zhǔn)確和可靠的識別結(jié)果。該方法在保證識別準(zhǔn)確率的同時,充分利用了多尺度語義信息的互補性,顯著提升了情感隱喻識別的整體性能,為相關(guān)領(lǐng)域研究提供了新的技術(shù)思路和解決方案。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1