一種用于自然語言處理的軟件安全漏洞挖掘方法

文檔序號：41944582發(fā)布日期：2025-05-16 14:01閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>一種用于自然語言處理的軟件安全漏洞挖掘方法

技術(shù)特征：

1.一種用于自然語言處理的軟件安全漏洞挖掘方法，其特征在于，包括以下步驟：

2.根據(jù)權(quán)利要求1所述的一種用于自然語言處理的軟件安全漏洞挖掘方法，其特征在于，所述步驟s1的漏洞代碼數(shù)據(jù)集包含獨立的訓(xùn)練集和測試集，首先設(shè)定標(biāo)簽t為目標(biāo)標(biāo)簽，在待預(yù)處理的訓(xùn)練集dpre中提取標(biāo)簽為目標(biāo)標(biāo)簽的樣本集合作為待預(yù)處理的目標(biāo)標(biāo)簽訓(xùn)練子集其中，表示待預(yù)處理的目標(biāo)標(biāo)簽訓(xùn)練子集，n表示中樣本的數(shù)量，表示中的最后一個樣本；然后通過bert模型將樣本轉(zhuǎn)化為數(shù)值，進行歸一化處理，具體的：

3.根據(jù)權(quán)利要求1所述的一種用于自然語言處理的軟件安全漏洞挖掘方法，其特征在于，所述步驟s2中，將基于步驟s1得到預(yù)處理后的目標(biāo)標(biāo)簽訓(xùn)練子集dt，通過類激活映射方法提取每一個預(yù)處理后的目標(biāo)標(biāo)簽樣本的重要特征集，具體步驟如下：

4.根據(jù)權(quán)利要求1所述的一種用于自然語言處理的軟件安全漏洞挖掘方法，其特征在于，所述步驟s3中，對目標(biāo)標(biāo)簽訓(xùn)練子集的特征詞集合中的所有單詞出現(xiàn)的次數(shù)進行統(tǒng)計，并進行降序排列，選擇前m個頻繁的單詞作為漏洞代碼數(shù)據(jù)集在類別為目標(biāo)標(biāo)簽t上的觸發(fā)集，具體集合如下：

5.根據(jù)權(quán)利要求1所述的一種用于自然語言處理的軟件安全漏洞挖掘方法，其特征在于，所述步驟s4的具體步驟如下：

6.根據(jù)權(quán)利要求1所述的一種用于自然語言處理的軟件安全漏洞挖掘方法，其特征在于，所述步驟s5生成用于后門漏洞代碼檢測模型的具體步驟如下：

7.根據(jù)權(quán)利要求1所述的一種用于自然語言處理的軟件安全漏洞挖掘方法，其特征在于，所述步驟s6的具體步驟如下：

技術(shù)總結(jié)
本發(fā)明設(shè)計了一種用于自然語言處理的軟件安全漏洞挖掘方法，可用于檢測少量中毒樣本訓(xùn)練的文本分類程序中的后門漏洞。通此方法不僅能夠在混入少量后門樣本的情況下有效檢測到NLP模型中的后門漏洞，還提高了生成的后門樣本的有效性和隱蔽性，對當(dāng)前NLP模型的安全性提出了新的挑戰(zhàn)與防御思路。實驗結(jié)果證明，本發(fā)明在不同的預(yù)訓(xùn)練模型上均能有效檢測出后門漏洞，并且相比其他現(xiàn)有技術(shù)，在后門樣本的質(zhì)量和有效性方面具有顯著優(yōu)勢。

技術(shù)研發(fā)人員：張云春,王琪,姚紹文,歐思佳,劉浩,黃飛楊,王諾筠,于勇濤
受保護的技術(shù)使用者：云南大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/15

完整全部詳細技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種用于自然語言處理的軟件安全漏洞挖掘方法