1.一種用于自然語言處理的軟件安全漏洞挖掘方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種用于自然語言處理的軟件安全漏洞挖掘方法,其特征在于,所述步驟s1的漏洞代碼數(shù)據(jù)集包含獨立的訓(xùn)練集和測試集,首先設(shè)定標(biāo)簽t為目標(biāo)標(biāo)簽,在待預(yù)處理的訓(xùn)練集dpre中提取標(biāo)簽為目標(biāo)標(biāo)簽的樣本集合作為待預(yù)處理的目標(biāo)標(biāo)簽訓(xùn)練子集其中,表示待預(yù)處理的目標(biāo)標(biāo)簽訓(xùn)練子集,n表示中樣本的數(shù)量,表示中的最后一個樣本;然后通過bert模型將樣本轉(zhuǎn)化為數(shù)值,進行歸一化處理,具體的:
3.根據(jù)權(quán)利要求1所述的一種用于自然語言處理的軟件安全漏洞挖掘方法,其特征在于,所述步驟s2中,將基于步驟s1得到預(yù)處理后的目標(biāo)標(biāo)簽訓(xùn)練子集dt,通過類激活映射方法提取每一個預(yù)處理后的目標(biāo)標(biāo)簽樣本的重要特征集,具體步驟如下:
4.根據(jù)權(quán)利要求1所述的一種用于自然語言處理的軟件安全漏洞挖掘方法,其特征在于,所述步驟s3中,對目標(biāo)標(biāo)簽訓(xùn)練子集的特征詞集合中的所有單詞出現(xiàn)的次數(shù)進行統(tǒng)計,并進行降序排列,選擇前m個頻繁的單詞作為漏洞代碼數(shù)據(jù)集在類別為目標(biāo)標(biāo)簽t上的觸發(fā)集,具體集合如下:
5.根據(jù)權(quán)利要求1所述的一種用于自然語言處理的軟件安全漏洞挖掘方法,其特征在于,所述步驟s4的具體步驟如下:
6.根據(jù)權(quán)利要求1所述的一種用于自然語言處理的軟件安全漏洞挖掘方法,其特征在于,所述步驟s5生成用于后門漏洞代碼檢測模型的具體步驟如下:
7.根據(jù)權(quán)利要求1所述的一種用于自然語言處理的軟件安全漏洞挖掘方法,其特征在于,所述步驟s6的具體步驟如下: