本發(fā)明涉及網(wǎng)絡(luò)安全和人工智能領(lǐng)域,具體涉及一種基于多模態(tài)大模型的網(wǎng)絡(luò)安全態(tài)勢感知方法和系統(tǒng)。
背景技術(shù):
1、隨著信息技術(shù)的快速發(fā)展,網(wǎng)絡(luò)環(huán)境日益復雜,網(wǎng)絡(luò)安全問題成為全球關(guān)注的焦點,傳統(tǒng)的網(wǎng)絡(luò)安全技術(shù)往往依賴于單一的數(shù)據(jù)源和靜態(tài)的規(guī)則系統(tǒng),難以應(yīng)對日益增長的網(wǎng)絡(luò)攻擊手段和隱蔽的威脅行為,為了提高網(wǎng)絡(luò)安全防護的智能化水平,需要采用先進的技術(shù)手段進行網(wǎng)絡(luò)安全態(tài)勢的實時監(jiān)控和分析。
2、網(wǎng)絡(luò)安全態(tài)勢感知是維護網(wǎng)絡(luò)空間安全的關(guān)鍵技術(shù)之一,其目的是通過實時監(jiān)測和分析網(wǎng)絡(luò)活動,及時發(fā)現(xiàn)并響應(yīng)安全威脅。
3、傳統(tǒng)的網(wǎng)絡(luò)安全態(tài)勢感知方法主要依賴于人工設(shè)定的安全規(guī)則和閾值,以及單一數(shù)據(jù)源的分析,這些方法在面對新型攻擊手段和復雜網(wǎng)絡(luò)環(huán)境時,往往響應(yīng)遲緩、誤報率高、分析能力有限,隨著網(wǎng)絡(luò)攻擊手段的不斷演變和升級,傳統(tǒng)的安全防護措施越來越難以滿足日益增長的安全需求。
4、現(xiàn)有的網(wǎng)絡(luò)安全態(tài)勢感知技術(shù)依然存在一些局限性和挑戰(zhàn):
5、現(xiàn)有網(wǎng)絡(luò)安全態(tài)勢感知系統(tǒng)大多依賴單一數(shù)據(jù)源,如網(wǎng)絡(luò)流量或系統(tǒng)日志,缺乏對多源數(shù)據(jù)的綜合分析能力,限制了對復雜攻擊模式的識別和響應(yīng);
6、盡管部分網(wǎng)絡(luò)安全態(tài)勢感知系統(tǒng)能夠?qū)崟r監(jiān)控網(wǎng)絡(luò)活動,但在自動化響應(yīng)方面存在不足,許多情況下,安全事件的識別和響應(yīng)仍需人工參與,導致響應(yīng)延遲;
7、系統(tǒng)在處理大量數(shù)據(jù)時產(chǎn)生較高比例的誤報和漏報,這不僅增加了安全分析師的工作負擔,也忽視了真正的安全威脅;
8、另外,在處理和融合多模態(tài)數(shù)據(jù)方面缺乏有效的數(shù)據(jù)融合和分析機制。
9、針對上述問題,本技術(shù)提出了一種基于多模態(tài)大模型的網(wǎng)絡(luò)安全態(tài)勢感知方法和系統(tǒng)。
技術(shù)實現(xiàn)思路
1、本發(fā)明針對上述現(xiàn)有技術(shù)中一個或多個技術(shù)缺陷,提出了如下技術(shù)方案。
2、基于本技術(shù)的第一方面,提出了一種基于多模態(tài)大模型的網(wǎng)絡(luò)安全態(tài)勢感知方法,包括:
3、s1:對多模態(tài)數(shù)據(jù)的數(shù)據(jù)源i定義唯一的正交序列si,將所述正交序列si與每個數(shù)據(jù)源的日志記錄di(t)結(jié)合生成新的編碼數(shù)據(jù)序列ei(t),并將所述編碼數(shù)據(jù)序列ei(t)相加得到復合信號c(t),將所述正交序列si與所述復合信號c(t)進行匹配運算,得到單個數(shù)據(jù)源的信息;
4、s2:通過教師-學生模型將所述單個數(shù)據(jù)源中的多模態(tài)數(shù)據(jù)進行特征提取和知識蒸餾;
5、s3:通過快速梯度符號方法和迭代快速梯度符號方法生成所述單個數(shù)據(jù)源的原始多模態(tài)數(shù)據(jù)的對抗樣本,對所述多模態(tài)數(shù)據(jù)進行跨模態(tài)關(guān)聯(lián)分析,將提取的特征進行融合處理和跨模態(tài)對齊處理;
6、s4:通過深度均衡多模態(tài)融合技術(shù)建立均衡系統(tǒng),并在所述均衡系統(tǒng)中通過最小化代價函數(shù)、下半連續(xù)函數(shù)、聯(lián)合概率分布和sinkhorn算法計算處理后的不同模態(tài)的特征之間的最優(yōu)傳輸路徑并進行特征整合;
7、s5:基于雙向編碼器結(jié)構(gòu)和整合的特征構(gòu)建多模態(tài)深度態(tài)勢感知與預(yù)測模型,并利用所述對抗樣本進行訓練,將殘差周期預(yù)測技術(shù)集成到所述多模態(tài)深度態(tài)勢感知與預(yù)測模型中,利用所述多模態(tài)深度態(tài)勢感知與預(yù)測模型進行網(wǎng)絡(luò)安全態(tài)勢感知。
8、更進一步地,所述s1之前還包括獲取網(wǎng)絡(luò)中的所述多模態(tài)數(shù)據(jù)并進行數(shù)據(jù)增強處理,包括對所述多模態(tài)數(shù)據(jù)中的圖像數(shù)據(jù)進行旋轉(zhuǎn)、縮放和色彩變換;以及,
9、對所述多模態(tài)數(shù)據(jù)中的文本數(shù)據(jù)進行同義詞替換和句子重組。
10、更進一步地,所述對所述多模態(tài)數(shù)據(jù)進行跨模態(tài)關(guān)聯(lián)分析具體包括:對不同模態(tài)的數(shù)據(jù)提取深層特征,捕捉不同模態(tài)間數(shù)據(jù)的交互行為,構(gòu)造不同模態(tài)數(shù)據(jù)的細粒度關(guān)聯(lián)關(guān)系,以及通過基于哈希學習的跨模態(tài)檢索匹配方法和學習標簽的潛在語義矩陣,構(gòu)造哈希碼與標簽的關(guān)聯(lián)關(guān)系。
11、構(gòu)造哈希碼與標簽的關(guān)聯(lián)關(guān)系能夠提高跨模態(tài)數(shù)據(jù)的檢索效率;
12、對多模態(tài)數(shù)據(jù)進行跨模態(tài)關(guān)聯(lián)分析可以準確捕捉網(wǎng)絡(luò)安全威脅的本質(zhì)特征,提高威脅檢測的準確性和效率。
13、更進一步地,所述均衡系統(tǒng)包括遞歸融合層、模態(tài)特征注入層和均衡狀態(tài)層,所述遞歸融合層基于前一次迭代結(jié)果計算本層輸出,所述模態(tài)特征注入層結(jié)合注入的模態(tài)特征獲得殘差融合特征,所述均衡狀態(tài)層通過黑盒求解器尋找所述均衡系統(tǒng)內(nèi)部和跨模態(tài)特征的均衡狀態(tài)。
14、均衡系統(tǒng)能夠從低層次到高層次徹底編碼不同模態(tài)內(nèi)外的豐富信息,實現(xiàn)有效的下游多模態(tài)學習,可以輕松地插入到各種多模態(tài)框架中。
15、更進一步地,所述基于雙向編碼器結(jié)構(gòu)和整合的特征構(gòu)建多模態(tài)深度態(tài)勢感知與預(yù)測模型具體包括:
16、s501:初始化所述雙向編碼器的參數(shù);
17、s502:將所述多模態(tài)數(shù)據(jù)中的文本數(shù)據(jù)進行分詞并轉(zhuǎn)換為token序列,將非文本數(shù)據(jù)通過向量量化或嵌入技術(shù)轉(zhuǎn)換為文本兼容的形式;
18、s503:將處理后的多模態(tài)數(shù)據(jù)輸入所述雙向編碼器,通過前向傳播和后向傳播捕捉token序列中每個元素的上下文信息,并將所述上下文信息中的特征進行融合得到每個token序列的上下文相關(guān)特征;
19、s504:在所述雙向編碼器添加多頭注意力機制捕捉所述上下文相關(guān)特征之間的依賴關(guān)系,并根據(jù)所述上下文特征的重要性進行注意力權(quán)重分配;
20、s505:將不同模態(tài)數(shù)據(jù)的特征通過所述均衡系統(tǒng)進行交互,學習跨模態(tài)數(shù)據(jù)的關(guān)聯(lián)性,通過雙向編碼器的多層結(jié)構(gòu)學習共享特征的表示;
21、s506:在所述雙向編碼器的輸出中添加周期性預(yù)測模塊以使得集成殘差周期預(yù)測技術(shù),得到所述多模態(tài)深度感知與預(yù)測模型。
22、構(gòu)建多模態(tài)深度態(tài)勢感知與預(yù)測模型能確保各模態(tài)的特征融合過程中保持獨特性和完整性。
23、更進一步地,所述初始化所述雙向編碼器的參數(shù)包括詞嵌入矩陣,位置編碼和其他網(wǎng)絡(luò)參數(shù)。
24、更進一步地,響應(yīng)于網(wǎng)絡(luò)安全態(tài)勢感知和預(yù)測的結(jié)果,觸發(fā)預(yù)設(shè)的安全響應(yīng)措施,智能決策樹根據(jù)網(wǎng)絡(luò)安全態(tài)勢的實時反饋調(diào)整安全響應(yīng)措施策略。
25、基于本技術(shù)的第二方面,提出了一種基于多模態(tài)大模型的網(wǎng)絡(luò)安全態(tài)勢感知系統(tǒng),包括:
26、正交序列融合模塊:對多模態(tài)數(shù)據(jù)的數(shù)據(jù)源i定義唯一的正交序列si,將所述正交序列si與每個數(shù)據(jù)源的日志記錄di(t)結(jié)合生成新的編碼數(shù)據(jù)序列ei(t),并將所述編碼數(shù)據(jù)序列ei(t)相加得到復合信號c(t),將所述正交序列si與所述復合信號c(t)進行匹配運算,得到單個數(shù)據(jù)源的信息;
27、初處理模塊:通過教師-學生模型將所述單個數(shù)據(jù)源中的多模態(tài)數(shù)據(jù)進行特征提取和知識蒸餾;
28、再處理模塊:通過快速梯度符號方法和迭代快速梯度符號方法生成所述單個數(shù)據(jù)源的原始多模態(tài)數(shù)據(jù)的對抗樣本,對所述多模態(tài)數(shù)據(jù)進行跨模態(tài)關(guān)聯(lián)分析,將提取的特征進行融合處理和跨模態(tài)對齊處理;
29、整合模塊:通過深度均衡多模態(tài)融合技術(shù)建立均衡系統(tǒng),并在所述均衡系統(tǒng)中通過最小化代價函數(shù)、下半連續(xù)函數(shù)、聯(lián)合概率分布和sinkhorn算法計算處理后的不同模態(tài)的特征之間的最優(yōu)傳輸路徑并進行特征整合;
30、預(yù)測模塊:基于雙向編碼器結(jié)構(gòu)和整合的特征構(gòu)建多模態(tài)深度態(tài)勢感知與預(yù)測模型,并利用所述對抗樣本進行訓練,將殘差周期預(yù)測技術(shù)集成到所述多模態(tài)深度態(tài)勢感知與預(yù)測模型中,利用所述多模態(tài)深度態(tài)勢感知與預(yù)測模型進行網(wǎng)絡(luò)安全態(tài)勢感知。
31、基于本技術(shù)的第三方面,提出了一種計算機程序產(chǎn)品,其上有一個或多個計算機程序,當所述一個或多個計算機程序被計算機處理器執(zhí)行時實施如上述之任一項所述的方法。
32、本技術(shù)的技術(shù)效果在于:本技術(shù)通過生成對抗網(wǎng)絡(luò)和最優(yōu)傳輸transformer融合技術(shù),并結(jié)合自注意力機制和時間序列分析技術(shù),構(gòu)建一個能夠進行實時網(wǎng)絡(luò)安全態(tài)勢分析和未來趨勢預(yù)測的深度學習模型;以及根據(jù)數(shù)據(jù)特性和網(wǎng)絡(luò)環(huán)境變化動態(tài)調(diào)整預(yù)處理策略,利用對抗學習優(yōu)化特征學習過程,跨模態(tài)關(guān)聯(lián)分析整合不同模態(tài)的特征,提高模型對網(wǎng)絡(luò)安全威脅的識別和預(yù)測能力,能夠全面地捕捉和分析網(wǎng)絡(luò)安全威脅,提高安全威脅識別的準確性,減少網(wǎng)絡(luò)安全威脅的誤報率和漏報率,使得安全分析師能夠更有效地集中精力處理真正的威脅,提升了網(wǎng)絡(luò)安全防護的智能化水平,降低了人為因素導致的安全風險,增強了對復雜攻擊模式的識別能力,提高了系統(tǒng)的適應(yīng)性和靈活性。