本發(fā)明涉及ipv6地址探測(cè),尤其涉及一種基于大語(yǔ)言模型的ipv6地址探測(cè)方法及系統(tǒng)。
背景技術(shù):
1、本部分的陳述僅僅是提供了與本發(fā)明相關(guān)的背景技術(shù)信息,不必然構(gòu)成在先技術(shù)。
2、隨著當(dāng)下互聯(lián)網(wǎng)時(shí)代的迅速發(fā)展,越來(lái)越多的設(shè)備可接入互聯(lián)網(wǎng)。然而原始的ipv4地址空間僅為232,地址空間非常有限,當(dāng)下的ipv4地址已經(jīng)被全部分配,這使得ipv4耗盡的問(wèn)題更加凸顯。為了解決這一問(wèn)題,ipv6應(yīng)運(yùn)而生。ipv6地址空間為2128,理論上每一粒沙子都可獲得一個(gè)ipv6地址,以此從根源上解決了ipv4地址分配殆盡的問(wèn)題。然而隨著ipv6的使用,一些問(wèn)題也日益凸顯,最嚴(yán)峻的問(wèn)題之一就是無(wú)法掃描整個(gè)ipv6地址空間。
3、對(duì)整個(gè)ipv6地址空間進(jìn)行掃描,即全面掌握ipv6地址空間是網(wǎng)絡(luò)攻防的重要基礎(chǔ),是ipv6網(wǎng)絡(luò)設(shè)備和服務(wù)識(shí)別定位、漏洞發(fā)現(xiàn)、滲透測(cè)試等網(wǎng)絡(luò)攻擊的重要基礎(chǔ),感知ipv6互聯(lián)網(wǎng)網(wǎng)絡(luò)拓?fù)浜完P(guān)鍵節(jié)點(diǎn),對(duì)確保信息網(wǎng)絡(luò)安全、奪取網(wǎng)絡(luò)空間信息優(yōu)勢(shì)意義重大。對(duì)于ipv4地址而言,使用快速掃描工具,例如zmap,可在一小時(shí)內(nèi)遍歷整個(gè)ipv4地址空間,然而對(duì)于ipv6地址空間而言,以目前的最強(qiáng)算力需連續(xù)掃描數(shù)億年。為解決無(wú)法直接遍歷掃描ipv6地址空間的問(wèn)題,當(dāng)前研究提出了多種ipv6地址生成方法,該ipv6地址生成方法的核心思想是,根據(jù)已知的活躍ipv6地址,通過(guò)對(duì)ipv6地址的結(jié)構(gòu)或語(yǔ)義進(jìn)行分析,尋找活躍ipv6地址之間存在的關(guān)系,以此在ipv6整個(gè)大空間中找到包含活躍ipv6地址最密集的區(qū)域,生成活躍率較高的ipv6地址,將該預(yù)測(cè)生成的地址作為掃描目標(biāo),來(lái)達(dá)到ipv6地址掃描的目的。
4、目前的地址探測(cè)方法可劃分為兩類,第一類是基于種子地址的結(jié)構(gòu)信息來(lái)生成ipv6地址,其通過(guò)人為劃分地址空間的方法來(lái)分析種子地址的結(jié)構(gòu)信息,搜索種子分布密集的地址空間,來(lái)生成ipv6地址。然而,這一方法大多使用dhc(divisive?hierarchicalclustering,層次分裂聚類)算法,雖然其有助于快速縮小搜索范圍并集中資源探測(cè)更可能活躍的地址區(qū)域,但在dhc算法執(zhí)行的過(guò)程中,可能過(guò)于集中于高密度區(qū)域,從而忽略了那些可能包含活躍地址但密度較低的區(qū)域;同時(shí)dhc算法的性能與效果也可能高度依賴于初始種子地址的選擇和分布,若種子地址分布不均勻,可能導(dǎo)致掃描結(jié)果出現(xiàn)偏差;在某些情況下,dhc可能會(huì)過(guò)度劃分地址空間,導(dǎo)致生成過(guò)多的子空間,這可能會(huì)使后續(xù)的掃描工作變得復(fù)雜和低效。
5、為此,還提出了第二類基于種子地址的語(yǔ)義信息來(lái)生成ipv6地址的方法,其通過(guò)人工智能方法來(lái)分析種子地址的語(yǔ)義信息,挖掘種子的分布規(guī)律,從而生成ipv6地址。然而,這一方法也存在一定的問(wèn)題:目前人工智能模型對(duì)于種子地址的語(yǔ)義信息的學(xué)習(xí)能力較差,導(dǎo)致生成ipv6地址效果較差,且該算法進(jìn)行批量生成地址的能力仍需提高;同時(shí),對(duì)于算法生成的ipv6地址,目前也未有快捷有效的全方面評(píng)估方法,無(wú)法保障最終生成ipv6地址的有效性。
技術(shù)實(shí)現(xiàn)思路
1、為解決上述目前ipv6地址探測(cè)時(shí)地址生成算法效率較低,無(wú)法對(duì)生成的ipv6地址進(jìn)行迅速有效評(píng)估的問(wèn)題,本發(fā)明提供了一種基于大語(yǔ)言模型的ipv6地址探測(cè)方法及系統(tǒng),通過(guò)微調(diào)大語(yǔ)言模型數(shù)據(jù)集的構(gòu)造以及微調(diào)大語(yǔ)言模型,結(jié)合vllm快速推理框架,實(shí)現(xiàn)效果更優(yōu)、效率更高的有效ipv6地址生成,并實(shí)現(xiàn)面向生成的ipv6地址的多維度全方面自動(dòng)化評(píng)估。
2、第一方面,本發(fā)明提供了一種基于大語(yǔ)言模型的ipv6地址探測(cè)方法。
3、一種基于大語(yǔ)言模型的ipv6地址探測(cè)方法,包括:
4、獲取若干活躍ipv6地址作為種子地址,構(gòu)建ipv6種子數(shù)據(jù)集;
5、對(duì)ipv6種子數(shù)據(jù)集中的每一種子地址進(jìn)行預(yù)分類,根據(jù)預(yù)分類后的種子地址進(jìn)行大語(yǔ)言模型ipv6微調(diào)數(shù)據(jù)集的構(gòu)造;
6、利用構(gòu)造的ipv6微調(diào)數(shù)據(jù)集,并采用lora法對(duì)大語(yǔ)言模型進(jìn)行微調(diào);
7、基于微調(diào)后的大語(yǔ)言模型,采用vllm加速推理框架,生成若干ipv6地址,構(gòu)建ipv6地址候選集;
8、基于ipv6地址候選集,進(jìn)行命中率、生成率、多樣性、創(chuàng)新性、別名地址占比的多維度評(píng)估,并提取ipv6地址候選集中的活躍ipv6地址;
9、將生成的活躍ipv6地址作為種子地址與原始種子數(shù)據(jù)集合并,得到更新后的種子數(shù)據(jù)集,以此不斷循環(huán),完成對(duì)ipv6地址空間的探測(cè)。
10、第二方面,本發(fā)明提供了一種基于大語(yǔ)言模型的ipv6地址探測(cè)系統(tǒng)。
11、一種基于大語(yǔ)言模型的ipv6地址探測(cè)系統(tǒng),包括:
12、種子地址獲取模塊,用于獲取若干活躍ipv6地址作為種子地址,構(gòu)建ipv6種子數(shù)據(jù)集;
13、微調(diào)數(shù)據(jù)集構(gòu)造模塊,用于對(duì)ipv6種子數(shù)據(jù)集中的每一種子地址進(jìn)行預(yù)分類,根據(jù)預(yù)分類后的種子地址進(jìn)行大語(yǔ)言模型ipv6微調(diào)數(shù)據(jù)集的構(gòu)造;
14、大語(yǔ)言模型微調(diào)模塊,用于利用構(gòu)造的ipv6微調(diào)數(shù)據(jù)集,并采用lora法對(duì)大語(yǔ)言模型進(jìn)行微調(diào);
15、ipv6地址生成模塊,用于基于微調(diào)后的大語(yǔ)言模型,采用vllm加速推理框架,生成若干ipv6地址,構(gòu)建ipv6地址候選集;
16、ipv6地址評(píng)估模塊,用于基于ipv6地址候選集,進(jìn)行命中率、生成率、多樣性、創(chuàng)新性、別名地址占比的多維度評(píng)估,并提取ipv6地址候選集中的活躍ipv6地址;
17、ipv6地址探測(cè)模塊,用于將生成的活躍ipv6地址作為種子地址與原始種子數(shù)據(jù)集合并,得到更新后的種子數(shù)據(jù)集,以此不斷循環(huán),完成對(duì)ipv6地址空間的探測(cè)。
18、第三方面,本發(fā)明還提供了一種電子設(shè)備,包括:存儲(chǔ)器,用于存儲(chǔ)可執(zhí)行指令;處理器,用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的可執(zhí)行指令時(shí),實(shí)現(xiàn)上述的基于大語(yǔ)言模型的ipv6地址探測(cè)方法。
19、第四方面,本發(fā)明還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有可執(zhí)行指令,用于引起處理器執(zhí)行所述可執(zhí)行指令時(shí),實(shí)現(xiàn)上述的基于大語(yǔ)言模型的ipv6地址探測(cè)方法。
20、第五方面,本發(fā)明還提供了一種計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品包括可執(zhí)行指令,可執(zhí)行指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中;其中,電子設(shè)備的處理器從計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中讀取可執(zhí)行指令,并執(zhí)行可執(zhí)行指令時(shí),實(shí)現(xiàn)上述的基于大語(yǔ)言模型的ipv6地址探測(cè)方法。
21、以上一個(gè)或多個(gè)技術(shù)方案存在以下有益效果:
22、1、本發(fā)明提供了一種基于大語(yǔ)言模型的ipv6地址探測(cè)方法及系統(tǒng),采用特定的微調(diào)大語(yǔ)言模型數(shù)據(jù)集的構(gòu)造方式,即先對(duì)活躍ipv6地址即種子地址進(jìn)行預(yù)分類,再對(duì)分類后的活躍ipv6地址進(jìn)行微調(diào)數(shù)據(jù)集構(gòu)造的方式,以此構(gòu)建高質(zhì)量的ipv6微調(diào)數(shù)據(jù)集,進(jìn)而能夠有效緩解大語(yǔ)言模型學(xué)習(xí)特征的壓力,提高地址生成效率;利用構(gòu)造的ipv6微調(diào)數(shù)據(jù)集,并采用lora法對(duì)大語(yǔ)言模型進(jìn)行微調(diào),以使得大語(yǔ)言模型能夠更加高效的獲取活躍ipv6地址的特征規(guī)律并進(jìn)行學(xué)習(xí);進(jìn)而,通過(guò)微調(diào)的大語(yǔ)言模型,結(jié)合vllm快速推理框架,實(shí)現(xiàn)效果更優(yōu)、效率更高的有效ipv6地址生成,有效提高地址生成的命中率與生成率,解決目前ipv6地址探測(cè)時(shí)地址生成算法效率較低的問(wèn)題。
23、2、本發(fā)明提出了面向ipv6地址候選集的自動(dòng)化評(píng)估工具,從命中率、生成率、多樣性、創(chuàng)新性、別名地址占比等多個(gè)維度對(duì)地址生成算法進(jìn)行全方面方便快捷的評(píng)估,解決目前無(wú)法對(duì)生成的ipv6地址進(jìn)行迅速有效評(píng)估的問(wèn)題,實(shí)現(xiàn)面向生成的ipv6地址的多維度全方面自動(dòng)化評(píng)估。
24、本發(fā)明附加方面的優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。