最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

異常脫敏日志識別模型的訓(xùn)練方法、裝置、設(shè)備及介質(zhì)與流程

文檔序號:41944352發(fā)布日期:2025-05-16 14:01閱讀:5來源:國知局
異常脫敏日志識別模型的訓(xùn)練方法、裝置、設(shè)備及介質(zhì)與流程

本說明書涉及數(shù)據(jù)處理,尤其涉及一種異常脫敏日志識別模型的訓(xùn)練方法、異常脫敏日志識別方法、裝置、設(shè)備、介質(zhì)及程序產(chǎn)品。


背景技術(shù):

1、對于涉及用戶隱私的日志數(shù)據(jù),往往需要對其進(jìn)行日志脫敏。例如,使用加密算法對日志數(shù)據(jù)中的ip地址、賬號名、密碼、電話號碼等進(jìn)行轉(zhuǎn)換,以在數(shù)據(jù)分析和存儲過程中保護(hù)敏感信息。為了防止因日志漏脫敏等情況而導(dǎo)致的信息泄露,需要在對日志進(jìn)行脫敏處理后,進(jìn)一步識別異常脫敏日志。

2、相關(guān)技術(shù)中,通常需要根據(jù)專家經(jīng)驗預(yù)先定義識別規(guī)則,例如預(yù)先定義需要進(jìn)行脫敏的數(shù)據(jù)類型、數(shù)據(jù)形式、關(guān)鍵字段等,然后利用預(yù)先定義的識別規(guī)則識別出異常脫敏日志。然而,由于專家經(jīng)驗存在局限性,預(yù)先定義的識別規(guī)則往往無法正確識別預(yù)期之外的日志數(shù)據(jù)(如非常規(guī)格式的日志數(shù)據(jù)等)是否為異常脫敏日志,需要提供異常脫敏日志識別模型的訓(xùn)練方案,來有效識別異常脫敏日志。


技術(shù)實現(xiàn)思路

1、本說明書實施例提供了一種異常脫敏日志識別模型的訓(xùn)練方法、裝置、設(shè)備、介質(zhì)及程序產(chǎn)品,能夠有效識別異常脫敏日志。

2、第一方面,本說明書實施例提供了一種異常脫敏日志識別模型的訓(xùn)練方法,包括:

3、獲取第一樣本脫敏日志集合對應(yīng)的第一樣本特征向量集合;第一樣本脫敏日志集合包括正常脫敏日志;

4、基于第一樣本特征向量集合中的至少一個第一樣本特征向量和各第一樣本特征向量攜帶的第一樣本標(biāo)簽,對異常檢測模型進(jìn)行訓(xùn)練,得到第一異常脫敏日志識別模型。

5、在一種可能的實現(xiàn)方式中,基于第一樣本特征向量集合中的各第一樣本特征向量和各第一樣本特征向量攜帶的第一樣本標(biāo)簽,對異常檢測模型進(jìn)行訓(xùn)練,得到異常脫敏日志識別模型,包括:

6、將至少一個第一樣本特征向量輸入至異常檢測模型,得到各第一樣本特征向量對應(yīng)的第一預(yù)測標(biāo)簽;

7、根據(jù)各第一預(yù)測標(biāo)簽和各第一樣本標(biāo)簽,確定異常檢測模型的第一分類損失;

8、基于第一分類損失調(diào)整異常檢測模型的參數(shù),并再次執(zhí)行獲取第一樣本脫敏日志集合對應(yīng)的第一樣本特征向量集合的步驟,直至達(dá)到第一訓(xùn)練停止條件時停止,得到第一異常脫敏日志識別模型。

9、在一種可能的實現(xiàn)方式中,獲取第一樣本脫敏日志集合對應(yīng)的第一樣本特征向量集合之前,方法還包括:

10、將一批第一樣本脫敏日志輸入至特征提取模型,得到一批第一樣本脫敏日志中各第一樣本脫敏日志對應(yīng)的第一樣本特征向量;

11、基于各第一樣本特征向量和各第一樣本特征向量攜帶的第一樣本標(biāo)簽,構(gòu)建第一日志特征庫;

12、獲取第一樣本脫敏日志集合對應(yīng)的第一樣本特征向量集合,包括:

13、從第一日志特征庫中獲取第一樣本脫敏日志集合對應(yīng)的第一樣本特征向量集合。

14、在一種可能的實現(xiàn)方式中,上述方法還包括:

15、獲取第二樣本脫敏日志集合對應(yīng)的第二樣本特征向量集合;第二樣本脫敏日志集合中的各第二樣本脫敏日志與第一樣本脫敏日志集合中的各第一樣本脫敏日志的數(shù)據(jù)格式和/或數(shù)據(jù)語義不同;第二樣本脫敏日志集合包括正常脫敏日志;

16、基于第二樣本特征向量集合中的至少一個第二樣本特征向量和各第二樣本特征向量攜帶的第二樣本標(biāo)簽,對第一異常脫敏日志識別模型進(jìn)行微調(diào),得到第二異常脫敏日志識別模型。

17、在一種可能的實現(xiàn)方式中,基于第二樣本特征向量集合中的至少一個第二樣本特征向量和各第二樣本特征向量攜帶的第二樣本標(biāo)簽,對第一異常脫敏日志識別模型進(jìn)行微調(diào),得到第二異常脫敏日志識別模型,包括:

18、將至少一個第二樣本特征向量輸入至第一異常脫敏日志識別模型,得到各第二樣本特征向量對應(yīng)的第二預(yù)測標(biāo)簽;

19、根據(jù)各第二預(yù)測標(biāo)簽和各第二樣本標(biāo)簽,確定第一異常脫敏日志識別模型的第二分類損失;

20、基于第二分類損失調(diào)整第一異常脫敏日志識別模型的參數(shù),并再次執(zhí)行獲取第二樣本脫敏日志集合對應(yīng)的第二樣本特征向量集合的步驟,直至達(dá)到第二訓(xùn)練停止條件時停止,得到第二異常脫敏日志識別模型。

21、第二方面,本說明書實施例提供了一種異常脫敏日志識別方法,包括:

22、獲取待識別的第一目標(biāo)脫敏日志集合對應(yīng)的第一目標(biāo)特征向量集合;

23、將第一目標(biāo)特征向量集合中的至少一個第一目標(biāo)特征向量輸入至第一異常脫敏日志識別模型,得到各第一目標(biāo)脫敏日志對應(yīng)的第一識別標(biāo)簽;

24、根據(jù)各第一識別標(biāo)簽,確定第一目標(biāo)脫敏日志集合中的異常脫敏日志;

25、其中,第一異常脫敏日志識別模型采用本說明書實施例第一方面提供的方法訓(xùn)練得到。

26、在一種可能的實現(xiàn)方式中,根據(jù)各第一識別標(biāo)簽,確定第一目標(biāo)脫敏日志集合中的異常脫敏日志之后,方法還包括:

27、生成用于提示優(yōu)化異常脫敏日志的異常日志告警提示信息。

28、第三方面,本說明書實施例提供了一種異常脫敏日志識別模型的訓(xùn)練裝置,包括:

29、第一獲取模塊,用于獲取第一樣本脫敏日志集合對應(yīng)的第一樣本特征向量集合;第一樣本脫敏日志集合包括正常脫敏日志;

30、訓(xùn)練模塊,用于基于第一樣本特征向量集合中的至少一個第一樣本特征向量和各第一樣本特征向量攜帶的第一樣本標(biāo)簽,對異常檢測模型進(jìn)行訓(xùn)練,得到第一異常脫敏日志識別模型。

31、第四方面,本說明書實施例提供了一種異常脫敏日志識別裝置,包括:

32、第二獲取模塊,用于獲取待識別的第一目標(biāo)脫敏日志集合對應(yīng)的第一目標(biāo)特征向量集合;

33、識別模塊,用于將第一目標(biāo)特征向量集合中的至少一個第一目標(biāo)特征向量輸入至第一異常脫敏日志識別模型,得到各第一目標(biāo)脫敏日志對應(yīng)的第一識別標(biāo)簽;

34、確定模塊,用于根據(jù)各第一識別標(biāo)簽,確定第一目標(biāo)脫敏日志集合中的異常脫敏日志;

35、其中,第一異常脫敏日志識別模型采用本說明書實施例第一方面提供的方法訓(xùn)練得到。

36、第五方面,本說明書實施例提供了一種計算機(jī)存儲介質(zhì),所述計算機(jī)存儲介質(zhì)存儲有多條指令,上述指令適于由處理器加載并執(zhí)行本說明書實施例第一方面或第二方面提供的方法步驟。

37、第六方面,本說明書實施例提供了一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序;上述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)本說明書實施例第一方面或第二方面提供的方法步驟。

38、上述異常脫敏日志識別模型的訓(xùn)練方法、裝置、電子設(shè)備、計算機(jī)存儲介質(zhì)及計算機(jī)程序產(chǎn)品,通過獲取第一樣本脫敏日志集合對應(yīng)的第一樣本特征向量集合,基于第一樣本特征向量集合中的至少一個第一樣本特征向量和各第一樣本特征向量攜帶的第一樣本標(biāo)簽,訓(xùn)練得到第一異常脫敏日志識別模型,能夠在無法收集到真實異常脫敏日志的情況下,通過包括正常脫敏日志的第一樣本脫敏日志集合,讓模型學(xué)習(xí)正常脫敏日志的特征分布情況,從而識別出與正常脫敏日志的特征分布不同的異常脫敏日志。整個異常脫敏日志識別模型的訓(xùn)練過程,無需異常樣本即可正確識別預(yù)期之外的日志數(shù)據(jù)(如非常規(guī)格式的日志數(shù)據(jù)等)是否為異常脫敏日志,能夠使訓(xùn)練得到的第一異常脫敏日志識別模型有效識別異常脫敏日志。

39、上述異常脫敏日志識別方法、裝置、電子設(shè)備、計算機(jī)存儲介質(zhì)及計算機(jī)程序產(chǎn)品,通過獲取待識別的第一目標(biāo)脫敏日志集合對應(yīng)的第一目標(biāo)特征向量集合,將第一目標(biāo)特征向量集合中的至少一個第一目標(biāo)特征向量輸入至第一異常脫敏日志識別模型,得到各第一目標(biāo)脫敏日志對應(yīng)的第一識別標(biāo)簽,根據(jù)各第一識別標(biāo)簽,確定第一目標(biāo)脫敏日志集合中的異常脫敏日志,能夠采用上述訓(xùn)練得到的第一異常脫敏日志識別模型,正確識別預(yù)期之外的日志數(shù)據(jù)(如非常規(guī)格式的日志數(shù)據(jù)等)是否為異常脫敏日志,實現(xiàn)了異常脫敏日志的有效識別。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1