最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

基于大語言模型的正則表達(dá)式生成方法及裝置與流程

文檔序號:41952258發(fā)布日期:2025-05-16 14:14閱讀:4來源:國知局
基于大語言模型的正則表達(dá)式生成方法及裝置與流程

本說明書實施例涉及機(jī)器學(xué)習(xí),特別涉及基于大語言模型的正則表達(dá)式生成方法及裝置。


背景技術(shù):

1、隨著計算機(jī)和互聯(lián)網(wǎng)技術(shù)的發(fā)展,意圖識別在越來越多的場景中得以應(yīng)用,其主要用于理解用戶的意圖;比如智能客服場景中,意圖識別廣泛應(yīng)用于客服機(jī)器人中,通過識別用戶輸入的意圖,機(jī)器人能夠快速響應(yīng)用戶需求。此外,在電商智能客服、虛擬助手等場景中意圖識別的精準(zhǔn)度起到重要作用?,F(xiàn)有技術(shù)中,意圖識別大多數(shù)基于規(guī)則的方法依賴詞典匹配,但靈活性不足;而傳統(tǒng)機(jī)器學(xué)習(xí)則通過統(tǒng)計特征分類,深度學(xué)習(xí)(如bert、lstm)則是通過自動捕捉語義,提升準(zhǔn)確性。雖然上述實現(xiàn)可以達(dá)到意圖識別目的,但是在實際業(yè)務(wù)場景中意圖識別精準(zhǔn)度并不高,同時效率低下,因此亟需一種有效的方案以解決上述問題。


技術(shù)實現(xiàn)思路

1、有鑒于此,本說明書實施例提供了一種基于大語言模型的正則表達(dá)式生成方法。本說明書一個或者多個實施例同時涉及一種基于大語言模型的正則表達(dá)式生成裝置,一種數(shù)據(jù)處理方法,一種數(shù)據(jù)處理裝置,一種計算設(shè)備,一種計算機(jī)可讀存儲介質(zhì)以及一種計算機(jī)程序產(chǎn)品,以解決現(xiàn)有技術(shù)中存在的技術(shù)缺陷。

2、根據(jù)本說明書實施例的第一方面,提供了一種基于大語言模型的正則表達(dá)式生成方法,包括:

3、在樣本庫中選擇意圖標(biāo)簽相同的候選樣本組成多個意圖文檔,其中,候選樣本基于文本數(shù)據(jù)和所述文本數(shù)據(jù)對應(yīng)的意圖標(biāo)簽組成;

4、提取每個意圖文檔對應(yīng)的意圖關(guān)鍵詞,并通過對所述意圖關(guān)鍵詞進(jìn)行聚類,獲得目標(biāo)意圖標(biāo)簽對應(yīng)的意圖關(guān)鍵詞集合;

5、利用大語言模型按照目標(biāo)提示詞對所述意圖關(guān)鍵詞集合進(jìn)行處理,獲得所述目標(biāo)意圖標(biāo)簽對應(yīng)的正則表達(dá)式;

6、將所述正則表達(dá)式存儲至正則庫,其中,所述正則庫存儲的正則表達(dá)式用于在問答交互階段識別用戶問答意圖。

7、根據(jù)本說明書實施例的第二方面,提供了一種數(shù)據(jù)處理方法,包括:

8、獲取用戶提交的問題文本數(shù)據(jù);

9、利用正則庫中存儲的正則表達(dá)式對所述問題文本數(shù)據(jù)進(jìn)行正則匹配,其中,所述正則庫中存儲的正則表達(dá)式根據(jù)上述方法構(gòu)建;

10、根據(jù)匹配結(jié)果確定所述問題文本數(shù)據(jù)對應(yīng)的目標(biāo)正則表達(dá)式,并將所述目標(biāo)正則表達(dá)式對應(yīng)的意圖標(biāo)簽作為所述問題文本數(shù)據(jù)對應(yīng)的意圖標(biāo)簽;

11、基于所述問題文本數(shù)據(jù)對應(yīng)的意圖標(biāo)簽生成答案文本數(shù)據(jù),并向所述用戶進(jìn)行展示。

12、根據(jù)本說明書實施例的第三方面,提供了一種基于大語言模型的正則表達(dá)式生成裝置,包括:

13、選擇模塊,被配置為在樣本庫中選擇意圖標(biāo)簽相同的候選樣本組成多個意圖文檔,其中,候選樣本基于文本數(shù)據(jù)和所述文本數(shù)據(jù)對應(yīng)的意圖標(biāo)簽組成;

14、提取模塊,被配置為提取每個意圖文檔對應(yīng)的意圖關(guān)鍵詞,并通過對所述意圖關(guān)鍵詞進(jìn)行聚類,獲得目標(biāo)意圖標(biāo)簽對應(yīng)的意圖關(guān)鍵詞集合;

15、處理模塊,被配置為利用大語言模型按照目標(biāo)提示詞對所述意圖關(guān)鍵詞集合進(jìn)行處理,獲得所述目標(biāo)意圖標(biāo)簽對應(yīng)的正則表達(dá)式;

16、存儲模塊,被配置為將所述正則表達(dá)式存儲至正則庫,其中,所述正則庫存儲的正則表達(dá)式用于在問答交互階段識別用戶問答意圖。

17、根據(jù)本說明書實施例的第四方面,提供了一種數(shù)據(jù)處理裝置,包括:

18、獲取模塊,被配置為獲取用戶提交的問題文本數(shù)據(jù);

19、匹配模塊,被配置為利用正則庫中存儲的正則表達(dá)式對所述問題文本數(shù)據(jù)進(jìn)行正則匹配,其中,所述正則庫中存儲的正則表達(dá)式根據(jù)上述方法構(gòu)建;

20、確定模塊,被配置為根據(jù)匹配結(jié)果確定所述問題文本數(shù)據(jù)對應(yīng)的目標(biāo)正則表達(dá)式,并將所述目標(biāo)正則表達(dá)式對應(yīng)的意圖標(biāo)簽作為所述問題文本數(shù)據(jù)對應(yīng)的意圖標(biāo)簽;

21、展示模塊,被配置為基于所述問題文本數(shù)據(jù)對應(yīng)的意圖標(biāo)簽生成答案文本數(shù)據(jù),并向所述用戶進(jìn)行展示。

22、根據(jù)本說明書實施例的第五方面,提供了一種計算設(shè)備,包括:

23、存儲器和處理器;

24、所述存儲器用于存儲計算機(jī)可執(zhí)行指令,所述處理器用于執(zhí)行所述計算機(jī)可執(zhí)行指令,該計算機(jī)可執(zhí)行指令被處理器執(zhí)行時實現(xiàn)上述基于大語言模型的正則表達(dá)式生成方法或數(shù)據(jù)處理方法的步驟。

25、根據(jù)本說明書實施例的第六方面,提供了一種計算機(jī)可讀存儲介質(zhì),其存儲有計算機(jī)可執(zhí)行指令,該指令被處理器執(zhí)行時實現(xiàn)上述基于大語言模型的正則表達(dá)式生成方法或數(shù)據(jù)處理方法的步驟。

26、根據(jù)本說明書實施例的第七方面,提供了一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序或指令,該計算機(jī)程序或指令被處理器執(zhí)行時實現(xiàn)上述基于大語言模型的正則表達(dá)式生成方法或數(shù)據(jù)處理方法的步驟。

27、本實施例提供的基于大語言模型的正則表達(dá)式生成方法,為了能夠構(gòu)建出快速且精準(zhǔn)識別文本數(shù)據(jù)意圖的正則表達(dá)式,可以先在樣本庫中選擇意圖標(biāo)簽相同的候選樣本組成多個意圖文檔,其中,候選樣本基于文本數(shù)據(jù)和文本數(shù)據(jù)對應(yīng)的意圖標(biāo)簽組成;在此基礎(chǔ)上,可以提取每個意圖文檔對應(yīng)的意圖關(guān)鍵詞,并通過對意圖關(guān)鍵詞進(jìn)行聚類,從而獲得目標(biāo)意圖標(biāo)簽對應(yīng)的意圖關(guān)鍵詞集合,實現(xiàn)在正則表達(dá)式構(gòu)建前可以將表達(dá)目標(biāo)意圖標(biāo)簽對應(yīng)意圖信息的關(guān)鍵詞整合在一起,從而使得后續(xù)對應(yīng)目標(biāo)意圖標(biāo)簽的正則表達(dá)式構(gòu)建更加準(zhǔn)確。此后即可利用大語言模型按照目標(biāo)提示詞對意圖關(guān)鍵詞集合進(jìn)行處理,實現(xiàn)根據(jù)處理結(jié)果獲得目標(biāo)意圖標(biāo)簽對應(yīng)的正則表達(dá)式;最后即可將正則表達(dá)式存儲至正則庫,以在應(yīng)用階段,可以使用正則庫存儲的正則表達(dá)式在問答交互階段識別用戶問答意圖。從而有效的提高了意圖識別效率和準(zhǔn)確度。



技術(shù)特征:

1.一種基于大語言模型的正則表達(dá)式生成方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的基于大語言模型的正則表達(dá)式生成方法,其特征在于,所述在樣本庫中選擇意圖標(biāo)簽相同的候選樣本組成多個意圖文檔步驟執(zhí)行之前,還包括:

3.根據(jù)權(quán)利要求2所述的基于大語言模型的正則表達(dá)式生成方法,其特征在于,在匹配失敗的情況下,還包括:

4.根據(jù)權(quán)利要求1所述的基于大語言模型的正則表達(dá)式生成方法,其特征在于,所述多個意圖文檔中的任意一個意圖文檔對應(yīng)的意圖關(guān)鍵詞的確定,包括:

5.根據(jù)權(quán)利要求1所述的基于大語言模型的正則表達(dá)式生成方法,其特征在于,所述目標(biāo)意圖標(biāo)簽對應(yīng)的意圖關(guān)鍵詞集合的確定,包括:

6.根據(jù)權(quán)利要求1所述的基于大語言模型的正則表達(dá)式生成方法,其特征在于,所述將所述正則表達(dá)式存儲至正則庫步驟執(zhí)行之后,還包括:

7.根據(jù)權(quán)利要求4所述的基于大語言模型的正則表達(dá)式生成方法,其特征在于,所述利用關(guān)鍵詞去重算法對所述多個初始意圖關(guān)鍵詞進(jìn)行去重處理,根據(jù)去重處理結(jié)果確定所述待處理意圖文檔對應(yīng)的意圖關(guān)鍵詞,包括:

8.一種數(shù)據(jù)處理方法,其特征在于,包括:

9.一種基于大語言模型的正則表達(dá)式生成裝置,其特征在于,包括:

10.一種數(shù)據(jù)處理裝置,其特征在于,包括:

11.一種計算設(shè)備,其特征在于,包括:

12.一種計算機(jī)可讀存儲介質(zhì),其特征在于,其存儲有計算機(jī)可執(zhí)行指令,該計算機(jī)可執(zhí)行指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至8任一項所述方法的步驟。

13.一種計算機(jī)程序產(chǎn)品,其特征在于,包括計算機(jī)程序或指令,該計算機(jī)程序或指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至8任一項所述方法的步驟。


技術(shù)總結(jié)
本說明書實施例提供基于大語言模型的正則表達(dá)式生成方法及裝置,其中所述基于大語言模型的正則表達(dá)式生成方法包括:在樣本庫中選擇意圖標(biāo)簽相同的候選樣本組成多個意圖文檔,其中,候選樣本基于文本數(shù)據(jù)和所述文本數(shù)據(jù)對應(yīng)的意圖標(biāo)簽組成;提取每個意圖文檔對應(yīng)的意圖關(guān)鍵詞,并通過對所述意圖關(guān)鍵詞進(jìn)行聚類,獲得目標(biāo)意圖標(biāo)簽對應(yīng)的意圖關(guān)鍵詞集合;利用大語言模型按照目標(biāo)提示詞對所述意圖關(guān)鍵詞集合進(jìn)行處理,獲得所述目標(biāo)意圖標(biāo)簽對應(yīng)的正則表達(dá)式;將所述正則表達(dá)式存儲至正則庫,其中,所述正則庫存儲的正則表達(dá)式用于在問答交互階段識別用戶問答意圖。

技術(shù)研發(fā)人員:周智欣,陳超斌,游克海
受保護(hù)的技術(shù)使用者:深圳唯愛智云科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/15
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1