本發(fā)明涉及自然語言處理技術(shù),尤其涉及一種電力領(lǐng)域?qū)嶓w提取方法、系統(tǒng)、介質(zhì)及設(shè)備。
背景技術(shù):
1、現(xiàn)階段,電力領(lǐng)域?qū)嶓w抽取主要依賴于手工設(shè)計的規(guī)則或基于監(jiān)督學(xué)習(xí)的模型訓(xùn)練,存在一些問題。手工規(guī)則難以應(yīng)對文本語境的多樣性,且維護(hù)成本高?;诒O(jiān)督學(xué)習(xí)的模型需要大量標(biāo)注數(shù)據(jù),在數(shù)據(jù)獲取和標(biāo)注方面存在挑戰(zhàn),尤其是在電力專業(yè)領(lǐng)域,標(biāo)注資源往往較為稀缺。
2、近年來,大模型在自然語言處理領(lǐng)域取得了顯著進(jìn)展,展現(xiàn)出強(qiáng)大的文本理解和生成能力。然而,將大型語言模型應(yīng)用于電力領(lǐng)域?qū)嶓w抽取仍面臨以下挑戰(zhàn):大型語言模型缺乏領(lǐng)域特有的專業(yè)知識,無法準(zhǔn)確識別和理解電力領(lǐng)域的概念和關(guān)系?,F(xiàn)有的大模型實體抽取技術(shù)普遍缺乏對特定領(lǐng)域知識的融入,效果難以令人滿意。
技術(shù)實現(xiàn)思路
1、基于此,有必要針對上述問題,提出了一種電力領(lǐng)域?qū)嶓w提取方法、裝置、介質(zhì)及設(shè)備。
2、一種電力領(lǐng)域?qū)嶓w提取方法,所述方法包括:
3、獲取電力領(lǐng)域的帶有標(biāo)簽的上下文示例,所述標(biāo)簽用于指示所述上下文示例中包含的實體類型。
4、將帶有標(biāo)簽的上下文示例輸入情景學(xué)習(xí)模型中,使情景學(xué)習(xí)模型學(xué)習(xí)所述上下文示例。
5、將待處理語句輸入情景學(xué)習(xí)模型中,得到待處理語句中的實體類型。
6、基于所述待處理語句中的實體類型構(gòu)建輸入,輸入情景學(xué)習(xí)模型中,得到實體類型對應(yīng)的實體。
7、其中,還包括:
8、采集電力領(lǐng)域的專業(yè)名詞數(shù)據(jù),根據(jù)專業(yè)名詞數(shù)據(jù)構(gòu)建電力領(lǐng)域詞典,所述電力領(lǐng)域詞典中包括電力領(lǐng)域的實體和實體類型。
9、根據(jù)電力領(lǐng)域詞典獲取帶有標(biāo)簽的上下文示例。
10、其中,所述采集電力領(lǐng)域的專業(yè)名詞,根據(jù)專業(yè)名詞構(gòu)建電力領(lǐng)域詞典,所述電力領(lǐng)域詞典中包括電力領(lǐng)域的實體和實體類型,具體包括:
11、采集電力領(lǐng)域的專業(yè)名詞,對所述電力領(lǐng)域的專業(yè)名詞進(jìn)行分類。
12、根據(jù)分類后的電力領(lǐng)域的專業(yè)名詞構(gòu)建電力領(lǐng)域詞典,并將所述電力領(lǐng)域詞典存儲在數(shù)據(jù)庫中。
13、其中,還包括:
14、接收用戶的查詢請求,提取出所述查詢請求中包含的專業(yè)名詞。
15、基于所述數(shù)據(jù)庫查詢專業(yè)名詞對應(yīng)的電力領(lǐng)域知識。
16、其中,所述基于所述待處理語句中的實體類型構(gòu)建輸入,輸入情景學(xué)習(xí)模型中,得到實體類型對應(yīng)的實體,具體包括:
17、根據(jù)所述待處理語句中包括的實體類型,生成所述實體類型對應(yīng)的輸入語句。
18、將所述輸入語句輸入情景學(xué)習(xí)模型中,所述情景學(xué)習(xí)模型在每個回合提取一個實體類型對應(yīng)電力領(lǐng)域?qū)嶓w,其中,回合數(shù)與所述待處理語句中的實體類型的數(shù)量相等。
19、其中,所述基于所述待處理語句中的實體類型構(gòu)建輸入,輸入情景學(xué)習(xí)模型中,得到實體類型對應(yīng)的實體之后,還具體包括:
20、根據(jù)所述待處理語句中的實體類型與每個回合提取出來的對應(yīng)的實體構(gòu)成詞組,作為情景學(xué)習(xí)模型的輸出。
21、其中,所述實體類型包括配電系統(tǒng)和電力設(shè)備。
22、一種電力領(lǐng)域?qū)嶓w提取系統(tǒng),所述系統(tǒng)包括:
23、帶有標(biāo)簽的上下文示例獲取模塊,用于獲取電力領(lǐng)域的帶有標(biāo)簽的上下文示例,所述標(biāo)簽用于指示所述上下文示例中包含的實體類型。
24、情景學(xué)習(xí)模型學(xué)習(xí)模塊,用于將帶有標(biāo)簽的上下文示例輸入情景學(xué)習(xí)模型中,使情景學(xué)習(xí)模型學(xué)習(xí)所述上下文示例。
25、實體類型獲取模塊,用于將待處理語句輸入情景學(xué)習(xí)模型中,得到待處理語句中的實體類型。
26、實體獲取模塊,用于基于所述待處理語句中的實體類型構(gòu)建輸入,輸入情景學(xué)習(xí)模型中,得到實體類型對應(yīng)的實體。
27、一種計算機(jī)可讀存儲介質(zhì),存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時,使得所述處理器執(zhí)行如上所述方法的步驟。
28、一種計算機(jī)設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,所述計算機(jī)程序被所述處理器執(zhí)行時,使得所述處理器執(zhí)行如上所述方法的步驟。
29、采用本發(fā)明實施例,具有如下有益效果:
30、本發(fā)明通過獲取電力領(lǐng)域的帶有標(biāo)簽的上下文示例,為情景學(xué)習(xí)模型提供了明確的學(xué)習(xí)目標(biāo)。標(biāo)簽指示了實體類型,使該模型能夠?qū)W習(xí)到電力領(lǐng)域特有的語言模式和實體特征,提高模型在電力領(lǐng)域?qū)嶓w識別上的準(zhǔn)確性和效率。將待處理的語句輸入情景學(xué)習(xí)模型中,模型能夠自動識別并標(biāo)注出語句中的實體類型和具體的實體,為用戶提供了快速、準(zhǔn)確的信息提取服務(wù),大大節(jié)省了人工識別的時間和成本。同時,由于模型已經(jīng)學(xué)習(xí)了電力領(lǐng)域的特定知識,因此它在處理電力領(lǐng)域相關(guān)語句時表現(xiàn)出更高的準(zhǔn)確性和適應(yīng)性。
1.一種電力領(lǐng)域?qū)嶓w提取方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的一種電力領(lǐng)域?qū)嶓w提取方法,其特征在于,還包括:
3.根據(jù)權(quán)利要求2所述的一種電力領(lǐng)域?qū)嶓w提取方法,其特征在于,所述采集電力領(lǐng)域的專業(yè)名詞,根據(jù)專業(yè)名詞構(gòu)建電力領(lǐng)域詞典,所述電力領(lǐng)域詞典中包括電力領(lǐng)域的實體和實體類型,具體包括:
4.根據(jù)權(quán)利要求3所述的的一種電力領(lǐng)域?qū)嶓w提取方法,其特征在于,還包括:
5.根據(jù)權(quán)利要求2所述的一種電力領(lǐng)域?qū)嶓w提取方法,其特征在于,所述基于所述待處理語句中的實體類型構(gòu)建輸入,輸入情景學(xué)習(xí)模型中,得到實體類型對應(yīng)的實體,具體包括:
6.根據(jù)權(quán)利要求5所述的一種電力領(lǐng)域?qū)嶓w提取方法,其特征在于,所述基于所述待處理語句中的實體類型構(gòu)建輸入,輸入情景學(xué)習(xí)模型中,得到實體類型對應(yīng)的實體之后,還具體包括:
7.根據(jù)權(quán)利要求1所述的一種電力領(lǐng)域?qū)嶓w提取方法,其特征在于,所述實體類型包括配電系統(tǒng)和電力設(shè)備。
8.一種電力領(lǐng)域?qū)嶓w提取系統(tǒng),其特征在于,所述系統(tǒng)包括:
9.一種計算機(jī)可讀存儲介質(zhì),存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時,使得所述處理器執(zhí)行如權(quán)利要求1至7中任一項所述方法的步驟。
10.一種計算機(jī)設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,所述計算機(jī)程序被所述處理器執(zhí)行時,使得所述處理器執(zhí)行如權(quán)利要求1至7中任一項所述方法的步驟。