本發(fā)明涉及文本處理,具體涉及一種基于人工智能的航空資料修訂系統(tǒng)。
背景技術(shù):
1、航空資料是指與航空活動、飛行操作、航行管理、航空器維修、航空安全等相關(guān)的各種信息和文檔,這些資料對于航空公司、飛行員、航空管制員、飛機維護人員等都至關(guān)重要,以確保飛行安全、合規(guī)性以及高效的航空運營。
2、傳統(tǒng)系統(tǒng)通常依賴人工檢查、比對和修訂航空資料,過程繁瑣且耗時,每次更新都需要人員逐一核對原始資料與修訂內(nèi)容,可能導(dǎo)致修訂周期較長,尤其是在大量資料需要更新時,人工修訂過程中,人員往往需要手動執(zhí)行很多重復(fù)的任務(wù),例如查找、復(fù)制、粘貼和更新多個數(shù)據(jù)點,增加了不必要的工作量;且傳統(tǒng)系統(tǒng)通常依賴人工操作,因此容易受到疲勞、疏忽和判斷錯誤的影響,比如,遺漏某些更新內(nèi)容、誤讀標(biāo)準(zhǔn)資料、錯誤地修正數(shù)據(jù)等,都可能導(dǎo)致航空資料的準(zhǔn)確性受到影響;而且傳統(tǒng)系統(tǒng)大多沒有充分利用自動化技術(shù),需要人工在多個資料中查找和修訂信息;并且傳統(tǒng)系統(tǒng)修訂文本時,通常需要人工查找并單獨更新圖像和文本內(nèi)容,導(dǎo)致圖文資料沒有統(tǒng)一和整合,更新后的資料可能在視覺和信息表達上缺乏一致性,圖文配合不夠精確。
技術(shù)實現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問題在于克服上述現(xiàn)有技術(shù)的缺點,提供一種基于人工智能的航空資料修訂系統(tǒng)。
2、解決上述技術(shù)問題所采用的技術(shù)方案是:一種基于人工智能的航空資料修訂系統(tǒng),一種基于人工智能的航空資料修訂系統(tǒng),其特征在于,包括:
3、文本獲取單元,所述文本獲取單元用于獲取目標(biāo)航空資料文本,對所述目標(biāo)航空資料文本進行分句操作,以得到所述目標(biāo)航空資料文本的第一子句序列,獲取標(biāo)準(zhǔn)航空資料文本,對所述標(biāo)準(zhǔn)航空資料文本進行分句操作,以得到所述目標(biāo)航空資料的第二子句序列;
4、句子匹配單元,所述句子匹配單元用于將所述第一子句序列中各個第一子句與所述第二子句序列進行語義匹配,以得到與所述第一子句相匹配的第二子句,即得到所述第一子句序列所對應(yīng)的第二子句集合;
5、句子釋義單元,所述句子釋義單元用于根據(jù)預(yù)先訓(xùn)練的大語言模型對所述第二子句集合中各個第二子句進行子句釋義,以得到所述第二子句所對應(yīng)的子句釋義,即得到所述第二子句集合所對應(yīng)的子句釋義集合;
6、資料修訂單元,所述資料修訂單元用于對所述子句釋義集合進行上下文感知生成,以得到所述子句釋義集合所對應(yīng)的資料修訂文本;
7、資料生成單元,所述資料生成單元用于將所述第二子句集合與標(biāo)準(zhǔn)航空圖像集合進行圖文匹配,以得到所述第二子句所對應(yīng)的標(biāo)準(zhǔn)航空圖像,將所述標(biāo)準(zhǔn)航空圖像添加至所述資料修訂文本中的相應(yīng)位置,以得到航空圖文修訂資料。
8、優(yōu)選的,將所述第一子句序列中各個第一子句與所述第二子句序列進行語義匹配,以得到與所述第一子句相匹配的第二子句,包括:
9、對所述第一子句和所述第二子句進行分詞操作,以得到所述第一子句所對應(yīng)的第一詞語序列和所述第二子句所對應(yīng)的第二詞語序列;
10、對所述第一子句和所述第二子句進行字符分割操作,以得到所述第一子句所對應(yīng)的第一字符序列和所述第二子句所對應(yīng)的第二字符序列;
11、根據(jù)預(yù)訓(xùn)練的word2vec模型的權(quán)重將所述第一詞語和所述第一詞語所對應(yīng)的第一字符映射為第一詞語向量;根據(jù)預(yù)訓(xùn)練的word2vec模型的權(quán)重將所述第二詞語和所述第二詞語所對應(yīng)的第二字符映射為第二詞語向量;
12、對所述第一詞語向量和所述第二詞語向量進行正則化,以得到第一詞語向量所對應(yīng)的第一標(biāo)準(zhǔn)詞語向量和所述第二詞語向量所對應(yīng)的第二標(biāo)準(zhǔn)詞語向量。
13、優(yōu)選的,將所述第一子句序列中各個第一子句與所述第二子句序列進行語義匹配,以得到與所述第一子句相匹配的第二子句,包括:
14、對所述第一標(biāo)準(zhǔn)詞語向量和所述第二標(biāo)準(zhǔn)詞語向量進行差異編碼,以得到所述第一標(biāo)準(zhǔn)詞語向量和所述第二標(biāo)準(zhǔn)詞語向量之間的差異向量;
15、對所述第一標(biāo)準(zhǔn)詞語向量和所述第二標(biāo)準(zhǔn)詞語向量進行交互編碼,以得到所述第一標(biāo)準(zhǔn)詞語向量和所述第二標(biāo)準(zhǔn)詞語向量之間的交互向量;
16、將所述差異向量和所述交互向量進行融合,以得到融合向量,對所述融合向量進行分類,以得到所述第一子句和所述第二子句之間的匹配度。
17、優(yōu)選的,對所述第一標(biāo)準(zhǔn)詞語向量和所述第二標(biāo)準(zhǔn)詞語向量進行差異編碼,以得到所述第一標(biāo)準(zhǔn)詞語向量和所述第二標(biāo)準(zhǔn)詞語向量之間的差異向量,包括:
18、根據(jù)雙向gru對所述第一標(biāo)準(zhǔn)詞語向量和所述第二標(biāo)準(zhǔn)詞語向量進行上下文編碼,以得到所述第一標(biāo)準(zhǔn)詞語向量所對應(yīng)的第一上下文向量和所述第二標(biāo)準(zhǔn)詞語向量所對應(yīng)的第二上下文向量;
19、根據(jù)manhattan距離確定所述第一上下文向量和所述第二上下文向量之間的距離,根據(jù)所述距離對所述第一上下文向量和所述第二上下文向量進行差異編碼,以得到所述第一標(biāo)準(zhǔn)詞語向量和所述第二標(biāo)準(zhǔn)詞語向量之間的差異向量。
20、優(yōu)選的,對所述第一標(biāo)準(zhǔn)詞語向量和所述第二標(biāo)準(zhǔn)詞語向量進行交互編碼,以得到所述第一標(biāo)準(zhǔn)詞語向量和所述第二標(biāo)準(zhǔn)詞語向量之間的交互向量,包括:
21、根據(jù)多頭注意力機制對所述第一標(biāo)準(zhǔn)詞語向量和所述第二標(biāo)準(zhǔn)詞語向量進行交互編碼,以得到所述第一標(biāo)準(zhǔn)詞語向量和所述第二標(biāo)準(zhǔn)詞語向量之間的交互向量,其中,所述交互向量的表達式如下:
22、;
23、其中,表示交互向量,、和表示第頭的查詢、鍵和值投影矩陣,和表示第一標(biāo)準(zhǔn)詞語向量和第二標(biāo)準(zhǔn)詞語向量,表示多頭注意力機制,表示拼接操作。
24、優(yōu)選的,對所述子句釋義集合進行上下文感知生成,以得到所述子句釋義集合所對應(yīng)的資料修訂文本,包括:
25、對所述子句釋義集合進行依存句法分析,以生成帶權(quán)有向圖,其中,所述帶權(quán)有向圖的表達式如下:
26、;
27、其中,表示帶權(quán)有向圖,表示節(jié)點集合,表示依存邊集合,表示句法權(quán)重集合,其中,節(jié)點集合中的節(jié)點與子句釋義集合中子句釋義中的詞匯單元相對應(yīng),依存邊集合中的依存邊與詞匯單元之間的依存關(guān)系類型相對應(yīng),句法權(quán)重集合中的句法權(quán)重與句法關(guān)聯(lián)強度相對應(yīng);
28、對所述子句釋義集合進行語義角色標(biāo)注,以得到語義角色標(biāo)注結(jié)果,基于所述語義角色標(biāo)注結(jié)果構(gòu)建超邊集合,其中,所述超邊集合中超邊的表達式如下:
29、;
30、其中,表示超邊,表示子句釋義中第0個謂詞-論元結(jié)構(gòu);
31、基于所述超邊集合構(gòu)建所述帶權(quán)有向圖所對應(yīng)的超圖,其中,所述超圖的表達式如下:
32、;
33、其中,表示超圖,表示超邊集合。
34、優(yōu)選的,對所述子句釋義集合進行上下文感知生成,以得到所述子句釋義集合所對應(yīng)的資料修訂文本,還包括:
35、基于圖注意力網(wǎng)絡(luò)對所述超圖進行特征編碼,以得到所述超圖所對應(yīng)的上下文感知特征向量;
36、基于所述上下文感知特征向量構(gòu)建原型向量,其中,所述原型向量的表達式如下:
37、;
38、其中,表示原型向量,表示平均池化操作,表示上下文感知特征向量;
39、基于所述原型向量計算所述子句釋義集合中各個子句釋義的語義偏離度,其中,所述語義偏離度的計算公式如下:
40、;
41、其中,表示原型向量與候選子句釋義之間的語義偏離度,表示候選子句釋義的輸出向量;
42、基于門控機制對所述候選子句釋義進行動態(tài)調(diào)制候選釋義表示,其中,所述動態(tài)調(diào)制候選釋義表示的表達式如下:
43、;
44、其中,表示動態(tài)調(diào)制候選釋義表示,表示激活函數(shù),表示偏置項,表示超圖中的超邊連接初始化;
45、當(dāng)所述語義偏離度小于預(yù)設(shè)的偏離度閾值時,則將所述語義偏離度所對應(yīng)的候選釋義作為所述資料修訂文本的子句。
46、優(yōu)選的,將所述第二子句集合與標(biāo)準(zhǔn)航空圖像集合進行圖文匹配,以得到所述第二子句所對應(yīng)的標(biāo)準(zhǔn)航空圖像,包括:
47、根據(jù)自底而上注意力對所述標(biāo)準(zhǔn)航空圖像進行提取特征,以生成區(qū)域特征向量,將所述標(biāo)準(zhǔn)航空圖像切分為若干塊,以得到位置特征向量,根據(jù)bi-gru對所述第二子句進行特征提取,以得到文本特征向量;
48、將所述位置特征向量經(jīng)過線性層變換作為查詢向量,將所述區(qū)域特征向量作為鍵和值向量做交叉注意力,以得到視覺特征向量;
49、對所述文本特征向量和所述視覺特征向量進行相似度采樣,以得到整體相似性,若所述整體相似性高于預(yù)設(shè)的相似性閾值,則所述第二子句與所述標(biāo)準(zhǔn)航空圖像相匹配。
50、優(yōu)選的,對所述文本特征向量和所述視覺特征向量進行相似度采樣,以得到整體相似性,包括:
51、計算所述文本特征向量和所述視覺特征向量之間的相似度,其中,所述相似度使用余弦相似度;
52、根據(jù)所述相似度確定所述文本特征向量和所述視覺特征向量之間的語義關(guān)系;
53、根據(jù)所述文本特征向量和所述視覺特征向量之間的語義關(guān)系確定所述塊在所述標(biāo)準(zhǔn)航空圖像中的加權(quán)相似度;
54、根據(jù)所述塊在所述標(biāo)準(zhǔn)航空圖像中的加權(quán)相似度確定所述文本特征向量和所述視覺特征向量之間的整體相似性。
55、優(yōu)選的,所述語義關(guān)系的計算公式如下:
56、;
57、其中,表示文本特征向量所對應(yīng)的第二子句和視覺特征向量所對應(yīng)的標(biāo)準(zhǔn)航空圖像之間的語義關(guān)系,表示當(dāng)輸入為正時等于輸入的掩碼,否則為0,表示文本特征向量和視覺特征向量之間的相似度,表示預(yù)設(shè)的參數(shù)閾值,表示標(biāo)準(zhǔn)航空圖像中塊的數(shù)量,表示激活函數(shù);
58、所述加權(quán)相似度的計算公式如下:
59、;
60、其中,表示塊在標(biāo)準(zhǔn)航空圖像中的加權(quán)相似度,表示塊的視覺特征向量;
61、所述整體相似性的計算公式如下:
62、;
63、其中,表示文本特征向量和視覺特征向量之間的整體相似性,表示文本特征向量。
64、本發(fā)明的有益效果如下:(1)本發(fā)明通過自動化的文本處理流程(如文本分句、語義匹配、子句釋義等)快速地從目標(biāo)航空資料文本中識別出需要修訂的部分,并結(jié)合標(biāo)準(zhǔn)航空資料進行比較和修訂,這可以大大減少人工修訂的時間和成本,并提高修訂的準(zhǔn)確性,避免人為錯誤,且通過引入預(yù)先訓(xùn)練的大語言模型,系統(tǒng)能夠更好地理解文本中的語義,尤其是在復(fù)雜的航空資料中,大語言模型的使用可以確保對航空資料文本的深入理解,并且能夠根據(jù)上下文提供精準(zhǔn)的釋義,確保所得到的修訂文本在語義上更為準(zhǔn)確和專業(yè);(2)本發(fā)明通過將文本與標(biāo)準(zhǔn)航空圖像集合進行圖文匹配,自動選擇并插入與修訂文本相關(guān)的標(biāo)準(zhǔn)航空圖像,這種自動化圖文匹配功能避免了人工查找和插入圖像的繁瑣過程,保證了修訂后的航空資料既有精準(zhǔn)的文本修訂,又能對應(yīng)相應(yīng)的圖像信息,提高了資料的完整性和實用性,且能夠進行上下文感知生成,即根據(jù)整個文本的上下文來生成適當(dāng)?shù)男抻唭?nèi)容,而不僅僅是逐條修訂單獨的句子,這可以確保修訂后的資料更加連貫和自然,不會出現(xiàn)邏輯跳躍或信息斷層;(3)本發(fā)明通過標(biāo)準(zhǔn)航空資料和標(biāo)準(zhǔn)航空圖像的引用,確保所有修訂后的資料遵循統(tǒng)一的標(biāo)準(zhǔn),避免了資料在內(nèi)容上出現(xiàn)不一致或不規(guī)范的情況,這對于航空領(lǐng)域來說尤其重要,因為精確的、標(biāo)準(zhǔn)化的航空資料對于飛行安全和操作至關(guān)重要,而且生成的航空圖文修訂資料不僅提供了文本的修訂,還通過圖文配合提升了資料的可視化效果,這使得航空人員能夠更清晰、更直觀地理解航空資料,尤其是在飛行操作中可能涉及的具體圖像與數(shù)據(jù),增加了資料的易用性和實際應(yīng)用價值。