1.一種基于ocr與nlp的保電方案文本識(shí)別分析方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于ocr與nlp的保電方案文本識(shí)別分析方法,其特征在于,獲取保電方案文本的圖像數(shù)據(jù),通過(guò)光學(xué)字符識(shí)別處理將圖像數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化文本數(shù)據(jù),具體包括:
3.根據(jù)權(quán)利要求2所述的一種基于ocr與nlp的保電方案文本識(shí)別分析方法,其特征在于,對(duì)結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行自然語(yǔ)言處理分析,識(shí)別與保電任務(wù)相關(guān)的事件時(shí)間標(biāo)簽與邏輯依賴關(guān)系,并將事件時(shí)間標(biāo)簽與邏輯依賴關(guān)系映射為優(yōu)先級(jí)調(diào)度規(guī)則,具體包括:
4.根據(jù)權(quán)利要求1所述的一種基于ocr與nlp的保電方案文本識(shí)別分析方法,其特征在于,通過(guò)動(dòng)態(tài)語(yǔ)義嵌入模型對(duì)結(jié)構(gòu)化文本數(shù)據(jù)的上下文表示進(jìn)行提取,評(píng)估上下文一致性的波動(dòng)特性,具體包括:
5.根據(jù)權(quán)利要求4所述的一種基于ocr與nlp的保電方案文本識(shí)別分析方法,其特征在于,使用多分形去趨勢(shì)波動(dòng)分析對(duì)語(yǔ)義向量變化率進(jìn)行波動(dòng)特性建模,生成上下文一致性波動(dòng)特性指數(shù)以評(píng)估上下文一致性的波動(dòng)特性,具體為:設(shè)語(yǔ)義向量變化率序列為,通過(guò)多分形去趨勢(shì)波動(dòng)分析生成波動(dòng)特性指數(shù),計(jì)算公式為:;其中,表示上下文一致性波動(dòng)特性指數(shù),表示第個(gè)上下文片段的語(yǔ)義向量變化率,表示語(yǔ)義向量變化率的均值,表示上下文片段的總數(shù),表示上下文片段的編號(hào)。
6.根據(jù)權(quán)利要求5所述的一種基于ocr與nlp的保電方案文本識(shí)別分析方法,其特征在于,基于上下文一致性的波動(dòng)特性確定保電任務(wù)間邏輯關(guān)聯(lián)的強(qiáng)度變化,并根據(jù)保電任務(wù)間邏輯關(guān)聯(lián)的強(qiáng)度變化生成初步保電任務(wù)優(yōu)先級(jí),具體包括:
7.根據(jù)權(quán)利要求1所述的一種基于ocr與nlp的保電方案文本識(shí)別分析方法,其特征在于,對(duì)結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行再次解析,根據(jù)優(yōu)先級(jí)調(diào)度規(guī)則和初步保電任務(wù)優(yōu)先級(jí)確認(rèn)最終的保電任務(wù)優(yōu)先級(jí),具體包括: