最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法及系統(tǒng)與流程

文檔序號:41954817發(fā)布日期:2025-05-16 14:20閱讀:3來源:國知局
基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法及系統(tǒng)與流程

本發(fā)明涉及知識圖譜構(gòu)建,具體為基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法及系統(tǒng)。


背景技術(shù):

1、分布式能源接入中分布式光伏接入在電氣連接方面對標準執(zhí)行的差異性較大、在部分設(shè)備通信鏈路方面未落實標準要求以及在設(shè)備接入缺乏安全認證,在此基礎(chǔ)上需要對分布式能源(光伏)接入設(shè)置光伏領(lǐng)域知識圖譜。因此如何基于分布式能源抓取的多源異構(gòu)數(shù)據(jù)構(gòu)建知識圖譜成為技術(shù)難點。本發(fā)明基于多源異構(gòu)數(shù)據(jù)構(gòu)建在基于分布式光伏接入領(lǐng)域的知識結(jié)構(gòu)的基礎(chǔ)上,實現(xiàn)分布式光伏能源的知識圖譜構(gòu)建過程。


技術(shù)實現(xiàn)思路

1、鑒于上述存在的問題,提出了本發(fā)明。

2、因此,本發(fā)明解決的技術(shù)問題是:首先,多源異構(gòu)數(shù)據(jù)難以高效整合和處理,不同類型的數(shù)據(jù)(包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù))在數(shù)據(jù)格式和標準執(zhí)行上差異較大,導(dǎo)致無法統(tǒng)一分析和管理;其次,缺乏系統(tǒng)化的知識分類和管理方法,導(dǎo)致分布式光伏領(lǐng)域的知識難以有效組織和利用,知識的擴展性和可操作性差;此外,在分布式光伏接入過程中,實體與實體之間的復(fù)雜關(guān)系難以自動識別和提取,現(xiàn)有方法在處理異構(gòu)數(shù)據(jù)中的實體關(guān)系時效率低,準確性差;最后,現(xiàn)有技術(shù)中缺乏有效的機制來對知識圖譜中的數(shù)據(jù)進行動態(tài)更新和維護,難以確保知識的持續(xù)準確性和一致性。

3、為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法,包括:

4、收集分布式光伏接入后分布式能源數(shù)據(jù);

5、對收集的分布式能源數(shù)據(jù)進行預(yù)處理;

6、根據(jù)分布式光伏接入領(lǐng)域的知識分類,定義光伏領(lǐng)域的核心知識實體;

7、定義所述核心知識實體之間的關(guān)系;

8、對所述核心知識實體和關(guān)系進行抽??;

9、基于所抽取的核心知識實體和關(guān)系,構(gòu)建分布式光伏領(lǐng)域的知識圖譜。

10、作為本發(fā)明所述的基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法的一種優(yōu)選方案,其中:所述收集分布式光伏接入后分布式能源數(shù)據(jù)包括通過光伏逆變器和氣象監(jiān)測站采集光伏電站的實時運行數(shù)據(jù)、氣象數(shù)據(jù)、維護數(shù)據(jù)和能源交易數(shù)據(jù),并以預(yù)定時間間隔記錄所述數(shù)據(jù)。

11、作為本發(fā)明所述的基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法的一種優(yōu)選方案,其中:所述進行預(yù)處理包括對收集到的數(shù)據(jù)進行數(shù)據(jù)清洗,去除不完整或錯誤的數(shù)據(jù)記錄;

12、將來自不同數(shù)據(jù)源的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進行格式轉(zhuǎn)換與融合;

13、對清洗和融合后的數(shù)據(jù)進行標注添加標簽。

14、作為本發(fā)明所述的基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法的一種優(yōu)選方案,其中:所述定義光伏領(lǐng)域的核心知識實體包括根據(jù)分布式光伏接入領(lǐng)域的知識分類,定義光伏領(lǐng)域的核心知識實體,所述核心知識實體包括基礎(chǔ)實體、設(shè)備實體和數(shù)據(jù)實體,其中基礎(chǔ)實體包括范圍、規(guī)范性引用文件和技術(shù)位置,設(shè)備實體包括無功容量、電壓調(diào)節(jié)、啟停、運行適用性和安全與保護,數(shù)據(jù)實體包括電能質(zhì)量、通用技術(shù)要求、電能計量、通信與信號以及系統(tǒng)檢測;

15、定義所述核心知識實體之間的關(guān)系,所述關(guān)系包括基礎(chǔ)實體與設(shè)備實體、數(shù)據(jù)實體之間的連接關(guān)系,設(shè)備實體與數(shù)據(jù)實體之間的測量關(guān)系,以及設(shè)備實體之間的產(chǎn)生關(guān)系;

16、為每個核心知識實體定義其相關(guān)屬性,所述屬性包括運行適用性的電壓范圍和頻率范圍屬性,以及電能質(zhì)量的基本要求屬性。

17、作為本發(fā)明所述的基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法的一種優(yōu)選方案,其中:所述定義所述核心知識實體之間的關(guān)系包括通過關(guān)鍵詞匹配規(guī)則識別基礎(chǔ)實體,所述關(guān)鍵詞匹配規(guī)則用于檢測數(shù)據(jù)中的特定關(guān)鍵詞,若數(shù)據(jù)中出現(xiàn)預(yù)定義關(guān)鍵詞,則將其對應(yīng)的內(nèi)容識別為基礎(chǔ)實體;

18、利用支持向量機算法對文本數(shù)據(jù)中的設(shè)備實體和數(shù)據(jù)實體進行識別,所述過程包括對數(shù)據(jù)進行標注,并基于標注數(shù)據(jù)訓(xùn)練svm模型,所述模型根據(jù)文本中的詞匯、詞性及上下文信息預(yù)測文本中的光伏設(shè)備實體和數(shù)據(jù)實體的類型;

19、利用關(guān)系抽取模板從預(yù)處理后的數(shù)據(jù)中提取實體之間的關(guān)系,所述關(guān)系抽取通過分析數(shù)據(jù)中的特定時間戳信息,識別電能質(zhì)量與電壓偏差數(shù)據(jù)之間的關(guān)系;

20、通過神經(jīng)網(wǎng)絡(luò)的關(guān)系分類模型對標注數(shù)據(jù)中的實體對進行訓(xùn)練,所述模型根據(jù)實體的屬性、上下文信息和特征對實體對之間的關(guān)系進行分類,確定實體間的具體關(guān)系類型。

21、作為本發(fā)明所述的基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法的一種優(yōu)選方案,其中:所述構(gòu)建分布式光伏領(lǐng)域的知識圖譜包括在圖數(shù)據(jù)庫中構(gòu)建知識圖譜,基于實體識別和關(guān)系抽取的結(jié)果,將實體作為節(jié)點存儲,并將實體之間的關(guān)系作為邊進行存儲;

22、為每個節(jié)點設(shè)置相應(yīng)的屬性,根據(jù)節(jié)點之間的關(guān)系將節(jié)點連接在一起,構(gòu)成完整的知識圖譜結(jié)構(gòu)。

23、作為本發(fā)明所述的基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法的一種優(yōu)選方案,其中:對知識圖譜進行定期評估,所述評估包括通過比較實體節(jié)點的屬性和連接關(guān)系,檢查并修正不符合預(yù)設(shè)條件的節(jié)點或關(guān)系,確保知識圖譜中的數(shù)據(jù)保持一致。

24、本發(fā)明的另外一個目的是提供基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建系統(tǒng),其能通過構(gòu)建基于知識圖譜的光伏領(lǐng)域知識管理系統(tǒng),解決了現(xiàn)有分布式光伏接入數(shù)據(jù)處理中的數(shù)據(jù)整合不一致、知識分類不系統(tǒng)、關(guān)系提取準確性低問題。

25、為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建系統(tǒng),包括:數(shù)據(jù)采集模塊、數(shù)據(jù)處理模塊、實體定義模塊、關(guān)系定義模塊、關(guān)系抽取模塊以及圖譜構(gòu)建模塊;所述數(shù)據(jù)采集模塊用于收集分布式光伏接入后分布式能源數(shù)據(jù);所述數(shù)據(jù)處理模塊用于對收集的分布式能源數(shù)據(jù)進行預(yù)處理;所述實體定義模塊用于根據(jù)分布式光伏接入領(lǐng)域的知識分類,定義光伏領(lǐng)域的核心知識實體;所述關(guān)系定義模塊用于定義所述核心知識實體之間的關(guān)系;所述關(guān)系抽取模塊用于對所述核心知識實體和關(guān)系進行抽??;所述圖譜構(gòu)建模塊用于基于所抽取的核心知識實體和關(guān)系,構(gòu)建分布式光伏領(lǐng)域的知識圖譜。

26、一種計算機設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如上所述基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法的步驟。

27、一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上所述基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法的步驟。

28、本發(fā)明的有益效果:本發(fā)明提供的基于分布式能源異構(gòu)數(shù)據(jù)的知識圖譜構(gòu)建方法本發(fā)明通過引入多源異構(gòu)數(shù)據(jù)的預(yù)處理方法,有效提升了在分布式光伏接入過程中不同數(shù)據(jù)源的數(shù)據(jù)整合效率,減少了由于數(shù)據(jù)格式不一致導(dǎo)致的處理困難。通過系統(tǒng)化定義光伏領(lǐng)域的核心知識實體,改進了分布式光伏接入過程中知識管理的條理性,使得復(fù)雜數(shù)據(jù)中的知識能夠被清晰組織和快速訪問。本發(fā)明在實體識別過程中結(jié)合了關(guān)鍵詞匹配和支持向量機(svm)算法,使得在處理復(fù)雜文本數(shù)據(jù)時能夠提高實體識別的準確性,尤其在面對非結(jié)構(gòu)化數(shù)據(jù)時表現(xiàn)更為顯著。在關(guān)系提取方面,利用關(guān)系抽取模板與神經(jīng)網(wǎng)絡(luò)分類模型,較好地解決了實體間復(fù)雜關(guān)系提取的效率低和準確性不足的問題。通過基于圖數(shù)據(jù)庫的知識圖譜構(gòu)建方法,本發(fā)明確保了實體和關(guān)系數(shù)據(jù)的可視化存儲與高效查詢。此外,定期對知識圖譜進行評估和更新,減少了知識過時或不一致的問題,保障了系統(tǒng)的長期穩(wěn)定性和數(shù)據(jù)的實時性。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1