本發(fā)明涉及大數(shù)據(jù)分析與知識圖譜構(gòu)建,具體為一種區(qū)域可持續(xù)發(fā)展指標(biāo)知識圖譜的數(shù)據(jù)處理方法及裝置。
背景技術(shù):
1、在數(shù)字化浪潮的推動下,城市與區(qū)域發(fā)展研究領(lǐng)域迎來深刻變革,數(shù)據(jù)處理方法作為洞察區(qū)域發(fā)展規(guī)律、制定科學(xué)發(fā)展策略的關(guān)鍵支撐,其重要性愈發(fā)凸顯,區(qū)域可持續(xù)發(fā)展關(guān)乎資源的合理配置、生態(tài)環(huán)境的保護(hù)以及社會民生的改善,是實現(xiàn)人類社會長期繁榮的核心議題。
2、在此背景下,現(xiàn)有技術(shù)中公開號為cn117708192a提供的基于大數(shù)據(jù)城市指標(biāo)知識圖譜的數(shù)據(jù)處理方法,包括以下步驟:包括:獲取目標(biāo)地區(qū)多個歷史年份的城市宏觀大數(shù)據(jù),生成原始指標(biāo)集;從原始指標(biāo)集中選取優(yōu)先級最高的第一城市指標(biāo),并確定以所述第一城市指標(biāo)為前置指標(biāo)的各第二城市指標(biāo),從而生成可用指標(biāo)集;在所述可用指標(biāo)集內(nèi)逐次抽取多個指標(biāo)組合,分別學(xué)習(xí)同一年份內(nèi)各指標(biāo)組合與所述第一城市指標(biāo)間的數(shù)據(jù)關(guān)系,確定最佳指標(biāo)組合和最佳數(shù)據(jù)模型;返回所述選取第一城市指標(biāo)的操作,直到所述原始指標(biāo)集中的城市指標(biāo)均選取;根據(jù)各城市指標(biāo)對應(yīng)的最佳指標(biāo)組合和最佳數(shù)據(jù)模型,構(gòu)建以各城市指標(biāo)為節(jié)點的知識圖譜。本方法通過量化形式明確大量城市指標(biāo)之間的復(fù)雜數(shù)據(jù)關(guān)系。
3、但是還存在如下不足,由上述的陳述可知,一方面,現(xiàn)有方法將主要精力集中于梳理城市指標(biāo)間的數(shù)據(jù)關(guān)系,卻對區(qū)域可持續(xù)發(fā)展所涉及的經(jīng)濟、環(huán)境與社會三大系統(tǒng)的協(xié)調(diào)性缺乏充分考量,區(qū)域可持續(xù)發(fā)展絕非單一維度的增長,而是經(jīng)濟增長、環(huán)境保護(hù)、社會公平正義等多個目標(biāo)相互協(xié)調(diào)的過程,現(xiàn)有方法由于未能對環(huán)境監(jiān)測數(shù)據(jù)和社會發(fā)展指標(biāo)進(jìn)行系統(tǒng)整合與深度分析,難以生成諸如多元協(xié)調(diào)指數(shù)這類評估區(qū)域可持續(xù)發(fā)展的關(guān)鍵指標(biāo),致使無法全面、客觀地衡量區(qū)域可持續(xù)發(fā)展的整體水平;另一方面,現(xiàn)有方法在時間維度的分析上存在重大缺陷,未能借助時間序列數(shù)據(jù)對區(qū)域發(fā)展趨勢展開深入預(yù)測,在區(qū)域發(fā)展的動態(tài)進(jìn)程中,各指標(biāo)隨時間的演變趨勢,對于預(yù)判未來發(fā)展方向、提前謀劃應(yīng)對策略具有不可替代的價值;然而,現(xiàn)有方法僅著眼于同一年份內(nèi)指標(biāo)間的數(shù)據(jù)關(guān)系,忽視了指標(biāo)在時間維度上的發(fā)展規(guī)律,無法為區(qū)域的長期規(guī)劃與科學(xué)決策提供有力的預(yù)測支持。
4、在所述背景技術(shù)部分公開的上述信息僅用于加強對本公開的背景的理解,因此它可以包括不構(gòu)成對本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種區(qū)域可持續(xù)發(fā)展指標(biāo)知識圖譜的數(shù)據(jù)處理方法及裝置,以解決上述背景技術(shù)中提出的問題。
2、為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種區(qū)域可持續(xù)發(fā)展指標(biāo)知識圖譜的數(shù)據(jù)處理方法,具體步驟包括:
4、s1.連續(xù)收集同一區(qū)域多個歷史年份的可持續(xù)發(fā)展指標(biāo)數(shù)據(jù),可持續(xù)發(fā)展指標(biāo)數(shù)據(jù)包括經(jīng)濟統(tǒng)計數(shù)據(jù)、環(huán)境監(jiān)測數(shù)據(jù)和社會發(fā)展指標(biāo)數(shù)據(jù),將經(jīng)濟統(tǒng)計數(shù)據(jù)、環(huán)境監(jiān)測數(shù)據(jù)和社會發(fā)展指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;
5、s2.將標(biāo)準(zhǔn)化處理后的經(jīng)濟統(tǒng)計數(shù)據(jù)、環(huán)境監(jiān)測數(shù)據(jù)和社會發(fā)展指標(biāo)數(shù)據(jù)進(jìn)行計算,生成用于評估經(jīng)濟、環(huán)境與社會的協(xié)調(diào)發(fā)展程度的多元協(xié)調(diào)指數(shù);
6、s3.基于同一區(qū)域多個歷史年份的可持續(xù)發(fā)展指標(biāo)數(shù)據(jù)以及多元協(xié)調(diào)指數(shù)數(shù)據(jù),構(gòu)建同一區(qū)域各個歷史年份的可持續(xù)發(fā)展指標(biāo)知識圖譜,從構(gòu)建的可持續(xù)發(fā)展指標(biāo)知識圖譜中提取時間序列數(shù)據(jù),時間序列數(shù)據(jù)包括同一區(qū)域各歷史年份的可持續(xù)發(fā)展指標(biāo)數(shù)據(jù)和多元協(xié)調(diào)指數(shù)數(shù)據(jù);
7、s4.基于長短期記憶網(wǎng)絡(luò)構(gòu)建可持續(xù)發(fā)展預(yù)測模型,以多個歷史年份中的前一年份的時間序列數(shù)據(jù)作為輸入,以多個歷史年份中的后一年份的可持續(xù)發(fā)展指標(biāo)數(shù)據(jù)和協(xié)調(diào)指數(shù)數(shù)據(jù)為標(biāo)簽輸出,對可持續(xù)發(fā)展預(yù)測模型進(jìn)行訓(xùn)練;
8、s5.從當(dāng)前的知識圖譜中,提取出當(dāng)前年份的時間序列數(shù)據(jù),輸入訓(xùn)練完畢的可持續(xù)發(fā)展預(yù)測模型,獲取該區(qū)域下一年份的可持續(xù)發(fā)展指標(biāo)數(shù)據(jù)和多元協(xié)調(diào)指數(shù)數(shù)據(jù)的預(yù)測值;
9、s6.基于該區(qū)域下一年份的可持續(xù)發(fā)展指標(biāo)數(shù)據(jù)和多元協(xié)調(diào)指數(shù)數(shù)據(jù)的預(yù)測值,構(gòu)建下一年份的可持續(xù)發(fā)展指標(biāo)知識圖譜。
10、進(jìn)一步地,經(jīng)濟統(tǒng)計數(shù)據(jù)包括人均gdp和就業(yè)增長率,環(huán)境監(jiān)測數(shù)據(jù)包括空氣質(zhì)量指數(shù)和森林覆蓋率,社會發(fā)展指標(biāo)數(shù)據(jù)包括人均受教育年限和單位gdp能耗。
11、進(jìn)一步地,將標(biāo)準(zhǔn)化處理后的經(jīng)濟統(tǒng)計數(shù)據(jù)、環(huán)境監(jiān)測數(shù)據(jù)和社會發(fā)展指標(biāo)數(shù)據(jù)進(jìn)行計算,生成多元協(xié)調(diào)指數(shù),依據(jù)的公式如下:
12、;
13、其中,為同一區(qū)域第個歷史年份的多元協(xié)調(diào)指數(shù),為同一區(qū)域第個歷史年份的人均gdp,為同一區(qū)域第個歷史年份的單位gdp能耗,為同一區(qū)域第個歷史年份的人均受教育年限,為同一區(qū)域第個歷史年份的空氣質(zhì)量指數(shù),為同一區(qū)域第個歷史年份的森林覆蓋率,為同一區(qū)域第個歷史年份的就業(yè)增長率;
14、式中,為人均gdp與單位gdp能耗比值的權(quán)重系數(shù),為人均gdp、單位gdp能耗比值和人均受教育年限3個指標(biāo)在綜合評估經(jīng)濟、環(huán)境與社會的協(xié)調(diào)發(fā)展程度時的權(quán)重系數(shù),為人均gdp和空氣質(zhì)量指數(shù)2個指標(biāo)在綜合評估經(jīng)濟、環(huán)境與社會的協(xié)調(diào)發(fā)展程度時的權(quán)重系數(shù),為森林覆蓋率和單位gdp能耗比值的權(quán)重系數(shù),為就業(yè)增長率和空氣質(zhì)量指數(shù)2個指標(biāo)在綜合評估經(jīng)濟、環(huán)境與社會的協(xié)調(diào)發(fā)展程度時的權(quán)重系數(shù),在的基礎(chǔ)上,令。
15、進(jìn)一步地,基于同一區(qū)域多個歷史年份的區(qū)域可持續(xù)發(fā)展指標(biāo)數(shù)據(jù),構(gòu)建各個歷史年份的區(qū)域可持續(xù)發(fā)展指標(biāo)知識圖譜,具體的過程如下:
16、數(shù)據(jù)關(guān)聯(lián):以區(qū)域和時間為索引,整合經(jīng)濟統(tǒng)計數(shù)據(jù)、環(huán)境監(jiān)測數(shù)據(jù)和社會發(fā)展指標(biāo)數(shù)據(jù),關(guān)聯(lián)同一地區(qū)同年人均gdp、空氣質(zhì)量指數(shù)和人均受教育年限數(shù)據(jù);
17、知識抽?。簭脑紨?shù)據(jù)中提取實體、實體關(guān)系、實體屬性和關(guān)系屬性;
18、圖譜搭建:依照數(shù)據(jù)規(guī)模選存儲方案,數(shù)據(jù)量少用neo4j數(shù)據(jù)庫,數(shù)據(jù)量大選分布式數(shù)據(jù)庫,將抽取的實體設(shè)為節(jié)點,實體關(guān)系設(shè)為邊,為節(jié)點和邊添加屬性;
19、設(shè)定節(jié)點:設(shè)“經(jīng)濟發(fā)展表征體”和“生態(tài)環(huán)境質(zhì)量體”為節(jié)點,前者包括人均gdp數(shù)據(jù),后者包括空氣質(zhì)量指數(shù);
20、定義邊及關(guān)系:兩者以“經(jīng)濟活動對生態(tài)環(huán)境的影響”建立有向邊,方向從前者指向后者;
21、添加節(jié)點屬性:為“經(jīng)濟發(fā)展表征體”添加人均gdp屬性;
22、添加邊屬性:為邊添加“影響程度”屬性,通過專家評估確定影響強度;
23、圖譜優(yōu)化和驗證:進(jìn)行一致性檢查、知識推理和可視化驗證。
24、進(jìn)一步地,構(gòu)建下一年份的區(qū)域可持續(xù)發(fā)展指標(biāo)知識圖譜,具體的過程如下:
25、參照之前構(gòu)建同一區(qū)域歷史年份知識圖譜的方法,以預(yù)測值為基礎(chǔ),構(gòu)建下一年份的區(qū)域可持續(xù)發(fā)展指標(biāo)知識圖譜,在新的知識圖譜中,添加下一年份的節(jié)點,并根據(jù)指標(biāo)之間的邏輯關(guān)系和影響機制,添加相應(yīng)的邊,從而形成一個能夠反映下一年份區(qū)域可持續(xù)發(fā)展情況的知識圖譜。
26、為實現(xiàn)上述目的,本發(fā)明還提供如下技術(shù)方案:
27、一種區(qū)域可持續(xù)發(fā)展指標(biāo)知識圖譜的數(shù)據(jù)處理裝置,所述裝置用于執(zhí)行上述任一所述的一種區(qū)域可持續(xù)發(fā)展指標(biāo)知識圖譜的數(shù)據(jù)處理方法,包括:
28、數(shù)據(jù)收集模塊,用于連續(xù)收集同一區(qū)域多個歷史年份的區(qū)域可持續(xù)發(fā)展指標(biāo)數(shù)據(jù),包括經(jīng)濟統(tǒng)計數(shù)據(jù)、環(huán)境監(jiān)測數(shù)據(jù)和社會發(fā)展指標(biāo)數(shù)據(jù),將經(jīng)濟統(tǒng)計數(shù)據(jù)、環(huán)境監(jiān)測數(shù)據(jù)和社會發(fā)展指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;
29、數(shù)據(jù)計算模塊,用于將標(biāo)準(zhǔn)化處理后的經(jīng)濟統(tǒng)計數(shù)據(jù)、環(huán)境監(jiān)測數(shù)據(jù)和社會發(fā)展指標(biāo)數(shù)據(jù)進(jìn)行計算,生成用于評估經(jīng)濟、環(huán)境與社會的協(xié)調(diào)發(fā)展程度的多元協(xié)調(diào)指數(shù);
30、圖譜構(gòu)建模塊,用于基于同一區(qū)域多個歷史年份的可持續(xù)發(fā)展指標(biāo)數(shù)據(jù)以及多元協(xié)調(diào)指數(shù)數(shù)據(jù),構(gòu)建同一區(qū)域各個歷史年份的可持續(xù)發(fā)展指標(biāo)知識圖譜,從構(gòu)建的區(qū)域可持續(xù)發(fā)展指標(biāo)知識圖譜中提取時間序列數(shù)據(jù),時間序列數(shù)據(jù)包括同一區(qū)域各年份的可持續(xù)發(fā)展指標(biāo)數(shù)據(jù)和多元協(xié)調(diào)指數(shù)數(shù)據(jù);
31、預(yù)測模型構(gòu)建模塊,用于基于長短期記憶網(wǎng)絡(luò)構(gòu)建可持續(xù)發(fā)展預(yù)測模型,以多個歷史年份中的前一年份的時間序列數(shù)據(jù)作為輸入,以多個歷史年份中的后一年份的區(qū)域可持續(xù)發(fā)展指標(biāo)數(shù)據(jù)和協(xié)調(diào)指數(shù)數(shù)據(jù)為標(biāo)簽輸出,對區(qū)域可持續(xù)發(fā)展預(yù)測模型進(jìn)行訓(xùn)練;
32、模擬模塊,用于從當(dāng)前的知識圖譜中,提取出當(dāng)前年份的時間序列數(shù)據(jù),輸入訓(xùn)練完畢的可持續(xù)發(fā)展預(yù)測模型,獲取該區(qū)域下一年份的可持續(xù)發(fā)展指標(biāo)數(shù)據(jù)和多元協(xié)調(diào)指數(shù)數(shù)據(jù)的預(yù)測值;
33、圖譜預(yù)測模塊,用于基于該區(qū)域下一年份的可持續(xù)發(fā)展指標(biāo)數(shù)據(jù)和多元協(xié)調(diào)指數(shù)數(shù)據(jù)的預(yù)測值,構(gòu)建下一年份的可持續(xù)發(fā)展指標(biāo)知識圖譜。
34、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
35、本發(fā)明通過連續(xù)收集區(qū)域經(jīng)濟統(tǒng)計數(shù)據(jù)、環(huán)境監(jiān)測數(shù)據(jù)和社會發(fā)展指標(biāo)數(shù)據(jù),并標(biāo)準(zhǔn)化處理,計算多元協(xié)調(diào)指數(shù),對區(qū)域可持續(xù)發(fā)展水平展開多維度綜合評估,突破傳統(tǒng)僅關(guān)注單一領(lǐng)域的局限,清晰呈現(xiàn)區(qū)域發(fā)展的協(xié)同狀態(tài),借助獨特算法融合經(jīng)濟、環(huán)境與社會三大系統(tǒng)的關(guān)鍵數(shù)據(jù),精確衡量三大系統(tǒng)的協(xié)調(diào)程度,量化三者間的協(xié)同發(fā)展?fàn)顩r,幫助研究人員和決策者全面、直觀地了解區(qū)域發(fā)展的協(xié)調(diào)性;
36、借助長短期記憶網(wǎng)絡(luò),對區(qū)域可持續(xù)發(fā)展指標(biāo)的時間序列數(shù)據(jù)進(jìn)行深度建模,模型能自動學(xué)習(xí)各指標(biāo)在時間維度上的復(fù)雜演變規(guī)律,捕捉經(jīng)濟、環(huán)境與社會指標(biāo)的周期性變化,發(fā)現(xiàn)數(shù)據(jù)間的長期依賴關(guān)系,通過這種全面深入的建模與分析,模型對區(qū)域經(jīng)濟、環(huán)境、社會系統(tǒng)之間的復(fù)雜關(guān)系形成透徹理解,為區(qū)域可持續(xù)發(fā)展提供極具前瞻性的預(yù)測,幫助區(qū)域管理者提前規(guī)劃發(fā)展路徑,在制定經(jīng)濟發(fā)展策略時,充分考慮對環(huán)境和社會的影響,合理配置資源,協(xié)調(diào)經(jīng)濟增長與環(huán)境保護(hù)、社會發(fā)展的關(guān)系,有效應(yīng)對人口、資源、環(huán)境等多方面的潛在挑戰(zhàn),實現(xiàn)區(qū)域可持續(xù)發(fā)展的長遠(yuǎn)目標(biāo)。