最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種基于二次分解聚類的組合機器學(xué)習(xí)年徑流預(yù)測方法

文檔序號:41950612發(fā)布日期:2025-05-16 14:10閱讀:3來源:國知局
一種基于二次分解聚類的組合機器學(xué)習(xí)年徑流預(yù)測方法

本發(fā)明屬于電子數(shù)字數(shù)據(jù)處理,尤其涉及水文預(yù)報,尤其涉及一種基于二次分解聚類的組合機器學(xué)習(xí)年徑流預(yù)測方法。


背景技術(shù):

1、近年來,極端降水、極端干旱和極端洪澇等惡劣氣候?qū)θ祟惿拓敭a(chǎn)安全帶來巨大隱患。為減輕甚至避免該類安全隱患,開展精準的徑流預(yù)報必要且迫切。目前關(guān)于洪水預(yù)報和月徑流預(yù)報已存在較豐富的研究成果,且預(yù)報精度較高,然而對于年徑流預(yù)報,由于其徑流序列具有較強的非線性、非平穩(wěn)性特點,涉及機理極其復(fù)雜,所以,對其進行精準預(yù)報仍是一項十分具有挑戰(zhàn)性的工作。

2、目前,被廣泛應(yīng)用于徑流預(yù)報的模型可劃分為兩類,即:基于物理過程的水文模型和基于數(shù)據(jù)驅(qū)動的水文模型。前者一般需結(jié)合氣象要素,采用傳統(tǒng)的產(chǎn)匯流理論,實現(xiàn)對未來徑流的預(yù)測。該類模型具有一定物理基礎(chǔ),但其所采用的產(chǎn)匯流理論中存在較多需要確定的經(jīng)驗參數(shù),若參數(shù)值選取不當(dāng),則會造成預(yù)報精度較低。與基于物理過程的水文模型相比較,基于數(shù)據(jù)驅(qū)動的水文模型不需要考慮徑流發(fā)生的復(fù)雜物理機制,而只需要對時間序列進行數(shù)學(xué)分析,并建立輸入和輸出變量之間的函數(shù)關(guān)系。該類模型可進一步細分為兩類,即基于數(shù)理統(tǒng)計思想的模型和機器學(xué)習(xí)模型。其中,以lstm模型、support?vector?machine(svm)模型和extreme?gradient?boosting(xgb)模型為代表的機器學(xué)習(xí)模型在中長期徑流預(yù)報中的精度往往超過基于物理過程的水文模型,具有廣闊的應(yīng)用前景。

3、為進一步提高基于機器學(xué)習(xí)模型的徑流預(yù)測能力,降低時間序列復(fù)雜性對模型預(yù)測效果的影響,已有研究主要從以下兩方面入手:一方面,從機器學(xué)習(xí)模型的內(nèi)部機理出發(fā),對其內(nèi)部各類參數(shù)與機制進行優(yōu)化與改進,如引入優(yōu)化算法對模型的敏感參數(shù)進行尋優(yōu)、增添注意力機制等。另一方面,通過對時間序列進行分解,降低時間序列復(fù)雜性,結(jié)合時序預(yù)測領(lǐng)域中的“分解-預(yù)測-重構(gòu)”策略,依據(jù)一定的數(shù)學(xué)規(guī)則將復(fù)雜時間序列剖分為多個具有簡單特征的imf分量以及res,然后對其進行預(yù)測并重構(gòu)得出結(jié)果。對數(shù)據(jù)量較大的徑流序列,采用“分解-預(yù)測-重構(gòu)”策略可有效挖掘徑流系列的數(shù)據(jù)特征并提升預(yù)測精度,然而對于年徑流序列來講,由于序列長度較小,序列分解時的邊界效應(yīng)問題將被放大,從而對年徑流預(yù)測精度產(chǎn)生影響。。


技術(shù)實現(xiàn)思路

1、為克服采用“分解-預(yù)測-重構(gòu)”策略對于年徑流序列來講,由于序列長度較小,序列分解時的邊界效應(yīng)問題將被放大,從而對年徑流預(yù)測精度產(chǎn)生影響的技術(shù)缺陷,本發(fā)明提供了一種基于二次分解聚類的組合機器學(xué)習(xí)年徑流預(yù)測方法,該方法基于vmd、k-means聚類算法、sc算法、sao算法和lstm的二次分解聚類的組合機器學(xué)習(xí)年徑流預(yù)測模型vmdk-means-vmdsc-sao-lstm能充分挖掘年徑流序列所蘊含的特征,提升年徑流預(yù)測精度。

2、本發(fā)明提供了一種基于二次分解聚類的組合機器學(xué)習(xí)年徑流預(yù)測方法,其步驟為:

3、s1、采用變分模態(tài)分解方法vmd將年徑流序列分解成多個本征模態(tài)函數(shù)分量imf以及殘差序列res;

4、s2、利用k-means聚類方法對imf進行聚類,合成具有代表性的高頻分量imfhigh、中頻分量imfmid和低頻分量imflow;

5、s3、應(yīng)用vmd對imfhigh進行二次分解,生成多個新的本征模態(tài)函數(shù)imf';

6、s4、基于譜聚類算法sc對一次分解生成的res、一次聚類生成的imfmid、imflow和二次分解生成的各imf'進行第二次聚類重構(gòu),生成最終本征模態(tài)函數(shù)imf”;s5、構(gòu)建以雪消融算法優(yōu)化長短期記憶網(wǎng)絡(luò)模型sao-lstm為基礎(chǔ)的年徑流預(yù)測模型,并基于所述年徑流預(yù)測模型對二次聚類得到的各imf”分別展開預(yù)測。s6、對各預(yù)測結(jié)果進行整合,得到最終年徑流預(yù)測結(jié)果。

7、本發(fā)明在預(yù)報前對長度有限且復(fù)雜、非平穩(wěn)的原始年徑流序列進行充分分解,有效提取其特征,并通過聚類處理,減小年徑流序列分解帶來的邊界效應(yīng)放大問題,對于提升基于機器學(xué)習(xí)模型的年徑流預(yù)報模型精度具有重要的工程價值與科學(xué)意義。

8、優(yōu)選的,步驟s1包括:

9、s11、構(gòu)建變分問題:設(shè)原始徑流序列f(t)被分解為k個分量,采用希爾伯特變換求解每個模態(tài)函數(shù)uk(t)的邊際譜,然后對每一個模態(tài)函數(shù)的中心頻率ωk的指數(shù)項進行混疊,完成模態(tài)函數(shù)的基頻帶調(diào)制,最后,利用高斯平滑法確定每個模態(tài)函數(shù)的帶寬,則vmd約束變分模型如下:

10、

11、式中:t為變分問題目標(biāo)函數(shù);uk為模態(tài)函數(shù);ωk為各模態(tài)函數(shù)的中心頻率;為對時間t求偏導(dǎo);δ(t)為狄拉克函數(shù);*為卷積符號;為希爾伯特變換;л為180°;j為虛數(shù)單位;表示將頻譜平移到基頻帶;k為一次分解的模態(tài)個數(shù);

12、s12、求解變分問題:采用懲罰因子α和拉格朗日乘子λ將上述約束問題轉(zhuǎn)換為非約束問題:

13、

14、由傅里葉變換中的帕塞瓦爾定理可得,信號的能量在時域和頻域具有等效性,因此將時域的問題在頻域解決;結(jié)合交替方向乘子法迭代更新模態(tài)函數(shù)中心頻率和拉格朗日乘子得到信號分解的所有模態(tài);和的迭代公式如下:

15、

16、式中:為信號傅里葉變換對應(yīng)的頻域形式;τ為噪聲容忍度;n為迭代次數(shù);迭代終止條件表達式為:

17、

18、式中:ε為收斂容許誤差,ε取值為10-7。

19、優(yōu)選的,步驟s2包括:

20、s21、計算k個imf的樣本熵,樣本熵計算公式為:

21、

22、式中:m為嵌入維數(shù);r表示相似容限;bm(r)為兩個序列在相似容限下匹配m個點的概率;bm+1(r)為兩個序列匹配m+1個點的概率;

23、s22、由樣本熵組成數(shù)據(jù)集,從數(shù)據(jù)集中隨機選擇k個數(shù)據(jù)作為初始聚類中心ci(1≤i≤k);

24、s23、計算每個數(shù)據(jù)對象與聚類中心ci之間的歐幾里得距離,并將其歸類至最近的聚類中心ci所對應(yīng)的類,歐幾里得距離l計算公式為:

25、l=||x-ci||

26、式中:x為類中的點;

27、s24、重新計算每個聚類內(nèi)數(shù)據(jù)對象的均值,以此更新聚類中心;

28、s25、重復(fù)s21-s24步,直至聚類中心穩(wěn)定或達到最大迭代次數(shù),即聚類中心不再變化作為迭代終止條件。

29、優(yōu)選的,步驟s3包括:

30、s31、構(gòu)建變分問題:設(shè)imfhigh被分解為k'個分量,采用希爾伯特變換求解每個模態(tài)函數(shù)u'k(t)的邊際譜,然后對每一個模態(tài)函數(shù)的中心頻率ω'k的指數(shù)項進行混疊,完成模態(tài)函數(shù)的基頻帶調(diào)制,最后利用高斯平滑法確定每個模態(tài)函數(shù)的帶寬,則vmd約束變分模型如下:

31、

32、式中:t'為變分問題目標(biāo)函數(shù);u'k為imfhigh分解出的新模態(tài)函數(shù);ω'k為各u'k的中心頻率;為對時間t求偏導(dǎo);δ(t)為狄拉克函數(shù);*為卷積符號;

33、為希爾伯特變換;л為180°;j為虛數(shù)單位;表示將頻譜平移到基頻帶;k'為二次分解的模態(tài)個數(shù);

34、s32、求解變分問題:采用懲罰因子α'和拉格朗日乘子λ'將上述約束問題轉(zhuǎn)換為非約束問題:

35、

36、則和的迭代公式如下:

37、

38、式中:為信號傅里葉變換對應(yīng)的頻域形式;τ為噪聲容忍度;n為迭代次數(shù);迭代終止條件表達式為:

39、

40、式中:ε為收斂容許誤差,其中ε取值為10-7。

41、優(yōu)選的,步驟s4包括:

42、s41、把一次分解生成的res、一次聚類生成的imfmid、imflow和二次分解生成的各imf'中的所有數(shù)據(jù)看作空間中的點,設(shè)每兩個點之間的權(quán)重為ωij,則對于任意一個點,它的度di定義為和它相連的所有邊的權(quán)重之和,可表示為:

43、

44、定義點集v的子集為a,子集a內(nèi)所有頂點的度之和記為:

45、

46、根據(jù)每個點的定義可構(gòu)建如下度矩陣d,矩陣d中僅有主對角線有值,其表達式如下:

47、

48、s42、通過計算這些點所組成的相似矩陣s,進而求得它們的鄰接矩陣w,由此可計算拉普拉斯矩陣l:

49、l=d-w

50、s43、引入指示向量hj并進行ncut切圖操作,其中,hj是一個n維的向量。將其轉(zhuǎn)化為優(yōu)化問題進行求解,計算如下:

51、

52、式中:vi為點集v中的點,i為單位對角矩陣,h為最優(yōu)指示向量;選擇k-means聚類算法作為譜聚類的基礎(chǔ)算法,對該向量中的點進行k-means聚類,即可得到譜聚類最后的結(jié)果。

53、優(yōu)選的,步驟s5包括:

54、s51、數(shù)據(jù)集劃分:將二次聚類得到的imf”劃分為訓(xùn)練集和測試集;

55、s52、模型參數(shù)初始化:初始化參數(shù)包括隨機生成sao算法的初始種群z,種群規(guī)模n,解的維度dim,設(shè)置最大迭代次數(shù)tmax、初始雙種群規(guī)模na=nb=n/2,lstm算法學(xué)習(xí)率lr、神經(jīng)元個數(shù)n和正則化參數(shù)b取值范圍;

56、s53、模型訓(xùn)練:以平均絕對百分誤差mape作為目標(biāo)函數(shù),各imf”訓(xùn)練集作為輸入向量,基于sao算法優(yōu)化lstm模型,對比前后兩次目標(biāo)函數(shù)計算結(jié)果,保留較小的mape對應(yīng)的訓(xùn)練參數(shù)值和預(yù)測結(jié)果值;

57、s54、訓(xùn)練終止:檢查是否已達到最大迭代次數(shù)。如果達到最大迭代次數(shù),則退出循環(huán)并輸出預(yù)測結(jié)果,否則,重復(fù)s51-s53步;

58、s55、模型預(yù)測:將各imf”測試集數(shù)據(jù)分別輸入至優(yōu)化后的lstm模型,獲得各imf”測試集預(yù)測結(jié)果。

59、優(yōu)選的,步驟s6為將各imf”預(yù)測結(jié)果相加,得到最終的徑流預(yù)測結(jié)果。

60、本發(fā)明提供的技術(shù)方案與現(xiàn)有技術(shù)相比具有如下技術(shù)效果:本發(fā)明針對年徑流序列分解時邊界效應(yīng)顯著,造成預(yù)報精度較低的問題,采用vmd算法將年徑流序列分解成多個imf分量以及res;利用k-means聚類方法對imf進行聚類,合成具有代表性的imfhigh、imfmid和imflow;應(yīng)用vmd對imfhigh進行二次分解,生成多個imf';利用sc算法對一次分解生成的res、一次聚類生成的imfmid、imflow和二次聚類生成的各imf'進行第二次聚類重構(gòu),生成imf”;構(gòu)建以sao-lstm為基礎(chǔ)的年徑流預(yù)測模型,基于sao-lstm模型對二次聚類得到的各imf”分別展開預(yù)測;對各預(yù)測結(jié)果進行整合,即可得到最終年徑流預(yù)測結(jié)果。本發(fā)明中,通過提出二次分解與聚類算法的耦合,有效降低了年徑流序列分解中的邊界效應(yīng)影響,可顯著提高基于機器學(xué)習(xí)模型的年徑流序列預(yù)測精度,是年徑流預(yù)測的一種有效的方法。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1