本說明書涉及機(jī)器學(xué)習(xí),尤其涉及一種預(yù)測模型的訓(xùn)練方法、數(shù)據(jù)預(yù)測方法、裝置及電子設(shè)備。
背景技術(shù):
1、近年來,為了更好地應(yīng)對未來可能出現(xiàn)的運(yùn)營狀況,各行業(yè)常利用歷史數(shù)據(jù)進(jìn)行時(shí)序預(yù)測以輔助進(jìn)行對應(yīng)決策的制定。然而,在進(jìn)行時(shí)序預(yù)測時(shí)常采用樹模型進(jìn)行預(yù)測,而每個預(yù)測任務(wù)下的子預(yù)測任務(wù)往往需要單獨(dú)對應(yīng)的樹模型進(jìn)行擬合以預(yù)測。
技術(shù)實(shí)現(xiàn)思路
1、本說明書提供了一種預(yù)測模型的訓(xùn)練方法、數(shù)據(jù)預(yù)測方法、裝置及電子設(shè)備,所述技術(shù)方案如下:
2、第一方面,本說明書提供了一種預(yù)測模型的訓(xùn)練方法,所述方法包括:
3、獲取時(shí)序預(yù)測任務(wù)對應(yīng)的模型訓(xùn)練集,確定所述時(shí)序預(yù)測任務(wù)對應(yīng)的至少兩個時(shí)序預(yù)測時(shí)長以及所述時(shí)序預(yù)測時(shí)長對應(yīng)的目標(biāo)預(yù)測信息;
4、從所述模型訓(xùn)練集中確定每個時(shí)序預(yù)測時(shí)長關(guān)聯(lián)的模型子訓(xùn)練集,生成所述模型子訓(xùn)練集與所述目標(biāo)預(yù)測信息對應(yīng)的典型相關(guān)參數(shù);
5、基于所述時(shí)序預(yù)測任務(wù)、各模型子訓(xùn)練集以及各模型子訓(xùn)練集對應(yīng)的典型相關(guān)參數(shù),對樹模型進(jìn)行模型訓(xùn)練處理得到目標(biāo)預(yù)測模型。
6、可選地,所述基于所述時(shí)序預(yù)測任務(wù)、各模型子訓(xùn)練集以及各模型子訓(xùn)練集對應(yīng)的典型相關(guān)參數(shù),對樹模型進(jìn)行模型訓(xùn)練處理得到目標(biāo)預(yù)測模型,包括:
7、基于各模型子訓(xùn)練集對應(yīng)的典型相關(guān)參數(shù)確定樹模型針對各模型子訓(xùn)練集的參考注意力權(quán)重分布信息;
8、基于所述時(shí)序預(yù)測任務(wù)、所述參考注意力權(quán)重分布信息與各模型子訓(xùn)練集對所述樹模型進(jìn)行模型訓(xùn)練,得到目標(biāo)預(yù)測模型。
9、可選地,所述基于所述時(shí)序預(yù)測任務(wù)、所述參考注意力權(quán)重分布信息與各模型子訓(xùn)練集對所述樹模型進(jìn)行模型訓(xùn)練,得到目標(biāo)預(yù)測模型,包括:
10、將所述時(shí)序預(yù)測任務(wù)與各模型子訓(xùn)練集輸入所述樹模型進(jìn)行模型訓(xùn)練,在所述模型訓(xùn)練過程中,獲取所述樹模型針對各模型子訓(xùn)練集的注意力權(quán)重分布信息;
11、基于所述參考注意力權(quán)重分布信息和所述注意力權(quán)重分布信息確定針對所述樹模型的模型損失值;
12、利用所述模型損失值對所述樹模型進(jìn)行模型參數(shù)調(diào)整,直至所述樹模型完成模型訓(xùn)練得到目標(biāo)預(yù)測模型。
13、可選地,所述典型相關(guān)參數(shù)包括典型相關(guān)系數(shù)與典型相關(guān)得分;所述基于各模型子訓(xùn)練集對應(yīng)的典型相關(guān)參數(shù)確定所述樹模型針對各模型子訓(xùn)練集的參考注意力權(quán)重分布信息,包括:
14、基于所述典型相關(guān)得分確定所述樹模型針對各模型子訓(xùn)練集的第一注意力權(quán)重分布;
15、基于所述典型相關(guān)系數(shù)確定所述樹模型針對各模型子訓(xùn)練集中每個關(guān)聯(lián)樣本時(shí)間對的第二注意力權(quán)重分布;
16、基于所述第一注意力權(quán)重分布和所述第二注意力權(quán)重分布確定參考注意力權(quán)重分布信息。
17、可選地,所述從所述模型訓(xùn)練集中確定每個時(shí)序預(yù)測時(shí)長關(guān)聯(lián)的模型子訓(xùn)練集,包括:
18、基于所述時(shí)序預(yù)測時(shí)長確定所述模型訓(xùn)練集中的關(guān)聯(lián)樣本時(shí)間對;其中,所述關(guān)聯(lián)樣本時(shí)間對包括時(shí)間間隔大于或等于所述時(shí)序預(yù)測時(shí)長的兩個關(guān)聯(lián)時(shí)間點(diǎn),以及所述關(guān)聯(lián)時(shí)間點(diǎn)對應(yīng)的時(shí)間點(diǎn)信息和目標(biāo)類別值;
19、基于各時(shí)序預(yù)測時(shí)長對應(yīng)的關(guān)聯(lián)樣本時(shí)間對生成模型子訓(xùn)練集。
20、可選地,所述生成所述模型子訓(xùn)練集與所述目標(biāo)預(yù)測信息對應(yīng)的典型相關(guān)參數(shù),包括:
21、確定所述模型子訓(xùn)練集中每個關(guān)聯(lián)樣本時(shí)間對與所述目標(biāo)預(yù)測信息之間的典型相關(guān)系數(shù);其中,所述典型相關(guān)系數(shù)用于表征所述關(guān)聯(lián)樣本時(shí)間對與所述目標(biāo)預(yù)測信息之間的相關(guān)性信息;
22、確定所述模型子訓(xùn)練集與所述目標(biāo)預(yù)測信息對應(yīng)的典型相關(guān)得分;其中,所述典型相關(guān)得分用于表征所述模型子訓(xùn)練集與所述目標(biāo)預(yù)測信息的整體相關(guān)性信息;
23、基于所述典型相關(guān)系數(shù)與所述典型相關(guān)得分確定典型相關(guān)參數(shù)。
24、可選地,所述確定所述時(shí)序預(yù)測任務(wù)對應(yīng)的至少兩個時(shí)序預(yù)測時(shí)長以及所述時(shí)序預(yù)測時(shí)長對應(yīng)的目標(biāo)預(yù)測信息,包括:
25、確定所述時(shí)序預(yù)測任務(wù)對應(yīng)的至少兩個時(shí)序預(yù)測子任務(wù);
26、獲取所述時(shí)序預(yù)測子任務(wù)對應(yīng)的預(yù)測類別和預(yù)測時(shí)間點(diǎn)信息,基于所述預(yù)測類別和所述預(yù)測時(shí)間點(diǎn)信息生成目標(biāo)預(yù)測信息;
27、確定所述時(shí)序預(yù)測子任務(wù)對應(yīng)的時(shí)序預(yù)測時(shí)長,得到每個時(shí)序預(yù)測子任務(wù)對應(yīng)的時(shí)序預(yù)測時(shí)長。
28、第二方面,本說明書提供了一種數(shù)據(jù)預(yù)測方法,所述方法包括:
29、獲取目標(biāo)時(shí)序預(yù)測任務(wù),基于所述目標(biāo)預(yù)測模型對所述目標(biāo)時(shí)序預(yù)測任務(wù)進(jìn)行模型預(yù)測處理,得到所述目標(biāo)時(shí)序預(yù)測任務(wù)對應(yīng)的目標(biāo)預(yù)測信息值;
30、其中,所述目標(biāo)預(yù)測模型基于各模型子訓(xùn)練集以及各模型子訓(xùn)練集對應(yīng)的典型相關(guān)參數(shù),對樹模型進(jìn)行模型訓(xùn)練處理后得到;所述典型相關(guān)參數(shù)基于所述模型子訓(xùn)練集與目標(biāo)預(yù)測信息生成得到;所述模型子訓(xùn)練集為所述模型訓(xùn)練集中與每個時(shí)序預(yù)測時(shí)長關(guān)聯(lián)的子訓(xùn)練集;所述模型訓(xùn)練集與時(shí)序預(yù)測任務(wù)對應(yīng),所述目標(biāo)預(yù)測信息以及至少兩個所述時(shí)序預(yù)測時(shí)長基于所述時(shí)序預(yù)測任務(wù)確定。
31、第三方面,本說明書提供了一種預(yù)測模型的訓(xùn)練裝置,所述裝置包括:
32、獲取模塊,適于獲取時(shí)序預(yù)測任務(wù)對應(yīng)的模型訓(xùn)練集,確定所述時(shí)序預(yù)測任務(wù)對應(yīng)的至少兩個時(shí)序預(yù)測時(shí)長以及所述時(shí)序預(yù)測時(shí)長對應(yīng)的目標(biāo)預(yù)測信息;
33、生成模塊,適于從所述模型訓(xùn)練集中確定每個時(shí)序預(yù)測時(shí)長關(guān)聯(lián)的模型子訓(xùn)練集,生成所述模型子訓(xùn)練集與所述目標(biāo)預(yù)測信息對應(yīng)的典型相關(guān)參數(shù);
34、訓(xùn)練模塊,適于基于所述時(shí)序預(yù)測任務(wù)、各模型子訓(xùn)練集以及各模型子訓(xùn)練集對應(yīng)的典型相關(guān)參數(shù),對樹模型進(jìn)行模型訓(xùn)練處理得到目標(biāo)預(yù)測模型。
35、第四方面,本說明書提供了一種數(shù)據(jù)預(yù)測裝置,所述裝置包括:
36、預(yù)測模塊,適于獲取目標(biāo)時(shí)序預(yù)測任務(wù),基于所述目標(biāo)預(yù)測模型對所述目標(biāo)時(shí)序預(yù)測任務(wù)進(jìn)行模型預(yù)測處理,得到所述目標(biāo)時(shí)序預(yù)測任務(wù)對應(yīng)的目標(biāo)預(yù)測信息值;
37、其中,所述目標(biāo)預(yù)測模型基于各模型子訓(xùn)練集以及各模型子訓(xùn)練集對應(yīng)的典型相關(guān)參數(shù),對樹模型進(jìn)行模型訓(xùn)練處理后得到;所述典型相關(guān)參數(shù)基于所述模型子訓(xùn)練集與目標(biāo)預(yù)測信息生成得到;所述模型子訓(xùn)練集為所述模型訓(xùn)練集中與每個時(shí)序預(yù)測時(shí)長關(guān)聯(lián)的子訓(xùn)練集;所述模型訓(xùn)練集與時(shí)序預(yù)測任務(wù)對應(yīng),所述目標(biāo)預(yù)測信息以及至少兩個所述時(shí)序預(yù)測時(shí)長基于所述時(shí)序預(yù)測任務(wù)確定。
38、第五方面,本說明書提供一種計(jì)算機(jī)存儲介質(zhì),所述計(jì)算機(jī)存儲介質(zhì)存儲有多條指令,所述指令適于由處理器加載并執(zhí)行上述的方法步驟。
39、第六方面,本說明書提供一種電子設(shè)備,可包括:處理器和存儲器;其中,所述存儲器存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序適于由所述處理器加載并執(zhí)行上述的方法步驟。
40、第七方面,本說明書提供一種計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品存儲有至少一條指令,所述至少一條指令由處理器加載并執(zhí)行上述任意一項(xiàng)的方法步驟。
41、本說明書一些實(shí)施例提供的技術(shù)方案帶來的有益效果至少包括:首先確定時(shí)序預(yù)測任務(wù)對應(yīng)的至少兩個時(shí)序預(yù)測時(shí)長以及時(shí)序預(yù)測時(shí)長對應(yīng)的目標(biāo)預(yù)測信息,之后從時(shí)序預(yù)測任務(wù)對應(yīng)的模型訓(xùn)練集中確定每個時(shí)序預(yù)測時(shí)長關(guān)聯(lián)的模型子訓(xùn)練集,生成模型子訓(xùn)練集與目標(biāo)預(yù)測信息對應(yīng)的典型相關(guān)參數(shù),典型相關(guān)參數(shù)用于表征每個模型子訓(xùn)練集和不同時(shí)序預(yù)測時(shí)長對應(yīng)的目標(biāo)預(yù)測信息的相關(guān)性,以及每個模型子訓(xùn)練集中元素和不同時(shí)序預(yù)測時(shí)長對應(yīng)的目標(biāo)預(yù)測信息的相關(guān)性,最后利用各模型子訓(xùn)練集以及各模型子訓(xùn)練集對應(yīng)的典型相關(guān)參數(shù),對樹模型進(jìn)行模型訓(xùn)練處理得到目標(biāo)預(yù)測模型,從而使得樹模型在模型訓(xùn)練處理過程中充分學(xué)習(xí)每個模型子訓(xùn)練集和不同時(shí)序預(yù)測時(shí)長對應(yīng)的目標(biāo)預(yù)測信息的相關(guān)性,以及每個模型子訓(xùn)練集中元素和不同時(shí)序預(yù)測時(shí)長對應(yīng)的目標(biāo)預(yù)測信息的相關(guān)性,進(jìn)而捕捉不同時(shí)序預(yù)測時(shí)長的模型子訓(xùn)練集的預(yù)測目標(biāo)和輸入特征的聯(lián)合概率分布的關(guān)鍵特征,從而在利用樹模型的可解釋性和魯棒性的同時(shí),使樹模型具備了多時(shí)序預(yù)測時(shí)長的預(yù)測能力,從而解決了在進(jìn)行時(shí)序預(yù)測時(shí)常采用樹模型進(jìn)行預(yù)測,而每個預(yù)測任務(wù)下的子預(yù)測任務(wù)往往需要單獨(dú)對應(yīng)的樹模型進(jìn)行擬合以預(yù)測的技術(shù)問題。