本發(fā)明涉及子癇前期風(fēng)險預(yù)測,尤其涉及一種基于時序多模態(tài)的子癇前期預(yù)測模型的構(gòu)建方法、預(yù)測方法和預(yù)測裝置。
背景技術(shù):
1、子癇前期(preeclampsia,pe)是一種妊娠期特有的多系統(tǒng)疾病,對孕產(chǎn)婦和圍產(chǎn)兒構(gòu)成重大安全威脅。當(dāng)前,子癇前期的診斷主要依賴于高血壓和尿蛋白等指標(biāo),但這些方法存在明顯的滯后性,不能滿足早期預(yù)測的需求。此外,臨床檢測過程中往往忽略了與子癇前期高度相關(guān)的其他特征數(shù)據(jù)。
2、子癇前期的發(fā)病機制尚未完全明確,且由于電子健康記錄(ehr)數(shù)據(jù)通常存在缺失和不規(guī)則的問題,傳統(tǒng)的時間序列分析方法難以有效處理這些數(shù)據(jù),導(dǎo)致無法全面挖掘影響子癇前期發(fā)生的潛在因素和特征,無法準(zhǔn)確預(yù)測子癇前期。
3、因此,現(xiàn)有技術(shù)還有待于改進和發(fā)展。
技術(shù)實現(xiàn)思路
1、基于上述現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種基于時序多模態(tài)的子癇前期預(yù)測模型的構(gòu)建方法、預(yù)測方法和預(yù)測裝置,旨在解決傳統(tǒng)的時間序列分析方法難以有效處理存在缺失的數(shù)據(jù),導(dǎo)致子癇前期預(yù)測不準(zhǔn)確的問題。
2、本發(fā)明的技術(shù)方案如下:
3、本發(fā)明的第一方面,提供一種基于時序多模態(tài)的子癇前期預(yù)測模型的構(gòu)建方法,其中,包括如下步驟:
4、獲取已知妊娠結(jié)局的孕婦的多模態(tài)時序特征數(shù)據(jù),構(gòu)建時間序列數(shù)據(jù)集;已知妊娠結(jié)局的孕婦包括患有子癇前期的孕婦和未患有子癇前期的孕婦;
5、利用所述時間序列數(shù)據(jù)集對圖注意力網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)進行訓(xùn)練,得到缺失值擬合模型;
6、將所述缺失值擬合模型作為嵌入層嵌入到門控循環(huán)單元中,利用所述時間序列數(shù)據(jù)集進行訓(xùn)練后,得到子癇前期預(yù)測模型。
7、可選地,獲取已知妊娠結(jié)局的孕婦的多模態(tài)時序特征數(shù)據(jù),構(gòu)建時間序列數(shù)據(jù)集的步驟具體包括:
8、將已知妊娠結(jié)局的孕婦的妊娠期分為多個時間節(jié)點,采集已知妊娠結(jié)局的孕婦在每個時間節(jié)點的多模態(tài)特征數(shù)據(jù),對每個時間節(jié)點的多模態(tài)特征數(shù)據(jù)進行合并,且將當(dāng)前時間節(jié)點未出現(xiàn)的特征數(shù)據(jù)置為空值,重復(fù)出現(xiàn)的特征數(shù)據(jù)取最后一次出現(xiàn)的特征數(shù)據(jù),獲得預(yù)處理后的多模態(tài)時序特征數(shù)據(jù);
9、以特征數(shù)據(jù)出現(xiàn)的次數(shù)大于預(yù)設(shè)值作為篩選標(biāo)準(zhǔn),將所述預(yù)處理后的多模態(tài)時序特征數(shù)據(jù)進行篩選后,構(gòu)建時間序列數(shù)據(jù)集。
10、可選地,以特征數(shù)據(jù)出現(xiàn)的次數(shù)大于預(yù)設(shè)值作為篩選標(biāo)準(zhǔn),將所述預(yù)處理后的多模態(tài)時序特征數(shù)據(jù)進行篩選后,構(gòu)建時間序列數(shù)據(jù)集的步驟具體包括:
11、以特征數(shù)據(jù)出現(xiàn)的次數(shù)大于預(yù)設(shè)值作為篩選標(biāo)準(zhǔn),將所述預(yù)處理后的多模態(tài)時序特征數(shù)據(jù)進行篩選后,得到篩選后的多模態(tài)時序特征數(shù)據(jù);所述篩選后的多模態(tài)時序特征數(shù)據(jù)包括常量特征和變量特征;
12、在篩選后的多模態(tài)時序特征數(shù)據(jù)中常量特征空缺位置進行常量特征的填充,得到填充后的多模態(tài)時序特征數(shù)據(jù),構(gòu)建時間序列數(shù)據(jù)集。
13、可選地,利用所述時間序列數(shù)據(jù)集對圖注意力網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)進行訓(xùn)練,得到缺失值擬合模型的步驟具體包括:
14、將所述時間序列數(shù)據(jù)集轉(zhuǎn)換為圖結(jié)構(gòu)數(shù)據(jù),并將圖結(jié)構(gòu)數(shù)據(jù)中的一部分節(jié)點的特征值進行掩碼作為空缺值,形成缺失節(jié)點,得到帶有缺失節(jié)點的圖結(jié)構(gòu)數(shù)據(jù);
15、將所述帶有缺失節(jié)點的圖結(jié)構(gòu)數(shù)據(jù)輸入到圖注意力網(wǎng)絡(luò)后,輸出第一數(shù)據(jù);
16、將所述第一數(shù)據(jù)與所述圖結(jié)構(gòu)數(shù)據(jù)進行融合,得到融合特征數(shù)據(jù);
17、將所述融合特征數(shù)據(jù)進行特征展開,得到一維特征數(shù)據(jù);
18、將所述一維特征數(shù)據(jù)輸入到三層堆疊的全連接網(wǎng)絡(luò)中,得到空缺值的填充值和子癇前期預(yù)測結(jié)果;
19、根據(jù)填充值和節(jié)點處被掩碼的真實值得到第一損失值,根據(jù)子癇前期預(yù)測結(jié)果與子癇前期真實結(jié)果得到第二損失值;
20、根據(jù)第一損失值和第二損失值對圖注意力網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)中的參數(shù)進行調(diào)整,直至第一損失值和第二損失值的權(quán)重加和收斂,則訓(xùn)練好的圖注意力網(wǎng)絡(luò)和與所述圖注意力網(wǎng)絡(luò)連接的三層堆疊的全連接網(wǎng)絡(luò)中的兩層堆疊的全連接網(wǎng)絡(luò)構(gòu)成缺失值擬合模型。
21、可選地,在圖注意力網(wǎng)絡(luò)中設(shè)置缺失節(jié)點僅能接受來自相鄰節(jié)點的信息而不會向相鄰節(jié)點傳遞信息的信息傳遞機制后,將所述帶有缺失節(jié)點的圖結(jié)構(gòu)數(shù)據(jù)輸入到圖注意力網(wǎng)絡(luò)中,輸出第一數(shù)據(jù)。
22、可選地,將所述缺失值擬合模型作為嵌入層嵌入到門控循環(huán)單元中,利用所述時間序列數(shù)據(jù)集進行訓(xùn)練后,得到子癇前期預(yù)測模型的步驟具體包括:
23、將所述缺失值擬合模型作為嵌入層嵌入到門控循環(huán)單元的輸入端,將所述時間序列數(shù)據(jù)集轉(zhuǎn)換為圖結(jié)構(gòu)數(shù)據(jù)后作為輸入,得到對孕婦是否患有子癇前期進行正確預(yù)測的概率;
24、根據(jù)對孕婦是否患有子癇前期進行正確預(yù)測的概率和孕婦是否患有子癇前期的真實情況,得到交叉熵損失函數(shù);
25、根據(jù)所述交叉熵損失函數(shù)對嵌入有缺失值擬合模型的門控循環(huán)單元進行訓(xùn)練,直至交叉熵損失函數(shù)收斂,得到所述子癇前期預(yù)測模型。
26、本發(fā)明的第二方面,提供一種子癇前期的預(yù)測方法,其中,將待測孕婦的多模態(tài)時序特征數(shù)據(jù)輸入至采用本發(fā)明如上所述的構(gòu)建方法構(gòu)建得到的子癇前期預(yù)測模型,對待測孕婦將來是否會發(fā)生子癇前期進行預(yù)測。
27、本發(fā)明的第三方面,提供一種子癇前期預(yù)測裝置,其中,包括:
28、預(yù)測單元,用于將待測孕婦的多模態(tài)時序特征數(shù)據(jù)輸入至采用本發(fā)明如上所述的構(gòu)建方法構(gòu)建得到的子癇前期預(yù)測模型,對待測孕婦將來是否會發(fā)生子癇前期進行預(yù)測。
29、本發(fā)明的第四方面,提供一種計算機可讀存儲介質(zhì),其中,所述計算機可讀存儲介質(zhì)存儲有計算機程序,當(dāng)所述計算機程序被處理器執(zhí)行時,實現(xiàn)本發(fā)明如上所述的預(yù)測方法。
30、本發(fā)明的第五方面,提供一種電子設(shè)備,其中,包括存儲器和處理器,所述存儲器上存儲有可在所述處理器上運行的計算機程序,當(dāng)所述計算機程序被所述處理器執(zhí)行時,實現(xiàn)本發(fā)明如上所述的預(yù)測方法。
31、有益效果:本發(fā)明通過圖注意力網(wǎng)絡(luò)和全連接網(wǎng)格構(gòu)建得到缺失值擬合模型,其能有效處理孕婦妊娠期檢測數(shù)據(jù)(如醫(yī)療指標(biāo)、體征以及her數(shù)據(jù)等)中的缺失和不規(guī)則性,能夠從高度缺失的數(shù)據(jù)中提取有效特征,利用圖注意力網(wǎng)絡(luò)來捕捉孕婦各類健康數(shù)據(jù)之間的潛在關(guān)聯(lián)性,最大程度降低缺失值對模型預(yù)測精度的負面影響。通過缺失值擬合模型對缺失數(shù)據(jù)的特殊處理,能夠有效恢復(fù)缺失信息,確保模型能夠更準(zhǔn)確地處理不完整的醫(yī)療數(shù)據(jù),同時結(jié)合門控循環(huán)單元進行時序特征的捕捉和預(yù)測,有效提高了對子癇前期的預(yù)測準(zhǔn)確性。
1.一種基于時序多模態(tài)的子癇前期預(yù)測模型的構(gòu)建方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的構(gòu)建方法,其特征在于,獲取已知妊娠結(jié)局的孕婦的多模態(tài)時序特征數(shù)據(jù),構(gòu)建時間序列數(shù)據(jù)集的步驟具體包括:
3.根據(jù)權(quán)利要求2所述的構(gòu)建方法,其特征在于,以特征數(shù)據(jù)出現(xiàn)的次數(shù)大于預(yù)設(shè)值作為篩選標(biāo)準(zhǔn),將所述預(yù)處理后的多模態(tài)時序特征數(shù)據(jù)進行篩選后,構(gòu)建時間序列數(shù)據(jù)集的步驟具體包括:
4.根據(jù)權(quán)利要求1-3任一項所述的構(gòu)建方法,其特征在于,利用所述時間序列數(shù)據(jù)集對圖注意力網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)進行訓(xùn)練,得到缺失值擬合模型的步驟具體包括:
5.根據(jù)權(quán)利要求4所述的構(gòu)建方法,其特征在于,在圖注意力網(wǎng)絡(luò)中設(shè)置缺失節(jié)點僅能接受來自相鄰節(jié)點的信息而不會向相鄰節(jié)點傳遞信息的信息傳遞機制后,將所述帶有缺失節(jié)點的圖結(jié)構(gòu)數(shù)據(jù)輸入到圖注意力網(wǎng)絡(luò)中,輸出第一數(shù)據(jù)。
6.根據(jù)權(quán)利要求5所述的構(gòu)建方法,其特征在于,將所述缺失值擬合模型作為嵌入層嵌入到門控循環(huán)單元中,利用所述時間序列數(shù)據(jù)集進行訓(xùn)練后,得到子癇前期預(yù)測模型的步驟具體包括:
7.一種子癇前期的預(yù)測方法,其特征在于,將待測孕婦的多模態(tài)時序特征數(shù)據(jù)輸入至采用權(quán)利要求1-6任一項所述的構(gòu)建方法構(gòu)建得到的子癇前期預(yù)測模型,對待測孕婦將來是否會發(fā)生子癇前期進行預(yù)測。
8.一種子癇前期預(yù)測裝置,其特征在于,包括:
9.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有計算機程序,當(dāng)所述計算機程序被處理器執(zhí)行時,實現(xiàn)權(quán)利要求7所述的預(yù)測方法。
10.一種電子設(shè)備,其特征在于,包括存儲器和處理器,所述存儲器上存儲有可在所述處理器上運行的計算機程序,當(dāng)所述計算機程序被所述處理器執(zhí)行時,實現(xiàn)權(quán)利要求7所述的預(yù)測方法。