本說明書涉及醫(yī)療人工智能,尤其涉及一種急性髓系白血病的動態(tài)風險分層方法和裝置。
背景技術(shù):
1、急性髓系白血病(acute?myeloid?leukemia,?aml)是一種高度異質(zhì)性的血液腫瘤,患者生存時間差異顯著。當前基于eln?2022指南的預(yù)后評估體系主要依賴傳統(tǒng)細胞遺傳學分析技術(shù)和有限分子標記檢測(如flt3-itd、npm1等),難以充分利用高通量測序生成的復(fù)雜基因組數(shù)據(jù)。而現(xiàn)有的cox比例風險模型(cox?proportional-hazards?model)假設(shè)線性風險關(guān)系,無法捕捉基因特征間的復(fù)雜交互作用。因此,開發(fā)能夠融合多維度生物標志物、捕捉非線性關(guān)聯(lián)特征,同時具備生物學可解釋性的智能預(yù)后系統(tǒng),已成為優(yōu)化aml精準診療的關(guān)鍵科學問題。
2、因此亟需開發(fā)一種通過融合多維度生物標志物和機器學習技術(shù)提高預(yù)后評估準確性和個性化的智能系統(tǒng)。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種急性髓系白血病的動態(tài)風險分層方法及裝置,旨在解決現(xiàn)有預(yù)后評估體系中基因組數(shù)據(jù)利用不足以及特征間交互效應(yīng)解析不充分的問題。
2、本說明書采用下述技術(shù)方案:
3、本說明書提供了一種急性髓系白血病的動態(tài)風險分層方法,包括:
4、對多源數(shù)據(jù)進行融合,構(gòu)建規(guī)范化特征集合;
5、通過單變量cox回歸分析、lasso懲罰的cox回歸分析以及多變量cox回歸分析進行特征篩選,從所述規(guī)范化特征集合中提取出具有獨立預(yù)后價值的特征集合;以及
6、基于所述具有獨立預(yù)后價值的特征集合,構(gòu)建隨機生存森林模型,生成個體化風險評分;對所述個體化風險評分進行動態(tài)聚類,以將患者劃分為低、中、高風險層級。
7、可選的,所述通過單變量cox回歸分析、lasso懲罰的cox回歸分析以及多變量cox回歸分析進行特征篩選,從所述規(guī)范化特征集合中提取出具有獨立預(yù)后價值的特征集合包括:
8、對所述規(guī)范化特征集合中的每個特征進行所述單變量cox比例風險回歸分析,篩選出p值<0.2的特征,得到初步特征集合;
9、將所述初步特征集合輸入lasso懲罰的cox模型,通過s折交叉驗證確定正則化參數(shù),篩選出稀疏特征集合;
10、對所述稀疏特征集合執(zhí)行多變量cox逐步回歸優(yōu)化,獲得所述具有獨立預(yù)后價值的特征集合。
11、可選的,所述對多源數(shù)據(jù)進行融合,構(gòu)建規(guī)范化特征集合包括:
12、對所述多源數(shù)據(jù)中的離散特征進行二元邏輯編碼,對所述多源數(shù)據(jù)中的連續(xù)特征保留原始值域;
13、統(tǒng)計每個樣本的特征缺失率,刪除特征缺失率≥20%的樣本;
14、針對被保留的樣本中的離散特征,采用眾數(shù)填補法處理缺失值;針對連續(xù)特征,采用中位數(shù)插補法處理缺失值。
15、可選的,基于累積風險函數(shù)加權(quán)計算所述個體化風險評分:
16、
17、其中,為第棵樹的chf估計值,輸出風險評分。
18、可選的,所述對所述個體化風險評分進行動態(tài)聚類,以將患者劃分為低、中、高風險層級包括:利用高斯混合模型和貝葉斯決策技術(shù)對所述個體化風險評分進行動態(tài)聚類,以將患者劃分為低、中、高風險層級。
19、可選的,lasso懲罰的cox模型進行稀疏化處理的目標函數(shù)為:
20、
21、其中,為偏似然函數(shù),正則化參數(shù)通過s折交叉驗證確定,為特征總數(shù)。
22、本說明書提供了一種急性髓系白血病的動態(tài)風險分層裝置,包括:
23、數(shù)據(jù)融合處理模塊,用于對多源數(shù)據(jù)進行融合,構(gòu)建規(guī)范化特征集合;
24、遞進式特征篩選模塊,用于通過單變量cox回歸分析、lasso懲罰的cox回歸分析以及多變量cox回歸分析進行特征篩選,從所述規(guī)范化特征集合中提取出具有獨立預(yù)后價值的特征集合;
25、風險評分和分層模塊,用于基于所述具有獨立預(yù)后價值的特征集合,構(gòu)建隨機生存森林模型,生成個體化風險評分;對所述個體化風險評分進行動態(tài)聚類,以將患者劃分為低、中、高風險層級。
26、可選的,所述裝置還包括驗證與解釋模塊,用于評估模型性能以及提供多粒度特征解釋。
27、本說明書提供了一種計算機可讀存儲介質(zhì),所述存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述急性髓系白血病的動態(tài)風險分層方法。
28、本說明書提供了一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)上述急性髓系白血病的動態(tài)風險分層方法。
29、本說明書采用的上述至少一個技術(shù)方案能夠達到以下有益效果:
30、從上述方法可以看出,通過多源數(shù)據(jù)融合處理、三級遞進式特征篩選,提高了預(yù)后評估的準確性和個性化水平;通過采用隨機生存森林算法,克服了傳統(tǒng)cox風險模型線性假設(shè)的限制,從而提高了風險評分的預(yù)測能力;通過高斯混合模型和動態(tài)聚類技術(shù),根據(jù)個體化風險評分將患者分為低危、中危和高危組,為臨床醫(yī)生提供更精確的分層依據(jù)。
1.一種急性髓系白血病的動態(tài)風險分層方法,其特征在于,所述方法包括以下步驟:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過單變量cox回歸分析、lasso懲罰的cox回歸分析以及多變量cox回歸分析進行特征篩選,從所述規(guī)范化特征集合中提取出具有獨立預(yù)后價值的特征集合包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對多源數(shù)據(jù)進行融合,構(gòu)建規(guī)范化特征集合包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于累積風險函數(shù)加權(quán)計算所述個體化風險評分:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述個體化風險評分進行動態(tài)聚類,以將患者劃分為低、中、高風險層級包括:利用高斯混合模型和貝葉斯決策技術(shù)對所述個體化風險評分進行動態(tài)聚類,以將患者劃分為低、中、高風險層級。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,lasso懲罰的cox模型進行稀疏化處理的目標函數(shù)為:
7.一種急性髓系白血病的動態(tài)風險分層裝置,其特征在于,所述裝置包括:
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括驗證與解釋模塊,用于評估模型性能以及提供多粒度特征解釋。
9.一種計算機可讀存儲介質(zhì),其特征在于,所述存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述權(quán)利要求1~6任一項所述的方法。
10.一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)上述權(quán)利要求1~6任一項所述的方法。