本發(fā)明涉及智能醫(yī)療領(lǐng)域,更具體地,涉及一種基于淋巴腫瘤micm表型分型的人工智能特征提取方法、系統(tǒng)、設(shè)備、介質(zhì)和程序產(chǎn)品。
背景技術(shù):
1、結(jié)構(gòu)化報(bào)告規(guī)范在醫(yī)療大數(shù)據(jù)時(shí)代中是勢(shì)在必行。不僅在血液腫瘤臨床診療和科學(xué)研究等方面建立良好的數(shù)據(jù)基礎(chǔ),也可以在與臨床、與患者的溝通過程中起到更好的橋梁作用,推進(jìn)血液腫瘤治療中心逐步邁向標(biāo)準(zhǔn)化、數(shù)據(jù)化和智能化,在血液腫瘤治療領(lǐng)域開展有深度的臨床科研和創(chuàng)新治療手段。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述問題,本發(fā)明提供一種基于淋巴腫瘤micm表型分型的人工智能特征提取方法,利用數(shù)據(jù)處理和特征提取捕捉時(shí)序數(shù)據(jù)中的信息,并對(duì)疾病預(yù)測(cè)模型的參數(shù)提出改進(jìn),并進(jìn)行有效優(yōu)化,從而構(gòu)建形成適用于臨床的疾病預(yù)警模型。
2、本技術(shù)(第一方面)公開一種基于淋巴腫瘤micm表型分型的人工智能特征提取方法,包括:
3、s101:獲取待測(cè)者的診斷報(bào)告;
4、s102:基于所述診斷報(bào)告得到結(jié)構(gòu)化診斷報(bào)告;
5、s103:將所述結(jié)構(gòu)化診斷報(bào)告向量化得到向量化診斷報(bào)告;
6、s104:所述向量化診斷報(bào)告輸入基于量子編碼的transformer中進(jìn)行特征提取得到micm表型分型特征;所述基于量子編碼的transformer將輸入數(shù)據(jù)轉(zhuǎn)換為量子態(tài)后提取量子態(tài)特征信息,將量子態(tài)特征信息轉(zhuǎn)換為回非量子態(tài)數(shù)據(jù)后輸出micm表型分型特征。
7、進(jìn)一步,所述基于量子編碼的transformer包括輸入層、量子編碼層、量子門層和輸出層;所述基于量子編碼的transformer的處理步驟包括:
8、第1步:所述輸入層為所述向量化診斷報(bào)告的每個(gè)向量配置初始量子態(tài)得到初始量子態(tài)的向量;
9、第2步:所述量子編碼層將所述初始量子態(tài)的向量進(jìn)行量子編碼得到量子編碼的向量;
10、第3步:所述量子編碼的向量經(jīng)過量子門層進(jìn)行前向傳播得到前向傳播提取的量子態(tài)特征;
11、第4步:所述輸出層將所述提取的量子態(tài)特征映射回非量子態(tài)得到所述micm表型分型特征;
12、可選的,所述步驟在第2步和第3步之間還包括第3’步:通過動(dòng)態(tài)量子拓?fù)鋬?yōu)化策略優(yōu)化量子編碼的向量的量子比特之間的相關(guān)性距離。
13、進(jìn)一步,所述每個(gè)向量配置初始量子態(tài)的方式表示為:
14、
15、式中,表示初始量子態(tài),αi是復(fù)數(shù)振幅,|i>是量子比特的基態(tài),n是表征向量所用的量子比特的數(shù)量;
16、可選的,所述量子編碼層的轉(zhuǎn)換可以表示為:
17、ψenc=u(θ)|ψ>
18、式中,ψenc表示編碼后的量子態(tài),u(θ)是依據(jù)輸入數(shù)據(jù)特性調(diào)整的量子門,θ表示量子門的參數(shù),|ψ>是初始量子態(tài);
19、可選的,所述量子門層表示為:
20、ψpro=upro(γ)ψenc
21、式中,ψpro表示前向傳播后的量子態(tài),upro(γ)是前向傳播過程中使用的量子門,γ為量子門參數(shù);
22、可選的,所述輸出層表示為:
23、
24、式中,ψdec表示解碼后得到的micm表型分型特征,ψpro是表示前向傳播后提取到的量子態(tài)特征信息,是量子編碼操作的共軛轉(zhuǎn)置,用于將量子態(tài)特征信息映射為所述micm表型分型特征;
25、可選的,所述量子門u(θ)表示為:
26、u(θ)=e-iθh
27、式中,h是哈密頓量;
28、可選的,使用動(dòng)態(tài)量子拓?fù)鋬?yōu)化策略調(diào)整得到調(diào)整后的哈密頓量,使用所述調(diào)整后的哈密頓量得到所述量子門u(θ);
29、可選的,所述動(dòng)態(tài)量子拓?fù)鋬?yōu)化策略動(dòng)態(tài)的調(diào)整方式可以表示為:
30、
31、λjk=softmax(-djk/τte)
32、式中,softmax()為預(yù)設(shè)的softmax分類函數(shù),hdqto為動(dòng)態(tài)調(diào)整后的哈密頓量;λjk為量子比特j和k之間的耦合強(qiáng)度,和為作用于量子比特j和k的pauli-z操作,djk表示量子比特j和k之間的特征相關(guān)性距離,τte是溫度參數(shù)。
33、進(jìn)一步,所述基于量子編碼的transformer的構(gòu)建步驟包括:
34、初始的量子編碼的transformer包括初始輸入層、初始量子編碼層、初始量子門層和初始輸出層,所述初始量子編碼層和初始量子門層的參數(shù)為隨機(jī)初始化的參數(shù);
35、訓(xùn)練集的向量化診斷報(bào)告經(jīng)過初始的量子編碼的transformer得到初始micm表型分型特征后,基于所述初始micm表型分型特征得到模型預(yù)測(cè)輸出,比較訓(xùn)練集的實(shí)際值和模型預(yù)測(cè)輸出之間的差異到損失函數(shù),迭代訓(xùn)練所述損失函數(shù)直到達(dá)到停止條件得到所述基于量子編碼的transformer;
36、所述停止條件包括達(dá)到預(yù)設(shè)的最大迭代次數(shù);
37、可選的,基于初始micm表型分型特征計(jì)算得到損失函數(shù)表示為:
38、
39、式中,l表示損失函數(shù),i∈[1,m],i表示訓(xùn)練集中的第i個(gè)樣本,m表示訓(xùn)練集中的總樣本數(shù)目,yi是第i個(gè)樣本的目標(biāo)輸出,ψdec,i表示第i個(gè)樣本的micm表型分型特征,f(ψdec,i)是模型的預(yù)測(cè)的第i個(gè)樣本的輸出;
40、可選的,所述初始量子編碼層的參數(shù)的更新方式表示為:
41、
42、式中,θnew和θold分別表示更新后和更新前的初始量子編碼層參數(shù),ηrate是學(xué)習(xí)率,是損失函數(shù)關(guān)于初始量子編碼層參數(shù)θ的梯度;
43、可選的,所述初始量子門層的參數(shù)的更新方式表示為:
44、
45、式中,γnew和γold分別表示更新后和更新前的初始量子門層的參數(shù),η2是學(xué)習(xí)率,是損失函數(shù)關(guān)于初始量子門層參數(shù)γ的梯度。
46、可選的,所述停止條件包括量子糾纏度小于預(yù)設(shè)的閾值:經(jīng)過量子門層進(jìn)行前向傳播得到前向傳播提取的量子態(tài)特征后,計(jì)算得到不同量子比特之間的糾纏度,當(dāng)時(shí),則表示模型收斂,則停止訓(xùn)練;
47、可選的,所述糾纏度表示為:
48、e=tr(ρa(bǔ)logρa(bǔ))
49、式中,e表示量子糾纏度,ρa(bǔ)是系統(tǒng)a的約化密度矩陣,系統(tǒng)a代表上一次次迭代提取到的量子態(tài)特征信息,tr()表示跡操作,
50、進(jìn)一步地,約化密度矩陣ρa(bǔ)從總密度矩陣ρ通過跡運(yùn)算得到,所述總密度矩陣ρ為本次迭代提取到的量子態(tài)特征信息的特征矩陣,約化密度矩陣ρa(bǔ)可以表示為:
51、ρa(bǔ)=trb(ρ)
52、式中,trb()表示對(duì)系統(tǒng)b部分取跡,留下系統(tǒng)a部分的狀態(tài),系統(tǒng)b是本次迭代提取到的量子態(tài)特征信息。
53、進(jìn)一步,
54、所述診斷報(bào)告包括形態(tài)學(xué)信息、免疫學(xué)信息、細(xì)胞遺傳學(xué)信息、分子學(xué)信息;
55、可選的,基于所述診斷報(bào)告得到結(jié)構(gòu)化診斷報(bào)告的方法包括使用機(jī)器視覺技術(shù)按照標(biāo)準(zhǔn)報(bào)告模型提取得到所述結(jié)構(gòu)化診斷報(bào)告;
56、可選的,將所述結(jié)構(gòu)化診斷報(bào)告向量化得到向量化診斷報(bào)告的方法包括下列方法的一種或幾種:word2vec、doc2vec、bert。
57、進(jìn)一步,所述基于量子編碼的基于淋巴腫瘤micm表型分型的人工智能特征提取方法還包括s105:基于所述micm表型分型特征得到患者的診療信息;
58、可選的,還包括s105’:將所述micm表型分型特征輸入分類器中得到待測(cè)者是否患有血液腫瘤的分類結(jié)果;
59、可選的,所述micm診斷報(bào)告包括所述患者的治療信息和所述分類結(jié)果。
60、可選的,所述分類器包括下列的一種或幾種:條件隨機(jī)場(chǎng)算法、支持向量機(jī)、決策樹、隨機(jī)森林、邏輯斯蒂回歸;
61、進(jìn)一步,所述分類器為訓(xùn)練好的條件隨機(jī)場(chǎng),所述訓(xùn)練好的條件隨機(jī)場(chǎng)的構(gòu)建方法包括:
62、獲取診斷報(bào)告訓(xùn)練集,所述訓(xùn)練集還包括是否患有血液腫瘤的標(biāo)簽;
63、基于所述診斷報(bào)告訓(xùn)練集得到micm表型分型特征訓(xùn)練集;
64、初始化條件隨機(jī)場(chǎng)的參數(shù)得到初始化的條件隨機(jī)場(chǎng);
65、對(duì)所述初始化的條件隨機(jī)場(chǎng)的參數(shù)進(jìn)行蒙特卡羅隨機(jī)采樣得到樣本參數(shù);
66、基于所述樣本參數(shù)得到micm表型分型特征訓(xùn)練集的預(yù)測(cè)標(biāo)簽,基于所述micm表型分型特征訓(xùn)練集的預(yù)測(cè)標(biāo)簽和診斷報(bào)告的實(shí)際標(biāo)簽計(jì)算得到條件隨機(jī)場(chǎng)的損失函數(shù),通過迭代逐漸最小化所述條件隨機(jī)場(chǎng)的損失函數(shù),達(dá)到停止條件后得到所述訓(xùn)練好的條件隨機(jī)場(chǎng);
67、可選的,所述條件隨機(jī)場(chǎng)的損失函數(shù)表示為:
68、
69、式中,l(qθ)表示基于條件隨機(jī)場(chǎng)的參數(shù)qθ的損失函數(shù),是第i個(gè)樣本的標(biāo)簽數(shù)據(jù),qθ(t)是迭代過程中第t次迭代時(shí)蒙特卡羅抽樣得到的條件隨機(jī)場(chǎng)的參數(shù),是在給定特征和參數(shù)qθ(t)下的標(biāo)簽預(yù)測(cè)概率,λl1為l1正則化系數(shù),||qθ||1為參數(shù)qθ(t)的l1正則項(xiàng);
70、可選的,所述蒙特卡羅隨機(jī)采樣得到樣本參數(shù)表示為:
71、qθ(t)=qθ(t-1)+∈(t)
72、式中,qθ(t)表示第t次迭代的樣本參數(shù),qθ(t-1)表示第t-1次迭代的樣本參數(shù),∈(t)為采樣步長(zhǎng);
73、可選的,采樣步長(zhǎng)∈(t)為動(dòng)態(tài)自適應(yīng)設(shè)置,設(shè)置方式為:
74、∈(t)=κcy·exp(-ρcyt)
75、式中,κcy是初始步長(zhǎng),ρcy是衰減因子;
76、可選的,采用稀疏正則化策略優(yōu)化所述樣本參數(shù)得到優(yōu)化的樣本參數(shù)后,使用所述優(yōu)化的樣本參數(shù)替換所述樣本參數(shù)計(jì)算得到所述條件隨機(jī)場(chǎng)的損失函數(shù);
77、可選的,所述稀疏正則化策略表示為:
78、
79、式中,表示第t次迭代時(shí)優(yōu)化的樣本參數(shù),δqθ(t)是第t次迭代過程中樣本參數(shù)qθ(t)的增量,αgz是學(xué)習(xí)率,是條件隨機(jī)場(chǎng)的損失函數(shù)對(duì)參數(shù)的梯度,δgz是基于模型輸出與實(shí)際分類結(jié)果之間差異計(jì)算得到的調(diào)整因子,sign(qθ(t))表示qθ(t)的符號(hào)函數(shù);
80、可選的,所述停止條件包括迭代的信息增益小于預(yù)設(shè)的閾值:在每次迭代后,基于當(dāng)前的條件隨機(jī)場(chǎng)的樣本參數(shù)計(jì)算得到信息增益,當(dāng)信息增益小于預(yù)設(shè)的閾值時(shí)停止迭代;
81、可選的,表示在給定特征和參數(shù)qθ(t)下的標(biāo)簽預(yù)測(cè)概率,當(dāng)前的條件隨機(jī)場(chǎng)的樣本參數(shù)確定時(shí),可計(jì)算得到所有的其中c∈[1,c],c表示分類標(biāo)簽,c是所有可能的類別,信息增益表示如下:
82、
83、式中,esi表示第i個(gè)樣本的信息增益,是給定特征的條件下類別c的概率,p(c)是類別c的先驗(yàn)概率。
84、本技術(shù)第二方面公開一種基于淋巴腫瘤micm表型分型的人工智能特征提取系統(tǒng),包括:
85、獲取模塊201:用于獲取待測(cè)者的診斷報(bào)告;
86、結(jié)構(gòu)化處理模塊202:用于基于所述診斷報(bào)告得到結(jié)構(gòu)化診斷報(bào)告;
87、向量化處理模塊203:用于將所述結(jié)構(gòu)化診斷報(bào)告向量化得到向量化診斷報(bào)告;
88、特征提取模塊204:用于所述向量化診斷報(bào)告輸入基于量子編碼的transformer中進(jìn)行特征提取得到micm表型分型特征;所述基于量子編碼的transformer將輸入數(shù)據(jù)轉(zhuǎn)換為量子態(tài)后提取量子態(tài)特征信息,將量子態(tài)特征信息轉(zhuǎn)換為回非量子態(tài)數(shù)據(jù)后輸出micm表型分型特征。
89、本技術(shù)第三方面公開一種計(jì)算機(jī)設(shè)備,所述設(shè)備包括:存儲(chǔ)器和處理器;所述存儲(chǔ)器用于存儲(chǔ)程序指令;所述處理器用于調(diào)用程序指令,當(dāng)程序指令被執(zhí)行時(shí),用于執(zhí)行上述的方法的步驟。
90、本技術(shù)第四方面公開一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的方法的步驟。
91、本技術(shù)第五方面公開一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的方法的步驟。
92、本技術(shù)具有以下有益效果:
93、1.本技術(shù)通過基于量子編碼的transformer提取所需的micm表型分型特征,采用基于量子編碼的transformer算法增強(qiáng)模型對(duì)數(shù)據(jù)特征的捕獲能力;
94、2.采用采用動(dòng)態(tài)量子拓?fù)鋬?yōu)化策略優(yōu)化量子比特之間的連接拓?fù)浣Y(jié)構(gòu),以提高特征提取過程中量子編碼的效率和模型的信息處理能力;
95、3.本發(fā)明并利用基于蒙特卡羅法優(yōu)化的條件隨機(jī)場(chǎng)算法進(jìn)行模型訓(xùn)練,通過稀疏表征策略提高處理效率和精確性;
96、4.基于本發(fā)明創(chuàng)新技術(shù),能夠在micm診斷任務(wù)中有效提升數(shù)據(jù)處理能力,增強(qiáng)了模型對(duì)不同數(shù)據(jù)特性的適應(yīng)能力,提升模型在醫(yī)療診斷任務(wù)中的分類準(zhǔn)確性和預(yù)測(cè)的可靠性。