本發(fā)明屬于病理圖像處理,具體涉及一種生物標(biāo)志物預(yù)測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、惡性腫瘤及時(shí)和準(zhǔn)確的診斷對(duì)于患者的治療選擇和預(yù)后評(píng)估至關(guān)重要。生物標(biāo)志物在癌癥的診療中扮演著至關(guān)重要的角色,它們不僅能夠提高診斷的準(zhǔn)確性,還能在風(fēng)險(xiǎn)評(píng)估、治療決策、療效監(jiān)測等方面發(fā)揮重要作用。通常通過聚合酶鏈反應(yīng)(pcr)、測序或免疫組化分析檢測生物標(biāo)志物是目前主流的方法。但是,對(duì)于低收入和中等收入國家的許多患者來說,基因生物標(biāo)志物的檢測存在高昂成本和復(fù)雜基礎(chǔ)設(shè)施的問題。同時(shí),由于基因生物標(biāo)志物的檢測方法的復(fù)雜性,使得檢測周期長,造成治療方案推遲。
2、如:前列腺癌生物標(biāo)志物ar-v7(雄激素受體剪接變異體7)是當(dāng)前前列腺癌治療領(lǐng)域的一個(gè)重要焦點(diǎn)。ar-v7是雄激素受體(ar)的一種剪接變體,它在前列腺癌的治療耐藥性和疾病進(jìn)展中起著關(guān)鍵作用。qrt-pcr是目前最常用的ar-v7?mrna檢測方法,但技術(shù)路線復(fù)雜,需要專業(yè)的實(shí)驗(yàn)室條件和技術(shù)人員,限制了其在臨床上的廣泛應(yīng)用。
3、人工智能(ai)在預(yù)測生物標(biāo)志物方面的應(yīng)用正迅速發(fā)展,主要包括數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等。深度學(xué)習(xí)技術(shù)能夠處理和分析大量的生物信息學(xué)和臨床數(shù)據(jù),挖掘出生物標(biāo)志物與疾病之間的關(guān)聯(lián),發(fā)現(xiàn)新的生物標(biāo)志物和潛在的治療靶點(diǎn)。但是現(xiàn)有的人工智能預(yù)測方法存在以下問題。
4、第一,難以確定腫瘤和正常組織,技術(shù)難度大。在腫瘤和正常組織邊界處易產(chǎn)生分類錯(cuò)誤,降低診斷的準(zhǔn)確性。常規(guī)分類方法未能準(zhǔn)確反映腫瘤細(xì)胞的實(shí)際分布,無法提供腫瘤細(xì)胞的具體比例,關(guān)鍵信息的缺失影響治療決策。
5、第二,高標(biāo)注成本。精確的像素級(jí)分割需要大量的專家手工標(biāo)注,成本高且耗時(shí)。
6、第三,自適應(yīng)性差。病理圖像的高分辨率和染色不一致性,使得精確的像素級(jí)分割極具挑戰(zhàn)。細(xì)胞形態(tài)和染色質(zhì)量的個(gè)體差異導(dǎo)致算法難以普遍適用于不同樣本。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述技術(shù)問題,本發(fā)明提出了一種生物標(biāo)志物預(yù)測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
2、為了達(dá)到上述目的,本發(fā)明的技術(shù)方案如下:
3、第一方面,本發(fā)明公開一種生物標(biāo)志物預(yù)測方法,包括:
4、步驟s1:收集患者的病理圖像及其對(duì)應(yīng)標(biāo)注信息;
5、步驟s2:將收集的每個(gè)病理圖像劃分為若干圖像塊,并進(jìn)行預(yù)處理;
6、步驟s3:基于預(yù)處理后的圖像塊,建立生物標(biāo)志物數(shù)據(jù)集和腫瘤分割數(shù)據(jù)集;
7、生物標(biāo)志物數(shù)據(jù)集包括:標(biāo)注有生物標(biāo)志物診斷結(jié)果的圖像塊;
8、腫瘤分割數(shù)據(jù)集包括:標(biāo)注有腫瘤和正常組織的圖像塊;
9、步驟s4:利用生物標(biāo)志物數(shù)據(jù)集訓(xùn)練自監(jiān)督學(xué)習(xí)模型,自監(jiān)督學(xué)習(xí)模型用于將每個(gè)圖像塊劃分為若干圖像片,并提取每個(gè)圖像片的圖像片特征;
10、步驟s5:采用訓(xùn)練好的自監(jiān)督學(xué)習(xí)模型將腫瘤分割數(shù)據(jù)集內(nèi)每個(gè)圖像塊劃分為若干圖像片,并提取每個(gè)圖像片的圖像片特征;
11、步驟s6:利用步驟s5獲得的腫瘤分割數(shù)據(jù)集的圖像片特征訓(xùn)練腫瘤分割模型,腫瘤分割模型用于預(yù)測每個(gè)圖像塊及對(duì)應(yīng)圖像片的腫瘤概率;
12、步驟s7:采用訓(xùn)練好的腫瘤分割模型預(yù)測生物標(biāo)志物數(shù)據(jù)集內(nèi)每個(gè)圖像塊及對(duì)應(yīng)圖像片的腫瘤概率;
13、步驟s8:基于步驟s7的預(yù)測結(jié)果,篩選優(yōu)化生物標(biāo)志物數(shù)據(jù)集內(nèi)的圖像塊,生成新的生物標(biāo)志物數(shù)據(jù)集;
14、步驟s9:采用訓(xùn)練好的自監(jiān)督學(xué)習(xí)模型將新的生物標(biāo)志物數(shù)據(jù)集內(nèi)每個(gè)圖像塊劃分為若干圖像片,并提取每個(gè)圖像片的圖像片特征;
15、步驟s10:利用步驟s9獲得的新的生物標(biāo)志物數(shù)據(jù)集的圖像片特征訓(xùn)練生物標(biāo)志物預(yù)測模型,生物標(biāo)志物預(yù)測模型用于預(yù)測患者的生物標(biāo)志物狀態(tài);
16、步驟s11:將訓(xùn)練好的模型應(yīng)用待分析的病理圖像,預(yù)測生物標(biāo)志物狀態(tài)。
17、在上述技術(shù)方案的基礎(chǔ)上,還可做如下改進(jìn):
18、作為優(yōu)選的方案,步驟s2包括:
19、步驟s2.1:將收集的每個(gè)病理圖像按照固定尺寸劃分為若干圖像塊;
20、步驟s2.2:調(diào)整統(tǒng)一所有圖像塊的分辨率;
21、步驟s2.3:篩選并排除無效圖像塊。
22、作為優(yōu)選的方案,步驟s11包括:
23、步驟s11.1:收集患者的待分析病理圖像;
24、步驟s11.2:將收集的每個(gè)病理圖像劃分為若干圖像塊,并進(jìn)行預(yù)處理;
25、步驟s11.3:基于預(yù)處理后的圖像塊,建立待分析數(shù)據(jù)集;
26、步驟s11.4:利用訓(xùn)練好的自監(jiān)督學(xué)習(xí)模型將待分析數(shù)據(jù)集內(nèi)的每個(gè)圖像塊分為若干圖像片,并提取每個(gè)圖像片的圖像片特征;
27、步驟s11.5:基于待分析數(shù)據(jù)集的圖像片特征,利用訓(xùn)練好的腫瘤分割模型預(yù)測每個(gè)圖像塊及對(duì)應(yīng)圖像片的腫瘤概率;
28、步驟s11.6:基于步驟s11.5的預(yù)測結(jié)果,篩選優(yōu)化待分析數(shù)據(jù)集內(nèi)的圖像塊,生成新的待分析數(shù)據(jù)集;
29、步驟s11.7:采用訓(xùn)練好的自監(jiān)督學(xué)習(xí)模型將新的待分析數(shù)據(jù)集內(nèi)每個(gè)圖像塊劃分為若干圖像片,并提取每個(gè)圖像片的圖像片特征;
30、步驟s11.8:基于新的待分析數(shù)據(jù)集的圖像片特征,利用訓(xùn)練好的生物標(biāo)志物預(yù)測模型預(yù)測患者的生物標(biāo)志物狀態(tài)。
31、作為優(yōu)選的方案,步驟s8和步驟s11.6分別通過以下步驟篩選優(yōu)化對(duì)應(yīng)數(shù)據(jù)集內(nèi)的圖像塊,具體包括:
32、步驟a:根據(jù)每個(gè)圖像塊預(yù)測的腫瘤概率,判斷每個(gè)圖像塊為腫瘤圖像塊或正常組織圖像塊;
33、根據(jù)每個(gè)圖像片預(yù)測的腫瘤概率,判斷每個(gè)圖像片為腫瘤圖像片或正常組織圖像片;
34、步驟b:篩除對(duì)應(yīng)數(shù)據(jù)集內(nèi)的所有被判斷為正常組織的圖像塊;
35、步驟c:評(píng)估對(duì)應(yīng)數(shù)據(jù)集內(nèi)剩下的每個(gè)圖像塊的腫瘤含量t,
36、t=m/n;
37、其中:m為該圖像塊中被判斷為腫瘤圖像片的數(shù)量;
38、n為該圖像塊中所有圖像片的數(shù)量;
39、步驟d:根據(jù)每個(gè)圖像塊的腫瘤含量,從對(duì)應(yīng)數(shù)據(jù)集剩下的圖像塊中篩選出腫瘤含量超過含量閾值的圖像塊;
40、步驟e:對(duì)于篩選出的圖像塊,采用掩碼技術(shù)移除所有被判斷為正常組織的圖像片,得到新的圖像塊,形成新的對(duì)應(yīng)數(shù)據(jù)集。
41、第二方面,本發(fā)明還公開一種生物標(biāo)志物預(yù)測裝置,包括:
42、收集模塊,用于收集患者的病理圖像及其對(duì)應(yīng)標(biāo)注信息;
43、預(yù)處理模塊,用于將收集的每個(gè)病理圖像劃分為若干圖像塊,并進(jìn)行預(yù)處理;
44、數(shù)據(jù)集建立模塊,用于基于預(yù)處理后的圖像塊,建立生物標(biāo)志物數(shù)據(jù)集和腫瘤分割數(shù)據(jù)集;
45、生物標(biāo)志物數(shù)據(jù)集包括:標(biāo)注有生物標(biāo)志物診斷結(jié)果的圖像塊;
46、腫瘤分割數(shù)據(jù)集包括:標(biāo)注有腫瘤和正常組織的圖像塊;
47、自監(jiān)督學(xué)習(xí)模型訓(xùn)練模塊,用于利用生物標(biāo)志物數(shù)據(jù)集訓(xùn)練自監(jiān)督學(xué)習(xí)模型,自監(jiān)督學(xué)習(xí)模型用于將每個(gè)圖像塊劃分為若干圖像片,并提取每個(gè)圖像片的圖像片特征;
48、第一特征提取模塊,用于采用訓(xùn)練好的自監(jiān)督學(xué)習(xí)模型將腫瘤分割數(shù)據(jù)集內(nèi)每個(gè)圖像塊劃分為若干圖像片,并提取每個(gè)圖像片的圖像片特征;
49、腫瘤分割模型訓(xùn)練模塊,用于利用第一特征提取模塊獲得的腫瘤分割數(shù)據(jù)集的圖像片特征訓(xùn)練腫瘤分割模型,腫瘤分割模型用于預(yù)測每個(gè)圖像塊及對(duì)應(yīng)圖像片的腫瘤概率;
50、分割預(yù)測模塊,用于采用訓(xùn)練好的腫瘤分割模型預(yù)測生物標(biāo)志物數(shù)據(jù)集內(nèi)每個(gè)圖像塊及對(duì)應(yīng)圖像片的腫瘤概率;
51、篩選優(yōu)化模塊,用于基于分割預(yù)測模塊的預(yù)測結(jié)果,篩選優(yōu)化生物標(biāo)志物數(shù)據(jù)集內(nèi)的圖像塊,生成新的生物標(biāo)志物數(shù)據(jù)集;
52、第二特征提取模塊,用于采用訓(xùn)練好的自監(jiān)督學(xué)習(xí)模型將新的生物標(biāo)志物數(shù)據(jù)集內(nèi)每個(gè)圖像塊劃分為若干圖像片,并提取每個(gè)圖像片的圖像片特征;
53、生物標(biāo)志物預(yù)測模型訓(xùn)練模塊,用于利用第二特征提取模塊獲得的新的生物標(biāo)志物數(shù)據(jù)集的圖像片特征訓(xùn)練生物標(biāo)志物預(yù)測模型,生物標(biāo)志物預(yù)測模型用于預(yù)測患者的生物標(biāo)志物狀態(tài);
54、應(yīng)用模塊,用于將訓(xùn)練好的模型應(yīng)用待分析的病理圖像,預(yù)測生物標(biāo)志物狀態(tài)。
55、作為優(yōu)選的方案,預(yù)處理模塊包括:
56、圖像塊劃分單元,用于將收集的每個(gè)病理圖像按照固定尺寸劃分為若干圖像塊;
57、分辨率調(diào)整單元,用于調(diào)整統(tǒng)一所有圖像塊的分辨率;
58、無效圖像塊篩除單元,用于篩選并排除無效圖像塊。
59、作為優(yōu)選的方案,應(yīng)用模塊包括:
60、應(yīng)用收集單元,用于收集患者的待分析病理圖像;
61、應(yīng)用預(yù)處理單元,用于將收集的每個(gè)病理圖像劃分為若干圖像塊,并進(jìn)行預(yù)處理;
62、應(yīng)用數(shù)據(jù)集建立單元,用于基于預(yù)處理后的圖像塊,建立待分析數(shù)據(jù)集;
63、應(yīng)用第一特征提取單元,用于利用訓(xùn)練好的自監(jiān)督學(xué)習(xí)模型將待分析數(shù)據(jù)集內(nèi)的每個(gè)圖像塊分為若干圖像片,并提取每個(gè)圖像片的圖像片特征;
64、應(yīng)用分割預(yù)測單元,用于基于待分析數(shù)據(jù)集的圖像片特征,利用訓(xùn)練好的腫瘤分割模型預(yù)測每個(gè)圖像塊及對(duì)應(yīng)圖像片的腫瘤概率;
65、應(yīng)用篩選優(yōu)化單元,用于基于應(yīng)用分割預(yù)測單元的預(yù)測結(jié)果,篩選優(yōu)化待分析數(shù)據(jù)集內(nèi)的圖像塊,生成新的待分析數(shù)據(jù)集;
66、應(yīng)用第二特征提取單元,用于采用訓(xùn)練好的自監(jiān)督學(xué)習(xí)模型將新的待分析數(shù)據(jù)集內(nèi)每個(gè)圖像塊劃分為若干圖像片,并提取每個(gè)圖像片的圖像片特征;
67、應(yīng)用預(yù)測單元,用于基于新的待分析數(shù)據(jù)集的圖像片特征,利用訓(xùn)練好的生物標(biāo)志物預(yù)測模型預(yù)測患者的生物標(biāo)志物狀態(tài)。
68、作為優(yōu)選的方案,篩選優(yōu)化模塊和應(yīng)用篩選優(yōu)化單元分別包括:
69、判斷單元,用于根據(jù)每個(gè)圖像塊預(yù)測的腫瘤概率,判斷每個(gè)圖像塊為腫瘤圖像塊或正常組織圖像塊;
70、根據(jù)每個(gè)圖像片預(yù)測的腫瘤概率,判斷每個(gè)圖像片為腫瘤圖像片或正常組織圖像片;
71、篩除單元,用于篩除對(duì)應(yīng)數(shù)據(jù)集內(nèi)的所有被判斷為正常組織的圖像塊;
72、腫瘤含量評(píng)估單元,用于評(píng)估對(duì)應(yīng)數(shù)據(jù)集內(nèi)剩下的每個(gè)圖像塊的腫瘤含量t,
73、t=m/n;
74、其中:m為該圖像塊中被判斷為腫瘤圖像片的數(shù)量;
75、n為該圖像塊中所有圖像片的數(shù)量;
76、篩選單元,用于根據(jù)每個(gè)圖像塊的腫瘤含量,從對(duì)應(yīng)數(shù)據(jù)集剩下的圖像塊中篩選出腫瘤含量超過含量閾值的圖像塊;
77、形成單元,用于對(duì)于篩選出的圖像塊,采用掩碼技術(shù)移除所有被判斷為正常組織的圖像片,得到新的圖像塊,形成新的對(duì)應(yīng)數(shù)據(jù)集。
78、第三方面,本發(fā)明還公開一種計(jì)算設(shè)備,包括:
79、一個(gè)或多個(gè)處理器;
80、存儲(chǔ)器;
81、以及一個(gè)或多個(gè)程序,其中一個(gè)或多個(gè)程序存儲(chǔ)在存儲(chǔ)器中并被配置為由一個(gè)或多個(gè)處理器執(zhí)行,一個(gè)或多個(gè)程序包括上述任一生物標(biāo)志物預(yù)測方法的指令。
82、第四方面,本發(fā)明還公開一種存儲(chǔ)介質(zhì),其特征在于,存儲(chǔ)介質(zhì)存儲(chǔ)有一個(gè)或多個(gè)計(jì)算機(jī)可讀的程序,一個(gè)或多個(gè)程序包括指令,指令適于由存儲(chǔ)器加載并執(zhí)行上述任一生物標(biāo)志物預(yù)測方法。
83、本發(fā)明公開一種生物標(biāo)志物預(yù)測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),其具有以下有益效果:
84、第一,本發(fā)明采用自監(jiān)督學(xué)習(xí)模型提取圖像片特征,降低了對(duì)人工標(biāo)注數(shù)據(jù)的依賴。
85、第二,本發(fā)明基于圖像片特征采用弱監(jiān)督學(xué)習(xí)方法訓(xùn)練腫瘤分割模型,可以準(zhǔn)確的把腫瘤組織和正常組織進(jìn)行分割。
86、第三,本發(fā)明根據(jù)腫瘤分割模型的預(yù)測結(jié)果對(duì)圖像塊進(jìn)行篩選優(yōu)化,使得生物標(biāo)志物的預(yù)測更為準(zhǔn)確。
87、綜上述,本發(fā)明可以有效對(duì)生物標(biāo)志物的狀態(tài)進(jìn)行預(yù)測,預(yù)測精度高,可有效的減輕臨床病理醫(yī)生的負(fù)擔(dān),提高腫瘤相關(guān)生物標(biāo)志物的預(yù)測準(zhǔn)確性,具有顯著的臨床意義。