本發(fā)明屬于圖像分割,涉及一種基于非顯著性特征的口腔黏膜病分割方法及系統(tǒng)。
背景技術(shù):
1、在口腔等醫(yī)學(xué)圖像中,病灶區(qū)域與周?chē)M織器官的特征較為相似,即存在許多的非顯著性特征。而偽裝對(duì)象檢測(cè)cod技術(shù)是一種旨在從背景中定位偽裝對(duì)象的技術(shù),因此利用cod技術(shù)可以很好的提升非顯著性特征區(qū)域的分割性能。早期的cod技術(shù)中,利用手工標(biāo)注的特征,如顏色、強(qiáng)度、形狀、方向和邊緣,提出了一種發(fā)現(xiàn)和跟蹤偽裝對(duì)象的檢測(cè)跟蹤策略,將多種類型的特征集成在一起來(lái)表示偽裝對(duì)象。但是,由于手工特征的表達(dá)能力有限,這些早期模型往往無(wú)法獲得令人滿意的性能。為了解決這個(gè)問(wèn)題,人們開(kāi)發(fā)了幾種基于深度學(xué)習(xí)的方法,并獲得了很好的偽裝目標(biāo)檢測(cè)性能。但分割性能越好的模型會(huì)應(yīng)用更多、更復(fù)雜的模塊,并不斷加大模型的網(wǎng)絡(luò)深度。然而,由于有限的計(jì)算資源,這些模型并不適合實(shí)際的臨床環(huán)境。因此,分割模型需要在性能和模型參數(shù)之間做出很好的權(quán)衡,側(cè)重于在資源約束下設(shè)計(jì)輕量級(jí)、性能好的體系結(jié)構(gòu)。fddwnet使用分解擴(kuò)張深度可分離卷積,以更少的模型參數(shù)從不同規(guī)模的接受域?qū)W習(xí)特征表示,但忽略了語(yǔ)義分割的固有特性,使得分割精度較差。utnet是一種簡(jiǎn)單而強(qiáng)大的混合transformer架構(gòu),它將自注意力集成到卷積神經(jīng)網(wǎng)絡(luò)中,用于增強(qiáng)醫(yī)學(xué)圖像分割,但非顯著特征學(xué)習(xí)不到位,分割精度較低。utnetv2是對(duì)utnet的改進(jìn),是一種混合多級(jí)結(jié)構(gòu),采用深度可分卷積作為變壓器塊的投影和前饋網(wǎng)絡(luò),引入局部建模,減少了對(duì)大數(shù)據(jù)的依賴,但模型參數(shù)量依然過(guò)大。相關(guān)學(xué)者將mlp與unet相結(jié)合,提出了unext,在保證分割性能的前提下,顯著減少了參數(shù)的數(shù)量,但分割的視覺(jué)效果一般。同時(shí)輕量級(jí)malunet以較低的參數(shù)成本和計(jì)算復(fù)雜度實(shí)現(xiàn)具有競(jìng)爭(zhēng)力的皮膚病變分割性能,但它在非顯著特征區(qū)域的分割性能不高。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于解決現(xiàn)有技術(shù)中分割模型無(wú)法平衡性能和模型參數(shù)的問(wèn)題,提供一種基于非顯著性特征的口腔黏膜病分割方法及系統(tǒng)。
2、為達(dá)到上述目的,本發(fā)明采用以下技術(shù)方案予以實(shí)現(xiàn):
3、基于非顯著性特征的口腔黏膜病分割方法,包括:
4、對(duì)采集的醫(yī)學(xué)口腔圖像進(jìn)行預(yù)處理;
5、基于低級(jí)特征對(duì)比子模塊、邏輯語(yǔ)義關(guān)系子模塊、編碼器和解碼器,構(gòu)建分割模型;
6、對(duì)預(yù)處理后的圖像進(jìn)行分割,得到訓(xùn)練集和測(cè)試集;
7、將訓(xùn)練集輸入至分割模型中進(jìn)行訓(xùn)練,并基于測(cè)試集對(duì)分割模型進(jìn)行測(cè)試,當(dāng)達(dá)到預(yù)設(shè)的條件時(shí),得到最優(yōu)的分割模型;
8、對(duì)再次采集的醫(yī)學(xué)口腔圖像進(jìn)行預(yù)處理,將預(yù)處理后的圖像輸入至最優(yōu)的分割模型,得到分割圖像。
9、本發(fā)明的進(jìn)一步改進(jìn)在于:
10、進(jìn)一步的,對(duì)采集的醫(yī)學(xué)口腔圖像進(jìn)行預(yù)處理,具體為:對(duì)醫(yī)學(xué)口腔圖像進(jìn)行圖像裁剪、重采樣和數(shù)據(jù)歸一化處理。
11、進(jìn)一步的,低級(jí)特征對(duì)比子模塊通過(guò)不同的感受野和跨空間-通道注意機(jī)制提取低級(jí)特征,并計(jì)算差異以提高低級(jí)特征對(duì)比度,具體為:
12、輸入口腔圖像的低級(jí)特征fin后,將不同的感受野分為局部和上下文分支,對(duì)口腔圖像進(jìn)行特征提??;
13、通過(guò)不同的感受野后,分別按照寬度和高度進(jìn)行劃分,通過(guò)平均池化層進(jìn)行降采樣,連接采樣結(jié)果并通過(guò)一個(gè)1×1的卷積層、批處理歸一化和swish激活函數(shù),得到處理后的特征fmid;
14、將fmid分成fhmid∈c×h×1和fwmid∈c×1×w后分別通過(guò)一個(gè)1×1的卷積層和sigmoid激活函數(shù),并將這兩部分結(jié)果和平均池化前的特征進(jìn)行相乘后輸出;
15、經(jīng)過(guò)局部分支后輸出特征flocal,經(jīng)過(guò)上下文分支后輸出特征fcontext;將flocal和fcontext相減后進(jìn)行實(shí)例歸一化和leaky?relu,得到這一級(jí)的對(duì)比特征fcontrast,最后串聯(lián)輸出低級(jí)對(duì)比特征;
16、其中,局部感受野為3×3的卷積計(jì)算且擴(kuò)展率為1;上下文感受野為3×3的卷積計(jì)算且擴(kuò)展率為4。
17、進(jìn)一步的,邏輯語(yǔ)義關(guān)系子模塊包括4個(gè)分支,每個(gè)分支包含一系列具有不同核大小和數(shù)量的卷積層,代表不同的感受野;將所有分支的信息進(jìn)行整合,獲取全面的語(yǔ)義信息,具體為:
18、第一個(gè)分支先通過(guò)一個(gè)1×1的卷積層,再通過(guò)批處理歸一化;
19、第二個(gè)分支先通過(guò)一個(gè)1×1的卷積層、批處理歸一化和gelu激活函數(shù),再通過(guò)一個(gè)7×7的卷積層、批處理歸一化和gelu激活函數(shù),最后通過(guò)一個(gè)3×3的卷積層和批處理歸一化;
20、第三個(gè)和第四個(gè)分支均先通過(guò)一個(gè)1×1的卷積層、批處理歸一化和gelu激活函數(shù),再分別通過(guò)兩個(gè)7×7的卷積層、批處理歸一化和gelu激活函數(shù),最后通過(guò)一個(gè)3×3的卷積層和批處理歸一化;
21、將上述四個(gè)分支的輸出連接,并使用3×3的卷積層、批處理歸一化,接著與使用1×1的卷積層、批處理歸一化后的輸出進(jìn)行相加,通過(guò)leaky?relu激活函數(shù)進(jìn)行處理,得到最終的輸出特征。
22、進(jìn)一步的,經(jīng)過(guò)邏輯語(yǔ)義關(guān)系子模塊處理的數(shù)據(jù)傳入編碼器中依次進(jìn)行下采樣操作;編碼器為五層,前兩層每層包括兩個(gè)3×3的卷積層和一個(gè)最大池化層;所述第一個(gè)3×3卷積層用于提取特征;第二個(gè)3×3卷積層用于進(jìn)一步提取特征;最大池化層用于下采樣,減少特征的空間維度;后三個(gè)層構(gòu)成特征層次模塊。
23、進(jìn)一步的,特征層次模塊的工作流程為:將輸入特征進(jìn)行組歸一化,并沿著通道維度將輸入特征平均分為4組;
24、前3組分別對(duì)應(yīng)高度-寬度xy軸、通道-高度zx軸和通道-寬度zy軸的特征;隨機(jī)初始化的可學(xué)習(xí)張量pxy、pzx、pzy后,分別通過(guò)雙線性插值、深度可分離卷積;再將不同軸特征和可學(xué)習(xí)張量分3組進(jìn)行hadamard?product運(yùn)算;
25、對(duì)于第4組,只在特征映射上使用深度可分離卷積,即依次通過(guò)一個(gè)1×1的卷積層、gelu激活函數(shù)和一個(gè)3×3的卷積層進(jìn)行卷積;
26、沿著通道維度將上述4組的輸出連接起來(lái),并進(jìn)行組歸一化;再依次通過(guò)一個(gè)3×3的卷積層、gelu激活函數(shù)和一個(gè)1×1的卷積層整合特征信息。
27、進(jìn)一步的,解碼器工作流程為:將下采樣后的數(shù)據(jù)傳入解碼器中依次進(jìn)行上采樣操作;第一層為特征層次模塊,其余每一層都是由兩個(gè)3×3的卷積和一個(gè)雙線性插值構(gòu)成。
28、進(jìn)一步的,得到最優(yōu)的分割模型,具體為:
29、(1)設(shè)定分割模型的初始超參數(shù);
30、(2)將預(yù)處理的訓(xùn)練集輸入到分割模型中,啟動(dòng)模型的初始訓(xùn)練流程;
31、(3)在訓(xùn)練過(guò)程中,監(jiān)控?cái)?shù)據(jù)集的變化,并動(dòng)態(tài)調(diào)整超參數(shù),以優(yōu)化模型的學(xué)習(xí)效率和提高模型對(duì)數(shù)據(jù)的適應(yīng)性;
32、(4)在每次迭代后,檢查模型的損失函數(shù)值,記錄下每次迭代的結(jié)果;
33、(5)當(dāng)訓(xùn)練次數(shù)達(dá)到預(yù)設(shè)的最大迭代次數(shù)時(shí),模型訓(xùn)練過(guò)程將被停止;
34、(6)在訓(xùn)練結(jié)束后,觀察所有迭代過(guò)程中保存的模型,基于測(cè)試集,通過(guò)比較它們的損失函數(shù)值,找到并保存損失函數(shù)值最小的模型作為最優(yōu)分割模型。
35、基于非顯著性特征的口腔黏膜病分割系統(tǒng),包括:
36、預(yù)處理模塊,所述預(yù)處理模塊對(duì)采集的醫(yī)學(xué)口腔圖像進(jìn)行預(yù)處理;
37、構(gòu)建模塊,所述構(gòu)建模塊基于低級(jí)特征對(duì)比子模塊、邏輯語(yǔ)義關(guān)系子模塊、編碼器和解碼器,構(gòu)建分割模型;
38、分割模塊,所述分割模塊對(duì)預(yù)處理后的圖像進(jìn)行分割,得到訓(xùn)練集和測(cè)試集;
39、訓(xùn)練模塊,所述訓(xùn)練模塊將訓(xùn)練集輸入至分割模型中進(jìn)行訓(xùn)練,并基于測(cè)試集對(duì)分割模型進(jìn)行測(cè)試,當(dāng)達(dá)到預(yù)設(shè)的條件時(shí),得到最優(yōu)的分割模型;
40、獲取模塊,所述獲取模塊對(duì)再次采集的醫(yī)學(xué)口腔圖像進(jìn)行預(yù)處理,將預(yù)處理后的圖像輸入至最優(yōu)的分割模型,得到分割圖像。
41、與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
42、本發(fā)明通過(guò)低級(jí)特征對(duì)比子模塊、邏輯語(yǔ)義關(guān)系子模塊、編碼器和解碼器,構(gòu)建分割模型,并對(duì)分割模型進(jìn)行訓(xùn)練,得到最優(yōu)的分割模型,進(jìn)而得到分割圖像。本發(fā)明通過(guò)低級(jí)特征對(duì)比子模塊、邏輯語(yǔ)義關(guān)系子模塊加大口腔病灶與非病灶之間不同級(jí)別的特征差異,提高了對(duì)非顯著特征區(qū)域的分割準(zhǔn)確性。并且通過(guò)編碼器中的特征層次模塊沿著通道維度將輸入特征平均分為若干組,從不同視角提取表示口腔信息,大大減少模型的參數(shù)量,提高了分割模型的性能和模型參數(shù)的平衡性。