1.一種基于unet算法的面向文本線段檢測方法,其特征在于,所述檢測方法的過程是:
2.根據(jù)權(quán)利要求1所述的檢測方法,其特征在于,尺寸歸一化處理后圖像分辨率為1024×1024。
3.根據(jù)權(quán)利要求1所述的檢測方法,其特征在于,所述步驟s4的具體過程是:
4.根據(jù)權(quán)利要求1所述的檢測方法,其特征在于,所述線段檢測網(wǎng)絡(luò)模型為tr-unet網(wǎng)絡(luò),所述tr-unet網(wǎng)絡(luò)包括cnn和transformer結(jié)構(gòu)組成的編碼器、以及解碼器;所述cnn包括依次連接的多層卷積和線性層,多層卷積輸出的隱藏特征hidden?feature經(jīng)過線性層輸入transformer結(jié)構(gòu)中,所述transformer結(jié)構(gòu)包括堆疊的若干層transformer層,transformer結(jié)構(gòu)的輸出通過重塑操作reshape、3*3卷積和relu函數(shù)、上采樣upsample處理后獲得第一特征f1;
5.根據(jù)權(quán)利要求4所述的檢測方法,其特征在于,所述cnn中卷積的數(shù)量為三個(gè),卷積核大小均為3*3;所述transformer結(jié)構(gòu)中transformer層的數(shù)量為12層。
6.根據(jù)權(quán)利要求5所述的檢測方法,其特征在于,所述殘差塊為cnn的第一層卷積后串聯(lián)三個(gè)殘差塊,第二層卷積串聯(lián)兩個(gè)殘差塊,第三層卷積串聯(lián)一個(gè)殘差塊;所述殘差塊包括并聯(lián)的3*3卷積核的第一卷積和1*1卷積核的第二卷積,第一卷積和第二卷積的輸出相加為殘差塊的輸出。
7.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)可實(shí)現(xiàn)權(quán)利要求1-6任一所述檢測方法的步驟。