本申請(qǐng)涉及車廂號(hào)識(shí)別領(lǐng)域,具體而言,涉及一種車廂號(hào)的識(shí)別方法、裝置、電子設(shè)備及介質(zhì)。
背景技術(shù):
1、目前,光學(xué)字符識(shí)別(ocr)已經(jīng)從傳統(tǒng)的多模塊級(jí)聯(lián)轉(zhuǎn)向了端到端建模。后者因?yàn)闇p少了中間環(huán)節(jié),所以能更好地應(yīng)對(duì)環(huán)境變化帶來(lái)的影響。但在處理像火車車廂號(hào)這樣固定長(zhǎng)度,可能存在連續(xù)相同字符的情況時(shí),傳統(tǒng)的aed模型容易出現(xiàn)漏識(shí)問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例的目的在于提供一種車廂號(hào)的識(shí)別方法、裝置、電子設(shè)備及介質(zhì),用以解決了現(xiàn)有技術(shù)存在的上述問(wèn)題,可識(shí)別到準(zhǔn)確的車廂號(hào)。
2、第一方面,提供了一種車廂號(hào)的識(shí)別方法,該方法可以包括:
3、獲取包含待識(shí)別車廂號(hào)的目標(biāo)圖像;
4、對(duì)所述目標(biāo)圖像進(jìn)行處理,得到多個(gè)圖像塊和各圖像塊的圖像數(shù)據(jù)和位置數(shù)據(jù);
5、針對(duì)任一圖像塊,對(duì)所述圖像塊的圖像數(shù)據(jù)和相應(yīng)的位置數(shù)據(jù)進(jìn)行編碼處理,得到所述圖像塊的位置編碼;
6、將各圖像塊中的圖像數(shù)據(jù)和相應(yīng)的位置編碼,輸入至訓(xùn)練好的車廂號(hào)識(shí)別模型中,得到所述目標(biāo)圖像中的目標(biāo)車廂號(hào);所述車廂號(hào)識(shí)別模型包括編碼器和由用于確定字符序列的主路徑與用于確定字符序列中各字符的預(yù)期重復(fù)次數(shù)的輔助路徑組成的解碼器。
7、在一種可能的實(shí)現(xiàn)中,所述位置編碼包括旋轉(zhuǎn)編碼和重復(fù)強(qiáng)度權(quán)重。
8、在一種可能的實(shí)現(xiàn)中,所述重復(fù)強(qiáng)度權(quán)重的確定過(guò)程包括:
9、針對(duì)任一圖像塊,基于該圖像塊的圖像數(shù)據(jù)和相應(yīng)的位置數(shù)據(jù),確定相鄰圖像塊的圖像數(shù)據(jù);
10、將該圖像塊的圖像數(shù)據(jù)和任一相鄰的相鄰圖像塊的圖像數(shù)據(jù)進(jìn)行組合,得到多個(gè)圖像數(shù)據(jù)對(duì);
11、針對(duì)任一圖像數(shù)據(jù)對(duì),對(duì)該圖像數(shù)據(jù)對(duì)中的兩個(gè)圖像數(shù)據(jù)進(jìn)行相似度計(jì)算,得到余弦相似度;
12、采用softmax函數(shù),對(duì)各余弦相似度進(jìn)行處理,得到所述重復(fù)強(qiáng)度權(quán)重。
13、在一種可能的實(shí)現(xiàn)中,將各圖像塊中的圖像數(shù)據(jù)和相應(yīng)的位置編碼,輸入至訓(xùn)練好的車廂號(hào)識(shí)別模型中,得到所述目標(biāo)圖像中的目標(biāo)車廂號(hào),包括:
14、將各圖像塊中的圖像數(shù)據(jù)和對(duì)應(yīng)的位置編碼輸入至所述編碼器中進(jìn)行處理,得到多個(gè)向量序列;
15、將多個(gè)向量序列輸入至所述主路徑中處理,得到字符序列;所述字符序列中包括多個(gè)字符;
16、將多個(gè)向量序列輸入至所述輔助路徑中處理,得到每個(gè)字符的預(yù)期重復(fù)次數(shù);
17、將所述字符序列中的多個(gè)字符與各字符的預(yù)期重復(fù)次數(shù)進(jìn)行融合,得到所述目標(biāo)車廂號(hào)。
18、在一種可能的實(shí)現(xiàn)中,所述編碼器中包括編碼嵌入層和多個(gè)第一處理層;所述第一處理層包括依次連接的第一多頭注意力模塊、第一歸一化模塊、第一逐位前饋網(wǎng)絡(luò)模塊和第二歸一化模塊。
19、在一種可能的實(shí)現(xiàn)中,所述主路徑包括依次連接的解碼嵌入層、多個(gè)第二處理層和全連接層;所述第二處理層包括依次連接的第二多頭注意力模塊、第三歸一化模塊、第二逐位前饋網(wǎng)絡(luò)模塊和第四歸一化模塊。
20、在一種可能的實(shí)現(xiàn)中,所述輔助路徑為5x3的卷積層結(jié)構(gòu)。
21、第二方面,提供了一種車廂號(hào)的識(shí)別裝置,該裝置可以包括:
22、獲取單元,用于獲取包含待識(shí)別車廂號(hào)的目標(biāo)圖像;
23、處理單元,用于對(duì)所述目標(biāo)圖像進(jìn)行處理,得到多個(gè)圖像塊和各圖像塊的圖像數(shù)據(jù)和位置數(shù)據(jù);
24、以及,針對(duì)任一圖像塊,對(duì)所述圖像塊的圖像數(shù)據(jù)和相應(yīng)的位置數(shù)據(jù)進(jìn)行編碼處理,得到所述圖像塊的位置編碼;
25、以及,將各圖像塊中的圖像數(shù)據(jù)和相應(yīng)的位置編碼,輸入至訓(xùn)練好的車廂號(hào)識(shí)別模型中,得到所述目標(biāo)圖像中的目標(biāo)車廂號(hào);所述車廂號(hào)識(shí)別模型包括編碼器和由用于確定字符序列的主路徑與用于確定字符序列中各字符的預(yù)期重復(fù)次數(shù)的輔助路徑組成的解碼器。
26、第三方面,提供了一種電子設(shè)備,該電子設(shè)備包括處理器、通信接口、存儲(chǔ)器和通信總線,其中,處理器,通信接口,存儲(chǔ)器通過(guò)通信總線完成相互間的通信;
27、存儲(chǔ)器,用于存放計(jì)算機(jī)程序;
28、處理器,用于執(zhí)行存儲(chǔ)器上所存放的程序時(shí),實(shí)現(xiàn)上述第一方面中任一所述的方法步驟。
29、第四方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)內(nèi)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面中任一所述的方法步驟。
30、本申請(qǐng)?zhí)峁┮环N車廂號(hào)的識(shí)別方法,包括:獲取包含待識(shí)別車廂號(hào)的目標(biāo)圖像;對(duì)目標(biāo)圖像進(jìn)行處理,得到多個(gè)圖像塊和各圖像塊的圖像數(shù)據(jù)和位置數(shù)據(jù);針對(duì)任一圖像塊,對(duì)圖像塊的圖像數(shù)據(jù)和相應(yīng)的位置數(shù)據(jù)進(jìn)行編碼處理,得到圖像塊的位置編碼;將各圖像塊中的圖像數(shù)據(jù)和相應(yīng)的位置編碼,輸入至訓(xùn)練好的車廂號(hào)識(shí)別模型中,得到目標(biāo)圖像中的目標(biāo)車廂號(hào);本申請(qǐng)能夠基于車廂號(hào)識(shí)別模型準(zhǔn)確地識(shí)別車廂號(hào),不需要額外的人工檢查,節(jié)省了大量時(shí)間和人力資源。精確的車廂號(hào)識(shí)別有助于防止因信息錯(cuò)誤而導(dǎo)致的安全隱患,為鐵路運(yùn)輸行業(yè)的智能化升級(jí)提供了強(qiáng)有力的支持。
1.一種車廂號(hào)的識(shí)別方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的方法,其特征在于,所述位置編碼包括旋轉(zhuǎn)編碼和重復(fù)強(qiáng)度權(quán)重。
3.如權(quán)利要求2所述的方法,其特征在于,所述重復(fù)強(qiáng)度權(quán)重的確定過(guò)程包括:
4.如權(quán)利要求1所述的方法,其特征在于,將各圖像塊中的圖像數(shù)據(jù)和相應(yīng)的位置編碼,輸入至訓(xùn)練好的車廂號(hào)識(shí)別模型中,得到所述目標(biāo)圖像中的目標(biāo)車廂號(hào),包括:
5.如權(quán)利要求1所述的方法,其特征在于,所述編碼器中包括編碼嵌入層和多個(gè)第一處理層;所述第一處理層包括依次連接的第一多頭注意力模塊、第一歸一化模塊、第一逐位前饋網(wǎng)絡(luò)模塊和第二歸一化模塊。
6.如權(quán)利要求1所述的方法,其特征在于,所述主路徑包括依次連接的解碼嵌入層、多個(gè)第二處理層和全連接層;所述第二處理層包括依次連接的第二多頭注意力模塊、第三歸一化模塊、第二逐位前饋網(wǎng)絡(luò)模塊和第四歸一化模塊。
7.如權(quán)利要求1所述的方法,其特征在于,所述輔助路徑為5x3的卷積層結(jié)構(gòu)。
8.一種車廂號(hào)的識(shí)別裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括處理器、通信接口、存儲(chǔ)器和通信總線,其中,處理器,通信接口,存儲(chǔ)器通過(guò)通信總線完成相互間的通信;
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)內(nèi)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7任一所述的方法步驟。