最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種基于深度學(xué)習(xí)的人工智能模型構(gòu)建方法及裝置

文檔序號(hào):41955321發(fā)布日期:2025-05-16 14:21閱讀:8來(lái)源:國(guó)知局
一種基于深度學(xué)習(xí)的人工智能模型構(gòu)建方法及裝置

本發(fā)明屬于深度學(xué)習(xí),特別是涉及一種基于深度學(xué)習(xí)的人工智能模型構(gòu)建方法及裝置。


背景技術(shù):

1、隨著現(xiàn)代的人工智能和計(jì)算機(jī)視覺技術(shù)的發(fā)展,出現(xiàn)了文字識(shí)別技術(shù),該技術(shù)廣泛應(yīng)用預(yù)掃描文檔數(shù)字化,車牌識(shí)別等。

2、目前常用的文字識(shí)別技術(shù)主要依賴傳統(tǒng)的圖像處理算法和機(jī)器學(xué)習(xí)模型,這些方法大多采用滑動(dòng)窗口,基于特征的圖像處理以及支持向量機(jī)等傳統(tǒng)方法,通過手工提取特征進(jìn)行分類來(lái)識(shí)別圖像中的文本。

3、傳統(tǒng)文字識(shí)別方法在面對(duì)復(fù)雜的文字背景或不同風(fēng)格的手寫體時(shí),由于依賴簡(jiǎn)單的特征提取算法,容易受噪聲、背景干擾以及字體多樣性的影響,導(dǎo)致識(shí)別準(zhǔn)確率下降,難以準(zhǔn)確提取文字信息。此外,人工提取的特征難以應(yīng)對(duì)多樣化的文本形式。傳統(tǒng)的文字識(shí)別方法在處理字符時(shí),常依賴單獨(dú)字符的分類而忽略了上下文的關(guān)系,且需要大量標(biāo)注數(shù)據(jù)才能訓(xùn)練出高精度模型。


技術(shù)實(shí)現(xiàn)思路

1、基于此,有必要針對(duì)上述技術(shù)問題,提供一種能夠在數(shù)據(jù)稀缺情況下生成高準(zhǔn)確率和效率模型的基于深度學(xué)習(xí)的人工智能模型構(gòu)建方法及裝置。

2、第一方面,本申請(qǐng)?zhí)峁┝艘环N基于深度學(xué)習(xí)的人工智能模型構(gòu)建方法,包括:

3、獲取數(shù)據(jù)集,并對(duì)數(shù)據(jù)集進(jìn)行坐標(biāo)標(biāo)記,得到訓(xùn)練樣本;數(shù)據(jù)集包括圖像文件;

4、加載預(yù)訓(xùn)練模型的特征架構(gòu),在特征架構(gòu)的基礎(chǔ)上增加擴(kuò)展架構(gòu);特征架構(gòu)為預(yù)訓(xùn)練模型已取得目標(biāo)特征關(guān)系的模塊;目標(biāo)特征關(guān)系指示目標(biāo)模型輸出預(yù)期結(jié)果;擴(kuò)展架構(gòu)指示目標(biāo)模型學(xué)習(xí)有效特征后產(chǎn)生符合預(yù)期的輸出;

5、凍結(jié)特征架構(gòu),并調(diào)整擴(kuò)展架構(gòu)的權(quán)重到設(shè)定值;設(shè)定當(dāng)學(xué)習(xí)率增長(zhǎng)到設(shè)定值時(shí),解凍特征架構(gòu);學(xué)習(xí)率基于不損壞目標(biāo)特征關(guān)系的最大學(xué)習(xí)速率得出;

6、利用訓(xùn)練樣本根據(jù)學(xué)習(xí)率訓(xùn)練預(yù)訓(xùn)練模型,得到目標(biāo)模型。

7、在其中一個(gè)實(shí)施例中,對(duì)數(shù)據(jù)集進(jìn)行坐標(biāo)標(biāo)記,得到訓(xùn)練樣本,包括:

8、在數(shù)據(jù)集覆蓋若干初始錨框;初始錨框是不同尺度和寬高比的候選區(qū)域;

9、判斷初始錨框是否包含目標(biāo)對(duì)象,得到包含目標(biāo)對(duì)象的初始錨框的錨框數(shù)據(jù);錨框數(shù)據(jù)包括錨框位置和錨框大小;

10、對(duì)錨框數(shù)據(jù)進(jìn)行特征提取和分類,得到應(yīng)用錨框;

11、利用應(yīng)用錨框輸出訓(xùn)練樣本。

12、在其中一個(gè)實(shí)施例中,對(duì)數(shù)據(jù)集進(jìn)行坐標(biāo)標(biāo)記,得到訓(xùn)練樣本,包括:

13、對(duì)數(shù)據(jù)集進(jìn)行裁剪,得到裁剪區(qū)域;

14、對(duì)裁剪區(qū)域進(jìn)行分類,并判斷是否為目標(biāo)區(qū)域,得到目標(biāo)區(qū)域圖像和非目標(biāo)區(qū)域圖像;

15、目標(biāo)區(qū)域圖像和非目標(biāo)區(qū)域圖像構(gòu)成訓(xùn)練樣本。

16、在其中一個(gè)實(shí)施例中,利用訓(xùn)練樣本根據(jù)學(xué)習(xí)率訓(xùn)練預(yù)訓(xùn)練模型,得到目標(biāo)模型,包括:

17、利用卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)訓(xùn)練樣本的關(guān)鍵點(diǎn)坐標(biāo);

18、對(duì)關(guān)鍵點(diǎn)坐標(biāo)進(jìn)行變換,生成標(biāo)準(zhǔn)輸入圖像;

19、將標(biāo)準(zhǔn)輸入圖像進(jìn)行特征提取,得到特征數(shù)據(jù);

20、將特征數(shù)據(jù)轉(zhuǎn)化為特征序列進(jìn)行序列建模;

21、輸出標(biāo)準(zhǔn)輸入圖像的預(yù)測(cè)結(jié)果,并確定目標(biāo)模型。

22、在其中一個(gè)實(shí)施例中,目標(biāo)模型為attention?htr模型;

23、attention?htr模型包括順次連接的薄板樣條、32層殘差神經(jīng)網(wǎng)絡(luò)、雙向長(zhǎng)短期記憶網(wǎng)絡(luò)和基于注意力機(jī)制的解碼器;

24、薄板樣條的定位網(wǎng)絡(luò)用于生成標(biāo)準(zhǔn)輸入圖像;

25、32層殘差神經(jīng)網(wǎng)絡(luò)用于特征提?。?/p>

26、雙向長(zhǎng)短期記憶網(wǎng)絡(luò)用于生成特征序列;

27、基于注意力機(jī)制的解碼器用于輸出預(yù)測(cè)結(jié)果。

28、在其中一個(gè)實(shí)施例中,基于注意力機(jī)制的解碼器通過以下方法輸出預(yù)測(cè)結(jié)果:

29、利用單向長(zhǎng)短期記憶網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),輸出若干初步預(yù)測(cè)結(jié)果;

30、利用以下公式,計(jì)算單個(gè)初步預(yù)測(cè)結(jié)果的概率:

31、

32、z=[z1,z2,…,zn]

33、其中,z表示是初步預(yù)測(cè)結(jié)果,zi表示第i個(gè)初步預(yù)測(cè)結(jié)果;表示指數(shù)運(yùn)算,將每一個(gè)初步預(yù)測(cè)結(jié)果進(jìn)行指數(shù)變換;表示指數(shù)變化后的結(jié)果的總和,用來(lái)進(jìn)行歸一化;

34、選擇概率最高的初步預(yù)測(cè)結(jié)果為預(yù)測(cè)結(jié)果。

35、在其中一個(gè)實(shí)施例中,在利用卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)訓(xùn)練樣本的關(guān)鍵點(diǎn)坐標(biāo)之前,還包括:

36、使用過濾器增強(qiáng)訓(xùn)練樣本的圖像邊緣;

37、對(duì)圖像進(jìn)行水平投影,得到水平投影曲線;

38、根據(jù)水平投影曲線確定文本位置;

39、按照設(shè)定閾值,將圖像根據(jù)文本位置裁剪為單獨(dú)的行,得到行圖像;設(shè)定閾值根據(jù)水平投影曲線的最高值和最低值的中間值得到;

40、將行圖像進(jìn)行垂直投影,得到垂直投影曲線,得到空格數(shù)據(jù);

41、計(jì)算空格數(shù)據(jù)的平均值;

42、在空格數(shù)據(jù)大于平均值位置,分割出字圖像。

43、在其中一個(gè)實(shí)施例中,在對(duì)數(shù)據(jù)集進(jìn)行坐標(biāo)標(biāo)記,得到訓(xùn)練樣本之前,包括:

44、對(duì)圖像文件的大小、顏色進(jìn)行圖像歸一化的標(biāo)準(zhǔn)化處理;

45、對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng);數(shù)據(jù)增強(qiáng)包括水平翻轉(zhuǎn)、增強(qiáng)噪聲和亮度調(diào)節(jié)。

46、在其中一個(gè)實(shí)施例中,還包括:

47、獲取測(cè)試集,并將測(cè)試集輸入目標(biāo)模型,評(píng)估模型性能;

48、根據(jù)模型性能進(jìn)行優(yōu)化處理,優(yōu)化處理包括學(xué)習(xí)率和目標(biāo)模型參數(shù)調(diào)整。

49、第二方面,本申請(qǐng)還提供了一種基于深度學(xué)習(xí)的人工智能模型構(gòu)建裝置,包括:

50、數(shù)據(jù)處理模塊,用于獲取數(shù)據(jù)集,并對(duì)數(shù)據(jù)集進(jìn)行坐標(biāo)標(biāo)記,得到訓(xùn)練樣本;

51、模型加載模塊,用于加載預(yù)訓(xùn)練模型的特征架構(gòu),在特征架構(gòu)的基礎(chǔ)上增加擴(kuò)展架構(gòu);

52、訓(xùn)練設(shè)置模塊,用于凍結(jié)特征架構(gòu),并調(diào)整擴(kuò)展架構(gòu)的權(quán)重到設(shè)定值;設(shè)定當(dāng)學(xué)習(xí)率增長(zhǎng)到設(shè)定值時(shí),解凍特征架構(gòu);

53、模型建立模塊,用于利用訓(xùn)練樣本根據(jù)學(xué)習(xí)率訓(xùn)練預(yù)訓(xùn)練模型,得到目標(biāo)模型。

54、上述基于深度學(xué)習(xí)的人工智能模型構(gòu)建方法及裝置,通過加載預(yù)訓(xùn)練模型中特征架構(gòu),并在其基礎(chǔ)上增加擴(kuò)展架構(gòu),利用了預(yù)訓(xùn)練模型中符合目標(biāo)模型的通用特征并通過擴(kuò)展架構(gòu)學(xué)習(xí)任務(wù)相關(guān)的特征,使得模型能夠迅速?gòu)囊阎奶卣麝P(guān)系轉(zhuǎn)移到特定任務(wù)的特征學(xué)習(xí)中,避免了從零開始訓(xùn)練模型的高昂計(jì)算成本和時(shí)間,提高特定任務(wù)的模型準(zhǔn)確度和效率,也適用于缺乏大量數(shù)據(jù)的模型訓(xùn)練情況,設(shè)定訓(xùn)練是凍結(jié)特征架構(gòu),只更新擴(kuò)展架構(gòu)參數(shù),待學(xué)習(xí)率達(dá)到設(shè)定值后再階段特征架構(gòu),防止模型初期訓(xùn)練時(shí)大幅調(diào)整預(yù)訓(xùn)練模型中學(xué)到的有效特征,同時(shí)確保后期逐步解凍特征架構(gòu)后,模型能夠在不破壞原有特征的基礎(chǔ)上進(jìn)一步優(yōu)化,避免了模型建立過程中過擬合和模型性能下降的風(fēng)險(xiǎn)。



技術(shù)特征:

1.一種基于深度學(xué)習(xí)的人工智能模型構(gòu)建方法,其特征在于,所述方法包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述數(shù)據(jù)集進(jìn)行坐標(biāo)標(biāo)記,得到訓(xùn)練樣本,包括:

3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述數(shù)據(jù)集進(jìn)行坐標(biāo)標(biāo)記,得到訓(xùn)練樣本,包括:

4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用所述訓(xùn)練樣本根據(jù)所述學(xué)習(xí)率訓(xùn)練所述預(yù)訓(xùn)練模型,得到目標(biāo)模型,包括:

5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述目標(biāo)模型為attention?htr模型;

6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于注意力機(jī)制的解碼器通過以下方法輸出預(yù)測(cè)結(jié)果:

7.根據(jù)權(quán)利要求4所述的方法,其特征在于,在所述利用卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)所述訓(xùn)練樣本的關(guān)鍵點(diǎn)坐標(biāo)之前,還包括:

8.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述對(duì)所述數(shù)據(jù)集進(jìn)行坐標(biāo)標(biāo)記,得到訓(xùn)練樣本之前,包括:

9.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:

10.一種基于深度學(xué)習(xí)的人工智能模型構(gòu)建裝置,其特征在于,所述裝置包括:


技術(shù)總結(jié)
本申請(qǐng)涉及一種基于深度學(xué)習(xí)的人工智能模型構(gòu)建方法及裝置,方法包括:獲取數(shù)據(jù)集,并對(duì)數(shù)據(jù)集進(jìn)行坐標(biāo)標(biāo)記,得到訓(xùn)練樣本;加載預(yù)訓(xùn)練模型的特征架構(gòu),在特征架構(gòu)的基礎(chǔ)上增加擴(kuò)展架構(gòu);凍結(jié)特征架構(gòu),并調(diào)整擴(kuò)展架構(gòu)的權(quán)重到設(shè)定值;利用訓(xùn)練樣本根據(jù)學(xué)習(xí)率訓(xùn)練預(yù)訓(xùn)練模型,得到目標(biāo)模型。采用本方法能夠避免了從零開始訓(xùn)練模型的高昂計(jì)算成本和時(shí)間,提高特定任務(wù)的模型準(zhǔn)確度和效率,也適用于缺乏大量數(shù)據(jù)的模型訓(xùn)練情況,模型能夠在不破壞原有特征的基礎(chǔ)上進(jìn)一步優(yōu)化,避免了模型建立過程中過擬合和模型性能下降的風(fēng)險(xiǎn)。

技術(shù)研發(fā)人員:葛偉杰,康仲峰,龔子杰
受保護(hù)的技術(shù)使用者:蘭州大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/15
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1