本技術(shù)涉及人工智能(artificial?intelligence,ai),尤其涉及一種分類模型的訓(xùn)練方法及裝置。
背景技術(shù):
1、半監(jiān)督學(xué)習(xí)(semi-supervised?learning,ssl)已成為一種很有前途的機器學(xué)習(xí)范式,在自然語言處理和計算機視覺等領(lǐng)域有廣泛應(yīng)用。它能利用少量的有標(biāo)簽數(shù)據(jù)和大量的無標(biāo)簽數(shù)據(jù)來訓(xùn)練模型,從而降低數(shù)據(jù)標(biāo)注的成本和時間,提高模型在小樣本或稀缺類別上的表現(xiàn),增強模型對噪聲或異常數(shù)據(jù)魯棒性。
2、然而,現(xiàn)有大多數(shù)ssl方法都是為具有平衡類分布的數(shù)據(jù)設(shè)計的,而在現(xiàn)實場景,數(shù)據(jù)通常在類上表現(xiàn)出不平衡的分布。類不平衡問題會嚴重損害ssl方法的性能,因為它們往往會忽略少數(shù)類別的數(shù)據(jù),錯誤分類少數(shù)類別,或為無標(biāo)簽的數(shù)據(jù)產(chǎn)生有偏見的偽標(biāo)簽。盡管近些年,部分解決類不平衡半監(jiān)督學(xué)習(xí)(class-imbalanced?semi-supervisedlearning,cissl)問題的方法陸續(xù)提出,但現(xiàn)有的ssl方案存在著在類不平衡的數(shù)據(jù)集上訓(xùn)練時,生成的偽標(biāo)簽質(zhì)量較低,進而導(dǎo)致訓(xùn)練出的分類模型的預(yù)測分類精度較差的問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)的實施例提供一種分類模型的訓(xùn)練方法,有效解決了在訓(xùn)練數(shù)據(jù)分布不均衡的情況下,訓(xùn)練出的分類模型預(yù)測分類精度較差的問題。
2、第一方面,本技術(shù)提供了一種分類模型的訓(xùn)練方法,待訓(xùn)練分類模型包括特征提取網(wǎng)絡(luò)和分類器,該方法包括獲取目標(biāo)訓(xùn)練數(shù)據(jù)集,目標(biāo)訓(xùn)練數(shù)據(jù)集包括有標(biāo)簽樣本子集和無標(biāo)簽樣本子集,有標(biāo)簽樣本子集包括多個被標(biāo)注的樣本,無標(biāo)簽樣本子集包括多個未被標(biāo)注的樣本,目標(biāo)訓(xùn)練數(shù)據(jù)集包括k個類別的樣本,k為大于1的正整數(shù);將未被標(biāo)注的樣本分別輸入k個正樣本無標(biāo)簽(positive-unlabeled,pu)分類模型,得到k個pu分類模型的輸出結(jié)果,k個pu分類模型中的各個pu分類模型分別用于對k個類別中各個類別的樣本進行類別估計;基于k個pu分類模型的輸出結(jié)果,得到未被標(biāo)注的樣本的偽標(biāo)簽;基于有標(biāo)簽樣本子集和偽標(biāo)簽樣本子集對待訓(xùn)練分類模型進行訓(xùn)練,更新特征提取網(wǎng)絡(luò)的參數(shù)和分類器的參數(shù),偽標(biāo)簽樣本子集包括多個具有偽標(biāo)簽的樣本。
3、當(dāng)樣本輸入至待訓(xùn)練分類模型后,通過特征提取網(wǎng)絡(luò)對該輸入樣本進行特征提取得到該樣本的特征表示,然后將該特征表示輸入至分類器,分類器基于該特征表示輸出該輸入樣本的估計類別概率分布,例如概率1、概率2…概率n,表示輸入樣本為a類別的概率為概率1、為b類別的概率為概率2…為n類別的概率為概率n,通過概率分布即可確定輸入樣本的估計類別,例如輸出的概率分布中最大的為a類別的概率為0.9,則確定輸入樣本的類別為a類別。
4、本技術(shù)提供的分類模型的訓(xùn)練方法,通過k個pu分類模型為未標(biāo)注的樣本生成偽標(biāo)簽,有效緩解偽標(biāo)簽有偏的問題,從而提高偽標(biāo)簽的標(biāo)注質(zhì)量,有利于分類模型的半監(jiān)督訓(xùn)練。
5、在一個可能的實現(xiàn)中,將未被標(biāo)注的樣本分別輸入k個pu分類模型,得到k個pu分類模型的輸出結(jié)果之前還包括基于目標(biāo)訓(xùn)練數(shù)據(jù)集對分類模型進行訓(xùn)練,更新特征提取網(wǎng)絡(luò)的參數(shù)。也就是說,首先進行半監(jiān)督訓(xùn)練,利用有標(biāo)簽數(shù)據(jù)子集和無標(biāo)簽數(shù)據(jù)子集對分類模型進行訓(xùn)練,使得特征提取網(wǎng)絡(luò)學(xué)習(xí)到高質(zhì)量的樣本特征表示。
6、在該可能的實現(xiàn)中,k個pu分類模型中的每個pu分類模型包括更新后的特征提取網(wǎng)絡(luò)和pu分類器;將未被標(biāo)注的樣本分別輸入k個pu分類模型,得到k個pu分類模型的輸出結(jié)果之前還包括基于目標(biāo)訓(xùn)練數(shù)據(jù)集對k個pu分類模型中的各個pu分類模型進行訓(xùn)練,更新各個pu分類模型的pu分類器。
7、換言之,k個pu分類模型是與半監(jiān)督訓(xùn)練的分類模型采用同一批訓(xùn)練數(shù)據(jù)集進行訓(xùn)練的,pu分類模型包括分類模型在目標(biāo)訓(xùn)練數(shù)據(jù)集進行初始訓(xùn)練更新后的特征提取網(wǎng)絡(luò)和pu分類器,且pu分類模型在訓(xùn)練過程中特征提取網(wǎng)絡(luò)的參數(shù)保持不變,僅更新pu分類器,因此針對pu分類模型的訓(xùn)練也可以稱之為針對pu分類器的訓(xùn)練;如此能夠確保pu分類器適應(yīng)特征提取網(wǎng)絡(luò)學(xué)習(xí)到的最新表示,從而利用該表示為未標(biāo)注的樣本生成更高質(zhì)量的偽標(biāo)簽。
8、在另一個可能的實現(xiàn)中,針對k個pu分類模型中的任意一個pu分類模型的訓(xùn)練方法如下所示:從目標(biāo)訓(xùn)練數(shù)據(jù)集中確定當(dāng)前訓(xùn)練的pu分類模型對應(yīng)的pu訓(xùn)練數(shù)據(jù)集,其中,pu訓(xùn)練數(shù)據(jù)集包括正樣本子集和無標(biāo)簽樣本子集,正樣本子集包括多個正樣本,正樣本為有標(biāo)簽樣本子集中的目標(biāo)類別的樣本,目標(biāo)類別為當(dāng)前訓(xùn)練的pu分類模型對應(yīng)的類別;基于pu訓(xùn)練數(shù)據(jù)集對pu分類模型進行訓(xùn)練,更新pu分類器的參數(shù)。通過逐類別的訓(xùn)練pu分類器,能夠保證pu分類器的學(xué)習(xí)不受原始數(shù)據(jù)分布的影響,從而保證訓(xùn)練得到的pu分類器是公平的(即不存在針對某個類別的樣本的偏見),進一步保證pu分類器生成標(biāo)簽的可靠性。
9、在另一個可能的實現(xiàn)中,基于pu訓(xùn)練數(shù)據(jù)集對pu分類模型進行訓(xùn)練,更新pu分類器的參數(shù)的一種具體實現(xiàn)為,將pu訓(xùn)練數(shù)據(jù)集中的樣本輸入pu分類模型,得到pu分類模型對pu訓(xùn)練數(shù)據(jù)集中各個樣本的類別估計;基于pu損失函數(shù),更新pu分類器的參數(shù),pu損失函數(shù)包括正風(fēng)險估計項和負風(fēng)險估計項,正風(fēng)險估計項用于懲罰pu分類器將正樣本估計為負樣本,負風(fēng)險估計項用于懲罰pu分類器將無標(biāo)簽樣本子集中的樣本估計為正樣本。
10、可選的,pu損失函數(shù)還與目標(biāo)類別的樣本在有標(biāo)簽樣本子集中的占比相關(guān)。示例性的,訓(xùn)練第k類pu分類器,pu損失函數(shù)如下所示:
11、
12、其中,πk是由有標(biāo)簽樣本子集中的第k類分布先驗確定,表示有標(biāo)簽樣本子集第k類樣本的數(shù)目,nu表示無標(biāo)簽樣本子集中樣本的總數(shù)量,l(.,.)函數(shù)時任意的代理0-1損失函數(shù),例如sigmoid損失函數(shù):
13、pu損失函數(shù)中第一個項(即加號之前的項)表示正風(fēng)險估計,用來懲罰pu分類器為正樣本分配一個低概率,第二項(即加號之后的項)用來表示非負風(fēng)險估計,用來懲罰pu分類器為無標(biāo)簽樣本分配一個高概率,同時max函數(shù)保證了對于無標(biāo)簽樣本的經(jīng)驗風(fēng)險估計大于等于0,從而降低了模型過擬合的風(fēng)險。
14、在另一個可能的實現(xiàn)中,將未被標(biāo)注的樣本分別輸入k個pu分類模型,得到k個pu分類模型的輸出結(jié)果之前還包括對無標(biāo)簽樣本子集做第一數(shù)據(jù)增強處理,增加無標(biāo)簽樣本子集中的樣本數(shù)量,有利于后續(xù)對分類模型的訓(xùn)練。
15、當(dāng)樣本為圖片時,第一數(shù)據(jù)增強處理可以為翻轉(zhuǎn)、平移、旋轉(zhuǎn)和裁剪中的一項或多項圖像數(shù)據(jù)樣本增強處理。
16、在另一個可能的實現(xiàn)中,每個pu分類模型的輸出結(jié)果包括估計概率,估計概率指示每個pu分類模型估計輸入樣本為正樣本的概率;基于k個pu分類模型的輸出結(jié)果,得到未被標(biāo)注的樣本的偽標(biāo)簽包括基于k個pu分類模型的輸出結(jié)果,確定目標(biāo)pu分類模型,目標(biāo)pu分類模型輸出的估計概率最大;將目標(biāo)pu分類模型對應(yīng)的類別,標(biāo)注為未被標(biāo)注的樣本的偽標(biāo)簽。通過為目標(biāo)訓(xùn)練數(shù)據(jù)集中的每類樣本設(shè)置專門的pu分類模型,有效緩解了對多數(shù)類的偏見,增加生成偽標(biāo)簽的質(zhì)量。
17、在另一個可能的實現(xiàn)中,基于有標(biāo)簽樣本子集和偽標(biāo)簽樣本子集對分類模型進行訓(xùn)練,更新特征提取網(wǎng)絡(luò)的參數(shù)和分類器的參數(shù)的一種具體實現(xiàn)為:將被標(biāo)注的樣本輸入分類模型,輸出被標(biāo)注的樣本對應(yīng)的類別估計;基于被標(biāo)注的樣本的標(biāo)簽和被標(biāo)注的樣本的類別估計,得到第一損失函數(shù)的損失值;將具有偽標(biāo)簽的樣本輸入分類模型,輸出具有偽標(biāo)簽的樣本對應(yīng)的類別估計;基于具有偽標(biāo)簽的樣本的偽標(biāo)簽和具有偽標(biāo)簽的樣本的類別估計,得到第二損失函數(shù)的損失值;基于第一損失函數(shù)的損失值和第二損失函數(shù)的損失值,更新特征提取網(wǎng)絡(luò)的參數(shù)和分類器的參數(shù)。
18、示例性的,分類模型的損失函數(shù)如下所示:
19、
20、其中,l是標(biāo)準交叉熵損失函數(shù),α(.)是數(shù)據(jù)增強函數(shù),h(.)是原始分類器。是特征提取網(wǎng)絡(luò),用來提取特征。表示有標(biāo)簽的樣本,表示樣本對應(yīng)的真實標(biāo)簽。表示無標(biāo)簽的樣本,表示樣本通過pu分類器生成的偽標(biāo)簽。
21、可選的,在基于有標(biāo)簽樣本子集和偽標(biāo)簽樣本子集對分類模型進行訓(xùn)練,更新特征提取網(wǎng)絡(luò)的參數(shù)和所述分類器的參數(shù)之前還包括對偽標(biāo)簽樣本子集做第二數(shù)據(jù)增強處理。例如當(dāng)樣本為圖片時,第二數(shù)據(jù)增強處理可以為翻轉(zhuǎn)、平移、旋轉(zhuǎn)和裁剪中的一項或多項圖像數(shù)據(jù)樣本增強處理。
22、在另一個可能的實現(xiàn)中,本技術(shù)提供的分類模型的訓(xùn)練方法還包括待訓(xùn)練分類模型經(jīng)過多個訓(xùn)練周期的訓(xùn)練,得到訓(xùn)練完成的目標(biāo)分類模型,其中,在每個在當(dāng)前訓(xùn)練周期完成之后,從偽標(biāo)簽樣本子集中確定可靠偽標(biāo)簽的樣本,得到可靠偽標(biāo)簽樣本子集,可靠偽標(biāo)簽的樣本對應(yīng)的pu分類模型的輸出結(jié)果大于或等于預(yù)設(shè)閾值;基于可靠偽標(biāo)簽樣本子集,對有標(biāo)簽樣本子集進行數(shù)據(jù)擴充,增加有標(biāo)簽樣本子集的樣本數(shù)量,進而提升分類模型的訓(xùn)練質(zhì)量。
23、在該可能的實現(xiàn)中,為了確保生成偽標(biāo)簽的可靠性,只選擇pu分類器的輸出結(jié)果大于或等于閾值τ的樣本,構(gòu)成每個類別k的偽標(biāo)簽列表,進而得到可靠偽標(biāo)簽樣本集,通過可靠偽標(biāo)簽樣本子集,對有標(biāo)簽樣本子集進行數(shù)據(jù)擴充,增加有標(biāo)簽樣本子集的樣本數(shù)量,進而提升分類模型的訓(xùn)練質(zhì)量。
24、在另一個可能的實現(xiàn)中,基于可靠偽標(biāo)簽樣本子集,對有標(biāo)簽樣本子集進行數(shù)據(jù)擴充的一種具體實現(xiàn)為:確定有標(biāo)簽樣本子集中第一類別樣本的數(shù)量,第一類別樣本的數(shù)量最多;基于有標(biāo)簽樣本子集中各個類別樣本的數(shù)量和第一類別樣本的數(shù)量的差值,確定各個類別樣本的采樣數(shù)量;基于各個類別樣本的采樣數(shù)量,對可靠偽標(biāo)簽樣本子集中各個類別樣本進行樣本采樣,得到擴充數(shù)據(jù)集;將擴充數(shù)據(jù)集補充至有標(biāo)簽樣本子集中,得到數(shù)據(jù)擴充后的有標(biāo)簽數(shù)據(jù)子集。
25、在該可能的實現(xiàn)中,無需使用復(fù)雜的類重新平衡規(guī)則,只需簡單的針對每個類別k,只需要從該類別的偽標(biāo)簽列表中采用tk個置信樣本,其中,其中,表示有標(biāo)簽數(shù)據(jù)子集中第k類樣本的數(shù)量,表示有標(biāo)簽樣本子集中數(shù)量最多的類別的樣本數(shù)量,ρ屬于(0,1)是采樣比,其用來控制類平衡和偽標(biāo)簽質(zhì)量的權(quán)衡,如此解決訓(xùn)練數(shù)據(jù)集的類不平衡問題,提升分類模型的訓(xùn)練質(zhì)量。
26、在另一個可能的實現(xiàn)中,分類模型對應(yīng)的全量訓(xùn)練數(shù)據(jù)集包括有標(biāo)簽樣本集和無標(biāo)簽樣本集,有標(biāo)簽樣本集包括多個被標(biāo)注的樣本,無標(biāo)簽樣本集包括多個未被標(biāo)注的樣本;獲取當(dāng)前訓(xùn)練周期的目標(biāo)訓(xùn)練數(shù)據(jù)集的一種具體實現(xiàn)為:利用隨機采樣器分別從有標(biāo)簽樣本集中和無標(biāo)簽樣本集中進行樣本采集,得到當(dāng)前批次的有標(biāo)簽樣本子集和無標(biāo)簽樣本子集。
27、在一些其他示例中,目標(biāo)訓(xùn)練數(shù)據(jù)集也可以直接為全量訓(xùn)練數(shù)據(jù)集,即不采用分批訓(xùn)練的方式進行訓(xùn)練,直接在全量數(shù)據(jù)集上對待訓(xùn)練分類模型進行訓(xùn)練,得到訓(xùn)練完成的目標(biāo)分類模型。
28、第二方面,本技術(shù)提供了一種分類模型的訓(xùn)練裝置,該分類模型包括特征提取網(wǎng)絡(luò)和分類器,該裝置包括獲取模塊、pu分類模塊、偽標(biāo)簽標(biāo)注模塊和訓(xùn)練模塊,其中,獲取模塊用于獲取目標(biāo)訓(xùn)練數(shù)據(jù)集,目標(biāo)訓(xùn)練數(shù)據(jù)集包括有標(biāo)簽樣本子集和無標(biāo)簽樣本子集,有標(biāo)簽樣本子集包括多個被標(biāo)注的樣本,無標(biāo)簽樣本子集包括多個未被標(biāo)注的樣本,目標(biāo)訓(xùn)練數(shù)據(jù)集包括k個類別的樣本,k為大于1的正整數(shù);pu分類模塊用于將未被標(biāo)注的樣本分別輸入k個pu分類模型,得到k個pu分類模型的輸出結(jié)果,k個pu分類模型中的各個pu分類模型分別用于對k個類別中各個類別的樣本進行類別估計;偽標(biāo)簽標(biāo)注模塊用于基于k個pu分類模型的輸出結(jié)果,得到未被標(biāo)注的樣本的偽標(biāo)簽;訓(xùn)練模塊用于基于有標(biāo)簽樣本子集和偽標(biāo)簽樣本子集對分類模型進行訓(xùn)練,更新特征提取網(wǎng)絡(luò)的參數(shù)和分類器的參數(shù),偽標(biāo)簽樣本子集包括多個具有偽標(biāo)簽的樣本。
29、在一個可能的實現(xiàn)中,訓(xùn)練模塊還用于:基于目標(biāo)訓(xùn)練數(shù)據(jù)集對分類模型進行訓(xùn)練,更新特征提取網(wǎng)絡(luò)的參數(shù)。
30、在另一個可能的實現(xiàn)中,k個pu分類模型中的每個pu分類模型包括更新后的特征提取網(wǎng)絡(luò)和pu分類器;本技術(shù)提供的分類模型的訓(xùn)練裝置還包括pu學(xué)習(xí)模塊,該pu學(xué)習(xí)模塊用于基于目標(biāo)訓(xùn)練數(shù)據(jù)集對k個pu分類模型中的各個pu分類模型進行訓(xùn)練,更新各個pu分類模型的pu分類器。
31、在另一個可能的實現(xiàn)中,第i個pu分類模型為k個pu分類模型中的任意一個pu分類模型,第i個pu分類模型包括更新后的特征提取網(wǎng)絡(luò)和第i個pu分類器;pu學(xué)習(xí)模塊針對第i個pu分類模型進行訓(xùn)練的具體實現(xiàn)為:從目標(biāo)訓(xùn)練數(shù)據(jù)集中確定第i個pu分類模型對應(yīng)的第i個pu訓(xùn)練數(shù)據(jù)集,其中,第i個pu訓(xùn)練數(shù)據(jù)集包括正樣本子集和無標(biāo)簽樣本子集,正樣本子集包括多個正樣本,正樣本為有標(biāo)簽樣本子集中的目標(biāo)類別的樣本,目標(biāo)類別為第i個pu分類模型對應(yīng)的類別;基于第i個pu訓(xùn)練數(shù)據(jù)集對第i個pu分類模型進行訓(xùn)練,更新第i個pu分類器的參數(shù)。
32、在另一個可能的實現(xiàn)中,基于第i個pu訓(xùn)練數(shù)據(jù)集對第i個pu分類模型進行訓(xùn)練,更新第i個pu分類器的參數(shù)的一種具體實現(xiàn)為:將第i個pu訓(xùn)練數(shù)據(jù)集中的樣本輸入第i個pu分類模型,得到第i個pu分類模型對第i個pu訓(xùn)練數(shù)據(jù)集中各個樣本的類別估計;基于pu損失函數(shù),更新第i個pu分類器的參數(shù),pu損失函數(shù)包括正風(fēng)險估計項和負風(fēng)險估計項,正風(fēng)險估計項用于懲罰第i個pu分類器將正樣本估計為負樣本,負風(fēng)險估計項用于懲罰第i個pu分類器將無標(biāo)簽樣本估計為正樣本。
33、在另一個可能的實現(xiàn)中,pu損失函數(shù)還與目標(biāo)類別的樣本在有標(biāo)簽樣本子集中的占比相關(guān)。
34、在另一個可能的實現(xiàn)中,本技術(shù)提供的分類模型的訓(xùn)練裝置還包括第一數(shù)據(jù)增強模塊,該第一數(shù)據(jù)增強模塊用于對無標(biāo)簽樣本子集做第一數(shù)據(jù)增強處理。
35、在另一個可能的實現(xiàn)中,每個pu分類模型的輸出結(jié)果包括估計概率,該估計概率指示每個pu分類模型的輸入樣本為正樣本的概率;偽標(biāo)簽標(biāo)注模塊具體用于:基于k個pu分類模型的輸出結(jié)果,確定目標(biāo)pu分類模型,目標(biāo)pu分類模型輸出的估計概率最大;將目標(biāo)pu分類模型對應(yīng)的類別,標(biāo)注為未被標(biāo)注的樣本的偽標(biāo)簽。
36、在另一個可能的實現(xiàn)中,訓(xùn)練模塊具體用于:將被標(biāo)注的樣本輸入所述分類模型,輸出被標(biāo)注的樣本對應(yīng)的類別估計;基于被標(biāo)注的樣本的標(biāo)簽和被標(biāo)注的樣本的類別估計,得到第一損失函數(shù)的損失值;將具有偽標(biāo)簽的樣本輸入分類模型,輸出具有偽標(biāo)簽的樣本對應(yīng)的類別估計;基于具有偽標(biāo)簽的樣本的偽標(biāo)簽和具有偽標(biāo)簽的樣本的類別估計,得到第二損失函數(shù)的損失值;基于第一損失函數(shù)的損失值和第二損失函數(shù)的損失值,更新特征提取網(wǎng)絡(luò)的參數(shù)和分類器的參數(shù)。
37、在另一個可能的實現(xiàn)中,本技術(shù)提供的分類模型的訓(xùn)練裝置還包括第二數(shù)據(jù)增強模塊,該第二數(shù)據(jù)增強模塊用于對偽標(biāo)簽樣本子集做第二數(shù)據(jù)增強處理。
38、在另一個可能的實現(xiàn)中,本技術(shù)提供的分類模型的訓(xùn)練裝置還包括數(shù)據(jù)擴充模塊,該數(shù)據(jù)擴充模塊用于在每個訓(xùn)練周期完成之后,從偽標(biāo)簽樣本子集中確定可靠偽標(biāo)簽的樣本,得到可靠偽標(biāo)簽樣本子集,可靠偽標(biāo)簽的樣本對應(yīng)的pu分類模型的輸出結(jié)果大于或等于預(yù)設(shè)閾值;基于可靠偽標(biāo)簽樣本子集,對有標(biāo)簽樣本子集進行數(shù)據(jù)擴充。
39、在另一個可能的實現(xiàn)中,基于可靠偽標(biāo)簽樣本子集,對有標(biāo)簽樣本子集進行數(shù)據(jù)擴充的一種具體實現(xiàn)為確定有標(biāo)簽樣本子集中第一類別樣本的數(shù)量,第一類別樣本的數(shù)量最多;基于有標(biāo)簽樣本子集中各個類別樣本的數(shù)量和第一類別樣本的數(shù)量的差值,確定各個類別樣本的采樣數(shù)量;基于各個類別樣本的采樣數(shù)量,對可靠偽標(biāo)簽樣本子集中各個類別樣本進行樣本采樣,得到擴充數(shù)據(jù)集;將擴充數(shù)據(jù)集補充至有標(biāo)簽樣本子集中,得到數(shù)據(jù)擴充后的有標(biāo)簽數(shù)據(jù)子集。
40、在另一個可能的實現(xiàn)中,分類模型對應(yīng)的全量訓(xùn)練數(shù)據(jù)集包括有標(biāo)簽樣本集和無標(biāo)簽樣本集,有標(biāo)簽樣本集包括多個被標(biāo)注的樣本,無標(biāo)簽樣本集包括多個未被標(biāo)注的樣本;獲取模塊具體用于利用隨機采樣器分別從有標(biāo)簽樣本集中和無標(biāo)簽樣本集中進行樣本采集,得到當(dāng)前批次的有標(biāo)簽樣本子集和無標(biāo)簽樣本子集。
41、第三方面,本技術(shù)實施例提供一種計算設(shè)備,包括存儲器和處理器,所述存儲器中存儲有指令,當(dāng)所述指令被處理器執(zhí)行時,使得第一方面所述的方法被實現(xiàn)。
42、第四方面,本技術(shù)實施例提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,當(dāng)所述計算機程序在被處理器執(zhí)行時,使得第一方面所述的方法被實現(xiàn)。
43、第五方面,本技術(shù)實施例還提供一種計算機程序或計算機程序產(chǎn)品,該計算機程序或計算機程序產(chǎn)品包括指令,當(dāng)所述指令執(zhí)行時,令計算機執(zhí)行第一方面所述的方法。
44、第六方面,本技術(shù)實施例還提供一種芯片,包括至少一個處理器和通信接口,所述處理器用于執(zhí)行第一方面所述的方法。