1.一種基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)方法,其特征在于,所述基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)方法包括:
2.根據(jù)權(quán)利要求1所述的基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)方法,其特征在于,所述收集舊數(shù)據(jù)作為訓(xùn)練集,收集無標簽的新數(shù)據(jù)作為測試集,之前還包括:
3.根據(jù)權(quán)利要求1所述的基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)方法,其特征在于,所述根據(jù)所述訓(xùn)練集和所述測試集計算kl距離,將所述kl距離與設(shè)定閾值進行比較,判斷所述新數(shù)據(jù)是否發(fā)生概念漂移,具體包括:
4.根據(jù)權(quán)利要求1所述的基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)方法,其特征在于,所述新訓(xùn)練集包括已打標簽的訓(xùn)練集數(shù)據(jù)和未打標簽的測試集數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)方法,其特征在于,所述基于原隨機森林模型,結(jié)合基尼系數(shù)、權(quán)重和密度差建立建樹新準則,得到rfkl模型,具體包括:
6.根據(jù)權(quán)利要求4所述的基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)方法,其特征在于,所述基于所述新訓(xùn)練集,選擇所述建樹新準則的最小值對應(yīng)的特征為分裂特征,利用所述分裂特征訓(xùn)練所述rfkl模型,得到訓(xùn)練好的rfkl模型,具體包括:
7.根據(jù)權(quán)利要求1所述的基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)方法,其特征在于,所述使用準確率作為評價指標評估所述訓(xùn)練好的rfkl模型的性能,將性能滿足要求的所述訓(xùn)練好的rfkl模型作為概念漂移自適應(yīng)后的rfkl模型,具體包括:
8.一種基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)系統(tǒng),其特征在于,所述基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)系統(tǒng)包括:
9.一種終端,其特征在于,所述終端包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)程序,所述基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)程序被所述處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-7任一項所述的基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)方法的步驟。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)程序,所述基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-7任一項所述的基于無標簽數(shù)據(jù)的概念漂移自適應(yīng)方法的步驟。