本公開總體上涉及機(jī)器學(xué)習(xí)算法,并且特別地涉及從機(jī)器學(xué)習(xí)算法的訓(xùn)練數(shù)據(jù)集生成嵌入空間的方法和系統(tǒng)。
背景技術(shù):
1、機(jī)器學(xué)習(xí)(ml)算法是整個人工智能領(lǐng)域的一部分,并且可用于從數(shù)據(jù)中自動學(xué)習(xí)(例如,逐步改進(jìn)特定任務(wù)的性能),而無需顯式編程。例如,機(jī)器學(xué)習(xí)算法可以用于控制物理資產(chǎn),其中機(jī)器學(xué)習(xí)模型可以用相關(guān)歷史數(shù)據(jù)(例如,訓(xùn)練數(shù)據(jù)集)來訓(xùn)練。然而,在訓(xùn)練數(shù)據(jù)集(即使相對較大)沒有考慮數(shù)據(jù)的特殊性的意義上,當(dāng)前的ml算法可缺乏任何控制。機(jī)器學(xué)習(xí)模型包括神經(jīng)網(wǎng)絡(luò)(其中可以為網(wǎng)絡(luò)的每一層確定嵌入)、決策樹/森林(其中可以為樹的每個深度確定嵌入)和整體模型(其中可以僅為輸入空間確定嵌入)。
技術(shù)實(shí)現(xiàn)思路
1.一種從在具有一個或多個處理器的計(jì)算機(jī)系統(tǒng)上實(shí)現(xiàn)的機(jī)器學(xué)習(xí)算法的訓(xùn)練數(shù)據(jù)集生成嵌入空間的方法,所述方法包括:
2.如權(quán)利要求1所述的方法,其中,由所述機(jī)器學(xué)習(xí)算法來生成所述嵌入空間包括使用所述機(jī)器學(xué)習(xí)算法的一個或多個層生成所述嵌入空間,所述一個或多個層中的每一層提供從輸入空間到輸出空間的變換,其中所述輸入空間的基數(shù)等于前一層的輸出空間的所述基數(shù)。
3.如權(quán)利要求1所述的方法,其中,生成所述嵌入空間包括生成所述多個誘導(dǎo)數(shù)據(jù)點(diǎn),所述多個誘導(dǎo)數(shù)據(jù)點(diǎn)中的每個誘導(dǎo)數(shù)據(jù)點(diǎn)對應(yīng)于密度分布的質(zhì)心,捕獲所述多個訓(xùn)練數(shù)據(jù)點(diǎn)的密度分布以提供多個質(zhì)心,所述多個質(zhì)心是所述訓(xùn)練數(shù)據(jù)集的所述多個訓(xùn)練數(shù)據(jù)點(diǎn)的代表點(diǎn)。
4.如權(quán)利要求1所述的方法,其中,生成所述嵌入空間包括生成所述多個誘導(dǎo)數(shù)據(jù)點(diǎn),所述多個訓(xùn)練數(shù)據(jù)點(diǎn)的每個集群由高斯分布表示,所述多個誘導(dǎo)數(shù)據(jù)點(diǎn)中的每個對應(yīng)于所述高斯分布的質(zhì)心。
5.如權(quán)利要求1所述的方法,進(jìn)一步包括由傳感器裝置生成通過所述計(jì)算機(jī)系統(tǒng)的所述輸入接收的所述輸入操作數(shù)據(jù)。
6.如權(quán)利要求1所述的方法,其中,所述輸入操作數(shù)據(jù)包括遙感數(shù)據(jù)。
7.如權(quán)利要求1所述的方法,其中,所述機(jī)器學(xué)習(xí)算法包括神經(jīng)網(wǎng)絡(luò)、決策樹或整體模型。
8.如權(quán)利要求7所述的方法,其中,在所述神經(jīng)網(wǎng)絡(luò)中,生成所述嵌入空間是在所述神經(jīng)網(wǎng)絡(luò)的一個或多個層中執(zhí)行的。
9.如權(quán)利要求7所述的方法,其中,在所述決策樹中,生成所述嵌入空間是在所述決策樹的每個深度處執(zhí)行的。
10.如權(quán)利要求7所述的方法,其中,在所述整體模型中,生成所述嵌入空間是針對輸入空間來執(zhí)行的。