示例實(shí)施例可以涉及用于重用數(shù)據(jù)以用于訓(xùn)練機(jī)器學(xué)習(xí)模型的系統(tǒng)、方法和/或計(jì)算機(jī)程序。
背景技術(shù):
1、軟件應(yīng)用越來(lái)越多地使用機(jī)器學(xué)習(xí)模型。這些模型可能需要針對(duì)特定用戶進(jìn)行微調(diào)以提高性能。例如,醫(yī)療相關(guān)的應(yīng)用可能需要獲得用戶數(shù)據(jù)來(lái)針對(duì)用戶建立基線,或者人工智能(ai)助手可以收集用戶語(yǔ)音數(shù)據(jù)以適配用戶的聲音和說(shuō)話風(fēng)格,以提高針對(duì)用戶的語(yǔ)音識(shí)別性能。隨著許多應(yīng)用收集和存儲(chǔ)用戶數(shù)據(jù)用于訓(xùn)練其各自的機(jī)器學(xué)習(xí)模型,這增加了設(shè)備的存儲(chǔ)要求的負(fù)擔(dān)。所增加的存儲(chǔ)要求可能針對(duì)諸如智能手機(jī)等具有有限存儲(chǔ)容量的設(shè)備造成困難。
技術(shù)實(shí)現(xiàn)思路
1、考慮針對(duì)本發(fā)明的各種實(shí)施例的保護(hù)范圍由獨(dú)立權(quán)利要求規(guī)定。本說(shuō)明書中所描述的不屬于獨(dú)立權(quán)利要求范圍內(nèi)的實(shí)施例和特征,如果有,被解釋為有助于用于理解本發(fā)明的各種實(shí)施例的示例。
2、根據(jù)第一方面,描述了一種裝置,包括:用于接收收集新用戶數(shù)據(jù)的請(qǐng)求的部件,該新用戶數(shù)據(jù)用于訓(xùn)練與應(yīng)用相關(guān)聯(lián)的機(jī)器學(xué)習(xí)模型;用于基于本體來(lái)標(biāo)識(shí)適合用于訓(xùn)練機(jī)器學(xué)習(xí)模型的現(xiàn)有存儲(chǔ)數(shù)據(jù)的部件;以及用于響應(yīng)于標(biāo)識(shí)數(shù)據(jù)適合用于訓(xùn)練機(jī)器學(xué)習(xí)模型而提供對(duì)經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的訪問(wèn)的部件。
3、在一些示例中,該請(qǐng)求還可以包括新用戶數(shù)據(jù)的模態(tài)。在一些示例中,用于標(biāo)識(shí)現(xiàn)有存儲(chǔ)數(shù)據(jù)的部件還可以包括:用于基于模態(tài)來(lái)標(biāo)識(shí)現(xiàn)有存儲(chǔ)數(shù)據(jù)的部件。
4、在一些示例中,該請(qǐng)求還可以包括指示用于訓(xùn)練機(jī)器學(xué)習(xí)模型的一個(gè)或多個(gè)標(biāo)簽的數(shù)據(jù)。在一些示例中,用于標(biāo)識(shí)現(xiàn)有存儲(chǔ)數(shù)據(jù)的部件還可以:包括用于基于本體來(lái)確定與一個(gè)或多個(gè)標(biāo)簽相關(guān)的一個(gè)或多個(gè)項(xiàng)的部件;以及用于標(biāo)識(shí)具有元數(shù)據(jù)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的部件,該元數(shù)據(jù)包括相關(guān)的所述一個(gè)或多個(gè)項(xiàng)中的至少一個(gè)項(xiàng)。
5、該裝置還可以包括用于處理經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)以增強(qiáng)用于訓(xùn)練機(jī)器學(xué)習(xí)模型的現(xiàn)有存儲(chǔ)數(shù)據(jù)的適用性的部件。在一些示例中,用于提供經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的訪問(wèn)的部件可以包括:用于提供現(xiàn)有存儲(chǔ)數(shù)據(jù)的處理版本的訪問(wèn)的部件。
6、在一些示例中,用于處理經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的部件可以包括:用于對(duì)經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)應(yīng)用信號(hào)處理的部件。
7、該裝置還可以包括:用于生成針對(duì)經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)標(biāo)簽以用于訓(xùn)練與應(yīng)用相關(guān)聯(lián)的機(jī)器學(xué)習(xí)模型的部件。
8、在一些示例中,用于生成標(biāo)簽的部件可以包括:用于從經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)生成一個(gè)或多個(gè)隱藏任務(wù)的部件;以及用于基于一個(gè)或多個(gè)隱藏任務(wù)來(lái)標(biāo)記經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的部件。
9、在一些示例中,用于從經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)生成一個(gè)或多個(gè)隱藏任務(wù)的部件可以包括:用于基于優(yōu)化標(biāo)記函數(shù)和配置為執(zhí)行隱藏任務(wù)的多個(gè)機(jī)器學(xué)習(xí)模型、從經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)來(lái)生成一個(gè)或多個(gè)隱藏任務(wù)的部件,該優(yōu)化基于執(zhí)行隱藏任務(wù)時(shí)多個(gè)機(jī)器學(xué)習(xí)模型的輸出之間的一致性分?jǐn)?shù)。
10、在一些示例中,多個(gè)機(jī)器學(xué)習(xí)模型具有同一架構(gòu)但具有不同的起始參數(shù)值。
11、在一些示例中,隱藏任務(wù)是隨機(jī)分類任務(wù)。
12、在一些示例中,用于基于一個(gè)或多個(gè)隱藏任務(wù)標(biāo)記經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的部件可以包括:用于基于主動(dòng)學(xué)習(xí)模型來(lái)標(biāo)記現(xiàn)有存儲(chǔ)數(shù)據(jù)的部件。
13、在一些示例中,用于基于一個(gè)或多個(gè)隱藏任務(wù)來(lái)標(biāo)記經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的部件可以包括以下至少一項(xiàng):用于向用戶提供針對(duì)一個(gè)或多個(gè)隱藏任務(wù)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的子集以用于手動(dòng)標(biāo)記的部件;用于從用戶接收現(xiàn)有存儲(chǔ)數(shù)據(jù)的子集的手動(dòng)標(biāo)記的部件;或者用于基于接收到的手動(dòng)標(biāo)記來(lái)自動(dòng)地標(biāo)記剩余的現(xiàn)有存儲(chǔ)數(shù)據(jù)的部件。
14、該裝置還可以包括用于修改經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的元數(shù)據(jù)以指示用于訓(xùn)練機(jī)器學(xué)習(xí)模型的數(shù)據(jù)的可重用性的部件。
15、在一些示例中,用于修改所標(biāo)識(shí)現(xiàn)有存儲(chǔ)數(shù)據(jù)的元數(shù)據(jù)以指示用于訓(xùn)練機(jī)器學(xué)習(xí)模型的數(shù)據(jù)的重復(fù)用性的部件可以包括:用于修改元數(shù)據(jù)以包括針對(duì)數(shù)據(jù)而確定的標(biāo)簽的部件。
16、該裝置還可以包括用于基于經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)來(lái)訓(xùn)練機(jī)器學(xué)習(xí)模型的部件。
17、在一些示例中,本體可以已經(jīng)基于一個(gè)或多個(gè)數(shù)據(jù)集的數(shù)據(jù)項(xiàng)中的標(biāo)簽的共現(xiàn)而生成。在一些示例中,該裝置還可以包括用于生成本體的部件。
18、根據(jù)第二方面,描述了一種方法,包括:由裝置從應(yīng)用接收收集新用戶數(shù)據(jù)的請(qǐng)求,該新用戶數(shù)據(jù)用于訓(xùn)練與該應(yīng)用相關(guān)聯(lián)的機(jī)器學(xué)習(xí)模型;由該裝置基于本體來(lái)標(biāo)識(shí)適合用于訓(xùn)練機(jī)器學(xué)習(xí)模型的現(xiàn)有存儲(chǔ)數(shù)據(jù);以及響應(yīng)于應(yīng)用的請(qǐng)求,由該裝置提供對(duì)經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的訪問(wèn)。
19、在一些示例中,請(qǐng)求還可以包括用戶數(shù)據(jù)的模態(tài)。在一些示例中,標(biāo)識(shí)現(xiàn)有存儲(chǔ)數(shù)據(jù)還可以包括:基于模態(tài)來(lái)標(biāo)識(shí)現(xiàn)有存儲(chǔ)數(shù)據(jù)。
20、在一些示例中,請(qǐng)求還可以包括:指示用于訓(xùn)練機(jī)器學(xué)習(xí)模型的一個(gè)或多個(gè)標(biāo)簽的數(shù)據(jù)。在一些示例中,標(biāo)識(shí)現(xiàn)有存儲(chǔ)數(shù)據(jù)還可以包括:基于本體來(lái)確定與一個(gè)或多個(gè)標(biāo)簽相關(guān)的一個(gè)或多個(gè)項(xiàng);以及標(biāo)識(shí)具有元數(shù)據(jù)的現(xiàn)有存儲(chǔ)數(shù)據(jù),該元數(shù)據(jù)包括相關(guān)的一個(gè)或多個(gè)項(xiàng)中的至少一個(gè)項(xiàng)。
21、該方法還可以包括:處理經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)以增強(qiáng)用于訓(xùn)練機(jī)器學(xué)習(xí)模型的現(xiàn)有存儲(chǔ)數(shù)據(jù)的適用性。在一些示例中,提供對(duì)經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的訪問(wèn)可以包括:提供對(duì)現(xiàn)有存儲(chǔ)數(shù)據(jù)的經(jīng)處理版本的訪問(wèn)。
22、在一些示例中,處理經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)可以包括:對(duì)經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)應(yīng)用信號(hào)處理。
23、該方法還可以包括:生成針對(duì)經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)標(biāo)簽,以用于訓(xùn)練關(guān)聯(lián)于應(yīng)用的機(jī)器學(xué)習(xí)模型。
24、在一些示例中,生成標(biāo)簽可以包括:從經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)生成一個(gè)或多個(gè)隱藏任務(wù);以及基于一個(gè)或多個(gè)隱藏任務(wù)來(lái)標(biāo)記經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)。
25、在一些示例中,從經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)生成一個(gè)或多個(gè)隱藏任務(wù)可以包括:基于優(yōu)化標(biāo)記函數(shù)和配置為執(zhí)行隱藏任務(wù)的多個(gè)機(jī)器學(xué)習(xí)模型、從經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)來(lái)生成一個(gè)或多個(gè)隱藏任務(wù),該優(yōu)化基于執(zhí)行隱藏任務(wù)時(shí)多個(gè)機(jī)器學(xué)習(xí)模型的輸出之間的一致性分?jǐn)?shù)。
26、在一些示例中,多個(gè)機(jī)器學(xué)習(xí)模型具有同一架構(gòu)但具有不同的起始參數(shù)值。
27、在一些示例中,隱藏任務(wù)是隨機(jī)分類任務(wù)。
28、在一些示例中,基于一個(gè)或多個(gè)隱藏任務(wù)來(lái)標(biāo)記經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)可以包括:基于主動(dòng)學(xué)習(xí)模型來(lái)標(biāo)記現(xiàn)有存儲(chǔ)數(shù)據(jù)。
29、在一些示例中,基于一個(gè)或多個(gè)隱藏任務(wù)來(lái)標(biāo)記經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)可以包括以下至少一項(xiàng):向用戶提供針對(duì)一個(gè)或多個(gè)隱藏任務(wù)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的子集以用于手動(dòng)標(biāo)記;從用戶接收現(xiàn)有存儲(chǔ)數(shù)據(jù)的子集的手動(dòng)標(biāo)記;或者基于接收到的手動(dòng)標(biāo)記來(lái)自動(dòng)地標(biāo)記剩余的現(xiàn)有存儲(chǔ)數(shù)據(jù)。
30、該方法還可以包括修改經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的元數(shù)據(jù)以指示用于訓(xùn)練機(jī)器學(xué)習(xí)模型的數(shù)據(jù)的可重用性。
31、在一些示例中,修改經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的元數(shù)據(jù)以指示用于訓(xùn)練機(jī)器學(xué)習(xí)模型的數(shù)據(jù)的可重用性可以包括:修改元數(shù)據(jù)以包括針對(duì)數(shù)據(jù)而確定的標(biāo)簽。
32、該方法還可以包括基于經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)來(lái)訓(xùn)練機(jī)器學(xué)習(xí)模型。
33、在一些示例中,本體可以基于一個(gè)或多個(gè)數(shù)據(jù)集的數(shù)據(jù)項(xiàng)中的標(biāo)簽的共現(xiàn)而生成。在一些示例中,該方法還可以包括生成本體。
34、根據(jù)第三方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括指令的集合,當(dāng)在裝置上執(zhí)行時(shí),該指令被配置為使得該裝置執(zhí)行任何前述方法定義的方法。
35、根據(jù)第四方面,提供了一種(非瞬態(tài))計(jì)算機(jī)可讀介質(zhì),包括程序指令,當(dāng)由裝置執(zhí)行時(shí),該程序指令使得該裝置至少執(zhí)行以下操作:由該裝置從應(yīng)用接收收集新用戶數(shù)據(jù)的請(qǐng)求,該新用戶數(shù)據(jù)用于訓(xùn)練與該應(yīng)用相關(guān)聯(lián)的機(jī)器學(xué)習(xí)模型;由該裝置基于本體來(lái)標(biāo)識(shí)適合用于訓(xùn)練機(jī)器學(xué)習(xí)模型的現(xiàn)有存儲(chǔ)數(shù)據(jù);以及響應(yīng)于應(yīng)用的請(qǐng)求,由該裝置提供對(duì)經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的訪問(wèn)。
36、第三方面的程序指令還可以根據(jù)第二方面的任何前述方法定義執(zhí)行操作。
37、根據(jù)第五方面,提供了一種裝置,包括:一個(gè)或多個(gè)處理器;以及至少一個(gè)存儲(chǔ)指令的存儲(chǔ)器,當(dāng)由一個(gè)或多個(gè)處理器執(zhí)行時(shí),該指令使得該裝置至少?gòu)膽?yīng)用接收收集新用戶數(shù)據(jù)的請(qǐng)求,該新用戶數(shù)據(jù)用于訓(xùn)練與該應(yīng)用相關(guān)聯(lián)的機(jī)器學(xué)習(xí)模型;基于本體來(lái)標(biāo)識(shí)適合用于訓(xùn)練機(jī)器學(xué)習(xí)模型的現(xiàn)有存儲(chǔ)數(shù)據(jù);以及響應(yīng)于應(yīng)用的請(qǐng)求,提供對(duì)經(jīng)標(biāo)識(shí)的現(xiàn)有存儲(chǔ)數(shù)據(jù)的訪問(wèn)。
38、第五方面的計(jì)算機(jī)程序代碼還可以根據(jù)第二方面的任何前述方法定義執(zhí)行操作。