最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

多目標預(yù)測模型的訓練方法、物料處理方法及裝置與流程

文檔序號:41950813發(fā)布日期:2025-05-16 14:10閱讀:5來源:國知局
多目標預(yù)測模型的訓練方法、物料處理方法及裝置與流程

本技術(shù)涉及網(wǎng)絡(luò),尤其涉及一種多目標預(yù)測模型的訓練方法、物料處理方法及裝置。


背景技術(shù):

1、目前,推薦系統(tǒng)的粗排模型,在訓練樣本的選擇上,基本與精排模型的訓練樣本一致,即在曝光的物料中選取樣本。這種樣本選擇方式,將訓練樣本的空間局限在了曝光樣本空間。從推薦系統(tǒng)鏈路上來看,離最終曝光越遠的環(huán)節(jié),其真實樣本空間與曝光樣本空間的偏差越大。利用曝光的物料作為訓練樣本,隨著鏈路的變遠,ssb(sample?selection?bias,選擇偏差)會越來越大,從而導致訓練出的粗排模型的精確度較低,進一步導致粗排階段的推薦結(jié)果不準確。此外,在復(fù)雜的推薦業(yè)務(wù)場景中,目標往往是復(fù)雜多元的,針對每個目標訓練一個模型,既浪費了訓練資源,也不利于粗排階段各目標的推薦結(jié)果之間的融合調(diào)節(jié)。因此,提供一種更優(yōu)的粗排模型顯得尤為必要。


技術(shù)實現(xiàn)思路

1、本技術(shù)實施例的目的是提供一種多目標預(yù)測模型的訓練方法、物料處理方法及裝置,用以解決目前推薦系統(tǒng)的粗排模型存在訓練樣本選擇偏差問題,導致粗排階段的推薦結(jié)果不準確的問題。

2、為解決上述技術(shù)問題,本技術(shù)實施例是這樣實現(xiàn)的:

3、一方面,本技術(shù)實施例提供一種多目標預(yù)測模型的訓練方法,包括:

4、獲取樣本數(shù)據(jù)集;所述樣本數(shù)據(jù)集中包括多組樣本數(shù)據(jù);每組所述樣本數(shù)據(jù)包括樣本用戶的樣本用戶側(cè)特征、樣本物料的樣本物料側(cè)特征,以及所述樣本物料在不同預(yù)測目標下的標簽信息;所述樣本物料包括已曝光的物料和/或進入精排階段但未曝光的物料;所述標簽信息包括正樣本或者負樣本;

5、分別將每組所述樣本數(shù)據(jù)輸入待訓練的多目標預(yù)測模型中,輸出所述樣本數(shù)據(jù)中樣本物料在不同預(yù)測目標下的樣本預(yù)測值;所述樣本預(yù)測值用于表征所述樣本物料被執(zhí)行所述預(yù)測目標對應(yīng)的操作的預(yù)測結(jié)果;

6、針對每個所述預(yù)測目標,根據(jù)所述樣本物料在所述預(yù)測目標下的標簽信息、樣本預(yù)測值、以及所述預(yù)測目標對應(yīng)的損失函數(shù),確定所述多目標預(yù)測模型在所述預(yù)測目標下的損失值;

7、根據(jù)所述多目標預(yù)測模型在所有預(yù)測目標下的損失值,更新所述多目標預(yù)測模型的模型參數(shù),得到訓練后的多目標預(yù)測模型;所述多目標預(yù)測模型為推薦系統(tǒng)粗排階段的模型。

8、另一方面,本技術(shù)實施例提供一種物料處理方法,包括:

9、響應(yīng)于目標用戶的線上請求,獲取所述目標用戶的用戶側(cè)特征;以及,獲取針對所述線上請求的已召回物料在不同預(yù)測目標下的物料輸出向量;所述不同預(yù)測目標下的物料輸出向量基于所述已召回物料的物料標識和預(yù)先訓練的多目標預(yù)測模型所確定;

10、針對每個所述已召回物料,將所述用戶側(cè)特征和所述已召回物料在不同預(yù)測目標下的物料輸出向量輸入所述多目標預(yù)測模型中,輸出所述已召回物料在不同預(yù)測目標下的預(yù)測值;所述預(yù)測值用于表征所述已召回物料被執(zhí)行所述預(yù)測目標對應(yīng)的操作的預(yù)測結(jié)果;

11、根據(jù)每個所述已召回物料在不同預(yù)測目標下的預(yù)測值,從所有已召回物料中篩選出第一預(yù)設(shè)數(shù)量的物料,作為粗篩粗排物料;

12、針對每個所述粗篩粗排物料,將所述用戶側(cè)特征和所述粗篩粗排物料的物料側(cè)特征輸入目標深度結(jié)構(gòu)模型中,輸出所述粗篩粗排物料對應(yīng)的推薦值;所述推薦值用于表征所述粗篩粗排物料被推薦給所述目標用戶的預(yù)測結(jié)果;

13、根據(jù)每個所述粗篩粗排物料對應(yīng)的推薦值,從所有粗篩粗排物料中篩選出第二預(yù)設(shè)數(shù)量的物料,作為粗排輸出物料;所述第二預(yù)設(shè)數(shù)量小于所述第一預(yù)設(shè)數(shù)量。

14、再一方面,本技術(shù)實施例提供一種多目標預(yù)測模型的訓練裝置,包括:

15、第一獲取模塊,用于獲取樣本數(shù)據(jù)集;所述樣本數(shù)據(jù)集中包括多組樣本數(shù)據(jù);每組所述樣本數(shù)據(jù)包括樣本用戶的樣本用戶側(cè)特征、樣本物料的樣本物料側(cè)特征,以及所述樣本物料在不同預(yù)測目標下的標簽信息;所述樣本物料包括已曝光的物料和/或進入精排階段但未曝光的物料;所述標簽信息包括正樣本或者負樣本;

16、第一多目標預(yù)測模塊,用于分別將每組所述樣本數(shù)據(jù)輸入待訓練的多目標預(yù)測模型中,輸出所述樣本數(shù)據(jù)中樣本物料在不同預(yù)測目標下的樣本預(yù)測值;所述樣本預(yù)測值用于表征所述樣本物料被執(zhí)行所述預(yù)測目標對應(yīng)的操作的預(yù)測結(jié)果;

17、確定模塊,用于針對每個所述預(yù)測目標,根據(jù)所述樣本物料在所述預(yù)測目標下的標簽信息、樣本預(yù)測值、以及所述預(yù)測目標對應(yīng)的損失函數(shù),確定所述多目標預(yù)測模型在所述預(yù)測目標下的損失值;

18、更新模塊,用于根據(jù)所述多目標預(yù)測模型在所有預(yù)測目標下的損失值,更新所述多目標預(yù)測模型的模型參數(shù),得到訓練后的多目標預(yù)測模型;所述多目標預(yù)測模型為推薦系統(tǒng)粗排階段的模型。

19、再一方面,本技術(shù)實施例提供一種物料處理裝置,包括:

20、第二獲取模塊,用于響應(yīng)于目標用戶的線上請求,獲取所述目標用戶的用戶側(cè)特征;以及,獲取針對所述線上請求的已召回物料在不同預(yù)測目標下的物料輸出向量;所述不同預(yù)測目標下的物料輸出向量基于所述已召回物料的物料標識和預(yù)先訓練的多目標預(yù)測模型所確定;

21、第二多目標預(yù)測模塊,用于針對每個所述已召回物料,將所述用戶側(cè)特征和所述已召回物料在不同預(yù)測目標下的物料輸出向量輸入所述多目標預(yù)測模型中,輸出所述已召回物料在不同預(yù)測目標下的預(yù)測值;所述預(yù)測值用于表征所述已召回物料被執(zhí)行所述預(yù)測目標對應(yīng)的操作的預(yù)測結(jié)果;

22、第一篩選模塊,用于根據(jù)每個所述已召回物料在不同預(yù)測目標下的預(yù)測值,從所有已召回物料中篩選出第一預(yù)設(shè)數(shù)量的物料,作為粗篩粗排物料;

23、推薦值確定模塊,用于針對每個所述粗篩粗排物料,將所述用戶側(cè)特征和所述粗篩粗排物料的物料側(cè)特征輸入目標深度結(jié)構(gòu)模型中,輸出所述粗篩粗排物料對應(yīng)的推薦值;所述推薦值用于表征所述粗篩粗排物料被推薦給所述目標用戶的預(yù)測結(jié)果;

24、第二篩選模塊,用于根據(jù)每個所述粗篩粗排物料對應(yīng)的推薦值,從所有粗篩粗排物料中篩選出第二預(yù)設(shè)數(shù)量的物料,作為粗排輸出物料;所述第二預(yù)設(shè)數(shù)量小于所述第一預(yù)設(shè)數(shù)量。

25、再一方面,本技術(shù)實施例提供一種電子設(shè)備,包括處理器和與所述處理器電連接的存儲器,所述存儲器存儲有計算機程序,所述處理器用于從所述存儲器調(diào)用并執(zhí)行所述計算機程序以實現(xiàn)上述多目標預(yù)測模型的訓練方法,或者,所述處理器用于從所述存儲器調(diào)用并執(zhí)行所述計算機程序以實現(xiàn)上述物料處理方法。

26、再一方面,本技術(shù)實施例提供一種存儲介質(zhì),用于存儲計算機程序,所述計算機程序能夠被處理器執(zhí)行以實現(xiàn)上述多目標預(yù)測模型的訓練方法,或者,所述計算機程序能夠被處理器執(zhí)行以實現(xiàn)上述物料處理方法。

27、采用本技術(shù)實施例的技術(shù)方案,利用多組樣本數(shù)據(jù)對待訓練的多目標預(yù)測模型進行訓練,以得到訓練后的多目標預(yù)測模型。其中,每組樣本數(shù)據(jù)包括樣本用戶的樣本用戶側(cè)特征、樣本物料的樣本物料側(cè)特征,以及在不同預(yù)測目標下樣本物料的標簽信息,樣本物料包括已曝光的物料和/或進入精排階段但未曝光的物料,標簽信息包括正樣本或者負樣本??梢?,該技術(shù)方案在多目標預(yù)測模型的訓練過程中,能夠采用已曝光的物料和/或進入精排階段但未曝光的物料作為樣本物料,充分考慮到了在線服務(wù)過程中需要粗排階段的模型處理的物料與粗排階段的模型的訓練樣本的不一致性,增大了訓練樣本的空間,有效緩解了選擇偏差問題,有利于提升推薦系統(tǒng)鏈路的推薦一致性,確保了多目標預(yù)測模型的預(yù)測結(jié)果的準確度,從而有利于提高粗排階段推薦結(jié)果的準確度。并且,該技術(shù)方案針對多個預(yù)測目標訓練一個預(yù)測模型,增強了各預(yù)測目標之間的協(xié)調(diào)性與整體性,提高了模型表達能力,節(jié)約了模型訓練資源。

28、采用本技術(shù)實施例的技術(shù)方案,通過在推薦系統(tǒng)的粗排階段引入多目標預(yù)測模型這一雙塔類模型,能夠?qū)⒂脩魝?cè)與物料側(cè)解耦開,對用戶側(cè)特征實時計算,而物料側(cè)特征則離線計算存儲,這樣,基于用戶的線上請求,能夠快速確定出已召回物料在不同預(yù)測目標下的預(yù)測值,提升了推薦系統(tǒng)對用戶的線上請求的響應(yīng)速度,提高了推薦系統(tǒng)在線服務(wù)的實時性。從而,基于多個預(yù)測目標下的預(yù)測值從已召回物料中篩選出粗篩粗排物料,以利用目標深度結(jié)構(gòu)模型進行進一步處理。由于深度結(jié)構(gòu)類模型有著更強的特征交叉能力,因此,該技術(shù)方案充分利用了雙塔類模型的服務(wù)性能優(yōu)勢與深度結(jié)構(gòu)類模型的精度優(yōu)勢,確保了粗排階段推薦結(jié)果的實時性和精確度。并且,該技術(shù)方案中,通過本技術(shù)訓練出的多目標預(yù)測模型輸出的已召回物料在不同預(yù)測目標下的預(yù)測值,來篩選粗篩粗排物料,由于多目標預(yù)測模型輸出的預(yù)測值較為準確,因此能夠確保粗篩粗排物料的準確度,從而有利于提高粗排階段推薦結(jié)果的準確度。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1