本申請涉及因果推斷領(lǐng)域,特別涉及一種糾偏推斷方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、隨機(jī)對照試驗是一種常用的實驗設(shè)計方法,用于比較實驗組和對照組在某個變量上的效果差異。在隨機(jī)對照實驗中,參與者被隨機(jī)分配到實驗組和對照組,觀察和測量參與者在某個指標(biāo)上的表現(xiàn),可以評估不同策略之間的因果效應(yīng)。通過比較實驗組和對照組之間的差異,可以得出因果推斷,即某個處理對變量的影響。
2、相關(guān)技術(shù)中,隨機(jī)對照實驗是評估策略對因果效應(yīng)的標(biāo)準(zhǔn),可以使用實驗組和對照組中指標(biāo)的均值差進(jìn)行因果推斷,并使用對照組的均值方差和實驗組的均值方差來估計因果推斷統(tǒng)計量的方差。在沒有搶奪效應(yīng)的情況下,可以保證因果推斷統(tǒng)計量是對整體因果效應(yīng)的無偏估計。
3、當(dāng)存在搶奪效應(yīng)的情況下,因果推斷統(tǒng)計量具有偏差大、方差高的不佳性質(zhì),如何消除因果推斷統(tǒng)計量的偏差,從而提高因果推斷的準(zhǔn)確性是當(dāng)前亟待解決的問題。
技術(shù)實現(xiàn)思路
0、
技術(shù)實現(xiàn)要素:
1、本申請?zhí)峁┝艘环N糾偏推斷方法、裝置、設(shè)備及存儲介質(zhì),所述技術(shù)方案如下:
2、根據(jù)本申請的一方面,提供了一種糾偏推斷方法,所述方法包括:
3、計算第一消費者賬號對應(yīng)的召回池中的k個推薦內(nèi)容分別對應(yīng)的第一曝光概率和第二曝光概率,所述第一曝光概率用于指示假設(shè)所述k個推薦內(nèi)容均為隨機(jī)對照實驗的實驗組中的推薦內(nèi)容時當(dāng)前推薦內(nèi)容的曝光概率,所述第二曝光概率用于指示假設(shè)所述k個推薦內(nèi)容均為隨機(jī)對照實驗的對照組中的推薦內(nèi)容時當(dāng)前推薦內(nèi)容的曝光概率;
4、獲取所述第一消費者賬號對所述k個推薦內(nèi)容的指標(biāo)結(jié)果數(shù)據(jù),所述第一消費者賬號是多個消費者賬號中的任意一個;
5、基于所述k個推薦內(nèi)容分別對應(yīng)的第一曝光概率和第二曝光概率,消除所述指標(biāo)結(jié)果數(shù)據(jù)對應(yīng)的因果效應(yīng)估計量中的搶奪效應(yīng)偏差,得到所述第一消費者賬號對應(yīng)的消除偏差后的因果效應(yīng)估計量;
6、基于所述多個消費者賬號對應(yīng)的消除偏差后的因果效應(yīng)估計量,得到所述隨機(jī)對照試驗對應(yīng)的因果推斷統(tǒng)計量。
7、根據(jù)本申請的另一方面,提供了一種糾偏推斷裝置,所述裝置包括:
8、計算模塊,用于計算第一消費者賬號對應(yīng)的召回池中的k個推薦內(nèi)容分別對應(yīng)的第一曝光概率和第二曝光概率,所述第一曝光概率用于指示假設(shè)所述k個推薦內(nèi)容均為隨機(jī)對照實驗的實驗組中的推薦內(nèi)容時當(dāng)前推薦內(nèi)容的曝光概率,所述第二曝光概率用于指示假設(shè)所述k個推薦內(nèi)容均為隨機(jī)對照實驗的對照組中的推薦內(nèi)容時當(dāng)前推薦內(nèi)容的曝光概率;
9、獲取模塊,用于獲取所述第一消費者賬號對所述k個推薦內(nèi)容的指標(biāo)結(jié)果數(shù)據(jù),所述第一消費者賬號是多個消費者賬號中的任意一個;
10、消除模塊,用于基于所述k個推薦內(nèi)容分別對應(yīng)的第一曝光概率和第二曝光概率,消除所述指標(biāo)結(jié)果數(shù)據(jù)對應(yīng)的因果效應(yīng)估計量中的搶奪效應(yīng)偏差,得到所述第一消費者賬號對應(yīng)的消除偏差后的因果效應(yīng)估計量;
11、處理模塊,用于基于所述多個消費者賬號對應(yīng)的消除偏差后的因果效應(yīng)估計量,得到所述隨機(jī)對照試驗對應(yīng)的因果推斷統(tǒng)計量。
12、根據(jù)本申請的另一方面,提供了一種計算機(jī)設(shè)備,所述計算機(jī)設(shè)備包括處理器和存儲器,所述存儲器中存儲有計算機(jī)程序,所述計算機(jī)程序由所述處理器加載并執(zhí)行以實現(xiàn)如上所述的糾偏推斷方法。
13、根據(jù)本申請的另一方面,提供了一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)中存儲有可執(zhí)行指令,所述可執(zhí)行指令由處理器加載并執(zhí)行以實現(xiàn)如上所述的糾偏推斷方法。
14、根據(jù)本申請的另一方面,提供了一種計算機(jī)程序產(chǎn)品,所述計算機(jī)程序產(chǎn)品包括計算機(jī)指令,所述計算機(jī)指令存儲在計算機(jī)可讀存儲介質(zhì)中,處理器從所述計算機(jī)可讀存儲介質(zhì)讀取并執(zhí)行所述計算機(jī)指令,以實現(xiàn)如上所述的糾偏推斷方法。
15、本申請?zhí)峁┑募夹g(shù)方案帶來的有益效果至少包括:
16、將隨機(jī)對照試驗分成實驗組和對照組:通過計算第一消費者賬號對應(yīng)召回池中的推薦內(nèi)容分別對應(yīng)的第一曝光概率和第二曝光概率;獲取第一消費者賬號對推薦內(nèi)容的指標(biāo)結(jié)果數(shù)據(jù);基于第一曝光概率和第二曝光概率,消除指標(biāo)結(jié)果數(shù)據(jù)對應(yīng)的因果效應(yīng)估計量中的搶奪效應(yīng)偏差,得到第一消費者賬號對應(yīng)的消除偏差后的因果效應(yīng)估計量;基于多個消費者賬號對應(yīng)的消除偏差后的因果效應(yīng)估計量,得到隨機(jī)對照試驗對應(yīng)的因果推斷統(tǒng)計量。本申請通過計算召回池中推薦內(nèi)容的曝光概率,將第一曝光概率和第二曝光概率的差值結(jié)合推薦內(nèi)容的指標(biāo)結(jié)果數(shù)據(jù),消除隨機(jī)對照試驗中的搶奪效應(yīng)偏差,得到消除偏差后的因果效應(yīng)估計量,基于因果效應(yīng)估計量可得到隨機(jī)對照試驗對應(yīng)的因果推斷統(tǒng)計量。
1.一種糾偏推斷方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述k個推薦內(nèi)容分別對應(yīng)的第一曝光概率和第二曝光概率,消除所述指標(biāo)結(jié)果數(shù)據(jù)對應(yīng)的因果效應(yīng)估計量中的搶奪效應(yīng)偏差,得到所述第一消費者賬號對應(yīng)的消除偏差后的因果效應(yīng)估計量,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述計算第一消費者賬號對應(yīng)的召回池中的k個推薦內(nèi)容分別對應(yīng)的第一曝光概率,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于所述k個推薦內(nèi)容中的第v個推薦內(nèi)容的第一效用函數(shù)和第二效用函數(shù),以及所述k個推薦內(nèi)容中各個推薦內(nèi)容的第一效用函數(shù)和第二效用函數(shù),計算所述第v個推薦內(nèi)容對應(yīng)的第一曝光概率,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述基于所述第v個推薦內(nèi)容的第一效用函數(shù)和第二效用函數(shù),計算第一數(shù)值,包括:
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述基于所述k個推薦內(nèi)容中各個推薦內(nèi)容實際對應(yīng)的效用函數(shù),計算第二數(shù)值,包括:
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述計算第一消費者賬號對應(yīng)的召回池中的推薦內(nèi)容分別對應(yīng)的第二曝光概率,包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述基于所述k個推薦內(nèi)容中的第v個推薦內(nèi)容的第二效用函數(shù),以及所述k個推薦內(nèi)容中各個推薦內(nèi)容的第二效用函數(shù),計算所述第v個推薦內(nèi)容對應(yīng)的第一曝光概率,包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述基于所述第v個推薦內(nèi)容的第二效用函數(shù),計算第三數(shù)值,包括:
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述基于所述推薦內(nèi)容中各個推薦內(nèi)容的第二效用函數(shù),計算第四數(shù)值,包括:
11.根據(jù)權(quán)利要求1至10任一所述的方法,其特征在于,所述基于所述多個消費者賬號對應(yīng)的消除偏差后的因果效應(yīng)估計量,得到所述隨機(jī)對照試驗對應(yīng)的因果推斷統(tǒng)計量,包括:
12.根據(jù)權(quán)利要求1至10任一所述的方法,其特征在于,所述基于所述多個消費者賬號對應(yīng)的消除偏差后的因果效應(yīng)估計量,得到所述隨機(jī)對照試驗對應(yīng)的因果推斷統(tǒng)計量,包括:
13.一種糾偏推斷裝置,其特征在于,所述裝置包括:
14.一種計算機(jī)設(shè)備,其特征在于,所述計算機(jī)設(shè)備包括處理器和存儲器,所述存儲器中存儲有計算機(jī)程序,所述計算機(jī)程序由所述處理器加載并執(zhí)行以實現(xiàn)如權(quán)利要求1至12任一項所述的糾偏推斷方法。
15.一種計算機(jī)可讀存儲介質(zhì),其特征在于,所述計算機(jī)可讀存儲介質(zhì)中存儲有可執(zhí)行指令,所述可執(zhí)行指令由處理器加載并執(zhí)行以實現(xiàn)如權(quán)利要求1至12任一項所述的糾偏推斷方法。