本發(fā)明屬于因果推斷,具體為一種基于因果推斷的內(nèi)容偏好人群圈選方法。
背景技術(shù):
1、當(dāng)前汽車業(yè)界依據(jù)動(dòng)力類型主要分為兩大類:一是傳統(tǒng)的燃油車,二是涵蓋純電動(dòng)、混合動(dòng)力等模式的新能源汽車。汽車之家這一平臺(tái)的內(nèi)容生態(tài)正是圍繞這兩大類別構(gòu)建。對(duì)于燃油車,汽車之家已擁有穩(wěn)固的用戶群體,其內(nèi)容在燃油車領(lǐng)域的點(diǎn)擊轉(zhuǎn)化率高、表現(xiàn)優(yōu)異;至于新能源汽車,它代表著汽車行業(yè)的未來發(fā)展趨勢(shì),因此汽車之家需要加大資源投入,將其作為重點(diǎn)發(fā)展方向。
2、在實(shí)際業(yè)務(wù)操作中,進(jìn)行首頁內(nèi)容推薦時(shí),我們首先需要對(duì)用戶進(jìn)行細(xì)分,識(shí)別出對(duì)新能源汽車有較高興趣的用戶群體,以優(yōu)化新能源內(nèi)容的展示,提升其點(diǎn)擊率和瀏覽時(shí)長。然而,若直接依賴響應(yīng)模型(諸如新能源偏好模型、點(diǎn)擊通過率(ctr)模型、留資意愿模型等)進(jìn)行篩選,可能會(huì)篩選出本身就具有高點(diǎn)擊率的用戶流,這些用戶無論推送何種內(nèi)容都傾向于點(diǎn)擊和留資。這種情況會(huì)帶來兩個(gè)問題:一是可能會(huì)擠壓燃油車內(nèi)容的展示空間,導(dǎo)致燃油車內(nèi)容的點(diǎn)擊量減少,損害已建立的燃油車內(nèi)容性能指標(biāo);二是整體的內(nèi)容推薦效果提升可能受到局限,因?yàn)楦呋A(chǔ)點(diǎn)擊率的用戶群限制了進(jìn)一步增長的空間,使得優(yōu)化成效大打折扣
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于因果推斷的內(nèi)容偏好人群圈選方法,以解決上述背景技術(shù)中提出的問題。
2、為了實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于因果推斷的內(nèi)容偏好人群圈選方法,該方法的步驟為:
3、a1,圈選用戶客群:根據(jù)提出的uplift類模型,篩選只有在看到新能源車相關(guān)內(nèi)容時(shí)才會(huì)點(diǎn)擊的用戶群體;
4、a2,劃分用戶群體:根據(jù)干預(yù)情況和點(diǎn)擊情況,將用戶分割成四類;
5、a3,定位persuadables人群:運(yùn)用uplift增益模型進(jìn)行反事實(shí)預(yù)估,以計(jì)算因果效應(yīng),找出persuadables人群;
6、a4,獲取uplift值,通過基于t-learner模型和s-learner模型,獲得uplift值,并進(jìn)行ctr計(jì)算。
7、優(yōu)選地,所述a2中的四類為:
8、sure?things:不干預(yù)也會(huì)點(diǎn)擊;
9、persuadables:不干預(yù)不點(diǎn),干預(yù)了才會(huì)點(diǎn)擊;
10、do?not?disturbs:不干預(yù)會(huì)點(diǎn),干預(yù)了反而不點(diǎn);
11、lost?causes:無論是否干預(yù)均不點(diǎn)。
12、優(yōu)選地,所述a4中的基于t-learner模型的方法為:
13、b1,機(jī)器學(xué)習(xí):在新能源人群場(chǎng)景上,利用機(jī)器學(xué)習(xí)作為base?learner估計(jì)增益量;
14、b2,分類:根據(jù)內(nèi)容進(jìn)行標(biāo)注,并劃分成新能源和燃油車兩類;
15、b3,構(gòu)建ml模型:對(duì)實(shí)驗(yàn)組和對(duì)照組分別構(gòu)建ml模型,并進(jìn)行計(jì)算;
16、b4,獲取干預(yù)增益值:獲得兩組ml模型后,互換預(yù)測(cè)樣本,在獲得評(píng)分后,對(duì)獲得的評(píng)分相減獲得干預(yù)增益值;
17、優(yōu)選地,所述a4中的基于s-learner模型,先把把treatment構(gòu)造成一個(gè)特征,在新能源人群場(chǎng)景上,在模型訓(xùn)練完成后,通過改變treatment變量來進(jìn)行反事實(shí)推理,計(jì)算出該樣本在接受干預(yù)后的uplift值。
18、優(yōu)選地,模型訓(xùn)練過程中,一方面需要避免模型過擬合,另一方面又要使其獲得充分訓(xùn)練。
19、優(yōu)選地,所述估計(jì)增益量為:
20、1.μ1(x)=e[y/t=1,x=x];μ0(x)=e[y/t=0,x=x];
21、
22、公式1中響應(yīng)模型μ1(x)用于擬合在施加干預(yù)的情況下響應(yīng)目標(biāo)y與特征x的關(guān)系,而響應(yīng)μ0(x)用于擬合在未施加干預(yù)的情況下響應(yīng)目標(biāo)y與特征x的關(guān)系;
23、公式2修正成t=μ1(x)-μ0(x),即代表對(duì)測(cè)試集上單個(gè)樣本x施加干預(yù)后對(duì)用戶帶來的增益量。
24、優(yōu)選地,s-learner模型的特征為:
25、1.μ(t,x)=e[y|t=t,x=x];
26、2.t=u(1,x)-u(0,x),。
27、優(yōu)選地,在模型訓(xùn)練的過程中,兩個(gè)模型的參數(shù)值盡量趨同,以減小模型層面的偏差積累。
28、本發(fā)明的有益效果如下:
29、本發(fā)明通過提出了一種創(chuàng)新的人群圈選方案,專為應(yīng)對(duì)復(fù)雜多變的新場(chǎng)景而設(shè)計(jì),該方案能夠從全局角度出發(fā),對(duì)資源進(jìn)行合理優(yōu)化,確保每一份資源都能發(fā)揮最大效用,其方法邏輯清晰直觀,不僅易于實(shí)施落地,還具備出色的可解釋性,使得相關(guān)人員能夠輕松理解并應(yīng)用,通過引入用戶偏好數(shù)據(jù),該方案能夠進(jìn)一步提升圈選的精準(zhǔn)度,確保所圈定的用戶群體與營銷目標(biāo)高度匹配,同時(shí),該方案還具備一定的自我優(yōu)化能力,能夠根據(jù)實(shí)際運(yùn)營效果進(jìn)行動(dòng)態(tài)調(diào)整,持續(xù)提升圈選效果,對(duì)于支持平臺(tái)內(nèi)的內(nèi)容推薦、搜索、push等策略的制定,該方案同樣發(fā)揮著重要作用,通過精準(zhǔn)圈定用戶群體,平臺(tái)能夠更加有效地推送用戶感興趣的內(nèi)容,提升用戶體驗(yàn)與滿意度,此外,該方案還為精準(zhǔn)營銷與精細(xì)化運(yùn)營提供了有力支持,幫助平臺(tái)實(shí)現(xiàn)更高效的用戶轉(zhuǎn)化與收益增長。
1.一種基于因果推斷的內(nèi)容偏好人群圈選方法,其特征在于:該方法的步驟為:
2.根據(jù)權(quán)利要求1所述的一種基于因果推斷的內(nèi)容偏好人群圈選方法,其特征在于:所述a2劃分用戶群體中的四類為:
3.根據(jù)權(quán)利要求1所述的一種基于因果推斷的內(nèi)容偏好人群圈選方法,其特征在于:所述a4獲取uplift值中的基于t-learner模型的方法為:
4.根據(jù)權(quán)利要求1所述的一種基于因果推斷的內(nèi)容偏好人群圈選方法,其特征在于:所述a4獲取uplift值中的基于s-learner模型,先把把treatment構(gòu)造成一個(gè)特征,在新能源人群場(chǎng)景上,在模型訓(xùn)練完成后,通過改變treatment變量來進(jìn)行反事實(shí)推理,計(jì)算出該樣本在接受干預(yù)后的uplift值。
5.根據(jù)權(quán)利要求1所述的一種基于因果推斷的內(nèi)容偏好人群圈選方法,其特征在于:模型訓(xùn)練過程中,一方面需要避免模型過擬合,另一方面又要使其獲得充分訓(xùn)練。
6.根據(jù)權(quán)利要求3述的一種基于因果推斷的內(nèi)容偏好人群圈選方法,其特征在于:所述估計(jì)增益量為:
7.根據(jù)權(quán)利要求1所述的一種基于因果推斷的內(nèi)容偏好人群圈選方法,其特征在于:s-learner模型的特征為:
8.根據(jù)權(quán)利要求1所述的一種基于因果推斷的內(nèi)容偏好人群圈選方法,其特征在于:在模型訓(xùn)練的過程中,兩個(gè)模型的參數(shù)值盡量趨同,以減小模型層面的偏差積累。