本發(fā)明涉及數(shù)據(jù)推送領(lǐng)域,具體為一種基于用戶屬性分析的數(shù)據(jù)推送方法及系統(tǒng)。
背景技術(shù):
1、常見的數(shù)據(jù)推送方法一般是根據(jù)用戶的基礎(chǔ)屬性對用戶進行分類,然后根據(jù)分類對應的數(shù)據(jù)對用戶進行數(shù)據(jù)推薦,然而這種方法沒有考慮到用戶的喜好在日常生活中會發(fā)生動態(tài)變化,所以根據(jù)上述方法對用戶進行分類并根據(jù)分類進行數(shù)據(jù)推薦時,會出現(xiàn)推薦的數(shù)據(jù)和用戶當前喜好的匹配度較低的現(xiàn)象,從而導致用戶的使用體驗較差。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于用戶屬性分析的數(shù)據(jù)推送方法及系統(tǒng),解決了現(xiàn)有技術(shù)中未考慮到用戶喜好的動態(tài)變化而導致推薦的數(shù)據(jù)不符合用戶需求的技術(shù)問題。
2、為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種基于用戶屬性分析的數(shù)據(jù)推送方法及系統(tǒng),包括以下步驟:
4、s1、獲取歷史用戶和目標用戶的基礎(chǔ)屬性信息,并生成歷史用戶屬性信息和目標用戶屬性信息;
5、s2、根據(jù)歷史用戶屬性信息建立目標模型,并對歷史用戶進行分類生成歷史用戶的用戶類型;
6、s3、將目標用戶屬性信息作為目標模型的輸入分析目標用戶的用戶類型;
7、s4、基于目標用戶的用戶類型計算每個對應推薦數(shù)據(jù)的優(yōu)先程度p(u,i);
8、s5、根據(jù)優(yōu)先程度p(u,i)對目標用戶進行推薦數(shù)據(jù)推送。
9、進一步地,在步驟s1中,基礎(chǔ)屬性信息包括購買消費記錄、瀏覽記錄、位置信息和注冊信息。
10、進一步地,在步驟s2中,具體包括以下步驟:
11、s21、以歷史用戶及其行為分別作為圖網(wǎng)絡的節(jié)點和邊,節(jié)點的表達式為:
12、n(u)=(a1,…,a6)
13、式中,n(u)表示第u個用戶對應的節(jié)點;a1,…,a6分別表示用戶的注冊名、年齡、性別、所在位置、注冊時間和總消費金額;
14、s22、根據(jù)歷史用戶屬性信息計算邊的第二權(quán)重wpurchase(u,v)、第三權(quán)重wlocation(u,v)和第四權(quán)重wbrowse(u,v),并構(gòu)建邊權(quán)重集合w,w=(w1,…,w3),其中,w1,…,w3分別表示第二權(quán)重wpurchase(u,v)、第三權(quán)重wlocation(u,v)和第四權(quán)重wbrowse(u,v);
15、s23、根據(jù)邊權(quán)重集合w計算邊的第一權(quán)重w(u,v);
16、s24、根據(jù)第一權(quán)重w(u,v)生成用于對歷史用戶進行分類的用戶分類圖網(wǎng)絡;
17、s25、對圖神經(jīng)網(wǎng)絡進行訓練獲得目標模型,并將用戶分類圖網(wǎng)絡輸入目標模型,輸出歷史用戶的用戶類型。
18、進一步地,在步驟s22中,第二權(quán)重wpurchase(u,v)的計算公式為:
19、wpurchase(u,v)=|{p|p∈pu∩pv}|
20、式中,pu和pv分別表示第u個和第v個用戶的購買消費記錄中購買的商品集合;p表示第u個和第v個用戶共同購買過的商品;
21、第三權(quán)重wlocation(u,v)的計算公式為:
22、
23、式中,locu和locv分別表示第u個和第v個用戶的地理位置坐標;deuclidean(locu,locv)表示第u個和第v個用戶的地理位置坐標的歐幾里得距離函數(shù);
24、第四權(quán)重wbrowse(u,v)的計算公式為:
25、
26、式中,bu和bv分別表示第u個和第v個用戶瀏覽過的商品和視頻的集合。
27、進一步地,步驟s23中,第一權(quán)重w(u,v)的計算公式為:
28、
29、式中,wi和wjk分別表示關(guān)于第一權(quán)重的第一影響參數(shù)和第二影響參數(shù)。
30、進一步地,在步驟s25中,目標函數(shù)的節(jié)點v更新的表達式為:
31、
32、式中,u表示節(jié)點v的鄰居節(jié)點;表示節(jié)點v在第l+1層的特征向量;表示節(jié)點v在第l層的特征向量;表示節(jié)點u在第l層的特征向量;n(v)表示節(jié)點v的所有鄰居節(jié)點u的集合;u∈n(v)∪{v}表示節(jié)點v和節(jié)點v的所有鄰居節(jié)點u的集合;w(l)表示第l層到第l+1層的可學習權(quán)重矩陣;ωuv表示節(jié)點v和鄰居節(jié)點u之間的邊的第一權(quán)重w(u,v);b(l)表示偏置項;σ表示激活函數(shù)。
33、進一步地,在步驟s4中,具體包括以下步驟:
34、s41、獲取由多組推薦數(shù)據(jù)所組成的推薦數(shù)據(jù)集;
35、s42、計算推薦數(shù)據(jù)集中每個推薦數(shù)據(jù)的優(yōu)先程度影響參數(shù),優(yōu)先程度影響參數(shù)包括時間衰減因子d(t)、行為強度權(quán)重w(b)、內(nèi)容相關(guān)性r(u,i)和內(nèi)容新鮮度加分項f(i);
36、s43、根據(jù)優(yōu)先程度影響參數(shù)計算優(yōu)先程度p(u,i)。
37、進一步地,在步驟s42中,時間衰減因子d(t)的計算公式為:
38、d(t)=e-λt
39、式中,t表示目標用戶上次看到相同類型的推薦數(shù)據(jù)的時間間隔;λ表示衰減速率參數(shù);
40、行為強度權(quán)重w(b)的表達式為:
41、
42、其中,b表示目標用戶的行為,分別是瀏覽view、搜索search和購買purchase;wview、wsearch和wpurchase分別表示目標用戶不同行為對應的行為強度權(quán)重值;
43、內(nèi)容相關(guān)性r(u,i)的計算公式為:
44、r(u,i)=vi×100%
45、式中,vi表示目標用戶瀏覽和該推薦數(shù)據(jù)相同類型的數(shù)據(jù)的數(shù)量;
46、內(nèi)容新鮮度加分項f(i)的計算公式為:
47、
48、式中,viewy表示該推薦數(shù)據(jù)的當前瀏覽量。
49、進一步地,在步驟s43中,優(yōu)先程度p(u,i)的計算公式為:
50、
51、式中,m表示目標用戶的行為總數(shù),即瀏覽view、搜索search和購買purchase。
52、一種基于用戶屬性分析的數(shù)據(jù)推送系統(tǒng),包括:
53、信息獲取單元,所述信息獲取單元用于獲取歷史用戶和目標用戶的基礎(chǔ)屬性信息;
54、用戶分類單元,所述用戶分類單元用于計算目標用戶的用戶類型;
55、數(shù)據(jù)推送單元,所述數(shù)據(jù)推送單元用于計算用戶類型對應推薦數(shù)據(jù)的優(yōu)先程度,并根據(jù)優(yōu)先程度進行數(shù)據(jù)推送。
56、與現(xiàn)有技術(shù)相比,本發(fā)明提供了一種基于用戶屬性分析的數(shù)據(jù)推送方法及系統(tǒng),具備以下有益效果:
57、1、本發(fā)明相較于常見的數(shù)據(jù)推薦方法來說,考慮到了用戶喜好的動態(tài)變化,根據(jù)用戶最近的行為計算每個推薦數(shù)據(jù)的優(yōu)先程度進行推送,可以有效提高用戶體驗和成交率。
58、2、本發(fā)明相較于其他用戶分類方法來說,采用神經(jīng)網(wǎng)絡模型進行分類,可以挖掘不同用戶和基礎(chǔ)屬性信息之間隱含的關(guān)系,以提高對用戶進行分類的精度,并且在構(gòu)建用戶分類圖網(wǎng)絡時,進一步發(fā)掘了用戶的每個基礎(chǔ)屬性信息之間的相互影響,以進一步提高對用戶進行分類的精度。
59、3、本發(fā)明在計算邊的第一權(quán)重時,考慮到用戶的購買消費記錄、位置信息和瀏覽記錄對邊的權(quán)重的影響,相較于其他的計算方法來說,還考慮到了不同基礎(chǔ)屬性信息之間的相互影響到最對第一權(quán)重的影響,所以本發(fā)明對第一權(quán)重的計算更加精準,便于提高后期對用戶進行分類的精度。