本發(fā)明涉及通信,特別是指一種用戶標(biāo)識(shí)確定方法、裝置及電子設(shè)備。
背景技術(shù):
1、隨著數(shù)字化時(shí)代的發(fā)展,考慮基于構(gòu)建自有客戶關(guān)系管理系統(tǒng)(customerrelationship?management?system,crms)及客戶數(shù)據(jù)平臺(tái)(customer?data?platform,cdp),來聯(lián)通各個(gè)用戶相關(guān)的數(shù)據(jù)平臺(tái)??紤]用戶標(biāo)識(shí)(user?id,uid)應(yīng)該具有唯一性,代表用戶可識(shí)別的唯一身份標(biāo)識(shí),比如crms、cdp等可以通過對(duì)uid的管理,發(fā)現(xiàn)用戶的個(gè)人信息、喜好等信息,為用戶提供更好的服務(wù)。通常情況下,針對(duì)企業(yè)官網(wǎng)、會(huì)員系統(tǒng)、app等,crms、cdp等可以存儲(chǔ)有終端客戶的各類信息,考慮不同的系統(tǒng)中這些數(shù)據(jù)可能不一致,且不同來源的數(shù)據(jù)往往對(duì)應(yīng)有不同的uid,這將不便于crms、cdp等進(jìn)行統(tǒng)一的用戶管理以提供更好的服務(wù)。
2、為了實(shí)現(xiàn)用戶的統(tǒng)一管理,需要通過uid統(tǒng)一映射的方式,將從多源采集到的數(shù)據(jù)里提取到的id信息進(jìn)行數(shù)據(jù)統(tǒng)一映射,形成數(shù)據(jù)銜接。其中,id統(tǒng)一映射是指將不同系統(tǒng)中的用戶id進(jìn)行映射,可以通過對(duì)不同渠道、系統(tǒng)的同一用戶身份進(jìn)行統(tǒng)一標(biāo)識(shí),實(shí)現(xiàn)系統(tǒng)間的用戶關(guān)聯(lián)。id統(tǒng)一映射包括兩部分,首先是id之間的匹配,即提取出所采集到的數(shù)據(jù)里的源id信息,此時(shí)會(huì)形成多個(gè)用戶id,需要對(duì)多個(gè)用戶id進(jìn)行id統(tǒng)一映射;然后是將多個(gè)用戶id下的行為、屬性等數(shù)據(jù)串標(biāo)記在統(tǒng)一用戶id上,這個(gè)步驟就是數(shù)據(jù)映射;也就是說,id統(tǒng)一映射與數(shù)據(jù)映射是銜接的過程。但是目前uid統(tǒng)一映射的方式通常是基于采集到的數(shù)據(jù)中包含有相同的手機(jī)號(hào),或者相同的身份證號(hào),或者相同的郵箱,或者相同的設(shè)備id等,將不同來源數(shù)據(jù)進(jìn)行uid統(tǒng)一映射,這種方式的uid統(tǒng)一性較差,無法滿足更高的用戶管理需求。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提供一種用戶標(biāo)識(shí)確定方法、裝置及電子設(shè)備,以解決目前的uid統(tǒng)一映射的方式存在uid統(tǒng)一性較差,無法滿足更高的用戶管理需求的問題。
2、為達(dá)到上述目的,本發(fā)明的實(shí)施例提供一種用戶標(biāo)識(shí)確定方法,包括:
3、獲取多個(gè)用戶使用數(shù)據(jù);其中,所述用戶使用數(shù)據(jù)包括與用戶標(biāo)識(shí)相關(guān)的一個(gè)或多個(gè)用戶信息;
4、根據(jù)所述用戶信息,對(duì)所述多個(gè)用戶使用數(shù)據(jù)進(jìn)行歸類,確定多個(gè)初始數(shù)據(jù)分組;其中,每個(gè)所述初始數(shù)據(jù)分組對(duì)應(yīng)至少一個(gè)所述用戶使用數(shù)據(jù),且每個(gè)所述初始數(shù)據(jù)分組中的不同用戶使用數(shù)據(jù)包含相同的用戶信息和/或不同用戶使用數(shù)據(jù)之間的用戶信息相似度滿足預(yù)設(shè)條件;
5、根據(jù)社區(qū)發(fā)現(xiàn)算法,對(duì)所述多個(gè)初始數(shù)據(jù)分組進(jìn)行合并,得到目標(biāo)數(shù)據(jù)分組;
6、針對(duì)每個(gè)目標(biāo)數(shù)據(jù)分組,生成所述目標(biāo)數(shù)據(jù)分組對(duì)應(yīng)的統(tǒng)一用戶標(biāo)識(shí)。
7、可選地,所述根據(jù)所述用戶信息,對(duì)所述多個(gè)用戶使用數(shù)據(jù)進(jìn)行歸類,確定多個(gè)初始數(shù)據(jù)分組,包括:
8、根據(jù)所述用戶信息,基于第一規(guī)則確定對(duì)所述多個(gè)用戶使用數(shù)據(jù)歸類得到的多個(gè)初始數(shù)據(jù)分組;其中,所述第一規(guī)則是:將包含相同用戶信息的用戶使用數(shù)據(jù)歸類為同一初始數(shù)據(jù)分組;
9、和/或,
10、根據(jù)所述用戶信息,基于第二規(guī)則確定對(duì)所述多個(gè)用戶使用數(shù)據(jù)歸類得到的多個(gè)初始數(shù)據(jù)分組;其中,所述第二規(guī)則是:針對(duì)包含不同用戶信息的用戶使用數(shù)據(jù),將用戶信息的相似度滿足預(yù)設(shè)條件的用戶使用數(shù)據(jù)歸類為同一初始數(shù)據(jù)分組。
11、可選地,所述根據(jù)所述用戶信息,基于第二規(guī)則確定對(duì)所述多個(gè)用戶使用數(shù)據(jù)歸類得到的多個(gè)初始數(shù)據(jù)分組,包括:
12、按照用戶信息所屬的類型,對(duì)目標(biāo)用戶使用數(shù)據(jù)中的用戶信息進(jìn)行歸類,確定至少一個(gè)類型分組;其中,所述目標(biāo)用戶使用數(shù)據(jù)是包含不同用戶信息的用戶使用數(shù)據(jù),每個(gè)類型分組對(duì)應(yīng)至少一個(gè)用戶信息;
13、針對(duì)每個(gè)類型分組,分別確定所述類型分組中不同用戶信息之間的相似度;
14、針對(duì)不同用戶使用數(shù)據(jù),根據(jù)至少一個(gè)類型分組對(duì)應(yīng)的不同用戶信息之間的相似度,確定不同用戶使用數(shù)據(jù)之間的相關(guān)度;
15、將相關(guān)度大于第一閾值的不同用戶使用數(shù)據(jù)歸類為同一初始數(shù)據(jù)分組,確定對(duì)所述多個(gè)用戶使用數(shù)據(jù)歸類得到的多個(gè)初始數(shù)據(jù)分組。
16、可選地,所述針對(duì)每個(gè)類型分組,分別確定所述類型分組中不同用戶信息之間的相似度,包括:
17、針對(duì)每個(gè)類型分組,將所述類型分組中的每個(gè)用戶信息進(jìn)行結(jié)構(gòu)劃分,得到多個(gè)字段;
18、針對(duì)每個(gè)用戶信息所劃分得到的多個(gè)字段,將不同用戶信息之間對(duì)應(yīng)的每個(gè)字段分別進(jìn)行相似度比對(duì),并基于所述多個(gè)字段的比對(duì)結(jié)果確定不同用戶信息之間的相似度。
19、可選地,所述針對(duì)不同用戶使用數(shù)據(jù),根據(jù)至少一個(gè)類型分組對(duì)應(yīng)的不同用戶信息之間的相似度,確定不同用戶使用數(shù)據(jù)之間的相關(guān)度,包括:
20、針對(duì)不同用戶使用數(shù)據(jù),將每個(gè)類型分組對(duì)應(yīng)的不同用戶信息之間的相似度的加權(quán)之和,確定為不同用戶使用數(shù)據(jù)之間的相關(guān)度。
21、可選地,所述根據(jù)社區(qū)發(fā)現(xiàn)算法,對(duì)所述多個(gè)初始數(shù)據(jù)分組進(jìn)行合并,得到目標(biāo)數(shù)據(jù)分組,包括:
22、以每個(gè)初始數(shù)據(jù)分組作為社區(qū)節(jié)點(diǎn),基于不同初始數(shù)據(jù)分組中用戶使用數(shù)據(jù)之間的相關(guān)性連接不同社區(qū)節(jié)點(diǎn),構(gòu)建社區(qū)網(wǎng)絡(luò);
23、基于所述社區(qū)網(wǎng)絡(luò),采用社區(qū)發(fā)現(xiàn)算法對(duì)多個(gè)社區(qū)節(jié)點(diǎn)進(jìn)行社區(qū)合并;
24、在任意兩個(gè)社區(qū)節(jié)點(diǎn)不滿足合并條件的情況下,確定得到目標(biāo)數(shù)據(jù)分組。
25、可選地,所述基于所述社區(qū)網(wǎng)絡(luò),采用社區(qū)發(fā)現(xiàn)算法對(duì)多個(gè)社區(qū)節(jié)點(diǎn)進(jìn)行社區(qū)合并,包括:
26、基于所述社區(qū)網(wǎng)絡(luò),采用社區(qū)發(fā)現(xiàn)算法對(duì)多個(gè)社區(qū)節(jié)點(diǎn)進(jìn)行k個(gè)階段的社區(qū)合并;
27、其中,每個(gè)階段的社區(qū)合并按照以下步驟執(zhí)行:
28、從第i個(gè)階段的社區(qū)網(wǎng)絡(luò)中選擇多個(gè)社區(qū)節(jié)點(diǎn)作為種子節(jié)點(diǎn);
29、采用社區(qū)發(fā)現(xiàn)算法,將滿足合并條件的鄰節(jié)點(diǎn)與所述鄰節(jié)點(diǎn)對(duì)應(yīng)的種子節(jié)點(diǎn)進(jìn)行合并;其中,所述鄰節(jié)點(diǎn)是所述第i個(gè)階段社區(qū)合并后的社區(qū)節(jié)點(diǎn)中除所述種子節(jié)點(diǎn)之外的社區(qū)節(jié)點(diǎn),k、i為正整數(shù),i≤k。
30、可選地,所述從第i個(gè)階段的社區(qū)網(wǎng)絡(luò)中選擇多個(gè)社區(qū)節(jié)點(diǎn)作為種子節(jié)點(diǎn),包括:
31、針對(duì)第i個(gè)階段的社區(qū)網(wǎng)絡(luò)中每個(gè)社區(qū)節(jié)點(diǎn),根據(jù)所述社區(qū)節(jié)點(diǎn)的度、所述社區(qū)節(jié)點(diǎn)的鄰節(jié)點(diǎn)的度,以及所述社區(qū)節(jié)點(diǎn)與每個(gè)鄰節(jié)點(diǎn)對(duì)應(yīng)的不同用戶使用數(shù)據(jù)之間的相關(guān)度,計(jì)算得到每個(gè)社區(qū)節(jié)點(diǎn)的影響力值;
32、根據(jù)每個(gè)社區(qū)節(jié)點(diǎn)的影響力值,多個(gè)社區(qū)節(jié)點(diǎn)作為種子節(jié)點(diǎn);其中,所述種子節(jié)點(diǎn)的影響力值大于所述種子節(jié)點(diǎn)的鄰節(jié)點(diǎn)的影響力值。
33、可選地,所述采用社區(qū)發(fā)現(xiàn)算法,將滿足合并條件的鄰節(jié)點(diǎn)與所述鄰節(jié)點(diǎn)對(duì)應(yīng)的種子節(jié)點(diǎn)進(jìn)行合并,包括:
34、采用社區(qū)發(fā)現(xiàn)算法執(zhí)行多輪合并;其中,每一輪合并的過程按照以下步驟執(zhí)行:
35、針對(duì)每個(gè)種子節(jié)點(diǎn),分別計(jì)算所述種子節(jié)點(diǎn)的每個(gè)鄰節(jié)點(diǎn)合并到所述種子節(jié)點(diǎn)內(nèi)的模塊度增益;
36、若目標(biāo)鄰節(jié)點(diǎn)對(duì)應(yīng)的模塊度增益大于第二閾值,則將所述目標(biāo)鄰節(jié)點(diǎn)與所述種子節(jié)點(diǎn)進(jìn)行合并;否則,不合并所述目標(biāo)鄰節(jié)點(diǎn);其中,所述目標(biāo)鄰節(jié)點(diǎn)為所述種子節(jié)點(diǎn)的任意鄰節(jié)點(diǎn)。
37、可選地,所述針對(duì)每個(gè)種子節(jié)點(diǎn),分別計(jì)算所述種子節(jié)點(diǎn)的每個(gè)鄰節(jié)點(diǎn)合并到所述種子節(jié)點(diǎn)中的模塊度增益,包括:
38、針對(duì)所述種子節(jié)點(diǎn)的每個(gè)鄰節(jié)點(diǎn),根據(jù)第一邊的權(quán)重和、第二邊的權(quán)重和、第三邊的權(quán)重和,以及所述種子節(jié)點(diǎn)的社區(qū)總度數(shù),計(jì)算得到所述鄰節(jié)點(diǎn)合并到所述種子節(jié)點(diǎn)內(nèi)的模塊度增益;
39、其中,所述第一邊的權(quán)重和是:所述鄰節(jié)點(diǎn)連接到所述種子節(jié)點(diǎn)內(nèi)的邊的權(quán)重和;所述第二邊的權(quán)重和是:連接到所述鄰節(jié)點(diǎn)的所有邊的權(quán)重和;所述第三邊的權(quán)重和是:所述第i個(gè)階段的社區(qū)網(wǎng)絡(luò)內(nèi)所有邊的權(quán)重和。
40、可選地,所述模塊度增益的計(jì)算公式為:
41、
42、其中,δq為所述模塊度增益,ki,in為所述第一邊的權(quán)重和,ki為所述第二邊的權(quán)重和,m為所述第三邊的權(quán)重和,σtot為所述總度數(shù)。
43、可選地,所述任意兩個(gè)社區(qū)節(jié)點(diǎn)不滿足合并條件是:任意兩個(gè)社區(qū)節(jié)點(diǎn)中的一個(gè)社區(qū)節(jié)點(diǎn)合并到另一個(gè)社區(qū)節(jié)點(diǎn)內(nèi)的模塊度增益小于或等于第二閾值。
44、可選地,所述方法還包括:
45、獲取新的用戶使用數(shù)據(jù);其中,所述新的用戶使用數(shù)據(jù)包括與用戶標(biāo)識(shí)相關(guān)的一個(gè)或多個(gè)用戶信息;
46、若所述新的用戶使用數(shù)據(jù)與第一目標(biāo)數(shù)據(jù)分組中的用戶使用數(shù)據(jù)包含相同的用戶信息,或者所述新的用戶使用數(shù)據(jù)與所述第一目標(biāo)數(shù)據(jù)分組中的用戶使用數(shù)據(jù)之間的用戶信息相似度滿足預(yù)設(shè)條件,則將所述第一目標(biāo)數(shù)據(jù)分組對(duì)應(yīng)的統(tǒng)一用戶標(biāo)識(shí)確定為所述新的用戶使用數(shù)據(jù)的統(tǒng)一用戶標(biāo)識(shí);否則,將所述新的用戶使用數(shù)據(jù)作為新的社區(qū)節(jié)點(diǎn);
47、若基于社區(qū)發(fā)現(xiàn)算法,所述新的社區(qū)節(jié)點(diǎn)與第二目標(biāo)數(shù)據(jù)分組對(duì)應(yīng)的社區(qū)節(jié)點(diǎn)滿足合并條件,則將所述第二目標(biāo)數(shù)據(jù)分組對(duì)應(yīng)的統(tǒng)一用戶標(biāo)識(shí)確定為所述新的用戶使用數(shù)據(jù)的統(tǒng)一用戶標(biāo)識(shí);否則,生成所述新的用戶使用數(shù)據(jù)對(duì)應(yīng)的統(tǒng)一用戶標(biāo)識(shí)。
48、為達(dá)到上述目的,本發(fā)明的實(shí)施例提供一種用戶標(biāo)識(shí)確定裝置,包括:
49、獲取模塊,用于獲取多個(gè)用戶使用數(shù)據(jù);其中,所述用戶使用數(shù)據(jù)包括與用戶標(biāo)識(shí)相關(guān)的一個(gè)或多個(gè)用戶信息;
50、歸類模塊,用于根據(jù)所述用戶信息,對(duì)所述多個(gè)用戶使用數(shù)據(jù)進(jìn)行歸類,確定多個(gè)初始數(shù)據(jù)分組;其中,每個(gè)所述初始數(shù)據(jù)分組對(duì)應(yīng)至少一個(gè)所述用戶使用數(shù)據(jù),且每個(gè)所述初始數(shù)據(jù)分組中的不同用戶使用數(shù)據(jù)包含相同的用戶信息和/或不同用戶使用數(shù)據(jù)之間的用戶信息相似度滿足預(yù)設(shè)條件;
51、合并模塊,用于根據(jù)社區(qū)發(fā)現(xiàn)算法,對(duì)所述多個(gè)初始數(shù)據(jù)分組進(jìn)行合并,得到目標(biāo)數(shù)據(jù)分組;
52、生成模塊,用于針對(duì)每個(gè)目標(biāo)數(shù)據(jù)分組,生成所述目標(biāo)數(shù)據(jù)分組對(duì)應(yīng)的統(tǒng)一用戶標(biāo)識(shí)。
53、為達(dá)到上述目的,本發(fā)明的實(shí)施例提供一種電子設(shè)備,包括:收發(fā)器、處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的程序或指令;所述處理器執(zhí)行所述程序或指令時(shí)實(shí)現(xiàn)如上所述的用戶標(biāo)識(shí)確定方法的步驟。
54、為達(dá)到上述目的,本發(fā)明的實(shí)施例提供一種可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有程序或指令,所述程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的用戶標(biāo)識(shí)確定方法的步驟。
55、本發(fā)明的上述技術(shù)方案的有益效果如下:
56、本發(fā)明實(shí)施例中,根據(jù)多個(gè)用戶使用數(shù)據(jù)中的用戶信息,對(duì)所述多個(gè)用戶使用數(shù)據(jù)進(jìn)行歸類,確定多個(gè)初始數(shù)據(jù)分組,并根據(jù)社區(qū)發(fā)現(xiàn)算法,對(duì)所述多個(gè)初始數(shù)據(jù)分組進(jìn)行合并,得到目標(biāo)數(shù)據(jù)分組。這樣基于該目標(biāo)數(shù)據(jù)分組來生成統(tǒng)一用戶標(biāo)識(shí),即實(shí)現(xiàn)針對(duì)多用戶使用數(shù)據(jù)的精確用戶id映射,并基于精確用戶id映射生成的統(tǒng)一用戶標(biāo)識(shí)提供用戶服務(wù),即保證uid管理具有較高的統(tǒng)一性,并且可以滿足更高的用戶管理需求。