本發(fā)明屬于數(shù)據(jù)挖掘領(lǐng)域,具體涉及評(píng)估用戶的興趣傾向的方法和裝置。
背景技術(shù):
隨著以微博為代表的社交網(wǎng)絡(luò)服務(wù)(SNS)的迅速發(fā)展,對(duì)SNS用戶的分析逐漸成為了熱點(diǎn),尤其是對(duì)用戶的興趣進(jìn)行分析,分析的結(jié)果可以用于各種推薦系統(tǒng),進(jìn)而達(dá)到提升用戶體驗(yàn)和精準(zhǔn)廣告投放的雙贏目的。
在諸如微博的SNS媒體中,有著大量的用戶群體,具有很高的研究?jī)r(jià)值和應(yīng)用價(jià)值。在SNS媒體中,每個(gè)用戶通常擁有自己的好友列表,其中可能包含該用戶的真正朋友、同事、家人,也可能包含用戶的真實(shí)興趣,如體育、財(cái)經(jīng)、旅游等。因此可對(duì)用戶的好友列表進(jìn)行分析以推測(cè)用戶的興趣傾向。
然而,如何對(duì)用戶的好友列表進(jìn)行有效的分析,以得到比較準(zhǔn)確的評(píng)估結(jié)果,一直是本領(lǐng)域未解決的難題。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明提出了一種評(píng)估SNS用戶的興趣傾向的方法和裝置。該方法和裝置通過(guò)計(jì)算能夠反映用戶的實(shí)際興趣的目標(biāo)好友的自身傾向分?jǐn)?shù)以及用戶與該目標(biāo)好友的關(guān)系分?jǐn)?shù),從而可以評(píng)估用戶關(guān)于該目標(biāo)好友的興趣傾向程度。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種評(píng)估用戶的興趣傾向的方法,包括:計(jì)算所述用戶與其好友列表中的目標(biāo)好友的關(guān)系分?jǐn)?shù);計(jì)算所述目標(biāo)好友的自身傾向分?jǐn)?shù);以及根據(jù)所述關(guān)系分?jǐn)?shù)和所述自身傾向分?jǐn)?shù)計(jì)算所述用戶關(guān)于所述目標(biāo)好友的興趣傾向程度。
根據(jù)本發(fā)明的另一方面,提供了一種評(píng)估用戶的興趣傾向的裝置,包括:關(guān)系分?jǐn)?shù)計(jì)算單元,計(jì)算所述用戶與其好友列表中的目標(biāo)好友的關(guān)系分?jǐn)?shù);自身傾向分?jǐn)?shù)計(jì)算單元,計(jì)算所述目標(biāo)好友的自身傾向分?jǐn)?shù);以及興趣傾向程度計(jì)算單元,根據(jù)所述關(guān)系分?jǐn)?shù)計(jì)算單元所計(jì)算的關(guān)系分?jǐn)?shù)和所述自身傾向分?jǐn)?shù)計(jì)算單元所計(jì)算的自身傾向分?jǐn)?shù),計(jì)算所述用戶關(guān)于所述目標(biāo)好友的興趣傾向程度。
根據(jù)本發(fā)明所提供的技術(shù)方案,可評(píng)估用戶的興趣傾向,從而準(zhǔn)確地為用戶推送相關(guān)領(lǐng)域的內(nèi)容或信息,以提升用戶體驗(yàn)。
附圖說(shuō)明
參照附圖來(lái)閱讀本發(fā)明的各實(shí)施方式,將更容易理解本發(fā)明的其它特征和優(yōu)點(diǎn),在此描述的附圖只是為了對(duì)本發(fā)明的實(shí)施方式進(jìn)行示意性說(shuō)明的目的,而非全部可能的實(shí)施,并且不旨在限制本發(fā)明的范圍。在附圖中:
圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式評(píng)估SNS用戶的興趣傾向的方法的流程圖;
圖2示出了根據(jù)本發(fā)明另一個(gè)實(shí)施方式評(píng)估SNS用戶的興趣傾向的方法的流程圖;
圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式計(jì)算用戶與其好友列表中的目標(biāo)好友的關(guān)系分?jǐn)?shù)的流程圖;
圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式計(jì)算用戶與目標(biāo)好友的親密度的流程圖;
圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式用戶的示例性好友關(guān)系圖;
圖6示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式評(píng)估SNS用戶的興趣傾向的裝置的框圖;
圖7示出了根據(jù)本發(fā)明另一個(gè)實(shí)施方式評(píng)估SNS用戶的興趣傾向的裝置的框圖;
圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的關(guān)系分?jǐn)?shù)計(jì)算單元的框圖;
圖9示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的親密度計(jì)算子單元的框圖;以及
圖10示出了可用于實(shí)施根據(jù)本發(fā)明實(shí)施例的方法和系統(tǒng)的計(jì)算機(jī)的 示意性框圖。
具體實(shí)施方式
現(xiàn)參照附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行詳細(xì)描述。應(yīng)注意,以下描述僅僅是示例性的,而并不旨在限制本發(fā)明。此外,在以下描述中,將采用相同的附圖標(biāo)號(hào)表示不同附圖中的相同或相似的部件。在以下描述的不同實(shí)施方式中的不同特征,可彼此結(jié)合,以形成本發(fā)明范圍內(nèi)的其他實(shí)施方式。
圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式評(píng)估SNS用戶的興趣傾向的方法的流程圖。如圖1所示,該方法100包括步驟S110至S130。在步驟S110中,計(jì)算用戶與其好友列表中的目標(biāo)好友的關(guān)系分?jǐn)?shù)。目標(biāo)好友可根據(jù)實(shí)際需要來(lái)選擇,其通常是能夠反映用戶的實(shí)際興趣的好友。在步驟S120中,計(jì)算該目標(biāo)好友的自身傾向分?jǐn)?shù)??梢岳斫?,步驟S110和S120可以并行處理或按先后順序處理,并且其處理順序可以對(duì)調(diào)。隨后,在步驟S130中,根據(jù)上述計(jì)算得到的關(guān)系分?jǐn)?shù)和自身傾向分?jǐn)?shù)計(jì)算該用戶關(guān)于該目標(biāo)好友的興趣傾向程度。
由此,通過(guò)計(jì)算能夠反映用戶的實(shí)際興趣的目標(biāo)好友的自身傾向分?jǐn)?shù)以及用戶與該目標(biāo)好友的關(guān)系分?jǐn)?shù),從而可以評(píng)估用戶關(guān)于該目標(biāo)好友的興趣傾向程度。例如,目標(biāo)好友是一家母嬰產(chǎn)品店,那么其自身傾向分?jǐn)?shù)必然反映出母嬰產(chǎn)品店的特性,如果用戶與其關(guān)系越緊密,則用戶對(duì)母嬰產(chǎn)品的興趣傾向程度就越高,反之,如果用戶與其關(guān)系越疏遠(yuǎn),則用戶對(duì)母嬰產(chǎn)品的興趣傾向程度就沒(méi)那么高。如此,可通過(guò)上述方法評(píng)估用戶的興趣傾向,從而準(zhǔn)確地為用戶推送相關(guān)領(lǐng)域的內(nèi)容或信息,以提升用戶體驗(yàn)。
圖2示出了根據(jù)本發(fā)明另一個(gè)實(shí)施方式評(píng)估SNS用戶的興趣傾向的方法的流程圖。為了簡(jiǎn)要起見(jiàn),以下將僅描述圖2所示的實(shí)施方式與圖1的不同之處,并將略去其相同之處的詳細(xì)描述。如圖2所示,該方法100’包括步驟S105至S130。首先,在步驟S105中,實(shí)時(shí)監(jiān)控用戶的好友列表,并且在檢測(cè)到好友列表發(fā)生變化時(shí),將新加入好友列表的好友作為目標(biāo)好友。此后,可將新加入好友列表的該好友作為目標(biāo)好友進(jìn)行步驟S110至S130的處理。
根據(jù)上述實(shí)施方式,當(dāng)用戶改變其好友列表,加入新的好友時(shí),往往會(huì)反映用戶最新的興趣需求。例如,用戶最近在考慮購(gòu)買(mǎi)汽車(chē),那么該用 戶可能會(huì)新加入一些與汽車(chē)銷(xiāo)售相關(guān)的好友(例如,一些品牌的4S店),那么這正反映了用戶的最新興趣傾向。因此,將新加入好友列表的好友作為目標(biāo)好友進(jìn)行處理,有助于有效地評(píng)估用戶的興趣傾向,并易于得到較好的結(jié)果。
圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式計(jì)算用戶與其好友列表中的目標(biāo)好友的關(guān)系分?jǐn)?shù)的流程圖。如圖3所示,上述步驟S110可包括子步驟S111至S113。在子步驟S111中,計(jì)算用戶與目標(biāo)好友的親密度。在子步驟S112中,計(jì)算目標(biāo)好友與用戶的好友列表中其他好友的相似度??梢岳斫猓硬襟ES111和S112可以并行處理或按先后順序處理,并且其處理順序可以對(duì)調(diào)。隨后,在子步驟S113中,根據(jù)上述計(jì)算得到的親密度和相似度計(jì)算用戶與目標(biāo)好友的關(guān)系分?jǐn)?shù)。
根據(jù)本實(shí)施方式,在計(jì)算用戶與目標(biāo)好友的關(guān)系分?jǐn)?shù)時(shí),考慮了兩方面的因素,即用戶與目標(biāo)好友的親密度以及目標(biāo)好友與用戶的其他好友的相似度。用戶與目標(biāo)好友的親密度越高,二者的關(guān)系也就越緊密。另一方面,目標(biāo)好友與用戶的其他好友的相似度越高,則目標(biāo)好友與用戶的關(guān)系也會(huì)越緊密。由此計(jì)算的關(guān)系分?jǐn)?shù)將更加準(zhǔn)確,并有利于后續(xù)的處理。
根據(jù)本發(fā)明的一個(gè)實(shí)施方式,可通過(guò)下式計(jì)算用戶與目標(biāo)好友的關(guān)系分?jǐn)?shù):
Sfriend=α*Closeness(u,f)+β*Similarity(f,f*) 公式1
其中,Sfriend是用戶與目標(biāo)好友的關(guān)系分?jǐn)?shù),u代表該用戶,f代表目標(biāo)好友,f*代表用戶的好友列表中除了目標(biāo)好友外的其他所有好友,Closeness(u,f)表示用戶與目標(biāo)好友的親密度,Similarity(f,f*)表示目標(biāo)好友與用戶的好友列表中其他所有好友的相似度,α和β均為可調(diào)的系數(shù)。根據(jù)一個(gè)實(shí)施例,α+β=1。
可見(jiàn),用戶與目標(biāo)好友的關(guān)系分?jǐn)?shù)與用戶與目標(biāo)好友的親密度以及目標(biāo)好友與用戶的其他好友的相似度呈正相關(guān)的關(guān)系。也就是說(shuō),如果用戶與目標(biāo)好友的親密度越大,則其關(guān)系越強(qiáng)。如果目標(biāo)好友與用戶的其他好友越相似,則其關(guān)系越強(qiáng)。
圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式計(jì)算用戶與目標(biāo)好友的親密度的流程圖。如圖4所示,上述步驟S111可包括子步驟S111a至S111c。在子步驟S111a中,根據(jù)用戶的好友列表以及用戶與其好友列表中的每個(gè)好友之間的關(guān)系,建立用戶的好友關(guān)系圖。在好友關(guān)系圖建立后,在子步驟 S111b中,識(shí)別好友關(guān)系圖中的最小連通圖。最小連通圖指的是包含該用戶和其至少兩個(gè)好友的不可拆分的完整循環(huán)關(guān)系圖,其詳細(xì)解釋將在下文中進(jìn)行示例性說(shuō)明。隨后,在子步驟S111c中,根據(jù)識(shí)別結(jié)果計(jì)算該用戶與目標(biāo)好友的親密度Closeness(u,f)。
圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式用戶的示例性好友關(guān)系圖。如圖5所示,用戶0的好友列表中包含四個(gè)好友1-4,在好友關(guān)系圖中的每一個(gè)節(jié)點(diǎn)代表該用戶或其一個(gè)好友。好友關(guān)系圖中的每條有方向的連線代表了用戶與好友間以及好友之間的關(guān)注關(guān)系。例如,如圖5所示,該用戶0與好友1為相互關(guān)注關(guān)系,用戶0關(guān)注了好友2,但好友2未關(guān)注用戶0。
可見(jiàn),用戶的好友關(guān)系圖能夠在一定程度上反映出用戶與好友之間的親密程度。例如,用戶0與好友1可能相互認(rèn)識(shí),其關(guān)系較親密。相比較而言,用戶0與好友2之間的關(guān)系可能親密程度較低。由此,可利用好友關(guān)系圖,反映出用戶可能的興趣傾向。例如,如果用戶主動(dòng)關(guān)注一個(gè)親密程度較低的好友,那么該好友的自身興趣傾向很可能預(yù)示了該用戶的某種興趣傾向。如上述示例中所述,當(dāng)用戶近期考慮購(gòu)買(mǎi)汽車(chē)時(shí),該用戶可能會(huì)將某品牌的4S店作為好友關(guān)注,但該用戶與該4S店的親密程度是較低的。反之,與用戶親密程度較高的好友,往往是用戶在現(xiàn)實(shí)生活中彼此認(rèn)識(shí)的朋友,因此該好友不一定能夠反映出用戶的興趣傾向。
根據(jù)本發(fā)明一個(gè)實(shí)施方式,用戶的好友關(guān)系圖由<(p,e)>表示,其中p代表好友關(guān)系圖中具有直接關(guān)系的每個(gè)用戶對(duì),e代表用戶對(duì)p的關(guān)系緊密數(shù)。例如,圖5所示的好友關(guān)系圖可表示為:<((0,1),2),((0,2),1),((0,3),2),((0,4),1),((3,4),2)>。其中,如果一個(gè)用戶對(duì)之間彼此關(guān)注,則關(guān)系緊密數(shù)為2,如果僅有一方關(guān)注了另一方,則關(guān)系緊密數(shù)為1。
在圖5所示的好友關(guān)系圖中,用戶0、好友3和4構(gòu)成了連通圖,該連通圖是一個(gè)完整的循環(huán),并且不可從中拆分出其他完整的循環(huán),因此,該連通圖即為用戶0的好友關(guān)系圖中的最小連通圖??梢岳斫猓粋€(gè)用戶的好友關(guān)系圖中,可包含一個(gè)或多個(gè)最小連通圖。
根據(jù)本發(fā)明一個(gè)實(shí)施方式,如果從好友關(guān)系圖中識(shí)別出的一個(gè)或多個(gè)最小連通圖包含用戶和目標(biāo)好友,則可通過(guò)下式計(jì)算用戶與目標(biāo)好友的親密度Closeness(u,f):
其中,MCG代表最小連通圖,dist(p)代表用戶對(duì)p中的用戶在最小連通圖中到達(dá)用戶的最短路徑長(zhǎng)度數(shù)。
以圖5所示的好友關(guān)系圖為例,如果好友4為目標(biāo)好友,則最小連通圖包含用戶0和目標(biāo)好友4。根據(jù)上述公式2,用戶0和目標(biāo)好友4的親密度Closeness(u,f)=e(0,3)*dist(0,3)+e(3,4)*dist(3,4)+e(0,4)*dist(0,4)=2*1+2*2+1*1=7。
根據(jù)本發(fā)明一個(gè)實(shí)施方式,如果從好友關(guān)系圖中未識(shí)別出最小連通圖,或者從好友關(guān)系圖中識(shí)別出的所有最小連通圖中均不包含該用戶或目標(biāo)好友,則可通過(guò)下式計(jì)算用戶與目標(biāo)好友的親密度Closeness(u,f):
Closeness(u,f)=default_value+|e| 公式3
其中,default_value為預(yù)設(shè)值。
還以圖5所示的好友關(guān)系圖為例,如果好友2為目標(biāo)好友,則從好友關(guān)系圖中識(shí)別出的最小連通圖中未包含目標(biāo)好友2。根據(jù)上述公式3,用戶0和目標(biāo)好友2的親密度Closeness(u,f)=default_value+1。
根據(jù)本發(fā)明一個(gè)實(shí)施方式,可通過(guò)下式計(jì)算目標(biāo)好友與用戶的好友列表中其他好友的相似度Similarity(f,f*):
Similarity(f,f*)=max(sim(Vf,Vf’)) 公式4
其中,f’代表f*中的任一好友,Vf代表目標(biāo)好友f的特征向量,Vf’代表f’的特征向量,sim(Vf,Vf’)代表Vf和Vf’兩個(gè)向量的相似度??蛇x地,可以Vf和Vf’兩個(gè)向量的余弦近似度作為相似度,以用于上述公式4中。
由公式4可以看出,目標(biāo)好友f與用戶的好友列表中其他好友f*的相似度Similarity(f,f*)取決于其特征向量與用戶的其他好友的的特征向量的相似度的最大值。也就是說(shuō),目標(biāo)好友與用戶的某一其他好友越相似,該相似度數(shù)值越大。
根據(jù)一個(gè)實(shí)施例,好友或目標(biāo)好友的特征向量V可由(m,fr,fl,t,w)表示,其中m代表該好友的用戶類(lèi)型,fr代表該好友的好友數(shù)量,fl代表該好友的被關(guān)注數(shù)量,t代表該好友的標(biāo)簽信息,并且w代表從該好友的發(fā)布中抽取的主題詞。可以理解,可根據(jù)實(shí)際需要以任意已知的方式 來(lái)生成用戶的好友的特征向量。特征向量可包含許多不同的信息。
根據(jù)本發(fā)明一個(gè)實(shí)施方式,可通過(guò)下式計(jì)算目標(biāo)好友的自身傾向分?jǐn)?shù):
Sinterest=svm(Vf) 公式5
其中,Sinterest表示目標(biāo)好友的自身傾向分?jǐn)?shù),Vf代表目標(biāo)好友的特征向量,svm(Vf)表示利用分類(lèi)器對(duì)Vf給出的分類(lèi)結(jié)果分?jǐn)?shù)。
對(duì)于每個(gè)預(yù)設(shè)的興趣類(lèi),分類(lèi)器可根據(jù)特征向量,計(jì)算出用戶(或好友)的分類(lèi)結(jié)果分?jǐn)?shù),該分?jǐn)?shù)可反映該用戶(或好友)對(duì)于該興趣類(lèi)的興趣傾向程度。因此,目標(biāo)好友的自身傾向分?jǐn)?shù)Sinterest可反映目標(biāo)好友對(duì)于任一興趣類(lèi)的興趣傾向程度。
根據(jù)本發(fā)明一個(gè)實(shí)施方式,可通過(guò)下式計(jì)算用戶關(guān)于目標(biāo)好友的興趣傾向程度:
興趣傾向程度=Sinterest/Sfriend 公式6。
由上述公式6可以看出,用戶關(guān)于目標(biāo)好友的興趣傾向程度與該用戶和目標(biāo)好友的關(guān)系分?jǐn)?shù)呈負(fù)相關(guān)的關(guān)系。也就是說(shuō),目標(biāo)好友與用戶的關(guān)系分?jǐn)?shù)越大(即,關(guān)系越強(qiáng)),用戶關(guān)于目標(biāo)好友的興趣傾向程度越低。可以理解,如果目標(biāo)好友是用戶實(shí)際生活中關(guān)系緊密的朋友,則其關(guān)系分?jǐn)?shù)會(huì)較大,而用戶的興趣傾向與該好友的關(guān)系并不大。反之,如果目標(biāo)好友僅僅是用戶關(guān)注的例如某個(gè)領(lǐng)域的明星或某個(gè)行業(yè)的店鋪,則其關(guān)系分?jǐn)?shù)會(huì)較小,而該好友能夠在一定程度上反映用戶的興趣傾向。
由上述公式6可以看出,用戶關(guān)于目標(biāo)好友的興趣傾向程度與目標(biāo)好友的自身傾向分?jǐn)?shù)呈正相關(guān)的關(guān)系。也就是說(shuō),目標(biāo)好友的自身傾向程度越強(qiáng)烈,則用戶的興趣傾向程度越大。
圖6示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式評(píng)估用戶的興趣傾向的裝置的框圖。如圖6所示,該裝置600可包括關(guān)系分?jǐn)?shù)計(jì)算單元610、自身傾向分?jǐn)?shù)計(jì)算單元620和興趣傾向程度計(jì)算單元630。關(guān)系分?jǐn)?shù)計(jì)算單元610用于計(jì)算用戶與其好友列表中的目標(biāo)好友的關(guān)系分?jǐn)?shù)。自身傾向分?jǐn)?shù)計(jì)算單元620用于計(jì)算該目標(biāo)好友的自身傾向分?jǐn)?shù)。興趣傾向程度計(jì)算單元630用于根據(jù)關(guān)系分?jǐn)?shù)計(jì)算單元610所計(jì)算的關(guān)系分?jǐn)?shù)和自身傾向分?jǐn)?shù)計(jì)算單元620所計(jì)算的自身傾向分?jǐn)?shù),計(jì)算該用戶關(guān)于該目標(biāo)好友的興趣傾向程度。
圖7示出了根據(jù)本發(fā)明另一個(gè)實(shí)施方式評(píng)估用戶的興趣傾向的裝置的框圖。如圖7所示,除了關(guān)系分?jǐn)?shù)計(jì)算單元610、自身傾向分?jǐn)?shù)計(jì)算單元620和興趣傾向程度計(jì)算單元630以外,該裝置600’還可包括檢測(cè)單元640。檢測(cè)單元640用于實(shí)時(shí)監(jiān)控用戶的好友列表,并在檢測(cè)到好友列表發(fā)生變化時(shí),將新加入好友列表的好友作為目標(biāo)好友。
圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的關(guān)系分?jǐn)?shù)計(jì)算單元的框圖。如圖8所示,關(guān)系分?jǐn)?shù)計(jì)算單元610可包括親密度計(jì)算子單元611、相似度計(jì)算子單元612和關(guān)系分?jǐn)?shù)計(jì)算子單元613。親密度計(jì)算子單元611用于計(jì)算該用戶與該目標(biāo)好友的親密度。相似度計(jì)算子單元612計(jì)算該目標(biāo)好友與用戶的好友列表中其他好友的相似度。關(guān)系分?jǐn)?shù)計(jì)算子單元613用于根據(jù)親密度計(jì)算子單元611所計(jì)算的親密度和相似度計(jì)算子單元612所計(jì)算的相似度計(jì)算關(guān)系分?jǐn)?shù)。
根據(jù)本發(fā)明的一個(gè)實(shí)施方式,關(guān)系分?jǐn)?shù)計(jì)算子單元613可通過(guò)下式計(jì)算用戶與目標(biāo)好友的關(guān)系分?jǐn)?shù):
Sfriend=α*Closeness(u,f)+β*Similarity(f,f*) 公式1
其中,Sfriend是用戶與目標(biāo)好友的關(guān)系分?jǐn)?shù),u代表該用戶,f代表目標(biāo)好友,f*代表用戶的好友列表中除了目標(biāo)好友外的其他所有好友,Closeness(u,f)表示用戶與目標(biāo)好友的親密度,Similarity(f,f*)表示目標(biāo)好友與用戶的好友列表中其他所有好友的相似度,α和β均為可調(diào)的系數(shù)。根據(jù)一個(gè)實(shí)施例,α+β=1。
圖9示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的親密度計(jì)算子單元的框圖。如圖9所示,親密度計(jì)算子單元611可包括好友關(guān)系圖建立模塊611a、最小連通圖識(shí)別模塊611b和計(jì)算模塊611c。好友關(guān)系圖建立模塊611a用于根據(jù)用戶的好友列表以及用戶與其好友列表中的每個(gè)好友之間的關(guān)系,建立用戶的好友關(guān)系圖。最小連通圖識(shí)別模塊611b用于識(shí)別好友關(guān)系圖中的最小連通圖。最小連通圖指的是包含用戶和其至少兩個(gè)好友的不可拆分的完整循環(huán)關(guān)系圖。計(jì)算模塊611c用于根據(jù)最小連通圖識(shí)別模塊611b的識(shí)別結(jié)果計(jì)算用戶與目標(biāo)好友的親密度Closeness(u,f)。
根據(jù)本發(fā)明的一個(gè)實(shí)施方式,用戶的好友關(guān)系圖由<(p,e)>表示,其中p代表好友關(guān)系圖中具有直接關(guān)系的每個(gè)用戶對(duì),e代表用戶對(duì)p的關(guān)系緊密數(shù)。
根據(jù)本發(fā)明一個(gè)實(shí)施方式,如果從好友關(guān)系圖中識(shí)別出的一個(gè)或多個(gè) 最小連通圖包含用戶和目標(biāo)好友,則計(jì)算模塊611c可通過(guò)下式計(jì)算用戶與目標(biāo)好友的親密度Closeness(u,f):
其中,MCG代表最小連通圖,dist(p)代表用戶對(duì)p中的用戶在最小連通圖中到達(dá)用戶的最短路徑長(zhǎng)度數(shù)。
根據(jù)本發(fā)明一個(gè)實(shí)施方式,如果從好友關(guān)系圖中未識(shí)別出最小連通圖,或者從好友關(guān)系圖中識(shí)別出的所有最小連通圖中均不包含該用戶或目標(biāo)好友,則計(jì)算模塊611c可通過(guò)下式計(jì)算用戶與目標(biāo)好友的親密度Closeness(u,f):
Closeness(u,f)=default_value+|e| 公式3
其中,default_value為預(yù)設(shè)值。
根據(jù)本發(fā)明一個(gè)實(shí)施方式,相似度計(jì)算子單元612可通過(guò)下式計(jì)算目標(biāo)好友與用戶的好友列表中其他好友的相似度Similarity(f,f*):
Similarity(f,f*)=max(sim(Vf,Vf’)) 公式4
其中,f’代表f*中的任一好友,Vf代表目標(biāo)好友f的特征向量,Vf’代表f’的特征向量,sim(Vf,Vf’)代表Vf和Vf’兩個(gè)向量的相似度??蛇x地,可以Vf和Vf’兩個(gè)向量的余弦近似度作為相似度,以用于上述公式4中。
根據(jù)本發(fā)明一個(gè)實(shí)施方式,自身傾向分?jǐn)?shù)計(jì)算單元620可通過(guò)下式計(jì)算目標(biāo)好友的自身傾向分?jǐn)?shù):
Sinterest=svm(Vf) 公式5
其中,Sinterest表示目標(biāo)好友的自身傾向分?jǐn)?shù),Vf代表目標(biāo)好友的特征向量,svm(Vf)表示利用分類(lèi)器對(duì)Vf給出的分類(lèi)結(jié)果分?jǐn)?shù)。
根據(jù)本發(fā)明一個(gè)實(shí)施方式,興趣傾向程度計(jì)算單元630可通過(guò)下式計(jì)算用戶關(guān)于目標(biāo)好友的興趣傾向程度:
興趣傾向程度=Sinterest/Sfriend 公式6。
另外,這里尚需指出的是,上述系統(tǒng)中各個(gè)組成部件可以通過(guò)軟件、固件、硬件或其組合的方式進(jìn)行配置。配置可使用的具體手段或方式為本領(lǐng)域技術(shù)人員所熟知,在此不再贅述。在通過(guò)軟件或固件實(shí)現(xiàn)的情況下, 從存儲(chǔ)介質(zhì)或網(wǎng)絡(luò)向具有專(zhuān)用硬件結(jié)構(gòu)的計(jì)算機(jī)(例如圖10所示的通用計(jì)算機(jī)1000)安裝構(gòu)成該軟件的程序,該計(jì)算機(jī)在安裝有各種程序時(shí),能夠執(zhí)行各種功能等。
圖10示出了可用于實(shí)施根據(jù)本發(fā)明實(shí)施例的方法和系統(tǒng)的計(jì)算機(jī)的示意性框圖。
在圖10中,中央處理單元(CPU)1001根據(jù)只讀存儲(chǔ)器(ROM)1002中存儲(chǔ)的程序或從存儲(chǔ)部分1008加載到隨機(jī)存取存儲(chǔ)器(RAM)1003的程序執(zhí)行各種處理。在RAM 1003中,還根據(jù)需要存儲(chǔ)當(dāng)CPU 1001執(zhí)行各種處理等等時(shí)所需的數(shù)據(jù)。CPU 1001、ROM 1002和RAM 1003經(jīng)由總線1004彼此連接。輸入/輸出接口1005也連接到總線1004。
下述部件連接到輸入/輸出接口1005:輸入部分1006(包括鍵盤(pán)、鼠標(biāo)等等)、輸出部分1007(包括顯示器,比如陰極射線管(CRT)、液晶顯示器(LCD)等,和揚(yáng)聲器等)、存儲(chǔ)部分1008(包括硬盤(pán)等)、通信部分1009(包括網(wǎng)絡(luò)接口卡比如LAN卡、調(diào)制解調(diào)器等)。通信部分1009經(jīng)由網(wǎng)絡(luò)比如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動(dòng)器1010也可連接到輸入/輸出接口1005??刹鹦督橘|(zhì)1011比如磁盤(pán)、光盤(pán)、磁光盤(pán)、半導(dǎo)體存儲(chǔ)器等等可以根據(jù)需要被安裝在驅(qū)動(dòng)器1010上,使得從中讀出的計(jì)算機(jī)程序根據(jù)需要被安裝到存儲(chǔ)部分1008中。
在通過(guò)軟件實(shí)現(xiàn)上述系列處理的情況下,從網(wǎng)絡(luò)比如因特網(wǎng)或存儲(chǔ)介質(zhì)比如可拆卸介質(zhì)1011安裝構(gòu)成軟件的程序。
本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這種存儲(chǔ)介質(zhì)不局限于圖10所示的其中存儲(chǔ)有程序、與設(shè)備相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)1011??刹鹦督橘|(zhì)1011的例子包含磁盤(pán)(包含軟盤(pán)(注冊(cè)商標(biāo)))、光盤(pán)(包含光盤(pán)只讀存儲(chǔ)器(CD-ROM)和數(shù)字通用盤(pán)(DVD))、磁光盤(pán)(包含迷你盤(pán)(MD)(注冊(cè)商標(biāo)))和半導(dǎo)體存儲(chǔ)器?;蛘撸鎯?chǔ)介質(zhì)可以是ROM 1002、存儲(chǔ)部分1008中包含的硬盤(pán)等等,其中存有程序,并且與包含它們的設(shè)備一起被分發(fā)給用戶。
本發(fā)明還提出一種存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品。所述指令代碼由機(jī)器讀取并執(zhí)行時(shí),可執(zhí)行上述根據(jù)本發(fā)明實(shí)施方式的方法。
相應(yīng)地,用于承載上述存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品的存儲(chǔ)介質(zhì)也包括在本發(fā)明的范圍內(nèi)。所述存儲(chǔ)介質(zhì)包括但不限于軟盤(pán)、光盤(pán)、磁光盤(pán)、存儲(chǔ)卡、存儲(chǔ)棒等等。
應(yīng)當(dāng)注意,本發(fā)明的方法不限于按照說(shuō)明書(shū)中描述的時(shí)間順序來(lái)執(zhí)行,也可以按照其他的次序順序地、并行地或獨(dú)立地執(zhí)行。因此,本說(shuō)明書(shū)中描述的方法的執(zhí)行順序不對(duì)本發(fā)明的技術(shù)范圍構(gòu)成限制。
以上對(duì)本發(fā)明各實(shí)施方式的描述是為了更好地理解本發(fā)明,其僅僅是示例性的,而非旨在對(duì)本發(fā)明進(jìn)行限制。應(yīng)注意,在以上描述中,針對(duì)一種實(shí)施方式描述和/或示出的特征可以以相同或類(lèi)似的方式在一個(gè)或更多個(gè)其它實(shí)施方式中使用,與其它實(shí)施方式中的特征相組合,或替代其它實(shí)施方式中的特征。本領(lǐng)域技術(shù)人員可以理解,在不脫離本發(fā)明的發(fā)明構(gòu)思的情況下,針對(duì)以上所描述的實(shí)施方式進(jìn)行的各種變化和修改,均屬于本發(fā)明的范圍內(nèi)。
綜上,在根據(jù)本發(fā)明的實(shí)施例中,本發(fā)明提供了如下技術(shù)方案。
方案1、一種評(píng)估用戶的興趣傾向的方法,包括:
計(jì)算所述用戶與其好友列表中的目標(biāo)好友的關(guān)系分?jǐn)?shù);
計(jì)算所述目標(biāo)好友的自身傾向分?jǐn)?shù);以及
根據(jù)所述關(guān)系分?jǐn)?shù)和所述自身傾向分?jǐn)?shù)計(jì)算所述用戶關(guān)于所述目標(biāo)好友的興趣傾向程度。
方案2、如方案1所述的方法,還包括:
實(shí)時(shí)監(jiān)控所述用戶的好友列表,并在檢測(cè)到所述好友列表發(fā)生變化時(shí),將新加入所述好友列表的好友作為所述目標(biāo)好友。
方案3、如方案1或2所述的方法,其中計(jì)算所述用戶與其好友列表中的目標(biāo)好友的關(guān)系分?jǐn)?shù)包括:
計(jì)算所述用戶與所述目標(biāo)好友的親密度;
計(jì)算所述目標(biāo)好友與所述用戶的好友列表中其他好友的相似度;以及
根據(jù)所述親密度和所述相似度計(jì)算所述關(guān)系分?jǐn)?shù)。
方案4、如方案3所述的方法,其中所述用戶與所述目標(biāo)好友的關(guān)系分?jǐn)?shù)通過(guò)下式計(jì)算得出:
Sfriend=α*Closeness(u,f)+β*Similarity(f,f*)
其中,Sfriend代表所述用戶與所述目標(biāo)好友的關(guān)系分?jǐn)?shù),Closeness(u,f)代表所述用戶與所述目標(biāo)好友的親密度,u代表所述用戶,f代表所述目標(biāo)好友,f*代表所述用戶的好友列表中除了所述目標(biāo)好友外的其他所有 好友,Similarity(f,f*)代表所述目標(biāo)好友與所述用戶的好友列表中其他所有好友的相似度,α和β分別代表可調(diào)的系數(shù)。
方案5、如方案4所述的方法,其中計(jì)算所述用戶與所述目標(biāo)好友的親密度包括:
根據(jù)所述用戶的好友列表以及所述用戶與其好友列表中的每個(gè)好友之間的關(guān)系,建立所述用戶的好友關(guān)系圖;
識(shí)別所述好友關(guān)系圖中的最小連通圖,其中所述最小連通圖是包含所述用戶和其至少兩個(gè)好友的不可拆分的完整循環(huán)關(guān)系圖;以及
根據(jù)識(shí)別結(jié)果計(jì)算所述用戶與所述目標(biāo)好友的親密度Closeness(u,f)。
方案6、如方案5所述的方法,其中所述用戶的好友關(guān)系圖由<(p,e)>表示,其中p代表所述好友關(guān)系圖中具有直接關(guān)系的每個(gè)用戶對(duì),e代表用戶對(duì)p的關(guān)系緊密數(shù)。
方案7、如方案6所述的方法,其中當(dāng)從所述好友關(guān)系圖中識(shí)別出包含所述用戶和所述目標(biāo)好友的至少一個(gè)最小連通圖時(shí),所述用戶與所述目標(biāo)好友的親密度Closeness(u,f)通過(guò)下式計(jì)算得出:
其中,MCG代表最小連通圖,dist(p)代表用戶對(duì)p中的用戶在最小連通圖中到達(dá)所述用戶的最短路徑長(zhǎng)度數(shù);
或者
當(dāng)從所述好友關(guān)系圖中識(shí)別出不具有包含所述用戶和所述目標(biāo)好友的最小連通圖時(shí),所述用戶與所述目標(biāo)好友的親密度Closeness(u,f)通過(guò)下式計(jì)算得出:
Closeness(u,f)=default_value+|e|
其中,default_value為預(yù)設(shè)值。
方案8、如方案4至7中任一項(xiàng)所述的方法,其中所述目標(biāo)好友與所述用戶的好友列表中其他好友的相似度Similarity(f,f*)通過(guò)下式計(jì)算得出:
Similarity(f,f*)=max(sim(Vf,Vf’))
其中,f’代表f*中的任一好友,Vf代表所述目標(biāo)好友f的特征向量,Vf’代表f’的特征向量,sim(Vf,Vf’)代表Vf和Vf’兩個(gè)向量的相似度。
方案9、如方案1至8中任一項(xiàng)所述的方法,其中所述目標(biāo)好友的自身傾向分?jǐn)?shù)通過(guò)下式計(jì)算得出:
Sinterest=svm(Vf)
其中,Sinterest表示所述目標(biāo)好友的自身傾向分?jǐn)?shù),Vf代表所述目標(biāo)好友的特征向量,svm(Vf)表示利用分類(lèi)器對(duì)Vf給出的分類(lèi)結(jié)果分?jǐn)?shù)。
方案10、如方案1至9中任一項(xiàng)所述的方法,其中所述用戶關(guān)于所述目標(biāo)好友的興趣傾向程度通過(guò)下式計(jì)算得出:
興趣傾向程度=目標(biāo)好友的自身傾向分?jǐn)?shù)/關(guān)系分?jǐn)?shù)。
方案11、一種評(píng)估用戶的興趣傾向的裝置,包括:
關(guān)系分?jǐn)?shù)計(jì)算單元,計(jì)算所述用戶與其好友列表中的目標(biāo)好友的關(guān)系分?jǐn)?shù);
自身傾向分?jǐn)?shù)計(jì)算單元,計(jì)算所述目標(biāo)好友的自身傾向分?jǐn)?shù);以及
興趣傾向程度計(jì)算單元,根據(jù)所述關(guān)系分?jǐn)?shù)計(jì)算單元所計(jì)算的關(guān)系分?jǐn)?shù)和所述自身傾向分?jǐn)?shù)計(jì)算單元所計(jì)算的自身傾向分?jǐn)?shù),計(jì)算所述用戶關(guān)于所述目標(biāo)好友的興趣傾向程度。
方案12、如方案11所述的裝置,還包括:
檢測(cè)單元,實(shí)時(shí)監(jiān)控所述用戶的好友列表,并在檢測(cè)到所述好友列表發(fā)生變化時(shí),將新加入所述好友列表的好友作為所述目標(biāo)好友。
方案13、如方案11或12所述的裝置,其中所述關(guān)系分?jǐn)?shù)計(jì)算單元包括:
親密度計(jì)算子單元,計(jì)算所述用戶與所述目標(biāo)好友的親密度;
相似度計(jì)算子單元,計(jì)算所述目標(biāo)好友與所述用戶的好友列表中其他好友的相似度;以及
關(guān)系分?jǐn)?shù)計(jì)算子單元,根據(jù)所述親密度計(jì)算子單元所計(jì)算的親密度和所述相似度計(jì)算子單元所計(jì)算的相似度計(jì)算所述關(guān)系分?jǐn)?shù)。
方案14、如方案13所述的裝置,其中所述關(guān)系分?jǐn)?shù)計(jì)算子單元通過(guò)下式計(jì)算所述用戶與所述目標(biāo)好友的關(guān)系分?jǐn)?shù):
Sfriend=α*Closeness(u,f)+β*Similarity(f,f*)
其中,Sfriend代表所述用戶與所述目標(biāo)好友的關(guān)系分?jǐn)?shù),Closeness(u,f)代表所述用戶與所述目標(biāo)好友的親密度,u代表所述用戶,f代表所述目標(biāo)好友,f*代表所述用戶的好友列表中除了所述目標(biāo)好友外的其他所有好友,Similarity(f,f*)代表所述目標(biāo)好友與所述用戶的好友列表中其他所有好友的相似度,α和β分別代表可調(diào)的系數(shù)。
方案15、如方案14所述的裝置,其中所述親密度計(jì)算子單元包括:
好友關(guān)系圖建立模塊,根據(jù)所述用戶的好友列表以及所述用戶與其好友列表中的每個(gè)好友之間的關(guān)系,建立所述用戶的好友關(guān)系圖;
最小連通圖識(shí)別模塊,識(shí)別所述好友關(guān)系圖建立模塊所建立的好友關(guān)系圖中的最小連通圖,其中所述最小連通圖是包含所述用戶和其至少兩個(gè)好友的不可拆分的完整循環(huán)關(guān)系圖;以及
計(jì)算模塊,根據(jù)所述最小連通圖識(shí)別模塊的識(shí)別結(jié)果計(jì)算所述用戶與所述目標(biāo)好友的親密度Closeness(u,f)。
方案16、如方案15所述的裝置,其中所述用戶的好友關(guān)系圖由<(p,e)>表示,其中p代表所述好友關(guān)系圖中具有直接關(guān)系的每個(gè)用戶對(duì),e代表用戶對(duì)p的關(guān)系緊密數(shù)。
方案17、如方案16所述的裝置,其中當(dāng)所述最小連通圖識(shí)別模塊從所述好友關(guān)系圖中識(shí)別出包含所述用戶和所述目標(biāo)好友的至少一個(gè)最小連通圖時(shí),所述計(jì)算模塊通過(guò)下式計(jì)算所述用戶與所述目標(biāo)好友的親密度Closeness(u,f):
其中,MCG代表最小連通圖,dist(p)代表用戶對(duì)p中的用戶在最小連通圖中到達(dá)所述用戶的最短路徑長(zhǎng)度數(shù);
或者
當(dāng)所述最小連通圖識(shí)別模塊從所述好友關(guān)系圖中識(shí)別出不具有包含所述用戶和所述目標(biāo)好友的最小連通圖時(shí),所述計(jì)算模塊通過(guò)下式計(jì)算所述用戶與所述目標(biāo)好友的親密度Closeness(u,f):
Closeness(u,f)=default_value+|e|
其中,default_value為預(yù)設(shè)值。
方案18、如方案14至17中任一項(xiàng)所述的裝置,其中所述相似度計(jì)算子單元通過(guò)下式計(jì)算所述目標(biāo)好友與所述用戶的好友列表中其他好友的相似度Similarity(f,f*):
Similarity(f,f*)=max(sim(Vf,Vf’))
其中,f’代表f*中的任一好友,Vf代表所述目標(biāo)好友f的特征向量,Vf’代表f’的特征向量,sim(Vf,Vf’)代表Vf和Vf’兩個(gè)向量的相似度。
方案19、如方案11至18中任一項(xiàng)所述的裝置,其中所述自身傾向分?jǐn)?shù)計(jì)算單元通過(guò)下式計(jì)算所述目標(biāo)好友的自身傾向分?jǐn)?shù):
Sinterest=svm(Vf)
其中,Sinterest表示所述目標(biāo)好友的自身傾向分?jǐn)?shù),Vf代表所述目標(biāo)好友的特征向量,svm(Vf)表示利用分類(lèi)器對(duì)Vf給出的分類(lèi)結(jié)果分?jǐn)?shù)。
方案20、如方案11至19中任一項(xiàng)所述的裝置,其中所述興趣傾向程度計(jì)算單元通過(guò)下式計(jì)算所述用戶關(guān)于所述目標(biāo)好友的興趣傾向程度:
興趣傾向程度=目標(biāo)好友的自身傾向分?jǐn)?shù)/關(guān)系分?jǐn)?shù)。