用于推斷主題之間的關(guān)系的方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種用于推斷主題之間的關(guān)系的方法和系統(tǒng)。各實(shí)施例涉及基于圖分析而估計(jì)主題的接近度。訪問(wèn)包括多個(gè)節(jié)點(diǎn)和邊的圖。所述圖中的每個(gè)節(jié)點(diǎn)表示主題,并且每個(gè)邊表示兩個(gè)主題之間的已知關(guān)聯(lián)。針對(duì)所述圖執(zhí)行統(tǒng)計(jì)遍歷試驗(yàn)?;趶乃鼋y(tǒng)計(jì)遍歷試驗(yàn)提取的統(tǒng)計(jì)信息,推斷由所述圖中的節(jié)點(diǎn)表示的任何兩個(gè)主題之間的關(guān)系強(qiáng)度。
【專利說(shuō)明】用于推斷主題之間的關(guān)系的方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本公開一般地涉及圖分析,更具體地說(shuō),涉及基于圖分析估計(jì)主題的接近度。
【背景技術(shù)】
[0002] 搜索引擎已經(jīng)成為有用的工具,有助于用戶在因特網(wǎng)中查找感興趣的信息。通常, 當(dāng)用戶希望使用搜索引擎時(shí),用戶可以在搜索框中輸入搜索查詢。用戶然后可以提交搜索 引擎,這可以將用戶導(dǎo)向到包含對(duì)應(yīng)于查詢的一個(gè)或多個(gè)搜索結(jié)果的搜索結(jié)果頁(yè)面。用戶 然后可以能夠選擇一個(gè)搜索結(jié)果,其中結(jié)果的選擇可以將用戶導(dǎo)向到網(wǎng)頁(yè)以便瀏覽。
[0003] 諸如Facebook⑧和:Linked丨n?.之類的社交網(wǎng)絡(luò)也提供用戶獲得(和共享) 信息的手段。在線社交網(wǎng)絡(luò)服務(wù)基于在單獨(dú)用戶之間建立的關(guān)系,將個(gè)體聚集成在線社區(qū)。 這些關(guān)系可以基于友誼、家庭關(guān)系、業(yè)務(wù)關(guān)系等。
[0004] 大多數(shù)在線社交網(wǎng)絡(luò)服務(wù)還允許用戶將他們自己組織成組。這些組可以基于組成 員共有的主題,例如共同興趣、原因或共享環(huán)境。在這些組中,可以交換特別適用于或用于 該組成員的消息和其它數(shù)據(jù)。某些組可能允許任何用戶加入,而其它"私有"組可能需要版 主或現(xiàn)有組成員邀請(qǐng)潛在的組成員。將用戶組織為在線社交網(wǎng)絡(luò)服務(wù)中的不同組可以用于 將與特定主題或社交原因相關(guān)的信息交換集中到其預(yù)定接收者。
【發(fā)明內(nèi)容】
[0005] 各實(shí)施例包括用于推斷主題之間的關(guān)系的方法、系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品。一種方 法可以包括訪問(wèn)包含多個(gè)節(jié)點(diǎn)和邊的圖。所述圖中的每個(gè)節(jié)點(diǎn)表示主題,并且每個(gè)邊表示 兩個(gè)主題之間的已知關(guān)聯(lián)。所述方法還可以包括針對(duì)所述圖執(zhí)行統(tǒng)計(jì)遍歷試驗(yàn)。所述方法 可以還包括推斷由所述圖中的節(jié)點(diǎn)表示的任何兩個(gè)主題之間的關(guān)系強(qiáng)度。所述推斷可以基 于從所述統(tǒng)計(jì)遍歷試驗(yàn)提取的統(tǒng)計(jì)信息。
[0006] 各實(shí)施例還包括用于相對(duì)于其它代理對(duì)一個(gè)主題感興趣的程度而標(biāo)識(shí)代理對(duì)所 述主題感興趣的程度的方法、系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品。一種方法可以包括收集有關(guān)代理集 合的信息。所述方法還可以包括基于所述信息,計(jì)算所述主題和所述代理集合中的每個(gè)代 理之間的關(guān)系強(qiáng)度。所述方法還可以包括基于一個(gè)代理與所述主題的關(guān)系相對(duì)于所述代理 集合中的其它代理的不同程度,對(duì)所述主題和所述代理之間的關(guān)系進(jìn)行排序。所述方法還 可以包括輸出所述排序的結(jié)果。
[0007] 通過(guò)本公開的技術(shù)實(shí)現(xiàn)其它特性和優(yōu)點(diǎn)。在此詳細(xì)描述了本公開的其它實(shí)施例和 方面。為了更好地理解本公開以及優(yōu)點(diǎn)和特性,將參考說(shuō)明書和附圖。
【專利附圖】
【附圖說(shuō)明】
[0008] 在說(shuō)明書結(jié)尾處的權(quán)利要求中具體指出并明確要求保護(hù)了被視為本發(fā)明的主題。 從下面結(jié)合附圖的詳細(xì)描述,本公開的上述和其它特性和優(yōu)點(diǎn)將變得顯而易見,這些附圖 是:
[0009] 圖1示出根據(jù)一個(gè)實(shí)施例的可以在其上實(shí)現(xiàn)社交交互促進(jìn)過(guò)程的系統(tǒng);
[0010] 圖2A示出根據(jù)一個(gè)實(shí)施例的用于在即時(shí)社區(qū)中連接用戶的系統(tǒng)環(huán)境;
[0011] 圖2B示出根據(jù)一個(gè)實(shí)施例的圖;
[0012] 圖3示出根據(jù)一個(gè)實(shí)施例的用于構(gòu)建用戶簡(jiǎn)檔的示例性體系架構(gòu);
[0013] 圖4示出根據(jù)一個(gè)實(shí)施例的用于實(shí)現(xiàn)即時(shí)社區(qū)的系統(tǒng)環(huán)境;
[0014] 圖5示出根據(jù)一個(gè)實(shí)施例的示例性方法的流程圖;
[0015] 圖6示出根據(jù)一個(gè)實(shí)施例的用于計(jì)算概率估計(jì)的示例性方法的流程圖;
[0016] 圖7示出原始得分表;
[0017] 圖8A示出根據(jù)一個(gè)實(shí)施例的用于計(jì)算得分的示例性方法的流程圖;
[0018] 圖8B示出根據(jù)一個(gè)實(shí)施例的用于計(jì)算得分的示例性方法的流程圖;
[0019] 圖9示出根據(jù)一個(gè)實(shí)施例的改進(jìn)后的得分表;
[0020] 圖10示出根據(jù)一個(gè)實(shí)施例的用于推斷主題之間的關(guān)系的示例性方法的流程圖; 以及
[0021] 圖11示出根據(jù)一個(gè)實(shí)施例的用于推斷主題之間的關(guān)系的示例性方法的流程圖。
【具體實(shí)施方式】
[0022] 在此描述的實(shí)施例提供一種社交交互促進(jìn)工具,其基于心理狀態(tài)一致性或想法共 鳴性,促進(jìn)兩個(gè)或更多人員之間的通信。在一個(gè)實(shí)施例中,在用戶(例如,使用該工具的人 員)和一個(gè)或多個(gè)其它用戶之間促進(jìn)通信。通過(guò)這種方式,可以在用戶和一個(gè)或多個(gè)其它 用戶之間建立所謂的即時(shí)社區(qū)。通常,啟動(dòng)通信的用戶希望在短時(shí)間(例如,大約幾秒)內(nèi) 進(jìn)行通信。啟動(dòng)通信的用戶通常想要就感興趣的特定主題進(jìn)行交互。在此方面,不與該主 題具體相關(guān)的材料對(duì)于用戶來(lái)說(shuō)可能具有很小的價(jià)值,并且甚至可能用作消遣。
[0023] 在一個(gè)實(shí)施例中,使用該工具的人員在很短時(shí)間內(nèi)以很高概率開始與另一個(gè)人 員(例如,人)交互,并且這種交互具有很高質(zhì)量(例如,對(duì)于交互的所有方都相關(guān)并且有 益)。可以基于啟動(dòng)與感興趣的特定主題有關(guān)的查詢或討論的用戶,建立即時(shí)社區(qū)。可以 邀請(qǐng)從用戶池或組中選擇的其它用戶加入社區(qū)。邀請(qǐng)可以基于一個(gè)或多個(gè)因素或輸入,例 如感興趣的特定主題、與每個(gè)其它用戶關(guān)聯(lián)的簡(jiǎn)檔,以及一個(gè)或多個(gè)模型(例如,自適應(yīng)世 界模型)。在一個(gè)實(shí)施例中,本發(fā)明的成功操作不需要專注于特定主題的組,并且啟動(dòng)查詢 /討論不需要與任何單獨(dú)用戶的興趣描述完全匹配以將這些用戶視為與查詢發(fā)起者進(jìn)行潛 在交互。相反,基于要與之交互的自然人(如果給出他們與查詢的接近度,如由不斷變化的 世界理念和事件模型所測(cè)量的),始終即時(shí)(on-the-spot)確定交互的自然焦點(diǎn)對(duì)等組。
[0024] 在此描述的各實(shí)施例與現(xiàn)有技術(shù)形成對(duì)照,在現(xiàn)有技術(shù)中,用戶可能嘗試開始與 另一個(gè)實(shí)體(例如,另一個(gè)人員或用戶)交互或通信?,F(xiàn)有技術(shù)可能不足以將啟動(dòng)通信的 用戶與了解感興趣的主題的人員相鏈接。例如,當(dāng)前技術(shù)需要啟動(dòng)通信的用戶知道就感興 趣的主題與何人聯(lián)系,或者至少標(biāo)識(shí)其中可能討論感興趣的主題的現(xiàn)有論壇。社交媒體當(dāng) 前基于關(guān)系和社交組(例如,家庭、朋友、朋友的朋友等),這通常不是相關(guān)目標(biāo)受眾,也不 足夠大以便確保有關(guān)用戶的感興趣主題的富交互。即使假設(shè)用戶可以以其他方式標(biāo)識(shí)要與 其交互的合適人員,該人員也可能很少有動(dòng)機(jī)以有意義的方式參與交互。
[0025] 在此描述的各實(shí)施例涉及即時(shí)社區(qū)的概念,即時(shí)社區(qū)表示人員之間的交互,這些 人員促進(jìn)他們之間高度相關(guān)但通常短暫的交互。還可以提供用于創(chuàng)建和管理單獨(dú)即時(shí)社區(qū) 的機(jī)制,并且專注于優(yōu)化單獨(dú)用戶體驗(yàn)。其它實(shí)施例還可以包括核心機(jī)制,所述機(jī)制用于基 于實(shí)體(例如,人員)的重要理念的相對(duì)小的樣本以及表示為圖的世界模型,推斷該實(shí)體的 世界視圖。
[0026] 參與用戶可以使用所述系統(tǒng)的各實(shí)施例作為人為交互的通用代理,而不僅僅是消 息傳送工具,從而大幅提高所述系統(tǒng)在人員之間建立關(guān)系的精確度,并且因此改善用戶體 驗(yàn)。所述系統(tǒng)的一個(gè)實(shí)施例具有以下能力:除了查詢本身之外,還接收有關(guān)用戶查詢背后 的意圖的信息。例如,用戶可能具有以下意圖:尋求合作伙伴以便開發(fā)一種發(fā)明,解決關(guān)鍵 的客戶情況,啟動(dòng)有關(guān)某點(diǎn)的辯論等。同樣,查詢的潛在響應(yīng)者可能感覺被強(qiáng)迫在給定主題 中回答查詢,但僅針對(duì)用戶查詢背后的特定意圖,因此所述系統(tǒng)的各實(shí)施例包括以下能力: 用戶僅針對(duì)特定意圖聲明對(duì)某一主題感興趣。所述系統(tǒng)然后使用該其它信息適當(dāng)?shù)芈酚烧?qǐng) 求??梢砸远喾N方式指定用戶意圖,包括作為文本中的特殊注釋(例如散列標(biāo)簽),或者作 為用戶接口中的可選擇選項(xiàng)。
[0027] 為了實(shí)現(xiàn)將用戶與符合的興趣和/或意圖關(guān)聯(lián)的任務(wù),必須采用一種方法,其估 計(jì)任何兩個(gè)用戶在任何給定時(shí)間的接近程度??梢宰鳛樵撊蝿?wù)一部分采用的一種技術(shù)是估 計(jì)任何兩個(gè)理念或理念集合的接近程度的方法,其中理念是嵌入所述系統(tǒng)中以幫助推理的 理念(或主題)領(lǐng)域的一部分。然后可以使用該方法估計(jì)用戶可能對(duì)理念或理念集合感興 趣的概率,并且通過(guò)擴(kuò)展,估計(jì)查詢發(fā)起者與連接到所述系統(tǒng)的任何特定用戶的符合程度。 后一種情形可以通過(guò)接受采用自然語(yǔ)言形式的用戶查詢來(lái)實(shí)現(xiàn),然后采用自然語(yǔ)言模塊以 便從查詢提取可以被映射到所述系統(tǒng)的理念或主題領(lǐng)域的特定重要關(guān)鍵字。
[0028] 在此描述的進(jìn)一步實(shí)施例用于針對(duì)給定領(lǐng)域中的每個(gè)主題或理念,估計(jì)代理或用 戶(人員或其它)對(duì)該主題或理念感興趣的概率或可能性。可以基于代理對(duì)某個(gè)主題集合 感興趣而對(duì)另一個(gè)主題集合不感興趣的情況,估計(jì)對(duì)給定主題感興趣的概率。起始假設(shè)可 以是存在給定領(lǐng)域中的感興趣主題之間的第一級(jí)以及可能第二級(jí)關(guān)系的初始描述。該描述 可以采用圖的形式,并且具有連接被判斷為密切相關(guān)的節(jié)點(diǎn)的加權(quán)鏈接,其中權(quán)重指示此 類接近的程度。術(shù)語(yǔ)"理念"和"主題"在此可以交換使用以指圖中的節(jié)點(diǎn)。
[0029] 節(jié)點(diǎn)領(lǐng)域原則上可以非常大,并且可以以任意精確度描述理念。例如,可以具有數(shù) 千萬(wàn)個(gè)描述理念的節(jié)點(diǎn),并且每個(gè)節(jié)點(diǎn)連接到多個(gè)其它節(jié)點(diǎn)(范圍從數(shù)十個(gè)到數(shù)千個(gè))。例 如,代理可能對(duì)"KindofBlue(泛藍(lán)調(diào)調(diào))"(著名的爵士音樂(lè)專輯)感興趣,并且如果給出 該興趣,則一個(gè)實(shí)施例可能詢問(wèn):代理也對(duì)"VillageVanguard(前衛(wèi)村)"(知名的紐約市 爵士俱樂(lè)部)感興趣的概率是多少?代理對(duì)"lydiadominantscale(利地亞屬調(diào)音階)" 感興趣的概率是多少?代理對(duì)比爾?埃文斯的鋼琴演奏風(fēng)格感興趣的概率是多少?代理對(duì) "chopsuey(雜燴)"感興趣的概率是多少?如果給出代理不喜歡采用聲樂(lè)的爵士的事實(shí), 則一個(gè)實(shí)施例可以進(jìn)一步進(jìn)行并且詢問(wèn)先前問(wèn)題的概率如何變化?
[0030] 現(xiàn)代技術(shù)未能提供有關(guān)在主題之間建立關(guān)系的高解析度或精確度,以便回答例如 上面提出的問(wèn)題。例如,一種技術(shù)或技能簡(jiǎn)單地依賴于圖中兩個(gè)主題/節(jié)點(diǎn)之間的鏈接或 跳躍數(shù)量作為概念之間接近度的指示符,其中兩個(gè)主題之間的鏈接/跳躍數(shù)量越大,兩個(gè) 主題密切相關(guān)的可能性越小。這種技術(shù)未能考慮領(lǐng)域中所有其它節(jié)點(diǎn)之間的整體鏈接集合 對(duì)所述兩個(gè)節(jié)點(diǎn)之間關(guān)系的可能影響,并且也沒(méi)有考慮到用戶可能表明對(duì)給定主題不感興 趣而提供一種低估方式。第二種技術(shù)是從上述專用于主題集合的圖創(chuàng)建馬爾可夫鏈,然后 通過(guò)迭代矩陣*向量積估計(jì)靜態(tài)概率分布。此第二種技術(shù)未能針對(duì)高度(或者過(guò)于稀疏) 連接的節(jié)點(diǎn)的性能惡化效應(yīng)而調(diào)整。此外,此第二種技術(shù)未能:(1)考慮到用戶可能表明對(duì) 給定主題不感興趣而提供一種低估方式,以及(2)提供數(shù)值,該數(shù)值可以很容易被解釋為 用戶對(duì)給定題目或主題感興趣或不感興趣的概率。
[0031] 在第一實(shí)施例中,可以假設(shè)用戶僅對(duì)一個(gè)主題感興趣。在第二實(shí)施例中,可以放寬 該假設(shè),第二假設(shè)可以是用戶表現(xiàn)出對(duì)兩個(gè)或更多主題感興趣。
[0032] 在某些實(shí)施例中,可以將有關(guān)領(lǐng)域中的節(jié)點(diǎn)集合的概率分布與其它信息相組合。 可以使用用戶感興趣的一個(gè)主題的知識(shí)迭代從圖導(dǎo)出的馬爾可夫鏈,并且可以使用另一個(gè) 分布規(guī)范化或校準(zhǔn)得到的概率分布。規(guī)范化(也稱為校準(zhǔn)步驟)可以消除或明顯減少單純 馬爾可夫鏈技術(shù)固有的對(duì)圖中高度鏈接的節(jié)點(diǎn)的偏向,同時(shí)提供數(shù)值,該數(shù)值可以被解釋 為用戶對(duì)主題感興趣或不感興趣的概率估計(jì)。
[0033] 針對(duì)單獨(dú)獲得的每個(gè)主題或節(jié)點(diǎn)生成估計(jì)之后,可以針對(duì)節(jié)點(diǎn)組合生成估計(jì)???以使用基于統(tǒng)計(jì)分析和理論的信息組合原則,產(chǎn)生組合各種估計(jì)的估計(jì)。信息組合技術(shù)的 一個(gè)實(shí)例是使用概率的對(duì)數(shù)似然比,其可以有意義地進(jìn)行算術(shù)相加以便提供上述組合估 計(jì),并且還可以擴(kuò)展以便包括權(quán)重,這些權(quán)重描述代理表現(xiàn)出感興趣的各種主題的相對(duì)重 要性。信息組合技術(shù)的另一個(gè)實(shí)例包括通過(guò)針對(duì)主題領(lǐng)域中的每個(gè)主題,獲得分配給主題 的每個(gè)單獨(dú)估計(jì)的最大概率值,而組合多個(gè)單獨(dú)概率估計(jì)。
[0034] 在某些實(shí)施例中,當(dāng)分配代理對(duì)主題領(lǐng)域中的給定主題感興趣的概率估計(jì)時(shí), 可以考慮有關(guān)代理表現(xiàn)出不感興趣的主題的知識(shí)。可以經(jīng)由對(duì)數(shù)似然領(lǐng)域中的減法 (subtraction)實(shí)現(xiàn)該任務(wù)。
[0035] 上述每個(gè)階段可以與以不同方式完成相同任務(wù)的其它技術(shù)相交換。例如,不是使 用對(duì)數(shù)似然比執(zhí)行信息組合,而是可以例如通過(guò)針對(duì)領(lǐng)域中的每個(gè)主題,獲得分配給該主 題的每個(gè)單獨(dú)估計(jì)的最大概率值,來(lái)組合多個(gè)單獨(dú)概率估計(jì)。
[0036] 現(xiàn)在轉(zhuǎn)到圖1,總體上示出可以在其上實(shí)現(xiàn)各實(shí)施例的系統(tǒng)100。
[0037] 系統(tǒng)100包括主機(jī)系統(tǒng)計(jì)算機(jī)102和通信設(shè)備104,它們以通信方式耦合到一個(gè)或 多個(gè)網(wǎng)絡(luò)106。主機(jī)系統(tǒng)計(jì)算機(jī)102可以實(shí)現(xiàn)為一個(gè)或多個(gè)高速計(jì)算機(jī)處理設(shè)備,例如一 個(gè)或多個(gè)大型計(jì)算機(jī)或服務(wù)器,它們能夠處理在此描述的社交交互促進(jìn)工具的各實(shí)施例的 最終用戶進(jìn)行的大量計(jì)算活動(dòng)。主機(jī)系統(tǒng)計(jì)算機(jī)102可以用作數(shù)據(jù)庫(kù)服務(wù)器,并且協(xié)調(diào)對(duì) 應(yīng)用數(shù)據(jù)(包括存儲(chǔ)在存儲(chǔ)設(shè)備110上的數(shù)據(jù))的訪問(wèn)。存儲(chǔ)設(shè)備110可以使用包含在主 機(jī)系統(tǒng)計(jì)算機(jī)102中的存儲(chǔ)器實(shí)現(xiàn),或者可以是單獨(dú)的物理設(shè)備。在一個(gè)實(shí)施例中,存儲(chǔ)設(shè) 備110存儲(chǔ)用戶簡(jiǎn)檔,這些用戶簡(jiǎn)檔可以用于維護(hù)用戶或代理感興趣(或不感興趣)的主 題的歷史或日志。
[0038] 主機(jī)系統(tǒng)計(jì)算機(jī)102可以使用一個(gè)或多個(gè)服務(wù)器實(shí)現(xiàn),這些服務(wù)器響應(yīng)于存儲(chǔ)在 可由服務(wù)器訪問(wèn)的存儲(chǔ)介質(zhì)中的計(jì)算機(jī)程序而操作。主機(jī)系統(tǒng)計(jì)算機(jī)102還可以用作網(wǎng)絡(luò) 服務(wù)器(例如,Web服務(wù)器),以便與通信設(shè)備104以及任何其它網(wǎng)絡(luò)實(shí)體通信。在一個(gè)實(shí) 施例中,主機(jī)系統(tǒng)計(jì)算機(jī)102可以表示云計(jì)算環(huán)境中的節(jié)點(diǎn),或者可以被配置為在客戶機(jī)/ 服務(wù)器體系架構(gòu)中操作。
[0039] 通信設(shè)備104可以是具有計(jì)算機(jī)處理能力的任何類型的設(shè)備。例如,通信設(shè)備104 可以包括通用計(jì)算機(jī)(例如,臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī))、主機(jī)連接的終端(例如,瘦客戶 機(jī))和便攜式通信設(shè)備(例如,智能電話、個(gè)人數(shù)字助理和平板PC)的組合。通信設(shè)備104 可以是有線或無(wú)線設(shè)備。在一個(gè)實(shí)施例中,通信設(shè)備104可以表示云計(jì)算環(huán)境中的云消費(fèi) 者。一個(gè)或多個(gè)通信設(shè)備104可以包括用戶設(shè)備。
[0040] 在一個(gè)實(shí)施例中,通信設(shè)備104可以由操作主機(jī)系統(tǒng)計(jì)算機(jī)102的實(shí)體或企業(yè)托 管的網(wǎng)站或Web服務(wù)的最終用戶實(shí)現(xiàn)。通信設(shè)備104可以均執(zhí)行Web瀏覽器以便訪問(wèn)網(wǎng)絡(luò) 實(shí)體,例如主機(jī)系統(tǒng)計(jì)算機(jī)102。在一個(gè)實(shí)施例中,通信設(shè)備104訪問(wèn)主機(jī)系統(tǒng)計(jì)算機(jī)102 的網(wǎng)站以便瀏覽和訪問(wèn)應(yīng)用112。應(yīng)用112可以實(shí)現(xiàn)在此描述的各實(shí)施例。應(yīng)用112的實(shí) 施例可以包括在此描述的社交交互促進(jìn)工具(多個(gè))和技術(shù)。應(yīng)用112的實(shí)施例可以包括 在此描述的概率估計(jì)工具(例如,用于推斷主題之間的關(guān)系,用于相對(duì)于其它代理對(duì)一個(gè) 主題感興趣的程度而標(biāo)識(shí)代理對(duì)該主題感興趣的程度)。
[0041] 網(wǎng)絡(luò)(多個(gè))106可以是任何類型的已知網(wǎng)絡(luò),包括但不限于廣域網(wǎng)(WAN)、局域網(wǎng) (LAN)、全球網(wǎng)絡(luò)(例如,因特網(wǎng))、虛擬專用網(wǎng)絡(luò)(VPN)和內(nèi)聯(lián)網(wǎng)。網(wǎng)絡(luò)(多個(gè))106可以使 用所屬【技術(shù)領(lǐng)域】已知的無(wú)線網(wǎng)絡(luò)或任何類型的物理網(wǎng)絡(luò)實(shí)施方式實(shí)現(xiàn),例如使用蜂窩、衛(wèi) 星和/或地面網(wǎng)絡(luò)技術(shù)。
[0042] 系統(tǒng)100還包括存儲(chǔ)設(shè)備108,其以通信方式耦合到主機(jī)系統(tǒng)計(jì)算機(jī)102。存儲(chǔ)設(shè) 備108可以跨包括網(wǎng)絡(luò)(例如,網(wǎng)絡(luò)(多個(gè))106)的分布式環(huán)境,被邏輯尋址為整合數(shù)據(jù)源。 在一個(gè)實(shí)施例中,存儲(chǔ)設(shè)備108以及存儲(chǔ)設(shè)備110存儲(chǔ)應(yīng)用112使用的數(shù)據(jù)(包括但不限 于用戶簡(jiǎn)檔數(shù)據(jù)),以及用于確定用來(lái)創(chuàng)建會(huì)話或其它交互的用戶之間共性的數(shù)據(jù)(例如, 表示主題之間的關(guān)系的圖)。
[0043] 在某些實(shí)施例中,系統(tǒng)(例如,系統(tǒng)100的應(yīng)用112)可以用于在人員或用戶之間 建立即時(shí)社區(qū)。在某些情況下,社區(qū)可以基于特定感興趣的主題,并且可以在以下用戶之間 建立:在建立社區(qū)之前,他們可能并不相互了解。可以基于用戶之間的推斷的心理狀態(tài)一致 性(想法共鳴性)建立社區(qū)??梢曰谑澜缋砟詈褪录尸F(xiàn)的模型建立社區(qū)??梢栽谀P?中包括用戶的心理狀態(tài)(包括靜態(tài)知識(shí)),以及受事件影響的短期心理狀態(tài)。
[0044] 現(xiàn)在轉(zhuǎn)到圖2A,示出根據(jù)一個(gè)實(shí)施例的示例性系統(tǒng)環(huán)境200。具體地說(shuō),在圖2A 中,名為愛麗絲的第一用戶可以啟動(dòng)與服務(wù)提供者(SP)的通信。該通信可以涉及愛麗絲感 興趣的特定主題。例如,如果愛麗絲最近生完小孩,則她可能對(duì)參與有關(guān)照顧嬰兒的會(huì)話感 興趣。愛麗絲可以輸入自然語(yǔ)言表達(dá)式"tendingtoinfantchildren(照顧嬰兒)"作為她 想要討論的感興趣主題。愛麗絲還可以提供與該主題相關(guān)的消息,例如"mybabywasjust born-whatshouldIdo?(我的小孩剛出生一我應(yīng)該做什么?)"。
[0045] 愛麗絲可能對(duì)與其社交組成員進(jìn)行有關(guān)照顧嬰兒的會(huì)話感到不舒適,或者可能不 知道最近剛有小孩的任何人(以便能夠利用有關(guān)照顧兒童的最新可用信息或科學(xué))。無(wú)論 愛麗絲想要參與即時(shí)社區(qū)的原因?yàn)楹?,她都可以通過(guò)在SP提供的文本框中輸入(例如,鍵 入)其感興趣的主題(例如,照顧嬰兒)來(lái)啟動(dòng)交互,如圖2A中的箭頭編號(hào)1反映的那樣。
[0046] 響應(yīng)于輸入的感興趣主題,SP可以標(biāo)識(shí)用戶數(shù)量(例如,當(dāng)前登錄的用戶),在當(dāng) 前時(shí)間這些用戶可能對(duì)愛麗絲的特定主題感興趣。例如,如圖2A中的圓編號(hào)2反映的,SP 可以將鮑勃、查理和多麗絲標(biāo)識(shí)為至少現(xiàn)在可以與愛麗絲的感興趣主題最具有"想法一致 性"的用戶。如經(jīng)由圖2A中的箭頭編號(hào)3反映的,可以向鮑勃、查理和多麗絲通知愛麗絲 的感興趣主題,并且可以邀請(qǐng)他們加入與愛麗絲進(jìn)行有關(guān)該主題的交互。作為邀請(qǐng)的一部 分,鮑勃、查理和多麗絲可以潛在地作為消息而接收愛麗絲提供的主題(例如,"tendingto infantchildren")和/或愛_絲提供的消息(例如,"mybabywasjustborn-whatshould Ido?")。應(yīng)該注意,所述系統(tǒng)進(jìn)行這些判斷,而鮑勃、查理或多麗絲不必在文本"tending toinfantchildren"或"mybabywasjustborn-whatshouldIdo? "中顯式聲明其興趣。 相反,所述系統(tǒng)分析愛麗絲寫入的文本,并且還分析所述系統(tǒng)的各種用戶(包括鮑勃、查理 和多麗絲)的簡(jiǎn)檔之間的關(guān)系。例如,鮑勃可能表明他是蒙特梭利教育系統(tǒng)的學(xué)生,多麗絲 可能最近表明對(duì)領(lǐng)養(yǎng)感興趣。
[0047] 響應(yīng)于接收愛麗絲想法的通知,鮑勃和多麗絲可以在其選擇、形成愛麗絲、鮑勃和 多麗絲之間的交互式即時(shí)社區(qū)(圖2A中的箭頭編號(hào)5)時(shí)進(jìn)行響應(yīng)(圖2A中的箭頭編號(hào) 4)。無(wú)論鮑勃和多麗絲哪一個(gè)首先響應(yīng),都會(huì)啟動(dòng)交互。來(lái)自鮑勃和多麗絲的響應(yīng)可以包 括對(duì)愛麗絲提供的消息的響應(yīng)。在該社區(qū)中,愛麗絲、鮑勃和多麗絲可以討論照顧嬰兒,并 且可能討論任何其它相關(guān)主題(例如,照顧青少年)。在某一時(shí)刻,可能在以下情況下撤消 或取消擴(kuò)展到查理的邀請(qǐng):例如,如果查理未在閾值時(shí)間內(nèi)接受邀請(qǐng),如果足夠數(shù)量的其它 用戶開始參與,如果愛麗絲表明加入社區(qū)的用戶足夠或者提供高質(zhì)量交互等。
[0048] 通信參數(shù)(例如,針對(duì)給定主題的被通知用戶數(shù)量)可以使能在啟動(dòng)交互(例如, 圖2A的箭頭編號(hào)1)的幾秒內(nèi)形成想法一致用戶的小社區(qū)??梢园l(fā)生這種情況的原因是在 統(tǒng)計(jì)上,被聯(lián)系的全體人員中首先響應(yīng)的人員的平均時(shí)間遠(yuǎn)短于任何給定個(gè)人的平均響應(yīng) 時(shí)間。
[0049] 在某些實(shí)施例中,可以分析包括節(jié)點(diǎn)和邊的圖。圖2B中示出這種圖250的一個(gè)實(shí) 例。所述圖可以是稀疏圖,其中節(jié)點(diǎn)之間的邊數(shù)量遠(yuǎn)小于節(jié)點(diǎn)之間的可能邊數(shù)量。所述圖 可以表示世界模型,并且可以基于隨時(shí)間變得可用的信息或反饋而改變。節(jié)點(diǎn)252可以表 示類別,例如主題類別。如果兩個(gè)節(jié)點(diǎn)或主題密切相關(guān),則它們可以經(jīng)由邊254直接連接到 彼此,而如果兩個(gè)節(jié)點(diǎn)或主題彼此并未如此密切相關(guān),則它們可以通過(guò)多個(gè)節(jié)點(diǎn)和邊而彼 此分離??梢詫D與從啟動(dòng)用戶接收的輸入主題規(guī)范以及與第二用戶關(guān)聯(lián)的用戶簡(jiǎn)檔相比 較,以便判定是否應(yīng)該邀請(qǐng)第二用戶以使啟動(dòng)用戶參與即時(shí)社區(qū)或交互。參考圖2B,并且繼 續(xù)上面結(jié)合圖2A描述的實(shí)例,如果查理在一家制造搖響器的公司工作,則可以足夠?qū)е卵?請(qǐng)查理(圖2A中的箭頭編號(hào)3)與愛麗絲交互。
[0050] 用戶可以顯式表明其是否對(duì)節(jié)點(diǎn)或主題特別感興趣,以及到什么程度。例如,用戶 可以從其當(dāng)前正在查看的網(wǎng)頁(yè)中選擇按鈕,這可以用于表明用戶對(duì)該網(wǎng)頁(yè)以及該網(wǎng)頁(yè)中討 論的任何主題信息感興趣。同樣,用戶可以掃描餐館中的菜單上的可用代碼,以便表明用戶 喜歡該餐館或該餐館中的特定前菜??梢允褂冕槍?duì)圖執(zhí)行統(tǒng)計(jì)推斷的技術(shù)來(lái)推斷"全世界 視圖",以便填充任何缺少的信息。
[0051] 一個(gè)實(shí)施例使用潛在接收者的"全世界視圖"模型,以便選擇要將查詢發(fā)送到的接 收者。此外,所述系統(tǒng)還可以使用用戶(其通過(guò)發(fā)送查詢啟動(dòng)交互)的"全世界視圖"模型, 以便選擇所述接收者。發(fā)送用戶的視圖模型可用于增加所述系統(tǒng)的關(guān)系構(gòu)建精確度,例如 方式為:允許所述系統(tǒng)在其中查詢可能具有多種解釋的情況下消除用戶查詢歧義。例如,考 慮其中發(fā)送用戶的查詢是"Howaboutthembobcats?(山貓?jiān)趺礃???的情況。在這種 情況下,如果(從用戶的視圖模型)知道發(fā)送用戶對(duì)籃球比對(duì)動(dòng)物更感興趣,則所述系統(tǒng)可 以能夠?qū)⒉樵兘忉尀?Howaboutthem[CharlotteBobcats] ?(他們[夏洛特山貓隊(duì)]怎 么樣?)"。備選地,如果知道發(fā)送用戶對(duì)動(dòng)物感興趣,則所述系統(tǒng)可以能夠?qū)⒉樵兘忉尀橹?動(dòng)物而不是指體育團(tuán)隊(duì)。可以基于各種源形成發(fā)送用戶的視圖模型,這些源包括用戶的過(guò) 去會(huì)話(例如,用戶具有涉及體育或動(dòng)物的過(guò)去會(huì)話),以及用于生成"世界視圖"模型的其 它先前提及的源(例如網(wǎng)站)。
[0052] -個(gè)實(shí)施例使用基于網(wǎng)站(例如Wikipedia?)中的超鏈接圖的靜態(tài)世界模型。 將用戶建模為一對(duì)圖節(jié)點(diǎn)集合,一個(gè)集合描述感興趣的事物,另一個(gè)集合描述用戶不想聽 到的事物(即,那些無(wú)趣的事物)。一個(gè)實(shí)施例支持每個(gè)用戶僅一個(gè)節(jié)點(diǎn),并且每個(gè)用戶的 節(jié)點(diǎn)數(shù)量沒(méi)有上限。針對(duì)圖執(zhí)行統(tǒng)計(jì)推斷以便推斷應(yīng)用于每個(gè)用戶的"全世界視圖",因此 填充空白。在一個(gè)實(shí)施例中,假設(shè)已知用戶u對(duì)節(jié)點(diǎn)集合s感興趣,并且已知用戶N回避節(jié) 點(diǎn)集合T,計(jì)算用戶U認(rèn)為節(jié)點(diǎn)N有趣的概率。
[0053] 基于世界模型的該統(tǒng)計(jì)推斷步驟允許使用世界模型作為可用于解釋用戶查詢描 述和接收者用戶數(shù)據(jù)的上下文,推導(dǎo)用戶查詢描述和用于形成潛在接收者用戶模型的數(shù) 據(jù)之間的間接關(guān)系。作為一個(gè)實(shí)例,可以將有關(guān)夏洛特山貓隊(duì)的消息推斷為與已知興趣是 "Americansports(美國(guó)體育)"的接收者的興趣間接相關(guān),即使未顯式知道該接收者具有 "CharlotteBobcats(夏洛特山貓隊(duì))"作為興趣。這種用于接觸用戶的技術(shù)與所屬技術(shù)領(lǐng) 域中已知的技術(shù)截然不同,后者通?;陉P(guān)鍵字匹配。
[0054] 現(xiàn)在轉(zhuǎn)到圖3,示出根據(jù)一個(gè)實(shí)施例的用于構(gòu)建用戶簡(jiǎn)檔的示例性體系架構(gòu)300。 如圖所示,用戶模型302可以用作到放大階段304的輸入。在其可提供有關(guān)用戶興趣或知 識(shí)的有限數(shù)量線索的意義上,用戶模型302可以是稀疏的。用戶模型302可以包括用戶指 定的有關(guān)用戶興趣或知識(shí)的信息。
[0055] 放大階段304可以用于基于用戶模型302,填充用戶簡(jiǎn)檔或圖中的任何空白。例 如,如果用戶圖中缺少節(jié)點(diǎn)或邊,則放大階段304可以分析用戶模型302以便提供任何缺少 的信息。放大階段304可以輸出富用戶模型308,其可以存儲(chǔ)在推斷的用戶世界視圖數(shù)據(jù)庫(kù) 310中,該數(shù)據(jù)庫(kù)可以隨一個(gè)或多個(gè)模型更改而更新。
[0056] 在一個(gè)實(shí)施例中,富用戶模型308以及推斷的用戶世界視圖數(shù)據(jù)庫(kù)310的全部或 部分存儲(chǔ)在圖1中所示的存儲(chǔ)設(shè)備108中。
[0057] 在某些實(shí)施例中,可以在體系架構(gòu)300中包括地理信息層(未示出)。系統(tǒng)可以 了解是否針對(duì)感興趣的特定主題從某個(gè)地理區(qū)域中選擇人員。參考圖2A作為實(shí)例,如果愛 麗絲位于北美洲,則可以使愛麗絲加入即時(shí)社區(qū)的潛在用戶可能限于位于北美洲的那些用 戶,前提是例如北美洲的照顧兒童標(biāo)準(zhǔn)不同于世界其它地方。
[0058] 在某些實(shí)施例中,交互或社區(qū)可能產(chǎn)生其它交互。例如,并且參考圖2A,如果愛麗 絲請(qǐng)求有關(guān)照顧嬰兒的交互,則鮑勃可以能夠向愛麗絲推薦其社交網(wǎng)絡(luò)朋友一兒科醫(yī)生弗 蘭克?約翰遜以便進(jìn)行進(jìn)一步討論。
[0059] 在某些實(shí)施例中,可以向感興趣的特定主題附加緊急標(biāo)簽或標(biāo)志。例如,如果主題 涉及照顧嬰兒,并且主題的啟動(dòng)(例如,圖2A的箭頭1)表明從世界模型中反映的交通事故 地點(diǎn)啟動(dòng)主題,則可以將通信請(qǐng)求傳輸給更多人,例如具有治療遭遇機(jī)動(dòng)車輛事故的嬰兒 經(jīng)驗(yàn)的那些兒科醫(yī)生。還可以將通信請(qǐng)求傳輸給可能在愛麗絲或交通事故地點(diǎn)附近的第一 響應(yīng)者,以便確??梢约皶r(shí)實(shí)施緊急救援(如果需要)。
[0060] 在選擇候選用戶池以便邀請(qǐng)加入即時(shí)社區(qū)方面(如上所述),某些用戶可能在給 定主題方面比其它人更有知識(shí)或更積極響應(yīng)。在某些實(shí)施例中,可以將邀請(qǐng)擴(kuò)展到"社區(qū)支 柱"(例如,有知識(shí)并且積極響應(yīng)的那些用戶),并且擴(kuò)展到具有更少知識(shí)/更少做出響應(yīng)的 用戶??梢詳U(kuò)展邀請(qǐng)以便確保社區(qū)支柱未由于過(guò)多邀請(qǐng)而超負(fù)荷,并且確保為具有有關(guān)給 定主題的更少知識(shí)的用戶"播種"知識(shí),這些用戶可以有助于在未來(lái)分發(fā)這些知識(shí)(例如, 作為未來(lái)社區(qū)的成員)。
[0061] 在某些實(shí)施例中,可以形成用戶參與社區(qū)的分布。可以多次擴(kuò)展邀請(qǐng)。例如,可以 使用連續(xù)邀請(qǐng),其中例如最初可能邀請(qǐng)少量用戶。基于響應(yīng)時(shí)間,可以擴(kuò)展其它邀請(qǐng)以使其 它用戶加入社區(qū)??梢允褂帽O(jiān)視技術(shù)以檢測(cè)何時(shí)用戶鍵入,以便判定是否應(yīng)該擴(kuò)展其它邀 請(qǐng)。
[0062] 在某些實(shí)施例中,社區(qū)中的用戶可以能夠查看社區(qū)中的其它用戶發(fā)送的通信。相 反,在某些實(shí)施例中,一個(gè)或多個(gè)用戶可能無(wú)法查看另一個(gè)用戶或用戶組發(fā)送的通信,這可 以用于確保通信的隱私性。
[0063] 一個(gè)或多個(gè)用戶可以瀏覽社區(qū)。這種瀏覽可以結(jié)合網(wǎng)頁(yè)或任何其它界面發(fā)生。在 某些實(shí)施例中,可以從較大社區(qū)集合或池中選擇或過(guò)濾可見以用于瀏覽目的的社區(qū)。這種 選擇/過(guò)濾可以基于特定用戶可能感興趣的主題,或者用戶了解的主題。在某些實(shí)施例中, 可以利用用戶興趣之間的關(guān)聯(lián),以便在擴(kuò)展邀請(qǐng)以使用戶加入社區(qū)或者建議社區(qū)以便用戶 閱讀或查看方面提供增強(qiáng)的解析度或精確度。在某些實(shí)施例中,當(dāng)用戶啟動(dòng)交互(例如,圖 2A中的箭頭編號(hào)1)時(shí),可以建立新社區(qū),并且可以詢問(wèn)相關(guān)社區(qū)中的用戶或?qū)<乙约尤胄?社區(qū)。通過(guò)這種方式,相關(guān)社區(qū)中的交互可能不會(huì)被解釋為新社區(qū)的結(jié)果。在某些實(shí)施例 中,不是建立新社區(qū),而是啟動(dòng)交互的用戶動(dòng)作可能導(dǎo)致用戶加入現(xiàn)有的相關(guān)社區(qū)。
[0064] 社區(qū)的存在期可以取決于一個(gè)或多個(gè)參數(shù)。例如,如果社區(qū)已建立多個(gè)小時(shí),則可 能阻止其它用戶加入社區(qū)。如果社區(qū)的已建立時(shí)間超過(guò)閾值,則當(dāng)用戶瀏覽社區(qū)以便加入 時(shí),社區(qū)可能不可見。在某些實(shí)施例中,社區(qū)的存在期可以取決于主題的性質(zhì)。例如,罕見 主題可以在較長(zhǎng)一段時(shí)間內(nèi)保持開放或可見。同樣,頻繁被請(qǐng)求的主題可以在較長(zhǎng)一段時(shí) 間內(nèi)保持開放或可見,以便將大量常見或相關(guān)問(wèn)題吸收到同一會(huì)話中。
[0065] 在某些實(shí)施例中,可以基于初始交互,播種與系統(tǒng)(例如,系統(tǒng)100)關(guān)聯(lián)的知識(shí) 庫(kù)??梢詮某跏加脩舫刂械贸鲞@些初始交互,以便擴(kuò)展系統(tǒng)中可用的主題知識(shí)。之后,可以 基于對(duì)系統(tǒng)的繼續(xù)使用而發(fā)展知識(shí)庫(kù)。系統(tǒng)的大小或容量可以取決于以下項(xiàng):用戶數(shù)量、用 戶活動(dòng)(例如,用戶參與頻率、用戶參與時(shí)間長(zhǎng)度等)、可用的處理速度、啟動(dòng)交互的請(qǐng)求產(chǎn) 生新社區(qū)相對(duì)于合并到現(xiàn)有社區(qū)的可能性等。
[0066] 各實(shí)施例可以用于針對(duì)以下各項(xiàng)創(chuàng)建即時(shí)社區(qū)(例如,基于地理信息、興趣、專業(yè) 知識(shí)、時(shí)間接近度)(例如,我要聽音樂(lè)會(huì)X,有人具有多余票嗎?我希望購(gòu)買產(chǎn)品X,您所在 的路線有多長(zhǎng)?):有關(guān)合適領(lǐng)域的專業(yè)新聞(例如,您從產(chǎn)品公告中了解如何將技術(shù)X應(yīng) 用于產(chǎn)品Z嗎?)、最近事件(例如,史密斯剛才就公司XYZ收入都說(shuō)了什么?),以及重要 信息的局部傳播(例如,我剛才感覺地面搖晃?是地震嗎?)。與可能包含陳舊和靜態(tài)(非 交互式)數(shù)據(jù)的博客和網(wǎng)頁(yè)相比,在此描述的實(shí)施例包括交互式數(shù)據(jù)。
[0067] 以下是一個(gè)實(shí)施例如何處理用戶問(wèn)題的實(shí)例。用戶帕蒂輸入問(wèn)題:"1'mwitha customer.HejustaskedmeaboutiHadoop^ .Cansomeonetellmehowitconnectsto Websphere?(我有一個(gè)客戶。他剛才問(wèn)我有關(guān)'Hadoop'的問(wèn)題。有人能告訴我如何將 它連接到Websphere嗎?)"。解析問(wèn)題并且可以提取概念"customer(客戶)"、"Hadoop"、 "Websphere"和"HadoopconnectsWebsphere(Hadoop連接Websphere) "。系統(tǒng)估計(jì)這些概 念如何與我們認(rèn)為任何給定的單獨(dú)用戶感興趣的概念相關(guān)。我們強(qiáng)調(diào)這些用戶不需要表現(xiàn) 出對(duì)提取的概念的任何直接興趣,因?yàn)槲覀円蕾囉谝环N用于估計(jì)在圖中表示的任何兩個(gè)理 念之間的關(guān)系強(qiáng)度的技術(shù)。用戶然后創(chuàng)建可以能夠幫助帕蒂的用戶的草稿列表。系統(tǒng)還從 帕蒂的問(wèn)題(以及任何其它可用信息)推斷帕蒂在客戶處,并且因此問(wèn)題緊急?;诖耍?統(tǒng)將帕蒂的問(wèn)題傳送到草稿列表的相對(duì)大的部分。在一個(gè)實(shí)施例中,草稿列表例如可以僅 限于與帕蒂在同一公司工作的那些人員,或者其所在公司銷售帕蒂的問(wèn)題中提及的產(chǎn)品的 人員。
[0068] 在另一個(gè)實(shí)例中,帕特正在帕利塞茲商場(chǎng)購(gòu)物,這時(shí)他看到一張熟悉的面孔。他發(fā) 送問(wèn)題"DidIjustseeMrs.MovieStarenterthePalisadesMali?(我剛才看到某影星 夫人進(jìn)入帕利塞茲商場(chǎng)了嗎?)"。系統(tǒng)解析帕特的問(wèn)題并且認(rèn)識(shí)到地理定位的重要性。它 將問(wèn)題傳送到作為當(dāng)前購(gòu)物者的用戶列表(并且還可能傳送到經(jīng)常在帕利塞茲商場(chǎng)購(gòu)物 的那些用戶),可能根據(jù)對(duì)名人的興趣或其它準(zhǔn)則確定優(yōu)先級(jí)。幾秒后,帕特開始從更多看 到或沒(méi)有看到某影星夫人的購(gòu)物者那里獲得回復(fù)。此外,帕特還可能從以下人員那里獲得 回復(fù):其當(dāng)前未在帕利塞茲商場(chǎng),但經(jīng)常在那里購(gòu)物,從而讓人們知道有一位經(jīng)常在帕利塞 茲商場(chǎng)的某影星夫人的模仿者。帕特可以切換到聊天模式以便向其它用戶廣播所有響應(yīng)。 這將構(gòu)建協(xié)同定位的即時(shí)地理社區(qū)。
[0069] 現(xiàn)在轉(zhuǎn)到圖4,示出根據(jù)一個(gè)實(shí)施例的用于實(shí)現(xiàn)即時(shí)社區(qū)的系統(tǒng)環(huán)境400。可以結(jié) 合圖1的系統(tǒng)100實(shí)現(xiàn)系統(tǒng)400。
[0070] 如圖所示,系統(tǒng)400可以包括匹配引擎402。匹配引擎402可以用于將使用有關(guān)其 興趣和特定請(qǐng)求的先前信息的人員與即時(shí)社區(qū)中的會(huì)話內(nèi)容相匹配。
[0071] 系統(tǒng)400可以包括控制引擎404,在圖4中由虛線橢圓/圓表示??刂埔?04可 以基于人類行為模型,促進(jìn)社區(qū)的形成和解散,以便確保蓬勃發(fā)展并且管理良好的系統(tǒng)。控 制引擎404可以通過(guò)優(yōu)化以下項(xiàng)提供此類特性:即時(shí)社區(qū)的大小、范圍、生存和多樣性,邀 請(qǐng)多少用戶參與,或者啟動(dòng)即時(shí)社區(qū)建立,如何將用戶添加到即時(shí)社區(qū)或者從即時(shí)社區(qū)中 刪除的動(dòng)態(tài)性,應(yīng)用統(tǒng)計(jì)方法以便保護(hù)用戶的隱私性,以及防止外部惡意"社交工程"。
[0072] 系統(tǒng)400可以包括一個(gè)或多個(gè)接口,例如Web接口 406、聊天接口 408和應(yīng)用(app) 接口 410。接口可以與前端接口關(guān)聯(lián),前端接口可以包括網(wǎng)站、移動(dòng)應(yīng)用和工具欄應(yīng)用設(shè)計(jì) 以及集成接口,以便促進(jìn)與消息傳送服務(wù)的通信。接口可以與后端接口關(guān)聯(lián),后端接口可以 包括自然語(yǔ)言處理技術(shù)和能力。接口可以用于接收和/或存儲(chǔ)用戶偏好和興趣一在某些實(shí) 施例中,可以在遠(yuǎn)程服務(wù)器中促進(jìn)這種存儲(chǔ)。接口可以耦合到接口集線器412。接口可以將 實(shí)時(shí)數(shù)據(jù)和用戶偏好傳送到接口集線器412。
[0073] 在某些實(shí)施例中,每個(gè)用戶可以在會(huì)話期間連接到唯一接口集線器(例如,接口 集線器412)。接口集線器412可以將新問(wèn)題或交互請(qǐng)求路由到即時(shí)社區(qū)處理機(jī)414。即時(shí) 社區(qū)處理機(jī)414可以向主數(shù)據(jù)庫(kù)416通知用戶連接和斷開連接。接口集線器412可以將即 時(shí)社區(qū)和系統(tǒng)消息路由到接口(例如,接口 406-410)。接口集線器412可以跟蹤與連接到 該接口集線器412的每個(gè)用戶對(duì)應(yīng)的即時(shí)社區(qū)。
[0074] 即時(shí)社區(qū)處理機(jī)414可以從接口集線器412接收文本和用戶標(biāo)識(shí)符。即時(shí)社區(qū)處 理機(jī)414可以將新問(wèn)題或交互請(qǐng)求路由到NLP弓丨擎418。如果給出來(lái)自NLP引擎418的主 題列表,則即時(shí)社區(qū)處理機(jī)414可以查詢匹配引擎402以獲得即時(shí)社區(qū)和(新的或現(xiàn)有的) 聯(lián)系人列表。作為響應(yīng),即時(shí)社區(qū)處理機(jī)414可以從匹配引擎402接收即時(shí)社區(qū)和聯(lián)系人 結(jié)果。即時(shí)社區(qū)處理機(jī)414可以將問(wèn)題或交互路由到聯(lián)系人(例如,作為邀請(qǐng)的一部分)。 即時(shí)社區(qū)處理機(jī)414可以管理響應(yīng),并且可以根據(jù)需要撤消問(wèn)題或交互。即時(shí)社區(qū)處理機(jī) 414可以向主數(shù)據(jù)庫(kù)416通知任何新的即時(shí)社區(qū)或者對(duì)現(xiàn)有即時(shí)社區(qū)的更改或修改。
[0075] 即時(shí)社區(qū)處理機(jī)414可以提供對(duì)現(xiàn)有即時(shí)社區(qū)的支持。例如,即時(shí)社區(qū)處理機(jī)414 可以將即時(shí)社區(qū)消息路由到用戶。即時(shí)社區(qū)處理機(jī)414可以將即時(shí)社區(qū)消息路由到NLP引 擎418以便過(guò)濾(例如,第二級(jí)過(guò)濾)。即時(shí)社區(qū)處理機(jī)414可以管理即時(shí)社區(qū)的終止,并 且可以向主數(shù)據(jù)庫(kù)416通知即時(shí)社區(qū)的銷毀。即時(shí)社區(qū)處理機(jī)414可以聯(lián)系匹配引擎402 以獲得有關(guān)與給定即時(shí)社區(qū)相關(guān)的主題的聯(lián)系人列表,或者獲得要與其合并的其它現(xiàn)有即 時(shí)社區(qū)。
[0076] 匹配引擎402可以從即時(shí)社區(qū)處理機(jī)414接收列表。該列表可以包括主題和/或 權(quán)重。匹配引擎402可以產(chǎn)生與接收的主題相關(guān)的用戶和現(xiàn)有即時(shí)社區(qū)的有序列表。匹配 引擎402可以從主數(shù)據(jù)庫(kù)416接收用戶狀態(tài)和即時(shí)社區(qū)狀態(tài)更新(可能借助即時(shí)社區(qū)處理 機(jī)414)。匹配引擎402可以從系統(tǒng)分析引擎404a接收參數(shù),這些參數(shù)可以控制如何完成列 表。
[0077] 主數(shù)據(jù)庫(kù)416可以維護(hù)所有用戶的列表,包括簡(jiǎn)檔、興趣、憑證、活動(dòng)級(jí)別、歷史以 及當(dāng)前參與。主數(shù)據(jù)庫(kù)416可以維護(hù)當(dāng)前即時(shí)社區(qū)和連接用戶的列表。主數(shù)據(jù)庫(kù)416可以 更新與匹配引擎402關(guān)聯(lián)的數(shù)據(jù)。主數(shù)據(jù)庫(kù)416可以由控制引擎404使用。主數(shù)據(jù)庫(kù)416 可以由即時(shí)社區(qū)處理機(jī)414和/或接口集線器412更新。
[0078] 系統(tǒng)分析引擎404a可以跟蹤整個(gè)系統(tǒng)400的動(dòng)態(tài)。系統(tǒng)分析引擎404a可以處理 控制鉤子(例如匹配引擎402中的鉤子),以便保證系統(tǒng)400的穩(wěn)定性。
[0079] 主題分析引擎404b可以跟蹤主題興趣的演化。主題分析引擎404b可以為NLP引 擎418提供有關(guān)演化的數(shù)據(jù)或反饋。
[0080] 現(xiàn)在轉(zhuǎn)到圖5,示出方法500的流程圖??梢越Y(jié)合例如在此描述的一個(gè)或多個(gè)組 件、設(shè)備或系統(tǒng)執(zhí)行方法500。方法500可以用于形成即時(shí)社區(qū)。
[0081] 在方框502,可以獲得用戶的感興趣主題。例如,第一用戶可能結(jié)合用戶簡(jiǎn)檔,輸入 或表明她感興趣的那些主題。在某些實(shí)施例中,可以推斷用戶的感興趣主題。例如,如果第 一用戶查看與版權(quán)和商標(biāo)相關(guān)的網(wǎng)頁(yè),則可以推斷第一用戶通常對(duì)知識(shí)產(chǎn)權(quán)感興趣,并且 可以將知識(shí)產(chǎn)權(quán)保存為第一用戶的感興趣主題。
[0082] 在方框504,第二用戶可以請(qǐng)求有關(guān)所標(biāo)識(shí)的感興趣主題的交互。例如,第二用戶 可以請(qǐng)求有關(guān)獲得發(fā)明專利的問(wèn)題的交互。例如,第二用戶可能不知道專利申請(qǐng)的哪些部 分需要符合專利局實(shí)踐規(guī)則。第二用戶可以使用一個(gè)或多個(gè)自然語(yǔ)言表達(dá)式或消息提出問(wèn) 題,例如"howdoIprepareapatentapplication?(我如何準(zhǔn)備專利申請(qǐng)?)" 和"what sectionsareneeded?(需要哪些部分?)"。
[0083] 在方框506,邏輯可以分解方框504的請(qǐng)求/自然語(yǔ)言表達(dá)式,以標(biāo)識(shí)要邀請(qǐng)的以 便與第二用戶交互的一個(gè)或多個(gè)用戶??梢曰谡?qǐng)求/自然語(yǔ)言表達(dá)式和用戶簡(jiǎn)檔中的可 用信息之間的想法共鳴性,標(biāo)識(shí)要邀請(qǐng)的用戶。在準(zhǔn)備專利申請(qǐng)的上下文中,可以基于第一 用戶對(duì)版權(quán)和商標(biāo)感興趣,將上面結(jié)合方框502描述的第一用戶標(biāo)識(shí)為應(yīng)被邀請(qǐng)的用戶。 [0084] 可以查詢一個(gè)或多個(gè)圖(其包括節(jié)點(diǎn)和邊,這些節(jié)點(diǎn)和邊可以彼此相關(guān)或者將主 題連接到彼此),以便標(biāo)識(shí)要在方框506邀請(qǐng)的用戶。圖可以表示世界模型,該模型可以隨 時(shí)間改變或變化。所述圖可以基于從一個(gè)或多個(gè)源獲得的信息。例如,所述圖可以基于用 戶簡(jiǎn)檔或用戶模型(例如,圖3的用戶模型302)以及世界模型。
[0085] 為了確保要邀請(qǐng)的用戶及時(shí)響應(yīng)請(qǐng)求,可以在方框506,從活躍或當(dāng)前登錄到系統(tǒng) 或平臺(tái)的用戶池中選擇要邀請(qǐng)的用戶。
[0086] 在方框508,可以將邀請(qǐng)傳輸?shù)皆诜娇?06標(biāo)識(shí)的用戶(多個(gè))。傳輸?shù)难?qǐng)可以 包括方框504的一個(gè)或多個(gè)自然語(yǔ)言表達(dá)式或消息。因此,對(duì)版權(quán)和商標(biāo)感興趣的第一用 戶可以接收有關(guān)準(zhǔn)備專利申請(qǐng)的邀請(qǐng)。作為方框508的一部分,可以形成即時(shí)社區(qū)。
[0087] 在方框510,可以從在方框508接收傳輸?shù)难?qǐng)的一個(gè)或多個(gè)用戶處接收加入交 互/用戶社區(qū)的接受。可以將接受邀請(qǐng)的那些用戶與在方框504啟動(dòng)請(qǐng)求的(第二)用戶 一起放入即時(shí)社區(qū)中,以便作為即時(shí)社區(qū)成員的用戶將能夠就感興趣的主題(多個(gè))(例 如,專利準(zhǔn)備和專利申請(qǐng)各部分)而彼此交互。
[0088] 方法500是示例性的。在某些實(shí)施例中,可以包括未示出的其它方框或操作。在 某些實(shí)施例中,某個(gè)方框或操作(或其一部分)可以是可選的。在某些實(shí)施例中,可以以不 同于圖5中所示的順序或序列執(zhí)行方框或操作。
[0089] 如上所述,即時(shí)社區(qū)的概念可以用于使得用戶(不必以其它方式知道彼此)能夠 彼此交互以便討論一個(gè)或多個(gè)感興趣的主題。在此方面,系統(tǒng)或平臺(tái)可以用作個(gè)人交互代 理,所述代理可以基于用戶的想法、視圖或興趣聚集用戶??梢栽谧匀徽Z(yǔ)言表達(dá)式與圖之間 形成上下文關(guān)系,以便確定應(yīng)該邀請(qǐng)哪些用戶參與即時(shí)社區(qū)。
[0090] 如上所述,在某些實(shí)例中,可能難以獲得高質(zhì)量或足夠的即時(shí)社區(qū)參與。例如,用 戶可能沒(méi)有動(dòng)機(jī)參與有關(guān)給定主題的會(huì)話,并且即使他們參與,也可能不傾向于最大限度 地參與。同樣,系統(tǒng)(例如,系統(tǒng)100和400)的所有者或運(yùn)營(yíng)者可能沒(méi)有動(dòng)機(jī)提供即時(shí)社 區(qū)服務(wù),除非提供用于運(yùn)營(yíng)服務(wù)的某種激勵(lì)。
[0091] 為了激勵(lì)所有者/運(yùn)營(yíng)者提供即時(shí)社區(qū)服務(wù),服務(wù)的所有者或運(yùn)營(yíng)者可以提供廣 告,這些廣告與即時(shí)社區(qū)關(guān)聯(lián)的主題在上下文上相關(guān)。這些廣告例如可以在與即時(shí)社區(qū)關(guān) 聯(lián)的網(wǎng)頁(yè)的側(cè)欄中顯示。供應(yīng)商或廣告商可以連同預(yù)算規(guī)范、關(guān)鍵字和感興趣主題一起提 供其廣告。即時(shí)社區(qū)的服務(wù)提供者可以根據(jù)供應(yīng)商提供的輸入,選擇哪些廣告在給定即時(shí) 社區(qū)中呈現(xiàn),或者哪些廣告呈現(xiàn)給即時(shí)社區(qū)的給定用戶。服務(wù)提供者可以隨時(shí)間更改呈現(xiàn) 的廣告,這可以基于即時(shí)社區(qū)中的交互或會(huì)話如何在該時(shí)間段內(nèi)變化。如在此使用的,會(huì)話 是一種類型交互的實(shí)例。
[0092] 服務(wù)提供者可以基于供應(yīng)商呈現(xiàn)廣告的次數(shù),基于廣告呈現(xiàn)給的用戶的身份等, 向供應(yīng)商收取費(fèi)用。如果用戶點(diǎn)擊或選擇廣告,則服務(wù)提供者可以向供應(yīng)商收取額外費(fèi)用。 更進(jìn)一步,如果用戶從供應(yīng)商購(gòu)買產(chǎn)品或服務(wù),則可以向供應(yīng)商收取額外費(fèi)用??梢岳?通過(guò)向用戶賬戶存入份額,將服務(wù)提供者收取的部分費(fèi)用與即時(shí)社區(qū)的一個(gè)或多個(gè)用戶分 享。
[0093] 可以實(shí)現(xiàn)檢測(cè)系統(tǒng),以便確保用戶未以欺詐性方式就啟動(dòng)或參與即時(shí)社區(qū)而收取 報(bào)酬(例如,金錢報(bào)酬或費(fèi)用份額)。例如,即時(shí)社區(qū)的啟動(dòng)用戶可能需要為即時(shí)社區(qū)中的 第二用戶提供肯定反饋,以便允許第二用戶接收?qǐng)?bào)酬。通過(guò)這種方式,可以激勵(lì)由即時(shí)社區(qū) 中的第二用戶所表現(xiàn)出的高質(zhì)量參與。
[0094] 可以使用技術(shù)確保啟動(dòng)用戶和第二用戶未嘗試結(jié)伴參與同一即時(shí)社區(qū)(單獨(dú))以 便獲得報(bào)酬。例如,可以使用隨機(jī)選擇技術(shù)降低第一用戶和第二用戶重復(fù)參與同一即時(shí)社 區(qū)的可能性。在某些實(shí)施例中,可以阻止第一用戶和第二用戶在給定時(shí)間段內(nèi)同時(shí)參與"n" 個(gè)以上的即時(shí)社區(qū)(其中"n"是數(shù)值),或者可以相對(duì)于參與其它即時(shí)社區(qū)的基準(zhǔn)縮減或減 少其報(bào)酬。
[0095] 在某些實(shí)施例中,提供一種在因特網(wǎng)上實(shí)現(xiàn)匿名會(huì)話的系統(tǒng)。該系統(tǒng)可以包括會(huì) 話代理、參與者或用戶以及廣告商。參與者可以通過(guò)在系統(tǒng)中發(fā)送第一消息而啟動(dòng)會(huì)話。代 理可以將第一消息轉(zhuǎn)送到它自己目的地的多個(gè)參與者和廣告商。代理可以根據(jù)它自己的目 的地,隨時(shí)添加或刪除參與者和廣告商。參與者可以參與會(huì)話,這可以包括響應(yīng)于先前消息 而發(fā)送一個(gè)或多個(gè)消息。代理可以向廣告商拍賣會(huì)話內(nèi)容、關(guān)鍵字、句子以及任何其它相關(guān) 信息。
[0096] 在某些實(shí)施例中,廣告商可以出錢以便加入會(huì)話。廣告商可以包括機(jī)器人或真人。 如果代理允許廣告商加入,則代理可以從廣告商的資金或賬戶中提取資金。對(duì)于參與者,可 以將廣告商標(biāo)識(shí)為廣告商或另一個(gè)參與者。
[0097] 廣告可以在會(huì)話內(nèi)顯示,或者在單獨(dú)的廣告區(qū)域中顯示。廣告可以不對(duì)稱地顯示 或呈現(xiàn),并且每個(gè)參與者可能觀察到不同的廣告。廣告可以是超鏈接,當(dāng)參與者點(diǎn)擊它們 時(shí),代理可以從廣告商的資金或賬戶中提取出價(jià)金額。廣告可以是廣告商提供的實(shí)際會(huì)話。 廣告可以隨會(huì)話更改而更改。
[0098] 參與者或用戶可以因加入和參與會(huì)話或交互而從代理接收金錢獎(jiǎng)勵(lì)。代理可以使 參與者知道獎(jiǎng)勵(lì)金額,以便參與者可以確定和更改其參與級(jí)別的優(yōu)先級(jí)。參與者可以就其 它參與者貢獻(xiàn)進(jìn)行表決,以便代理可以調(diào)整獎(jiǎng)勵(lì)金額。
[0099] 現(xiàn)在將注意力轉(zhuǎn)到對(duì)上述體系架構(gòu)的核心組件的描述。讀者可以理解,為了實(shí)現(xiàn) 將用戶與符合的興趣和/或意圖關(guān)聯(lián)的任務(wù),必須采用一種方法,其估計(jì)任何兩個(gè)用戶在 任何給定時(shí)間的接近程度。我們采用的觀點(diǎn)是:我們將通過(guò)依賴于建模為圖的概念領(lǐng)域?qū)?現(xiàn)這一點(diǎn),其中圖的節(jié)點(diǎn)是概念或主題,并且其中圖中的邊表示這些概念之間的第一級(jí)關(guān) 系,而且邊具有潛在權(quán)重。擁有圖之后,可以作為關(guān)聯(lián)用戶的任務(wù)一部分采用的一種技術(shù)是 概率估計(jì)工具,其用于估計(jì)任何兩個(gè)理念或理念集合的接近程度,其中理念是理念(或主 題)領(lǐng)域的一部分。然后可以使用該方法估計(jì)用戶可能對(duì)理念或理念集合感興趣的概率, 并且通過(guò)擴(kuò)展,估計(jì)查詢發(fā)起者與連接到所述系統(tǒng)的任何特定用戶的符合程度。后一種情 形可以通過(guò)接受采用自然語(yǔ)言形式的用戶查詢來(lái)實(shí)現(xiàn),然后采用自然語(yǔ)言模塊以便從查詢 提取可以被映射到所述系統(tǒng)的理念或主題領(lǐng)域的特定重要關(guān)鍵字。
[0100] 現(xiàn)在參考圖6,例如由圖1中所示的應(yīng)用112實(shí)現(xiàn)的概率估計(jì)工具可以被配置為 結(jié)合一個(gè)或多個(gè)階段操作。圖6中示出用于估計(jì)代理對(duì)主題領(lǐng)域中的給定主題感興趣的概 率的方法600的一個(gè)實(shí)例。例如,第一階段602可以用于獲得主題領(lǐng)域的模型。第二階段 604可以用于針對(duì)領(lǐng)域中的每個(gè)主題,獲得代理對(duì)該主題感興趣的概率,假設(shè)代理表現(xiàn)出僅 對(duì)一個(gè)主題感興趣。第三階段606可以用于計(jì)算代理對(duì)領(lǐng)域中的各種主題感興趣的概率估 計(jì),假設(shè)代理表現(xiàn)出對(duì)兩個(gè)或更多主題感興趣。第四階段608可以用于每當(dāng)代理指定其沒(méi) 有興趣或不感興趣的一個(gè)或多個(gè)主題時(shí),組合估計(jì)。
[0101] 關(guān)于上面參考圖6描述的第一階段602,可以假設(shè)具有正方隨機(jī)矩陣P,并且每個(gè) 維度等于給定主題領(lǐng)域中的主題數(shù)量(例如,大約十萬(wàn)個(gè)主題、一百萬(wàn)個(gè)主題、五百萬(wàn)個(gè)主 題、一千萬(wàn)個(gè)主題等)。P_U,j}可以指示第i行和第j列上的表項(xiàng),并且從馬爾可夫鏈理 論意義上說(shuō),可以被解釋為從狀態(tài)j轉(zhuǎn)到狀態(tài)i的概率,以便矩陣P的每列分別加一(1)。 可以假設(shè)已經(jīng)選擇概率,以便反映可以針對(duì)領(lǐng)域的主題表現(xiàn)出的第一級(jí)關(guān)系??梢允褂脝?獨(dú)網(wǎng)頁(yè)標(biāo)識(shí)主題,并且主題之間的第一級(jí)鏈接可以由網(wǎng)頁(yè)(例如,Wikipedia網(wǎng)頁(yè)、企業(yè)內(nèi) 聯(lián)網(wǎng)網(wǎng)頁(yè)、普通網(wǎng)頁(yè))之間的超鏈接給出。此外,不需要存在超鏈接,因?yàn)榭梢曰诿枋雒?個(gè)主題的語(yǔ)言,使用非結(jié)構(gòu)化信息處理技術(shù)提取兩個(gè)主題之間的隱式鏈接。可以使用從一 個(gè)頁(yè)面去往另一個(gè)給定頁(yè)面的相對(duì)超鏈接數(shù)量確定這些頁(yè)面之間的關(guān)系強(qiáng)度。此外,可以 使用頁(yè)面中的超鏈接重要性(例如,超鏈接在頁(yè)面中的位置)的估計(jì),進(jìn)一步影響填充矩陣 P時(shí)分配給頁(yè)面的概率。
[0102] 當(dāng)從網(wǎng)頁(yè)集合的超鏈接結(jié)構(gòu)構(gòu)建圖時(shí),以下操作可能很有用:人為添加和/或刪 除鏈接,以及刪除一個(gè)或多個(gè)節(jié)點(diǎn)以便提高對(duì)應(yīng)圖的質(zhì)量。例如,可以將節(jié)點(diǎn)與彼此僅松散 相關(guān)的多個(gè)頁(yè)面的索引關(guān)聯(lián)。這種節(jié)點(diǎn)及其鏈接可能引入假關(guān)系,因?yàn)樗饕⒎侵荚谑境?主題之間的真正關(guān)系,而僅是一種用于瀏覽Web的機(jī)制。消除這些類型的節(jié)點(diǎn)及其鏈接可 以用于獲得或隔離主題之間的關(guān)系的指示。一個(gè)實(shí)例是考慮Wikipedia中的"消歧"頁(yè)面。 這些頁(yè)面包含主題列表,這些主題的上下文描述非常類似(例如,DeepBlue計(jì)算機(jī)和Deep Blue電影),但表示不同的事物。一個(gè)實(shí)施例將從圖中刪除這些消歧節(jié)點(diǎn)(但是,它們可以 在其它算法中用于其它目的)。
[0103]在相反的情況下,在沒(méi)有鏈接的位置添加鏈接可以是適合的,例如當(dāng)存在從第一 主題到第二主題的鏈接,但沒(méi)有從第二主題到第一主題的鏈接時(shí)。如果存在從第一主題到 第二主題的鏈接指示第一和第二主題之間的關(guān)系,則可以合理地假設(shè)應(yīng)該添加從第二主題 到第一主題的鏈接。添加這種鏈接可以提高在此描述的算法的整體性能。如果給出人為添 加鏈接的事實(shí),則可以為這種添加的鏈接提供常規(guī)或典型鏈接的權(quán)重,或者可以提供較低 的重要性或權(quán)重。
[0104] 關(guān)于上面參考圖6描述的第二階段604,第二階段604可以基于廣義形式的矩陣特 征向量算法的使用。在此技術(shù)中,可以使用下面等式1中提供的矩陣替換馬爾可夫鏈轉(zhuǎn)變 概率矩陣P:
[0105] (l-a)P+av〇[lII... 1]等式I
[0106] 等式1可以表示統(tǒng)計(jì)遍歷試驗(yàn)或者是其一個(gè)實(shí)例。在等式1中,"a"表示在0和 1之間的參數(shù),"v° "表示概率向量,其在與代理對(duì)其表現(xiàn)出原有興趣的主題對(duì)應(yīng)的表項(xiàng)中等 于1,而在其它位置等于〇," [111-1] "符號(hào)表示充滿1的行向量,其長(zhǎng)度等于領(lǐng)域中的主 題數(shù)量(也等于P中的行/列數(shù)量)。因此,V°[l1 1…1]表示每列等于V°的方陣。等式 1中的矩陣可以被視為專用于特定主題的馬爾可夫鏈。通過(guò)圖形方式,如果概率"a"l返回 到描述代理對(duì)其表現(xiàn)出感興趣的主題的節(jié)點(diǎn),并且轉(zhuǎn)為概率(1-a),則在隨機(jī)矩陣P描述的 馬爾可夫鏈中采取步驟。
[0107]假設(shè)等式1中的馬爾可夫鏈具有靜態(tài)概率分布,則靜態(tài)概率分布可以被視為Web 瀏覽的"隨機(jī)瀏覽"試驗(yàn)的結(jié)果,其在感興趣的特定網(wǎng)頁(yè)處開始,然后隨機(jī)查找或點(diǎn)擊鏈接, 始終以某一概率返回到起始網(wǎng)頁(yè)。生成的靜態(tài)概率分布可以提供任何給定網(wǎng)頁(yè)多長(zhǎng)時(shí)間被 訪問(wèn)一次的指示,并且具有停留在接近起始網(wǎng)頁(yè)的頁(yè)面的某種偏好??梢酝ㄟ^(guò)重復(fù)的矩陣 "X"向量運(yùn)算估計(jì)靜態(tài)概率分布,其在合理的誤差裕度內(nèi)相當(dāng)快速地收斂到靜態(tài)分布。
[0108] 靜態(tài)概率分布(或其估計(jì))可能偏重于具有許多內(nèi)部鏈接的節(jié)點(diǎn),即使這些節(jié)點(diǎn) 與初始主題(如向量,描述的)所關(guān)聯(lián)的節(jié)點(diǎn)相距甚遠(yuǎn)。這是因?yàn)檫@些節(jié)點(diǎn)有效地充當(dāng) 吸引者。例如,在Wikipedia中,使用鏈接作為度量的一個(gè)最受歡迎的節(jié)點(diǎn)(或主題)是 "U.S.A.(美國(guó))"。即使某人表現(xiàn)出例如對(duì)"Patagonia(巴塔哥尼亞)"或"DimSum(點(diǎn) 心)"感興趣,也會(huì)觀察到專用于Patagonia或DimSum的對(duì)應(yīng)靜態(tài)分布仍然為U.S.A.給出 高概率。這可能是不希望的結(jié)果,該結(jié)果可以導(dǎo)致對(duì)感興趣的概率的錯(cuò)誤估計(jì)。
[0109] 可以假設(shè)"W"表示針對(duì)選擇某一"a",等式1的靜態(tài)分布或其估計(jì),"Z"表示"規(guī) 范化"分布。規(guī)范化分布例如可以是矩陣P的靜態(tài)分布估計(jì)。規(guī)范化分布可以是以下矩陣 的靜態(tài)分布估計(jì):該矩陣采用等式1的形式,但其中使用所有表項(xiàng)等于同一概率的概率向 量替換向量v° (例如,均勻分布)。在后一種情形/實(shí)施例中,參數(shù)"a"還具有潛在選擇,該 選擇不需要與計(jì)算"W"時(shí)進(jìn)行的"a"選擇一致。備選地,可以選擇不同于均勻分布的概率 分布,以便反映有關(guān)參考人群對(duì)每個(gè)主題的興趣程度的不同假設(shè)。
[0110] 無(wú)論如何,"Z"可以對(duì)應(yīng)于某人沒(méi)有任何特定主題作為感興趣主題時(shí)的靜態(tài)分布, 因此更確切地說(shuō)反映整個(gè)人群的興趣,而不是僅一個(gè)特定人員或代理的興趣。靜態(tài)分布至 少在原則上可以完全基于任何給定主題在圖中的拓?fù)鋬?yōu)勢(shì)(例如,許多內(nèi)部鏈接)或劣勢(shì), 衡量該主題的流行度。上面針對(duì)Z給出的實(shí)例將具有該通用屬性。
[0111] 擁有"W"和"Z"之后,可以通過(guò)下面的等式2計(jì)算代理對(duì)主題"j"感興趣的概率 估計(jì):
[0112] f(g(ff(j)) /(g(W(j))+g(Z(j)))) 等式 2
[0113] 等式2可以用于推斷關(guān)系強(qiáng)度。在等式2中,W(j)表示向量W的第j個(gè)表項(xiàng),對(duì) 于Z也一樣,f()表示下面進(jìn)一步描述的"過(guò)濾函數(shù)"。如下面進(jìn)一步描述的,值W可以稱為 "原始得分"。首先,可以假設(shè)f(.) =1,其對(duì)應(yīng)于沒(méi)有過(guò)濾的條件。同樣,由于下面進(jìn)一步 描述的原因,函數(shù)g()可以用于預(yù)處理向量W和Z。首先,可以假設(shè)g(.) = 1。
[0114] 如果專用于固定主題的分布W具有屬性W(j) =Z(j),其中Z未專用于某個(gè)主題, 則等式2中表示的比率等于0. 5,這可以被解釋為漠不關(guān)心(例如,不喜歡也不厭惡)。因 此,如果Z和W針對(duì)j保持一致,則這可以表示沒(méi)有證據(jù)表明與"普通"或一般的Z(j)相比, 存在于W中的專用性導(dǎo)致訪問(wèn)節(jié)點(diǎn)j的比率更高。
[0115] 為了討論,如果W(j) = 10Z(j)(例如,在專用于給定主題下,訪問(wèn)節(jié)點(diǎn)j的頻率是 Z的十倍),則等式2中的比率等于10/11或大約0. 9。0. 9這一值可以被解釋為表示代理 對(duì)j感興趣的概率是0.9。
[0116] 同樣,如果W(j)與Z(j)相比非常小,則等式2中的比率將接近于0,這可以被解釋 為表示與一般人群相比,代理對(duì)此類主題j感興趣的可能性更小。
[0117] 在上述格式中,等式2中表示的比率結(jié)果可以被解釋為感興趣/不感興趣或喜歡 /不喜歡的概率。
[0118] 可以結(jié)合等式2中的過(guò)濾函數(shù)以便考慮以下事實(shí):在許多實(shí)際情況下,等式2的變 化范圍可能僅集中于[0, 1]區(qū)間內(nèi)的某些區(qū)域。通常,如下函數(shù):
[0119]g(x) =x'b等式 3
[0120] 對(duì)于某個(gè)指數(shù)b(例如,b= 0.5)可以產(chǎn)生良好的結(jié)果。同樣,函數(shù)f?可以用于進(jìn) 一步控制生成的概率估計(jì)。例如,它可以用于調(diào)整等式2中表示的比率,以便該比率始終等 于或大于閾值。因此,可以將函數(shù)f表示為:
[0121]f(x) =X,如果x>x_0,以及 等式 4
[0122] f (X)=x_0,如果x〈x_0 等式 5
[0123] 關(guān)于上面參考圖6描述的第三階段606,可以假設(shè)從兩個(gè)不同初始主題開始,從等 式2獲得兩個(gè)感興趣概率估計(jì),表示為El和E2??梢允褂枚喾N技術(shù),將估計(jì)El和E2組合 成單個(gè)估計(jì)。例如,El和E2的最大值可以用于E。例如:
[0124]E=max(El,E2) 等式 6
[0125] 另一種可能性是將El和E2均視為從統(tǒng)計(jì)獨(dú)立的試驗(yàn)獲得(以試驗(yàn)結(jié)果為條件), 這些試驗(yàn)嘗試回答感興趣(1. 0 = 100%確定感興趣)相對(duì)于沒(méi)有興趣或不感興趣(0. 0 = 100%確定不感興趣)的概率的問(wèn)題。從這個(gè)觀點(diǎn)來(lái)看,可以使用對(duì)數(shù)似然比的概念在形式 上組合兩個(gè)獨(dú)立的觀察值。具體地說(shuō),如果Pl、p2、…PM是獨(dú)立的感興趣概率估計(jì),則可以 從以下等式計(jì)算組合概率:
[0126]LLRinv(LLR(Pl) +LLR(P2) + …+LLR(PM)) 等式 6
[0127] 其中LLR(x) =log(xAl-x))并且LLRinv是LLR(X)的對(duì)應(yīng)反函數(shù)。這種形式可 以通過(guò)在每個(gè)LLR項(xiàng)的前面添加因數(shù)"kx",支持對(duì)每個(gè)單獨(dú)主題的強(qiáng)度進(jìn)行加權(quán),例如:
[0128]LLRinvGc1LLR(Pl) +k2LLR(P2) + …+kMLLR(PM))等式 8
[0129] 關(guān)于上面參考圖6描述的第四階段608,可以使等式8中的適當(dāng)"kx"因數(shù)變負(fù),以 便每當(dāng)代理指定其不感興趣的一個(gè)或多個(gè)主題時(shí)組合估計(jì)。
[0130] 所屬【技術(shù)領(lǐng)域】的技術(shù)人員將理解,可以使用圖對(duì)主題之間的關(guān)系進(jìn)行建模。例如, 圖的每個(gè)節(jié)點(diǎn)可以表示主題、理念或概念??梢越?jīng)由一個(gè)或多個(gè)邊或鏈接,將節(jié)點(diǎn)連接到彼 此,或者潛在地連接到一個(gè)或多個(gè)其它節(jié)點(diǎn)。
[0131] 主題包(bundle)可以被定義為節(jié)點(diǎn)集合,其中該集合包括至少一個(gè)節(jié)點(diǎn)。領(lǐng)域中 可以存在多個(gè)("M"個(gè))主題包。可能感興趣的是:確定M個(gè)主題包相對(duì)彼此的重要性。
[0132] 例如,參考圖7,示出原始得分表700,其中表中的數(shù)值是原始得分的自然對(duì)數(shù)。"并 行處理"、"GPGPU"、"數(shù)據(jù)挖掘"、"貝多芬"、"古典音樂(lè)"、"嘻哈文化"和"美國(guó)"可以表示主 題或節(jié)點(diǎn)。主題在表700的垂直列或部分中示為查詢主題。經(jīng)由圖7中所示的數(shù)值,反映 查詢主題與表示為個(gè)人主題(圖7中的頂部水平行)的主題的關(guān)系。數(shù)值表示查詢主題與 個(gè)人主題的接近度或貼近度,并且值"〇"表示高的接近度或貼近度。當(dāng)值遠(yuǎn)離"〇"時(shí),查詢 主題與個(gè)人主題更少地相關(guān)。
[0133] 如圖7中所示,查詢主題"數(shù)據(jù)挖掘"僅與個(gè)人主題"并行處理"略微相關(guān),如圖7 中的值"-13"反映的那樣。查詢主題"美國(guó)"與個(gè)人主題"并行處理"更多地相關(guān),如圖7中 的值"_8"反映的那樣。非常確定地顯示,與"數(shù)據(jù)挖掘"相比,"美國(guó)"與"并行處理"更密 切相關(guān),這用于反映現(xiàn)有技術(shù)的不足之處。
[0134] 在某些實(shí)施例中,對(duì)于給定主題包,可以為領(lǐng)域中的每個(gè)其它主題包分配原始得 分,該得分嘗試衡量給定主題包與每個(gè)其它主題包之間的關(guān)系強(qiáng)度??梢允褂迷荚u(píng)分函 數(shù)分配原始得分。
[0135]為了計(jì)算原始得分,原始評(píng)分函數(shù)可以依賴于多個(gè)輸入。所述輸入可以包括:(1) 表示理念或主題領(lǐng)域的圖,并且每個(gè)主題是節(jié)點(diǎn),圖中的每個(gè)鏈接表示第一級(jí)關(guān)系,(2)有 關(guān)M個(gè)主題包的概率分布,其表征一般人群對(duì)主題包的興趣,以及(3)至少兩個(gè)主題包,表 示為A和B,以便易于說(shuō)明。
[0136] 原始評(píng)分函數(shù)的輸出可以提供以下問(wèn)題的答案:相對(duì)于主題包的一般人群,主題 包A與主題包B的相關(guān)性為何??梢灾赋觯嘘P(guān)主題包的概率分布,加上原始評(píng)分函數(shù)(應(yīng) 用于每個(gè)單獨(dú)主題包),轉(zhuǎn)而可以暗示M個(gè)主題包的每一個(gè)的原始得分分布。
[0137] 可以將算法與原始評(píng)分函數(shù)結(jié)合使用,以便確定或計(jì)算原始得分。作為算法的第 一任務(wù)或方法800,可以獲得主題包的概率分布估計(jì)。
[0138] 如圖8A中所示,第一任務(wù)800可以包括多個(gè)操作。例如,在操作802中,可以從M 個(gè)主題包中選擇主題包,可能隨機(jī)選擇。在操作804中,可以針對(duì)操作802的選定主題包對(duì) 原始評(píng)分函數(shù)求值。在操作806中,可以基于操作804的結(jié)果,更新每個(gè)主題包的得分分布 估計(jì)。
[0139]為了完成操作806,可以針對(duì)分布假設(shè)參數(shù)模型(S卩,假設(shè)分布遵循參數(shù)模型)。例 如,可以假設(shè)將分布的尾部建模為帕累托分布。參數(shù)模型可以用于相對(duì)于任意分布減少數(shù) 據(jù)存儲(chǔ),可能以使用不會(huì)同等應(yīng)用于所有主題包的模型為代價(jià)。
[0140] 可實(shí)行進(jìn)一步優(yōu)化。例如,如果原始評(píng)分函數(shù)是線性的(在可以通過(guò)將單獨(dú)主題 的原始評(píng)分相加而計(jì)算具有兩個(gè)主題的主題包的原始評(píng)分的意義上),則可以通過(guò)限制將 主題包視為其內(nèi)部具有一個(gè)主題的主題包,實(shí)現(xiàn)第一任務(wù)800。
[0141]另一種優(yōu)化是操作806中的估計(jì)不需要與所有主題包具有相同的性質(zhì)。例如,對(duì) 于某些主題包,參數(shù)估計(jì)可能足夠。對(duì)于某些主題包,可以計(jì)算更復(fù)雜的估計(jì),而不對(duì)分布 形狀進(jìn)行任何假設(shè)。
[0142] 擁有操作806中的估計(jì)之后,可以通過(guò)圖8B中所示的第二任務(wù)或方法850,回答主 題包A與主題包B的相關(guān)性為何的問(wèn)題。
[0143] 如圖8B中所示,第二任務(wù)850可以包括多個(gè)操作。在操作852中,可以針對(duì)主題 包A對(duì)原始評(píng)分函數(shù)求值。在操作854中,可以從操作852的結(jié)果中提取分配給主題包B 的得分。在操作856中,可以確定操作854中的已提取得分在主題包B的得分分布估計(jì)中 具有的百分位數(shù)。在操作858中,可以輸出操作856的所確定的百分位數(shù)。
[0144] 在某些實(shí)施例中,可以將操作852和854融合為單個(gè)操作。例如,可能不需要對(duì)整 個(gè)原始評(píng)分函數(shù)求值以產(chǎn)生操作854中需要的得分。
[0145] 在某些實(shí)施例中,可以預(yù)先計(jì)算得分分布估計(jì)。在某些實(shí)施例中,可以預(yù)先計(jì)算原 始評(píng)分函數(shù)。預(yù)先計(jì)算可以用于減少存儲(chǔ)器/存儲(chǔ)容量和/或減少所需的處理資源,以及 用于快速獲得任何兩個(gè)主題包之間的關(guān)系。
[0146] 在某些實(shí)施例中,可以通過(guò)獲得馬爾可夫鏈的靜態(tài)分布估計(jì),實(shí)現(xiàn)原始評(píng)分函數(shù), 該馬爾可夫鏈專用于針對(duì)其對(duì)原始評(píng)分函數(shù)求值的主題包,并且描述馬爾可夫隨機(jī)過(guò)程, 該過(guò)程通過(guò)將圖的鏈接與給定概率關(guān)聯(lián),訪問(wèn)圖中的節(jié)點(diǎn)。可以通過(guò)以下操作設(shè)計(jì)一種此 類馬爾可夫鏈:從例如從圖的關(guān)聯(lián)矩陣獲得的通用馬爾可夫鏈開始,然后將來(lái)自圖中每個(gè) 節(jié)點(diǎn)的鏈接添加回包含在主題包中的節(jié)點(diǎn),將合適的概率與此類鏈接關(guān)聯(lián)。
[0147] 參考圖9,示出根據(jù)一個(gè)或多個(gè)實(shí)施例的改進(jìn)后的得分表900。表900類似于圖7 的表700。與表900關(guān)聯(lián)的值不同于與表700關(guān)聯(lián)的值。例如,在表900中,數(shù)值的范圍可 以從0. 5到1. 0。在表900中,值越接近于1. 0,表示查詢主題和個(gè)人主題之間的關(guān)系越強(qiáng)。 在表900中,值越接近于0. 5,表示查詢主題與個(gè)人主題不相關(guān)。如表900中所示,查詢主 題"數(shù)據(jù)挖掘"相對(duì)于個(gè)人主題"并行處理"具有值〇. 7,這表示數(shù)據(jù)挖掘和并行處理之間的 中等或中度關(guān)系。如表900中所示,查詢主題"美國(guó)"相對(duì)于個(gè)人主題"并行處理"具有值 〇. 5,這指示美國(guó)和并行處理高度不相關(guān)。因此,使用在此描述的技術(shù),可以開發(fā)主題之間的 更精確關(guān)系,如表700和900之間的差異反映的那樣。
[0148] 參考圖10,示出示例性方法1000的流程圖。方法1000可以用于推斷主題之間的 關(guān)系。
[0149] 在方框1002,可以構(gòu)造圖。所述圖可以包括至少三個(gè)節(jié)點(diǎn)??梢酝ㄟ^(guò)一個(gè)或多個(gè) 邊表不節(jié)點(diǎn)之間的關(guān)系。
[0150] 在方框1004,可以針對(duì)圖執(zhí)行統(tǒng)計(jì)遍歷試驗(yàn)。遍歷試驗(yàn)包括遍歷至少兩個(gè)邊,并且 可以使用例如先前針對(duì)等式1描述的矩陣執(zhí)行。
[0151] 在方框1006,可以基于遍歷試驗(yàn),推斷三個(gè)節(jié)點(diǎn)中的第一節(jié)點(diǎn)和三個(gè)節(jié)點(diǎn)中的第 二節(jié)點(diǎn)之間的關(guān)系強(qiáng)度。在一個(gè)實(shí)施例中,可以使用等式2推斷關(guān)系強(qiáng)度。
[0152] 本公開的各實(shí)施例可以用于調(diào)整原始得分(例如,上面等式2中的"W"),以便考 慮一般人群或子人群表現(xiàn)出的興趣。沒(méi)有用于比較的基準(zhǔn),單獨(dú)獲得的原始得分可能沒(méi)有 多少含義或意義。參考上面的等式2, "Z"可以表示用于比較"W"的參考或基準(zhǔn)分布。
[0153] 為了獲得更具體的實(shí)例,第一用戶可以對(duì)主題"美國(guó)"表現(xiàn)出興趣,概率為KT5,并 且對(duì)"法律學(xué)校"表現(xiàn)出興趣,概率為1〇_7。將這些概率視為原始得分,考慮到1〇_ 5大于1〇_7, 可能傾向于假設(shè)第一用戶對(duì)美國(guó)比對(duì)法律學(xué)校更感興趣。但是,如果參考人群對(duì)美國(guó)感興 趣的平均概率為1〇_ 5,并且對(duì)法律學(xué)校感興趣的平均概率為1〇_8,則至少相對(duì)于參考人群的 平均興趣,第一用戶可能實(shí)際上對(duì)法律學(xué)校比對(duì)美國(guó)更感興趣。
[0154] 結(jié)合上面"美國(guó)"和"法律學(xué)校"之間的比較,第一用戶對(duì)這些主題/題目的興趣 參考了參考人群表現(xiàn)的對(duì)這些主題的平均興趣??梢栽诘谝挥脩舻脑嫉梅趾蛥⒖既巳褐?間進(jìn)行更細(xì)致的比較。例如,如果針對(duì)用戶對(duì)"美國(guó)"和"法律學(xué)校"感興趣的程度,記錄參 考人群中的每一個(gè)用戶的答案,則可以開發(fā)參數(shù)模型(可能基于直方圖),以便提供有關(guān)第 一用戶對(duì)"美國(guó)"和"法律學(xué)校"感興趣的更高級(jí)別或程度的信息。例如,可以能夠確定第 一用戶對(duì)法律學(xué)校的興趣使得該第一用戶例如在對(duì)法律學(xué)校感興趣的用戶中排名前90%, 但在對(duì)美國(guó)感興趣的用戶中僅排名前40%。
[0155] 現(xiàn)在參考圖11,示出方法1100的流程圖。方法1100可以用于標(biāo)識(shí)代理對(duì)主題的 興趣,該興趣相對(duì)于其它代理對(duì)該主題的興趣。
[0156] 在方框1102,可以收集有關(guān)代理集合的信息。該信息可以包括對(duì)一個(gè)或多個(gè)主題 表現(xiàn)出興趣。
[0157] 在方框1104,基于方塊1102的信息,可以計(jì)算主題與代理集合中的每個(gè)代理之間 的關(guān)系強(qiáng)度。
[0158] 在方框1106,可以基于代理相對(duì)于其它代理與主題的關(guān)系如何不同,對(duì)該主題和 該代理之間的關(guān)系進(jìn)行排序。
[0159] 在方框1108,可以輸出排序的結(jié)果。例如,可以作為方框1108的一部分獲得代理 表現(xiàn)出對(duì)主題出感興趣。方框1108的結(jié)果可以包括代理對(duì)其它主題的興趣,以及其它代理 對(duì)一個(gè)或多個(gè)主題的興趣。
[0160] 技術(shù)效果和益處包括提供一種社交交互促進(jìn)工具,其自動(dòng)執(zhí)行以下過(guò)程:標(biāo)識(shí)兩 個(gè)或更多用戶或個(gè)體之間的共性,以便促進(jìn)有關(guān)感興趣的特定主題的偶然社交交互。所述 社交交互促進(jìn)工具可以從各種數(shù)據(jù)源(例如社交媒體網(wǎng)站)收集有關(guān)用戶的信息,并且可 以建立社區(qū)(例如,即時(shí)社區(qū))。可以基于以下項(xiàng)建立社區(qū):消息內(nèi)容的描述、對(duì)應(yīng)于可能 接收者人群中的至少兩個(gè)可能消息接收者的接收者數(shù)據(jù),以及基于對(duì)所述描述與所述接收 者數(shù)據(jù)之間的至少一種間接關(guān)系的強(qiáng)度排序來(lái)選擇相關(guān)子人群,其中所述間接關(guān)系可以通 過(guò)所述描述、所述接收者和至少一個(gè)其它數(shù)據(jù)源來(lái)定義。社區(qū)可以在消息發(fā)送者和相關(guān)子 人群之間提供雙向通信通道。
[0161] 技術(shù)效果和益處還可以包括基于圖分析和/或一個(gè)或多個(gè)評(píng)分函數(shù),提供主題或 理念的接近度或相關(guān)性的估計(jì)。
[0162] 在此使用的術(shù)語(yǔ)只是為了描述特定實(shí)施例并且并非旨在作為本公開的限制。如在 此使用的,單數(shù)形式"一"、"一個(gè)"和"該"旨在同樣包括復(fù)數(shù)形式,除非上下文明確地另有 所指。還將理解,當(dāng)在此說(shuō)明書中使用時(shí),術(shù)語(yǔ)"包括"和/或"包含"指定了聲明的特性、 整數(shù)、步驟、操作、元素和/或組件的存在,但是并不排除一個(gè)或多個(gè)其它特性、整數(shù)、步驟、 操作、元素、組件和/或其組合的存在或增加。
[0163] 下面權(quán)利要求中的對(duì)應(yīng)結(jié)構(gòu)、材料、操作以及所有功能性限定的裝置或步驟的等 同替換,旨在包括任何用于與在權(quán)利要求中具體指出的其它元件相組合地執(zhí)行該功能的結(jié) 構(gòu)、材料或操作。出于示例和說(shuō)明目的給出了對(duì)本公開的描述,但所述描述并非旨在是窮舉 的或是將本公開限于所披露的形式。在不偏離本公開的范圍和精神的情況下,對(duì)于所屬技 術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō)許多修改和變化都將是顯而易見的。實(shí)施例的選擇和描述是為 了最佳地解釋本公開的原理和實(shí)際應(yīng)用,并且當(dāng)適合于所構(gòu)想的特定使用時(shí),使得所屬技 術(shù)領(lǐng)域的其它普通技術(shù)人員能夠理解本公開的具有各種修改的各種實(shí)施例。
[0164] 此外,所屬【技術(shù)領(lǐng)域】的技術(shù)人員知道,本公開的各個(gè)方面可以實(shí)現(xiàn)為系統(tǒng)、方法或 計(jì)算機(jī)程序產(chǎn)品。因此,本公開的各個(gè)方面可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件實(shí)施 方式、完全的軟件實(shí)施方式(包括固件、駐留軟件、微代碼等),或硬件和軟件方面結(jié)合的實(shí) 施方式,這里可以統(tǒng)稱為"電路"、"模塊"或"系統(tǒng)"。此外,本公開的各個(gè)方面還可以實(shí)現(xiàn)為 在一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)程序產(chǎn)品的形式,該計(jì)算機(jī)可讀介質(zhì)中包含計(jì)算 機(jī)可讀的程序代碼。
[0165] 可以采用一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)的任意組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī) 可讀信號(hào)介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是一但不限于一 電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者上述的任意合適的組合。計(jì)算 機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便 攜式計(jì)算機(jī)盤、硬盤、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、可擦式可編程只讀存儲(chǔ)器 (EPROM或閃存)、光纖、便攜式緊湊盤只讀存儲(chǔ)器(CD-ROM)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者 上述的任意合適的組合。在本文件中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的 有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
[0166] 計(jì)算機(jī)可讀的信號(hào)介質(zhì)可以包括例如在基帶中或者作為載波一部分傳播的數(shù)據(jù) 信號(hào),其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括一 但不限于一電磁信號(hào)、光信號(hào)或上述的任意合適的組合。計(jì)算機(jī)可讀的信號(hào)介質(zhì)可以是計(jì) 算機(jī)可讀存儲(chǔ)介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳 輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
[0167] 計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括一但不限 于一無(wú)線、有線、光纜、RF等等,或者上述的任意合適的組合。
[0168] 可以以一種或多種程序設(shè)計(jì)語(yǔ)言的任意組合來(lái)編寫用于執(zhí)行本公開的各個(gè)方面 的操作的計(jì)算機(jī)程序代碼,所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言一諸如Java、 Smalltalk、C++等,還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言一諸如"C"語(yǔ)言或類似的程序設(shè)計(jì) 語(yǔ)言。程序代碼可以完全地在用戶計(jì)算機(jī)上執(zhí)行、部分地在用戶計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú) 立的軟件包執(zhí)行、部分在用戶計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī) 或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過(guò)任意種類的網(wǎng)絡(luò)一包 括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)-連接到用戶計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如 利用因特網(wǎng)服務(wù)提供商來(lái)通過(guò)因特網(wǎng)連接)。
[0169] 上面參照根據(jù)本公開實(shí)施例的方法、裝置(系統(tǒng))和計(jì)算機(jī)程序產(chǎn)品的流程圖和 /或框圖描述了本公開的各個(gè)方面。應(yīng)當(dāng)理解,流程圖和/或框圖的每個(gè)方框以及流程圖 和/或框圖中各方框的組合,都可以由計(jì)算機(jī)程序指令實(shí)現(xiàn)。這些計(jì)算機(jī)程序指令可以提 供給通用計(jì)算機(jī)、專用計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機(jī)器, 使得這些指令在通過(guò)計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器執(zhí)行時(shí),產(chǎn)生了實(shí)現(xiàn)流程 圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的裝置。
[0170] 也可以把這些計(jì)算機(jī)程序指令存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中,這些指令使得計(jì)算機(jī)、 其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備以特定方式工作,從而,存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的 指令就產(chǎn)生出包括實(shí)現(xiàn)流程圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的指令 的制造品(articleofmanufacture) 〇
[0171] 也可以把計(jì)算機(jī)程序指令加載到計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備 上,使得在計(jì)算機(jī)、其它可編程裝置或其它設(shè)備上執(zhí)行一系列操作步驟,以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn) 的過(guò)程,從而使得在計(jì)算機(jī)或其它可編程裝置上執(zhí)行的指令提供實(shí)現(xiàn)流程圖和/或框圖中 的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的過(guò)程。
[0172] 附圖中的流程圖和框圖顯示了根據(jù)本公開的不同實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程 序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代 表一個(gè)模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個(gè)或多個(gè)用 于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo) 注的功能可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)連續(xù)的方框?qū)嶋H上可以基本 并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是, 框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定 的功能或動(dòng)作的專用的基于硬件的系統(tǒng)來(lái)實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合 來(lái)實(shí)現(xiàn)。
【權(quán)利要求】
1. 一種用于推斷主題之間的關(guān)系的方法,所述方法包括: 訪問(wèn)包含多個(gè)節(jié)點(diǎn)和邊的圖,每個(gè)節(jié)點(diǎn)表示主題,并且每個(gè)邊表示兩個(gè)主題之間的已 知關(guān)聯(lián); 針對(duì)所述圖執(zhí)行統(tǒng)計(jì)遍歷試驗(yàn);以及 推斷由所述圖中的節(jié)點(diǎn)表示的任何兩個(gè)主題之間的關(guān)系強(qiáng)度,所述推斷基于從所述統(tǒng) 計(jì)遍歷試驗(yàn)提取的統(tǒng)計(jì)信息。
2. 根據(jù)權(quán)利要求1的方法,還包括構(gòu)造所述圖。
3. 根據(jù)權(quán)利要求1的方法,其中所述推斷在以下兩個(gè)主題之間:這兩個(gè)主題沒(méi)有連接 它們的邊。
4. 根據(jù)權(quán)利要求1的方法,其中使用馬爾可夫鏈執(zhí)行所述遍歷試驗(yàn)。
5. 根據(jù)權(quán)利要求1的方法,其中所述圖是稀疏圖。
6. 根據(jù)權(quán)利要求1的方法,其中到所述統(tǒng)計(jì)遍歷試驗(yàn)的輸入包括所述任何兩個(gè)主題中 的至少一個(gè)。
7. 根據(jù)權(quán)利要求1的方法,其中執(zhí)行統(tǒng)計(jì)遍歷試驗(yàn)包括: 迭代從所述圖中導(dǎo)出的馬爾可夫鏈;以及 其中推斷任何兩個(gè)主題之間的關(guān)系強(qiáng)度包括規(guī)范化基于所述迭代獲得的概率分布,以 便如果給出對(duì)一個(gè)主題感興趣,確定對(duì)另一主題感興趣的概率。
8. 根據(jù)權(quán)利要求1的方法,還包括: 使用信息組合技術(shù),基于代理表現(xiàn)出對(duì)至少兩個(gè)其它主題感興趣,計(jì)算所述代理對(duì)一 個(gè)主題感興趣的概率估計(jì)。
9. 根據(jù)權(quán)利要求8的方法,其中所述信息組合技術(shù)包括使用概率的對(duì)數(shù)似然比。
10. 根據(jù)權(quán)利要求9的方法,還包括: 使用所述對(duì)數(shù)似然比,基于所述代理表現(xiàn)出對(duì)至少一個(gè)主題不感興趣,計(jì)算所述代理 對(duì)所述一個(gè)主題感興趣的概率估計(jì)。
11. 根據(jù)權(quán)利要求10的方法,其中使用所述對(duì)數(shù)似然比將所述不感興趣表示為減法。
12. 根據(jù)權(quán)利要求1的方法,還包括: 迭代地選擇包括在所述圖中的節(jié)點(diǎn)集合; 對(duì)于每次迭代,針對(duì)選定集合對(duì)原始評(píng)分函數(shù)求值;以及 使用所述求值的結(jié)果,針對(duì)包括在多個(gè)集合中的每個(gè)集合更新原始得分分布估計(jì),以 便獲得所述原始得分的分布。
13. 根據(jù)權(quán)利要求12的方法,其中所述原始評(píng)分函數(shù)是線性的,并且其中每個(gè)選定節(jié) 點(diǎn)集合具有單個(gè)節(jié)點(diǎn)。
14. 根據(jù)權(quán)利要求12的方法,其中更新后的得分分布估計(jì)基于所述分布遵循參數(shù)模型 的假設(shè)。
15. 根據(jù)權(quán)利要求12的方法,還包括: 將原始得分與所述原始得分的分布相比較; 基于所述比較確定所述原始得分的百分位數(shù);以及 輸出所確定的百分位數(shù)。
16. 根據(jù)權(quán)利要求12的方法,其中預(yù)先計(jì)算包括在所述多個(gè)集合中的至少一個(gè)所述集 合的原始得分分布。
17. 根據(jù)權(quán)利要求12的方法,其中作為融合操作而執(zhí)行迭代選擇所述節(jié)點(diǎn)集合和針對(duì) 選定集合對(duì)所述原始評(píng)分函數(shù)求值。
18. -種系統(tǒng),包括: 存儲(chǔ)器,其具有計(jì)算機(jī)可讀計(jì)算機(jī)指令;以及 處理器,其用于執(zhí)行所述計(jì)算機(jī)可讀指令以便執(zhí)行一種方法,所述方法包括: 訪問(wèn)包含多個(gè)節(jié)點(diǎn)和邊的圖,每個(gè)節(jié)點(diǎn)表示主題,并且每個(gè)邊表示兩個(gè)主題之間的已 知關(guān)聯(lián); 針對(duì)所述圖執(zhí)行統(tǒng)計(jì)遍歷試驗(yàn);以及 推斷由所述圖中的節(jié)點(diǎn)表示的任何兩個(gè)主題之間的關(guān)系強(qiáng)度,所述推斷基于從所述統(tǒng) 計(jì)遍歷試驗(yàn)提取的統(tǒng)計(jì)信息。
19. 根據(jù)權(quán)利要求18的系統(tǒng),其中所述任何兩個(gè)主題沒(méi)有連接它們的邊。
20. 根據(jù)權(quán)利要求18的系統(tǒng),其中使用馬爾可夫鏈執(zhí)行所述統(tǒng)計(jì)遍歷試驗(yàn)。
21. 根據(jù)權(quán)利要求18的系統(tǒng),其中到所述統(tǒng)計(jì)遍歷試驗(yàn)的輸入包括所述任何兩個(gè)主題 中的至少一個(gè)。
22. -種用于推斷主題之間的關(guān)系的系統(tǒng),所述系統(tǒng)包括用于執(zhí)行權(quán)利要求1-17的任 何方法的所有步驟的裝置。
【文檔編號(hào)】G06F17/30GK104239385SQ201410254310
【公開日】2014年12月24日 申請(qǐng)日期:2014年6月10日 優(yōu)先權(quán)日:2013年6月11日
【發(fā)明者】M·M·弗蘭切斯基尼, A·賈格莫漢, L·A·L·蒙塔諾, L·索爾斯 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司