最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

優(yōu)化搜索結(jié)果的方法及裝置與流程

文檔序號:11155354閱讀:750來源:國知局
優(yōu)化搜索結(jié)果的方法及裝置與制造工藝

本發(fā)明實(shí)施例涉及計(jì)算機(jī)技術(shù),尤其涉及一種優(yōu)化搜索結(jié)果的方法及裝置。



背景技術(shù):

隨著計(jì)算機(jī)技術(shù)的發(fā)展,用戶通過計(jì)算機(jī)進(jìn)行搜索的場景越來越普遍。例如,在線上購物過程中,用戶可以輸入搜索詞來搜索自己想要的商品。計(jì)算機(jī)中的搜索系統(tǒng)在接收到用戶輸入的搜索詞后,可以根據(jù)內(nèi)部的算法計(jì)算搜索出的文檔的分值,將搜索出的文檔按照分值進(jìn)行排序,并輸出給用戶。對于用戶來說,最終呈現(xiàn)出的文檔的順序非常重要,其直接影響了用戶的搜索體驗(yàn)。在計(jì)算搜索出的文檔的分值時(shí),是按照文檔的各索引字段及各索引字段的權(quán)重值進(jìn)行計(jì)算的。通過設(shè)置索引字段的權(quán)重值,可以在搜索過程中強(qiáng)調(diào)一些字段而弱化另一些字段。因此,在搜索系統(tǒng)中,確定索引字段的合理的權(quán)重集非常重要。

目前,企業(yè)通常都采用人工的方式確定各索引字段的權(quán)重值。例如,在搜索系統(tǒng)上線之前,通常由技術(shù)人員根據(jù)需求設(shè)置各索引字段及各索引字段的初始的權(quán)重值,加載數(shù)據(jù)后進(jìn)行測試搜索,,再根據(jù)搜索結(jié)果調(diào)整索引字段的權(quán)重值,直至最終輸出的目標(biāo)文檔的順序達(dá)到滿意的程度。

但是,上述過程是采用人工方式調(diào)整字段的權(quán)重值,調(diào)整后的搜索效果依賴于個(gè)人經(jīng)驗(yàn),效果不可靠。而且,一旦搜索系統(tǒng)上線運(yùn)行之后,無法持續(xù)對搜索結(jié)果進(jìn)行優(yōu)化,從而,導(dǎo)致用戶的搜索體驗(yàn)不高。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例提供一種優(yōu)化搜索結(jié)果的方法及裝置,以提高用戶的搜索體驗(yàn)。

一方面,本發(fā)明實(shí)施例提供一種優(yōu)化搜索結(jié)果的方法,應(yīng)用于對搜索系統(tǒng)進(jìn)行分析的搜索分析系統(tǒng)。該搜索系統(tǒng)提供不同的索引字段。該方法包括:搜索分析系統(tǒng)獲取搜索系統(tǒng)的搜索日志。其中,搜索日志中包括發(fā)生過的搜索中的搜索詞信息、搜索結(jié)果信息及用戶的操作信息。搜索分析系統(tǒng)從搜索詞信息中確定出用于測試的搜索詞集合,并根據(jù)搜索詞信息、搜索結(jié)果信息及用戶的操作信息對搜索詞集合中每個(gè)搜索詞的搜索進(jìn)行有效性分析,得到關(guān)于有效性的分析結(jié)果。搜索分析系統(tǒng)以搜索詞集合中的搜索詞在索引字段的不同權(quán)重集下進(jìn)行測試搜索,得到各搜索詞在不同權(quán)重集下的測試結(jié)果。搜索分析系統(tǒng)利用從搜索日志得到的關(guān)于有效性的分析結(jié)果測算每個(gè)權(quán)重集下的測試結(jié)果的有效值,并確定各測試結(jié)果的有效值中滿足預(yù)設(shè)條件的有效值,將滿足預(yù)設(shè)條件的有效值對應(yīng)的權(quán)重集作為索引字段的最優(yōu)權(quán)重集。搜索分析系統(tǒng)以最優(yōu)權(quán)重集對搜索系統(tǒng)中的索引字段的權(quán)重值進(jìn)行更新。權(quán)重集是由各索引字段的權(quán)重值組合而成集合。這里的預(yù)設(shè)條件可以為各測試結(jié)果的有效值中最大的有效值,也可以是各測試結(jié)果的有效值中大于預(yù)設(shè)閾值的有效值。該方法實(shí)現(xiàn)了在搜索系統(tǒng)的運(yùn)行過程中,可以根據(jù)搜索日志得到每個(gè)搜索詞的有效性的分析結(jié)果,再根據(jù)該分析結(jié)果去測算每個(gè)權(quán)重集下的測試結(jié)果的有效值,進(jìn)而,根據(jù)每個(gè)權(quán)重集下的測試結(jié)果的有效值確定索引字段的最優(yōu)權(quán)重集,對索引字段的權(quán)重值進(jìn)行更新,在搜索系統(tǒng)上線之后,可以根據(jù)搜索日志持續(xù)實(shí)現(xiàn)對搜索結(jié)果的優(yōu)化,相較于無法持續(xù)對搜索結(jié)果進(jìn)行優(yōu)化的方式,可以實(shí)現(xiàn)不斷優(yōu)化搜索結(jié)果,從而,提高了用戶的搜索體驗(yàn)。

在一種可能的設(shè)計(jì)中,以搜索詞集合中的搜索詞在索引字段的不同權(quán)重集下進(jìn)行測試搜索包括:通過調(diào)整索引字段的權(quán)重值來得到索引字段的不同權(quán)重集;在每次調(diào)整后,以搜索詞集合中的搜索詞在調(diào)整后的權(quán)重集下進(jìn)行測試搜索,得到不同權(quán)重集下的測試結(jié)果。在調(diào)整過程中,可以是以遍歷索引字段的權(quán)重集空間的方法來進(jìn)行調(diào)整。該實(shí)現(xiàn)方式可以高效地得到不同權(quán)重集下的測試結(jié)果。

在一種可能的設(shè)計(jì)中,有效性分析包括:對每個(gè)搜索詞所產(chǎn)生的搜索結(jié)果中的文檔的有效性進(jìn)行分析;相應(yīng)的,得到關(guān)于有效性的分析結(jié)果包括:得到每個(gè)搜索詞的有效文檔集以及有效文檔集中每個(gè)有效文檔的有效值。則利用從搜索日志得到的關(guān)于有效性的分析結(jié)果測算每個(gè)權(quán)重集下的測試結(jié)果的有效值,具體包括:從各權(quán)重集的測試結(jié)果中提取用于進(jìn)行測算的測算文檔集;確定測試搜索中搜索到測算文檔集的搜索詞,從測算文檔集中識別出包括在測算文檔集對應(yīng)的搜索詞的有效文檔集中的文檔;從關(guān)于有效性的分析結(jié)果中獲取識別出的測算文檔的有效值;根據(jù)每個(gè)權(quán)重集下識別出的測算文檔的有效值計(jì)算權(quán)重集下的測試結(jié)果的有效值。實(shí)現(xiàn)了簡便快捷地進(jìn)行有效性分析,提高了優(yōu)化搜索結(jié)果的效率。

在一種可能的設(shè)計(jì)中,對每個(gè)搜索詞所產(chǎn)生的搜索結(jié)果中的文檔的有效性進(jìn)行分析,包括:確定每個(gè)搜索詞的有效文檔集;根據(jù)公式Rix=r*Di*Fi2確定有效文檔集中第x個(gè)有效文檔相對第i個(gè)搜索詞的有效值,其中,r為預(yù)設(shè)的參數(shù),Di為第x個(gè)有效文檔被用戶選中的次數(shù),F(xiàn)i為用戶選中第x個(gè)有效文檔之前的翻頁次數(shù)。

在一種可能的設(shè)計(jì)中,根據(jù)每個(gè)權(quán)重集下識別出的測算文檔的有效值計(jì)算權(quán)重集下的測試結(jié)果的有效值,具體包括:根據(jù)公式確定第i個(gè)搜索詞對應(yīng)的測算文檔集相對第i個(gè)搜索詞的測試搜索有效值,其中,z為測算文檔集中測算文檔的總個(gè)數(shù),R'ix為測算文檔集中第x個(gè)測算文檔相對第i個(gè)搜索詞的測試搜索有效值,當(dāng)?shù)趚個(gè)測算文檔為識別出的測算文檔時(shí),R'ix=Rix,當(dāng)?shù)趚個(gè)測算文檔不是識別出的測算文檔時(shí),R'ix=0;根據(jù)公式確定第x個(gè)權(quán)重集下的測試結(jié)果的有效值。

該實(shí)現(xiàn)方式限定了具體的對文檔的有效性進(jìn)行分析以及確定不同的權(quán)重集下的測試結(jié)果的有效值的公式,實(shí)現(xiàn)了定量地進(jìn)行分析,提高了優(yōu)化搜索結(jié)果的準(zhǔn)確率。

在一種可能的設(shè)計(jì)中,有效性分析還包括:對每個(gè)搜索詞的重要性進(jìn)行分析;相應(yīng)的,得到關(guān)于有效性的分析結(jié)果還包括:得到每個(gè)搜索詞的重要性權(quán)重值;相應(yīng)地,根據(jù)每個(gè)權(quán)重集下識別出的測算文檔的有效值計(jì)算權(quán)重集下的測試結(jié)果的有效值,具體包括:根據(jù)公式確定第i個(gè)搜索詞對應(yīng)的測算文檔集相對第i個(gè)搜索詞的測試搜索有效值,其中,Ti為第i個(gè)搜索詞的重要性權(quán)重值,z為測算文檔集中測算文檔的總個(gè)數(shù),R'ix為測算文檔集中第x個(gè)測算文檔相對第i個(gè)搜索詞的測試搜索有效值,當(dāng)?shù)趚個(gè)測算文檔為識別出的測算文檔時(shí),R'ix=Rix,當(dāng)?shù)趚個(gè)測算文檔不是識別出的測算文檔時(shí),R'ix=0;根據(jù)公式確定第x個(gè)權(quán)重集下的測試結(jié)果的有效值。

在一種可能的設(shè)計(jì)中,對每個(gè)搜索詞的重要性進(jìn)行分析,具體包括:根據(jù)公式確定第i個(gè)搜索詞的重要性權(quán)重值,其中,n為搜索詞集合中搜索詞的總個(gè)數(shù),Ci表示搜索詞集合中第i個(gè)搜索詞被搜索的次數(shù)。

該實(shí)現(xiàn)方式中,在進(jìn)行有效性分析時(shí),對每個(gè)搜索詞的重要性進(jìn)行了分析,并且,限定了具體的確定搜索詞的重要性權(quán)重值的公式,以及,在計(jì)算權(quán)重集下的測試結(jié)果的有效值時(shí)考慮到了搜索詞的重要性權(quán)重值,進(jìn)一步提高了優(yōu)化搜索結(jié)果的準(zhǔn)確率。

另一方面,本發(fā)明實(shí)施例提供一種優(yōu)化搜索結(jié)果的裝置,該裝置具有實(shí)現(xiàn)上述方法實(shí)施例中搜索分析系統(tǒng)的功能。所述功能可以通過硬件實(shí)現(xiàn),也可以通過硬件執(zhí)行相應(yīng)的軟件實(shí)現(xiàn)。所述硬件或軟件包括一個(gè)或多個(gè)與上述功能相對應(yīng)的部件(比如,獲取模塊,有效性分析模塊,測試搜索模塊,測算模塊,確定模塊,更新模塊)。

再一方面,本發(fā)明實(shí)施例提供一種計(jì)算機(jī)存儲介質(zhì),用于儲存為上述搜索分析系統(tǒng)所用的計(jì)算機(jī)軟件指令,其包含用于執(zhí)行上述方面為搜索分析系統(tǒng)所設(shè)計(jì)的程序。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本發(fā)明實(shí)施例提供的搜索分析系統(tǒng)及搜索系統(tǒng)的架構(gòu)圖;

圖2為本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的方法實(shí)施例的流程示意圖;

圖3為本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的裝置實(shí)施例一的結(jié)構(gòu)示意圖;

圖4為本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的裝置實(shí)施例二的結(jié)構(gòu)示意圖。

具體實(shí)施方式

本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”、“第三”及“第四”等(如果存在)是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例例如能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。

圖1為本發(fā)明實(shí)施例提供的搜索分析系統(tǒng)及搜索系統(tǒng)的架構(gòu)圖。如圖1所示,本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的方法,可以應(yīng)用于對搜索系統(tǒng)11進(jìn)行分析的搜索分析系統(tǒng)12中。搜索系統(tǒng)11提供不同的索引字段。在搜索系統(tǒng)11中,當(dāng)用戶輸入搜索詞發(fā)起信息搜索時(shí),搜索系統(tǒng)11在索引庫111中根據(jù)搜索詞及索引字段檢索目標(biāo)物品信息,并反饋給用戶。并在搜索日志112中記錄搜索詞、搜索結(jié)果及用戶對該搜索結(jié)果的操作信息。這里的信息搜索可以是商品搜索或文獻(xiàn)搜索等。在此過程中,各索引字段的權(quán)重值會影響最終搜索結(jié)果中的商品或文獻(xiàn)的排序,而該排序是影響用戶搜索體驗(yàn)的重要因素。為方便起見,將搜索結(jié)果中的商品和文獻(xiàn)都稱為文檔。因此,在搜索系統(tǒng)11的運(yùn)行過程中,調(diào)整并確定各索引字段的權(quán)重集非常重要。搜索分析系統(tǒng)12可以在搜索系統(tǒng)的運(yùn)行過程中,采用本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的方法,對搜索系統(tǒng)中的索引字段的權(quán)重值進(jìn)行更新,從而優(yōu)化搜索結(jié)果,提高用戶體驗(yàn)。

本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的方法可以由搜索分析系統(tǒng)獲取搜索系統(tǒng)的搜索日志,搜索日志中包括發(fā)生過的搜索中的搜索詞信息、搜索結(jié)果信息及用戶的操作信息,從搜索詞信息中確定出用于測試的搜索詞集合,并根據(jù)搜索詞信息、搜索結(jié)果信息及用戶的操作信息對搜索詞集合中每個(gè)搜索詞的搜索進(jìn)行有效性分析,得到關(guān)于有效性的分析結(jié)果,以搜索詞集合中的搜索詞在索引字段的不同權(quán)重集下進(jìn)行測試搜索,得到各搜索詞在不同權(quán)重集下的測試結(jié)果,權(quán)重集是由各索引字段的權(quán)重值組合而成的集合,利用從搜索日志得到的關(guān)于有效性的分析結(jié)果測算每個(gè)權(quán)重集下的測試結(jié)果的有效值,確定各測試結(jié)果的有效值中滿足預(yù)設(shè)條件的有效值,將滿足預(yù)設(shè)條件的有效值對應(yīng)的權(quán)重集作為索引字段的最優(yōu)權(quán)重集,以最優(yōu)權(quán)重集對搜索系統(tǒng)中的索引字段的權(quán)重值進(jìn)行更新。也就是說,本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的方法是由搜索分析系統(tǒng)根據(jù)搜索日志對歷史上的搜索進(jìn)行有效性分析,然后利用該分析結(jié)果來評估在索引字段的不同權(quán)重集下進(jìn)行測試搜索的搜索結(jié)果,從而找出最優(yōu)的權(quán)重集。由于搜索分析系統(tǒng)是基于歷史的客觀數(shù)據(jù)來對測試搜索的搜索結(jié)果進(jìn)行評估的,因此,由此找出的最優(yōu)權(quán)重集比人為經(jīng)驗(yàn)具有更高的可靠性。另外,該方法可以在搜索系統(tǒng)的運(yùn)行過程中執(zhí)行,因此,在搜索系統(tǒng)上線之后,可以根據(jù)搜索日志持續(xù)實(shí)現(xiàn)對搜索結(jié)果的優(yōu)化,相較于無法持續(xù)對搜索結(jié)果進(jìn)行優(yōu)化的方式,可以實(shí)現(xiàn)不斷優(yōu)化搜索結(jié)果,從而,提高了用戶的搜索體驗(yàn)。

下面以具體的實(shí)施例對本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明。下面這幾個(gè)具體的實(shí)施例可以相互結(jié)合,對于相同或相似的概念或過程可能在某些實(shí)施例不再贅述。

圖2為本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的方法實(shí)施例的流程示意圖。如圖2所示,本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的方法包括如下步驟:

S101:搜索分析系統(tǒng)獲取搜索系統(tǒng)的搜索日志。

其中,搜索日志中包括發(fā)生過的搜索中的搜索詞信息、搜索結(jié)果信息及用戶的操作信息。

具體地,搜索系統(tǒng)中可以包括索引庫和搜索日志。索引庫中以索引字段的形式存儲有搜索系統(tǒng)中的物品信息。舉例來說,當(dāng)搜索系統(tǒng)為在線購物網(wǎng)站的搜索系統(tǒng)時(shí),商品的索引字段可以是:商品名稱、商品編碼、商品價(jià)格、商品簡介及商品圖片等字段;當(dāng)搜索系統(tǒng)為科技文獻(xiàn)檢索系統(tǒng)的搜索系統(tǒng)時(shí),文獻(xiàn)的索引字段可以是:文獻(xiàn)名稱、文獻(xiàn)簡介及文獻(xiàn)類型等字段。

搜索系統(tǒng)中的搜索日志可以包括發(fā)生過的搜索中的搜索詞信息、搜索結(jié)果信息及用戶的操作信息。搜索系統(tǒng)可以將用戶進(jìn)行搜索時(shí)的搜索詞及搜索詞被搜索的次數(shù)作為搜索詞信息存儲在搜索日志中。將搜索系統(tǒng)根據(jù)搜索詞及索引字段搜索出的搜索結(jié)果中的文檔作為搜索結(jié)果信息存儲在搜索日志中。將用戶對搜索出的文檔的操作的信息作為操作信息存儲在搜索日志中??蛇x的,搜索詞信息可以是搜索詞以及每個(gè)搜索詞被搜索的次數(shù),搜索結(jié)果信息可以是搜索出的文檔集,操作信息可以是用戶選中文檔集中的某個(gè)文檔的次數(shù),以及,選中該文檔之前的翻頁次數(shù)。

在第一種可能的實(shí)現(xiàn)方式中,搜索分析系統(tǒng)可以以預(yù)設(shè)的頻率獲取搜索系統(tǒng)的搜索日志。該獲取過程可以是搜索分析系統(tǒng)以預(yù)設(shè)的周期向搜索系統(tǒng)發(fā)送搜索日志獲取請求,搜索系統(tǒng)在接收到搜索日志獲取請求之后,向搜索分析系統(tǒng)發(fā)送搜索日志。該獲取過程還可以是搜索系統(tǒng)以預(yù)設(shè)的周期向搜索系統(tǒng)搜索分析系統(tǒng)主動發(fā)送搜索日志。示例性的,該預(yù)設(shè)的周期可以是24小時(shí)。

在第二種可能的實(shí)現(xiàn)方式中,可以是搜索分析系統(tǒng)在確定搜索系統(tǒng)的搜索的當(dāng)前有效值小于預(yù)設(shè)的有效值閾值時(shí),說明此時(shí)需要對搜索結(jié)果進(jìn)行優(yōu)化,則搜索分析系統(tǒng)確定獲取搜索系統(tǒng)的搜索日志以進(jìn)行搜索結(jié)果的優(yōu)化。對于搜索系統(tǒng)的搜索的當(dāng)前有效值的確定方式,將在下文進(jìn)行詳細(xì)說明。

S102:搜索分析系統(tǒng)從搜索詞信息中確定出用于測試的搜索詞集合,并根據(jù)搜索詞信息、搜索結(jié)果信息及用戶的操作信息對搜索詞集合中每個(gè)搜索詞的搜索進(jìn)行有效性分析,得到關(guān)于有效性的分析結(jié)果。

具體地,在從搜索詞信息中確定出用于測試的搜索詞集合時(shí),可以是按照搜索次數(shù)對搜索詞排序,選出搜索次數(shù)最高的n個(gè)搜索詞(Q1,...,Qn)作為用于測試的搜索詞集合。當(dāng)然,也可以從搜索日志中隨機(jī)選出n個(gè)搜索詞作為用于測試的搜索詞集合,本發(fā)明實(shí)施例對此不做限制。

可選的,對搜索詞集合中每個(gè)搜索詞的搜索進(jìn)行有效性分析,可以包括:對每個(gè)搜索詞所產(chǎn)生的搜索結(jié)果中的文檔的有效性進(jìn)行分析,以及,對每個(gè)搜索詞的重要性進(jìn)行分析。相應(yīng)地,得到關(guān)于有效性的分析結(jié)果包括:得到每個(gè)搜索詞的有效文檔集、有效文檔集中每個(gè)有效文檔的有效值,以及,每個(gè)搜索詞的重要性權(quán)重值。

在一種更具體的實(shí)現(xiàn)方式中,對每個(gè)搜索詞所產(chǎn)生的搜索結(jié)果中的文檔的有效性進(jìn)行分析,包括:確定每個(gè)搜索詞的有效文檔集;根據(jù)公式Rix=r*Di*Fi2確定有效文檔集中第x個(gè)有效文檔相對第i個(gè)搜索詞的有效值,其中,r為預(yù)設(shè)的參數(shù),Di為第x個(gè)有效文檔被用戶選中的次數(shù),F(xiàn)i為用戶選中第x個(gè)有效文檔之前的翻頁次數(shù)。

可以根據(jù)搜索日志中,用戶對每個(gè)搜索詞對應(yīng)的搜索結(jié)果文檔集中每個(gè)文檔的點(diǎn)擊次數(shù),確定點(diǎn)擊次數(shù)靠前的m份文檔(Wi1,...,Wim)作為搜索詞Qi的有效文檔集。當(dāng)然,也可以從每個(gè)搜索詞的搜索結(jié)果文檔集中任意取m份文檔作為每個(gè)搜索詞的有效文檔集。在確定出每個(gè)搜索詞的有效文檔集之后,針對一個(gè)搜索詞Qi,可以根據(jù)公式Rix=r*Di*Fi2確定該搜索詞的有效文檔集中第x個(gè)有效文檔相對該搜索詞的有效值。需要說明的是,針對每一個(gè)搜索詞,都有具有m個(gè)有效文檔的有效文檔集,有效文檔集中的每一個(gè)有效文檔都具有相對該搜索詞的有效值。

在一種更具體的實(shí)現(xiàn)方式中,對每個(gè)搜索詞的重要性進(jìn)行分析,具體包括:根據(jù)公式確定第i個(gè)搜索詞的重要性權(quán)重值,其中,n為搜索詞集合中搜索詞的總個(gè)數(shù),Ci表示搜索詞集合中第i個(gè)搜索詞被搜索的次數(shù)??梢岳斫獾氖牵@里是用一個(gè)搜索詞被搜索的次數(shù)與搜索詞集合中所有搜索詞被搜索的總次數(shù)的比值來表征該搜索詞的重要性權(quán)重值。也即,如果一個(gè)搜索詞被搜索的次數(shù)越多,表示該搜索詞的重要性權(quán)重值越大,即該搜索詞越重要。

需要說明的是,有效文檔的有效值以及搜索詞的重要性權(quán)重值的計(jì)算公式中的參數(shù)中,除預(yù)設(shè)參數(shù)外,其他參數(shù)都可以從搜索日志中獲取。

S103:搜索分析系統(tǒng)以搜索詞集合中的搜索詞在索引字段的不同權(quán)重集下進(jìn)行測試搜索,得到各搜索詞在不同權(quán)重集下的測試結(jié)果。

其中,權(quán)重集是由各索引字段的權(quán)重值組合而成集合。

具體地,在本發(fā)明實(shí)施例中,索引字段的不同權(quán)重集指的是索引字段的權(quán)重集空間中的各個(gè)權(quán)重集。也即,以搜索詞集合中的搜索詞遍歷索引字段的權(quán)重空間中的每個(gè)權(quán)重集進(jìn)行測試搜索,以獲取各搜索詞在不同權(quán)重集下的測試結(jié)果。

可選的,可以通過以下方法進(jìn)行測試搜索:通過調(diào)整索引字段的權(quán)重值來得到索引字段的不同權(quán)重集;在每次調(diào)整后,以搜索詞集合中的搜索詞在調(diào)整后的權(quán)重集下進(jìn)行測試搜索,得到不同權(quán)重集下的測試結(jié)果。這里的測試結(jié)果可以包括:在索引字段的不同權(quán)重集下,以每一個(gè)搜索詞進(jìn)行測試搜索后得到的由測試文檔組成的測試文檔集。

需要說明的是,在進(jìn)行測試搜索時(shí),為了不影響搜索系統(tǒng)的正常運(yùn)行,可以設(shè)置一個(gè)用于測試搜索的索引庫。該用于測試搜索的索引庫與搜索系統(tǒng)中的索引庫完全一樣,再在該用于測試搜索的索引庫中以搜索詞集合中的搜索詞在不同的權(quán)重集進(jìn)行測試搜索。

S104:搜索分析系統(tǒng)利用從搜索日志得到的關(guān)于有效性的分析結(jié)果測算每個(gè)權(quán)重集下的測試結(jié)果的有效值。

具體地,在得到各搜索詞在不同權(quán)重集下的測試結(jié)果后,可以根據(jù)S102中得到的有效性的分析結(jié)果測算每個(gè)權(quán)重集下的測試結(jié)果的有效值。

可選的,可以采用以下過程測算每個(gè)權(quán)重集下的測試結(jié)果的有效值:從各權(quán)重集的測試結(jié)果中提取用于進(jìn)行測算的測算文檔集;確定測試搜索中搜索到測算文檔集的搜索詞,從測算文檔集中識別出包括在測算文檔集對應(yīng)的搜索詞的有效文檔集中的文檔;從關(guān)于有效性的分析結(jié)果中獲取識別出的測算文檔的有效值;根據(jù)每個(gè)權(quán)重集下識別出的測算文檔的有效值計(jì)算權(quán)重集下的測試結(jié)果的有效值。

在從各權(quán)重集的測試結(jié)果中提取用于進(jìn)行測算的測算文檔集時(shí),可以是從由測試文檔組成的測試文檔集中選取位于前z個(gè)的測試文檔作為測算文檔集。再確定該測算文檔集對應(yīng)的搜索詞。測算文檔集中,有的測算文檔包括在該測算文檔集對應(yīng)的搜索詞的有效文檔集中,有的測算文檔不包括在該測算文檔集對應(yīng)的搜索詞的有效文檔集中。識別出包括在測算文檔集對應(yīng)的搜索詞的有效文檔集中的文檔。

在一種更具體的實(shí)現(xiàn)方式中,可以根據(jù)公式確定第i個(gè)搜索詞對應(yīng)的測算文檔集相對第i個(gè)搜索詞的測試搜索有效值,其中,Ti為第i個(gè)搜索詞的重要性權(quán)重值,z為測算文檔集中測算文檔的總個(gè)數(shù),R'ix為測算文檔集中第x個(gè)測算文檔相對第i個(gè)搜索詞的測試搜索有效值,當(dāng)?shù)趚個(gè)測算文檔為識別出的測算文檔時(shí),R'ix=Rix,當(dāng)?shù)趚個(gè)測算文檔不是識別出的測算文檔時(shí),R'ix=0;根據(jù)公式確定第x個(gè)權(quán)重集下的測試結(jié)果的有效值。即,在計(jì)算每個(gè)權(quán)重集下的測試結(jié)果的有效值時(shí),先確定出在該權(quán)重集下,每一個(gè)搜索詞的測試搜索有效值,再將n個(gè)搜索詞的測試搜索有效值相加,即可得到該權(quán)重集下的測試結(jié)果的有效值。采用此實(shí)現(xiàn)方式可以獲取每個(gè)權(quán)重集下的測試結(jié)果的有效值。

S105:搜索分析系統(tǒng)確定各測試結(jié)果的有效值中滿足預(yù)設(shè)條件的有效值,將滿足預(yù)設(shè)條件的有效值對應(yīng)的權(quán)重集作為索引字段的最優(yōu)權(quán)重集。

具體地,這里的預(yù)設(shè)條件可以為各測試結(jié)果的有效值中最大的有效值,也可以是各測試結(jié)果的有效值中大于預(yù)設(shè)閾值的有效值。本發(fā)明實(shí)施例對此不做限制。

當(dāng)預(yù)設(shè)條件為各測試結(jié)果的有效值中最大的有效值時(shí),首先確定出測試結(jié)果的有效值中最大的有效值,再將該最大的有效值對應(yīng)的權(quán)重集作為索引字段的最優(yōu)權(quán)重集。當(dāng)預(yù)設(shè)條件為各測試結(jié)果的有效值中大于預(yù)設(shè)閾值的有效值時(shí),首先確定出測試結(jié)果的有效值中大于預(yù)設(shè)閾值的有效值,如果有多個(gè)測試結(jié)果的有效值大于預(yù)設(shè)閾值,則從這些多個(gè)有效值中隨機(jī)選取一個(gè)有效值,再將該有效值對應(yīng)的權(quán)重集作為索引字段的最優(yōu)權(quán)重集。

S106:搜索分析系統(tǒng)以最優(yōu)權(quán)重集對搜索系統(tǒng)中的索引字段的權(quán)重值進(jìn)行更新。

具體地,在確定出最優(yōu)權(quán)重集后,用該權(quán)重集更新搜索系統(tǒng)中的索引字段的當(dāng)前的權(quán)重值。當(dāng)更新完成后,用戶在進(jìn)行搜索時(shí),搜索結(jié)果會更滿足用戶的需求。

下面對S101中,確定獲取搜索系統(tǒng)的搜索日志的時(shí)機(jī)的第二種可能的實(shí)現(xiàn)方式中,計(jì)算搜索系統(tǒng)的搜索的當(dāng)前有效值的實(shí)現(xiàn)過程作一詳細(xì)說明:可以根據(jù)已經(jīng)確定的搜索詞集合,對搜索詞集合中每個(gè)搜索詞的搜索進(jìn)行有效性分析,即,得到每個(gè)搜索詞的有效文檔集、有效文檔集中每個(gè)有效文檔的有效值以及搜索詞的重要性權(quán)重值。需要說明的是,該過程與S102的區(qū)別在于,搜索詞集合可能不同,也可能相同。該過程中的搜索詞集合為上一次進(jìn)行優(yōu)化搜索結(jié)果的方法時(shí)根據(jù)搜索日志選取的搜索詞集合。而S102中,搜索詞集合為在搜索系統(tǒng)的當(dāng)前權(quán)重集下,根據(jù)搜索日志重新選取的搜索詞集合。類似地,根據(jù)S102中計(jì)算搜索詞有效值的公式確定當(dāng)前權(quán)重集下有效文檔的有效值,以及,搜索詞的重要性權(quán)重值。之后,根據(jù)S104中計(jì)算測算文檔集相對第i個(gè)搜索詞的測試搜索有效值的公式計(jì)算有效文檔集的測試搜索有效值,再根據(jù)計(jì)算第x個(gè)權(quán)重集下的測試結(jié)果的有效值的公式計(jì)算當(dāng)前權(quán)重集下的當(dāng)前有效值。在獲取到當(dāng)前有效值后,比較當(dāng)前有效值與預(yù)設(shè)的有效值閾值,在當(dāng)前有效值小于預(yù)設(shè)的有效值閾值,確定執(zhí)行優(yōu)化搜索結(jié)果的方法。即,開始執(zhí)行S101。

本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的方法,通過獲取搜索系統(tǒng)的搜索日志,搜索日志中包括發(fā)生過的搜索中的搜索詞信息、搜索結(jié)果信息及用戶的操作信息,從搜索詞信息中確定出用于測試的搜索詞集合,并根據(jù)搜索詞信息、搜索結(jié)果信息及用戶的操作信息對搜索詞集合中每個(gè)搜索詞的搜索進(jìn)行有效性分析,得到關(guān)于有效性的分析結(jié)果,以搜索詞集合中的搜索詞在索引字段的不同權(quán)重集下進(jìn)行測試搜索,得到各搜索詞在不同權(quán)重集下的測試結(jié)果,權(quán)重集是由各索引字段的權(quán)重值組合而成的集合,利用從搜索日志得到的關(guān)于有效性的分析結(jié)果測算每個(gè)權(quán)重集下的測試結(jié)果的有效值,確定各測試結(jié)果的有效值中滿足預(yù)設(shè)條件的有效值,將滿足預(yù)設(shè)條件的有效值對應(yīng)的權(quán)重集作為索引字段的最優(yōu)權(quán)重集,以最優(yōu)權(quán)重集對搜索系統(tǒng)中的索引字段的權(quán)重值進(jìn)行更新,實(shí)現(xiàn)了在搜索系統(tǒng)的運(yùn)行過程中,可以根據(jù)搜索日志得到每個(gè)搜索詞的有效性的分析結(jié)果,再根據(jù)該分析結(jié)果去測算每個(gè)權(quán)重集下的測試結(jié)果的有效值,進(jìn)而,根據(jù)每個(gè)權(quán)重集下的測試結(jié)果的有效值確定索引字段的最優(yōu)權(quán)重集,對索引字段的權(quán)重值進(jìn)行更新,在搜索系統(tǒng)上線之后,可以根據(jù)搜索日志持續(xù)實(shí)現(xiàn)對搜索結(jié)果的優(yōu)化,相較于無法持續(xù)對搜索結(jié)果進(jìn)行優(yōu)化的方式,可以實(shí)現(xiàn)不斷優(yōu)化搜索結(jié)果,從而,提高了用戶的搜索體驗(yàn)。

可選的,在另一種實(shí)現(xiàn)方式中,針對上述實(shí)施例的S102,進(jìn)行有效性分析時(shí),還可以是以下過程:搜索分析系統(tǒng)對每個(gè)搜索詞所產(chǎn)生的搜索結(jié)果中的文檔的有效性進(jìn)行分析,相應(yīng)地,得到關(guān)于有效性的分析結(jié)果包括:得到每個(gè)搜索詞的有效文檔集以及有效文檔集中每個(gè)有效文檔的有效值。該種實(shí)現(xiàn)方式中與上述實(shí)施例中S102的區(qū)別在于,在進(jìn)行有效性分析時(shí),不對每個(gè)搜索詞的重要性進(jìn)行分析。

則基于該實(shí)現(xiàn)方式,利用從搜索日志得到的關(guān)于有效性的分析結(jié)果測算每個(gè)權(quán)重集下的測試結(jié)果的有效值中的過程與上述實(shí)施例中的S104區(qū)別在于,在根據(jù)每個(gè)權(quán)重集下識別出的測算文檔的有效值計(jì)算權(quán)重集下的測試結(jié)果的有效值時(shí),在本實(shí)現(xiàn)方式中,是根據(jù)公式確定第i個(gè)搜索詞對應(yīng)的測算文檔集相對第i個(gè)搜索詞的測試搜索有效值,其中,z為測算文檔集中測算文檔的總個(gè)數(shù),R'ix為測算文檔集中第x個(gè)測算文檔相對第i個(gè)搜索詞的測試搜索有效值,當(dāng)?shù)趚個(gè)測算文檔為識別出的測算文檔時(shí),R'ix=Rix,當(dāng)?shù)趚個(gè)測算文檔不是識別出的測算文檔時(shí),R'ix=0;根據(jù)公式確定第x個(gè)權(quán)重集下的測試結(jié)果的有效值。

該實(shí)現(xiàn)過程相較于上述實(shí)施例,在進(jìn)行有效性分析時(shí)更加簡便快捷,同時(shí),在確定測試結(jié)果的有效值時(shí)更加簡便快捷,提高了優(yōu)化搜索結(jié)果的效率。

圖3為本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的裝置實(shí)施例一的結(jié)構(gòu)示意圖。本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的裝置可以是方法實(shí)施例中的搜索分析系統(tǒng),用于對搜索系統(tǒng)進(jìn)行分析,搜索系統(tǒng)提供不同的索引字段。如圖3所示,本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的裝置包括如下模塊:

獲取模塊31,用于獲取搜索系統(tǒng)的搜索日志。

其中,搜索日志中包括發(fā)生過的搜索中的搜索詞信息、搜索結(jié)果信息及用戶的操作信息。

具體地,獲取模塊31的實(shí)現(xiàn)過程和技術(shù)原理與圖2所示實(shí)施例中的S101的實(shí)現(xiàn)過程和技術(shù)原理類似,此處不再贅述。

有效性分析模塊32,用于從搜索詞信息中確定出用于測試的搜索詞集合,并根據(jù)搜索詞信息、搜索結(jié)果信息及用戶的操作信息對搜索詞集合中每個(gè)搜索詞的搜索進(jìn)行有效性分析,得到關(guān)于有效性的分析結(jié)果。

在第一種可能的實(shí)現(xiàn)方式中,有效性分析模塊32可以包括:有效性分析子模塊321和重要性分析子模塊322。其中,有效性分析子模塊321,用于對每個(gè)搜索詞所產(chǎn)生的搜索結(jié)果中的文檔的有效性進(jìn)行分析。重要性分析子模塊322,用于對每個(gè)搜索詞的重要性進(jìn)行分析。相應(yīng)地,得到關(guān)于有效性的分析結(jié)果包括:得到每個(gè)搜索詞的有效文檔集、有效文檔集中每個(gè)有效文檔的有效值以及得到每個(gè)搜索詞的重要性權(quán)重值。

在第二種可能的實(shí)現(xiàn)方式中,有效性分析模塊32包括:有效性分析子模塊321。有效性分析子模塊321,用于對每個(gè)搜索詞所產(chǎn)生的搜索結(jié)果中的文檔的有效性進(jìn)行分析。相應(yīng)地,得到關(guān)于有效性的分析結(jié)果包括:得到每個(gè)搜索詞的有效文檔集以及有效文檔集中每個(gè)有效文檔的有效值。

可選的,有效性分析子模塊321具體用于:確定每個(gè)搜索詞的有效文檔集;根據(jù)公式Rix=r*Di*Fi2確定有效文檔集中第x個(gè)有效文檔相對第i個(gè)搜索詞的有效值,其中,r為預(yù)設(shè)的參數(shù),Di為第x個(gè)有效文檔被用戶選中的次數(shù),F(xiàn)i為用戶選中第x個(gè)有效文檔之前的翻頁次數(shù)。

重要性分析子模塊322具體用于:根據(jù)公式確定第i個(gè)搜索詞的重要性權(quán)重值,其中,n為搜索詞集合中搜索詞的總個(gè)數(shù),Ci表示搜索詞集合中第i個(gè)搜索詞被搜索的次數(shù)。

有效性分析模塊32的實(shí)現(xiàn)過程和技術(shù)原理與圖2所示實(shí)施例中的S102的實(shí)現(xiàn)過程和技術(shù)原理類似,此處不再贅述。

測試搜索模塊33,用于以搜索詞集合中的搜索詞在索引字段的不同權(quán)重集下進(jìn)行測試搜索,得到各搜索詞在不同權(quán)重集下的測試結(jié)果。

其中,權(quán)重集是由各索引字段的權(quán)重值組合而成集合。

可選的,測試搜索模塊33具體用于:通過調(diào)整索引字段的權(quán)重值來得到索引字段的不同權(quán)重集;在每次調(diào)整后,以搜索詞集合中的搜索詞在調(diào)整后的權(quán)重集下進(jìn)行測試搜索,得到不同權(quán)重集下的測試結(jié)果。

測試搜索模塊33的實(shí)現(xiàn)過程和技術(shù)原理與圖2所示實(shí)施例中的S103的實(shí)現(xiàn)過程和技術(shù)原理類似,此處不再贅述。

測算模塊34,用于利用從搜索日志得到的關(guān)于有效性的分析結(jié)果測算每個(gè)權(quán)重集下的測試結(jié)果的有效值。

具體地,測算模塊34包括:提取子模塊341,用于從各權(quán)重集的測試結(jié)果中提取用于進(jìn)行測算的測算文檔集;識別子模塊342,用于確定測試搜索中搜索到測算文檔集的搜索詞,從測算文檔集中識別出包括在測算文檔集對應(yīng)的搜索詞的有效文檔集中的文檔;獲取子模塊343,用于從關(guān)于有效性的分析結(jié)果中獲取識別出的測算文檔的有效值;計(jì)算子模塊344,用于根據(jù)每個(gè)權(quán)重集下識別出的測算文檔的有效值計(jì)算權(quán)重集下的測試結(jié)果的有效值。

針對有效性分析模塊32的第一種可能的實(shí)現(xiàn)方式,計(jì)算子模塊344具體用于:根據(jù)公式確定第i個(gè)搜索詞對應(yīng)的測算文檔集相對第i個(gè)搜索詞的測試搜索有效值,其中,Ti為第i個(gè)搜索詞的重要性權(quán)重值,z為測算文檔集中測算文檔的總個(gè)數(shù),R'ix為測算文檔集中第x個(gè)測算文檔相對第i個(gè)搜索詞的測試搜索有效值,當(dāng)?shù)趚個(gè)測算文檔為識別出的測算文檔時(shí),R'ix=Rix,當(dāng)?shù)趚個(gè)測算文檔不是識別出的測算文檔時(shí),R'ix=0;根據(jù)公式確定第x個(gè)權(quán)重集下的測試結(jié)果的有效值。

針對有效性分析模塊32的第二種可能的實(shí)現(xiàn)方式,計(jì)算子模塊344具體用于:根據(jù)公式確定第i個(gè)搜索詞對應(yīng)的測算文檔集相對第i個(gè)搜索詞的測試搜索有效值,其中,z為測算文檔集中測算文檔的總個(gè)數(shù),R'ix為測算文檔集中第x個(gè)測算文檔相對第i個(gè)搜索詞的測試搜索有效值,當(dāng)?shù)趚個(gè)測算文檔為識別出的測算文檔時(shí),R'ix=Rix,當(dāng)?shù)趚個(gè)測算文檔不是識別出的測算文檔時(shí),R'ix=0;根據(jù)公式確定第x個(gè)權(quán)重集下的測試結(jié)果的有效值。

測算模塊34的實(shí)現(xiàn)過程和技術(shù)原理與圖2所示實(shí)施例中的S104的實(shí)現(xiàn)過程和技術(shù)原理類似,此處不再贅述。

確定模塊35,用于確定各測試結(jié)果的有效值中滿足預(yù)設(shè)條件的有效值,將滿足預(yù)設(shè)條件的有效值對應(yīng)的權(quán)重集作為索引字段的最優(yōu)權(quán)重集。

確定模塊35的實(shí)現(xiàn)過程和技術(shù)原理與圖2所示實(shí)施例中的S105的實(shí)現(xiàn)過程和技術(shù)原理類似,此處不再贅述。

更新模塊36,用于以最優(yōu)權(quán)重集對搜索系統(tǒng)中的索引字段的權(quán)重值進(jìn)行更新。

更新模塊36的實(shí)現(xiàn)過程和技術(shù)原理與圖2所示實(shí)施例中的S106的實(shí)現(xiàn)過程和技術(shù)原理類似,此處不再贅述。

本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的裝置,通過設(shè)置獲取模塊,用于獲取搜索系統(tǒng)的搜索日志,有效性分析模塊,用于從搜索詞信息中確定出用于測試的搜索詞集合,并根據(jù)搜索詞信息、搜索結(jié)果信息及用戶的操作信息對搜索詞集合中每個(gè)搜索詞的搜索進(jìn)行有效性分析,得到關(guān)于有效性的分析結(jié)果,測試搜索模塊,用于以搜索詞集合中的搜索詞在索引字段的不同權(quán)重集下進(jìn)行測試搜索,得到各搜索詞在不同權(quán)重集下的測試結(jié)果,測算模塊,用于利用從搜索日志得到的關(guān)于有效性的分析結(jié)果測算每個(gè)權(quán)重集下的測試結(jié)果的有效值,確定模塊,用于確定各測試結(jié)果的有效值中滿足預(yù)設(shè)條件的有效值,將滿足預(yù)設(shè)條件的有效值對應(yīng)的權(quán)重集作為索引字段的最優(yōu)權(quán)重集,更新模塊,用于以最優(yōu)權(quán)重集對搜索系統(tǒng)中的索引字段的權(quán)重值進(jìn)行更新,實(shí)現(xiàn)了在搜索系統(tǒng)的運(yùn)行過程中,可以根據(jù)搜索日志得到每個(gè)搜索詞的有效性的分析結(jié)果,再根據(jù)該分析結(jié)果去測算每個(gè)權(quán)重集下的測試結(jié)果的有效值,進(jìn)而,根據(jù)每個(gè)權(quán)重集下的測試結(jié)果的有效值確定索引字段的最優(yōu)權(quán)重集,對索引字段的權(quán)重值進(jìn)行更新,在搜索系統(tǒng)上線之后,可以根據(jù)搜索日志持續(xù)實(shí)現(xiàn)對搜索結(jié)果的優(yōu)化,相較于無法持續(xù)對搜索結(jié)果進(jìn)行優(yōu)化的方式,可以實(shí)現(xiàn)不斷優(yōu)化搜索結(jié)果,從而,提高了用戶的搜索體驗(yàn)。

圖4為本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的裝置實(shí)施例二的結(jié)構(gòu)示意圖。本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的裝置是對搜索分析系統(tǒng)的硬件結(jié)構(gòu)進(jìn)行介紹。如圖4所示,本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的裝置包括:存儲器41和處理器42。存儲器41用于存儲處理器42的可執(zhí)行指令。

處理器42可以是一個(gè)中央處理器(Central Processing Unit,CPU),或者是特定集成電路(Application Specific Integrated Circuit,ASIC),或者是完成實(shí)施本發(fā)明實(shí)施例的一個(gè)或多個(gè)集成電路。當(dāng)優(yōu)化搜索結(jié)果的程序運(yùn)行時(shí),處理器42與存儲器41之間通信,處理器42調(diào)用可執(zhí)行指令,用于執(zhí)行以下操作:

獲取搜索系統(tǒng)的搜索日志,搜索日志中包括發(fā)生過的搜索中的搜索詞信息、搜索結(jié)果信息及用戶的操作信息;從搜索詞信息中確定出用于測試的搜索詞集合,并根據(jù)搜索詞信息、搜索結(jié)果信息及用戶的操作信息對搜索詞集合中每個(gè)搜索詞的搜索進(jìn)行有效性分析,得到關(guān)于有效性的分析結(jié)果;以搜索詞集合中的搜索詞在索引字段的不同權(quán)重集下進(jìn)行測試搜索,得到各搜索詞在不同權(quán)重集下的測試結(jié)果;權(quán)重集是由各索引字段的權(quán)重值組合而成集合;利用從搜索日志得到的關(guān)于有效性的分析結(jié)果測算每個(gè)權(quán)重集下的測試結(jié)果的有效值;確定各測試結(jié)果的有效值中滿足預(yù)設(shè)條件的有效值,將滿足預(yù)設(shè)條件的有效值對應(yīng)的權(quán)重集作為索引字段的最優(yōu)權(quán)重集;以最優(yōu)權(quán)重集對搜索系統(tǒng)中的索引字段的權(quán)重值進(jìn)行更新。

具體地,在以搜索詞集合中的搜索詞在索引字段的不同權(quán)重集下進(jìn)行測試搜索的方面,處理器42具體用于:通過調(diào)整索引字段的權(quán)重值來得到索引字段的不同權(quán)重集;在每次調(diào)整后,以搜索詞集合中的搜索詞在調(diào)整后的權(quán)重集下進(jìn)行測試搜索,得到不同權(quán)重集下的測試結(jié)果。

在一種可能的實(shí)現(xiàn)方式中,在有效性分析的方面,處理器42用于:對每個(gè)搜索詞所產(chǎn)生的搜索結(jié)果中的文檔的有效性進(jìn)行分析;相應(yīng)的,得到關(guān)于有效性的分析結(jié)果包括:得到每個(gè)搜索詞的有效文檔集以及有效文檔集中每個(gè)有效文檔的有效值。

在利用從搜索日志得到的關(guān)于有效性的分析結(jié)果測算每個(gè)權(quán)重集下的測試結(jié)果的有效值的方面,處理器42具體用于:從各權(quán)重集的測試結(jié)果中提取用于進(jìn)行測算的測算文檔集;確定測試搜索中搜索到測算文檔集的搜索詞,從測算文檔集中識別出包括在測算文檔集對應(yīng)的搜索詞的有效文檔集中的文檔;從關(guān)于有效性的分析結(jié)果中獲取識別出的測算文檔的有效值;根據(jù)每個(gè)權(quán)重集下識別出的測算文檔的有效值計(jì)算權(quán)重集下的測試結(jié)果的有效值。

在對每個(gè)搜索詞所產(chǎn)生的搜索結(jié)果中的文檔的有效性進(jìn)行分析的方面,處理器42具體用于:確定每個(gè)搜索詞的有效文檔集;根據(jù)公式Rix=r*Di*Fi2確定有效文檔集中第x個(gè)有效文檔相對第i個(gè)搜索詞的有效值,其中,r為預(yù)設(shè)的參數(shù),Di為第x個(gè)有效文檔被用戶選中的次數(shù),F(xiàn)i為用戶選中第x個(gè)有效文檔之前的翻頁次數(shù)。

在根據(jù)每個(gè)權(quán)重集下識別出的測算文檔的有效值計(jì)算權(quán)重集下的測試結(jié)果的有效值的方面,處理器42具體用于:根據(jù)公式確定第i個(gè)搜索詞對應(yīng)的測算文檔集相對第i個(gè)搜索詞的測試搜索有效值,其中,z為測算文檔集中測算文檔的總個(gè)數(shù),R'ix為測算文檔集中第x個(gè)測算文檔相對第i個(gè)搜索詞的測試搜索有效值,當(dāng)?shù)趚個(gè)測算文檔為識別出的測算文檔時(shí),R'ix=Rix,當(dāng)?shù)趚個(gè)測算文檔不是識別出的測算文檔時(shí),R'ix=0;根據(jù)公式確定第x個(gè)權(quán)重集下的測試結(jié)果的有效值。

在另一種可能的實(shí)現(xiàn)方式中,在有效性分析的方面,處理器42還用于:對每個(gè)搜索詞的重要性進(jìn)行分析;相應(yīng)的,得到關(guān)于有效性的分析結(jié)果還包括:得到每個(gè)搜索詞的重要性權(quán)重值。相應(yīng)地,在根據(jù)每個(gè)權(quán)重集下識別出的測算文檔的有效值計(jì)算權(quán)重集下的測試結(jié)果的有效值的方面,處理器42具體用于:根據(jù)公式確定第i個(gè)搜索詞對應(yīng)的測算文檔集相對第i個(gè)搜索詞的測試搜索有效值,其中,Ti為第i個(gè)搜索詞的重要性權(quán)重值,z為測算文檔集中測算文檔的總個(gè)數(shù),R'ix為測算文檔集中第x個(gè)測算文檔相對第i個(gè)搜索詞的測試搜索有效值,當(dāng)?shù)趚個(gè)測算文檔為識別出的測算文檔時(shí),R'ix=Rix,當(dāng)?shù)趚個(gè)測算文檔不是識別出的測算文檔時(shí),R'ix=0;根據(jù)公式確定第x個(gè)權(quán)重集下的測試結(jié)果的有效值。

可選的,在對每個(gè)搜索詞的重要性進(jìn)行分析的方面,處理器42具體用于:根據(jù)公式確定第i個(gè)搜索詞的重要性權(quán)重值,其中,n為搜索詞集合中搜索詞的總個(gè)數(shù),Ci表示搜索詞集合中第i個(gè)搜索詞被搜索的次數(shù)。

本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的裝置中,處理器42執(zhí)行的詳細(xì)的處理過程可參考方法實(shí)施例中圖2所示的S102~S106,此處不再贅述。

本發(fā)明實(shí)施例提供的優(yōu)化搜索結(jié)果的裝置,實(shí)現(xiàn)在搜索系統(tǒng)的運(yùn)行過程中,可以根據(jù)搜索日志得到每個(gè)搜索詞的有效性的分析結(jié)果,再根據(jù)該分析結(jié)果去測算每個(gè)權(quán)重集下的測試結(jié)果的有效值,進(jìn)而,根據(jù)每個(gè)權(quán)重集下的測試結(jié)果的有效值確定索引字段的最優(yōu)權(quán)重集,對索引字段的權(quán)重值進(jìn)行更新,在搜索系統(tǒng)上線之后,可以根據(jù)搜索日志持續(xù)實(shí)現(xiàn)對搜索結(jié)果的優(yōu)化,相較于無法持續(xù)對搜索結(jié)果進(jìn)行優(yōu)化的方式,可以實(shí)現(xiàn)不斷優(yōu)化搜索結(jié)果,從而,提高了用戶的搜索體驗(yàn)。

本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲于一計(jì)算機(jī)可讀取存儲介質(zhì)中。該程序在執(zhí)行時(shí),執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲介質(zhì)包括:ROM、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述各實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1