最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種流行檢索詞的挖掘、推薦方法及裝置的制作方法

文檔序號(hào):6362668閱讀:245來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):一種流行檢索詞的挖掘、推薦方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明屬于信息處理領(lǐng)域,尤其涉及一種流行檢索詞的挖掘、推薦方法及裝置。
背景技術(shù)
隨著網(wǎng)絡(luò)的發(fā)展,網(wǎng)絡(luò)信息更新的速度也越來(lái)越快,如何使用戶(hù)能夠最快的獲取最新的而且是其感興趣的網(wǎng)絡(luò)信息呢?網(wǎng)絡(luò)流行檢索詞的挖掘與推薦是解決該問(wèn)題的關(guān)鍵。現(xiàn)有網(wǎng)絡(luò)流行檢索詞的挖掘和推薦方法主要是按照詞匯的搜索量來(lái)排序,將搜索量高的一個(gè)或者多個(gè)詞匯作為流行檢索詞推薦給用戶(hù)。然而,對(duì)于新出現(xiàn)的網(wǎng)絡(luò)詞匯,在初始階段其搜索量可能并不高,如果僅按搜索量排序會(huì)造成對(duì)新詞匯捕捉的不及時(shí)。另外,對(duì)于某些搜索量很高的詞匯,其點(diǎn)擊量可能并不高,原因大多是用戶(hù)輸入該詞匯卻無(wú)法搜索到想要的結(jié)果,或者是用戶(hù)通過(guò)作弊等手段,人為的提高某些詞匯的搜索量,如果將這些詞匯推薦給用戶(hù),會(huì)嚴(yán)重影響到用戶(hù)的體驗(yàn)及滿(mǎn)意度。

發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種流行檢索詞的挖掘方法,旨在解決現(xiàn)有技術(shù)在挖掘流行檢索詞時(shí),挖掘不夠及時(shí)及不夠準(zhǔn)確的問(wèn)題。本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一種流行檢索詞的挖掘方法,所述方法包括以下步驟:對(duì)歷史檢索詞進(jìn)行預(yù)處理;計(jì)算所述預(yù)處理后檢索詞的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度;根據(jù)計(jì)算得到的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度,獲取所述預(yù)處理后檢索詞的流行度。一種流行檢索詞的推薦方法,所述方法包括所述的流行檢索詞的挖掘方法,以及根據(jù)應(yīng)用場(chǎng)景和用戶(hù)屬性,將流行度最高的前N個(gè)檢索詞推薦給對(duì)應(yīng)的用戶(hù),所述N大于等于I。本發(fā)明實(shí)施例的另一目的在于提供一種流行檢索詞的挖掘裝置,所述裝置包括:預(yù)處理單元,用于對(duì)歷史檢索詞進(jìn)行預(yù)處理;計(jì)算單元,用于計(jì)算所述預(yù)處理后檢索詞的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度;流行度獲取單元,用于根據(jù)計(jì)算得到的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度,獲取所述預(yù)處理后檢索詞的流行度。一種流行檢索詞的推薦裝置,所述推薦裝置包括所述的流行檢索詞的挖掘裝置,以及推薦單元,用于根據(jù)應(yīng)用場(chǎng)景和用戶(hù)屬性,將流行度最高的前N個(gè)檢索詞推薦給對(duì)應(yīng)的用戶(hù),所述N大于等于I。從上述技術(shù)方案可以看出,本發(fā)明實(shí)施例根據(jù)計(jì)算得到的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度來(lái)獲取預(yù)處理后檢索詞的流行度,由于查詢(xún)密度能更好的反應(yīng)用戶(hù)對(duì)檢索詞的關(guān)注程度,查詢(xún)熱度能更好的反應(yīng)用戶(hù)關(guān)注程度的上升或下降趨勢(shì),點(diǎn)擊度能更好的反應(yīng)搜索結(jié)果的有效性,使得挖掘到的檢索詞能夠更好的反應(yīng)其流行度,從而有效解決現(xiàn)有技術(shù)單純依靠詞匯的搜索量進(jìn)行排序,造成新興詞匯挖掘不及時(shí)以及某些詞匯由于作弊或者搜索信息的無(wú)效而挖掘不準(zhǔn)確的問(wèn)題。另外,本發(fā)明實(shí)施例還可以根據(jù)應(yīng)用場(chǎng)景和用戶(hù)屬性的不同,將挖掘到的流行度最高的一個(gè)或者多個(gè)檢索詞推薦給對(duì)所述檢索詞感興趣的用戶(hù),從而提聞?dòng)脩?hù)的滿(mǎn)意度。


圖1是本發(fā)明實(shí)施例一提供的流行檢索詞的挖掘方法的實(shí)現(xiàn)流程圖;圖2是本發(fā)明實(shí)施例一提供的流行檢索詞挖掘結(jié)果的示例圖;圖3是本發(fā)明實(shí)施例二提供的流行檢索詞的推薦方法的實(shí)現(xiàn)流程圖;圖4是本發(fā)明實(shí)施例三提供的流行檢索詞的挖掘裝置的組成結(jié)構(gòu)圖;圖5是本發(fā)明實(shí)施例四提供的流行檢索詞的挖掘裝置的組成結(jié)構(gòu)圖。
具體實(shí)施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。本發(fā)明實(shí)施例通過(guò)計(jì)算預(yù)處理后檢索詞的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度,根據(jù)計(jì)算得到的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度來(lái)獲取所述預(yù)處理后檢索詞的流行度,并根據(jù)應(yīng)用場(chǎng)景和用戶(hù)屬性的不同,將挖掘到的流行度最高的一個(gè)或者多個(gè)檢索詞推薦給對(duì)所述檢索詞感興趣的用戶(hù),提高了用戶(hù)對(duì)推薦的流行檢索詞的滿(mǎn)意度,并有效解決了現(xiàn)有技術(shù)單純依靠詞匯的搜索量進(jìn)行排序,造成新興詞匯挖掘不及時(shí)以及某些詞匯由于作弊或者搜索信息的無(wú)效而挖掘不準(zhǔn)確的問(wèn)題。為了說(shuō)明本發(fā)明所述的技術(shù)方案,下面通過(guò)具體實(shí)施例來(lái)進(jìn)行說(shuō)明。實(shí)施例一:圖1示出了本發(fā)明實(shí)施例一提供的流行檢索詞的挖掘方法的實(shí)現(xiàn)流程,該方法過(guò)程詳述如下:在步驟SlOl中,對(duì)歷史檢索詞進(jìn)行預(yù)處理。在本實(shí)施例中,在對(duì)檢索詞進(jìn)行挖掘前,需要對(duì)搜索日志(不局限于此)中的歷史檢索詞進(jìn)行預(yù)處理。其中,所述歷史檢索詞包括所述檢索詞每天的搜索量(Query View,QV)、結(jié)果點(diǎn)擊次數(shù)等信息。所述預(yù)處理包括但不局限于去導(dǎo)航處理以及去重處理。其中,去導(dǎo)航處理指的是過(guò)濾以導(dǎo)航為目的的檢索詞,例如“優(yōu)酷”、“youku”、“百度”、“QQ”等;去重處理指的是把有相同目的或者相同含義的檢索詞歸并到一起,以方便對(duì)該檢索詞的搜索量進(jìn)行更準(zhǔn)確的統(tǒng)計(jì)。比如“優(yōu)酷”和“youku”、“百度”和“baidu”、“4399”和“4399游戲”等。本實(shí)施例在去導(dǎo)航和去重處理過(guò)程中采用了線(xiàn)性設(shè)計(jì)方法,使得查詢(xún)和點(diǎn)擊百萬(wàn)級(jí)關(guān)鍵詞擬合到一起的時(shí)間復(fù)雜度為0(max(n,m))(原先復(fù)雜度為O(n*m)),極大提升了處理性能。在步驟S102中,計(jì)算所述預(yù)處理后檢索詞的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度。在本實(shí)施例中,查詢(xún)密度考慮了時(shí)間衰減的QV量,即距離當(dāng)日時(shí)間越久遠(yuǎn)的QV折扣越大,通過(guò)查詢(xún)密度能更好的反應(yīng)用戶(hù)對(duì)檢索詞的關(guān)注程度。其中,查詢(xún)密度的一種計(jì)算方法如下:
權(quán)利要求
1.一種流行檢索詞的挖掘方法,其特征在于,所述方法包括以下步驟: 對(duì)歷史檢索詞進(jìn)行預(yù)處理; 計(jì)算所述預(yù)處理后檢索詞的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度; 根據(jù)計(jì)算得到的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度,獲取所述預(yù)處理后檢索詞的流行度。
2.如權(quán)利要求1所述的方法,其特征在于,所述預(yù)處理包括去導(dǎo)航處理以及去重處理。
3.如權(quán)利要求1所述的方法,其特征在于,所述查詢(xún)密度的計(jì)算公式為:
4.如權(quán)利要求1所述的方法,其特征在于,所述查詢(xún)熱度的計(jì)算公式為:
5.如權(quán)利要求1所述的方法,其特征在于,所述點(diǎn)擊度的計(jì)算公式為:
6.如權(quán)利要求1所述的方法,其特征在于,所述流行度的計(jì)算公式為:score= (intensity) α X (recency) 0 X (clickability) Y,其中 int ensity 為查詢(xún)密度,recency 為查詢(xún)熱度,clickability為點(diǎn)擊度,α、β、λ分別為預(yù)先設(shè)置的權(quán)重參數(shù)。
7.一種流行檢索詞的推薦方法,其特征在于,所述方法包括如權(quán)利要求1至6任一項(xiàng)所述的流行檢索詞的挖掘方法,以及 根據(jù)應(yīng)用場(chǎng)景和用戶(hù)屬性,將流行度最高的前N個(gè)檢索詞推薦給對(duì)應(yīng)的用戶(hù),所述N大于等于I。
8.一種流行檢索詞的挖掘裝置,其特征在于,所述裝置包括: 預(yù)處理單元,用于對(duì)歷史檢索詞進(jìn)行預(yù)處理; 計(jì)算單元,用于計(jì)算所述預(yù)處理后檢索詞的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度; 流行度獲取單元,用于根據(jù)計(jì)算得到的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度,獲取所述預(yù)處理后檢索詞的流行度。
9.如權(quán)利要求8所述的裝置,其特征在于,所述預(yù)處理包括去導(dǎo)航處理以及去重處理。
10.如權(quán)利要求8所述的裝置,其特征在于,所述查詢(xún)密度的計(jì)算公式為:
11.如權(quán)利要求8所述的裝置,其特征在于,所述查詢(xún)熱度的計(jì)算公式為:
12.如權(quán)利要求8所述的裝置,其特征在于,所述點(diǎn)擊度的計(jì)算公式為: 1 click _ qv.clickbility ==^ ,其中t為計(jì)算點(diǎn)擊度的總的時(shí)間量,qVi為當(dāng)前詞匯第i天的搜索量,click_qVi為當(dāng)前詞匯第i天的點(diǎn)擊量。
13.如權(quán)利要求8所述的裝置,其特征在于,所述流行度的計(jì)算公式為:SCOre=(intensity) α X (recency) 0 X (clickability) Y,其中 int ensity 為查詢(xún)密度,recency 為查詢(xún)熱度,clickability為點(diǎn)擊度,α、β、λ分別為預(yù)先設(shè)置的權(quán)重參數(shù)。
14.一種流行檢索詞的推薦裝置,其特征在于,所述推薦裝置包括如權(quán)利要求8至13任一項(xiàng)所述的流行檢索詞的挖掘裝置,以及 推薦單元,用于根據(jù)應(yīng)用場(chǎng)景和用戶(hù)屬性,將流行度最高的前N個(gè)檢索詞推薦給對(duì)應(yīng)的用戶(hù),所述N大于等于1。
全文摘要
本發(fā)明適用于信息處理領(lǐng)域,提供了一種流行檢索詞的挖掘、推薦方法及裝置,所述方法包括下述步驟對(duì)歷史檢索詞進(jìn)行預(yù)處理;計(jì)算所述預(yù)處理后檢索詞的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度;根據(jù)計(jì)算得到的查詢(xún)密度、查詢(xún)熱度以及點(diǎn)擊度,獲取所述預(yù)處理后檢索詞的流行度。本發(fā)明可提高流行檢索詞的挖掘準(zhǔn)確率,解決現(xiàn)有技術(shù)對(duì)新興詞匯挖掘不及時(shí)以及某些詞匯由于作弊或者搜索信息的無(wú)效而挖掘不準(zhǔn)確的問(wèn)題。
文檔編號(hào)G06F17/30GK103198072SQ201210004129
公開(kāi)日2013年7月10日 申請(qǐng)日期2012年1月6日 優(yōu)先權(quán)日2012年1月6日
發(fā)明者潘璇, 程剛, 李鶴, 林偉堅(jiān), 周霄驍, 吳志堅(jiān), 劉新鳴, 莊子明, 鄒永, 林松 申請(qǐng)人:騰訊科技(深圳)有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1