最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

使用頁面集而提供信息搜索服務(wù)的服務(wù)器、方法和系統(tǒng)的制作方法

文檔序號:6363018閱讀:289來源:國知局
專利名稱:使用頁面集而提供信息搜索服務(wù)的服務(wù)器、方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種信息搜索服務(wù),更確切的說,是一種使用頁面組而提供信息搜索服務(wù)的方法、系統(tǒng)和服務(wù)器。
背景技術(shù)
隨著因特網(wǎng)的發(fā)展,網(wǎng)絡(luò)信息搜索技術(shù)已經(jīng)得到了很大的發(fā)展,而使得大量的信息在網(wǎng)絡(luò)上可被處理和堆積,而且用戶可以又快又準(zhǔn)地搜索到信息。網(wǎng)絡(luò)信息搜索技術(shù)使得用戶能夠使用web瀏覽器(網(wǎng)絡(luò)瀏覽器)輕松的從網(wǎng)上搜索到各種各樣的信息,例如圖片,聲音,電影圖像等。然而,搜索技術(shù)存在著一個(gè)不利的因素就是,隨著網(wǎng)址以幾何級數(shù)增長,它們無法提供用戶真正必需的信息。最常見的一種解決這種問題的方法就是使用搜索引擎。搜索引擎是一種被設(shè)計(jì)用來幫助發(fā)現(xiàn)信息的程序,這些信息存儲(chǔ)在計(jì)算機(jī)系統(tǒng)中,例如存儲(chǔ)于公共或私人網(wǎng)絡(luò)或個(gè)人電腦內(nèi)的萬維網(wǎng)。搜索引擎通過搜索程序,例如搜索機(jī)器人或者網(wǎng)絡(luò)蜘蛛,來創(chuàng)建網(wǎng)址信息的索引,并且將索引信息存儲(chǔ)到數(shù)據(jù)庫中。它允許用戶查詢符合特定規(guī)則的內(nèi)容(特別是那些含有給定單詞或者短語的內(nèi)容),并返回一個(gè)和特定規(guī)則相匹配的參考列表。搜索引擎使用網(wǎng)絡(luò)索引方法,網(wǎng)絡(luò)路徑方法和元搜索方法。網(wǎng)絡(luò)索引方法是一種最通用的搜索方法。它通過搜索程序例如搜索機(jī)器人或者網(wǎng)絡(luò)蜘蛛,來創(chuàng)建網(wǎng)址信息的索弓丨,并且將索引信息存儲(chǔ)到數(shù)據(jù)庫中,它允許用戶查詢符合特定規(guī)則的內(nèi)容,并返回一個(gè)和特定規(guī)則相匹配的參考列表。網(wǎng)絡(luò)路徑方法按照主題和層次對因特網(wǎng)上的頁面進(jìn)行分類以編輯一個(gè)數(shù)據(jù)庫,然后創(chuàng)建條目的路徑,它允許用戶選擇和需要信息最接近的條目,進(jìn)而逐漸的縮小搜索的范圍。元搜索方法是一種高級網(wǎng)絡(luò)索引方法,它在網(wǎng)絡(luò)索引方法中創(chuàng)建一個(gè)可提供搜索服務(wù)的搜索引擎的列表,使得用戶可以選擇一個(gè)搜索引擎進(jìn)行搜索。但是,這些搜索引擎各自都存在著以下的不足。網(wǎng)絡(luò)路徑方法不能獲得實(shí)質(zhì)性的搜索結(jié)果,因?yàn)樵谒阉鹘Y(jié)果內(nèi)只包含了相對少量的網(wǎng)頁。此外,網(wǎng)絡(luò)路徑方法搜索很耗時(shí),因?yàn)樗枰芏嗖襟E來獲得信息。網(wǎng)絡(luò)索引方法和元搜索方法使得用戶在大量的搜索結(jié)果前感到困惑,而且其搜索結(jié)果可靠性很低,因?yàn)樗鼈兲峁┙o用戶所有的頁面,包括查詢頁面。元搜索方法和網(wǎng)絡(luò)索引方法首先使用它們自己的算法來提供可靠性高的網(wǎng)頁。但是,這些頁面未必提供給用戶他們想要的信息,因?yàn)榘ú樵冊趦?nèi)的所有頁面都被提供了。例如,以上提及的搜索方法會(huì)提供書中一頁的存儲(chǔ)信息,而不會(huì)提供一本或多本書的存儲(chǔ)信息,而使得復(fù)雜搜索是不可能的。因此,要解決搜索結(jié)果的低可靠性問題,輔助內(nèi)容,例如網(wǎng)絡(luò)咖啡館博客(Internet caf blog),或者信息服務(wù),就被應(yīng)用到搜索引擎中了。

發(fā)明內(nèi)容
技術(shù)方案本發(fā)明提供了能夠提供信息捜索服務(wù)的ー種方法,系統(tǒng)和服務(wù)器,這種服務(wù)可以對符合特定規(guī)則的ー組頁面進(jìn)行索引,并在這組頁面內(nèi)進(jìn)行搜索。有益效果
根據(jù)本發(fā)明,用戶可以又快又準(zhǔn)的在因特網(wǎng)上查到信息,因?yàn)椹`組網(wǎng)頁被分析用以創(chuàng)建ー個(gè)位置信息模式,使用位置信息模式將含有類似信息的網(wǎng)頁分組為多組,接著含有與查詢相關(guān)信息的多個(gè)頁面,也就是ー個(gè)代表頁面和一些低級別的頁面的形式被劃為ー組后再提供給用戶。


通過示意性實(shí)施例的詳細(xì)描述,本發(fā)明的以上及其他特征和優(yōu)勢將更清楚,其中參照下述附圖圖I是根據(jù)本發(fā)明的一個(gè)實(shí)施例,使用一組頁面來提供信息捜索服務(wù)的系統(tǒng)的方框圖;圖2根據(jù)本發(fā)明的一個(gè)實(shí)施例,一個(gè)組搜索服務(wù)器的方框圖;圖3和4是說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的URL(統(tǒng)ー資源定位符)模式和ー個(gè)URL模式樹(UP樹)的示意圖;圖5是根據(jù)本發(fā)明的一個(gè)實(shí)施例,使用一組頁面來提供信息捜索服務(wù)的方法的流程圖;以及圖6是根據(jù)本發(fā)明的一個(gè)實(shí)施例的一個(gè)組檢索結(jié)果。實(shí)施發(fā)明的最優(yōu)方式根據(jù)本發(fā)明的ー個(gè)方面,它提供了ー種提供組搜索服務(wù)的方法,包括(a)通過分析所收集數(shù)據(jù)最初定位的位置信息來創(chuàng)建這些數(shù)據(jù)的位置信息模式;(b)根據(jù)已經(jīng)創(chuàng)建的位置信息模式對所收集數(shù)據(jù)進(jìn)行分組;以及(C)從數(shù)據(jù)組中選擇ー個(gè)與關(guān)鍵字相關(guān)的數(shù)據(jù)組并且提供一個(gè)組搜索結(jié)果。根據(jù)本發(fā)明的另ー個(gè)方面,它提供了在一個(gè)系統(tǒng)中提供一種組搜索服務(wù)的方法,該系統(tǒng)包括一個(gè)發(fā)送查詢并輸出搜索結(jié)果的用戶終端,ー個(gè)提供多個(gè)頁面的web服務(wù)器,以及ー個(gè)從用戶終端接收查詢并創(chuàng)建和發(fā)送搜索結(jié)果到用戶終端的組搜索服務(wù)器,該方法包括(a)從用戶終端接收查詢和查詢請求信號;(b)接收來自web服務(wù)器的網(wǎng)頁;(C)分析網(wǎng)頁以創(chuàng)建ー個(gè)URL模式,并且用該URL模式把這些網(wǎng)頁分到ー個(gè)網(wǎng)頁組;(d)從網(wǎng)頁組中提取索引,創(chuàng)建索引信息,并創(chuàng)建索引所參照的網(wǎng)頁組的URL信息;以及(e)比較查詢和索引來創(chuàng)建ー個(gè)組搜索結(jié)果并將該結(jié)果發(fā)送給用戶終端。根據(jù)本發(fā)明的另ー個(gè)方面,它提供了ー個(gè)提供組搜索服務(wù)的系統(tǒng),該組捜索服務(wù)通過搜索在無線/有線網(wǎng)絡(luò)中多個(gè)網(wǎng)頁內(nèi)的信息而獲得,系統(tǒng)包括ー個(gè)在無線/有線通訊網(wǎng)絡(luò)上實(shí)現(xiàn)網(wǎng)上沖浪的用戶終端,它通過傳送查詢和搜索請求信號來產(chǎn)生搜索請求,接收該請求對應(yīng)的組搜索結(jié)果,并且輸出組搜索結(jié)果到顯示單元;一個(gè)從信息中創(chuàng)建網(wǎng)頁并提供網(wǎng)頁的web服務(wù)器;以及一個(gè)接收和分析網(wǎng)頁以創(chuàng)建URL模式,并使用URL模式而把網(wǎng)頁分組為網(wǎng)頁組,對網(wǎng)頁組進(jìn)行索引,在網(wǎng)頁組中搜索信息并創(chuàng)建和傳送組搜索結(jié)果給用戶終端的組搜索服務(wù)器。 根據(jù)本發(fā)明的另一個(gè)方面,它提供了一個(gè)組搜索服務(wù)器,其包括一個(gè)位置信息模式生成模塊,它通過分析所收集數(shù)據(jù)最初定位的位置信息來創(chuàng)建這些數(shù)據(jù)的位置信息模式;一個(gè)網(wǎng)頁分組模塊,它根據(jù)已創(chuàng)建的位置信息模式將所收集數(shù)據(jù)分組為數(shù)據(jù)組;以及一個(gè)控制器,它從數(shù)據(jù)組中選擇一個(gè)與關(guān)鍵字相關(guān)的一個(gè)數(shù)據(jù)組并且提供一個(gè)組搜索結(jié)果O根據(jù)本發(fā)明的另一個(gè)方面,它提供了一個(gè)組搜索服務(wù)器,該服務(wù)器接收在無線/有線通訊網(wǎng)絡(luò)上實(shí)現(xiàn)網(wǎng)上沖浪的用戶終端發(fā)送的查詢和搜索請求,在web服務(wù)器提供的網(wǎng)頁中搜索信息,并發(fā)送搜索結(jié)果給用戶終端,該組搜索服務(wù)器包括一個(gè)網(wǎng)頁收集模塊,它執(zhí)行網(wǎng)頁收集程序,用以自web服務(wù)器接收web服務(wù)器訪問無線/有線通訊網(wǎng)絡(luò)而獲得的網(wǎng)頁,并存儲(chǔ)這些網(wǎng)頁;一個(gè)URL模式生成模塊,它通過分析網(wǎng)頁收集模塊接收到的網(wǎng)頁來創(chuàng)建URL模式;一個(gè)網(wǎng)頁分組模塊,它利用URL模式生成模塊創(chuàng)建的URL模式將網(wǎng)頁分組為網(wǎng)頁組;一個(gè)索引管理模塊,它從網(wǎng)頁分組模塊分組的網(wǎng)頁組中提取索引,用以創(chuàng)建并存儲(chǔ)索引信息和索引所參照的網(wǎng)頁組的URL信息;一個(gè)查詢管理模塊,它根據(jù)收到的查詢和搜索請求信號而搜索索引信息,將具有與查詢相關(guān)的索引的網(wǎng)頁組的URL信息創(chuàng)建為組搜索結(jié)果,以及將組搜索結(jié)果傳送至用戶終端;以及一個(gè)控制器,它控制網(wǎng)頁收集模塊,URL模式生成模塊,網(wǎng)頁分組模塊,索引管理模塊,查詢管理模塊,使得組搜索服務(wù)器能夠使用網(wǎng)頁組來完成搜索,并通過無線/有線通訊網(wǎng)絡(luò)與客戶終端和web服務(wù)器進(jìn)行通訊。
具體實(shí)施例方式現(xiàn)在用結(jié)合附圖,對本發(fā)明的示意性實(shí)施例進(jìn)行詳細(xì)描述。圖I是根據(jù)本發(fā)明的一個(gè)實(shí)施例,使用頁面分組而提供信息搜索服務(wù)的系統(tǒng)的方框圖。根據(jù)本發(fā)明的一個(gè)實(shí)施例,使用頁面分組而提供信息搜索服務(wù)的系統(tǒng)包括一個(gè)用戶終端110,一個(gè)無線/有線通訊網(wǎng)絡(luò)120,一個(gè)web服務(wù)器130,一個(gè)組搜索服務(wù)器140,一個(gè)組搜索數(shù)據(jù)庫(此后都用DB來表示數(shù)據(jù)庫)141,一個(gè)索引服務(wù)器150,和一個(gè)索引數(shù)據(jù)庫 151。用戶終端110通過無線/有線通訊網(wǎng)絡(luò)120訪問組搜索服務(wù)器140,發(fā)送一個(gè)查詢和搜索請求信號,并接收來自組搜索服務(wù)器140的組搜索結(jié)果,再輸出組搜索結(jié)果到顯示單元。用戶終端110包括一個(gè)有線通訊單元,該單元包括一個(gè)因特網(wǎng)調(diào)制解調(diào)器,例如極高比特速率數(shù)字用戶線路(VDSL)調(diào)制解調(diào)器和電纜調(diào)制解調(diào)器,和/或一個(gè)移動(dòng)通訊單元,該單元包括一個(gè)移動(dòng)通訊調(diào)制解調(diào)器,例如碼分多址(CDMA) 2000調(diào)制解調(diào)器和寬帶CDMA(ff-CDMA)調(diào)制解調(diào)器。用戶終端110使用包含的通訊單元通過無線/有線通訊網(wǎng)絡(luò)120來訪問組搜索服務(wù)器140。用戶終端進(jìn)一步包括一個(gè)包含一塊內(nèi)存和一個(gè)微處理器的控制器。內(nèi)存存放網(wǎng)絡(luò)瀏覽器程序,這些程序被用來接收用戶查詢,請求信息捜索,以及輸出捜索結(jié)果給顯示單元。微處理器控制用戶終端110的運(yùn)行。 用戶終端110的例子包括一臺(tái)個(gè)人計(jì)算機(jī)(PC),例如一臺(tái)桌上電腦或者一臺(tái)膝上電腦,以及ー個(gè)通訊終端,例如個(gè)人數(shù)碼助理(PDA)、手機(jī)、個(gè)人通訊服務(wù)電話、掌上電腦、全球移動(dòng)通訊系統(tǒng)(GSM)電話、W-CDMA手機(jī)、CDMA-2000手機(jī)和移動(dòng)寬帶系統(tǒng)(MBS)手機(jī)。無線/有線通訊網(wǎng)絡(luò)120將用戶終端110、web服務(wù)器130、組搜索服務(wù)器140、索引服務(wù)器150連接起來,使得它們可以使用有線或無線的方式重復(fù)它們之間發(fā)送和接收的數(shù)據(jù)。web服務(wù)器130是ー個(gè)典型的網(wǎng)絡(luò)服務(wù)器,包括用網(wǎng)頁形式提供各種信息的多個(gè)計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)軟件。網(wǎng)絡(luò)服務(wù)器指一個(gè)計(jì)算機(jī)系統(tǒng)和計(jì)算機(jī)軟件(網(wǎng)絡(luò)服務(wù)器程序),它被連接到一個(gè)子單元,而與其他網(wǎng)絡(luò)服務(wù)器通過計(jì)算機(jī)網(wǎng)絡(luò),例如企業(yè)內(nèi)部互聯(lián)網(wǎng)或者因特網(wǎng),進(jìn)行通信,接收運(yùn)行請求并提供運(yùn)行結(jié)果。然而,除了網(wǎng)絡(luò)服務(wù)器程序,網(wǎng)絡(luò)服務(wù)器應(yīng)該被解釋為包括運(yùn)行在網(wǎng)絡(luò)服務(wù)器上的應(yīng)用程序以及存儲(chǔ)在上面的各種數(shù)據(jù)庫。網(wǎng)絡(luò)服務(wù)器被具體化為根據(jù)操作系統(tǒng),例如DOS、Windows, Linux、UNIX或者M(jìn)acOS,而使用相應(yīng)的網(wǎng)絡(luò)服務(wù)器程序。索引服務(wù)器150執(zhí)行ー個(gè)數(shù)據(jù)收集程序,通常是ー個(gè)web機(jī)器人,從連接到無線/有線通訊網(wǎng)絡(luò)120的web服務(wù)器130上收集數(shù)據(jù)。索引服務(wù)器150定時(shí)更新收集的數(shù)據(jù),且索引數(shù)據(jù)庫151使用一個(gè)翻轉(zhuǎn)文件或者類似的機(jī)制存放收集到的數(shù)據(jù)。組搜索服務(wù)器140與索引服務(wù)器150以及索引數(shù)據(jù)庫151相通訊以閱讀網(wǎng)絡(luò)數(shù)據(jù),組搜索服務(wù)器140還分析網(wǎng)絡(luò)數(shù)據(jù)的位置信息以創(chuàng)建多種位置信息模式。位置信息是指包括收集到的網(wǎng)絡(luò)數(shù)據(jù)的因特網(wǎng)路徑。它優(yōu)選包括網(wǎng)絡(luò)數(shù)據(jù)的統(tǒng)ー資源定位符(URLs)。它分析在位置信息模式之間的聯(lián)系以執(zhí)行分組操作。上述過程能包括使用ー個(gè)URL模式樹而創(chuàng)建在多個(gè)不同URL模式之間的ー個(gè)聯(lián)系,還包括對具有相同URL模式分組域值的網(wǎng)頁進(jìn)行分組。可選擇地或另外地,創(chuàng)建和URL模式分組的過程能包括參照ー個(gè)預(yù)定的URL模式路徑。組搜索服務(wù)器140提取在網(wǎng)頁組単元內(nèi)的索引,創(chuàng)建由索引參照的網(wǎng)頁的索引信息和URL信息,并且在組搜索數(shù)據(jù)庫141內(nèi)儲(chǔ)存索引信息和URL信息。當(dāng)組搜索服務(wù)器140從用戶終端接收ー個(gè)查詢和ー個(gè)信息搜索需求時(shí),它將該查詢與搜索相對比以創(chuàng)建關(guān)于組捜索結(jié)果的信息。組搜索結(jié)果與關(guān)于查詢的其他捜索結(jié)果一起,能被傳送至用戶終端110。組搜索服務(wù)器140將會(huì)參照圖2而被詳細(xì)描述。即使組捜索服務(wù)器140沒有從用戶接收到關(guān)于查詢的組搜索結(jié)果,它也能被用于提供一個(gè)關(guān)于一個(gè)確定關(guān)鍵字的組搜索結(jié)果。例如,它能使用ー個(gè)包含用戶查詢的更高水平的概念或一個(gè)關(guān)于用戶查詢的確定的關(guān)鍵字以提供一個(gè)組搜索結(jié)果。進(jìn)ー步地,它能使用一個(gè)關(guān)于情報(bào)的關(guān)鍵字以提供一個(gè)組搜索結(jié)果。組搜索數(shù)據(jù)庫141儲(chǔ)存網(wǎng)頁組的索引信息和位置信息(包括URL信息),這些信息由組搜索服務(wù)器140所創(chuàng)建。它能進(jìn)一歩地儲(chǔ)存組的中心詞。數(shù)據(jù)庫是指通過DBMS(數(shù)據(jù)庫管理系統(tǒng))程序而在計(jì)算機(jī)系統(tǒng)的存儲(chǔ)區(qū)內(nèi)形成的數(shù)據(jù)結(jié)構(gòu),在其中數(shù)據(jù)被取得、刪除、編輯和添加。數(shù)據(jù)庫能使用一個(gè)相關(guān)的DBMS而適應(yīng)于本發(fā)明,例如,Oracle, Informix,Sybase, MS SQL (微軟結(jié)構(gòu)查詢語言),或DB2的數(shù)據(jù)庫管理系統(tǒng)。數(shù)據(jù)庫包括存儲(chǔ)、取得、刪除、編輯和添加數(shù)據(jù)所需的域和元素。進(jìn)一步地,組搜索數(shù)據(jù)庫141和索引數(shù)據(jù)庫151能彼此分開,或?yàn)橥暾惑w。
圖2根據(jù)本發(fā)明的一個(gè)實(shí)施例,一個(gè)組搜索服務(wù)器的方框圖。一個(gè)組搜索服務(wù)器140是包括一個(gè)網(wǎng)頁收集模塊210、一個(gè)URL模式生成模塊220、一個(gè)網(wǎng)頁分組模塊230、一個(gè)索引管理模塊240、一個(gè)查詢管理模塊250和一個(gè)控制器260的網(wǎng)絡(luò)服務(wù)器。網(wǎng)頁收集模塊210通過無線/有線通訊網(wǎng)絡(luò)而訪問web服務(wù)器130以收集數(shù)據(jù)。網(wǎng)頁收集模塊210能選擇性地包括在組搜索服務(wù)器140內(nèi),以反映被位置信息所參照的數(shù)據(jù)的變化,該位置信息由索引服務(wù)器150所收集且存儲(chǔ)于索引數(shù)據(jù)庫151內(nèi)。URL模式生成模塊220分析控制器260或網(wǎng)頁收集模塊210所需的網(wǎng)頁的URLs以創(chuàng)建URL模式。URL模式是指網(wǎng)頁的URL的預(yù)定模式,且其被創(chuàng)建以管理具有相同內(nèi)容的一組網(wǎng)頁或以同樣模式寫成的一組網(wǎng)頁。在本發(fā)明中,相同網(wǎng)頁被分組和被管理以用于信息搜索。此時(shí),URL模式被用作選擇相同網(wǎng)頁的一個(gè)標(biāo)準(zhǔn)。URL模式生成模塊220分析控制器260或網(wǎng)頁收集模塊210接收的網(wǎng)頁的URLs,以創(chuàng)建包括分組域的URL模式。例如,在由Neowiz公司提供的SayClub主頁服務(wù)器內(nèi),每一個(gè)ID (身份)的代表頁的URL被分析,ID被設(shè)置為一個(gè)分組域,因此創(chuàng)建了一個(gè)http: //hompy.sayclub. com/[ID]的URL模式。URL模式將會(huì)參照圖3而被詳細(xì)描述。除了分組域,URL模式能基于超文本傳輸協(xié)議(HyperText Markup Language, HTML)模版而創(chuàng)建,該模版由兩個(gè)網(wǎng)頁或網(wǎng)頁內(nèi)容所共享。HTML模版是指通常使用的基礎(chǔ)結(jié)構(gòu),以使得網(wǎng)頁能夠易于被寫入。例如,它以標(biāo)簽形式被書寫,如〈Table. · · ><TD>[text number]</TDXTD>[title]</TD>. · ·〈/TABLE〉,其常用于寫入網(wǎng)頁。寫入為網(wǎng)頁的一個(gè)HTML文件典型地是一個(gè)HTML標(biāo)簽和一個(gè)文本的組合,它遵守HTML的語法。HTML文件由多個(gè)功能塊組成,如,菜單塊、用于與其他入口站點(diǎn)相連的連接塊、和一個(gè)用于包含內(nèi)容的信息塊。功能塊經(jīng)常用于網(wǎng)頁內(nèi),且因此用模版寫入以方便用戶。由同樣操作件創(chuàng)建的網(wǎng)頁能包含于多個(gè)由web服務(wù)器所管理的網(wǎng)頁內(nèi),而該服務(wù)器提供了公告服務(wù)、博客服務(wù)、最小化主頁服務(wù)及其類似物。即,共享一個(gè)相同HTML模版的多個(gè)網(wǎng)頁趨向于由相同的操作件所創(chuàng)建,且趨向于包含相同的內(nèi)容。因?yàn)樘峁┝斯娣?wù)、博客服務(wù)和最小化主頁服務(wù)的web服務(wù)器130使用相同的HTML模版以寫入由web服務(wù)器130所管理的最多的網(wǎng)頁,所以由相同web服務(wù)器130所管理的網(wǎng)頁共享同樣的HTML模版。相應(yīng)地,共享同樣HTML模版的網(wǎng)頁能具有同樣的URL模式?;谒鑅RL模式之間的通過UP樹信息的聯(lián)系,網(wǎng)頁分組模塊230對由URL模式生成模塊220創(chuàng)建的不同URL模式進(jìn)行分組,而且在URL模式組內(nèi)對具有同樣分組域的網(wǎng)頁進(jìn)行分組。即,網(wǎng)頁分組模塊230對URL模式進(jìn)行分組,該URL模式與由URL模式生成模塊220創(chuàng)建的URL模式不同,但是它們又相互相關(guān),基于所需URL模式之間的通過UP樹信息的聯(lián)系,網(wǎng)頁分組模塊230在URL模式組內(nèi)對具有相同URL模式分組域值的網(wǎng)頁進(jìn)行分組。例如,登記于SayClub主頁內(nèi)網(wǎng)頁的URLs能夠概括為大約20種不同的URL模式?;赨P樹信息,這20種不同URL模式被分組在ー個(gè)單個(gè)組。在它們中,具有同一個(gè)用戶ID的網(wǎng)頁作為ー個(gè)分組域值而被分組在ー個(gè)網(wǎng)頁組內(nèi)。相應(yīng)地,當(dāng)?shù)怯浻赟ayClub主頁的網(wǎng)頁被依據(jù)用戶ID而分組,網(wǎng)頁的分組數(shù)等同于登記于SayClub主頁的用戶ID的數(shù)量。進(jìn)一歩地,這能等同地應(yīng)用于登記于Naver博客的網(wǎng)頁,以使得網(wǎng)頁的分組數(shù)等同于登記于Naver博客的用戶ID的數(shù)量。然而,在本發(fā)明中,用于分組網(wǎng)頁的標(biāo)準(zhǔn)不局限于分組域值。例如,能通過對分組域執(zhí)行“和”或“或”操作的而對網(wǎng)頁分組。本發(fā)明可進(jìn)ー步包括對在ー個(gè)索引和一個(gè)相應(yīng)組之間的聯(lián)系進(jìn)行評價(jià),以對頁面組進(jìn)行細(xì)分或改變,該索引由索引管理模塊240提取。例如,當(dāng)自頁面組提取的索引涉及兩個(gè)或多個(gè)域時(shí),頁面可被整合為ー個(gè)組或基于域而被細(xì)分兩個(gè)或多個(gè)子組。當(dāng)從ー組頁面提取的ー個(gè)索引不正確地表示其內(nèi)容,該組可被刪除以產(chǎn)生ー個(gè)可靠的搜索結(jié)果。索引管理模塊240從ー個(gè)由網(wǎng)頁分組模塊230分組的頁面組提取ー個(gè)索引,以及 存儲(chǔ)在組搜索數(shù)據(jù)庫141內(nèi)網(wǎng)頁的索引信息和URL信息。即,索引管理模塊240從ー個(gè)頁面組提取ー個(gè)索引以創(chuàng)建索引信息,以及在組搜索數(shù)據(jù)庫141的索引數(shù)據(jù)庫151內(nèi)儲(chǔ)存索引信息。另外,索引管理模塊240使用UP樹信息以創(chuàng)建網(wǎng)頁組的URL信息和在組搜索數(shù)據(jù)庫141內(nèi)儲(chǔ)存URL信息。在從用戶終端110接收ー個(gè)查詢或關(guān)鍵字時(shí),查詢管理模塊250搜索索引數(shù)據(jù)庫151,從組搜索數(shù)據(jù)庫141接收具有匹配查詢索引的網(wǎng)頁組信息和創(chuàng)建組捜索結(jié)果。在查詢或關(guān)鍵字與索引之間的匹配可通過使用指定術(shù)語詞典或共有信息(MI)值而執(zhí)行。另外,可使用公知算法而執(zhí)行。控制器260控制網(wǎng)頁收集模塊210、URL模式生成模塊220、網(wǎng)頁分組模塊230、索引管理模塊240和查詢管理模塊250,以使得組搜索服務(wù)器能夠使用ー組網(wǎng)頁進(jìn)行查詢。另夕卜,控制器與索引服務(wù)器150和索引數(shù)據(jù)151進(jìn)行通訊,從用戶終端110接收查詢搜索請求,和發(fā)送組捜索結(jié)果。圖3和圖4是根據(jù)本發(fā)明的一個(gè)實(shí)施例,對URL模式和UP樹的進(jìn)行解釋的示意圖。圖3 說明了使用 Neowiz SayClub 主頁(http://hompy. sayclub. com,此后稱之為hompy)服務(wù)的用戶主頁的URL,以及其相關(guān)頁面的URL。用戶主頁包括ー些在用戶URL內(nèi)含有其ID的網(wǎng)頁。在SayClub hompy, URL被表現(xiàn)為查詢形式,如被“變量名稱=變量值”跟隨的“◎”符號。相應(yīng)地,在圖3中,當(dāng)跟隨“targetmsrl =”的值被認(rèn)為是確認(rèn)用戶ID的標(biāo)準(zhǔn)吋,URL模式被如圖4所示而創(chuàng)建。另外,在由門戶站點(diǎn)所提供的私人博客服務(wù)或公告服務(wù)中,服務(wù)提供商的域名可被一個(gè)分隔符所跟隨用以區(qū)別用戶和公告。圖4是通過分析在hompy內(nèi)網(wǎng)頁的URL而得到的URL的樹狀結(jié)構(gòu)的模式。參照圖3,每ー個(gè)網(wǎng)頁在其URL內(nèi)包括用戶的ID。因此,在網(wǎng)頁的URL中,“用戶ID”的部分可被轉(zhuǎn)換為[ID]的分組域,而包含在hompy內(nèi)的“公告類型”部分可被轉(zhuǎn)換為[公告類型]的分組域。即使是分組域值變化了,而當(dāng)URL瀏覽的內(nèi)容實(shí)質(zhì)上沒有改變時(shí),分組域可被設(shè)置為[忽略]域,而[忽略]域在分組URL模式的過程中被忽略?;诜纸M域值的變化,可通過分析在相應(yīng)組內(nèi)文件的囊括和聯(lián)系而確定分組域之間的優(yōu)先。
當(dāng)URL模式通過上述過程而被創(chuàng)建,被創(chuàng)建的URL模式能被用于概括Neowizhompy所有用戶的網(wǎng)頁。分組域能自動(dòng)地被形成于分析URL地址的過程中。在由門戶站點(diǎn)或社區(qū)站點(diǎn)提供的私人博客或公告中,URL模式被統(tǒng)一地按照服務(wù)提供商的策略而創(chuàng)建。在這種情況下,創(chuàng)建和對URL模式分組的過程能通過參照關(guān)于分組域的預(yù)定URL模式和路徑而被執(zhí)行。圖5是根據(jù)本發(fā)明的一個(gè)實(shí)施例,使用一組頁面而提供信息搜索服務(wù)的方法的流程圖。 一個(gè)因特網(wǎng)用戶使用用戶終端以輸入一個(gè)信息搜索的查詢,且發(fā)送該查詢和搜索請求至組搜索服務(wù)器140(操作S410)。操作S410可被省略。即,一個(gè)組搜索服務(wù)器可通過分析儲(chǔ)存數(shù)據(jù)而被執(zhí)行,而無需用戶輸入查詢或查詢請求。在從用戶終端110接收查詢和搜索請求信號后,組搜索服務(wù)器140從索引數(shù)據(jù)庫151接收關(guān)于網(wǎng)頁的信息(包括地址信息),而該索引數(shù)據(jù)庫151由索引服務(wù)器150所預(yù)先收集和編譯(操作S420)。組搜索服務(wù)器140可選擇性地操作網(wǎng)頁收集模塊210以從索引數(shù)據(jù)庫151接收附助材料。期間,根據(jù)一個(gè)預(yù)定方法,web機(jī)器人程序可被執(zhí)行以接收網(wǎng)頁索引服務(wù)器150而存儲(chǔ)于索引數(shù)據(jù)庫151內(nèi)。在從索引服務(wù)器150接收網(wǎng)頁后,組搜索服務(wù)器140分析網(wǎng)頁以創(chuàng)建URL模式(S430)。在創(chuàng)建URL模式后,基于通過UP樹信息獲得的URL模式與網(wǎng)頁組的聯(lián)系,而該網(wǎng)頁組在一組URL模式內(nèi)具有同樣的URL模式的分組域值(操作S440),組搜索服務(wù)器140對不同的URL模式進(jìn)行分組。在分組網(wǎng)頁后,組搜索服務(wù)器140從組單元內(nèi)的網(wǎng)頁組提取索引,以創(chuàng)建索引信息和由索引參照的網(wǎng)頁組的URL信息(操作S450),以及在組搜索數(shù)據(jù)庫150內(nèi)存儲(chǔ)索引信息和網(wǎng)頁組的URL信息(操作S460)。在組搜索數(shù)據(jù)庫150內(nèi)存儲(chǔ)索引信息和網(wǎng)頁組的URL信息后,組搜索服務(wù)器140對接收自用戶終端110的查詢和存儲(chǔ)于組搜索數(shù)據(jù)庫150內(nèi)的索引進(jìn)行對比,進(jìn)行搜索,創(chuàng)建和發(fā)送組搜索結(jié)果至用戶終端110 (操作S470)。在從組搜索服務(wù)器140接收搜索結(jié)果后,用戶終端110輸出搜索結(jié)果至顯示單元。根據(jù)本發(fā)明,即使是查詢沒有從用戶被輸出,也可提供組搜索服務(wù)。根據(jù)本發(fā)明,組搜索服務(wù)將多個(gè)網(wǎng)頁分組為一個(gè)網(wǎng)頁組,且搜索與該網(wǎng)頁相關(guān)的實(shí)體,而不是搜索包含于網(wǎng)頁內(nèi)的一個(gè)術(shù)語。搜索服務(wù)可與公告搜索服務(wù)一起而被使用。最近,公告服務(wù)廣泛地用于網(wǎng)頁上,在其中用戶登記關(guān)于特定信息的材料,寫入信息的問題和解答。公告服務(wù)可包括含有比用戶搜索更多信息的網(wǎng)頁。相應(yīng)地,當(dāng)一個(gè)用戶輸入查詢以請求搜索,一個(gè)代表性的網(wǎng)頁和共享關(guān)于該查詢信息的低水平的公告網(wǎng)頁,被分組在一起以及以預(yù)定次序被提供,而不是簡單地提供包含該查詢的網(wǎng)頁。根據(jù)本發(fā)明的一個(gè)實(shí)施例,組搜索服務(wù)在下午中采取為公告服務(wù)。然而,本發(fā)明并不局限至此,而是可被應(yīng)用為使用網(wǎng)頁組以進(jìn)行搜索的多種服務(wù)。圖6是根據(jù)本發(fā)明的一個(gè)實(shí)施例,解釋組搜索結(jié)果的示意圖。在提供組搜索結(jié)果的方面,其輸出順序可取決于用戶查詢和關(guān)鍵字、組內(nèi)文件的數(shù)目、在現(xiàn)實(shí)期間內(nèi)組內(nèi)文件數(shù)目的增加、組和組文件的創(chuàng)建時(shí)間或普及度之間的聯(lián)系,而所述普及度如用戶訪問單個(gè)組的數(shù)量。為了評價(jià)該聯(lián)系,評價(jià)技術(shù)可被使用,其中使用了在相應(yīng)組內(nèi)和預(yù)定術(shù)語路徑內(nèi),用戶使用查詢和關(guān)鍵字的頻次。普及度可取決于在相應(yīng)組內(nèi)文件查詢的數(shù)目,用戶訪問組的數(shù)目以及在預(yù)定時(shí)間內(nèi)在相應(yīng)組內(nèi)創(chuàng)建的數(shù)據(jù)量。當(dāng)一個(gè)用戶在網(wǎng)頁內(nèi)的輸入窗口 510內(nèi)輸入“psp”查詢,即輸出一個(gè)組搜索結(jié)果530,所述網(wǎng)頁輸出至用戶終端110以提供組搜索服務(wù)和選擇“搜索”。組搜索結(jié)果530按照“Neo rank order (新登記次序)”而在分類菜單520內(nèi)被分類。用戶可在分類菜單520內(nèi)的“相關(guān)文章次序”或“普及度次序”內(nèi)對組搜索結(jié)果530進(jìn)行分類。組搜索結(jié)果530可顯示網(wǎng)絡(luò)文件的名稱、文章名稱等以有效地提供信息。頁面組信息540可進(jìn)一步包括關(guān)于頁面組分類和所囊括文件的數(shù)目的信息。另外,可提供單個(gè)頁面組內(nèi)單個(gè)文件的清單550以方便用戶。進(jìn)一步地,可提供關(guān)于單個(gè)頁面組來源信息的分類項(xiàng)560以有效地提供信息。雖然本發(fā)明被參照其說明性實(shí)施例而被描述,但是本領(lǐng)域技術(shù)人員能夠理解,在下述權(quán)利要求的范圍內(nèi),可以作出形式和細(xì)節(jié)上的多種變化,而不會(huì)脫離本發(fā)明的保護(hù)范圍。產(chǎn)業(yè)上的可利用性本發(fā)明能被有效地適用于提供信息搜索服務(wù)的方法、系統(tǒng)和服務(wù)器。
權(quán)利要求
1.一種組搜索服務(wù)器,包括 網(wǎng)頁收集模塊,執(zhí)行網(wǎng)頁收集程序,用以接收網(wǎng)頁并存儲(chǔ)所述網(wǎng)頁; URL模式生成模塊,通過分析網(wǎng)頁收集模塊接收到的網(wǎng)頁的URL來創(chuàng)建包含為網(wǎng)頁分組的分組域的URL模式; 網(wǎng)頁分組模塊,它利用URL模式生成模塊創(chuàng)建的URL模式將網(wǎng)頁分組為網(wǎng)頁組;索引管理模塊,從網(wǎng)頁分組模塊分組的網(wǎng)頁組中提取索引,用以創(chuàng)建并存儲(chǔ)索引信息和索引所參照的網(wǎng)頁組的URL信息; 查詢管理模塊,在接收到查詢和搜索請求信號時(shí)搜索索引信息,將具有與所述查詢相關(guān)的索引的網(wǎng)頁組的URL信息創(chuàng)建為組搜索結(jié)果;以及 控制器,控制網(wǎng)頁收集模塊,URL模式生成模塊,網(wǎng)頁分組模塊,索引管理模塊和查詢管理模塊,使得組搜索服務(wù)器能夠使用網(wǎng)頁組來完成搜索; 其中,URL模式生成模塊使用網(wǎng)頁的URL生成分組域。
2.根據(jù)權(quán)利要求I所述的組搜索服務(wù)器,其中,URL模式生成模塊創(chuàng)建用作標(biāo)準(zhǔn)的URL模式,所述標(biāo)準(zhǔn)用于以預(yù)定模式對網(wǎng)頁分組,該預(yù)定模式由具有相同信息的網(wǎng)頁所共享。
3.根據(jù)權(quán)利要求I所述的組搜索服務(wù)器,其中,所述網(wǎng)頁分組模塊基于通過URL模式數(shù)信息獲得的URL模式之間的聯(lián)系,將不同URL模式分組以創(chuàng)建URL模式的組,以及將URL模式的組中的具有相同的URL模式的分組域值的網(wǎng)頁分組為網(wǎng)頁組。
4.根據(jù)權(quán)利要求I所述的組搜索服務(wù)器,其中,所述網(wǎng)頁分組模塊將具有相同值的網(wǎng)頁分組為網(wǎng)頁組,所述值通過對URL模式的分組域執(zhí)行“和”或“或”操作的而獲得。
5.根據(jù)權(quán)利要求I所述的組搜索服務(wù)器,其中,所述索引管理模塊從包含于網(wǎng)頁組內(nèi)的網(wǎng)頁提取索引,以創(chuàng)建和存儲(chǔ)索引信息,以及創(chuàng)建和存儲(chǔ)由索引所參照的網(wǎng)頁組的URL信息,以使得URL信息與索引相對應(yīng)。
全文摘要
披露的是提供信息搜索服務(wù)的方法、系統(tǒng)和服務(wù)器。提供組搜索服務(wù)的方法,包括通過分析所收集數(shù)據(jù)最初定位的位置信息,來創(chuàng)建這些數(shù)據(jù)的位置信息模式;根據(jù)已經(jīng)創(chuàng)建的位置信息模式,將所收集數(shù)據(jù)分組為數(shù)據(jù)組;以及從數(shù)據(jù)組中選擇一個(gè)與關(guān)鍵字相關(guān)的數(shù)據(jù)組并且提供一個(gè)組搜索結(jié)果。
文檔編號G06F17/30GK102622402SQ201210008279
公開日2012年8月1日 申請日期2006年3月3日 優(yōu)先權(quán)日2005年3月4日
發(fā)明者南世東, 愼重?zé)?申請人:搜索方案株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1