本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種基于語(yǔ)音交互的搜索方法和裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,鍵盤的輸入成本也隨之不斷提升。語(yǔ)音搜索,基于強(qiáng)大的語(yǔ)音識(shí)別能力,支持通過語(yǔ)音命令快速發(fā)起搜索,讓搜索更快捷、更直接、更智能。相關(guān)技術(shù)中,傳統(tǒng)的語(yǔ)音搜索以接收指令、反饋指令模式,在每次搜索時(shí),該次搜索與上一次搜索和下一次搜索均獨(dú)立,即,在同一檢索序列中,搜索間均無關(guān)聯(lián)。
這種方式下,若用戶在對(duì)當(dāng)前的檢索詞進(jìn)行相關(guān)的追問或者補(bǔ)充搜索時(shí),需重述需求主體并給出完整的檢索需求表達(dá),不能夠結(jié)合語(yǔ)音搜索的上下文信息進(jìn)行搜索,在語(yǔ)音搜索表達(dá)式簡(jiǎn)化的情況下搜索精準(zhǔn)度不高。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本發(fā)明的一個(gè)目的在于提出一種基于語(yǔ)音交互的搜索方法,能夠結(jié)合語(yǔ)音搜索的上下文信息進(jìn)行搜索,提升搜索精準(zhǔn)度,提升用戶搜索體驗(yàn)度。
本發(fā)明的另一個(gè)目的在于提出一種基于語(yǔ)音交互的搜索裝置。
本發(fā)明的又一個(gè)目的在于提出一種基于語(yǔ)音交互的搜索裝置。
本發(fā)明的另一個(gè)目的在于提出一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
本發(fā)明的另一個(gè)目的在于提出一種計(jì)算機(jī)程序產(chǎn)品。
為達(dá)到上述目的,本發(fā)明第一方面實(shí)施例提出的基于語(yǔ)音交互的搜索方法,包括:根據(jù)用戶提供的用于搜索的語(yǔ)音數(shù)據(jù)獲取第一檢索詞,并獲取為所述第一檢索詞的上文信息的多個(gè)第二檢索詞;根據(jù)所述第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合;根據(jù)每種分詞組合的相關(guān)性評(píng)分,從所述多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞;根據(jù)所述第三檢索詞進(jìn)行搜索。
本發(fā)明第一方面實(shí)施例提出的基于語(yǔ)音交互的搜索方法,通過根據(jù)第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合;根據(jù)每種分詞組合的相關(guān)性評(píng)分,從多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進(jìn)行搜索,能夠結(jié)合語(yǔ)音搜索的上下文信息進(jìn)行搜索,提升搜索精準(zhǔn)度,提升用戶搜索體驗(yàn)度。
為達(dá)到上述目的,本發(fā)明第二方面實(shí)施例提出的基于語(yǔ)音交互的搜索裝置,包括:第一獲取模塊,用于根據(jù)用戶提供的用于搜索的語(yǔ)音數(shù)據(jù)獲取第一檢索詞;第二獲取模塊,用于獲取為所述第一檢索詞的上文信息的多個(gè)第二檢索詞;生成模塊,用于根據(jù)所述第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合;選擇模塊,用于根據(jù)每種分詞組合的相關(guān)性評(píng)分,從所述多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞;搜索模塊,用于根據(jù)所述第三檢索詞進(jìn)行搜索。
本發(fā)明第二方面實(shí)施例提出的基于語(yǔ)音交互的搜索裝置,通過根據(jù)第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合;根據(jù)每種分詞組合的相關(guān)性評(píng)分,從多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進(jìn)行搜索,能夠結(jié)合語(yǔ)音搜索的上下文信息進(jìn)行搜索,提升搜索精準(zhǔn)度,提升用戶搜索體驗(yàn)度。
為達(dá)到上述目的,本發(fā)明第三方面實(shí)施例提出的基于語(yǔ)音交互的搜索裝置,其特征在于,包括:
處理器;
用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
其中,所述處理器被配置為:
根據(jù)用戶提供的用于搜索的語(yǔ)音數(shù)據(jù)獲取第一檢索詞,并獲取為所述第一檢索詞的上文信息的多個(gè)第二檢索詞;
根據(jù)所述第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合;
根據(jù)每種分詞組合的相關(guān)性評(píng)分,從所述多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞;
根據(jù)所述第三檢索詞進(jìn)行搜索。
本發(fā)明第三方面實(shí)施例提出的基于語(yǔ)音交互的搜索裝置,通過根據(jù)第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合;根據(jù)每種分詞組合的相關(guān)性評(píng)分,從多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進(jìn)行搜索,能夠結(jié)合語(yǔ)音搜索的上下文信息進(jìn)行搜索,提升搜索精準(zhǔn)度,提升用戶搜索體驗(yàn)度。
為達(dá)到上述目的,本發(fā)明第四方面實(shí)施例提出的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由移動(dòng)終端的處理器被執(zhí)行時(shí),使得移動(dòng)終端能夠執(zhí)行一種基于語(yǔ)音交互的搜索方法,所述方法包括:
根據(jù)用戶提供的用于搜索的語(yǔ)音數(shù)據(jù)獲取第一檢索詞,并獲取為所述第一檢索詞的上文信息的多個(gè)第二檢索詞;
根據(jù)所述第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合;
根據(jù)每種分詞組合的相關(guān)性評(píng)分,從所述多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞;
根據(jù)所述第三檢索詞進(jìn)行搜索。
本發(fā)明第四方面實(shí)施例提出的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),通過根據(jù)第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合;根據(jù)每種分詞組合的相關(guān)性評(píng)分,從多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進(jìn)行搜索,能夠結(jié)合語(yǔ)音搜索的上下文信息進(jìn)行搜索,提升搜索精準(zhǔn)度,提升用戶搜索體驗(yàn)度。
為達(dá)到上述目的,本發(fā)明第五方面實(shí)施例提出的計(jì)算機(jī)程序產(chǎn)品,當(dāng)所述計(jì)算機(jī)程序產(chǎn)品中的指令處理器執(zhí)行時(shí),執(zhí)行一種基于語(yǔ)音交互的搜索方法,所述方法包括:
根據(jù)用戶提供的用于搜索的語(yǔ)音數(shù)據(jù)獲取第一檢索詞,并獲取為所述第一檢索詞的上文信息的多個(gè)第二檢索詞;
根據(jù)所述第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合;
根據(jù)每種分詞組合的相關(guān)性評(píng)分,從所述多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞;
根據(jù)所述第三檢索詞進(jìn)行搜索。
本發(fā)明第五方面實(shí)施例提出的計(jì)算機(jī)程序產(chǎn)品,通過根據(jù)第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合;根據(jù)每種分詞組合的相關(guān)性評(píng)分,從多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進(jìn)行搜索,能夠結(jié)合語(yǔ)音搜索的上下文信息進(jìn)行搜索,提升搜索精準(zhǔn)度,提升用戶搜索體驗(yàn)度。
本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
附圖說明
本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1是本發(fā)明一實(shí)施例提出的基于語(yǔ)音交互的搜索方法的流程示意圖;
圖2是本發(fā)明另一實(shí)施例提出的基于語(yǔ)音交互的搜索方法的流程示意圖;
圖3是本發(fā)明另一實(shí)施例提出的基于語(yǔ)音交互的搜索方法的流程示意圖;
圖4是本發(fā)明實(shí)施例中語(yǔ)音搜索界面示意圖;
圖5是本發(fā)明一實(shí)施例提出的基于語(yǔ)音交互的搜索裝置的結(jié)構(gòu)示意圖;
圖6是本發(fā)明另一實(shí)施例提出的基于語(yǔ)音交互的搜索裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。相反,本發(fā)明的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
圖1是本發(fā)明一實(shí)施例提出的基于語(yǔ)音交互的搜索方法的流程示意圖。該基于語(yǔ)音交互的搜索方法被配置為基于語(yǔ)音交互的搜索裝置中來舉例說明。該基于語(yǔ)音交互的搜索方法可以應(yīng)用在電子設(shè)備的搜索引擎中,搜索引擎是指能夠接收用戶輸入的搜索信息,并從互聯(lián)網(wǎng)上搜集與搜索信息相關(guān)信息,在對(duì)信息進(jìn)行組織和處理后,為用戶提供檢索服務(wù),將與搜索信息相關(guān)信息展示給用戶的系統(tǒng)。
其中,電子設(shè)備例如為個(gè)人電腦(Personal Computer,PC),云端設(shè)備或者移動(dòng)設(shè)備,移動(dòng)設(shè)備例如智能手機(jī),或者平板電腦等。
參見圖1,該基于語(yǔ)音交互的搜索方法包括:
S11:根據(jù)用戶提供的用于搜索的語(yǔ)音數(shù)據(jù)獲取第一檢索詞,并獲取為第一檢索詞的上文信息的多個(gè)第二檢索詞。
傳統(tǒng)的語(yǔ)音搜索以接收指令、反饋指令模式,在每次搜索時(shí),該次搜索與上一次搜索和下一次搜索均獨(dú)立,即,在同一檢索序列中,搜索間均無關(guān)聯(lián),若用戶在對(duì)當(dāng)前的檢索詞進(jìn)行相關(guān)的追問或者補(bǔ)充搜索時(shí),需重述需求主體并給出完整的檢索需求表達(dá),不能夠結(jié)合語(yǔ)音搜索的上下文信息進(jìn)行搜索,在語(yǔ)音搜索表達(dá)式簡(jiǎn)化的情況下搜索精準(zhǔn)度不高。
而本發(fā)明的實(shí)施例中,通過搜索上文和當(dāng)前搜索的深層需求理解,若歷史搜索詞中包含第一檢索詞的第一分詞結(jié)果和第二檢索詞的第二分詞結(jié)果的初始分詞組合時(shí),則根據(jù)初始分詞組合進(jìn)行搜索,能夠有效提升搜索效率;若歷史搜索詞中無初始分詞組合,則根據(jù)第一檢索詞的類型信息將第一分詞和第二分詞進(jìn)行組合處理,得到多種分詞組合,根據(jù)相關(guān)算法計(jì)算上述每種分詞組合的相關(guān)性評(píng)分,將評(píng)分值最大的分詞組合作為最終的檢索詞進(jìn)行搜索,能夠結(jié)合語(yǔ)音搜索的上下文信息進(jìn)行搜索,提升搜索精準(zhǔn)度,提升用戶搜索體驗(yàn)度。
在本發(fā)明的實(shí)施例中,可以接收用戶提供的用于搜索的語(yǔ)音數(shù)據(jù),獲取與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的第一文本,并將對(duì)應(yīng)的第一文本作為第一檢索詞。
可選地,用戶可以點(diǎn)擊搜索引擎搜索框中的麥克風(fēng)按鈕,輸入語(yǔ)音數(shù)據(jù),搜索引擎中的語(yǔ)音采集模塊采集到該語(yǔ)音數(shù)據(jù),獲取與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的第一文本,并將對(duì)應(yīng)的第一文本作為第一檢索詞。
可以理解的是,用戶可以對(duì)當(dāng)前搜索結(jié)果進(jìn)行相關(guān)地追問搜索或者補(bǔ)充搜索,當(dāng)前第一檢索詞的上文信息可以為多個(gè)。
例如,用戶在搜索引擎中輸入的語(yǔ)音數(shù)據(jù)為“美國(guó)”,搜索結(jié)果展示頁(yè)面提供美國(guó)相關(guān)信息,當(dāng)用戶想查詢美國(guó)的人口數(shù)據(jù)時(shí),輸入語(yǔ)音數(shù)據(jù)“人口多少”,結(jié)合上文信息,可知,第一檢索詞為“人口多少”,第二檢索詞為“美國(guó)”,或者,用戶可以繼續(xù)追問“首都是哪里”,結(jié)合上文信息可知,第一檢索詞為“首都是哪里”,第二檢索詞為:“美國(guó)”和“人口多少”。
S12:根據(jù)第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合。
在本發(fā)明的實(shí)施例中,可以采用相關(guān)技術(shù)對(duì)第一檢索詞和第二檢索詞進(jìn)行切詞處理,獲得第一檢索詞和第二檢索詞的詞法信息,即,得到第一分詞結(jié)果和第二分詞結(jié)果。
需要說明的是,對(duì)于歷史未出現(xiàn)過的第一檢索詞,根據(jù)上下文特征,通過切詞處理,可以過濾掉首位相同的分詞,且可以過濾掉拼音相同的模糊音。
在本發(fā)明的實(shí)施例中,可以判斷歷史搜索詞中是否存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合;若存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合,則將初始分詞組合作為生成的分詞組合;若不存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合,則提取第一分詞結(jié)果中每個(gè)第一分詞的第一特征信息,并提取第二分詞結(jié)果中每個(gè)第二分詞的第二特征信息;根據(jù)第一特征信息和第二特征信息,確定第一檢索詞的類型信息;根據(jù)第一檢索詞的類型信息將第一分詞和第二分詞進(jìn)行組合處理,得到多種分詞組合。
一些實(shí)施例中,參見圖2,步驟S12具體包括:
S21:判斷歷史搜索詞中是否存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合,若是,執(zhí)行S22,否則,執(zhí)行S23。
可選地,判斷歷史搜索詞中是否存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合,在歷史搜索詞中存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合時(shí),直接將初始分詞組合作為生成的分詞組合,根據(jù)生成的分詞組合進(jìn)行搜索,能夠有效提升搜索效率;在歷史搜索詞中不存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合時(shí),執(zhí)行S23。
S22:將初始分詞組合作為生成的分詞組合。
可選地,在歷史搜索詞中存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合時(shí),直接將初始分詞組合作為生成的分詞組合,根據(jù)生成的分詞組合進(jìn)行搜索,能夠有效提升搜索效率。
S23:提取第一分詞結(jié)果中每個(gè)第一分詞的第一特征信息,并提取第二分詞結(jié)果中每個(gè)第二分詞的第二特征信息。
在本發(fā)明的實(shí)施例中,第一特征信息/第二特征信息包括以下至少之一:第一分詞/第二分詞的實(shí)體類型、權(quán)重、用戶歷史搜索頻次、用戶歷史搜索后的點(diǎn)擊頻次、泛口語(yǔ)化的懲罰權(quán)重,以及編輯距離。
其中,第一分詞/第二分詞的實(shí)體類型為第一分詞/第二分詞的實(shí)體信息,例如人名、地名等。
第一分詞/第二分詞的權(quán)重的權(quán)值大小描述其在第一檢索詞/第二檢索詞中的重要性。
用戶歷史搜索頻次用于確定后續(xù)步驟中的每種分詞組合的相關(guān)性評(píng)分。
泛口語(yǔ)化的懲罰權(quán)重表示對(duì)第一分詞/第二分詞進(jìn)行口語(yǔ)化泛化的歸一處理。由于語(yǔ)音數(shù)據(jù)中存在大量口語(yǔ)化表述,例如“我想搜……”“查一下……是啥意思”,因此需要進(jìn)行口語(yǔ)化泛化的歸一處理。具體地,根據(jù)人工構(gòu)建的口語(yǔ)化詞表對(duì)第一分詞/第二分詞進(jìn)行口語(yǔ)化泛化的歸一處理,口語(yǔ)化詞表中每個(gè)分詞對(duì)應(yīng)一個(gè)懲罰權(quán)重,懲罰權(quán)重越大,表明分詞的口語(yǔ)話程度越高。
編輯距離為一種常見的相似度計(jì)算方法。
可選地,可以提取第一分詞結(jié)果中每個(gè)第一分詞的第一特征信息,并提取第二分詞結(jié)果中每個(gè)第二分詞的第二特征信息,以根據(jù)第一特征信息和第二特征信息確定第一檢索詞的類型信息。
S24:根據(jù)第一特征信息和第二特征信息,確定第一檢索詞的類型信息。
其中,類型信息包括:第一檢索詞為第二檢索詞的補(bǔ)充搜索的第一類型信息、第一檢索詞為第二檢索詞的追問搜索的第二類型信息。
在本發(fā)明的實(shí)施例中,第一類型信息為:主體語(yǔ)義不變,需求強(qiáng)相關(guān),例如,“天天酷跑下載”,“天天酷跑”為主體詞,“下載”為需求詞;第二類型信息為:主體語(yǔ)義變化,需求語(yǔ)義不變。
可選地,可以借助實(shí)體屬性知識(shí)庫(kù)識(shí)別第一檢索詞和第二檢索詞的實(shí)體屬性成分。需要說明的是,自然語(yǔ)言中同種意思可以用不同的表述方式,實(shí)體屬性描述中亦是如此,即同一個(gè)屬性需求有不同的表述方式,例如,“人口有多少”、“有多少人口”、“人口是多少”都是“人口”屬性需求的不同表述,因此需要通過主干抽取技術(shù)從不同的表述方式中抽取相同的需求主干。
具體地,通過判斷當(dāng)前第一檢索詞的實(shí)體屬性信息和上文信息的多個(gè)第二檢索詞的實(shí)體屬性的相關(guān)性,即根據(jù)第一特征信息和第二特征信息,進(jìn)而判斷第一檢索詞是屬性變更還是實(shí)體變更。
例如,當(dāng)?shù)谝粰z索詞為:“那體重呢?”,第二檢索詞為:“劉德華的身高”時(shí),通過實(shí)體屬性匹配,獲得實(shí)體為“劉德華”,而“身高”“體重”均為“劉德華”的屬性,因此,可知第一檢索詞的類型信息為:屬性變更,主體語(yǔ)義不變,即第一類型信息。
或者,當(dāng)?shù)谝粰z索詞為:“那姚明呢?”,第二檢索詞為:“劉德華的身高”時(shí),通過實(shí)體屬性匹配,獲得實(shí)體為“劉德華”“姚明”,而他們共同的屬性為“身高”,因此,可知第一檢索詞的類型信息為:主體語(yǔ)義變化,需求語(yǔ)義不變,即第二類型信息。
S25:根據(jù)第一檢索詞的類型信息將第一分詞和第二分詞進(jìn)行組合處理,得到多種分詞組合。
作為一種示例,當(dāng)?shù)谝粰z索詞為第二檢索詞的追問搜索的第二類型信息時(shí),例如,當(dāng)?shù)谝粰z索詞為:“那法國(guó)的呢?”,第二檢索詞為:“美國(guó)的首都是哪里”時(shí),得到的多種分詞組合可以如表1所示。
表1
本實(shí)施例中,通過在歷史搜索詞中存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合時(shí),將初始分詞組合作為生成的分詞組合,能夠有效提升搜索效率,通過在歷史搜索詞中不存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合時(shí),根據(jù)第一特征信息和第二特征信息,確定第一檢索詞的類型信息,根據(jù)第一檢索詞的類型信息將第一分詞和第二分詞進(jìn)行組合處理,得到多種分詞組合,以便于后續(xù)對(duì)相關(guān)性評(píng)分最大的分詞組合進(jìn)行搜索,能夠使用戶自如地表達(dá)檢索需求,使得語(yǔ)音搜索交互體驗(yàn)更具智能化,提升搜索精準(zhǔn)度,提升用戶搜索體驗(yàn)度。
一些實(shí)施例中,在步驟S12后,還包括:
S31:確定多種分詞組合中,每種分詞組合在用戶搜索歷史中的出現(xiàn)頻次,以及與分詞組合對(duì)應(yīng)的第一分詞的第一用戶歷史搜索頻次和對(duì)應(yīng)的第二分詞的第二用戶歷史搜索頻次。
可選地,可以假設(shè)分詞組合在用戶搜索歷史中的出現(xiàn)頻次為Nxyi,與分詞組合對(duì)應(yīng)的第一分詞的第一用戶歷史搜索頻次為Nxi,與分詞組合對(duì)應(yīng)的第二分詞的第二用戶歷史搜索頻次為Nyi,其中,i=1,2,…,M,M為分詞組合的個(gè)數(shù),用戶歷史總的搜索頻次為N。
S32:根據(jù)出現(xiàn)頻次、第一用戶歷史搜索頻次,以及第二用戶歷史搜索頻次確定相關(guān)性評(píng)分。
在本發(fā)明的實(shí)施例中,可以根據(jù)出現(xiàn)頻次Nxyi、第一用戶歷史搜索頻次Nxi、第二用戶歷史搜索頻次Nyi,以及預(yù)設(shè)公式確定相關(guān)性評(píng)分Corr(i),其中,預(yù)設(shè)公式為:
Corr(i)=Math.log10(N/Nxi)*Math.log10(N/Nyi)*Nxyi/(Nxi+Nyi-Nxyi);
通過根據(jù)出現(xiàn)頻次、第一用戶歷史搜索頻次,以及第二用戶歷史搜索頻次確定相關(guān)性評(píng)分,以便于后續(xù)對(duì)相關(guān)性評(píng)分最大的分詞組合進(jìn)行搜索,能夠使用戶自如地表達(dá)檢索需求,使得語(yǔ)音搜索交互體驗(yàn)更具智能化,提升搜索精準(zhǔn)度,提升用戶搜索體驗(yàn)度。
S13:根據(jù)每種分詞組合的相關(guān)性評(píng)分,從多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞。
在本發(fā)明的實(shí)施例中,可以從多種分詞組合中選擇相關(guān)性評(píng)分最高的分詞組合作為目標(biāo)分詞組合,并將目標(biāo)分詞組合作為第三檢索詞。
例如,當(dāng)?shù)谝粰z索詞為第二檢索詞的追問搜索的第二類型信息,且第一檢索詞為:“那法國(guó)的呢?”,第二檢索詞為:“美國(guó)的首都是哪里”時(shí),根據(jù)預(yù)設(shè)公式得到表1中每種分詞組合的相關(guān)性評(píng)分如表2所示(第一檢索詞為第二檢索詞的補(bǔ)充搜索的第一類型信息的處理過程類似,此處不再贅述)。
表2
可以從多種分詞組合中選擇相關(guān)性評(píng)分最高的分詞組合:法國(guó)的首都是哪里,作為目標(biāo)分詞組合,并將目標(biāo)分詞組合作為第三檢索詞,以根據(jù)第三檢索詞進(jìn)行搜索。
S14:根據(jù)第三檢索詞進(jìn)行搜索。
作為一種示例,參見圖4,圖4為本發(fā)明實(shí)施例中語(yǔ)音搜索界面示意圖,當(dāng)用戶輸入的語(yǔ)音數(shù)據(jù)為“美國(guó)”(第二檢索詞)時(shí),搜索結(jié)果展示頁(yè)面提供美國(guó)相關(guān)信息,當(dāng)用戶想查詢美國(guó)的人口數(shù)據(jù)時(shí),只需直接輸入語(yǔ)音數(shù)據(jù)“人口多少”(第一檢索詞),結(jié)合上文信息,本實(shí)施例能夠自動(dòng)識(shí)別第一檢索詞為第二檢索詞的補(bǔ)充搜索的第一類型信息,得到第三檢索詞為“美國(guó)人口多少”,并觸發(fā)搜索結(jié)果,滿足用戶需求。
同理,用戶可以繼續(xù)追問“首都是哪里”(第一檢索詞),結(jié)合上文信息可知,第二檢索詞為:“美國(guó)”和“人口多少”,本實(shí)施例能夠自動(dòng)識(shí)別第一檢索詞為第二檢索詞的補(bǔ)充搜索的第一類型信息,得到第三檢索詞為“美國(guó)首都是哪里”,展示搜索結(jié)果。
進(jìn)一步地,為了滿足用戶的口語(yǔ)化語(yǔ)音表述,用戶還可以自然地追問“那法國(guó)的呢”,結(jié)合上文信息,本實(shí)施例能夠自動(dòng)識(shí)別出第一檢索詞為第二檢索詞的追問搜索的第二類型信息,得到第三檢索詞為“法國(guó)的首都是哪里”,展示搜索結(jié)果。
本實(shí)施例中,通過根據(jù)第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合;根據(jù)每種分詞組合的相關(guān)性評(píng)分,從多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進(jìn)行搜索,能夠結(jié)合語(yǔ)音搜索的上下文信息進(jìn)行搜索,提升搜索精準(zhǔn)度,提升用戶搜索體驗(yàn)度。
圖5是本發(fā)明一實(shí)施例提出的基于語(yǔ)音交互的搜索裝置的結(jié)構(gòu)示意圖。該基于語(yǔ)音交互的搜索裝置500可以通過軟件、硬件或者兩者的結(jié)合來實(shí)現(xiàn)。
參見圖5,該基于語(yǔ)音交互的搜索裝置500可以包括:第一獲取模塊510、第二獲取模塊520、生成模塊530、選擇模塊540,以及搜索模塊550。其中,
第一獲取模塊510,用于根據(jù)用戶提供的用于搜索的語(yǔ)音數(shù)據(jù)獲取第一檢索詞。
可選地,第一獲取模塊510具體用于:接收用戶提供的用于搜索的語(yǔ)音數(shù)據(jù),獲取與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的第一文本,并將對(duì)應(yīng)的第一文本作為第一檢索詞。
第二獲取模塊520,用于獲取為第一檢索詞的上文信息的多個(gè)第二檢索詞。
生成模塊530,用于根據(jù)第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合。
選擇模塊540,用于根據(jù)每種分詞組合的相關(guān)性評(píng)分,從多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞。
可選地,選擇模塊540具體用于:從多種分詞組合中選擇相關(guān)性評(píng)分最高的分詞組合作為目標(biāo)分詞組合,并將目標(biāo)分詞組合作為第三檢索詞。
搜索模塊550,用于根據(jù)第三檢索詞進(jìn)行搜索。
一些實(shí)施例中,參見圖6,該基于語(yǔ)音交互的搜索裝置500還可以包括:
可選地,生成模塊530包括:
判斷子模塊531,用于判斷歷史搜索詞中是否存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合。
第一處理子模塊532,用于在存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合時(shí),將初始分詞組合作為生成的分詞組合。
提取子模塊533,用于在不存在包含第一分詞結(jié)果和第二分詞結(jié)果的初始分詞組合時(shí),提取第一分詞結(jié)果中每個(gè)第一分詞的第一特征信息,并提取第二分詞結(jié)果中每個(gè)第二分詞的第二特征信息。
可選地,第一特征信息/第二特征信息包括以下至少之一:
第一分詞/第二分詞的實(shí)體類型、權(quán)重、用戶歷史搜索頻次、用戶歷史搜索后的點(diǎn)擊頻次、泛口語(yǔ)化的懲罰權(quán)重,以及編輯距離。
確定子模塊534,用于根據(jù)第一特征信息和第二特征信息,確定第一檢索詞的類型信息,其中,類型信息包括:第一檢索詞為第二檢索詞的補(bǔ)充搜索的第一類型信息、第一檢索詞為第二檢索詞的追問搜索的第二類型信息。
第二處理子模塊535,用于根據(jù)第一檢索詞的類型信息將第一分詞和第二分詞進(jìn)行組合處理,得到多種分詞組合。
第一確定模塊560,用于確定多種分詞組合中,每種分詞組合在用戶搜索歷史中的出現(xiàn)頻次,以及與分詞組合對(duì)應(yīng)的第一分詞的第一用戶歷史搜索頻次和對(duì)應(yīng)的第二分詞的第二用戶歷史搜索頻次。
第二確定模塊570,用于根據(jù)出現(xiàn)頻次、第一用戶歷史搜索頻次,以及第二用戶歷史搜索頻次確定相關(guān)性評(píng)分。
需要說明的是,前述圖1-圖4實(shí)施例中對(duì)基于語(yǔ)音交互的搜索方法實(shí)施例的解釋說明也適用于該實(shí)施例的基于語(yǔ)音交互的搜索裝置500,其實(shí)現(xiàn)原理類似,此處不再贅述。
本實(shí)施例中,通過根據(jù)第一檢索詞的第一分詞結(jié)果和每個(gè)第二檢索詞的第二分詞結(jié)果生成多種分詞組合;根據(jù)每種分詞組合的相關(guān)性評(píng)分,從多種分詞組合中選擇目標(biāo)分詞組合并作為第三檢索詞;根據(jù)第三檢索詞進(jìn)行搜索,能夠結(jié)合語(yǔ)音搜索的上下文信息進(jìn)行搜索,提升搜索精準(zhǔn)度,提升用戶搜索體驗(yàn)度。
需要說明的是,在本發(fā)明的描述中,術(shù)語(yǔ)“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性。此外,在本發(fā)明的描述中,除非另有說明,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上。
流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場(chǎng)可編程門陣列(FPGA)等。
本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。
此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。
上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。
在本說明書的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語(yǔ)的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。