一種基于大模型的語音對話檢索方法、設(shè)備及介質(zhì)與流程

文檔序號：41954888發(fā)布日期：2025-05-16 14:20閱讀：2來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本技術(shù)涉及語音檢索的，尤其涉及一種基于大模型的語音對話檢索方法、設(shè)備及介質(zhì)。

背景技術(shù)：

1、在當(dāng)前的信息化社會中，數(shù)據(jù)庫作為存儲和管理大量數(shù)據(jù)的重要工具，其檢索效率與便捷性直接關(guān)系到數(shù)據(jù)利用的效率。傳統(tǒng)的數(shù)據(jù)庫檢索方式大多依賴于文本輸入，用戶需要通過鍵盤等設(shè)備輸入檢索關(guān)鍵詞或語句，這種方式在某些場景下顯得不夠靈活和高效。特別是在移動設(shè)備和智能家居等場景中，用戶更希望通過語音交互的方式來完成數(shù)據(jù)庫的檢索操作。

2、然而，現(xiàn)有的語音對話檢索系統(tǒng)往往存在一些問題。例如，一些系統(tǒng)依賴于大量的訓(xùn)練數(shù)據(jù)來構(gòu)建模型，導(dǎo)致冷啟動成本高，且對于特定領(lǐng)域的數(shù)據(jù)庫檢索任務(wù)，模型的泛化能力可能不足。此外，一些系統(tǒng)在語義理解方面存在局限性，難以準(zhǔn)確理解用戶的復(fù)雜意圖和表述，導(dǎo)致檢索結(jié)果的準(zhǔn)確性和召回率不高。還有一些系統(tǒng)在對話回復(fù)的生成上缺乏靈活性，無法根據(jù)用戶的實際需求和對話狀態(tài)進行動態(tài)調(diào)整。

3、因此，提出一種基于大模型的語音對話檢索方法用以解決上述問題。

技術(shù)實現(xiàn)思路

1、本技術(shù)實施例提供了一種基于大模型的語音對話檢索方法、設(shè)備及介質(zhì)，用以解決如下技術(shù)問題：傳統(tǒng)數(shù)據(jù)庫檢索方式不靈活、現(xiàn)有語音對話檢索系統(tǒng)的冷啟動成本高。

2、第一方面，本技術(shù)實施例提供了一種基于大模型的語音對話檢索方法，其特征在于，方法包括：構(gòu)建待檢索數(shù)據(jù)庫以及與待檢索數(shù)據(jù)庫關(guān)聯(lián)的倒排索引數(shù)據(jù)庫；其中，待檢索數(shù)據(jù)庫為包括多個文字字段值的數(shù)據(jù)庫，倒排索引數(shù)據(jù)庫為將待檢索數(shù)據(jù)庫中多個文字字段值轉(zhuǎn)化為多個拼音字段值的數(shù)據(jù)庫；基于預(yù)設(shè)的話術(shù)模板與用戶交流，以采集用戶的檢索語音；其中，話術(shù)模板可引導(dǎo)用戶如何提問，并根據(jù)字段值與用戶交流；基于預(yù)設(shè)的語音識別大模型處理檢索語音，以將檢索語音轉(zhuǎn)化為拼音檢索信息；其中，拼音檢索信息為包括多個拼音字段值的信息；基于預(yù)設(shè)的模糊匹配算法匹配拼音檢索信息檢索和倒排索引數(shù)據(jù)庫，收集匹配度大于預(yù)設(shè)的匹配度閾值的拼音字段值，以獲取第一數(shù)量個待處理字段值；其中，匹配度的取值范圍為0到1；判斷第一數(shù)量個待處理字段值是否大于預(yù)設(shè)的數(shù)量閾值；若是，則基于話術(shù)模板處理第一數(shù)量個待處理字段值，以生成篩選語音，并基于篩選語音采集用戶的檢索語音；若否，則基于話術(shù)模板處理拼音檢索信息，以生成語音信息，并基于語音信息提醒用戶輸入檢索語音；若否，且第一數(shù)量為0時，則基于話術(shù)模板提醒用戶重新輸入檢索語音；若是，且存在匹配度為1的拼音字段值，則確定拼音字段值為檢索字段值；基于檢索字段值檢索待檢索數(shù)據(jù)庫，以獲取檢索結(jié)果；在檢索結(jié)果唯一時，基于話術(shù)模板處理檢索結(jié)果，并回復(fù)用戶；在檢索結(jié)果不唯一時，對比待處理字段值與檢索結(jié)果，以確定缺失字段值，并基于話術(shù)模板處理缺失字段值，以采集用戶的檢索語音。

3、在本技術(shù)的一種實現(xiàn)方式中，構(gòu)建待檢索數(shù)據(jù)庫以及與待檢索數(shù)據(jù)庫關(guān)聯(lián)的倒排索引數(shù)據(jù)庫，具體包括：構(gòu)建待檢索數(shù)據(jù)庫；對待檢索數(shù)據(jù)庫中的每個文字字段值進行拼音轉(zhuǎn)換，生成對應(yīng)的拼音字段值；將拼音字段值與原始的文字字段值建立關(guān)聯(lián)關(guān)系，形成倒排索引數(shù)據(jù)庫。

4、在本技術(shù)的一種實現(xiàn)方式中，基于預(yù)設(shè)的語音識別大模型處理檢索語音，以將檢索語音轉(zhuǎn)化為拼音檢索信息，具體包括：基于語音識別大模型處理檢索語音，以將檢索語音轉(zhuǎn)化為拼音檢索信息；和/或基于預(yù)設(shè)的語音識別算法處理檢索語音，以將檢索語音轉(zhuǎn)化為檢索文字；在用戶確認(rèn)檢索文字時，基于預(yù)設(shè)的信息抽取算法處理檢索文字信息，以生成待查詢字段值；基于預(yù)設(shè)的自然語言處理算法處理待查詢字段值，以生成拼音檢索信息。

5、在本技術(shù)的一種實現(xiàn)方式中，基于預(yù)設(shè)的模糊匹配算法匹配拼音檢索信息檢索和倒排索引數(shù)據(jù)庫，收集匹配度大于預(yù)設(shè)的匹配度閾值的拼音字段值，以獲取第一數(shù)量個待處理字段值，具體包括：基于模糊匹配算法計算拼音檢索信息與倒排索引數(shù)據(jù)庫中每個拼音字段值的匹配度；將匹配度大于預(yù)設(shè)匹配度閾值的拼音字段值作為待處理字段值。

6、在本技術(shù)的一種實現(xiàn)方式中，若是，則基于話術(shù)模板處理第一數(shù)量個待處理字段值，以生成篩選語音，并基于篩選語音采集用戶的檢索語音，具體包括：確定處理流程；根據(jù)處理流程處理第一數(shù)量個待處理字段值，生成包含第一數(shù)量個待處理字段值的篩選語音提示；通過語音合成技術(shù)將篩選語音提示轉(zhuǎn)化為語音信號，并播放給用戶；采集用戶根據(jù)篩選語音提示給出的檢索語音。

7、在本技術(shù)的一種實現(xiàn)方式中，若否，則基于話術(shù)模板處理拼音檢索信息，以生成語音信息，并基于語音信息提醒用戶重新輸入檢索語音，具體包括：確定處理流程；當(dāng)?shù)谝粩?shù)量小于數(shù)量閾值時，基于話術(shù)模板處理待檢索字段值，生成包括待檢索字段值的確認(rèn)語音提示；通過語音合成技術(shù)將確認(rèn)語音提示轉(zhuǎn)化為語音信號，并播放給用戶；采集用戶重新輸入的檢索語音。

8、在本技術(shù)的一種實現(xiàn)方式中，在檢索結(jié)果不唯一時，對比待處理字段值與檢索結(jié)果，以確定缺失字段值，并基于話術(shù)模板處理缺失字段值，以采集用戶的檢索語音，具體包括：當(dāng)檢索結(jié)果不唯一時，對比待處理字段值與檢索結(jié)果中的字段值，以確定缺失字段值；基于話術(shù)模板生成包含缺失字段值的詢問語音，并播放給用戶；采集用戶根據(jù)詢問語音給出的檢索語音。

9、在本技術(shù)的一種實現(xiàn)方式中，方法還包括：在檢索過程中記錄用戶的檢索歷史，以更新語音識別大模型。

10、第二方面，本技術(shù)實施例還提供了一種基于大模型的語音對話檢索設(shè)備，設(shè)備包括：至少一個處理器；以及，與至少一個處理器通信連接的存儲器；其中，存儲器存儲有可被至少一個處理器執(zhí)行的指令，指令被至少一個處理器執(zhí)行，以使至少一個處理器能夠：構(gòu)建待檢索數(shù)據(jù)庫以及與待檢索數(shù)據(jù)庫關(guān)聯(lián)的倒排索引數(shù)據(jù)庫；其中，待檢索數(shù)據(jù)庫為包括多個文字字段值的數(shù)據(jù)庫，倒排索引數(shù)據(jù)庫為將待檢索數(shù)據(jù)庫中多個文字字段值轉(zhuǎn)化為多個拼音字段值的數(shù)據(jù)庫；基于預(yù)設(shè)的話術(shù)模板與用戶交流，以采集用戶的檢索語音；其中，話術(shù)模板可引導(dǎo)用戶如何提問，并根據(jù)字段值與用戶交流；基于預(yù)設(shè)的語音識別大模型處理檢索語音，以將檢索語音轉(zhuǎn)化為拼音檢索信息；其中，拼音檢索信息為包括多個拼音字段值的信息；基于預(yù)設(shè)的模糊匹配算法匹配拼音檢索信息檢索和倒排索引數(shù)據(jù)庫，收集匹配度大于預(yù)設(shè)的匹配度閾值的拼音字段值，以獲取第一數(shù)量個待處理字段值；其中，匹配度的取值范圍為0到1；判斷第一數(shù)量個待處理字段值是否大于預(yù)設(shè)的數(shù)量閾值；若是，則基于話術(shù)模板處理第一數(shù)量個待處理字段值，以生成篩選語音，并基于篩選語音采集用戶的檢索語音；若是，且存在匹配度為1的拼音字段值，則確定拼音字段值為檢索字段值；若否，則基于話術(shù)模板處理拼音檢索信息，以生成語音信息，并基于語音信息提醒用戶重新輸入檢索語音；基于檢索字段值檢索待檢索數(shù)據(jù)庫，以獲取檢索結(jié)果；在檢索結(jié)果唯一時，基于話術(shù)模板處理檢索結(jié)果，并回復(fù)用戶；在檢索結(jié)果不唯一時，對比待處理字段值與檢索結(jié)果，以確定缺失字段值，并基于話術(shù)模板處理缺失字段值，以采集用戶的檢索語音。

11、第三方面，本技術(shù)實施例還提供了一種基于大模型的語音對話檢索的非易失性計算機存儲介質(zhì)，存儲有計算機可執(zhí)行指令，其特征在于，計算機可執(zhí)行指令設(shè)置為：構(gòu)建待檢索數(shù)據(jù)庫以及與待檢索數(shù)據(jù)庫關(guān)聯(lián)的倒排索引數(shù)據(jù)庫；其中，待檢索數(shù)據(jù)庫為包括多個文字字段值的數(shù)據(jù)庫，倒排索引數(shù)據(jù)庫為將待檢索數(shù)據(jù)庫中多個文字字段值轉(zhuǎn)化為多個拼音字段值的數(shù)據(jù)庫；基于預(yù)設(shè)的話術(shù)模板與用戶交流，以采集用戶的檢索語音；其中，話術(shù)模板可引導(dǎo)用戶如何提問，并根據(jù)字段值與用戶交流；基于預(yù)設(shè)的語音識別大模型處理檢索語音，以將檢索語音轉(zhuǎn)化為拼音檢索信息；其中，拼音檢索信息為包括多個拼音字段值的信息；基于預(yù)設(shè)的模糊匹配算法匹配拼音檢索信息檢索和倒排索引數(shù)據(jù)庫，收集匹配度大于預(yù)設(shè)的匹配度閾值的拼音字段值，以獲取第一數(shù)量個待處理字段值；其中，匹配度的取值范圍為0到1；判斷第一數(shù)量個待處理字段值是否大于預(yù)設(shè)的數(shù)量閾值；若是，則基于話術(shù)模板處理第一數(shù)量個待處理字段值，以生成篩選語音，并基于篩選語音采集用戶的檢索語音；若是，且存在匹配度為1的拼音字段值，則確定拼音字段值為檢索字段值；若否，則基于話術(shù)模板處理拼音檢索信息，以生成語音信息，并基于語音信息提醒用戶重新輸入檢索語音；基于檢索字段值檢索待檢索數(shù)據(jù)庫，以獲取檢索結(jié)果；在檢索結(jié)果唯一時，基于話術(shù)模板處理檢索結(jié)果，并回復(fù)用戶；在檢索結(jié)果不唯一時，對比待處理字段值與檢索結(jié)果，以確定缺失字段值，并基于話術(shù)模板處理缺失字段值，以采集用戶的檢索語音。

12、本技術(shù)實施例提供的一種基于大模型的語音對話檢索方法、設(shè)備及介質(zhì)，至少包括以下技術(shù)效果：

13、通過構(gòu)建待檢索數(shù)據(jù)庫及其對應(yīng)的倒排索引數(shù)據(jù)庫，實現(xiàn)了文字字段值與拼音字段值的快速轉(zhuǎn)換，極大地提高了檢索效率。采用預(yù)設(shè)的話術(shù)模板與用戶進行交互，引導(dǎo)用戶提出檢索問題，并基于語音識別大模型將用戶的檢索語音轉(zhuǎn)化為拼音檢索信息。利用模糊匹配算法在倒排索引數(shù)據(jù)庫中進行匹配，能夠收集到與檢索語音高度相關(guān)的字段值。還根據(jù)匹配結(jié)果的數(shù)量和質(zhì)量，智能地引導(dǎo)用戶進一步篩選或補充檢索信息，確保檢索結(jié)果的準(zhǔn)確性。在檢索結(jié)果唯一時，直接回復(fù)用戶；在結(jié)果不唯一時，通過對比確定缺失字段值，并引導(dǎo)用戶補充，從而精準(zhǔn)滿足用戶的檢索需求，提升了用戶體驗，從而在一定程度上實現(xiàn)了檢索方式靈活、冷啟動成本低的效果。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張琨,閔萬里,田鈿,朱錦雷,張鑫
技術(shù)所有人：神思電子技術(shù)股份有限公司
我是此專利的發(fā)明人

上一篇：基于圖像識別的外賣包裝碳足跡核算方法
上一篇：一種基于配置驅(qū)動的快速合作方對接方法與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種基于大模型的語音對話檢索方法、設(shè)備及介質(zhì)與流程

一種基于大模型的語音對話檢索方法、設(shè)備及介質(zhì)與流程