一種虛擬數(shù)字人語音播報系統(tǒng)及方法與流程

文檔序號：41561678發(fā)布日期：2025-04-08 18:15閱讀：11來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及數(shù)字人，具體涉及一種虛擬數(shù)字人語音播報系統(tǒng)及方法。
背景技術(shù)：
：：1、隨著電信運(yùn)營商的運(yùn)營管理系統(tǒng)逐漸完善，基本管理單元已細(xì)化至網(wǎng)格化單元管理。具體的，電信運(yùn)營商可以按照地區(qū)對運(yùn)營區(qū)域劃分為多個網(wǎng)格區(qū)域，并對每個網(wǎng)格內(nèi)的人口、服務(wù)用戶和業(yè)務(wù)屬性等信息進(jìn)行統(tǒng)計和管理。2、運(yùn)營管理系統(tǒng)通過跟蹤網(wǎng)格調(diào)度執(zhí)行情況和各項(xiàng)業(yè)務(wù)指標(biāo)的變化趨勢，從網(wǎng)格收入、重點(diǎn)指標(biāo)、規(guī)模等維度可以進(jìn)行網(wǎng)格診斷。并且，運(yùn)營管理系統(tǒng)還可以基于網(wǎng)格區(qū)域快速地根據(jù)用戶的需求進(jìn)行信息查詢。3、但是，現(xiàn)有的電信運(yùn)營商的運(yùn)營管理系統(tǒng)通常以文字方式呈現(xiàn)查詢結(jié)果，用戶僅能通過視覺瀏覽查詢結(jié)果。運(yùn)營管理系統(tǒng)對于查詢結(jié)果的顯示方式單一，從而導(dǎo)致用戶的使用體驗(yàn)降低。技術(shù)實(shí)現(xiàn)思路1、本發(fā)明所要解決的技術(shù)問題是用戶對于運(yùn)營商的運(yùn)營管理系統(tǒng)的體驗(yàn)低的問題。2、為解決上述技術(shù)問題，本發(fā)明提供了一種虛擬數(shù)字人語音播報系統(tǒng)及方法，具體采用如下技術(shù)方案：3、第一方面，本發(fā)明提供一種虛擬數(shù)字人語音播報系統(tǒng)，包括：虛擬數(shù)字人生成模塊、播報文本獲取模塊、播報文本配置模塊、播報文本轉(zhuǎn)語音模塊和播報模塊。其中，虛擬數(shù)字人生成模塊用于根據(jù)目標(biāo)人物圖像生成虛擬數(shù)字人視頻。播報文本獲取模塊用于根據(jù)查詢結(jié)果提取指標(biāo)名稱和指標(biāo)名稱對應(yīng)的數(shù)據(jù)值，查詢結(jié)果根據(jù)查詢請求確定得到。播報文本配置模塊用于根據(jù)查詢結(jié)果從固定話術(shù)數(shù)據(jù)庫中查詢確定話術(shù)模板，將話術(shù)模板和指標(biāo)名稱對應(yīng)的數(shù)據(jù)值結(jié)合，生成播報文本。播報文本轉(zhuǎn)語音模塊用于調(diào)用人工智能(artificial?intelligence，ai)語音合成服務(wù)將播報文本轉(zhuǎn)換為播報語音。播報模塊用于播放虛擬數(shù)字人視頻和播報語音。4、該系統(tǒng)通過虛擬數(shù)字人生成模塊采用虛擬技術(shù)可以生成虛擬數(shù)字人形象，通過播報文本轉(zhuǎn)語音模塊和播報模塊采用文本轉(zhuǎn)語音技術(shù)實(shí)現(xiàn)可以實(shí)現(xiàn)文本播報，通過java技術(shù)可以實(shí)現(xiàn)播報內(nèi)容的配置、語音內(nèi)容的獲取、文本轉(zhuǎn)語音能力調(diào)用，以及通過前端交互技術(shù)實(shí)現(xiàn)虛擬數(shù)字人交互及語音播報，這樣，可以實(shí)現(xiàn)通過虛擬數(shù)字人對查詢結(jié)果進(jìn)行語音播報，從而提高了用戶的使用體驗(yàn)。5、結(jié)合第一方面，在一種可選擇的實(shí)現(xiàn)方式中，上述根據(jù)目標(biāo)人物圖像生成虛擬數(shù)字人視頻中，虛擬數(shù)字人生成模塊具體用于：首先，根據(jù)目標(biāo)人物圖像生成預(yù)設(shè)類型形象圖像。然后，將預(yù)設(shè)類型形象圖像添加口型動作信息，生成添加口型的預(yù)設(shè)類型形象圖像。接下來，將添加口型的預(yù)設(shè)類型形象圖像進(jìn)行形象摳圖，生成虛擬人物無損壓縮的位圖圖形格式(portable?network?graphics，png)序列。最后，將虛擬人物png序列進(jìn)行動態(tài)化處理和圖像壓縮，生成虛擬數(shù)字人視頻。6、結(jié)合第一方面，在一種可選擇的實(shí)現(xiàn)方式中，上述播報文本配置模塊基于springcloud微服務(wù)框架,通過結(jié)構(gòu)化查詢語言(structured?query?language，sql)動態(tài)查詢話術(shù)模板。7、結(jié)合第一方面，在一種可選擇的實(shí)現(xiàn)方式中，該系統(tǒng)還包括：虛擬數(shù)字人控制模塊。具體的，虛擬數(shù)字人控制模塊用于控制播報模塊開啟播放虛擬數(shù)字人視頻和播報語音，還用于控制播報模塊隱藏虛擬數(shù)字人視頻和停止播放播報語音。8、結(jié)合第一方面，在一種可選擇的實(shí)現(xiàn)方式中，該系統(tǒng)還包括：語音內(nèi)容交互模塊。具體的，語音內(nèi)容交互模塊用于在播放虛擬數(shù)字人視頻和播報語音的情況下，突出顯示播報文本。9、結(jié)合第一方面，在一種可選擇的實(shí)現(xiàn)方式中，上述在突出顯示播報文本中，語音內(nèi)容交互模塊具體用于：通過js元素定位和高亮渲染處理，將播報文本進(jìn)行高亮顯示。10、第二方面，本發(fā)明提供一種虛擬數(shù)字人語音播報方法，該方法包括：首先，根據(jù)目標(biāo)人物圖像生成虛擬數(shù)字人視頻。然后，根據(jù)查詢結(jié)果提取指標(biāo)名稱和指標(biāo)名稱對應(yīng)的數(shù)據(jù)值，查詢結(jié)果根據(jù)查詢請求確定得到。其次，根據(jù)查詢結(jié)果從固定話術(shù)數(shù)據(jù)庫中查詢確定話術(shù)模板，將話術(shù)模板和指標(biāo)名稱對應(yīng)的數(shù)據(jù)值結(jié)合，生成播報文本。接下來，調(diào)用ai語音合成服務(wù)將播報文本轉(zhuǎn)換為播報語音。最后，播放虛擬數(shù)字人視頻和播報語音。11、結(jié)合第二方面，在一種可選擇的實(shí)現(xiàn)方式中，該方法還包括：在播放虛擬數(shù)字人視頻和播報語音的情況下，突出顯示播報文本。12、第三方面，提供一種電子設(shè)備，包括：存儲器、一個或多個處理器；存儲器與處理器耦合；其中，存儲器中存儲有計算機(jī)程序代碼，計算機(jī)程序代碼包括計算機(jī)指令，當(dāng)計算機(jī)指令被處理器執(zhí)行時，使得電子設(shè)備執(zhí)行如上述第二方面及其任一種可選擇的方法。13、第四方面，提供一種計算機(jī)可讀存儲介質(zhì)，包括計算機(jī)指令，當(dāng)計算機(jī)指令在電子設(shè)備上運(yùn)行時，使得電子設(shè)備執(zhí)行如上述第二方面及其任一種可選擇的方法。14、可以理解地，上述第二方面提供的虛擬數(shù)字人語音播報方法、第三方面的電子設(shè)備，第四方面的計算機(jī)可讀存儲介質(zhì)所能達(dá)到的有益效果，可參考第一方面及其任一種可能的設(shè)計方式中的有益效果，此處不再贅述。技術(shù)特征：1.一種虛擬數(shù)字人語音播報系統(tǒng)，其特征在于，包括：虛擬數(shù)字人生成模塊、播報文本獲取模塊、播報文本配置模塊、播報文本轉(zhuǎn)語音模塊和播報模塊；2.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，所述根據(jù)目標(biāo)人物圖像生成虛擬數(shù)字人視頻中，所述虛擬數(shù)字人生成模塊具體用于：3.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，所述播報文本配置模塊基于springcloud微服務(wù)框架,通過sql動態(tài)查詢所述話術(shù)模板。4.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，所述系統(tǒng)還包括：虛擬數(shù)字人控制模塊；5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的系統(tǒng)，其特征在于，所述系統(tǒng)還包括：語音內(nèi)容交互模塊；6.根據(jù)權(quán)利要求5所述的系統(tǒng)，其特征在于，在所述突出顯示所述播報文本中，所述語音內(nèi)容交互模塊具體用于：7.一種虛擬數(shù)字人語音播報方法，其特征在于，包括：8.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述方法還包括：9.一種電子設(shè)備，其特征在于，包括：存儲器、一個或多個處理器；所述存儲器與所述處理器耦合；其中，所述存儲器中存儲有計算機(jī)程序代碼，所述計算機(jī)程序代碼包括計算機(jī)指令，當(dāng)所述計算機(jī)指令被所述處理器執(zhí)行時，使得所述電子設(shè)備執(zhí)行如權(quán)利要求7或8所述的方法。10.一種計算機(jī)可讀存儲介質(zhì)，其特征在于，包括計算機(jī)指令，當(dāng)所述計算機(jī)指令在電子設(shè)備上運(yùn)行時，使得所述電子設(shè)備執(zhí)行如權(quán)利要求7或8所述的方法。技術(shù)總結(jié)本發(fā)明提供一種虛擬數(shù)字人語音播報系統(tǒng)及方法，包括：虛擬數(shù)字人生成模塊、播報文本獲取模塊、播報文本配置模塊、播報文本轉(zhuǎn)語音模塊和播報模塊。其中，虛擬數(shù)字人生成模塊用于根據(jù)目標(biāo)人物圖像生成虛擬數(shù)字人視頻。播報文本獲取模塊用于根據(jù)查詢結(jié)果提取指標(biāo)名稱和指標(biāo)名稱對應(yīng)的數(shù)據(jù)值。播報文本配置模塊用于根據(jù)查詢結(jié)果從固定話術(shù)數(shù)據(jù)庫中查詢確定話術(shù)模板，將話術(shù)模板和指標(biāo)名稱對應(yīng)的數(shù)據(jù)值結(jié)合，生成播報文本。播報文本轉(zhuǎn)語音模塊用于調(diào)用AI語音合成服務(wù)將播報文本轉(zhuǎn)換為播報語音。播報模塊用于播放虛擬數(shù)字人視頻和播報語音。這樣，可以實(shí)現(xiàn)通過虛擬數(shù)字人對查詢結(jié)果進(jìn)行語音播報，從而提高了用戶的使用體驗(yàn)。技術(shù)研發(fā)人員：金玉婷受保護(hù)的技術(shù)使用者：北京思特奇信息技術(shù)股份有限公司技術(shù)研發(fā)日：技術(shù)公布日：2025/4/7

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：金玉婷
技術(shù)所有人：北京思特奇信息技術(shù)股份有限公司
我是此專利的發(fā)明人

上一篇：一種蒸汽消融槍的蒸汽發(fā)生裝置的制作方法
上一篇：一種帶有指示功能的微機(jī)綜合保護(hù)屏柜體的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種虛擬數(shù)字人語音播報系統(tǒng)及方法與流程