本發(fā)明涉及數(shù)字人,具體涉及一種虛擬數(shù)字人語音播報系統(tǒng)及方法。
背景技術(shù):
::1、隨著電信運(yùn)營商的運(yùn)營管理系統(tǒng)逐漸完善,基本管理單元已細(xì)化至網(wǎng)格化單元管理。具體的,電信運(yùn)營商可以按照地區(qū)對運(yùn)營區(qū)域劃分為多個網(wǎng)格區(qū)域,并對每個網(wǎng)格內(nèi)的人口、服務(wù)用戶和業(yè)務(wù)屬性等信息進(jìn)行統(tǒng)計和管理。2、運(yùn)營管理系統(tǒng)通過跟蹤網(wǎng)格調(diào)度執(zhí)行情況和各項(xiàng)業(yè)務(wù)指標(biāo)的變化趨勢,從網(wǎng)格收入、重點(diǎn)指標(biāo)、規(guī)模等維度可以進(jìn)行網(wǎng)格診斷。并且,運(yùn)營管理系統(tǒng)還可以基于網(wǎng)格區(qū)域快速地根據(jù)用戶的需求進(jìn)行信息查詢。3、但是,現(xiàn)有的電信運(yùn)營商的運(yùn)營管理系統(tǒng)通常以文字方式呈現(xiàn)查詢結(jié)果,用戶僅能通過視覺瀏覽查詢結(jié)果。運(yùn)營管理系統(tǒng)對于查詢結(jié)果的顯示方式單一,從而導(dǎo)致用戶的使用體驗(yàn)降低。技術(shù)實(shí)現(xiàn)思路1、本發(fā)明所要解決的技術(shù)問題是用戶對于運(yùn)營商的運(yùn)營管理系統(tǒng)的體驗(yàn)低的問題。2、為解決上述技術(shù)問題,本發(fā)明提供了一種虛擬數(shù)字人語音播報系統(tǒng)及方法,具體采用如下技術(shù)方案:3、第一方面,本發(fā)明提供一種虛擬數(shù)字人語音播報系統(tǒng),包括:虛擬數(shù)字人生成模塊、播報文本獲取模塊、播報文本配置模塊、播報文本轉(zhuǎn)語音模塊和播報模塊。其中,虛擬數(shù)字人生成模塊用于根據(jù)目標(biāo)人物圖像生成虛擬數(shù)字人視頻。播報文本獲取模塊用于根據(jù)查詢結(jié)果提取指標(biāo)名稱和指標(biāo)名稱對應(yīng)的數(shù)據(jù)值,查詢結(jié)果根據(jù)查詢請求確定得到。播報文本配置模塊用于根據(jù)查詢結(jié)果從固定話術(shù)數(shù)據(jù)庫中查詢確定話術(shù)模板,將話術(shù)模板和指標(biāo)名稱對應(yīng)的數(shù)據(jù)值結(jié)合,生成播報文本。播報文本轉(zhuǎn)語音模塊用于調(diào)用人工智能(artificial?intelligence,ai)語音合成服務(wù)將播報文本轉(zhuǎn)換為播報語音。播報模塊用于播放虛擬數(shù)字人視頻和播報語音。4、該系統(tǒng)通過虛擬數(shù)字人生成模塊采用虛擬技術(shù)可以生成虛擬數(shù)字人形象,通過播報文本轉(zhuǎn)語音模塊和播報模塊采用文本轉(zhuǎn)語音技術(shù)實(shí)現(xiàn)可以實(shí)現(xiàn)文本播報,通過java技術(shù)可以實(shí)現(xiàn)播報內(nèi)容的配置、語音內(nèi)容的獲取、文本轉(zhuǎn)語音能力調(diào)用,以及通過前端交互技術(shù)實(shí)現(xiàn)虛擬數(shù)字人交互及語音播報,這樣,可以實(shí)現(xiàn)通過虛擬數(shù)字人對查詢結(jié)果進(jìn)行語音播報,從而提高了用戶的使用體驗(yàn)。5、結(jié)合第一方面,在一種可選擇的實(shí)現(xiàn)方式中,上述根據(jù)目標(biāo)人物圖像生成虛擬數(shù)字人視頻中,虛擬數(shù)字人生成模塊具體用于:首先,根據(jù)目標(biāo)人物圖像生成預(yù)設(shè)類型形象圖像。然后,將預(yù)設(shè)類型形象圖像添加口型動作信息,生成添加口型的預(yù)設(shè)類型形象圖像。接下來,將添加口型的預(yù)設(shè)類型形象圖像進(jìn)行形象摳圖,生成虛擬人物無損壓縮的位圖圖形格式(portable?network?graphics,png)序列。最后,將虛擬人物png序列進(jìn)行動態(tài)化處理和圖像壓縮,生成虛擬數(shù)字人視頻。6、結(jié)合第一方面,在一種可選擇的實(shí)現(xiàn)方式中,上述播報文本配置模塊基于springcloud微服務(wù)框架,通過結(jié)構(gòu)化查詢語言(structured?query?language,sql)動態(tài)查詢話術(shù)模板。7、結(jié)合第一方面,在一種可選擇的實(shí)現(xiàn)方式中,該系統(tǒng)還包括:虛擬數(shù)字人控制模塊。具體的,虛擬數(shù)字人控制模塊用于控制播報模塊開啟播放虛擬數(shù)字人視頻和播報語音,還用于控制播報模塊隱藏虛擬數(shù)字人視頻和停止播放播報語音。8、結(jié)合第一方面,在一種可選擇的實(shí)現(xiàn)方式中,該系統(tǒng)還包括:語音內(nèi)容交互模塊。具體的,語音內(nèi)容交互模塊用于在播放虛擬數(shù)字人視頻和播報語音的情況下,突出顯示播報文本。9、結(jié)合第一方面,在一種可選擇的實(shí)現(xiàn)方式中,上述在突出顯示播報文本中,語音內(nèi)容交互模塊具體用于:通過js元素定位和高亮渲染處理,將播報文本進(jìn)行高亮顯示。10、第二方面,本發(fā)明提供一種虛擬數(shù)字人語音播報方法,該方法包括:首先,根據(jù)目標(biāo)人物圖像生成虛擬數(shù)字人視頻。然后,根據(jù)查詢結(jié)果提取指標(biāo)名稱和指標(biāo)名稱對應(yīng)的數(shù)據(jù)值,查詢結(jié)果根據(jù)查詢請求確定得到。其次,根據(jù)查詢結(jié)果從固定話術(shù)數(shù)據(jù)庫中查詢確定話術(shù)模板,將話術(shù)模板和指標(biāo)名稱對應(yīng)的數(shù)據(jù)值結(jié)合,生成播報文本。接下來,調(diào)用ai語音合成服務(wù)將播報文本轉(zhuǎn)換為播報語音。最后,播放虛擬數(shù)字人視頻和播報語音。11、結(jié)合第二方面,在一種可選擇的實(shí)現(xiàn)方式中,該方法還包括:在播放虛擬數(shù)字人視頻和播報語音的情況下,突出顯示播報文本。12、第三方面,提供一種電子設(shè)備,包括:存儲器、一個或多個處理器;存儲器與處理器耦合;其中,存儲器中存儲有計算機(jī)程序代碼,計算機(jī)程序代碼包括計算機(jī)指令,當(dāng)計算機(jī)指令被處理器執(zhí)行時,使得電子設(shè)備執(zhí)行如上述第二方面及其任一種可選擇的方法。13、第四方面,提供一種計算機(jī)可讀存儲介質(zhì),包括計算機(jī)指令,當(dāng)計算機(jī)指令在電子設(shè)備上運(yùn)行時,使得電子設(shè)備執(zhí)行如上述第二方面及其任一種可選擇的方法。14、可以理解地,上述第二方面提供的虛擬數(shù)字人語音播報方法、第三方面的電子設(shè)備,第四方面的計算機(jī)可讀存儲介質(zhì)所能達(dá)到的有益效果,可參考第一方面及其任一種可能的設(shè)計方式中的有益效果,此處不再贅述。技術(shù)特征:1.一種虛擬數(shù)字人語音播報系統(tǒng),其特征在于,包括:虛擬數(shù)字人生成模塊、播報文本獲取模塊、播報文本配置模塊、播報文本轉(zhuǎn)語音模塊和播報模塊;2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述根據(jù)目標(biāo)人物圖像生成虛擬數(shù)字人視頻中,所述虛擬數(shù)字人生成模塊具體用于:3.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述播報文本配置模塊基于springcloud微服務(wù)框架,通過sql動態(tài)查詢所述話術(shù)模板。4.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括:虛擬數(shù)字人控制模塊;5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括:語音內(nèi)容交互模塊;6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,在所述突出顯示所述播報文本中,所述語音內(nèi)容交互模塊具體用于:7.一種虛擬數(shù)字人語音播報方法,其特征在于,包括:8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述方法還包括:9.一種電子設(shè)備,其特征在于,包括:存儲器、一個或多個處理器;所述存儲器與所述處理器耦合;其中,所述存儲器中存儲有計算機(jī)程序代碼,所述計算機(jī)程序代碼包括計算機(jī)指令,當(dāng)所述計算機(jī)指令被所述處理器執(zhí)行時,使得所述電子設(shè)備執(zhí)行如權(quán)利要求7或8所述的方法。10.一種計算機(jī)可讀存儲介質(zhì),其特征在于,包括計算機(jī)指令,當(dāng)所述計算機(jī)指令在電子設(shè)備上運(yùn)行時,使得所述電子設(shè)備執(zhí)行如權(quán)利要求7或8所述的方法。技術(shù)總結(jié)本發(fā)明提供一種虛擬數(shù)字人語音播報系統(tǒng)及方法,包括:虛擬數(shù)字人生成模塊、播報文本獲取模塊、播報文本配置模塊、播報文本轉(zhuǎn)語音模塊和播報模塊。其中,虛擬數(shù)字人生成模塊用于根據(jù)目標(biāo)人物圖像生成虛擬數(shù)字人視頻。播報文本獲取模塊用于根據(jù)查詢結(jié)果提取指標(biāo)名稱和指標(biāo)名稱對應(yīng)的數(shù)據(jù)值。播報文本配置模塊用于根據(jù)查詢結(jié)果從固定話術(shù)數(shù)據(jù)庫中查詢確定話術(shù)模板,將話術(shù)模板和指標(biāo)名稱對應(yīng)的數(shù)據(jù)值結(jié)合,生成播報文本。播報文本轉(zhuǎn)語音模塊用于調(diào)用AI語音合成服務(wù)將播報文本轉(zhuǎn)換為播報語音。播報模塊用于播放虛擬數(shù)字人視頻和播報語音。這樣,可以實(shí)現(xiàn)通過虛擬數(shù)字人對查詢結(jié)果進(jìn)行語音播報,從而提高了用戶的使用體驗(yàn)。技術(shù)研發(fā)人員:金玉婷受保護(hù)的技術(shù)使用者:北京思特奇信息技術(shù)股份有限公司技術(shù)研發(fā)日:技術(shù)公布日:2025/4/7