一種直播語音播放方法、裝置、設(shè)備及存儲介質(zhì)與流程

文檔序號：41951211發(fā)布日期：2025-05-16 14:11閱讀：3來源：國知局

本發(fā)明涉及音頻處理，尤其涉及一種直播語音播放方法、裝置、設(shè)備及存儲介質(zhì)。

背景技術(shù)：

1、隨著直播行業(yè)的火熱發(fā)展和ai技術(shù)的不斷成熟，使用數(shù)字人代替真人主播的新型直播也應(yīng)運而生。在傳統(tǒng)直播時，音頻可以通過錄音設(shè)備采集真人主播得到。但在數(shù)字人直播時，音頻是通過tts技術(shù)生成的mp3。由于直播平臺需要的音頻必須是持續(xù)的語音流，如果直接將離散的mp3進行推流，會導致直播聲音斷斷續(xù)續(xù)，使得用戶在聽覺方面體驗感較差。

技術(shù)實現(xiàn)思路

1、本發(fā)明提供了一種直播語音播放方法、裝置、設(shè)備及存儲介質(zhì)，實現(xiàn)了音頻內(nèi)容的實時打斷與插播，滿足了直播場景下靈活調(diào)整內(nèi)容的需求，解決了數(shù)字人直播中音頻不連續(xù)的問題，使得直播聲音更加流暢自然。

2、根據(jù)本發(fā)明的一方面，提供了一種直播語音播放方法，該方法包括：

3、獲取在直播過程中數(shù)字直播對象對應(yīng)的待播放音頻數(shù)據(jù)；

4、將所述待播放音頻數(shù)據(jù)進行拆分處理，獲得多個音頻碎片數(shù)據(jù)和所述音頻碎片數(shù)據(jù)對應(yīng)的碎片索引文件；

5、基于所述碎片索引文件，將多個所述音頻碎片數(shù)據(jù)推送至直播音頻通道中，并基于多個所述音頻碎片數(shù)據(jù)的排列順序，實現(xiàn)所述數(shù)字直播對象的直播語音播放。

6、根據(jù)本發(fā)明的另一方面，提供了一種直播語音播放裝置，該裝置包括：

7、音頻數(shù)據(jù)獲取模塊，用于獲取在直播過程中數(shù)字直播對象對應(yīng)的待播放音頻數(shù)據(jù)；

8、碎片數(shù)據(jù)獲得模塊，用于將所述待播放音頻數(shù)據(jù)進行拆分處理，獲得多個音頻碎片數(shù)據(jù)和所述音頻碎片數(shù)據(jù)對應(yīng)的碎片索引文件；

9、直播語音播放模塊，用于基于所述碎片索引文件，將多個所述音頻碎片數(shù)據(jù)推送至直播音頻通道中，并基于多個所述音頻碎片數(shù)據(jù)的排列順序，實現(xiàn)所述數(shù)字直播對象的直播語音播放。

10、根據(jù)本發(fā)明的另一方面，提供了一種電子設(shè)備，所述電子設(shè)備包括：

11、至少一個處理器；以及

12、與所述至少一個處理器通信連接的存儲器；其中，

13、所述存儲器存儲有可被所述至少一個處理器執(zhí)行的計算機程序，所述計算機程序被所述至少一個處理器執(zhí)行，以使所述至少一個處理器能夠執(zhí)行本發(fā)明任一實施例所述的直播語音播放方法。

14、根據(jù)本發(fā)明的另一方面，提供了一種計算機可讀存儲介質(zhì)，所述計算機可讀存儲介質(zhì)存儲有計算機指令，所述計算機指令用于使處理器執(zhí)行時實現(xiàn)本發(fā)明任一實施例所述的直播語音播放方法。

15、本發(fā)明實施例的技術(shù)方案，通過獲取在直播過程中數(shù)字直播對象對應(yīng)的待播放音頻數(shù)據(jù)。將所述待播放音頻數(shù)據(jù)進行拆分處理，獲得多個音頻碎片數(shù)據(jù)和所述音頻碎片數(shù)據(jù)對應(yīng)的碎片索引文件?；谒鏊槠饕募?，將多個所述音頻碎片數(shù)據(jù)推送至直播音頻通道中，并基于多個所述音頻碎片數(shù)據(jù)的排列順序，實現(xiàn)所述數(shù)字直播對象的直播語音播放，解決了數(shù)字人直播中音頻不連續(xù)的問題，滿足了直播場景下靈活調(diào)整音頻內(nèi)容的需求，使得數(shù)字人直播的直播聲音更加流暢自然。

16、應(yīng)當理解，本部分所描述的內(nèi)容并非旨在標識本發(fā)明的實施例的關(guān)鍵或重要特征，也不用于限制本發(fā)明的范圍。本發(fā)明的其它特征將通過以下的說明書而變得容易理解。

技術(shù)特征：

1.一種直播語音播放方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法，還包括：

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述方法，還包括：

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法，還包括：

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，在將所述插播碎片數(shù)據(jù)插入至所述直播音頻通道中之前，還包括：

6.根據(jù)權(quán)利要求1所述的方法，其特征在于，在所述將多個所述音頻碎片數(shù)據(jù)推送至直播音頻通道中之后，還包括：

7.根據(jù)權(quán)利要求1-6任一項所述的方法，其特征在于，所述音頻碎片數(shù)據(jù)為ts碎片，所述碎片索引文件為m3u8索引文件。

8.一種直播語音播放裝置，其特征在于，包括：

9.一種電子設(shè)備，其特征在于，所述電子設(shè)備包括：

10.一種計算機可讀存儲介質(zhì)，其特征在于，所述計算機可讀存儲介質(zhì)存儲有計算機指令，所述計算機指令用于使處理器執(zhí)行時實現(xiàn)權(quán)利要求1-7中任一項所述的直播語音播放方法。

技術(shù)總結(jié)
本發(fā)明公開了一種直播語音播放方法、裝置、設(shè)備及存儲介質(zhì)。該方法包括：獲取在直播過程中數(shù)字直播對象對應(yīng)的待播放音頻數(shù)據(jù)；將所述待播放音頻數(shù)據(jù)進行拆分處理，獲得多個音頻碎片數(shù)據(jù)和所述音頻碎片數(shù)據(jù)對應(yīng)的碎片索引文件；基于所述碎片索引文件，將多個所述音頻碎片數(shù)據(jù)推送至直播音頻通道中，并基于多個所述音頻碎片數(shù)據(jù)的排列順序，實現(xiàn)所述數(shù)字直播對象的直播語音播放，實現(xiàn)了音頻內(nèi)容的實時打斷與插播，滿足了直播場景下靈活調(diào)整內(nèi)容的需求，解決了數(shù)字人直播中音頻不連續(xù)的問題，使得直播聲音更加流暢自然。

技術(shù)研發(fā)人員：韓威兵,唐守旭,劉庶,張磊,張亮,李銘魁
受保護的技術(shù)使用者：上海序祿信息科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/15

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：韓威兵,唐守旭,劉庶,張磊,張亮,李銘魁
技術(shù)所有人：上海序祿信息科技有限公司
我是此專利的發(fā)明人

上一篇：具有增加的抗破碎性的玻璃陶瓷制品及其制造方法與流程
上一篇：一種多點陣列式智能化剛度自適應(yīng)隔振器

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種直播語音播放方法、裝置、設(shè)備及存儲介質(zhì)與流程

一種直播語音播放方法、裝置、設(shè)備及存儲介質(zhì)與流程