最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種直播語音播放方法、裝置、設(shè)備及存儲介質(zhì)與流程

文檔序號:41951211發(fā)布日期:2025-05-16 14:11閱讀:3來源:國知局
一種直播語音播放方法、裝置、設(shè)備及存儲介質(zhì)與流程

本發(fā)明涉及音頻處理,尤其涉及一種直播語音播放方法、裝置、設(shè)備及存儲介質(zhì)。


背景技術(shù):

1、隨著直播行業(yè)的火熱發(fā)展和ai技術(shù)的不斷成熟,使用數(shù)字人代替真人主播的新型直播也應(yīng)運而生。在傳統(tǒng)直播時,音頻可以通過錄音設(shè)備采集真人主播得到。但在數(shù)字人直播時,音頻是通過tts技術(shù)生成的mp3。由于直播平臺需要的音頻必須是持續(xù)的語音流,如果直接將離散的mp3進行推流,會導致直播聲音斷斷續(xù)續(xù),使得用戶在聽覺方面體驗感較差。


技術(shù)實現(xiàn)思路

1、本發(fā)明提供了一種直播語音播放方法、裝置、設(shè)備及存儲介質(zhì),實現(xiàn)了音頻內(nèi)容的實時打斷與插播,滿足了直播場景下靈活調(diào)整內(nèi)容的需求,解決了數(shù)字人直播中音頻不連續(xù)的問題,使得直播聲音更加流暢自然。

2、根據(jù)本發(fā)明的一方面,提供了一種直播語音播放方法,該方法包括:

3、獲取在直播過程中數(shù)字直播對象對應(yīng)的待播放音頻數(shù)據(jù);

4、將所述待播放音頻數(shù)據(jù)進行拆分處理,獲得多個音頻碎片數(shù)據(jù)和所述音頻碎片數(shù)據(jù)對應(yīng)的碎片索引文件;

5、基于所述碎片索引文件,將多個所述音頻碎片數(shù)據(jù)推送至直播音頻通道中,并基于多個所述音頻碎片數(shù)據(jù)的排列順序,實現(xiàn)所述數(shù)字直播對象的直播語音播放。

6、根據(jù)本發(fā)明的另一方面,提供了一種直播語音播放裝置,該裝置包括:

7、音頻數(shù)據(jù)獲取模塊,用于獲取在直播過程中數(shù)字直播對象對應(yīng)的待播放音頻數(shù)據(jù);

8、碎片數(shù)據(jù)獲得模塊,用于將所述待播放音頻數(shù)據(jù)進行拆分處理,獲得多個音頻碎片數(shù)據(jù)和所述音頻碎片數(shù)據(jù)對應(yīng)的碎片索引文件;

9、直播語音播放模塊,用于基于所述碎片索引文件,將多個所述音頻碎片數(shù)據(jù)推送至直播音頻通道中,并基于多個所述音頻碎片數(shù)據(jù)的排列順序,實現(xiàn)所述數(shù)字直播對象的直播語音播放。

10、根據(jù)本發(fā)明的另一方面,提供了一種電子設(shè)備,所述電子設(shè)備包括:

11、至少一個處理器;以及

12、與所述至少一個處理器通信連接的存儲器;其中,

13、所述存儲器存儲有可被所述至少一個處理器執(zhí)行的計算機程序,所述計算機程序被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行本發(fā)明任一實施例所述的直播語音播放方法。

14、根據(jù)本發(fā)明的另一方面,提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機指令,所述計算機指令用于使處理器執(zhí)行時實現(xiàn)本發(fā)明任一實施例所述的直播語音播放方法。

15、本發(fā)明實施例的技術(shù)方案,通過獲取在直播過程中數(shù)字直播對象對應(yīng)的待播放音頻數(shù)據(jù)。將所述待播放音頻數(shù)據(jù)進行拆分處理,獲得多個音頻碎片數(shù)據(jù)和所述音頻碎片數(shù)據(jù)對應(yīng)的碎片索引文件?;谒鏊槠饕募?,將多個所述音頻碎片數(shù)據(jù)推送至直播音頻通道中,并基于多個所述音頻碎片數(shù)據(jù)的排列順序,實現(xiàn)所述數(shù)字直播對象的直播語音播放,解決了數(shù)字人直播中音頻不連續(xù)的問題,滿足了直播場景下靈活調(diào)整音頻內(nèi)容的需求,使得數(shù)字人直播的直播聲音更加流暢自然。

16、應(yīng)當理解,本部分所描述的內(nèi)容并非旨在標識本發(fā)明的實施例的關(guān)鍵或重要特征,也不用于限制本發(fā)明的范圍。本發(fā)明的其它特征將通過以下的說明書而變得容易理解。



技術(shù)特征:

1.一種直播語音播放方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法,還包括:

3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法,還包括:

4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法,還包括:

5.根據(jù)權(quán)利要求4所述的方法,其特征在于,在將所述插播碎片數(shù)據(jù)插入至所述直播音頻通道中之前,還包括:

6.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述將多個所述音頻碎片數(shù)據(jù)推送至直播音頻通道中之后,還包括:

7.根據(jù)權(quán)利要求1-6任一項所述的方法,其特征在于,所述音頻碎片數(shù)據(jù)為ts碎片,所述碎片索引文件為m3u8索引文件。

8.一種直播語音播放裝置,其特征在于,包括:

9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:

10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有計算機指令,所述計算機指令用于使處理器執(zhí)行時實現(xiàn)權(quán)利要求1-7中任一項所述的直播語音播放方法。


技術(shù)總結(jié)
本發(fā)明公開了一種直播語音播放方法、裝置、設(shè)備及存儲介質(zhì)。該方法包括:獲取在直播過程中數(shù)字直播對象對應(yīng)的待播放音頻數(shù)據(jù);將所述待播放音頻數(shù)據(jù)進行拆分處理,獲得多個音頻碎片數(shù)據(jù)和所述音頻碎片數(shù)據(jù)對應(yīng)的碎片索引文件;基于所述碎片索引文件,將多個所述音頻碎片數(shù)據(jù)推送至直播音頻通道中,并基于多個所述音頻碎片數(shù)據(jù)的排列順序,實現(xiàn)所述數(shù)字直播對象的直播語音播放,實現(xiàn)了音頻內(nèi)容的實時打斷與插播,滿足了直播場景下靈活調(diào)整內(nèi)容的需求,解決了數(shù)字人直播中音頻不連續(xù)的問題,使得直播聲音更加流暢自然。

技術(shù)研發(fā)人員:韓威兵,唐守旭,劉庶,張磊,張亮,李銘魁
受保護的技術(shù)使用者:上海序祿信息科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/15
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1