本公開涉及視頻領(lǐng)域,尤其涉及視頻轉(zhuǎn)碼。
背景技術(shù):
1、隨著短視頻等的流行,視頻數(shù)據(jù)在互聯(lián)網(wǎng)上所占的比重越來越高,數(shù)據(jù)統(tǒng)計表明視頻數(shù)據(jù)在互聯(lián)網(wǎng)上所占的比重已經(jīng)達到了80%多。尤其現(xiàn)在隨著5g的到來,用戶對畫質(zhì)的要求也更高,4k、8k、hdr等視頻也越來越多,隨之而來的便是視頻質(zhì)量的成倍增加,這也就導致了視頻運營平臺的cdn(content?delivery?network,內(nèi)容分發(fā)網(wǎng)絡(luò))成本(如轉(zhuǎn)碼成本)變得越來越高。例如:現(xiàn)有的視頻轉(zhuǎn)碼方式主要是使用更先進的編碼器如hevc,av1等進行轉(zhuǎn)碼,這隨之而來的便是計算量的大幅增加。
2、因而,如何在保證視頻質(zhì)量的同時,減少轉(zhuǎn)碼(其中,轉(zhuǎn)碼的本質(zhì)是先解碼再編碼)過程中的計算量以降低cdn成本成為亟待解決的問題。
技術(shù)實現(xiàn)思路
1、本公開提供了一種視頻轉(zhuǎn)碼方法、裝置、設(shè)備、存儲介質(zhì)以及車輛。
2、根據(jù)本公開的第一方面,提供了一種視頻轉(zhuǎn)碼方法。該方法包括:
3、獲取原始視頻流;
4、對所述原始視頻流進行解碼,得到原始分辨率數(shù)據(jù)、低分辨率數(shù)據(jù)以及所述原始視頻流對應(yīng)的初始編碼信息,其中,所述低分辨率數(shù)據(jù)的分辨率低于所述原始分辨率數(shù)據(jù)的分辨率;
5、獲取所述原始分辨率數(shù)據(jù)中每幀的感興趣區(qū)域,其中,所述每幀的感興趣區(qū)域基于所述低分辨率數(shù)據(jù)確定;
6、將所述原始分辨率數(shù)據(jù)中每幀的感興趣區(qū)域?qū)?yīng)的初始編碼信息進行調(diào)整,并保留所述每幀的非感興趣區(qū)域?qū)?yīng)的初始編碼信息,以獲得所述每幀的最終編碼信息;
7、利用所述每幀的最終編碼信息對所述原始分辨率數(shù)據(jù)中每幀進行編碼,以得到轉(zhuǎn)碼視頻流。
8、如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述獲取所述原始分辨率數(shù)據(jù)中每幀的感興趣區(qū)域,包括:
9、確定所述低分辨率數(shù)據(jù)中每幀的當前分辨率和當前場景;
10、獲取分辨率、場景與感興趣區(qū)域之間的預(yù)設(shè)對應(yīng)關(guān)系;
11、將所述當前分辨率和所述當前場景與所述預(yù)設(shè)對應(yīng)關(guān)系進行匹配,以確定所述低分辨率數(shù)據(jù)中每幀的感興趣區(qū)域;
12、依據(jù)所述低分辨率數(shù)據(jù)與所述原始分辨率數(shù)據(jù)之間的分辨率比例關(guān)系將所述低分辨率數(shù)據(jù)中每幀的感興趣區(qū)域進行縮放,以確定所述原始分辨率數(shù)據(jù)中每幀的感興趣區(qū)域。
13、如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述對所述原始視頻流進行解碼,得到原始分辨率數(shù)據(jù)、低分辨率數(shù)據(jù)以及所述原始視頻流對應(yīng)的初始編碼信息,包括:
14、獲取所述低分辨率數(shù)據(jù)對應(yīng)的預(yù)設(shè)分辨率;
15、在所述預(yù)設(shè)分辨率的基礎(chǔ)上,對所述原始視頻流進行解碼,以得到原始分辨率數(shù)據(jù)和所述原始視頻流對應(yīng)的初始編碼信息以及所述低分辨率數(shù)據(jù),其中,所述初始編碼信息包括:所述原始分辨率數(shù)據(jù)對應(yīng)的初始宏塊、所述初始宏塊的運動矢量以及所述初始宏塊所屬片的類型。
16、如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述將所述原始分辨率數(shù)據(jù)中每幀的感興趣區(qū)域?qū)?yīng)的初始編碼信息進行調(diào)整,包括:
17、確定預(yù)設(shè)編碼標準對應(yīng)的至少一種宏塊劃分方式;
18、計算所述至少一種宏塊劃分方式中各宏塊劃分方式對應(yīng)的失真量;
19、按照所述各宏塊劃分方式對應(yīng)的失真量的大小,調(diào)整所述原始分辨率數(shù)據(jù)中每幀的感興趣區(qū)域?qū)?yīng)的初始編碼信息。
20、如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述按照所述各宏塊劃分方式對應(yīng)的失真量的大小,調(diào)整所述原始分辨率數(shù)據(jù)中每幀的感興趣區(qū)域?qū)?yīng)的初始編碼信息,包括:
21、從所述至少一種宏塊劃分方式中選擇失真量最小的宏塊劃分方式;
22、將所述失真量最小的宏塊劃分方式確定為宏塊最優(yōu)劃分模式;
23、確定所述宏塊最優(yōu)劃分模式下每幀的感興趣區(qū)域?qū)?yīng)的至少一個新宏塊以及所述至少一個新宏塊各自所屬的片的類型,并計算所述至少一個新宏塊各自的運動矢量。
24、如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述獲得所述每幀的最終編碼信息,包括:
25、復用保存所述原始分辨率數(shù)據(jù)中每幀的非感興趣區(qū)域的初始宏塊和所述每幀的非感興趣區(qū)域的初始宏塊的運動矢量和所述每幀的非感興趣區(qū)域的初始宏塊所屬片的類型;
26、將所述原始分辨率數(shù)據(jù)中所述每幀的感興趣區(qū)域?qū)?yīng)的至少一個新宏塊、所述至少一個新宏塊各自所屬的片的類型、所述至少一個新宏塊各自的運動矢量以及所述每幀的非感興趣區(qū)域的初始宏塊、所述每幀的非感興趣區(qū)域的初始宏塊的運動矢量以及所述每幀的非感興趣區(qū)域的初始宏塊所屬片的類型確定為所述每幀的最終編碼信息。
27、如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述利用所述每幀的最終編碼信息對所述原始分辨率數(shù)據(jù)中每幀進行編碼,以得到轉(zhuǎn)碼視頻流,包括:
28、減小所述原始分辨率數(shù)據(jù)中每幀的感興趣區(qū)域的量化參數(shù)并增大所述原始分辨率數(shù)據(jù)中每幀的非感興趣區(qū)域的量化參數(shù);
29、利用所述每幀的最終編碼信息對量化參數(shù)調(diào)整后的所述原始分辨率數(shù)據(jù)中每幀進行編碼,以得到轉(zhuǎn)碼視頻流。
30、根據(jù)本公開的第二方面,提供了一種視頻轉(zhuǎn)碼裝置。該裝置包括:
31、第一獲取模塊,用于獲取原始視頻流;
32、解碼模塊,用于對所述原始視頻流進行解碼,得到原始分辨率數(shù)據(jù)、低分辨率數(shù)據(jù)以及所述原始視頻流對應(yīng)的初始編碼信息,其中,所述低分辨率數(shù)據(jù)的分辨率低于所述原始分辨率數(shù)據(jù)的分辨率;
33、第二獲取模塊,用于獲取所述原始分辨率數(shù)據(jù)中每幀的感興趣區(qū)域,其中,所述每幀的感興趣區(qū)域基于所述低分辨率數(shù)據(jù)確定;
34、處理模塊,用于將所述原始分辨率數(shù)據(jù)中每幀的感興趣區(qū)域?qū)?yīng)的初始編碼信息進行調(diào)整,并保留所述每幀的非感興趣區(qū)域?qū)?yīng)的初始編碼信息,以獲得所述每幀的最終編碼信息;
35、編碼模塊,用于利用所述每幀的最終編碼信息對所述原始分辨率數(shù)據(jù)中每幀進行編碼,以得到轉(zhuǎn)碼視頻流。
36、根據(jù)本公開的第三方面,提供了一種電子設(shè)備。該電子設(shè)備包括:存儲器和處理器,所述存儲器上存儲有計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)如以上所述的方法。
37、根據(jù)本公開的第四方面,提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述程序被處理器執(zhí)行時實現(xiàn)如根據(jù)本公開的第一方面的方法。
38、根據(jù)本公開的第五方面,提供了一種車輛,所述車輛包括如第二方面所述的視頻轉(zhuǎn)碼裝置和/或如第三方面所述的電子設(shè)備。
39、本公開中,在獲取到原始視頻流之后,通過對所述原始視頻流進行解碼,可得到原始分辨率數(shù)據(jù)、低分辨率數(shù)據(jù)以及所述原始視頻流對應(yīng)的初始編碼信息,然后獲取所述原始分辨率數(shù)據(jù)中每幀的感興趣區(qū)域,進而將所述原始分辨率數(shù)據(jù)中每幀的感興趣區(qū)域?qū)?yīng)的初始編碼信息進行調(diào)整并保留所述每幀的非感興趣區(qū)域?qū)?yīng)的初始編碼信息,即可得到每幀的最終編碼信息,以便于利用所述每幀的最終編碼信息對所述原始分辨率數(shù)據(jù)中每幀進行編碼,以得到轉(zhuǎn)碼視頻流,如此,在轉(zhuǎn)碼過程中,只需要對感興趣區(qū)域的編碼信息進行調(diào)整而非感興趣區(qū)域的編碼信息復用保存即可,這顯然降低了轉(zhuǎn)碼過程的計算量,且人眼一般會將注意力更多地放在感興趣區(qū)域(如人臉),將少部分的注意力放在非感興趣區(qū)域(如背景),因而,在整體碼率降低的條件下,使得視頻的質(zhì)量沒有明顯下降,也就實現(xiàn)了在保證視頻質(zhì)量的同時,減少轉(zhuǎn)碼過程中的計算量以降低cdn成本。
40、應(yīng)當理解,
技術(shù)實現(xiàn)要素:
部分中所描述的內(nèi)容并非旨在限定本公開的實施例的關(guān)鍵或重要特征,亦非用于限制本公開的范圍。本公開的其它特征將通過以下的描述變得容易理解。