本申請(qǐng)涉及計(jì)算機(jī),具體涉及一種三維模型生成方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,三維虛擬模型越來(lái)越多地應(yīng)用在各個(gè)行業(yè),例如,虛擬游戲、三維打印、動(dòng)畫(huà)視頻制作、虛擬試衣等。文本引導(dǎo)生成三維模型的技術(shù),通過(guò)給定的文本內(nèi)容能夠自動(dòng)化高效地生成符合文本描述的三維模型,因而使用越來(lái)越廣泛。
2、相關(guān)技術(shù)在基于文本引導(dǎo)生成三維模型時(shí),通常是基于大量已經(jīng)預(yù)先標(biāo)記有樣本描述文本的樣本三維模型預(yù)先訓(xùn)練一個(gè)文本到三維模型的映射模型,在生成三維模型時(shí),將描述文本輸入該映射模型中即可生成對(duì)應(yīng)的三維模型。
3、由于三維模型是立體結(jié)構(gòu),其模型結(jié)構(gòu)比較復(fù)雜,訓(xùn)練映射模型過(guò)程中的樣本描述文本通常很難將三維模型的各個(gè)部位的結(jié)構(gòu)特征、三維模型的整體結(jié)構(gòu)特征等完整、準(zhǔn)確地描述出來(lái),待生成三維模型對(duì)應(yīng)的描述文本通常也缺乏對(duì)三維模型完整、準(zhǔn)確地描述,導(dǎo)致映射模型所生成的三維模型的可能會(huì)出現(xiàn)模型不合理、準(zhǔn)確性不高等的情況。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)?zhí)峁┝艘环N三維模型生成方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),能夠提高所生成的三維模型的合理性和準(zhǔn)確率。具體方式如下。
2、第一方面,本申請(qǐng)實(shí)施例提供了一種三維模型生成方法,所述方法包括:
3、獲取待生成三維模型對(duì)應(yīng)的描述文本,以及所述待生成三維模型對(duì)應(yīng)的初始三維可變形模型;
4、對(duì)所述初始三維可變形模型進(jìn)行渲染,得到第一初始渲染圖像;
5、基于所述第一初始渲染圖像與所述描述文本之間的匹配程度,調(diào)整所述初始三維可變形模型的模型參數(shù),以生成符合所述描述文本的三維結(jié)構(gòu)模型。
6、第二方面,本申請(qǐng)實(shí)施例還提供了一種三維模型生成裝置,所述裝置包括:
7、獲取單元,用于獲取待生成三維模型對(duì)應(yīng)的描述文本,以及所述待生成三維模型對(duì)應(yīng)的初始三維可變形模型;
8、渲染單元,用于對(duì)所述初始三維可變形模型進(jìn)行渲染,得到第一初始渲染圖像;
9、調(diào)整單元,用于基于所述第一初始渲染圖像與所述描述文本之間的匹配程度,調(diào)整所述初始三維可變形模型的模型參數(shù),以生成符合所述描述文本的三維結(jié)構(gòu)模型。
10、第三方面,本申請(qǐng)實(shí)施例還提供了一種電子設(shè)備,包括:
11、處理器;以及
12、存儲(chǔ)器,用于存儲(chǔ)數(shù)據(jù)處理程序,該電子設(shè)備通電并通過(guò)所述處理器運(yùn)行該程序后,執(zhí)行如第一方面任一項(xiàng)所述的方法。
13、第四方面,本申請(qǐng)實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有數(shù)據(jù)處理程序,該程序被處理器運(yùn)行,執(zhí)行如第一方面任一項(xiàng)所述的方法。
14、與現(xiàn)有技術(shù)相比,本申請(qǐng)具有以下優(yōu)點(diǎn):
15、本申請(qǐng)實(shí)施例提供的三維模型生成方法,獲取了待生成三維模型對(duì)應(yīng)的描述文本,以及待生成三維模型對(duì)應(yīng)的初始三維可變形模型,對(duì)該初始三維可變形模型進(jìn)行渲染,得到第一初始渲染圖像,再基于第一初始渲染圖像與描述文本之間的匹配程度調(diào)整初始三維可變形模型的模型參數(shù),由于描述文本是用于描述待生成三維模型的,通過(guò)第一初始渲染圖像與描述文本之間的匹配程度,可以反映出第一初始渲染圖像所對(duì)應(yīng)的三維模型與待生成三維模型之間的結(jié)構(gòu)差異程度,因此,通過(guò)第一初始渲染圖像與描述文本之間的匹配程度,可以指導(dǎo)初始三維可變形模型的模型參數(shù)的調(diào)整,使調(diào)整了模型參數(shù)后的初始三維可變形模型與描述文本所描述的三維模型匹配,從而生成符合描述文本的三維結(jié)構(gòu)模型。
16、本申請(qǐng)?zhí)峁┑姆桨冈谏扇S模型時(shí),是基于待生成三維模型對(duì)應(yīng)的描述文本引導(dǎo)初始三維可變形模型進(jìn)行模型參數(shù)調(diào)整而生成了符合描述文本的三維結(jié)構(gòu)模型,待生成三維模型對(duì)應(yīng)的初始三維可變形模型通常是一個(gè)已經(jīng)符合三維模型結(jié)構(gòu)布局的模型,在初始可變形三維模型的基礎(chǔ)上按照描述文本進(jìn)行調(diào)整所得到的三維結(jié)構(gòu)模型,即能夠滿(mǎn)足描述文本所描述的結(jié)構(gòu),也可以使得所生成的三維結(jié)構(gòu)模型符合三維模型的結(jié)構(gòu)布局,使得所生成的三維模型的結(jié)構(gòu)更合理、準(zhǔn)確性更高。
17、另外,本申請(qǐng)基于第一初始渲染圖像與描述文本之間的匹配程度調(diào)整初始三維可變形模型的模型參數(shù),由于渲染圖像為二維圖像,二維圖像相對(duì)于三維模型的特征描述更簡(jiǎn)單方便,因此,可以很方便地確定出二維圖像與描述文本之間的匹配程度,使得三維模型生成的過(guò)程簡(jiǎn)單易實(shí)現(xiàn)。
18、由于大部分三維模型并未預(yù)先設(shè)置對(duì)應(yīng)的描述文本,所以,相關(guān)技術(shù)訓(xùn)練映射模型所需的訓(xùn)練數(shù)據(jù)需要人工對(duì)大量三維模型編輯描述文本,人工成本很高,訓(xùn)練過(guò)程非常繁瑣,本申請(qǐng)由于無(wú)需訓(xùn)練用于生成三維模型的映射模型,因此無(wú)需預(yù)先搜集大量三維模型的描述文本,可以大大減少生成三維模型過(guò)程所花費(fèi)的人力,使三維模型生成過(guò)程更簡(jiǎn)單方便。
1.一種三維模型生成方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述基于所述第一初始渲染圖像與所述描述信息之間的匹配程度,調(diào)整所述初始三維可變形模型的模型參數(shù)之前,所述方法還包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述獲取第一初始噪聲之前,所述方法還包括:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述第一預(yù)測(cè)噪聲與所述第一初始噪聲之間的差別,采用梯度下降法,調(diào)整所述初始三維可變形模型的模型參數(shù),生成符合所述描述文本的三維結(jié)構(gòu)模型,包括:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述以所述描述文本以及所述第一初始噪聲強(qiáng)度為引導(dǎo)條件,預(yù)測(cè)所述第一初始加噪圖像的噪聲,得到第一預(yù)測(cè)噪聲,包括:
6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,在所述基于貼圖調(diào)整信息調(diào)整所述初始模型貼圖之前,所述方法還包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,在所述獲取第二初始噪聲之前,所述方法還包括:
9.根據(jù)權(quán)利要求6所述的方法,其特征在于,在所述基于貼圖調(diào)整信息調(diào)整所述初始模型貼圖之前,所述方法還包括:
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,在所述基于貼圖調(diào)整信息調(diào)整所述初始模型貼圖之前,所述方法還包括:
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,在所述以所述貼圖特征對(duì)應(yīng)的描述文本為引導(dǎo)條件,預(yù)測(cè)所述第三初始加噪圖像的噪聲,得到第三預(yù)測(cè)噪聲之前,所述方法還包括:
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述第二圖文擴(kuò)散模型通過(guò)以下方式訓(xùn)練得到:
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,在所述基于貼圖調(diào)整信息調(diào)整所述初始模型貼圖之前,所述方法還包括:
14.根據(jù)權(quán)利要求13所述的方法,其特征在于,在所述基于貼圖調(diào)整信息調(diào)整所述初始模型貼圖之前,所述方法還包括:
15.根據(jù)權(quán)利要求14所述的方法,其特征在于,在所述以亮度格式貼圖特征對(duì)應(yīng)的描述文本為引導(dǎo)條件,預(yù)測(cè)所述初始加噪亮度圖像的噪聲,得到第四預(yù)測(cè)噪聲之前,所述方法還包括:
16.根據(jù)權(quán)利要求15所述的方法,其特征在于,所述第三圖文擴(kuò)散模型通過(guò)以下方式訓(xùn)練得到:
17.一種三維模型生成裝置,其特征在于,所述裝置包括:
18.一種電子設(shè)備,其特征在于,包括:
19.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,存儲(chǔ)有數(shù)據(jù)處理程序,該程序被處理器運(yùn)行,執(zhí)行如權(quán)利要求1-16中任一項(xiàng)所述的方法。