本發(fā)明屬于ppt生成,具體是一種基于大模型生成ppt的方法。
背景技術(shù):
1、基于大模型生成ppt這項(xiàng)技術(shù)的興起,是在人工智能(ai)領(lǐng)域快速發(fā)展的背景下產(chǎn)生的。特別是近年來(lái),深度學(xué)習(xí)技術(shù)的進(jìn)步,以及大規(guī)模語(yǔ)言模型(如gpt-3、bert等)的成功應(yīng)用,極大地推動(dòng)了自然語(yǔ)言處理(nlp)和計(jì)算機(jī)視覺(jué)(cv)領(lǐng)域的研究與應(yīng)用。
2、目前的產(chǎn)品有兩個(gè)功能,首先是一句話(huà)生成ppt,即,通過(guò)用戶(hù)的輸入生成ppt內(nèi)容,在通常情況下用戶(hù)的輸入內(nèi)容為指定的標(biāo)題,如,多模態(tài)算法工程師的年終總結(jié),如何有效的進(jìn)行身材管理等;第二個(gè)功能是根據(jù)用戶(hù)提供的文件和標(biāo)題生成ppt,目前輸入的文件格式支持,word,ppt,標(biāo)準(zhǔn)pdf,非標(biāo)準(zhǔn)pdf。
3、現(xiàn)有的aippt產(chǎn)品也同樣是基于大模型來(lái)進(jìn)行ppt生成的,一般是基于一步或兩步提示詞進(jìn)行大綱構(gòu)建和內(nèi)容生成的,例如,在多模態(tài)算法工程師的年終總結(jié)兩步生成的示例中,先生成大綱,然后再通過(guò)大綱生成對(duì)應(yīng)的內(nèi)容,最后將內(nèi)容通過(guò)ppt填充的算法生成最后的ppt文件;在一步示例中則是直接生成好大綱和對(duì)應(yīng)的內(nèi)容;一步與兩步的不同,主要體現(xiàn)在用戶(hù)的交互邏輯上,如,在兩步生成的過(guò)程中,用戶(hù)可以更改生成好的大綱,然后再生成更符合用戶(hù)需求的內(nèi)容;在一步生成的產(chǎn)品中則是完整生成后用戶(hù)再進(jìn)行修改直至完成ppt生成。
4、目前的aippt產(chǎn)品,存在如下問(wèn)題:
5、1.生成的文字內(nèi)容,字?jǐn)?shù),質(zhì)量較少,結(jié)構(gòu)層級(jí)較低;這點(diǎn)為常見(jiàn)aippt的產(chǎn)品通病,主要是大模型對(duì)生成長(zhǎng)文本的能力不足引起的。
6、2.ppt模板簡(jiǎn)單、單調(diào);這點(diǎn)也為常見(jiàn)的aippt產(chǎn)品通病,也主要是由于第一點(diǎn)生成的文本內(nèi)容簡(jiǎn)單導(dǎo)致的,其次是沒(méi)有制作支持不同種結(jié)構(gòu)的模板導(dǎo)致的。
7、3.ppt的填充邏輯簡(jiǎn)單;這也是由于上述兩點(diǎn)引起的問(wèn)題,大模型生成的內(nèi)容沒(méi)有復(fù)雜的層級(jí)結(jié)構(gòu),所以本身的ppt填充算法也比較簡(jiǎn)單,對(duì)章節(jié),子章節(jié),子節(jié)點(diǎn)的填充邏輯較為單一。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述問(wèn)題,提出了本發(fā)明以便提供克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的一種基于大模型生成ppt的方法。
2、為實(shí)現(xiàn)上述目的,本發(fā)明采用了如下技術(shù)方案:
3、一種基于大模型生成ppt的方法,所述方法包括:
4、通過(guò)前端獲取輸入的標(biāo)題和文件;
5、將前端信息傳遞給微服務(wù),通過(guò)微服務(wù)做中轉(zhuǎn)將用戶(hù)的輸入信息發(fā)送給大模型并生成大綱和內(nèi)容;
6、微服務(wù)將生成好的內(nèi)容發(fā)送到windows虛擬機(jī),并通過(guò)填充算法生成ppt;
7、將生成好的ppt返回給前端頁(yè)面供用戶(hù)下載。
8、可選的,所述方法還包括對(duì)大模型進(jìn)行訓(xùn)練,用以使得大模型生成的結(jié)構(gòu)和內(nèi)容更為復(fù)雜,并制作出更為復(fù)雜的ppt。
9、可選的,所述方法還包括對(duì)生成好的內(nèi)容進(jìn)行針對(duì)性訓(xùn)練,用以固定大模型生成的文檔結(jié)構(gòu)。
10、可選的,所述方法還包括優(yōu)化ppt的使用體驗(yàn),所述優(yōu)化包括:
11、根據(jù)文本框大小、文本長(zhǎng)度和字體文件動(dòng)態(tài)調(diào)整文字大小,用以避免因?yàn)榇竽P蜕蓛?nèi)容過(guò)多導(dǎo)致的內(nèi)容超框;
12、在用戶(hù)上傳文件生成ppt的功能中,大模型在訓(xùn)練過(guò)程中被設(shè)置成動(dòng)態(tài)調(diào)整用戶(hù)預(yù)設(shè)章節(jié)個(gè)數(shù),用以保證生成ppt結(jié)構(gòu)的穩(wěn)定性;
13、在用戶(hù)上傳文件生成ppt的功能中,大模型在訓(xùn)練過(guò)程中被設(shè)置成優(yōu)化用戶(hù)文檔文案;
14、使用vllm技術(shù)做推理部署和加速。
15、可選的,給填充算法增加大量的隨機(jī)性,用以使得每次生成ppt采用不重復(fù)的模板。
16、可選的,通過(guò)填充算法生成ppt包括對(duì)ppt模板進(jìn)行填充,所述ppt模板采用了統(tǒng)一的結(jié)構(gòu)與處理方法。
17、綜上所述,由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:
18、1.本發(fā)明通過(guò)windows虛擬機(jī)中的powerpoint合成ppt文件可以更好的控制生成效果,可以直接對(duì)powerpoint進(jìn)行編程,內(nèi)置了大量微軟提供的庫(kù),例如,對(duì)文本框和字體大小進(jìn)行自適應(yīng)縮放,復(fù)制指定的窗格框到指定的頁(yè)數(shù),自動(dòng)生成各類(lèi)ppt的動(dòng)畫(huà)效果等,相較于目前其他在前端合成ppt的方案,本發(fā)明合成ppt的效果和質(zhì)量更加穩(wěn)定,可控,而且直接調(diào)用微軟提供的ppt庫(kù)進(jìn)行編程,減少了大量組件的開(kāi)發(fā)成本。
19、2.本發(fā)明對(duì)大模型進(jìn)行針對(duì)性的訓(xùn)練,例如在控制ppt結(jié)構(gòu)復(fù)雜度、文本框字?jǐn)?shù)控、標(biāo)準(zhǔn)化格式控制、各類(lèi)ppt方向相較于其他類(lèi)似方案使用的大模型,本發(fā)明進(jìn)行針對(duì)訓(xùn)練過(guò)的大模型可以生成更復(fù)雜,質(zhì)量更高的文本內(nèi)容,有助于生成更理想的ppt。
1.一種基于大模型生成ppt的方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的一種基于大模型生成ppt的方法,其特征在于,所述方法還包括對(duì)大模型進(jìn)行訓(xùn)練,用以使得大模型生成的結(jié)構(gòu)和內(nèi)容更為復(fù)雜,并制作出更為復(fù)雜的ppt。
3.如權(quán)利要求1所述的一種基于大模型生成ppt的方法,其特征在于,所述方法還包括對(duì)生成好的內(nèi)容進(jìn)行針對(duì)性訓(xùn)練,用以固定大模型生成的文檔結(jié)構(gòu)。
4.如權(quán)利要求1所述的一種基于大模型生成ppt的方法,其特征在于,所述方法還包括優(yōu)化ppt的使用體驗(yàn),所述優(yōu)化包括:
5.如權(quán)利要求1所述的一種基于大模型生成ppt的方法,其特征在于,給填充算法增加大量的隨機(jī)性,用以使得每次生成ppt采用不重復(fù)的模板。
6.如權(quán)利要求1所述的一種基于大模型生成ppt的方法,其特征在于,通過(guò)填充算法生成ppt包括對(duì)ppt模板進(jìn)行填充,所述ppt模板采用了統(tǒng)一的結(jié)構(gòu)與處理方法。