文本生成方法及電子設(shè)備與流程

文檔序號(hào)：41952154發(fā)布日期：2025-05-16 14:13閱讀：2來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本公開總體上涉及計(jì)算機(jī)領(lǐng)域，并且更具體地涉及文本生成方法及電子設(shè)備。

背景技術(shù)：

1、生成式大語言模型是能夠生成自然語言文本的深度學(xué)習(xí)模型。這類模型基于復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)，例如變換器（transformer），并經(jīng)過大量文本數(shù)據(jù)的預(yù)訓(xùn)練，以學(xué)習(xí)語言的統(tǒng)計(jì)特性和模式。生成式大語言模型的核心能力是生成連貫、有邏輯且符合語法規(guī)則的文本。這意味著模型可以輸出全新的文本內(nèi)容，如文章、對(duì)話、詩(shī)歌等，而不僅僅是復(fù)制或重述訓(xùn)練數(shù)據(jù)中的內(nèi)容。

2、在大語言模型中，混合專家（mixture?of?experts，moe）可以被集成到變換層中，通過激活較少數(shù)目的專家，能夠減少計(jì)算量。但是目前的方案中被激活的專家數(shù)目是固定的，導(dǎo)致模型不夠靈活。

技術(shù)實(shí)現(xiàn)思路

1、根據(jù)本公開的示例實(shí)施例，提供了一種文本生成的方法、裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)、和計(jì)算機(jī)程序產(chǎn)品。能夠基于提示信息的復(fù)雜程度來確定moe大模型中要激活的專家的數(shù)目，以此能夠?qū)崿F(xiàn)模型的動(dòng)態(tài)控制和動(dòng)態(tài)使用。

2、在本公開的第一方面，提供了一種信息處理方法，包括：獲取提示信息；將提示信息輸入到moe大模型中，確定提示信息對(duì)應(yīng)的向量表示，其中moe大模型具有經(jīng)訓(xùn)練確定的最大專家數(shù)目；還包括利用文本評(píng)估模型，基于向量表示，確定提示信息的評(píng)分值，其中提示信息的評(píng)分值是用于表征提示信息的復(fù)雜程度的量化的性能指標(biāo)；基于提示信息的評(píng)分值，確定moe大模型中要激活的專家的數(shù)目，其中要激活的專家的數(shù)目不大于最大專家數(shù)目；以及基于moe大模型的激活的專家，生成與提示信息對(duì)應(yīng)的輸出。

3、在本公開的第二方面，提供了一種電子設(shè)備，包括：至少一個(gè)處理單元；至少一個(gè)存儲(chǔ)器，至少一個(gè)存儲(chǔ)器被耦合到至少一個(gè)處理單元并且存儲(chǔ)用于由至少一個(gè)處理單元執(zhí)行的指令，該指令當(dāng)由至少一個(gè)處理單元執(zhí)行時(shí)使得電子設(shè)備執(zhí)行根據(jù)本公開的第一方面所描述的方法。

4、在本公開的第三方面，提供了一種文本生成裝置，包括：獲取單元，被配置為獲取提示信息；第一確定單元，被配置為將提示信息輸入到moe大模型中，確定提示信息對(duì)應(yīng)的向量表示，其中moe大模型具有經(jīng)訓(xùn)練確定的最大專家數(shù)目；第二確定單元，被配置為利用文本評(píng)估模型，基于向量表示，確定提示信息的評(píng)分值，其中提示信息的評(píng)分值是用于表征提示信息的復(fù)雜程度的量化的性能指標(biāo)；第三確定單元，被配置為基于提示信息的評(píng)分值，確定moe大模型中要激活的專家的數(shù)目，其中要激活的專家的數(shù)目不大于最大專家數(shù)目；以及生成單元，被配置為基于moe大模型的所述激活的專家，生成與提示信息對(duì)應(yīng)的輸出。

5、在本公開的第四方面，提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)具有在其上存儲(chǔ)的機(jī)器可執(zhí)行指令，該機(jī)器可執(zhí)行指令在由設(shè)備執(zhí)行時(shí)使該設(shè)備執(zhí)行根據(jù)本公開的第一方面所描述的方法。

6、在本公開的第五方面，提供了一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)可執(zhí)行指令，其中計(jì)算機(jī)可執(zhí)行指令在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)本公開的第一方面所描述的方法。

7、在本公開的第六方面，提供了一種電子設(shè)備，包括：處理電路，被配置為執(zhí)行根據(jù)本公開的第一方面所描述的方法。

8、提供
技術(shù)實(shí)現(xiàn)要素：
部分是為了以簡(jiǎn)化的形式來介紹一系列概念，它們?cè)谙挛牡木唧w實(shí)施方式中將被進(jìn)一步描述。發(fā)明內(nèi)容部分不旨在標(biāo)識(shí)本公開的關(guān)鍵特征或必要特征，也不旨在限制本公開的范圍。本公開的其它特征將通過以下的描述變得容易理解。

技術(shù)特征：

1.一種文本生成方法，包括：

2.?根據(jù)權(quán)利要求1所述的方法，其中基于所述評(píng)分值確定所述moe大模型中要激活的專家的數(shù)目包括：

3.?根據(jù)權(quán)利要求2所述的方法，其中確定所述多個(gè)閾值包括：

4.根據(jù)權(quán)利要求3所述的方法，其中所述服務(wù)器的所述工作狀態(tài)包括以下至少一項(xiàng)：

5.根據(jù)權(quán)利要求2所述的方法，其中所述多個(gè)候選專家數(shù)目中的每個(gè)都小于所述最大專家數(shù)目。

6.根據(jù)權(quán)利要求1所述的方法，其中所述提示信息對(duì)應(yīng)的向量表示包括：所述moe大模型的中間層輸出的所述提示信息對(duì)應(yīng)的層次化特征。

7.根據(jù)權(quán)利要求1所述的方法，其中生成所述輸出包括：

8.根據(jù)權(quán)利要求1所述的方法，其中生成所述輸出包括：

9.根據(jù)權(quán)利要求8所述的方法，其中確定所述評(píng)分值包括：

10.根據(jù)權(quán)利要求8所述的方法，其中所述多個(gè)單詞元為所述已生成的輸出中的最后生成的預(yù)設(shè)數(shù)目的單詞元。

11.根據(jù)權(quán)利要求1所述的方法，其中所述文本評(píng)估模型采用卷積神經(jīng)網(wǎng)絡(luò)cnn或循環(huán)神經(jīng)網(wǎng)絡(luò)rnn結(jié)構(gòu)。

12.一種電子設(shè)備，包括：

13.一種文本生成裝置，包括：

14.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的方法。

技術(shù)總結(jié)
本公開涉及文本生成方法及電子設(shè)備。該方法包括：將提示信息輸入到MoE大模型中，確定提示信息對(duì)應(yīng)的向量表示，其中MoE大模型具有經(jīng)訓(xùn)練確定的最大專家數(shù)目；利用文本評(píng)估模型，基于向量表示，確定提示信息的評(píng)分值，其中提示信息的評(píng)分值是用于表征提示信息的復(fù)雜程度的量化的性能指標(biāo)；基于提示信息的評(píng)分值，確定MoE大模型中要激活的專家的數(shù)目，其中要激活的專家的數(shù)目不大于最大專家數(shù)目；以及基于MoE大模型的激活的專家，生成與提示信息對(duì)應(yīng)的輸出。以此方式，本公開可使MoE大模型根據(jù)提示詞的復(fù)雜程度，動(dòng)態(tài)調(diào)整激活的專家數(shù)目，提高輸出的準(zhǔn)確性并降低硬件成本。

技術(shù)研發(fā)人員：王倪劍橋
受保護(hù)的技術(shù)使用者：北京飛書科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/15

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王倪劍橋
技術(shù)所有人：北京飛書科技有限公司
我是此專利的發(fā)明人

上一篇：一種大型天線復(fù)合控制方法及系統(tǒng)與流程
上一篇：全自動(dòng)金屬徽章組裝機(jī)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

文本生成方法及電子設(shè)備與流程