最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種基于大語言模型的會計(jì)分錄自動編制方法及系統(tǒng)

文檔序號:41956206發(fā)布日期:2025-05-16 14:23閱讀:7來源:國知局
一種基于大語言模型的會計(jì)分錄自動編制方法及系統(tǒng)

本發(fā)明屬于財(cái)務(wù)數(shù)據(jù)處理,涉及一種基于大語言模型的會計(jì)分錄自動編制方法及系統(tǒng)。


背景技術(shù):

1、會計(jì)分錄亦稱“記賬公式”,是根據(jù)復(fù)式記賬原理的要求,對于每筆會計(jì)事項(xiàng)(又稱“經(jīng)濟(jì)業(yè)務(wù)”)列出對應(yīng)的雙方會計(jì)科目及其金額的一種記錄。會計(jì)分錄能夠清楚地反映某一會計(jì)事項(xiàng)下各會計(jì)科目的發(fā)生額,是填制記賬憑證過程中的重要內(nèi)容。從會計(jì)分錄編制工作流程的角度而言,會計(jì)分錄編制就是一種將一段描述會計(jì)事項(xiàng)內(nèi)容的自然語言文本為輸入,根據(jù)相應(yīng)會計(jì)準(zhǔn)則與知識,將輸入轉(zhuǎn)化為一種格式化程度較高、與輸入有嚴(yán)格對應(yīng)關(guān)系、具有確定的標(biāo)準(zhǔn)答案的文本的過程。表1給出了一個會計(jì)分錄編制任務(wù)的具體例子。

2、表1?一個會計(jì)分錄編制任務(wù)的輸入與輸出內(nèi)容例

3、

4、目前,企業(yè)的會計(jì)分錄編制方式通常是通過會計(jì)人員根據(jù)已有的會計(jì)知識,對發(fā)生的會計(jì)事項(xiàng)手工編制會計(jì)分錄,這樣的方式不僅耗時耗力,并且容易出現(xiàn)錯誤。已有一些方法通過簡單的分類器等人工智能模型探索自動生成會計(jì)分錄的方法,然而,由于會計(jì)分錄涉及較復(fù)雜的計(jì)算、邏輯判斷等內(nèi)容,此類方法在處理復(fù)雜會計(jì)事項(xiàng)時的準(zhǔn)確度并不令人滿意。

5、基于此,本發(fā)明利用現(xiàn)有大語言模型,并結(jié)合一種原創(chuàng)的數(shù)據(jù)格式“中間態(tài)分錄”進(jìn)行處理,提出一種可極大提高準(zhǔn)確率的會計(jì)分錄自動編制方法。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提供一種基于大語言模型的會計(jì)分錄自動編制方法及系統(tǒng),現(xiàn)有技術(shù)中雖可以采用具有較強(qiáng)自然語言理解和生成能力的大語言模型實(shí)現(xiàn)會計(jì)分錄編制任務(wù),然而,現(xiàn)有的通用大模型直接用于會計(jì)分錄編制任務(wù),其訓(xùn)練過程僅僅是將會計(jì)事項(xiàng)和會計(jì)分錄直接作為上下文或問答對加入大模型的訓(xùn)練數(shù)據(jù)中,無法使大模型較好地學(xué)習(xí)到分錄編制過程中的邏輯與計(jì)算細(xì)節(jié),因此在會計(jì)分錄的編制過程中亦會出現(xiàn)分錄邏輯識別錯誤、數(shù)值計(jì)算錯誤等多種問題。本發(fā)明通過對現(xiàn)有通用大語言模型,進(jìn)行二次預(yù)訓(xùn)練、微調(diào)并結(jié)合引入中間態(tài)分錄處理,同時結(jié)合中間態(tài)分錄解碼器,能夠更好的用于會計(jì)分錄編制任務(wù),極大提高會計(jì)分錄準(zhǔn)確性。

2、為了解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:

3、一種基于大語言模型的會計(jì)分錄自動編制方法,包括如下:

4、1)收集會計(jì)事項(xiàng)數(shù)據(jù)集并整理其對應(yīng)的會計(jì)分錄文本,作為會計(jì)分錄編制任務(wù)的標(biāo)準(zhǔn)輸入與最終輸出;

5、2)基于會計(jì)事項(xiàng)與會計(jì)分錄之間的邏輯關(guān)系及數(shù)值計(jì)算方法,引入中間態(tài)分錄,針對所述會計(jì)事項(xiàng)數(shù)據(jù)集中的會計(jì)事項(xiàng)獲得其對應(yīng)中間態(tài)分錄,構(gòu)建“會計(jì)事項(xiàng)-中間態(tài)分錄-會計(jì)分錄”三元組數(shù)據(jù)集;

6、3)對于三元組數(shù)據(jù)集,將其中的會計(jì)事項(xiàng)與中間態(tài)分錄作為問答對,將其用于通用大語言模型的預(yù)訓(xùn)練與微調(diào),訓(xùn)練得到財(cái)會大模型,所述財(cái)會大模型能夠在引導(dǎo)下,接收輸入的會計(jì)事項(xiàng)并輸出對應(yīng)的中間態(tài)分錄;

7、4)將所述財(cái)會大模型輸出的中間態(tài)分錄數(shù)據(jù)輸入中間態(tài)分錄解碼器進(jìn)行解碼,輸出對應(yīng)的會計(jì)分錄。

8、上述技術(shù)方案中,進(jìn)一步的,所述的中間態(tài)分錄由標(biāo)識符與實(shí)質(zhì)性內(nèi)容組成,其中標(biāo)識符的形態(tài)為一個由尖括號對包裹的英文短語,共有<para>、<name>、<pos>、<num>、<spe>和<endpara>六種,其分別對應(yīng)表示段落、科目名稱、位置、數(shù)值、特殊項(xiàng)和結(jié)束,用于標(biāo)記在該標(biāo)識符之后出現(xiàn)的內(nèi)容在中間態(tài)分錄中的性質(zhì)與意義,實(shí)質(zhì)性內(nèi)容為單字、短語、短句或函數(shù)式,用于在中間態(tài)分錄中表達(dá)與具體會計(jì)分錄相關(guān)的實(shí)質(zhì)性含義。

9、進(jìn)一步的,所述中間態(tài)分錄采用特定的三級結(jié)構(gòu)組成,所述三級結(jié)構(gòu)為:

10、(1)一級結(jié)構(gòu):中間態(tài)分錄

11、一個中間態(tài)分錄中存有編寫與之對應(yīng)的會計(jì)分錄的所有必要信息,一個中間態(tài)分錄由一個或多個段落組成,以第一個<para>標(biāo)識符出現(xiàn)標(biāo)志整個中間態(tài)分錄的開始;

12、當(dāng)且僅當(dāng)所有段落內(nèi)容全部結(jié)束后,出現(xiàn)標(biāo)識符<endpara>,表示整個中間態(tài)分錄全部結(jié)束,在一條中間態(tài)分錄中,<endpara>標(biāo)識符一共只出現(xiàn)一次;

13、(2)二級結(jié)構(gòu):段落

14、以標(biāo)識符<para>代表段落開始,<para>標(biāo)識符出現(xiàn)后的所有行的內(nèi)容,都是歸屬于當(dāng)前段落的內(nèi)容,直到下一個<para>出現(xiàn)或<endpara>標(biāo)識符出現(xiàn),為一個段落;

15、一個段落中對應(yīng)著編寫單條會計(jì)分錄所需的完整信息,與<para>位于同一行并緊接其后的內(nèi)容為該段落實(shí)質(zhì)性內(nèi)容,是用于對該段落中事項(xiàng)進(jìn)行描述的文字,該內(nèi)容最終會在輸出的會計(jì)分錄中保持原樣輸出;

16、從一個段落的第二行開始直到該段落最后一行的內(nèi)容,是該段落中含有的具體科目的信息,其中每行對應(yīng)一個科目;

17、(3)三級結(jié)構(gòu):科目

18、一個科目的信息由依次排列的<name>、<pos>、以及<num>或<spe>三個標(biāo)識符及對應(yīng)實(shí)質(zhì)性內(nèi)容來表達(dá);其中:

19、標(biāo)識符<name>的實(shí)質(zhì)性內(nèi)容是科目的名稱;

20、標(biāo)識符<pos>的實(shí)質(zhì)性內(nèi)容表示所述科目在最終會計(jì)分錄中出現(xiàn)的位置,用于確定所述科目出現(xiàn)在會計(jì)分錄中的借方、貸方或不出現(xiàn);

21、標(biāo)識符<num>或<spe>的實(shí)質(zhì)性內(nèi)容為所述科目的數(shù)值:如果該科目的值是用戶輸入的會計(jì)事項(xiàng)文本中已直接給出的數(shù)值,無需通過額外的計(jì)算或推理得出,則使用<num>,其實(shí)質(zhì)性內(nèi)容即為文本中給出的值;如果該科目的值沒有在會計(jì)事項(xiàng)文本中直接給出,而是需要進(jìn)行額外的計(jì)算或推理才能得出,則使用<spe>,其實(shí)質(zhì)性內(nèi)容是所述計(jì)算或推理用到的函數(shù)名及其參數(shù),這些參數(shù)都是在本條中間態(tài)分錄中出現(xiàn)的科目名,而函數(shù)名表示對這些參數(shù)進(jìn)行計(jì)算的具體方法,計(jì)算結(jié)果即為本科目的值;

22、一個科目的內(nèi)容均會出現(xiàn)在同一行中,然后另起一行出現(xiàn)下一個科目,如此重復(fù),直至一個段落中包含的科目全部出現(xiàn)。

23、進(jìn)一步的,所述標(biāo)識符<pos>的實(shí)質(zhì)性內(nèi)容以及其含義包括如下:

24、借:本科目將出現(xiàn)在會計(jì)分錄的借方;

25、貸:本科目將出現(xiàn)在會計(jì)分錄的借方;

26、不出現(xiàn):本科目不會出現(xiàn)在會計(jì)分錄中;

27、正借:本科目的值若為正,則出現(xiàn)在會計(jì)分錄的借方,否則出現(xiàn)在會計(jì)分錄的貸方;

28、正貸:本科目的值若為正,則出現(xiàn)在會計(jì)分錄的貸方,否則出現(xiàn)在會計(jì)分錄的借方;

29、僅正借:本科目的值若為正,則出現(xiàn)在會計(jì)分錄的借方,否則不會出現(xiàn)在會計(jì)分錄中;

30、僅正貸:本科目的值若為正,則出現(xiàn)在會計(jì)分錄的貸方,否則不會出現(xiàn)在會計(jì)分錄中。

31、進(jìn)一步的,所述中間態(tài)分錄解碼器是對中間態(tài)分錄進(jìn)行處理的程序模塊,中間態(tài)分錄解碼器接收財(cái)會大模型輸出的以所述特定的三級結(jié)構(gòu)組成的中間態(tài)分錄,對其內(nèi)容進(jìn)行結(jié)構(gòu)化識別及存儲,計(jì)算科目數(shù)值,并生成對應(yīng)的文字形式的會計(jì)分錄,進(jìn)行輸出呈現(xiàn)。

32、進(jìn)一步的,所述中間態(tài)分錄解碼器對接收的中間態(tài)分錄進(jìn)行結(jié)構(gòu)化識別及存儲,包括:

33、1)內(nèi)容提取與格式檢查

34、從接收到的中間態(tài)分錄中,截取出以首個<para>標(biāo)識符開頭、以<endpara>標(biāo)識符結(jié)尾的中間態(tài)分錄內(nèi)容,并保存,若未檢測到上述內(nèi)容,返回報錯信息;

35、2)段落切分

36、從所截取的中間態(tài)分錄內(nèi)容中,根據(jù)<para>標(biāo)識符出現(xiàn)的位置,將每個中間態(tài)分錄切分成若干個段落,并分別保存;

37、3)科目切分

38、從每個段落中,根據(jù)<name>標(biāo)識符的位置以及換行符的位置,識別出每個段落中包含的各個科目,并將每個科目保存為不同的對象,將每個科目中的標(biāo)識符及其實(shí)質(zhì)性內(nèi)容存儲為該對象下的變量;特別地,對于<spe>標(biāo)識符后的內(nèi)容,將其包含的函數(shù)名稱、各參數(shù)名稱全部單獨(dú)識別出來并保存。

39、進(jìn)一步的,所述中間態(tài)分錄解碼器中包括有計(jì)算模塊,其中存儲有與所有函數(shù)名稱對應(yīng)的計(jì)算邏輯;所述計(jì)算科目數(shù)值包括:

40、對于標(biāo)記符<spe>對應(yīng)的科目數(shù)值需計(jì)算得到,故所述中間態(tài)分錄解碼器對每個段落作如下處理:

41、順序遍歷該段落中所有的科目;

42、若當(dāng)前科目的數(shù)值已知即標(biāo)識符為<num>,或者為<spe>但已經(jīng)被計(jì)算過,則繼續(xù)遍歷;

43、若當(dāng)前科目的數(shù)值未知即標(biāo)識符為<spe>且尚未被計(jì)算過,則判斷對應(yīng)保存的各參數(shù)名稱的各個科目的數(shù)值是否全部已知;若是,則根據(jù)該科目的<spe>中記錄的函數(shù)名稱、參數(shù)名稱及其對應(yīng)數(shù)值,調(diào)用所述計(jì)算模塊,計(jì)算出該函數(shù)名稱對應(yīng)的值,并保存在該科目對象中;該過程中,所述計(jì)算模塊根據(jù)預(yù)設(shè)的格式將計(jì)算過程以文本形式保存,形成解說性文字;

44、至此,一個科目的數(shù)值被計(jì)算完成,然后,繼續(xù)向下遍歷該段落中的科目,直到該段落中的所有科目數(shù)值均為已知狀態(tài);

45、對一個段落的計(jì)算結(jié)束后,對下一個段落重復(fù)執(zhí)行上述過程,直到所有段落都被執(zhí)行完畢。

46、進(jìn)一步的,所有段落的所有科目數(shù)值均計(jì)算完畢后,中間態(tài)分錄解碼器將所有段落進(jìn)行整合,根據(jù)標(biāo)識符<pos>的實(shí)質(zhì)性內(nèi)容,識別出各個段落中需要被輸出在會計(jì)分錄中的科目及其借貸方向,并基于科目的名稱、數(shù)值、借貸方向,將它們組合成格式規(guī)范的會計(jì)分錄文本;與此同時,此前在計(jì)算過程中保存的解說性文字也會被附注到會計(jì)分錄文本的后面,共同作為中間態(tài)分錄解碼器的輸出。

47、進(jìn)一步的,所述預(yù)訓(xùn)練和微調(diào)采用開源通用大模型baichuan2-7b-chat和大模型訓(xùn)練框架llama-factory進(jìn)行,訓(xùn)練數(shù)據(jù)由所述問答對與網(wǎng)絡(luò)搜集的通用語料以2:3的比例組成。

48、一種基于大語言模型的會計(jì)分錄自動編制系統(tǒng),用于實(shí)現(xiàn)如上任一項(xiàng)所述的方法,該系統(tǒng)包括:

49、財(cái)會大模型,用于接收會計(jì)事項(xiàng)輸入,并將其按照預(yù)先設(shè)置的三級結(jié)構(gòu)形式進(jìn)行編碼形成中間態(tài)分錄,輸出至中間態(tài)分錄解碼器;

50、中間態(tài)分錄解碼器,含有計(jì)算模塊,所述中間態(tài)分錄解碼器對接收的中間態(tài)分錄進(jìn)行結(jié)構(gòu)化識別及存儲,并基于所述計(jì)算模塊計(jì)算科目數(shù)值,最終生成對應(yīng)的文字形式的會計(jì)分錄,進(jìn)行輸出呈現(xiàn)。

51、本發(fā)明的有益效果是:

52、本發(fā)明通過構(gòu)建一種用于會計(jì)分錄編制任務(wù)的大語言模型及系統(tǒng),結(jié)合會計(jì)分錄知識創(chuàng)新設(shè)計(jì)并引入了中間態(tài)分錄,并通過中間態(tài)分錄解碼器,充分利用了會計(jì)事項(xiàng)及會計(jì)分錄間的邏輯關(guān)系與數(shù)值計(jì)算方法,可以使本發(fā)明系統(tǒng)更好地理解、處理會計(jì)分錄編制任務(wù),確保了會計(jì)分錄邏輯的準(zhǔn)確性與數(shù)值計(jì)算的精確性。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1