本發(fā)明涉及電子發(fā)票,特別涉及一種用于xml格式數(shù)電票的解析方法、系統(tǒng)及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著稅收數(shù)字化轉(zhuǎn)型的深入推進(jìn),全面數(shù)字化的電子發(fā)票(可簡(jiǎn)稱數(shù)電票)試點(diǎn)范圍不斷擴(kuò)大,對(duì)企業(yè)的發(fā)票管理工作帶來了極大的挑戰(zhàn)。一方面,xml格式的數(shù)電票非常重要,根據(jù)規(guī)定,企業(yè)接收數(shù)電票后,無論是否打印歸檔,都要保存數(shù)電票含有數(shù)字簽名的xml格式電子文件。另一方面,數(shù)電票的版式文件(pdf、ofd)的版面較為簡(jiǎn)潔,其發(fā)票版面未完整顯示發(fā)票信息,只有xml格式的發(fā)票包含完整的信息。然而,xml格式的發(fā)票,形式上是一串代碼,其雖然記錄了發(fā)票的全部數(shù)據(jù),但是xml格式的發(fā)票不適合數(shù)據(jù)閱讀和統(tǒng)計(jì)。目前主要是依靠人工讀取記錄,存在效率低下且錯(cuò)誤率高的問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的主要目的在于解決現(xiàn)有技術(shù)中主要依靠人工讀取xml格式的發(fā)票,存在效率低下且錯(cuò)誤率高的問題。為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基用于xml格式數(shù)電票的解析方法、系統(tǒng)及存儲(chǔ)介質(zhì),能夠批量解析xml格式的數(shù)電票并自動(dòng)導(dǎo)出數(shù)據(jù)至excel,快速、準(zhǔn)確地完成發(fā)票數(shù)據(jù)提取、分類和統(tǒng)計(jì),助力發(fā)票風(fēng)險(xiǎn)管控工作。
2、本發(fā)明一實(shí)施例提供了一種用于xml格式數(shù)電票的解析方法,包括:
3、構(gòu)建發(fā)票解析程序腳本,并將構(gòu)建的發(fā)票解析程序腳本封裝成執(zhí)行文件保存于電子設(shè)備內(nèi);
4、構(gòu)建發(fā)票池文件夾,將待解析的各數(shù)電票存儲(chǔ)于發(fā)票池文件夾內(nèi);
5、運(yùn)行執(zhí)行文件,以對(duì)發(fā)票池文件夾內(nèi)的所有數(shù)電票進(jìn)行批量解析。
6、作為本發(fā)明的一個(gè)具體實(shí)施方式,構(gòu)建發(fā)票解析程序腳本,包括:
7、對(duì)數(shù)電票進(jìn)行解析,構(gòu)建關(guān)于數(shù)電票的dom文檔;
8、獲取dom文檔的各標(biāo)識(shí)元素的數(shù)值,并將獲取到的各標(biāo)識(shí)元素的數(shù)值存儲(chǔ)于相應(yīng)的中轉(zhuǎn)變量中,標(biāo)識(shí)元素包括文檔根元素和特定標(biāo)簽元素;
9、構(gòu)建多個(gè)變量參數(shù),多個(gè)變量參數(shù)與各標(biāo)識(shí)元素一一對(duì)應(yīng);
10、將各中轉(zhuǎn)變量中存儲(chǔ)的元素?cái)?shù)值分別賦值給相應(yīng)的變量參數(shù)內(nèi);
11、構(gòu)建空列表,基于賦值后的多個(gè)變量參數(shù)填充空列表,并保存為excel文件存儲(chǔ)于設(shè)定路徑內(nèi)。
12、作為本發(fā)明的一個(gè)具體實(shí)施方式,構(gòu)建發(fā)票解析程序腳本,還包括:
13、構(gòu)建執(zhí)行窗口、路徑變量以及用于獲取用戶選擇的目錄路徑的獲取函數(shù);
14、執(zhí)行窗口彈出文件對(duì)話框,以允許用戶選擇文件目錄;
15、獲取函數(shù)獲取用戶選擇的文件目錄的路徑,并將所獲取的路徑的值賦值給路徑變量。
16、作為本發(fā)明的一個(gè)具體實(shí)施方式,構(gòu)建發(fā)票解析程序腳本,還包括:
17、定義檢查函數(shù),以用于檢查路徑變量的值是否存在;
18、若路徑變量的值存在,則對(duì)路徑變量的值所對(duì)應(yīng)的路徑下的文件進(jìn)行解析。
19、作為本發(fā)明的一個(gè)具體實(shí)施方式,構(gòu)建發(fā)票解析程序腳本是在python環(huán)境中進(jìn)行的。
20、作為本發(fā)明的一個(gè)具體實(shí)施方式,通過在python中導(dǎo)入tkinter、os、requests、base64、pandas和xml.dom.minidom外部數(shù)據(jù)功能庫構(gòu)建發(fā)票解析程序腳本。
21、作為本發(fā)明的一個(gè)具體實(shí)施方式,用于xml格式數(shù)電票的解析方法還包括:
22、在對(duì)發(fā)票池文件夾內(nèi)的所有數(shù)電票進(jìn)行批量解析后,登錄增值稅發(fā)票綜合服務(wù)平臺(tái),對(duì)解析后的發(fā)票進(jìn)行批量查驗(yàn)和驗(yàn)真,并篩選出需要認(rèn)證的目標(biāo)數(shù)電票,與下載發(fā)票文件匹配,上傳匹配后的發(fā)票文件至登錄增值稅發(fā)票綜合服務(wù)平臺(tái)以進(jìn)行批量認(rèn)證。
23、相應(yīng)的,本發(fā)明一實(shí)施例還提供了一種用于xml格式數(shù)電票的解析系統(tǒng),用于電子設(shè)備,該系統(tǒng)包括:
24、腳本構(gòu)建模塊,用于構(gòu)建發(fā)票解析程序腳本,并將構(gòu)建的發(fā)票解析程序腳本封裝成執(zhí)行文件保存于電子設(shè)備內(nèi);
25、文件夾構(gòu)建模塊,用于構(gòu)建發(fā)票池文件夾,將待解析的各數(shù)電票存儲(chǔ)于發(fā)票池文件夾內(nèi);
26、運(yùn)行模塊,用于運(yùn)行執(zhí)行文件,以對(duì)發(fā)票池文件夾內(nèi)的所有數(shù)電票進(jìn)行批量解析。
27、作為本發(fā)明的一個(gè)具體實(shí)施方式,腳本構(gòu)建模塊包括:
28、解析單元,用于對(duì)數(shù)電票進(jìn)行解析,構(gòu)建關(guān)于數(shù)電票的dom文檔;
29、獲取單元,用于獲取dom文檔的各標(biāo)識(shí)元素的數(shù)值,并將獲取到的各標(biāo)識(shí)元素的數(shù)值存儲(chǔ)于相應(yīng)的中轉(zhuǎn)變量中,標(biāo)識(shí)元素包括文檔根元素和特定標(biāo)簽元素;
30、參數(shù)構(gòu)建單元,用于構(gòu)建多個(gè)變量參數(shù),多個(gè)變量參數(shù)與各標(biāo)識(shí)元素一一對(duì)應(yīng);
31、賦值單元,用于將各中轉(zhuǎn)變量中存儲(chǔ)的元素?cái)?shù)值分別賦值給相應(yīng)的變量參數(shù)內(nèi);
32、列表構(gòu)建單元,用于構(gòu)建空列表,基于賦值后的多個(gè)變量參數(shù)填充空列表,并保存為excel文件存儲(chǔ)于設(shè)定路徑內(nèi)。
33、相應(yīng)的,本發(fā)明一實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有指令,該指令在計(jì)算機(jī)上執(zhí)行時(shí)使得計(jì)算機(jī)執(zhí)行上述任一具體實(shí)施方式中的方法。
34、相比于現(xiàn)有技術(shù),本發(fā)明至少具有以下技術(shù)效果:
35、本發(fā)明提供的用于xml格式數(shù)電票的解析方法,通過構(gòu)建發(fā)票解析程序腳本,能夠?qū)崿F(xiàn)批量解析xml格式的數(shù)電票并自動(dòng)導(dǎo)出數(shù)據(jù)至excel,實(shí)現(xiàn)了快速、準(zhǔn)確地完成數(shù)據(jù)提取、分類和統(tǒng)計(jì)工作,多維度管控發(fā)票真實(shí)性、合規(guī)性以及重復(fù)入賬等風(fēng)險(xiǎn)。
1.一種用于xml格式數(shù)電票的解析方法,其特征在于,包括:
2.如權(quán)利要求1所述的方法,其特征在于,構(gòu)建發(fā)票解析程序腳本,包括:
3.如權(quán)利要求2所述的方法,其特征在于,構(gòu)建發(fā)票解析程序腳本,還包括:
4.如權(quán)利要求3所述的方法,其特征在于,構(gòu)建發(fā)票解析程序腳本,還包括:
5.如權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,構(gòu)建發(fā)票解析程序腳本是在python環(huán)境中進(jìn)行的。
6.如權(quán)利要求5所述的方法,其特征在于,通過在python中導(dǎo)入tkinter、os、requests、base64、pandas和xml.dom.minidom外部數(shù)據(jù)功能庫構(gòu)建所述發(fā)票解析程序腳本。
7.如權(quán)利要求1所述的方法,其特征在于,還包括:
8.一種用于xml格式數(shù)電票的解析系統(tǒng),用于電子設(shè)備,其特征在于,包括
9.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述腳本構(gòu)建模塊包括:
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有指令,該指令在計(jì)算機(jī)上執(zhí)行時(shí)使得計(jì)算機(jī)執(zhí)行權(quán)利要求1~7任一項(xiàng)所述的揚(yáng)聲器溫度控制方法。