本發(fā)明涉及物料信息化領(lǐng)域。更具體地說,本發(fā)明涉及一種基于ai的bom物料信息自動(dòng)編碼方法。
背景技術(shù):
1、在制造業(yè)、電子信息產(chǎn)業(yè)等眾多行業(yè)中,物料清單(bom)作為描述產(chǎn)品結(jié)構(gòu)的核心文件,詳細(xì)記錄了產(chǎn)品所需的各種物料信息。對(duì)物料信息進(jìn)行高效管理,尤其是精準(zhǔn)、統(tǒng)一的編碼,是企業(yè)實(shí)現(xiàn)生產(chǎn)流程優(yōu)化、成本控制以及供應(yīng)鏈協(xié)同的關(guān)鍵。傳統(tǒng)的物料信息編碼方式,多依賴人工操作,存在諸多難以克服的問題。人工編碼存在如下不能克服的缺陷:一是效率低下,影響企業(yè)采購、生產(chǎn)、庫存等流程的進(jìn)度;二是準(zhǔn)確性不能保證,引發(fā)后續(xù)采購、生產(chǎn)、庫存管理等環(huán)節(jié)的連鎖反應(yīng);三是缺乏統(tǒng)一的標(biāo)準(zhǔn),無法實(shí)現(xiàn)物料編碼信息的共享。因此,開發(fā)一種能夠自動(dòng)、準(zhǔn)確且高效地對(duì)物料清單中的物料信息進(jìn)行編碼的方法迫在眉睫。隨著人工智能(ai)技術(shù)的飛速發(fā)展,其在各行業(yè)的應(yīng)用日益廣泛,為解決物料編碼問題帶來了新的契機(jī)。ai憑借強(qiáng)大的數(shù)據(jù)分析、模式識(shí)別和預(yù)測(cè)能力,理論上能夠?qū)崿F(xiàn)物料信息的自動(dòng)化編碼,有望突破傳統(tǒng)人工編碼的局限。然而,在實(shí)際物料管理過程中,諸多因素給基于ai的物料信息自動(dòng)化編碼帶來了巨大挑戰(zhàn)。
2、首先,在實(shí)際物料管理過程中,由于企業(yè)內(nèi)部不同部門或不同業(yè)務(wù)環(huán)節(jié)所使用的物料清單格式千差萬別。在研發(fā)部門,為方便記錄產(chǎn)品設(shè)計(jì)思路,物料清單可能側(cè)重于物料的技術(shù)規(guī)格和設(shè)計(jì)參數(shù),格式較為靈活;而生產(chǎn)部門為便于安排生產(chǎn)流程和物料配送,其物料清單更關(guān)注物料的生產(chǎn)工藝和裝配順序,格式又有所不同。在電子制造企業(yè),研發(fā)部門可能會(huì)按功能模塊羅列物料,生產(chǎn)部門則可能依據(jù)生產(chǎn)線順序排列,導(dǎo)致物料清單的數(shù)據(jù)結(jié)構(gòu)混亂,難以直接轉(zhuǎn)換成統(tǒng)一的標(biāo)準(zhǔn)清單。供應(yīng)商提供的物料清單格式更是多種多樣,有的以excel表格形式呈現(xiàn),有的則是pdf文檔,甚至部分供應(yīng)商以自定義的電子文檔格式提供,這使得企業(yè)在整合物料清單數(shù)據(jù)時(shí),需要耗費(fèi)大量時(shí)間和人力進(jìn)行格式轉(zhuǎn)換和數(shù)據(jù)梳理。
3、其次,物料清單中的數(shù)據(jù)錯(cuò)誤極為常見,物料名稱拼寫錯(cuò)誤、物料規(guī)格型號(hào)表述模糊、物料封裝形式記錄不準(zhǔn)確等問題屢見不鮮。以一家汽車制造企業(yè)為例,在采購發(fā)動(dòng)機(jī)零部件的物料清單中,可能將某個(gè)關(guān)鍵零部件的名稱拼寫錯(cuò)誤,導(dǎo)致后續(xù)在與供應(yīng)商溝通以及質(zhì)量追溯時(shí)產(chǎn)生嚴(yán)重問題。這些錯(cuò)誤數(shù)據(jù)使得物料清單無法直接作為標(biāo)準(zhǔn)清單使用,因?yàn)闃?biāo)準(zhǔn)清單要求數(shù)據(jù)準(zhǔn)確無誤,否則會(huì)對(duì)整個(gè)生產(chǎn)流程產(chǎn)生連鎖負(fù)面影響。
4、最后,物料清單中還存在嚴(yán)重的信息缺失問題,部分物料清單可能缺少關(guān)鍵的物料組別信息,這使得企業(yè)無法清晰區(qū)分物料的類別,不利于物料的分類管理和庫存盤點(diǎn)。一些物料清單可能沒有記錄物料的位號(hào),導(dǎo)致在生產(chǎn)裝配過程中無法準(zhǔn)確確定物料的安裝位置,影響生產(chǎn)效率和產(chǎn)品質(zhì)量。在物料用量信息方面,也可能出現(xiàn)數(shù)據(jù)不準(zhǔn)確或缺失的情況,這會(huì)給采購計(jì)劃制定和庫存管理帶來極大困擾,使得物料清單難以轉(zhuǎn)化為標(biāo)準(zhǔn)清單,無法為企業(yè)的生產(chǎn)運(yùn)營(yíng)提供可靠的數(shù)據(jù)支持。
5、隨著智能制造的發(fā)展,生產(chǎn)流程的自動(dòng)化和信息化程度不斷提高,對(duì)物料清單的標(biāo)準(zhǔn)化要求也越來越高。自動(dòng)化生產(chǎn)線需要準(zhǔn)確無誤的標(biāo)準(zhǔn)清單來實(shí)現(xiàn)物料的自動(dòng)配送和裝配,工業(yè)互聯(lián)網(wǎng)的發(fā)展也要求企業(yè)與供應(yīng)商、合作伙伴之間能夠基于標(biāo)準(zhǔn)清單進(jìn)行高效的數(shù)據(jù)共享和協(xié)同工作。然而,當(dāng)前物料清單的上述問題給物料信息自動(dòng)化編碼帶來了挑戰(zhàn),嚴(yán)重阻礙了企業(yè)的數(shù)字化轉(zhuǎn)型和智能化發(fā)展進(jìn)程。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的一個(gè)目的是解決至少上述問題,并提供至少后面將說明的優(yōu)點(diǎn)。
2、本發(fā)明還有一個(gè)目的是提供一種基于ai的bom物料信息自動(dòng)編碼方法,其能夠提升物料數(shù)據(jù)準(zhǔn)確性與標(biāo)準(zhǔn)化程度,大幅提高編碼效率,實(shí)現(xiàn)物料管理智能化、精細(xì)化,打破企業(yè)內(nèi)外部信息壁壘,增強(qiáng)協(xié)同性,優(yōu)化生產(chǎn)、采購等流程,為企業(yè)降本增效提供有力支撐。
3、為了實(shí)現(xiàn)根據(jù)本發(fā)明的這些目的和其它優(yōu)點(diǎn),提供了一種基于ai的bom物料信息自動(dòng)編碼方法,包括:
4、s1、統(tǒng)一產(chǎn)品任一階段制定的物料清單的數(shù)據(jù)結(jié)構(gòu),存儲(chǔ)為多個(gè)單條物料清單數(shù)據(jù)的集合,任一單條物料清單數(shù)據(jù)至少包括物料名稱、物料組別、物料規(guī)格型號(hào)、位號(hào)、物料封裝形式以及物料用量;
5、s2、采用ai識(shí)別物料清單中位號(hào)及物料用量;
6、s3、篩選出位號(hào)數(shù)據(jù)具有單一性的各單條物料清單數(shù)據(jù),并提取各單條物料清單數(shù)據(jù)中物料名稱、物料規(guī)格型號(hào)、位號(hào)以及物料封裝形式四個(gè)數(shù)據(jù),將單條物料清單數(shù)據(jù)的四個(gè)數(shù)據(jù)與預(yù)先構(gòu)建的標(biāo)準(zhǔn)數(shù)據(jù)庫中數(shù)據(jù)比對(duì),若該單條物料清單數(shù)據(jù)的四個(gè)數(shù)據(jù)與所述標(biāo)準(zhǔn)數(shù)據(jù)庫中一個(gè)條目完全匹配,則將該單條物料數(shù)據(jù)替換成標(biāo)準(zhǔn)數(shù)據(jù)庫中對(duì)應(yīng)的條目但保留單條物料數(shù)據(jù)中位號(hào)及對(duì)應(yīng)的物料用量數(shù)據(jù),形成單條物料標(biāo)準(zhǔn)數(shù)據(jù);否則對(duì)該單條物料清單數(shù)據(jù)進(jìn)行清洗后,重新與所述標(biāo)準(zhǔn)數(shù)據(jù)庫中數(shù)據(jù)比對(duì),若清洗后的單條物料清單數(shù)據(jù)的四個(gè)數(shù)據(jù)與所述標(biāo)準(zhǔn)數(shù)據(jù)庫中一個(gè)條目完全匹配,則將該單條物料數(shù)據(jù)替換成標(biāo)準(zhǔn)數(shù)據(jù)庫中對(duì)應(yīng)的條目但保留單條物料數(shù)據(jù)中位號(hào)及對(duì)應(yīng)的物料用量數(shù)據(jù),形成單條物料標(biāo)準(zhǔn)數(shù)據(jù);
7、s4、采用ai根據(jù)單條物料標(biāo)準(zhǔn)數(shù)據(jù)中的物料規(guī)格型號(hào)、位號(hào)以及物料封裝形式生成唯一型號(hào)編碼,并以物料組別加唯一型號(hào)編碼的形式編碼物料;
8、其中,對(duì)單條物料清單數(shù)據(jù)進(jìn)行清洗的方法為:根據(jù)預(yù)先構(gòu)建的電子器件領(lǐng)域標(biāo)準(zhǔn)詞匯表糾正物料名稱、物料規(guī)格型號(hào)及物料封裝形式的拼寫錯(cuò)誤。
9、優(yōu)選的是,步驟s3中經(jīng)清洗后仍與所述標(biāo)準(zhǔn)數(shù)據(jù)庫中數(shù)據(jù)無法完全匹配的單條物料清單數(shù)據(jù),進(jìn)一步進(jìn)行如下處理:
10、a1、利用預(yù)先構(gòu)建的電子元器件領(lǐng)域知識(shí)圖譜,從該單條物料清單數(shù)據(jù)中找出物料關(guān)鍵參數(shù)數(shù)據(jù),所述物料關(guān)鍵參數(shù)數(shù)據(jù)包括元器件類型、封裝形式和性能參數(shù),
11、a2、統(tǒng)一同類關(guān)鍵參數(shù)的表達(dá)形式,并通過向量轉(zhuǎn)換模型,將所述物料關(guān)鍵參數(shù)數(shù)據(jù)轉(zhuǎn)換為低維數(shù)字向量;
12、a3、給不同關(guān)鍵參數(shù)數(shù)據(jù)分配權(quán)重后,將所有關(guān)鍵參數(shù)向量數(shù)據(jù)加權(quán)組合,生成該單條物料清單數(shù)據(jù)的綜合向量;
13、a4、通過余弦距離算法,計(jì)算該單條物料清單數(shù)據(jù)的綜合向量與所述標(biāo)準(zhǔn)數(shù)據(jù)庫中各條目的綜合向量之間的余弦距離,若所得余弦距離超過設(shè)定的匹配閾值,則將該單條物料數(shù)據(jù)替換成標(biāo)準(zhǔn)數(shù)據(jù)庫中對(duì)應(yīng)的條目但物料用量數(shù)據(jù)保留單條物料數(shù)據(jù)中物料用量數(shù)據(jù),形成單條物料標(biāo)準(zhǔn)數(shù)據(jù)。
14、優(yōu)選的是,若a4中所得余弦距離超過所述匹配閾值的條目大于1,則:
15、將余弦距離超過所述匹配閾值的多個(gè)條目按照余弦距離從小到大進(jìn)行排序,選取余弦距離最小的條目作為所述標(biāo)準(zhǔn)數(shù)據(jù)庫中對(duì)應(yīng)的條目。
16、優(yōu)選的是,若a4中所得余弦距離超過所述匹配閾值的條目大于1,則:
17、將余弦距離超過所述匹配閾值的多個(gè)條目按照余弦距離從小到大進(jìn)行排序,選取余弦距離最小和次小的兩個(gè)條目,進(jìn)一步計(jì)算兩個(gè)條目對(duì)應(yīng)的余弦距離的差值,若所述差值不大于0.05,則選取余弦距離最小的條目作為所述標(biāo)準(zhǔn)數(shù)據(jù)庫中對(duì)應(yīng)的條目,否則,進(jìn)一步統(tǒng)計(jì)兩個(gè)條目物料關(guān)鍵參數(shù)數(shù)據(jù)的數(shù)量,選取物料關(guān)鍵參數(shù)數(shù)據(jù)數(shù)量較大的條目作為所述標(biāo)準(zhǔn)數(shù)據(jù)庫中對(duì)應(yīng)的條目。
18、優(yōu)選的是,a4中還包括以下步驟:
19、b1、建立歷史匹配數(shù)據(jù)庫,計(jì)算標(biāo)準(zhǔn)數(shù)據(jù)庫中各個(gè)條目在歷史匹配過程中被選中的頻率;
20、b2、所得余弦距離超過所述匹配閾值的條目大于1時(shí),選取歷史匹配過程中被選中頻率最高的條目作為所述標(biāo)準(zhǔn)數(shù)據(jù)庫中對(duì)應(yīng)的條目。
21、優(yōu)選的是,步驟s1中還包括對(duì)產(chǎn)品任一階段制定的物料清單進(jìn)行格式識(shí)別并選擇相應(yīng)的處理工具對(duì)物料清單中的數(shù)據(jù)進(jìn)行初步檢測(cè),將缺少物料名稱、物料組別、物料規(guī)格型號(hào)、位號(hào)、物料封裝形式以及物料用量任一數(shù)據(jù)的物料清單返回物料清單提供方補(bǔ)充缺少信息。
22、優(yōu)選的是,在所述步驟s1中,統(tǒng)一產(chǎn)品任一階段制定的物料清單的數(shù)據(jù)結(jié)構(gòu)包括以下步驟:
23、對(duì)產(chǎn)品任一階段制定的物料清單進(jìn)行格式識(shí)別,其中包括:
24、c1、通過文件擴(kuò)展名識(shí)別出文件格式a,通過文件頭識(shí)別出文件格式b;
25、c2、利用文件格式判斷規(guī)則庫中多種規(guī)則,對(duì)文件格式a和文件格式b分別進(jìn)行判定,將各種規(guī)則的判定結(jié)果量化為得分,并給予各個(gè)得分分配權(quán)重,根據(jù)得分和權(quán)重加權(quán)組合形成文件格式a的綜合得分和文件格式b的綜合得分,選取綜合得分較大的文件格式為物料清單的文件格式;
26、根據(jù)識(shí)別出的文件格式,選擇相應(yīng)的處理工具提取出物料清單中的各種數(shù)據(jù),生成統(tǒng)一數(shù)據(jù)結(jié)構(gòu)的單條物料清單數(shù)據(jù)。
27、優(yōu)選的是,步驟s1中統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)至少包括以下字段:
28、物料名稱字段,用于明確標(biāo)識(shí)物料的具體稱謂,其數(shù)據(jù)類型為字符串;
29、物料組別字段,用于對(duì)物料按照功能、來源或生產(chǎn)階段的分類標(biāo)準(zhǔn)進(jìn)行分組,其數(shù)據(jù)類型為字符串;
30、物料規(guī)格型號(hào)字段,用于記錄物料的各項(xiàng)技術(shù)參數(shù)與型號(hào)規(guī)格,其數(shù)據(jù)類型為字符串;
31、位號(hào)字段,用于標(biāo)識(shí)物料在產(chǎn)品結(jié)構(gòu)中的具體位置編號(hào),其數(shù)據(jù)類型為字符串;
32、物料封裝形式字段,用于記錄物料的封裝類型,其數(shù)據(jù)類型為字符串;以及
33、物料用量信息字段,用于記錄物料的數(shù)量,其數(shù)據(jù)類型為整數(shù)。
34、優(yōu)選的是,步驟s3中篩選物料清單中位號(hào)數(shù)據(jù)具有單一性的方法包括:讀取一條物料清單數(shù)據(jù),將其位號(hào)與已記錄的位號(hào)進(jìn)行比對(duì),并更新頻次信息,如果該位號(hào)的頻次信息大于1,則判定為非單一性位號(hào)。
35、優(yōu)選的是,對(duì)單條物料清單數(shù)據(jù)進(jìn)行清洗前需去除噪聲數(shù)據(jù),所述去除噪聲數(shù)據(jù)的方法包括:
36、d1、將單條物料清單數(shù)據(jù)作為核心數(shù)據(jù)源,確定其物料名稱信息,并提取該物料的關(guān)鍵參數(shù)數(shù)據(jù);
37、d2、再將該物料產(chǎn)品設(shè)計(jì)圖紙、生產(chǎn)工藝文檔以及供應(yīng)商提供的物料說明作為數(shù)據(jù)來源,針對(duì)不同數(shù)據(jù)源的數(shù)據(jù)格式差異,進(jìn)行統(tǒng)一化處理后,提取一個(gè)或者多個(gè)來源的物料關(guān)鍵參數(shù)數(shù)據(jù);
38、d3、合并步驟d1和d2中提取到的數(shù)據(jù),合成一個(gè)綜合的特征向量,用來代表該物料;
39、d4、利用數(shù)據(jù)挖掘算法,挖掘該特征向量中不同特征之間的頻繁項(xiàng)集與關(guān)聯(lián)規(guī)則;
40、d5、當(dāng)讀取一條待去噪的單條物料清單數(shù)據(jù)時(shí),首先確定其物料名稱信息,用物料名稱信息匹配上單條物料清單數(shù)據(jù)中相同物料名稱的單條物料清單數(shù)據(jù),然后提取相應(yīng)的不同特征之間的頻繁項(xiàng)集與關(guān)聯(lián)規(guī)則,根據(jù)這些頻繁項(xiàng)集與關(guān)聯(lián)規(guī)則對(duì)這條待去噪的單條物料清單數(shù)據(jù)執(zhí)行去噪操作。
41、本發(fā)明至少包括以下有益效果:
42、其一、本發(fā)明提供的基于ai的bom物料信息自動(dòng)編碼方法實(shí)現(xiàn)了對(duì)物料清單數(shù)據(jù)結(jié)構(gòu)的統(tǒng)一,明確了物料名稱、物料組別等關(guān)鍵信息的記錄規(guī)范,不但從源頭上確保數(shù)據(jù)的完整性與一致性,還為后續(xù)編碼工作簡(jiǎn)化了數(shù)據(jù)處理量,通過與標(biāo)準(zhǔn)數(shù)據(jù)庫的比對(duì)和清洗機(jī)制,基于電子器件領(lǐng)域標(biāo)準(zhǔn)詞匯表糾正拼寫錯(cuò)誤,使得物料數(shù)據(jù)符合行業(yè)標(biāo)準(zhǔn),有效避免了因數(shù)據(jù)不規(guī)范導(dǎo)致的信息誤解與錯(cuò)誤傳遞;
43、其二、本發(fā)明提供的基于ai的bom物料信息自動(dòng)編碼方法從物料清單的數(shù)據(jù)收集、處理、標(biāo)準(zhǔn)化到編碼,貫穿企業(yè)物料管理全流程;在生產(chǎn)環(huán)節(jié),準(zhǔn)確的物料編碼助力生產(chǎn)計(jì)劃精準(zhǔn)制定和物料配送;在采購環(huán)節(jié),便于與供應(yīng)商高效溝通;在庫存管理環(huán)節(jié),利于庫存盤點(diǎn)與控制,全面提升企業(yè)物料管理的精細(xì)化水平,優(yōu)化企業(yè)運(yùn)營(yíng)流程,降低運(yùn)營(yíng)成本,增強(qiáng)企業(yè)競(jìng)爭(zhēng)力;
44、其三、本發(fā)明提供的基于ai的bom物料信息自動(dòng)編碼方法針對(duì)與標(biāo)準(zhǔn)數(shù)據(jù)庫無法直接匹配的物料數(shù)據(jù),運(yùn)用電子元器件領(lǐng)域知識(shí)圖譜、向量轉(zhuǎn)換模型和余弦距離算法技術(shù),通過找出物料關(guān)鍵參數(shù)數(shù)據(jù),轉(zhuǎn)換為低維數(shù)字向量,計(jì)算余弦距離,實(shí)現(xiàn)對(duì)復(fù)雜物料數(shù)據(jù)的智能化匹配,當(dāng)面對(duì)新型電子元器件時(shí),即便其數(shù)據(jù)格式特殊,也能高效找到標(biāo)準(zhǔn)數(shù)據(jù)庫中的對(duì)應(yīng)條目,顯著提升物料編碼的適用性與靈活性;
45、其四、本發(fā)明提供的基于ai的bom物料信息自動(dòng)編碼方法中當(dāng)余弦距離匹配結(jié)果不唯一時(shí),采用多種策略進(jìn)行處理,如按余弦距離排序選取最小條目,或進(jìn)一步計(jì)算最小和次小條目余弦距離差值,結(jié)合物料關(guān)鍵參數(shù)數(shù)據(jù)數(shù)量,甚至考慮歷史匹配頻率等因素,這些策略從多個(gè)維度優(yōu)化匹配決策,適配不同多種場(chǎng)景,確保選取最符合實(shí)際的標(biāo)準(zhǔn)條目,提高物料編碼的準(zhǔn)確性與可靠性;
46、其五、本發(fā)明提供的基于ai的bom物料信息自動(dòng)編碼方法公開了對(duì)物料清單的格式識(shí)別與處理的流程,通過文件擴(kuò)展名和文件頭識(shí)別文件格式,利用格式判斷規(guī)則庫量化判定結(jié)果,加權(quán)組合形成綜合得分來確定格式,進(jìn)而選擇相應(yīng)工具提取數(shù)據(jù),使得所述物料信息自動(dòng)編碼方法能夠適應(yīng)多種格式的物料清單,確保從不同來源的物料清單中準(zhǔn)確提取數(shù)據(jù),為后續(xù)的標(biāo)準(zhǔn)化和編碼工作提供有效數(shù)據(jù)支持,保障了物料管理流程的連貫性與高效性;
47、其六、本發(fā)明提供的基于ai的bom物料信息自動(dòng)編碼方法公開了利用數(shù)據(jù)挖掘算法去除噪聲數(shù)據(jù),以物料產(chǎn)品設(shè)計(jì)圖紙、生產(chǎn)工藝文檔等多源數(shù)據(jù)為支撐,通過提取關(guān)鍵參數(shù)數(shù)據(jù),合并形成綜合特征向量,挖掘頻繁項(xiàng)集與關(guān)聯(lián)規(guī)則,能精準(zhǔn)識(shí)別并去除單條物料清單數(shù)據(jù)中的噪聲;保證了編碼數(shù)據(jù)的純凈度,為后續(xù)編碼的準(zhǔn)確性奠定堅(jiān)實(shí)基礎(chǔ)。
48、本發(fā)明的其它優(yōu)點(diǎn)、目標(biāo)和特征將部分通過下面的說明體現(xiàn),部分還將通過對(duì)本發(fā)明的研究和實(shí)踐而為本領(lǐng)域的技術(shù)人員所理解。