本發(fā)明屬于機(jī)器學(xué)習(xí)應(yīng)用,具體涉及不確定性量化輔助機(jī)器學(xué)習(xí)優(yōu)化鈦合金熱處理工藝的方法。
背景技術(shù):
1、近期,機(jī)器學(xué)習(xí)(ml)已應(yīng)用于材料科學(xué)的研究,以加速材料發(fā)現(xiàn)及優(yōu)化。通常,機(jī)器學(xué)習(xí)從輸入到輸出的映射,輸入通常是成分、加工參數(shù)和實(shí)驗(yàn)條件等特征,而輸出是相關(guān)屬性,如抗拉強(qiáng)度、屈服強(qiáng)度、彈性模量、拉伸應(yīng)變等。在鈦合金熱處理工藝優(yōu)化方面,傳統(tǒng)方法是通過“試錯(cuò)法”不斷調(diào)整熱處理工藝,這種方法成本過高,且周期較長。因此,需要研究一種基于理論的優(yōu)化策略方法,能夠同時(shí)考慮全套多尺度信息,且能提高目標(biāo)性能的預(yù)測精度。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提供不確定性量化輔助機(jī)器學(xué)習(xí)優(yōu)化鈦合金熱處理工藝的方法,解決了現(xiàn)有技術(shù)中需通過“試錯(cuò)法”不斷調(diào)整熱處理工藝,成本過高,周期較長的問題。
2、本發(fā)明所采用的技術(shù)方案是:不確定性量化輔助機(jī)器學(xué)習(xí)優(yōu)化鈦合金熱處理工藝的方法,具體步驟如下:
3、s1、用spssau設(shè)計(jì)四因素五水平正交實(shí)驗(yàn),構(gòu)建機(jī)器學(xué)習(xí)數(shù)據(jù)庫;
4、s2、使用機(jī)器學(xué)習(xí)對熱處理工藝及高溫拉伸性能進(jìn)行建模預(yù)測,同時(shí)結(jié)合重采樣方法考慮模型的不確定性量化,并將不確定性量化的結(jié)果作為模型篩選的指標(biāo),選擇出最后模型并進(jìn)行訓(xùn)練;
5、s3、生成預(yù)測所用的虛擬空間,利用s2選出的模型對虛擬空間中數(shù)據(jù)的高溫拉伸性能進(jìn)行建模預(yù)測,對高溫拉伸性能進(jìn)行多目標(biāo)優(yōu)化計(jì)算出eih值,預(yù)測強(qiáng)塑性匹配提升的最佳加工參數(shù)。
6、本發(fā)明的特點(diǎn)還在于:
7、s1的具體方法為:
8、基于鈦合金不同加工條件,用spssau設(shè)計(jì)四因素五水平正交實(shí)驗(yàn),其中訓(xùn)練模型的特征包括固溶溫度、固溶時(shí)間、時(shí)效溫度、時(shí)效時(shí)間,時(shí)效溫度取值分別為670℃、700℃、730℃、760℃和790℃;時(shí)效時(shí)間取值分別為1h、2h、3h、4h和5h;固溶溫度取值分別為900℃、950℃、1000℃、1050℃和1100℃;固溶時(shí)間取值分別為1h、2h、3h、4h和5h;
9、針對正交試驗(yàn)輸出相應(yīng)的目標(biāo)測試性能,目標(biāo)測試性能包括高溫屈服強(qiáng)度和高溫?cái)嗔蜒由炻?,根?jù)輸出的數(shù)據(jù)構(gòu)建機(jī)器及其學(xué)習(xí)數(shù)據(jù)庫。
10、s2中高溫拉伸性能包括高溫屈服強(qiáng)度和高溫?cái)嗔蜒由炻剩?/p>
11、s2的具體操作過程為:
12、s2.1、設(shè)置不同機(jī)器學(xué)習(xí)模型,通過原始數(shù)據(jù)集分別對不同的機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,并用測試集分別對訓(xùn)練后的機(jī)器學(xué)習(xí)模型進(jìn)行評估,從而篩選掉綜合表現(xiàn)最差的模型;
13、s2.2、對剩余的機(jī)器學(xué)習(xí)模型進(jìn)行下一步模型訓(xùn)練,分別對高溫屈服強(qiáng)度和高溫?cái)嗔蜒由炻蔬M(jìn)行建模,對不同機(jī)器學(xué)習(xí)模型性能進(jìn)行評估,分別選出高溫屈服強(qiáng)度和高溫?cái)嗔蜒由炻矢髯詫?yīng)的最佳機(jī)器學(xué)習(xí)模型,利用重采樣方法進(jìn)行不確定性量化,以進(jìn)行下一步優(yōu)化;
14、s2.3、通過上述模型性能及不確定性量化指標(biāo)的分析,分別選擇測試集回歸系數(shù)高且不確定性小的機(jī)器學(xué)習(xí)模型作為高溫屈服強(qiáng)度和高溫?cái)嗔蜒由炻实淖罴杨A(yù)測模型。
15、s2.1~s2.3中對機(jī)器學(xué)習(xí)模型進(jìn)行評估的具體方法均為:分別對所選機(jī)器學(xué)習(xí)模型的性能進(jìn)行評估,機(jī)器學(xué)習(xí)模型的性能指標(biāo)包括:回歸系數(shù)r2、平均絕對誤差mae及均方根誤差rmse,采用上述指標(biāo)的準(zhǔn)確率來評估訓(xùn)練后的模型,篩選出性能最好的模型。
16、s2.1中原始數(shù)據(jù)集為每個(gè)參數(shù)下取三個(gè)平行樣本在700℃下進(jìn)行高溫拉伸性能測試,共獲得25組實(shí)驗(yàn)數(shù)據(jù),實(shí)驗(yàn)數(shù)據(jù)為三個(gè)水平樣的平均值,即為原始數(shù)據(jù)集;
17、s2.1的具體過程為:設(shè)置支持向量回歸模型svr、高斯回歸模型gp、隨機(jī)森林rf、從sklearn中調(diào)用線性回歸模型lr及極端梯度提升模型xgb等機(jī)器學(xué)習(xí)模型,按2:8的比例把原始數(shù)據(jù)集隨機(jī)劃分為測試集和訓(xùn)練集,以訓(xùn)練集樣本的均值與方差分別對訓(xùn)練集和測試集進(jìn)行標(biāo)準(zhǔn)化處理,而后利用標(biāo)準(zhǔn)化后的數(shù)據(jù)分別對不同機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,并對訓(xùn)練集數(shù)據(jù)進(jìn)行重采樣,根據(jù)采樣數(shù)據(jù),分別選出高溫屈服強(qiáng)度和高溫?cái)嗔蜒由炻矢髯詫?yīng)的最佳機(jī)器學(xué)習(xí)模型。
18、s2.2的具體過程為:
19、選擇隨機(jī)森林模型rf、支持向量回歸模型svr、極端梯度提升模型xgb以及高斯回歸模型gp重新進(jìn)行機(jī)器學(xué)習(xí)建模;利用重采樣方法進(jìn)行不確定性量化,重采樣方法具體為對經(jīng)s2.1標(biāo)準(zhǔn)化處理后的數(shù)據(jù)集以2:8劃分為測試集和訓(xùn)練集,然后使用與s2.1相同的模型訓(xùn)練方法分別對剩余的模型進(jìn)行進(jìn)一步模型訓(xùn)練,共將模型訓(xùn)練1000次,獲得1000個(gè)預(yù)測值。
20、s2.3的具體過程為:通過預(yù)測均值、預(yù)測標(biāo)準(zhǔn)差和真實(shí)值,計(jì)算得到誤校準(zhǔn)面積和采用回歸系數(shù)r2,進(jìn)而通過不同模型的不確定性量化能力和精度篩選出最終的模型。
21、s3的具體操作為:
22、s3.1、生成預(yù)測所用的虛擬空間,虛擬空間共設(shè)定固溶溫度、固溶時(shí)間、時(shí)效時(shí)間和時(shí)效溫度四個(gè)參數(shù);
23、s3.2、分別用篩選出的兩種模型對相應(yīng)的高溫拉伸性能進(jìn)行預(yù)測,并以其預(yù)測均值與方差進(jìn)行多目標(biāo)優(yōu)化的eih計(jì)算,并根據(jù)eih值從大到小對工藝參數(shù)進(jìn)行排序,最終得到最佳加工參數(shù)。
24、s3.1中設(shè)定四種參數(shù)范圍的具體操作為:固溶溫度范圍根據(jù)鈦合金β相變點(diǎn)確定,鈦合金β相變點(diǎn)為1050℃,兩相區(qū)為930℃~1050℃,確定α相區(qū)以下的某一溫度t為起始溫度,固溶處理溫度的上邊界為t1,步長為n1℃,其中t的取值為900℃,t1取值為1200℃,n1取值為10℃,固溶溫度取值范圍為500℃~800℃;
25、時(shí)效溫度為鈦合金的服役溫度以上,采用的溫度范圍為500~800℃,步長為n1℃,n1取值為10℃;
26、固溶時(shí)間和時(shí)效時(shí)間均采用的時(shí)間范圍為0.5~7h,步長為n2h,n2取值為0.5h。
27、s3.2的具體操作方法為:
28、通過步驟s2.2中訓(xùn)練得到的兩個(gè)模型對虛擬空間的樣本進(jìn)行預(yù)測,通過得到eih值高的熱處理工藝,進(jìn)而得到兼顧強(qiáng)度與塑性指標(biāo)的帕累托前沿;
29、得到帕累托前沿的具體方法如下:用基于超體積的預(yù)期改進(jìn)方法,通過表示帕累托優(yōu)勢,定義am為所有arm的集合,其中a:,m的元素被稱為逼近集,逼近集合a的超體積指標(biāo)h(即:超體積)定義為受限于參考點(diǎn)(即被a中的每個(gè)元素都支配的點(diǎn))的被支配子空間的體積,公式如下:
30、h(a)=vol(1)
31、基于超體積的改進(jìn)函數(shù)i:rm×am→r被定義為
32、i(y,a)=h—h(a)(2)
33、其中yrm,且aam;
34、考慮到回歸模型的預(yù)測,對于x中的一些xx,其形式為具有均值和標(biāo)準(zhǔn)差的獨(dú)立m維正態(tài)分布;
35、關(guān)于逼近集合a的點(diǎn)x處的期望改進(jìn),表示為eih(x,a),定義如下:
36、eih(x,a)=pdfx(y)dy(3)
37、其中,積分區(qū)域r是rm;
38、eih值是一個(gè)多目標(biāo)問題的評判指標(biāo),如果一個(gè)數(shù)據(jù)點(diǎn)的eih值越大,就說明這個(gè)點(diǎn)對于將帕累托前沿向前推進(jìn)有著最大的數(shù)學(xué)期望。
39、本發(fā)明的有益效果是:
40、(1)本發(fā)明通過集成傳統(tǒng)ml模型,集成了xgboost、線性回歸模型、極端梯度回歸、隨機(jī)森林等單一模型來增強(qiáng)預(yù)測,有效的利用己有的數(shù)據(jù),構(gòu)建了固溶溫度、固溶時(shí)間、時(shí)效溫度和時(shí)效時(shí)間與目標(biāo)特征的定量關(guān)系模型,在此基礎(chǔ)上,利用重采樣方法實(shí)現(xiàn)模型的不確定性量化,且利用基于超體積的預(yù)期改進(jìn)方法的多目標(biāo)優(yōu)化方法,超體積指標(biāo)不需要關(guān)于帕累托前沿的先驗(yàn)知識,最大化超體積指標(biāo)的集合是有效集的子集,相應(yīng)的目標(biāo)矢量涵蓋帕累托前沿;本發(fā)明將超體積的期望增益視為對多目標(biāo)域中期望改進(jìn)的一般化從對材料強(qiáng)度或塑性性能的預(yù)測到材料強(qiáng)塑性匹配提升提供了一種思路方法;
41、(2)本發(fā)明優(yōu)化方法中數(shù)據(jù)驅(qū)動(dòng)的建模:使用機(jī)器學(xué)習(xí)對高溫拉伸性能進(jìn)行預(yù)測,提高了模型預(yù)測的準(zhǔn)確性;
42、不確定性量化:通過重采樣技術(shù)評估模型預(yù)測的可靠性,確保結(jié)果的可信度;
43、多目標(biāo)優(yōu)化:采用多目標(biāo)優(yōu)化算法,平衡強(qiáng)度和塑性,尋找最佳的熱處理工藝參數(shù);
44、虛擬空間生成:構(gòu)建虛擬空間預(yù)測未知參數(shù),減少實(shí)驗(yàn)次數(shù),提高研究效率。