本發(fā)明涉及工業(yè)自動(dòng)控制,特別是涉及一種智能調(diào)節(jié)球閥,可根據(jù)管網(wǎng)壓力實(shí)時(shí)自動(dòng)調(diào)整閥門(mén)開(kāi)度,實(shí)現(xiàn)流量精確控制,適用于對(duì)穩(wěn)定流量要求高的精密工業(yè)流程控制。
背景技術(shù):
1、球閥是工業(yè)管道系統(tǒng)中常用的控制元件,傳統(tǒng)球閥通常采用手動(dòng)或簡(jiǎn)單自動(dòng)化方式調(diào)節(jié),主要存在以下問(wèn)題:
2、傳統(tǒng)手動(dòng)球閥無(wú)法實(shí)時(shí)響應(yīng)系統(tǒng)壓力波動(dòng),調(diào)節(jié)滯后性明顯。在工業(yè)生產(chǎn)過(guò)程中,管網(wǎng)壓力經(jīng)常發(fā)生波動(dòng),如上游泵的啟停、并聯(lián)管路的切換等都會(huì)引起壓力變化,進(jìn)而導(dǎo)致流量不穩(wěn)定,影響工藝過(guò)程。
3、現(xiàn)有自動(dòng)調(diào)節(jié)球閥多采用pid控制算法,該算法對(duì)非線性系統(tǒng)和時(shí)變參數(shù)系統(tǒng)的適應(yīng)能力有限。當(dāng)工況變化時(shí),需要重新整定控制參數(shù),維護(hù)成本高。
4、簡(jiǎn)單閾值控制策略難以應(yīng)對(duì)復(fù)雜變化的壓力環(huán)境,往往出現(xiàn)調(diào)節(jié)過(guò)度或不足的情況,造成流量波動(dòng),甚至產(chǎn)生水錘效應(yīng),威脅系統(tǒng)安全。
5、現(xiàn)有傳感檢測(cè)技術(shù)存在測(cè)量噪聲干擾,直接影響控制決策的準(zhǔn)確性,特別是在惡劣工業(yè)環(huán)境中,信號(hào)質(zhì)量問(wèn)題較為嚴(yán)重。
6、針對(duì)上述問(wèn)題,亟需一種能夠克服上述問(wèn)題的智能調(diào)節(jié)球閥,以滿足精密工業(yè)流程對(duì)穩(wěn)定流量的控制需求。
7、綜上,本發(fā)明要解決的技術(shù)問(wèn)題是:如何設(shè)計(jì)一種能夠在管網(wǎng)壓力波動(dòng)條件下實(shí)現(xiàn)流量精確控制的智能調(diào)節(jié)球閥,克服現(xiàn)有球閥調(diào)節(jié)滯后、抗干擾能力弱的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、為解決上述技術(shù)問(wèn)題,本發(fā)明提供一種智能調(diào)節(jié)球閥,包括:
2、球閥本體,用于控制流體的通斷和流量;
3、壓力傳感器,設(shè)置在球閥的進(jìn)口端和出口端,用于實(shí)時(shí)檢測(cè)管網(wǎng)中的壓力數(shù)據(jù);
4、微控制器,與所述壓力傳感器電連接,用于處理壓力數(shù)據(jù)并控制球閥開(kāi)度;
5、執(zhí)行機(jī)構(gòu),與所述微控制器電連接,用于根據(jù)微控制器的控制信號(hào)調(diào)整球閥開(kāi)度;以及
6、智能控制算法模塊,包括自適應(yīng)卡爾曼濾波單元和強(qiáng)化學(xué)習(xí)單元,所述自適應(yīng)卡爾曼濾波單元用于對(duì)傳感器采集的壓力數(shù)據(jù)進(jìn)行濾波處理,所述強(qiáng)化學(xué)習(xí)單元用于根據(jù)濾波后的壓力數(shù)據(jù)確定球閥的最優(yōu)開(kāi)度調(diào)整策略;
7、其中,所述自適應(yīng)卡爾曼濾波單元和強(qiáng)化學(xué)習(xí)單元構(gòu)成雙層級(jí)控制架構(gòu),自適應(yīng)卡爾曼濾波單元的輸出作為強(qiáng)化學(xué)習(xí)單元的輸入狀態(tài),強(qiáng)化學(xué)習(xí)單元的輸出動(dòng)作用于控制球閥開(kāi)度。
8、本發(fā)明進(jìn)一步設(shè)置為:所述自適應(yīng)卡爾曼濾波單元執(zhí)行以下步驟:
9、預(yù)測(cè)狀態(tài):
10、預(yù)測(cè)協(xié)方差:
11、計(jì)算卡爾曼增益:
12、更新?tīng)顟B(tài)估計(jì):
13、更新協(xié)方差:
14、其中,為k時(shí)刻的狀態(tài)估計(jì),fk為狀態(tài)轉(zhuǎn)移矩陣,bk為控制輸入矩陣,uk為控制輸入,pk為協(xié)方差矩陣,qk為過(guò)程噪聲協(xié)方差,zk為測(cè)量值,hk為觀測(cè)矩陣,rk為測(cè)量噪聲協(xié)方差,i為單位矩陣。
15、本發(fā)明進(jìn)一步設(shè)置為:所述自適應(yīng)卡爾曼濾波單元還包括自適應(yīng)機(jī)制,通過(guò)以下方式動(dòng)態(tài)調(diào)整噪聲協(xié)方差:
16、測(cè)量噪聲協(xié)方差自適應(yīng)更新:
17、過(guò)程噪聲協(xié)方差自適應(yīng)更新:
18、其中,為殘差,λr和λq為指數(shù)平滑因子,取值范圍為(0,1)。
19、本發(fā)明進(jìn)一步設(shè)置為:所述強(qiáng)化學(xué)習(xí)單元執(zhí)行q學(xué)習(xí)算法,包括以下步驟:
20、定義狀態(tài)s,包含經(jīng)過(guò)自適應(yīng)卡爾曼濾波處理后的壓力值、壓差、流量估計(jì)值以及當(dāng)前閥門(mén)開(kāi)度;
21、定義動(dòng)作a,表示閥門(mén)開(kāi)度的調(diào)整量;
22、根據(jù)以下公式更新q值:,其中,q(s,a)為狀態(tài)s下采取動(dòng)作a的價(jià)值函數(shù),α為學(xué)習(xí)率,r為即時(shí)獎(jiǎng)勵(lì),γ為折扣因子,s'為執(zhí)行動(dòng)作a后的新?tīng)顟B(tài)。
23、本發(fā)明進(jìn)一步設(shè)置為:所述強(qiáng)化學(xué)習(xí)單元的獎(jiǎng)勵(lì)函數(shù)為:;
24、其中,ftarget為目標(biāo)流量,factual為實(shí)際流量,ptarget為目標(biāo)壓力,pactual為實(shí)際壓力,δθ為閥門(mén)開(kāi)度調(diào)整量,wf、wp和wθ為權(quán)重系數(shù),用于平衡流量控制精度、壓力控制精度和動(dòng)作平滑度。
25、本發(fā)明進(jìn)一步設(shè)置為:所述智能控制算法模塊還包括知識(shí)遷移機(jī)制,用于實(shí)現(xiàn)自適應(yīng)卡爾曼濾波單元和強(qiáng)化學(xué)習(xí)單元之間的雙向信息交互,包括:
26、將卡爾曼濾波的系統(tǒng)模型用于初始化強(qiáng)化學(xué)習(xí)單元的策略網(wǎng)絡(luò);
27、利用強(qiáng)化學(xué)習(xí)的經(jīng)驗(yàn)數(shù)據(jù)周期性更新卡爾曼濾波的系統(tǒng)模型參數(shù);
28、構(gòu)建狀態(tài)增強(qiáng)函數(shù):,將卡爾曼濾波的狀態(tài)估計(jì)轉(zhuǎn)換為強(qiáng)化學(xué)習(xí)的增強(qiáng)狀態(tài)表示;
29、基于強(qiáng)化學(xué)習(xí)價(jià)值函數(shù)動(dòng)態(tài)調(diào)整卡爾曼濾波自適應(yīng)參數(shù):和,其中fα和fβ為參數(shù)映射函數(shù)。
30、本發(fā)明進(jìn)一步設(shè)置為:所述強(qiáng)化學(xué)習(xí)單元包括經(jīng)驗(yàn)回放機(jī)制,維護(hù)固定大小的經(jīng)驗(yàn)緩沖區(qū)d,存儲(chǔ)轉(zhuǎn)移樣本(s,a,r,s'),每次訓(xùn)練時(shí)從d中隨機(jī)采樣批次數(shù)據(jù)更新q值,以減少樣本相關(guān)性并提高學(xué)習(xí)效率。
31、本發(fā)明進(jìn)一步設(shè)置為:所述智能控制算法模塊還包括預(yù)測(cè)性控制功能,通過(guò)以下步驟實(shí)現(xiàn):
32、利用自適應(yīng)卡爾曼濾波單元預(yù)測(cè)未來(lái)n個(gè)時(shí)間步的壓力和流量變化;
33、強(qiáng)化學(xué)習(xí)單元基于預(yù)測(cè)狀態(tài)序列提前規(guī)劃最優(yōu)動(dòng)作序列;
34、執(zhí)行動(dòng)作序列的第一個(gè)動(dòng)作,并在下一控制周期重新規(guī)劃。
35、本發(fā)明進(jìn)一步設(shè)置為:所述微控制器還包括異常處理模塊,用于檢測(cè)傳感器故障或系統(tǒng)異常,當(dāng)檢測(cè)到異常時(shí),切換至安全控制模式,根據(jù)預(yù)先設(shè)定的規(guī)則調(diào)整閥門(mén)開(kāi)度,保證系統(tǒng)安全。
36、綜上所述,本發(fā)明具有以下有益效果:
37、本發(fā)明通過(guò)將自適應(yīng)卡爾曼濾波算法與強(qiáng)化學(xué)習(xí)算法相結(jié)合,構(gòu)建雙層級(jí)智能控制架構(gòu),不僅克服了單獨(dú)使用各算法的缺陷,還產(chǎn)生了增益效果,具體表現(xiàn)為:
38、傳統(tǒng)自適應(yīng)卡爾曼濾波算法在處理球閥這類非線性系統(tǒng)時(shí),由于依賴線性化假定,單獨(dú)使用時(shí)導(dǎo)致?tīng)顟B(tài)估計(jì)偏差,特別是在系統(tǒng)動(dòng)態(tài)變化較快的場(chǎng)景下。本發(fā)明通過(guò)強(qiáng)化學(xué)習(xí)單元對(duì)非線性關(guān)系的自適應(yīng)學(xué)習(xí)能力,有效補(bǔ)償了這一不足。實(shí)驗(yàn)數(shù)據(jù)表明,組合算法的狀態(tài)估計(jì)精度比單獨(dú)使用卡爾曼濾波提高,特別是在壓力突變場(chǎng)景下更加明顯。
39、強(qiáng)化學(xué)習(xí)算法單獨(dú)使用時(shí)需要大量交互數(shù)據(jù)才能收斂到最優(yōu)策略,在實(shí)際工業(yè)環(huán)境中獲取這些數(shù)據(jù)成本高昂且耗時(shí)。本發(fā)明通過(guò)卡爾曼濾波提供的高質(zhì)量狀態(tài)估計(jì)和系統(tǒng)模型知識(shí),加速了強(qiáng)化學(xué)習(xí)的收斂過(guò)程。
40、實(shí)現(xiàn)多目標(biāo)平衡優(yōu)化:?jiǎn)我凰惴y以同時(shí)兼顧多個(gè)控制目標(biāo)。本發(fā)明的融合架構(gòu)通過(guò)強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì),同時(shí)考慮流量精度、壓力穩(wěn)定性和閥門(mén)動(dòng)作平滑性,實(shí)現(xiàn)了多目標(biāo)平衡。
41、本發(fā)明的算法融合不僅克服了各自缺點(diǎn),還產(chǎn)生了預(yù)測(cè)性控制能力。通過(guò)卡爾曼濾波的預(yù)測(cè)步驟和強(qiáng)化學(xué)習(xí),系統(tǒng)能夠提前0.5-2秒響應(yīng)即將到來(lái)的壓力波動(dòng),實(shí)現(xiàn)預(yù)測(cè)控制效果。
42、本發(fā)明的知識(shí)遷移機(jī)制實(shí)現(xiàn)了兩個(gè)算法單元間的雙向信息流動(dòng),使系統(tǒng)展現(xiàn)出自校準(zhǔn)和自學(xué)習(xí)特性。隨著運(yùn)行時(shí)間增加,系統(tǒng)性能不斷提升,相較于啟動(dòng)初期,長(zhǎng)期運(yùn)行后的控制精度提升,而傳統(tǒng)固定參數(shù)系統(tǒng)往往會(huì)因設(shè)備老化而性能下降。
43、融合系統(tǒng)表現(xiàn)出優(yōu)于單一算法的穩(wěn)定性。在傳感器部分失效的條件下,系統(tǒng)仍能維持基本控制功能,流量波動(dòng)控制較好,而單一算法系統(tǒng)在相同條件下通常會(huì)徹底失控。
44、相比單獨(dú)實(shí)現(xiàn)兩種算法的簡(jiǎn)單組合,本發(fā)明的深度融合架構(gòu)計(jì)算資源需求降低,使系統(tǒng)能夠在資源受限的工業(yè)控制器上運(yùn)行,大幅降低了實(shí)施成本。
45、綜上所述,本發(fā)明通過(guò)自適應(yīng)卡爾曼濾波與強(qiáng)化學(xué)習(xí)算法的創(chuàng)新融合,不僅克服了單一算法的固有缺陷,還產(chǎn)生了多項(xiàng)增益效果,實(shí)現(xiàn)了在復(fù)雜多變工況下的精確流量控制。