本發(fā)明新型專利涉及建筑暖通空調(diào)系統(tǒng)預(yù)測(cè),尤其是一種提高基于機(jī)器學(xué)習(xí)的建筑冷熱負(fù)荷預(yù)測(cè)精度的數(shù)據(jù)特征工程處理方法。
背景技術(shù):
1、據(jù)統(tǒng)計(jì),2020年全國(guó)建筑全過程能耗總量為22.7億tce,碳排放總量為50.8%億tco2,分別占全國(guó)能源消耗總量的45.5%和全國(guó)碳排放的50.9%,其中建筑運(yùn)行階段能耗10.6億tce,碳排放28.2億tco2,分別占全國(guó)能源消費(fèi)總量的21.3%和全國(guó)碳排放的28.2%。因此提高建筑能效、降低建筑運(yùn)行能耗可以節(jié)約巨大的能源以及降低大量的碳排放。由于內(nèi)外擾動(dòng)等因素的變化會(huì)使建筑冷熱負(fù)荷需求也不斷改變,需要調(diào)整運(yùn)行策略,使得滿足熱舒適需求同時(shí)保持機(jī)組的高效率運(yùn)行,由于建筑暖通空調(diào)系統(tǒng)的高延遲、大滯后性特點(diǎn),僅依靠負(fù)反饋調(diào)節(jié)的空調(diào)系統(tǒng)可能無法保證室內(nèi)熱舒適性和設(shè)備的節(jié)能運(yùn)行。故準(zhǔn)確的建筑負(fù)荷預(yù)測(cè)對(duì)建筑暖通空調(diào)系統(tǒng)的高效運(yùn)行和減少能源消耗具有重要意義。
2、目前,建筑負(fù)荷預(yù)測(cè)方法主要有兩種方法:基于物理方法的負(fù)荷預(yù)測(cè)和基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)方法。基于物理方法的負(fù)荷預(yù)測(cè)計(jì)算主要是根據(jù)不穩(wěn)定傳熱原理,利用建筑和環(huán)境信息,如外部氣候條件、建筑熱工參數(shù)、室內(nèi)用電設(shè)備功率密度,人員密度、室內(nèi)外遮陽和人行為,以及暖通空調(diào)設(shè)備運(yùn)行方式等為輸入,逐級(jí)精確地計(jì)算建筑所有部件的能耗?;跈C(jī)器學(xué)習(xí)的預(yù)測(cè)方法則是通過大量歷史數(shù)據(jù)獲取輸入與輸出之間的統(tǒng)計(jì)學(xué)規(guī)律。在人工智能蓬勃發(fā)展的今天,利用能耗模擬軟件獲取負(fù)荷的計(jì)算量大,耗時(shí)較長(zhǎng),在后續(xù)實(shí)際工程中,且不能很好地與智能控制系統(tǒng)集成以達(dá)到實(shí)時(shí)調(diào)控的目的,故目前更多采用機(jī)器學(xué)習(xí)方法預(yù)測(cè)建筑負(fù)荷。
3、一個(gè)典型的hvac系統(tǒng)是一個(gè)復(fù)雜的非線性網(wǎng)絡(luò),包含數(shù)百個(gè)特征,反映了系統(tǒng)的各個(gè)方面,除了受建筑物的形體結(jié)構(gòu)、圍護(hù)結(jié)構(gòu)熱工參數(shù)、建筑物內(nèi)部物體的熱工特性等靜態(tài)參數(shù)的影響之外,還主要受室外氣象參數(shù)、室內(nèi)人員數(shù)量和人行為、照明功率和設(shè)備功率等動(dòng)態(tài)參數(shù)的影響,同時(shí)由于熱滯后性的影響,這些參數(shù)的歷史數(shù)據(jù)也會(huì)對(duì)負(fù)荷預(yù)測(cè)產(chǎn)生影響。在機(jī)器學(xué)習(xí)訓(xùn)練模型時(shí),輸入特征集決定了機(jī)器學(xué)習(xí)的預(yù)測(cè)性能上限,當(dāng)輸入特征之間存在相關(guān)性時(shí),會(huì)造成信息冗余,冗余的參數(shù)復(fù)制了一個(gè)或多個(gè)其他參數(shù)所包含的大部分或全部信息,使得預(yù)測(cè)結(jié)果出現(xiàn)較大偏差和波動(dòng)。在建筑負(fù)荷預(yù)測(cè)時(shí)這種數(shù)據(jù)特征的冗余更加明顯,例如室外溫度與太陽輻射之間存在著較強(qiáng)的相關(guān)關(guān)系,某些建筑中人員在室率的增加也勢(shì)必帶來設(shè)備功率的增加。因此合理選擇輸入特征對(duì)于提高建筑負(fù)荷預(yù)測(cè)精度和效率至關(guān)重要。
技術(shù)實(shí)現(xiàn)思路
1、為了解決基于機(jī)器學(xué)習(xí)的建筑負(fù)荷預(yù)測(cè)模型中輸入特征多且冗余性較大的問題,本發(fā)明的目的在于提供一種提高建筑冷熱負(fù)荷預(yù)測(cè)的泛化能力和預(yù)測(cè)精度的特征工程數(shù)據(jù)處理方法,可以有效地從眾多影響建筑冷熱負(fù)荷的輸入特征中篩選出對(duì)預(yù)測(cè)有意義的重要變量,同時(shí)降低變量間的冗余性,有效提高模型預(yù)測(cè)精度。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提出一種基于mrmr-pca的特征工程處理方法,利用最大相關(guān)最小冗余(max-relevance?min-redundancy,mrmr)算法選擇出與目標(biāo)變量相關(guān)性強(qiáng)、與其他特征變量冗余性低的特征子集,進(jìn)一步再利用主成分分析(principal?componentanalysis,pca)算法將mrmr算法篩選出的特征子集轉(zhuǎn)化為彼此獨(dú)立、相互正交的綜合特征集,主要包括以下內(nèi)容:
3、s1.構(gòu)建建筑冷熱負(fù)荷預(yù)測(cè)數(shù)據(jù)集:采集建筑冷熱負(fù)荷數(shù)據(jù)、氣象數(shù)據(jù)、建筑內(nèi)擾數(shù)據(jù);
4、s2.數(shù)據(jù)預(yù)處理:采集到的數(shù)據(jù)可能存在異常和缺失的情況,利用iqr法對(duì)數(shù)據(jù)異常值進(jìn)行識(shí)別處理,利用插值法填補(bǔ)缺失值和異常值,將特征變量進(jìn)行標(biāo)準(zhǔn)化;
5、s3.特征選擇:利用mrmr算法計(jì)算出變量的最大相關(guān)度-最小冗余度,選擇出與目標(biāo)變量相關(guān)性強(qiáng)、與其他特征變量冗余性低的特征子集;
6、s4.特征提取:利用pca算法將mrmr算法篩選出的特征子集轉(zhuǎn)化為彼此獨(dú)立、相互正交的綜合特征集,進(jìn)一步降低冗余信息的相互影響。經(jīng)過mrmr-pca處理后的數(shù)據(jù)既為最終輸入建筑負(fù)荷預(yù)測(cè)模型的特征變量。
7、由上述技術(shù)方案可知,本發(fā)明的有益效果為:第一,首先利用傳感器和智慧能源系統(tǒng)收集負(fù)荷數(shù)據(jù)、氣象數(shù)據(jù)和建筑內(nèi)擾數(shù)據(jù),構(gòu)建建筑冷熱負(fù)荷預(yù)測(cè)數(shù)據(jù)集;第二,通過iqr法識(shí)別異常值,利用插值法填補(bǔ)異常值和缺失值,再將清洗后的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化;第三,利用mrmr算法計(jì)算出變量的最大相關(guān)度-最小冗余度,選擇出與目標(biāo)變量相關(guān)性強(qiáng)、與其他特征變量冗余性低的特征子集,較好地解決負(fù)荷預(yù)測(cè)中的多種變量之間的干擾和冗余問題;第四,利用pca算法將mrmr算法篩選出的特征子集轉(zhuǎn)化為彼此獨(dú)立、相互正交的綜合特征集,從而進(jìn)一步降低冗余信息相互影響,減少輸入變量數(shù)量,提高了預(yù)測(cè)精度和效率。
1.一種提高基于機(jī)器學(xué)習(xí)的建筑冷熱負(fù)荷預(yù)測(cè)精度的數(shù)據(jù)特征工程處理方法,其特征在于:該方法包括下列順序的步驟:
2.根據(jù)權(quán)利要求1所述的一種提高基于機(jī)器學(xué)習(xí)的建筑冷熱負(fù)荷預(yù)測(cè)精度的數(shù)據(jù)特征工程處理方法,其特征在于:步驟s1具體數(shù)據(jù)包括:所述建筑冷熱負(fù)荷數(shù)據(jù)包括熱力入口處供水流量及供水溫差,氣象數(shù)據(jù)包括室外氣溫、露點(diǎn)溫度、相對(duì)濕度、風(fēng)速、風(fēng)向、水平面總輻射、法線方向太陽輻射,水平面散射輻射,建筑內(nèi)擾數(shù)據(jù)包括人員在室數(shù)、照明功率和設(shè)備功率,這些數(shù)據(jù)可通過安裝相應(yīng)傳感器以及智慧能源系統(tǒng)獲得。
3.根據(jù)權(quán)利要求1所述的一種提高基于機(jī)器學(xué)習(xí)的建筑冷熱負(fù)荷預(yù)測(cè)精度的數(shù)據(jù)特征工程處理方法,其特征在于:步驟s2中所述iqr法根據(jù)數(shù)的四分位數(shù)范圍來判斷數(shù)據(jù)是否為異常值,具體步驟如下:
4.根據(jù)權(quán)利要求1所述的一種提高基于機(jī)器學(xué)習(xí)的建筑冷熱負(fù)荷預(yù)測(cè)精度的數(shù)據(jù)特征工程處理方法,其特征在于:步驟s3中,利用mrmr算法計(jì)算出變量的最大相關(guān)度-最小冗余度,選擇出與目標(biāo)變量相關(guān)性強(qiáng)、與其他特征變量冗余性低的特征子集,具體步驟如下:
5.根據(jù)權(quán)利要求1所述的一種提高基于機(jī)器學(xué)習(xí)的建筑冷熱負(fù)荷預(yù)測(cè)精度的數(shù)據(jù)特征工程處理方法,其特征在于:步驟s4中利用pca算法將mrmr算法篩選出的特征子集轉(zhuǎn)化為彼此獨(dú)立、相互正交的綜合特征集,進(jìn)一步降低冗余信息的相互影響,具體步驟如下: