本發(fā)明涉及電廠數(shù)據(jù)管理,尤其涉及一種基于大數(shù)據(jù)的智慧電廠數(shù)據(jù)管理方法及系統(tǒng)。
背景技術(shù):
1、隨著能源行業(yè)的快速發(fā)展,電廠作為能源供應(yīng)的核心環(huán)節(jié),其運(yùn)行數(shù)據(jù)的采集、處理和分析對于保障電廠安全、提高運(yùn)營效率至關(guān)重要。
2、然而,隨著物聯(lián)網(wǎng)、大數(shù)據(jù)等技術(shù)的廣泛應(yīng)用,電廠產(chǎn)生的數(shù)據(jù)量呈爆炸式增長,傳統(tǒng)電廠數(shù)據(jù)管理方式存在數(shù)據(jù)處理效率低下、數(shù)據(jù)價(jià)值挖掘不足、異常預(yù)警不及時(shí)等問題,難以滿足當(dāng)前電廠智能化、精細(xì)化管理的需求,基于此,如何有效管理這些數(shù)據(jù),從中識(shí)別出異常數(shù)據(jù),并據(jù)此構(gòu)建異常檢測模型,以實(shí)現(xiàn)對電廠問題的及時(shí)發(fā)現(xiàn)和反饋,成為當(dāng)前電廠數(shù)據(jù)管理領(lǐng)域亟待解決的技術(shù)難題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于大數(shù)據(jù)的智慧電廠數(shù)據(jù)管理方法及系統(tǒng),旨在解決傳統(tǒng)技術(shù)存在的數(shù)據(jù)處理效率低下、數(shù)據(jù)價(jià)值挖掘不足、異常預(yù)警不及時(shí)等問題。
2、第一方面,本發(fā)明提供一種基于大數(shù)據(jù)的智慧電廠數(shù)據(jù)管理方法,所述方法包括:
3、獲取與目標(biāo)電廠相關(guān)的歷史電廠數(shù)據(jù),并對所述歷史電廠數(shù)據(jù)進(jìn)行一次聚類分析,以根據(jù)一次聚類分析結(jié)果將所述電廠數(shù)據(jù)劃分成多種一級(jí)數(shù)據(jù);
4、對所述多種一級(jí)數(shù)據(jù)進(jìn)行二次聚類分析,以根據(jù)二次聚類分類結(jié)果將所述多種一級(jí)數(shù)據(jù)劃分成多種二級(jí)數(shù)據(jù);
5、對每種二級(jí)數(shù)據(jù)進(jìn)行異常檢測,以根據(jù)異常檢測結(jié)果從每種二級(jí)數(shù)據(jù)中提取異常數(shù)據(jù),選取觀測時(shí)段,以根據(jù)所述觀測時(shí)段下的異常數(shù)據(jù)生成與每種二級(jí)數(shù)據(jù)對應(yīng)的樣本數(shù)據(jù)序列,并根據(jù)所述樣本數(shù)據(jù)序列構(gòu)建每種二級(jí)數(shù)據(jù)的異常檢測模型;
6、每隔第一預(yù)設(shè)時(shí)間獲取目標(biāo)電廠的目標(biāo)電廠數(shù)據(jù),并將所述目標(biāo)電廠數(shù)據(jù)劃分成多種目標(biāo)二級(jí)數(shù)據(jù),以將所述目標(biāo)二級(jí)數(shù)據(jù)輸入所述異常檢測模型,得到每個(gè)周期下的每種二級(jí)數(shù)據(jù)的檢測結(jié)果,并將所述檢測結(jié)果進(jìn)行上傳。
7、進(jìn)一步地,所述獲取與目標(biāo)電廠相關(guān)的歷史電廠數(shù)據(jù),并對所述歷史電廠數(shù)據(jù)進(jìn)行一次聚類分析,以根據(jù)一次聚類分析結(jié)果將所述電廠數(shù)據(jù)劃分成多種一級(jí)數(shù)據(jù)的步驟包括:
8、隨機(jī)初始化k1個(gè)聚類中心,并計(jì)算每個(gè)歷史電廠數(shù)據(jù)到每個(gè)聚類中心的歐式距離,并從同一歷史電廠數(shù)據(jù)下的所有的歐式距離中篩選出最小歐式距離,以將該歷史電廠數(shù)據(jù)劃分至所述最小歐式距離所屬的簇中;
9、如此,遍歷所有的歷史電廠數(shù)據(jù),得到k1個(gè)分類的簇,每個(gè)簇與一種一級(jí)數(shù)據(jù)對應(yīng)。
10、進(jìn)一步地,所述對所述多種一級(jí)數(shù)據(jù)進(jìn)行二次聚類分析,以根據(jù)二次聚類分類結(jié)果將所述多種一級(jí)數(shù)據(jù)劃分成多種二級(jí)數(shù)據(jù)的步驟包括:
11、隨機(jī)初始化k2個(gè)聚類中心,以得到k2個(gè)分類的簇。
12、所述計(jì)算每個(gè)歷史電廠數(shù)據(jù)到每個(gè)聚類中心的歐式距離的步驟包括:
13、根據(jù)以下公式計(jì)算得到每個(gè)歷史電廠數(shù)據(jù)到聚類中心的歐式距離:
14、
15、其中,d(xi,yj)表示第i個(gè)歷史電廠數(shù)據(jù)與第j個(gè)聚類中心的歐式距離,xin表示第i個(gè)歷史電廠數(shù)據(jù)在第n個(gè)維度的取值,yjn表示第j個(gè)聚類中心在第n個(gè)維度的取值。
16、進(jìn)一步地,所述對每種二級(jí)數(shù)據(jù)進(jìn)行異常檢測,以根據(jù)異常檢測結(jié)果從每種二級(jí)數(shù)據(jù)中提取異常數(shù)據(jù)的步驟包括:
17、獲取每種二級(jí)數(shù)據(jù)的數(shù)據(jù)均值和數(shù)據(jù)標(biāo)準(zhǔn)差,并根據(jù)所述數(shù)據(jù)標(biāo)準(zhǔn)差設(shè)定檢測閾值;
18、獲取二級(jí)數(shù)據(jù)與對應(yīng)的數(shù)據(jù)均值之間的差值絕對值,并判斷所述差值絕對值是否大于檢測閾值;
19、若所述差值絕對值大于檢測閾值,則判定該二級(jí)數(shù)據(jù)為異常數(shù)據(jù);
20、若所述差值絕對值小于或等于檢測閾值,則判定該二級(jí)數(shù)據(jù)為正常數(shù)據(jù)。
21、進(jìn)一步地,所述選取觀測時(shí)段,以根據(jù)所述觀測時(shí)段下的異常數(shù)據(jù)生成與每種二級(jí)數(shù)據(jù)對應(yīng)的樣本數(shù)據(jù)序列,并根據(jù)所述樣本數(shù)據(jù)序列構(gòu)建每種二級(jí)數(shù)據(jù)的異常檢測模型的步驟包括:
22、假設(shè)初始化時(shí)刻t0,則以時(shí)刻t0-t1到時(shí)刻t0為觀測時(shí)段,則生成的樣本數(shù)據(jù)序列為e=(e1、e2、…、ea),其中,ea表示觀測時(shí)段下的第a個(gè)異常數(shù)據(jù);
23、獲取與每種樣本數(shù)據(jù)序列相關(guān)的至少一種故障類型,以根據(jù)所述故障類型將所有的樣本數(shù)據(jù)序列進(jìn)行劃分,得到每一種故障類型下的至少一種目標(biāo)樣本數(shù)據(jù)序列;
24、根據(jù)所述至少一種目標(biāo)樣本數(shù)據(jù)序列對該故障類型下的初始異常檢測模型進(jìn)行訓(xùn)練,得到多個(gè)分別與每種故障類型對應(yīng)的最終異常檢測模型。
25、進(jìn)一步地,所述獲取二級(jí)數(shù)據(jù)與對應(yīng)的數(shù)據(jù)均值之間的差值絕對值,并判斷所述差值絕對值是否大于檢測閾值的步驟包括:
26、根據(jù)以下公式判斷二級(jí)數(shù)據(jù)是否為異常數(shù)據(jù):
27、|zij-μj|>3σj
28、其中,zij表示第j簇下的第i個(gè)二級(jí)數(shù)據(jù),μj表示第j簇下的所有二級(jí)數(shù)據(jù)的數(shù)據(jù)均值,σj表示第j簇下的所有二級(jí)數(shù)據(jù)的標(biāo)準(zhǔn)差。
29、進(jìn)一步地,所述每隔第一預(yù)設(shè)時(shí)間獲取目標(biāo)電廠的目標(biāo)電廠數(shù)據(jù),并將所述目標(biāo)電廠數(shù)據(jù)劃分成多種目標(biāo)二級(jí)數(shù)據(jù),以將所述目標(biāo)二級(jí)數(shù)據(jù)輸入所述異常檢測模型,得到每個(gè)周期下的每種二級(jí)數(shù)據(jù)的檢測結(jié)果,并將所述檢測結(jié)果進(jìn)行上傳的步驟包括:
30、當(dāng)存在故障時(shí),則所述檢測結(jié)果為每一周期下的故障類型;
31、根據(jù)故障類型將所述檢測結(jié)果以及與所述檢測結(jié)果相關(guān)的異常數(shù)據(jù)上傳至對應(yīng)的存儲(chǔ)空間中。
32、第二方面,本發(fā)明提供一種基于大數(shù)據(jù)的智慧電廠數(shù)據(jù)管理系統(tǒng),所述系統(tǒng)包括:
33、一次分類模塊,用于獲取與目標(biāo)電廠相關(guān)的歷史電廠數(shù)據(jù),并對所述歷史電廠數(shù)據(jù)進(jìn)行一次聚類分析,以根據(jù)一次聚類分析結(jié)果將所述電廠數(shù)據(jù)劃分成多種一級(jí)數(shù)據(jù);
34、二次分類模塊,用于對所述多種一級(jí)數(shù)據(jù)進(jìn)行二次聚類分析,以根據(jù)二次聚類分類結(jié)果將所述多種一級(jí)數(shù)據(jù)劃分成多種二級(jí)數(shù)據(jù);
35、檢測模型構(gòu)建模塊,用于對每種二級(jí)數(shù)據(jù)進(jìn)行異常檢測,以根據(jù)異常檢測結(jié)果從每種二級(jí)數(shù)據(jù)中提取異常數(shù)據(jù),選取觀測時(shí)段,以根據(jù)所述觀測時(shí)段下的異常數(shù)據(jù)生成與每種二級(jí)數(shù)據(jù)對應(yīng)的樣本數(shù)據(jù)序列,并根據(jù)所述樣本數(shù)據(jù)序列構(gòu)建每種二級(jí)數(shù)據(jù)的異常檢測模型;
36、數(shù)據(jù)存儲(chǔ)模塊,用于每隔第一預(yù)設(shè)時(shí)間獲取目標(biāo)電廠的目標(biāo)電廠數(shù)據(jù),并將所述目標(biāo)電廠數(shù)據(jù)劃分成多種目標(biāo)二級(jí)數(shù)據(jù),以將所述目標(biāo)二級(jí)數(shù)據(jù)輸入所述異常檢測模型,得到每個(gè)周期下的每種二級(jí)數(shù)據(jù)的檢測結(jié)果,并將所述檢測結(jié)果進(jìn)行上傳。
37、第三方面,本發(fā)明提供一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)存儲(chǔ)一個(gè)或多個(gè)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的基于大數(shù)據(jù)的智慧電廠數(shù)據(jù)管理方法。
38、第四方面,本發(fā)明提供一種電子設(shè)備,所述電子設(shè)備包括存儲(chǔ)器和處理器,其中:
39、所述存儲(chǔ)器用于存放計(jì)算機(jī)程序;
40、所述處理器用于執(zhí)行存儲(chǔ)器上所存放的計(jì)算機(jī)程序時(shí),實(shí)現(xiàn)上述的基于大數(shù)據(jù)的智慧電廠數(shù)據(jù)管理方法。
41、與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點(diǎn):
42、1.本發(fā)明通過對海量的歷史電廠數(shù)據(jù)進(jìn)行初步聚類分析以及二次聚類分析,進(jìn)而實(shí)現(xiàn)對歷史電廠數(shù)據(jù)的精確分類,以為后續(xù)精確分析故障類型提供精確的數(shù)據(jù)支撐,使得歷史電廠數(shù)據(jù)實(shí)現(xiàn)運(yùn)行數(shù)據(jù)、狀態(tài)數(shù)據(jù)、環(huán)境數(shù)據(jù)等一級(jí)數(shù)據(jù)的劃分,運(yùn)行數(shù)據(jù)包括如發(fā)電量、供電煤耗、主汽溫度、壓力、再熱汽溫、排煙溫度、汽輪機(jī)熱耗率、發(fā)電補(bǔ)給水率、等二級(jí)數(shù)據(jù),狀態(tài)數(shù)據(jù)包括電壓、電流、溫度等二級(jí)數(shù)據(jù),環(huán)境數(shù)據(jù)包括溫度、濕度、風(fēng)速、風(fēng)向、降雨量、日照強(qiáng)度等二級(jí)數(shù)據(jù)。
43、2.本發(fā)明通過對二級(jí)數(shù)據(jù)進(jìn)行異常檢測,從而生成每種二級(jí)數(shù)據(jù)相關(guān)的樣本數(shù)據(jù)序列,即異常數(shù)據(jù)集,而后再基于每種故障類型精確鎖定與其相關(guān)的二級(jí)數(shù)據(jù),從而高效以及準(zhǔn)確地完整異常檢測模型的訓(xùn)練,以便能夠快速處理后續(xù)實(shí)時(shí)檢測不斷產(chǎn)生的海量電廠數(shù)據(jù),并能將檢測結(jié)果進(jìn)行有序存儲(chǔ),以便在發(fā)生故障時(shí),能夠及時(shí)反饋和溯源。