1.一種分布式統(tǒng)計數(shù)據(jù)分析優(yōu)化方法,其特征在于,包括:
2.根據(jù)權利要求1所述的一種分布式統(tǒng)計數(shù)據(jù)分析優(yōu)化方法,其特征在于,利用爬蟲方法獲取預先選擇的企業(yè)營收數(shù)據(jù)平臺的經(jīng)濟數(shù)值數(shù)據(jù)和預設時間周期內(nèi)的經(jīng)濟時間序列數(shù)據(jù);經(jīng)濟數(shù)值數(shù)據(jù)包括每個客戶的平均消費金額,經(jīng)濟時間序列數(shù)據(jù)包括每日營收金額;為經(jīng)濟數(shù)值數(shù)據(jù)中的任意一個數(shù)值數(shù)據(jù)點添加編號,并將經(jīng)濟數(shù)值數(shù)據(jù)的所有數(shù)值數(shù)據(jù)點按照編號大小升序排列;將經(jīng)濟時間序列數(shù)據(jù)所屬的預設時間周期分成y份時間周期區(qū)間,將每個時間周期區(qū)間內(nèi)的所有時序數(shù)據(jù)點視為一份經(jīng)濟時間序列數(shù)據(jù);對每一份經(jīng)濟時間序列數(shù)據(jù)按照時間周期區(qū)間的順序進行編號,整合所有編號后的經(jīng)濟時間序列數(shù)據(jù)得到經(jīng)濟時間序列數(shù)據(jù)集;任意一份經(jīng)濟時間序列數(shù)據(jù)中的任意一個時序數(shù)據(jù)點有一個時間戳與其對應;將經(jīng)濟數(shù)值數(shù)據(jù)和經(jīng)濟時間序列數(shù)據(jù)集整合得到經(jīng)濟數(shù)據(jù)集。
3.根據(jù)權利要求2所述的一種分布式統(tǒng)計數(shù)據(jù)分析優(yōu)化方法,其特征在于,所述對經(jīng)濟數(shù)據(jù)集進行預處理的方式包括:
4.根據(jù)權利要求3所述的一種分布式統(tǒng)計數(shù)據(jù)分析優(yōu)化方法,其特征在于,所述對缺失數(shù)值數(shù)據(jù)點進行平均消費金額缺失值擬合的方式包括:
5.根據(jù)權利要求4所述的一種分布式統(tǒng)計數(shù)據(jù)分析優(yōu)化方法,其特征在于,所述對經(jīng)濟時間序列數(shù)據(jù)集進行缺失值處理的方式包括:
6.根據(jù)權利要求5所述的一種分布式統(tǒng)計數(shù)據(jù)分析優(yōu)化方法,其特征在于,所述對完整時序數(shù)據(jù)進行濾波處理的方式包括:
7.根據(jù)權利要求6所述的一種分布式統(tǒng)計數(shù)據(jù)分析優(yōu)化方法,其特征在于,所述對預處理后經(jīng)濟數(shù)據(jù)集進行數(shù)據(jù)分片的方式包括:
8.根據(jù)權利要求7所述的一種分布式統(tǒng)計數(shù)據(jù)分析優(yōu)化方法,其特征在于,所述對分片經(jīng)濟數(shù)據(jù)集進行任務分配處理的方式包括:
9.根據(jù)權利要求8所述的一種分布式統(tǒng)計數(shù)據(jù)分析優(yōu)化方法,其特征在于,所述對最優(yōu)分配數(shù)據(jù)集進行數(shù)據(jù)分析的方式包括:
10.一種分布式統(tǒng)計數(shù)據(jù)分析優(yōu)化系統(tǒng),其用于實現(xiàn)權利要求1-9中任一項所述的一種分布式統(tǒng)計數(shù)據(jù)分析優(yōu)化方法,其特征在于,包括: