本發(fā)明涉及大數(shù)據(jù)分析領(lǐng)域,特別是一種基于大數(shù)據(jù)分析的旅游人數(shù)預(yù)測(cè)方法及系統(tǒng)。
背景技術(shù):
1、旅游人數(shù)預(yù)測(cè)作為旅游行業(yè)的重要決策依據(jù),對(duì)于旅游資源的合理配置、旅游市場(chǎng)的精準(zhǔn)營(yíng)銷以及旅游政策的科學(xué)制定都具有重大意義。傳統(tǒng)的旅游人數(shù)預(yù)測(cè)方法,如基于歷史數(shù)據(jù)的線性回歸、時(shí)間序列分析等,雖然能在一定程度上反映旅游人數(shù)的變化趨勢(shì),但由于其數(shù)據(jù)來源單一、分析方法簡(jiǎn)單,往往難以應(yīng)對(duì)復(fù)雜多變的旅游市場(chǎng)環(huán)境。并且伴隨著大數(shù)據(jù)技術(shù)的應(yīng)用和挖掘,旅游數(shù)據(jù)的應(yīng)用通常伴隨個(gè)人隱私的泄露,具備一定的公眾隱私信息泄露危險(xiǎn)性。因此如何提升旅游人數(shù)預(yù)測(cè)準(zhǔn)確性的同時(shí)又能保證在相同不泄露公眾的隱私,是現(xiàn)階段丞待解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是為了解決上述問題,設(shè)計(jì)了一種基于大數(shù)據(jù)分析的旅游人數(shù)預(yù)測(cè)方法及系統(tǒng)。
2、實(shí)現(xiàn)上述目的本發(fā)明的技術(shù)方案為,進(jìn)一步,在上述一種基于大數(shù)據(jù)分析的旅游人數(shù)預(yù)測(cè)方法中,所述旅游人數(shù)預(yù)測(cè)方法包括以下步驟:
3、獲取數(shù)據(jù)庫中的實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù),對(duì)所述實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,得到訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù),所述實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)至少包括:實(shí)時(shí)天氣數(shù)據(jù)、實(shí)時(shí)交通流量數(shù)據(jù)、實(shí)時(shí)門票預(yù)定數(shù)據(jù)、實(shí)時(shí)熱點(diǎn)社交媒體數(shù)據(jù);
4、利用rsa非對(duì)稱加密算法對(duì)所述訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)進(jìn)行加密,得到目標(biāo)訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù);
5、建立cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型,利用next-vi?t作為所述cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型的混合框架,得到目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型;
6、將所述目標(biāo)訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)輸入至所述目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型中進(jìn)行識(shí)別預(yù)測(cè),利用cnn卷積神經(jīng)網(wǎng)絡(luò)獲取訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)特征,transfome獲取所述訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)的全局信息,得到實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù);
7、基于所述實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù)判斷景點(diǎn)的人流量數(shù)據(jù)是否高于預(yù)設(shè)的景點(diǎn)極限人流量數(shù)據(jù),若高于景點(diǎn)極限人流量數(shù)據(jù)則生成備選景點(diǎn)旅游方案,將所述備選景點(diǎn)旅游方案展示至用戶的移動(dòng)終端;
8、獲取用戶的實(shí)時(shí)旅游人數(shù)反饋數(shù)據(jù),將所述實(shí)時(shí)旅游人數(shù)反饋數(shù)據(jù)和所述實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù)進(jìn)行對(duì)比,若兩個(gè)數(shù)據(jù)之間的差值大于20%,則將所述實(shí)時(shí)旅游人數(shù)反饋數(shù)據(jù)輸入至所述目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型進(jìn)行訓(xùn)練。
9、進(jìn)一步,在上述一種基于大數(shù)據(jù)分析的旅游人數(shù)預(yù)測(cè)方法中,所述獲取數(shù)據(jù)庫中的實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù),對(duì)所述實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,得到訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù),所述實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)至少包括:實(shí)時(shí)天氣數(shù)據(jù)、實(shí)時(shí)交通流量數(shù)據(jù)、實(shí)時(shí)門票預(yù)定數(shù)據(jù)、實(shí)時(shí)熱點(diǎn)社交媒體數(shù)據(jù),包括:
10、基于用戶的實(shí)時(shí)景點(diǎn)查詢需求獲取數(shù)據(jù)庫中的實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù),所述實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)至少包括:實(shí)時(shí)天氣數(shù)據(jù)、實(shí)時(shí)交通流量數(shù)據(jù)、實(shí)時(shí)門票預(yù)定數(shù)據(jù)、實(shí)時(shí)熱點(diǎn)社交媒體數(shù)據(jù);
11、將所述實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)進(jìn)行數(shù)據(jù)切分,得到多層實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù);
12、對(duì)所述多層實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)進(jìn)行二進(jìn)制轉(zhuǎn)化,得到二進(jìn)制實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù);
13、對(duì)所述二進(jìn)制實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)進(jìn)行數(shù)據(jù)集分類,得到訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)。
14、進(jìn)一步,在上述一種基于大數(shù)據(jù)分析的旅游人數(shù)預(yù)測(cè)方法中,其特征在于,所述利用rsa非對(duì)稱加密算法對(duì)所述訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)進(jìn)行加密,得到目標(biāo)訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù),包括:
15、獲取訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù),隨機(jī)選擇兩個(gè)素?cái)?shù),將所述兩個(gè)素?cái)?shù)分別記為p和q;
16、設(shè)定n為兩個(gè)素?cái)?shù)的乘積,其中n=p*q,且所述n為公鑰和私鑰的一部分;
17、設(shè)定m是兩個(gè)素?cái)?shù)減一后的乘積,其中m=(p-1)*(q-1);
18、設(shè)定e作為公鑰的一部分,且e與m互質(zhì),其中e與m為互質(zhì)的奇數(shù),且1<e<m;
19、設(shè)定d作為私鑰的一部分,且d為e關(guān)于m的模反元素,其中e*dmod?m=1;
20、設(shè)定p為所述訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù),c為目標(biāo)訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù),其中c=p^e?mod?n。
21、進(jìn)一步,在上述一種基于大數(shù)據(jù)分析的旅游人數(shù)預(yù)測(cè)方法中,所述建立cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型,利用next-vi?t作為所述cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型的混合框架,得到目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型,包括:
22、建立cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型,所述cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型至少包括初始層、輸入層、輸出層、全連接層和平均池化層;
23、在所述cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型的每一層之前放置一個(gè)patch的線性嵌入層,所述線性嵌入層用于通道匹配和提取patch信息;
24、利用next-v?i?t作為所述cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型的混合框架;
25、將所述cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型中的ncb模塊和ntb模塊以(n+1)*l的混合方式進(jìn)行堆疊,得到目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型。
26、進(jìn)一步,在上述一種基于大數(shù)據(jù)分析的旅游人數(shù)預(yù)測(cè)方法中,所述將所述目標(biāo)訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)輸入至所述目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型中進(jìn)行識(shí)別預(yù)測(cè),利用cnn卷積神經(jīng)網(wǎng)絡(luò)獲取訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)特征,transfome獲取所述訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)的全局信息,得到實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù),包括:
27、將所述目標(biāo)訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)輸入至所述目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型中進(jìn)行識(shí)別預(yù)測(cè);
28、利用cnn卷積神經(jīng)網(wǎng)絡(luò)獲取訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)特征,transfome獲取所述訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)的全局信息;
29、基于mhca多頭卷積注意機(jī)制作為所述目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型的令牌混合器;
30、對(duì)所述目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型中多個(gè)子空間的數(shù)據(jù)信息進(jìn)行深度學(xué)習(xí),從多個(gè)并行子空間獲取數(shù)據(jù)信息,得到實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù);
31、所述實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù)至少包括:旅游車流量數(shù)據(jù)、旅游人流量數(shù)據(jù)。
32、進(jìn)一步,在上述一種基于大數(shù)據(jù)分析的旅游人數(shù)預(yù)測(cè)方法中,所述基于所述實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù)判斷景點(diǎn)的人流量數(shù)據(jù)是否高于預(yù)設(shè)的景點(diǎn)極限人流量數(shù)據(jù),若高于景點(diǎn)極限人流量數(shù)據(jù)則生成備選景點(diǎn)旅游方案,將所述備選景點(diǎn)旅游方案展示至用戶的移動(dòng)終端,包括:
33、獲取景點(diǎn)停車位數(shù)量和景點(diǎn)售票數(shù)量,基于所述景點(diǎn)停車位數(shù)量和景點(diǎn)售票數(shù)量生成景點(diǎn)極限人流量數(shù)據(jù);
34、根據(jù)所述實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù)判斷景點(diǎn)的人流量數(shù)據(jù)是否高于預(yù)設(shè)的景點(diǎn)極限人流量數(shù)據(jù);
35、若所述實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù)高于景點(diǎn)極限人流量數(shù)據(jù),則獲取數(shù)據(jù)庫中與實(shí)時(shí)景點(diǎn)類型相似的目標(biāo)景點(diǎn),并獲取所述目標(biāo)景點(diǎn)的人流量數(shù)據(jù);
36、若所述目標(biāo)景點(diǎn)的人流量數(shù)據(jù)小于實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù),則生成備選景點(diǎn)旅游方案,將所述備選景點(diǎn)旅游方案?jìng)鬏斨劣脩舻囊苿?dòng)終端。
37、進(jìn)一步,在上述一種基于大數(shù)據(jù)分析的旅游人數(shù)預(yù)測(cè)方法中,所述獲取用戶的實(shí)時(shí)旅游人數(shù)反饋數(shù)據(jù),將所述實(shí)時(shí)旅游人數(shù)反饋數(shù)據(jù)和所述實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù)進(jìn)行對(duì)比,若兩個(gè)數(shù)據(jù)之間的差值大于20%,則將所述實(shí)時(shí)旅游人數(shù)反饋數(shù)據(jù)輸入至所述目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型進(jìn)行訓(xùn)練,包括:
38、基于用戶的移動(dòng)終端獲取景點(diǎn)調(diào)查反饋數(shù)據(jù),所述景點(diǎn)調(diào)查反饋數(shù)據(jù)至少包括:景點(diǎn)實(shí)時(shí)圖像數(shù)據(jù)、景點(diǎn)人數(shù)實(shí)時(shí)調(diào)查數(shù)據(jù)、景點(diǎn)車流量數(shù)據(jù);
39、基于所述景點(diǎn)調(diào)查反饋數(shù)據(jù)生成實(shí)時(shí)旅游人數(shù)反饋數(shù)據(jù),將所述實(shí)時(shí)旅游人數(shù)反饋數(shù)據(jù)和所述實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù)進(jìn)行對(duì)比;
40、若兩個(gè)數(shù)據(jù)之間的差值小于20%,則對(duì)所述目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型的參數(shù)進(jìn)行調(diào)整;
41、若兩個(gè)數(shù)據(jù)之間的差值大于20%,則將所述實(shí)時(shí)旅游人數(shù)反饋數(shù)據(jù)輸入至所述目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型進(jìn)行訓(xùn)練。
42、實(shí)現(xiàn)上述目的本發(fā)明的技術(shù)方案為,進(jìn)一步,一種基于大數(shù)據(jù)分析的旅游人數(shù)預(yù)測(cè)系統(tǒng),所述旅游人數(shù)預(yù)測(cè)系統(tǒng)包括以下模塊:
43、數(shù)據(jù)處理模塊,用于獲取數(shù)據(jù)庫中的實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù),對(duì)所述實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,得到訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù),所述實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)至少包括:實(shí)時(shí)天氣數(shù)據(jù)、實(shí)時(shí)交通流量數(shù)據(jù)、實(shí)時(shí)門票預(yù)定數(shù)據(jù)、實(shí)時(shí)熱點(diǎn)社交媒體數(shù)據(jù);
44、數(shù)據(jù)加密模塊,用于利用rsa非對(duì)稱加密算法對(duì)所述訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)進(jìn)行加密,得到目標(biāo)訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù);
45、模型建立模塊,用于建立cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型,利用next-vi?t作為所述cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型的混合框架,得到目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型;
46、人數(shù)預(yù)測(cè)模塊,用于將所述目標(biāo)訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)輸入至所述目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型中進(jìn)行識(shí)別預(yù)測(cè),利用cnn卷積神經(jīng)網(wǎng)絡(luò)獲取訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)特征,transfome獲取所述訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)的全局信息,得到實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù);
47、旅游選擇模塊,用于基于所述實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù)判斷景點(diǎn)的人流量數(shù)據(jù)是否高于預(yù)設(shè)的景點(diǎn)極限人流量數(shù)據(jù),若高于景點(diǎn)極限人流量數(shù)據(jù)則生成備選景點(diǎn)旅游方案,將所述備選景點(diǎn)旅游方案展示至用戶的移動(dòng)終端;
48、預(yù)測(cè)對(duì)比模塊,用于獲取用戶的實(shí)時(shí)旅游人數(shù)反饋數(shù)據(jù),將所述實(shí)時(shí)旅游人數(shù)反饋數(shù)據(jù)和所述實(shí)時(shí)旅游人數(shù)預(yù)測(cè)數(shù)據(jù)進(jìn)行對(duì)比,若兩個(gè)數(shù)據(jù)之間的差值大于20%,則將所述實(shí)時(shí)旅游人數(shù)反饋數(shù)據(jù)輸入至所述目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型進(jìn)行訓(xùn)練。
49、進(jìn)一步,在上述一種基于大數(shù)據(jù)分析的旅游人數(shù)預(yù)測(cè)系統(tǒng)中,所述數(shù)據(jù)處理模塊包括以下子模塊:
50、獲取子模塊,用于基于用戶的實(shí)時(shí)景點(diǎn)查詢需求獲取數(shù)據(jù)庫中的實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù),所述實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)至少包括:實(shí)時(shí)天氣數(shù)據(jù)、實(shí)時(shí)交通流量數(shù)據(jù)、實(shí)時(shí)門票預(yù)定數(shù)據(jù)、實(shí)時(shí)熱點(diǎn)社交媒體數(shù)據(jù);
51、切分子模塊,用于將所述實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)進(jìn)行數(shù)據(jù)切分,得到多層實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù);
52、二進(jìn)制子模塊,用于對(duì)所述多層實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)進(jìn)行二進(jìn)制轉(zhuǎn)化,得到二進(jìn)制實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù);
53、得到子模塊,用于對(duì)所述二進(jìn)制實(shí)時(shí)旅游關(guān)聯(lián)數(shù)據(jù)進(jìn)行數(shù)據(jù)集分類,得到訓(xùn)練旅游關(guān)聯(lián)數(shù)據(jù)。
54、進(jìn)一步,在上述一種基于大數(shù)據(jù)分析的旅游人數(shù)預(yù)測(cè)系統(tǒng)中,所述模型建立模塊包括以下子模塊:
55、建立子模塊,用于建立cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型,所述cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型至少包括初始層、輸入層、輸出層、全連接層和平均池化層;
56、嵌入子模塊,用于在所述cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型的每一層之前放置一個(gè)patch的線性嵌入層,所述線性嵌入層用戶通道匹配和提取patch信息;
57、混合子模塊,用于利用next-v?i?t作為所述cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型的混合框架;
58、堆疊子模塊,用于將所述cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型中的ncb模塊和ntb模塊以(n+1)*l的混合方式進(jìn)行堆疊,得到目標(biāo)cnn-transformer混合人流量數(shù)據(jù)預(yù)測(cè)模型。
59、其有益效果在于,通過在收集、存儲(chǔ)和分析旅游數(shù)據(jù)的過程中,采用先進(jìn)的加密算法和技術(shù)手段,確保數(shù)據(jù)的安全性和隱私性。既保護(hù)了消費(fèi)者的個(gè)人信息不被泄露,也維護(hù)了旅游企業(yè)的商業(yè)機(jī)密。并且實(shí)現(xiàn)了對(duì)旅游市場(chǎng)的全面分析。無論是搜索引擎的查詢量、社交媒體的用戶評(píng)論,還是在線旅游平臺(tái)的預(yù)訂數(shù)據(jù),都被納入分析范疇,從而更準(zhǔn)確地反映了旅游市場(chǎng)的真實(shí)情況。這種全面的數(shù)據(jù)分析使得預(yù)測(cè)結(jié)果更加精準(zhǔn),為旅游企業(yè)提供了有力的決策支持。