本發(fā)明涉及公共交通大數(shù)據(jù)處理,尤其涉及的是一種基于時(shí)空特征的公交通勤乘客出行需求分析方法。
背景技術(shù):
1、近年來,城市公交面臨著客運(yùn)量持續(xù)下降的嚴(yán)峻挑戰(zhàn)。根據(jù)數(shù)據(jù)顯示,2012年至2022年間,常規(guī)公交系統(tǒng)的客運(yùn)量逐年下降,同時(shí),單車日載客量也下降幅度顯著。這樣一來,導(dǎo)致城市公交面臨了高運(yùn)力投入與低客流效益之間的巨大反差。
2、為了應(yīng)對(duì)這一挑戰(zhàn),公交公司開始采取多種措施優(yōu)化運(yùn)營效率和服務(wù)質(zhì)量。優(yōu)化線路布局、增加定制公交服務(wù)、調(diào)整車輛數(shù)量與分布等方法已在諸多大城市得到廣泛應(yīng)用。例如,a城市在2022年底優(yōu)化了138條公交線路,新增了60個(gè)站點(diǎn),并實(shí)現(xiàn)了市中心區(qū)所有地鐵站點(diǎn)與公交線路的200米接駁。盡管這些措施在一定程度上緩解了運(yùn)營壓力,但要確保公交資源的有效配置和持續(xù)改進(jìn),還需要更為精準(zhǔn)的乘客需求預(yù)測。
3、目前,公交行業(yè)的需求預(yù)測多依賴于傳統(tǒng)的歷史數(shù)據(jù)分析方法,忽略了乘客出行行為的時(shí)空特征和出行鏈規(guī)律。尤其是通勤乘客的需求通常集中在早晚高峰時(shí)段,傳統(tǒng)方法難以精準(zhǔn)預(yù)測這些波動(dòng)性需求的變化。隨著城市空間結(jié)構(gòu)的日益復(fù)雜化和出行方式的多樣化,傳統(tǒng)的需求預(yù)測方法無法完全滿足公交系統(tǒng)在高峰時(shí)段的運(yùn)力調(diào)度需求。這將導(dǎo)致運(yùn)力與需求不匹配,無法為乘客提供高效、便捷的出行服務(wù)。
4、因此,現(xiàn)有技術(shù)還有待改進(jìn)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明要解決的技術(shù)問題在于,針對(duì)現(xiàn)有技術(shù)缺陷,本發(fā)明提供一種基于時(shí)空特征的公交通勤乘客出行需求分析方法,以解決傳統(tǒng)的歷史數(shù)據(jù)分析方法難以精準(zhǔn)預(yù)測波動(dòng)性運(yùn)力調(diào)度需求的問題。
2、本發(fā)明解決技術(shù)問題所采用的技術(shù)方案如下:
3、第一方面,本發(fā)明提供基于時(shí)空特征的公交通勤乘客出行需求分析方法,包括:
4、獲取公交乘客的歷史出行數(shù)據(jù),并構(gòu)建個(gè)人出行行為數(shù)據(jù)集;
5、基于出行頻率篩選通勤乘客群體,并根據(jù)乘客的出行時(shí)間及出行站點(diǎn)的熵值、出行鏈相似度分析出行時(shí)空規(guī)律;
6、根據(jù)所述出行時(shí)空規(guī)律提取與預(yù)測目標(biāo)相關(guān)的出行鏈維度特征、時(shí)間維度特征以及空間維度特征;
7、基于提取的特征構(gòu)建特征矩陣,利用分布式梯度增強(qiáng)模型對(duì)所述特征矩陣中的特征進(jìn)行訓(xùn)練,基于訓(xùn)練后的出行需求預(yù)測模型預(yù)測及輸出通勤乘客的出行需求。
8、在一種實(shí)現(xiàn)方式中,所述獲取公交乘客的歷史出行數(shù)據(jù),并構(gòu)建個(gè)人出行行為數(shù)據(jù)集,包括:
9、獲取公交乘客的上車站點(diǎn)、下車站點(diǎn)、上車時(shí)間以及下車時(shí)間信息,得到所述歷史出行數(shù)據(jù);
10、根據(jù)所述歷史出行數(shù)據(jù)構(gòu)建所述個(gè)人出行行為數(shù)據(jù)集。
11、在一種實(shí)現(xiàn)方式中,所述基于出行頻率篩選通勤乘客群體,包括:
12、基于所述個(gè)人出行行為數(shù)據(jù)集分析對(duì)應(yīng)乘客的日出行頻率、周出行頻率以及重復(fù)出行鏈出行頻率;
13、根據(jù)所述日出行頻率、所述周出行頻率以及所述重復(fù)出行鏈出行頻率,從所述公交乘客的歷史出行數(shù)據(jù)中篩選通勤乘客,確定所述通勤乘客群體。
14、在一種實(shí)現(xiàn)方式中,所述根據(jù)乘客的出行時(shí)間及出行站點(diǎn)的熵值、出行鏈相似度分析出行時(shí)空規(guī)律,包括:
15、分別計(jì)算通勤乘客和非通勤乘客對(duì)應(yīng)的出行時(shí)間、出行站點(diǎn)的熵值以及相同工作日出行鏈相似度,對(duì)比得出所述通勤乘客的出行模式時(shí)空規(guī)律。
16、在一種實(shí)現(xiàn)方式中,所述根據(jù)所述出行時(shí)空規(guī)律提取與預(yù)測目標(biāo)相關(guān)的出行鏈維度特征、時(shí)間維度特征以及空間維度特征,包括:
17、提取相同工作日相同出行次序的od1數(shù)據(jù)、相同工作日相同出行次序的出行時(shí)間t1、所述od1數(shù)據(jù)對(duì)應(yīng)的最高頻出行時(shí)間t2以及所述出行時(shí)間t1對(duì)應(yīng)的最高頻出行時(shí)間od2數(shù)據(jù),得到所述出行鏈維度特征;
18、提取通勤乘客在最近預(yù)設(shè)次出行的出行時(shí)間,得到所述時(shí)間維度特征;
19、提取所述通勤乘客在所述最近預(yù)設(shè)次出行對(duì)應(yīng)的出行od數(shù)據(jù),提取每次出行與前一次出行終點(diǎn)d距離最近的歷史起始點(diǎn)o對(duì)應(yīng)的最高頻od數(shù)據(jù),得到所述空間維度特征。
20、在一種實(shí)現(xiàn)方式中,所述基于提取的特征構(gòu)建特征矩陣,利用分布式梯度增強(qiáng)模型對(duì)所述特征矩陣中的特征進(jìn)行訓(xùn)練,基于訓(xùn)練后的出行需求預(yù)測模型預(yù)測及輸出通勤乘客的出行需求,包括:
21、基于提取的特征構(gòu)建所述特征矩陣,對(duì)所述特征矩陣中的出行鏈維度特征、時(shí)間維度特征以及空間維度特征進(jìn)行獨(dú)熱編碼;
22、基于所述分布式梯度增強(qiáng)模型對(duì)所述特征矩陣中的出行鏈維度特征、時(shí)間維度特征以及空間維度特征進(jìn)行訓(xùn)練,得到所述訓(xùn)練后的出行需求預(yù)測模型;
23、基于所述訓(xùn)練后的出行需求預(yù)測模型預(yù)測及輸出通勤乘客的出行需求。
24、在一種實(shí)現(xiàn)方式中,所述基于所述分布式梯度增強(qiáng)模型對(duì)所述特征矩陣中的出行鏈維度特征、時(shí)間維度特征以及空間維度特征進(jìn)行訓(xùn)練,包括:
25、基于所述分布式梯度增強(qiáng)模型對(duì)提取的時(shí)空特征進(jìn)行訓(xùn)練,構(gòu)建出行需求預(yù)測模型;
26、采用k折交叉驗(yàn)證方法對(duì)所述出行需求預(yù)測模型進(jìn)行驗(yàn)證,并根據(jù)驗(yàn)證結(jié)果優(yōu)化模型參數(shù),得到所述訓(xùn)練后的出行需求預(yù)測模型。
27、第二方面,本發(fā)明提供一種基于時(shí)空特征的公交通勤乘客出行需求分析系統(tǒng),包括:
28、數(shù)據(jù)集獲取模塊,用于獲取公交乘客的歷史出行數(shù)據(jù),并構(gòu)建個(gè)人出行行為數(shù)據(jù)集;
29、出行時(shí)空規(guī)律分析模塊,用于基于出行頻率篩選通勤乘客群體,并根據(jù)乘客的出行時(shí)間及出行站點(diǎn)的熵值、出行鏈相似度分析出行時(shí)空規(guī)律;
30、多維度特征提取模塊,用于根據(jù)所述出行時(shí)空規(guī)律提取與預(yù)測目標(biāo)相關(guān)的出行鏈維度特征、時(shí)間維度特征以及空間維度特征;
31、預(yù)測及輸出模塊,用于基于提取的特征構(gòu)建特征矩陣,利用分布式梯度增強(qiáng)模型對(duì)所述特征矩陣中的特征進(jìn)行訓(xùn)練,基于訓(xùn)練后的出行需求預(yù)測模型預(yù)測及輸出通勤乘客的出行需求。
32、第三方面,本發(fā)明提供一種終端,包括:處理器以及存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有基于時(shí)空特征的公交通勤乘客出行需求分析程序,所述基于時(shí)空特征的公交通勤乘客出行需求分析程序被所述處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如第一方面所述的基于時(shí)空特征的公交通勤乘客出行需求分析方法的操作。
33、第四方面,本發(fā)明還提供一種介質(zhì),所述介質(zhì)為計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述介質(zhì)存儲(chǔ)有基于時(shí)空特征的公交通勤乘客出行需求分析程序,所述基于時(shí)空特征的公交通勤乘客出行需求分析程序被處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如第一方面所述的基于時(shí)空特征的公交通勤乘客出行需求分析方法的操作。
34、本發(fā)明采用上述技術(shù)方案具有以下效果:
35、本發(fā)明通過分析公交通勤乘客的歷史出行數(shù)據(jù),可確定通勤乘客的時(shí)空規(guī)律,以及通過提取時(shí)間、空間和出行鏈維度的特征,采用xgboost算法對(duì)多維特征進(jìn)行建模,從而構(gòu)建機(jī)器學(xué)習(xí)預(yù)測模型,可有效提高需求預(yù)測的準(zhǔn)確性,從而精準(zhǔn)預(yù)測通勤乘客的出行需求。
1.一種基于時(shí)空特征的公交通勤乘客出行需求分析方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于時(shí)空特征的公交通勤乘客出行需求分析方法,其特征在于,所述獲取公交乘客的歷史出行數(shù)據(jù),并構(gòu)建個(gè)人出行行為數(shù)據(jù)集,包括:
3.根據(jù)權(quán)利要求1所述的基于時(shí)空特征的公交通勤乘客出行需求分析方法,其特征在于,所述基于出行頻率篩選通勤乘客群體,包括:
4.根據(jù)權(quán)利要求1所述的基于時(shí)空特征的公交通勤乘客出行需求分析方法,其特征在于,所述根據(jù)乘客的出行時(shí)間及出行站點(diǎn)的熵值、出行鏈相似度分析出行時(shí)空規(guī)律,包括:
5.根據(jù)權(quán)利要求1所述的基于時(shí)空特征的公交通勤乘客出行需求分析方法,其特征在于,所述根據(jù)所述出行時(shí)空規(guī)律提取與預(yù)測目標(biāo)相關(guān)的出行鏈維度特征、時(shí)間維度特征以及空間維度特征,包括:
6.根據(jù)權(quán)利要求1所述的基于時(shí)空特征的公交通勤乘客出行需求分析方法,其特征在于,所述基于提取的特征構(gòu)建特征矩陣,利用分布式梯度增強(qiáng)模型對(duì)所述特征矩陣中的特征進(jìn)行訓(xùn)練,基于訓(xùn)練后的出行需求預(yù)測模型預(yù)測及輸出通勤乘客的出行需求,包括:
7.根據(jù)權(quán)利要求6所述的基于時(shí)空特征的公交通勤乘客出行需求分析方法,其特征在于,所述基于所述分布式梯度增強(qiáng)模型對(duì)所述特征矩陣中的出行鏈維度特征、時(shí)間維度特征以及空間維度特征進(jìn)行訓(xùn)練,包括:
8.一種基于時(shí)空特征的公交通勤乘客出行需求分析系統(tǒng),其特征在于,包括:
9.一種終端,其特征在于,包括:處理器以及存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有基于時(shí)空特征的公交通勤乘客出行需求分析程序,所述基于時(shí)空特征的公交通勤乘客出行需求分析程序被所述處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如權(quán)利要求1-7中任意一項(xiàng)所述的基于時(shí)空特征的公交通勤乘客出行需求分析方法的操作。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有基于時(shí)空特征的公交通勤乘客出行需求分析程序,所述基于時(shí)空特征的公交通勤乘客出行需求分析程序被處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如權(quán)利要求1-7中任意一項(xiàng)所述的基于時(shí)空特征的公交通勤乘客出行需求分析方法的操作。