最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種預(yù)測公交車到站時間的方法與流程

文檔序號:11146234閱讀:738來源:國知局
一種預(yù)測公交車到站時間的方法與制造工藝

本發(fā)明涉及交通技術(shù)領(lǐng)域,更具體地,涉及預(yù)測公交車到站時間的方法。



背景技術(shù):

隨著我國城市化進(jìn)程的發(fā)展,城市的經(jīng)濟(jì)得到了發(fā)展,人口、車輛也大量增加,隨之引發(fā)了一系列的交通問題,尤其是交通擁堵。公共交通具有承載率高、污染小、運(yùn)輸效率高等特點,故大力發(fā)展公共交通可以減緩城市擁堵現(xiàn)象。近年來,智能交通得到了重視和發(fā)展,出行者對于公交車到站時間的獲取需求也日益增加。到站時間公開之后,乘客可以提前規(guī)劃行程。這將吸引他們選擇公共交通出行,從而緩解交通壓力。此外,公交運(yùn)營公司的可以根據(jù)公交車的到站時間進(jìn)行調(diào)度,有利于公交管理向動態(tài)智能化的轉(zhuǎn)變,提高運(yùn)營效率。

公交到站時間預(yù)測近年來在國內(nèi)外都引起了廣泛關(guān)注。例如,都柏林在站點設(shè)置了電子站牌來展示到站時間;在日本,公交車到達(dá)時間預(yù)測是政府大力支持的一項交通需求管理措施。通過互聯(lián)網(wǎng)向用戶的手機(jī)和電腦發(fā)送公交車的預(yù)測到達(dá)時間吸引人們乘坐公交車出行,從而限制私家車使用數(shù)量。在中國的應(yīng)用主要分為兩種:一種是布置實體公交電子站牌,例如上海在站牌上展示公交到站時間;另外一種是利用客戶端軟件發(fā)布信息。用戶可以通過這些軟件獲取公交車的位置(距離)信息等。

目前雖然存在多種預(yù)測模型,如基于歷史數(shù)據(jù)、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等,但是基本上預(yù)測精度有限。公交車的行駛過程受到各種隨機(jī)因素的影響,尤其我國城市交通環(huán)境復(fù)雜,目前已有的成熟預(yù)測方法得到的公交到站時間不夠準(zhǔn)確,可靠性較低??傮w看來,關(guān)于公交車到達(dá)時間預(yù)測技術(shù)的研究仍然較少或者存在一定的局限性,亟待開發(fā)一種新型的公交到站時間預(yù)測方法。



技術(shù)實現(xiàn)要素:

本發(fā)明提供一種克服上述問題或者至少部分地解決上述問題的預(yù)測公交車到站時間的方法。

根據(jù)本發(fā)明的一個方面,提供一種預(yù)測公交車到站時間的方法,其特征在于,包括:

S1、采集一定時間內(nèi)的公交車數(shù)據(jù)以及公交線路數(shù)據(jù),基于空間插值法,獲得公交車在各數(shù)據(jù)點的時距數(shù)據(jù)對;

S2、基于所述時距數(shù)據(jù)對,獲得公交車運(yùn)營序列;

S3、將所述公交車運(yùn)營序列輸入至LSTM遞歸神經(jīng)網(wǎng)絡(luò),獲得公交車到站時間預(yù)測模型;以及

S4、對所述公交車到站時間預(yù)測模型基于鏈?zhǔn)筋A(yù)測法,獲得預(yù)測的公交車到站時間。

本發(fā)明提出利用遞歸神經(jīng)網(wǎng)絡(luò)進(jìn)行公交到站時間預(yù)測的方法:利用我國城市公交在運(yùn)營時的公交車數(shù)據(jù)和公交線路數(shù)據(jù),提取與交通相關(guān)的信息,經(jīng)過訓(xùn)練LSTM遞歸神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)交通狀況變化的規(guī)律,從而得到公交車在動態(tài)變化交通環(huán)境下的到站時間。

附圖說明

圖1為本發(fā)明實施例中LSTM型RNN中隱藏層結(jié)點的結(jié)構(gòu)圖;

圖2為根據(jù)本發(fā)明實施例的預(yù)測公交車到站時間的流程示意圖;

圖3為根據(jù)本發(fā)明實施例的計算除首站之外站點的出發(fā)時間的一維線性回歸示意圖;

圖4為根據(jù)本發(fā)明實施例的預(yù)測到站時間結(jié)果說明圖;

圖5為根據(jù)本發(fā)明實施例的預(yù)測方法與其他4種方法的結(jié)構(gòu)圖。

具體實施方式

下面結(jié)合附圖和實施例,對本發(fā)明的具體實施方式作進(jìn)一步詳細(xì)描述。以下實施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。

為了克服現(xiàn)有預(yù)測方法存在的公交到站時間不夠準(zhǔn)確、可靠性交底的計算問題,本發(fā)明提供了一種基于LSTM遞歸神經(jīng)網(wǎng)絡(luò)的預(yù)測公交車到站時間的方法。下面結(jié)合附圖對本發(fā)明的具體實施方式進(jìn)行說明。

遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)通過添加自連接隱藏層,賦予神經(jīng)網(wǎng)絡(luò)對時間進(jìn)行建模的能力,從而區(qū)別于其他的神經(jīng)網(wǎng)絡(luò)。RNN隱藏層的輸出,不僅僅會傳播到下一層,而且還進(jìn)入了下一時刻的本隱藏層,但RNN會受到梯度消失或梯度爆炸的影響,導(dǎo)致它難以學(xué)習(xí)較遠(yuǎn)時間點對當(dāng)前時間點的影響。本發(fā)明采用具有解決上下文長時間依賴的RNN網(wǎng)絡(luò)結(jié)構(gòu),如長短時神經(jīng)網(wǎng)絡(luò)(Long Short Term Memory,LSTM),帶門結(jié)構(gòu)的遞歸單元神經(jīng)網(wǎng)絡(luò)(Gated Recurrent Unit,GRU)等。

本發(fā)明采用的RNN為LSTM型RNN,通過將普通的神經(jīng)元用帶有門結(jié)構(gòu)(在本發(fā)明中,包括輸入門、遺忘門和輸出門)的記憶單元(Memory Cell)替換,解決了梯度消失或梯度爆炸的問題。在前向傳播中,門結(jié)構(gòu)控制了激活的進(jìn)入和輸出;在后向傳播中,門結(jié)構(gòu)控制了殘差的流入和流出。如圖1所示,此為帶有一個記憶單元的隱藏層神經(jīng)元結(jié)點,包含三個門:輸入門i、遺忘門f和輸出門O,it,ft,ot分別是三個門在時刻t對應(yīng)的激活值;xt和ht-1是神經(jīng)元輸入數(shù)據(jù)的兩個來源,其中xt是上一層的神經(jīng)元在t時刻的輸出,而ht-1是上一個時刻即t-1時刻本層所有神經(jīng)元的輸出值;Ct是內(nèi)部狀態(tài)在此時刻的值;ht是當(dāng)前t時刻隱藏結(jié)點的輸出值。它們的計算過程為:

it=σ(Wxi*xt+Whi*ht-1+bi);

ft=σ(Wxf*xt+Whf*ht-1+bf);

ot=σ(Wxo*xt+Who*ht-1+bo);

Ct=ftοht-1+itοgt;

其中Wxg,Wxi,Wxf,Wxo,Whg,Whf分別是連接各層(不同結(jié)構(gòu))的邊的權(quán)值;bi,bf,bo,bg是偏置項,權(quán)值和偏置項都是待求參數(shù)。在RNN中,權(quán)值和偏置項在不同的時刻共享相同的值。σ和是不同的激活函數(shù),σ常為Sigmoid函數(shù),而可以為tanh函數(shù)或tanh函數(shù)的變種。ο運(yùn)算符代表元素對應(yīng)相乘。

利用LSTM能夠?qū)W習(xí)長期依賴關(guān)系的特點,本發(fā)明從已有的定位數(shù)據(jù)和靜態(tài)數(shù)據(jù)中提取在公交到站預(yù)測問題中LSTM所需的時間序列信息,用這些信息反映描述某時間某位置的交通狀況。本發(fā)明將時間序列信息輸入至網(wǎng)絡(luò)中以學(xué)習(xí)交通狀態(tài),并用LSTM記憶單元的內(nèi)部狀態(tài)進(jìn)行存儲。隱藏層節(jié)點的輸出經(jīng)過前向傳播過程,直到網(wǎng)絡(luò)的輸出層,通過預(yù)測到站時間。故本發(fā)明預(yù)測的公交到站時間是基于動態(tài)變化的交通狀態(tài)的,更具有可靠性。

圖2示出了本發(fā)明的流程示意圖,包括:

S1、采集一定時間內(nèi)的公交車數(shù)據(jù)以及公交線路數(shù)據(jù),基于空間插值法,獲得公交車在各數(shù)據(jù)點的時距數(shù)據(jù)對;

S2、基于所述時距數(shù)據(jù)對,獲得公交車運(yùn)營序列;

S3、將所述公交車運(yùn)營序列輸入至LSTM遞歸神經(jīng)網(wǎng)絡(luò),獲得公交車到站時間預(yù)測模型;以及

S4、對所述公交車到站時間預(yù)測模型基于鏈?zhǔn)筋A(yù)測法,獲得預(yù)測的公交車到站時間。

本發(fā)明提出利用遞歸神經(jīng)網(wǎng)絡(luò)進(jìn)行公交到站時間預(yù)測的方法:利用我國城市公交在運(yùn)營時的公交車數(shù)據(jù)和公交線路數(shù)據(jù),提取與交通相關(guān)的信息,經(jīng)過訓(xùn)練LSTM遞歸神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)交通狀況變化的規(guī)律,從而得到公交車在動態(tài)變化交通環(huán)境下的到站時間。

本發(fā)明所述的公交車數(shù)據(jù)包括:公交車編號、公交車所屬線路的線路編號、公交車的地理位置數(shù)據(jù)、公交車的地理位置數(shù)據(jù)的采集時間、運(yùn)營次數(shù)以及上下行方向,其中公交車的地理位置數(shù)據(jù)為公交車在運(yùn)營過程中通過車載定位系統(tǒng)發(fā)射的全球定位系統(tǒng)(Global Positioning System,GPS)數(shù)據(jù)。

本發(fā)明所述的公交線路數(shù)據(jù)包括:公交線路的線路編號、線路中各站點編號、各站點的地理位置數(shù)據(jù)、各路口的地理位置信息以及上下行方向。之所以選擇路口,是因為交通受到信號燈的控制影響較大,主要體現(xiàn)在信號燈的改變會引發(fā)交通狀態(tài)的突然變化,從而影響公交車的運(yùn)行時間,比如由綠燈變換成紅燈之后,交通流被截斷,處于被截斷部分交通流的公交車會增加停車延誤時間以及引道延誤時間。

由于公交線路數(shù)據(jù)和公交車數(shù)據(jù)通常保存在公交公司的數(shù)據(jù)庫中,數(shù)據(jù)的組織形式是雜亂無章的,本發(fā)明首先需要將屬于公交車不同次運(yùn)營的定位數(shù)據(jù)區(qū)分開來,使每一個劃分出來的小集合里的數(shù)據(jù)都屬于同一次運(yùn)營。

具體地說,所述步驟S1包括:

S1.1、采集一定時間內(nèi)的公交車數(shù)據(jù)以及公交線路數(shù)據(jù),獲得對應(yīng)不同線路、不同運(yùn)營次數(shù)的公交車的歷史時距數(shù)據(jù)信息,所述歷史時距數(shù)據(jù)信息包括所述線路的首站點和末站點的地理位置數(shù)據(jù)、線路總距離和總到站時間。

獲得公交車的歷史時距數(shù)據(jù)信息的方法屬于現(xiàn)有技術(shù),例如,可以采用專利“一種公交時距數(shù)據(jù)的獲取方法及服務(wù)器”(發(fā)明號:2016108876465)的方法獲得,

在到站預(yù)測問題中,我們還需要知道公交車到達(dá)各個站點的時間,因此,步驟S1還包括步驟S1.2:基于所述歷史時距數(shù)據(jù)信息,通過空間插值法,獲得各數(shù)據(jù)點的積累距離。

所述步驟S1.2具體包括:根據(jù)線路編號和上下行標(biāo)志,我們從數(shù)據(jù)表里查詢線路的中間站點和沿線路的路口的經(jīng)緯度位置。通過空間插值,如克里金插值法得到站點(也可以是路口,下同)的累積距離:設(shè)某次運(yùn)營的定位數(shù)據(jù)的坐標(biāo)值為x1,x2,...,xn,對應(yīng)的觀測值為計算得到的累積距離Z(x1),Z(x2),...,Z(xn),所述積累距離為該站點到首站點的距離,那么對于某個站點(路口)的經(jīng)緯度坐標(biāo)x0,它對應(yīng)的累積距離Z(x0)可以用線性組合來估計,其中λi為組合權(quán)重,體現(xiàn)了x0與x1,x2,...,xn之間的關(guān)系,該關(guān)系通過求解克里金方程得到,由于篇幅問題,求解克里金方程的方法不再詳細(xì)說明,可參考論文Oliver,M.A."Kriging:A Method of Interpolation for Geographical Information Systems."International Journal of Geographic Information Systems 4:313–332.1990。

在得到中間站點的累積距離之后,我們通過線性回歸的方法計算公交車的到達(dá)除首站之外各站點的時間。根據(jù)已知的輸入,輸出數(shù)據(jù)(在該問題中,輸入和輸出分別為定位數(shù)據(jù)的連續(xù)累積距離和采集時間),擬合線性函數(shù)(在該問題中,為連續(xù)累積距離和采集時間的關(guān)系表示),并將未知的數(shù)據(jù)輸入(在該問題中,為站點的累積距離)至擬合的函數(shù)中,得到所需要的值(在該問題中,為到達(dá)站點的時間)。具體的操作過程如下:

圖3示出了計算各站到達(dá)時間的線性回歸示意圖,如圖3所示,黑色的點表示的是根據(jù)專利“一種公交時距數(shù)據(jù)的獲取方法及服務(wù)器”(發(fā)明號:2016108876465)獲得的各定位數(shù)據(jù)的連續(xù)累積距離以及采集時間,藍(lán)色的線是擬合函數(shù),該擬合函數(shù)的過程通過python計算機(jī)程序語言中的sklearn.linear_model包來實現(xiàn),具體的程序如下:

regr=linear_model.LinearRegression()

regr.fit(X,Y)

y_pred=regr.predict(x)

其中,第一個語句得到函數(shù)句柄,第二個語句輸入已知的輸入數(shù)據(jù)X和輸出數(shù)據(jù)Y,得到擬合函數(shù);第三個語句輸入數(shù)據(jù)X至擬合函數(shù)中,計算得到y(tǒng)_pred,其中輸入數(shù)據(jù)X對應(yīng)于公交車輛實時動態(tài)位置對應(yīng)的累積距離;輸出數(shù)據(jù)Y對應(yīng)于公交車輛實時動態(tài)位置所在的數(shù)據(jù)采集絕對時間,x是除去首站之外的各站點的累積距離,得到的y_pred即所需的各站到達(dá)時間。

進(jìn)一步地,由于公交車在30秒時間間隔內(nèi)的運(yùn)營距離會較長,本發(fā)明對每百米距離的位置進(jìn)行采樣,作為采樣點,通過線性插值,得到對應(yīng)的公交車運(yùn)行時間。

插值的目的是為了改善車載定位裝置低頻率發(fā)射定位數(shù)據(jù)的缺點,使模型能夠以更高頻率監(jiān)測交通狀態(tài)的變化和公交車的運(yùn)行情況。

在得到各數(shù)據(jù)點的積累距離后,本發(fā)明的步驟S1還包括步驟S1.3,將所述積累距離和對應(yīng)的到站時間作為公交車到達(dá)該數(shù)據(jù)點時的時距數(shù)據(jù)對。

在一個實施例中,時距數(shù)據(jù)對相應(yīng)的來源可能是站點、采樣點或者路口點。一次運(yùn)營過程中,按時間順序排列的所有時距數(shù)據(jù)對記錄了公交車在時間和空間范圍內(nèi)的移動情況。

在一個實施例中,本發(fā)明在獲得所有時距數(shù)據(jù)對后,開始構(gòu)建時間序列,以訓(xùn)練LSTM模型,在公交車到站時間預(yù)測問題中,公交車運(yùn)營序列(或簡稱為運(yùn)營序列)是“時間序列”。

本發(fā)明中的所述步驟S2具體包括:

S2.1、將公交車到達(dá)各數(shù)據(jù)點時的時距數(shù)據(jù)對、當(dāng)前數(shù)據(jù)點與下一數(shù)據(jù)點的間距、共享同一個站點的線路總數(shù)以及數(shù)據(jù)標(biāo)識符作為特征向量,構(gòu)成對應(yīng)各數(shù)據(jù)點的公交車運(yùn)營特征向量。

具體來說,一次運(yùn)營中的所有時距數(shù)據(jù)對的序列記為S=(S1,S2,...,Si,...SN),其中Si=(ti,di)T,記錄了公交車到達(dá)Si對應(yīng)位置的運(yùn)行時間ti和積累距離di。以Si為例,計算LSTM所需的部分輸入信息,包括:當(dāng)前時刻Ti=ti+ST,其中,ST是公交車離開第一個站點的絕對時間,當(dāng)前位置和首站之前的距離以及和下一個數(shù)據(jù)點的間隔距離Δdi=di+1-di。

通過對數(shù)據(jù)庫的查詢得到共享同一個站點的線路總數(shù)量(li,當(dāng)?shù)趇個數(shù)據(jù)點不對應(yīng)站點時,值為0);給予每一個數(shù)據(jù)點一個one-hot向量(fi,即一位有效編碼)以區(qū)分不同來源的數(shù)據(jù)點,如:當(dāng)數(shù)據(jù)點為站點時,fi=[0,0,1];當(dāng)為采樣點時,fi=[0,1,0];當(dāng)為公交車的地理位置時fi=[1,0,0]。這五種特征構(gòu)成了一個公交時距數(shù)據(jù)對的運(yùn)營特征向量,Xi=(Ti,di,Δdi,li,fi)T。

由此可知,運(yùn)營特征向量的每個特征都是和交通狀態(tài)密切相關(guān)的:Ti和di分別為當(dāng)前時刻(用絕對時間表示)和公交車所處的當(dāng)前位置(用和首站之間的距離表示),這將告訴網(wǎng)絡(luò)需要學(xué)習(xí)何時何地的交通狀態(tài);Δdi是待預(yù)測位置和當(dāng)前位置之間的距離,這明確了需要預(yù)測多遠(yuǎn)距離內(nèi)的交通變化情況;li特指共享站點的線路數(shù)量,用來反映站點的承載力對公交車運(yùn)營的影響:線路數(shù)量的多少關(guān)系到上進(jìn)出站的排隊長度,從而影響上下車的延誤時間。在這樣的輸入條件下,本發(fā)明讓LSTM網(wǎng)絡(luò)學(xué)習(xí)在某時空條件限定下的交通狀態(tài)以及在一定距離范圍內(nèi)交通的逐漸變化情況。在此期間若遇到信號燈路口等特殊位置,網(wǎng)絡(luò)還需要考慮交通突然變化的可能性。

運(yùn)營序列作為LSTM的輸入,它對應(yīng)的目標(biāo)輸出是公交車到達(dá)下一個位置點的運(yùn)行時間,即對Xi來說,對應(yīng)的目標(biāo)輸出Yi=ti+1。目標(biāo)序列記為Y=(Y1,Y2,...,Yi,...YN-1)。線路所有的運(yùn)營序列(X1,X2,...,XM)和對應(yīng)的目標(biāo)序列(Y1,Y2,...,YM)構(gòu)成運(yùn)營序列訓(xùn)練集,其中M是此線路公交車運(yùn)營的總次數(shù)。

在獲得公交車運(yùn)營特征向量后,所述步驟S2進(jìn)一步包括步驟S2.2:對所述公交車運(yùn)營特征向量中除數(shù)據(jù)標(biāo)識符外的各特征向量依次進(jìn)行歸一化處理(除以各特征的最大值maxV)和去均值處理(減去各特征的均值meanV),獲得所述公交車運(yùn)營序列。

在一個實施例中,所述步驟S3進(jìn)一步包括:

基于所述公交車運(yùn)營特征向量的維度,對所述公交車運(yùn)營序列進(jìn)行分批,獲得若干批數(shù)據(jù)。

具體地說,LSTM的輸入為K維向量,K即公交運(yùn)營序列特征向量的維度(即特征向量的長度)。本發(fā)明將公交車運(yùn)營序列進(jìn)行分批:設(shè)定一個miniBatch值,例如可設(shè)定為256,將運(yùn)營序列訓(xùn)練集共分為(M/miniBatch)批。

對每一批數(shù)據(jù)來說,在公交車到達(dá)每一個數(shù)據(jù)點的時刻向LSTM遞歸神經(jīng)網(wǎng)絡(luò)輸入該批數(shù)據(jù)對應(yīng)的公交運(yùn)營序列(miniBatch×K×1的矩陣),經(jīng)前向傳播,所述LSTM遞歸神經(jīng)網(wǎng)絡(luò)存儲交通狀態(tài),并輸出網(wǎng)絡(luò)輸出值。

接下來比較所述網(wǎng)絡(luò)輸出值和此時刻的目標(biāo)輸出值,獲得均方誤差,作為LSTM網(wǎng)絡(luò)的誤差,同時使用時間展開的后向傳播計算并傳遞殘差,對所有批的數(shù)據(jù)完成一次前向和后向傳播的過程稱為一次迭代,經(jīng)多次迭代(可以預(yù)先設(shè)定一個值,也可以當(dāng)誤差小于某個設(shè)定的值后停止迭代),獲得所述公交車到站時間預(yù)測模型。

在一個實施例中,基于隨機(jī)梯度下降法(Stochastic gradient descent,SGD),對LSTM遞歸神經(jīng)網(wǎng)絡(luò)中的權(quán)值和偏置進(jìn)行更新。具體的更新方程為:

new Wxi=Wxi+(m*Wxi-αΔWxi)

new bi=bi+(m*bi-αΔbi)

其余的權(quán)重和偏置的更新方程與上述公式類似。其中α是學(xué)習(xí)率,m是沖量因子,它的引入有助于訓(xùn)練過程中更新的權(quán)重和偏置陷入局部最小值。

在本發(fā)明中,預(yù)測公交車到站時間的過程定義為“無輸入的鏈?zhǔn)筋A(yù)測”,所述步驟S4包括:

S4.1、將公交車的當(dāng)前位置到預(yù)測位置之間的其他數(shù)據(jù)點作為輔助點。具體地說,假設(shè)線路共有n個站點,公交車當(dāng)前正位于第i個站點(記為當(dāng)前站點,i=1,...,n-1),想要預(yù)測到達(dá)下游目標(biāo)站點(記為第j個站點,j=i+1,...,n)的時間。預(yù)測過程按照i->ap1->...->apn->j的順序展開,其中ap1,...,apn是兩個站點之間存在其他的位置點(如兩個站點之間的采樣點、路口點),我們將它們統(tǒng)稱為輔助點。

S4.2、向所述公交車到站時間預(yù)測模型輸入基于當(dāng)前位置計算的公交車運(yùn)營特征向量,經(jīng)前向傳播獲得公交車運(yùn)行至第一個輔助點的預(yù)測的到站時間。具體地說,根據(jù)當(dāng)前站點的時距數(shù)據(jù)對Si計算對應(yīng)的運(yùn)營特征向量Xi,輸入至訓(xùn)練好的LSTM網(wǎng)絡(luò)中,經(jīng)過前向傳播過程得到的輸出值,即網(wǎng)絡(luò)預(yù)測公交車運(yùn)行至ap1的時間,記為Op1。

我們繼續(xù)預(yù)測公交車從ap1運(yùn)行至ap2的時間,由于車輛還未到達(dá)ap1所處的位置,所以,ap1對應(yīng)的運(yùn)營特征向量中的時間特征需要用上一步的預(yù)測結(jié)果來替代,即ap1對應(yīng)的運(yùn)營特征向量Xp1=(Tp1Dp1,Δdp1,lp1,fp1)T=(Op1,Dp1,Δdp1,lp1,fp1)T(除了當(dāng)前時刻特征是用上一步的預(yù)測結(jié)果替換之外,其余特征都跟網(wǎng)絡(luò)輸出結(jié)果無關(guān),可以從數(shù)據(jù)庫查詢得到或者計算得到)。

S4.3、將所述預(yù)測的到站時間將作為下一輔助點對應(yīng)的到站時間,結(jié)合其余特征向量,構(gòu)成下一輔助點的公交車運(yùn)營特征向量,重復(fù)步驟S4.2,直至獲得預(yù)測位置的網(wǎng)絡(luò)輸出值;以及

S4.4、對所述步驟S4.3的網(wǎng)絡(luò)輸出值進(jìn)行反去均值(加上S2.2步驟中得到的各特征的平均值meanV)和反歸一化(乘以S2.2步驟中得到的各特征的最大值maxV)處理,獲得預(yù)測的公交車到站時間。

當(dāng)車輛位于第i個站點,下游的交通狀態(tài)都是預(yù)測得到的。隨著車輛的向前移動,如真正到達(dá)第i+1個站點后,我們才可以得到真實的運(yùn)營特征向量。將該向量再輸入至LSTM網(wǎng)絡(luò)中糾正歷史預(yù)測的交通狀態(tài),再次預(yù)測第i+1個站點的下游目標(biāo)站點到站時間(這里的時間指當(dāng)前時間減去公交車離開首站的時間得到的時間)。因此,對一次運(yùn)營來說,預(yù)測結(jié)果是一個下三角矩陣,如圖5所示,橫坐標(biāo)(水平方向)代表當(dāng)前站點,縱坐標(biāo)代表下游站點,則第列的含義代表公交車當(dāng)前位于第個站點時預(yù)測到達(dá)下游各站點的時間。所以,圖4的矩陣包括以下含義,1、此線路共有十個站點;2、矩陣第t列(1≤t≤9)的含義為:當(dāng)公交車到達(dá)第t個站點時,模型預(yù)測公交車到達(dá)第t+1個站點至第十個站點的時間。

下面給出本發(fā)明的的應(yīng)用實例:

以北京118路(紫竹院南門—紅廟路口東)為例用本發(fā)明進(jìn)行預(yù)測,并和其他方法進(jìn)行比較。對比的方法是Sinn,M.,Ji,W.Y.,Calabrese,F.,&Bouillet,E.(2012).Predicting arrival times of buses using real-time GPS measurements.(Vol.24,pp.1227-1232)。對比文件中提到的四種方法,分別為:基于延遲的預(yù)測(,Delay-based Prediction,DB),線性回歸(Linear Regression,LR),K近鄰(K-Nearest Neighbor,KNN)和核回歸(Kernel Regression,KR)。

以在2015年2月份采集的該線路的定位數(shù)據(jù)為基礎(chǔ)進(jìn)行到站時間預(yù)測。將前27天的數(shù)據(jù)(共704條公交車運(yùn)營序列)作為訓(xùn)練數(shù)據(jù),預(yù)測2月28日共Y(Y=31)次運(yùn)營的到站時間。并用平均絕對誤差(mean absolute error,MAE)評估預(yù)測結(jié)果:

我們使用的LSTM模型包含一個輸入層,一個共有64個隱藏節(jié)點的隱藏層以及一個單一的線性輸出單元。記憶單元的激活函數(shù)為tanh函數(shù)。值域在[0,1]之間的sigmoid函數(shù)是三個門的激活函數(shù)。權(quán)值用高斯分布進(jìn)行初始化,使其服從N(0,1/(Nin+Nout),其中Nin和Nout分別指前一層和當(dāng)前層的神經(jīng)元數(shù)量。SGD方法的沖量因子設(shè)置為0.95,學(xué)習(xí)率在迭代中保持不變?yōu)?.0001。

五種方法得到結(jié)果如圖5所示。對所有預(yù)測長度的平均誤差而言,LSTM方法比其余四種方法中的最好結(jié)果提高了約24秒。在現(xiàn)實生活中,公交線路所在的道路上一般不會只有一輛公交車,所以短距離的預(yù)測是更貼近現(xiàn)實的。我們統(tǒng)計短距離預(yù)測的預(yù)測結(jié)果,預(yù)測距離為一站到五站,對應(yīng)圖5的第三到第七行。當(dāng)預(yù)測距離為一站時,預(yù)測公交車到達(dá)下一個站點的時間;當(dāng)預(yù)測距離為兩站時,預(yù)測公交車到達(dá)下游兩個站點的時間,依此類推。注意,預(yù)測距離為所有站點時,則是預(yù)測公交車到達(dá)所有下游站點的時間??梢钥吹?,LSTM的無論是長距離預(yù)測還是短距離預(yù)測,結(jié)果都是優(yōu)于其他方法的。

綜上所述,本發(fā)明提供了一種利用遞歸神經(jīng)網(wǎng)絡(luò)預(yù)測公交到站時間的方法。利用RNN來學(xué)習(xí)交通狀態(tài)的變化,將公交到站時間和交通情況關(guān)聯(lián)起來,得到更為可靠精確的預(yù)測結(jié)果。總的來說,用LSTM型RNN預(yù)測公交車到站時間具有以下的特點:

1.LSTM模型具有長時記憶歷史信息的優(yōu)點。因為交通的變化也具有歷史相關(guān)性,上下游的交通情況是互相影響的,故我們用記憶單元來存儲交通狀態(tài),并且利用記憶單元的內(nèi)部狀態(tài)隨時間展開而變化的模式來模擬交通狀態(tài)的演變。LSTM網(wǎng)絡(luò)的輸出在本問題中定義為預(yù)測的到站時間,故得到的公交到站時間是基于交通狀態(tài)的,相對于其它方法是更值得信任的。

2.LSTM模型具有很好的擴(kuò)展性。對于其他模型來說,加入多元信息很困難,而我們可以不斷地加入更多和交通相關(guān)的特征到LSTM模型中。在目前已有數(shù)據(jù)的基礎(chǔ)上我們只提取了五類特征。然而,交通還受到很多其他動態(tài)因素的影響,如天氣等。如果在未來能得到更多的信息,我們需要做的只是對數(shù)據(jù)進(jìn)行處理得到新的特征,并增加LSTM網(wǎng)絡(luò)的輸入或者輸出維度。更多重要影響因素的加入可能會進(jìn)一步提高預(yù)測的準(zhǔn)確性。

3.LSTM模型不用限制序列的長度,故我們可將到站預(yù)測擴(kuò)展為預(yù)測任意地點的公交車到達(dá)時間(適用于某些城市揮手即停的模式)。我們只需要對任意想要預(yù)測的位置進(jìn)行插值,經(jīng)過計算得到對應(yīng)的運(yùn)營特征向量,加入已有的序列中,再利用訓(xùn)練好的模型進(jìn)行鏈?zhǔn)筋A(yù)測即可。

最后,本發(fā)明的方法僅為較佳的實施方案,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1