本發(fā)明屬于交通工程領(lǐng)域,適用于城市道路中的車(chē)輛分類。車(chē)輛分類信息對(duì)于交通規(guī)劃、道路設(shè)施的設(shè)計(jì)與使用起到非常重要的作用。
背景技術(shù):
現(xiàn)在已經(jīng)有許多技術(shù)應(yīng)用于車(chē)輛分類。除了人工分類外,最近的車(chē)輛分類方法主要依靠固定傳感器例如氣動(dòng)導(dǎo)管傳感器、感應(yīng)線圈傳感器、壓電式傳感器等。這些方法被稱為是侵入式分類方法,不僅需要在現(xiàn)場(chǎng)操作,還會(huì)干擾交通流。另外一種非侵入式分類方法所依靠的傳感器有雷達(dá)傳感器、紅外線傳感器、聲波傳感器、視覺(jué)成像等,這種方法不會(huì)干擾交通但是運(yùn)行和維護(hù)費(fèi)用較高。
但是這些分類方法并不是在所有的情況下都適用。要么是傳感器運(yùn)用的成本太貴,或是在一些特定情況下,它們的檢測(cè)數(shù)據(jù)會(huì)出現(xiàn)錯(cuò)誤。例如在流量大,車(chē)速較快的路段,氣動(dòng)導(dǎo)管傳感器的檢測(cè)效果不理想;在擁堵的情況下,感應(yīng)線去傳感器的檢測(cè)效果也不理想;視覺(jué)成像的效果會(huì)受天氣的影響。
所以,現(xiàn)有的車(chē)輛分類方法主要存在兩個(gè)問(wèn)題(i)嚴(yán)重依賴固定傳感器和檢測(cè)技術(shù),侵入式設(shè)備影響交通,且成本較高(ii)現(xiàn)有的方法只能在固定地點(diǎn)采集交通檢測(cè)數(shù)據(jù),對(duì)大范圍的地區(qū)的數(shù)據(jù)采集比較昂貴。
技術(shù)實(shí)現(xiàn)要素:
鑒于以上陳述的已有方案的不足,本發(fā)明旨在提供高效、簡(jiǎn)單的方法,并使之克服現(xiàn)有技術(shù)上的缺點(diǎn)。
為了實(shí)現(xiàn)上述目的,本發(fā)明提出的方法是:
一種基于GPS數(shù)據(jù)的多類型車(chē)輛分類方法,采用車(chē)載位置的G PS數(shù)據(jù),基于三類車(chē)輛:小汽車(chē)、小型貨車(chē)和大型貨車(chē)加減速特征,用機(jī)器學(xué)習(xí)支持向量機(jī)建立車(chē)輛分類器,運(yùn)用支持向量機(jī)模型對(duì)三類車(chē)輛進(jìn)行自動(dòng)分類;其具體處理包含如下的手段:
(1)首先對(duì)采集的GPS數(shù)據(jù)進(jìn)行清洗,剔除奇異點(diǎn);
(2)對(duì)清洗后的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,對(duì)整理后的GPS數(shù)據(jù)進(jìn)行特征提取,提取的特征包括車(chē)輛的最大加速度、加速度的標(biāo)準(zhǔn)差、加減速累積頻率;在特征提取過(guò)程中獲得多組數(shù)據(jù)樣本;
(3)基于以上車(chē)輛的加減速特征,運(yùn)用支持向量機(jī)模型建立針對(duì)三種車(chē)型的分類器,其中支持向量機(jī)模型表達(dá)式為:
ξi≥0
其中:
xi∈Rd(i=1,2,...,N)是訓(xùn)練樣本i的提取特征;
N是總的訓(xùn)練樣本;
ti{1,-1}是樣本i的實(shí)際車(chē)輛種類(1表示小汽車(chē),-1表示貨車(chē));
w和b是將樣本分為兩種類型的分隔線的參數(shù);
表示一個(gè)固定的特征空間,該空間可以將矢量xi從初始的d-維度空間轉(zhuǎn)換到更高的維度空間;
ξi是一個(gè)松弛變量用來(lái)處理錯(cuò)誤分類的樣本;
C是一個(gè)控制變量用來(lái)平衡最大的效益和錯(cuò)誤分類的誤差;
確定分類器的方法如下式:
其中:
xt是實(shí)驗(yàn)樣本t的特征,該樣本的車(chē)輛種類是確定的;
αi是拉格朗日乘子,它是通過(guò)求解二元支持向量機(jī)模型的對(duì)偶問(wèn)題得到的;
k(xt,xi)是Kernel方程,它是和的點(diǎn)積;
(4)將車(chē)輛加減速變化情況作為有效的特征,通過(guò)交叉驗(yàn)證的數(shù)據(jù)挖掘方法和forward-selection選擇方法得到車(chē)型分類的最有效特征,對(duì)車(chē)輛進(jìn)行自動(dòng)分類。
本發(fā)明采用GPS數(shù)據(jù),運(yùn)用支持向量機(jī)模型對(duì)三類車(chē)輛進(jìn)行分類,對(duì)三種車(chē)輛進(jìn)行分類準(zhǔn)確率達(dá)到75%。通過(guò)對(duì)不同GPS數(shù)據(jù)的采樣頻率的計(jì)算結(jié)果進(jìn)行對(duì)比,發(fā)現(xiàn)采樣頻率越高對(duì)三種車(chē)輛的分類越準(zhǔn)確。
附圖說(shuō)明
圖1:GPS數(shù)據(jù)圖。
圖2:為采樣頻率為5秒的提取特征圖。其中:
圖A以最大加/減速度為特征的提取特征圖;
圖B以加/減速度標(biāo)準(zhǔn)差為特征的提取特征圖;
圖C以最大加速度超過(guò)1mpss的車(chē)輛比例為特征的提取特征圖;
圖D以最大加速度超過(guò)0.5mpss的車(chē)輛比例為特征的提取特征圖。
圖3:提取特征的箱線圖。其中:
圖A為小汽車(chē)的提取特征箱線圖;
圖B為小型貨車(chē)的提取特征箱線圖;
圖C為大型貨車(chē)的提取特征箱線圖。
圖4:交叉驗(yàn)證的計(jì)算過(guò)程。
圖5:Forward-selection方法提取最有效特征。
圖6:、模型1與模型4對(duì)比圖。
圖7:不同采樣頻率對(duì)應(yīng)的分類精度對(duì)照。
為了更好的建立車(chē)輛分類模型,首先需要對(duì)采集來(lái)的數(shù)據(jù)進(jìn)行清洗,剔除奇異點(diǎn)。剔除的規(guī)則1)GPS數(shù)據(jù)中兩個(gè)連續(xù)點(diǎn)之間的時(shí)間大于數(shù)據(jù)采集時(shí)間間隔;2)GPS數(shù)據(jù)中兩個(gè)連續(xù)點(diǎn)之間的加/減速度大于6m/s2。然后將清洗后的數(shù)據(jù)以20分鐘為間隔獲得車(chē)輛的時(shí)間-速度記錄。最后通過(guò)數(shù)據(jù)挖掘技術(shù),對(duì)整理后的GPS數(shù)據(jù)進(jìn)行車(chē)輛特征提取,提取的特征包括車(chē)輛的最大加減速度、加減速的標(biāo)準(zhǔn)差、加減速累積頻率。在車(chē)輛特征提取過(guò)程中可獲得多組數(shù)據(jù)樣本。
將清洗后的GPS數(shù)據(jù),通過(guò)數(shù)據(jù)挖掘技術(shù),提取出車(chē)輛的特征如圖2所示。圖A表明小汽車(chē)的最大加速度比小型貨車(chē)的大,而小型貨車(chē)的最大加速度比大型貨車(chē)的大。圖B、C、D表明小汽車(chē)的加減速變化比小型貨車(chē)和大型貨車(chē)的大,同時(shí)也表明貨車(chē)出現(xiàn)大幅度加減速頻率的次數(shù)較少。
本發(fā)明方法共提取了車(chē)輛的30個(gè)特征。三個(gè)箱線圖呈現(xiàn)出來(lái)的規(guī)律和圖2是類似的,即貨車(chē)較于小汽車(chē)的加速度更小,并且出現(xiàn)大幅度加減速的頻率更少。圖3中小汽車(chē)的箱線圖中,特征1即最大加速度的箱線圖表明提取特征的樣本數(shù)據(jù)中25%的小汽車(chē)最大加速度小于1.8m/s2,75%的車(chē)輛最大加速度大于1.4m/s2,最大的加速度為2.5m/s2,最小的加速度為1.1m/s2,箱體以外的數(shù)據(jù)為異常值,其余箱線圖的含義類似。
基于以上車(chē)輛加減速特征,運(yùn)用支持向量機(jī)模型建立針對(duì)三種車(chē)型的分類器,其中支持向量機(jī)模型表達(dá)式為:
ξi≥0
其中:
xi∈Rd(i=1,2,...,N)是訓(xùn)練樣本i的提取特征;
N是總的訓(xùn)練樣本;
ti{1,-1}是樣本i的實(shí)際車(chē)輛種類(1表示小汽車(chē),-1表示貨車(chē));
w和b是將樣本分為兩種類型的分隔線的參數(shù);
表示一個(gè)固定的特征空間,該空間可以將矢量xi從初始的d-維度空間轉(zhuǎn)換到更高的維度空間;
ξi是一個(gè)松弛變量用來(lái)處理錯(cuò)誤分類的樣本;
C是一個(gè)控制變量用來(lái)平衡最大的效益和錯(cuò)誤分類的誤差;
確定分類器的方法如下式:
其中:
xt是實(shí)驗(yàn)樣本t的特征,該樣本的車(chē)輛種類是確定的;
αi是拉格朗日乘子,它是通過(guò)求解二元支持向量機(jī)模型的對(duì)偶問(wèn)題得到的;
k(xt,xi)是Kernel方程,它是和的點(diǎn)積。
如果y(xt)≥0即樣本t所得的指標(biāo)為1,則表示該樣本為小汽車(chē);如果y(xt)≤0即樣本t所得的指標(biāo)為-1,則表示該樣本為貨車(chē)。
將車(chē)輛加減速變化情況作為有效的特征,通過(guò)交叉驗(yàn)證的數(shù)據(jù)挖掘辦法和forward-selection選擇方法得到車(chē)型分類的最有效特征,計(jì)算過(guò)程如圖4所示:
通過(guò)交叉驗(yàn)證的數(shù)據(jù)挖掘的辦法得到車(chē)型分類的最有效特征。圖5中模型四表明,在使用減速度超過(guò)0.8m/s2的數(shù)據(jù)比例,減速度超過(guò)0.6m/s2的數(shù)據(jù)比例,加速度超過(guò)0.5m/s2的數(shù)據(jù)比例以及加速度超過(guò)1.4m/s2的數(shù)據(jù)比例時(shí),對(duì)三類車(chē)輛的分類精度最高。
如圖6所示,通過(guò)forward-selection方法的選擇,得出最有效的特征為特征23、21、7、16,即減速度超過(guò)0.8m/s2的數(shù)據(jù)比例,減速度超過(guò)0.6m/s2的數(shù)據(jù)比例,加速度超過(guò)0.5m/s2的數(shù)據(jù)比例以及加速度超過(guò)1.4m/s2的數(shù)據(jù)比例。
由于本發(fā)明方法是對(duì)三種類型的車(chē)輛進(jìn)行分類,所以建立三個(gè)分類器,分類器采用一對(duì)一相比較的形式來(lái)確定樣本的類型。然后,將樣本數(shù)據(jù)導(dǎo)入分類器中進(jìn)行訓(xùn)練。
在實(shí)驗(yàn)階段,將同一個(gè)樣本數(shù)據(jù)導(dǎo)入3個(gè)分類器中,3個(gè)分類器會(huì)得到3種標(biāo)簽,樣本數(shù)據(jù)獲得的某個(gè)標(biāo)簽數(shù)量越多,這個(gè)樣本數(shù)據(jù)就是相應(yīng)標(biāo)簽所指代的車(chē)輛類型,如三個(gè)分類器得出的分類結(jié)果是小汽車(chē)、小汽車(chē)、小型貨車(chē),那么這個(gè)數(shù)據(jù)樣本所對(duì)應(yīng)的車(chē)輛類型就是小汽車(chē)。如果兩種或多種類型車(chē)輛得到的標(biāo)簽數(shù)量一樣多,就會(huì)采用K-最鄰近算法來(lái)確定樣本的車(chē)輛類型。即當(dāng)實(shí)驗(yàn)樣本與訓(xùn)練樣本之前距離最近時(shí),那么訓(xùn)練樣本的車(chē)輛類型就是實(shí)驗(yàn)樣本的分類結(jié)果。實(shí)驗(yàn)樣本與每個(gè)訓(xùn)練樣本的歐式距離用下式計(jì)算,本文設(shè)定的K值為7。
針對(duì)GPS數(shù)據(jù)的不同采樣頻率得到的分類精確度。發(fā)現(xiàn)采樣頻率在低于5秒一次時(shí)分類精度明顯降低,如圖7所示。
通過(guò)該種方法建立多類型車(chē)輛分類器,對(duì)車(chē)輛進(jìn)行自動(dòng)分類。實(shí)例分析,其數(shù)據(jù)結(jié)果顯示該分類器對(duì)三種車(chē)輛的分類準(zhǔn)確度達(dá)75%,并且數(shù)據(jù)采樣頻率越高,分類精度越準(zhǔn)確。