本發(fā)明涉及軌跡生成,尤其涉及一種基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法及系統(tǒng)。
背景技術(shù):
1、軌跡數(shù)據(jù)的生成依賴于多種傳感器、算法以及應(yīng)用場景,是一個(gè)復(fù)雜而精細(xì)的過程。真實(shí)的軌跡數(shù)據(jù)主要通過對移動(dòng)對象在時(shí)空環(huán)境下的移動(dòng)過程進(jìn)行采樣獲得。采樣點(diǎn)包含了移動(dòng)對象的位置、時(shí)間戳、速度等關(guān)鍵信息,根據(jù)采樣順序?qū)⒉蓸狱c(diǎn)連接起來,就構(gòu)成了軌跡數(shù)據(jù)。
2、然而,現(xiàn)有的軌跡生成技術(shù)往往是針對gps等定位設(shè)備產(chǎn)生的連續(xù)的軌跡數(shù)據(jù)設(shè)計(jì)的,然而基于gps的軌跡數(shù)據(jù)需要用戶的授權(quán),覆蓋率不高,限制了其應(yīng)用范圍。移動(dòng)信令數(shù)據(jù)是由移動(dòng)運(yùn)行商采集,通常具有用戶基數(shù)大、覆蓋人群廣、真實(shí)客觀和實(shí)時(shí)性強(qiáng)等特點(diǎn),在人口監(jiān)測、公共安全和智慧交通等領(lǐng)域中產(chǎn)生了巨大的應(yīng)用價(jià)值。然而,由于涉及個(gè)人隱私、存在數(shù)據(jù)安全隱患,真實(shí)的基于移動(dòng)信令的個(gè)體移動(dòng)軌跡數(shù)據(jù)在實(shí)際應(yīng)用中的可得性仍存在很大局限。
技術(shù)實(shí)現(xiàn)思路
1、鑒于此,本發(fā)明實(shí)施例提供了一種基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法,以消除或改善現(xiàn)有技術(shù)中存在的一個(gè)或更多個(gè)缺陷。
2、本發(fā)明的一個(gè)方面提供了一種基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法,該方法的步驟包括:
3、獲取預(yù)設(shè)時(shí)間段的原始的移動(dòng)信令數(shù)據(jù),原始的移動(dòng)信令數(shù)據(jù)包括對應(yīng)每個(gè)基站的移動(dòng)信令數(shù)據(jù),并對原始的移動(dòng)信令數(shù)據(jù)進(jìn)行預(yù)處理;
4、基于每個(gè)基站的移動(dòng)信令數(shù)據(jù)確定基站關(guān)系圖,所述基站關(guān)系圖中包括基站之間的切換關(guān)系,基于每個(gè)基站的切換關(guān)系和基站的特征數(shù)據(jù)構(gòu)建每個(gè)基站的初始數(shù)據(jù)集;
5、基于每個(gè)基站的初始數(shù)據(jù)集構(gòu)建對應(yīng)每個(gè)基站的表示向量,將各個(gè)基站的表示向量組合為輸入向量輸入到預(yù)訓(xùn)練的擴(kuò)散模型中,所述擴(kuò)散模型輸出軌跡生成向量,所述軌跡生成向量由多個(gè)對應(yīng)用戶的軌跡生成子向量組成;
6、基于所述軌跡生成向量確定預(yù)設(shè)時(shí)間段中用戶的軌跡數(shù)據(jù)。
7、采用上述方案,本方案以基站的移動(dòng)信令數(shù)據(jù)作為基礎(chǔ),首先對移動(dòng)信令數(shù)據(jù)進(jìn)行預(yù)處理,刪除其中的重復(fù)數(shù)據(jù)等無效數(shù)據(jù),并基于構(gòu)建包括基站之間的切換關(guān)系的基站關(guān)系圖,基站之間的切換關(guān)系為用戶由一個(gè)基站的連接切換到另一個(gè)基站的連接的關(guān)系,并構(gòu)建對應(yīng)每個(gè)基站的表示向量,再通過擴(kuò)散模型輸出軌跡生成向量,并得到用戶的軌跡數(shù)據(jù),本方案能夠基于基站的移動(dòng)信令數(shù)據(jù),得到粗粒度的用戶移動(dòng)軌跡。
8、在本發(fā)明的一些實(shí)施方式中,在對原始的移動(dòng)信令數(shù)據(jù)進(jìn)行預(yù)處理的步驟中:
9、將預(yù)設(shè)時(shí)間段的原始的移動(dòng)信令數(shù)據(jù)劃分為多個(gè)子時(shí)間段的移動(dòng)信令數(shù)據(jù);
10、基于每個(gè)子時(shí)間段的移動(dòng)信令數(shù)據(jù)確定用戶在該子時(shí)間段所連接的基站。
11、在本發(fā)明的一些實(shí)施方式中,在基于每個(gè)子時(shí)間段的移動(dòng)信令數(shù)據(jù)確定用戶在該子時(shí)間段所連接的基站的步驟中,統(tǒng)計(jì)每個(gè)用戶在子時(shí)間段內(nèi)連接時(shí)長最長的基站,作為該用戶在子時(shí)間段內(nèi)所連接的基站。
12、在本發(fā)明的一些實(shí)施方式中,在對原始的移動(dòng)信令數(shù)據(jù)進(jìn)行預(yù)處理的步驟中,所述預(yù)處理包括根據(jù)時(shí)間排序、去除乒乓數(shù)據(jù)、去除重復(fù)數(shù)據(jù)和去除噪聲數(shù)據(jù)。
13、在本發(fā)明的一些實(shí)施方式中,在基于每個(gè)基站的移動(dòng)信令數(shù)據(jù)確定基站關(guān)系圖的步驟中,將每個(gè)基站均作為基站關(guān)系圖中的一個(gè)節(jié)點(diǎn),若兩個(gè)基站之間存在切換關(guān)系,則構(gòu)建兩個(gè)基站之間的邊。
14、在本發(fā)明的一些實(shí)施方式中,基站的特征數(shù)據(jù)包括基站的位置區(qū)域識(shí)別碼、小區(qū)識(shí)別碼和經(jīng)緯度等信息,在基于每個(gè)基站的初始數(shù)據(jù)集構(gòu)建對應(yīng)每個(gè)基站的表示向量的步驟中:
15、對所述初始數(shù)據(jù)集中基站的特征數(shù)據(jù)與每個(gè)基站的切換關(guān)系進(jìn)行組合,并進(jìn)行編碼;
16、得到對應(yīng)每個(gè)基站的表示向量。
17、在本發(fā)明的一些實(shí)施方式中,所述軌跡生成向量中每個(gè)維度的值均對應(yīng)一個(gè)基站,在基于所述軌跡生成向量確定預(yù)設(shè)時(shí)間段中用戶的軌跡數(shù)據(jù)的步驟中,基于所述軌跡生成向量中的維度順序,確定用戶對于基站的軌跡數(shù)據(jù)。
18、在本發(fā)明的一些實(shí)施方式中,所述方法的步驟還包括對所述擴(kuò)散模型進(jìn)行預(yù)訓(xùn)練,在預(yù)訓(xùn)練的步驟中:
19、基于輸出的軌跡生成向量和標(biāo)簽數(shù)據(jù)計(jì)算預(yù)測噪聲損失、恢復(fù)損失和基站切換約束損失;
20、基于預(yù)測噪聲損失、恢復(fù)損失和基站切換約束損失計(jì)算總損失函數(shù),基于總損失函數(shù)對所述擴(kuò)散模型進(jìn)行預(yù)訓(xùn)練。
21、在本發(fā)明的一些實(shí)施方式中,在基于輸出的軌跡生成向量和標(biāo)簽數(shù)據(jù)計(jì)算預(yù)測噪聲損失、恢復(fù)損失和基站切換約束損失的步驟中:
22、計(jì)算預(yù)測的噪聲和白噪聲之間的均方誤差,作為預(yù)測噪聲損失;
23、計(jì)算輸出的軌跡生成向量與輸入向量的均方誤差,作為恢復(fù)損失;
24、遍歷軌跡生成向量中相鄰的基站,若兩個(gè)相鄰的在所述基站關(guān)系圖中存在邊,則損失值為0;若兩個(gè)相鄰的在所述基站關(guān)系圖中不存在邊,則損失值為1,對損失值進(jìn)行累加,得到基站切換約束損失。
25、本發(fā)明的第二方面還提供一種基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成系統(tǒng),該系統(tǒng)包括計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括處理器和存儲(chǔ)器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)指令,所述處理器用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)指令,當(dāng)所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)該系統(tǒng)實(shí)現(xiàn)如前所述方法所實(shí)現(xiàn)的步驟。
26、本發(fā)明的第三方面還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)以實(shí)現(xiàn)前述基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法所實(shí)現(xiàn)的步驟。
27、本發(fā)明的附加優(yōu)點(diǎn)、目的,以及特征將在下面的描述中將部分地加以闡述,且將對于本領(lǐng)域普通技術(shù)人員在研究下文后部分地變得明顯,或者可以根據(jù)本發(fā)明的實(shí)踐而獲知。本發(fā)明的目的和其它優(yōu)點(diǎn)可以通過在說明書以及附圖中具體指出并獲得。
28、本領(lǐng)域技術(shù)人員將會(huì)理解的是,能夠用本發(fā)明實(shí)現(xiàn)的目的和優(yōu)點(diǎn)不限于以上具體所述,并且根據(jù)以下詳細(xì)說明將更清楚地理解本發(fā)明能夠?qū)崿F(xiàn)的上述和其他目的。
1.一種基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法,其特征在于,該方法的步驟包括:
2.根據(jù)權(quán)利要求1所述的基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法,其特征在于,在對原始的移動(dòng)信令數(shù)據(jù)進(jìn)行預(yù)處理的步驟中:
3.根據(jù)權(quán)利要求2所述的基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法,其特征在于,在基于每個(gè)子時(shí)間段的移動(dòng)信令數(shù)據(jù)確定用戶在該子時(shí)間段所連接的基站的步驟中,統(tǒng)計(jì)每個(gè)用戶在子時(shí)間段內(nèi)連接時(shí)長最長的基站,作為該用戶在子時(shí)間段內(nèi)所連接的基站。
4.根據(jù)權(quán)利要求1所述的基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法,其特征在于,在對原始的移動(dòng)信令數(shù)據(jù)進(jìn)行預(yù)處理的步驟中,所述預(yù)處理包括根據(jù)時(shí)間排序、去除乒乓數(shù)據(jù)、去除重復(fù)數(shù)據(jù)和去除噪聲數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法,其特征在于,在基于每個(gè)基站的移動(dòng)信令數(shù)據(jù)確定基站關(guān)系圖的步驟中,將每個(gè)基站均作為基站關(guān)系圖中的一個(gè)節(jié)點(diǎn),若兩個(gè)基站之間存在切換關(guān)系,則構(gòu)建兩個(gè)基站之間的邊。
6.根據(jù)權(quán)利要求1所述的基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法,其特征在于,基站的特征數(shù)據(jù)包括基站的位置區(qū)域識(shí)別碼、小區(qū)識(shí)別碼和經(jīng)緯度等信息,在基于每個(gè)基站的初始數(shù)據(jù)集構(gòu)建對應(yīng)每個(gè)基站的表示向量的步驟中:
7.根據(jù)權(quán)利要求1所述的基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法,其特征在于,所述軌跡生成向量中每個(gè)維度的值均對應(yīng)一個(gè)基站,在基于所述軌跡生成向量確定預(yù)設(shè)時(shí)間段中用戶的軌跡數(shù)據(jù)的步驟中,基于所述軌跡生成向量中的維度順序,確定用戶對于基站的軌跡數(shù)據(jù)。
8.根據(jù)權(quán)利要求1~7任一項(xiàng)所述的基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法,其特征在于,所述方法的步驟還包括對所述擴(kuò)散模型進(jìn)行預(yù)訓(xùn)練,在預(yù)訓(xùn)練的步驟中:
9.根據(jù)權(quán)利要求8所述的基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成方法,其特征在于,在基于輸出的軌跡生成向量和標(biāo)簽數(shù)據(jù)計(jì)算預(yù)測噪聲損失、恢復(fù)損失和基站切換約束損失的步驟中:
10.一種基于擴(kuò)散過程的移動(dòng)信令軌跡數(shù)據(jù)生成系統(tǒng),其特征在于,該系統(tǒng)包括計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括處理器和存儲(chǔ)器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)指令,所述處理器用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)指令,當(dāng)所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)該系統(tǒng)實(shí)現(xiàn)如權(quán)利要求1~9任一項(xiàng)所述方法所實(shí)現(xiàn)的步驟。