本發(fā)明涉及數(shù)據(jù)庫(kù)管理系統(tǒng)、時(shí)空數(shù)據(jù)庫(kù)、浮動(dòng)車(chē)輛跟蹤、交通情報(bào)分析,位置相關(guān)服務(wù),大數(shù)據(jù)計(jì)算等領(lǐng)域,提出一種面向數(shù)據(jù)庫(kù)的時(shí)空軌跡大數(shù)據(jù)存儲(chǔ)系統(tǒng)及方法,屬于計(jì)算機(jī)互聯(lián)網(wǎng)技術(shù)領(lǐng)域。
背景技術(shù):
隨著支持GPS的移動(dòng)終端(如車(chē)輛導(dǎo)航儀、智能手機(jī)和物聯(lián)網(wǎng)定位器等)以及在線地圖服務(wù)(如Google Maps、百度地圖、MapQuest)的不斷推廣與普及,使得人們可以記錄他們當(dāng)前的地理坐標(biāo)并分享他們的運(yùn)動(dòng)信息到互聯(lián)網(wǎng)上去,如互聯(lián)網(wǎng)應(yīng)用Bikely、GPS-Way-points、Share-My-Routes和Microsoft的GeoLife等項(xiàng)目。同時(shí),越來(lái)越多的社交網(wǎng)絡(luò),諸如微博、微信、Twitter、Foursquare和Facebook等,也提供基于GPS位置和行程共享的功能。根據(jù)歐盟GSA的報(bào)告,在Apple和Android手機(jī)APP市場(chǎng)上大約一半的應(yīng)用在不斷手機(jī)用戶的位置信息。藉此,越來(lái)越多的智能手機(jī)用戶可以在日常生活中享受基于位置的服務(wù)LBS。
現(xiàn)今,空間數(shù)據(jù)專(zhuān)家和科學(xué)家把這類(lèi)帶有時(shí)間戳的地理點(diǎn)序列數(shù)據(jù)稱(chēng)作軌跡(Trajectory)。軌跡數(shù)據(jù)用來(lái)記錄移動(dòng)對(duì)象隨著時(shí)間不斷改變的空間位置。它的通用數(shù)據(jù)表示形式是:<id,(latitude1,longitude1,t1,o1),(latitude 2,longitude 2,t2,o2)…>,其中(latitudei,longitudei)為空間維度的位置信息,(ti)為時(shí)間戳,(oi)為其他擴(kuò)展屬性,比如速度、方向、狀態(tài)等。基于軌跡數(shù)據(jù),人們可以研究一個(gè)移動(dòng)對(duì)象的運(yùn)動(dòng)和一組移動(dòng)對(duì)象的運(yùn)動(dòng)行為,如游客在博物館的游覽習(xí)慣。隨著巨量軌跡數(shù)據(jù)的生成,催生了許多新型的應(yīng)用,比如社交網(wǎng)絡(luò)、行程規(guī)劃、線路推薦和通勤模式等。以軌跡相似性搜索和行程推薦類(lèi)應(yīng)用為例,其基本算法是:給定一些選中的位置(比如用戶在地圖上點(diǎn)擊了幾個(gè)坐標(biāo)點(diǎn)),從數(shù)據(jù)庫(kù)中檢索出經(jīng)過(guò)(或接近)這組坐標(biāo)點(diǎn)的軌跡,Cyclopath就是一個(gè)生動(dòng)的例子,它向用戶提供能夠匹配個(gè)人騎行需求的自行車(chē)路徑來(lái),并將個(gè)人騎行知識(shí)共享到社區(qū)去。
軌跡數(shù)據(jù)區(qū)別于其它地理空間數(shù)據(jù)類(lèi)型(比如OSGeo規(guī)范中的Geometry和Raster數(shù)據(jù))的一個(gè)主要特征是:軌跡是一種時(shí)間序列化的地理空間數(shù)據(jù)。軌跡數(shù)據(jù)的實(shí)踐意義在于:離散的、孤立的GPS采樣點(diǎn)難以被直接理解與檢索,通過(guò)軌跡這種新型的數(shù)據(jù)模型,用戶可以輕松跨越時(shí)空采樣源數(shù)據(jù)與上層空間數(shù)據(jù)分析需求之間的語(yǔ)義間隔,進(jìn)行高效快捷的軌跡大數(shù)據(jù)存儲(chǔ)與檢索。
近年來(lái),科學(xué)家和學(xué)者已經(jīng)提出了一些軌跡數(shù)據(jù)庫(kù)的原型系統(tǒng),比如美國(guó)UIC大學(xué)的Domino、德國(guó)FernUni大學(xué)的Secondo、希臘UP大學(xué)的Hermos、瑞士EPFL的ST-Toolkit和澳大利亞UQ大學(xué)的SharkDB等。在中國(guó)科研界在逐漸研發(fā)軌跡數(shù)據(jù)管理的原型系統(tǒng),比如中國(guó)科學(xué)院軟件研究所所提出的移動(dòng)對(duì)象數(shù)據(jù)庫(kù)DTNMOD系統(tǒng),用以管理路網(wǎng)受限的運(yùn)動(dòng)軌跡。但是這些系統(tǒng)都是基于學(xué)術(shù)研究和教育目的開(kāi)發(fā)的,難以適用于大數(shù)據(jù)級(jí)的實(shí)踐應(yīng)用中,具體不足之處體現(xiàn)為兩點(diǎn):(1)難以支持大規(guī)模并發(fā)的數(shù)據(jù)注入。在大數(shù)據(jù)時(shí)代進(jìn)行數(shù)據(jù)系統(tǒng)設(shè)計(jì)必須遵守的一條規(guī)則是:“數(shù)據(jù)是有重量的”,需要考慮數(shù)據(jù)并發(fā)加載和注入的能力。比如一個(gè)城市有數(shù)萬(wàn)輛出租車(chē),每秒鐘有數(shù)萬(wàn)條GPS記錄注入(參考當(dāng)前最大叫車(chē)軟件嘀嘀打車(chē)數(shù)據(jù)和最大交通數(shù)據(jù)服務(wù)商四維圖新)?,F(xiàn)有的軌跡數(shù)據(jù)庫(kù)原型中均將GPS源數(shù)據(jù)轉(zhuǎn)換為軌跡數(shù)據(jù)模型,無(wú)論是實(shí)時(shí)數(shù)據(jù)注入還是批量數(shù)據(jù)導(dǎo)入,其數(shù)據(jù)加載性能與擴(kuò)展性非常有限。(2)難以支持復(fù)雜的數(shù)據(jù)分析場(chǎng)景?,F(xiàn)在大數(shù)據(jù)系統(tǒng)具有2個(gè)技術(shù)特征:采用可以水平擴(kuò)展的集群架構(gòu),提供可以靈活定制的OLAP分析技術(shù)。前者意味著數(shù)據(jù)需要在集群之間進(jìn)行高速的交換(比如MapReduce架構(gòu)下的shuffle技術(shù)或MPP架構(gòu)下地interconnect技術(shù)),造成通訊風(fēng)暴;后者意味著如果沒(méi)有提供貼近高層語(yǔ)義的軌跡查詢接口,用戶將難以進(jìn)行高效快捷的開(kāi)發(fā),甚至?xí)斐赏ㄟ^(guò)商業(yè)智能軟件(BI)生成非常復(fù)雜、難以解讀和調(diào)優(yōu)的查詢計(jì)劃,堵塞了大數(shù)據(jù)分析計(jì)算隊(duì)列。
綜上所述,對(duì)于面向數(shù)據(jù)庫(kù)的軌跡大數(shù)據(jù)存儲(chǔ)方法,目前已有的相關(guān)方案難以適用于大數(shù)據(jù)級(jí)的實(shí)踐應(yīng)用,難以支持大規(guī)模高并發(fā)的數(shù)據(jù)注入以及難以支持復(fù)雜的數(shù)據(jù)分析場(chǎng)景。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于:克服現(xiàn)有技術(shù)的不足,提供一種面向數(shù)據(jù)庫(kù)的軌跡大數(shù)據(jù)存儲(chǔ)方法,確保大規(guī)模高并發(fā)的數(shù)據(jù)注入,以及對(duì)復(fù)雜的數(shù)據(jù)分析場(chǎng)景提供支持。
本發(fā)明技術(shù)解決問(wèn)題:針對(duì)快速增長(zhǎng)的海量時(shí)空軌跡數(shù)據(jù)的存儲(chǔ)需求,提供一種面向數(shù)據(jù)庫(kù)的軌跡大數(shù)據(jù)存儲(chǔ)方法(Database-oriented Trajectory big data Storage method,簡(jiǎn)稱(chēng)DOTS),提供源時(shí)空采樣數(shù)據(jù)的高并發(fā)注入、軌跡數(shù)據(jù)查詢計(jì)劃高效執(zhí)行和豐富的軌跡語(yǔ)義查詢擴(kuò)展框架,所提方法涉及時(shí)空軌跡數(shù)據(jù)在數(shù)據(jù)庫(kù)管理系統(tǒng)中的存儲(chǔ)、表征與查詢等環(huán)節(jié),充分考慮實(shí)踐性,具有大規(guī)模源數(shù)據(jù)并發(fā)加載、輕量級(jí)軌跡數(shù)據(jù)表征和靈活查詢處理等先進(jìn)技術(shù)特征?;诒景l(fā)明所提方法,數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家們可以搭建軌跡大數(shù)據(jù)存儲(chǔ)系統(tǒng),向手機(jī)APP應(yīng)用、企業(yè)Cloud服務(wù)和個(gè)人行程管理等提供基礎(chǔ)軟件支撐。
本發(fā)明技術(shù)解決方案包括:一種面向數(shù)據(jù)庫(kù)的軌跡大數(shù)據(jù)存儲(chǔ)方法,實(shí)現(xiàn)步驟為:
步驟1,利用信息采集終端對(duì)某一具有位置信息采樣的對(duì)象所處的狀態(tài)信息如經(jīng)緯度、速度等等進(jìn)行信息采集,通過(guò)必要的傳輸設(shè)備將采集到的信息發(fā)送到數(shù)據(jù)處理系統(tǒng);
步驟2,在數(shù)據(jù)處理系統(tǒng),對(duì)接收到的原始數(shù)據(jù)信息進(jìn)行必要的噪音過(guò)濾和數(shù)據(jù)清洗,之后將簡(jiǎn)單處理過(guò)的數(shù)據(jù)信息直接注入數(shù)據(jù)庫(kù),通過(guò)以上步驟得到數(shù)據(jù)存儲(chǔ)層。以下步驟中所述軌跡信息的源軌跡數(shù)據(jù)都是通過(guò)此步驟的操作得到的;
步驟3,對(duì)上述步驟得到的源空間數(shù)據(jù)進(jìn)行建模與處理,并通過(guò)截取、投影、度量、擬合等內(nèi)部函數(shù)操作,得到軌段(Track)數(shù)據(jù),通過(guò)以上操作步驟得到軌跡層;
步驟4,在基于步驟3得到的軌段數(shù)據(jù)的基礎(chǔ)上,提供時(shí)空數(shù)據(jù)分析的復(fù)雜查詢功能。
步驟1所述的某一具有位置信息采樣的對(duì)象所處的狀態(tài)信息為:信息采集對(duì)象的狀態(tài)信息包括唯一識(shí)別id號(hào),經(jīng)緯度信息<latitude,longitude>,時(shí)間信息time,運(yùn)行速度speed以及其他信息,可以表示為<id,latitude,longitude,time,speed,others>。
所述步驟2中對(duì)接收到的原始數(shù)據(jù)信息進(jìn)行必要的噪音過(guò)濾和數(shù)據(jù)清洗,這是為了將一些明顯的存在數(shù)據(jù)信息誤差的錯(cuò)誤數(shù)據(jù)丟棄掉,避免因?yàn)殄e(cuò)誤數(shù)據(jù)對(duì)后續(xù)的操作帶來(lái)更多的累計(jì)影響。對(duì)接收到的原始數(shù)據(jù)信息進(jìn)行必要的噪音過(guò)濾和數(shù)據(jù)清洗之后將簡(jiǎn)單處理過(guò)的數(shù)據(jù)信息直接注入數(shù)據(jù)庫(kù),這么做對(duì)數(shù)據(jù)庫(kù)的好處是:短事務(wù)、高并發(fā)、可水平擴(kuò)展。軌跡大數(shù)據(jù)注入的數(shù)量和速度都會(huì)對(duì)數(shù)據(jù)庫(kù)系統(tǒng)造成致命威脅,比如占用連接池、消耗鎖資源、耗盡內(nèi)存空間等,所以除了基本的數(shù)據(jù)清洗和噪音過(guò)濾外,對(duì)于數(shù)據(jù)注入不能進(jìn)行太復(fù)雜的處理。數(shù)據(jù)將以“元數(shù)據(jù)表+數(shù)據(jù)子表”的方式進(jìn)行組織,具體形式如下:軌跡數(shù)據(jù)庫(kù)由一組軌跡池構(gòu)成,每個(gè)軌跡池由一組軌跡構(gòu)成;軌跡池和子表的對(duì)應(yīng)關(guān)系保存在元數(shù)據(jù)表中,元數(shù)據(jù)表中每一行對(duì)應(yīng)一條軌跡,同一個(gè)軌跡池的軌跡保存在同一個(gè)子表中;元數(shù)據(jù)表除了保存軌跡池和軌跡對(duì)應(yīng)關(guān)系,還保存該軌跡的唯一ID號(hào),以及時(shí)空范圍、最后一次更新時(shí)間、所采用的坐標(biāo)系、時(shí)空精度誤差等等源數(shù)據(jù)。
所述步驟3中對(duì)存儲(chǔ)層的源空間數(shù)據(jù)進(jìn)行建模與處理,存儲(chǔ)層的源數(shù)據(jù)是對(duì)連續(xù)的運(yùn)行軌跡的離散采樣數(shù)據(jù)存儲(chǔ),離散的采樣點(diǎn)是難以解讀的,所以需要將其進(jìn)行整體或局部建模,并提供包括截取、投影、度量、擬合等內(nèi)部加工函數(shù)。得到軌段數(shù)據(jù),因?yàn)橹虚g數(shù)據(jù)需要在數(shù)據(jù)庫(kù)集群環(huán)境下進(jìn)行交換,為了提高集群節(jié)點(diǎn)之間的交換效率,所以提出軌段概念。對(duì)源空間數(shù)據(jù)進(jìn)行操作后得到軌段數(shù)據(jù),每個(gè)軌段是一個(gè)虛擬的軌跡子段,它只是對(duì)一個(gè)軌跡特定時(shí)間、空間范圍內(nèi)連續(xù)軌跡段的元數(shù)據(jù)表示,并沒(méi)有記錄真實(shí)數(shù)據(jù)(GPS序列),所以軌段結(jié)構(gòu)簡(jiǎn)單,單項(xiàng)數(shù)據(jù)的尺寸小而固定,數(shù)據(jù)規(guī)模很小,適合在數(shù)據(jù)庫(kù)中作為中間數(shù)據(jù)類(lèi)型進(jìn)行計(jì)算與加工。對(duì)源空間數(shù)據(jù)進(jìn)行操作后得到軌段數(shù)據(jù),每個(gè)軌段數(shù)據(jù)對(duì)應(yīng)著某條軌跡的子段,它負(fù)責(zé)保存該軌段的數(shù)據(jù)分布特性,比如數(shù)據(jù)劃分效率、時(shí)間區(qū)間、空間閉包等功能,但是只有經(jīng)過(guò)實(shí)例化的軌段才具有真實(shí)數(shù)據(jù)。
所述步驟4在基于軌段數(shù)據(jù)的基礎(chǔ)上,提供時(shí)空數(shù)據(jù)分析的復(fù)雜查詢功能,其中所依賴的支撐函數(shù)包括數(shù)據(jù)實(shí)例化、格式轉(zhuǎn)換和I/O操作等。可以提供包括基于語(yǔ)義的軌跡特征分析以及其他復(fù)雜功能,如軌跡推薦(給出一組點(diǎn)或一條軌跡,找出經(jīng)過(guò)這些點(diǎn)的其他相似軌跡)和軌跡聚類(lèi)(給定一組軌跡,找出并行時(shí)間足夠長(zhǎng)的軌跡子組來(lái)),以及軌跡異常檢測(cè)(給定一組軌跡,找出其中可能存在的異常軌跡)。
本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)和積極效果如下:
(1)本發(fā)明支持大規(guī)模高并發(fā)的數(shù)據(jù)注入,在數(shù)據(jù)庫(kù)中以擴(kuò)展方式進(jìn)行相關(guān)的用戶定義數(shù)據(jù)類(lèi)型和用戶定義函數(shù),并提供了四種源軌跡數(shù)據(jù)注入數(shù)據(jù)庫(kù)的方法,以“元數(shù)據(jù)表+數(shù)據(jù)子表”的方式進(jìn)行數(shù)據(jù)組織,確保大規(guī)模高并發(fā)的數(shù)據(jù)注入的實(shí)時(shí)運(yùn)行。
(2)本發(fā)明支持復(fù)雜的數(shù)據(jù)分析場(chǎng)景,可以根據(jù)數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)SQL接口來(lái)訪問(wèn)軌跡相關(guān)的擴(kuò)展函數(shù),并提供了不同的數(shù)據(jù)輸出方式以應(yīng)對(duì)基于語(yǔ)義的軌跡特征分析以及其他復(fù)雜功能的應(yīng)用,擴(kuò)展了方法的應(yīng)用范圍。
附圖說(shuō)明
圖1為本發(fā)明的實(shí)施例流程圖。
具體實(shí)施方式
如圖1所示,本發(fā)明實(shí)例建立的面向數(shù)據(jù)庫(kù)的軌跡大數(shù)據(jù)存儲(chǔ)方法為:利用信息采集終端對(duì)某一具有位置信息采樣的對(duì)象所處的狀態(tài)信息如經(jīng)緯度、速度等等進(jìn)行信息采集并通過(guò)必要的傳輸設(shè)備將采集到的信息發(fā)送到數(shù)據(jù)處理系統(tǒng),在數(shù)據(jù)處理系統(tǒng),對(duì)接收到的原始數(shù)據(jù)信息進(jìn)行必要的噪音過(guò)濾和數(shù)據(jù)清洗,之后將簡(jiǎn)單處理過(guò)的數(shù)據(jù)信息直接注入數(shù)據(jù)庫(kù),對(duì)數(shù)據(jù)庫(kù)中的源空間數(shù)據(jù)進(jìn)行建模與處理,并通過(guò)截取、投影、度量、擬合等內(nèi)部函數(shù)操作,得到軌段數(shù)據(jù),并在軌段數(shù)據(jù)的基礎(chǔ)上,提供時(shí)空數(shù)據(jù)分析的復(fù)雜查詢功能。本發(fā)明方法提供源時(shí)空采樣數(shù)據(jù)的高并發(fā)注入、軌跡數(shù)據(jù)查詢計(jì)劃高效執(zhí)行和豐富的軌跡語(yǔ)義查詢擴(kuò)展框架,涉及時(shí)空軌跡數(shù)據(jù)在數(shù)據(jù)庫(kù)管理系統(tǒng)中的存儲(chǔ)、表征與查詢等環(huán)節(jié),充分考慮實(shí)踐性,具有大規(guī)模源數(shù)據(jù)并發(fā)加載、輕量級(jí)軌跡數(shù)據(jù)表征和靈活查詢處理等先進(jìn)技術(shù)特征。以目前世界上用戶最多的開(kāi)源數(shù)據(jù)庫(kù)PostgreSQL及其集群方案(如PG-XL,PG-XC,GPDB)為例,說(shuō)明一下如何在其中實(shí)施本發(fā)明所提方法,對(duì)本發(fā)明的具體實(shí)施方式做詳細(xì)描述。
具體實(shí)現(xiàn)步驟如下:
該框架分為三層,分別為存儲(chǔ)層,軌跡層和語(yǔ)義層:
1、存儲(chǔ)層,負(fù)責(zé)保存源時(shí)空采樣數(shù)據(jù),除了進(jìn)行必要的噪音過(guò)濾和數(shù)據(jù)清洗外,不對(duì)數(shù)據(jù)進(jìn)行太多加工,比如將GPS采樣直接注入數(shù)據(jù)庫(kù)。這么做的對(duì)數(shù)據(jù)庫(kù)的好處是:短事務(wù)、高并發(fā)、可水平擴(kuò)展。軌跡大數(shù)據(jù)注入的數(shù)量和速度都會(huì)對(duì)數(shù)據(jù)庫(kù)系統(tǒng)造成致命威脅,比如占用連接池、消耗鎖資源、耗盡內(nèi)存空間等,所以除了基本的數(shù)據(jù)清洗和噪音過(guò)濾外,對(duì)于數(shù)據(jù)注入不能進(jìn)行太復(fù)雜的處理。
在數(shù)據(jù)庫(kù)中以extension方式的方式實(shí)現(xiàn)Trajectory相關(guān)的用戶定義數(shù)據(jù)類(lèi)型UDT和用戶定義函數(shù)UDF。關(guān)于計(jì)算幾何相關(guān)算法,可以基于GEOS庫(kù)和GDAL庫(kù)兩個(gè)開(kāi)源的OSGeo標(biāo)準(zhǔn)庫(kù)實(shí)現(xiàn)。關(guān)于時(shí)空索引,可以基于PostgreSQL的GiST索引框架進(jìn)行擴(kuò)展。對(duì)于需要數(shù)據(jù)分發(fā)的場(chǎng)景(如GPDB),可以采用三種方式進(jìn)行解決:增加時(shí)空數(shù)據(jù)的分發(fā)策略,提供基于UDF的數(shù)據(jù)分發(fā)機(jī)制,或通過(guò)擴(kuò)展不可見(jiàn)列來(lái)保存數(shù)據(jù)降維數(shù)據(jù)(如保存其GeoHash值,后者為一維字符串,可以適用于原有分發(fā)策略)。
數(shù)據(jù)注入:有四種方式可以將軌跡源數(shù)據(jù)注入數(shù)據(jù)庫(kù),一種是調(diào)用trajectory.append()函數(shù)操作trajectory的meta-data元數(shù)據(jù)表;一種是直接通過(guò)SQL的INSERT語(yǔ)句往raw源數(shù)據(jù)表中添加新的時(shí)空采樣值;或者通過(guò)數(shù)據(jù)庫(kù)的COPY TO語(yǔ)句進(jìn)行DDL操作;最后一種是通過(guò)ETL工具進(jìn)行加載。數(shù)據(jù)注入方式的靈活性保證了本發(fā)明所提方法的實(shí)用性。
在存儲(chǔ)層,數(shù)據(jù)將以“元數(shù)據(jù)表+數(shù)據(jù)子表”的方式進(jìn)行組織具體形式如下:
(1)軌跡數(shù)據(jù)庫(kù)由一組軌跡池構(gòu)成,每個(gè)軌跡池由一組軌跡構(gòu)成;
(2)軌跡池和子表的對(duì)應(yīng)關(guān)系保存在元數(shù)據(jù)表中,元數(shù)據(jù)表中每一行對(duì)應(yīng)一條軌跡,同一個(gè)軌跡池的軌跡保存在同一個(gè)子表中;
(3)元數(shù)據(jù)表除了保存軌跡池和軌跡對(duì)應(yīng)關(guān)系,還保存該軌跡的唯一ID號(hào),以及時(shí)空范圍、最后一次更新時(shí)間、所采用的坐標(biāo)系、時(shí)空精度誤差等等源數(shù)據(jù)。
2、軌跡層,負(fù)責(zé)對(duì)存儲(chǔ)層的源空間數(shù)據(jù)進(jìn)行建模與處理,存儲(chǔ)層的源數(shù)據(jù)是對(duì)連續(xù)的運(yùn)行軌跡的離散采樣數(shù)據(jù)存儲(chǔ),離散的采樣點(diǎn)是難以解讀的,所以需要將其進(jìn)行整體或局部建模,并通過(guò)截取、投影、度量、擬合等內(nèi)部函數(shù)操作,得到軌段數(shù)據(jù),因?yàn)橹虚g數(shù)據(jù)需要在數(shù)據(jù)庫(kù)集群環(huán)境下進(jìn)行交換,為了提高集群節(jié)點(diǎn)之間的交換效率,所以提出軌段概念。每個(gè)軌段是一個(gè)虛擬的軌跡子段,它只是對(duì)一個(gè)軌跡特定時(shí)間、空間范圍內(nèi)連續(xù)軌跡段的元數(shù)據(jù)表示,并沒(méi)有記錄真實(shí)數(shù)據(jù)(GPS序列),所以軌段結(jié)構(gòu)簡(jiǎn)單,單項(xiàng)數(shù)據(jù)的尺寸小而固定,數(shù)據(jù)規(guī)模很小,適合在數(shù)據(jù)庫(kù)中作為中間數(shù)據(jù)類(lèi)型進(jìn)行計(jì)算與加工。每個(gè)軌段數(shù)據(jù)對(duì)應(yīng)著某條軌跡的子段,它負(fù)責(zé)保存該軌段的數(shù)據(jù)分布特性,比如數(shù)據(jù)劃分效率、時(shí)間區(qū)間、空間閉包等功能,但是只有經(jīng)過(guò)實(shí)例化的軌段才具有真實(shí)數(shù)據(jù)。
3、語(yǔ)義層,在基于軌段數(shù)據(jù)的基礎(chǔ)上,提供時(shí)空數(shù)據(jù)分析的復(fù)雜查詢功能,其中所依賴的支撐函數(shù)包括數(shù)據(jù)實(shí)例化、格式轉(zhuǎn)換和I/O操作等。
數(shù)據(jù)查詢:根據(jù)數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)SQL接口來(lái)訪問(wèn)軌跡相關(guān)的擴(kuò)展函數(shù)。數(shù)據(jù)的輸出,可以通過(guò)SQL返回,也可以保存在單獨(dú)的結(jié)果臨時(shí)表中,僅返回該臨時(shí)表的名稱(chēng)或者其ID信息。數(shù)據(jù)輸出以O(shè)SGeo的字符串標(biāo)準(zhǔn)輸出,亦或可以通過(guò)JSON格式進(jìn)行輸出,以便于直接服務(wù)于當(dāng)前互聯(lián)網(wǎng)應(yīng)用。
可以提供包括基于語(yǔ)義的軌跡特征分析以及其他復(fù)雜功能,如軌跡推薦(給出一組點(diǎn)或一條軌跡,找出經(jīng)過(guò)這些點(diǎn)的其他相似軌跡)和軌跡聚類(lèi)(給定一組軌跡,找出并行時(shí)間足夠長(zhǎng)的軌跡子組來(lái)),以及軌跡異常檢測(cè)(給定一組軌跡,找出其中可能存在的異常軌跡。
關(guān)于DOTS的內(nèi)部查詢函數(shù)定義及其完整列表,不在本發(fā)明范圍內(nèi),本發(fā)明僅對(duì)起軌跡大數(shù)據(jù)的存儲(chǔ)方法進(jìn)行約定。
以上通過(guò)實(shí)例對(duì)本發(fā)明進(jìn)行了詳細(xì)的描述,本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,在不超出本發(fā)明的精神和實(shí)質(zhì)的范圍內(nèi),對(duì)本發(fā)明做出一定的修改和變動(dòng),比如對(duì)數(shù)據(jù)庫(kù)返回?cái)?shù)據(jù)的具體表示格式進(jìn)行修改,或?qū)λ饕慕M織方式及搜索過(guò)程進(jìn)行局部修改,仍然可以實(shí)現(xiàn)本發(fā)明的目的。
本發(fā)明未詳細(xì)闡述部分屬于本領(lǐng)域技術(shù)人員的公知技術(shù)。