本發(fā)明屬于數(shù)據(jù)處理,具體涉及一種用于慢跑指數(shù)構(gòu)建的多源數(shù)據(jù)分析與評估方法。
背景技術(shù):
1、隨著社會經(jīng)濟的發(fā)展與健康理念的普及,人們越來越關(guān)注通過運動改善身體狀況和提升生活質(zhì)量。作為一種對年齡、性別、身體條件、技能水平等要求較低的運動形式,慢跑逐漸成為大眾的首選健身方式之一。與此同時,國家大力推進基礎(chǔ)設(shè)施建設(shè),各大城市新建大量的健身運動場所。這些場所雖然在一定程度上滿足居民的運動需求,但在適應(yīng)個性化慢跑需求方面仍存在不足。因此,街道作為一種天然的開放式運動空間,成為許多人進行慢跑活動的首選場所。
2、現(xiàn)有研究表明,街道建成環(huán)境特征(如綠視率、天空開闊率等)對慢跑頻次與路徑選擇有顯著影響。然而,對于影響慢跑行為的具體指標(biāo)的選擇,未考慮主觀感知,仍存在優(yōu)化空間。且目前對影響慢跑行為的指標(biāo)選擇尚未形成科學(xué)的標(biāo)準(zhǔn),對于各類因素的權(quán)重分析和作用機制研究仍不夠深入。此外,傳統(tǒng)的路徑推薦方法通?;趩我痪S度分析,忽略了環(huán)境特征與慢跑需求之間的復(fù)雜關(guān)系,導(dǎo)致推薦結(jié)果缺乏個性化與適用性。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種用于慢跑指數(shù)構(gòu)建的多源數(shù)據(jù)分析與評估方法,克服了現(xiàn)有技術(shù)的不足,通過整合多源數(shù)據(jù),包括運動軌跡數(shù)據(jù)、街景圖像、建成環(huán)境和感知評分等,利用隨機森林模型深入探究城市街道慢跑能力的關(guān)鍵影響因素及其內(nèi)在機制,揭示各特征對慢跑能力的非線性關(guān)系,為科學(xué)評估街道慢跑適宜性提供技術(shù)支持。
2、為解決上述問題,本發(fā)明所采取的技術(shù)方案如下:
3、一種用于慢跑指數(shù)構(gòu)建的多源數(shù)據(jù)分析與評估方法,具體包括以下步驟:
4、s1、數(shù)據(jù)預(yù)處理:獲取完整的路網(wǎng)信息,并對其進行數(shù)據(jù)清理和優(yōu)化;
5、s2、計算慢跑頻次:將運動軌跡數(shù)據(jù)疊加到清理后的路網(wǎng)數(shù)據(jù)上,捕捉軌跡數(shù)據(jù)在每條道路段的分布情況,計算慢跑頻次;
6、s3、多源數(shù)據(jù)提?。悍謩e提取主客觀環(huán)境相關(guān)特征;
7、s4、構(gòu)建模型:建立隨機森林回歸模型,通過網(wǎng)格搜索和交叉驗證,對隨機森林回歸模型的關(guān)鍵參數(shù)進行優(yōu)化;
8、s5、模型結(jié)果分析:利用基于隨機森林回歸模型的特征重要性分析和部分依賴圖分析,探究特征與慢跑頻次之間的非線性關(guān)系,以及獲取各特征的閾值;
9、s6、構(gòu)建慢跑指數(shù):根據(jù)特征重要性評分,為各指標(biāo)設(shè)置權(quán)重,結(jié)合非線性分析中提取的特征閾值,優(yōu)化指數(shù)構(gòu)成,構(gòu)建用于評估城市街道的慢跑能力的慢跑指數(shù)。
10、進一步,s2中所述慢跑頻次的表達式為:
11、
12、其中,fr為道路段的運動頻次,表示該道路在研究日內(nèi)的總軌跡計數(shù);n表示研究區(qū)域內(nèi)在當(dāng)天記錄的軌跡總數(shù)量;
13、δi表示指示函數(shù),在每條道路內(nèi)設(shè)置50米的緩沖區(qū),δi用于判斷軌跡i是否位于道路段的緩沖區(qū)內(nèi);若軌跡i位于該緩沖區(qū)內(nèi),δi=1;否則,δi=0。
14、進一步,s3中所述主客觀環(huán)境相關(guān)特征包括道路可達性、道路長度、土地利用混合度、人口密度、綠視率、天空視域、建筑視域以及主觀感知評分。
15、進一步,s4中所述建立隨機森林回歸模型的具體步驟包括:
16、(1)對訓(xùn)練數(shù)據(jù)集進行抽樣,構(gòu)建若干個子數(shù)據(jù)集,并在每個子數(shù)據(jù)集上訓(xùn)練一棵決策樹;
17、(2)每棵決策樹在節(jié)點分裂時隨機選擇個特征,降低特征間的相關(guān)性,增強模型的穩(wěn)定性;
18、(3)隨機森林的最終輸出值為所有決策樹預(yù)測值的平均值,具體公式如下:
19、
20、式中:為預(yù)測結(jié)果即慢跑頻次;tb(x)為第b棵樹對主觀和客觀特征x的預(yù)測值;b表示森林中決策樹的數(shù)量。
21、(4)通過網(wǎng)格搜索和交叉驗證,對隨機森林回歸模型的關(guān)鍵參數(shù)進行優(yōu)化。
22、進一步,所述隨機森林回歸模型利用擬合優(yōu)度和均方根誤差檢驗?zāi)P托阅?,具體表達式為:
23、
24、其中,n為樣本容量;yi因變量的真實值;因變量的預(yù)測值;因變量預(yù)測值的平均值。
25、進一步,s6中所述慢跑指數(shù)的具體公式為:
26、
27、其中,i表示慢跑指數(shù),wj為每個變量xj的權(quán)重,是誤差項;fj(xj)是針對每個變量xj設(shè)定的非線性函數(shù)。
28、進一步,所述fj(xj)的表達式為:
29、
30、其中,k和x0是根據(jù)數(shù)據(jù)擬合得出的參數(shù),調(diào)整sigmoid函數(shù)的形狀和位置。
31、本發(fā)明與現(xiàn)有技術(shù)相比較,具有以下有益效果:
32、1、本發(fā)明在傳統(tǒng)的建成環(huán)境分析基礎(chǔ)上,進一步引入了對主觀感受的量化分析,綜合考慮客觀環(huán)境特征與人的主觀感知,使自變量種類更加全面,提高了分析的科學(xué)性與適用性。
33、2、本發(fā)明采用隨機森林模型,能夠有效捕捉特征與慢跑頻次之間的非線性關(guān)系,并量化各變量的重要性和閾值。這種方法顯著優(yōu)于傳統(tǒng)的多元線性回歸模型,在處理復(fù)雜數(shù)據(jù)關(guān)系和多維特征時表現(xiàn)更為優(yōu)越。
34、3、本發(fā)明根據(jù)特征重要性分析結(jié)果,為各指標(biāo)設(shè)置權(quán)重,同時結(jié)合變量的閾值,構(gòu)建了更為科學(xué)合理的慢跑指數(shù),用于量化城市街道的慢跑適宜性。與傳統(tǒng)指數(shù)構(gòu)建方法相比,本發(fā)明的慢跑指數(shù)更加精準(zhǔn)、直觀,為慢跑者提供了可信賴的道路選擇參考。
35、4、本發(fā)明通過構(gòu)建慢跑指數(shù),為慢跑者提供了量化的、個性化的慢跑道路選擇參考,幫助其基于科學(xué)數(shù)據(jù)選擇最優(yōu)路徑,從而提升慢跑體驗。同時,本發(fā)明的研究成果還可間接為城市街道規(guī)劃者優(yōu)化慢跑環(huán)境提供數(shù)據(jù)支持。
1.一種用于慢跑指數(shù)構(gòu)建的多源數(shù)據(jù)分析與評估方法,其特征在于:具體包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種用于慢跑指數(shù)構(gòu)建的多源數(shù)據(jù)分析與評估方法,其特征在于:s2中所述慢跑頻次的表達式為:
3.根據(jù)權(quán)利要求1所述的一種用于慢跑指數(shù)構(gòu)建的多源數(shù)據(jù)分析與評估方法,其特征在于:s3中所述主客觀環(huán)境相關(guān)特征包括道路可達性、道路長度、土地利用混合度、人口密度、綠視率、天空視域、建筑視域以及主觀感知評分。
4.根據(jù)權(quán)利要求1所述的一種用于慢跑指數(shù)構(gòu)建的多源數(shù)據(jù)分析與評估方法,其特征在于:s4中所述建立隨機森林回歸模型的具體步驟包括:
5.根據(jù)權(quán)利要求4所述的一種用于慢跑指數(shù)構(gòu)建的多源數(shù)據(jù)分析與評估方法,其特征在于:所述隨機森林回歸模型利用擬合優(yōu)度和均方根誤差檢驗?zāi)P托阅埽唧w表達式為:
6.根據(jù)權(quán)利要求1所述的一種用于慢跑指數(shù)構(gòu)建的多源數(shù)據(jù)分析與評估方法,其特征在于:s6中所述慢跑指數(shù)的具體公式為:
7.根據(jù)權(quán)利要求6所述的一種用于慢跑指數(shù)構(gòu)建的多源數(shù)據(jù)分析與評估方法,其特征在于:所述fj(xj)的表達式為: