最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)方法及系統(tǒng)

文檔序號(hào):41949498發(fā)布日期:2025-05-16 14:07閱讀:5來(lái)源:國(guó)知局
一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)方法及系統(tǒng)

本發(fā)明屬于交通管理,具體的說(shuō)是一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)方法及系統(tǒng)。


背景技術(shù):

1、隨著移動(dòng)通信技術(shù)的普及,路徑誘導(dǎo)——通過(guò)信息系統(tǒng)(如智能手機(jī)應(yīng)用程序、可變信息標(biāo)志、車(chē)輛應(yīng)用程序)為駕駛者提供實(shí)時(shí)交通信息和最佳交通路線(xiàn)——在城市交通中扮演著愈發(fā)重要的角色。研究表明,路徑誘導(dǎo)能顯著影響交通系統(tǒng)的通行效率和溫室氣體排放。在城市道路交通網(wǎng)絡(luò)密集的情況下,通過(guò)路徑誘導(dǎo)方法提高交通系統(tǒng)效率并降低交通碳排放成為了一種可行的思路。

2、但傳統(tǒng)的路徑誘導(dǎo)方法往往側(cè)重于單一目標(biāo)(如出行時(shí)間最短),而忽略了交通效率與溫室氣體排放之間的平衡,以及城市管理的多樣化需求或出行者多元化的偏好。因此,如何建立有效的多智能強(qiáng)化學(xué)習(xí)方法,為出行者提供差異化的交通路徑誘導(dǎo),并能夠靈活切換不同誘導(dǎo)目標(biāo),以更好地滿(mǎn)足不同情況下的交通誘導(dǎo)需求,把握和增強(qiáng)多目標(biāo)交通誘導(dǎo)對(duì)整個(gè)城市交通系統(tǒng)的調(diào)控能力,是當(dāng)前亟待解決的關(guān)鍵問(wèn)題。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明旨在解決現(xiàn)有導(dǎo)航系統(tǒng)中誘導(dǎo)目標(biāo)單一、導(dǎo)致交通資源利用不均衡的問(wèn)題,提出一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)方法及系統(tǒng),本發(fā)明考慮出行時(shí)間、排放等多重目標(biāo),為不同起點(diǎn)-終點(diǎn)對(duì)(od對(duì))的出行者、同od對(duì)的不同出行者提供差異化的誘導(dǎo)路徑,在提升交通系統(tǒng)效率的同時(shí)減少系統(tǒng)排放,提升交通系統(tǒng)的整體效能,同時(shí),本發(fā)明還能夠根據(jù)城市管理需求,靈活調(diào)整誘導(dǎo)策略,進(jìn)而提升城市交通管理的效率和響應(yīng)能力,具體技術(shù)方案如下:

2、本發(fā)明的一方面,提供了一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)系統(tǒng),該系統(tǒng)包括:

3、仿真模塊,用于對(duì)仿真交通需求進(jìn)行校準(zhǔn);

4、優(yōu)化控制模塊,用于隨著時(shí)間推移最大化整個(gè)系統(tǒng)的累積獎(jiǎng)勵(lì);

5、迭代優(yōu)化模塊,用于在信息交互中實(shí)現(xiàn)策略迭代優(yōu)化;

6、判斷模塊,用于通過(guò)仿真模塊信息判斷系統(tǒng)收益是否趨于穩(wěn)定;

7、輸出模塊,用于輸出管控方案。

8、具體的,在仿真模塊中,利用sumo作為微觀仿真平臺(tái),標(biāo)定交通需求,并根據(jù)可行性為每個(gè)od對(duì)預(yù)審3-4條備選路徑。

9、具體的,在優(yōu)化控制模塊中,包括一個(gè)多智能體馬爾可夫決策過(guò)程模型,其優(yōu)化目標(biāo)是通過(guò)改進(jìn)智能體的策略,隨著時(shí)間推移最大化整個(gè)系統(tǒng)的累積獎(jiǎng)勵(lì)。

10、具體的,智能體的決策變量包括狀態(tài)、動(dòng)作和獎(jiǎng)勵(lì);

11、其中,狀態(tài)是交通狀況的度量,用一個(gè)向量st=(bt,i,vt,i,lt,i)表示,其中,bt,i表示在給定時(shí)間步長(zhǎng)下每條邊上的車(chē)輛數(shù)量,vt,i表示平均車(chē)速,lt,i表示平均行駛距離,每個(gè)智能體j的動(dòng)作是一個(gè)誘導(dǎo)分流率,在預(yù)先確定備選路徑中進(jìn)行比例分配;

12、動(dòng)作向量表示為其中m(j)表示備選路徑的數(shù)量。例如,對(duì)于一個(gè)特定的od對(duì)d,動(dòng)作表示分配給備選路徑1、2和3的車(chē)輛數(shù)比例;

13、獎(jiǎng)勵(lì)定義為反映交通效率的旅行時(shí)間(tt)與反應(yīng)環(huán)境影響的二氧化碳排放量(ce)的綜合指標(biāo),表示為:

14、rt=-αttt-(1-α)*γ*cet

15、其中,ttt=∑ttt,e是車(chē)輛e在當(dāng)前路況下完成全程的通行時(shí)間,cet=∑cet,i是路段i的二氧化碳排放量;

16、參數(shù)γ用于統(tǒng)一兩個(gè)值的數(shù)量級(jí),具體數(shù)值基于仿真場(chǎng)景中的總行駛時(shí)間和總排放量,以及單個(gè)目標(biāo)優(yōu)化的總行駛時(shí)間和總排放量進(jìn)行估計(jì);

17、通過(guò)權(quán)重α調(diào)整模型的優(yōu)化目標(biāo):當(dāng)α=0時(shí),模型目標(biāo)為減少排放;當(dāng)α=1時(shí),模型優(yōu)先考慮通行時(shí)間和效率;

18、當(dāng)α=0.5時(shí),模型將減少排放與提高通行效率作為共同目標(biāo),旨在尋找能夠?qū)崿F(xiàn)兩個(gè)目標(biāo)平衡的誘導(dǎo)優(yōu)化解。

19、具體的,在優(yōu)化控制模塊中,還包括使用初始化強(qiáng)化學(xué)習(xí)算法,以?xún)?yōu)化整個(gè)網(wǎng)絡(luò)的交通效率和排放;

20、其中,初始化強(qiáng)化學(xué)習(xí)算法為vda2c算法,使用從多智能體馬爾可夫決策過(guò)程獲得的轉(zhuǎn)換作為輸入來(lái)學(xué)習(xí)代理的狀態(tài)-動(dòng)作映射,并根據(jù)更新的策略將獎(jiǎng)勵(lì)動(dòng)作返回。

21、具體的,在優(yōu)化控制模塊中,還包括設(shè)置出行者偏好屬性。

22、具體的,在信息交互中實(shí)現(xiàn)策略迭代優(yōu)化包括:根據(jù)交通需求分析和仿真場(chǎng)景,選定od對(duì)并確定相應(yīng)的備選路徑;

23、在仿真模塊和優(yōu)化控制模塊之間建立信息交互機(jī)制,通過(guò)仿真過(guò)程收集智能體在不同狀態(tài)下采取各種動(dòng)作所獲得的獎(jiǎng)勵(lì)信息;

24、引入強(qiáng)化學(xué)習(xí)中的動(dòng)態(tài)調(diào)整機(jī)制,采用策略梯度方法優(yōu)化策略。

25、具體的,通過(guò)仿真模塊信息判斷系統(tǒng)收益是否趨于穩(wěn)定的標(biāo)準(zhǔn)為:當(dāng)仿真模塊輸出的獎(jiǎng)勵(lì)值趨于穩(wěn)定,或算法達(dá)到最大迭代次數(shù),認(rèn)為優(yōu)化過(guò)程結(jié)束。

26、具體的,輸出管控方案包括在策略?xún)?yōu)化完成后,通過(guò)對(duì)比優(yōu)化前后的交通系統(tǒng)的效率和排放量,驗(yàn)證優(yōu)化策略的有效性。

27、本發(fā)明的另一方面,提供了一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)方法,包括如下步驟:

28、s1:初始化仿真模塊,實(shí)現(xiàn)對(duì)仿真交通需求進(jìn)行校準(zhǔn);

29、s2:初始化優(yōu)化控制模塊,實(shí)現(xiàn)隨著時(shí)間推移最大化整個(gè)系統(tǒng)的累積獎(jiǎng)勵(lì);

30、s4:利用迭代優(yōu)化模塊在信息交互中實(shí)現(xiàn)策略迭代優(yōu)化;

31、s5:通過(guò)判斷模塊實(shí)現(xiàn)利用仿真模塊信息判斷系統(tǒng)收益是否趨于穩(wěn)定;

32、s6:通過(guò)輸出模塊輸出管控方案。

33、有益效果:

34、1.本發(fā)明通過(guò)提供差異化的路徑誘導(dǎo)信息,避免同質(zhì)化導(dǎo)航信息引發(fā)的交通擁堵,實(shí)現(xiàn)交通流量的動(dòng)態(tài)均衡,顯著提升交通網(wǎng)絡(luò)整體效率并降低車(chē)輛排放,為綠色交通的發(fā)展提供有力支持?;诤贾菔辛羰焖俾芳爸苓厖^(qū)域交通數(shù)據(jù)進(jìn)行測(cè)試,在多個(gè)目標(biāo)下均證明了誘導(dǎo)策略?xún)?yōu)化對(duì)系統(tǒng)表現(xiàn)的提升效果。其中,在生態(tài)目標(biāo)下,道路網(wǎng)絡(luò)的整體效率提高了13.90%,二氧化碳排放量減少了16.09%,在實(shí)現(xiàn)提高效率和減少排放兩大目標(biāo)方面取得了顯著的共贏效果。

35、2.本發(fā)明提出了一種適用于實(shí)時(shí)交通誘導(dǎo)的多智能體馬爾可夫決策框架,能夠靈活適配不同誘導(dǎo)目標(biāo),響應(yīng)多樣化的城市交通管理需求。該框架提升了交通管理的精準(zhǔn)性與適應(yīng)性,為復(fù)雜交通場(chǎng)景中的高效誘導(dǎo)提供了堅(jiān)實(shí)的理論與實(shí)踐基礎(chǔ)。

36、3.本發(fā)明充分考慮出行者的個(gè)體偏好,提出差異化定制的路徑誘導(dǎo)策略,能夠深入挖掘出行者需求與行為模式的潛在規(guī)律,同時(shí)顯著提高出行者對(duì)路徑選擇的滿(mǎn)意度和遵從度。在優(yōu)化后的誘導(dǎo)策略下,針對(duì)不同偏好屬性的出行者,分配的路徑呈現(xiàn)出顯著的傾向性,為個(gè)性化交通管理開(kāi)辟了新的方向。



技術(shù)特征:

1.一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)系統(tǒng),其特征在于:該系統(tǒng)包括:

2.如權(quán)利要求1所述的一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)系統(tǒng),其特征在于:在仿真模塊中,利用sumo作為微觀仿真平臺(tái),標(biāo)定交通需求,并根據(jù)可行性為每個(gè)od對(duì)預(yù)審3-4條備選路徑。

3.如權(quán)利要求1所述的一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)系統(tǒng),其特征在于:在優(yōu)化控制模塊中,包括一個(gè)多智能體馬爾可夫決策過(guò)程模型,其優(yōu)化目標(biāo)是通過(guò)改進(jìn)智能體的策略,隨著時(shí)間推移最大化整個(gè)系統(tǒng)的累積獎(jiǎng)勵(lì)。

4.如權(quán)利要求1所述的一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)系統(tǒng),其特征在于:智能體的決策變量包括狀態(tài)、動(dòng)作和獎(jiǎng)勵(lì);

5.如權(quán)利要求3所述的一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)系統(tǒng),其特征在于:在優(yōu)化控制模塊中,還包括使用初始化強(qiáng)化學(xué)習(xí)算法,以?xún)?yōu)化整個(gè)網(wǎng)絡(luò)的交通效率和排放;

6.如權(quán)利要求3所述的一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)系統(tǒng),其特征在于:在優(yōu)化控制模塊中,還包括設(shè)置出行者偏好屬性。

7.如權(quán)利要求1所述的一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)系統(tǒng),其特征在于:在信息交互中實(shí)現(xiàn)策略迭代優(yōu)化包括:根據(jù)交通需求分析和仿真場(chǎng)景,選定od對(duì)并確定相應(yīng)的備選路徑;

8.如權(quán)利要求1所述的一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)系統(tǒng),其特征在于:通過(guò)仿真模塊信息判斷系統(tǒng)收益是否趨于穩(wěn)定的標(biāo)準(zhǔn)為:當(dāng)仿真模塊輸出的獎(jiǎng)勵(lì)值趨于穩(wěn)定,或算法達(dá)到最大迭代次數(shù),認(rèn)為優(yōu)化過(guò)程結(jié)束。

9.如權(quán)利要求3所述的一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)系統(tǒng),其特征在于:輸出管控方案包括在策略?xún)?yōu)化完成后,通過(guò)對(duì)比優(yōu)化前后的交通系統(tǒng)的效率和排放量,驗(yàn)證優(yōu)化策略的有效性。

10.一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)方法,其特征在于:包括如下步驟:


技術(shù)總結(jié)
本發(fā)明屬于交通管理技術(shù)領(lǐng)域,具體的說(shuō)是一種基于多智能體的多目標(biāo)交通路徑誘導(dǎo)方法及系統(tǒng),仿真模塊,用于對(duì)仿真交通需求進(jìn)行校準(zhǔn);優(yōu)化控制模塊,用于隨著時(shí)間推移最大化整個(gè)系統(tǒng)的累積獎(jiǎng)勵(lì);迭代優(yōu)化模塊,用于在信息交互中實(shí)現(xiàn)策略迭代優(yōu)化;判斷模塊,用于通過(guò)仿真模塊信息判斷系統(tǒng)收益是否趨于穩(wěn)定;輸出模塊,用于輸出管控方案,本發(fā)明通過(guò)提供差異化的路徑誘導(dǎo)信息,避免同質(zhì)化導(dǎo)航信息引發(fā)的交通擁堵,實(shí)現(xiàn)交通流量的動(dòng)態(tài)均衡,顯著提升交通網(wǎng)絡(luò)整體效率并降低車(chē)輛排放,為綠色交通的發(fā)展提供有力支持。

技術(shù)研發(fā)人員:李德纮,戚子玥,朱政,王凌昊,蔣哲遠(yuǎn),胡雋
受保護(hù)的技術(shù)使用者:浙江大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/15
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1