最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

基于路徑誤差補償?shù)倪\動體移動方法及裝置與流程

文檔序號:41563024發(fā)布日期:2025-04-08 18:16閱讀:17來源:國知局
基于路徑誤差補償?shù)倪\動體移動方法及裝置與流程

本技術涉及運動控制,特別是指一種基于路徑誤差補償?shù)倪\動體移動方法及裝置、計算設備。


背景技術:

1、在現(xiàn)代工業(yè)自動化、機器人技術以及自動駕駛領域中,實現(xiàn)高精度的軌跡跟蹤至關重要。為了提高軌跡跟蹤的準確性,并解決傳統(tǒng)控制方法難以處理非線性系統(tǒng)的問題,可以引入基于神經(jīng)網(wǎng)絡的自適應動態(tài)規(guī)劃(adaptive?dynamic?programming,adp)來優(yōu)化路徑誤差補償。這種方法與actor-critic架構相同,通過三個主要組件協(xié)同工作:評價網(wǎng)絡(critic?network)、行為網(wǎng)絡(action?network)和模型網(wǎng)絡(model?network),其中,評價網(wǎng)絡(critic?network)用于評估當前策略的好壞,即估算給定狀態(tài)下采取某個行動的價值(q值);行為網(wǎng)絡(action?network)依據(jù)評價網(wǎng)絡提供的信息決定應該采取的動作,負責生成針對給定狀態(tài)的最佳行動方案。模型網(wǎng)絡(model?network)用來模擬系統(tǒng)的動態(tài)特性,預測不同控制輸入下的系統(tǒng)響應。如圖1所示,該方法的流程如下:

2、1、通過環(huán)境(environment,即adp的模型網(wǎng)絡(model?network))給價值函數(shù)(value?function,即adp的評價網(wǎng)絡(critic?network))和策略(policy,即adp的行為網(wǎng)絡(action?network))提供狀態(tài)(state)參數(shù);

3、2、策略(policy,即adp的行為網(wǎng)絡(action?network))接收當前狀態(tài)(state),并根據(jù)當前狀態(tài)(state)選擇一個動作(action)。

4、3、環(huán)境接收動作(action),并根據(jù)該動作產生新的狀態(tài)(state)和獎勵(reward),并將新的狀態(tài)(state)和獎勵(reward)提供給價值函數(shù)。

5、4、價值函數(shù)接收新的狀態(tài)(state)和歷史獎勵(reward),根據(jù)新的狀態(tài)和歷史獎勵計算新的狀態(tài)下采取某個動作的價值(q值),并基于價值(q值)計算td誤差(temporaldifference?error)并輸出,td誤差用來評估當前策略的好壞。

6、5、策略接收td誤差(td?error)來調整其策略參數(shù),以優(yōu)化未來的動作(action)選擇。

7、6、環(huán)境未來的接收動作(action),并根據(jù)該未來的動作產生下一個新的狀態(tài)(state)和獎勵(reward),并將下一個新的狀態(tài)(state)和獎勵(reward)提供給價值函數(shù),繼續(xù)下一輪的迭代。

8、盡管基于adp的方法提供了高度的靈活性,允許復雜環(huán)境下的高效學習和適應,但它們同樣面臨著挑戰(zhàn)。首先,adp算法涉及大量的計算,對于實時性要求高的任務來說,如無人駕駛汽車的軌跡跟蹤控制,控制系統(tǒng)必須能夠在短時間內做出決策,而adp的學習過程如果過于緩慢,則可能無法滿足這一需求。再者,adp可以通過持續(xù)學習來適應環(huán)境變化,但對于突然出現(xiàn)的干擾,如交通流中的突發(fā)事件或者機器人操作環(huán)境中意外障礙物的出現(xiàn),它可能因為學習過程較慢而不能及時作出反應,從而影響系統(tǒng)的抗干擾能力。

9、因此,如何提供一種動態(tài)調整移動路線的方案,可以滿足實時性、增強抗干擾性、提高移動精度,且不需復雜的運算,是有待解決的技術問題。


技術實現(xiàn)思路

1、鑒于現(xiàn)有技術的以上問題,本技術提供一種基于路徑誤差補償?shù)倪\動體移動方法及裝置、計算設備及存儲介質,以實現(xiàn)運動體移動位置的實時動態(tài)調整。

2、為達到上述目的,本技術第一方面提供了一種基于路徑誤差補償?shù)倪\動體移動方法,包括:

3、獲取運動體的規(guī)劃路徑中的設定位置,將設定位置依次下發(fā)給運動體,使運動體根據(jù)所述設定位置移動,所述規(guī)劃路徑可描述為有序點集,有序點集中的每連續(xù)兩個設定位置點連線構成規(guī)劃路徑中的一路徑段;

4、實時獲取運動體基于下發(fā)的當前設定位置移動到的實際位置;

5、確定出所述實際位置在所述規(guī)劃路徑中所處的路徑段,計算所述實際位置與其所處的路徑段的偏離程度作為偏移誤差;

6、基于所述偏移誤差對規(guī)劃路徑中的待下發(fā)的下一設定位置進行修正,將修正后的下一設定位置下發(fā)給運動體,以使運動體基于修正后的下一設定位置進行移動。

7、由上,本技術通過獲取運動體根據(jù)當前設定位置移動到的實際位置,并通過計算該實際位置在規(guī)劃路徑中的所處路徑段與實際位置的偏移誤差來進行補償處理,這個過程不涉及大量的計算,可以滿足實時性能。本技術在獲得偏移誤差后立即就進行下一設定位置修正,可以增強抗干擾性。由于實時對下發(fā)的設定位置進行修正,使得運動體按照修正后的軌跡運動,可以提高運動體的移動精度。

8、作為第一方面的一種可能的實現(xiàn)方式,所述確定出所述實際位置在所述規(guī)劃路徑中所處的路徑段,包括:

9、遍歷所述規(guī)劃路徑的有序點集中的預設范圍內的各點;

10、對于所述范圍內的每連續(xù)兩個點,計算所述實際位置分別與所述兩個點構成的路徑段之間的第一夾角和第二夾角;所述實際位置與兩個點中其中一點的連線和兩個點構成的路徑段之間的夾角為第一夾角,所述實際位置與兩個點中其中另一點的連線和兩個點構成的路徑段之間的夾角為第二夾角;

11、判斷所述第一夾角和所述第二夾角均小于等于90度條件時,對應的所述兩個點構成的路徑段為所述實際位置在所述規(guī)劃路徑中所處的路徑段。

12、由上,本技術只需要簡單的幾何運算,即只需要計算實際位置分別與遍歷范圍內每連續(xù)兩個點之間的連線的夾角,當夾角滿足小于等于90度條件,就能快速定位到運動體所在的路徑段,減少了計算量,提高了實時處理能力。

13、作為第一方面的一種可能的實現(xiàn)方式,所述預設范圍內的各點包括:

14、以所述規(guī)劃路徑中的前一設定位置在所述規(guī)劃路徑中所處的路徑段段數(shù)為基準,其前后預設數(shù)量的點,其中,所述前一設定位置是當前設定位置的前一個下發(fā)的設定位置。

15、由上,相比于遍歷整個有序點集來確定實際位置所在的路徑段,本技術使用局部化搜索策略僅考慮當前設定位置的前一個下發(fā)的設定位置所在路徑段及其前后預設數(shù)量的點,能夠顯著減少計算量,加快了處理速度。

16、作為第一方面的一種可能的實現(xiàn)方式,所述遍歷包括:

17、根據(jù)所述預設數(shù)量的點分別與所述前一設定位置在所述規(guī)劃路徑中所處的路徑段段數(shù)的順序上的遠近,由近到遠的方式進行遍歷。

18、由上,本技術從靠近前一設定位置的點開始遍歷,能夠優(yōu)先處理那些最有可能包含當前實際位置的路徑段,有助于更快地收斂到正確的路徑段上,避免不必要的計算。

19、作為第一方面的一種可能的實現(xiàn)方式,所述實際位置與其所處的路徑段的偏離程度,包括:

20、所述實際位置到其所處的路徑段的距離。

21、由上,本技術通過采用距離作為偏離程度的衡量標準,計算量小,能夠顯著提高處理速度。

22、作為第一方面的一種可能的實現(xiàn)方式,還包括:

23、獲取下發(fā)所述當前設定位置的第一時間;

24、確定獲取到所述實際位置的第二時間;

25、計算所述第一時間和所述第二時間的時間差作為時延誤差;

26、還基于所述時延誤差對規(guī)劃路徑中的待下發(fā)的下一設定位置進行修正。

27、由上,在實際應用中,從下發(fā)指令到運動體響應并到達指定位置之間往往存在一定的延遲,本技術通過計算時延誤差并進行修正,可以有效補償這種延遲,使得系統(tǒng)能夠更準確地預測和調整運動體的實際位置。

28、作為第一方面的一種可能的實現(xiàn)方式,所述對規(guī)劃路徑中的待下發(fā)的下一設定位置進行修正,包括:

29、設置補償比例;

30、基于所述補償比例、所述偏移誤差和所述時延誤差對待下發(fā)的所述下一設定位置進行修正。

31、由上,本技術通過引入補償比例,可以根據(jù)實際情況靈活調整偏移誤差和時延誤差的影響程度,從而實現(xiàn)更精準的路徑修正,確保運動體更加準確地遵循預設的規(guī)劃路徑。

32、作為第一方面的一種可能的實現(xiàn)方式,所述基于所述補償比例、所述偏移誤差和所述時延誤差對待下發(fā)的所述下一設定位置進行修正,包括:

33、修正后的待下發(fā)的下一設定位置=規(guī)劃路徑中的待下發(fā)的下一設定位置*(100%-補償比例)+偏移誤差*補償比例;

34、其中,規(guī)劃路徑中的待下發(fā)的下一設定位置是規(guī)劃路徑中的第n個設定位置,該n=當前設定位置的實際位置在所述規(guī)劃路徑中所處的路徑段的段數(shù)+時延誤差所對應的規(guī)劃路徑中的點的數(shù)量。

35、為達到上述目的,本技術第二方面提供了一種基于路徑誤差補償?shù)倪\動體移動裝置,包括:

36、規(guī)劃路徑獲取模塊,用于獲取運動體的規(guī)劃路徑中的設定位置,將設定位置依次下發(fā)給運動體,使運動體根據(jù)所述設定位置移動,所述規(guī)劃路徑可描述為有序點集,有序點集中的每連續(xù)兩個設定位置點連線構成規(guī)劃路徑中的一路徑段;

37、實時位置獲取模塊,用于實時獲取運動體基于下發(fā)的當前設定位置移動到的實際位置;

38、偏移誤差確定模塊,用于確定出所述實際位置在所述規(guī)劃路徑中所處的路徑段,計算所述實際位置與其所處的路徑段的偏離程度作為偏移誤差;

39、設定位置修正模塊,用于基于所述偏移誤差對規(guī)劃路徑中的待下發(fā)的下一設定位置進行修正,將修正后的下一設定位置下發(fā)給運動體,以使運動體基于修正后的下一設定位置進行移動。

40、本技術第三方面提供了一種計算設備,包括:

41、處理器,以及

42、存儲器,其上存儲有程序指令,所述程序指令當被所述處理器執(zhí)行時使得所述處理器執(zhí)行上述第一方面任一所述的方法。

43、本技術第四方面提供了一種計算機可讀存儲介質,其上存儲有程序指令,所述程序指令當被計算機執(zhí)行時使得所述計算機實現(xiàn)上述第一方面的任一所述的方法。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1