使用模擬傳感器數(shù)據(jù)的自主機(jī)器和應(yīng)用的視點(diǎn)自適應(yīng)感知的制作方法

文檔序號(hào)：41959900發(fā)布日期：2025-05-20 16:54閱讀：4來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

使用模擬傳感器數(shù)據(jù)的自主機(jī)器和應(yīng)用的視點(diǎn)自適應(yīng)感知的制作方法

背景技術(shù)：

1、設(shè)計(jì)一種無監(jiān)督地自主、安全地駕駛車輛的系統(tǒng)是非常困難的。自主車輛應(yīng)當(dāng)至少能夠作為專注駕駛員的功能等效物來執(zhí)行，該專注駕駛員利用具有在復(fù)雜環(huán)境中識(shí)別移動(dòng)和靜止障礙物并對(duì)其作出反應(yīng)的驚人能力的感知和動(dòng)作系統(tǒng)，以避免與沿著車輛的路徑的其他對(duì)象或結(jié)構(gòu)碰撞。因此，檢測有活力的對(duì)象(例如汽車、行人等)和環(huán)境的其他部分的能力通常對(duì)于自主駕駛感知系統(tǒng)至關(guān)重要。許多傳統(tǒng)的感知方法依賴深度神經(jīng)網(wǎng)絡(luò)(dnn)來評(píng)估圖像或其他傳感器數(shù)據(jù)，以用于檢測任務(wù)。

2、自主駕駛的視覺感知中的最重要的挑戰(zhàn)之一源于由不同車輛制造商在不同車型上實(shí)現(xiàn)的相機(jī)裝置(rig)配置的多樣性(例如，不同的相機(jī)數(shù)量、視場、位置、取向等)。與二維(2d)計(jì)算機(jī)視覺不同(其中dnn可以提供一些平移不變性，因此對(duì)相機(jī)位置的某些變化可以具有一定的魯棒性)，多視圖或三維(3d)感知(例如，其依賴于將2d(例如，圖像)特征提升到3d空間)在處理使用不同相機(jī)裝置生成的數(shù)據(jù)時(shí)，尤其是在道路非平面時(shí)，通常會(huì)經(jīng)受性能下降。因此，不同車型(例如，轎車、卡車、運(yùn)動(dòng)型多用途車)上相機(jī)裝置配置的多樣性限制了開發(fā)在不同車型上表現(xiàn)良好的通用dnn的能力。理想情況下，dnn將使用由配備有與目標(biāo)車型相同的相機(jī)裝置(例如，相同的相機(jī)數(shù)量、視點(diǎn)、相機(jī)參數(shù))的數(shù)據(jù)收集車輛生成的數(shù)據(jù)進(jìn)行訓(xùn)練，以最小化域差距。然而，這在現(xiàn)實(shí)世界中往往是不可行的。例如，為每種車型收集新數(shù)據(jù)并開發(fā)專用的dnn是高度資源密集的且不切實(shí)際的，而且對(duì)于新車型來說通常是不可能的。因此，存在對(duì)能夠支持多視圖或3d感知的改進(jìn)的感知技術(shù)的需求。

技術(shù)實(shí)現(xiàn)思路

1、本公開的實(shí)施例涉及用于自主機(jī)器和應(yīng)用的視點(diǎn)適應(yīng)的感知。例如，公開了適配(adapt)3d感知網(wǎng)絡(luò)以適應(yīng)不可獲得的(unavailable)目標(biāo)裝置(rig)數(shù)據(jù)的系統(tǒng)和方法。在一些實(shí)施例中，通過使用真實(shí)源裝置數(shù)據(jù)以及模擬源裝置數(shù)據(jù)和模擬目標(biāo)裝置數(shù)據(jù)來訓(xùn)練作為訓(xùn)練網(wǎng)絡(luò)的一部分的3d感知網(wǎng)絡(luò)的一個(gè)或更多個(gè)層，3d感知網(wǎng)絡(luò)可以被適配以適應(yīng)不可獲得的目標(biāo)裝置數(shù)據(jù)。從真實(shí)源數(shù)據(jù)提取的特征統(tǒng)計(jì)數(shù)據(jù)(statistics)可以用于在訓(xùn)練期間變換從模擬數(shù)據(jù)提取的特征。通過訓(xùn)練網(wǎng)絡(luò)的真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)的路徑可以在真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)上交替地被訓(xùn)練，以更新不同路徑的共享權(quán)重。

2、附加地或替代地，通過使用模擬源裝置數(shù)據(jù)和模擬目標(biāo)裝置數(shù)據(jù)(無真實(shí)源裝置數(shù)據(jù))訓(xùn)練作為訓(xùn)練網(wǎng)絡(luò)的一部分的3d感知網(wǎng)絡(luò)的一個(gè)或更多個(gè)層，3d感知網(wǎng)絡(luò)可以被適配以適應(yīng)不可獲得的目標(biāo)裝置數(shù)據(jù)。比較(例如，自上而下)從模擬源裝置數(shù)據(jù)和模擬目標(biāo)裝置數(shù)據(jù)提取的經(jīng)變換特征圖的一致性損失可被用于最小化跨訓(xùn)練通道的差異。

3、這樣，通過訓(xùn)練網(wǎng)絡(luò)的一條或更多條路徑可被指定為3d感知網(wǎng)絡(luò)，并且目標(biāo)裝置數(shù)據(jù)可以被應(yīng)用于3d感知網(wǎng)絡(luò)以執(zhí)行一項(xiàng)或更多項(xiàng)感知任務(wù)。

技術(shù)特征：

1.一個(gè)或更多個(gè)處理器，包括處理電路，所述處理電路用于使用三維3d感知網(wǎng)絡(luò)對(duì)自機(jī)器執(zhí)行一個(gè)或更多個(gè)操作，所述3d感知網(wǎng)絡(luò)是至少基于將模擬二維2d傳感器數(shù)據(jù)應(yīng)用于所述3d感知網(wǎng)絡(luò)的至少一部分而被更新的，所述模擬2d傳感器數(shù)據(jù)是至少基于模擬目標(biāo)傳感器裝置和自機(jī)器的源傳感器裝置而被生成的。

2.根據(jù)權(quán)利要求1所述的一個(gè)或更多個(gè)處理器，其中所述處理電路還用于：至少基于更新視點(diǎn)調(diào)整網(wǎng)絡(luò)來更新所述3d感知網(wǎng)絡(luò)，所述視點(diǎn)調(diào)整網(wǎng)絡(luò)包括所述3d感知網(wǎng)絡(luò)的被復(fù)制為所述視點(diǎn)調(diào)整網(wǎng)絡(luò)的多個(gè)通道的至少一部分的一個(gè)或更多個(gè)層。

3.根據(jù)權(quán)利要求1所述的一個(gè)或更多個(gè)處理器，其中所述處理電路還用于：至少基于將模擬所述源傳感器裝置的所述模擬2d傳感器數(shù)據(jù)應(yīng)用于所述3d感知網(wǎng)絡(luò)的所述至少一部分的一個(gè)或更多個(gè)第一路徑以及將模擬所述目標(biāo)傳感器裝置的所述模擬2d傳感器數(shù)據(jù)應(yīng)用于所述3d感知網(wǎng)絡(luò)的所述至少一部分的一個(gè)或更多個(gè)第二路徑，來更新所述3d感知網(wǎng)絡(luò)。

4.根據(jù)權(quán)利要求1所述的一個(gè)或更多個(gè)處理器，其中所述3d感知網(wǎng)絡(luò)包括生成變換后的特征的視圖變換，其中所述處理電路還用于：至少基于最小化所述3d感知網(wǎng)絡(luò)的所述至少一部分的一個(gè)或更多個(gè)第一路徑和一個(gè)或更多個(gè)第二路徑的所述變換后的特征之間的差異的損失，來更新所述3d感知網(wǎng)絡(luò)。

5.根據(jù)權(quán)利要求1所述的一個(gè)或更多個(gè)處理器，其中所述處理電路還用于：至少基于最小化處理對(duì)應(yīng)于所述源傳感器裝置的所述模擬2d傳感器數(shù)據(jù)的一個(gè)或更多個(gè)第一路徑的視圖變換后的特征與處理對(duì)應(yīng)于所述目標(biāo)傳感器裝置的所述模擬2d傳感器數(shù)據(jù)的一個(gè)或更多個(gè)第二路徑的視圖變換后的特征之間的差異的損失，來更新所述3d感知網(wǎng)絡(luò)。

6.根據(jù)權(quán)利要求1所述的一個(gè)或更多個(gè)處理器，其中所述源傳感器裝置表示第一傳感器配置，所述第一傳感器配置不同于所述目標(biāo)傳感器裝置的第二傳感器配置。

7.根據(jù)權(quán)利要求1所述的一個(gè)或更多個(gè)處理器，其中所述處理電路還用于：在模擬的一個(gè)或更多個(gè)時(shí)間片中的至少一個(gè)時(shí)間片內(nèi)，為所述源傳感器裝置的一個(gè)或更多個(gè)模擬傳感器中的至少一個(gè)傳感器和所述目標(biāo)傳感器裝置的至少一個(gè)對(duì)應(yīng)傳感器生成模擬2d傳感器數(shù)據(jù)幀以及模擬真值數(shù)據(jù)。

8.根據(jù)權(quán)利要求1所述的一個(gè)或更多個(gè)處理器，其中所述處理電路還用于：至少基于將真實(shí)2d傳感器數(shù)據(jù)和所述模擬2d傳感器數(shù)據(jù)應(yīng)用于包括所述3d感知網(wǎng)絡(luò)的一個(gè)或更多個(gè)層的第一視點(diǎn)調(diào)整網(wǎng)絡(luò)來更新所述第一視點(diǎn)調(diào)整網(wǎng)絡(luò)，之后至少基于將所述模擬2d傳感器數(shù)據(jù)應(yīng)用于包括所述3d感知網(wǎng)絡(luò)的一個(gè)或更多個(gè)層的第二視點(diǎn)調(diào)整網(wǎng)絡(luò)來更新所述第二視點(diǎn)調(diào)整網(wǎng)絡(luò)。

9.根據(jù)權(quán)利要求1所述的一個(gè)或更多個(gè)處理器，其中所述3d感知網(wǎng)絡(luò)被更新以執(zhí)行2d到3d變換或2d-3d融合中的至少一個(gè)。

10.根據(jù)權(quán)利要求1所述的一個(gè)或更多個(gè)處理器，其中所述3d感知網(wǎng)絡(luò)或所述一個(gè)或更多個(gè)處理器中的至少一個(gè)被包括在以下的至少一項(xiàng)中：

11.一種系統(tǒng)，包括一個(gè)或更多個(gè)處理器，所述一個(gè)或更多個(gè)處理器用于：使用三維3d重建網(wǎng)絡(luò)對(duì)自機(jī)器執(zhí)行一個(gè)或更多個(gè)操作，所述3d重建網(wǎng)絡(luò)至少基于將模擬二維2d傳感器數(shù)據(jù)應(yīng)用于所述3d重建網(wǎng)絡(luò)的至少一部分而被更新，所述模擬2d傳感器數(shù)據(jù)是至少基于模擬目標(biāo)傳感器裝置和所述自機(jī)器的源傳感器裝置而被生成的。

12.根據(jù)權(quán)利要求11所述的系統(tǒng)，其中所述一個(gè)或更多個(gè)處理器還用于：至少基于更新視點(diǎn)調(diào)整網(wǎng)絡(luò)來更新所述3d重建網(wǎng)絡(luò)，所述視點(diǎn)調(diào)整網(wǎng)絡(luò)包括所述3d重建網(wǎng)絡(luò)的被復(fù)制為所述視點(diǎn)調(diào)整網(wǎng)絡(luò)的多個(gè)通道的至少一部分的一個(gè)或更多個(gè)層。

13.根據(jù)權(quán)利要求11所述的系統(tǒng)，其中所述一個(gè)或更多個(gè)處理器還用于：至少基于將模擬所述源傳感器裝置的所述模擬2d傳感器數(shù)據(jù)應(yīng)用于所述3d重建網(wǎng)絡(luò)的所述至少一部分的一個(gè)或更多個(gè)第一路徑以及將模擬所述目標(biāo)傳感器裝置的所述模擬2d傳感器數(shù)據(jù)應(yīng)用于所述3d重建網(wǎng)絡(luò)的所述至少一部分的一個(gè)或更多個(gè)第二路徑，來更新所述3d重建網(wǎng)絡(luò)。

14.根據(jù)權(quán)利要求11所述的系統(tǒng)，其中所述3d重建網(wǎng)絡(luò)被更新以執(zhí)行生成變換后的特征的視圖變換，其中所述一個(gè)或更多個(gè)處理器還用于：至少基于最小化所述3d重建網(wǎng)絡(luò)的所述至少一部分的一個(gè)或更多個(gè)第一路徑和一個(gè)或更多個(gè)第二路徑的所述變換后的特征之間的差異的損失，來更新所述3d重建網(wǎng)絡(luò)。

15.根據(jù)權(quán)利要求11所述的系統(tǒng)，其中所述一個(gè)或更多個(gè)處理器還用于：至少基于最小化處理對(duì)應(yīng)于所述源傳感器裝置的所述模擬2d傳感器數(shù)據(jù)的一個(gè)或更多個(gè)第一路徑的視圖變換后的特征與處理對(duì)應(yīng)于所述目標(biāo)傳感器裝置的所述模擬2d傳感器數(shù)據(jù)的一個(gè)或更多個(gè)第二路徑的視圖變換后的特征之間的差異的損失，來更新所述3d重建網(wǎng)絡(luò)。

16.根據(jù)權(quán)利要求11所述的系統(tǒng)，其中所述源傳感器裝置表示第一傳感器配置，所述第一傳感器配置不同于所述目標(biāo)傳感器裝置的第二傳感器配置。

17.根據(jù)權(quán)利要求11所述的系統(tǒng)，其中所述一個(gè)或更多個(gè)處理器還用于：在模擬的一個(gè)或更多個(gè)時(shí)間片中的至少一個(gè)時(shí)間片內(nèi)，為所述源傳感器裝置的一個(gè)或更多個(gè)模擬傳感器中的至少一個(gè)傳感器和所述目標(biāo)傳感器裝置的至少一個(gè)對(duì)應(yīng)傳感器生成模擬2d傳感器數(shù)據(jù)幀以及模擬真值數(shù)據(jù)。

18.根據(jù)權(quán)利要求11所述的系統(tǒng)，其中所述系統(tǒng)或所述3d重建網(wǎng)絡(luò)中的至少一個(gè)被包括在以下的至少一項(xiàng)中：

19.一種方法，包括：

20.根據(jù)權(quán)利要求19所述的方法，其中所述方法由以下中的至少一項(xiàng)執(zhí)行，或所述3d重建網(wǎng)絡(luò)被包括在以下中的至少一項(xiàng)中：

技術(shù)總結(jié)
本公開涉及使用模擬傳感器數(shù)據(jù)的自主機(jī)器和應(yīng)用的視點(diǎn)自適應(yīng)感知。公開了與自主機(jī)器和應(yīng)用的視點(diǎn)適配的感知相關(guān)的系統(tǒng)和方法。3D感知網(wǎng)絡(luò)可被適配為通過使用模擬源裝置數(shù)據(jù)和模擬目標(biāo)裝置數(shù)據(jù)訓(xùn)練3D感知網(wǎng)絡(luò)的一個(gè)或更多個(gè)層以作為訓(xùn)練網(wǎng)絡(luò)的一部分，來應(yīng)對(duì)不可獲得的目標(biāo)裝置數(shù)據(jù)。比較從模擬源裝置數(shù)據(jù)和模擬目標(biāo)裝置數(shù)據(jù)提取的(自上而下)變換后的特征圖的一致性損失可用于最小化跨訓(xùn)練通道的差異。因此，通過訓(xùn)練網(wǎng)絡(luò)的一個(gè)或更多個(gè)路徑可以被指定為3D感知網(wǎng)絡(luò)，并且目標(biāo)裝置數(shù)據(jù)可被應(yīng)用于該3D感知網(wǎng)絡(luò)以執(zhí)行一個(gè)或更多個(gè)感知任務(wù)。

技術(shù)研發(fā)人員：徐娥賢,崔泰銀,樸旻雨,朱柾柾
受保護(hù)的技術(shù)使用者：輝達(dá)公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/19

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：徐娥賢,崔泰銀,樸旻雨,朱柾柾
技術(shù)所有人：輝達(dá)公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

智能感知與自主控制相關(guān)技術(shù)

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

使用模擬傳感器數(shù)據(jù)的自主機(jī)器和應(yīng)用的視點(diǎn)自適應(yīng)感知的制作方法