本發(fā)明涉及機(jī)器人控制,尤其涉及一種機(jī)器人分揀抓取控制方法。
背景技術(shù):
1、在物流、倉(cāng)儲(chǔ)和制造業(yè)等領(lǐng)域,機(jī)器人分揀和抓取任務(wù)通常需要高精度和高效率的自動(dòng)化解決方案。傳統(tǒng)的分揀抓取主要依賴于固定的規(guī)則和機(jī)械裝置,難以適應(yīng)復(fù)雜多變的環(huán)境和物體類型。例如,傳統(tǒng)方法在處理形狀不規(guī)則、尺寸多樣化的物體時(shí),容易出現(xiàn)抓取失敗或分揀錯(cuò)誤的情況。此外,傳統(tǒng)方法對(duì)環(huán)境變化的適應(yīng)性差,無法在復(fù)雜環(huán)境下自動(dòng)調(diào)整行為。
2、因此,如何提供一種能夠精確測(cè)量物體尺寸、智能識(shí)別物體類型,并及時(shí)優(yōu)化抓取策略的機(jī)器人分揀抓取控制方法具有重要的現(xiàn)實(shí)意義。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種機(jī)器人分揀抓取控制方法,以解決上述技術(shù)問題。
2、為解決上述技術(shù)問題,本發(fā)明提供一種機(jī)器人分揀抓取控制方法,包括如下步驟:
3、步驟1:校正3d相機(jī)并求出像素點(diǎn)在世界坐標(biāo)系下的坐標(biāo);
4、步驟2:使用校正后的3d相機(jī)對(duì)待抓取物體進(jìn)行拍攝,得到所述待抓取物體的點(diǎn)云并進(jìn)行圖像處理,再通過圖像算法計(jì)算出待抓取物體的數(shù)據(jù)信息,所述數(shù)據(jù)信息至少包括所述待抓取物體的尺寸和姿態(tài);
5、步驟3:構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),將所述待抓取物體的數(shù)據(jù)信息輸入所述卷積神經(jīng)網(wǎng)絡(luò),輸出所述待抓取物體的種類,并基于所述待抓取物體的種類進(jìn)行夾持類型判斷和夾持力計(jì)算;
6、步驟4:構(gòu)建強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò),利用強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)對(duì)所述卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,得到適應(yīng)不同種類待抓取物體的抓取策略模型;
7、步驟5:利用所述抓取策略模型控制機(jī)器人的分揀抓取動(dòng)作。
8、較佳地,步驟1包括:
9、步驟11:制作用于3d相機(jī)標(biāo)定的棋盤格;
10、步驟12:使用張正友標(biāo)定法進(jìn)行3d相機(jī)標(biāo)定,得到所述3d相機(jī)的內(nèi)參矩陣、畸變參數(shù)和外參矩陣;
11、步驟13:基于求得的3d相機(jī)的內(nèi)參矩陣和外參矩陣計(jì)算所述像素點(diǎn)在世界坐標(biāo)系下的坐標(biāo)。
12、較佳地,步驟2中,所述圖像處理至少包括去重和去噪。
13、較佳地,步驟2中,所述待抓取物體的尺寸表示為,姿態(tài)表示為,其中分別為待抓取物體包圍盒的長(zhǎng)寬高,為包圍盒的中心點(diǎn)坐標(biāo),為俯仰角,是偏航角,是翻滾角。
14、較佳地,步驟3包括:
15、步驟31:構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),所述卷積神經(jīng)網(wǎng)絡(luò)依次包括輸入層、3個(gè)卷積層、池化層以及3個(gè)全連接層;
16、步驟32:訓(xùn)練所述卷積神經(jīng)網(wǎng)絡(luò),利用訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)輸出所述待抓取物體的種類;
17、步驟33:通過輸出的種類得到對(duì)應(yīng)的抓取方式,并計(jì)算該抓取方式對(duì)應(yīng)的夾持力。
18、較佳地,步驟33中,輸出的種類為第一種類,則采用平動(dòng)抓取,輸出的種類為第二種類,則采取包絡(luò)抓取。
19、較佳地,所述夾持力的計(jì)算公式為:
20、,
21、其中,為夾持力,為驅(qū)動(dòng)機(jī)構(gòu)輸出扭矩或推力,為機(jī)械效率,為夾持力臂長(zhǎng)度。
22、較佳地,所述強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)為dqn,所述dqn中包含當(dāng)前網(wǎng)絡(luò)、目標(biāo)網(wǎng)絡(luò)和回訪緩沖區(qū)。
23、較佳地,所述當(dāng)前網(wǎng)絡(luò)的損失函數(shù)為:
24、,
25、其中,為反向傳播算法更新后的網(wǎng)絡(luò)參數(shù),為一次訓(xùn)練的數(shù)據(jù)數(shù)量,為當(dāng)前的狀態(tài)和動(dòng)作,為下一步的狀態(tài)和動(dòng)作,為獎(jiǎng)勵(lì)值,為折扣因子,為帶有參數(shù)的當(dāng)前q網(wǎng)絡(luò),為帶有的目標(biāo)q網(wǎng)絡(luò)。
26、較佳地,所述強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)的獎(jiǎng)勵(lì)函數(shù)規(guī)則為:抓取到物體獲得100獎(jiǎng)勵(lì);在抓取過程中,獲得的獎(jiǎng)勵(lì)與距離成正比;抓取失敗獲得-50獎(jiǎng)勵(lì)。
27、與現(xiàn)有技術(shù)相比,本發(fā)明提供的機(jī)器人分揀抓取控制方法具有如下優(yōu)點(diǎn):
28、1、本發(fā)明可以精確測(cè)量物體尺寸并智能識(shí)別物體類型,在此基礎(chǔ)上能夠根據(jù)物體的形狀、尺寸和材質(zhì)動(dòng)態(tài)調(diào)整抓取策略,從而適應(yīng)物體的復(fù)雜形狀和尺寸多樣性,顯著提高抓取的成功率;
29、2、本發(fā)明可以通過強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)不斷優(yōu)化抓取策略,能夠根據(jù)環(huán)境變化自動(dòng)調(diào)整行為,適應(yīng)復(fù)雜多變的工作場(chǎng)景;強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)還允許系統(tǒng)在實(shí)際操作中不斷學(xué)習(xí)和改進(jìn),從而更好地應(yīng)對(duì)突發(fā)情況和環(huán)境變化;
30、3、本發(fā)明能夠高效地完成分類和抓取任務(wù),提高了整體工作效率,同時(shí)減少了對(duì)人工的依賴,降低了人力成本。
1.一種機(jī)器人分揀抓取控制方法,其特征在于,包括如下步驟:
2.如權(quán)利要求1所述的機(jī)器人分揀抓取控制方法,其特征在于,步驟1包括:
3.如權(quán)利要求1所述的機(jī)器人分揀抓取控制方法,其特征在于,步驟2中,所述圖像處理至少包括去重和去噪。
4.如權(quán)利要求1所述的機(jī)器人分揀抓取控制方法,其特征在于,步驟2中,所述待抓取物體的尺寸表示為,
5.如權(quán)利要求1所述的機(jī)器人分揀抓取控制方法,其特征在于,步驟3包括:
6.如權(quán)利要求5所述的機(jī)器人分揀抓取控制方法,其特征在于,步驟33中,輸出的種類為第一種類,則采用平動(dòng)抓取,輸出的種類為第二種類,則采取包絡(luò)抓取。
7.如權(quán)利要求5所述的機(jī)器人分揀抓取控制方法,其特征在于,所述夾持力的計(jì)算公式為:
8.如權(quán)利要求1所述的機(jī)器人分揀抓取控制方法,其特征在于,所述強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)為dqn,所述dqn中包含當(dāng)前網(wǎng)絡(luò)、目標(biāo)網(wǎng)絡(luò)和回訪緩沖區(qū)。
9.如權(quán)利要求8所述的機(jī)器人分揀抓取控制方法,其特征在于,所述當(dāng)前網(wǎng)絡(luò)的損失函數(shù)為:
10.如權(quán)利要求9所述的機(jī)器人分揀抓取控制方法,其特征在于,所述強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)的獎(jiǎng)勵(lì)函數(shù)規(guī)則為:抓取到物體獲得100獎(jiǎng)勵(lì);在抓取過程中,獲得的獎(jiǎng)勵(lì)與距離成正比;抓取失敗獲得-50獎(jiǎng)勵(lì)。