System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于機(jī)械手控制,具體涉及一種機(jī)械手抓握對(duì)齊方法、系統(tǒng)及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、機(jī)械手作為工業(yè)自動(dòng)化和智能制造領(lǐng)域的重要組成部分,在生產(chǎn)制造、醫(yī)療、服務(wù)等多個(gè)領(lǐng)域發(fā)揮著關(guān)鍵作用。隨著科技的進(jìn)步和應(yīng)用需求的不斷提高,對(duì)機(jī)械手的智能化和靈活性提出了更高的要求。
2、傳統(tǒng)的機(jī)械手通常依賴預(yù)設(shè)程序和固定動(dòng)作序列來完成任務(wù),缺乏自主決策和環(huán)境適應(yīng)能力。這種方式在結(jié)構(gòu)簡(jiǎn)單、環(huán)境穩(wěn)定的場(chǎng)景下可以滿足基本需求,但在復(fù)雜多變的動(dòng)態(tài)環(huán)境中往往表現(xiàn)不佳。例如,當(dāng)目標(biāo)物體的位置、姿態(tài)發(fā)生變化時(shí),傳統(tǒng)機(jī)械手難以做出相應(yīng)調(diào)整,容易造成抓取失敗或碰撞等問題。
3、此外,傳統(tǒng)機(jī)械手的操作往往需要人工編程和調(diào)試,耗時(shí)耗力,難以快速適應(yīng)新的任務(wù)需求,在一些高度動(dòng)態(tài)的場(chǎng)景中,如協(xié)作機(jī)器人、服務(wù)機(jī)器人等應(yīng)用場(chǎng)景中,傳統(tǒng)機(jī)械手的局限性更加明顯,難以滿足靈活交互、實(shí)時(shí)決策的需求。
技術(shù)實(shí)現(xiàn)思路
1、鑒于以上所述的現(xiàn)有技術(shù)的缺點(diǎn),本專利技術(shù)的目的是提供一種機(jī)械手抓握對(duì)齊方法、系統(tǒng)及存儲(chǔ)介質(zhì),解決了如何對(duì)目標(biāo)物體的精確抓握對(duì)齊的問題。
2、為實(shí)現(xiàn)上述目的,本專利技術(shù)采用如下技術(shù)方案。
3、本專利技術(shù)第一方面提供一種機(jī)械手抓握對(duì)齊方法,包括:上層機(jī)械手抓握手勢(shì)選擇步驟以及下層機(jī)械手腕部關(guān)節(jié)抓握對(duì)齊步驟;其中:
4、所述上層機(jī)械手抓握手勢(shì)選擇步驟包括:獲取并基于目標(biāo)物體的圖片提取目標(biāo)物體的輪廓;根據(jù)目標(biāo)物體的輪廓計(jì)算目標(biāo)物體的位置狀態(tài)信息和形狀;基于所述目標(biāo)物體的
5、所述下層機(jī)械手腕部關(guān)節(jié)抓握對(duì)齊步驟包括:將目標(biāo)物體的位置狀態(tài)信息作為預(yù)設(shè)強(qiáng)化學(xué)習(xí)算法的狀態(tài)空間,輸出機(jī)械手腕部關(guān)節(jié)動(dòng)作角度;
6、基于機(jī)械手抓握手勢(shì)和機(jī)械手腕部關(guān)節(jié)動(dòng)作角度實(shí)現(xiàn)機(jī)械手對(duì)目標(biāo)物體的抓握對(duì)齊。
7、作為本專利技術(shù)的一種實(shí)施方式,所述獲取并基于目標(biāo)物體的圖片提取目標(biāo)物體的輪廓,包括:
8、通過機(jī)械手上的攝像頭實(shí)時(shí)獲取目標(biāo)物體的圖片;
9、對(duì)目標(biāo)物體的圖片進(jìn)行預(yù)處理,得到預(yù)處理后的目標(biāo)物體的圖片;
10、對(duì)預(yù)處理后的目標(biāo)物體的圖片進(jìn)行邊緣檢測(cè),得到邊緣檢測(cè)后的目標(biāo)物體的圖片;
11、對(duì)邊緣檢測(cè)后的目標(biāo)物體的圖片進(jìn)行膨脹處理,得到膨脹處理后的目標(biāo)物體的圖片;
12、對(duì)膨脹處理后的目標(biāo)物體的圖片進(jìn)行輪廓提取,得到目標(biāo)物體的輪廓。
13、作為本專利技術(shù)的一種實(shí)施方式,所述根據(jù)目標(biāo)物體的輪廓計(jì)算目標(biāo)物體的位置狀態(tài)信息和形狀,包括:
14、獲取目標(biāo)物體的輪廓的最小外接矩形的幾何中點(diǎn)坐標(biāo)和兩條對(duì)稱軸長(zhǎng)度比值,以及目標(biāo)物體的輪廓圓度;
15、通過將最小外接矩形的幾何中點(diǎn)坐標(biāo)與相機(jī)坐標(biāo)系中的光軸點(diǎn)坐標(biāo)進(jìn)行相對(duì)坐標(biāo)運(yùn)算,獲取目標(biāo)物體的位置狀態(tài)信息;以及
16、當(dāng)目標(biāo)物體的輪廓圓度大于圓度判斷閾值,判斷目標(biāo)物體的形狀為球體;反之為長(zhǎng)方體或正方體,其中:當(dāng)目標(biāo)物體的最小外接矩形的兩條對(duì)稱軸長(zhǎng)度比值大于軸長(zhǎng)度比值判斷閾值,判斷目標(biāo)物體的形狀為長(zhǎng)方體,否則為正方體。
17、作為本專利技術(shù)的一種實(shí)施方式,所述將目標(biāo)物體的位置狀態(tài)信息作為預(yù)設(shè)強(qiáng)化狀態(tài)信息學(xué)習(xí)算法的狀態(tài)空間,輸出機(jī)械手腕部關(guān)節(jié)動(dòng)作角度,包括:
18、獲取目標(biāo)物體的位置狀態(tài)信息,其中目標(biāo)物體的位置狀態(tài)信息以表示,其中, t為時(shí)刻,為環(huán)境狀態(tài),以 t時(shí)刻的上層機(jī)械手抓握手勢(shì)選擇步驟得到的目標(biāo)物體的位置狀態(tài)信息作為環(huán)境狀態(tài);
19、以雙延遲深度確定性梯度策略強(qiáng)化學(xué)習(xí)算法作為預(yù)設(shè)強(qiáng)化學(xué)習(xí)算法,所述雙延遲深度確定性梯度策略強(qiáng)化學(xué)習(xí)算法用td3強(qiáng)化學(xué)習(xí)算法表示,所述td3強(qiáng)化學(xué)習(xí)算法的狀態(tài)空間為目標(biāo)物體所有可能的位置狀態(tài)信息;
20、將所述目標(biāo)物體的位置狀態(tài)信息輸入至所述td3強(qiáng)化學(xué)習(xí)算法中,輸出一組角度值,該組角度值即為機(jī)械手腕部關(guān)節(jié)動(dòng)作角度。
21、作為本專利技術(shù)的一種實(shí)施方式,所述td3強(qiáng)化學(xué)習(xí)算法的獎(jiǎng)勵(lì)函數(shù)設(shè)置為根據(jù)機(jī)械手腕部關(guān)節(jié)動(dòng)作結(jié)束后的對(duì)齊程度來給予不同的獎(jiǎng)勵(lì)值,其中,未對(duì)齊程度值的定義為:,未對(duì)齊程度值 d越小則代表當(dāng)前機(jī)械手對(duì)齊程度較高,反之未對(duì)齊程度值 d越大則代表當(dāng)前對(duì)齊程度越低。
22、作為本專利技術(shù)的一種實(shí)施方式,所述將所述目標(biāo)物體的位置狀態(tài)信息輸入至所述td3強(qiáng)化學(xué)習(xí)算法中,輸出一組角度值,包括:
23、在 t時(shí)刻:
24、智能體接收上層機(jī)械手抓握手勢(shì)選擇步驟輸出的 t時(shí)刻的目標(biāo)物體的位置狀態(tài)信息作為環(huán)境狀態(tài);
25、將環(huán)境狀態(tài)輸入至智能體中的策略網(wǎng)絡(luò)進(jìn)行決策,通過策略網(wǎng)絡(luò)輸出兩個(gè)腕部關(guān)節(jié)動(dòng)作角度作為動(dòng)作。
26、作為本專利技術(shù)的一種實(shí)施方式,所述基于機(jī)械手抓握手勢(shì)和機(jī)械手腕部關(guān)節(jié)動(dòng)作角度實(shí)現(xiàn)機(jī)械手對(duì)目標(biāo)物體的抓握對(duì)齊后,包括:
27、機(jī)械手腕部關(guān)節(jié)電機(jī)執(zhí)行動(dòng)作,執(zhí)行完成后,時(shí)刻變?yōu)? t+1時(shí)刻;
28、在 t+1時(shí)刻時(shí):
29、智能體接收上層機(jī)械手抓握手勢(shì)選擇步驟輸出的 t+1時(shí)刻的目標(biāo)物體的位置狀態(tài)信息作為環(huán)境狀態(tài);
30、將環(huán)境狀態(tài)代入預(yù)設(shè)獎(jiǎng)勵(lì)函數(shù),獲取動(dòng)作的獎(jiǎng)勵(lì)值;
31、將四元組樣本數(shù)據(jù)存入樣本數(shù)據(jù)池。
32、作為本專利技術(shù)的一種實(shí)施方式,所述下層td3強(qiáng)化學(xué)習(xí)算法中包含六個(gè)網(wǎng)絡(luò):兩個(gè)價(jià)值網(wǎng)絡(luò),兩個(gè)目標(biāo)價(jià)值網(wǎng)絡(luò),一個(gè)策略網(wǎng)絡(luò)和一個(gè)目標(biāo)策略網(wǎng)絡(luò);
33、所述td3強(qiáng)化學(xué)習(xí)算法的訓(xùn)練過程,包括:
34、從樣本數(shù)據(jù)池中抽取一批四元組樣本數(shù)據(jù);
35、,其中向量的每個(gè)元素都獨(dú)立從截?cái)嗾龖B(tài)分布中抽取,下標(biāo)now表示神經(jīng)網(wǎng)絡(luò)當(dāng)前參數(shù);
36、使用兩個(gè)目標(biāo)價(jià)值網(wǎng)絡(luò)進(jìn)行預(yù)測(cè):
37、;
38、;
39、計(jì)算td目標(biāo):
40、;
41、使用兩個(gè)價(jià)值網(wǎng)絡(luò)進(jìn)行預(yù)測(cè):
42、;
43、;
44、計(jì)算td誤差:
45、;
46、;
47、更新上述兩個(gè)價(jià)值網(wǎng)絡(luò):
48、;
49、;
50、每隔 k輪更新一次策略網(wǎng)絡(luò)和目標(biāo)網(wǎng)絡(luò)參數(shù):
51、使用策略網(wǎng)絡(luò)做預(yù)測(cè):,然后更新策略網(wǎng)絡(luò):
52、;
53、更新目標(biāo)網(wǎng)絡(luò)參數(shù):
54、;
55、;
56、;<本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種機(jī)械手抓握對(duì)齊方法,其特征在于,包括:上層機(jī)械手抓握手勢(shì)選擇步驟以及下層機(jī)械手腕部關(guān)節(jié)抓握對(duì)齊步驟;其中:
2.根據(jù)權(quán)利要求1所述的機(jī)械手抓握對(duì)齊方法,其特征在于,所述獲取并基于目標(biāo)物體的圖片提取目標(biāo)物體的輪廓,包括:
3.根據(jù)權(quán)利要求1所述的機(jī)械手抓握對(duì)齊方法,其特征在于,所述根據(jù)目標(biāo)物體的輪廓計(jì)算目標(biāo)物體的位置狀態(tài)信息和形狀,包括:
4.根據(jù)權(quán)利要求1所述的機(jī)械手抓握對(duì)齊方法,其特征在于,所述將目標(biāo)物體的位置狀態(tài)信息作為預(yù)設(shè)強(qiáng)化學(xué)習(xí)算法的狀態(tài)空間,輸出機(jī)械手腕部關(guān)節(jié)動(dòng)作角度,包括:
5.根據(jù)權(quán)利要求4所述的機(jī)械手抓握對(duì)齊方法,其特征在于,所述TD3強(qiáng)化學(xué)習(xí)算法的獎(jiǎng)勵(lì)函數(shù)設(shè)置為根據(jù)機(jī)械手腕部關(guān)節(jié)動(dòng)作結(jié)束后的對(duì)齊程度來給予不同的獎(jiǎng)勵(lì)值,其中,未對(duì)齊程度值的定義為:,未對(duì)齊程度值d越小則代表當(dāng)前機(jī)械手對(duì)齊程度較高,反之未對(duì)齊程度值d越大則代表當(dāng)前對(duì)齊程度越低。
6.根據(jù)權(quán)利要求4所述的機(jī)械手抓握對(duì)齊方法,其特征在于,所述將所述目標(biāo)物體的位置狀態(tài)信息輸入至所述TD3強(qiáng)化學(xué)習(xí)算法中,輸出一組角度值,包括:
8.根據(jù)權(quán)利要求4所述的機(jī)械手抓握對(duì)齊方法,其特征在于,所述TD3強(qiáng)化學(xué)習(xí)算法中包含六個(gè)網(wǎng)絡(luò):兩個(gè)價(jià)值網(wǎng)絡(luò),兩個(gè)目標(biāo)價(jià)值網(wǎng)絡(luò),一個(gè)策略網(wǎng)絡(luò)和一個(gè)目標(biāo)策略網(wǎng)絡(luò);
9.一種機(jī)械手抓握對(duì)齊系統(tǒng),其特征在于,包括:上層機(jī)械手抓握手勢(shì)選擇單元、下層機(jī)械手腕部關(guān)節(jié)抓握對(duì)齊單元和執(zhí)行單元;其中:
10.一種可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行如權(quán)利要求1-8任一項(xiàng)所述的機(jī)械手抓握對(duì)齊方法的步驟。
...【技術(shù)特征摘要】
1.一種機(jī)械手抓握對(duì)齊方法,其特征在于,包括:上層機(jī)械手抓握手勢(shì)選擇步驟以及下層機(jī)械手腕部關(guān)節(jié)抓握對(duì)齊步驟;其中:
2.根據(jù)權(quán)利要求1所述的機(jī)械手抓握對(duì)齊方法,其特征在于,所述獲取并基于目標(biāo)物體的圖片提取目標(biāo)物體的輪廓,包括:
3.根據(jù)權(quán)利要求1所述的機(jī)械手抓握對(duì)齊方法,其特征在于,所述根據(jù)目標(biāo)物體的輪廓計(jì)算目標(biāo)物體的位置狀態(tài)信息和形狀,包括:
4.根據(jù)權(quán)利要求1所述的機(jī)械手抓握對(duì)齊方法,其特征在于,所述將目標(biāo)物體的位置狀態(tài)信息作為預(yù)設(shè)強(qiáng)化學(xué)習(xí)算法的狀態(tài)空間,輸出機(jī)械手腕部關(guān)節(jié)動(dòng)作角度,包括:
5.根據(jù)權(quán)利要求4所述的機(jī)械手抓握對(duì)齊方法,其特征在于,所述td3強(qiáng)化學(xué)習(xí)算法的獎(jiǎng)勵(lì)函數(shù)設(shè)置為根據(jù)機(jī)械手腕部關(guān)節(jié)動(dòng)作結(jié)束后的對(duì)齊程度來給予不同的獎(jiǎng)勵(lì)值,其中,未對(duì)齊程度值的定義為:,未對(duì)齊程度值d越小則代表當(dāng)前機(jī)械手對(duì)齊程度較高,反之未對(duì)齊程度值d越大則...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:湯奇榮,余明達(dá),汪遠(yuǎn)翔,馬保平,余敏,林榮富,
申請(qǐng)(專利權(quán))人:同濟(jì)大學(xué),
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。