(文章來源:教育新聞網(wǎng))
谷歌和加州大學(xué)伯克利分校的研究人員在本周在預(yù)印本服務(wù)器Arxiv.org上發(fā)表的兩篇論文中描述了新的AI和機(jī)器學(xué)習(xí)技術(shù),這些技術(shù)使機(jī)器人能夠適應(yīng)從未見過的任務(wù)并抓住被遮擋的物體。第一項研究詳細(xì)介紹了X射線,該算法在部署到機(jī)器人上時可以搜索對象的堆以掌握目標(biāo)對象,而第二項研究則提出了一種策略適應(yīng)技術(shù),可以“教”機(jī)器人技能,而無需從頭開始進(jìn)行模型訓(xùn)練。
抓機(jī)器人是一個非常困難的挑戰(zhàn)。例如,機(jī)器人努力執(zhí)行所謂的“機(jī)械搜索”,即當(dāng)他們不得不從一堆其他對象中識別并拾取一個對象時。大多數(shù)機(jī)器人不是特別適應(yīng)性強(qiáng),并且缺乏足夠功能強(qiáng)大的AI模型來指導(dǎo)機(jī)械手進(jìn)行機(jī)械搜索。X射線和策略調(diào)整步驟可以構(gòu)成產(chǎn)品包裝系統(tǒng)的基礎(chǔ),該產(chǎn)品包裝系統(tǒng)可以在無需人工監(jiān)督的情況下發(fā)現(xiàn),拾取和放下各種物體。
有關(guān)X射線的研究的合著者指出,由于缺乏合適的模型,機(jī)械搜索(在大量對象中找到對象)仍然具有挑戰(zhàn)性。X射線結(jié)合了遮擋推斷和假設(shè)預(yù)測來解決該問題,它可用來估計與對象最相似的邊界框(對象周圍矩形邊框的坐標(biāo))的占用率分布,同時考慮各種平移和旋轉(zhuǎn)。
X-Ray假定堆中至少有一個完全或部分被未知對象遮擋的目標(biāo)對象,并且每個時間步最多可以抓取一個對象。以RGB圖像和目標(biāo)對象為輸入,它可以預(yù)測場景的占用率分布和分割蒙版,并計算幾種潛在的抓握動作,以最高的成功概率執(zhí)行該動作。為了訓(xùn)練和驗證X射線,研究人員生成了10,000個增強(qiáng)深度圖像的語料庫,這些圖像標(biāo)記有矩形框目標(biāo)對象的對象占用分布。他們從Thingiverse上的1296個3D CAD模型的開放源數(shù)據(jù)集中進(jìn)行采樣,選擇了10個大小相同,體積較小但厚度較小的盒子目標(biāo),因此它們更有可能被遮擋。這使他們總共獲得了100,000張圖像。
在這10,000張圖片中,約有8,000張被保留用于培訓(xùn),其余的則留作測試。使用一千個包含模擬對象(蓋子,多米諾骨牌和長笛)的其他圖像來評估X射線對看不見的形狀,對象,長寬比和比例尺的概括。在涉及帶有吸盤和平行顎式抓爪的真實ABB YuMi機(jī)器人的物理實驗中,研究人員要求X射線將物體裝滿垃圾箱,然后將垃圾箱傾倒在目標(biāo)物體的頂部。在最初包含25個對象的堆中,系統(tǒng)在20次試驗中以5個動作的中位數(shù)提取了目標(biāo)對象,成功率為100%。
合著者將精力放在未來的工作上,以提高X射線的訓(xùn)練效率,并分析數(shù)據(jù)集大小以及用于生成訓(xùn)練分布的平移和旋轉(zhuǎn)次數(shù)的影響。他們還計劃根據(jù)目標(biāo)對象可見性的獎勵來探索強(qiáng)化學(xué)習(xí)策略。
在這兩篇論文的最新文章中,合著者試圖開發(fā)一種能夠不斷適應(yīng)新的現(xiàn)實環(huán)境,物體和條件的系統(tǒng)。與大多數(shù)機(jī)器人相反,后者僅需訓(xùn)練一次即可部署,而適應(yīng)能力卻很少。研究人員對機(jī)器學(xué)習(xí)模型進(jìn)行了預(yù)訓(xùn)練,以在608,000次嘗試抓取的語料庫中抓取一系列對象,然后他們執(zhí)行的任務(wù)是使用向其起始位置右移10厘米的抓手抓取對象。系統(tǒng)練習(xí)了一段時間(經(jīng)過800次嘗試)并將這些嘗試記錄到新數(shù)據(jù)集(目標(biāo)數(shù)據(jù)集)中之后,新嘗試在50%的時間內(nèi)與原始數(shù)據(jù)集進(jìn)行了混合,調(diào)整模型。
在五個不同的場景中重復(fù)了這些步驟-預(yù)訓(xùn)練,嘗試新任務(wù)和微調(diào)。一方面,刺眼的光線阻礙了機(jī)器人的攝像頭。在另一種情況下,棋盤圖案的背景使模型難以識別對象。最后,實驗人員讓機(jī)器人抓住訓(xùn)練中看不到的透明瓶子(眾所周知,透明物體很難抓住機(jī)器人,因為它們有時會混淆深度傳感器),并撿拾坐在高反射金屬板上的物體。
研究人員報告說,在實驗中,該模型成功地在苛刻的燈光下63%的時間,透明瓶子的74%的時間,棋盤墊板的時間的86%的時間,抓手?jǐn)U展的88%的時間成功地捕獲了物體,和91%的時間使用偏置夾持器。而且,他們說,機(jī)器人適應(yīng)新情況只需要花費(fèi)1-4個小時的練習(xí)時間(相比之下,學(xué)習(xí)如何掌握的時間大約為6,000個小時),并且性能不會隨著所適應(yīng)的模型而降低。
(責(zé)任編輯:fqj)
-
谷歌
+關(guān)注
關(guān)注
27文章
6195瀏覽量
106016 -
AI
+關(guān)注
關(guān)注
87文章
31520瀏覽量
270335
發(fā)布評論請先 登錄
相關(guān)推薦
構(gòu)建人形機(jī)器人學(xué)習(xí)的合成運(yùn)動生成管線
![構(gòu)建人形<b class='flag-5'>機(jī)器人學(xué)</b>習(xí)的合成運(yùn)動生成管線](https://file1.elecfans.com/web3/M00/06/2B/wKgZPGeIdgOAHo0UAAARx11NzcQ599.png)
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗】1.初步理解具身智能
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗】+初品的體驗
NVIDIA通過加速AWS上的機(jī)器人仿真推進(jìn)物理AI的發(fā)展
名單公布!【書籍評測活動NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下一個浪潮!
NVIDIA發(fā)布全新AI和仿真工具以及工作流
麻省理工學(xué)院推出新型機(jī)器人訓(xùn)練模型
機(jī)器人的三大矩陣是什么及關(guān)系式
“卷不動了”?OTA來救場!智能機(jī)器人“永葆青春”的秘訣
![“卷不動了”?OTA來救場!智能<b class='flag-5'>機(jī)器人</b>“永葆青春”的秘訣](https://file1.elecfans.com//web2/M00/00/CA/wKgZomax2GmAL1OUAAH1U9jWD90366.png)
Al大模型機(jī)器人
NVIDIA Isaac 機(jī)器人平臺利用最新的生成式 AI 和先進(jìn)的仿真技術(shù),加速 AI 機(jī)器人技術(shù)的發(fā)展
![NVIDIA Isaac <b class='flag-5'>機(jī)器人</b>平臺利用最新的生成式 <b class='flag-5'>AI</b> 和先進(jìn)的仿真技術(shù),加速 <b class='flag-5'>AI</b> <b class='flag-5'>機(jī)器人</b>技術(shù)的發(fā)展](https://file1.elecfans.com//web2/M00/EC/89/wKgaomZe5cOAJ4oaAABqKAD4BXg456.png)
使用NVIDIA Isaac Manipulator生成抓取姿勢和機(jī)器人運(yùn)動
![使用NVIDIA Isaac Manipulator生成抓取姿勢和<b class='flag-5'>機(jī)器人</b>運(yùn)動](https://file1.elecfans.com/web2/M00/E7/3B/wKgaomZGwpiAUj33AAAPHdYGBVc223.gif)
NVIDIA Isaac機(jī)器人平臺升級,加速AI機(jī)器人技術(shù)革新
機(jī)器人學(xué)習(xí)中主流智能抓取方案
![<b class='flag-5'>機(jī)器人學(xué)</b>習(xí)中主流智能抓取方案](https://file1.elecfans.com/web2/M00/C4/16/wKgZomXxC8mAJlTaAAA5NgxRuWM161.png)
評論