衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

教機器用計算機視覺閱讀樂高手冊

星星科技指導員 ? 來源:NVIDIA ? 作者:Michelle Horton ? 2022-10-11 09:22 ? 次閱讀

樂高愛好者抓撓他們的頭,閱讀組裝說明,可能很快有助于復雜的建設,感謝一個新的 學習 來自斯坦福大學、麻省理工學院和 Autodesk 。研究人員設計了一個深度學習框架,將 2D 手冊翻譯成機器可以理解的步驟,以構建 3D 樂高套件。這項工作可以推動專注于制造機器的研究,幫助人們組裝物體。

“樂高手冊提供了一個獨立的環境,展示了人類的一項核心技能:在指導下學習完成任務。利用視覺場景解析和程序合成的最新進展,我們旨在構建具有類似技能的機器,從樂高開始,最終以現實世界場景為目標,”該研究資深作者吳家軍說,斯坦福大學計算機科學助理教授。

研究人員表示,用人工智能翻譯 2D 手冊面臨兩大挑戰。首先, AI 必須基于 2D 手動圖像在每個裝配步驟中學習和理解 3D 形狀之間的對應關系。這包括考慮工件的方向和對齊。

它還必須能夠對磚塊進行分類,并在半組裝模型中推斷出磚塊的三維姿態。作為樂高積木制作過程的一部分,小部件被組合成更大的部件,如吉他的頭部、頸部和身體。當這些較大的部分組合在一起時,將創建一個完整的項目。這增加了難度,因為機器必須解析出所有的樂高積木,甚至是那些可能不可見的積木,如樂高釘和反積木。

該團隊致力于創建一個模型,該模型可以將 2D 手冊轉化為機器可執行計劃,以構建定義的對象。雖然目前有兩種執行此任務的方法:基于搜索的方法和基于學習的方法,但都存在局限性。

基于搜索的方法尋找工件和手動圖像的可能三維姿態,尋找正確的姿態。該方法計算量大,速度慢,但精度高。

基于學習的模型依賴于神經網絡來預測部件的 3D 姿態。它們速度快,但精度不高,尤其是在使用看不見的 3D 形狀時。

為了解決這一局限性,研究人員開發了手冊到可執行計劃網絡 ( MEPNet ) ,根據研究,它使用深度學習和 計算機視覺 集成“神經 2D 關鍵點檢測模塊和 2D-3D 投影算法

??根據一系列預測,在每一步,模型都會閱讀手冊,定位要添加的零件,并推導出 3D 定位。在模型預測了每一塊和每一步的姿勢后,它可以從頭開始解析手冊,創建一個機器人可以遵循的建筑計劃來建造樂高對象。

研究人員在研究中寫道:“對于每個步驟,輸入包括 1 )一組在之前的步驟中構建的原始磚塊和零件,以 3D 表示; 2 )一個顯示組件應如何連接的目標 2D 圖像。預期輸出是該步驟中涉及的所有組件的(相對)姿態。”。

他們從一個包含 72 種磚塊的樂高工具包中創建了第一個合成訓練數據,并使用了來自 LPub3D ,一個用于“創建樂高風格的數字建筑說明”的開源應用程序

研究人員總共生成了 8000 份培訓手冊,其中 10 套用于驗證, 20 套用于測試。每個數據集中有大約 200 個單獨的步驟,約占培訓中的 200000 個單獨步驟。

他們在研究中寫道:“我們在綜合生成的數據集上對 MEPNet 進行全面監控,在該數據集中,我們有基本真相關鍵點、掩碼和旋轉信息。”。 MEPNet 模型在四個點上訓練 5 天 NVIDIA Titan RTX GPU 由 NVIDIA 圖靈架構提供支持。

他們還在 Minecraft house 數據集上測試了該模型,該數據集具有與樂高類似的構建風格。

通過將 MEPNet 與現有模型進行比較,研究人員發現,它在現實世界的樂高積木、合成手冊和 Minecraft 示例中的表現優于其他模型。

MEPNet 在姿勢估計方面更準確,甚至在識別不可見片段的構建方面也更好。研究人員還發現,該模型能夠將從合成手冊中獲得的知識應用于現實世界的樂高手冊。

雖然還需要制造一個能夠執行計劃的機器人,但研究人員將這項工作視為一個起點。

“我們的長期目標是制造能夠幫助人類構造和組裝復雜物體的機器。我們正在考慮將我們的方法擴展到其他組裝領域,如宜家家具,”斯坦福大學計算機科學博士生王若成( Ruocheng Wang )說。

關于作者

Michelle Horton 是 NVIDIA 的高級開發人員通信經理,擁有通信經理和科學作家的背景。她在 NVIDIA 為開發者博客撰文,重點介紹了開發者使用 NVIDIA 技術的多種方式。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7540

    瀏覽量

    88649
  • AI
    AI
    +關注

    關注

    87

    文章

    31536

    瀏覽量

    270353
收藏 人收藏

    評論

    相關推薦

    【小白入門必看】一文讀懂深度學習計算機視覺技術及學習路線

    一、什么是計算機視覺計算機視覺,其實就是機器怎么像我們人一樣,用攝像頭看看周圍的世界,然后理
    的頭像 發表于 10-31 17:00 ?556次閱讀
    【小白入門必看】一文讀懂深度學習<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術及學習路線

    什么是機器視覺opencv?它有哪些優勢?

    機器視覺(Machine Vision)是一種利用計算機和圖像處理技術來模擬人類視覺系統的功能,實現對圖像的識別、分析和理解的技術。OpenCV(Open Source Compute
    的頭像 發表于 07-16 10:33 ?902次閱讀

    機器視覺計算機視覺有什么區別

    機器視覺計算機視覺是兩個密切相關但又有所區別的概念。 一、定義 機器視覺
    的頭像 發表于 07-16 10:23 ?630次閱讀

    計算機視覺機器視覺的區別與聯系

    隨著人工智能技術的飛速發展,計算機視覺機器視覺作為該領域的兩個重要分支,逐漸引起了廣泛關注。盡管兩者在名稱上有所相似,但實際上它們在定義、技術特點、應用領域以及發展前景等方面都存在著
    的頭像 發表于 07-10 18:24 ?1701次閱讀

    計算機視覺的工作原理和應用

    計算機視覺(Computer Vision,簡稱CV)是一門跨學科的研究領域,它利用計算機和數學算法來模擬人類視覺系統對圖像和視頻進行識別、理解、分析和處理。其核心目標在于使
    的頭像 發表于 07-10 18:24 ?2296次閱讀

    機器視覺計算機視覺的區別與聯系

    機器視覺計算機視覺是兩個密切相關但又有所區別的領域。 1. 引言 在當今科技迅猛發展的時代,機器人和
    的頭像 發表于 07-09 09:27 ?751次閱讀

    計算機視覺與人工智能的關系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個領域的知識。人工智能則是研究如
    的頭像 發表于 07-09 09:25 ?763次閱讀

    計算機視覺與智能感知是干嘛的

    引言 計算機視覺(Computer Vision)是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等
    的頭像 發表于 07-09 09:23 ?1089次閱讀

    計算機視覺機器視覺區別在哪

    ,旨在實現對圖像和視頻的自動分析和理解。 機器視覺 機器視覺計算機視覺的一個分支,主要應用于工
    的頭像 發表于 07-09 09:22 ?530次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有視覺
    的頭像 發表于 07-09 09:11 ?1421次閱讀

    機器視覺計算機視覺的區別

    在人工智能和自動化技術的快速發展中,機器視覺(Machine Vision, MV)和計算機視覺(Computer Vision, CV)作為兩個重要的分支領域,都扮演著至關重要的角色
    的頭像 發表于 06-06 17:24 ?1454次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學習、大數據等技術的快速發展,計算機
    的頭像 發表于 06-06 17:17 ?1128次閱讀

    【量子計算機重構未來 | 閱讀體驗】+ 初識量子計算機

    感覺量子技術神奇神秘,希望通過閱讀此書來認識量子計算機。 先瀏覽一下目錄: 通過目錄,基本可以確定這是一本關于量子計算機的科普書籍,主要包括什么是量子計算機、量子
    發表于 03-05 17:37

    【量子計算機重構未來 | 閱讀體驗】初探

    本帖最后由 oxlm_1 于 2024-3-4 23:24 編輯 非常感謝能有這次機會參與《量子計算機重構未來》這本書的試讀活動。當看到這本書的測評時,首先好奇的是,量子計算機能做什么,為此
    發表于 03-04 23:09

    計算機視覺的十大算法

    隨著科技的不斷發展,計算機視覺領域也取得了長足的進步。本文將介紹計算機視覺領域的十大算法,包括它們的基本原理、應用場景和優缺點。這些算法在圖像處理、目標檢測、人臉識別等領域有著廣泛的應
    的頭像 發表于 02-19 13:26 ?1363次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法
    捷豹百家乐官网娱乐城| 百家乐官网游戏平台有哪些哪家的口碑最好 | 聚龍社百家乐官网的玩法技巧和规则 | 大发888官方hgx2dafa888gwd | 大赢家百家乐官网的玩法技巧和规则 | 喜达百家乐的玩法技巧和规则| 赚钱的棋牌游戏| 百家乐官网牌机的破解法| 百家乐官网麻将筹码币镭射贴膜| 网址百家乐的玩法技巧和规则| 瑞丰国际娱乐场| 乐天堂百家乐官网娱乐| 斗地主百家乐的玩法技巧和规则 | 温州百家乐真人网| 大发888资讯| 线上百家乐官网攻略| 娱乐城百家乐送白菜| 百家乐筹码| 现场百家乐官网机| 威尼斯人娱乐场 28| 真人百家乐官网皇冠网| 百家乐视频游戏网站| 红桃k娱乐城备用网址| 斗地主百家乐官网的玩法技巧和规则 | 百家乐官网压分技巧| 做生意开店风水| 体育博彩概论| 恒利百家乐官网的玩法技巧和规则| 威尼斯人娱乐网代理注| 百家乐官网园小区户型图| 百家乐游戏网上投注| 莱西市| 网络百家乐投注| 巴林左旗| 百家乐积分| 百家乐官网玩法说明| 百家乐官网搏牌| 大发888娱乐城下载新澳博| 百家乐官网有赢钱公式吗| 百家乐任你博赌场娱乐网规则| 安图县|