NVIDIA 機器人技術和仿真研究人員在 2022 年機器人技術:科學與系統( RSS )會議上介紹了 工廠:機器人裝配的快速接觸 。這項工作是機器人研究中普遍存在的接觸豐富交互的模擬和學習方面的一個新突破。其目的是大大加快機器人裝配的研究和開發,并作為一個強大的工具,用于任何類型的接觸豐富的仿真。
機器人裝配:什么、為什么和挑戰
裝配在汽車、航空航天、電子和醫療行業中至關重要。示例包括擰緊螺母和螺栓、焊接、插銷和電纜布線。
然而,機器人裝配仍然是機器人技術中最古老、最具挑戰性的任務之一。由于物理復雜性、高可靠性、零件可變性和高精度要求,自動化變得異常困難。
在工業中,機器人裝配方法可能實現高精度、高精度和高可靠性,但通常需要昂貴的設備和定制夾具,這些設備和夾具的設置和維護非常耗時(例如,預編程軌跡和仔細調整)。涉及對變化(零件類型、外觀和位置)魯棒性和復雜操作的任務通常使用人工完成。
研究方法可以實現更低的成本、更高的自適應性和更好的魯棒性,但通常可靠性較低,速度較慢。
仿真:解決機器人裝配挑戰的工具
幾十年來,仿真一直用于驗證、驗證和優化機器人設計和算法。這包括確保部署這些算法的安全性。它還被用于生成用于深度學習的大規模數據集,執行系統識別,以及開發規劃和控制方法。
在強化學習( RL )研究中,我們最近看到了如何將仿真結果轉移到真實系統。精確的物理模擬對于機器人發展的重要性無論怎樣強調都不為過。
基于物理的模擬器,如 MuJoCo 和 NVIDIA ISAAC Gym 已用于訓練虛擬代理執行操作和移動任務,例如求解魔方或使用 ANYmal 在不平坦地形上行走。這些政策已經成功地轉移到現實世界的機器人上。
然而,快速準確的模擬器的能力并沒有對機器人裝配產生實質性影響。為具有不同變化和運動的復雜物體開發此類模擬器是一項困難的任務。
例如,一個簡單的螺母和螺栓組件需要的不僅僅是純螺旋運動。螺母和螺栓的螺紋之間有有限間隙,允許螺母以六個自由度移動。即使是人類也需要一定程度的小心,以確保螺母與螺栓具有適當的初始對準,并且在擰緊過程中不會卡住。
然而,用傳統方法模擬任務可能需要使用數萬個三角形的網格。檢測這些網格之間的碰撞、生成接觸點和法線以及求解非穿透約束是主要的計算挑戰。
盡管世界上有大量的螺紋緊固件,但沒有任何現有的機器人模擬器能夠以與基本物理動力學相同的速率實時模擬單個螺母和螺栓組件。
在工廠里,研究人員開發了一些方法來克服機器人裝配和其他接觸豐富的交互中的挑戰。
什么是工廠?
Factory (機器人裝配的快速接觸)是一套物理模擬方法和機器人學習工具,用于實現廣泛接觸豐富交互的實時和快速模擬。工廠應用之一是機器人裝配。
工廠提供以下核心貢獻:
一套 methods ,用于通過基于 GPU 的符號距離函數( SDF )碰撞合成、接觸減少和高斯 – 賽德爾解算器,快速、準確地物理模擬富含接觸的相互作用。
機器人學習套件 包括:
60 項高質量資產,包括一臺 Franka 機器人和 NIST 裝配任務委員會 1 的所有剛體裝配, NIST 裝配任務委員會 1 是機器人裝配的既定基準
用于機器人裝配的三種 ISAAC 健身房式學習環境
七種經典機器人控制器
概念驗證強化學習策略 用于執行接觸豐富任務的機器人(模擬 Franka 機器人在 NIST 板、螺母和螺栓組件上解決最多接觸豐富任務)
工廠論文中的物理模擬方法已集成到 ISAAC Gym 使用的 PhysX 物理引擎中。最新版本的 ISAAC Gym 和 ISAAC Gym 環境 GitHub 回購。 Omniverse ISAAC Sim 模擬器中也提供了模擬方法,今年夏天晚些時候將提供強化學習示例。
模擬方法和結果
使用基于 GPU 的物體 SDF 碰撞快速實現、用于減少 SDF 碰撞接觸的接觸減少算法和自定義數值求解器,研究人員不僅能夠實時模擬單個 M16 螺母和螺栓,而且能夠在并行環境中實時模擬 1024 個。這基本上比現有技術快 200000 倍。
研究人員演示了模擬器在各種具有挑戰性的場景中的性能,包括以下場景:
512 個碗在同一環境中落成一堆
一堆螺母被送入進料器機構,以 60 Hz 的頻率振動
Franka 機器人執行手動腳本軌跡以抓取螺母并將其擰緊到螺栓上,該環境的 128 個實例實時執行
機器人學習工具
機器人裝配最為成熟的基準是 NIST 裝配任務委員會 ,自 2017 年以來,這是年度機器人競賽的焦點。 NIST 任務委員會 1 由 38 個獨特部分組成。然而,由于缺乏真實的間隙、零件之間的干涉、手動測量等,所提供的 CAD 模型并不適合物理模擬。現實的模型很難找到。
工廠使用 60 個高質量、模擬就緒的零件模型,每個模型具有一個 Onshape CAD 模型、一個或多個 OBJ 網格、 URDF 描述和符合國際標準( ISO 724 、 ISO 965 和 ISO 286 )或基于制造商提供的模型的估計材料特性。這些模型包括 NIST 裝配任務委員會 1 上的所有零件,其尺寸變化跨越真實世界的公差帶。零件之間的間隙范圍從 0 到最大 2.66 mm ,許多零件在 0.1-0.5 mm 范圍內。
工廠為 ISAAC 健身房提供了三個機器人裝配場景,可用于開發規劃和控制算法、收集模擬傳感器數據以進行監督學習以及訓練 RL 代理。每個場景都包含一個 Franka 機器人和 NIST 任務板 1 中分解的組件。
資產可以在所有環境中的類型和位置上隨機化。所有場景都在 NVIDIA RTX 3090 GPU 上進行了多達 128 個同時環境的測試。場景如下:
學習環境中可用的七個機器人控制器包括關節空間逆微分運動學( IK )運動控制器、關節空間逆動力學( ID )控制器、任務空間阻抗控制器、操作空間運動控制器、開環力控制器、閉環比例力控制器和混合力運動控制器。
研究人員希望模型、環境和控制器隨著他們和社區的貢獻而不斷增長。
概念驗證 RL 政策
工廠采用 GPU 加速策略 RL 來解決 NIST 任務板 1 上接觸最多的任務:將螺母組裝到螺栓上。像許多裝配任務一樣,這樣的過程是一個漫長的過程,并且很難進行端到端的學習。問題分為三個階段:
拾取:機器人從工作表面上的隨機位置用平行鉗口抓取螺母。
位置:機器人將螺母運輸到固定在表面的螺栓頂部。
螺釘:機器人使螺母與螺栓接觸,嚙合配合螺紋,并擰緊螺母,直到其接觸螺栓頭的底座。
培訓在單個 GPU 上完成。對對象的初始位置和方向應用大隨機性,同時使用近端策略優化( PPO )訓練一批 3-4 個策略。每個批次需要 1-1.5 小時的訓練,每個子策略在 128 多個環境中進行訓練,最多 1024 個策略更新用于快速實驗。試驗時的成功率為 98.4% 。
最后,為了評估模擬到真實傳輸的潛力(將在模擬中學習到的策略傳輸到真實世界的機器人系統),研究人員將在模擬中這些交互過程中產生的接觸力與在真實世界中使用扳手執行相同任務的人測得的接觸力進行了比較。有關更多信息,請參閱 R-PAL 日常交互操作( DIM )數據集 。
下圖顯示,模擬緊固螺母的直方圖位于真實緊固螺母直方圖的中間,這表明與真實值具有很強的一致性。
圖 螺釘子策略執行期間的模擬接觸力與 每日交互式操作( DIM )數據集 中的模擬真實接觸力的比較
結論和未來方向
雖然 Factory 開發時將機器人裝配作為一種激勵應用,但在機器人內使用這些方法執行完全不同的任務沒有限制,例如在家庭環境中抓取復雜的非凸形狀,在不平坦的室外地形上移動,以及對物體集合進行不可抓取的操作。
這項工作的未來方向是實現復雜物理交互的完整端到端仿真,包括有效地將訓練好的策略轉移到真實機器人系統的技術。這可能會將成本和風險降至最低,提高安全性,并實現高效行為。
有朝一日,每一個先進的工業制造機器人都可能會使用這些技術進行模擬訓練,以便無縫地轉移到現實世界中。
為此, NVIDIA 開發人員正在努力完善工廠研究所使用的物理模擬方法,以便可以在 Omniverse ISAAC Sim 中使用。有限的功能已經存在,并將隨著時間的推移變得更加強大。
關于作者:
Oyindamola Omotuyi 是 NVIDIA 的產品營銷經理實習生,專注于機器人開發社區。在之前的 NVIDIA 實習期間,她撰寫了 NVIDIA 對話 AI 電子書的介紹。 Oyindamola Omotuyi 擁有尼日利亞拉各斯大學系統工程學士學位和辛辛那提大學機械工程碩士學位。她目前正在辛辛那提大學攻讀博士學位,專注于多智能體深度強化學習和機器人感知。
審核編輯:郭婷
-
機器人
+關注
關注
210文章
28231瀏覽量
206618 -
NVIDIA
+關注
關注
14文章
4949瀏覽量
102828
發布評論請先 登錄
相關推薦
評論