新的 Project GR00T 工作流和 AI world model開發(fā)技術(shù)將提高機器人的靈巧性、控制性、操縱性和移動性。
NVIDIA 在本周于德國慕尼黑舉行的機器人學(xué)習(xí)大會(CoRL)上發(fā)布了全新 AI 和仿真工具以及工作流。機器人開發(fā)者可以使用這些工具和工作流,大大加快 AI 機器人(包括人形機器人)的開發(fā)工作。
此次發(fā)布的系列產(chǎn)品包括:NVIDIA Isaac Lab 機器人學(xué)習(xí)框架正式版;Project GR00T(一個為加速人形機器人發(fā)展的項目)的六個全新人形機器人學(xué)習(xí)工作流;以及用于視頻數(shù)據(jù)管理和處理的全新世界模型開發(fā)工具,包括用于視頻處理的NVIDIA Cosmos tokenizer和NVIDIA NeMo Curator。
開源 Cosmos tokenizer可將圖像和視頻分解為具有極高壓縮率的高質(zhì)量 token,為機器人開發(fā)者提供卓越的視覺標(biāo)記化功能。Cosmos tokenizer的運行速度最高可達到當(dāng)前標(biāo)記器的 12 倍,NeMo Curator 的視頻處理整理速度則最高可達到未優(yōu)化管線的 7 倍。
NVIDIA 在 CoRL 上還發(fā)布了 23 篇與機器人學(xué)習(xí)相關(guān)的論文,并舉辦了 9 場研討會,同時發(fā)布了面向開發(fā)者的培訓(xùn)和工作流指南。此外,Hugging Face 和 NVIDIA 還宣布,將共同使用 LeRobot、NVIDIA Isaac Lab和NVIDIA Jetson來加速開發(fā)者社區(qū)的開源機器人研究。
使用 Isaac Lab 加速機器人開發(fā)
NVIDIA Isaac Lab 是一個建立在NVIDIA Omniverse平臺上的開源機器人學(xué)習(xí)框架。NVIDIA Omniverse 是一個用于開發(fā)適用于工業(yè)數(shù)字化和物理 AI 仿真的 OpenUSD 應(yīng)用的平臺。
開發(fā)者可以使用 Isaac Lab 來大規(guī)模訓(xùn)練機器人策略。這個開源的統(tǒng)一機器人學(xué)習(xí)框架適用于從人形機器人到四足機器人和協(xié)作機器人等各種具身,能夠處理日益復(fù)雜的動作和交互。
全球領(lǐng)先的商用機器人制造商、機器人應(yīng)用開發(fā)商和機器人研究機構(gòu)都在使用 Isaac Lab,包括 1X、Agility Robotics、波士頓動力人工智能研究所、Berkeley Humanoid、波士頓動力公司、Field AI、傅利葉、銀河通用、Mentee Robotics、Skild AI、Swiss-Mile、宇樹科技和小鵬機器人。
Project GR00T:
通用人形機器人的基礎(chǔ)
制造先進的人形機器人非常困難,需要多層技術(shù)和跨學(xué)科方法,才能使機器人有效地感知、移動和學(xué)習(xí)技能,進而實現(xiàn)人與機器人以及機器人與環(huán)境的交互。
Project GR00T旨在通過開發(fā)加速庫、基礎(chǔ)模型和數(shù)據(jù)管線,加速全球人形機器人開發(fā)者生態(tài)的發(fā)展。
這六個全新 Project GR00T 工作流為人形機器人開發(fā)者提供了實現(xiàn)最具挑戰(zhàn)性的人形機器人功能的藍圖:
GR00T-Gen用于構(gòu)建基于 OpenUSD 的生成式 AI 3D 環(huán)境
GR00T-Mimic用于生成機器人運動和軌跡
GR00T-Dexterity用于機器人靈巧操作
GR00T-Control用于全身控制
GR00T-Mobility用于機器人運動和導(dǎo)航
GR00T-Perception用于多模態(tài)感知
NVIDIA 具身 AI 高級研究經(jīng)理 Jim Fan 表示:“人形機器人是具身 AI 的下一輪浪潮。NVIDIA 的研究和工程團隊正在與整個公司內(nèi)部和我們的開發(fā)者生態(tài)合作構(gòu)建 Project GR00T,以幫助推動全球人形機器人開發(fā)者的進步和發(fā)展。”
世界模型構(gòu)建者的新開發(fā)工具
如今,機器人開發(fā)者正在構(gòu)建世界模型。這種用 AI 呈現(xiàn)世界的方式可以預(yù)測物體和環(huán)境對機器人行動的反應(yīng)。構(gòu)建這些世界模型需要大量計算和數(shù)據(jù),這些模型需要數(shù)千小時的經(jīng)過整理的真實世界圖像或視頻數(shù)據(jù)。
NVIDIA Cosmos tokenizer 提供高效、優(yōu)質(zhì)的編碼和解碼能力,能夠簡化這些世界模型的開發(fā)。它們樹立了最小失真和時間不穩(wěn)定性的新標(biāo)準(zhǔn),實現(xiàn)了高質(zhì)量的視頻和圖像重建。
Cosmos tokenizer 提供了高質(zhì)量壓縮和最高達 12 倍的視覺重構(gòu)速度,為在廣泛的視覺域開發(fā)可擴展、強大且高效的生成應(yīng)用創(chuàng)造了條件。
人形機器人公司 1X 已更新了 1X 世界模型挑戰(zhàn)賽數(shù)據(jù)集,以便使用 Cosmos tokenizer。
1X Technologies AI 副總裁 Eric Jang 表示:“NVIDIA Cosmos tokenizer 在保持視覺保真度的同時,實現(xiàn)了對我們數(shù)據(jù)的高度時空壓縮。這讓我們能夠以更高效的計算方式,來使用長視距視頻生成技術(shù)去訓(xùn)練世界模型。”
包括小鵬機器人和 Hillbot 在內(nèi)的其他人形機器人和通用機器人開發(fā)商正在其開發(fā)過程中使用 NVIDIA Cosmos tokenizer,以管理高分辨率圖像和視頻。
NeMo Curator 現(xiàn)在加入了一個視頻處理管線,這使機器人開發(fā)者能夠通過處理大規(guī)模文本、圖像和視頻數(shù)據(jù),來提高其世界模型的準(zhǔn)確性。
由于視頻數(shù)據(jù)的規(guī)模龐大,需要可擴展的管線和跨 GPU 負(fù)載平衡的高效編排,這給視頻數(shù)據(jù)管理帶來了挑戰(zhàn)。此外,還需要對過濾、字幕生成和嵌入模型進行優(yōu)化,才能最大程度地提高吞吐量。
NeMo Curator 通過自動管線編排來簡化數(shù)據(jù)整理工作,顯著縮短了處理時間,從而克服了這些挑戰(zhàn)。NeMo Curator 支持跨多節(jié)點、多 GPU 系統(tǒng)的線性擴展,可高效處理 100 PB 以上的數(shù)據(jù),這簡化了 AI 開發(fā),降低了成本,加快了產(chǎn)品的上市時間。
在 CoRL 上
推進機器人學(xué)習(xí)社區(qū)的發(fā)展
NVIDIA 機器人團隊與 CoRL 共同發(fā)布的近二十篇研究論文涵蓋了以下領(lǐng)域的突破性成果:集成 VLM 來優(yōu)化環(huán)境理解和任務(wù)執(zhí)行、機器人時間導(dǎo)航、為復(fù)雜的多步驟任務(wù)制定長視距規(guī)劃策略,以及利用人類演示來習(xí)得技能。
有關(guān)人形機器人控制和合成數(shù)據(jù)生成的突破性論文包括:SkillGen(一個基于合成數(shù)據(jù)生成的系統(tǒng),用于在人工演示極少的情況下訓(xùn)練機器人)和 HOVER(一個用于控制人形機器人運動和操作的機器人基礎(chǔ)模型)。
NVIDIA 研究人員還參加了本屆大會的九場研討會。進一步了解有關(guān)活動的完整日程安排:
供貨情況
NVIDIA Isaac Lab 1.2 現(xiàn)已在 GitHub 上開源可用。NVIDIA Cosmos tokenizer現(xiàn)已在 GitHub 和 Hugging Face 上開源。用于視頻處理的 NeMo Curator 將于本月底發(fā)布。
新的 NVIDIA Project GR00T 工作流即將推出,以幫助機器人公司更加輕松地構(gòu)建人形機器人功能。
學(xué)習(xí)使用 Isaac Lab 的研究人員和開發(fā)者現(xiàn)可以訪問開發(fā)者指南和教程,包括 Isaac Gym 到 Isaac Lab 的遷移指南。
在即將于 11 月 13 日舉行的關(guān)于機器人仿真和學(xué)習(xí)的 OpenUSD 內(nèi)部直播中了解機器人學(xué)習(xí)和仿真的最新進展.。
-
機器人
+關(guān)注
關(guān)注
210文章
28231瀏覽量
206614 -
NVIDIA
+關(guān)注
關(guān)注
14文章
4949瀏覽量
102826 -
仿真
+關(guān)注
關(guān)注
50文章
4048瀏覽量
133431
原文標(biāo)題:NVIDIA 利用 AI 和仿真工具推動機器人學(xué)習(xí)和人形機器人開發(fā)
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論