精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

伯克利那個會“18般武藝”的DeepMimic模型開源了!

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-10-19 09:06 ? 次閱讀

還記得今年4月伯克利BAIR實驗室發布的那個會“18般武藝”的DeepMimic模型嗎?他們使用強化學習技術,用動作捕捉片段訓練模型,教會了AI智能體完成24種動作,走路、跑步就不用說了,還包括翻跟斗、側翻跳、投球、高踢腿等等高能動作。

體會一下:

回旋踢

跑步

投球

訓練每一種動作都需要動作捕捉和深度強化學習,而BAIR的研究者創造了一個全新的系統,教會agent完成復雜、逼真的動作任務。

作者Xue Bin Peng等人將這個系統命名為DeepMimic,比已有工作更進一步的是,他們的目標是在訓練一個agent完成特定任務的前提下,使它的動作更貼近真實。他們的論文發表在SIGGRAPH 2018。

除了人形機器人外,他們還訓練了Atlas機器人、暴龍、龍等形態的agent。

Atlas機器人

整個DeepMimic所需要的input分為三部分:一個被稱為Character的Agent模型;希望Agent學習的參考動作(reference motion);希望Agent完成的任務(task)所定義的reward function。

訓練之后會得到一個可以控制Agent同時滿足與參考動作相似且可以完成任務的控制器

四種翻滾動作

現在,DeepMimic的代碼、數據和訓練策略已經全部開源,感興趣的讀者不妨試試拿來訓練自己的“功夫小子”。

開源代碼

SIGGRAPH 2018論文:“DeepMimic: Example-Guided Deep Reinforcement Learning of Physics-Based Character Skills”的代碼。這個框架使用強化學習來訓練一個模擬人形智能體來模仿來自mocap數據的各種運動技能。

項目頁面:

https://xbpeng.github.io/projects/DeepMimic/index.html

C++:

Bullet 2.87 (https://github.com/bulletphysics/bullet3/releases)

Eigen (http://www.eigen.tuxfamily.org/index.php?title=Main_Page)

OpenGL >= 3.2

freeglut (http://freeglut.sourceforge.net/)

glew (http://glew.sourceforge.net/)

Python:

PyOpenGL (http://pyopengl.sourceforge.net/)

Tensorflow (https://www.tensorflow.org/)

MPI4Py (https://mpi4py.readthedocs.io/en/stable/install.html)

Misc:

SWIG (http://www.swig.org/)

MPI

Windows:https://docs.microsoft.com/en-us/message-passing-interface/microsoft-mpi

Linux:sudo apt install libopenmpi-dev

Build

模擬環境是用C++編寫的,python包裝器使用SWIG構建。要安裝python依賴項,請運行

pip install -r requirements.txt

請注意,必須在MPI4Py之前安裝MPI。

Windows

wrapper使用DeepMimicCore.sln構建。

1. 從配置管理器中選擇x64配置。

2. 在DeepMimicCore的項目屬性下,修改要包含的其他包含目錄

Bullet源目錄

Eigen包括目錄

python包含目錄

3. 修改要指定的其他庫目錄

Bullet lib目錄

python lib目錄

使用Release_Swig配置構建DeepMimicCore項目,這應該在DeepMimicCore/. 中生成DeepMimicCore.py。

Linux

1. 通過指定以下內容修改DeepMimicCore中的Makefile,

EIGEN_DIR:Eigen包含目錄

BULLET_INC_DIR:Bullet源目錄

PYTHON_INC:python包含目錄

PYTHON_LIB:python lib目錄

2. 建立wrapper,

make python

這應該在DeepMimicCore/中生成DeepMimicCore.py

如何使用

一旦構建了python wrapper,就可以使用Tensorflow完全在python中完成訓練。DeepMimic.py運行用于查看模擬的可視化工具。使用mpi_run.py完成訓練,它使用MPI在多個進程之間并行訓練。

通過指定提供場景配置的參數文件來運行DeepMimic.py。例如,

python DeepMimic.py --arg_file args/run_humanoid3d_spinkick_args.txt

將為“回旋踢”運行一個預訓練的policy。同樣的,

python DeepMimic.py --arg_file args/kin_char_args.txt

將加載并播放mocap片段。

要訓練一個策略(policy),請通過指定參數文件和工作進程數來運行mpi_run.py。例如,

python mpi_run.py --arg_file args/train_humanoid3d_spinkick_args.txt --num_workers 4

將訓練一個策略,使用4個workers進行“回旋踢”。作為訓練方案,它會定期打印統計數據并將其記錄到output/,以及最新策略的.ckpt。通常需要大約6千萬個樣本來訓練一個策略,而訓練16個workers需要一天時間。16個workers可能是框架所能支持的最大workers數量。

args中已經為不同的技能提供了許多參數文件。train_ [something] _args.txt文件是為mpi_run.py設置的,用于訓練策略,并為DeepMimic.py設置run_ [something] _args.txt文件以運行其中一個預訓練策略。要運行自己的策略,請使用run_ [something] _args.txt的文件之一,并指定要使用--model_file運行的策略。確保引用的動作--motion_file對應于策略所訓練的動作,否則策略將無法正常運行。

接口

右上角的圖顯示了價值函數的預測

單擊右鍵并拖動將平移相機

單擊左鍵并拖動將對特定位置處的角色施加力

滾輪會放大/縮小

按“r”將重置該episode

按'l'將重新加載參數文件并重建所有內容

按'x'將使用隨機的框投向角色

按空格將暫停/恢復模擬

按’>'將逐步執行模擬

Mocap Data

Mocap clips位于data/motions/中。要播放剪輯,首先修改args/kin_char_args.txt并指定要使用的文件--motion_file,然后運行

python DeepMimic.py --arg_file args/kin_char_args.txt

動作文件遵循JSON格式。“Loop”字段指定運動是否是循環的。“wrap”指定一個循環運動,該循環將在結束時回到起始點,而“none”指定一旦運動結束就會停止的非循環運動。“Frames”列表中的每個向量指定運動中的關鍵幀。每個框架具有以下格式:

位置以米為單位指定,球面關節的3D旋轉指定為四元數(w,x,y,z),轉動關節(例如膝關節和肘關節)的1維旋轉用弧度的標量表示。根位置和旋轉在世界坐標中,但所有其他關節旋轉都在關節的局部坐標中。要使用你自己的動作剪輯,請將其轉換為類似格式的JSON文件。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30146

    瀏覽量

    268411
  • 智能體
    +關注

    關注

    1

    文章

    131

    瀏覽量

    10567
  • 強化學習
    +關注

    關注

    4

    文章

    266

    瀏覽量

    11213

原文標題:強化學習練就18般武藝!伯克利開源DeepMimic

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    UC伯克利教授Stuart Russell:人工智能基礎概念與34個誤區

    Russell是加州大學伯克利分校人工智能系統中心創始人兼計算機科學專業教授,同時還是人工智能領域里「標準教科書」《人工智能:一種現代方法》作者(谷歌研究主管Peter Norvig也是該書作者)。在這篇文章中,他以Q&A的方式講解了人工智能的未來以及常見的誤解。
    的頭像 發表于 07-04 09:41 ?5549次閱讀

    伯克利博士論文:DC-DC轉換器

    伯克利博士的論文,關于DC-DC轉換器的理解介紹和應用分析。
    發表于 09-29 18:13 ?103次下載
    <b class='flag-5'>伯克利</b>博士論文:DC-DC轉換器

    美國勞倫斯伯克利國家實驗室開發出“病毒發電”元件

      美國勞倫斯伯克利國家實驗室(LBNL)開發出了利用病毒來發電的技術,并在2012年5月13日發行的學術雜志《Nature Nanotechnology》上發表相關論文。
    的頭像 發表于 05-16 09:45 ?4468次閱讀

    美國加州大學伯克利分校模電資料

    美國加州大學伯克利分校模電資料,個人收集整理了很久的資料,大家根據自己情況,有選擇性的下載吧~
    發表于 10-28 09:19 ?0次下載

    伯克利(Berkeley)聯網程序代碼介紹

    本章介紹伯克利( B e r k e l e y )聯網程序代碼。開始我們先看一段源代碼并介紹一些通篇要用的印刷約定。對各種不同代碼版本的簡單歷史回顧讓我們可以看到本書中的源代碼處于什么位置。接下來
    發表于 05-09 14:33 ?0次下載

    伯克利分校和韓國KAIST先后公布柔性傳感器據說能檢測血氧

    加利福尼亞大學伯克利分校開發的一種柔性傳感器可以大面積獲取皮膚、組織和器官的血氧水平圖譜。這種傳感器通過在一種柔性材料上印刷紅色OLED、近紅外OLED和有機光電二極管的交替陣列制成。
    的頭像 發表于 11-24 09:47 ?4107次閱讀

    推特公開宣布伯克利機器人學習實驗室最新開發的機器人BLUE

    ieter Abbeel 是領域內著名的機器人學與機器學習專家,他目前是加州大學伯克利分校電子工程與計算機系教授、伯克利人工智能實驗室(BAIR)聯合主任、伯克利機器人學習實驗室(UC Berkeley's Robot Lear
    的頭像 發表于 04-13 11:09 ?4418次閱讀

    UC伯克利新機器人成果:靈活自由地使用工具

    之前我們剛剛介紹加州大學伯克利分校 Pieter Abbeel 教授領導伯克利機器人學習實驗室(UC Be
    的頭像 發表于 04-15 09:03 ?2455次閱讀

    機器人遭綁架?一男子看不慣在伯克利街道上漫游的送貨機器人

    根據媒體報道,4月25日周四晚間,Kiwibot公司向伯克利警察局報案,指出他們價值 2500 美元的送貨機器人被偷,伯克利警察局局長 Peter Hong 表示,警方使用 GPS 追蹤機器人的位置,確定機器人被鎖在一輛汽車的后備廂里,隨即找到了車主。
    的頭像 發表于 05-07 18:09 ?2737次閱讀

    伯克利單腿跳機器人迎來新升級 即將在ICRA2019會議上亮相

    IEEE Spectrum上就有一篇最新進展的介紹,在很多人的眼中,加州大學伯克利分校的Salto從2016年以來就是他們最喜歡的機器人之一,然后在后來的機器人技術突飛猛進的幾年里Salto就開始顯得有點過時
    的頭像 發表于 05-23 15:59 ?2894次閱讀

    加州大學伯克利分校的團隊給予跳躍機器人更高目標

    美國加州大學伯克利分校的研究人員,研發出一款能不斷跳躍的機器人:Salto-1P。
    的頭像 發表于 06-13 17:52 ?3414次閱讀

    清華、伯克利聯手打造 成立RISC-V國際實驗室

    圖靈獎得主牽頭,清華伯克利聯手打造開源芯片,以深圳為根節點,全面提升 RISC-V 生態系統至最先進水平、成為一家以技術成果轉移為主要使命的非營利組織,并產出免受專利訴訟的工業級知識產權成果。
    的頭像 發表于 06-16 10:16 ?3654次閱讀

    圖靈獎得主牽頭推動芯片開源 清華伯克利成立RISC-V國際實驗室

    圖靈獎得主牽頭,清華伯克利聯手打造開源芯片,以深圳為根節點,全面提升 RISC-V 生態系統至最先進水平、成為一家以技術成果轉移為主要使命的非營利組織,并產出免受專利訴訟的工業級知識產權成果。
    的頭像 發表于 06-17 15:05 ?4574次閱讀

    加州大學伯克利分校研發可以操控的機器人

    近日,加州大學伯克利分校(UC Berkeley)研發出了一款新型機器人,可實現洗碗、疊衣服、收拾房間的等動作。
    發表于 08-05 15:45 ?956次閱讀

    美國伯克利市考慮2027年出臺汽油車禁售令

    據外媒報道,六年后,美國加州伯克利或將禁售汽油車。 伯克利市考慮到2027年出臺一項汽油車禁售令,旨在應對氣候變化。 伯克利市議會計劃在下周二發起可行性調查請求,計劃出臺一項法規,逐步淘汰伯克
    的頭像 發表于 01-19 11:25 ?1429次閱讀