近日,Github 一位開發(fā)者 danaugrs 開源了一個(gè)新項(xiàng)目——Huskarl,一個(gè)專注研究和快速原型的深度強(qiáng)化學(xué)習(xí)框架。
此框架基于 TensorFlow 2.0 構(gòu)建,使用了 tf.keras API,保證了其簡潔性和可讀性。Huskarl 可以使多環(huán)境的并行計(jì)算變得很容易,這將對(duì)加速策略學(xué)習(xí)算法(比如 A2C 和 PPO)非常有用。此外,Huskarl 還可以與 OpenAI Gym 環(huán)境無縫結(jié)合,并將計(jì)劃支持多代理環(huán)境和 Unity3D 環(huán)境。
OpenAI Gym:2016 年 OpenAI 發(fā)布的一個(gè)可以開發(fā)、對(duì)比強(qiáng)化學(xué)習(xí)算法的工具包,提供了各種環(huán)境、模擬任務(wù)等,任何人都可以在上面訓(xùn)練自己的算法。
Unity3D:一個(gè)全面整合的專業(yè)游戲引擎,由 Unity Technologies 開發(fā)的一款可以讓玩家輕松創(chuàng)建三維視頻游戲、實(shí)時(shí)三維動(dòng)畫等類型互動(dòng)內(nèi)容的多平臺(tái)綜合型游戲開發(fā)工具。
目前,Huskarl 已經(jīng)支持了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(Advantage Actor-Critic)等算法,還有 DDPG(Deep Deterministic Policy Gradient)、PPO(Proximal Policy Optimization)、Curiosity-Driven Exploration 等算法在計(jì)劃中。
最重要的是,TF 2.0 的 nightly 已經(jīng)發(fā)布,這個(gè)開源工具也是基于 TF2.0 開發(fā)的,所以大家要先安裝一下 tf 2.0 nighty 版本。除此之外,還需要安裝以下工具和環(huán)境:
這個(gè)工具還是新鮮出爐燙手的呢,大家趕緊來嘗鮮試一下~
地址:
https://github.com/danaugrs/huskarl
-
強(qiáng)化學(xué)習(xí)
+關(guān)注
關(guān)注
4文章
266瀏覽量
11213 -
tensorflow
+關(guān)注
關(guān)注
13文章
328瀏覽量
60498 -
開源工具
+關(guān)注
關(guān)注
0文章
27瀏覽量
4444
原文標(biāo)題:新鮮開源:基于TF2.0的深度強(qiáng)化學(xué)習(xí)平臺(tái)
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論