2019年開啟之際,美國加州大學伯克利分校教授、機器人與強化學習領域專家 Pieter Abbeel 發布了一份資源大禮:《深度學習與機器人學》105頁PPT。這份PPT整理自Abbeel教授2018年受邀參加的69個演講,內容涵蓋監督學習、強化學習和無監督學習的重要進展,以及深度學習的主要應用等方面,有助于讀者對深度學習和機器人學有一個宏觀的理解。
Pieter Abbeel教授從AI近年的一些“熱論”講起,從馬斯克認為AI是人類文明面臨的最大威脅、普京說“誰能成為AI領域的領袖,誰就將成為世界的主宰者”,概述了近年來AI的熱潮:NIPS等頂會的參會人數達到史上最高、arxiv上AI領域的論文翻倍增長。
報告的主體部分是“深度學習成功”,詳細介紹了監督學習、強化學習和無監督學習的重要進展。Pieter Abbeel教授對這三個概念的解釋如下:
監督學習:模式識別,如果有足夠多的數據(input -> output pairs),那么神經網絡就能夠學習模式;
強化學習:通過試錯的過程,學習目標導向的行為
無監督學習:沒有明確的監督的條件下,學習世界的結構
最后,報告展示了深度學習的一系列應用。
PPT下載地址:
https://www.dropbox.com/s/dw4kmxkrv3orujd/2018_12_xx_Abbeel--AI.pdf?dl=0
Pieter Abbeel教授簡介
Pieter Abbeel,加州大學伯克利分校教授、機器人學習實驗室主任,伯克利人工智能研究(BAIR)實驗室聯合主任。
Pieter Abbeel是機器人和強化學習領域的大牛。Pieter Abbeel 2008年從斯坦福大學獲得博士學位,師從百度前首席科學家 Andrew Ng(吳恩達),畢業后在UC Berkeley任教。
2016~2017年,Pieter Abbeel加入Open AI,任研究科學家。現在則是Open AI顧問。
Pieter Abbeel還是兩家AI公司的創始人,Gradescope和covariant.ai。Gradescope開發為家庭作業、課題研究、試卷等打分的AI系統;covariant.ai開發機器人自動化的AI系統,在制造/倉儲/電子商務/物流等領域應用。
Pieter Abbeel 的研究重點特別集中于如何讓機器人向人類學習(學徒學習),如何讓機器人通過自己的試錯過程學習(強化學習),以及如何通過從learning-to-learn(元學習)過程中加快技能獲取。他開發的機器人已經學會了先進的直升機特技飛行、打結、基本裝配、疊衣服、移動、以及基于視覺的機器人操作。
機器人疊毛巾
Pieter Abbeel目前的主要研究方向:機器人和機器學習,特別關注深度強化學習、深度模仿學習、深度無監督學習、元學習、learning-to-learn、以及AI安全。
PPT全文
-
機器人
+關注
關注
210文章
28231瀏覽量
206618 -
神經網絡
+關注
關注
42文章
4765瀏覽量
100568 -
深度學習
+關注
關注
73文章
5493瀏覽量
120999
原文標題:【強化學習干貨】《深度學習與機器人學》大牛Pieter Abbeel 105頁PPT下載
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論