精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI的定位和導航類似于大腦的位置細胞和網格細胞

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-05-13 10:43 ? 次閱讀

近日,DeepMind 在 Nature 上發表的一篇論文引起 AI 領域和神經科學領域的極大震撼:AI 展現出與人腦 “網格細胞” 高度一致的空間導航能力。甚至有些學者認為,憑著這篇論文,DeepMind 的作者有可能問鼎諾貝爾獎。本文作者鄧侃博士對這篇突破性的論文進行了解讀。

Google 麾下的 DeepMind 公司,不僅會下圍棋,而且寫的論文也頂呱呱。

2018/5/10,今天的微信朋友圈,被DeepMind 一篇論文刷屏了。論文發表在最近一期 Nature 雜志上,題目是Vector-based navigation using grid-like representations in artificial agents [1]。

有些學者認為,憑著這篇論文,DeepMind 的作者有可能問鼎諾貝爾獎[2]。

重要意義:AI的定位和導航類似于大腦的位置細胞和網格細胞

其實這篇論文是DeepMind 人工智能團隊,與 University College of London(UCL) 的生物學家,合作的產物。

對空間的定位和導航能力,是生物的本能。早在 1971 年,UCL 的生理學教授 John O'Keefe 在大腦海馬體中,發現了位置細胞(Place Cell)。隨后 O'Keefe 的學生,Moser 夫婦于 2005 年發現,在大腦內嗅皮層,存在一種更為神奇的神經元,網格細胞(Grid Cell)。在運動過程中,生物的網格細胞,把空間分割為蜂窩那樣的六邊形,并且把運動軌跡記錄在蜂窩狀的網格上。

2014 年的諾貝爾生理學/醫學獎,頒發給了John O'Keefe 和Moser 夫婦。

人工智能深度學習模型,經常被詬病的一大軟肋,是缺乏生理學理論基礎。深度學習模型中的隱節點的物理意義,也無法解釋。

DeepMind 和 UCL 合著的 Nature 論文,發現深度學習模型中隱節點,與腦內的位置細胞和網格細胞,這兩者的激活機制和數值分布,非常相似,幾乎呈一一對應的關系。

Extended Data Fig 3.d:第一行,深度學習模型的隱節點的激活機制和數值分布。第二行,Moser 夫婦發現的網格細胞的蜂窩狀數值分布。深度學習隱節點與網格細胞的數值分布,極為相似。第三行,數值分布所揭示的空間定位及運動方向。

這篇論文,之所以引起學界轟動,原因在于證明了,把深度學習模型用于空間的定位和導航,其隱節點的物理意義,類似于大腦的位置細胞和網格細胞。進一步猜想,深度學習模型的定位和導航的計算過程,很可能與大腦的定位和導航的生理機制,也極為相似。

為什么DeepMind 熱衷于玩游戲?

面向空間定位和導航的深度學習模型,有哪些應用場景呢?DeepMind 把這個技術用于玩電子游戲,類似于 “反恐精英”(Counter Strike)那樣的走迷宮射殺***的游戲。

DeepMind 下完圍棋以后,玩初級電子游戲,現在升級了,改玩高級游戲了。為什么DeepMind 那么熱衷于游戲呢?

游戲是仿真系統,一切盡在掌控之中,想要什么數據,就能獲取什么數據。所以,每條數據,都很全面,不會有數據丟失。

同時,只要多雇一些玩家,多花一點時間,要多少訓練數據,就有多少訓練數據。

用游戲來驗證深度學習模型,非常方便。這是 DeepMind 熱衷于玩游戲的原因。同時,因為能夠快速地獲取數據,DeepMind 對于深度學習和強化學習研究,領先世界。

Figure 3. DeepMind 把基于深度學習的空間定位和導航技術,應用于反恐精英(Counter Strike)游戲。

問題是,把適用于游戲的深度學習模型,移用到真實世界,解決實際問題,是否仍然有效?

同是 Google 麾下兄弟,Google Brain 更注重解決實際問題,兄弟倆各有千秋。Google Brain 開發的 Tensorflow成為工程利器,而 DeepMind 的論文,提供新方法,引領研究前沿。

深度學習仿真位置和網格細胞的論文,技術上有什么創新?

短的答案,沒有獨特的創新。

長的答案,得先講講馬爾科夫和強化學習。

強化學習(Reinforcement Learning)是機器學習的一個重要分支,它試圖解決決策優化的問題。所謂決策優化,是指面對特定狀態(State,S),采取什么行動方案(Action,A),才能使收益最大(Reward,R)。很多問題都與決策優化有關,從下棋,到投資,到課程安排,到駕車,到走迷宮等等。

AlphaGo 的核心算法,就是強化學習。AlphaGo不僅穩超勝券地戰勝了當今世界所有人類高手,而且甚至不需要學習人類棋手的棋譜,完全靠自己摸索,在短短幾天內,發現并超越了一千多年來人類積累的全部圍棋戰略戰術。

最簡單的強化學習的數學模型,是馬爾科夫決策過程(Markov Decision Process,MDP)。之所以說 MDP 是一個簡單的模型,是因為它對問題做了很多限制。

1. 面對的狀態 s_{t},數量 t = 1... T,T 是有限的。

2. 采取的行動方案 a_{t},數量t = 1... T,T也是有限的。

3.對應于特定狀態 s_{t},當下的收益 r_{t} 是明確的。

4. 在某一個時刻 t,采取了行動方案 a_{t},狀態從當前的 s_{t} 轉換成下一個狀態 s_{t+1}。下一個狀態s_{t+1}有多種可能,從當前狀態 s_{t}轉換到下一個狀態中的某一種狀態的概率,稱為轉換概率。但是轉換概率,只依賴于當前狀態 s_{t},而與先前的狀態,s_{t-1}, s_{t-2} ... 無關。

解決馬爾科夫決策過程問題的常用的算法,是動態規劃(Dynamic Programming)。

對馬爾科夫決策過程的各項限制,不斷放松,研究相應的算法,是強化學習的目標。

例如對狀態 s_{t}放松限制,

1. 假如狀態 s_{t} 的數量t = 1... T,T雖然有限,但是數量巨大,或者有數量無限,如何改進算法?

2.假如狀態 s_{t} 不能完全確定,只能被部分觀察到,剩余部分被遮擋或缺失,如何改進算法?

3. 假如轉換概率,不僅依賴于當前狀態,而且依賴于先前的運動軌跡,如何改進算法?

4. 假如遇到先前沒有遇見過的新狀態s_{t},有沒有可能在以往遇見過的狀態中,找到相似狀態,從而估算轉換概率,估算收益?

Extended Data Fig 5. 用GridLSTM 來總結以往的運動軌跡,并加上神經網絡 g 來判別當前的空間定位和運動方向。然后基于對當前的空間定位和導航的判斷,用另一個 LSTM 來估算狀態轉換概率,從而決定導航策略。

這篇論文用深度學習模型,來仿真位置和網格細胞。具體來說,

1.用 CNN 來處理圖像,找到周邊環境中的標志物,用于識別當前的空間位置。

2. 把圖像處理的結果,與以往的運動軌跡相結合,用GridLSTM 來估算當前的狀態。

3. 把GridLSTM 估算出的當前狀態,經過一個神經網絡 g 的再加工,得到類似于位置細胞和網格細胞的隱節點。

4. 把當前的位置和運動方向,以及目標的位置,作為第二個 LSTM 模型的輸入,確定導航決策。

上述所有模塊,都是現成技術的集成,并無顯著創新。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 導航
    +關注

    關注

    7

    文章

    523

    瀏覽量

    42382
  • 人工智能
    +關注

    關注

    1791

    文章

    46896

    瀏覽量

    237671
  • 深度學習
    +關注

    關注

    73

    文章

    5493

    瀏覽量

    121000

原文標題:專家解讀DeepMind最新論文:深度學習模型復現大腦網格細胞

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    人類首創能生成神經細胞的“迷你大腦”,更精確模擬神經網絡!

    `近日,凱斯西儲大學醫學院、紐約干細胞基金會(NYSCF)研究所和喬治華盛頓大學的研究人員聯合提出了一種新方法,通過人類胚胎干細胞培育生成3D版的“迷你大腦”。這些“迷你大腦”名為“
    發表于 08-21 09:26

    人工智能可助辨識細胞結構

    美國艾倫細胞科學研究所的科學家使用機器學習技術訓練計算機,使其可在不使用熒光標記的情況下較為準確地辨認出細胞結構。傳統的熒光顯微法使用發光分子標記來確定細胞結構,但價格昂貴且每次只能觀察一部分結構
    發表于 10-15 05:21

    細胞的同時AFM熒光成像應用簡報

    細胞的同時AFM /熒光成像 - 應用簡報
    發表于 10-23 10:39

    Eversipn STT-MRAM的MJT細胞介紹

    Eversipn STT-MRAM的MJT細胞
    發表于 02-24 07:28

    細胞融合與單克隆抗體

    細胞融合(cell fusion),又稱體細胞雜交(somatic hybridiazation),是指兩個或更多個相同或不同細胞通過膜 融合形成單個細胞的過程。Muller
    發表于 02-17 10:02 ?0次下載

    總線細胞陣列中空閑細胞冗余數量研究

    總線細胞陣列中空閑細胞冗余數量研究_王濤
    發表于 01-07 21:39 ?0次下載

    細胞的產生與美國科學家成功制造出具有造血干細胞功能的細胞

    英國《自然》雜志 16 日發表了兩項干細胞研究重要進展,美國科學家成功將人體多能干細胞和小鼠內皮細胞轉化為具有造血干細胞功能的細胞。最新成果
    發表于 09-22 15:27 ?8次下載

    首次創造出能生成神經細胞的3D版“迷你大腦

    由胚胎干細胞發育而來的“迷你大腦”,能夠模擬與實際大腦相仿的細胞和神經間交互的過程,讓研究人員更準確地觀察到與脫髓鞘相關疾病的機理和發病過程,并探尋與這些疾病的新療法,加速對相關疾病的
    的頭像 發表于 08-01 09:10 ?3056次閱讀

    T 細胞打入腫瘤細胞要先對好“暗號”

    具有腫瘤清除作用的免疫 T 細胞需要與腫瘤細胞對好“暗號”后,才能打入腫瘤組織內部
    的頭像 發表于 06-19 09:20 ?3748次閱讀

    無人機集群類腦導航系統的應用特點及發展現狀研究

    隨著網格細胞位置細胞及頭朝向細胞等類腦認知導航細胞
    發表于 07-31 11:54 ?2447次閱讀

    “解碼”單細胞測序的故事

    有別傳統的基因芯片,從超過混合數萬個細胞中提取的DNA或者RNA進行測序,得出平均值。單細胞測序可以在單個細胞層面解析基因組及其表達調控特征,能更全面掌握
    的頭像 發表于 03-17 11:02 ?2036次閱讀

    基于CNN和LSTM的蛋白質亞細胞定位研究對比

    基于CNN和LSTM的蛋白質亞細胞定位研究對比
    發表于 06-11 14:16 ?15次下載

    基于人類乳腺細胞圖譜中各細胞亞型之間的位置關系和空間聯系

    ? 人類細胞圖譜計劃(Human Cell Atlas,HCA)旨在描述人體中每個細胞(約37萬億個)的詳細特征,呈現不同類型細胞在人體組織的三維結構,勾勒他們在人體系統內的聯系,揭示圖譜變化與健康
    的頭像 發表于 07-23 15:02 ?662次閱讀
    基于人類乳腺<b class='flag-5'>細胞</b>圖譜中各<b class='flag-5'>細胞</b>亞型之間的<b class='flag-5'>位置</b>關系和空間聯系

    細胞細胞注釋詳解之singleR細胞注釋

    除了對每個細胞的所屬細胞類型進行評分外,singleR還會對seuret聚類結果中每個cluster中各細胞類型比例進行分析,評估每個cluster所屬的細胞類型。結果由
    的頭像 發表于 09-21 17:34 ?2217次閱讀
    單<b class='flag-5'>細胞</b><b class='flag-5'>細胞</b>注釋詳解之singleR<b class='flag-5'>細胞</b>注釋

    細胞的“聚光燈”——前沿活細胞成像的案例分享

    細胞是一切生命的基本單位,構成了各式各樣的生命體。因此研究細胞的結構以及內部生命活動過程可以幫助我們更深入地探究生命的奧秘,了解生命體是如何構建和運作的。傳統的細胞顯微術只能通過觀察固定的細胞
    的頭像 發表于 10-24 08:04 ?228次閱讀
    活<b class='flag-5'>細胞</b>的“聚光燈”——前沿活<b class='flag-5'>細胞</b>成像的案例分享