抽象
系統神經科學尋求解釋大腦如何執行各種感知、認知和運動任務。相反,人工智能試圖根據它們必須解決的任務來設計計算系統。對于人工神經網絡,設計指定的三個組件是目標函數、學習規則和架構。隨著利用大腦啟發架構的深度學習越來越成功,這三個設計組件越來越成為我們如何建模、設計和優化復雜人工學習系統的核心。在這里,我們認為更多地關注這些組件也有利于系統神經科學。我們舉例說明了這種基于優化的框架如何推動神經科學的理論和實驗進展
學習目標,表示為要最大化或最小化的目標函數(或損失函數);一組學習規則,表示為突觸權重更新;和網絡架構,表示為信息流的路徑和連接(圖。1) 15。在這個框架內,我們不尋求總結計算是如何執行的,但我們確實總結了哪些目標函數、學習規則和架構將能夠學習該計算。
由于單個神經元的反應受到環境的影響,因此它們的計算應該反映這一海量信息源。我們可以在大腦中無處不在的神經元中看到這一點的證據,這些神經元在其活動中具有高熵,并且與實驗者迄今為止探索的大量刺激和行為沒有表現出易于描述的相關性6 , 7。
為了澄清我們的主張,我們建議使用這三個組成部分來確定規范性解釋可能是一種富有成效的方式,可以繼續開發更好的、非緊湊的電路神經元響應特性模型,如最近的研究所示,使用任務優化的深度 ANN 以確定激活特定神經元的最佳刺激29. 作為一個類比,自然選擇進化論為物種出現的原因提供了一個簡潔的解釋,可以用相對較少的文字來說明。
這種對物種出現的簡潔解釋隨后可用于開發特定物種系統發育的更復雜、非緊湊的模型。我們的建議是,基于這三個組成部分的規范性解釋可以提供類似的高級理論來生成我們的低級神經反應模型,這將使我們更接近許多科學家尋求的“理解”形式。
值得一提的是,研究人員長期以來一直假設目標函數和可塑性規則來解釋神經回路的功能59 – 62。然而,他們中的許多人回避了分層信用分配的問題,這是深度學習15的關鍵。也有明顯的實驗成功案例,包括預測編碼31、63、強化學習64、65和分層感官處理17、28方面的工作. 因此,我們在此闡明的基于優化的框架可以并且已經與個體神經元反應特性的研究一起運作。但是,我們相信,如果更廣泛地采用以三個核心組件為重點的框架,我們將會取得更大的成功。
去:
濕實驗室中的架構、學習規則和目標函數
此處闡述的框架如何與實驗工作相結合?取得進展的一種方法是使用三個核心組件構建工作模型,然后將模型與大腦進行比較。理想情況下,此類模型應檢查所有級別:(1) 它們應解決正在考慮的 Brain Set 中的復雜任務。(2) 他們應該了解我們的解剖學和可塑性知識。并且,(3)他們應該重現我們在大腦中觀察到的表征和表征的變化(圖 4). 當然,檢查這些標準中的每一個都非常重要。它可能需要許多新的實驗范式。檢查模型是否可以解決給定任務相對簡單,但要建立代表性和解剖學匹配并不容易,這是一個活躍的研究領域66、67。幸運的是,優化框架的模塊化允許研究人員嘗試單獨研究這三個組件中的每一個
大腦結構的實證研究
為了能夠識別定義大腦歸納偏差的結構,我們需要繼續進行實驗,在電路層面探索神經解剖學。要在優化框架內真正構建神經解剖學,我們還必須能夠確定哪些信息可用于電路,包括有關動作結果的信號可能來自何處。最終,我們希望能夠將解剖學的這些方面與指導負責學習的發育過程的具體生物標記聯系起來。
為了描述神經系統的解剖結構,已經進行了大量的實驗工作。我們正在使用一系列成像技術來量化電路57和68的解剖結構和發展。在繪制具有細胞類型特異性的神經回路投射方面也進行了大量工作56。試圖繪制大腦層次結構的研究早已存在69,但幾個小組現在正在探索深度 ANN 層次結構的哪些部分最能反映大腦的哪些區域17 , 70. 例如,紋狀皮層中的表示(例如,通過相異矩陣測量)更好地匹配深度 ANN 的早期層,而下顳葉皮層中的表示更好地匹配后面的層8 , 71。這種工作壓力還涉及深度 ANN 架構的優化,以便它們更貼近大腦中的表征動態,例如通過探索不同的循環連接模式66。面對已經和將要進行的一組令人眼花繚亂的解剖學觀察,將解剖學與目標函數和學習規則一起置于框架中的理論和框架提供了一種方法,可以將那些最具解釋力的特征歸零。
大腦學習規則的實證研究
研究突觸可塑性規則的神經科學有著悠久的傳統。然而,這些研究很少探討學分分配是如何發生的。然而,正如我們上面所討論的(方框 1),信用分配是 ANN 學習的關鍵,也可能存在于大腦中。值得慶幸的是,自上而下的反饋和神經調節系統已成為近期突觸可塑性研究的焦點72 – 76。這允許一些具體的建議,例如關于頂端樹突如何參與信用分配12、14,或者自上而下的注意力機制如何與神經調節劑相結合可以解決信用分配問題37、38(圖 5). 我們還可以查看表征的變化,并從這些觀察結果中推斷出可塑性規則77。對于實驗者來說,測量動物達到穩定表現期間和之后的神經反應非常重要,以便捕捉表征在學習過程中如何演變。著眼于學分分配的學習規則工作正在對影響可塑性的無數因素產生更細粒度的理解78。
將來,我們應該更好地研究學習規則并考慮優化。隨著光學技術的改進,并可能為我們提供一種估計體內突觸變化的方法79,我們可能能夠將突觸變化與行為錯誤等直接聯系起來。我們還可以直接測試可以解決信用分配問題的學習規則的假設生物模型,例如使用注意力37、38或使用樹突信號進行信用分配12、14的模型(圖 5).
大腦中目標函數的實證研究
在某些情況下,大腦正在優化的目標函數可能直接在我們可以監控和記錄的神經信號中表示。在其他情況下,目標函數可能只隱含地存在于控制突觸更新的可塑性規則方面。最優控制等規范性概念是適用的80,進化思想可以啟發我們的思維。更具體地說,動物行為學可以提供關于哪些功能對動物優化有用的指導81,為我們提供一個有意義的直觀空間來思考目標功能。
長期以來一直有文獻試圖將實驗數據與目標函數聯系起來。這始于將已知可塑性規則與潛在目標函數相關聯的理論工作。例如,有一些研究試圖通過比較實驗觀察到的神經活動與在自然場景中訓練的 ANN 的神經活動來估計目標函數59、82。還有一些方法使用逆向強化學習來確定系統優化了什么83。此外,有人可能會爭辯說,我們可以通過尋找針對給定目標優化的表征幾何與真實神經表征幾何之間的相關性來處理目標函數28 , 84. 另一種新出現的方法詢問在控制腦機接口 (BCI) 設備時動物的電路可以優化什么85。因此,建立在先前工作80基礎上的越來越多的文獻幫助我們探索大腦中的目標功能。
結論
許多系統神經科學都試圖就大腦中單個神經元的功能制定簡潔的陳述。這種方法已經成功地解釋了一些(相對較小的)電路和某些硬連線行為。然而,有理由相信,如果我們要開發具有數千、數百萬或數十億個神經元的塑料電路的良好模型,這種方法將需要得到其他見解的補充。不幸的是,不能保證中樞神經系統中單個神經元的功能可以壓縮為人類可解釋的、可口頭表達的形式。鑒于我們目前沒有很好的方法將深度 ANN 中各個單元的功能提煉成文字,并且考慮到真實的大腦可能更復雜,而不是更不復雜,
系統神經科學的當前理論既美麗又富有洞察力,但我們相信它們可以受益于建立在優化基礎上的內聚框架。例如,局部可塑性規則,如赫布機制,解釋了大量的生物數據。但是,為了在復雜任務上取得良好的性能,在設計 Hebb 規則時必須考慮目標函數和架構34、90。同樣,其他研究人員也有充分的理由指出了大腦利用歸納偏差的好處48. 然而,歸納偏差本身并不足以解決復雜的任務,例如 AI 集或各種 Brain Sets 中包含的任務。為了解決這些難題,歸納偏差必須與學習和學分分配相結合。正如我們所說,如果動物可以解決的一組任務是神經科學的基本考慮因素,那么構建能夠實際解決這些任務的模型就至關重要。
不可避免地,需要自下而上的描述性工作和自上而下的理論工作才能在系統神經科學中取得進展。不過,重要的是從正確的自上而下的理論框架開始。鑒于現代機器學習能夠解決人工智能集和眾多腦集中的問題,用機器學習的洞察力來指導系統神經科學研究的自上而下的框架將是富有成效的。如果我們在這種心態提供的框架內考慮研究數據,并將注意力集中在此處確定的三個基本組成部分上,我們相信我們可以開發出大腦理論,從而充分利用當前神經科學技術革命的好處。
審核編輯:劉清
-
神經網絡
+關注
關注
42文章
4765瀏覽量
100568 -
人工神經網絡
+關注
關注
1文章
119瀏覽量
14602 -
ANN
+關注
關注
0文章
21瀏覽量
9185
原文標題:神經科學的深度學習框架
文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論