機器之心編譯
大腦中神經(jīng)元之間的信號傳播速度大約是 100 米每秒,而光的傳播速度是 30 萬千米每秒,如果神經(jīng)元信號也是光速傳播的呢?來自加州大學(xué)洛杉磯分校(UCLA)的研究人員利用 3D 打印技術(shù)打印出了固態(tài)的神經(jīng)網(wǎng)絡(luò),并且利用層級傳播的光衍射來執(zhí)行計算,實現(xiàn)了手寫數(shù)字的圖像識別,相關(guān)成果已發(fā)表在《science》雜志上。
這一想法看似新奇,其實也很自然。神經(jīng)網(wǎng)絡(luò)中執(zhí)行的是線性運算,恰好和光衍射的線性相互作用對應(yīng),神經(jīng)元的權(quán)重、激活值概念也能和光的振幅、相位對應(yīng)(可調(diào))。此外,固態(tài)光衍射計算還具有能耗小、無發(fā)熱、光速執(zhí)行(盡管傳統(tǒng)計算機電路中的電場傳播也是光速的,但并未直接對應(yīng)神經(jīng)網(wǎng)絡(luò)的計算過程)等優(yōu)點。該研究方向尚處于起步階段,如果能充分利用其優(yōu)勢,也許會有很廣闊的應(yīng)用前景。
如今,機器學(xué)習(xí)無處不在,但多數(shù)機器學(xué)習(xí)系統(tǒng)是隱形的:它們在「黑箱」里優(yōu)化音頻或識別圖像中的人臉。但最近 UCLA 的研究人員研發(fā)出了一個 3D 打印 AI 分析系統(tǒng)。這一系統(tǒng)不僅看得見,還摸得著。與以往通過調(diào)節(jié)數(shù)字進行分析的系統(tǒng)不同,該系統(tǒng)通過光線的衍射來分析人工智能。這一新奇、獨特的研究成果表明:這些「人工智能」系統(tǒng)可以看起來非常簡單。
我們通常將機器學(xué)習(xí)系統(tǒng)看作人工智能的一種形式,其核心是對一組數(shù)據(jù)進行的一系列運算,每一次運算都基于上一次運算或饋送到一個循環(huán)中。運算本身并不太復(fù)雜——盡管也沒有簡單到可以用紙筆計算的程度。最終,這些簡單的數(shù)學(xué)運算會得出一個概率,即輸入的數(shù)據(jù)與系統(tǒng)「學(xué)會」識別的各種模式相匹配。
通常,機器學(xué)習(xí)系統(tǒng)進行每一次參數(shù)更新或推斷時所需的運算需要在 CPU 或 GPU 上進行。由于當(dāng)前的深度學(xué)習(xí)需要大量并行計算,GPU 成了更廣泛的選擇。但即使最先進的 GPU 也是用硅和銅制成的,信息需要沿著錯綜復(fù)雜的電路以脈沖的形式傳播。這就意味著,不論是執(zhí)行新的計算還是重復(fù)的計算,傳統(tǒng) GPU 都會產(chǎn)生能耗。
因此,當(dāng)深度學(xué)習(xí)中的這些「層」已經(jīng)完成訓(xùn)練,并且所有參數(shù)的值都確定下來,它還會一次次地重復(fù)計算與耗能。這意味著 3D 打印 AI 分析系統(tǒng)在訓(xùn)練完它的「層」后,還可以被優(yōu)化,不會占用太大空間或 CPU 功率。來自 UCLA 的研究人員表示,它確實可以固化,這些層本身就是由透明材料制成的 3D 打印層,印有復(fù)雜的衍射圖案,這些圖案可以對光線進行處理。
如果這樣描述讓你覺得有點頭疼,不妨想想機械計算器。如今,數(shù)字計算都是在計算機邏輯中以數(shù)字形式完成的。但是過去,計算器需要移動實際的機械零件才能進行計算——數(shù)字加到 10 都會造成零件位置變換。從某種程度上來說,這種「衍射深度神經(jīng)網(wǎng)絡(luò)」與之相仿:它使用并操縱數(shù)字的物理表示,而不是電子表示。這就代表著,如果將模型的預(yù)測過程固化為物理表示,那么它在實際預(yù)測過程中就能大大降低能耗。
正如研究人員所說:
給定層上的每個點傳輸或反射入射波,該入射波相當(dāng)于通過光學(xué)衍射連接到下一層其它神經(jīng)元的人工神經(jīng)元。通過改變相位和振幅,每個「神經(jīng)元」都是可調(diào)的。
「我們的全光深度學(xué)習(xí)框架能夠以光速執(zhí)行各種復(fù)雜任務(wù),基于計算機的神經(jīng)網(wǎng)絡(luò)也可以實現(xiàn)這些任務(wù)。」研究人員在論文中描述其系統(tǒng)時寫道。
為了證明這一點,他們訓(xùn)練了一個深度學(xué)習(xí)模型來識別寫手寫數(shù)字。完成之后,他們會把矩陣數(shù)學(xué)層轉(zhuǎn)化為一系列的光學(xué)變換。例如,一個層可能會通過將兩者的光線重新聚焦到下一層的單個區(qū)域來增加值——實際計算比這要復(fù)雜得多,此處只做概述。
通過在印刷版上布置數(shù)百萬個微型轉(zhuǎn)換,光從一端輸入并從另一個結(jié)構(gòu)中輸出,因此系統(tǒng)能以超過 90% 的準(zhǔn)確率判斷它是否為 1、2 和 3 等。
讀者可能會疑問這到底有什么用,因為最簡單的三層感知機在識別手寫數(shù)字時都能輕松達到 95% 以上的準(zhǔn)確率,而卷積網(wǎng)絡(luò)可以實現(xiàn) 99% 以上的準(zhǔn)確率。這一形式目前確實沒什么實際用處,但是神經(jīng)網(wǎng)絡(luò)是非常靈活的工具,系統(tǒng)完全有可能識別字母而不是僅限于數(shù)字。因此可以令光學(xué)字符識別系統(tǒng)在硬件中運行,且基本上不需要能耗或計算。
真正的局限在于制造工藝:打造一個能實現(xiàn)按需處理任務(wù)的超高精度衍射板非常困難。畢竟,如果需要精確到小數(shù)點后七位,而印刷版卻只能精確到第三位的話,那就相當(dāng)麻煩了。
這只是一個概念的證明——對大型數(shù)字識別機器并沒有迫切需求——但這個想法十分有趣。該想法可能會對攝像機和機器學(xué)習(xí)技術(shù)產(chǎn)生影響——在物質(zhì)世界而非虛擬世界里構(gòu)造光與數(shù)據(jù)。看起來像是倒退,但也許只是鐘擺在向后擺動。
深度學(xué)習(xí)已經(jīng)提高了我們使用計算機執(zhí)行高級推理任務(wù)的能力。我們在本文中引入了一種物理機制來執(zhí)行機器學(xué)習(xí),這是一種全光衍射深度神經(jīng)網(wǎng)絡(luò)(D^2NN)架構(gòu),可以按照基于深度學(xué)習(xí)設(shè)計的、集體工作的被動衍射層來實現(xiàn)多種函數(shù)。我們構(gòu)建了 3D 打印的 D^2NN 來實現(xiàn)手寫數(shù)字和時尚產(chǎn)品的圖像分類,以及成像鏡頭在太赫茲光譜的函數(shù)。我們的全光深度學(xué)習(xí)框架能以光速計算多種基于傳統(tǒng)計算機的神經(jīng)網(wǎng)絡(luò)也可以實現(xiàn)的復(fù)雜函數(shù),并將在全光圖像分析、特征檢測和目標(biāo)分類中開發(fā)新的應(yīng)用,此外它還允許設(shè)計新的攝像頭和光學(xué)器件,以利用 D^2NN 執(zhí)行獨特的任務(wù)。
圖 1:衍射深度神經(jīng)網(wǎng)絡(luò)(D^2NN)架構(gòu)。
圖 2:3D 打印的衍射深度神經(jīng)網(wǎng)絡(luò)測試實驗。
圖 3:衍射深度神經(jīng)網(wǎng)絡(luò)實現(xiàn)手寫數(shù)字識別。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4765瀏覽量
100565 -
人工智能
+關(guān)注
關(guān)注
1791文章
46896瀏覽量
237669 -
3D打印
+關(guān)注
關(guān)注
26文章
3544瀏覽量
108881
原文標(biāo)題:前沿 | 3D打印的深度神經(jīng)網(wǎng)絡(luò),光速執(zhí)行AI運算
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學(xué)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論