在GPU上運行的神經網絡已經在人工智能領域取得了一些驚人的進步,但這兩者的合作還并不完美。IBM的研究人員希望能設計出一種專門用于運行神經網絡的新的芯片,從而提供更快、更有效的替代方案。
直到本世紀初,研究人員才意識到,為視頻游戲設計的GPU(圖形處理單元)可以被用作硬件加速器,以運行比以前更大的神經網絡。
這要歸功于這些芯片能夠并行進行大量計算,而不是像傳統CPU那樣按順序處理它們。這對于同時計算構成深度學習神經網絡的數百個神經元的權重特別有用。
GPU的引入使這一領域得到了發展,但這些芯片仍然需要將處理和存儲分開,這意味著大量的時間和精力都花在了兩者之間的數據傳輸上。這促使人們開始研究新的存儲技術,這些技術能夠存儲和處理同一位置的權重數據,從而提高速度和能源效率。
這種新的存儲設備通過調整它們的電阻水平,以模擬的形式存儲數據——也就是說,數據被存儲在一個連續的范圍內,而不是數字存儲器的二進制1和0。因為信息存儲在存儲單元的電導中,所以可以簡單地在存儲單元間傳遞電壓并讓系統通過物理方法來進行計算。
但是這些設備固有的物理缺陷意味著它們的行為并不一致,這導致了目前使用它們來訓練神經網絡的分類精度明顯低于使用GPU。
“我們可以在一個比GPU更快的系統上進行訓練,但如果訓練操作不那么準確,那是沒有用的,”領導該項目的IBM Research博士后研究員Stefano Ambrogio在接受Singularity Hub采訪時說,“到目前為止,還沒有證據表明使用這些新設備能像使用GPU一樣精確。”
但研究又有了新的進展。發表在《自然》雜志上的一篇論文中,Ambrogio和他的同事們描述了他們是如何利用新興的模擬記憶和更傳統的電子元件組合來創造出一種芯片,這種芯片可以與GPU的精度相匹配,同時運行速度更快,能耗更少。
這些新的存儲技術難以訓練深層神經網絡的原因是,這個過程需要將每個神經元的權重進行上下數千次的刺激,直到網絡完全對齊。改變這些設備的電阻需要重新配置它們的原子結構,而且每次的操作過程都不一樣,Ambrogio說。這些刺激并不總是完全相同,這導致了對神經元權重的不精確的調整。
研究人員通過創造“突觸單元”來解決這個問題,這些“突觸單元”每一個都對應于網絡中的單個神經元,同時具有長期和短期記憶。每個單元格由一對相變存儲器(PCM)單元和三個晶體管以及一個電容的組合構成,PCM在電阻中存儲權重數據,電容將權重數據存儲為電荷。
PCM是一種“非易失性存儲器”,這意味著即使沒有外部電源,它也能保留存儲的信息,而電容器是“易失性的”,所以只能在幾毫秒內保持它的電荷。但是電容器沒有PCM設備的可變性,因此可以快速而準確地編程。
當神經網絡對圖像進行訓練以完成分類任務時,只有電容器的權重會被更新。在瀏覽到幾千張圖片后,權重數據會被轉移到PCM單元進行長期存儲。PCM的可變性意味著,權重數據的轉移仍然有可能包含錯誤,但是由于該單元只是偶爾更新,所以可以在不增加系統復雜性的情況下再次檢查電導。Ambrogio說,如果直接在PCM單元上進行訓練,這就不可行了。
為了測試他們的設備,研究人員對他們的網絡進行了一系列流行圖像識別的基準測試,結果達到了與谷歌領先的神經網絡軟件TensorFlow相當的精確度。但重要的是,他們預測,最終構建出的芯片將比GPU的能效高280倍,而且在每平方毫米面積上實現的算力將達到CPU的100倍。值得注意的是,研究人員還沒有完全構建出這一芯片。
雖然在測試中使用了真正的PCM單元,但其它組件是在計算機上模擬的。Ambrogio表示,他們希望在投入時間和精力打造完整的芯片之前,先檢查一下這種方法是否可行。他說,他們決定使用真正的PCM設備,因為對這些設備的模擬還不太可靠,但其它組件的模擬技術已經很成熟了,他們有信心基于這個設計建立一個完整的芯片。
它目前也只能在全連接神經網絡上與GPU競爭,在這個神經網絡中,每個神經元都與上一層的神經元相連接,Ambrogio說。但實際上許多神經網絡并沒有完全連接,或者只有某些層完全連接在一起。
但Ambrogio說,最終的芯片將被設計成可以與GPU合作的形式,從而在處理其它連接時也能夠處理全連接層的計算。他還認為,這種處理全連接層的更有效的方法可以被更廣泛地應用。
這樣的專用芯片能夠使哪些事情成為可能?
Ambrogio說,有兩個主要的應用:一是將人工智能應用到個人設備上,二是使數據中心更加高效。后者是大型科技公司的一大擔憂,因為它們的服務器消耗了大量的電費。
如果直接在個人設備上應用人工智能,用戶就可以不必在云端分享他們的數據,從而增加隱私性,但Ambrogio說,更令人興奮的前景是人工智能的個性化。
他說:“在你的汽車或智能手機上應用這個神經網絡,它們就能夠不斷地從你的經驗中學習。”
“你的手機會專門針對你的聲音進行個性化,你的汽車也會根據你的習慣形成獨特的駕駛方式。”
未來智能實驗室是人工智能學家與科學院相關機構聯合成立的人工智能,互聯網和腦科學交叉研究機構。
未來智能實驗室的主要工作包括:建立AI智能系統智商評測體系,開展世界人工智能智商評測;開展互聯網(城市)云腦研究計劃,構建互聯網(城市)云腦技術和企業圖譜,為提升企業,行業與城市的智能水平服務。
-
cpu
+關注
關注
68文章
10825瀏覽量
211151 -
神經網絡
+關注
關注
42文章
4762瀏覽量
100541 -
人工智能
+關注
關注
1791文章
46859瀏覽量
237580
原文標題:讓AI個性化而且功耗更低 IBM研發新型神經網絡芯片
文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論