IBM研發的北極點(NorthPole)處理器芯片可避開訪問外部存儲器,提高計算能力,節約能源。
美國加利福尼亞州圣何塞的IBM研究人員開發了一種以大腦為靈感的計算機芯片,這款北極點處理器芯片消除了頻繁訪問外部存儲器的需要,在圖像識別任務中比現有架構更快,能源消耗更少。這表明計算和內存可以大規模集成。相關研究10月19日發表在《科學》雜志。
北極點芯片采用神經推理結構,由簡單計算單元組成的多層陣列通過編程來識別數據中的模式。底層接收數據,例如圖像中的像素;每一個連續的層檢測日益復雜的模式,并將信息傳遞給下一層;頂層輸出結果,例如可以表示圖像含有貓、汽車或其他物體的可能性。
在傳統馮·諾伊曼架構下,計算和存儲分離。傳統計算機芯片可以有效處理計算,但每次計算時仍然需要使用被稱為RAM的外部存儲器。因此不管處理器運行多快、性能多好,每次執行運算時都需要把數據從存儲器搬到處理器中,數據處理完再搬回到存儲器。在以數據為主的AI計算之下,馮·諾伊曼架構的“存儲墻”和“功耗墻”挑戰凸顯。論文合著者、IBM計算機工程師達門德拉·莫達(Dharmendra Modha)表示,他曾估計在這種架構上模擬人類大腦可能需要12個核反應堆的能源輸出。
而北極點芯片使存儲單元在物理上盡可能接近計算單元中的計算元件。北極點芯片由256個計算單元組成,每個計算單元都有內存,通過消除片外內存,將計算與片上內存交織在一起。這些計算單元以一種網絡連接在一起,這種網絡的靈感來自于人類大腦皮層之間的白質連接。
在不使用最先進工藝的情況下,北極點芯片能耗是使用最先進技術的人工智能芯片的1/5。論文作者估計,如果北極點芯片設計采用最先進的制造工藝,其效率將是目前設計的25倍。論文提到,“在ResNet50基準圖像分類網絡上,相對于使用類似12納米技術工藝的GPU, 北極點實現了每瓦FPS(每秒傳輸幀數)的能量度量高25倍,每個晶體管FPS的空間度量高5倍,延遲時間度量低22倍?!?/p>
不過,據《自然》雜志報道,即使是北極點芯片224兆內存對于大型語言模型來說也是不夠的,比如聊天機器人ChatGPT這樣的語言模型,即使在最精簡的版本中也要占用幾千兆的數據。而且該芯片只能運行預先編程的神經網絡,這些神經網絡需要在單獨的機器上提前訓練。但論文作者表示,北極點芯片架構可能在速度關鍵型應用中有用,比如自動駕駛汽車。
審核編輯 黃宇
-
芯片
+關注
關注
454文章
50460瀏覽量
421971 -
內存
+關注
關注
8文章
3004瀏覽量
73900 -
AI
+關注
關注
87文章
30239瀏覽量
268478
發布評論請先 登錄
相關推薦
評論