加速器已經(jīng)無(wú)處不在:世界上的比特幣是由旨在加速這種加密貨幣的關(guān)鍵算法的芯片采礦得來(lái),幾乎每一種能發(fā)出聲音的數(shù)字產(chǎn)品都使用硬連線音頻解碼器,數(shù)十家初創(chuàng)公司正在追逐能讓深度學(xué)習(xí)AI無(wú)處不在的快速硅。這種專用化,使得各類原本運(yùn)行在通用CPU之上的軟件及其內(nèi)部常見(jiàn)算法得以在定制化硬件上帶來(lái)更快的處理速度,被認(rèn)為是摩爾定律失效之后,我們能夠在接下來(lái)一到兩代芯片當(dāng)中繼續(xù)驅(qū)動(dòng)計(jì)算能力保持增長(zhǎng)的一種方法。
但這不會(huì)奏效。至少,它不會(huì)長(zhǎng)時(shí)間奏效。這是普林斯頓大學(xué)電氣工程副教授David Wentzlaff和他的博士生Adi Fuchs即將在本月的IEEE高性能計(jì)算機(jī)架構(gòu)國(guó)際研討會(huì)(IEEE International Symposium on High-Performance Computer Architecture)上發(fā)表的研究結(jié)論。他們計(jì)算出,芯片專用化不能產(chǎn)生摩爾定律所能產(chǎn)生的那種收益。換句話說(shuō),加速器的發(fā)展會(huì)像晶體管的縮小那樣碰壁,而且這會(huì)比預(yù)期的更快發(fā)生。
為了證明他們的觀點(diǎn),F(xiàn)uchs和Wentzlaff必須弄清楚最近的性能提升有多少來(lái)自芯片專用化調(diào)整,有多少來(lái)自摩爾定律本身。這意味著要檢查1000多份芯片數(shù)據(jù)表,弄清楚一代又一代芯片的改進(jìn)有多少部分要?dú)w功于更好的算法和更巧妙電路的巧妙實(shí)現(xiàn)方法。換句話說(shuō),他們?cè)噲D量化人類的聰明才智。
為此,他們做了工程師們擅長(zhǎng)的事:他們將它轉(zhuǎn)換為一個(gè)無(wú)量綱的量。他們將其稱為芯片專用化回報(bào),希望借此回答這樣一個(gè)問(wèn)題:“在晶體管的固定物理預(yù)算下,芯片的計(jì)算能力提高了多少?”
使用該指標(biāo),他們?cè)u(píng)估了特定應(yīng)用集成電路(簡(jiǎn)稱ASIC)上的視頻解碼、GPU上的游戲幀速率、FPGA上的卷積神經(jīng)網(wǎng)絡(luò)以及ASIC上的比特幣采礦。結(jié)果并不令人振奮:專用芯片的增益很大程度上取決于每平方毫米硅上可用晶體管數(shù)量的增加。換句話說(shuō),離開(kāi)了摩爾定律,芯片專用化本身的力量是有限的。
因此,如果專用化無(wú)法給出理想的答案,那么未來(lái)的出路在哪里?Wentzlaff建議半導(dǎo)體業(yè)界學(xué)習(xí)使用那些能夠在邏輯停止時(shí)仍可實(shí)現(xiàn)擴(kuò)展的東西進(jìn)行計(jì)算。例如,每平方厘米可用閃存的比特?cái)?shù)在不受摩爾定律影響的情況下持續(xù)增長(zhǎng),因?yàn)闃I(yè)界已經(jīng)轉(zhuǎn)向使用能夠制造出256層甚至更高單元層數(shù)的3-D技術(shù)。Fuchs和Wentzlaff已經(jīng)開(kāi)始研究這個(gè)問(wèn)題,他們開(kāi)發(fā)了一種計(jì)算機(jī)架構(gòu),通過(guò)讓處理器查找存儲(chǔ)在內(nèi)存中的先前計(jì)算而不是重新計(jì)算它們來(lái)加速計(jì)算。
-
芯片
+關(guān)注
關(guān)注
454文章
50444瀏覽量
421922 -
摩爾定律
+關(guān)注
關(guān)注
4文章
632瀏覽量
78937
原文標(biāo)題:加速器墻:后摩爾定律世界的新問(wèn)題
文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論