摩爾定律的迫在眉睫和深度學習的不斷使用推動了針對特定神經體系結構進行優化的定制芯片的設計。這些定制芯片也被稱為加速器,可以顯著地增加可用的算力,從而提高神經網絡的性能以及廣泛應用的可能性。
在談到有關該公司是如何利用人工智能促進其定制芯片的研發時,Google Brain的總監杰夫迪恩(Jeff Dean)指出,在某些情況下,深度學習可以比人類做出更好的決策,像是規劃芯片中的電路布局。
2月初,Google發表了論文《阿波羅:可遷移架構探索》(Apollo:Architecture Exploration),講述了名為Apollo的研究項目,該項目提供了一種通用的芯片架構探索框架。
芯片架構指的是芯片功能組件的設計,它們如何相互作用以及軟件程序員應如何訪問這些組件。例如,經典的Intel x86處理器具有一定數量的片上內存、專用的數學邏輯單元和寄存器以一定的組合方式組成,這種組合方式賦予「英特爾架構」以意義。
定制芯片需要高效的架構探索方法。然而,由于搜索空間呈指數級增長,而目標函數又是一個黑匣子,優化架構的參數是一個艱巨的任務,通常需要專業知識。施加在參數上的約束進一步使有效配置的識別變得復雜。
為了解決上述問題,Apollo程序執行的是適合運行某種神經網絡的架構的探索。
這樣,目標就變成了,對于芯片架構來說正確的參數是什么,對于給定的神經網絡任務,芯片應滿足哪些標準?
該團隊將目標函數定義為找到適合于給定的AI任務的某種正確的數學運算單元組合,并對超過4.52億個參數進行排序檢索,包括將使用多少個數學運算單元(處理器)以及對于給定模型而言最佳的參數存儲量和激活存儲量。
圖示:人工智能加速器芯片的搜索空間,即芯片架構必須優化的功能塊。許多AI芯片的特征是用于大量簡單數學運算的并行,相同的處理器用于執行許多矢量矩陣乘法,這是神經網絡處理的主力軍。(來源:Google Blog)
他們選擇了一個名為MobileNet的較為簡單的AI任務進行測試,這是一種由資源節約型網絡組成的卷積神經網絡。實驗演示了如何利用針對復雜的高維度的定制優化策略進行架構探索,并以合理的少量評估(約占搜索空間的0.0004%)產生大的改進(高達24.6%)。此外,他們還測試了執行諸如對象檢測和語義分段之類任務的工作負載。
Apollo可以采用多種方法進行所謂的「黑盒優化」,并且可以比較每種方法在解決不同目標的效果,使這些方法適應于特定的任務。
該團隊在架構探索的背景下探索了四種優化策略,這些優化策略實際上是為開發神經網絡體系結構而設計的,包括隨機采樣、貝葉斯優化、為「設計」 DNA序列而研發的進化搜索以及基于總體的黑盒優化(P3BO)。
對這些優化進行比較的主要目的是為了有條不紊地指出最有效的方法。實驗結果表明,進化方法和P3BO優于隨機選擇和貝葉斯優化。
圖示:Apollo的優點是可以將各種現有的優化方法相結合,以了解它們如何在優化新型芯片設計的體系結構中相互疊加。(來源:Google Blog)
Apollo的搜索是高效的,可遷移的。
研究人員將P3BO與架構解決方案的半窮盡搜索集進行了比較,發現基于總體的黑盒優化方法能夠發現并使用像是計算與內存這類的電路中權衡取舍的解決方案,而這些通常需要特定領域的知識。并且,基于總體的方法可以找到半窮盡搜索無法找到的解決方案。
因此,Apollo能夠弄清楚不同的優化方法在芯片設計中的效果如何。但是,它還可以做更多的事情,那就是它可以運用「遷移學習」展示如何依次改進這些優化。
Yazdanbakhsh及其同事將Apollo稱為「第一個可遷移的架構探索的基礎框架」,它在不同的芯片上工作的越多,越能更好地探索可能的芯片體系結構,從而將學到的知識遷移到每個新任務上。研究表明,遷移學習可以有效地改善目標體系結構的探索,尤其是當優化約束具有更嚴格的界限時。
使用AI設計運行AI的芯片具有很好的對稱性。
Apollo代表著一個有趣的發展,超越了之前所說的機器學習僅用于一些「布局與布線」之類的低層次的設計決策。相比之下,Apollo程序執行的是更高層次的「架構探索」,而不僅僅是創建類似于建筑中的平面設計圖的產物。
當被問及Dean的描述時,主要作者阿米爾雅茲丹巴赫什(Amir Yazdanbakhsh)解釋:「我會看到我們的工作和布局布線工作是正交且互補的。相比于計算堆棧中的布局布線,架構探索的層次要更高。」他認為「架構探索」是存在更高性能的改進余地的方式。
但是,為MobileNet或任何其他網絡設計的芯片受到一定程度上的適用性的限制。
文章的作者之一Berkin Akin指出優化結果是芯片和神經網絡共同優化的產物。「神經網絡架構必須了解目標硬件架構,以優化整體系統性能和能效。」他表示,Apollo對于給定的工作負載可能就足夠了,但在芯片和神經網絡之間進行「共同優化」,將在未來產生其他好處。
「我們用ML為給定的工作負載找到最佳的硬件體系結構。當然,在某些情況下,可以靈活地同時優化硬件設計和神經網絡體系結構。實際上,我們正在進行一些此類聯合優化的工作,我們希望可以取得更好的折衷。.. 」
因此,雖然芯片設計受到AI的工作量的影響,但是新的芯片設計進程也會對神經網絡的設計產生相當的影響,這類的辯證法在未來幾年中可能會以有趣的方式發展。
責任編輯:YYX
-
芯片
+關注
關注
454文章
50460瀏覽量
421964 -
Google
+關注
關注
5文章
1758瀏覽量
57418 -
AI
+關注
關注
87文章
30239瀏覽量
268472
發布評論請先 登錄
相關推薦
評論