在谷歌第一代可擴展分布式訓練和推理系統取得成功后,谷歌大腦團隊 DistBelief 與 Alphabet 合作,構建了用于大規模機器學習模型實施和部署的第二代系統 TensorFlow。
與 DistBelief相比,TensorFlow 的編程模型更加靈活,同時保持其高性能和對訓練的支持以及在各種異構硬件平臺上使用廣泛的機器學習模型。正如谷歌所說,“偉大的軟件最閃耀的是偉大的硬件,”谷歌的幾個團隊探索了用于機器學習應用程序的定制加速器的設計。這些努力促成了張量處理單元 (TPU) 的誕生,這是一種用于機器學習的定制專用集成電路,專為 TensorFlow 量身定制。
一年多來,谷歌在其數據中心驗證了 TPU 的性能和效率,這些 TPU 的每瓦性能優化了一個數量級。TPU 芯片更能容忍降低的計算精度,這意味著每次操作只需要很少的晶體管,從而在相同的硅流片上每秒產生更多的操作。
在定量分析方面,與現代 CPU 和 GPU 相比,TPU 的性能提高了 15-30 倍,每瓦性能提高了 30-80 倍。通過這種方式,谷歌可以以更低的成本大規模設計和部署機器學習神經網絡模型。谷歌 TPU 采用 28nm 工藝技術,運行頻率為 700MHz,運行時功耗為 40W,支持 PCIe Gen3 x16 總線,提供 12.5GB/s 的帶寬用于與其主機平臺連接。
通往谷歌珊瑚之路
Google 推出了 Coral,這是一個用于構建 AI 應用程序的完整工具包,利用高效、私密、快速和離線的設備上推理功能。所有這一切都始于 Google Edge TPU 的發布,這是一種小型專用集成電路,可為低功耗設備提供高性能 ML 推理。
單個 ASIC 每秒可以執行 4 萬億次操作 (4 TOPS),同時需要 2 瓦的功率 (2 TOPS/watt)。Cloud TPU 與 Edge TPU 非常不同,因為它們非常適合訓練可能需要數周時間才能在硬件上訓練的大型復雜機器學習模型。邊緣 TPU 專為前面提到的小型和低功耗設備而設計,是設備上 ML 推理的理想選擇。
顧名思義,Google Edge TPU 僅使用第一代 Edge TPU 支持 TensorFlow Lite,該 TPU 能夠執行卷積神經網絡 (CNN) 等深度前饋神經網絡,使其成為基于視覺的 ML 應用程序的不錯選擇。此 Edge TPU 可以執行加速機器學習訓練,但僅限于保留最后一層。但是,API 可以通過反向傳播和權重印記來執行加速遷移學習。
為了支持 Google TPU,制造商在 Coral 的引擎蓋下設計了幾個集成邊緣 TPU 的硬件。列表中的一些流行的定制硬件包括開發板和 USB 加速器——被視為許多以人工智能為中心的應用程序實驗的一部分。
來自澳大利亞聯邦科學與工業研究組織 (CSIRO)、昆士蘭大學和昆士蘭科技大學的一組研究人員報告了與廣泛采用的嵌入式處理器 Arm Cortex-A53 相比,Edge TPU 的能效性能研究結果[2]。結果表明,對于少于 5400 個輸入節點和 0.15MB 模型大小的模型,Cortex-A53 比 Edge TPU 更有效。然而,隨著模型大小的增加,Edge TPU 的性能優于 Cortex-A53——保持性能直到模型大小超過 8MB。一旦模型大小達到 13.5MB 左右,Cortex-A53 就會超過 Edge TPU,并且輸入節點數超過 5400,Cortex-A53 就非常高效。
向前邁出一步
最近,谷歌在沒有任何官方新聞稿或公告的情況下,推出了帶有板載攝像頭、麥克風和 Edge TPU 的新型 Coral 開發板 micro 的登陸頁面。65x30 mm 微型開發板比著名的羽毛外形稍大,集成了 NXP i.MX RT1176 微控制器,具有 Cortex-A7 和 Cortex-A4 以及 Coral Edge TPU 協處理器,可提供 4 TOPS。Arm 處理器在單個硅流片中的組合提供了卓越的計算能力和多種媒體功能。
根據板載組件,內置攝像頭和麥克風表明了用于原型設計和部署低功耗嵌入式系統(如對象檢測和圖像分類)的特殊設計。深度神經網絡優化了由 Edge TPU 設備上機器學習推理支持的基于視覺的應用程序的實現。除了良好的輸入/輸出連接外,12 針 GPIO 接頭使開發人員能夠將 I/O 設備連接到 Coral 微開發板。
隨著谷歌意識到需要滿足極低功耗邊緣設備的需求,以實現更快的數據處理和低延遲,谷歌發布了 Coral 開發板微,專注于微控制器驅動的 tinyML 項目。谷歌沒有透露該產品定價和可用性的許多細節,這意味著感興趣的開發者需要無限期地等待更明確的信息。
審核編輯:郭婷
-
處理器
+關注
關注
68文章
19165瀏覽量
229129 -
嵌入式
+關注
關注
5068文章
19019瀏覽量
303292 -
機器學習
+關注
關注
66文章
8377瀏覽量
132409
發布評論請先 登錄
相關推薦
評論