到目前為止,亞馬遜和其他大型云運營商幾乎全部使用英特爾的 Xeon 芯片。雖然在服務器芯片市場,英特爾市場占有率非常高,但亞馬遜正使用折扣策略來贏得客戶。亞馬遜表示,基于 Graviton 的云服務比英特爾處理器上運行的現有產品「成本低得多」,具體在某些處理任務上,能夠減少 45% 的成本。
智能網卡與服務器處理器有何區別?如果你指的是亞馬遜云服務(Amazon Web Services),兩者大概相差三年。在西雅圖總部,公有云市場大佬亞馬遜 re:Invent 2018 大會現場,亞馬遜推出了基于 ARM 架構的 Graviton 服務器處理器。除去已經在 AWS 運行的 Intel Xeon 和 AMD Epyc 處理器,Annapurna Labs 表示 Graviton 還支持 EC2 虛擬計算服務。2015 年,亞馬遜以 3.5 億美元收購 Annapurna Labs。早些時候,亞馬遜從 Calxeda 挖來了幾名員工,Calxeda 是一家致力于開發基于 ARM 架構服務器系統的初創公司。
過去一年的 ARM 服務器市場波譎云詭:先是高通宣布放棄 Centriq 2400;Ampere(獲得私募基金 The Carlyle Group 投資)搶先收購 X-Gene,讓 Applied Micro 終于獲得喘息之機。如此看來,AWS 創造了自己的服務器芯片,放棄使用目前 ARM 架構服務器市場最領先的 Marvell(前身為 Cavium)ThunderX2 芯片,就顯得尤為重要。然而,這并不代表 Marvell 或者 Ampere──如果未來實現了超強浮點并行處理,擁有 A64FX 處理器(48 核且具備可伸縮矢量擴展)的富士通也將縱橫 ARM 市場──ARM 芯片未來在 AWS 公有云市場一定毫無作為。我們認為 AWS 已經在 Annapurna Labs 中研發「Alpine」系列雙核及四核 ARM 芯片,為自己的服務器集群創造 SmartNIC。SmartNIC 是服務器集群不可或缺的。除了 EC2 上的 Xeon、 Epyc 和現在的 Graviton 處理器的操作系統和應用之外,服務器集幾乎能卸載所有功能,使得公有云計算核心可以極大程度上運行應用。雖然之前說過,但我們還是想再次強調:大部分 Hyperscaler 和云構建仍依賴 SmartNIC 的發展。由于 InfiniBand 網絡具備搭配智能網卡 GeniusNIC(Mellanox Technology 的命名雖然有些玩笑意味,但能看得出企圖心)的卸載模型,HPC 中心能夠進一步提升價值。最終,Mellanox Technology 的落后也是由于相同的原因:Hyperscaler 和 HPC 中心經常采用卸載計算。核心計算十分昂貴,相對而言,卸載計算就不一樣了。
2016 年 1 月,亞馬遜與 Annapurna Labs 發布了 32 位 Armv7 與 64 位 Armv8 設計,兩者已達到「企業級性能與特征」,如支持 DDR4 內存、2MB 二級緩存。自那以后,再沒有透露好更多關于「Alpine」系列芯片的消息。Arm Holdings 生產的基于 Cortex-A15 核心的雙核及四核 32 位元件,其主頻分別達到 1.4 GHz 與 1.7 GHz;基于 Cortex-A57 設計的四核元件,主頻達到 1.7 GHz。上述 Arm Cortex 核心支持超標量通道及亂序執行,但并不具備超線程。這些設備的進給量與速度并沒有任何特別之處,由于 Amazon 并未公布任何細節,我們不展開討論具體架構。但我們推測有兩點非常不可思議:亞馬遜如何生產這些廉價設備;亞馬遜如何運用服務器卸載計算以使得服務器、網絡及存儲更加高效。主流廠商的策略確定無疑:Mellanox 主推 Bluefield 多核 ARM 處理器,微軟在 Azure 公有云的服務器上使用 FPGA 作為網絡加速及計算引擎,Netronome 主推 Agilio 網絡適配器。
AWS 全球基礎設施及客戶支持業務副總裁 Peter DeSantis 在 re:Invent 2018 大會介紹了 Graviton Arm 服務器的工藝。雖然我們不清楚 Graviton 芯片,Graviton 看起來是一個更加實用的處理器,其與 Intel Skylake Xeon-D-2100 v2 類似,搭配 8 到 18 個核心,主頻在 1.6 GHz 與 2.3 GHz 之間(通常核心數越多,時鐘頻率越低)。如果打開 AWS 網站,大家會發現一句申明「Gravitons 基于 64 位 Neoverse 核心」,這幾乎能斷定 Cosmos 核心是定制的。Cosmos 包含 ARM Cortex-A72 與 Cortex-A75 設計的微調版本,意圖達到 16 納米芯片工藝水平,其代工廠很可能是***半導體制造公司(Taiwan Semiconductor Manufacturing Corp)。大家回想下,Arm 發布的 Neoverse 正是 10 月曾發布的數據中心 Arm 芯片的翻版,其每年性能提高幅度達到 30%,并將在 2021 年前完成 7 納米到 5 納米制造工藝的升級。所有 AWS 的公開信息表示,通過 EC2 A1 讓業界熟悉的 Graviton 處理器,最多支持 16 個虛擬 CPU、32GB 主內存,服務器適配器的網絡帶寬達到 10 Gb/秒,彈性塊存儲(EBS)帶寬達到 3.5 Gb/秒。當我們想了解更多技術細節時,AWS 并未確認目前使用哪個 Cosmos 核心,亦未確認 Graviton 具備 16 個核心且無法通過同步多線程(SMT)為各個核心提供虛擬多線程。(SMT 支持通常由 ARM 許可證持有用戶添加,尚未成為 ARM 基本內核許可證部分。隨著 2019 年「Ares」內核到期,情況可能會改變。)AWS 向 The Next Platform 確認,EC2 A1 具備 Graviton 芯片,主頻達 2.3 GHz。單就整數計算而言,Graviton 已能與 Xeon-D 抗衡,或許達到了 Xeon SP 的下限水平。不同 A1 的進給量和速度如下:
我們推斷內存及內存帶寬不多,可能只有一個內存控制器和兩個內存通道,最高容量 512 GB,搭配十分昂貴的 128 GB 記憶棒,即便使用便宜的 8 GB 記憶棒也可輕松達到 32GB。Annapurna Labs 可能在芯片上放置了大量內存你控制器,我們認為其并不支持 SMT,推斷芯片上具備 16 個內核。一個內存控制器搭配八個核心是很好的平衡選擇,但如果大家想讓計算能力和內存帶寬恢復平衡,四個內存控制器的效果甚至會更好。(考慮到 AWS 并未大肆炫耀,該項可能仍未實現。)A1 采用 Amazon Linux 2 系統(紅帽 Linux 與亞馬遜 CentOS 克隆版結合的自研升級系統),亦支持 RHEL 和 Ubuntu 服務器系統,未來將支持其他操作系統──如果以后 AWS Arm 服務器芯片支持 Windows Server,應該十分有趣?;?Arm 的 A1 EC2 目前在美國東部、西部及歐洲(愛爾蘭)等區域可用,訂購類型一般涵蓋 On-Demand、 Reserved、Spot、Dedicated 及 Dedicated Host。AWS 特別提醒,上述 A1 實際應用于內存帶寬不做特別限制的橫向擴展工作負載,如 Web 服務器、開發環境、緩存服務器或容器化微服務等輕量化及無狀態服務。AWS 表示與 EC2 上同等性能的 32 位服務相比,這些服務成本能降低到 45%。不過,AWS 并未說明具體的比較對象。劃重點了。我們來看看 Arm 服務器之于基礎設備的野心有多大。毫無疑問,A1 會有無數的衍生版本。對于支持極有可能成為下一代智能網卡處理器的發展來說,這是件好事。算上基于 Arm 的 A1,AWS 還在 EC2 主題上研發了一些其它基礎設施變體。新一代 C5 服務在這些變體之間的以太網速率達到每秒 100Gb,適用于那些帶寬依賴的 HPC 仿真建模、機器學習訓練及密集數據分析工作。如同 C5 和 C5d,C5n 基于雙插槽服務器節點,搭配定制 Skylake Xeon SP 8000 Platinum 系列處理器,各芯片可能具備 18 個內核且主頻達到 3 GHz。
除了額外帶寬之外,C5n 的數據隊列是 C5 和 C5d 的數倍至多──32 比 8 的彈性網絡接口(Elastic Network Interface,應用于 Annapurna 處理器,布置在網卡附近,使其更加智能──幫助網絡適配器中數據更快的在內核中流轉。無論是單個可用范圍或區域內跨越多個可用范圍,帶寬在同一區域內都可用)。C5n 可用于 EC2 及其他服務器集群,與 S3 對象存儲或 Elastic MapReduce、Relational Database Service 及 ElastiCache 等服務連接。C5n 與 A1 的可用區域一致,業務范圍還附加美國政府私有云 GovCloud。
最后,去年 10 月 AWS 推出的 P3 GPU 加速服務使得以太網達到每秒 100 Gb,服務器鏈路上限達到每秒 25 Gb。具有更快網絡的 P3dn 將于下周推出,其配備 32 GB HBM2 內存的 Volta Tesla V100 GPU 加速器,而初代 P3 配備 16 GB HBM2 內存的初代 Volta 加速器。上述服務基于一對定制 24 核 Xeon SP 處理器,機箱中最多配備 8 個 GPU。作為最大云計算提供商的 AWS 提供了 ARM,這對 ARM 來說是一次勝利。在過去五年里,Calxeda、Applied Micro、英偉達、三星、博通、、Cavium、Marvell、AMD 和高通等多家先驅投身到 Arm 服務器芯片的研發。但發展到今日,這些想去幾乎全軍覆沒。
Moor Insight & Strategy 的行業分析師帕特里克·莫爾海德(Patrick Moorhead)上周五在給 CNBC 的郵件中寫道:「AWS 接受 ARM 為 ARM 帶來了可信度,將 ARM 的業務擴展到更多的云參與者和工作負載?!贡M管亞馬遜的大部分營收仍來自商品銷售,但 AWS 已成為該公司財務健康的關鍵。第三季度,亞馬遜超過一半的營業利潤來自 AWS。亞馬遜在線商店的收入本季度同比增長 10%,而 AWS 服務的營收增長了 46%。AWS 現在有超過 125 種服務可供客戶使用,包括核心的 EC2 計算服務。在接下來的幾年里,AWS 可以發布基于更強大 ARM 芯片的新實例?,F有實例使用 ARM 于 2015 年推出的 Cortex-A72 系統。但更重要的是,其他云計算提供商將可能同樣開始使用 ARM 技術發布實例。
-
芯片
+關注
關注
453文章
50406瀏覽量
421824 -
英特爾
+關注
關注
60文章
9886瀏覽量
171523 -
亞馬遜
+關注
關注
8文章
2625瀏覽量
83191
原文標題:性價比高出英特爾45%,亞馬遜的云服務器芯片如何做到?| 解讀
文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論