電子發燒友網報道(文/周凱揚)數據中心作為CPU、GPU和加速器廠商最為關注的市場,自然也少不了RISC-V這個新架構來摻和一腳。我們在之前的文章中也對RISC-V在數據中心的進展做了一些介紹,RISC-V雖然在服務器通用CPU上發力跡象不明顯,但要說AI加速器這類產品,很有可能會是RISC-V打入數據中心市場的最佳方向。
谷歌的RISC-V戰略
自己設計芯片的服務器廠商之一,谷歌,似乎也開始打算用上RISC-V。在今年9月美國的AI硬件峰會上,SiFive首席架構師和谷歌的TPU芯片架構師展示了他們的合作方案。谷歌的TPU是谷歌設計專用于機器學習的加速器,用于在數據中心上運行TensorFlow、Pytorch和JAX等機器學習框架。
而TPU的主要計算單元就是矩陣乘法打算(MXU),由脈動陣列中的128x128乘法/累積器組成,在最小配置v4版TPU中包含4個TPU芯片,每個TPU芯片都有8個MXU,是TPU v3版的兩倍,而且每個MXU都能使用BF16執行每周期16K的乘積累加運算。
然而,谷歌發現雖然TPU的機器學習算力雖然夠用,但客戶在利用這類大型AI加速器時,往往無法用它來完成其他的復雜計算負載,所以谷歌的做法是將SiFive的X280處理器核心,作為TPU的協處理器,用來提供維護和運行代碼,跑加速器沒法運行的內核。
雖然SiFive的X280主打的是加速AI/ML計算,但主要是針對邊緣端,比如AR/VR、數碼相機等等,并非用于數據中心的大型AI加速器。但在與谷歌等廠商的合作下,SiFive推出了一個名為矢量定制協處理器接口(VCIX)的技術,可以讓大型AI加速器直接與X280的32x512位矢量寄存器文件高速通信。
這相比其他方案來說,矢量寄存器層級上的訪問不僅可以提供更大的帶寬、比PCIe更低延遲,還能簡化軟件棧、省下更多的硬件資源。X280和TPU核心分工合作,前者負責運行完整的Linux系統和虛擬機管理程序,后者負責密集的機器學習運算。
英特爾HorseCreek初見端倪
早在去年,英特爾就宣布將會用到SiFive的P550高性能RISC-V核心,以及自己的7nm工藝(即現在的Intel4工藝)來打造一款RISC-V SoC,代號名為HorseCreek。雖然到了2022年,SiFive最高性能的核心已經成了P650。但作為一個十三級流水線、三發射、亂序的64位RISC-V核心,P550的性能仍然是相當能打的,SiFive給到的定位也是對標ARM的Cortex-A75,同時只需不到一半的面積。
不過消息公布后,英特爾雖然又開展了一系列與RISC-V相關的行動,比如加入RISC-V國際基金會、IFS支持RISC-V芯片代工和推出RISC-V的FPGA開發平臺等等,但HorseCreek卻始終不見蹤影。
而在今年的IntelInnovation大會上,英特爾的不少合作伙伴都在現場搭建了展臺,也有參會者終于在現場看到了HorseCreek的真面目。在Intel4工藝的加持下,HorseCreek將4個2.2GHz的SiFiveP550核心、DDR5和PCIe5集成到了4mmx4mm的單個裸片上,連英特爾CEO PatGelsinger本人也親自來展臺查看HorseCreek的開發平臺。
根據展臺上公開的數據,HorseCreek配備了三級緩存,包括私有二級緩存和通用三級緩存。DDR5這塊集成了英特爾的DDR PHY、DFI接口與Cadence的DDR內存控制器,支持到5600頻率的DDR5內存,PCIe5.0部分集成了英特爾的PCIePhy和新思的PCIeRootHub控制器。除了英特爾提供的PLL、內存編譯器、標準單元等數模IP以外,HorseCreek還用到了其他的IP,比如西門子的DFT和新思的NOC Fabric。
從以上數據可以看出,HorseCreek是一個集SiFive、英特爾和EDA廠商IP大成的SoC。如此強大的SoC加上豐富的接口支持,完全可以用于數據中心里。不過,HorseCreek的首個終端產品形態應該是SiFive的下一代HiFive開發板。上一代的HiFive Unmatched開發板已經售罄了,在疫情相關的供應鏈問題下,SiFive已經放棄了補貨的打算,轉而全力去打造下一代基于HorseCreek的HiFive開發板。
又一個千核RISC-V芯片
在戴爾的HPC社區大會上,來自美國的初創半導體公司InspireSemiconductor公布了他們為數據中心提供的RISC-V加速器方案,同時還給出了另一個有趣的說法,那就是現有的高性能計算方案已經“不夠好”了。
在他們看來,目前的主流數據中心CPU都太慢了,無論有無加速器的輔助都是如此,而在有了加速器以后,90%的高性能計算都是由加速器負責了。再者就是GPU和FPGA的方案,InspireSemiconductor指出這兩者的編程太復雜了,不僅鎖定了軟件棧,而且需要特定的技能才能獲得足夠好的計算結果。而ASIC和AI加速器的風險又太高了,從成本、時間上看都是如此。
為此,InspireSemiconductor推出了他們的RISC-V加速器方案,Thunderbird。Thunderbird在單芯片上集成了2560個64位的CPU核心,單個PCIe加速卡上的核心數量更是超過5000個。InspireSemiconductor稱他們用到了創新的高速互聯方案,在高效利用這么多核心的同時,最高可以組成256個芯片的陣列。
相較其他加速器和GPU方案,Thunderbird加速器也有著功耗上的優勢,單芯片的功耗在175W左右,同時他們給出了20W/Tflops的能效比,看來Thunderbird的峰值算力大概就在8.75Tflops左右了。雖然會上InspireSemiconductor也展示了谷歌、聯想和IBM等客戶或合作伙伴的一些反饋,但這些不少是客套話,是否已經用于這些公司的數據中心方案中還不好說。
InspireSemiconductor同時承諾了一個對開發者友好的軟件生態系統,但他們并沒有給出自己的軟件方案,而是指出Thunderbird將充分利用RISC-V已有的豐富軟件生態系統,比如OneAPI等,所以不必像競品芯片那樣去開發一次性的軟件棧。如此一來更適合那些喜歡標準CPU編程模型的開發者,無需像GPU那樣去學習CUDA、OpenCL,而是可以用Pragma和MPI這樣的標準編譯器方案。
AI編程上也是如此,InspireSemiconductor指出流行的AI框架,諸如TensorFlow、Pytorch和Glow等都已有了對RISC-V的支持,Linux也在操作系統支持的行列中。如此看來,InspireSemiconductor目前應該只提供了純硬件方案,而這樣的產品是否能在市面上取得成功,目前看來完全取決于英特爾Codeplay那邊的OneAPI軟件生態了。
谷歌的RISC-V戰略
自己設計芯片的服務器廠商之一,谷歌,似乎也開始打算用上RISC-V。在今年9月美國的AI硬件峰會上,SiFive首席架構師和谷歌的TPU芯片架構師展示了他們的合作方案。谷歌的TPU是谷歌設計專用于機器學習的加速器,用于在數據中心上運行TensorFlow、Pytorch和JAX等機器學習框架。
而TPU的主要計算單元就是矩陣乘法打算(MXU),由脈動陣列中的128x128乘法/累積器組成,在最小配置v4版TPU中包含4個TPU芯片,每個TPU芯片都有8個MXU,是TPU v3版的兩倍,而且每個MXU都能使用BF16執行每周期16K的乘積累加運算。
然而,谷歌發現雖然TPU的機器學習算力雖然夠用,但客戶在利用這類大型AI加速器時,往往無法用它來完成其他的復雜計算負載,所以谷歌的做法是將SiFive的X280處理器核心,作為TPU的協處理器,用來提供維護和運行代碼,跑加速器沒法運行的內核。
雖然SiFive的X280主打的是加速AI/ML計算,但主要是針對邊緣端,比如AR/VR、數碼相機等等,并非用于數據中心的大型AI加速器。但在與谷歌等廠商的合作下,SiFive推出了一個名為矢量定制協處理器接口(VCIX)的技術,可以讓大型AI加速器直接與X280的32x512位矢量寄存器文件高速通信。
這相比其他方案來說,矢量寄存器層級上的訪問不僅可以提供更大的帶寬、比PCIe更低延遲,還能簡化軟件棧、省下更多的硬件資源。X280和TPU核心分工合作,前者負責運行完整的Linux系統和虛擬機管理程序,后者負責密集的機器學習運算。
英特爾HorseCreek初見端倪
早在去年,英特爾就宣布將會用到SiFive的P550高性能RISC-V核心,以及自己的7nm工藝(即現在的Intel4工藝)來打造一款RISC-V SoC,代號名為HorseCreek。雖然到了2022年,SiFive最高性能的核心已經成了P650。但作為一個十三級流水線、三發射、亂序的64位RISC-V核心,P550的性能仍然是相當能打的,SiFive給到的定位也是對標ARM的Cortex-A75,同時只需不到一半的面積。
不過消息公布后,英特爾雖然又開展了一系列與RISC-V相關的行動,比如加入RISC-V國際基金會、IFS支持RISC-V芯片代工和推出RISC-V的FPGA開發平臺等等,但HorseCreek卻始終不見蹤影。
根據展臺上公開的數據,HorseCreek配備了三級緩存,包括私有二級緩存和通用三級緩存。DDR5這塊集成了英特爾的DDR PHY、DFI接口與Cadence的DDR內存控制器,支持到5600頻率的DDR5內存,PCIe5.0部分集成了英特爾的PCIePhy和新思的PCIeRootHub控制器。除了英特爾提供的PLL、內存編譯器、標準單元等數模IP以外,HorseCreek還用到了其他的IP,比如西門子的DFT和新思的NOC Fabric。
又一個千核RISC-V芯片
在戴爾的HPC社區大會上,來自美國的初創半導體公司InspireSemiconductor公布了他們為數據中心提供的RISC-V加速器方案,同時還給出了另一個有趣的說法,那就是現有的高性能計算方案已經“不夠好”了。
在他們看來,目前的主流數據中心CPU都太慢了,無論有無加速器的輔助都是如此,而在有了加速器以后,90%的高性能計算都是由加速器負責了。再者就是GPU和FPGA的方案,InspireSemiconductor指出這兩者的編程太復雜了,不僅鎖定了軟件棧,而且需要特定的技能才能獲得足夠好的計算結果。而ASIC和AI加速器的風險又太高了,從成本、時間上看都是如此。
為此,InspireSemiconductor推出了他們的RISC-V加速器方案,Thunderbird。Thunderbird在單芯片上集成了2560個64位的CPU核心,單個PCIe加速卡上的核心數量更是超過5000個。InspireSemiconductor稱他們用到了創新的高速互聯方案,在高效利用這么多核心的同時,最高可以組成256個芯片的陣列。
InspireSemiconductor同時承諾了一個對開發者友好的軟件生態系統,但他們并沒有給出自己的軟件方案,而是指出Thunderbird將充分利用RISC-V已有的豐富軟件生態系統,比如OneAPI等,所以不必像競品芯片那樣去開發一次性的軟件棧。如此一來更適合那些喜歡標準CPU編程模型的開發者,無需像GPU那樣去學習CUDA、OpenCL,而是可以用Pragma和MPI這樣的標準編譯器方案。
AI編程上也是如此,InspireSemiconductor指出流行的AI框架,諸如TensorFlow、Pytorch和Glow等都已有了對RISC-V的支持,Linux也在操作系統支持的行列中。如此看來,InspireSemiconductor目前應該只提供了純硬件方案,而這樣的產品是否能在市面上取得成功,目前看來完全取決于英特爾Codeplay那邊的OneAPI軟件生態了。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
英特爾
+關注
關注
60文章
9886瀏覽量
171525 -
谷歌
+關注
關注
27文章
6142瀏覽量
105100 -
數據中心
+關注
關注
16文章
4688瀏覽量
71956 -
RISC-V
+關注
關注
44文章
2229瀏覽量
46030
發布評論請先 登錄
相關推薦
RISC-V發展及FPGA廠商為什么選擇RISC-V
Microsemi 于 2017 年開始在其 FPGA 中提供 RISC-V 軟核,Lattice 于 2020 年開始提供,英特爾 (Altera) 于 2021 年
AMD數據中心營收首超英特爾
在這一領域的地位開始受到挑戰,也預示著數據中心市場競爭格局的轉變。 具體數據顯示,AMD 在2024年第三季度的數據中心業務收入達到了35.49億美元(按照當前匯率計算,約合人民幣25
AMD數據中心業務首超英特爾,Nvidia異軍突起
長期以來,英特爾在數據中心CPU市場占據主導地位,其Xeon處理器為絕大多數服務器提供動力。大約七、八年前,AMD的處理器在市場份額中還只是個位數。然而,這一局面已經發生了翻天覆地的變化。盡管
RISC-V,即將進入應用的爆發期
自己增加指令和自己的功能。RISC-V架構可以用于數據中心、車用、移動設備等任何AI需求產品。
展望RISC-V前景,此前硅谷芯片傳奇Jim Keller曾指出,“RISC-V的潛力是
發表于 10-31 16:06
RISC-V擁有巨大市場潛力的原因
敏感的市場尤其有吸引力。
5、行業支持:越來越多的行業巨頭和初創公司開始支持RISC-V,這不僅包括芯片制造商,還包括軟件開發商和系統設計公司。2023年,包括谷歌、英特爾、英偉達、高
發表于 09-30 14:20
英特爾數據中心XPU產品最新進展:預計2027年發布
據匈牙利媒體PROHARDVER!的最新報道,英特爾正緊鑼密鼓地在其內部開發新一代數據中心XPU產品,并有望于2027年正式發布。這一消息標志著英特爾在數據中心計算領域的又一重要布局,
risc-v的發展歷史
Foundation),旨在促進RISC-V架構的發展和推廣。該基金會由大量的企業和機構支持,包括英特爾、Nvidia、谷歌、華為、IBM、紅帽、西部數據等。
2015年:
發表于 07-29 17:20
RISC-V適合什么樣的應用場景
研發成本,不受任何專利或版權制約,這對于汽車電子等成本敏感型領域尤為重要。
5. 數據中心和云計算
高性能和能效比:RISC-V處理器在性能和能效比方面表現出色,適用于數據中心和云計算領域對高性能計算
發表于 07-29 17:16
RISC-V在中國的發展機遇有哪些場景?
的理想選擇。
生態系統建設:多家頭部芯片公司和生態廠商正在積極推進RISC-V在車規級產品的布局,這將有助于RISC-V在汽車領域的快速發展。
4. 數據中心和高性能計算(HPC)
性能與能效比
發表于 07-29 17:14
risc-v多核芯片在AI方面的應用
應用中的成本。
最后,RISC-V多核芯片不僅可以應用于AI邊緣計算領域,還可以擴展到其他領域,如數據中心、云計算、自動駕駛、機器人等,為這些領域提供高效、靈活和安全的解決方案。
總的來說,R
發表于 04-28 09:20
賽昉科技與超聚變達成戰略合作,RISC-V在數據中心迎來歷史性跨越
;賽昉科技聯合創新中心,賽昉科技為數據中心場景打造的首款研發代號為“獅子山”的RISC-V芯片將應用在超聚變的智算產品中。貫徹發展新質生產力的時代要求,賽昉科技將持續打造具
RISC-V 基礎學習:RISC-V 基礎介紹
同一個存儲器的不同物理位置,因此程序指令和數據的寬度相同,如英特爾公司的8086中央處理器的程序指令和數據都是16位寬。
數學家馮·諾依曼提出了計算機制造的三個基本原則,即采用二進制邏輯、程序存儲執行
發表于 03-12 10:25
【RISC-V開放架構設計之道|閱讀體驗】 RISC-V設計必備之案頭小冊
。在書中,特別提到了匯編器對于RISC-V中的作用,包括當講寄存器硬連線為0時,可以使用偽指令來簡化常規操作,如跳轉、返回和等于零時分支等。
浮點運算和壓縮指令數據集的知識則是放在下一次的帖子中說。
發表于 01-22 16:24
英特爾任命Justin Hotard為數據中心與人工智能事業部總經理
Hotard將加入英特爾高級領導層,向公司首席執行官帕特·基辛格直接匯報。他將全權負責英特爾囊括企業及云等多領域的數據中心系列產品,如至強處理器系列、GPU及加速器等。在AI無處不在的戰略規劃中,他也將發揮關鍵作用。
英特爾攜手京東云構建綠色數據中心高密度算力方案,降低TCO和碳排放
54V,有效降低了電源全鏈路損耗,改善了數據中心能效。結合在氣流優化、液冷散熱等方面的技術改進,以及第四代英特爾 至強 可擴展處理器帶來的更高能耗比,我們推出了綠色的高密度算力整機柜方案,打造了可持續的
評論