電子發(fā)燒友網(wǎng)報道(文/周凱揚)近年來,RISC-V已經(jīng)成了業(yè)界不可忽視的成功ISA之一,出貨核心數(shù)超過百億顆,但這百億核心中大部分用在了低功耗IoT等應(yīng)用上。隨著高性能計算已經(jīng)進(jìn)入Exascale時代,后發(fā)的RISC-V是否有機會在HPC市場占據(jù)一席之地,是不少廠商和開發(fā)者都在琢磨的問題。
其實從去年開始,RISC-V就已經(jīng)在往這個方向發(fā)力了,各種高性能RISC-V處理器的橫空出世,終結(jié)了RISC-V只能做中低端的論點。RISC-V國際基金會也在去年將HPC標(biāo)記為RISC-V發(fā)展的戰(zhàn)略優(yōu)先領(lǐng)域之一。倪光南院士在上周舉辦的玄鐵RISC-V生態(tài)大會上,也強調(diào)了發(fā)展基于RISC-V架構(gòu)的DSA新型服務(wù)器是中國的一大機遇。既然如此,市面上已有的高性能RISC-V處理器究竟表現(xiàn)如何,又是否已經(jīng)建立起相關(guān)的生態(tài)呢?
SiFive
作為RISC-V IP生態(tài)的中堅力量之一,SiFive已經(jīng)推出了一系列RISC-V IP產(chǎn)品,包括主打高性能的Performance系列、主打AI算力的Intelligence、面向汽車市場的Automotive系列和面向低功耗IoT應(yīng)用的Essential。
P670作為SiFive Performance系列的主打產(chǎn)品,采用了四發(fā)射13級流水線的設(shè)計,相較上一代P550,有了50%以上的性能提升。即便是相比Arm的Cortex-A78,依然有著明顯的PPA優(yōu)勢。P670的SpecINT2K6/GHz跑分在12以上,已經(jīng)可以滿足部分商用服務(wù)器的性能要求。
以算能的SG2380為例,這是一款2.5GHz 16核 RISC-V處理器,也是計劃于今年出貨的高性能大模型加速器。算能宣稱這是RISC-V在LLM應(yīng)用架構(gòu)設(shè)計上的全新嘗試,旨在為移動終端提供最強的大模型性能,支持Llama、StableDiffusion等語言、視覺類大模型支持。SG2380采用了RISC-V CPU+TPU的設(shè)計,而CPU部分正是基于SiFive P670打造,TPU則是基于SiFive的X280打造。
為了追求更高的性能,為數(shù)據(jù)中心提供更高的通用算力支持,SiFive于去年發(fā)布Performance的下一代旗艦產(chǎn)品P870。P870采用了6-wide、4發(fā)射、最多配置16核的設(shè)計,SpecINT2K6/GHz跑分高達(dá)18以上。SiFive表示P870非常適合用于消費級應(yīng)用,或是搭配Vector處理器用于數(shù)據(jù)中心。
為支持下一代高性能應(yīng)用,SiFive也已經(jīng)圍繞其RISC-V打造了一系列解決方案,比如Hypervision拓展和系統(tǒng)級的虛擬化IP,WorldGuard系統(tǒng)安全保護(hù)等,都能進(jìn)一步加快RISC-V在HPC和數(shù)據(jù)中心等應(yīng)用上的部署。
除此之外,SiFive也已經(jīng)在規(guī)劃下一代高性能核心,Napa。不過SiFive目前尚未透露更多關(guān)于Napa的情報,可以預(yù)想Napa會支持更多的核心數(shù)量,采用更先進(jìn)的工藝,并提供更高的性能。
平頭哥
平頭哥的C910在2020年面世之際可謂是當(dāng)時為數(shù)不多的RISC-V處理器中,性能最靠前的產(chǎn)品。這個在當(dāng)時就采用了12級流水線設(shè)計的處理器,在臺積電12nm的工藝支持下,跑分達(dá)到了6 DIMPS/MHz和7 Coremark/MHz,已經(jīng)可以超越Arm Cortex-A73,更是超越了當(dāng)時市面上其他亂序RISC-V處理器。
今年,法國云服務(wù)廠商Scaleway推出了基于平頭哥曳影1520 SoC打造的云服務(wù)器實例,這也是首個登錄公開商用云服務(wù)平臺的RISC-V產(chǎn)品,而曳影1520 SoC的CPU部分正是基于四核玄鐵C910的設(shè)計。除了云實例之外,全球首款RISC-V筆記本電腦ROMA,也是基于曳影1520 SoC打造,足以說明C910在通用計算性能上的優(yōu)秀。
去年11月,平頭哥進(jìn)一步發(fā)布了C920這個加強AI計算的9系列玄鐵處理器,維持了12級流水線的設(shè)計,但增加了可選配的亂序Vector運算單元,支持最新的Vector 1.0擴展。得益于新的運算單元,C920主要應(yīng)用于有高并發(fā)算力需求的人工智能、自動駕駛和網(wǎng)絡(luò)通信等領(lǐng)域。
算能科技也基于玄鐵C920打造了SG2042,作為全球首個商用量產(chǎn)的64核RISC-V CPU,SG2042還支持雙路CPU互聯(lián),典型功耗卻只有120W。且在PLCT的支持下,SG2042目前已經(jīng)適配了Ubuntu、Arch Linux、openEuler、Deepin等多款操作系統(tǒng),F(xiàn)irefox 和 LibreOffice 等常用辦公軟件也能成功運行。
今年的玄鐵RISC-V生態(tài)大會上,達(dá)摩院院長張建鋒透露C930也將在年內(nèi)發(fā)布,玄鐵C930兼容RVA24 Profile,SpecINT2006最高跑分可達(dá)15/GHz,令人期待未來會有哪些產(chǎn)品基于玄鐵C930打造,以及阿里云是否會開始基于RISC-V硬件提供云實例。
Tenstorrent
Tenstorrent作為業(yè)界炙手可熱的初創(chuàng)企業(yè)之一,已然成為絕大多數(shù)RISC-V會議的常客了,基于同一設(shè)計,Tenstorrent于短短一年的時間內(nèi),發(fā)布了五款RISC-V亂序處理器IP,其中Alastor和Ascalon是他們的高性能RISC-V處理器產(chǎn)品,前者針對客戶和邊緣端市場,后者針對服務(wù)器、筆記本和HPC市場。
Tenstorrent的RISC-V處理器IP的高性能設(shè)計,主要體現(xiàn)在指令集解碼器的寬度。要知道目前的主流x86處理器架構(gòu)設(shè)計,一般不會超過six-wide,比如AMD的Zen 4為4-wide,而英特爾的Golden Cove為6-wide,上面提到的P870也只是6-wide。
而Alastor采用了6-wide指令集解碼器寬度的設(shè)計,Ascalon更是做到了6-wide指令集解碼器寬度。這自然也離不開Tenstorrent的“蘋果背景”,畢竟無論是現(xiàn)任CEO,被譽為硅仙人的Jim Keller,還是Tenstorrent的首席CPU架構(gòu)師Wei-Han Lien,都是蘋果寬CPU微架構(gòu)背后的功臣,蘋果M1、A14等芯片的CPU均采用了8-wide的設(shè)計。
Ascalon集成了六個ALU、兩個FPU和兩個Vector單元,規(guī)格相當(dāng)高,所以主要用于高端服務(wù)器、數(shù)據(jù)中心、科學(xué)計算、大規(guī)模虛擬化以及實時數(shù)據(jù)分析之類的商業(yè)高性能計算應(yīng)用。從去年Tenstorrent給出的SpecINT2017/GHz成績來看(Alastor 1.9,Ascalon 2.2),Ascalon 跑分甚至超過了市面上所有主流服務(wù)器CPU核心,僅次于預(yù)測的AMD Zen 5跑分。
除了高性能計算通用核心外,Tensorrent打造了專用于神經(jīng)網(wǎng)絡(luò)推理和訓(xùn)練的專用核心,Tensix。Tensix支持主流數(shù)據(jù)精度,比如BF4、BF8、INT8、FP16甚至是FP64。相較只提供IP和Chiplet解決方案的RISC-V IP,Tensorrent將提供為Tensix提供IP、Chiplet、芯片、板卡、系統(tǒng)到云的一整套方案。不過將于今年推出的Grendel,將采用CPU+ML Chiplet的設(shè)計方案,屆時應(yīng)該會打通Tensorrent現(xiàn)有的RISC-V CPU和AI IP方案。
除了已經(jīng)開放購買的一些開發(fā)板、擴展卡產(chǎn)品外,Jim Keller也在不遺余力地為Tenstorrent尋找生態(tài)鏈伙伴,無論是三星、臺積電這樣的晶圓代工廠,還是Silicon Box 這樣的Chiplet制造廠商等,都與其達(dá)成了合作。
寫在最后
如果單從絕對性能上看,目前RISC-V處理器和主流x86產(chǎn)品還是存在一些差距,但其實隨著HPC和AI需求暴漲,在相關(guān)的應(yīng)用開發(fā)上,大家已經(jīng)意識到一味地追求計算性能本身帶來的收益越來越少,反而是對架構(gòu)、指令集等進(jìn)行優(yōu)化帶來的收益越來越高。而RISC-V架構(gòu)的靈活可定制性,恰恰給到了彎道超車的機會。
不過高性能處理器依然是一個必備的敲門磚,因此RISC-V在HPC領(lǐng)域還有很長的一段路要走。除此之外,如何與現(xiàn)有的HPC供應(yīng)鏈和開發(fā)生態(tài)達(dá)成協(xié)作,是RISC-V必須考慮的一件事,比如如何與服務(wù)器OEM合作,按照OCP項目的標(biāo)準(zhǔn)打造通用的服務(wù)器解決方案;又或是如何把盡快將眾多關(guān)鍵HPC庫和工具移植到RISC-V的硬件平臺之上。
-
HPC
+關(guān)注
關(guān)注
0文章
312瀏覽量
23689 -
RISC-V
+關(guān)注
關(guān)注
44文章
2233瀏覽量
46045
發(fā)布評論請先 登錄
相關(guān)推薦
評論