今天,龍芯中科發布龍芯4000系列CPU芯片,分別為3A4000和3B4000。性能方面,3A4000/3B4000采用28nm FDSOI工藝,微架構為GS464V核心,通用處理性能提升一倍以上,這將成為我國自主CPU發展史上又一新的里程碑。
據悉,龍芯4000系列進一步完善對虛擬機的支持,效率達到95%以上。在相同主頻下,龍芯4000系列比3A3000的流水線效率提高50%,主頻提升至1.8GHz-2.0GHz。
龍芯中科總裁、中科院計算技術研究所總工程師、龍芯CPU首席科學家胡偉武博士介紹,龍芯4000系列是首次全面集成可信模塊、國內密碼算法、訪問控制等安全機制的CPU芯片。
也就是說,龍芯4000系列處理器除了性能大幅提升之外,還擁有片內安全機制和高效云化的特點。
據介紹,龍芯在2019年的芯片出貨量已超50萬顆。未來,龍芯中科將著重提升CPU主頻與核數,3A5000和3C5000兩款芯片將分別計劃在2020年上半年和下半年流片。
▲龍芯中科總裁、中科院計算技術研究所總工程師、龍芯CPU首席科學家胡偉武博士
一、我國自主CPU發展的里程碑
龍芯中科是國產自主高性能通用處理器技術領先者和產品提供商,搭載龍芯中科CPU的計算機已進入政府采購目錄。
龍芯脫胎于中國科學院計算所,曾研發出我國首枚擁有自主知識產權的通用高性能微處理芯片。
CPU芯片長期被英特爾等國外巨頭所壟斷,龍芯先推出的龍芯1號、龍芯2號,打破了中國缺自主研發CPU芯片的歷史,是中國形成自主知識產權計算機產業道路上的一座里程碑。
從2001年至今,龍芯研發了龍芯1號、龍芯2號、龍芯3號三個系列處理器和龍芯橋片系列。
龍芯1號系列為32位低功耗、低成本處理器,主要面向低端嵌入式和專用應用領域;龍芯2號系列為64位低功耗單核或雙核列處理器,主要面向工控和終端等領域;龍芯3號系列為64位多核系列處理器, 主要面向桌面和服務器等領域。
今天發布的龍芯3A4000是龍芯3號系列處理器的最新產品,據上一代龍芯3A3000發布已相隔兩年。
2017年時,龍芯年營收達1.5億元,利潤2000多萬元,2018年營收和利潤均比2017年翻番,利潤達到歷史最高水平,交的稅款已超過國家給龍芯各類補助的總和。
胡偉武表示,今年上半年龍芯收入已超過去年全年,利潤是去年全年的1.3倍左右,預計到2021年,龍芯交給國家的稅將超過之前所有的研發投入。
二、采用GS464v架構,實現三大特點
龍芯3A4000是龍芯第三代高性能處理器核,采用新一代處理器架構GS464V,擁有雙DDR4-2400/2133內存通道,雙HT3.0系統總線,效率提升一倍。
性能方面,其主頻為1.8GHz,睿頻2.0GHz,采用37.5mm*37.5mm封裝工藝,典型功耗為30-40W。
據胡偉武介紹,龍芯3A4000主要有三方面特點:
1、相同工藝性能成倍提高
龍芯3A4000采用28nm工藝,進一步通過設計優化提升處理器性能,反映傳統桌面性能的SPEC INT2000的單核base分值,從930分提高到了2090分。
此外,它的科學計算性能與3A3000相比,提升了4倍以上,支持128/256位向量。而3B4000支持四路直連,與3B3000雙路服務器相比,四路服務器性能亦提升了4倍。
與此同時,龍芯3A4000的虛擬機效率大幅度提高,從原先的88%提升至98%。胡偉武稱,其單核性能已高于用14nm實現的Arm處理器。
2、片內安全機制
龍芯3A4000支持AES、MD5、SHA等加解密算法,片內集成安全可信模塊,支持國密算法。
此外,它支持操作系統內核棧防護機制,支持IO防護、安全執行環境等訪問控制,其高性能密碼算法服務能力支持商密及以上算法。
3、自主研發
龍芯3A4000的所有模塊源代碼和各類全定制模塊均為自主研發,除了廠家提供的標準單元庫和內存編譯器(Memory Compiler)外,沒有任何第三方IP。
除此之外,龍芯3A4000在功耗管理和封裝方面也有了進一步提升。
一方面,它第五個核(GS132E)監控主核運行,并進行動態功耗管理。例如,搭載龍芯3A4000的筆記本電腦工作時長比3A3000相比,提高了一倍以上;
另一方面,龍芯3A4000的封裝尺寸比3A3000更小,支持普通BGA、LGA和CBGA多種封裝形式,同時其桌面主板可支持四層布線。
值得一提的是,龍芯4000系列用于片間互連及連接橋片的HT控制器帶寬提高了一倍以上,內存控制器從DDR3升級至DDR4,SPEC CPU2006定點和浮點單核分值提高到20分。
但胡偉武也指出,龍芯4000系列處理器依然存在兩大問題。
一是DDR4內存頻率不夠高。DDR4規定的速率范圍是1600至3200,而龍芯4000系列最高DDR4工作速率為2400/2133,與規定范圍還存在一定差距。
二是功耗偏大。其非向量模式的典型功耗為30至40W,主要在于工藝不夠先進,設計優化比較極致,建議科學計算環境下使用256位浮點向量時,適當降低電壓和頻率。
三、未來重點突破主頻與核數
胡偉武談到,龍芯的下一步將會把研發重點放在提高主頻與核數上。
一方面,龍芯3A5000將提高主頻至2.5GHz,采用12nm工藝,單核性能將提高至30分左右,計劃于2020年上半年流片。
同時,其內存控制器延遲/寬帶進一步優化,LLC增加一倍,實現操作系統級二進制兼容。
另一方面,龍芯3C5000將增加核數,同樣采用12nm工藝,支持4至16路服務器,計劃將于2020年下半年流片。
在胡偉武看來,目前國內CPU企業發展核心技術主要有兩個途徑,一是市場換技術,如汽車產業;二是市場帶技術,如航天產業,而龍芯中科走的則是第二條路。
龍芯中科通過體制內市場引導,帶動技術進步后,再進一步參與體制外的市場競爭。同時,龍芯CPU自主編寫CPU源代碼,在應用中不斷演進,并注重自主CPU的自主生態建設,以逐步提高產品性能和完善生態。
雖然,龍芯發展至今已經為我國半導體產業的崛起提供了不可或缺的力量。但胡偉武認為,我國自主CPU與國外先進水平相比,在通用處理能力、單核性能和設計能力三大方面還存在較大差距。
“龍芯需要練好內功,通過設計優化提高單核通用處理性能。”胡偉武說到,3A4000和3B4000已基本填補單核通用處理性能的缺陷,性能提高2至3倍(約20-30分),達到AMD的水平。
而目前,市場主流CPU使用GCC編譯的單核分值為20至40分。
四、龍芯操作系統支持軟件生態建設
胡偉武談到,龍芯的操作系統目前具有兩種商業和技術模式。
面向專門企業,龍芯提供桌面和Windows服務器系統;面向設備企業,龍芯則基于基礎版開源OS維護,支持OS、整機和應用企業。
實際上,龍芯已面向三大不同的平臺開發相應的操作系統:
1、面向通用信息化系統的Loongnix。該系統基于通用Linux平臺進行完善和優化,為統一操作系統UOS龍芯版提供支撐。
2、面向高可靠實時終端的LoongOS。該系統基于Linux/RT-Linux構建了簡潔高效的OS。
3、面向實時嵌入式應用的LoongWorks。該系統針對歷史應用,基于VxWorks內核,完善圖形和網絡等API。
另一角度看,龍芯操作系統針對不同的硬件和應用,亦分別提出了兩種不同的二進制兼容。
除此之外,胡偉武也提到,龍芯將進一步統一系統架構,構建標準規范體系,實現操作系統跨主板整機兼容和CPU代際兼容。
從龍芯3A4000開始,龍芯也將參考設計全面支持統一系統架構,開發支持ACPI主板、固件、內核及OS的參考設計,以及基于ACPI/EC筆記本標準的解決方案。
結語:我國自主CPU研發的里程碑
龍芯中科經過近二十年的發展,已經成為我國國產自主高性能通用處理器的技術領先者,不僅打破了我國缺乏自主研發CPU芯片的歷史,同時也是我國形成自主知識產權計算機產業道路上的一座里程碑。
近二十年來,龍芯的自主CPU和OS已經趨于成熟。胡偉武稱,龍芯CPU單核通用處理性能已達到AMD水平,OS成熟度也已接近Windows XP。
然而,龍芯尚未豐富的應用和產業不配套,無疑是擺在自主CPU和OS未來發展道路上的一個阻礙。未來,龍芯如何完善基礎軟件環境和配套芯片,推動CPU和OS生態的進一步成熟發展,這十分值得我們期待。
評論
查看更多