寒武紀(jì)在官網(wǎng)披露7納米AI訓(xùn)練芯片思元 290 智能芯片及加速卡、玄思1000智能加速器相關(guān)信息,并表示該系列產(chǎn)品去年已經(jīng)實現(xiàn)規(guī)模化出貨。該披露信息中有幾個關(guān)鍵詞:“7nm””量產(chǎn)”“AI訓(xùn)練芯片”。網(wǎng)友評價寒武紀(jì)太低調(diào)了,其他AI芯片大廠發(fā)布一顆7納米芯片,得開各種發(fā)布會讓全世界知道,而寒武紀(jì)只是在官網(wǎng)披露一下,沒有任何其他動作。
異常低調(diào)的發(fā)布
記者查看了寒武紀(jì)創(chuàng)始人陳天石的微信,他只是于昨天早上9:02分在微信朋友圈發(fā)布了一條只有9個字的信息“思元290正式亮相”,轉(zhuǎn)發(fā)的是寒武紀(jì)公司公眾號內(nèi)容,非常低調(diào)。但這并不影響資本市場的敏感嗅覺,昨天寒武紀(jì)的股價上漲了17.73%,收報170元。隨著寒武紀(jì)的訓(xùn)練產(chǎn)品線集中亮相,寒武紀(jì)從訓(xùn)練芯片到云、邊、端等業(yè)務(wù)布局已經(jīng)清晰呈現(xiàn)。
思元290芯片以及這些加速卡為何物?在AI芯片市場處于什么樣的地位?對于寒武紀(jì)與業(yè)界有什么突破價值?
人工智能芯片有很多種分類方法:按功能來說,分為訓(xùn)練芯片和推理芯片;按應(yīng)用場景來說,分為云端和終端芯片;按照技術(shù)架構(gòu)來說,分為馮諾依曼架構(gòu)和非馮架構(gòu)芯片,諸如類腦芯片等。這次寒武紀(jì)推出的思元290智能芯片是其首顆訓(xùn)練芯片。為什么要做AI訓(xùn)練芯片? AI訓(xùn)練芯片市場有多大?其紅利有多“紅”?實際上,看看英偉達公司股價這些年在市場上的“一騎絕塵”,就很好理解。
隨著AI算法突飛猛進的發(fā)展,越來越多的模型訓(xùn)練需要巨量的算力支撐,才能快速有效實施,可以說算力是人工智能應(yīng)用取得突破的決定因素。目前,英偉達在全球云端訓(xùn)練芯片市場一家獨大,其GPU+CUDA計算平臺被認(rèn)為是最成熟的AI訓(xùn)練方案。此外,還有第三方異構(gòu)計算平臺OpenCL+AMD GPU以及云計算服務(wù)商自研加速芯片這兩種方案,全球各路芯片廠商基于不同方案,都推出了針對于云端訓(xùn)練的人工智能芯片。
從介紹來看,寒武紀(jì)推出的首顆訓(xùn)練芯片思元290,采用臺積電7nm制程工藝,集成460億個晶體管,支持MLUv02擴展架構(gòu),全面支持AI訓(xùn)練、推理或混合型人工智能計算加速任務(wù)。相比此前寒武紀(jì)推出的思元270芯片,思元290芯片可實現(xiàn)峰值算力提升4倍、內(nèi)存帶寬提高12倍、芯片間通訊帶寬提高19倍,可提供更優(yōu)性能功耗比,以及多 MLU 系統(tǒng)的擴展能力。
產(chǎn)品具有標(biāo)志性意義
思元290芯片有三大關(guān)鍵亮點。
其一采用7納米工藝制程。目前能夠提供7納米制程芯片的設(shè)計企業(yè),除了海思、英偉達等,寒武紀(jì)是少數(shù)進入這個陣營的創(chuàng)業(yè)企業(yè)。賽迪顧問集成電路產(chǎn)業(yè)研究中心分析師李秧認(rèn)為,其工藝水平實現(xiàn)7納米制程,無論在中國還是全球都是比較領(lǐng)先的,而且支持訓(xùn)練。從技術(shù)上看是具有標(biāo)志性意義的。
思元290問世,網(wǎng)友“無關(guān)風(fēng)月”在相關(guān)新聞下評論稱:“武紀(jì)真是低調(diào),發(fā)7nm制程的芯片,居然顯得如此的平靜。目前英偉達的RTX 30系也才用到7nm制程工藝。”工藝越高意味著復(fù)雜度也越高,能集成的晶體管數(shù)也越多,這次思元290晶體管數(shù)超過了460億個。
網(wǎng)友“無關(guān)風(fēng)月”提及的英偉達RTX 30系列,是去年9月由英偉達創(chuàng)始人兼CEO黃仁勛在自家廚房發(fā)布(黃仁勛最近喜歡在家中廚房舉行直播發(fā)布會),RTX 30基于8納米工藝由三星代工,黃仁勛認(rèn)為RTX架構(gòu)是英偉達有史以來提升最大的產(chǎn)品迭代。
其二是寒武紀(jì)的多芯互聯(lián)技術(shù)MLU-Link。目前,算法模型復(fù)雜度在不斷增加,對算力和訓(xùn)練的速度提出了更高的要求,為了構(gòu)建更強大的計算平臺,需要多芯片之間進行互聯(lián)。而寒武紀(jì)最新推出的多芯互聯(lián)技術(shù),首次用在了思元290芯片上。有了這個技術(shù),多卡矩陣就可以很輕松地鏈接起來。業(yè)內(nèi)人士認(rèn)為,每顆思元290的多芯互聯(lián)總帶寬能達到600GB/s,這個數(shù)據(jù)與世界上最快的卡相當(dāng)。同時稱,寒武紀(jì)的mlulink多芯互聯(lián)技術(shù)應(yīng)用起來很方便,尤其是對于算力中心,高效而簡潔。據(jù)介紹,寒武紀(jì)首款智能加速器玄思1000包含4片思元290智能加速卡,最大AI算力超過4100萬億次每秒(4.1 PetaOPS INT4),一臺玄思 1000 計算單元就足以替代一個小型傳統(tǒng)超級計算中心。
其三是寒武紀(jì)對應(yīng)用生態(tài)的支撐進一步提速。寒武紀(jì)稱Neuware提供完善的開發(fā)工具包和社區(qū)支持,幫助用戶在思元290芯片上進行方便、靈活的定制開發(fā)及部署工作。
軟件平臺和工具鏈?zhǔn)切酒緲?gòu)建生態(tài)的必備武器,英偉達之所以能夠聚集起強大的AI生態(tài),不僅僅是因為其芯片性能強大,與其軟件平臺和工具鏈的完善息息相關(guān)。某種意義上說,英偉達的“硬實力”得益于其“軟”實力,一定也不為過。
寒武紀(jì)稱,其Neuware軟件棧為思元 290 芯片提供完善的軟件及應(yīng)用生態(tài),支持業(yè)界主流的TensorFlow和PyTorch等深度學(xué)習(xí)框架,用戶不需要改變使用習(xí)慣,即可在思元 290 芯片上實現(xiàn)圖形圖像、語音、NLP、搜索推薦等多種應(yīng)用的訓(xùn)練和推理。
寒武紀(jì)從終端 IP 場景開始,連續(xù)推出了寒武紀(jì)1A、寒武紀(jì)1H、寒武紀(jì)1M 系列處理器,其后布局云端智能芯片及加速卡系列產(chǎn)品思元100和思元270,在2019 年推出基于思元 220 芯片的邊緣智能加速卡。由此建立起覆蓋云邊端、訓(xùn)練、推理的產(chǎn)品矩陣,并打造了平臺級基礎(chǔ)系統(tǒng)軟件Cambricon Neuware。這次發(fā)布思元290之后,寒武紀(jì)的產(chǎn)品布局就實現(xiàn)了“訓(xùn)推一體、端云融合”。短短幾年,寒武紀(jì)就成為少數(shù)幾家全面系統(tǒng)掌握了通用型智能芯片及其基礎(chǔ)系統(tǒng)軟件研發(fā)和產(chǎn)品化核心技術(shù)的企業(yè)。
財報預(yù)測仍將持續(xù)虧損
此前,有機構(gòu)希望邀請陳天石去大型會議做演講,陳天石婉拒并表示目前希望專注把產(chǎn)品和技術(shù)做好。或許,對于芯片公司而言,產(chǎn)品是面對市場的核心之劍,做好產(chǎn)品就是最好的宣傳。
寒武紀(jì)財報顯示,2020年上半年營收8720.34萬元,同比下降11.01%,虧損2.02億元,其中研發(fā)費用占營收比重為318.1%,同比增加182.69%;去年前三季度營收1.58億元,同比上漲42.97%,虧損約3.095億元,研發(fā)費用4.33億元,同比上漲32.78%。財報稱,公司預(yù)測四季度仍將持續(xù)虧損,主要系公司目前仍屬于大規(guī)模研發(fā)投入階段。
現(xiàn)在是芯片企業(yè)最好的時代。埋頭苦干,給出更優(yōu)的產(chǎn)品,或許是芯片企業(yè)迎接這個時代最好的姿態(tài)。
責(zé)任編輯:tzh
-
芯片
+關(guān)注
關(guān)注
453文章
50402瀏覽量
421802 -
gpu
+關(guān)注
關(guān)注
28文章
4700瀏覽量
128700 -
AI
+關(guān)注
關(guān)注
87文章
30140瀏覽量
268411 -
人工智能
+關(guān)注
關(guān)注
1791文章
46855瀏覽量
237551
發(fā)布評論請先 登錄
相關(guān)推薦
評論