本站原創(chuàng),作者:章鷹,電子發(fā)燒友執(zhí)行副主編。
2019年,人工智能是最受矚目的領(lǐng)域,從醫(yī)療保健到招聘各個行業(yè)都在擁抱AI。縱觀全球,盡管軟件和算法演進很快,但硬件和算力的結(jié)合卻能使AI的落地場景演進成為可能。在AI市場,全球領(lǐng)先的公司英偉達,已經(jīng)從游戲、超級計算機到神經(jīng)網(wǎng)絡的大型計算應用領(lǐng)域建立業(yè)界標準,過去的半年中,以寒武紀、華為、阿里巴巴為代表中國軍團對云端AI市場不斷推出新品,對這個領(lǐng)域全球競爭秩序發(fā)起了沖擊。
中國云端AI市場,三大廠商密集發(fā)布新品上市
2019年6月20日,寒武紀宣布推出第二代云端AI芯片思云270及板卡產(chǎn)品。處理非稀疏深度學習模型的理論峰值性能提升至上一代MLU100的4倍,達到128TOPS(INT8);同時兼容INT4和INT16運算,理論峰值分別達到256TOPS和64TOPS;支持浮點運算和混合精度運算。
圖:寒武紀思云270芯片。
8月23日,華為正式發(fā)布算力最強的AI處理器Ascend910(昇騰910),同時推出了全場景AI計算框架MindSphore。實際測試結(jié)果表明,在算力方面,昇騰910完全達到了設計規(guī)格,即:半精度(FP16)算力達到256Tera-FLOPS,整數(shù)精度(INT8)算力達到512Tera-OPS;重要的是,達到規(guī)格算力所需功耗僅310W,明顯低于設計規(guī)格的350W。
圖:華為昇騰910現(xiàn)場展示。
9月25日,在杭州云棲大會上,達摩院院長張建鋒現(xiàn)場展示了阿里推出全球最強的AI芯片——含光800。這是一款云端神經(jīng)網(wǎng)絡處理器,主打推理,重點應用于視覺場景,在業(yè)界標準的ResNet-50測試中,含光800推理性能達到78563IPS,比目前業(yè)界最好的AI芯片性能高4倍;能效比500IPS/W,是第二名的3.3倍。
圖:云棲大會上達摩院展臺上展出的含光800NPU。
圖:云棲大會上含光800NPU測試評估主動散熱PCIe板卡。
云端AI芯片市場為什么這么熱?
隨著物聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,全球聯(lián)網(wǎng)設備數(shù)量呈現(xiàn)爆發(fā)式增長,聯(lián)網(wǎng)設備的數(shù)量在2014年到2020年間的年復合增長率預計將達23.1%,到2020年物聯(lián)網(wǎng)設備數(shù)量達到501億。IDC預測2020年全球數(shù)據(jù)總量將突破40ZB,到2025年,全球聯(lián)網(wǎng)設備一年產(chǎn)生的數(shù)據(jù)量達到79.4ZB。在阿里云棲大會上,阿里巴巴董事長張勇提出的公開預測數(shù)據(jù)顯示,到2025年,全球一年產(chǎn)生的數(shù)據(jù)將達175ZB,是IDC預測的兩倍。
數(shù)據(jù)是數(shù)字經(jīng)濟時代的石油,算力是數(shù)字經(jīng)濟時代的發(fā)動機,把數(shù)據(jù)變成石油,其中AI芯片是關(guān)鍵。根據(jù)ABIResearch的第一份報告“云端AI芯片:市場前景和供應商定位”表示:云端AI推理和訓練所產(chǎn)生的AI芯片市場,預計將從2019年的42億美元增長到2024年的100億美元。終端AI芯片市場也將近80億美元。
與終端AI芯片相比,云端AI芯片通常具有更高的計算能力,更高的功耗,更大的物理占用面積,因此也相對更加昂貴。對于互聯(lián)網(wǎng)和云服務商,其自身對于AI芯片需求越大,意味著需要付出的成本更為高昂,這也是阿里巴巴、華為、亞馬遜等公司紛紛自研芯片的初始原因。
三位中國挑戰(zhàn)者的實力展示
到目前為止,云端AI市場一直由英偉達的GPU和英特爾的CPU主導,而現(xiàn)在的它們正面臨著HabanaLabs、高通等公司的挑戰(zhàn)。最近寒武紀、華為和阿里巴巴新品的發(fā)布,也正是宣布進入這一高地。
行業(yè)權(quán)威人士指出,考慮到國內(nèi)高端人工智能技術(shù)的匱乏,人工智能硬件在中國還處于新興產(chǎn)業(yè),市場潛力巨大,2019年,多家公司推出新品,很快與Nvidia展開激烈的競爭,是否能切分蛋糕,實力非常關(guān)鍵。
第一、在芯片性能方面,寒武紀“思元270”的性能參數(shù)有意向業(yè)界標桿英偉達TeslaT4看齊。“思元270”可支持INT16/INT8/INT4等多種定點精度計算,INT16的峰值性能為64Tops(64萬億次運算),INT8為128Tops,INT4為256Tops。
對比TeslaT4,F(xiàn)P16的峰值性能為65Tops,INT8為130Tops,INT4為260Tops。
功耗方面,“思元270”功耗為75w,與TeslaT4持平。
寒武紀在訓練領(lǐng)域的低精度整數(shù)運算實現(xiàn)了關(guān)鍵性突破,思元270訓練版板卡將可通過8位或16位定點運算提供卓越的人工智能訓練性能,該技術(shù)有望成為AI芯片發(fā)展的重要里程碑。
第二、華為輪值董事長徐直軍對業(yè)界表示:昇騰910總體技術(shù)表現(xiàn)超出預期,作為算力最強AI處理器,當之無愧。我們已經(jīng)把昇騰910用于實際AI訓練任務。比如,在典型的ResNet50網(wǎng)絡的訓練中,昇騰910與MindSpore配合,與現(xiàn)有主流訓練單卡配合TensorFlow相比,顯示出接近2倍的性能提升。
如同手機市場,華為在AI戰(zhàn)略商擺出了挑戰(zhàn)對手的姿態(tài),手機市場上華為自有品牌手機加上自有麒麟芯片技術(shù),把握住5G手機的領(lǐng)先優(yōu)勢,在AI市場,華為拿出昇騰910+MindSphere的硬件與架構(gòu)服務組合,還有自主的訓練架構(gòu)以及整合能力。雖然這個組合在海外市場能否開展業(yè)務令人懷疑,但在價格和效能驅(qū)動夏,華為在AI市場更有競爭力,特別是智慧城市、自動駕駛車輛、物聯(lián)網(wǎng)和之后會醫(yī)療等熱門應用上,華為自有技術(shù)加上軟硬整合,相信可以啟動更大的市場。
第三、阿里巴巴首席技術(shù)官張劍鋒表示,含光800的云端推理能力出眾。1個含光800算力等于10個普通GPU,在業(yè)界標準的ResNet-50測試中,峰值性能達到78563IPS,每秒處理7.8萬張圖片,是目前全球最高性能的AI推理芯片,每瓦可以處理500張照片。同樣以推理能力來說,含光800的推理能力是英偉達T4(1721IPS)的五倍,是英偉達P4的46倍,能效比是第二名HabanaLabs的Goya的3.3倍,是寒武紀MLU270的3.5倍。
在現(xiàn)場演示中,杭州城市大腦實時處理主城區(qū)的交通視頻,需要40顆傳統(tǒng)的GPU,延時300ms,使用含光800僅需要4顆,延時減低到150ms。在拍立淘商品庫每天新增的10億商品圖片,使用傳統(tǒng)GPU算力識別需要1小時,使用含光800可以縮短至5分鐘。軟硬件協(xié)同的極致設計體現(xiàn)了巨大市場前景。
結(jié)語
行業(yè)專家認為,人工智能將有可能得到規(guī)模化使用,大規(guī)模新技術(shù)會在未來二三十年取得突破。人工智能將給社會提供更多的效率,國家會因為人工智能發(fā)生翻天覆地的變化。
面對人工智能帶來的改變,國家自身的發(fā)展會取決于這個國家的能力,取決于行業(yè)成熟性和算法、算力、基礎(chǔ)設施的提供,比如超級計算機、超大規(guī)模的系統(tǒng)等一系列的支撐。作為中國本土云端AI芯片的主要供應商,寒武紀、華為和阿里平頭哥,雖然現(xiàn)在比英偉達的實力還有差距,但在中國巨大的市場潛力和應用帶動下,會有更多可能開發(fā)出先進產(chǎn)品,未來如何,讓我們拭目以待。
-
華為
+關(guān)注
關(guān)注
215文章
34294瀏覽量
251183 -
阿里巴巴
+關(guān)注
關(guān)注
7文章
1609瀏覽量
47109 -
英偉達
+關(guān)注
關(guān)注
22文章
3743瀏覽量
90830 -
寒武紀
+關(guān)注
關(guān)注
11文章
185瀏覽量
73858 -
AI芯片
+關(guān)注
關(guān)注
17文章
1859瀏覽量
34908
發(fā)布評論請先 登錄
相關(guān)推薦
評論