近日,百度智能芯片總經理歐陽劍在一次線上公開課中首次展示了百度昆侖 AI 芯片與飛騰 CPU 的適配視頻片段。視頻顯示,搭載飛騰 CPU、昆侖加速卡的服務器,運行流暢,性能強勁,圖像分割速度顯著加速。而在去年12月19日的飛騰首屆生態合作伙伴大會上,歐陽劍就曾分享了百度昆侖AI芯片與飛騰CPU的適配進展。百度昆侖芯片是繼百度飛槳(PaddlePaddle)深度學習平臺之后,百度又一重量級 AI 產品與飛騰完成適配。目前,百度與飛騰攜手,已實現了 AI 算力全國產化。二者聯合提供的解決方案有望成為 “ 新基建 ” 大潮中市場的全新選擇。
近年來,人工智能技術取得快速發展,不僅歸因于大數據的支撐,更離不開計算機芯片算力的不斷增強,而實現超級算力的核心就是 AI 芯片。百度昆侖 AI 芯片是百度自研的云端全功能 AI 芯片,采用百度自研 XPU 神經處理器架構,提供 512GB/s 的內存帶寬,能夠在 150W 的功耗下提供高達 260 TOPS 的能力,是業內算力領先的國產 AI 芯片。
百度已推出了兩款基于昆侖的 AI 加速卡:K100 和 K200。其中,K200 在 Gemm-Int8 數據類型、4K x 4K的矩陣下,Benchmark 分數超 200Tops,是英偉達 T4 的 3 倍多;BERT、ERNIE 、YoloV3 等模型的推理性能也展現出顯著提升。
目前,飛騰 CPU 已與百度昆侖 AI 芯片完成了 算力、架構、技術 三個方面的適配。在新算力層面,與百度昆侖 AI 芯片完成適配的 飛騰 FT-2000+/64 處理器 是飛騰面向高性能服務器領域的產品。該款處理器設計了數據親和的多核處理器體系架構,突破了高效亂序超標量流水線、層次化片上并行存儲結構、多級異構片上互連網絡、高可用處理器設計等關鍵技術,實測性能達到了國際主流服務器 CPU 同等水平,填補了國產高端通用 CPU 領域的空白,是中國首款自主設計的 64 核通用 CPU,也是國際上首款兼容 ARMv8 指令集的 64 核通用 CPU,為百度昆侖 AI 芯片提供了高效完整的 AI 計算流程支撐。
在新架構層面,飛騰是從云到端的通用計算架構,同一套架構支持不同的場景,而百度昆侖采用 XPU 架構,二者的有機結合,將打造新的 “ 普適架構 ”。
在新技術層面,芯片和操作系統等底層技術此前一直是國外巨頭占據主導地位,但每一次產業迭代都意味著一次洗牌的契機,新的技術體系將會建立。當前正處于 AI + 智能云時代,從芯片架構、操作系統,再到上層應用,都有了革命性的變化。百度昆侖+飛騰CPU+國產OS,再加上國產深度學習平臺百度飛槳(PaddlePaddle),以及新時代的各類應用,全國產的 AI 計算體系將登上歷史舞臺,并且有機會成為新的選擇。
就市場而言,隨著 “ 新基建 ” 浪潮興起,以芯片、服務器等產品為代表的信息產業發展正在按下 “ 加速鍵 ”。AI 算力需求將逐步邁入高峰期,更高性能的 AI 服務器將迎來高速增長,計算正和水、電一樣成為最基本的社會基礎設施。飛騰 CPU 芯片、百度昆侖 AI 芯片的成功適配和即將落地的應用,將構成自主國產芯片的聯合解決方案,發揮算力的 “ 乘數效應 ”,助力國產服務器在AI場景下顯著提升算力,為眾多合作伙伴賦能。
責任編輯:gt
-
cpu
+關注
關注
68文章
10826瀏覽量
211160 -
AI
+關注
關注
87文章
30172瀏覽量
268432 -
百度
+關注
關注
9文章
2257瀏覽量
90258
發布評論請先 登錄
相關推薦
評論