電子發(fā)燒友網(wǎng)報道(文/莫婷婷)當下,英偉達、AMD兩大巨頭占據(jù)全球超過80%的通用GPU市場。在算力需求激增的情況下,多家國內(nèi)企業(yè)選擇加入通用GPU賽道,例如天數(shù)智芯、沐曦、壁仞科技、登臨科技等。就在2021年3月,天數(shù)智芯發(fā)布全自研云端訓練通用GPU芯片——天垓100芯片,這也是國內(nèi)第一款全自研、GPU架構(gòu)下的7nm制程通用GPU訓練芯片。
電子發(fā)燒友網(wǎng)記者了解到,天數(shù)智芯的7nm 通用GPU訓練芯片已經(jīng)獲得安防、人工智能、超算中心等多個應用領域的客戶訂單,未來將持續(xù)往5nm、3nm等更高級的制程發(fā)力。那么,國內(nèi)通用GPU芯片量產(chǎn)的技術瓶頸在哪里,國內(nèi)企業(yè)如何實現(xiàn)突圍?記者就相關問題與天數(shù)智芯副總裁郭為進行了交流。
為什么國產(chǎn)通用GPU芯片量產(chǎn)難度大?
通用GPU即通用圖形處理器,可用于人工智能模型訓練與推理,以及高性能計算。與CPU相比,GPU的平行處理能力、處理速度都優(yōu)于CPU,這也加強了GPU的通用性,而通用GPU的出現(xiàn)讓GPU更加專注通用性。可以說,通用GPU就是GPU里的另一個快速發(fā)展的細分市場。
市場機構(gòu)的數(shù)據(jù)顯示,2019年我國通用GPU芯片的市場規(guī)模已達86億元,預計到2025年將保持32%的年復合增長率,達458億元。面對如此巨大的市場,國內(nèi)企業(yè)涉足通用GPU市場,面臨哪些挑戰(zhàn)?郭為向記者表示,通用GPU芯片在設計上主要面臨的是兩大挑戰(zhàn),一是通用架構(gòu),二是軟件生態(tài)。
在架構(gòu)方面,通用架構(gòu)需要適配各種各樣的算法,包括基礎計算;同時考慮到應用場景的特殊性,對芯片功耗也有要求,這就需要對芯片架構(gòu)的優(yōu)化和設計,實現(xiàn)低功耗高算力;另一方面,記者了解到國內(nèi)在人才方面還面臨較大的缺口,培養(yǎng)一位成熟的工程師需要10年的時間。
在軟件生態(tài)方面,通用GPU不僅僅是一顆芯片硬件,還涉及到整個軟件棧、編譯器等一系列的軟件生態(tài)系統(tǒng)。
為了突破技術瓶頸,天數(shù)智芯從2018年開始正式啟動通用GPU芯片設計,歷時三年最終量產(chǎn)國內(nèi)首款全自研的7nm 通用GPU芯片。據(jù)了解,該芯片采用2.5D CoWoS晶圓封裝技術,集成240億晶體管,支持多精度數(shù)據(jù)類型支持標準/混合訓練。在軟件上,該芯片兼容主流生態(tài)系統(tǒng),采用自主研發(fā)的軟件棧,從多方面實現(xiàn)算力升級。
目前,一些國際巨頭在GPU行業(yè)中仍處于領先位置,國內(nèi)廠商需要突破重重挑戰(zhàn)才能實現(xiàn)GPU突圍。郭為也提到,英偉達經(jīng)過十幾年的發(fā)展,不僅有自主完善芯片架構(gòu),同樣也有完善的軟件生態(tài),相對于軟件生態(tài),它具有豐富的軟件接口、底層加速庫,通用GPU芯片的入場門檻更高,這些都是國產(chǎn)企業(yè)需要追趕的。
正是因為通用GPU行業(yè)的高門檻,天數(shù)智芯的不易與成功也讓國產(chǎn)企業(yè)看到了另一個可能性。
天數(shù)智芯推出7nm通用GPU芯片時便得到了業(yè)內(nèi)人士的認可。中國工程院院士倪光南表示,該芯片在性能指標方面并不亞于國外主流產(chǎn)品。電子發(fā)燒友網(wǎng)了解到,天數(shù)智芯的“天垓100芯片”比業(yè)內(nèi)同類芯片的面積小了一半,卻實現(xiàn)單精FP32性能37TFlops,半精FP16/BF16性能147TFlops。
國產(chǎn)通用GPU芯片落地,深挖應用場景
國產(chǎn)通用GPU芯片在AI領域?qū)⒋蜷_大規(guī)模的應用市場,而這些都需要云端訓練。以安防攝像頭為例,攝像頭在工作過程中,需要進行車輛識別、人臉識別等,這部分更重要的是依賴云端訓練出的模型,進行大量推理。
郭為提到,通用GPU芯片還可以用于安檢機,以及快遞行業(yè),對大量的物品進行識別,不管是安防還是快遞行業(yè),這些行業(yè)對模型訓練以及模型推理的速度要求都非常高。在這方面,天數(shù)智芯已有客戶帶來了落地應用案例。
通用GPU芯片最典型的應用場景是在人工智能,但隨著技術的成熟,通用GPU芯片在5G、自動駕駛、大數(shù)據(jù)等領域的應用不斷擴增。
自動駕駛最重要的是安全性,車上有大量的傳感器獲取路面情況,這些數(shù)據(jù)將被整合,再通過預先訓練的模型預測路況,可以迅速作出決定。郭為指出,在這個過程中,需要大量的算力,同時考慮到汽車空間、電池功耗等問題,將大功耗或者大算力系統(tǒng)放在汽車內(nèi)部也不太適合,最值得考慮的解決方案是將系統(tǒng)放在邊緣側(cè),同時因為它需要迅速作出決定,要求邊緣側(cè)和汽車之間的通訊盡量地做到低時延,5G恰好可以實現(xiàn)這樣的低時延。
在這些處理過程中,都需要用到通用GPU芯片。郭為認為,在達到理想的高算力低功耗的技術下,未來可以把高端的高算力的芯片直接放在汽車上面,應用場景也就更廣了,這也是未來幾年業(yè)內(nèi)的研究方向。
對于未來的發(fā)展戰(zhàn)略,天數(shù)智芯副總裁郭為提到了三大方面:
一是更強的算力。任何一個AI應用的模型都會越來越復雜,要求提供更高的算力,同時芯片制成提升會帶來邊際效應收窄,這時該如何進一步提升算力,實際上是任何一個通用GPU芯片都會面臨的技術挑戰(zhàn)。另一方面,自動駕駛、智慧醫(yī)療等各個行業(yè)的算法也在不斷演進,此時,對于訓練芯片來講,更高的算力才能支持相應的算法運行。
二是更高的通用性。由于技術的快速迭代,云端訓練芯片一定要有更高的通用性才能跟上智能駕駛、智慧醫(yī)療等高端市場需求。
三是隱私計算。智慧醫(yī)療場景涉及到患者,甚至醫(yī)院的醫(yī)療數(shù)據(jù)隱私。而任何一個AI模型都需要大量的數(shù)據(jù)做訓練,這時需要用到隱私計算,通過隱私加解密的方式,讓這些敏感的數(shù)據(jù)做到可用。
“對于醫(yī)療這樣的場景,隱私保護是相當重要的。云端訓練芯片關于隱私保護這部分的解決方案,以及通用計算,也應當是后面的發(fā)展趨勢。”郭為表示,天數(shù)智芯在未來會深挖隱私保護的相關應用場景,并且推出解決方案。
小結(jié)
如今,國內(nèi)企業(yè)不斷發(fā)力通用GPU芯片市場,隨著技術的成熟也將給更多的應用場景帶來多樣化的可能性。當然,國內(nèi)企業(yè)還需正視與國際企業(yè)的差距,并且在追趕的過程中,不斷縮小差距,讓國內(nèi)的通用GPU芯片打開真正的用武之地。
-
AI
+關注
關注
87文章
30212瀏覽量
268451 -
GPU芯片
+關注
關注
1文章
303瀏覽量
5781 -
天數(shù)智芯
+關注
關注
0文章
94瀏覽量
5531
發(fā)布評論請先 登錄
相關推薦
評論