國產自主GPU架構“天狼星”鑒定及發布會6月15日在北京舉辦,GPU架構“天狼星”由國內企業中天恒星科技有限公司(Advanced Technology Stellar)自主研發。這是國內首次向通用桌面顯卡GPU發起沖擊。中天恒星創始人兼CEO黃永博士、中天恒星聯合創始人兼總架構師鄧仰東博士、中天恒星芯片設計部負責人李宗輝博士出席活動,正式向業界公布自研第一代產品。
圖1:渲染未來 中天恒星科技自研第一代GPU架構天狼星發布暨品鑒會現場
在芯片領域,CPU、GPU、FPGA是芯片中技術難度最高的類別,業界把他們稱之為芯片中的珠穆朗瑪峰,足以說明它們在技術領域的難度。隨著數字時代的來臨,圖形渲染需求越來越大,所以GPU圖形處理器的作用開始越來越凸顯,比如現在的元宇宙、數字孿生、游戲這些都是依賴于圖形處理器GPU做重要的技術支撐的。今年ChatGPT把AI重新帶熱,作為全球GPU巨頭,英偉達也是借著這股東風,它的市值前幾天突破了萬億美元,成為全球芯片市值最高的公司。
GPU作為芯片領域里技術難度最高的主賽道的芯片,我們現在是九成以上都是靠進口。而且現在隨著美國對我們的科技打壓日趨收緊,我們在采購高端GPU的時候,也受限制,以至于英偉達的兩款受限制的芯片被炒貨炒到八萬多、十萬多甚至幾十萬元。中國有這么大的市場需求,但是沒有自主可控的GPU,所以自主可控GPU在國內迫在眉睫。
圖2:中天恒星科技高管與行業專家領導合影
(出席本次活動的行業領導有:國際信息顯示學會中國總裁、fellow、俄羅斯工程院外籍院士、國際信息顯示學會北京分會理事長嚴群博士;上海市集成電路行業協會秘書長郭奕武;原國家能源局電力可靠性和質監中心副主任胡紅升;國家開發投資集團國投委執行總監梁敬東;杭州市上城區國有資本運營集團有限公司總經理陳轟;湖州市南太湖新區招商服務中心章佳輝;OPPO投資部陸宇仟珊;量子創新(北京)信息技術有限公司創始人程全富,副總裁郭松;北京銳馬視訊科技有限公司副總裁徐言茂,副總裁肖志剛;北京德風新征程科技股份有限公司副總裁王妙維)
中天恒星研發團隊由卡內基梅隆大學電子與計算機工程博士、清華大學軟件學院、微電子學研究所副教授、NVIDIA合作教授鄧仰東博士率領研發團隊自主開發。GPU架構從0開始擁有自己的知識產權,繞開了國際巨頭的專利限制。
當前,Imagination和Vivante兩家公司是主要IP來源,這些IP主要是針對移動應用的GPU內核,不適合桌面應用。此外,購買第三方的IP,難以形成成熟的圖形顯卡級GPU,核心電路專利無法自控和自主迭代。天恒星聯合創始人、總架構師鄧仰東博士表示:“很多國產的GPU的IP授權主要購買的第三方。中天恒星的路線有所不同,核心的圖形引擎完全自主設計的,所以3D圖形引擎這塊不涉及到別人的知識產權,也沒有IP的問題,全部是我們自己擁有,從0到完整架構的實現,都是我們自主的技術。”
中天恒星聯合創始人、總架構師鄧仰東博士在分享會上發言先介紹了當前GPU架構的技術。
首先,GPU是Graphics Processing Unit,是一個可編程芯片,目標是把我們要呈現的場景,通過一系列計算之后投射在一個兩維計算機屏幕上,這就是渲染的過程,人的眼睛是世界上最復雜的視覺儀器,我們感受到驚人的分辨率,GPU力圖在屏幕上再現和真實世界完全一樣的渲染效果,這就是GPU的作用。
有了ChatGPT之后,GPU概念異常火熱,出現了超大的GPU算力市場,GPU從一開始出現,它是為圖形渲染而生的,由于GPU擁有強大的并行計算能力,后來我們用它加速機器學習的訓練,就是所謂的算力的GPU。今年,按照黃仁勛的說法,算力GPU的產值會超過300億美元的規模,到2027年會達到1500億美元的量級。但是我們要看到,除了算力之外,真正用于渲染的這部分GPU,才是GPU市場的主流,也是我們關注的重點,所以我們今天發布的“天狼星”架構是一個圖形渲染GPU,先不說算力,我們關注最主流的GPU市場。
可以看一些具體數據,這個表格里,我們按照年份列出了GPU不同市場分布情況。頭兩列,在服務器中使用的GPU,這部分確實是用于算力的,2022年的數字加起來一共是80、90億美元左右的市場。另一大塊是以獨立顯卡為代表的用于渲染的GPU市場,這個占到了整個GPU市場的80%以上,也就是說圖形渲染GPU是大家必須關注的一個現象。除了獨立顯卡,還有一部分是集成顯卡,英特爾的主板上有集成顯卡,還有一部分是正在快速升級的嵌入式GPU市場,比如很多汽車的面板用嵌入式GPU做渲染的,這個也是渲染GPU市場,加起來,這塊要占GPU總體市場的80%以上。
渲染GPU的重要性還可以通過另一個數字來看,比如說服務器的出貨量和PC出貨量,2021年全球服務器出貨量1300萬臺,PC出貨量3.5億臺左右。一般來說,潛在的每一臺PC都會搭載一塊圖形顯示的顯卡,所以從這個意義上來講,整個渲染GPU也是主流。
我們還要關注到還有一個更大可能性,今天大屏電視已經非常普及,除了投影PPT以外,大屏還有一個作用就是家里看電視,還有一個更有前景的市場就是我們希望家里以互動方式和大屏交互,典型應用就是游戲。但是要打游戲,大家還是買一個游戲機,游戲機的核心也是GPU。實際上如果能做到性價比足夠高的GPU產品,我們可以給每一塊大屏配備一塊GPU芯片,這又是一個驚人的市場,所以總體來看,渲染的GPU是整個GPU市場的主流,也是我們關注的重點。
GPU芯片是高度標準化的芯片,首先渲染的內容是高度標準化的,標準主要有幾個方面,由三大圖形和計算標準界定的,一是Open GL,OpenGL是國際標準化組織在1997年推出的一個學的標準,此后從2007年開始,OpenGL連出三版,基本上界定了整個圖形渲染要完成的工作,與此同時,微軟推出了Direct X,微軟專門針對windows的一個圖形標準。OpenGL是跨平臺兼容的,Direct X只管windows平臺,Direct X的渲染效果更好,但是不具備平臺的兼容性。還有一個標準是OpenCL,這個一開始是為了針對圖形的純計算能力,后來也延伸到通用計算。這三大標準都是在2007-2017年經歷了黃金時代,2017年基本固化,也就是說今天的圖形標準仍然是2007年主要的圖形顯示內容,這也是很關鍵的信息,就是說從2007年之后,基本上圖形標準沒有很大變化,GPU要做的剛需工作基本沒有變化,這里有一個趕上NVIDIA圖形渲染GPU設計的可能性。
這些圖形標準共同定義了大量算法,我們要做圖形渲染的工作要做什么呢?我們面向的是3D場景,人眼能夠感受到或者真實世界是3D場景,3D場景要投射到一個二維屏幕上,這就是渲染的過程。要做到渲染,做到讓肉眼看屏幕有很多立體的感覺,要經歷一系列的算法步驟,圖形圖像標準就定義了各種各樣的算法步驟,這些算法步驟最終組成一個3D渲染流水線,這是OpenGL的典型的3D渲染流水線,是一個長系列工作,每一幀圖像都要經過一系列處理,每個步驟上有不同算法,算法處理之后,用GPU加速,最終在屏幕上看到一個具有很強真實性的渲染效果。這是GPU要完成的工作。
隨著這些算法的提出,GPU硬件逐漸發展起來,早年間有圖形指令集、頂點處理、片源處理,后來逐漸過渡到統一架構,再過渡到今天的光線追蹤等等,這些硬件的特征,隨著標準一步一步形成。我們的研究工作主要在清華大學前期研究工作,07年開始進行了大量這樣的研究工作,這里包括一開始并行計算的工作,后來是虛擬指令集的設計、GPU加速的仿真,再后來是GPU核心模塊設計,我們在2013年做到在一塊FPG(音)平臺上,把整個GPU架構仿真出來,但是要做架構仿真的時候,為了提高仿真速度,把傳統軟件仿真搬到FPG平臺上,通過分時復用硬件的方式,利用有限的資源,完成整個GPU架構的仿真,實現快速的迭代。此后我們又進行了很多比如說光線追蹤算法硬件的工作、片上調度的工作,因為GPU是一個海量線程,需要對線程進行大量的調度工作,還有片上通信網絡的工作,最后在這些工作基礎上,我們發展出了第一代和第二代的中天恒星GPU架構。第一代我們叫做“天狼星”,“天狼星”是夜空中肉眼可見的最亮的恒星,第二代叫做大角星,這是我們技術發展的輪廓。
最后總結一下,產品是GPU芯片,今天發布的是“天狼星”第一代GPU架構,我們希望以PC標準,包括臺式機、一體機、筆記本電腦為核心目標,逐漸拓展到大屏電視、數據中心、云渲染以及車載這樣一些市場,我們的特點是產品擁有全部的自主知識產權包括指令集、核心架構包括最后的物理設計,是全部的自主知識產權。我們的產品會兼容主流圖形產品,天然和各種圖形軟件生態吻合,通過一套架構多種配置的方式支持不同場景的需求,最終構造一個具有高能效優勢和高性價比優勢的領先的GPU產品。
國際信息顯示學會中國總裁fellow、俄羅斯工程院外籍院士、國際信息顯示學會北京分會理事長嚴群博士也在發布會上作了發言。嚴博士曾經參與了整個等離子顯示的原創研發、規模化生產。他指出,從CRT到平面顯示,兩代顯示技術有一個通用的形式,就是它的顯示內容,包括今天看到的顯示內容,顯示的所有都在顯示的平面上,沒有跳躍出平面的狀態,最大的問題就是它的互動性沒法體現。我們現在逐步進入到下一代顯示,我有機會看到這個,我估計這個是五年到十年時間可能就會到來,就是說顯示的內容不僅在平面上,而且可以跳到空間上,跟人進行實時影像交互。他認為接下來5到10年間,3D互動顯示技術將會實現。蘋果不久前發布的Vision Pro最大的特色就是開始進入空間三維顯示時代。雖然現在還只是被動的3D顯示,將來真正的3D顯示是可以擺脫頭盔的。未來的顯示屏加上很多的GPU功能,有沉浸式的三維影像呈現和交互體驗,不再是傳統的電視。一旦需要有交互體驗的時候,我們會重新回到大屏,重新回到這些有渲染的、真實的、你可以融入其中的體驗,這種體驗非常不得了。而且這個體驗,現在我們講的元宇宙,如果沒有這個體驗,永遠火不起來。
“回到蘋果做的Vision Pro,大家仔細看,實際是一個操作系統的革命,包括它的生態的革命。我覺得真是一個很好的時機,要抓住它,潮流也在往這個方向走,機會非常多,我認為現在只是看到芯片,我希望能夠在很多應用場景上,如果需要我幫助的話,我也非常樂意推動,本身也是我感興趣的點。我們如果能夠逐步上去的話,應該是非常大的東西,這個點如果抓得好的話,我們不見得比現在西方的有些國家的東西會落后,因為你抓的點是更高階層的點,對我們芯片的要求也會越來越高,”嚴群博士指出。
上海集成電路協會秘書長郭奕武跟中天恒星創始人兼CEO黃永博士認識于兩年前。他認為黃總的團隊是非常踏實地在做事情,我覺得在這個方面值得大家學習,也是值得大家肯定的。郭奕武在發言中表示,“他們自己把自己的錢掏出來做這件事,把整個產品、公司的命運和自己的命運聯系起來,這是我看到比較少的。“
他也談了他對天狼星GPU架構的看法。”特別關鍵的是他們的自研架構,而且在自研架構中,有這幾個特點:一是3D圖形渲染。二是指令集的自主可控,這是非常不容易的。三是它的框架結構,包括在整個儲存器當中的DDR4,這個也是現在比較領先的存儲架構,他都用上了,決定了他未來的產品、用途非常廣泛,而且可以用在各個方面。會前我和黃總交流過程中,他覺得他現在的切入點在顯示器,我覺得顯示領域非常廣闊,很多是一開始就很高,但是落不了地,顯示是非常重要的落地,現在顯示很多,這個地方落地既有他的高度又有他的落地,并沒有說是空中閣樓。我相信在黃總的帶領下,中天恒星一定會從架構到產品,最后能夠使我們的產品在全球落地。”郭奕武秘書長說。
創業非常難,相比來說,創業做芯片更難,如果在創業芯片里又選擇GPU賽道,真的是難上加難。中天恒星這樣的國內在非常主賽道、難度非常高的創業公司能夠選擇這樣的賽道,大家都有一種明知山有虎,偏向虎山行的魄力和勇氣,讓大家看到了中國新的未來之光,只有有這樣的擔當,有愚公移山的精神,才可以不斷實現我們的自主創新,也才能不斷打破國外對我們技術的封鎖。
在媒體問答環節上,有媒體提出天狼星GPU架構是針對信創賽道,還是對標國際GPU廠商如英偉達、AMD的產品時,中天恒星創始人兼CEO黃永博士作了回答。
黃永博士說:“這就是我們創業底層的商業和技術路線統一的邏輯,一個企業必須要有商業實現的可能。商業實現的前提是要有技術積累的過程和技術的壁壘,才能實現商業溢價。商業上沒有突破口落地是很難存活的。顯示、圖形渲染恰恰是目前需求量最大的一塊市場,是高度標準化的市場,唯一要做的就是提高性價比,這就是我們突破口的商業邏輯的最底層的,我們把它打磨成我們商業模式的競爭力,從性價比著手,突破渲染、顯示這樣標準化的市場,進而再往定制、半定制、更高端的市場去突破。和英偉達、AMD的競爭,這個市場很大,不僅僅是一個競爭,而且還有很多剛需沒有得到滿足,普通家用電腦或者顯示,更多集中在四千塊人民幣左右的市場售價,很難有更多選擇買更高端或者更貴的顯卡,我們恰恰滿足了這個剛需沒有得到滿足的市場的需要,我們不是搶它的蛋糕或者和它分這個市場蛋糕,是滿足了一部分剛需沒有得到滿足的市場。”
對于天狼星在GPU能效與現有產品的對比,黃永博士介紹稱,“我們在內存上使用了DDR4,這是小帶寬,通過一些高速芯片通信網絡搭組成高帶寬,所以能效上也有一定優勢,具體評估我們還需要具體去做。我剛才說的指標,32比特峰值運算能力是3T左右,如果集中度稍微提一下的話,可以到5.6TFLOPs,象素點大概48G,紋理象素點96G這樣一個能力,這個能力來看,比GTS1050高半代或者差不多的水平。剛才說了,2017年圖形標準定型之后,基本上定義了圖形渲染剛需是什么。2017年EVIDIA推出的產品就是1050這一代GPU,某種程度上反映了剛需的GPU需要的能力,所以我們對標也是這款產品,當然我們某些指標比它還要更好一些。”
國內出現多家做GPGPU的芯片公司,那么現在的GPGPU和GPU又有什么樣的區別呢?黃博士耐心地作了回答。
他介紹說,GPU就是一個標準的從圖形加速開始,慢慢成為一個處理器,現在基本承擔了全世界80%左右的算力由GPU提供,未來GPU在算力方面的貢獻會越來越多。 GPGPU在GPU渲染和并行計算架構優勢上找到一個專門把它用來做成矩運算,在人工智能加速上、機器學習,尤其訓練算法上的專用電路,用的是GPU的平行計算架構,把渲染拿掉了,只保留了平行計算架構。某種意義上來說,它是一個專用電路,好處就是在專用的訓練或者學習或者推理領域,有它的效率優勢,但是不足之處在于一旦固化了這個架構和線路以后,這個電路圖一旦固化以后,很難有通用性了,所以只能在某一個領域有效率。
另外,人工智能算法迭代很快,每三個月到半年就迭代一次,人工智能固化成算法的GPGPU電路,做一個芯片至少十二個月甚至一年半時間,也就意味著電路一旦做出來就已經落后了,這是一個矛盾,很難解決的矛盾。這也是為什么GPU還是在算力里提供了很大的算力支持或者說占有更多市場份額的原因,就是它的可編程性,它對算法通用的適用性是GPGPU不可替代的。相反,GPGPU是一個專用電路,很有可能在有些領域里還有其他替代方案,這個創業路線我們當時沒有選擇,也是基于剛才幾個方面的考慮。
中天恒星聯合創始人兼總架構師鄧仰東博士也對這個問題作了補充回復。“GPGPU其實是比較早的說法,我們說GPU,早年間只做圖形計算,2004年的時候,當時GPU計算能力已經超過了CPU,所以很多人說能不能用GPU做通用計算,做一般的非圖形計算,非圖形計算叫做通用計算,所以叫做GPGPU。從這個意義上,黃總說的就是這個意義。但是GPGPU當時用圖形OpenGL,把一個算法程序寫成OpenGL代碼,要做矩陣計算寫成一堆三角形數組然后做一些計算,和后面的純GPU編程還是有很大區別的。我一開始做科研,也是從GPGPU下手的,現在GPGPU說得相對比較少一點,有了KUDA做GPU這樣的計算,GPGPU這樣的詞更多貼合某些AI芯片公司,確實是針對某一領域的,但是在這個領域內具有一定通用性的GPU架構。”
不久前黃仁勛也提到美國對中國的封鎖只會加劇中國在GPU等關鍵核心領域的自我突破,所以我們才會看到,國內中天恒星這樣的企業已經開始在蓄勢待發的狀態了。另外,現在國內國產替代已經進入了推進期,從2018年中興事件起,大家就開始提國產替代,只是少部分下游企業會用國內的。但是現在已經優先用國內芯片企業,成了全產業鏈的共識,隨著國內GPU芯片、自主可控芯片出現之后,整個國內的應用市場都會起來,更多地采用國內自主可控的芯片。在這樣的大背景下,國產自主可控的GPU也是未來可期。
天狼星的開發里程碑:
2019年,第一代“天狼星”架構芯片設計驗證完成。
2021年,第一代“天狼星”架構GPU誕生;
2022年,定義第二代GPU架構“大角星”;
2023年,第一代“天狼星”架構GPU實現量產。
-
gpu
+關注
關注
28文章
4700瀏覽量
128697
發布評論請先 登錄
相關推薦
評論