大灣區(qū)沖出一家AI芯片創(chuàng)企,研發(fā)“六邊形戰(zhàn)士”,叫板英偉達(dá)。
蟄伏六年后,這家清華系A(chǔ)I芯片創(chuàng)企終于開(kāi)始在國(guó)產(chǎn)GPGPU江湖高頻出場(chǎng)。
今年4月,國(guó)內(nèi)首款基于可重構(gòu)架構(gòu)的GPGPU芯片RPP-R8亮相,現(xiàn)已小規(guī)模量產(chǎn)。其背后的珠海GPU芯片創(chuàng)企芯動(dòng)力,就此浮出水面。
芯動(dòng)力創(chuàng)始人、CEO李原是一位芯片連續(xù)創(chuàng)業(yè)者。他1989年本科畢業(yè)于清華大學(xué)物理系,隨后任職于英特爾、德州儀器等芯片巨頭。在英特爾任職期間,他曾開(kāi)發(fā)至強(qiáng)CPU服務(wù)器系統(tǒng),擁有從產(chǎn)品定義、量產(chǎn)到商用的全鏈條經(jīng)驗(yàn)。
從德州儀器辭職后,李原2008年在美國(guó)加州創(chuàng)立IPG Communications,承接通訊基站大型芯片設(shè)計(jì)項(xiàng)目。IPG獨(dú)創(chuàng)的Turbo譯碼器被英特爾應(yīng)用于其至強(qiáng)處理器。這家公司后來(lái)被美國(guó)老牌通信芯片商敏訊科技(MindSpeed)收購(gòu),敏訊科技的無(wú)線業(yè)務(wù)又在2013年被英特爾收購(gòu)。
就在英偉達(dá)提出GPGPU新概念的前后腳,李原也開(kāi)始琢磨類(lèi)似的思路,即如何在發(fā)揮GPU并行計(jì)算能力和通用性?xún)?yōu)勢(shì)的同時(shí),通過(guò)引入其他類(lèi)架構(gòu)的長(zhǎng)處,研發(fā)出能更好平衡性能、功耗、成本、延遲、部署速度的硬件。從2011年到2016年,經(jīng)過(guò)長(zhǎng)達(dá)六年的摸索,他們團(tuán)隊(duì)獨(dú)創(chuàng)了一個(gè)將NPU的高效率與GPU的高通用性相結(jié)合的創(chuàng)新架構(gòu)——可重構(gòu)并行處理器架構(gòu)(RPP)。
他為何早早選擇進(jìn)入GPGPU賽道創(chuàng)業(yè)?又如何組建團(tuán)隊(duì),將芯動(dòng)力RPP架構(gòu)從圖紙中的創(chuàng)新設(shè)想,變成了在實(shí)際應(yīng)用場(chǎng)景中發(fā)揮價(jià)值的硬件?在這外部環(huán)境復(fù)雜多變的五年之間,他對(duì)AI芯片及GPU行業(yè)的發(fā)展脈絡(luò)與方向有哪些新的感悟與思考?近日,芯東西與這位國(guó)內(nèi)GPGPU領(lǐng)域的創(chuàng)業(yè)代表人物進(jìn)行了深入交流。
01.清華物理系校友創(chuàng)業(yè)已在半導(dǎo)體領(lǐng)域深耕19年
創(chuàng)立芯動(dòng)力之際,李原早已是一位入局半導(dǎo)體行業(yè)19年之久的資深老兵。
1989年,他從清華大學(xué)物理系本科畢業(yè)后,接連遠(yuǎn)赴日本、加拿大進(jìn)修無(wú)線通信專(zhuān)業(yè)。2004年,李原入職德州儀器,主攻通訊系統(tǒng)研發(fā),在這里,他和芯動(dòng)力的另一位聯(lián)合創(chuàng)始人、當(dāng)時(shí)已是德州儀器資深硬件工程師的朱建斌相識(shí),這為多年后芯動(dòng)力核心團(tuán)隊(duì)的組建奠定了基礎(chǔ)。 當(dāng)李原第一次籌備創(chuàng)業(yè)期間,朱建斌主動(dòng)提出要轉(zhuǎn)到芯片設(shè)計(jì)行業(yè),并要從一位硬件工程師跨界成算法工程師,這令李原感到“有點(diǎn)不可思議”。朱建斌很快憑借其出色的學(xué)習(xí)能力、抗壓能力證明了自己,李原的創(chuàng)業(yè)團(tuán)隊(duì)也組建就緒。 2008年,李原、朱建斌以及幾位來(lái)自德州儀器的同事共同創(chuàng)業(yè),在美國(guó)加州創(chuàng)辦了一家無(wú)線通信芯片公司IPG Communications。 他們的初始目標(biāo)很簡(jiǎn)單,先靠創(chuàng)業(yè)生存下來(lái),再換個(gè)視角觀察整個(gè)半導(dǎo)體行業(yè)。IPG創(chuàng)立后不久就承接設(shè)計(jì)了休斯頓衛(wèi)星GlobalStar系統(tǒng)的通訊芯片,自研的Turbo譯碼器被英特爾應(yīng)用至其至強(qiáng)處理器,隨后在2011年順利被美國(guó)老牌通信芯片商敏訊科技(MindSpeed)收購(gòu)。
▲芯動(dòng)力發(fā)展歷程
這一次創(chuàng)業(yè),也讓李原對(duì)半導(dǎo)體產(chǎn)業(yè)的認(rèn)識(shí)更加深刻,他們發(fā)現(xiàn)幾個(gè)特點(diǎn):
半導(dǎo)體行業(yè)產(chǎn)業(yè)鏈綿長(zhǎng),芯片設(shè)計(jì)公司就是其中的靈魂。
半導(dǎo)體行業(yè)全球競(jìng)爭(zhēng)激烈,中小規(guī)模的公司不停被兼并、收購(gòu),很多從業(yè)人士被迫改行。李原的觀點(diǎn)是,不能這樣,“我們要逆流而上,要去看一看不同的風(fēng)景”。
競(jìng)爭(zhēng)激烈的行業(yè)共識(shí)后,他們還意識(shí)到,一旦在半導(dǎo)體行業(yè)里處于領(lǐng)先地位,企業(yè)就能獲得巨大市場(chǎng)。最后可能形成第一家公司供應(yīng)產(chǎn)品,第二家公司艱難競(jìng)爭(zhēng),第三家公司基本不存在的現(xiàn)象。
因此,第二次創(chuàng)業(yè),李原和團(tuán)隊(duì)的目標(biāo)就是:“我們應(yīng)該成為一家什么樣的公司才有可能存活下來(lái)。”
2011年,他們把各種各樣不同種類(lèi)的芯片擺到一張圖上,他們發(fā)現(xiàn)其中有一個(gè)很大的空缺,在常見(jiàn)的CPU、GPU、DSP,以及專(zhuān)用的通信芯片之外,還有一類(lèi)芯片的位置空缺,未被發(fā)現(xiàn)。
在這個(gè)空白處畫(huà)下的大大的問(wèn)號(hào),成為芯動(dòng)力創(chuàng)立的起點(diǎn)。經(jīng)過(guò)5年的探索,2016年他們找到了答案——可重構(gòu)并行處理器架構(gòu)。基于這一創(chuàng)新架構(gòu),李原等人先是在美國(guó)成立了公司,2017年轉(zhuǎn)回國(guó)內(nèi),在珠海創(chuàng)立芯動(dòng)力公司。
02.研發(fā)“六邊形戰(zhàn)士”處理器已實(shí)現(xiàn)千片級(jí)小規(guī)模量產(chǎn)
芯動(dòng)力剛剛成立,李原曾問(wèn)過(guò)朱建斌一個(gè)問(wèn)題:什么樣的節(jié)點(diǎn)代表他們做的事情成功了?朱建斌的答案是:“我們只要把這顆芯片真的做出來(lái),達(dá)到了我們預(yù)期的性能指標(biāo)。”
今年他們迎來(lái)了這一時(shí)刻。4月,芯動(dòng)力發(fā)布首款基于可重構(gòu)架構(gòu)的GPGPU芯片RPP-R8。
RPP-R8每顆芯片內(nèi)含有1024個(gè)計(jì)算核,相比傳統(tǒng)GPU架構(gòu)在同樣的算力占用更小的芯片面積,實(shí)現(xiàn)了低功耗和高能效的有效平衡。RPP-R8除了具備專(zhuān)用芯片所沒(méi)有的通用編程性,面積效率比可達(dá)到同類(lèi)產(chǎn)品的7~10倍,能效比也超過(guò)3倍,可滿足高效并行計(jì)算及AI計(jì)算應(yīng)用。
▲GPU和RPP架構(gòu)性能比較
這顆芯片于2020年一次性流片成功,李原透露,RPP-R8目前實(shí)現(xiàn)上千片級(jí)小規(guī)模量產(chǎn),并且已經(jīng)進(jìn)行大規(guī)模測(cè)試,之后他們會(huì)根據(jù)客戶反饋進(jìn)行產(chǎn)品修正,再繼續(xù)下一個(gè)產(chǎn)品研發(fā)。
事實(shí)上,基于RPP架構(gòu)的芯片成果做出來(lái),在成立時(shí)的他們看來(lái)是不可能的事情。
這背后的原因可以先從現(xiàn)在的三大GPGPU技術(shù)流派來(lái)看,第一類(lèi)較多公司采用的是在比較成熟的GPU架構(gòu)之上,構(gòu)建矩陣計(jì)算的能力;第二類(lèi)是純粹基于可重構(gòu)技術(shù)來(lái)做;第三類(lèi)是將可重構(gòu)技術(shù)與GPU編程模型CUDA語(yǔ)言相結(jié)合。
芯動(dòng)力選擇的即是第三類(lèi)。李原解釋說(shuō),主要有兩大技術(shù)原因,首先選擇可重構(gòu)技術(shù)是因?yàn)椋捎脗鹘y(tǒng)GPU架構(gòu)很難追齊行業(yè)頭部玩家,因此他們需要尋找更好的技術(shù);其次,與CUDA語(yǔ)言相結(jié)合是因?yàn)槠淇蓴U(kuò)展且廣為行業(yè)所接受。
走一條全新的路徑,也意味著他們一定程度上需要從0開(kāi)始。李原談道,最難的地方就在于,不僅要?jiǎng)?chuàng)新,還要達(dá)到市場(chǎng)的需求。
RPP架構(gòu)是針對(duì)并行計(jì)算設(shè)計(jì)的芯片架構(gòu),芯動(dòng)力將其稱(chēng)作“六邊形戰(zhàn)士”。這一架構(gòu)既結(jié)合了NPU的高效率與GPU的高通用性?xún)?yōu)勢(shì),還支持實(shí)時(shí)操作系統(tǒng)(RTOS),具備DSP的低延時(shí),可滿足高效并行計(jì)算及AI計(jì)算應(yīng)用,大大提高了系統(tǒng)的實(shí)時(shí)性和響應(yīng)速度。
芯動(dòng)力同樣制程下的GPGPU芯片,與英偉達(dá)相比,在一些場(chǎng)景下性能提高達(dá)50%,且面積為類(lèi)似芯片的1/7,功耗僅為其1/2-1/3。
這背后離不開(kāi)芯動(dòng)力的研發(fā)團(tuán)隊(duì),其核心成員有平均年限超過(guò)15年的資深半導(dǎo)體從業(yè)背景,且均來(lái)自英特爾、高通、德州儀器、聯(lián)發(fā)科等半導(dǎo)體知名企業(yè),研發(fā)人員占比超過(guò)80%。
時(shí)至今日,當(dāng)李原再次問(wèn)到什么是最大的成功時(shí),朱建斌已經(jīng)忘記了當(dāng)初的說(shuō)法,他的回答變成了:“我們把它在商業(yè)上做到成功,我們把這個(gè)事情變成一個(gè)客戶喜歡的商品,這樣才是真的成功。”
03.第一家客戶是銀行率先落地三大應(yīng)用場(chǎng)景
李原也一直在為做“客戶喜歡的商品”而努力。
芯動(dòng)力GPGPU芯片的第一家客戶是一家銀行。李原認(rèn)為,芯片行業(yè)周期長(zhǎng),因此芯片設(shè)計(jì)必須按照產(chǎn)品需求來(lái)設(shè)計(jì),否則芯片公司拿出的產(chǎn)品很容易因市場(chǎng)需求變化而被淘汰。
因此2017年以后,芯動(dòng)力團(tuán)隊(duì)花了很長(zhǎng)一段時(shí)間進(jìn)行市場(chǎng)調(diào)研,調(diào)研結(jié)果與這家銀行的需求不謀而合。銀行希望將智能攝像頭的“智能”和“攝像頭”區(qū)分開(kāi),邊緣算力盒子可以獨(dú)立于攝像頭進(jìn)行升級(jí)迭代。
李原談道,這也是他們與同類(lèi)企業(yè)在市場(chǎng)策略上的不同之處——更加強(qiáng)調(diào)對(duì)于客戶需求的分析。
在這個(gè)過(guò)程中,他們將客戶分為三層,終端用戶、軟件集成商、硬件集成商。其中,關(guān)注設(shè)備功能的終端用戶目前不在芯動(dòng)力的合作伙伴之列。
目前,他們采用的策略是,與軟件集成商合作先拿到市場(chǎng),贏得硬件集成商的認(rèn)同,進(jìn)一步推廣芯片產(chǎn)品。
芯動(dòng)力的產(chǎn)品已經(jīng)在邊緣計(jì)算領(lǐng)域與銀行、通訊領(lǐng)域與醫(yī)療超聲波方向、AI方向的高性能計(jì)算等領(lǐng)域?qū)崿F(xiàn)應(yīng)用。
作為產(chǎn)業(yè)鏈的上游玩家,芯片行業(yè)的封裝、模組、軟件、芯片本身領(lǐng)域都會(huì)影響到相關(guān)芯片企業(yè)研發(fā)或者進(jìn)入新領(lǐng)域的動(dòng)作,因此,芯動(dòng)力目前的策略是把現(xiàn)存的幾個(gè)方向做扎實(shí),按照節(jié)奏來(lái)走。
在公司的未來(lái)規(guī)劃中,李原有一個(gè)最為清晰的原則,那就是“技術(shù)是有邊界的”。放到RPP架構(gòu)中來(lái)說(shuō),就是這一架構(gòu)只做適合的并行計(jì)算,不會(huì)做串行計(jì)算。
從任職大廠到自主創(chuàng)業(yè)、從半導(dǎo)體老兵到創(chuàng)企CEO,這些此前的工作經(jīng)歷及身份的轉(zhuǎn)變,幫助李原為芯動(dòng)力一步步確立起了清晰的技術(shù)路線和應(yīng)用方向等。他說(shuō),最大的改變是視野不同。創(chuàng)業(yè)之前,有限的視野讓他產(chǎn)生諸多困惑,例如自己到底在做什么,做的東西有沒(méi)有用;創(chuàng)業(yè)之后,會(huì)更關(guān)注眼前的困惑,更加重視現(xiàn)在的產(chǎn)品。
04.GPGPU賽道競(jìng)爭(zhēng)激烈必須在細(xì)分賽道拿下第一
針對(duì)當(dāng)前國(guó)內(nèi)GPGPU產(chǎn)業(yè),李原反復(fù)提及四個(gè)字:競(jìng)爭(zhēng)激烈。
國(guó)內(nèi)相關(guān)創(chuàng)企迎著半導(dǎo)體熱潮涌入GPGPU賽道,李原認(rèn)為,想要在這條賽道活下來(lái),企業(yè)必須拿出產(chǎn)品驗(yàn)證自己存在的價(jià)值,在某一些方面超過(guò)英偉達(dá),做到英偉達(dá)做不到的事。
英偉達(dá)這個(gè)強(qiáng)大的競(jìng)爭(zhēng)對(duì)手,也是國(guó)內(nèi)GPGPU芯片走向落地的最大攔路虎。李原感慨道,最高端,英偉達(dá)的A100、H100芯片擁有市場(chǎng)其它芯片無(wú)法匹敵的能力;最低端,英偉達(dá)的芯片同樣在性能、價(jià)格上有競(jìng)爭(zhēng)力。
面對(duì)這一勁敵,李原認(rèn)為,全球競(jìng)爭(zhēng)激烈的半導(dǎo)體產(chǎn)業(yè)中,他們必須超過(guò)第一位,成為這個(gè)賽道的龍頭,才有可能生存下來(lái)。想要和英偉達(dá)競(jìng)爭(zhēng),就要先從與之不同的行業(yè)切入。他補(bǔ)充道,英偉達(dá)雖然有不同產(chǎn)品,但不見(jiàn)得其產(chǎn)品在每個(gè)行業(yè)都無(wú)可替代。深耕這些行業(yè),使得產(chǎn)品在性能、價(jià)格上擁有競(jìng)爭(zhēng)力是芯動(dòng)力目前最重要的事情。
此外,當(dāng)下大模型狂潮席卷,GPU缺貨風(fēng)波不斷,也為GPGPU產(chǎn)業(yè)帶來(lái)了很好的機(jī)會(huì)。在李原看來(lái),主要有兩個(gè)方向:
首先是AI訓(xùn)練,參數(shù)規(guī)模龐大的大型語(yǔ)言模型,需要強(qiáng)大的計(jì)算能力,國(guó)內(nèi)創(chuàng)企未來(lái)的技術(shù)演進(jìn)或許能滿足這一需求。不過(guò),目前而言,英偉達(dá)在這一方向的領(lǐng)先性鮮少有企業(yè)可以與之抗衡。
其次是應(yīng)用部分,大型語(yǔ)言模型在應(yīng)用端的計(jì)算需求,一般芯片也可以滿足,因此這對(duì)于國(guó)內(nèi)創(chuàng)企而言是一個(gè)巨大的機(jī)會(huì)。即便大型語(yǔ)言模型距離未來(lái)真正落到某一個(gè)場(chǎng)景還有一段距離,但李原對(duì)這個(gè)方向十分樂(lè)觀,其現(xiàn)在面臨的局限性未來(lái)有機(jī)會(huì)被打破。
就芯動(dòng)力而言,他認(rèn)為,大型語(yǔ)言模型呈現(xiàn)出的能力和人相比還有一段距離,芯動(dòng)力會(huì)在自己的技術(shù)上做一些思考,如何找到創(chuàng)新的芯片架構(gòu)路徑,使得大型語(yǔ)言模型性能達(dá)到替代人的地步。
最后,在半導(dǎo)體行業(yè)的漫漫創(chuàng)業(yè)路中,李原說(shuō):“要保持樂(lè)觀。”他和團(tuán)隊(duì)選擇了一條艱難的路創(chuàng)業(yè),正因?yàn)樗麄儧](méi)有在整個(gè)半導(dǎo)體行業(yè)走下坡路時(shí)放棄,現(xiàn)在也幸運(yùn)地碰到了其中為數(shù)不多蓬勃發(fā)展的好機(jī)會(huì)。
05.結(jié)語(yǔ):國(guó)產(chǎn)GPGPU新秀發(fā)力核心團(tuán)隊(duì)離不開(kāi)三大要素
GPGPU將GPU的應(yīng)用范圍擴(kuò)展到了圖形計(jì)算之外,在眾多大規(guī)模并行計(jì)算中得到了廣泛的應(yīng)用。今年芯片實(shí)現(xiàn)小規(guī)模量產(chǎn)的芯動(dòng)力開(kāi)始在這一領(lǐng)域嶄露頭角。
李原總結(jié)了芯動(dòng)力核心研發(fā)團(tuán)隊(duì)具備的幾大核心要素: 首先要有資深從業(yè)背景,芯動(dòng)力的研發(fā)團(tuán)隊(duì)準(zhǔn)入門(mén)檻非常高,有熟練研發(fā)經(jīng)驗(yàn)、善于從事這一行業(yè)的工作,是最起碼的要求。 其次,要對(duì)新技術(shù)保持開(kāi)放的心態(tài),他說(shuō):“當(dāng)我們把這件事情做的很好的時(shí)候,我們往往會(huì)給自己畫(huà)地為牢,走出來(lái)是很難的。” 第三,研發(fā)團(tuán)隊(duì)要有激情,遇到挑戰(zhàn)不低頭。芯動(dòng)力選擇的路線是沒(méi)人做過(guò)的事情,因此挫折往往更多。 對(duì)于GPGPU賽道則更為艱難,英偉達(dá)身處霸主地位已經(jīng)成為業(yè)界共識(shí),另辟蹊徑的芯動(dòng)力或許有望通過(guò)“六邊形戰(zhàn)士”的RPP架構(gòu),在部分特定能力上做到超越英偉達(dá)。
在今年9月14日-15日舉行的2023全球AI芯片峰會(huì)期間,李原將對(duì)RPP芯片架構(gòu)給AI芯片帶來(lái)的發(fā)展前景及機(jī)遇進(jìn)行深入解讀,分享這一架構(gòu)在適配各種不同AI算法和應(yīng)用場(chǎng)景方面的通用性,以及如何為AI企業(yè)提供強(qiáng)大的計(jì)算能力,推動(dòng)AI產(chǎn)品的應(yīng)用落地。
-
芯片
+關(guān)注
關(guān)注
453文章
50396瀏覽量
421793 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9020瀏覽量
85182 -
通訊基站
+關(guān)注
關(guān)注
0文章
2瀏覽量
63
原文標(biāo)題:珠海誕生的GPGPU新勢(shì)力!清華系芯片老兵創(chuàng)業(yè),首款芯片已量產(chǎn)
文章出處:【微信號(hào):算力基建,微信公眾號(hào):算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論