近日,2023中國(guó)算力大會(huì)在寧夏銀川舉行,沐曦集成電路(上海)有限公司(下稱“沐曦”)聯(lián)合創(chuàng)始人、CTO兼首席硬件架構(gòu)師彭莉受邀出席由中國(guó)信息通信研究院、中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)聯(lián)合舉辦的智能計(jì)算論壇,并擔(dān)任演講嘉賓,探討后GPT時(shí)代算力需求激增帶來(lái)的挑戰(zhàn)以及GPU如何突破算力供需瓶頸、推動(dòng)人工智能產(chǎn)業(yè)普惠化發(fā)展。
在題為“后GPT時(shí)代的算力需求”的演講中,彭莉預(yù)測(cè)大模型商業(yè)模式將分為通用計(jì)算市場(chǎng)和專用定制化市場(chǎng)兩大類:在通用計(jì)算市場(chǎng),大語(yǔ)言模型將終結(jié)多數(shù)NLP任務(wù),NLP技術(shù)水平被強(qiáng)行拉平,通用大模型或被大廠“壟斷”;而在專用定制化市場(chǎng),開源大模型將呈現(xiàn)百花齊放的發(fā)展態(tài)勢(shì),可針對(duì)私有數(shù)據(jù)、敏感數(shù)據(jù)進(jìn)行快速定制和領(lǐng)域?qū)R,大模型開發(fā)和部署能力將趨于普及化。
彭莉指出,區(qū)別于傳統(tǒng)AI,生成式AI技術(shù)可以借助接入類ChatGPT應(yīng)用發(fā)揮顯著的技術(shù)優(yōu)勢(shì),為大語(yǔ)言模型的開發(fā)降本增效,同時(shí)也對(duì)算力提出更高和更迫切的要求。由于大模型訓(xùn)練的一次性成本被大規(guī)模推理攤薄,大模型盈利的一大難點(diǎn)是降低推理成本。沐曦致力于打造高效通用的GPU芯片及軟硬件一體的生態(tài)解決方案,通過(guò)GPU軟件生態(tài)優(yōu)勢(shì)、硬件架構(gòu)優(yōu)勢(shì)、先進(jìn)封裝等方面全面提升GPU算力,降低大模型訓(xùn)練和推理的算力成本,在產(chǎn)品路線和生態(tài)戰(zhàn)略上均可滿足大模型對(duì)算力基礎(chǔ)設(shè)施的大規(guī)模需求,為推進(jìn)智能產(chǎn)業(yè)可持續(xù)發(fā)展打造堅(jiān)實(shí)的算力底座。
關(guān)于沐曦
沐曦致力于為異構(gòu)計(jì)算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產(chǎn)品,推出曦思N系列GPU用于AI推理,曦云C系列GPU用于千億參數(shù)AI大模型訓(xùn)練及通用計(jì)算,以及曦彩G系列GPU用于圖形渲染,滿足數(shù)據(jù)中心對(duì)“高能效”及“高通用性”的算力需求。沐曦產(chǎn)品均采用完全自主研發(fā)的GPU IP,擁有完全自主的指令集和架構(gòu),配以兼容主流GPU生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢(shì),能夠?yàn)榭蛻魳?gòu)建軟硬件一體的全面生態(tài)解決方案,是“雙碳”背景下推動(dòng)數(shù)據(jù)中心建設(shè)和產(chǎn)業(yè)數(shù)字化、智能化轉(zhuǎn)
-
集成電路
+關(guān)注
關(guān)注
5381文章
11385瀏覽量
360875 -
gpu
+關(guān)注
關(guān)注
28文章
4701瀏覽量
128706 -
智能計(jì)算
+關(guān)注
關(guān)注
0文章
176瀏覽量
16454 -
沐曦
+關(guān)注
關(guān)注
0文章
26瀏覽量
1142
原文標(biāo)題:沐曦彭莉:后GPT時(shí)代GPU如何降低算力門檻
文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論