近日,摩爾線(xiàn)程與無(wú)問(wèn)芯穹共同披露,他們成功地完成了由國(guó)產(chǎn)全功能GPU——摩爾線(xiàn)程MTT S4000所構(gòu)成的千卡集群驅(qū)動(dòng)的大規(guī)模AI模型“MT-infini-3B”的訓(xùn)練工作,并使用無(wú)問(wèn)芯穹的AI Studio PaaS平臺(tái)進(jìn)行構(gòu)建。
據(jù)介紹,此項(xiàng)訓(xùn)練歷時(shí)13.2天,過(guò)程穩(wěn)定而有序,集群整體運(yùn)行穩(wěn)定性達(dá)到了100%。相較于單機(jī)訓(xùn)練,千卡集群的擴(kuò)展效率提升了超過(guò)90%。
此次實(shí)訓(xùn)被譽(yù)為“充分證明了夸娥千卡智算集群在大模型訓(xùn)練中的可靠性,同時(shí)開(kāi)創(chuàng)了國(guó)產(chǎn)大語(yǔ)言模型與國(guó)產(chǎn)GPU千卡智算集群深度合作的新模式”。
值得注意的是,經(jīng)過(guò)此次實(shí)訓(xùn),MT-infini-3B模型的性能在同類(lèi)模型中名列前茅。在C-Eval、MMLU、CMMLU三個(gè)測(cè)試集中,其表現(xiàn)均優(yōu)于其他在國(guó)際主流硬件上訓(xùn)練的模型。
無(wú)問(wèn)芯穹的聯(lián)合創(chuàng)始人兼CEO夏立雪表示,公司正致力于開(kāi)發(fā)“M種模型”和“N種芯片”間的“MxN”中間層產(chǎn)品,以實(shí)現(xiàn)多種大模型算法在多元化芯片上的高效、統(tǒng)一部署。
他還透露,無(wú)問(wèn)芯穹已與摩爾線(xiàn)程建立了深度戰(zhàn)略合作關(guān)系,而本次“MT-infini-3B”的訓(xùn)練成果則是業(yè)內(nèi)首例基于國(guó)產(chǎn)GPU芯片的從零開(kāi)始到全面大模型實(shí)訓(xùn)的成功案例。
-
gpu
+關(guān)注
關(guān)注
28文章
4700瀏覽量
128703 -
語(yǔ)言模型
+關(guān)注
關(guān)注
0文章
506瀏覽量
10245 -
摩爾線(xiàn)程
+關(guān)注
關(guān)注
2文章
198瀏覽量
4520
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論