6月,智源研究院在北京智源大會(huì)上重磅發(fā)布了全面開源的“悟道3.0”系列大模型,包括“悟道·天鷹”(Aquila)語言大模型等領(lǐng)先成果。目前,摩爾線程已率先完成對(duì)“悟道·天鷹”(Aquila)大模型的推理兼容適配,整個(gè)適配過程僅花費(fèi)不到6小時(shí)時(shí)間,便實(shí)現(xiàn)與摩爾線程自研MUSAChat應(yīng)用的無縫集成。此前,摩爾線程曾在ChatGLM發(fā)布后24小時(shí)內(nèi)實(shí)現(xiàn)適配,并在數(shù)小時(shí)內(nèi)適配LLaMA模型,摩爾線程CUDA兼容的技術(shù)能力一再被驗(yàn)證。
這充分得益于摩爾線程強(qiáng)大的代碼移植工具"MUSIFY"。該工具可快速將現(xiàn)有的CUDA程序遷移至摩爾線程MUSA,零成本完成CUDA代碼自動(dòng)移植,之后用戶短時(shí)間內(nèi)即可完成熱點(diǎn)分析和針對(duì)性優(yōu)化,大大縮短遷移優(yōu)化的周期,從而使得大模型適配形成了標(biāo)準(zhǔn)“流水線作業(yè)”,讓開發(fā)者可以省時(shí)、省力、省事、省心。
目前,基于摩爾線程打造的AI與云計(jì)算平臺(tái),已經(jīng)可以運(yùn)行ChatGLM、Stable Diffusion、LLaMA、“悟道3.0”等開源大模型,以及摩爾線程自研的MUSAChat和MUSABert等模型的部分訓(xùn)練和推理應(yīng)用。借助摩爾線程元計(jì)算統(tǒng)一系統(tǒng)架構(gòu)MUSA,用戶可以復(fù)用PyTorch開源社區(qū)的大量模型算子,降低開發(fā)成本。與此同時(shí),摩爾線程開源的MT Pytorch可以支持多種模型的推理,覆蓋CV、NLP、語音等多個(gè)領(lǐng)域,能夠運(yùn)行典型的大模型分布式多卡推理,也可以支持單機(jī)多卡與多機(jī)多卡的分布式訓(xùn)練。利用數(shù)據(jù)并行、模型并行以及ZERO等分布式訓(xùn)練技術(shù),MT PyTorch還可以完成簡(jiǎn)單基礎(chǔ)模型以及典型Transformer結(jié)構(gòu)的NLP語言模型的訓(xùn)練。
據(jù)悉,智源此次發(fā)布的“悟道3.0”系列開源模型涵蓋語言、視覺、多模態(tài)等基礎(chǔ)大模型,其中,“悟道·天鷹”(Aquila)語言大模型是首個(gè)具備中英雙語知識(shí)、支持商用許可協(xié)議、國內(nèi)數(shù)據(jù)合規(guī)需求的開源語言大模型。其在中英文高質(zhì)量語料基礎(chǔ)上從0開始訓(xùn)練,通過數(shù)據(jù)質(zhì)量的控制、多種訓(xùn)練的優(yōu)化方法,實(shí)現(xiàn)在更小的數(shù)據(jù)集、更短的訓(xùn)練時(shí)間內(nèi),獲得比其他開源模型更優(yōu)的性能。
“悟道?天鷹(Aquila)”語言大模型開源商用許可無疑將會(huì)成為自主大語言模型產(chǎn)業(yè)生態(tài)的一個(gè)里程碑事件。摩爾線程也愿與眾多優(yōu)秀的基礎(chǔ)模型供應(yīng)商深度合作,攜手從硬件、算子、算法多個(gè)方面進(jìn)行深度優(yōu)化,從硬件、軟件、模型、業(yè)務(wù)多個(gè)維度賦能應(yīng)用開發(fā)商,致力于讓大模型更好賦能千行百業(yè)。
責(zé)任編輯:彭菁
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
6898瀏覽量
88833 -
模型
+關(guān)注
關(guān)注
1文章
3173瀏覽量
48716 -
摩爾線程
+關(guān)注
關(guān)注
2文章
198瀏覽量
4520
原文標(biāo)題:“悟道·天鷹”(Aquila)發(fā)布24小時(shí)后,摩爾線程率先實(shí)現(xiàn)兼容適配
文章出處:【微信號(hào):moorethreads,微信公眾號(hào):摩爾線程】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論