在人工智能(AI)技術(shù)飛速發(fā)展的今天,AI大模型的部署需求正迅速從云端向端側(cè)和邊緣側(cè)設(shè)備遷移。這一轉(zhuǎn)變對AI芯片的性能、功耗和響應(yīng)速度提出了前所未有的挑戰(zhàn)。正是在這樣的背景下,后摩智能憑借其創(chuàng)新的技術(shù)實力,推出了基于存算一體架構(gòu)的邊端大模型AI芯片——后摩漫界??M30,引領(lǐng)了AI芯片領(lǐng)域的新一輪革命。
后摩漫界??M30芯片以其高達100TOPS的最高算力和僅12W的典型功耗,成功實現(xiàn)了高性能與低功耗的完美融合。這一特性使得M30芯片能夠輕松應(yīng)對邊端側(cè)大模型部署對高效率和實時性的嚴苛要求,為AI技術(shù)在更多領(lǐng)域的應(yīng)用提供了強大的硬件支持。
作為一款通用的邊端大模型AI芯片,M30能夠支持多種大模型,包括但不限于ChatGLM、Llama2、通義千問等。在Qwen1.5-7B-Chat大模型上,M30的運行性能可達15-20 Tokens/s,這一表現(xiàn)足以證明其在處理復雜AI任務(wù)時的卓越能力。
為了進一步提升部署的便捷性,后摩智能同步推出了基于M30芯片的智算模組(SoM)和力謀??AI加速卡。智算模組(SoM)支持PCIe EP模式,以其小巧的體積、強勁的性能和極低的功耗,成為小型化設(shè)備和功耗敏感嵌入式場景的理想選擇。而力謀??AI加速卡作為標準的半高半長PCIe加速卡,則能在PC、一體機和服務(wù)器中實現(xiàn)快速部署,支持主動散熱和被動散熱兩種模式,確保設(shè)備在不同環(huán)境下的穩(wěn)定運行。
后摩漫界??M30芯片的推出,不僅為傳統(tǒng)的端側(cè)和邊緣側(cè)設(shè)備注入了強大的大模型能力,還成功適配了包括X86、ARM在內(nèi)的多種主流處理器。這使得M30芯片能夠廣泛應(yīng)用于AI PC、邊緣AI一體機、智能座艙、商用顯示、智能融合網(wǎng)關(guān),NAS(網(wǎng)絡(luò)附加存儲)等領(lǐng)域,為AI技術(shù)在更多領(lǐng)域的深入應(yīng)用注入了強大動力。
展望未來,后摩智能將繼續(xù)秉承創(chuàng)新、務(wù)實、高效的理念,不斷推出更多高性能、低功耗的AI芯片產(chǎn)品,為AI技術(shù)的發(fā)展和應(yīng)用做出更大的貢獻。同時,我們也期待更多企業(yè)和機構(gòu)能夠加入到AI技術(shù)的研發(fā)和應(yīng)用中來,共同推動AI技術(shù)的繁榮發(fā)展。
-
AI
+關(guān)注
關(guān)注
87文章
30239瀏覽量
268473 -
人工智能
+關(guān)注
關(guān)注
1791文章
46896瀏覽量
237662 -
后摩智能
+關(guān)注
關(guān)注
0文章
22瀏覽量
1177
發(fā)布評論請先 登錄
相關(guān)推薦
評論