北京2024年7月11日/美通社/ -- 7月9日,在"元腦中國行"全國巡展?jié)险旧希顺?a target="_blank">信息發(fā)布AIStation 人工智能開發(fā)平臺V5升級版,具備全面的大模型流程支持能力,幫助企業(yè)用戶降低構建大模型微調任務門檻,提供標準、安全的大模型推理服務,并針對大模型業(yè)務資源需求優(yōu)化了集群管理功能,助力行業(yè)客戶快速開展大模型業(yè)務創(chuàng)新與落地,獲得穩(wěn)定、高效、易用、高精度的大模型服務。
隨著大模型技術與產(chǎn)業(yè)化發(fā)展的快速迭代,企業(yè)用戶在大模型開發(fā)和應用的過程中面臨諸多新的挑戰(zhàn)。一方面,用戶在大模型微調過程通常會遇到環(huán)境算法配置復雜、模型結構多樣適配繁瑣、算力資源管理難等問題,模型精度難以提升;另一方面,在部署本地化、私有化大模型時,會面臨部署經(jīng)驗不足、性能優(yōu)化瓶頸、算力資源利用不合理等挑戰(zhàn),難以在保障數(shù)據(jù)與業(yè)務隱私的條件下構建和使用本地化大模型應用。
AIStation V5版本功能全面升級,支持端到端的大模型開發(fā)流程,新增適配50+大模型結構,內(nèi)置10+微調數(shù)據(jù)集和20+可配置參數(shù)項,提供低代碼大模型微調能力,讓用戶一鍵提交任務、統(tǒng)一管理任務,低門檻構建大模型微調任務、優(yōu)化模型性能。同時,針對大模型算力資源占用高、訓練穩(wěn)定性難保障的問題,AIStation V5升級了針對大模型訓練與微調的分布式任務一鍵配置能力,幫助用戶高效、穩(wěn)定地進行大模型微調。
AIStation V5集成了高性能推理服務框架,同等算力大模型批量推理服務承載量較原生部署方式提升1-3倍。通過對算力、服務、業(yè)務訪問的全方位治理,以及多樣化的推理服務部署機制,AIStation V5可以滿足不同場景下用戶自研模型的部署需求,讓用戶能夠在大規(guī)模集群內(nèi)更加細粒度的分配調度算力,部署和使用不同來源、不同結構、不同規(guī)模的大模型推理服務,就像在本地部署單個大模型、傳統(tǒng)AI應用與服務一樣簡單。
此外,AIStation V5針對大模型業(yè)務特點持續(xù)優(yōu)化集群管理核心功能,支持平臺管控的數(shù)據(jù)模型下載任務管理和導入流程,實現(xiàn)了分鐘級大模型訓練異常自動恢復,能夠有效降低大模型相關業(yè)務的人力投入和管理成本;優(yōu)化升級算力池化與分配策略,實現(xiàn)多團隊開發(fā)人員共用流程、共享環(huán)境,開發(fā)者與算力高效協(xié)同,助力企業(yè)客戶提升各類AI創(chuàng)新業(yè)務的整體效率。
浪潮信息AIStation是面向企業(yè)級訓練與推理場景開發(fā)的人工智能開發(fā)平臺,實現(xiàn)從模型開發(fā)、訓練、部署、測試、發(fā)布、服務的全流程一站式高效交付。通過統(tǒng)一管理計算資源、數(shù)據(jù)資源、深度學習軟件棧資源,以及支持大模型業(yè)務全鏈條,AIStation能夠為企業(yè)用戶提供敏捷高效的一體化AI平臺,加快AI開發(fā)應用創(chuàng)新落地。
審核編輯 黃宇
-
浪潮
+關注
關注
1文章
454瀏覽量
23824 -
算力
+關注
關注
1文章
936瀏覽量
14750 -
大模型
+關注
關注
2文章
2339瀏覽量
2501
發(fā)布評論請先 登錄
相關推薦
評論