要點
?高通與騰訊混元展開合作,基于驍龍8至尊版移動平臺實現騰訊混元大模型7B和3B版本的終端側部署,進一步擴展生成式AI技術在終端側的應用和普及。
?借助驍龍8至尊版的強大終端側AI性能和高通AI軟件棧,騰訊混元大模型能夠實現出色的終端側運行表現,為騰訊的廣泛業務場景和應用提供底層端側AI支持。
驍龍峰會期間,高通技術公司宣布與騰訊混元合作,基于驍龍8至尊版移動平臺,共同推動了騰訊混元大模型7B和3B版本的終端側部署,展示了此合作實現出色的運行表現。這將有助于騰訊混元大模型為廣泛的業務場景提供技術支持,通過利用終端側AI加速產品創新,有效降低運營成本,并進一步擴展生成式AI在終端側的應用和普及。
驍龍8至尊版移動平臺搭載全新的第二代定制高通Oryon CPU和增強的高通HexagonNPU,充分利用高通AI引擎優勢,能夠帶來更強大的終端側生成式AI處理能力。驍龍8至尊版的強大AI算力,結合高通AI軟件棧以及行業領先的工具套件,包括高通AI模型增效工具包(AIMET)等,為模型提供了全棧優化能力。通過使用基于硬件的INT4量化技術,可以大幅提升騰訊混元大模型在終端側的運行效率,端側推理實現首個token生成時延達到150ms,解碼速率達到超過30 tokens/秒。
騰訊混元大模型已為騰訊內部超過700個業務場景和C端應用提供底層技術支持,包括微信輸入法、騰訊手機管家、QQ、騰訊視頻、QQ瀏覽器、企業微信、騰訊會議等,通過實現面向驍龍8至尊版的終端側部署,能夠利用終端側生成式AI的豐富優勢,更好地滿足廣泛的終端側業務需求。例如,騰訊手機管家短信智能識別功能率先利用騰訊混元的終端側模型能力,通過海量數據結合深度神經網絡與預訓練,讓模型具備極強的語義理解能力,通過結合上下文語境信息更準確地理解短信意圖,使短信召回率大幅提高將近200%,識別準確率提升20%。由于部分短信涉及用戶個人敏感信息,端側AI還可以在保證出色性能表現的同時,有效保護用戶的個人信息隱私安全。
高通技術公司高級副總裁兼技術規劃和邊緣解決方案業務總經理馬德嘉表示:
高通與騰訊混元大模型團隊長期攜手推動前沿終端側技術創新在移動應用中的部署和推廣,為廣大用戶和消費者打造創新的應用體驗。高通公司致力于賦能廣大ISV合作伙伴和開發者,利用高通強大的異構計算、行業領先的CPU、GPU、NPU和軟件解決方案,在搭載驍龍平臺的終端上推動生成式AI應用的普及,惠及全球更多用戶。
騰訊機器學習平臺部總經理,騰訊混元大模型負責人王迪表示:
騰訊混元已經構建起了全鏈路的大模型矩陣和應用平臺。同時,騰訊混元不斷完善部署生態。在云服務場景,我們通過多種技術在提升效果的同時調用價格持續降低。在智能終端場景,騰訊和高通持續深入合作,賦能不同業務對端側模型的部署需求,并在騰訊豐富的生態中持續迭代能力,讓更多的B端和C端用戶獲得實用大模型的非凡體驗。
-
高通
+關注
關注
76文章
7439瀏覽量
190358 -
驍龍
+關注
關注
2文章
1000瀏覽量
36724 -
大模型
+關注
關注
2文章
2326瀏覽量
2480
原文標題:高通與騰訊混元合作,基于驍龍8至尊版共同推動騰訊混元大模型終端側部署
文章出處:【微信號:Qualcomm_China,微信公眾號:高通中國】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論