在日前舉辦的2024 vivo開發者大會上,vivo高級副總裁、首席技術官施玉堅表示,在過去三年和今年前三季度,vivo始終穩居國產手機銷量第一。去年,vivo推出了自己的技術品牌——“藍科技”。藍科技是從應用創新扎根到底層技術創新,從硬件驅動到形成軟硬件一體化能力,這是vivo基于用戶需求,所構建的技術研發體系。其包含了“藍圖影像”、“藍海續航系統”、“藍晶芯片技術棧”以及全新升級的“藍心大模型”和“藍河操作系統”。
在此次大會上,vivo正式發布全新AI戰略——“藍心智能”,同時帶來全面升級的自研藍心大模型矩陣、原系統5(OriginOS 5)、藍河操作系統2(BlueOS 2)等等。
早在去年,端側AI便成為各大手機終端廠商進行手機創新的主航道,彼時大家都將AI端側大模型的參數集中于7B。然而參數越大所需的處理器、存儲等資源越多,輕量化小模型或許更適合于智能終端,但是否AI性能會打折扣呢。vivo最新推出的3B小模型給出了答案。
正如vivo對于藍心大模型的定位是,通過豐富中文數據與知識的供給,把藍心大模型做成最懂中國人的大模型。我們可以看到,無論是中文詩句的文生圖、方言的采集與支持等等,vivo的一系列底層技術的創新是實實在在踐行這一定位,并將智能手機AI帶到一個新的階段。
藍晶芯片技術棧升級,“天璣芯,看藍晶”
vivo一直專注SoC從定義、設計到研發調校的全鏈路技術閉環,實現底層的“軟硬一體化”設計,為芯片注入“vivo的靈魂”。
近年來,聯發科技發布的旗艦芯片,均由vivo旗艦手機首發搭載。隨著雙方合作的持續深化,vivo藍晶芯片技術棧也積累了強大的芯片調校經驗,軟硬一體化打造最強綜合能效體驗,并在業界有了“天璣調校看藍廠”、“天璣芯,看藍晶”等美譽。
vivo X200系列將全球首發搭載天璣9400,vivo藍晶芯片技術棧深度調校,帶來“沖動又冷靜”的最強綜合能效體驗。
天璣9400的第二代全大核CPU架構包含1個主頻高達3.62GHz的Cortex-X925超大核,以及3個Cortex-X4超大核和4個Cortex-A720大核,其單核性能相較上一代提升35%,多核性能提升28%。天璣9400采用臺積電第二代3nm制程,相較上一代同性能功耗降低40%。與此同時,天璣9400搭載新一代旗艦12核GPU Immortalis-G925,其峰值性能相較上一代提升 41%,功耗節省44%,光線追蹤性能較上一代提升40%,游刃有余的性能將大幅提升游戲沉浸感。
vivo藍晶芯片技術棧的深度調校,在進一步激發天璣9400強悍性能的同時,也實現了更優秀的能耗控制,達到高能效與低能耗的完美平衡。根據vivo產品經理韓伯嘯發布的截圖顯示,搭載天璣9400的vivo X200系列,在安兔兔平臺跑出超300萬分的歷史新高,再次樹立安卓旗艦手機的性能標桿。
vivo全新AI戰略“藍心智能”:AI與OS的深度融合
在此次大會上,vivo副總裁、OS產品副總裁、vivo AI全球研究院院長周圍正式發布了vivo的全新AI戰略——藍心智能。
藍心智能是將大模型技術與手機操作系統深度融合的個人智能。藍心智能可以理解用戶的個人情景和偏好,為用戶提供個人化的專屬服務。
vivo從三個方面用AI重構系統體驗。包括重構人與設備的交互體驗,讓交互更自然更符合直覺。重構人與數字世界的服務體驗,讓智能更加個人化,也就是構建簡單高效的服務獲取能力和主動服務能力,從而讓手機成為智能溫暖的個人助理。還有,重構人與物理世界的連接體驗,讓溝通更順暢和溫暖。vivo利用多模態大模型,讓手機成為視障人士的眼睛,幫助他們可以獨自安全的走到更遠的陌生的地方。
基于此,vivo基于藍心大模型技術做出的一次全新探索,即“PhoneGPT”也就是手機智能體。在演示中,藍心小V不僅可以對屏幕界面進行識別和操作,也可以通過接管音頻進行自主對話,以完成用戶交代的任務,例如幫助我們去訂餐廳、訂咖啡等等。這是手機自動化的一小步,卻是解放用戶雙手的一大步。
未來,藍心智能將以藍心大模型矩陣為技術底座,繼續探索AI與OS的深度融合,持續打造開放共贏的智能體生態。
全新藍心大模型矩陣,3B端側大模型打破“不可能三角定律”
為進一步夯實AI能力底座,vivo在今年的開發者大會上發布了全新自研藍心大模型矩陣。全面升級語言大模型和端側大模型能力,并帶來vivo自研的語音大模型、圖像大模型以及多模態大模型。這預示藍心智能,向著個人化和多元化發展邁出重要的一步。
在去年開發者大會上,vivo 發布了自研十億、百億、千億三個參數量級,由5款語言大模型組成的藍心大模型矩陣。并在行業中率先跑通了1B、7B、13B的端側大模型,同時基于藍心大模型推出了藍心小V和藍心千詢APP。截至今天,vivo的AI能力已覆蓋全球60多個國家和地區,服務超過5億手機用戶,大模型token輸出量超過了3萬億個。
繼去年帶來了三款端側大模型之后,vivo正式發布全新30億參數量級的藍心端側大模型3B。
圖:電子發燒友網現場拍攝
在對話寫作、摘要總結、信息抽取等能力上,藍心3B可以越級比肩行業7B-9B模型。相比藍心7B,藍心 3B極致性能提升300%,平衡模式下功耗優化達46%,極致出詞速度可以達到80字/s,系統功耗僅450mA,內存占用僅1.4GB。在SuperCLUE和Equal Eval的小模型綜合能力評測中,藍心3B均排名第一,同時獲得了泰爾實驗室端側大模型綜合能力認證以及AIIA安全防范能力認證。藍心端側大模型3B真正打破了“模型小、能力強、消耗低“的不可能三角定律”。
圖:電子發燒友網現場拍攝
據了解,vivo X200系列將全球首發LPDDR5X Ultra Pro內存,為用戶帶去更強悍的手機性能體驗。也就是說,采用參數量級更小的模型的同時,內存性能還頂格提升,這為智能手機的AI極致性能體驗提供了巨大的空間。從另一方面來自,模型輕量化也有利于端側AI功能從旗艦手機向中低端智能手機的下放,對AI手機的普及起到至關重要的作用。
云端語言大模型升級方面,BlueLM-70B 2.0新增學習了1億知識問答,500w篇的論文,以及1.2億代碼倉庫等高質量數據,模型整體能力提升30%。新增了多模態多輪對話能力,支持400+手機系統工具和180+三方工具的調用,以及全面升級了大模型的代碼生成能力,能實現數理計算和Excel的數據分析能力。
語言大模型新增圖像理解能力,通過將文本、圖像抽象成統一的token表示,vivo為語言大模型新增了看世界的“眼睛”,能夠理解手機上的文字和圖片多種模態的信息。BlueLM-V-3B模型,領跑行業4B及以下的多模態大模型。
vivo自研語音大模型基于藍心文本大模型開發,通過離散化編碼結合文本大模型學習,實現更智能、豐富和簡單的語音交互。它具備四大核心能力:語音合成、音色復刻、語音翻譯和方言自由說。未來,vivo計劃將語音大模型能力逐步開放至智能體平臺,以更廣泛地服務于用戶和開發者。
vivo的文生圖大模型即藍心圖像大模型BlueLM-Art,精通中文語境,融合了中國特色與東方美學,其在中文理解、中國文化詮釋、人物攝影美學及中文文字繪制等多個維度都取得了出色的效果,多次榮登SuperCLUE-Image基準榜單中文領域榜首。
大模型時代,vivo持續推進各模態大模型端側化能力建設,探索大模型在各業務場景端側產品落地,覆蓋“聽、說、讀、寫、畫”各應用場景。針對全模態大模型端側化,vivo 從算法模型設計,到量化、性能瓶頸分析工具建設,再到底層運行時異構方案設計和業務框架層靈活的多業務部署架構建設,提供了完整的解決方案。通過軟硬件協同,充分挖掘芯片潛力,確保大模型在端側運行時的強悍性能。
AI落地三大挑戰,訓推一體架構協同
vivo AI工程架構專家陳崇沛分享vivo在大規模高性能計算領域的探索與創新。他指出,大規模訓練、高性能推理及海量算力治理是AI落地面臨的三大挑戰。為此,vivo構建了大模型工程體系,解決了大規模訓練的問題,讓模型能按天迭代;解決高性能推理的問題,能秒級生成圖片;搭建了堅如磐石的萬卡集群,算力能持續穩定輸出。這一體系全面支撐了vivo各模態、模型的訓練與推理,廣泛應用于vivo的AI產品中。
展望未來,vivo要打造出強有力的個人化智能產品,就要具備o1這類強邏輯推斷能力的模型。而大模型工程的關鍵是性能和靈活性兼具的強化學習訓練框架,這樣才能發揮出強化學習Scaling law的威力。為了實現這個目標,vivo的思路是:以訓推一體架構為基礎,整合自研推理引擎和訓練框架,滿足多模型訓練推理協同的要求,支持高性能、高靈活性的自博弈強化學習。
-
vivo
+關注
關注
12文章
3292瀏覽量
63143
發布評論請先 登錄
相關推薦
評論