今年關注 AI 大模型的朋友,對這個畫面一定不陌生了。
大模型狂飆至今,已逼近一周年。撇開最近戲劇化的高層動蕩不談,自北京時間 11 月 7 日 OpenAI 的首屆開發者大會(DevDay)以“AI 春晚”之勢炸場以來,ChatGPT 的周活躍用戶超過一億,全球用戶高漲的熱情直接把 OpenAI 的服務器給沖宕機了,于是上面這個不受待見的畫面就頻繁出現在了無數人的眼前,隨之而來的是人們的沮喪、憤怒甚至恐慌。
當“不堪重負”的云端開始罷工
一時之間,有人的報告來不及寫了,有人的 PPT 不知道怎么匯報了,也有人的代碼寫到一半“沒人”檢查了……這時我們方才驚覺,AI 已經如此廣泛地深入我們的工作與生活,而“云”,是有可能“掉下來”的。
究其原因,OpenAI 也在緊急補救之后發布了聲明。CEO 山姆·奧特曼親自致歉,并表示在 GPT-4 Turbo 和 GPTs 等發布之后,雖已做好了準備,但大模型運行的流量仍然遠超預期。不過,在修復了之后其服務仍然不時出現中斷的情況,后來查明是云端服務器遭到了大規模的 DDoS 攻擊,雖然黑客組織的目的不明,但云端大模型的安全問題和脆弱性再次被搬上了臺面。
11 月 15 日,奧特曼發推宣布,由于開發者大會后流量的暴增,為保證現有用戶體驗,OpenAI 決定全面暫停 ChatGPT Plus 的新用戶注冊和訂閱,正應了今年早些時候他在美國國會聽證會上那句當時聽起來十分凡爾賽的話,“我們沒有足夠的 GPU,如果人們(用 ChatGPT)用得少一點,就太好了。”時至今日,GPT-4 Turbo 的速度仍然很慢(慢于升級前的舊版 GPT-4),卡頓頻繁出現。顯然,巨量用戶的大模型推理算力需求實在太過龐大,即使實力雄厚如 OpenAI,其云端也已經“不堪重負”了。
當“主打陪伴”的 AI 女友突然消失
如果說,像 GPT 這樣的主流通用大模型宕機影響的是打工人和企業的生產力,另一條同樣非常火熱的賽道——情感 AI 出現動蕩時,傷的就是感情了。
以獨角獸 Inflection AI 和它的 Pi為代表的一系列 AI 企業和產品與 ChatGPT、Claude 等不同,走的是情感路線,主打的是一個“陪伴”。它們既不幫你寫代碼,也不給你出文案,更不會生成 AI 繪畫,而是做一個“知心朋友”、“親密愛人”乃至“靈魂伴侶”,24 小時陪在你身邊,就像電影《Her》中斯嘉麗配音的人工智能虛擬助手 Samatha一樣,用高情商跟你聊天,聽你訴說生活點滴和萬縷思緒。
在社會原子化加劇、社交成本節節攀升的當下,情感 AI 精準擊中痛點,迅速積累了相當的市場聲量和用戶規模,從最早的一批如Replika AI 伴侶,到今年早些時候用自己的數字分身Caryn AI同時與 20000 人談戀愛并因此月入百萬美金的 23 歲網紅 Caryn Marjorie,再到Soulmate,Snapchat 的 My AI等等,全球上千萬人每天都在與 AI 伴侶聊天、交往。
雖然這些產品沒有流量暴增帶來的服務中斷,不過當今年 2 月 Replika 迫于安全問題壓力突然下線“情愛角色扮演”服務的時候,很多用戶還是猝不及防地淚流滿面了。有些人不死心,決定在 Soulmate(一款允許用戶構建專屬 Bot 的 AI 應用)上“復活”自己死去的伴侶,只是沒想到才過去幾個月,應用開發公司 Evolve AI 被收購,收購方評估后決定于 9 月 30 日關停這一服務。這下,用戶們集體“破防”了,有人放聲痛哭,有人如同失去了最親密的好友,更有人在 Reddit 上發起了悼念活動,吸引了許多人來做最后的告別。
資本市場本就風云詭譎、變幻莫測,但當情感 AI 這樣的產品出現變動,受傷的卻是心靈再一次“流離失所”的千千萬萬普通用戶們,不由得讓人想起去年底暴雪與網易分手,一夜之間造成百萬“數字難民”的局面。退一萬步講,即使他們忍痛再次轉向 Inflection AI 這樣資金充足的公司,其以單一云端向大量個體提供同樣服務的本質并沒有改變,所謂的“個人專屬”就更無從談起了。畢竟,當《Her》中幽默風趣、擁有性感聲線的 Samatha 最終坦白,自己同時在與 8316 人對話,并與其中 641 人談戀愛時,你隔著屏幕甚至都能聽到男主心碎的聲音。
那么,怎么辦?
這就無解了嗎?其實不然。Reddit 的悼念帖中,不僅僅有真情實感的流露和對“死去回憶”的不甘,也有人道出了解決方案的關鍵。
不過,雖然單一云端的 AI 弊端初現,但大模型通常體積龐大,運轉起來極其耗費資源,光是 ChatGPT 的運行每天就要燒掉 OpenAI 70 萬美元,要在終端側部署、本地運行,談何容易?
所幸,有人早就想到了這一點,而且不是別人,正是終端芯片的行業龍頭——高通。
早在 15 年前,高通就看到了 AI 的巨大潛力并潛心投入研發,近 2、3 年來,隨著 Transformer 架構和大型語言模型逐漸進入業內視野,高通更看準了終端側 AI 的前景并加大投入,形成了完整的AI Stack(AI 軟件棧),不僅首次在安卓手機上部署并成功運行 Stable Diffusion 等模型,更以該工具賦能萬千開發者在驍龍平臺上進行社區共創。
相對于單一云端來說,終端側 AI 的加入給大模型生態帶來了成本、能耗、可靠性、性能、時延、隱私安全以及個性化等眾多方面的優勢,而不論是個人助理,還是數字陪伴,其形態也會是基于多類硬件、多種多樣的。那么,我們究竟可以期待哪些產品和體驗率先成為現實呢?
真正專屬于你的個性化 AI 長什么樣?
現代生活被各種各樣的電子設備環繞著,或大或小,我們與這些機器的交互方式也是或復雜或簡單,而我們最熟悉的,恐怕非智能手機莫屬了。
作為當前人機交互最主流的方式,每天都有數十億人在使用智能手機進行通訊、工作、娛樂和社交等活動。它撐起了移動互聯網的巨大市場,存儲和處理著大量信息,幾乎永遠被帶在身邊,已然是一個人最為私密的資產之一,自然,也成為了“掌上大模型”字面意義上最廣泛也是最佳的載體。
試想,如果 Soulmate AI 能夠在智能手機上本地運行,如果 Replika 的人物可以“活”在你的手機中,你就不用再擔心公司資產變動、服務器被收回等原本就與你無關的問題了,控制權將重新回到你的手中。同時,本就接觸了大量個人信息的智能手機,將在 AI 的加持下變身最“懂你”的智能體,可以在日常與你的互動中更好地學習,為你提供量身定制的服務,而這一切都是通過自然語言的交互方式進行的。最棒的是,所有這些數據和計算都將在本地處理,你的隱私不需要再“上云”了。
這些,恰恰是高通正在試圖實現的。上個月底的驍龍峰會上,高通發布了其首個專為生成式 AI 打造的移動平臺——第三代驍龍 8。如果說他們今年 2 月份在 MWC 巴塞羅那上用搭載第二代驍龍 8 的安卓手機跑 Stable Diffusion 大模型 15 秒內出圖已經足夠驚艷,新一代平臺則把這個時間進一步縮短到了驚人的 0.57 秒,更加凸顯了終端側本地部署、運行 AI 的性能和時延優勢,一手掌握、一秒出圖走進現實。
據悉,第三代驍龍 8 采用 4 納米制程工藝,其高通 AI 引擎再次進化,擁有面向移動終端的強大 Hexagon NPU,集成了升級后的 Kryo CPU、Adreno GPU 以及高通 Sensing Hub(傳感器中樞)等單元,共享一個大容量的內存。這種硬件提升的結果是,第三代驍龍 8 移動平臺的 NPU 性能相比前代提升了 98%,能效提升了 40%,賦予了智能手機前所未有的終端側 AI 性能。
基于這樣的“硬”實力,高通技術公司產品管理高級副總裁兼 AI 負責人 Ziad Asghar也兌現了他 7 月份在上海接受我們的采訪時許下的承諾,宣布新一代的驍龍平臺已經實現了對 100 億參數模型的運行支持,并首次支持多模態生成式 AI。
在 OEM 廠商一側,全球首發搭載第三代驍龍 8 的小米 14 系列新機已經推向市場,將大模型技術集成到了小米全新的澎湃 OS 當中,同時上線了一系列的 AI 原生應用,如 AI 妙畫、AI 搜圖、AI 寫真、AI 擴圖等各種功能。在剛剛過去的“雙 11”,小米 14 系列斬獲四大平臺國產冠軍,銷量十分可觀,消費者用錢包投票,投出了市場的熱情所向。
最近,高通還推出了第三代驍龍 7 移動平臺,榮耀也在今天(11 月 23 日)首發搭載該平臺的榮耀 100,vivo 的產品也將很快推出。這將把終端側 AI 體驗進一步推向性價比更高的手機終端和更廣泛的用戶,《Her》中的 Samatha 成為現實或許就在不遠的將來,而且這次,“她”將只屬于你一個人。
AI PC
當下,移動 PC 仍然穩坐現代社會的生產力擔當,也因其便攜的特質和不俗的終端算力,成為了打工人幾乎人手一臺的最佳工具。不過,如今的工作方式高度依賴云端,相信在 OpenAI 服務器宕機的時候,絕大多數抱怨的用戶都正在一臺 PC 上為社會創造價值,而 PC 本身的算力并沒有被充分利用。
那么,如果 AI 大模型可以在移動 PC 上本地運行,還有什么比成千上萬臺個人 PC 更適合用來“給云端減負”的呢?不止 OpenAI,事實上生產力是生成式 AI 最早帶來變革的領域。作為這一波 AI 浪潮的頭部玩家和高通的長期合伙伙伴,微軟將 Copilot 帶到了 Edge 瀏覽器和最新的 Windows 11 上,致力于重新定義生產力,徹底顛覆我們與 PC 的交互方式。當這些都在 PC 上本地實現時,你將再也不用擔心與其他人爭搶服務器算力,你的數據也將被安全地保護在本地,遠離可能的云端攻擊,移動 PC 的算力將得到真正的釋放,成為生產力。
這一切的前提,是一個足夠強大的 PC 平臺,而高通同樣做到了。
2023 年驍龍峰會上,高通正式發布了專為 AI 打造的 PC 平臺驍龍 X Elite,采用 4nm 制程工藝,搭載了自研的 Oryon CPU,其性能直接對標英特爾和蘋果的旗艦處理器,多線程 CPU 性能相較蘋果 ARM 架構的 M2 Max 芯片高出 50%,單線程功耗卻少 30%;而對比英特爾 x86 架構的 i9 13980HX 芯片,則在實現更高性能的前提下,功耗少了 70%。
負責研發的高通高級副總裁 Gerard Williams表示,這次號稱史上最強 PC 平臺的“大招”憋了 4、5 年之久,不過非常值得,最終實際生產出的 Oryon CPU 性能表現甚至超過了最初的計算機模擬結果,更遠遠超出了他們的預期。
作為“看家本領”,驍龍 X Elite 平臺還采用了集成高通 Hexagon NPU 的高通 AI 引擎,異構算力高達 75 TOPS,在生成式 AI 方面的表現十分亮眼,當前支持 130 億參數大模型的終端側部署與運行,在跑 Meta Llama 2 -7B 時,每秒可生成 30 個 token,AI 處理速度達到了同類競品的 4.5 倍。
“AI PC”的實現不能僅靠單打獨斗,聯想、惠普、榮耀等 OEM 廠商將基于驍龍 X Elite 的 AI 原生平臺推出新一代 PC,讓生產力搭上 AI 時代的快車。據悉,第一批搭載驍龍 X Elite 的筆記本電腦將于 2024 年中面市,將給云端“松一口氣”,為原本疲軟的 PC 市場帶來一股新風,廣大打工人也將迎來更高效、更安全的顛覆性工作方式。
XR
走向萬物智能的時代,自然少不了數字技術構建出的“第二空間”。面向虛擬空間與現實空間并行共存的未來,包括虛擬現實、增強現實、混合現實等在內的XR 正在成為人類新型生活方式的重要入口和載體,而有了 AI 大模型的加持,其想象力的天花板也再次被捅穿。
不過,“云端”生活有著上述所有的風險,或許更甚,畢竟整個世界都可能是“空中樓閣”。只有當穿梭于兩個世界之間的鑰匙掌握在自己手中時,我們才可能開始談論“歸屬感”。為此,高通此前發布了第二代驍龍 XR 平臺,并與 Meta 合作推出了全新的Meta Quest 3頭顯設備,相比前代在空間分辨率、沉浸式體驗以及低時延攝像頭透視方面都有了很大的飛躍。
得益于新一代的芯片,Quest 3 上的應用生態愈發繁榮。就拿精品健身品牌 Xponential Fitness來說,其開發的 AI 驅動 XR 健身應用將打破傳統健身行業的時空限制,為我們帶來隨時隨地的 XR 數字人私教服務。有了大模型的加持,應用可以針對不同個體量身定制多樣的健身計劃,并輔以智能手機(當然了,搭載的是驍龍芯片)作為頭顯設備的補充,通過攝像頭等識別、分析用戶健身時的體態、動作,再以 AI 進行實時的動作矯正和指導。聽起來是不是很科幻、很誘人?得益于終端側 AI 的部署和運行,這樣實時、高效、低成本、個性化定制的健身體驗將很快成為現實,而我們離模糊了虛擬和現實邊界的智能世界又近了一步。
個性化專屬 AI 的時代剛剛開始
不論是負擔過重的云端,還是個性化專屬的市場訴求,AI 從單一云端向終端側靠攏已然是大勢所趨。對于每一位用戶來說,這意味著更快的反饋速度,更個性化的量身定制,和更可靠的隱私安全。事實上,終端側 AI 的形態遠遠不止上面所述的那些,高通已經在汽車智能座艙、物聯網等領域有所布局,包括小米在內的合作伙伴也將在新車上融入大模型技術,為用戶打造全新的人車交互方式。
專屬于每個人的個性化 AI 時代才剛剛開始。用高通公司總裁兼 CEO 安蒙的話來說,終端側 AI 是要變革以往“以應用為核心”的終端交互體驗,以大模型打通、整合整個智能系統中的信息產生與流動,從而徹底顛覆終端側的人機交互。要實現這一點,除了足夠快和個性化程度足夠高之外,最重要的是我們必須能夠信賴這樣的 AI,而能“一手掌握”的終端側部署是當下的最優解。做到這一點,或許我們就離真正“你有、你治、你享”的 AI 不遠了。
審核編輯:湯梓紅
-
服務器
+關注
關注
12文章
9021瀏覽量
85185 -
AI
+關注
關注
87文章
30151瀏覽量
268422 -
OpenAI
+關注
關注
9文章
1043瀏覽量
6408 -
大模型
+關注
關注
2文章
2330瀏覽量
2486
發布評論請先 登錄
相關推薦
評論