把時間倒回一年之前,那時很多媒體和網友討論,中國能做出來類ChatGPT的大模型應用嗎?
當時我們就說,不用慌,不用忙,中國一定能做成大模型。轉瞬間,被稱為“大模型元年”的2023年即將在爆竹聲中結束。中國AI大模型,舉頭已覺千山綠。
根據相關數據,到2023年10月中國市場已經發布了超過230個大模型。“百模趕考”實至名歸。但是,大模型數量并不是做成大模型的終點,甚至不是做大模型的目的。
在今天這個階段,我們必須回答新的問題:大模型有了,怎么才能把大模型做好,用好?怎么才能讓大模型為社會經濟做出巨大價值?
想回答這個問題,就必須知道大模型的“好”是什么。
評價大模型的質量好壞,不是靠參數,靠規模,而是比效率,比技術,比應用,比生態,最終比誰最好用,誰最有用。
在探討這些問題時,我們會發現國產大模型格局的另一面:大模型雖多,但普通人知道,用到的卻并不多。隨便找個朋友問一問,會發現他大概率只知道一個國產大模型,那就是文心一言與其背后的文心大模型。
雖然有數量過百的大模型策馬奔騰,但卻是文心大模型一騎絕塵。為什么會這樣?
理解這個問題,才能理解大模型的本質規律:只有厚積薄發,做深做強,才是國產大模型的未來之路。
歲末回首,重新審視“百模趕考,文心奪魁”的行業格局,能看到AGI的曙光正悄然來到這片土地上。
身位之先:大模型的效率競賽
在AI大模型剛剛興起之際,用戶對它有好奇,行業對它有渴望,社會經濟對它有廣泛多元的期待。這時,誰能夠率先將大模型帶給用戶與產業,誰就能夠立下先鋒之功,通過身位領先來確定自身的行業優勢。
回望過去一年大模型行業的發展,會發現文心大模型每次都在扮演先鋒的角色。最終將大模型技術最快交到用戶、開發者以及千行百業手中。文心大模型的高效率、快節奏,以及這背后的技術領先與產品自信,是其能夠保持“一騎絕塵”的首要關鍵。
2023年3月,百度率先發布了文心一言大語言模型。這得益于百度十余年布局和深耕深度學習技術,并進行了廣泛的AI業務實踐。從2019年開始,百度就深耕預模型研發,打造了文心大模型體系。厚積薄發,做足準備的文心,在開年之際就達成了一路領先。
2023年7月,在2023世界人工智能大會期間,國家人工智能標準化總體組宣布了中國首個大模型標準化專題組組長單位名單,百度擔任聯合組長單位。至此,文心大模型正式進入“大模型國家隊”,為國產大模型標準化事業探尋航道,確立方向。
接下來,在8月31日,文心一言正式面向全社會開放,成為中國公眾能夠最早體驗到的大語言模型,真正將大模型能力帶到千家萬戶,尋常巷陌。
2013年12月,中國首個官方“大模型標準符合性評測”結果出爐。文心一言成為首批通過評測,符合《人工智能大規模預訓練模型 第2部分:評測指標與方法》語言大模型的相關技術要求,通用性、智能性等維度全面達到國家相關標準。
最先推出,最新開放,最先符合國家標準,“先”已經成為文心大模型的關鍵詞。深耕AI核心技術,打造AI生態,帶來的是厚積薄發下的高效率與快節奏。
文心之先,一騎絕塵,可以為整個AI行業所借鑒。
技術做厚:大模型的技術差異化積累
在我們討論AI大模型數量過多,行業飽和的問題時,經常會注意到一個現象:數百個大模型問世,但我們卻很難找到這些大模型之間的技術差異化有哪些?更遑論體會到技術差異帶來了應用差異。
這個現象出現的原因,在于大模型盲目追求數據量與模型參數,忽視了核心技術的研發與積累。文心大模型之所以反響好,用戶認同高,就在于它選擇了最厚重,最扎實的技術研發之路。每一代文心大模型升級,都建立在新技術能力的研發與運用基礎上。這就導致文心越升級,與其他大模型的技術能力差距就越大。技術的滾雪球現象開始顯現,最終形成了文心大模型在技術方面“人無我有,人有我優”的戰略優勢。堆山百仞,起于壘土。
2023年發布的文心一言背后,是文心大模型3.0。當時文心已經憑借知識增強技術確立了大模型領域的技術差異化,具備知識增強、檢索增強和對話增強的優勢。
隨后到5月,文心大模型3.5版本發布。其在基礎模型、精調技術、知識點增強、邏輯推理、插件機制等方面進行了創新,取得了生成效果和效率的全面提升。
到了10月,文心大模型4.0版本正式推出。其在多個關鍵技術方向上實現了突破,在理解、生成、邏輯、記憶四大能力上都有顯著提升。尤其邏輯和記憶能力大幅提升,帶給用戶非常直觀的幫助。
文心大模型能夠實現如此高效率、大幅度的技術升級,離不開其背后高效算力、自研框架,以及數據處理機制的協同優化。尤其文心飛槳聯合調優,成為業界著名的大模型高速發展案例,在過去一年受到了AI行業的廣泛討論。
文心大模型在萬卡算力上基于飛槳平臺,通過集群基礎設施和調度系統、飛槳框架的軟硬協同優化,支持了大模型的穩定高效訓練。自2023年3月發布以來,文心大模型的訓練效率已提升數倍,周均訓練有效率已經超過98%。
對核心技術的探索,對技術差異化的積累,讓文心大模型有了技術之厚。這是文心持續領先的底牌與底色。只要在技術上有更高追求,很多問題就自然會有答案。
應用需廣:如何將大模型帶到應用一線?
想要知道一棵樹是不是棟梁之材,不能僅僅坐而論道,把它夸得天花亂墜,而是要把它真正用起來,讓它去架梁持屋,發揮自己的價值。
對于AI大模型來說也是如此。大模型是否有用,不是在發布會和測試數據里說出來的,而是在億萬用戶,在千行百業手里用出來的。
審視過往一年的大模型行業發展,我們會發現在應用的廣度上,文心是其他大模型難以望其項背的。在C端用戶,只有文心一言實現了億級用戶規模;在B端應用,文心大模型的調用量超過了其他200家大模型的總和。
跨越數量級的應用領先,讓文心大模型在行業用戶、開發者、普通用戶手中探索出了無數種價值可能。在百度業務當中,文心大模型已大規模應用于搜索、信息流、智能音箱等互聯網產品;在對外開放過程中,文心大模型通過飛槳開源開放平臺、百度智能云賦能制造、能源、金融、通信、媒體、城市、教育等各行各業。文心大模型已與各行業頭部企業、機構共建了超過10個行業大模型,加速行業智能化升級。
在國家跳水隊,文心大模型對AI輔助訓練系統進行了全面升級,不僅能夠理解和執行教練與運動員的復雜指令,還可以對動作實時打分、精準量化分析。2023年,中國游泳協會授予百度“中國國家跳水隊人工智能合作伙伴”稱號。
在與國家圖書館的合作中,文心大模型通過大量學習古代方志和家譜數據,并進行文字識別和理解,打造了“古文今問”服務。用戶只需輸入尋根信息,就能得到相應的線索反饋,幫助全球華人尋根訪祖。
在聲橋 AI 語訓團隊手中,基于飛槳和文心大模型打造的 AI 口語康復應用,可以提供文字形式的反饋指導,幫助聽障人士進行語言訓練。
桃李不言,下自成蹊。文心的應用之廣,是其價值最好的證明。同時也證明了中國的AI大模型并不只有數量,更有應用的質量,有真材實料的智能化探索。
生態需盛:大模型生態建設刻不容緩
我們都知道,做軟件最難的就是做生態。生態決定了基礎軟件技術的探索上限,也決定了其未來長期發展的可能性。在AI技術剛剛發展起來時,做AI必須做生態就成為產業共識。
但在目前階段,我們可以看到中國有數量過百的大模型,卻很少有廠商關注生態建設。長此以往,容易導致大模型變成沒人會用,也沒人想用的“孤品”。
文心大模型之所以能保持領先,很大一部分原因來自生態的支持與推動。只有千萬人共建、共創的大模型,才是有生命力和持久力的大模型。
為此,百度推進飛槳與文心生態共同創新、相互促進。截止2023年12月,飛槳已凝聚1070萬開發者,服務23.5萬家企事業單位,基于飛槳創建了86萬個模型。飛槳生態與文心生態互為助力,推動彼此高速發展。
開發者社區是生態發展的關鍵支撐,百度打造了中國最大AI社區“星河社區”,伴隨大模型的發展,百度正式推出星河大模型社區,為開發者提供一體化大模型開發體驗,以及豐富的產品功能。截至2023年12月,星河大模型社區已經推出了超過4000個基于文心大模型的創新AI應用。
在生態共創方面,百度發布了文心大模型星河共創計劃,希望與開發者和生態伙伴合作,實現AI應用的廣泛創新。
與開發者生態的相輔相成的,是人才生態的建設。2020年,百度提出“5年為全社會培養500萬人工智能人才”的目標。截至2023年10月,百度已經培養了420萬AI人才。面對大模型技術巨大的人才需求,2023年百度發布了全新的人才培養星河計劃,將與產學研各界合作,為社會再培養500萬大模型人才。
無論從開發者聚合、應用創新、人才培養等任何維度來看,文心大模型的生態建設都已經展現出了繁盛的一面。生態起步快,活力高,受眾廣,真正實現文心大模型的土壤上“千樹萬樹梨花開”。
可以說,文心生態的興起,為國產大模型生態的整體建設奠定了典范,拓寬了邊界。
從大模型元年,到AGI曙光
經過風起云涌的一年,大模型領域的問題,從“有沒有大模型”,變成了“能不能做好大模型”“能不能用好大模型”。
面對新問題,新考驗,文心大模型在身位、技術、應用、生態四個方面的領先就是答案。
根據IDC《AI大模型技術能力評估報告,2023》顯示,文心大模型在14個參評模型中拿下12項指標的7個滿分,綜合評分位列國內主流大模型第一,并在算法模型、行業覆蓋兩大關鍵指標上拿下唯一滿分。
在人民數據發布的《AI大模型綜合能力測評報告》中顯示,文心一言不僅綜合評分超越ChatGPT,位居全球第一,更在內容生態、數據認知、知識問答三大維度評分超越ChatGPT。并且六大維度評分均位列國內大模型榜首。
如果說,在大模型元年,我們看到的是大模型的數量。
那么在更遠的未來,在我們所期待的大模型之春,需要看到的是大模型的應用質量和普惠價值。
如何才能實現這個進化?文心大模型已經在過去一年,用“先”“厚”“廣”“盛”這四個字做出了回答。只有整個行業都以這樣的路徑發展,去蕪存菁,避虛務實,國產大模型才能持續向好,打開行業之春,走向AGI之夏。
2023年8月16日,WAVE SUMMIT深度學習開發者大會2023在北京舉行。期間,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰表示,人工智能具有多種典型能力,理解、生成、邏輯、記憶是其中的基礎能力,這四項能力越強,越接近通用人工智能,而大語言模型具備了這四項能力,為通用人工智能帶來曙光。
在這場人類科技面向星辰大海的航行中,我們已經見到了曙光,只有找到正確的方向,選擇技術長跑,選擇生態共贏,才能讓漫長的征程一步步落地,讓AGI的曙光點點化為現實。
“百模趕考,文心奪魁”的行業格局,本質上是對技術主義與務實精神的肯定。
理解了這一點,也就找到了AI技術發展的前路。
-
AI
+關注
關注
87文章
30106瀏覽量
268399 -
ChatGPT
+關注
關注
29文章
1548瀏覽量
7487 -
文心一言
+關注
關注
0文章
123瀏覽量
1256 -
大模型
+關注
關注
2文章
2322瀏覽量
2479 -
AI大模型
+關注
關注
0文章
307瀏覽量
289
發布評論請先 登錄
相關推薦
評論