在聯(lián)合國總部的花園里,矗立著一尊青銅雕塑,名為“Let Us Beat Swords into Plowshares”,一個人手拿錘子,正在將劍改鑄為犁——“鑄劍為犁”,代表了近一個世紀以來,人類社會對于文明與發(fā)展的共識:將武器變?yōu)閯?chuàng)造的工具,以造福全人類。
而在人工智能領域,作為發(fā)展關鍵技術的預訓練大模型,也同時具備了劍與犁的兩種屬性——
開疆做劍:大模型在全球掀起了軍備競賽,參數(shù)規(guī)模不斷升級,文心等大模型的出現(xiàn),意味著中國將這一AI利器握在了手中,守住了智能科技的疆土;
開荒做犁:借助大模型強大的通用能力和開源開放,千行百業(yè)和開發(fā)者也因此受益,不必從零開始,可以低門檻地“開荒”引入AI,啟動智能化轉型升級。
近幾年,面對全球經(jīng)濟和政治形勢的不確定性,人們從未如此迫切地渴望過,將科技“鑄劍為犁”,大模型也應當從軍備競賽變?yōu)楫a(chǎn)業(yè)發(fā)展的新動能。
如何才能讓大模型“鑄劍為犁”、服務于民生百業(yè)?我回想起了一件往事。
2019年的時候,大模型還算是各大科技巨頭的“不傳之秘”,某實驗室就因為不愿意開放最新的大模型,被業(yè)界嘲諷是CloseAI(封閉AI)。而百度在當年發(fā)布了中國首個正式開放的預訓練模型ERNIE 1.0(產(chǎn)業(yè)級知識增強大模型文心的前身),卻沒有藏器待時,而是直接開啟了大模型落地應用的探索,聚焦“產(chǎn)業(yè)智能化”。
這件事令我記憶猶新,可以說,以百度為代表的中國AI力量,在大模型趨勢初現(xiàn)之際,就選擇了“鑄劍為犁”、造福產(chǎn)業(yè)的發(fā)展方向。
那么,時間來到2022年春,大模型能夠為普通人和千行百業(yè)所用了嗎?
4月16日,在剛剛結束的2021百度認知AI創(chuàng)意賽“AI創(chuàng)意派”決賽現(xiàn)場,我得到了AI大模型一些最新動向。簡單來說:1.大模型加速落地應用,展現(xiàn)出走進產(chǎn)業(yè)深處的無限可能;2.文心大模型應用門檻持續(xù)降低,公眾首次參賽,釋放出AI創(chuàng)意的無限遐想。
在這個乍暖還寒的春天,跟大家分享一下產(chǎn)業(yè)和個人,如何在當下用AI大模型種植希望。
幾度春風:AI大模型走進產(chǎn)業(yè)的百花深處
在你的印象中,都是哪些人在使用AI大模型?用GPT3訓練出“碾壓人類”小作文的,是世界頂尖算法工程師;用AlphaFold預測蛋白質的,是全球頂級AI實驗室;還有炸裂眼球的AI for science大模型,是為預算幾乎無上限的科學任務所準備的……這些AI大模型,千行百業(yè)的普通人不會用,也用不起。
難道,大模型注定與普通人無緣了?在2021百度認知AI創(chuàng)意賽“AI創(chuàng)意派”上,百度文心大模型,為我們展現(xiàn)了另一種打開方式。
正如百度集團副總裁吳甜在比賽現(xiàn)場所說:“只有人工智能和大模型的門檻,低到了所有人都可方便地用起來,才能真正大規(guī)模爆發(fā)出各種創(chuàng)意。本次創(chuàng)意賽中,選手展現(xiàn)了基于文心大模型的豐富創(chuàng)意,讓我們看到了大模型廣泛應用的前景。”
這個“鑄劍為犁”的產(chǎn)業(yè)化過程,是怎么發(fā)生的?
第一步:技術的鍛造。
與實驗室里的算力怪獸、規(guī)模巨獸不同,面向產(chǎn)業(yè)落地應用的大模型,還有許多技術難題需要攻克,解決成本、效率、部署等問題。為此,百度做了許多技術創(chuàng)新工作。
一方面,不斷提升參數(shù)規(guī)模和模型效果。2021年12月,ERNIE 3.0 升級為全球首個知識增強千億大模型,成為目前為止全球最大的中文單體模型,這也意味著通用能力更出色,泛化能力更強,只需學習少量行業(yè)數(shù)據(jù),就能夠應用于很多業(yè)務場景,降低企業(yè)的應用門檻。
另一方面,為了保證超大規(guī)模模型的學習效果,百度產(chǎn)業(yè)級深度學習平臺飛槳自主研發(fā)了端到端自適應分布式訓練框架與4D混合并行技術,有效支持文心大模型高效穩(wěn)定的訓練,讓產(chǎn)業(yè)用戶可以低成本地使用。
在技術的錘煉下,才能鍛造出一個產(chǎn)業(yè)可用、好用的大模型,真正支撐產(chǎn)業(yè)應用。此次吳甜也提到,大模型未來的發(fā)展趨勢之一,將是技術的持續(xù)創(chuàng)新。
第二步:產(chǎn)業(yè)的熔爐。
目前,產(chǎn)業(yè)在落地應用AI上遇到的普遍阻礙,就是行業(yè)know-how與AI模型的不相融,無法解決真實復雜的業(yè)務問題。傳統(tǒng)深度學習是“蠻力計算”,無法理解數(shù)據(jù)深層的含義。
作為產(chǎn)業(yè)級大模型,文心與其他大模型的核心差異之一,就是為產(chǎn)業(yè)與AI的融合增加了一個關鍵的催化劑——“知識增強”,將大規(guī)模知識與深度學習相結合,讓AI能夠理解特定領域數(shù)據(jù)背后所隱含的知識關系,從而提升理解能力。
舉個例子,病歷質量控制對于醫(yī)療行業(yè)非常重要,但掌握全科醫(yī)學知識的醫(yī)生很少,醫(yī)院病案科的醫(yī)生在進行抽檢工作時,病歷數(shù)量多,工作難度大,依靠有限的知識很難對所有病歷做出非常準確的分析和判斷。如果AI算法不能理解醫(yī)學知識,也無法很好地幫助病案科工作提質增效。百度在文心大模型基礎上加入了藥典、醫(yī)學大百科等一系列知識,再基于大模型訓練出醫(yī)療相關的模型,達到醫(yī)學博士的水平,可以對每份病案進行秒級別的智能掃描分析,從而有效提升了病案質控的工作效率。
第三步:大生產(chǎn)的模具。
從農(nóng)業(yè)生產(chǎn)到工業(yè)制造,規(guī)模化大生產(chǎn)必不可少的就是標準化模具的出現(xiàn)。AI的規(guī)模化應用,也離不開一系列配套工具與平臺。
目前,文心大模型支持數(shù)百家企業(yè)與機構,開發(fā)者數(shù)量超過6萬,對外日調量已經(jīng)超過了五千萬次。這是因為,借助百度飛槳、百度大腦等平臺和工具,文心大模型的能力能夠被各行各業(yè)開發(fā)者低門檻地應用。
以飛槳企業(yè)版零門檻AI開發(fā)平臺EasyDL為例,其就基于文心大模型推出了高精度NLP模型,最快15分鐘就可以完成垂直領域的模型訓練。哪怕是沒有AI基礎的金融、法律等從業(yè)人士,也能通過EasyDL一站式自動化訓練,用少量數(shù)據(jù)構建出自動分析合同條款、自動分析金融研報等定制模型。
這些配套工具與平臺的支撐,讓文心大模型能夠進入規(guī)模化應用階段。因此,吳甜也認為2022年將是文心大模型產(chǎn)業(yè)落地的關鍵年。
從科學家和工程師手中的神兵利器,到普通人和千行百業(yè)的繩墨爐錘,文心大模型“鑄劍為犁”,與產(chǎn)業(yè)共同孕育出了百花齊放的智能之春。
低吟淺唱:放飛AI大模型的無盡想象
哥倫布發(fā)現(xiàn)美洲之后,辣椒進入了人類的餐桌;萊特兄弟對天空的向往,拉開了飛行的序幕;喬布斯天才般的創(chuàng)意,智能手機開始主宰你我的生活……每一次技術浪潮,都少不了天才人物的神來之筆,用創(chuàng)意點燃了新技術的無限想象。
AI時代,大家都不希望中國只能跟在別人身后亦步亦趨,但是,創(chuàng)意從哪里來?
百度給出了一個答案:“創(chuàng)意在民間。”百度集團副總裁吳甜在AI創(chuàng)意派的比賽現(xiàn)場這樣說道。
民間,意味著要讓AI大模型為最廣泛的人才所用,無論技術水平高低都能參與其中。
此次比賽中,百度首次將AI大模型的使用門檻降到了大眾級別,吸引了全國各地近2000名不同年齡、不同技術基礎的選手。“樂植問答”項目的開發(fā)者林杰,就是一個農(nóng)業(yè)公司的產(chǎn)品負責人,沒有上手開發(fā)過。這次基于飛槳EasyDL平臺使用ERNIE 3.0,林杰的開發(fā)過程還挺順利,一步步訓練出了能夠解答植物問題的DEMO。最近打算自己種菜的朋友越來越多,說不定未來林杰的產(chǎn)品真能拯救植物殺手們。
民間,意味著AI創(chuàng)新會貼近真實生活,大模型要能夠解決大量細節(jié)而具體的問題。
本次創(chuàng)意賽的300多份創(chuàng)意方案中,有不少是大廠想不到,普通人卻特別期待的。比如哈工大大二學生煥宜就用六天時間,打造了一個“朋友圈古風文案小能手”,只要有圖片,分分鐘讓你變身文案達人,在朋友圈裝一把文人墨客,吸引點贊無數(shù)。
民間,意味著未知的場景和挑戰(zhàn),大模型會遭遇各種意想不到的用途和場景,也能在實踐中得到檢驗和提升。一個出乎意料的創(chuàng)意就是“反詐疫苗機器人”。
反詐App我下過、疫苗我打過、機器人我玩過,但這個“反詐疫苗機器人”究竟是啥,還真是一頭霧水。原來,開發(fā)者郭成(化名)對自己奶奶的各種反詐騙經(jīng)歷印象深刻,就有了用NLP技術來幫助弱勢群體識別詐騙套路的想法。報名參賽后,郭成利用百度ERNIE 3.0大模型開發(fā)了一個對話機器人,用戶跟它對話就能從實踐中汲取反詐經(jīng)驗,提高防騙能力,相當于打了一針“思想疫苗”。要理解騙子們狡詐詭譎的語言套路,自然就需要機器人具備極高的語義理解、意圖識別等能力,而這正是ERNIE 3.0大模型的優(yōu)勢之一。
對于廣大圍觀群眾來說,一場比賽的創(chuàng)意可能無法全部落地變?yōu)楝F(xiàn)實。但每一個參賽者,一定能夠從項目實踐中,感受到大模型的真正實力。而AI大模型落地應用的無限可能,就藏在這些關注的眼眸、放飛的腦洞之中。
一犁新雨破春耕:文心為智能時代寫下風物詩
如果說,文心大模型深入產(chǎn)業(yè),是從誕生之初就開始的“潤物細無聲”,那么剛剛結束的AI創(chuàng)意賽就像是一犁新雨破春耕,讓我們格外清晰地看到,大模型如何為AI規(guī)模化應用插上騰飛的翅膀。
原因也很簡單,大模型要服務于產(chǎn)業(yè),必須能夠解決那些具體的、細節(jié)的、工程化的問題。AI科學家們討論的是模型收斂、魯棒性、認知智能這類專業(yè)問題,而當大模型走進千行百業(yè),遭遇的問題則是如同參賽者們提出的一樣:如何找到合適的數(shù)據(jù)集?買不到GPU怎么訓練?不會調參該如何操作?結果不符合預期怎么辦?
大模型要“鑄劍為犁”,就必須指導并幫助產(chǎn)業(yè)人士解決這些現(xiàn)實問題。顯然,通過這次AI創(chuàng)意賽,對于上述問題,百度已經(jīng)有了成功的探索和答案。當然,這不僅僅是文心大模型的功勞,而是百度通過一整套體系,確保大模型能力被融合到產(chǎn)業(yè)智能化升級中。
最核心的,就是飛槳與大模型的融合。前面提到的飛槳開發(fā)出4D混合并行策略、自適應分布式訓練等,有效地支持文心大模型高效穩(wěn)定訓練,還有飛槳EasyDL等開發(fā)平臺和工具,也早已開源給社會各界使用。飛槳與大模型的強強聯(lián)手、融合發(fā)展,成為一個技術領先、自主創(chuàng)新、能力堅實、產(chǎn)業(yè)可用的AI大底座,有力地支撐中國產(chǎn)業(yè)智能化轉型。
接下來,是云與大模型的融合。產(chǎn)業(yè)智能化呼喚著更敏捷、簡單、低成本的AI獲取方式,云服務成為各行各業(yè)引入AI大模型、基礎算法、AI算力等的必經(jīng)之路。在這樣的大背景下,百度很早就推動了AI與云的深度融合,百度智能云作為百度AI技術的產(chǎn)業(yè)出口,正在將文心大模型推向越來越多的產(chǎn)業(yè)場景。
當然,大模型的發(fā)展也離不開與人才生態(tài)的融合。提到AI人才教育,似乎總是伴隨著嚴肅和焦慮,其實不然。中國人所向往的教育最高境界,是“暮春者,春服既成,冠者五六人,童子六七人,浴乎沂,風乎舞雩,詠而歸”。而AI創(chuàng)意賽恰恰讓我有了這種感受,在文心大模型的臂膀托舉下,無數(shù)創(chuàng)意自由地、輕盈而舒展地飛揚。當普通人也能且歌且行,融入AI創(chuàng)意的洪流,我們還會擔心聽不到AI創(chuàng)新的聲音嗎?
經(jīng)過三年耕耘,百度為AI大模型確立了從研致用的新范式,推動大模型走向“鑄劍為犁”、服務產(chǎn)業(yè)的新階段。
隨著更多人與產(chǎn)業(yè)加入大模型的合唱,一首智能時代的風物詩,將飄揚在華夏大地的每一個角落。
-
AI
+關注
關注
87文章
30239瀏覽量
268484 -
百度
+關注
關注
9文章
2258瀏覽量
90271 -
算力
+關注
關注
1文章
936瀏覽量
14750
發(fā)布評論請先 登錄
相關推薦
評論