電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)日前,創(chuàng)新工場董事長兼首席執(zhí)行官、創(chuàng)新工場人工智能工程院院長李開復(fù)在朋友圈表示,正在籌組一個全球化公司Project AI 2.0,致力于打造AI 2.0全新平臺和AI-first生產(chǎn)力應(yīng)用。
李開復(fù)在國內(nèi)被稱為“創(chuàng)業(yè)教父”,這條朋友圈信息表明,他和美團(tuán)元老王慧文、前京東技術(shù)掌門人周伯文等人一樣,也加入到了中文版ChatGPT的混戰(zhàn)。
李開復(fù)和他的AI 2.0
目前,在創(chuàng)新工場官網(wǎng)已經(jīng)上線“Project AI 2.0”的入口,目前主要在做兩方面的工作:其一是尋找AI大模型、NLP、Multi-modality等領(lǐng)域能力的優(yōu)秀技術(shù)人和研究員,和團(tuán)隊(duì)相關(guān);其二是尋找具有 AI 2.0 相關(guān)技術(shù)、場景、算力、投資興趣的合作方,和合伙人相關(guān)。
那么,李開復(fù)所謂的AI 2.0到底是什么呢?是不是就單單指中文版ChatGPT。在3月14日的一場分享會上,李開復(fù)專門回答過這個問題。
李開復(fù)表示,AI 2.0 將會帶來平臺式的變革,改寫用戶的入口和界面,誕生全新平臺催生新一代 AI 2.0應(yīng)用的研發(fā)和商業(yè)化。從他的描述中能夠看到,AI 2.0最大的改變應(yīng)該是多模態(tài),這使得AI 2.0突破了傳統(tǒng)AI 1.0的單領(lǐng)域、低縱效等瓶頸。
通過上面的示意圖可以看到,在AI 1.0階段,應(yīng)用主要是基于單一領(lǐng)域的數(shù)據(jù)集,因此在諸多數(shù)據(jù)集和諸多模型之間存在很明顯的孤島效應(yīng)。并且,在這個階段,需要大量的人工對數(shù)據(jù)完成標(biāo)注,以提升訓(xùn)練的效率。
在AI 2.0階段,大模型會容納進(jìn)來更多的數(shù)據(jù),李開復(fù)將其定義為超級海量數(shù)據(jù)。當(dāng)然,為了提升訓(xùn)練的效率,這些數(shù)據(jù)將不再依靠人工去標(biāo)注。最終訓(xùn)練得到的模型是一個跨領(lǐng)域知識的“基礎(chǔ)模型”,能夠執(zhí)行各種各樣的任務(wù)。
從李開復(fù)的描述來看,當(dāng)前以ChatGPT為代表的AIGC只是AI 2.0的初期,這一時(shí)期的特點(diǎn)是AI從輔助性工具真正開始替代人工,將在寫代碼、創(chuàng)意和編輯等領(lǐng)域最先開始。然后隨著大模型的發(fā)展,AI 2.0不會只停留在生成式AI的階段,將逐漸演化出預(yù)測、決策、探索等更高級別的認(rèn)知智能。因此,AI 2.0囊括的遠(yuǎn)景要遠(yuǎn)遠(yuǎn)超過以ChatGPT為代表的AIGC,絕不是單純打造一個ChatGPT中文版那么簡單。
所以說,AIGC只是AI 2.0的開端。
從李開復(fù)的言論可以看出,他對AI 2.0工作的開展非常重視,將親自帶隊(duì)。創(chuàng)新工場方面表示,已有多位具有全球大廠帶領(lǐng)大型團(tuán)隊(duì)的技術(shù)管理人才,確認(rèn)了加入意向。李開復(fù)講到,創(chuàng)新工場主要關(guān)注三大方向:AI 2.0智能應(yīng)用、AI 2.0平臺、AI基礎(chǔ)設(shè)施。其中,AI 2.0應(yīng)用將會迎來遍地開花的階段,包括各行各業(yè)的垂類AI助理、元宇宙應(yīng)用等之前做不出的應(yīng)用都會出現(xiàn)。
李開復(fù)認(rèn)為,AI 2.0將分為三個階段來逐步釋放生產(chǎn)力。第一階段是順承AI 1.0的模式——人機(jī)協(xié)同,不過和過往逐字輸入而得到大量泛泛的答案不同,AI 2.0將使得文檔能夠通過用戶的描述而精準(zhǔn)的輸出。不過,這一階段依然需要人工的協(xié)助,以校對AI輸出的內(nèi)容是否準(zhǔn)確。在第一階段,搜索引擎的改變是最直接的,所有用戶界面都將被重塑。
第二階段是局部自動的階段,這一時(shí)期AI將在容錯率高的領(lǐng)域獨(dú)自完成工作,而無需人工的介入,進(jìn)而顯著提升工作效率,比較顯著的代表領(lǐng)域是廣告、游戲和電子商務(wù)等。
第三階段則是全自動化階段,完全不再需要人工的介入。這一階段最典型的特征是,AI將被應(yīng)用于不容出錯的領(lǐng)域中,比如醫(yī)療、金融等。
除了自己研究之外,李開復(fù)還在朋友圈提到,“我們也積極尋找AI 2.0技術(shù)和應(yīng)用相關(guān)的投資機(jī)會,加速打造AI 2.0的全新創(chuàng)業(yè)生態(tài),對于AI 2.0的未來,我們具有更多更大的想象。 ”
AI 2.0的幾道門檻
綜上所述,很顯然李開復(fù)看到的AI 2.0是以ChatGPT中文版為起點(diǎn),最終實(shí)現(xiàn)的是AI對各行各業(yè)的滲透。
不過,李開復(fù)所提到的AI 2.0在實(shí)現(xiàn)的過程中,有幾個明顯的門檻,并且都極具挑戰(zhàn)。
首先是大模型在提示和標(biāo)注方面的工作,目前這方面的工作很多還是依靠人工。就以提示工作來說,這個崗位除了要求熟悉LLM架構(gòu)會編程,還要求有探索思維,需要腦洞大開,用合適的描述讓AI發(fā)揮出最大的潛力,這就說明現(xiàn)階段的AI還不夠聰明;再看一下數(shù)據(jù)標(biāo)注,我們都知道光耀的GPT大模型背后隱藏著數(shù)據(jù)標(biāo)注的“血汗工廠”,為了訓(xùn)練ChatGPT,OpenAI雇傭了時(shí)薪不到2美元的外包肯尼亞勞工,他們所負(fù)責(zé)的工作就是數(shù)據(jù)標(biāo)注,包括數(shù)據(jù)標(biāo)注、打標(biāo)簽、分類、調(diào)整和處理等。這些需要人工參與的環(huán)節(jié)隨著模型規(guī)模的增加將逐漸成為明顯的限制,否則那些參數(shù)萬億級別的大模型肯定要比GPT強(qiáng),現(xiàn)實(shí)是訓(xùn)練數(shù)據(jù)更精準(zhǔn)的GPT明顯更厲害。
其次是法律法規(guī)的缺失,GPT-3.5模型已經(jīng)顯示出,如果監(jiān)管不到位,ChatGPT可能存在對人類的偏見,并表現(xiàn)出攻擊性。目前,在GPT-4發(fā)布時(shí),微軟依然在依賴人工對抗訓(xùn)練來優(yōu)化這方面,并沒有現(xiàn)成的法規(guī)來說明需要達(dá)到什么程度。如果繼續(xù)這樣野蠻生長,特斯拉CEO埃隆·馬斯克、ChatGPT之父Sam Altman等人的擔(dān)憂也許會成為現(xiàn)實(shí),把人類尤其是分辨力不強(qiáng)的孩童帶入到危險(xiǎn)的境地,甚至可能產(chǎn)生自主思維消滅人類。因此Sam Altman呼吁,監(jiān)管機(jī)構(gòu)和社會需要參與這項(xiàng)技術(shù),以防止對人類可能產(chǎn)生的負(fù)面影響。
正如中國科學(xué)院大學(xué)人工智能學(xué)院副院長肖俊所言,ChatGPT是人工智能發(fā)展過程中的一個正常產(chǎn)物。而我們也都清楚,現(xiàn)階段以及未來的AI都需要持續(xù)依仗大數(shù)據(jù)。然而,面向公眾層面的大數(shù)據(jù)基本來源于互聯(lián)網(wǎng)。互聯(lián)網(wǎng)也被稱為數(shù)據(jù)大染缸,目前還有非常多監(jiān)管不到位的問題。那么,為了讓基于大模型的應(yīng)用是安全準(zhǔn)確的,目前來看李開復(fù)所提到的超級海量數(shù)據(jù)自動篩選和標(biāo)注在可預(yù)見的未來是難以做到的。否則,訓(xùn)練出來的產(chǎn)物將非常不可控。
第三個門檻是國內(nèi)需要獨(dú)自面臨的問題——國產(chǎn)高端計(jì)算芯片的缺失。在李開復(fù)的描述中,基礎(chǔ)設(shè)施建設(shè)是AI 2.0環(huán)節(jié)的重要一環(huán)。不過在現(xiàn)階段,我們見到GPT或者其他相關(guān)的大模型實(shí)際上都是基于英偉達(dá)的GPU在做訓(xùn)練,也就說英偉達(dá)產(chǎn)品是當(dāng)前AIGC發(fā)展的動力之源。在這方面,國內(nèi)硬件差距可能是五年,軟硬件的綜合差距可能是十年。在全球主要國家和地區(qū)都關(guān)注AIGC發(fā)展時(shí),英偉達(dá)GPU隨時(shí)都可能成為緊俏資源,或者是限制資源,那么我們在基礎(chǔ)設(shè)施方面的工作到時(shí)候只能被迫延后。
此前,有行業(yè)人士在接受電子發(fā)燒友網(wǎng)采訪時(shí)表示,目前支撐大模型訓(xùn)練的算力架構(gòu)從馮諾依曼開始就沒有發(fā)生過改變,計(jì)算、傳輸和存儲是三大核心環(huán)節(jié)。在這個基本框架下,國內(nèi)在諸多環(huán)節(jié)處于落后并受到掣肘。因此,有從業(yè)者認(rèn)為,在AIGC以及大模型狂飆的同時(shí),國內(nèi)也應(yīng)該嘗試更多算力層面的創(chuàng)新,比如用ASIC+垂直大模型解決具體行業(yè)的問題,不再依靠英偉達(dá)的通用算力GPU;另外存內(nèi)計(jì)算等創(chuàng)新型計(jì)算芯片也值得去關(guān)注。
后記
很明顯,李開復(fù)通過ChatGPT看到了AI 2.0時(shí)代更光明的未來,因此獨(dú)自帶隊(duì),投身到“Project AI 2.0”項(xiàng)目上,也算是加入到了中文版ChatGPT的混戰(zhàn)。不過,AI 2.0圖謀的越大越遠(yuǎn),里面出現(xiàn)的問題就會越多,我們產(chǎn)業(yè)的薄弱環(huán)節(jié)也會被放大。如果這些短板不能隨著模型和算法一起得到增強(qiáng),我們的AI 2.0時(shí)代很可能就是一個地基不穩(wěn)的大廈,看著宏偉但經(jīng)不起風(fēng)吹雨打。
-
AI
+關(guān)注
關(guān)注
87文章
30238瀏覽量
268471 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1549瀏覽量
7507
發(fā)布評論請先 登錄
相關(guān)推薦
評論