OpenAI的最新技術(shù)成果——文生視頻模型Sora,在春節(jié)假期炸裂登場,令海內(nèi)外的AI從業(yè)者、投資人徹夜難眠。
如果你還沒有關(guān)注到這個新聞,簡單介紹一下:Sora是OpenAI使用超大規(guī)模視頻數(shù)據(jù),訓(xùn)練出的一個通用視覺模型,可以理解和模擬運動中的物理世界,生成不同時間、縱橫比和分辨率的視頻,最大版本的Sora能夠生成長達一分鐘的高保真視頻。
Sora發(fā)布之前,也有許多采用各種方法的視頻生成模型,但都使用較少的視覺數(shù)據(jù),只能生成較短(4秒)或固定大小的視頻。所以,Sora逼真的視覺效果、碾壓級的性能提升,在震撼整個科技圈之余,也導(dǎo)致了“中國AI焦慮癥”的人傳人現(xiàn)象。
廣大網(wǎng)友們再一次痛心疾首,對中國A發(fā)出質(zhì)問:
為什么又一個AI元創(chuàng)新沒能發(fā)生在中國?我們點錯了科技樹,好難過;
中國跟美國的AI差距越來越大,Sora這波國內(nèi)慢了十年吧?這下真跟不上了;
復(fù)制Sora算力是最大阻礙,從芯片禁運開始咱們就完敗了,沒戲了。
當(dāng)然也不乏陰陽怪氣的,“等國外的類Sora模型開源,國內(nèi)AI公司就又能創(chuàng)新啦”。
在中美對弈的時代背景下,上述焦慮情緒,每一次在海外科技取得重大突破的時候,都會蔓延開來。但時間證明,作為全球唯二的AI大國之一,中國發(fā)展了多年AI技術(shù),就算美國真有什么新AI成果是其他國家做不了、趕不上的,那也絕對不是中國。
拿并不遙遠的ChatGPT來說,經(jīng)過一年狂奔,“中國有沒有自己的ChatGPT”已經(jīng)不再成為問題。2023年很多國產(chǎn)“類ChatGPT”大語言模型已經(jīng)向公眾開放使用,走進行業(yè)場景,有數(shù)億用戶檢測過中國AI的真實水平,或許與OpenAI還存在差距,但肯定不是一些人擔(dān)憂的那樣,認為“中國做不到”“技術(shù)有代差”。
這就像我們經(jīng)常會看到一類“震驚體”新聞,一種新藥問世,就說人類離永生不遠了;一個AI突破,就說AGI要實現(xiàn)了,人類要被毀滅了。讀者在這些奇談怪論中“死去活來”,對AI的認知也在“成神”和“騙子”之間反復(fù)橫跳。而真正懂藥的人,肯定不會相信一種藥能包治百病,而是搞清楚療效和副作用,在對應(yīng)的癥狀上使用。
同理,真正了解AI產(chǎn)業(yè)的人,也能正視中國AI的長處,承認現(xiàn)實差距,不卑不亢,積極應(yīng)對。
尤其是經(jīng)過了ChatGPT的“練兵”之后,這一次我們應(yīng)該更有底氣,客觀看待Sora對中國AI帶來的真實變化,準備迎接又一個“AI之春”。
變化一:拉近差距
在“ChatGPT為什么沒有誕生在中國?”之后,龍年版本已經(jīng)成了“Sora為什么沒有誕生在中國?”接連兩次錯失“元創(chuàng)新”,讓期待中國AI“彎道超車”“后來居上”的急性子讀者,大感失望。
科技發(fā)展從來不是一步登天,現(xiàn)實并沒有爽文小說中逆襲打臉的“金手指”,只能是一步一個腳印邁進。不能否認,大語言模型、文生視頻模型的顛覆性產(chǎn)品,沒有首發(fā)在中國,但也必須看到,中國AI一直都在正確的道路上,并且腳步在加速。
Sora的發(fā)布,反而會讓中美AI的距離進一步拉近,原因有三:
首先,方向一致。
錯過一場技術(shù)革命,最可怕的不是來得晚,而是點錯技能樹,比如歷史上日本大力發(fā)展的“五代機”,選錯方向就錯過了一個時代。OpenAI的ChatGPT、Sora都是在大規(guī)模預(yù)訓(xùn)練模型的技術(shù)路徑上,進行大量的工程實踐創(chuàng)新。由此可見,一項新突破,技術(shù)積累、技術(shù)選型是十分重要的,而這條以Transformer架構(gòu)為主的“大模型之路”,中國AI一直在持續(xù)跟進,基礎(chǔ)設(shè)施和算法層面的堅實程度是肉眼可見的。
其次,目標明確。
OpenAI的元創(chuàng)新讓人應(yīng)接不暇,處于全球AI領(lǐng)先地位,中國AI企業(yè)確實與其存在差距,始終在追趕。但這并不是諷刺中國AI的理由。“沒有從頭發(fā)明xx技術(shù)”,并不代表不優(yōu)秀,OpenAI也不是Transformer發(fā)明者。而且,OpenAI本身就是一家集合了全球頂尖人才、力量與資本的特殊AI公司,就連谷歌都跟在后面屢敗屢戰(zhàn),用OpenAI的標準去要求各方面資源受限的中國AI產(chǎn)學(xué)研機構(gòu),其實是不公平的。
Sora明確了,“視頻生成模型是一條構(gòu)建物理世界通用模擬器的有效路徑”,印證了暴力計算的又一次勝利,“Scaling Law”大力出奇跡的涌現(xiàn)效果,相當(dāng)于為中國AI領(lǐng)域完成了“探路”。有了清晰的追趕目標,中國AI各界反而能快速整合資源、投入研發(fā),從而進一步拉近中美在文生視頻上的距離。和ChatGPT一樣,中國AI做出“類Sora”也是必然的,絕不可能錯過這一波或者徹底跟不上。
最后,能力具備。
或早或晚,中國一定會做出“類Sora”,但到底是三年后、五年后,還是十年后?我們認為,2024年應(yīng)該就會看到國產(chǎn)Sora問世。無論是Sora所用到的基礎(chǔ)模型LLM、文生圖模型DALL·E 3、大規(guī)模視頻數(shù)據(jù)集、AI算力體系、大模型開發(fā)工具棧等核心基礎(chǔ)設(shè)施,中國都已經(jīng)具備。比如原創(chuàng)的基礎(chǔ)大語言模型文心一言、訊飛星火、BAICHUAN等,以及文生圖模型文心一格、騰訊混元等,加上過去一年大模型存算傳基礎(chǔ)設(shè)施的突飛猛進,有能力和條件支持中國AI修成正果,在視頻生成賽道再現(xiàn) 類ChatGPT 式的成功。
面對Sora,中國AI努力追趕是必須的,但數(shù)一數(shù)行囊中的工具和果實,不必妄自菲薄,更不用亂了陣腳。沿著正確且清晰的道路,加速向前跑,中美AI的差距才能縮小。
變化二:國產(chǎn)大模型格局再優(yōu)化
和LLM一樣,不會出現(xiàn)Sora在全球一枝獨秀,而國內(nèi)卻無視頻生成模型可用的情況。衷心希望,我們在不久的未來,不會像LLM百模大戰(zhàn)一樣,從擔(dān)憂“中國沒有Sora”,轉(zhuǎn)而擔(dān)憂“中國要那么多Sora怎么用”。
從這個角度看,OpenAI從ChatGPT到Sora的持續(xù)輸出,會讓國內(nèi)AI大模型市場少一點虛火,多一分理性。
少一點虛火,是指底層模型的重要性,被Sora再一次“劃重點”,避免國產(chǎn)大模型低水平的重復(fù)建設(shè)。
2023年一個又一個大語言模型被訓(xùn)練出來,推向市場,其中原創(chuàng)性的基礎(chǔ)模型占比最小,更多是行業(yè)大模型,以及很多私有化部署的大模型,在數(shù)據(jù)規(guī)模、參數(shù)規(guī)模上無法與基座模型相提并論,生成效果也會差很多。這種低水平的重復(fù)建設(shè),也會造成AI算力、投資的浪費。
而Sora在視頻領(lǐng)域的驚艷表現(xiàn),再次證明了暴力美學(xué)的有效性,將曾經(jīng)大火的AI視頻創(chuàng)業(yè)公司的模型直接碾壓。正如OpenAI CEO奧特曼在YC W24 啟動會上的演講中所說:最正確的做法是設(shè)想一個“上帝般的”模型正在運作,然后基于這種設(shè)想來構(gòu)建最好的產(chǎn)品。
對中國AI來說,將為數(shù)不多具有底層原創(chuàng)能力的基座模型,如文心、星火等,作為大模型基礎(chǔ)設(shè)施與支柱,支持初創(chuàng)企業(yè)和千行百業(yè)做好精調(diào)、優(yōu)化,避免“重復(fù)造輪子”,是非常重要的。
多一分理性,是在被Sora驚艷的同時,也要想到應(yīng)用和商業(yè)化的漸進性,以更合理的方案來進行國產(chǎn)類Sora的開發(fā)。
類ChatGPT的大語言模型在狂奔一年之后,在與各個行業(yè)結(jié)合的過程中,已經(jīng)暴露出實際應(yīng)用場景局限、商業(yè)價值雖有但不多、大模型投入產(chǎn)出比較低的挑戰(zhàn)。如何用好大模型,已經(jīng)成為中國AI的關(guān)鍵考驗。
相比“人人皆可上手”的大語言模型,視頻生成模型的應(yīng)用門檻更高,受眾群體更小,目前OpenAI僅開放給創(chuàng)作者使用,而非像ChatGPT那樣開放給大眾。不難看到,視頻生成模型從研發(fā)到落地,整個過程會更加緩慢,應(yīng)用潛力與商業(yè)出口還有待探索。
這一方面留給中國AI產(chǎn)學(xué)各界了較長的追趕窗口期,同時,由于Sora能夠激活多大的商業(yè)價值尚不明確,除了字節(jié)跳動、流媒體平臺等要全力投入,其他科技企業(yè)和初創(chuàng)公司都要考慮到商業(yè)化的問題,為創(chuàng)作、商用場景打磨好工具,做好視頻生成模型的提示詞工程,以便非專業(yè)背景的廣大行業(yè)用戶們上手使用。
大模型的價值需要商業(yè)化來證明,Sora也不例外。視頻生成模型走向行業(yè)的長跑,才剛剛開始。在更廣袤的產(chǎn)業(yè)空間里,如何讓類Sora產(chǎn)品帶來真實價值,這個答案OpenAI沒有給,美國AI不會給,只能由中國AI自己來書寫,而這也是國內(nèi)更勝一籌的地方。
變化三:長期動能的查漏補缺
不必焦慮Sora,并不意味著中國AI就能躺平“坐看云卷云舒”了。必須承認,國產(chǎn)大模型還有很多瓶頸尚待解決。
Sora模擬物理世界的通用能力,不僅可以用于影視制作等內(nèi)容創(chuàng)意行業(yè),還可以為游戲、自動駕駛、工業(yè)數(shù)字孿生、電商、文旅等各行各業(yè),提供一個構(gòu)建敘事融合世界的技術(shù)支柱。
那么問題來了,國產(chǎn)Sora一定會出現(xiàn),但我們做好各行業(yè)規(guī)模應(yīng)用Sora的準備了嗎?恐怕今天的答案還是,沒有。
前面提到,Sora的“暴力美學(xué)”再次證明了Scale的價值。而要達到涌現(xiàn)效果,基座模型仍然高度依賴于大量高質(zhì)量數(shù)據(jù)集,超大規(guī)模算力,大量工程化調(diào)優(yōu)人才,以及由此帶來的巨大開發(fā)及運行成本。
即使背靠微軟云的OpenAI,也沒有面向公眾開放使用Sora,也沒有向開發(fā)者開放API接入,就連正式開放使用的時間表都欠奉。國產(chǎn)AI本就存在的專項算力緊缺問題,在Sora問世之后變得更加緊迫。
同時不難預(yù)料,為了進一步阻截中國AI的發(fā)展,圍繞AI算力的新一輪限制一定會來。完善和發(fā)展AI基礎(chǔ)設(shè)施,構(gòu)建自主可控的產(chǎn)業(yè)鏈,讓大語言模型、視頻生成模型等新AI技術(shù)都不缺席中國式現(xiàn)代化的進程,讓算力成為中國數(shù)字經(jīng)濟長期發(fā)展的動能,中國計算行業(yè)依舊重任在肩。
此外,在中美AI差距中,數(shù)據(jù)的規(guī)模與質(zhì)量成為越不過的門檻。2023年5月英國《經(jīng)濟學(xué)人》提出,中國在建立基礎(chǔ)模型方面比美國落后兩到三年,造成這一差距的首要原因就是數(shù)據(jù),AI模型在訓(xùn)練時難以充分利用互聯(lián)網(wǎng)內(nèi)容。
針對這一現(xiàn)狀,2023年12月15日,國家數(shù)據(jù)局同中央網(wǎng)信辦、科技部、工業(yè)和信息化部等17個部門聯(lián)合印發(fā)《“數(shù)據(jù)要素×”三年行動計劃(2024—2026年)》,目標是到2026年底,數(shù)據(jù)要素應(yīng)用場景廣度和深度大幅擴展。2024年,我們一定會見證該行動的推進與落地,見證數(shù)據(jù)要素成為國產(chǎn)AI的養(yǎng)料。
由此可見,中國AI的查漏補缺,不是一朝一夕的事,也不是某一家AI企業(yè)、某一個模型廠商的事,面對已經(jīng)在行動的中國產(chǎn)業(yè)各界,何妨多一些耐心。
智者不惑,仁者不憂,勇者不懼。正視Sora給中國AI帶來的變化與挑戰(zhàn),不為一時的缺席而焦慮,是相信我們有能力登場,也終將登場。
-
AI
+關(guān)注
關(guān)注
87文章
30239瀏覽量
268473 -
OpenAI
+關(guān)注
關(guān)注
9文章
1045瀏覽量
6411 -
大模型
+關(guān)注
關(guān)注
2文章
2339瀏覽量
2499 -
Sora
+關(guān)注
關(guān)注
0文章
76瀏覽量
190
發(fā)布評論請先 登錄
相關(guān)推薦
評論