新舊之交,一個萬能程序的幽靈在全球游蕩,這個幽靈便是OpenAI公司研發的ChatGPT。它橫空出世的時間如此之迅速,以至于尚未起好中文名字就已經擁有了過億用戶。人工智能對話聊天機器人ChatGPT,英文縮寫Chat Generative Pre-Trained Transformer,學名聊天生成性預訓練轉換模型,在互聯網世界中火爆出圈、迅速走紅,短短2個月時間,就完成了全球用戶數突破1個億的小目標,為了達到這個目標,電話用了75年,手機用了16年,網站用了7年,蘋果公司的應用軟件iTunes和AppStore分別用了6.5年和2年,社交軟件Twitter、WhatsApp、Instagram、抖音分別用了5年、3.5年、2.5年和9個月。
ChatGPT之所以能在很短時間內與1億用戶確認過眼神,主要是源于其強大的交互能力。它既能創作詩詞歌賦,又能修改程序代碼,既可以求解某些數學問題,也可以撰寫專業學術論文。尤其是針對論文撰寫,引發了很多爭議,據某些消息報道,美國89%的學生在使用ChatGPT撰寫論文、完成作業,這也促使當前全球很多高校禁止學生使用ChatGPT。
由此可見,相較于其他一些聊天機器人應用,ChatGPT確實在交流精準程度、知識涉獵廣度、上下語境理解、多輪對話交互、用戶意圖揣摩、主動承認錯誤、質疑用戶問題等方面確實展現出了非同一般的功能升級與性能提升。有些場景下,與ChatGPT交互很像是人與人之間的真實互動,相互學習分享,表達觀點。
從理論研究、技術創新的角度分析,可以確定,ChatGPT所應用的技術是當前生成式人工智能技術(AIGC,AI Generated Content)浪潮中最明亮的星。生成式人工智能技術拓展決斷式人工智能應用邊界,利用人工智能技術來生成內容,突破了專業生成內容(PGC)、用戶生成內容(UGC)在寫作、繪畫、音樂、教育等領域進行創造性工作的“壟斷”,就像運用ChatGPT創作詩詞,撰寫文稿。
作為生成式人工智能技術領域的新貴,ChatGPT的核心是GPT模型(生成性預訓練轉換模型),這是一種自然語言處理的模型,其設計思路簡單來講,是通過特定算法預測下一個單詞的概率分布,通過在大型文本語料庫中訓練模型學習語言模式,并基于此來生成自然語言文本。從2018年GPT-1模型問世,到如今GPT-3模型的大熱,GPT模型的智能化程度持續提升,更大的語料庫和參數規模、更高的準確性和適應性、更強的計算能力與自我學習能力,以及更加通用的預訓練鑄就了ChatGPT的功能升級與性能提升。
GPT-4模型預計將在2023年初發布,相較于GPT-3和3.5,GPT-4的性能將會跳躍式提升。當然,ChatGPT最樸素的技術原理來源于概率統計。簡單優雅、深刻雋永的貝葉斯定理是其發展的基礎,通過貝葉斯定理, ChatGPT 可以計算出在已知語言模式中生成某個句子的概率,以及面對已知信息和問題做出相應特定回答的概率,從而選擇最優回復,實現交互,這再次說明了是數學在引領著人類世界前行,數字經濟也是數學經濟。
數字化時代,任何一個應用的規模化普及,都需要技術與市場的雙輪驅動。ChatGPT也不例外,這就不得不提ChatGPT的研發團隊OpenAI。2015年,OpenAI由大名鼎鼎的企業家埃隆·馬斯克、阿爾特曼、彼得·蒂爾等人創立,是一家人工智能研究公司,擁有硅谷眾多重量級企業的資金支持。
近期微軟官方證實,會繼續向OpenAI追加數十億美元投資,后續預計達100億美元,這必將成為人工智能領域的一段佳話。OpenAI建立初期是非盈利性的研究機構,但是現在最新版本ChatGPT也不再開源,正式啟動了商業化運作。由此不難看出,ChatGPT的背后依然隱藏著資本市場的激烈博弈。
微軟公司宣布將ChatGPT應用于自己的搜索引擎Bing,谷歌公司在自然語言處理領域也進行大量投入,研發BERT模型(雙向Transformer編碼器表達,Bidirectional Encoder Representation from Transformers),并計劃推出聊天機器人“巴德”抗衡ChatGPT,這些事實也進一步印證了互聯網大鱷運用資本市場加速圈定技術創新高地的明爭暗斗。
△圖源“北京日報”微信公眾號
ChatGPT在用戶體驗層面展現出強大性能,也有一部分聲音又開始擔心個人或者行業被人工智能取代,包括OpenAI的幾位創始人也就相關的問題進行過討論,其中阿爾特曼表達過:研發生成式人工智能技術的目的是為人類創造者提供工具、拓展能力,旨在增強、而非取代,而且所有深層生物學的東西無法被取代,包括與他人互動、享受樂趣、創造新事物的動力。
也有人通過實驗向ChatGPT詢問它會取代哪些職業,得到的回答是包括四個方面:數據輸入和處理、服務和幫助客戶處理常見問題、翻譯任務、撰寫報告和生成內容。但是ChatGPT同時也展現出滿滿的“求生欲”補充道:“重要的是,請注意,雖然有些任務可能會實現自動化,但像我這樣的技術也可以幫助和提升人類工作者,使他們在工作中更加多產、高效。”
從另一個層面分析,ChatGPT在技術與成本等方面存在的問題和弊端,也表明當前其無法真正取代行業或者個人。ChatGPT在其未經大量語料訓練的領域缺乏“人類常識”和引申能力,導致會一本正經地“胡說八道”;無法處理復雜冗長或者特別專業的語言結構,醫學、自然科學等等;處理接受在線新知識的能力不足。
同時,它依然是黑盒模型,無法確保不產生攻擊性表達,為了讓ChatGPT生成的內容更符合人類習慣,OpenAI曾雇傭40多個人給生成的內容打分,這40位老師只為有幫助的、真實的、無害的文本打高分,包含不良內容的打低分,這也讓ChatGPT這位學生更溫和、更加充滿正能量。
ChatGPT同樣需要非常強大的算力成本支撐,從GPT-1到GPT-3,模型訓練參數的數量從1.17億增長到了1750億,GPT-3訓練一次的費用是460萬美元,總訓練成本高達1200萬美元,這個數字已經極為驚人,但是據某公司測算,該企業使用ChatGPT的成本每年約為1000億元,不禁讓人驚掉下巴。
基于以上分析,不難發現ChatGPT等聊天機器人并不真正具備分析、理解、判斷能力,它所能做的更像是人云亦云,或者加權后更加貼近真實場景的人云亦云,是更靠近上層應用的AIGC框架,本質上仍需要底層計算能力的支撐,是算智能最新的人工弱智能,未來還有許多值得期待的演進,比如,進一步改進算法使之與數據、算力更加匹配,在文本和圖像互相轉換基礎上進一步加強模態的轉化,以及在使用過程中不斷自我優化升級能力的提升。突破這些問題將推進科技革新向更為廣闊的應用場景延伸,也推動人工智能向感知智能、認知智能持續邁進,從而更好地幫助人類創造新知識,推動社會進步。
最后,無論將ChatGPT定義為生成式人工智能技術創新的里程碑,或是揭示其背后對于人工的依賴,及其引發的資本市場的無情博弈,一個不爭的事實是ChatGPT的橫空問世貌似偶然,實則必然,OpenAI創立至今,經歷了八年的磨礪,對于理想的長久堅持轉化成為了ChatGPT今日的成就,這值得我們對于中國的科技創新事業開啟更深層次的思考。
2021年中國人工智能領域的專利申請數量首次超過美國,但在原創關鍵技術、核心算法等方面依然存在很大差距,比如ChatGPT背后的算法深度殘差網絡(ResNet)是由微軟提出的,論文是發表在頂級會議“計算機視覺與模式識別”(CVPR)的最佳論文;另一個基石算法Transformer,是由谷歌提出的,利用獨特的機制,可以一次性處理所有輸入的數據。
此外,某些高校、科研院所、科技企業中,依然存在急功近利的浮躁心態,“長期主義”是最近被ChatGPT帶熱互聯網熱詞,也許有些人覺得“長期主義”只是社會和公司畫的大餅,但OpenAI和ChatGPT的出彩確實讓人看到了“長期主義”的力量,所謂循序漸進、穩中有進、日拱一卒、功不唐捐。
為此建議從需求、供給、政策環境和基礎設施方面構建更加完整的創新生態,深耕在基礎研究領域的科學家很有創造性想法,更多資金、平臺、人才和制度應涌向基礎科學,讓基礎研究工作者能夠永葆任憑風浪起,穩坐釣魚船的氣度,潛心鉆研、推陳出新,為中國科技創新自立自強創造更多“0到1”的突破。 ChatGPT只是人工智能時代的又一個開端,這個時代將會在很多基礎學科研究天才的手上帶來更多的驚喜,希望下一個天才就是你!
審核編輯 :李倩
-
人工智能
+關注
關注
1791文章
46888瀏覽量
237644 -
聊天機器人
+關注
關注
0文章
332瀏覽量
12295 -
ChatGPT
+關注
關注
29文章
1549瀏覽量
7506
原文標題:中國聯通張云勇專業解讀chatGPT ,給了我們哪些啟示?
文章出處:【微信號:txdoutiao,微信公眾號:通信首條】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論