作者:小巖
編輯:白云朵朵
正所謂一波未平,一波又起。
OpenAI的宮斗大戲在歷經幾次反轉后終于落下帷幕。就在看客們認為OpenAI終于要偃旗息鼓,回歸平靜時,新的一場風波迫不及待的開始了。
根據路透社曝光,就在SamAltman被解雇之前,幾位研究人員曾給董事會寄出一封警告信。這封警告信的內容,很可能是引起整個事件的真正導火索。警告信中表示,內部名為Q*(發音為的QStar)的下一代AI模型,發展的過于強大過于先進,到底有多強大和先進呢?大概是到了可以威脅人類的地步。
而Q*的主導人,正是OpenAI的首席科學家Ilya Sutskeve,也是其宮斗大戲中,始終處于風口浪尖上的人物。
大家很自然的就把這一切與OpenAI前幾天的“兵變”串聯在了一起,不禁發現,這是一場分外精彩的大戲。
新模型Q*,究竟是什么?
截至目前,OpenAI官方還沒有關于Q*的詳細信息,我們先嘗試根據網上的信息,拼湊了解一下,究竟什么是Q*。
Q*,也叫QStar。需要說明的是,雖然在深度學習的領域,區塊之間通過乘積來求解,但在Q*這里并非如此,它只是代表“star”。
在AI領域,與Q相關的,本質上都是Q學習(QLearning)。Q學習這一基本概念最早誕生于1989年。2013年,DeepMind曾經通過改進Q學習的方式,推出過一個叫做深度Q學習的算法。深度Q學習最鮮明的特點就是使用經歷回放,即從過去多個結果中進行采樣,再使用Q學習,進而達到提高模型的穩定性的作用,降低模型因為某一次結果導致訓練方向過于發散的風險。
一直以來,Q學習的研究都沒有太突出的成果,所以這個概念相對小眾。但Q學習起到了一個極其重要的作用——開發出了DQN。DQN是指深度Q網絡,誕生于深度Q學習。DQN的思路和Q學習是一模一樣的,但是在求得Q學習中最大獎勵值的過程,是用神經網絡來實現的。這一下子就顯得與眾不同了。
以上我們所解釋的是“Q”代表的含義,那其中的“*”又意味著什么呢?
由于OpenAI沒有官方解釋,大家只能對此進行推測。但很多業內專業人士認為,“*”代表的是A*算法。所謂A*算法的運行原理,是先通過啟發式算法(也就是估值),估算一個大概的值,當然這個值很有可能極其偏離正解。估算完成后就會開始循環遍歷,如果怎么都沒辦法求解那就重新估值,直到開始出現解。如此反復,最終得出最佳解。這種算法耗時較長,只能在實驗室環境進行操作。
通過以上的說明,想必大家對“Q”和“*”都有了初步的了解。根據AI圈的共識,OpenAI的Q*最有可能的樣子,就是利用Q學習快速找到接近最優解的估值,再利用A*算法在小范圍內求解,從而省去大量沒有意義的計算過程,以此達到快速求得最佳解的效果。
出其不意的Q*,是否會過于強大,威脅人類?
對于出其不意的Q*,大家關注的點基本一致:它的研發進行到哪一步了?是否會威脅到人類?
之所以有這樣的擔憂,是因為大家把Q*的推出與SamAltman此前在APEC峰會上的發言聯系在了一起。彼時,Altman表示,“OpenAI歷史上已經有過4次,最近1次就是在過去幾周,當我們推開無知之幕并抵達探索發現的前沿時,我就在房間里,這是職業生涯中的最高榮譽”。很多人認為,“最近的一次”,指的就是Q*。
而Ilya Sutskeve,也曾在幾周前的一次采訪中表示,“不談太多細節,只想說數據限制是可以被克服,進步仍可以繼續”。
通過以上的信息,有人分析Q*目前至少具備兩個核心特性。一是突破了人類數據的限制,可以自己生產海量數據;二是擁有了自主學習和自我改進的能力。特別是第2點,被認為很有可能對人類造成威脅。
但對此,一些業內專業人士給予了不同的意見。Meta首席人工智能科學家楊立坤(Yann LeCun)就認為,Q*是OpenAI的一次規劃性嘗試,并不意味著它已經取得了某些突破。諸如FAIR,DeepMind,OpenAI一類的頂級實驗室其實早早就對此有了研究。這不是什么新鮮的新聞,這看上去更像是在炒冷飯。
由此我們不難發現,相較于Q*目前取得的進展,此次事件所帶給OpenAI的輿情影響力,似乎更大。
“人工智能是否會對人類構成生存風險”——這個問題始終值得警惕。
對于炒作和八卦,我們大可以一笑置之,但嚴峻的現實不容忽慮:不定期出現的炒作會讓大家降低對AI的警惕心理,會分散人們對AI可能造成的,AI已經造成的問題的注意力。
AI是否會對人類構成生存風險,這將是一把始終懸在人類頭頂的達摩克利斯之劍。不僅OpenAI這一類的專業公司需要警惕“人工智能暴動”,全人類都應該對此保持清醒。譬如OpenAI 的董事會設計了“內部終止開關和治理機制”,以防止推出有害技術。再比如歐盟即將敲定全面的《人工智能法案》。目前立法者之間最大的爭論之一是,是否要賦予科技公司更多的權力,讓它們自行監管尖端的人工智能模型。
一旦我們允許AI系統設定自己的目標,并開始以某種方式與真實的物理或數字世界對接,很可能會出現安全問題。炒作永遠都不會缺席,商業性質的公司永遠會將“優先考慮自身利益”作為首要目標。在這種情況下,我們更需要擁有透過現象看本質的能力,了解AI,重視AI,警惕AI。
審核編輯 黃宇
-
AI
+關注
關注
87文章
30162瀏覽量
268427 -
OpenAI
+關注
關注
9文章
1044瀏覽量
6408
發布評論請先 登錄
相關推薦
評論