6月18日,IBM的AI系統Project Debater首次與人類進行現場公開辯論。Project Debater能夠理解對方觀點,并有針對性地做出清晰的反駁,最終成功戰勝人類辯手。
美國時間6月18日,IBM Research推出了人工智能系統Project Debater,一個具有幽默感、小巧機智和偶爾有強有力的論點的實驗性會話AI系統。當日,Project Debater首次與人類進行現場公開辯論,此次辯論比賽在舊金山的IBM沃森西部廠區( Watson West Site)舉行。
Project Debater是IBM Research(即超級電腦沃森背后的團隊)最新研制的AI系統,也是第一個可以對復雜話題進行辯論的AI系統,旨在通過公正的辯論來拓展人們的思維。Project Debater擁有數以億計的論文、報告和新聞文章的龐大數據庫。通過消化這些數據,Project Debater可以就特定主題做出邏輯結構良好的演講,提出清晰明確的論點,并對對手觀點進行反駁。盡管在一些敘述上不是很自然,并不能完全和人類相提并論,但Project Debater的思考和答辯仍然令人印象深刻。
IBM Research首席調查員兼Project Debater的創造者Noam Slonim稱,該AI系統的訓練始于六年前,直到兩年前才有能力參與與人們的辯論。
IBM研究人員正在通過教授計算機來探索人工智能的界限,以創造引人入勝且信息更加豐富的觀點。他們的目標是建立一個智能系統,幫助人們在答案模糊時作出基于證據的決定。自2012年起,Project Debater是IBM對AI的下一個重要里程碑,是繼深藍(Deep Blue)和沃森(Watson)后的又一突破。根據IBM的計劃,Project Debater未來將能夠通過提供引人注目的、以證據為基礎的論點并限制情感、偏見或模棱兩可的影響來幫助人們做出理智的判斷。
首戰告捷,戰勝頂尖人類辯手
Project Debater和2016年的以色列國家辯論冠軍Noa Ovadia、以色列國際辯論協會主席Dan Zafrir分別進行了辯論比賽。
圖左為Noa Ovadia,圖右為Dan Zafrir
在比賽中,Project Debater參與了兩個辯論主題,即“政府是否應該資助太空探索”和“遠程醫療是否應該在醫療保健中發揮更大作用”。IBM公司希望確保人工智能系統能在不知道將研究什么的情況下進行辯論,因此Project Debater在辯論前并不知道論題。
就“政府是否應資助太空探索”的論題,Project Debater持正方,Noa Ovadia持反方。雙方隨后發布了四分鐘開幕詞、四分鐘反駁和兩分鐘論證總結。在每個部分之間,Project Debater聽取了人類對手的四分鐘開場白,解析了這些數據,并創建了一個突出顯示并試圖駁斥人類對手所提出的信息的論據。這令人難以置信,因為它不僅要理解單詞,還要理解這些單詞的背景。鸚鵡學舌般復述維基百科條目很容易做到,但獲取數據并創建一個不僅基于原始數據而且還考慮到剛才聽到的敘述的內容,卻十分困難。
Project Debater提出一個開放性觀點,即空間探索有益于人類,因為空間探索不僅有助于推動科學發現,還能激勵年輕人突破思考的壁壘。Noa Ovadia則認為諸如地球科學研究之類的項目有更值得獲得政府補貼。在聽取了Noa的論點后,Project Debater發表了反駁言論,認為太空探索帶來的潛在技術和經濟利益超過其他政府支出。
在雙方總結陳詞后,一項快速調查顯示,大多數觀眾認為Project Debater比人類的論述更能豐富他們的知識。
在這次辯論過程中,AI系統確實也出了些差錯,并做出了一些瘋狂的斷言,比如它認為太空探索“比更好的道路、更好的學校或更好的醫療保健更重要”,或者在辯論過程中隨機地說出“Scott Pelley畫外音”,這似乎是參考了哥倫比亞廣播公司(CBS)新聞和60分鐘(60 Minutes)記者的言論。
Chris Reed是論證技術中心(Center for Argument Technology)的主任,負責的是一個探索會話式人工智能的學術團隊,并沒有參與Project Debater項目。應IBM的邀請,Reed在周一的第一次演出中觀看了Project Debater的表現,并表示就像在看“如此多的難題聚集在一起”,包括堅持自己論點的能力、語法錯誤的欠缺以及在做出決定之前能夠預測和反駁其反對者的論點等問題。
“爭論和辯論,本質上是驅動科學進程的引擎,描述了大多數政治論壇發生的事情,甚至描繪了現代宗教的大多數概念。”Reed說,“論證是人類的一個決定性特征,如果我們的機器能夠傳達其中的一部分,那么我認為這意味著一件非常重要的事情正在發生改變。”從文化上來看,辯論的起源不在于沖突和競爭,而在于民主和討論。辯論豐富了決策制定過程,幫助人們權衡新思想和新理念的利弊。它處于文明社會的核心。我們辯論的不僅是為了讓別人相信我們自己的觀點,而且也是為了理解和學習彼此的觀點。
試想一下,一個與專業人類辯論家交流的AI系統聽取了他的觀點,并以令人信服的方式提出了自己的無腳本推論,說服聽眾思考其在有爭議的話題上的立場,這說明AI系統可以像人類一樣去理解意見并有針對性地給予自己的觀點。未來,相信機器能夠通過幫助人類做出許多重要決定。
之后,Project Debater與另一名以色列辯論專家Dan Zafrir之間進行了第二次辯論,對“應該增加對遠程醫療的使用”的論題持反對意見。
此次辯論有四十名成員參與投票,Project Debater比Dan Zafrir多得9票,成功贏得比賽。
在辯論中,Project Debater能夠引用阿拉伯聯合酋長國的一系列資料以及德國經濟事務部長的報告,獲得太空探索所能提供的就業數量等有效數據。但是,為了避免犯引用和語言邏輯方面的錯誤,Project Debater沒有直接引用其對手的論述。
“無偏見”的辯論機器
根據IBM研究人員Noam Slonim和Ranit Aharonov的說法,盡管人類辯論機器是對該技術的有趣展示,但Project Debater的真正力量將是其展現無偏見論述的能力。
圖左為Ranit Aharonov,圖右為Noam Slonim
我們生活在一個被情緒和偏見染上色彩的世界中,難免看問題的角度不夠真實與客觀。IBM表示,世界充滿了錯誤的信息和膚淺的想法,片面的、被篡改的敘事的興起正在挑戰社會和互聯網平臺。AI在語言和推理的新發展可以幫助提供多樣的、消息靈通的觀點,而Project Debater推動AI的前沿發展,促進智慧辯論,幫助人們建立充分知情的論點并做出更好的決策。
Project Debater可以幫助公司和政府透過我們生活經歷中的喧囂提取出一些本質的東西,并產生大多數公正的結論。當然,它所提供的數據集是基于人類的寫作作品,而這些數據仍然會存在作者的情感與偏見。
雖然Project Debater的目標是一個沒有偏見的機器,但在辯論期間,它還是出現疑似帶有偏見的表現。在反駁人類辯手Dan Zafrir關于遠程醫療擴張的論題時,該系統聲稱,Zafrir在開幕聲明中并沒有說出有關遠程醫療使用增加的事實。換句話說,它認為Zafrir是個騙子。
當被問及Project Debater這一表現時,IBM研究人員Noam Slonim表示,在反駁期間,該系統有一個置信度閾值。如果感覺非常自信,它會創建一個更復雜的陳述;如果感覺不那么自信,那么陳述就不那么令人印象深刻。因此,Project Debater對反駁意見不是很有信心,所以它基本上把Zafrir當成一個騙子。有趣的是,這大概是這個系統整個晚上做的最人性化的事情。
構建新AI系統困難重重
在此之前,人工智能可以對關鍵詞搜索回復簡單的問題或要求,比如“一升多少盎司?”或者“致電媽媽”,這為人們日常生活提供極大便利。Project Debater則開始探索新的領域:吸收了大量不同的信息和觀點,幫助人們建立有說服力的論點并做出明智的決定。
構建系統是一項非常困難和復雜的挑戰。Slonim說,為了使Project Debater成為可能,研究人員開發了數十篇研究論文中記載的許多創新技術。雖然準備辯論和反駁或理解對手的論點可能需要大量的技術,但辯論者的大部分對話仍然可以直接從文章中提取出來。
圖為研究人員Noam Slonim和Project Debater機器的合影
過去六年來,IBM以色列海法實驗室領導的全球IBM研究團隊賦予了Project Debater三種功能,每種功能都在AI方面開辟了新的天地:首先是數據驅動的語音編寫和交付功能;其次,聽力理解能夠識別隱藏在人類連續冗長的自然語音中的關鍵主張,并構建有意義的反駁;第三,系統的模擬人類困境,基于一個獨特的知識圖譜,提煉出原則性的論點。
辯論的形式為這些核心能力提供了理想的測試基礎。辯論規則源于人類的討論文化,論證的內核往往是內在的主觀的。Project Debater必須適應人的理性和思考邏輯,并提出人們可以理解和接受的論點。在辯論中,人工智能必須學會在凌亂的非結構化人類世界中進行導航和檢索,而不是像在棋盤游戲中那樣使用預先定義的規則。
與Big Blue在國際象棋中打敗國際象棋大師Gary Kasparov、DeepMind的AlphaGo擊敗世界頂級圍棋選手不同,辯論比其他比賽更加細致,與會者通過投票來決定本場比賽的最佳辯手,而人工智能通常擁有勝過人類豐富觀眾知識的能力,Ranit Aharanov如是說。
結語:Project Debater有助于人類做出明智的決定
Project Debater讓我們更接近人工智能的一個巨大界限:掌握語言。它是IBM一系列主要AI創新產品中的最新產品,其它產品還包括1997年獲得國際象棋世界冠軍Garry Kasparov的IBM深海“Deep Blue”,以及2011年在Jeopardy上擊敗人類冠軍的超級智能系統沃森(Watson)。
盡管Project Debater的工作還遠遠沒有完成,它有時會像人一樣犯錯。但在不遠的將來,它很有可能幫助解決數千個復雜的人類決策。例如,幫助收集和整理某個金融事實的相關材料,或提出與公共政策有關的贊成和反對的論點。由于不經常受到人類主觀意識和偏見的影響,Project Debater提出的觀點可能會貼近事實。
Project Debater將擴展沃森的功能,目前數十家公司正在使用沃森的功能挖掘大量內部數據集以獲得新的業務洞察力。該系統已經使用了Watson Speech to Text API,并將有助于增強沃森的高級語言和對話功能。未來,它的基礎技術也將在IBM云平臺和IBM沃森中商業化。
這對AI來說是一個非常積極的發展。我們可以使這種變革性技術更加透明和可解釋,這樣我們就越能信任它;而我們越能信任它,它就越能幫助我們在日益復雜的世界中做出最好、最明智的決定。
Slonim在接受采訪時告訴VentureBeat,在此次辯論賽之后,Project Debrater將在今年晚些時候參加一場曠日持久的辯論,隨后可能會舉行一次研討會,學者可以提出他們對Project Debater的意見和評論。
-
IBM
+關注
關注
3文章
1749瀏覽量
74626 -
AI
+關注
關注
87文章
30146瀏覽量
268414
原文標題:辯論屆人機大戰:IBM新AI完勝人類冠軍!
文章出處:【微信號:drc_iite,微信公眾號:全球技術地圖】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論