人工智能是這個時代的箴言,技術專家、學者、記者和風險投資家都在歌頌AI。不過,就像一些從專業學術領域延伸到日常生活中的短語一樣,“人工智能”一詞的使用也引起巨大的爭議。
但這并不是通常情況中由于“大眾無法理解科學家”而造成的爭議,其實,科學家和大眾一樣感到困惑。一想到這個時代正在興起一種可與人類匹敵的數字智能,所有人都很興奮,但同時也會感到害怕,這會分散我們的注意力。
這是當今時代背景下一個特殊的故事,它涉及到人、計算機、數據和生與死的決定,并非人們對硅基智能的幻想。
14年前,筆者的親戚懷孕后在做超聲波檢查。房間里的遺傳學家指著胎兒心臟周圍的一些白點:“這些都是唐氏綜合癥的跡象,而胎兒患病的風險已達二十分之一。”接著,她說可以通過羊膜穿刺術發現胎兒是否真的有先天遺傳變異的唐氏綜合癥。但是羊膜穿刺術是有風險的,在手術中胎兒死亡率大約是1/300。
作為一名統計學家,筆者很想弄清楚這些數字的根據和來源。十年前,英國做過一項統計研究,這些代表鈣積累的白點,實際上被認定是唐氏綜合癥的預測因子。但同時我也發現,我們測試的成像系統每平方英寸像素比英國分析使用的系統多幾百個。
我告訴遺傳學家,我認為這些白點可能是假陽性——它們只是“白噪音”。她說:“這就是幾年前唐氏綜合癥的診斷激增的原因,那時新電腦剛剛到貨。”
他們最終沒有做羊膜穿刺術,幾個月后,一個健康的女孩出生了。但這件事讓我很惶恐——粗略估計,全世界有幾千人在同一天接受了這個診斷,其中許多人選擇了羊膜穿刺,許多嬰兒不必要地死去。這種情況每天都在發生,直到有一天bug被修復。
這個故事暴露的問題與我個人的醫療保健無關——這關乎一個醫療系統,通過評估不同地點和時間的變量和結果,進行統計分析,并利用其他地方和不同時間的研究結果。
這樣的問題不僅和分析數據本身有關,還和研究數據庫研究人員關注的“出處”掛鉤——一般來說,數據科學家們需要厘清數據來源于哪里、如何推導以及這些推論之于現狀的重要性的問題。雖然熟練的數據科學家們可以依次進行案例分析,但當今的挑戰是,行星規模般龐大的醫療系統并不需要大量的人類監管。
我也是一名計算機科學家,碰巧在我的學校里找不到這樣的概念來構建一個全球范圍內的推理與決策系統——將計算機科學與統計學結合起來,并考慮到人類的效用。在我看來,發展不應只局限于醫學領域,還應涉及貿易、交通、教育等領域,至少要和構建人工智能系統一樣重要。
無論是否能很快理解“智能”,我們都面臨著一個巨大的挑戰,那就是如何讓機器和人類結合起來以改善人類生活。有些人認為這項任務從屬于“人工智能”的發展,但它也可以被看作是一個新的工程分支。就像過去幾十年的土木工程和化學工程一樣,這門新學科的目標是匯集幾個關鍵概念的力量,為人們提供新的工具和技能,并做到安全可靠。
土木工程和化學工程主要著眼于物理和化學,而這一新的工程學科將建立在上個世紀的思想基礎上,諸如“知識”、“算法”、“數據”、“不確定性”、“計算”、“推理”和“優化”。此外,這門新學科的大部分重點將是來自人類和關于人類的數據,它的整體研究方向也將聚焦于此。
盡管構建小模塊已經出現了,但是指導這些模塊放在一起的原則還未發展,所以這些模塊是以特殊的方式放置在一起的。因此,就像在結構工程出現之前設計建筑和橋梁一樣,人類正在構建涉及計算機、人類和環境的社會規模、推理和決策結構。
就像早期的建筑和橋梁經常以意想不到的方式倒塌并帶來毀滅性的后果一樣,早期的許多社會推理和決策過程中也存在嚴重的概念缺陷。遺憾的是,我們并不擅長預測下一個致命錯誤的出現,我們真正失去的是工程學科及其理論和設計概念。
通常,公共話語情景下,人們常使用人工智能AI作為分析通配符,而這使得他們很難思考新興技術的本質和含義。下文中,筆者將更仔細地研究“AI的過去和近況”。
當今被稱為“人工智能”的事物,在過去幾十年一直被稱為“機器學習”。機器學習屬于算法領域,包含了來自統計學、計算機科學和許多其他學科的思想,以開發處理數據、預測和支持決策制定的算法。
機器學習對世界的影響由來已久。早在上世紀90年代初,機器學習就已經很明顯地發展成為具有巨大工業意義的產品。而在世紀之交,機器學習開始被具有前瞻性的公司所利用。
在整個公司(如亞馬遜)內部,機器學習已經被應用于解決欺詐檢測和供應鏈預測等關鍵任務的后端問題,并開發面向消費者的突破性服務,如推薦系統。在接下來的20年里,隨著數據集和計算資源的快速增長,很快機器學習將不僅控制亞馬遜,而且將幾乎控制任何決策可以與大規模信息相關聯的組織。
科學家預測,新的商業模式會持續發展。“數據科學”這一術語開始用于指代這一現象,表明機器學習算法方面的專家需要與數據庫和分布式系統專家協作,以創建可伸縮、穩定的機器學習系統,用以表示生成的系統更廣泛的社會和環境影響范圍。
回顧歷史,“人工智能”一詞在20世紀50年代末被創造出來,指的是一種在軟件和硬件上實現具有人類智能水平物體的強烈愿景。雖然已經有了相關的學術領域,如運能分析、統計、模式識別、信息論和控制理論,這些往往受到人類智能的影響,人工智能其實是一項學術事業。
這些領域的靈感來自于一種能力,例如,一只松鼠能夠感知它所生活的森林的三維結構,并能在樹枝間跳躍。“人工智能”旨在專注于——人類高級的“推理”和“思考”或“認知”能力。
然而,60年后,高層次的推理和思考仍然難以捉摸。現今在工程領域中被稱為“人工智能”的技術主要著眼于低級模式的識別和調節運動,和統計領域——在集中識別數據和趨勢后做出有根據的預測、測試假設和決定。
事實上,David Rumelhart在20世紀80年代初重新發現的流行“反向傳播”算法(現在被認為是所謂的“人工智能革命”的基石),最早出現在20世紀50-60年代的控制理論領域。它的早期用途之一是在阿波羅飛船飛向月球時改進其推力。
自20世紀60年代以來,人類科技已經取得了重大進步,但人工智能的發展并沒有達到頂峰。相反,就像阿波羅宇宙飛船一樣,這些和研究人員的獨特技術問題相關的概念一直被隱藏在幕后。
雖然沒有明確向公眾、研究展示,但系統建設在文檔檢索、文本處理、垃圾郵件檢測、推薦系統、自定義搜索、社會網絡分析、準備、診斷和A/ B測試領域取得了巨大成功。這些創新也推動了一些公司的發展,如Google、Netflix、Facebook和亞馬遜。
人們將這些統稱為AI,優化和統計研究人員一夜之間被貼上“人工智能研究人員”的標簽,令人驚訝。但除此之外更嚴重的問題在于,使用這個模棱兩可的特殊字母縮寫,會妨礙人們對其涉及的知識和商業問題更為清晰的認知。
過去二十年里,在工業和研究方面,人類對于人工智能的模仿(也被稱為“信息增強”)取得了重大進展。計算和數據在這里被用來構建提高人類智能和創造力。搜索引擎可以被視為IA(增強人類記憶力和事實意識)和自然語言翻譯(增強人類溝通能力)的示例,基于計算的聲音和圖像的生成是藝術家創造力的調色板和增強器。
盡管這些服務可能需要高級的邏輯和分析,但目前它們還沒有——它們只是執行各種類型的字符串匹配和數字操作,以確定人類可使用的模式。
希望讀者能接受最后一個縮寫詞來代替“人工智能”,設想一個“智能基礎設施”(II)學科,其中存在一個能夠使人類環境更加友好、有趣和安全計算、數據和物理實體的網絡。這類基礎設施開始出現在交通、衛生、貿易和金融等領域,對個人和社區產生深遠影響。
這些討論常被冠以“物聯網”之名,但這通常僅僅指示了互聯網上的問題,而非關乎抽象層次更高、能夠操縱數據流以發現相關環境信息和交流信息的更多問題。
在筆者看來,讀者可以想象自己生活在一個“社會規模的醫療系統”中。該系統在醫生和放置在人體內部或周圍的設備之間創建數據流和數據分析流,從而使人工智能能夠進行診斷并提供治療。
該框架將整合有關人體細胞、DNA、血液樣本、氣候,種群遺傳學和大量科學文獻的藥物和治療知識。它將不僅關注單個患者和醫生,而是關注所有人類之間的關系,就像當前的醫學研究可以在一組人類(或動物)的對照下進行測試一樣。它將像現有銀行系統應對此類財務和支付問題的方式來保留重要,出處和連續性的概念。盡管人們可能會預料到系統中會出現的一些問題,包括隱私,責任,保護問題等,但這些問題僅僅是暫時性的障礙。
現在需要解決的一個關鍵問題:研究經典的人工模擬人工智能是應對更大挑戰的最好或唯一方法嗎?實際上,最近有關機器學習的最為成功的案例都涉及到模仿人類的人工智能領域,例如計算機視覺、語音識別、游戲玩法和機器人技術。因此,也許我們只應等待某些領域的進一步發展。
本文在這里聲明兩點。首先,顯而易見,人類模仿人工智能的進步是有限的,我們離實現人類模仿人工智能的期望還差得很遠。然而現實是,在模仿人類的人工智能上取得一定進步的喜悅(和恐懼)助長了人們的過度期望和媒體報道,而這其他工程領域所沒有的。
其次,要解決重要的IA和II問題,這些領域的進展還不夠充分,也不夠必要。例如無人駕駛汽車的開發,需要解決各種可能與人類能力無關的工程問題。整體運輸結構(a型結構)可能會更像目前的空中交通管制系統,而不是目前一組松散、向前看、漫不經心的人類駕駛員。
它將比目前的空中交通管制系統更為復雜,特別是在使用大數據和自適應統計建模來為細粒度的決策提供信息方面。這些問題最為重要,而強調模仿人類的人工智能可能會分散人們的注意力。
至于必要性方面,通常認為模仿人類的AI同時包含了IA和II的愿望,因為模仿人類的人工智能系統不僅能夠解決傳統人工智能問題(例如圖靈測試),同時還是解決AI和II的最佳選擇。
但這種說法沒有歷史依據:土木工程是通過嘗試建造一個人工木匠或砌磚工而發展起來的嗎?化學工程應該設計來建造一個人工化學家嗎?更具有爭議性的是:如果我們的目標是建立化工廠,我們是否可以先培養出一個人造化學家,然后觀察他會想如何發展化工廠?
類似地,人類智能是我們所知道的唯一智能形式,第一步要努力模仿它。但事實上,人類并不擅長任何一種推理——因為人類會存在失誤、偏見和弱點。此外,從根本上說,人類還沒有進化到能夠進行現代II系統必須面對的那種大規模決策,也沒有進化到能夠應對II環境中出現的模糊性。
有人可能會認為,一個人工智能系統不僅在模仿人類智能,而且它也會“正確”,會任意放大問題。但現在是在科幻小說的世界里——雖然這樣的推測在小說的背景中令人興奮,但不應該是面對IA和II的關鍵問題時前進的關鍵策略。就它們自身而言,我們需要解決IA和II問題,而不僅僅是完全模仿人工智能的節奏。
識別不屬于II系統中人類模擬人工智能研究的核心主題的算法和技術并不難。II系統需要具備可以快速處理發展并且在全球范圍內不連貫的分布式信息源的能力。這樣的系統必須在做出及時、分布式的決策時應對云邊緣的交互作用,并且還要處理長尾現象,也就是一些人的數據負荷很大,而另外一些人的數據卻很少。它們必須要克服跨越機構和競爭邊界的數據共享問題。
最重要的事情是,II系統必須將諸如激勵和定價這樣的經濟理念納入可以將人與人以及有價值的商品聯系起來的統計和計算基礎設施的領域。這種II系統可能被視為制造市場,而不僅僅只是提供服務。音樂、文學和新聞業等產業都迫切需要這樣的市場出現,由數據分析將生產者和消費者聯系起來。所有這些都必須基于新出現的文化、倫理和法律規范的框架才能實現。
當然,經典的人類模仿人工智能問題仍然是非常有趣的。然而,現在過分強調通過數據收集來進行人工智能研究,實施“深度學習”基礎設施,以及演示模仿那些松散定義的人類技能的系統——幾乎沒有對進化的解釋概念——往往會分散人們對經典人工智能中主要開放問題的注意力。
這些問題包括將意義和推理納入處理自然語言的系統中,推斷、反映和解釋因果關系,建立計算上可追蹤的不確定性表示以及建立長期目標設定框架。這些都是人類模仿人工智能的經典目標,但它們很容易被忘卻,在最近“人工智能革命”的爭論中,這些目標還沒有得到解決。
人工智能也將持續保持其重要的地位,在可見的將來,機器在現實環境進行抽象思考的能力上仍無法與人類相媲美。為了解決我們最緊迫的問題,人機交互值得重點關注。我們希望計算機能激活人類創造力,而不是取代人類的創造力。
約翰·麥卡錫(當時擔任達特茅斯大學的教授,即將在麻省理工學院進修)發明了“人工智能”這個詞,他顯然是為了把新研究方向與諾伯特·維納(麻省理工學院的一位更老的教授)的研究方向區分開來。
維納發明了“控制論”來指代其智能系統概念——這個概念與運籌學、統計學、模式識別、知識理論和控制理論密切相關。另一方面,麥卡錫強調了控制論與理性的聯系。奇怪的是,在麥卡錫術語體系下,維納的智能體系在現代占據了主導地位。這當然只是暫時的,AI行業的變動比一般行業劇烈得多。
但我們需要進一步發展麥卡錫和維納的歷史觀點。值得注意的是,現有的公共人工智能對話僅僅關注了行業和學術界的一小部分,這可能會讓大眾忽視人工智能、IA和II的全面覆蓋所帶來的威脅和機遇。
這種關注不是為了實現科幻小說或超人類機器的幻想,更多的是為了考慮和發展科技,因為科技在人們的日常生活中變得越來越常見和有力。此外,科技的理解和塑造需要來自各行各業的各種不同聲音,而不僅僅是技術協調者之間的對話。如果只關注模仿人類的人工智能,就會一葉障目。
盡管人工智能將持續推動各方面的進步,學術界也將繼續扮演重要的角色——不僅提供最具創意技術的一些想法,而且也引入計算和統計學科的研究人員和其他學科的研究人員的成果和觀點,特別是社會科學、人文科學和認知科學。
另一方面,雖然人文和科學在歷史前進的過程中很重要,但也必須承認這是一個規模和范圍巨大的工程項目——社會尋求創造新的種類的對象。這些工件應該按照規定的方式設計。
我們不想創造一個無用的項目來提供醫療保健、交通選擇和商業機會。在這一方面,正如上文所強調的,以數據和以學習為中心的領域還沒有成為一門工程學科。盡管這些領域非常吸引人,但它們還不能被視為工程學的一個分支。
此外,值得高興的是,我們正在目睹一個新工程學科的出現。通常來說,科技一詞在學術界和學術界以外的地方是狹義的,給人冷冰冰的機器印象和人類失去權力的負面暗示。因而我們想構建一門新的工程學科,現在我們有一個絕佳機會來構想一些異于傳統的新事物——以人為中心的工程學科。
如果未來仍然持續使用AI這一縮寫,人們必須要注意到其真正局限性。
責編AJX
-
人工智能
+關注
關注
1791文章
46877瀏覽量
237614 -
機器學習
+關注
關注
66文章
8381瀏覽量
132425 -
數據分析
+關注
關注
2文章
1429瀏覽量
34020
發布評論請先 登錄
相關推薦
評論