世事浮云,白云蒼狗,轉(zhuǎn)眼間關(guān)于人工智能的研究已歷經(jīng)兩個(gè)世紀(jì)。
在研究者和踐行者的不懈努力之下,如今人工智能應(yīng)用已遍地可見,無論是繁華都市還是偏遠(yuǎn)小鎮(zhèn),街頭巷尾偶遇可稱為人工智能的應(yīng)用并不算稀奇。
然而,人們并不滿足于碎片式的點(diǎn)狀應(yīng)用,更想要早日實(shí)現(xiàn)先驅(qū)們最初設(shè)定的宏愿——通用人工智能。但攀上這座高峰還遙遙無期。
要如何攀上通用人工智能的頂峰,專家們指出了不算很多的道路,但每條道路目前來說都不好走。
比如,最為人們青睞且最有前途的,當(dāng)屬深度學(xué)習(xí)這條“康莊大道”無疑。許多人以為,深度學(xué)習(xí)能夠解決一切問題,放之所有領(lǐng)域皆為準(zhǔn),但事實(shí)證明,深度神經(jīng)網(wǎng)絡(luò)的確能夠被訓(xùn)練下圍棋,也能流水線上做釘鉚,但同一個(gè)網(wǎng)絡(luò)不能同時(shí)做這兩件事,時(shí)至今日,尚沒有一個(gè)用深度學(xué)習(xí)實(shí)現(xiàn)通用人工智能的完整路線圖。不僅如此,深度學(xué)習(xí)與生俱來的弱點(diǎn)也日益暴露出來,如不可解釋性、大量依賴數(shù)據(jù)、成本高昂等,所以,這條路能否通向通用人工智能要被打上一個(gè)大大的問號。
又有人提出,可以整合各種專用“模塊”于一個(gè)“構(gòu)架”之中,讓它們分工協(xié)作,這樣就能拼成一個(gè)通用系統(tǒng)。但這個(gè)思路理論上可行,但實(shí)施起來卻難如登天,比如算法或設(shè)計(jì)本身的功能可能就是復(fù)雜且矛盾的,要協(xié)調(diào)好不計(jì)其數(shù)的“模塊”,就是一個(gè)浩繁的工程。
除此之外,還有人試圖通過構(gòu)造更像人腦的模型,來模仿人類各認(rèn)知功能的統(tǒng)一再現(xiàn),這就是所謂的“全腦模擬”。
“全腦模擬”的概念基于一個(gè)原理,即生命的主題是大腦,于是,20 世紀(jì)初,谷歌的科學(xué)家們提出一個(gè)大膽的想法——將人腦原封不動地移植到以神經(jīng)網(wǎng)絡(luò)為架構(gòu)的 AI 上,這樣人腦就可以永生,人也就能永生。然而,這個(gè)想法雖然讓人興奮,但實(shí)行起來難度更大,因?yàn)槿说拇竽X共有約860 億個(gè)神經(jīng)細(xì)胞,如果用神經(jīng)回路來模擬大腦,即使用當(dāng)代速度最快內(nèi)存最大的超級計(jì)算機(jī),也只能模擬大腦的百分之一。這讓大腦移植似乎變得不可能。
但是,這阻擋不了科學(xué)家的研究熱情。2018 年,日本理化學(xué)研究所和德國的 Jurich 研究所聯(lián)手,通過對網(wǎng)絡(luò)算法進(jìn)行改善,使得神經(jīng)網(wǎng)絡(luò)的性能提高到了原來的將近 100 倍,新的算法通過概率預(yù)測,刪除了很多不必要的信號通信。改善后的算法在性能上完全有可能對全腦進(jìn)行模擬。
全球還有無數(shù)人在進(jìn)行著類似的研究,美國的腦計(jì)劃、歐洲的腦計(jì)劃和中國的腦計(jì)劃就是這一理論的積極倡導(dǎo)者,為項(xiàng)目投資也逐年提高。2018年,美國對腦計(jì)劃的支持總額超過 4 億美元,同比增長 50%;經(jīng)過近 3 年的醞釀,中國的腦計(jì)劃也于 2018 年正式掛牌,作為重大科技項(xiàng)目被列入國家“十三五”規(guī)劃,僅招聘頂級專家就投入 1.8 億元人民幣真金白銀。
然而,這些本來被視為“人類之光”的計(jì)劃似乎并沒有預(yù)期進(jìn)行得那么順利。2013 年,歐盟大手一揮撥了 13 億歐元(目前匯率約合 99 億元人民幣)成立了歐盟“人類腦計(jì)劃”,但如今實(shí)施周期已過半,距離模擬出人腦卻還很遙遠(yuǎn),至今沒能拿出像樣的成果出來。于是這一計(jì)劃開始遭到科學(xué)界的質(zhì)疑,歐盟也已經(jīng)決定不再“將所有的雞蛋放在一個(gè)籃子里”,減小對歐盟“人類腦計(jì)劃”的投資,這讓后者的前途未卜。
既然此路難走,那就再想其他辦法。
科大訊飛在人工智能領(lǐng)域可算得上是先行者之一,因?yàn)樵缒觐A(yù)判語音技術(shù)將成為人工智能技術(shù)應(yīng)用突破口的獨(dú)到眼光,開辟出一條語音之路,如今已躋身這一領(lǐng)域的第一方陣。
這家科技公司對于通用人工智能的實(shí)現(xiàn)途徑也有自己的看法,并提出了一個(gè)概念——智能動力學(xué),并將之視為實(shí)現(xiàn)通用人工智能的三條途徑之一。
機(jī)緣巧合,筆者有幸采訪到科大訊飛聯(lián)合創(chuàng)始人、輪值總裁胡郁,探討了“智能動力學(xué)”究竟是何解。
智能動力學(xué):實(shí)現(xiàn)AI的第三條途徑
在胡郁的解釋下,筆者大致明白了“智能動力學(xué)”其實(shí)是一個(gè)相對“空氣動力學(xué)”而來的概念,通俗來講,就是像人類研究鳥類飛行一樣,最后研究出“空氣動力學(xué)”,造出了比鳥更好的飛機(jī),它不用像鳥一樣吃喝拉撒,但比鳥還快,因?yàn)轱w機(jī)遵循鳥類羽毛空氣動力學(xué)的基礎(chǔ)理論。相應(yīng)地,隨著我們對人類大腦理解越來越深入,對人類大腦拓?fù)浣Y(jié)構(gòu)和學(xué)習(xí)機(jī)制理解更深,我們完全有可能發(fā)明一種“智能動力學(xué)”的東西,它可以在學(xué)習(xí)人腦的學(xué)習(xí)機(jī)理、人腦結(jié)構(gòu)后,與計(jì)算機(jī)的速度快、存得多的特點(diǎn)完美結(jié)合在一起,產(chǎn)生強(qiáng)人工智能甚至超人工智能。
這是胡郁認(rèn)為的實(shí)現(xiàn)人工智能的三條途徑之一,而其他兩條是英雄所見略同,就是上文提到的深度神經(jīng)網(wǎng)絡(luò)和全腦模擬。
關(guān)于人工智能的實(shí)現(xiàn)路徑,相信很多人和筆者一樣,了解更多的是深度神經(jīng)網(wǎng)絡(luò)。為什么全腦模擬和智能動力學(xué)少被提及呢?后兩者和深度神經(jīng)網(wǎng)絡(luò)相比有何異同點(diǎn)?為什么深度神經(jīng)網(wǎng)絡(luò)比后兩者的概念更火?
胡郁回答了筆者這個(gè)疑問。他說道,“現(xiàn)在利用大數(shù)據(jù)加上深度學(xué)習(xí)的方式是主流的方法。但是從研究的角度來講,我認(rèn)為深度學(xué)習(xí)只是研究中的一種路徑而已,而從工業(yè)化的角度來說,深度學(xué)習(xí)的可操作性、穩(wěn)定性和目前跨過實(shí)用門檻的能力目前還是最強(qiáng)的。但是它也有一些問題,比如需要的數(shù)據(jù)量巨大,而且對于人類的某些智能,例如認(rèn)知智能,用現(xiàn)在深度神經(jīng)網(wǎng)絡(luò)的方法來做,就會面臨一些挑戰(zhàn),因?yàn)闆]有足夠的大數(shù)據(jù)來支撐。人類在學(xué)習(xí)過程中其實(shí)不依賴大數(shù)據(jù),而是小樣本,它依賴少量的案例或數(shù)據(jù)就能夠?qū)W習(xí),這導(dǎo)致現(xiàn)在的大數(shù)據(jù)系統(tǒng)其實(shí)有一些不足。”
所以,這也是訊飛提出“智能動力學(xué)”的一個(gè)主要原因,訊飛要學(xué)習(xí)人腦的學(xué)習(xí)機(jī)理,神經(jīng)元的連接方式和神經(jīng)元類型,希望得到更好的基于類似于人類學(xué)習(xí)方式的組合。
所以,他認(rèn)為,當(dāng)前正在使用的還是大數(shù)據(jù)、人工智能,即基于大數(shù)據(jù)的機(jī)器學(xué)習(xí)的人工智能。但是將來,訊飛想要發(fā)展智能動力學(xué),這是他們的目標(biāo)之一。
用一兩句話概括,后兩者相比于深度神經(jīng)網(wǎng)絡(luò)最大的不同點(diǎn)和優(yōu)勢在于,采用智能動力學(xué)的方法能夠更好地將人腦的思維方式和學(xué)習(xí)方法與電子計(jì)算機(jī)進(jìn)行結(jié)合,從而實(shí)現(xiàn)小樣本學(xué)習(xí)和遷移學(xué)習(xí),后兩者在這些方面會比較強(qiáng)一點(diǎn)。
既然全腦模擬和智能動力學(xué)有這么多優(yōu)點(diǎn),它們是否有望克服深度神經(jīng)網(wǎng)絡(luò)的缺點(diǎn),實(shí)現(xiàn)通用人工智能呢?
胡郁給出的答案在預(yù)料之中,但仍不免讓筆者感到一絲惋惜。
他說道:“全腦模擬是從現(xiàn)代腦科學(xué)研究的一個(gè)分支,我并不認(rèn)為腦科學(xué)就是全腦模擬,并在將來能帶來一個(gè)好的人工智能的前景,我更相信的是智能動力學(xué)可能會給我們帶來智能動力學(xué)研究腦工作的原理,并把這種原理放到人工智能系統(tǒng)中,比如與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合。所以,它的優(yōu)勢是能夠真正地探索人腦的奧秘,并在我們現(xiàn)在還不太擅長的領(lǐng)域取得突破性的進(jìn)展。特別是我在報(bào)告中(鏈接)提到的在認(rèn)知智能方面,我認(rèn)為會產(chǎn)生非常好的作用。”
現(xiàn)在,智能動力學(xué)還是一個(gè)訊飛提出的設(shè)想,想要將人工智能和腦科學(xué)研究的最新成果結(jié)合在一起,但還沒有得到應(yīng)用。
但胡郁說道,將來智能動力學(xué)的應(yīng)用方向和領(lǐng)域與人工智能、大數(shù)據(jù)一樣廣闊,并有望在認(rèn)知智能,比如更好地理解人的意圖,學(xué)習(xí)專家系統(tǒng)知識這些方面發(fā)揮更大的作用。
既然本文想要探索的那條通向通用人工智能的正確道路還沒有絕對答案,那不妨來看一看,在當(dāng)下的相關(guān)研究中有哪些最新的研究動向和趨勢吧。
知識圖譜將是大戶數(shù)據(jù)平臺的核心技術(shù)
大數(shù)據(jù)中臺的概念近來很受關(guān)注,科大訊飛也有自己的大數(shù)據(jù)平臺 Odeon。Odeon大數(shù)據(jù)平臺與訊飛的人工智能算法和應(yīng)用緊密結(jié)合在一起,通過底層硬件、大數(shù)據(jù)存儲和管理平臺和人工智能學(xué)習(xí)和運(yùn)算算法這三層,Odeon 大數(shù)據(jù)平臺將訊飛正在做的感知智能,即語音和圖像技術(shù)和認(rèn)知智能(語言理解、知識表達(dá)、邏輯推理和最終決策等)緊密地結(jié)合在一起,達(dá)到更好的處理效果。
有人認(rèn)為,因?yàn)橹R圖譜具有探索式分析的能力,將成為下一代大數(shù)據(jù)平臺的核心技術(shù)。知識圖譜真的具有如此大的潛力嗎?它的作用是否被夸了?
對此,胡郁認(rèn)為,知識圖譜是認(rèn)知智能取得突破的一個(gè)非常重要的方面,因?yàn)槿说拇竽X就是按照知識圖譜的方式來組織知識的,但是人與計(jì)算機(jī)相比的存儲能力較小,圖譜確實(shí)作為數(shù)據(jù)的中臺,是人工智能感知、認(rèn)知智能方面的一個(gè)必不可少的突破方向。它其實(shí)是將原來的知識全部結(jié)構(gòu)化,并在它們之間生成邏輯的關(guān)聯(lián)結(jié)構(gòu)。
“我認(rèn)為,知識圖譜在很多領(lǐng)域,特別是專家系統(tǒng)領(lǐng)域會有非常廣泛的應(yīng)用,比如現(xiàn)在講的專家系統(tǒng)主要用于教育、醫(yī)療、司法和智慧城市等方面。在醫(yī)療方面,訊飛做了智能助理,它能夠根據(jù)建立的病癥和表現(xiàn)之間的知識圖譜。通過知識圖譜推理預(yù)測用戶可能得病的概率,更好地幫助醫(yī)生進(jìn)行病情判斷。另外,知識圖譜在推理上具有優(yōu)勢,在邏輯推理方面非常實(shí)用,因此,知識圖譜在自然語言理解,知識表達(dá)和邏輯推理方面都將有非常重要的作用。”
機(jī)器翻譯要“達(dá)”、“雅”,需要理解和常識
下一個(gè)疑問轉(zhuǎn)移到訊飛憑之起家,同時(shí)非常擅長的機(jī)器翻譯上。
有專家認(rèn)為,近兩年來機(jī)器翻譯有了很大的進(jìn)展,但實(shí)際上都是靠大數(shù)據(jù)驅(qū)動的,大數(shù)據(jù)驅(qū)動的帶來的好處是機(jī)器翻譯性能得到飛速提升。然而問題是,因?yàn)榇髷?shù)據(jù)驅(qū)動深度學(xué)習(xí)是典型的“黑盒子”,雖然翻譯效果不錯(cuò),但其實(shí)機(jī)器對句子沒有任何理解。這樣的系統(tǒng)在處理復(fù)雜語義時(shí)非常脆弱,即使是非常簡單的日常詞匯,目前最先進(jìn)的機(jī)器翻譯系統(tǒng)也無法做到準(zhǔn)確翻譯。
面對這個(gè)略尖銳的問題,胡郁給出了自己的看法,“我認(rèn)為這應(yīng)該從兩個(gè)方面來看,我們都知道AlphaGo 戰(zhàn)勝李世石 9 段柯杰 9 段,憑的是算得快、存得多的優(yōu)勢,但這并不妨礙它打敗李世石和柯杰。所以,一方面我認(rèn)為在大部分翻譯領(lǐng)域,機(jī)器翻譯已經(jīng)做得不錯(cuò)了。現(xiàn)在,機(jī)器翻譯做得不好的地方,可能是占比非常小的俚語,機(jī)器翻譯的特點(diǎn)是沒看到過就不會翻,對于一些非常復(fù)雜的特殊情況,翻譯的效果可能會打折扣。所以,從另外一個(gè)角度來看,翻譯要求“信達(dá)雅”,人類在“達(dá)”和“雅”這兩個(gè)方面還具有一定的優(yōu)勢。我不認(rèn)為機(jī)器翻譯將來就要完全取代人類,它只是幫大家解決大部分的比較簡單的工作,而不是讓人類最后都沒飯吃。”
歸根結(jié)底,機(jī)器翻譯效果有時(shí)差強(qiáng)人意,也有一個(gè)重要的原因——機(jī)器不懂人的常識。問題存在就要想辦法解決,機(jī)器難以具備常識已經(jīng)不是個(gè)新鮮問題,從機(jī)器翻譯概念提出伊始這個(gè)問題就糾纏了研究者很久,卻至今未得到解決。打造常識知識庫是解決這個(gè)問題的基礎(chǔ)。
清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授孫茂松曾說過,打造好的知識庫,有兩個(gè)可行的辦法,一個(gè)是把現(xiàn)有世界各方面的知識庫都拿來先做整合,從中汲取養(yǎng)分。另一個(gè)辦法是從文本中挖掘知識庫,從文本中找到知識并進(jìn)行形式化。為此,清華大學(xué)正在聯(lián)合各方研究機(jī)構(gòu)打造這樣一個(gè)知識庫。
胡郁認(rèn)為,常識知識庫非常重要,但它有一個(gè)特點(diǎn)是很難通過大數(shù)據(jù)獲得,因?yàn)槿祟惖某WR不是以文字形式被記錄的。但是科大訊飛有嘗試構(gòu)建這樣的常識知識庫,但是卻沒有一個(gè)好的系統(tǒng)構(gòu)建的方法。他提到在 Winograd 的常識比賽測評中,科大訊飛獲得了第 1 名,但分?jǐn)?shù)僅有 60分,相比之下,一個(gè)人類的小孩卻可以很容易地達(dá)到 90 分,所以,胡郁并不認(rèn)為現(xiàn)在的常識技術(shù)已經(jīng)達(dá)到了應(yīng)用的門檻。
然而,他對于為機(jī)器翻譯的未來充滿希望,相信隨著數(shù)據(jù)量越來越大,機(jī)器犯錯(cuò)誤的可能性會變得越來越小。機(jī)器翻譯要想達(dá)到“信達(dá)雅”,它不僅要翻譯,還要理解句子的內(nèi)容。“現(xiàn)在機(jī)器翻譯不用理解句子的內(nèi)容,只需要考慮兩種語言之間的詞對和句對之間的關(guān)系,要做到“達(dá)”和”雅”,就必須理解句子內(nèi)容,所以就必須要做知識圖譜。所以,我認(rèn)為人和機(jī)器是各有所長的。”
AI+教育,實(shí)現(xiàn)幾千年“因材施教”的教育夢
在教育領(lǐng)域,人工智能的應(yīng)用近年來已經(jīng)很常見,做 AI+教育的企業(yè)遍地開花,但很多企業(yè)推出的產(chǎn)品都有同質(zhì)化的傾向,真正推動教育發(fā)生革命性變化的產(chǎn)品似乎很少。
胡郁并不認(rèn)同這個(gè)觀點(diǎn),他解釋道,很多產(chǎn)品其實(shí)表面上看起來差不多,但“里子”還是有差別的。比如訊飛正在做的所有教學(xué)內(nèi)容的知識圖譜,全國沒有幾家能做出來。
而對于 AI+教育的未來,胡郁認(rèn)為應(yīng)該圍繞學(xué)校、老師、家長這三點(diǎn),滿足這三類人的需求。與傳統(tǒng)教育相比,AI+教育能夠?qū)崿F(xiàn)因材施教的個(gè)性化教學(xué),實(shí)現(xiàn)教育界幾千年來的追求。
最后,總結(jié)起來,實(shí)現(xiàn)通用人工智能的道路還不甚明朗。在浩瀚宇宙中,人類不過是滄海一粟,如果把宇宙的歷史比作一條線,人類歷史充其量算得上是組成這條線的一個(gè)小點(diǎn),而人工智能技術(shù)發(fā)展史,在這小點(diǎn)上又是一個(gè)小到甚至肉眼都看不到的存在。但和世間萬物一樣,人工智能每時(shí)每刻都在發(fā)生著微不可查的變化,孕育著一場將要改變?nèi)祟惷\(yùn)的革命。
實(shí)現(xiàn)通用人工智能也許只是人類邁向更高文明的一道門檻,而找到通向峰頂?shù)牡缆罚€需要更多像訊飛一樣的先行者,推動 AI 技術(shù)不斷實(shí)現(xiàn)突破。
責(zé)任編輯:ct
評論
查看更多