現(xiàn)在,大小型高科技公司都在競相使這成為現(xiàn)實。你看看新聞就會聽說過這些行話:AI、機器學(xué)習、深度學(xué)習、神經(jīng)網(wǎng)絡(luò)、自然語言處理。
也許這一切都有點疑惑。因此,以下是關(guān)于這些概念的基本知識,以及它們之間是如何關(guān)聯(lián)的。
什么是人工智能(AI)?
簡單地說,AI是試圖讓計算機變得智能,甚至比人類更聰明。這是讓電腦擁有類人類的行為、思維過程和推理能力。
有兩種人工智能:
狹義的AI(弱AI)
這種AI只專注于一種狹義的任務(wù)。現(xiàn)在我們的身邊已經(jīng)處處都是弱AI了。它已經(jīng)在國際象棋,電視競賽節(jié)目《危險邊緣》,還有最近的圍棋比賽中擊敗了我們?nèi)祟悺?br /> 像Siri和Cortana這樣的數(shù)字助手可以給我們提供天氣信息以及在路上自動駕駛汽車。但是,它們有很大的局限性。自動駕駛汽車不會下國際象棋。Siri也無法讀取和刪除不重要的郵件。弱AI有一個狹隘的范圍:它不能超越最先為其設(shè)置的功能。
Cortana就是一個弱AI的例子
通用AI(強AI)
下面我們進入科幻小說的王國。薩曼莎毫無疑問被定義成一個強AI。她可以學(xué)到新的東西,并修改自己的代碼庫。她可以在國際象棋和開車上都打敗人類。
AI的分析
現(xiàn)在我們知道通用AI是我們的終極目標,那么我們怎么才能實現(xiàn)它呢?這里列出5個需要精通的領(lǐng)域:
感知:像我們?nèi)祟愐粯樱慌_電腦也需要五官來與世界進行互動。但它并不僅僅局限于這五個方面。它可以有人不具備的感覺。透視眼?聲納探測?所有的可能。
自然語言處理(NLP):超越感知世界,AI需要懂得解釋語言和寫字。他們需要解析句子和理解它們之間的細微差別、口音和含義。同一個句子根據(jù)上下文不同可以有不同的含義,所以這個任務(wù)的難度是眾所周知的。
知識表達:既然它可以感知到東西 - 物體,人,概念,詞語和數(shù)學(xué)符號 - 它需要一種方式來表示它們大腦中的世界。
推理:一旦它通過其感官收集到數(shù)據(jù)并和概念連起來,它就可以使用該數(shù)據(jù)來按照邏輯解決問題。例如,一個象棋軟件檢測到棋盤上的棋子走動,就可以計算出應(yīng)對的策略。
規(guī)劃和導(dǎo)航:要想做到真正像人類一樣,AI不僅要像人類一樣思考。還應(yīng)該在我們中間生活。因此,研究人員的一個大問題就是幫助人工智能在三維世界中移動和規(guī)劃最佳路徑。自主意識的交通工具必須做好這一點,因為一個錯誤就會出人命。
新加坡***乘坐自動駕駛汽車兜風。圖片來源:Kenji Soon, MCI 。
你可以看到這些方面是如何在一起協(xié)調(diào)工作的,諸如機器視覺,它是利用成像和圖像分析來解決問題。舉個例子,F(xiàn)acebook解析你上傳到社交網(wǎng)絡(luò)上的照片來建議你應(yīng)該標記誰,并且這已相當?shù)臏蚀_。
自動駕駛汽車也許是目前最復(fù)雜的機器視覺處理任務(wù)了。它需要認清路標,遵守車道,注意車輛、物體和人。它在能見度惡劣的天氣條件下,不管白天黑夜,是在破舊的路上還是全新的路上,都要能正常工作。
實現(xiàn)工具
這些概念并不是新的。他們早在1956年就在達特矛斯會議(Dartmouth Conferences)上被提出,這次會議是人工智能領(lǐng)域的開創(chuàng)性事件。
讓技術(shù)跟上我們的想象要花幾十年的時間,我們似乎也馬上就要最終站在AI革命的風口浪尖上,隨著更多的風險資本投資,更多的大型科技企業(yè)投入到AI的研發(fā)中來,我們在日常的生活越來越多地使用到AI。
促進AI崛起的重要因素包括摩爾定律,這讓我們可以在更小、更高效的芯片上注入更多的計算能力。計算能力到達一定程度后,AI就將會變得既實用又劃算。
谷歌在貓的識別上取得重大突破。圖片來源:zbeads
大數(shù)據(jù)是導(dǎo)致AI崛起的另一個趨勢:當谷歌在2012年為神經(jīng)網(wǎng)絡(luò)輸入了海量的數(shù)據(jù)之后,取得了突破性進展,這其中包括1000萬張YouTube的視頻劇照。
其結(jié)果是,神經(jīng)網(wǎng)絡(luò)在沒人教它的情況下學(xué)會了辨識貓,取得了75%的準確率。沒有這1000萬個視頻資料庫是不可能實現(xiàn)的。
當機器會學(xué)習
現(xiàn)在,讓我們理清幾個常常容易相互混淆的概念。機器學(xué)習是一個專注于從數(shù)據(jù)里學(xué)習insights并利用它們來預(yù)言世界的AI技術(shù)。
決策樹算法。 圖片來源:Wikipedia
機器學(xué)習已經(jīng)用算法實現(xiàn)了。一個任務(wù)是通過一系列算法來完成的。這種算法的例子包括決策樹學(xué)習和關(guān)聯(lián)規(guī)則學(xué)習。
機器學(xué)習算法使整個世界閃耀了起來,但是,它只是人工神經(jīng)網(wǎng)絡(luò),一個由我們大腦的神經(jīng)如何運作而得到啟發(fā)的技術(shù)。
它甚至進入了流行文化:在喜劇系列《硅谷》中,創(chuàng)業(yè)公司Pied Piper就是在神經(jīng)網(wǎng)絡(luò)上運行其壓縮服務(wù)。
視頻:https://youtu.be/E2YcOV5C2x4
這里有一個簡單的解釋:神經(jīng)網(wǎng)絡(luò)是由好幾層的神經(jīng)元組成的。輸入被傳遞到第一層上。單個神經(jīng)元接收輸入,給每個輸入值一個權(quán)重值,并在這個權(quán)重值的基礎(chǔ)上產(chǎn)生一個輸出。
輸出從第一層被傳遞到第二層來進行處理,以此類推。最終的輸出就這樣生成了。
然后,奇跡就發(fā)生了。運行網(wǎng)絡(luò)的人定義了“正確”的最終輸出應(yīng)該是什么。每次數(shù)據(jù)通過網(wǎng)絡(luò)傳遞,最終的結(jié)果都是與“正確”的值比較,每次它都會調(diào)整權(quán)重值直至其創(chuàng)建正確的最終輸出。這個網(wǎng)絡(luò)實際上是在進行自我訓(xùn)練。
舉個例子,這個人造大腦可以學(xué)習如何從照片中識別椅子。隨著時間的推移,它會學(xué)會什么是椅子的特性,來提高他們識別出椅子的概率。
Facebook的AI負責人Yann LeCun用類推法來解釋神經(jīng)網(wǎng)絡(luò):
模式識別系統(tǒng)就像個一端帶有攝像頭的黑盒子,在頂部有一個綠燈和一個紅燈,前面則有一大堆的旋鈕。學(xué)習算法就是試圖調(diào)整旋鈕,當在鏡頭前是一條狗時,使紅燈亮起;當鏡頭前有一輛汽車的時候,使綠燈亮起。
在你給機器展示一只狗的時候。就把紅燈亮起,不要做任何事情。如果它是暗的,就調(diào)整旋鈕使燈光變亮。如果綠色指示燈亮起,調(diào)整旋鈕,使其變暗。然后,顯示汽車的時候,調(diào)整旋鈕使紅燈變暗,綠燈變亮。
如果你展示了很多汽車和狗的案例,而你每次都是不斷一點點地調(diào)整旋鈕,最終,機器每一次都會得到正確的答案。
圖片來源:a16z
現(xiàn)在我們來談?wù)勆疃葘W(xué)習,這是一套簡單的訓(xùn)練多層人工神經(jīng)網(wǎng)絡(luò)的方法。它已被證明從數(shù)據(jù)中識別圖案是特別有效的。不論何時媒體談到神經(jīng)網(wǎng)絡(luò),很可能指的都是深度學(xué)習。
關(guān)于機器學(xué)習和深度學(xué)習的一個偉大解釋:How Does Your Phone Know This Is A Dog?
深度學(xué)習對于AI的促進作用是顯而易見的。它現(xiàn)在在軟件行業(yè)之外的許多行業(yè)都已經(jīng)使用。
Facebook M,一個人工智能驅(qū)動的虛擬助手,正在使用深度學(xué)習來幫助用戶完成各種任務(wù)-包括做研究、預(yù)訂機票以及買咖啡等。
谷歌正在使用一個名為RankBrain的深度學(xué)習系統(tǒng)來過濾搜索結(jié)果,來和更多的傳統(tǒng)搜索結(jié)果進行比較。據(jù)彭博社描述:
該系統(tǒng)每天幫谷歌處理15%的之前系統(tǒng)沒有遇到過的查詢請求。它善于處理模棱兩可的查詢請求,比如“在食物鏈頂端的消費者怎么稱呼?”
該系統(tǒng)現(xiàn)在已經(jīng)是谷歌搜索結(jié)果的第三大信號,位居反鏈接和內(nèi)容之后。
神經(jīng)網(wǎng)絡(luò)可以識別貓?這就是深度學(xué)習。
從Siri到薩曼莎
深度學(xué)習可能是建立更智能、更類人類AI的一個關(guān)鍵拼圖。
谷歌掃描貓的大腦需要1.6萬臺計算機處理器來運行。擊敗圍棋世界冠軍李世石的程序AlphaGo,運行在48個處理器上。在未來,神經(jīng)網(wǎng)絡(luò)能在廉價的移動電話上運行。
深度學(xué)習可以提高AI的各個方面,從自然語言處理到機器視覺,可以看成是一個能夠提高計算機學(xué)習能力的更好的一個大腦。
它可以提高虛擬助手例如Siri或谷歌處理不熟悉請求的能力。它可以處理視頻和生成總結(jié)內(nèi)容的短片。
或許有一天它還會贏得奧斯卡獎,誰知道呢?
評論
查看更多