對于技術(shù)領(lǐng)域中存在的AI相關(guān)技術(shù),我們應(yīng)心存感恩。人類不僅花費(fèi)了數(shù)十年的時間來研究完善數(shù)學(xué)算法,以使這些奇妙復(fù)雜的算法發(fā)揮效用,而且在這一過程中,我們還在不斷尋求突破性發(fā)展,并以此作為靈感,深入研究,從而使得下一代智能能夠得以存在于我們的星球上。大自然,及其所包含的一切,都深深地根植于AI的運(yùn)作中,并將在這里成長壯大。
David Attenborough拍攝的野生動物紀(jì)錄片令人印象深刻。他們對地球上許多生物的行為和屬性,進(jìn)行了令人難以置信的詳細(xì)解讀,這使得我們能夠了解這些生物是如何融入自然生態(tài)系統(tǒng),并通過共同努力,從而使我們居住的星球蓬勃發(fā)展,最終讓地球成為如今的模樣。雖然我不是David Attenborough,但我還是想將你們帶入到我的野生動物紀(jì)錄片中來。我們要探討的明星生物不是別的,正是那些被大自然直接啟發(fā)的人工智能算法。首先,我需要想你們介紹兩種算法概念,搜索/尋路(Search/Pathfinding)和預(yù)測建模(Predictive Modelling)。
搜索(尋路)算法
搜索算法本質(zhì)上是一種程序,旨在找到一個到達(dá)目標(biāo)的最佳/最短路徑。例如,旅行推銷員(travelling salesman)問題就是一個典型的搜索優(yōu)化問題,在這一問題中,你將會得到一個城市及其之間距離的列表。旅行推銷員需要對每個城市訪問一次,你必須為其尋找最短路線,以最大限度地減少旅行時間和費(fèi)用(確保能夠返回最初城市)。這一問題的實(shí)際應(yīng)用是送貨卡車。假設(shè)倫敦有100人在線下單,所有的箱子都被裝在同一輛貨車?yán)???爝f(例如DPD)必須計(jì)算最優(yōu)路線(平衡距離/時間),以便從倉庫(最終返回倉庫)交付這些包裹,并確保公司在交付過程中盡可能少地浪費(fèi)時間和金錢。
預(yù)測建模算法
如今,預(yù)測建模是炒作的焦點(diǎn)。世界各地的數(shù)據(jù)科學(xué)家都在他們舒適的辦公大樓樓頂高呼“神經(jīng)網(wǎng)絡(luò)”,而諸如谷歌這樣的公司正到處奔走,試圖用這些小巧而復(fù)雜的“人工大腦”及其不同變體來解決世界上的各種問題。實(shí)際上,預(yù)測建模使用統(tǒng)計(jì)學(xué)來預(yù)測結(jié)果。你經(jīng)常會聽到數(shù)據(jù)科學(xué)家試圖解決兩種預(yù)測建模問題,回歸和分類?;貧w是發(fā)現(xiàn)兩組變量之間相關(guān)性的黑魔法,分類是計(jì)算數(shù)據(jù)集屬于不同組的概率的過程。
5種生物啟發(fā)學(xué)習(xí)算法
1.人工神經(jīng)網(wǎng)絡(luò)(ARTIFICIAL NEURAL NETWORKS)
前饋神經(jīng)網(wǎng)絡(luò) - 最基本的神經(jīng)網(wǎng)絡(luò)類型
算法類型:預(yù)測建模
生物學(xué)啟示:認(rèn)知大腦功能(神經(jīng)元)
應(yīng)用示例:情感分析、圖像識別/檢測、語言修正、機(jī)器人
我們從最常見的人工智能(AI)算法開始。神經(jīng)網(wǎng)絡(luò)是人工智能領(lǐng)域中一個稱之為機(jī)器學(xué)習(xí)的子類別的一部分。它們的設(shè)計(jì)和構(gòu)建模仿了神經(jīng)元層面的大腦功能(即軸突和樹突相互作用,通過系統(tǒng)傳遞信息),通過一系列“層”生成預(yù)測輸出。每一層都提供了一個額外的數(shù)據(jù)表示層,從而使得你能夠?qū)ψ顝?fù)雜的問題進(jìn)行建模。
神經(jīng)網(wǎng)絡(luò)可能是目前應(yīng)用最廣泛的機(jī)器學(xué)習(xí)算法,也是數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)。這一概念最初是在1958年提出的,稱之為“感知機(jī)”。后來Geoffrey Hinton對其進(jìn)行了提煉,并被Google和Facebook等公司中進(jìn)行推廣。神經(jīng)網(wǎng)絡(luò)可用于解決各種類型的問題,包括自然語言處理、視覺識別等。這種監(jiān)督學(xué)習(xí)算法既支持回歸問題,也能用于分類問題,且其應(yīng)用的實(shí)例可以在日常的消費(fèi)類產(chǎn)品中找到,包括智能手機(jī)及聯(lián)網(wǎng)家庭設(shè)備。
2.遺傳算法
遺傳算法中個體的繁殖
算法類型:搜索/尋路
生物學(xué)啟示:適者生存/進(jìn)化(細(xì)胞繁殖)
應(yīng)用示例:數(shù)據(jù)挖掘/分析、機(jī)器人、制造/設(shè)計(jì)、過程優(yōu)化
為了解決搜索問題,遺傳算法在一組連續(xù)的世代個體中采用了一種類似于“適者生存”的進(jìn)化方法。每一代都含有一些字符串,標(biāo)記了我們在DNA中所看到的的染色體。群體中的每個個體都代表搜索空間中的一個點(diǎn),因此每個個體都是可能的候選解。為了提高解的數(shù)量,我們將個體置于進(jìn)化的過程中。
整體中的每個個體都會為爭奪資源和配偶而競爭
相較于競爭中失敗的個體而言,每場競爭中勝出的個體(通常)會產(chǎn)生更多的子個體。
更加“理想”的候選個體基因在種群中傳播,會導(dǎo)致優(yōu)秀的父母將產(chǎn)生更具有潛力的后代。
3.群體/集體智能(SWARM/COLLECTIVE INTELLIGENCE)
蟻群優(yōu)化實(shí)例, 一種集體智能算法
算法類型:搜索/尋路
生物啟示:蟻群/魚群/鳥群
應(yīng)用示例:機(jī)器人、視頻游戲AI、制造、路線規(guī)劃
蟻群優(yōu)化和粒子群優(yōu)化是符合“集體智慧”概念的兩種最常見算法。在基本層面上,我們所討論的算法都需要利用多個工作智能體(working agents)。每個工作智能體都表現(xiàn)出非?;镜男袨槟芰?,這些行為通過集體(作為一個整體)工作,以便可以觸發(fā)更復(fù)雜、更緊急的行為,以解決問題。
蟻群優(yōu)化(ACO)與粒子群優(yōu)化(PSO)有很大不同。兩者都旨在實(shí)現(xiàn)緊急行為,但采用了不同的方法。像真正的螞蟻群體一樣,ACO利用信息素氣味引導(dǎo)個體智能體選擇最短路徑。最初,在問題空間中初始化一個隨機(jī)信息素。隨后,個體智能體開始遍歷搜索空間,在搜索過程中釋放信息素氣味。在每個時間段中,信息素將以一個確定的速率衰減。單一智能體根據(jù)其前方信息素氣味的強(qiáng)度做出決策,以遍歷搜索空間。特定方向的氣味越強(qiáng)烈,就越有可能向那個方向前進(jìn)。信息素氣味最強(qiáng)的方案就是最優(yōu)解決方案。
PSO更多的是關(guān)注整體方向。一些單一智能體被初始化,隨后它們從隨機(jī)方向開始。每個時間段,每個智能體都需要做出決策是否要改變方向。這一決策將以最優(yōu)解決方案(pbest/全局最優(yōu))的方向、最鄰近的方向(局部最優(yōu))以及當(dāng)前前進(jìn)方向作為基礎(chǔ)。新的前進(jìn)方向通常是對所有這些值的 “妥協(xié)”。
4.強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)環(huán)境中的智能體行為
算法類型:預(yù)測建模
生物啟示:經(jīng)典條件反射
應(yīng)用示例:視頻游戲、自主車輛控制、生產(chǎn)線軟件、金融系統(tǒng)
隨著心理學(xué)的發(fā)展和一個類似于經(jīng)典條件反射的過程,強(qiáng)化學(xué)習(xí)可以對智能體所采取的有利行動做出積極的數(shù)字反應(yīng)。學(xué)習(xí)強(qiáng)化學(xué)習(xí)的概念往往比學(xué)習(xí)經(jīng)典的條件反射更容易。巴甫洛夫的狗(Pavlov’s Dogs),這是在19世紀(jì)90年代進(jìn)行的一項(xiàng)研究,當(dāng)時俄羅斯心理學(xué)家Ivan Pavlov正在研究狗的唾液對喂食的反應(yīng)。這里可以找到一篇能夠很好地解釋這件事的文章。本質(zhì)上而言,如果一個強(qiáng)化學(xué)習(xí)采取了一個好的行動,能夠向完成任務(wù)的方向邁出了一步,那么它將得到一個數(shù)字獎勵。該智能體將學(xué)習(xí)使用一個策略,從而使每一步都能獲得最大獎勵。將原始輸入應(yīng)用到算法中,可以讓智能體開發(fā)自身對問題的感知,并改進(jìn)該如何利用最有效的方式去解決問題。
將強(qiáng)化學(xué)習(xí)算法與其他機(jī)器學(xué)習(xí)技術(shù)相結(jié)合的應(yīng)用是非常普遍的,例如神經(jīng)網(wǎng)絡(luò)。這通常被稱為深度強(qiáng)化學(xué)習(xí)。神經(jīng)網(wǎng)絡(luò)常用于預(yù)測強(qiáng)化學(xué)習(xí)在作出特定決策時應(yīng)得到的獎勵。如今,Deep Mind是Google旗下的一所公司,它在這一領(lǐng)域取得了很大的進(jìn)步,并可以采用Deep Q Learning方法來解決更為普遍的問題(例如一種算法能夠玩轉(zhuǎn)整個Atari游戲庫,并且在游戲“GO”中,在沒有任何幫助的前提下?lián)魯×耸澜绻谲姡?。他們目前正在采用這種方法來處理更復(fù)雜的游戲,如“星際爭霸II”。
作為參考,Q Learning是一種無模型版本的強(qiáng)化學(xué)習(xí)算法。它可以為任何有限的馬爾可夫決策過程(Markov Decision Process)找到最優(yōu)的動作選擇策略。在程序初始化時,每個動作值對應(yīng)的Q值由開發(fā)人員定義,并在每個時間段由強(qiáng)化學(xué)習(xí)算法進(jìn)行更新。下圖展示的是更新Q動作值對(Q action-value pair)的等式示例。
Q學(xué)習(xí)值(Q Learning Value)更新方程
5.人工免疫系統(tǒng)
算法類型:預(yù)測建模
生物學(xué)啟示:免疫系統(tǒng)
用例:安全軟件、自主導(dǎo)航系統(tǒng)、調(diào)度系統(tǒng)、故障檢測軟件
免疫系統(tǒng)是通過產(chǎn)生免疫反應(yīng)來保護(hù)身體免受物質(zhì)和病原體侵害的系統(tǒng)。人工免疫系統(tǒng)(Artificial Immune System,AIS)是受理論免疫學(xué)和應(yīng)用于解決問題的觀察免疫功能啟發(fā)而產(chǎn)生的適應(yīng)性系統(tǒng)。AIS是生物啟發(fā)計(jì)算和自然計(jì)算的子領(lǐng)域,與機(jī)器學(xué)習(xí)和人工智能相關(guān)。通常有多個與AIS相關(guān)聯(lián)的算法:
克隆選擇(Clonal Selection)
樹突狀細(xì)胞(Dendritic Cell)
陰性選擇(Negative Selection)
人工免疫識別(Artificial Immune Recognition)
與生物免疫系統(tǒng)一樣,AIS能夠?qū)⑾到y(tǒng)內(nèi)的所有細(xì)胞分為“自我”和“非我”兩類。一個分布式的情報(bào)工作隊(duì)被用來對所有的細(xì)胞采取行動。參與免疫活動的最重要的兩類細(xì)胞是B細(xì)胞和T細(xì)胞(于你我而言是白血細(xì)胞)。T細(xì)胞分為三類,一種是用來激活B細(xì)胞,一種是用來結(jié)合并破壞外來入侵者,還有一種是用來抑制自身免疫問題。B細(xì)胞負(fù)責(zé)產(chǎn)生抗體,即與抗原(毒性/外來物質(zhì))相結(jié)合的特異性蛋白質(zhì)。人工免疫系統(tǒng)通常用于通過監(jiān)測入侵檢測以抵御網(wǎng)絡(luò)攻擊,并且通常被集成于企業(yè)級軟件中。與本文中提到的其他算法不同,關(guān)于此主題的免費(fèi)在線學(xué)習(xí)資料非常有限,該技術(shù)可能是本文提及的所有技術(shù)當(dāng)中最不發(fā)達(dá)的一種。
-
機(jī)器人
+關(guān)注
關(guān)注
210文章
28205瀏覽量
206525 -
算法
+關(guān)注
關(guān)注
23文章
4599瀏覽量
92643 -
人工智能
+關(guān)注
關(guān)注
1791文章
46859瀏覽量
237562 -
強(qiáng)化學(xué)習(xí)
+關(guān)注
關(guān)注
4文章
266瀏覽量
11213
原文標(biāo)題:這有5種來自大自然「饋贈」的AI技術(shù)及其應(yīng)用,你知道多少?
文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論