機(jī)器學(xué)習(xí)的本質(zhì),其實(shí)就是模仿人類大腦進(jìn)行學(xué)習(xí)的過程,通過讓機(jī)器模仿這種學(xué)習(xí)過程實(shí)現(xiàn)所謂的“智能”。
經(jīng)過近幾十年的發(fā)展,機(jī)器學(xué)習(xí)的方法也越來越成熟,主要有以下幾種:
- 監(jiān)督學(xué)習(xí)
- 無監(jiān)督學(xué)習(xí)
- 強(qiáng)化學(xué)習(xí)
- 深度學(xué)習(xí)
- 深度強(qiáng)化學(xué)習(xí)
如上圖所示,機(jī)器學(xué)習(xí)是從左往右的發(fā)展方向,每一階段的學(xué)習(xí)方法都比上一代優(yōu)秀了很多。
下面簡單介紹這幾種機(jī)器學(xué)習(xí)方法的工作原理。
監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)指的是讓機(jī)器從現(xiàn)有的標(biāo)注好的已知數(shù)據(jù)中學(xué)習(xí)預(yù)測模型的學(xué)習(xí)方法。
簡單來說,先給定計(jì)算機(jī)一組標(biāo)記好的數(shù)據(jù),讓計(jì)算機(jī)用回歸或分類的方法計(jì)算出數(shù)據(jù)與標(biāo)記之間的經(jīng)驗(yàn)關(guān)系。
通過這種方式,計(jì)算機(jī)最終會得出一個預(yù)測模型,訓(xùn)練數(shù)據(jù)越多,預(yù)測模型越準(zhǔn)確。
而所謂的“回歸”和“分類”方法,是計(jì)算機(jī)的兩種尋找規(guī)律的方式。具體如下:
回歸方法
計(jì)算機(jī)通過給定的標(biāo)記與數(shù)據(jù)之間的特征值,計(jì)算出標(biāo)記與數(shù)據(jù)之間的經(jīng)驗(yàn)關(guān)系。
這種方法最終得到的預(yù)測模型其實(shí)就是“經(jīng)驗(yàn)關(guān)系”。當(dāng)訓(xùn)練完成,你可以使用模型對未知數(shù)據(jù)進(jìn)行預(yù)測,以此來測試計(jì)算機(jī)是否已經(jīng)學(xué)習(xí)到了。
分類方法
分類方法指的是讓計(jì)算機(jī)將性質(zhì)相似的數(shù)據(jù)分類為一個組。這種方法得到的模型是一個分類器。
訓(xùn)練完成后,你可以使用未知數(shù)據(jù)讓分類器進(jìn)行分類,根據(jù)分類結(jié)果判斷計(jì)算機(jī)的預(yù)測精度水平。
監(jiān)督學(xué)習(xí)的方法包括:KNN、SVN等。
無監(jiān)督學(xué)習(xí)
無監(jiān)督學(xué)習(xí)是相對于監(jiān)督學(xué)習(xí)來講的,是對監(jiān)督學(xué)習(xí)的升級版。
無監(jiān)督學(xué)習(xí)指的是從無標(biāo)注的數(shù)據(jù)集中學(xué)習(xí)預(yù)測模型的方法。
監(jiān)督學(xué)習(xí)需要給計(jì)算機(jī)標(biāo)記好的訓(xùn)練集,而無監(jiān)督學(xué)習(xí)不需要人工標(biāo)記訓(xùn)練集,計(jì)算機(jī)會根據(jù)現(xiàn)有的數(shù)據(jù)集的特征,自動對數(shù)據(jù)集進(jìn)行分類。
無監(jiān)督學(xué)習(xí)的方法有:聚類、K均值、PCA等
強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)與監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)最大的區(qū)別,就是它不是一個分類任務(wù)。
強(qiáng)化學(xué)習(xí)訓(xùn)練時,需要環(huán)境給予反饋,以及對應(yīng)具體的反饋值。通過反饋值告訴預(yù)測模型預(yù)測結(jié)果是“好”還是“壞”,然后通過外界的反饋結(jié)果調(diào)整預(yù)測模型。
深度學(xué)習(xí)
深度學(xué)習(xí)是無監(jiān)督學(xué)習(xí)的一種,它模仿的是人類大腦神經(jīng)網(wǎng)絡(luò)。
常用的深度學(xué)習(xí)方法有深度神經(jīng)網(wǎng)絡(luò)、深度信念網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)等。
深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。
深度強(qiáng)化學(xué)習(xí)
深度學(xué)習(xí)具有較強(qiáng)的感知能力,但是缺乏一定的決策能力;而強(qiáng)化學(xué)習(xí)具有決策能力,對感知問題束手無策。因此,深度強(qiáng)化學(xué)習(xí)將深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相結(jié)合,優(yōu)勢互補(bǔ),為復(fù)雜系統(tǒng)的感知決策問題提供了解決思路。
該技術(shù)在機(jī)器人、視頻游戲、金融和醫(yī)療領(lǐng)域取得了巨大成功。許多以前無法解決的問題現(xiàn)在通過創(chuàng)建DRL模型得到了解決。
-
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7419瀏覽量
87714 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8377瀏覽量
132407 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5492瀏覽量
120975
發(fā)布評論請先 登錄
相關(guān)推薦
評論