機(jī)器學(xué)習(xí)特征選擇常用算法 - 全文

1. 綜述

(1) 什么是特征選擇

特征選擇 ( Feature Selection )也稱(chēng)特征子集選擇( Feature Subset Selection , FSS ) ，或?qū)傩赃x擇( Attribute Selection ) ，是指從全部特征中選取一個(gè)特征子集，使構(gòu)造出來(lái)的模型更好。

(2) 為什么要做特征選擇

在機(jī)器學(xué)習(xí)的實(shí)際應(yīng)用中，特征數(shù)量往往較多，其中可能存在不相關(guān)的特征，特征之間也可能存在相互依賴(lài)，容易導(dǎo)致如下的后果：

特征個(gè)數(shù)越多，分析特征、訓(xùn)練模型所需的時(shí)間就越長(zhǎng)。

特征個(gè)數(shù)越多，容易引起“維度災(zāi)難”，模型也會(huì)越復(fù)雜，其推廣能力會(huì)下降。

特征選擇能剔除不相關(guān)(irrelevant)或亢余(redundant )的特征，從而達(dá)到減少特征個(gè)數(shù)，提高模型精確度，減少運(yùn)行時(shí)間的目的。另一方面，選取出真正相關(guān)的特征簡(jiǎn)化了模型，使研究人員易于理解數(shù)據(jù)產(chǎn)生的過(guò)程。

2. 特征選擇過(guò)程

2.1 特征選擇的一般過(guò)程
特征選擇的一般過(guò)程可用圖1表示。首先從特征全集中產(chǎn)生出一個(gè)特征子集，然后用評(píng)價(jià)函數(shù)對(duì)該特征子集進(jìn)行評(píng)價(jià)，評(píng)價(jià)的結(jié)果與停止準(zhǔn)則進(jìn)行比較，若評(píng)價(jià)結(jié)果比停止準(zhǔn)則好就停止，否則就繼續(xù)產(chǎn)生下一組特征子集，繼續(xù)進(jìn)行特征選擇。選出來(lái)的特征子集一般還要驗(yàn)證其有效性。

綜上所述，特征選擇過(guò)程一般包括產(chǎn)生過(guò)程，評(píng)價(jià)函數(shù)，停止準(zhǔn)則，驗(yàn)證過(guò)程，這4個(gè)部分。

(1) 產(chǎn)生過(guò)程( Generation Procedure )
產(chǎn)生過(guò)程是搜索特征子集的過(guò)程，負(fù)責(zé)為評(píng)價(jià)函數(shù)提供特征子集。搜索特征子集的過(guò)程有多種，將在2.2小節(jié)展開(kāi)介紹。

(2) 評(píng)價(jià)函數(shù)( Evaluation Function )
評(píng)價(jià)函數(shù)是評(píng)價(jià)一個(gè)特征子集好壞程度的一個(gè)準(zhǔn)則。評(píng)價(jià)函數(shù)將在2.3小節(jié)展開(kāi)介紹。

(3) 停止準(zhǔn)則( Stopping Criterion )
停止準(zhǔn)則是與評(píng)價(jià)函數(shù)相關(guān)的，一般是一個(gè)閾值，當(dāng)評(píng)價(jià)函數(shù)值達(dá)到這個(gè)閾值后就可停止搜索。

(4) 驗(yàn)證過(guò)程( Validation Procedure )
在驗(yàn)證數(shù)據(jù)集上驗(yàn)證選出來(lái)的特征子集的有效性。

圖1. 特征選擇的過(guò)程 ( M. Dash and H. Liu 1997 )

2.2 產(chǎn)生過(guò)程
產(chǎn)生過(guò)程是搜索特征子空間的過(guò)程。搜索的算法分為完全搜索(Complete)，啟發(fā)式搜索(Heuristic)，隨機(jī)搜索(Random) 3大類(lèi)，如圖2所示。

圖2. 產(chǎn)生過(guò)程算法分類(lèi) ( M. Dash and H. Liu 1997 )

下面對(duì)常見(jiàn)的搜索算法進(jìn)行簡(jiǎn)單介紹。

2.2.1完全搜索
完全搜索分為窮舉搜索(Exhaustive)與非窮舉搜索(Non-Exhaustive)兩類(lèi)。

(1) 廣度優(yōu)先搜索( Breadth First Search )
算法描述：廣度優(yōu)先遍歷特征子空間。
算法評(píng)價(jià)：枚舉了所有的特征組合，屬于窮舉搜索，時(shí)間復(fù)雜度是O(2n)，實(shí)用性不高。

(2)分支限界搜索( Branch and Bound )
算法描述：在窮舉搜索的基礎(chǔ)上加入分支限界。例如：若斷定某些分支不可能搜索出比當(dāng)前找到的最優(yōu)解更優(yōu)的解，則可以剪掉這些分支。

(3) 定向搜索 (Beam Search )
算法描述：首先選擇N個(gè)得分最高的特征作為特征子集，將其加入一個(gè)限制最大長(zhǎng)度的優(yōu)先隊(duì)列，每次從隊(duì)列中取出得分最高的子集，然后窮舉向該子集加入1個(gè)特征后產(chǎn)生的所有特征集，將這些特征集加入隊(duì)列。

(4) 最優(yōu)優(yōu)先搜索 ( Best First Search )
算法描述：與定向搜索類(lèi)似，唯一的不同點(diǎn)是不限制優(yōu)先隊(duì)列的長(zhǎng)度。

2.2.2 啟發(fā)式搜索

(1)序列前向選擇( SFS , Sequential Forward Selection )

算法描述：特征子集X從空集開(kāi)始，每次選擇一個(gè)特征x加入特征子集X，使得特征函數(shù)J( X)最優(yōu)。簡(jiǎn)單說(shuō)就是，每次都選擇一個(gè)使得評(píng)價(jià)函數(shù)的取值達(dá)到最優(yōu)的特征加入，其實(shí)就是一種簡(jiǎn)單的貪心算法。

算法評(píng)價(jià)：缺點(diǎn)是只能加入特征而不能去除特征。例如：特征A完全依賴(lài)于特征B與C，可以認(rèn)為如果加入了特征B與C則A就是多余的。假設(shè)序列前向選擇算法首先將A加入特征集，然后又將B與C加入，那么特征子集中就包含了多余的特征A。

(2)序列后向選擇( SBS , Sequential Backward Selection )

算法描述：從特征全集O開(kāi)始，每次從特征集O中剔除一個(gè)特征x，使得剔除特征x后評(píng)價(jià)函數(shù)值達(dá)到最優(yōu)。

算法評(píng)價(jià)：序列后向選擇與序列前向選擇正好相反，它的缺點(diǎn)是特征只能去除不能加入。

另外，SFS與SBS都屬于貪心算法，容易陷入局部最優(yōu)值。

(3) 雙向搜索( BDS , Bidirectional Search )

算法描述：使用序列前向選擇(SFS)從空集開(kāi)始，同時(shí)使用序列后向選擇(SBS)從全集開(kāi)始搜索，當(dāng)兩者搜索到一個(gè)相同的特征子集C時(shí)停止搜索。

雙向搜索的出發(fā)點(diǎn)是。如下圖所示，O點(diǎn)代表搜索起點(diǎn)，A點(diǎn)代表搜索目標(biāo)。灰色的圓代表單向搜索可能的搜索范圍，綠色的2個(gè)圓表示某次雙向搜索的搜索范圍，容易證明綠色的面積必定要比灰色的要小。

圖2. 雙向搜索

(4) 增L去R選擇算法 ( LRS , Plus-L Minus-R Selection )

該算法有兩種形式:

<1> 算法從空集開(kāi)始，每輪先加入L個(gè)特征，然后從中去除R個(gè)特征，使得評(píng)價(jià)函數(shù)值最優(yōu)。( L > R )
<2> 算法從全集開(kāi)始，每輪先去除R個(gè)特征，然后加入L個(gè)特征，使得評(píng)價(jià)函數(shù)值最優(yōu)。( L < R )

算法評(píng)價(jià)：增L去R選擇算法結(jié)合了序列前向選擇與序列后向選擇思想， L與R的選擇是算法的關(guān)鍵。

(5) 序列浮動(dòng)選擇( Sequential Floating Selection )

算法描述：序列浮動(dòng)選擇由增L去R選擇算法發(fā)展而來(lái)，該算法與增L去R選擇算法的不同之處在于：序列浮動(dòng)選擇的L與R不是固定的，而是“浮動(dòng)”的，也就是會(huì)變化的。

序列浮動(dòng)選擇根據(jù)搜索方向的不同，有以下兩種變種。
<1>序列浮動(dòng)前向選擇( SFFS , Sequential Floating Forward Selection )

算法描述：從空集開(kāi)始，每輪在未選擇的特征中選擇一個(gè)子集x，使加入子集x后評(píng)價(jià)函數(shù)達(dá)到最優(yōu)，然后在已選擇的特征中選擇子集z，使剔除子集z后評(píng)價(jià)函數(shù)達(dá)到最優(yōu)。

<2>序列浮動(dòng)后向選擇( SFBS , Sequential Floating Backward Selection )

算法描述：與SFFS類(lèi)似，不同之處在于SFBS是從全集開(kāi)始，每輪先剔除特征，然后加入特征。

算法評(píng)價(jià)：序列浮動(dòng)選擇結(jié)合了序列前向選擇、序列后向選擇、增L去R選擇的特點(diǎn)，并彌補(bǔ)了它們的缺點(diǎn)。

(6) 決策樹(shù)( Decision Tree Method , DTM)

算法描述：在訓(xùn)練樣本集上運(yùn)行C4.5或其他決策樹(shù)生成算法，待決策樹(shù)充分生長(zhǎng)后，再在樹(shù)上運(yùn)行剪枝算法。則最終決策樹(shù)各分支處的特征就是選出來(lái)的特征子集了。決策樹(shù)方法一般使用信息增益作為評(píng)價(jià)函數(shù)。

2.2.3 隨機(jī)算法
(1) 隨機(jī)產(chǎn)生序列選擇算法(RGSS, Random Generation plus Sequential Selection)
算法描述：隨機(jī)產(chǎn)生一個(gè)特征子集，然后在該子集上執(zhí)行SFS與SBS算法。
算法評(píng)價(jià)：可作為SFS與SBS的補(bǔ)充，用于跳出局部最優(yōu)值。

(2) 模擬退火算法( SA, Simulated Annealing )
模擬退火算法可參考?大白話(huà)解析模擬退火算法?。

算法評(píng)價(jià)：模擬退火一定程度克服了序列搜索算法容易陷入局部最優(yōu)值的缺點(diǎn)，但是若最優(yōu)解的區(qū)域太小（如所謂的“高爾夫球洞”地形），則模擬退火難以求解。

(3) 遺傳算法( GA, Genetic Algorithms )
遺傳算法可參考?遺傳算法入門(mén)?。
算法描述：首先隨機(jī)產(chǎn)生一批特征子集，并用評(píng)價(jià)函數(shù)給這些特征子集評(píng)分，然后通過(guò)交叉、突變等操作繁殖出下一代的特征子集，并且評(píng)分越高的特征子集被選中參加繁殖的概率越高。這樣經(jīng)過(guò)N代的繁殖和優(yōu)勝劣汰后，種群中就可能產(chǎn)生了評(píng)價(jià)函數(shù)值最高的特征子集。

隨機(jī)算法的共同缺點(diǎn)：依賴(lài)于隨機(jī)因素，有實(shí)驗(yàn)結(jié)果難以重現(xiàn)。

2.3 評(píng)價(jià)函數(shù)
評(píng)價(jià)函數(shù)的作用是評(píng)價(jià)產(chǎn)生過(guò)程所提供的特征子集的好壞。
評(píng)價(jià)函數(shù)根據(jù)其工作原理，主要分為篩選器(Filter)、封裝器( Wrapper )兩大類(lèi)。

篩選器通過(guò)分析特征子集內(nèi)部的特點(diǎn)來(lái)衡量其好壞。篩選器一般用作預(yù)處理，與分類(lèi)器的選擇無(wú)關(guān)。篩選器的原理如下圖3：

圖3. Filter原理(Ricardo Gutierrez-Osuna 2008 )

封裝器實(shí)質(zhì)上是一個(gè)分類(lèi)器，封裝器用選取的特征子集對(duì)樣本集進(jìn)行分類(lèi)，分類(lèi)的精度作為衡量特征子集好壞的標(biāo)準(zhǔn)。封裝器的原理如圖4所示。

圖4. Wrapper原理 (Ricardo Gutierrez-Osuna 2008 )

下面簡(jiǎn)單介紹常見(jiàn)的評(píng)價(jià)函數(shù)。
(1) 相關(guān)性( Correlation)
運(yùn)用相關(guān)性來(lái)度量特征子集的好壞是基于這樣一個(gè)假設(shè)：好的特征子集所包含的特征應(yīng)該是與分類(lèi)的相關(guān)度較高（相關(guān)度高），而特征之間相關(guān)度較低的（亢余度低）。
可以使用線(xiàn)性相關(guān)系數(shù)(correlation coefficient) 來(lái)衡量向量之間線(xiàn)性相關(guān)度。

( 2) 距離 (Distance Metrics )
運(yùn)用距離度量進(jìn)行特征選擇是基于這樣的假設(shè)：好的特征子集應(yīng)該使得屬于同一類(lèi)的樣本距離盡可能小，屬于不同類(lèi)的樣本之間的距離盡可能遠(yuǎn)。

常用的距離度量（相似性度量）包括歐氏距離、標(biāo)準(zhǔn)化歐氏距離、馬氏距離等。

(3) 信息增益( Information Gain )
假設(shè)存在離散變量Y，Y中的取值包括{y1，y2，....，ym} ，yi出現(xiàn)的概率為Pi。則Y的信息熵定義為：

信息熵有如下特性：若集合Y的元素分布越“純”，則其信息熵越小；若Y分布越“紊亂”，則其信息熵越大。在極端的情況下：若Y只能取一個(gè)值，即P1=1，則H(Y)取最小值0；反之若各種取值出現(xiàn)的概率都相等，即都是1/m，則H(Y)取最大值log2m。

在附加條件另一個(gè)變量X，而且知道X=xi后，Y的條件信息熵(Conditional Entropy)表示為：

機(jī)器學(xué)習(xí)特征選擇常用算法

假設(shè)存在特征子集A和特征子集B，分類(lèi)變量為C，若IG( C|A ) > IG( C|B ) ，則認(rèn)為選用特征子集A的分類(lèi)結(jié)果比B好，因此傾向于選用特征子集A。

(4)一致性( Consistency )
若樣本1與樣本2屬于不同的分類(lèi)，但在特征A、 B上的取值完全一樣，那么特征子集{A，B}不應(yīng)該選作最終的特征集。

(5)分類(lèi)器錯(cuò)誤率 (Classifier error rate )
使用特定的分類(lèi)器，用給定的特征子集對(duì)樣本集進(jìn)行分類(lèi)，用分類(lèi)的精度來(lái)衡量特征子集的好壞。

以上5種度量方法中，相關(guān)性、距離、信息增益、一致性屬于篩選器，而分類(lèi)器錯(cuò)誤率屬于封裝器。

篩選器由于與具體的分類(lèi)算法無(wú)關(guān)，因此其在不同的分類(lèi)算法之間的推廣能力較強(qiáng)，而且計(jì)算量也較小。而封裝器由于在評(píng)價(jià)的過(guò)程中應(yīng)用了具體的分類(lèi)算法進(jìn)行分類(lèi)，因此其推廣到其他分類(lèi)算法的效果可能較差，而且計(jì)算量也較大。

閱讀全文

上一頁(yè)1 2全文

本文導(dǎo)航

第 1 頁(yè)：機(jī)器學(xué)習(xí)特征選擇常用算法
第 2 頁(yè)：2.2.2 啟發(fā)式搜索

算法(90510) 算法(90510)
特征選擇(7146) 特征選擇(7146)

評(píng)論

相關(guān)推薦

機(jī)器學(xué)習(xí)算法的特征工程與意義詳解

1、特征工程與意義特征就是從數(shù)據(jù)中抽取出來(lái)的對(duì)結(jié)果預(yù)測(cè)有用的信息。特征工程是使用專(zhuān)業(yè)知識(shí)背景知識(shí)和技巧處理數(shù)據(jù)，是得特征能在機(jī)器學(xué)習(xí)算法上發(fā)揮更好的作用的過(guò)程。 2、基本數(shù)據(jù)處理數(shù)據(jù)采集需要

2020-10-08 15:24:00

2624

機(jī)器學(xué)習(xí)中常用的決策樹(shù)算法技術(shù)解析

決策樹(shù)是最重要的機(jī)器學(xué)習(xí)算法之一，其可被用于分類(lèi)和回歸問(wèn)題。本文中，我們將介紹分類(lèi)部分。

2020-10-12 16:39:34

1112

分享一些最常見(jiàn)最實(shí)用的機(jī)器學(xué)習(xí)算法

在這篇文章中，分享一些最常用的機(jī)器學(xué)習(xí)算法。

2017-10-14 14:24:00

8793

機(jī)器學(xué)習(xí)算法概念介紹及選用建議

在從事數(shù)據(jù)科學(xué)工作的時(shí)候，經(jīng)常會(huì)遇到為具體問(wèn)題選擇最合適算法的問(wèn)題。雖然有很多有關(guān)機(jī)器學(xué)習(xí)算法的文章詳細(xì)介紹了相關(guān)的算法，但要做出最合適的選擇依然非常困難。

2019-01-14 13:49:42

3562

50多種適合機(jī)器學(xué)習(xí)和預(yù)測(cè)應(yīng)用的API，你的選擇是？（2018年版本）

摘要：本文盤(pán)點(diǎn)了2018年以來(lái)人臉和圖像識(shí)別、文本分析、自然語(yǔ)言處理、情感分析、語(yǔ)言翻譯、 機(jī)器學(xué)習(xí)和預(yù)測(cè)這幾個(gè)領(lǐng)域常用的API，讀者可以根據(jù)自己需求選擇合適的API完成相應(yīng)的任務(wù)。對(duì)于做工

2018-05-03 16:41:16

常用python機(jī)器學(xué)習(xí)庫(kù)盤(pán)點(diǎn)

現(xiàn)在人工智能非常火爆，機(jī)器學(xué)習(xí)應(yīng)該算是人工智能里面的一個(gè)子領(lǐng)域，而其中有一塊是對(duì)文本進(jìn)行分析，對(duì)數(shù)據(jù)進(jìn)行深入的挖掘提取一些特征值，然后用一些算法去學(xué)習(xí),訓(xùn)練,分析,甚至還能預(yù)測(cè)，那么Python中常用

2018-05-10 15:20:21

機(jī)器學(xué)習(xí)算法分享

機(jī)器學(xué)習(xí)算法（1）——Logistic Regression

2020-06-09 13:30:03

機(jī)器學(xué)習(xí)算法如何用于制造無(wú)人駕駛汽車(chē)？

機(jī)器學(xué)習(xí)算法如何用于制造無(wú)人駕駛汽車(chē)

2021-03-18 06:27:18

機(jī)器學(xué)習(xí)——期望最大算法

機(jī)器學(xué)習(xí) - 期望最大（EM）算法

2020-05-21 14:31:34

機(jī)器學(xué)習(xí)之 k-近鄰算法(k-NN)

機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)100天(5) --- k-近鄰算法(k-NN)

2020-05-15 15:06:29

機(jī)器學(xué)習(xí)之高級(jí)算法課程學(xué)習(xí)總結(jié)

機(jī)器學(xué)習(xí)：高級(jí)算法課程學(xué)習(xí)總結(jié)

2020-05-05 17:17:16

機(jī)器學(xué)習(xí)分類(lèi)與算法選擇

根據(jù)需求選擇算法

2019-09-12 15:38:30

機(jī)器學(xué)習(xí)的算法應(yīng)用

關(guān)于機(jī)器學(xué)習(xí)的相關(guān)算法。正版資源，免費(fèi)看的。

2017-08-24 22:14:36

機(jī)器學(xué)習(xí)簡(jiǎn)介與經(jīng)典機(jī)器學(xué)習(xí)算法人才培養(yǎng)

上課時(shí)間安排：2022年05月27日 — 2022年05月30日No.1 第一天一、機(jī)器學(xué)習(xí)簡(jiǎn)介與經(jīng)典機(jī)器學(xué)習(xí)算法介紹什么是機(jī)器學(xué)習(xí)？機(jī)器學(xué)習(xí)框架與基本組成機(jī)器學(xué)習(xí)的訓(xùn)練步驟機(jī)器學(xué)習(xí)問(wèn)題的分類(lèi)

2022-04-28 18:56:07

機(jī)器學(xué)習(xí)訓(xùn)練秘籍——吳恩達(dá)

機(jī)器學(xué)習(xí)的形式有許多種，但當(dāng)前具備實(shí)用價(jià)值的大部分機(jī)器學(xué)習(xí)算法都來(lái)自于監(jiān)督學(xué)習(xí)。我將經(jīng)常提及神經(jīng)網(wǎng)絡(luò)（也被人們稱(chēng)為“深度學(xué)習(xí)” ），但你只需對(duì)這個(gè)概念有基礎(chǔ)的了解便可以閱讀本書(shū)后面的內(nèi)容。如果對(duì)上

2018-11-30 16:45:03

機(jī)器算法學(xué)習(xí)比較

轉(zhuǎn)本文主要回顧下幾個(gè)常用算法的適應(yīng)場(chǎng)景及其優(yōu)缺點(diǎn)！機(jī)器學(xué)習(xí)算法太多了，分類(lèi)、回歸、聚類(lèi)、推薦、圖像識(shí)別領(lǐng)域等等，要想找到一個(gè)合適算法真的不容易，所以在實(shí)際應(yīng)用中，我們一般都是采用啟發(fā)式學(xué)習(xí)方式來(lái)實(shí)驗(yàn)

2016-09-27 10:48:01

機(jī)器人視覺(jué)系統(tǒng)組成及定位算法分析

：基于濾波器的定位算法主要有KF、SEIF、PF、EKF、UKF等。也可以使用單目視覺(jué)和里程計(jì)融合的方法。以里程計(jì)讀數(shù)作為輔助信息,利用三角法計(jì)算特征點(diǎn)在當(dāng)前機(jī)器人坐標(biāo)系中的坐標(biāo)位置,這里的三維坐標(biāo)計(jì)算需要

2019-06-08 08:30:00

機(jī)器狀態(tài)監(jiān)測(cè)的高級(jí)算法及實(shí)現(xiàn)課程

機(jī)器狀態(tài)監(jiān)測(cè)的高級(jí)算法及實(shí)現(xiàn)課程議程機(jī)器狀態(tài)監(jiān)測(cè)(MCM)簡(jiǎn)述常用的轉(zhuǎn)動(dòng)機(jī)器狀態(tài)監(jiān)測(cè)算法成功案例總結(jié)[hide]機(jī)器狀態(tài)監(jiān)測(cè)的高級(jí)算法及實(shí)現(xiàn).pdf[/hide]

2009-12-16 09:25:31

機(jī)器視覺(jué)算法與應(yīng)用（雙語(yǔ)版）

與縮放的模板匹配3.11.5 可靠的模板匹配算法3.12 光學(xué)字符識(shí)別（OCR）3.12.1 字符分割3.12.2 特征提取3.12.3 字符分類(lèi)4 機(jī)器視覺(jué)應(yīng)用4.1 半導(dǎo)體晶片切割4.2 序列號(hào)讀取

2016-06-29 13:48:38

Adaboost算法的Haar特征怎么進(jìn)行并行處理？

Adaboost 算法是Freund 和Schapire 于1995 年提出的，全稱(chēng)為Adaptive Boosting。它是 Boosting 算法的改進(jìn)，意為該算法通過(guò)機(jī)器訓(xùn)練與學(xué)習(xí)不斷自適應(yīng)地調(diào)整假設(shè)的錯(cuò)誤率，這種靈活性使得Adaboost 算法很容易與實(shí)際應(yīng)用聯(lián)系起來(lái)。

2019-08-28 07:05:11

MATLAB機(jī)器學(xué)習(xí)與深度學(xué)習(xí)核心技術(shù)應(yīng)用培訓(xùn)班

校區(qū)）第一章：MATLAB入門(mén)基礎(chǔ)第二章：MATLAB進(jìn)階與提高第三章：BP神經(jīng)網(wǎng)絡(luò)第四章：極限學(xué)習(xí)機(jī)第五章：支持向量機(jī)第六章：決策樹(shù)算法與隨機(jī)森林第七章：遺傳算法第八章：變量降維與特征選擇第九章：圖像處理

2018-10-23 16:51:05

Python機(jī)器學(xué)習(xí)常用庫(kù)

、Scikit-Learn在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的應(yīng)用中，Scikit-Learn是一個(gè)功能強(qiáng)大的Python包，我們可以用它進(jìn)行分類(lèi)、特征選擇、特征提取和聚集。二、StatsmodelsStatsmodels是另一個(gè)聚焦在

2018-03-26 16:29:41

c語(yǔ)言常用算法

非常實(shí)用的《c語(yǔ)言常用算法程序集》針對(duì)工程中常用的行之有效的算法而編寫(xiě)，其主要內(nèi)容包括多項(xiàng)式的計(jì)算、復(fù)數(shù)運(yùn)算、隨機(jī)數(shù)的產(chǎn)生、矩陣運(yùn)算、矩陣特征值與特征向量的計(jì)算、線(xiàn)性代數(shù)方程組的求解、非線(xiàn)性

2022-04-11 16:41:52

【下載】《機(jī)器學(xué)習(xí)》+《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》

讀者, 本書(shū)附錄給出了一些相關(guān)數(shù)學(xué)基礎(chǔ)知識(shí)簡(jiǎn)介.目錄：全書(shū)共16 章，大致分為3 個(gè)部分：第1 部分（第1～3 章）介紹機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)；第2 部分（第4～10 章）討論一些經(jīng)典而常用的機(jī)器學(xué)習(xí)

2017-06-01 15:49:24

【專(zhuān)輯精選】機(jī)器學(xué)習(xí)之算法教程與資料

電子發(fā)燒友總結(jié)了以“算法”為主題的精選干貨，今后每天一個(gè)主題為一期，希望對(duì)各位有所幫助！（點(diǎn)擊標(biāo)題即可進(jìn)入頁(yè)面下載相關(guān)資料）經(jīng)典算法大全（51個(gè)C語(yǔ)言算法+單片機(jī)常用算法+機(jī)器學(xué)十大算法）11種常見(jiàn)

2019-05-09 17:06:40

【阿里云大學(xué)免費(fèi)精品課】機(jī)器學(xué)習(xí)入門(mén)：概念原理及常用算法

摘要：阿里云大學(xué)聯(lián)合螞蟻金服高級(jí)算法專(zhuān)家推出了免費(fèi)的機(jī)器學(xué)習(xí)入門(mén)課程：機(jī)器學(xué)習(xí)入門(mén)：概念原理及常用算法（點(diǎn)擊開(kāi)始學(xué)習(xí)） AlaphaGo與圍棋界的較量，吸引了全世界的目光，也讓大家見(jiàn)識(shí)到了機(jī)器

2017-06-23 13:51:15

什么是機(jī)器學(xué)習(xí)? 機(jī)器學(xué)習(xí)基礎(chǔ)入門(mén)

的、面向任務(wù)的智能，這就是機(jī)器學(xué)習(xí)的范疇。我過(guò)去聽(tīng)到的機(jī)器學(xué)習(xí)定義的最強(qiáng)大的方法之一是與傳統(tǒng)的、用于經(jīng)典計(jì)算機(jī)編程的算法方法相比較。在經(jīng)典計(jì)算中，工程師向計(jì)算機(jī)提供輸入數(shù)據(jù)ーー例如，數(shù)字2和4ーー以及將它

2022-06-21 11:06:37

如何選擇機(jī)器學(xué)習(xí)的各種方法

的這篇博客，講述了如何選擇機(jī)器學(xué)習(xí)的各種方法。另外，Scikit-learn 也提供了一幅清晰的路線(xiàn)圖給大家選擇：其實(shí)機(jī)器學(xué)習(xí)的基本算法都很簡(jiǎn)單，下面我們就利用二維數(shù)據(jù)和交互圖形來(lái)看看機(jī)器學(xué)習(xí)中的一些

2019-03-07 20:18:53

干貨 | 這些機(jī)器學(xué)習(xí)算法，你了解幾個(gè)？

優(yōu)勝者。當(dāng)然，你嘗試的算法必須適合你的問(wèn)題，這就是選擇正確的機(jī)器學(xué)習(xí)算法的重要性之所在。打個(gè)比方，如果你需要清理你的房子，你可以使用真空吸塵器，掃帚或拖把，但是你不會(huì)拿出一把鏟子然后開(kāi)始挖掘。因此

2019-09-22 08:30:00

有沒(méi)有搞機(jī)器學(xué)習(xí)算法研究的啊？

有沒(méi)有搞機(jī)器學(xué)習(xí)、人工智能相關(guān)的算法研究的啊？自己一個(gè)人搞感覺(jué)挺難的，希望找到志同道合的朋友，相互探討。

2016-02-26 09:56:00

經(jīng)典算法大全（51個(gè)C語(yǔ)言算法+單片機(jī)常用算法+機(jī)器學(xué)十大算法）

試題學(xué)SPFA算法整體來(lái)說(shuō)，機(jī)器學(xué)習(xí)算法可以分為 3 大類(lèi)：0.1 監(jiān)督學(xué)習(xí) 工作原理：該算法由自變量（協(xié)變量、預(yù)測(cè)變量）和因變量（結(jié)果變量）組成，由一組自變量對(duì)因變量進(jìn)行預(yù)測(cè)。通過(guò)這些變量集合，我們

2018-10-23 14:31:12

請(qǐng)問(wèn)誰(shuí)做過(guò)蟻群算法選擇圖像特征，使識(shí)別準(zhǔn)確率最高？

請(qǐng)問(wèn)誰(shuí)做過(guò)蟻群算法選擇圖像特征，使識(shí)別準(zhǔn)確率最高？有學(xué)習(xí)資料或者matlab代碼可以讓我學(xué)習(xí)一下嗎

2019-02-17 17:20:32

阿里深度學(xué)習(xí)的“金剛鉆”——千億特征XNN算法及其落地實(shí)踐

博士，2016年加入阿里巴巴，現(xiàn)主要從事推薦系統(tǒng)特征、模型、架構(gòu)和大規(guī)模機(jī)器學(xué)習(xí)框架的研發(fā)工作。以下內(nèi)容根據(jù)演講嘉賓視頻分享以及PPT整理而成。本次分享的主要圍繞以下三個(gè)方面：一．業(yè)務(wù)背景二．XPS機(jī)器學(xué)習(xí)

2018-04-24 16:43:39

高級(jí)機(jī)器學(xué)習(xí)算法工程師--【北京】

職位描述：1. 負(fù)責(zé)計(jì)算機(jī)視覺(jué)&機(jī)器學(xué)習(xí)（包括深度學(xué)習(xí)）算法的開(kāi)發(fā)與性能提升，負(fù)責(zé)下述研究課題中的一項(xiàng)或多項(xiàng)，包括但不限于：人臉識(shí)別、檢測(cè)、活體、跟蹤、分類(lèi)、語(yǔ)義分割、深度估計(jì)、圖像處理

2017-12-07 14:34:41

改進(jìn)的支持向量機(jī)特征選擇算法

針對(duì)采用支持向量機(jī)進(jìn)行分類(lèi)的特征子集選擇問(wèn)題，提出一種改進(jìn)的基于梯度向量的特征評(píng)測(cè)算法。該算法在核特征空間中，利用數(shù)據(jù)點(diǎn)到分類(lèi)超平面的距離函數(shù)的梯度向量對(duì)各個(gè)

2009-04-03 08:38:56

基于改進(jìn)遺傳算法的支持向量機(jī)特征選擇

基于改進(jìn)遺傳算法的支持向量機(jī)特征選擇　引言　　支持向量機(jī)是一種在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展而來(lái)的機(jī)器學(xué)習(xí)方法[1]，通過(guò)學(xué)習(xí)類(lèi)別之間分界面附近的精

2010-02-06 10:36:49

1369

特征選擇算法綜述

自20世紀(jì)90年代以來(lái)，特征選擇成為模式識(shí)別和機(jī)器學(xué)習(xí)領(lǐng)域的重要研究方向，研究成果十分顯著，但是也存在許多問(wèn)題需要進(jìn)一步研究。本文首先將特征選擇視為特征集合空間中的啟發(fā)

2011-05-05 17:01:10

不平衡數(shù)據(jù)集上的Relief特征選擇算法_菅小艷

2017-01-08 10:40:54

一文解析機(jī)器學(xué)習(xí)常用35大算法

本文將帶你遍歷機(jī)器學(xué)習(xí)領(lǐng)域最受歡迎的算法。系統(tǒng)地了解這些算法有助于進(jìn)一步掌握機(jī)器學(xué)習(xí)。當(dāng)然，本文收錄的算法并不完全，分類(lèi)的方式也不唯一。

2018-06-30 04:24:00

3645

Spark機(jī)器學(xué)習(xí)庫(kù)的各種機(jī)器學(xué)習(xí)算法

本文將簡(jiǎn)要介紹Spark機(jī)器學(xué)習(xí)庫(kù)（Spark MLlibs APIs）的各種機(jī)器學(xué)習(xí)算法，主要包括：統(tǒng)計(jì)算法、分類(lèi)算法、聚類(lèi)算法和協(xié)同過(guò)濾算法，以及各種算法的應(yīng)用。你不是一個(gè)數(shù)據(jù)科學(xué)家。根據(jù)

2017-09-28 16:44:43

R語(yǔ)言機(jī)器學(xué)習(xí)算法的性能分析比較

你如何有效地計(jì)算出不同機(jī)器學(xué)習(xí)算法的估計(jì)準(zhǔn)確性？在這篇文章中，你將會(huì)學(xué)到8種技術(shù)，用來(lái)比較R語(yǔ)言機(jī)器學(xué)習(xí)算法。你可以使用這些技術(shù)來(lái)選擇最精準(zhǔn)的模型，并能夠給出統(tǒng)計(jì)意義方面的評(píng)價(jià)，以及相比其它算法

2017-10-12 16:33:39

一種面向高維微陣列數(shù)據(jù)的集成特征選擇算法

特征選擇算法是微陣列數(shù)據(jù)分析的重要工具，特征選擇算法的分類(lèi)性能和穩(wěn)定性對(duì)微陣列數(shù)據(jù)分析至關(guān)重要。為了提高特征選擇算法的分類(lèi)性能和穩(wěn)定性，提出一種面向高維微陣列數(shù)據(jù)的集成特征選擇算法來(lái)彌補(bǔ)單個(gè)基因

2017-11-28 16:25:26

基于元學(xué)習(xí)推薦的優(yōu)化算法自動(dòng)選擇框架

算法選擇的目的是從眾多可用優(yōu)化算法中自動(dòng)地選出最適用于當(dāng)前問(wèn)題的算法。針對(duì)算法選擇問(wèn)題提出了基于元學(xué)習(xí)推薦的優(yōu)化算法自動(dòng)選擇框架。依據(jù)此框架，以多模式資源受限的項(xiàng)目調(diào)度問(wèn)題為實(shí)證數(shù)據(jù)集，設(shè)計(jì)實(shí)現(xiàn)

2017-12-04 15:28:43

基于聚類(lèi)集成技術(shù)的在線(xiàn)特征選擇

針對(duì)既有歷史數(shù)據(jù)又有流特征的全新應(yīng)用場(chǎng)景，提出了一種基于組特征選擇和流特征的在線(xiàn)特征選擇算法。在對(duì)歷史數(shù)據(jù)的組特征選擇階段，為了彌補(bǔ)單一聚類(lèi)算法的不足，引入聚類(lèi)集成的思想。先利用k-means方法

2017-12-05 11:00:41

基于森林優(yōu)化特征選擇算法的改進(jìn)研究

在分類(lèi)中，特征選擇一直是一個(gè)重要而又困難的問(wèn)題．最近研究表明森林優(yōu)化特征選擇算法（FSFOA）具有更好的分類(lèi)性能及較好的維度縮減能力，然而，初始化階段的隨機(jī)性、更新機(jī)制上的局限性及局部播種階段

2017-12-14 16:47:25

機(jī)器學(xué)習(xí)分類(lèi)算法中必須要懂的四種算法

本文主要介紹了4 種應(yīng)用比較普遍的的機(jī)器學(xué)習(xí)算法，但是機(jī)器學(xué)習(xí)算法還有其他很多不同的算法，大家感興趣的可以自己去了解。樸素貝葉斯分類(lèi)是基于貝葉斯定理與特征條件獨(dú)立假設(shè)的分類(lèi)方法，發(fā)源于古典數(shù)學(xué)理論，擁有穩(wěn)定的數(shù)學(xué)基礎(chǔ)和分類(lèi)效率。

2017-12-26 14:45:02

26224

FAST特征選擇算法的改進(jìn)

交互的特征是指那些分開(kāi)考慮對(duì)目標(biāo)集不相關(guān)或弱相關(guān)，但合在一起考慮卻對(duì)目標(biāo)集高度相關(guān)的特征。特征交互現(xiàn)象廣泛存在，但找出有交互作用的特征卻是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。本文旨在對(duì)基于聚類(lèi)的FAST特征選擇

2017-12-30 15:36:03

機(jī)器學(xué)習(xí)算法分類(lèi)

機(jī)器學(xué)習(xí)起源于人工智能，可以賦予計(jì)算機(jī)以傳統(tǒng)編程所無(wú)法實(shí)現(xiàn)的能力，比如飛行器的自動(dòng)駕駛、人臉識(shí)別、計(jì)算機(jī)視覺(jué)和數(shù)據(jù)挖掘等。機(jī)器學(xué)習(xí)的算法很多。很多時(shí)候困惑人們的是，很多算法是一類(lèi)算法，而有些算法又是

2018-01-05 17:36:10

3101

人工智能之機(jī)器學(xué)習(xí)常見(jiàn)算法

機(jī)器學(xué)習(xí)無(wú)疑是當(dāng)前數(shù)據(jù)分析領(lǐng)域的一個(gè)熱點(diǎn)內(nèi)容。很多人在平時(shí)的工作中都或多或少會(huì)用到機(jī)器學(xué)習(xí)的算法。這里小編為您總結(jié)一下常見(jiàn)的機(jī)器學(xué)習(xí)算法，以供您在工作和學(xué)習(xí)中參考。

2018-02-02 17:20:46

1551

機(jī)器學(xué)習(xí)中的特征選擇的5點(diǎn)詳細(xì)資料概述

特征選擇是一個(gè)重要的“數(shù)據(jù)預(yù)處理” (data preprocessing) 過(guò)程，在現(xiàn)實(shí)機(jī)器學(xué)習(xí)任務(wù)中，獲得數(shù)據(jù)之后通常先進(jìn)行特征選擇，此后再訓(xùn)練學(xué)習(xí)器。那么，為什么要進(jìn)行特征選擇呢？

2018-06-18 17:24:00

6684

基于拉普拉斯評(píng)分的多標(biāo)記特征選擇算法

針對(duì)傳統(tǒng)的拉普拉斯評(píng)分特征選擇算法只適應(yīng)單標(biāo)記學(xué)習(xí)，無(wú)法直接應(yīng)用于多標(biāo)記學(xué)習(xí)的問(wèn)題，提出一種應(yīng)用于多標(biāo)記任務(wù)的拉普拉斯評(píng)分特征選擇算法。首先，考慮樣本在整體標(biāo)記空間中共同關(guān)聯(lián)和共同不關(guān)聯(lián)的相關(guān)性

2018-11-27 16:02:52

機(jī)器學(xué)習(xí)算法常用指標(biāo)匯總

機(jī)器學(xué)習(xí)性能評(píng)價(jià)標(biāo)準(zhǔn)是模型優(yōu)化的前提，在設(shè)計(jì)機(jī)器學(xué)習(xí)算法過(guò)程中，不同的問(wèn)題需要用到不同的評(píng)價(jià)標(biāo)準(zhǔn)，本文對(duì)機(jī)器學(xué)習(xí)算法常用指標(biāo)進(jìn)行了總結(jié)。

2019-02-13 15:09:19

3945

如何幫你的回歸問(wèn)題選擇最合適的機(jī)器學(xué)習(xí)算法

回歸分析在機(jī)器學(xué)習(xí)領(lǐng)域應(yīng)用非常廣泛，例如，商品的銷(xiāo)量預(yù)測(cè)問(wèn)題，交通流量預(yù)測(cè)問(wèn)題。那么，如何為這些回歸問(wèn)題選擇最合適的機(jī)器學(xué)習(xí)算法呢？

2019-05-03 09:39:00

2569

通過(guò)Python就能讀懂機(jī)器學(xué)習(xí)

具體來(lái)說(shuō)有四個(gè)方面的介紹，包括機(jī)器學(xué)習(xí)的定義、機(jī)器學(xué)習(xí)的起源，以及進(jìn)化反向、機(jī)器學(xué)習(xí)的分類(lèi)和類(lèi)別、最常用的機(jī)器學(xué)習(xí)算法，如何實(shí)現(xiàn)。

2019-05-14 14:31:02

2345

?機(jī)器學(xué)習(xí)算法優(yōu)缺點(diǎn)對(duì)比及選擇

本文的目的，是務(wù)實(shí)、簡(jiǎn)潔地盤(pán)點(diǎn)一番當(dāng)前機(jī)器學(xué)習(xí)算法。

2019-07-10 17:30:37

2319

機(jī)器學(xué)習(xí)處理器怎樣選擇合適的

雖然經(jīng)典機(jī)器學(xué)習(xí)算法需要人工干預(yù)來(lái)從數(shù)據(jù)中提取特征，但機(jī)器學(xué)習(xí)算法或網(wǎng)絡(luò)模型學(xué)習(xí)如何提取數(shù)據(jù)中的重要特征并對(duì)該數(shù)據(jù)進(jìn)行智能預(yù)測(cè)。

2019-09-11 11:52:15

2260

機(jī)器學(xué)習(xí)特征工程的五個(gè)方面優(yōu)點(diǎn)

特征工程是用數(shù)學(xué)轉(zhuǎn)換的方法將原始輸入數(shù)據(jù)轉(zhuǎn)換為用于機(jī)器學(xué)習(xí)模型的新特征。特征工程提高了機(jī)器學(xué)習(xí)模型的準(zhǔn)確度和計(jì)算效率，體現(xiàn)在以下五個(gè)方面

2020-03-15 16:57:00

3564

機(jī)器學(xué)習(xí)之感知機(jī)python是如何實(shí)現(xiàn)的

算法選擇，最終的目標(biāo)是求損失函數(shù)的最小值，利用機(jī)器學(xué)習(xí)中最常用的梯度下降GD或者隨機(jī)梯度下降SGD來(lái)求解。

2020-03-30 09:36:51

845

機(jī)器學(xué)習(xí)的十大經(jīng)典算法有哪些

C4.5算法是機(jī)器學(xué)習(xí)算法中的一種分類(lèi)決策樹(shù)算法其核心算法是ID3算法.C4.5算法繼承了ID3算法的優(yōu)點(diǎn)，并在以下幾方面對(duì)ID3算法進(jìn)行了改進(jìn)：1)用信息增益率來(lái)選擇屬性，克服了用信息增益選擇屬性時(shí)偏向選擇取值多的屬性的不足。

2020-04-25 08:00:00

機(jī)器學(xué)習(xí)如何進(jìn)行特征選擇

子集，然后對(duì)它進(jìn)行評(píng)價(jià)，之后根據(jù)評(píng)價(jià)結(jié)果選擇下一個(gè)特征子集，再進(jìn)行移動(dòng)學(xué)習(xí)評(píng)價(jià)，……，直到無(wú)法找到更好的候選子集。

2020-05-20 08:00:00

理解機(jī)器學(xué)習(xí)中的算法與模型

對(duì)于初學(xué)者來(lái)說(shuō)，這很容易讓人混淆，因?yàn)椤?b class="flag-6" style="color: red">機(jī)器學(xué)習(xí)算法”經(jīng)常與“機(jī)器學(xué)習(xí)模型”交替使用。這兩個(gè)到底是一樣的東西呢，還是不一樣的東西？作為開(kāi)發(fā)人員，你對(duì)排序算法、搜索算法等“算法”的直覺(jué)，將有助于你厘清這個(gè)困惑。在本文中，我將闡述機(jī)器學(xué)習(xí)“算法”和“模型”之間的區(qū)別。

2020-07-31 15:38:08

3347

機(jī)器學(xué)習(xí)之特征提取 VS 特征選擇

機(jī)器學(xué)習(xí)中特征選擇和特征提取區(qū)別 demi 在周四, 06/11/2020 - 16:08 提交 1. 特征提取 V.S 特征選擇特征提取和特征選擇

2020-09-14 16:23:20

3732

探討機(jī)器學(xué)習(xí)中特征選擇的4種方法

在本文中，我們將研究從數(shù)據(jù)集中選擇特征的不同方法;同時(shí)通過(guò)使用Python中Scikit-learn (sklearn)庫(kù)實(shí)現(xiàn)討論了特征選擇算法的類(lèi)型。

2020-12-10 15:56:41

1577

機(jī)器學(xué)習(xí)的范圍和算法

什么是機(jī)器學(xué)習(xí)？機(jī)器學(xué)習(xí)是英文名稱(chēng)MachineLearning（簡(jiǎn)稱(chēng)ML）的直譯。機(jī)器學(xué)習(xí)涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門(mén)學(xué)科。

2020-11-12 10:19:12

1203

機(jī)器學(xué)習(xí)的基本過(guò)程及關(guān)鍵要素

機(jī)器學(xué)習(xí)的基本過(guò)程，羅列了幾個(gè)主要流程和關(guān)鍵要素；繼而展開(kāi)介紹機(jī)器學(xué)習(xí)主要的算法框架，包括監(jiān)督學(xué)習(xí)算法，無(wú)監(jiān)督學(xué)習(xí)算法和常用的降維，特征選擇算法等；最后在業(yè)務(wù)實(shí)踐的過(guò)程中，給出了一個(gè)可行的項(xiàng)目管理流程，可供參考。

2020-11-12 10:28:48

10451

10大常用機(jī)器學(xué)習(xí)算法匯總

本文介紹了10大常用機(jī)器學(xué)習(xí)算法，包括線(xiàn)性回歸、Logistic回歸、線(xiàn)性判別分析、樸素貝葉斯、KNN、隨機(jī)森林等。

2020-11-20 11:10:04

2462

機(jī)器學(xué)習(xí)的范圍/算法/分類(lèi)

2021-01-21 09:29:06

3315

對(duì)Python特征選擇最全面的解答

機(jī)器學(xué)習(xí)中特征選擇是一個(gè)重要步驟，以篩選出顯著特征、摒棄非顯著特征。

2021-03-19 16:26:50

1662

最實(shí)用的的五種機(jī)器學(xué)習(xí)算法

最實(shí)用的機(jī)器學(xué)習(xí)算法Top5 demi 在周一, 04/01/2019 - 10:35 提交本文將推薦五種機(jī)器學(xué)習(xí)算法，你應(yīng)該考慮是否將它們投入應(yīng)用。這五種算法覆蓋最常用于聚類(lèi)、分類(lèi)、數(shù)值預(yù)測(cè)

2021-03-24 16:14:31

5986

特征選擇和機(jī)器學(xué)習(xí)的軟件缺陷跟蹤系統(tǒng)對(duì)比

針對(duì)Bugzilla缺陷跟蹤系統(tǒng)的ε clipse項(xiàng)目軟件缺陷報(bào)告數(shù)據(jù)集，使用特征選擇和機(jī)器學(xué)習(xí)算法對(duì)向量化的原始數(shù)據(jù)進(jìn)行特征降維、權(quán)重優(yōu)化等處理，得到數(shù)據(jù)維度較低的優(yōu)化數(shù)據(jù)集，并采用分類(lèi)算法評(píng)估

2021-06-10 10:50:56

一種改進(jìn)的局部和相似度保持特征選擇算法

LSPE（ Locality and Similarity Preserving Embedding）特征選擇算法首先基于KNN定義圖結(jié)構(gòu)來(lái)保持?jǐn)?shù)據(jù)的局部性，再基于定義圖學(xué)習(xí)數(shù)據(jù)的低維重構(gòu)系數(shù)來(lái)保持

2021-06-17 15:24:14

基于WordNet模型的遷移學(xué)習(xí)文本特征對(duì)齊算法

基于WordNet模型的遷移學(xué)習(xí)文本特征對(duì)齊算法

2021-06-27 16:14:43

特征選擇-嵌入式選擇

嵌入式特征選擇是將特征選擇過(guò)程與學(xué)習(xí)器訓(xùn)練過(guò)程融為一體，兩者在同一個(gè)優(yōu)化過(guò)程中完成，即在學(xué)習(xí)器訓(xùn)練過(guò)程中自動(dòng)地進(jìn)行了特征選擇。基于懲罰項(xiàng)的特征選擇法給定數(shù)據(jù)集 D={(x1,y1),(x2,y2

2021-10-21 10:36:04

數(shù)據(jù)機(jī)器學(xué)習(xí)疑難點(diǎn)解決方案介紹

機(jī)器學(xué)習(xí)一般涉及數(shù)據(jù)準(zhǔn)備、特征提取、算法選擇、模型評(píng)估、以及模型存儲(chǔ)與復(fù)用等諸多步驟；而材料數(shù)據(jù)往往還涉及晶體或分子的結(jié)構(gòu)特征和元素特征等的提取，更是增加了材料數(shù)據(jù)機(jī)器學(xué)習(xí)的難度。本次直播將重點(diǎn)講述材料數(shù)據(jù)機(jī)器學(xué)習(xí)的難點(diǎn)、痛點(diǎn)、以及解決方案。

2021-12-17 09:12:41

1300

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法流程

但是無(wú)可否認(rèn)的是深度學(xué)習(xí)實(shí)在太好用啦！極大地簡(jiǎn)化了傳統(tǒng)機(jī)器學(xué)習(xí)的整體算法分析和學(xué)習(xí)流程，更重要的是在一些通用的領(lǐng)域任務(wù)刷新了傳統(tǒng)機(jī)器學(xué)習(xí)算法達(dá)不到的精度和準(zhǔn)確率。

2022-04-26 15:07:20

4081

基于馬爾科夫邊界發(fā)現(xiàn)的因果特征選擇算法綜述

因果特征選擇算法(也稱(chēng)為馬爾科夫邊界發(fā)現(xiàn))學(xué)習(xí)目標(biāo)變量的馬爾科夫邊界,選擇與目標(biāo)存在因果關(guān)系的特征,具有比傳統(tǒng)方法更好的可解釋性和魯棒性.文中對(duì)現(xiàn)有因果特征選擇算法進(jìn)行全面綜述,分為單重馬爾科夫邊界

2022-07-29 10:01:14

923

17個(gè)機(jī)器學(xué)習(xí)的常用算法

根據(jù)數(shù)據(jù)類(lèi)型的不同，對(duì)一個(gè)問(wèn)題的建模有不同的方式。在機(jī)器學(xué)習(xí)或者人工智能領(lǐng)域，人們首先會(huì)考慮算法的學(xué)習(xí)方式。在機(jī)器學(xué)習(xí)領(lǐng)域，有幾種主要的學(xué)習(xí)方式。將算法按照學(xué)習(xí)方式分類(lèi)是一個(gè)不錯(cuò)的想法，這樣可以讓人們?cè)诮：?b class="flag-6" style="color: red">算法選擇的時(shí)候考慮能根據(jù)輸入數(shù)據(jù)來(lái)選擇最合適的算法來(lái)獲得最好的結(jié)果。

2022-08-11 11:20:17

1397

17個(gè)機(jī)器學(xué)習(xí)的常用算法！

源自：AI知識(shí)干貨根據(jù)數(shù)據(jù)類(lèi)型的不同，對(duì)一個(gè)問(wèn)題的建模有不同的方式。在機(jī)器學(xué)習(xí)或者人工智能領(lǐng)域，人們首先會(huì)考慮算法的學(xué)習(xí)方式。在機(jī)器學(xué)習(xí)領(lǐng)域，有幾種主要的學(xué)習(xí)方式。將算法按照學(xué)習(xí)方式分類(lèi)是一個(gè)不錯(cuò)

2022-08-22 09:57:33

1443

機(jī)器學(xué)習(xí)算法的基礎(chǔ)介紹

現(xiàn)在，機(jī)器學(xué)習(xí)有很多算法。如此多的算法，可能對(duì)于初學(xué)者來(lái)說(shuō)，是相當(dāng)不堪重負(fù)的。今天，我們將簡(jiǎn)要介紹 10 種最流行的機(jī)器學(xué)習(xí)算法，這樣你就可以適應(yīng)這個(gè)激動(dòng)人心的機(jī)器學(xué)習(xí)世界了！

2022-10-24 10:08:42

1517

深度學(xué)習(xí)算法如何工作?排名前十的深度學(xué)習(xí)算法介紹

定義神經(jīng)網(wǎng)絡(luò) Neural Networks，簡(jiǎn)稱(chēng)NN。針對(duì)機(jī)器學(xué)習(xí)算法需要領(lǐng)域?qū)＜疫M(jìn)行特征工程，模型泛化性能差的問(wèn)題，提出了NN可以從數(shù)據(jù)的原始特征學(xué)習(xí)特征表示，無(wú)需進(jìn)行復(fù)雜的特征處理。

2022-11-03 10:46:35

960

機(jī)器學(xué)習(xí)領(lǐng)域?qū)?b class="flag-6" style="color: red">算法按照學(xué)習(xí)方式分類(lèi)進(jìn)行問(wèn)題解決

2022-11-22 10:40:53

599

常用機(jī)器學(xué)習(xí)算法的基本概念和特點(diǎn)

。因此對(duì)于數(shù)據(jù)科學(xué)家來(lái)說(shuō)，理解算法顯得格外重要，理解不同算法的思想可以幫助數(shù)據(jù)科學(xué)家更從容地面對(duì)不同的應(yīng)用場(chǎng)景。本文列出了常用的機(jī)器學(xué)習(xí)算法的基本概念、主要特點(diǎn)和適用場(chǎng)景，希望可以在大家選擇合適的機(jī)器學(xué)習(xí)算法解決實(shí)

2023-01-17 15:43:09

2979

機(jī)器學(xué)習(xí)算法的隨機(jī)數(shù)據(jù)生成簡(jiǎn)析

在學(xué)習(xí)機(jī)器學(xué)習(xí)算法的過(guò)程中，我們經(jīng)常需要數(shù)據(jù)來(lái)驗(yàn)證算法，調(diào)試參數(shù)。

2023-03-15 09:07:48

359

如何評(píng)估機(jī)器學(xué)習(xí)模型的性能？機(jī)器學(xué)習(xí)的算法選擇

如何評(píng)估機(jī)器學(xué)習(xí)模型的性能？典型的回答可能是：首先，將訓(xùn)練數(shù)據(jù)饋送給學(xué)習(xí)算法以學(xué)習(xí)一個(gè)模型。第二，預(yù)測(cè)測(cè)試集的標(biāo)簽。第三，計(jì)算模型對(duì)測(cè)試集的預(yù)測(cè)準(zhǔn)確率。

2023-04-04 14:15:19

548

機(jī)器學(xué)習(xí)算法學(xué)習(xí)之特征工程1

特征工程是機(jī)器學(xué)習(xí)過(guò)程中的關(guān)鍵步驟，涉及將原始數(shù)據(jù)轉(zhuǎn)換為機(jī)器學(xué)習(xí)算法可以有效使用的格式。在本篇博客文章中，我們介紹了各種特征工程技術(shù)，包括特征選擇和提取、編碼分類(lèi)變量、縮放和歸一化、創(chuàng)建新特征、處理不平衡數(shù)據(jù)、處理偏斜和峰度、處理稀有類(lèi)別、處理時(shí)間序列數(shù)據(jù)、特征轉(zhuǎn)換和文本預(yù)處理。

2023-04-19 11:38:43

518

機(jī)器學(xué)習(xí)算法學(xué)習(xí)之特征工程2

2023-04-19 11:38:47

560

機(jī)器學(xué)習(xí)算法學(xué)習(xí)之特征工程3

2023-04-19 11:38:51

703

機(jī)器學(xué)習(xí)的經(jīng)典算法與應(yīng)用

? 一、機(jī)器學(xué)習(xí)基礎(chǔ)概念 ? 關(guān)于數(shù)據(jù) ? 機(jī)器學(xué)習(xí)就是喂入算法和數(shù)據(jù)，讓算法從數(shù)據(jù)中尋找一種相應(yīng)的關(guān)系。 ? Iris 鳶尾花數(shù)據(jù)集是一個(gè)經(jīng)典數(shù)據(jù)集，在統(tǒng)計(jì)學(xué)習(xí)和機(jī)器學(xué)習(xí)領(lǐng)域都經(jīng)常被用作示例。數(shù)據(jù)

2023-05-28 11:29:41

650

深度學(xué)習(xí)算法簡(jiǎn)介深度學(xué)習(xí)算法是什么深度學(xué)習(xí)算法有哪些

深度學(xué)習(xí)算法簡(jiǎn)介深度學(xué)習(xí)算法是什么?深度學(xué)習(xí)算法有哪些?? 作為一種現(xiàn)代化、前沿化的技術(shù)，深度學(xué)習(xí)已經(jīng)在很多領(lǐng)域得到了廣泛的應(yīng)用，其能夠不斷地從數(shù)據(jù)中提取最基本的特征，從而對(duì)大量的信息進(jìn)行機(jī)器學(xué)習(xí)

2023-08-17 16:02:56

5997

深度學(xué)習(xí)算法的選擇建議

深度學(xué)習(xí)算法的選擇建議隨著深度學(xué)習(xí)技術(shù)的普及，越來(lái)越多的開(kāi)發(fā)者將它應(yīng)用于各種領(lǐng)域，包括圖像識(shí)別、自然語(yǔ)言處理、聲音識(shí)別等等。對(duì)于剛開(kāi)始學(xué)習(xí)深度學(xué)習(xí)的開(kāi)發(fā)者來(lái)說(shuō)，選擇適合自己的算法和框架是非

2023-08-17 16:11:05

342

深度學(xué)習(xí)框架和深度學(xué)習(xí)算法教程

了基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法。深度學(xué)習(xí)算法可以分為兩大類(lèi)：監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)的基本任務(wù)是訓(xùn)練模型去學(xué)習(xí)輸入數(shù)據(jù)的特征和其對(duì)應(yīng)的標(biāo)簽，然后用于新數(shù)據(jù)的預(yù)測(cè)。而無(wú)監(jiān)督學(xué)習(xí)通常用于聚類(lèi)、降維和生成模型等任務(wù)中

2023-08-17 16:11:26

637

機(jī)器學(xué)習(xí)算法的5種基本算子

自主決策的方法和插件，其中包含了一系列常用的基本算子。在本文中，我們將會(huì)介紹機(jī)器學(xué)習(xí)算法的五種基本算子。一、求值算子求值算子是常用的機(jī)器學(xué)習(xí)算法中的一個(gè)基本元素，它通常用于對(duì)輸入數(shù)據(jù)進(jìn)行處理。在數(shù)據(jù)分析和處

2023-08-17 16:11:46

1244

機(jī)器學(xué)習(xí)算法匯總機(jī)器學(xué)習(xí)算法分類(lèi) 機(jī)器學(xué)習(xí)算法模型

是解決具體問(wèn)題的一系列步驟，機(jī)器學(xué)習(xí)的算法被設(shè)計(jì)用于從大量的數(shù)據(jù)中自動(dòng)學(xué)習(xí)并不斷改進(jìn)自身的性能。本文將為大家介紹機(jī)器學(xué)習(xí)算法匯總和分類(lèi)，以及常用的機(jī)器學(xué)習(xí)算法模型。 機(jī)器學(xué)習(xí)算法匯總 機(jī)器學(xué)習(xí)算法的類(lèi)型繁多，主

2023-08-17 16:11:48

632

機(jī)器學(xué)習(xí)算法總結(jié) 機(jī)器學(xué)習(xí)算法是什么機(jī)器學(xué)習(xí)算法優(yōu)缺點(diǎn)

機(jī)器學(xué)習(xí)算法總結(jié) 機(jī)器學(xué)習(xí)算法是什么?機(jī)器學(xué)習(xí)算法優(yōu)缺點(diǎn)? 機(jī)器學(xué)習(xí)算法總結(jié) 機(jī)器學(xué)習(xí)算法是一種能夠從數(shù)據(jù)中自動(dòng)學(xué)習(xí)的算法。它能夠從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)特征，進(jìn)而對(duì)未知數(shù)據(jù)進(jìn)行分類(lèi)、回歸、聚類(lèi)等任務(wù)。通過(guò)

2023-08-17 16:11:50

938

機(jī)器學(xué)習(xí)算法入門(mén) 機(jī)器學(xué)習(xí)算法介紹機(jī)器學(xué)習(xí)算法對(duì)比

，討論一些主要的機(jī)器學(xué)習(xí)算法，以及比較它們之間的優(yōu)缺點(diǎn)，以便于您選擇適合的算法。一、機(jī)器學(xué)習(xí)算法的基本概念 機(jī)器學(xué)習(xí)是一種人工智能的技術(shù)，它允許計(jì)算機(jī)從歷史數(shù)據(jù)中學(xué)習(xí)模式，以便于更好地預(yù)測(cè)未來(lái)的數(shù)據(jù)。機(jī)器學(xué)習(xí)算法

2023-08-17 16:27:15

569

機(jī)器學(xué)習(xí)vsm算法

機(jī)器學(xué)習(xí)vsm算法隨著機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展，相似性計(jì)算是機(jī)器學(xué)習(xí)中的重要組成部分。在信息檢索、文本挖掘、機(jī)器翻譯等領(lǐng)域中，相似性計(jì)算是必不可少的一項(xiàng)技術(shù)。在這些領(lǐng)域中，我們通常使用向量空間模型

2023-08-17 16:29:35

529

機(jī)器學(xué)習(xí)有哪些算法？機(jī)器學(xué)習(xí)分類(lèi)算法有哪些？機(jī)器學(xué)習(xí)預(yù)判有哪些算法？

機(jī)器學(xué)習(xí)有哪些算法？機(jī)器學(xué)習(xí)分類(lèi)算法有哪些？機(jī)器學(xué)習(xí)預(yù)判有哪些算法？ 機(jī)器學(xué)習(xí)是一種人工智能技術(shù)，通過(guò)對(duì)數(shù)據(jù)的分析和學(xué)習(xí)，為計(jì)算機(jī)提供智能決策。機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)機(jī)器學(xué)習(xí)的基礎(chǔ)。常見(jiàn)的機(jī)器學(xué)習(xí)算法

2023-08-17 16:30:11