国产亚洲欧美日韩在线我不卡_久久久久久久久经典精品欧美激情_97久久天天躁夜夜躁狠狠

機器學習性能評價標準是模型優化的前提，在設計機器學習算法過程中，不同的問題需要用到不同的評價標準，本文對機器學習算法常用指標進行了總結。

考慮一個二分問題，即將實例分成正類（positive）或負類（negative）。對一個二分問題來說，會出現四種情況。如果一個實例是正類并且也被預測成正類，即為真正類（True positive）,如果實例是負類被預測成正類，稱之為假正類（False positive）。相應地，如果實例是負類被預測成負類，稱之為真負類（True negative）,正類被預測成負類則為假負類（false negative）。

TP：正確肯定的數目；

FN：漏報，沒有正確找到的匹配的數目；

FP：誤報，給出的匹配是不正確的；

TN：正確拒絕的非匹配對數；

列聯表如下表所示，1代表正類，0代表負類：

1. TPR、FPR&TNR

從列聯表引入兩個新名詞。其一是真正類率(true positive rate ,TPR), 計算公式為

TPR = TP / (TP +FN)

刻畫的是分類器所識別出的正實例占所有正實例的比例。

另外一個是負正類率(false positive rate,FPR),計算公式為

FPR = FP / (FP + TN)

計算的是分類器錯認為正類的負實例占所有負實例的比例。

還有一個真負類率（True Negative Rate，TNR），也稱為specificity，計算公式為

TNR = TN /(FP +TN) = 1 - FPR

2. 精確率Precision、召回率Recall和F1值

精確率（正確率）和召回率是廣泛用于信息檢索和統計學分類領域的兩個度量值，用來評價結果的質量。其中精度是檢索出相關文檔數與檢索出的文檔總數的比率，衡量的是檢索系統的查準率；召回率是指檢索出的相關文檔數和文檔庫中所有的相關文檔數的比率，衡量的是檢索系統的查全率。

一般來說，Precision就是檢索出來的條目（比如：文檔、網頁等）有多少是準確的，Recall就是所有準確的條目有多少被檢索出來了，兩者的定義分別如下：

Precision = 提取出的正確信息條數 / 提取出的信息條數

Recall = 提取出的正確信息條數 / 樣本中的信息條數

為了能夠評價不同算法的優劣，在Precision和Recall的基礎上提出了F1值的概念，來對Precision和Recall進行整體評價。F1的定義如下：

F1值 = 正確率 * 召回率 * 2 / (正確率 + 召回率)

不妨舉這樣一個例子：

某池塘有1400條鯉魚，300只蝦，300只鱉。現在以捕鯉魚為目的。撒一大網，逮著了700條鯉魚，200只蝦，100只鱉。那么，這些指標分別如下：

正確率 = 700 / (700 + 200 + 100) = 70%

召回率 = 700 / 1400 = 50%

F1值 = 70% * 50% * 2 / (70% + 50%) = 58.3%

不妨看看如果把池子里的所有的鯉魚、蝦和鱉都一網打盡，這些指標又有何變化：

正確率 =1400 / (1400 +300 + 300) = 70%

召回率 =1400 / 1400 = 100%

F1值 = 70% * 100% * 2 / (70% + 100%) = 82.35%

由此可見，正確率是評估捕獲的成果中目標成果所占得比例；召回率，顧名思義，就是從關注領域中，召回目標類別的比例；而F值，則是綜合這二者指標的評估指標，用于綜合反映整體的指標。

當然希望檢索結果Precision越高越好，同時Recall也越高越好，但事實上這兩者在某些情況下有矛盾的。比如極端情況下，我們只搜索出了一個結果，且是準確的，那么Precision就是100%，但是Recall就很低；而如果我們把所有結果都返回，那么比如Recall是100%，但是Precision就會很低。因此在不同的場合中需要自己判斷希望Precision比較高或是Recall比較高。如果是做實驗研究，可以繪制Precision-Recall曲線來幫助分析。

3. 綜合評價指標F-measure

Precision和Recall指標有時候會出現的矛盾的情況，這樣就需要綜合考慮他們，最常見的方法就是F-Measure（又稱為F-Score）。

F-Measure是Precision和Recall加權調和平均：

當參數α=1時，就是最常見的F1。因此，F1綜合了P和R的結果，當F1較高時則能說明試驗方法比較有效。

4. ROC曲線和AUC

4.1 為什么引入ROC曲線？

Motivation1：在一個二分類模型中，對于所得到的連續結果，假設已確定一個閥值，比如說 0.6，大于這個值的實例劃歸為正類，小于這個值則劃到負類中。如果減小閥值，減到0.5，固然能識別出更多的正類，也就是提高了識別出的正例占所有正例的比類，即TPR,但同時也將更多的負實例當作了正實例，即提高了FPR。為了形象化這一變化，引入ROC，ROC曲線可以用于評價一個分類器。

Motivation2：在類不平衡的情況下,如正樣本90個,負樣本10個,直接把所有樣本分類為正樣本,得到識別率為90%。但這顯然是沒有意義的。單純根據Precision和Recall來衡量算法的優劣已經不能表征這種病態問題。

4.2 什么是ROC曲線？

ROC（Receiver Operating Characteristic）翻譯為"接受者操作特性曲線"。曲線由兩個變量1-specificity 和 Sensitivity繪制. 1-specificity=FPR，即負正類率。Sensitivity即是真正類率，TPR(True positive rate),反映了正類覆蓋程度。這個組合以1-specificity對sensitivity,即是以代價(costs)對收益(benefits)。

此外，ROC曲線還可以用來計算“均值平均精度”（mean average precision），這是當你通過改變閾值來選擇最好的結果時所得到的平均精度（PPV）。

為了更好地理解ROC曲線，我們使用具體的實例來說明：

如在醫學診斷中,判斷有病的樣本。那么盡量把有病的揪出來是主要任務,也就是第一個指標TPR,要越高越好。而把沒病的樣本誤診為有病的,也就是第二個指標FPR,要越低越好。

不難發現,這兩個指標之間是相互制約的。如果某個醫生對于有病的癥狀比較敏感,稍微的小癥狀都判斷為有病,那么他的第一個指標應該會很高,但是第二個指標也就相應地變高。最極端的情況下,他把所有的樣本都看做有病,那么第一個指標達到1,第二個指標也為1。

我們以FPR為橫軸,TPR為縱軸,得到如下ROC空間。

我們可以看出,左上角的點(TPR=1,FPR=0),為完美分類,也就是這個醫生醫術高明,診斷全對。點A(TPR>FPR),醫生A的判斷大體是正確的。中線上的點B(TPR=FPR),也就是醫生B全都是蒙的,蒙對一半,蒙錯一半;下半平面的點C(TPR

還是一開始的那幅圖,假設如下就是某個醫生的診斷統計圖,直線代表閾值。我們遍歷所有的閾值,能夠在ROC平面上得到如下的ROC曲線。

曲線距離左上角越近,證明分類器效果越好。

如上,是三條ROC曲線,在0.23處取一條直線。那么,在同樣的低FPR=0.23的情況下,紅色分類器得到更高的PTR。也就表明,ROC越往上,分類器效果越好。我們用一個標量值AUC來量化它。

4.3 什么是AUC？

AUC值為ROC曲線所覆蓋的區域面積,顯然,AUC越大,分類器分類效果越好。

AUC = 1，是完美分類器，采用這個預測模型時，不管設定什么閾值都能得出完美預測。絕大多數預測的場合，不存在完美分類器。

0.5 < AUC < 1，優于隨機猜測。這個分類器（模型）妥善設定閾值的話，能有預測價值。

AUC = 0.5，跟隨機猜測一樣（例：丟銅板），模型沒有預測價值。

AUC < 0.5，比隨機猜測還差；但只要總是反預測而行，就優于隨機猜測。

AUC的物理意義：假設分類器的輸出是樣本屬于正類的socre（置信度），則AUC的物理意義為，任取一對（正、負）樣本，正樣本的score大于負樣本的score的概率。

4.4 怎樣計算AUC？

第一種方法:AUC為ROC曲線下的面積,那我們直接計算面積可得。面積為一個個小的梯形面積之和。計算的精度與閾值的精度有關。

第二種方法:根據AUC的物理意義,我們計算正樣本score大于負樣本的score的概率。取N*M(N為正樣本數,M為負樣本數)個二元組,比較score,最后得到AUC。時間復雜度為O(N*M)。

第三種方法:與第二種方法相似,直接計算正樣本score大于負樣本的概率。我們首先把所有樣本按照score排序,依次用rank表示他們,如最大score的樣本,rank=n(n=N+M),其次為n-1。那么對于正樣本中rank最大的樣本,rank_max,有M-1個其他正樣本比他score小,那么就有(rank_max-1)-(M-1)個負樣本比他score小。其次為(rank_second-1)-(M-2)。最后我們得到正樣本大于負樣本的概率為

時間復雜度為O(N+M)。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

機器學習

機器學習

+關注

關注
66

文章
8306

瀏覽量
131834

原文標題：機器學習算法常用指標總結

文章出處：【微信號：AI_shequ，微信公眾號：人工智能愛好者社區】歡迎添加關注！文章轉載請注明出處。

機器學習模型評估指標

機器學習模型指標在機器學習建模過程中，針對不同的問題，需采用不同的模型評估指標。

發表于 09-06 12:51 ?897次閱讀

<b class='flag-5'>機器</b><b class='flag-5'>學習</b>模型評估<b class='flag-5'>指標</b>

【阿里云大學免費精品課】機器學習入門：概念原理及常用算法

摘要：阿里云大學聯合螞蟻金服高級算法專家推出了免費的機器學習入門課程：機器學習入門：概念原理及常用

發表于 06-23 13:51

常用python機器學習庫盤點

現在人工智能非常火爆，機器學習應該算是人工智能里面的一個子領域，而其中有一塊是對文本進行分析，對數據進行深入的挖掘提取一些特征值，然后用一些算法去學習,訓練,分析,甚至還能預測，那么P

發表于 05-10 15:20

單片機常用PID濾波算法資料匯總

單片機常用PID濾波算法資料匯總

發表于 05-21 11:45 ?26次下載

經典的機器學習算法匯總

本文將用一句話來總結每種典型的機器學習算法，幫你抓住問題的本質，強化理解和記憶。

發表于 08-11 10:24 ?5734次閱讀

10大常用機器學習算法匯總

本文介紹了10大常用機器學習算法，包括線性回歸、Logistic回歸、線性判別分析、樸素貝葉斯、KNN、隨機森林等。

發表于 11-20 11:10 ?2642次閱讀

流形學習LLE算法的配套Matlab源碼匯總

流形學習LLE算法的配套Matlab源碼匯總

發表于 08-25 09:30 ?1次下載

17個機器學習的常用算法

根據數據類型的不同，對一個問題的建模有不同的方式。在機器學習或者人工智能領域，人們首先會考慮算法的學習方式。在機器

發表于 08-11 11:20 ?1709次閱讀

17個機器學習的常用算法！

源自：AI知識干貨根據數據類型的不同，對一個問題的建模有不同的方式。在機器學習或者人工智能領域，人們首先會考慮算法的學習方式。在機器

發表于 08-22 09:57 ?2014次閱讀

常用機器學習算法的基本概念和特點

。因此對于數據科學家來說，理解算法顯得格外重要，理解不同算法的思想可以幫助數據科學家更從容地面對不同的應用場景。本文列出了常用的機器學習

發表于 01-17 15:43 ?3357次閱讀

機器學習算法的5種基本算子

自主決策的方法和插件，其中包含了一系列常用的基本算子。在本文中，我們將會介紹機器學習算法的五種基本算子。一、求值算子求值算子是常用的

發表于 08-17 16:11 ?1617次閱讀

機器學習算法匯總機器學習算法分類機器學習算法模型

是解決具體問題的一系列步驟，機器學習的算法被設計用于從大量的數據中自動學習并不斷改進自身的性能。本文將為大家介紹機器

發表于 08-17 16:11 ?957次閱讀

機器學習算法總結機器學習算法是什么機器學習算法優缺點

機器學習算法總結機器學習算法是什么?機器

發表于 08-17 16:11 ?1582次閱讀

機器學習算法入門機器學習算法介紹機器學習算法對比

機器學習算法入門機器學習算法介紹機器

發表于 08-17 16:27 ?834次閱讀

機器學習有哪些算法？機器學習分類算法有哪些？機器學習預判有哪些算法？

機器學習有哪些算法？機器學習分類算法有哪些？機器

發表于 08-17 16:30 ?1793次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

機器學習算法常用指標匯總

評論

機器學習模型評估指標

【阿里云大學免費精品課】機器學習入門：概念原理及常用算法

常用python機器學習庫盤點

單片機常用PID濾波算法資料匯總

經典的機器學習算法匯總

10大常用機器學習算法匯總

流形學習LLE算法的配套Matlab源碼匯總

17個機器學習的常用算法

17個機器學習的常用算法！

常用機器學習算法的基本概念和特點

機器學習算法的5種基本算子

機器學習算法匯總機器學習算法分類機器學習算法模型

機器學習算法總結機器學習算法是什么機器學習算法優缺點

機器學習算法入門機器學習算法介紹機器學習算法對比

機器學習有哪些算法？機器學習分類算法有哪些？機器學習預判有哪些算法？