精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

分類問題統計指標入門:混淆矩陣、召回、誤檢率、AUROC

zhKF_jqr_AI ? 來源:未知 ? 作者:李建兵 ? 2018-03-17 10:37 ? 次閱讀

縮寫

AUC曲線下面積(Area Under the Curve)

AUROC接受者操作特征曲線下面積(Area Under the Receiver Operating Characteristic curve)

大多數時候,AUC都是指AUROC,這是一個不好地做法,正如Marc Claesen指出的那樣,AUC有歧義(可能是任何曲線),而AUROC沒有歧義。

AUROC解釋

AUROC有一些等價的解釋:

均勻抽取的隨機陽性樣本排名在均勻抽取的隨機陰性樣本之前的期望

陽性樣本排名在均勻抽取的隨機陰性樣本之前的期望比例

若排名在一個隨機抽取的隨機陰性樣本前分割,期望的真陽性率

陰性樣本排名在均勻抽取的隨機陽性樣本之后和期望比例

若排名在一個均勻抽取的隨機陽性樣本后分割,期望的假陽性率

更多閱讀:如何推導AUROC的概率解釋(https://stats.stackexchange.com/questions/180638/how-to-derive-the-probabilistic-interpretation-of-the-auc/277721#277721)

AUROC計算

假設我們有一個概率二元分類器,比如邏輯回歸。

在討論ROC曲線(接受者操作特征曲線)之前,我們需要理解混淆矩陣(confusion matrix)的概念。一個二元預測可能有4個結果:

我們預測0,而真實類別是0:這被稱為真陰性(True Negative),即,我們正確預測類別為陰性(0)。比如,殺毒軟件沒有將一個無害的文件識別為病毒。

我們預測0,而真實類別是1:這被稱為假陰性(False Negative),即,我們錯誤預測類別為陰性(0)。比如,殺毒軟件沒有識別出一個病毒。

我們預測1,而真實類別是0:這被稱為假陽性(False Positive),即,我們錯誤預測類別為陽性(1)。比如,殺毒軟件將一個無害的文件識別為病毒。

我們預測1,而真實類別是1:這被稱為真陽性(True Positive),即,我們正確預測類別為陽性(1)。比如,殺毒軟件正確地識別出一個病毒。

我們統計模型做出的預測,數一下這四種結果各自出現了多少次,可以得到混淆矩陣:

在上面的混淆矩陣示例中,在分類的50個數據點中,45個分類正確,5個分類錯誤。

當比較兩個不同模型的時候,使用單一指標常常比使用多個指標更方便,下面我們基于混淆矩陣計算兩個指標,之后我們會將這兩個指標組合成一個:

真陽性率(TPR),即,靈敏度、命中率、召回,定義為TP/(TP+FN)。從直覺上說,這一指標對應被正確識別為陽性的陽性數據點占所有陽性數據點的比例。換句話說,TPR越高,我們遺漏的陽性數據點就越少。

假陽性率(FPR),即,誤檢率,定義為FP/(FP+TN)。從直覺上說,這一指標對應被誤認為陽性的陰性數據點占所有陰性數據點的比例。換句話說,FPR越高,我們錯誤分類的陰性數據點就越多。

為了將FPR和TPR組合成一個指標,我們首先基于不同的閾值(例如:0.00; 0.01, 0.02, …, 1.00)計算前兩個指標的邏輯回歸,接著將它們繪制為一個圖像,其中FPR值為橫軸,TPR值為縱軸。得到的曲線為ROC曲線,我們考慮的指標是該曲線的AUC,稱為AUROC。

下圖展示了AUROC的圖像:

在上圖中,藍色區域對應接受者操作特征曲線(AUROC)。對角虛線為隨機預測器的ROC曲線:AUROC為0.5. 隨機預測器通常用作基線,以檢驗模型是否有用。

如果你希望得到一些第一手的經驗:

Python:http://scikit-learn.org/stable/auto_examples/model_selection/plot_roc.html

MATLAB:http://www.mathworks.com/help/stats/perfcurve.html

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 矩陣
    +關注

    關注

    0

    文章

    422

    瀏覽量

    34502

原文標題:分類問題統計指標入門:混淆矩陣、召回、誤檢率、AUROC

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    什么是誤碼率和符號 ?

    什么是誤碼率和符號 ?它們用于衡量系統可靠性。誤碼率或比特(BER:bit error ratio)是指在經過系統傳輸后,送給用戶的接收碼流中發生錯誤的比特數占信源發送的原始碼
    發表于 05-30 15:52

    電能質量指標運行合格的標準

    以及用戶用電特性等因素,各項電能質量指標運行合格標準為:(1)連續運行統計期(年、季、月)內電網頻率合格應不低于99.5%(2)連續運行統計
    發表于 10-22 16:34

    誰有關于 memory用LDPC 的校矩陣

    請問哪位好心人有 關于 memory用LDPC 的校矩陣,可以給一個嗎 或者 code rate 是15/16的 校矩陣?。。。?/div>
    發表于 10-11 19:17

    使用單值評估指標進行優化

    ,又譯作召回)的組合并不能作為單值評估指標,因為它給出了兩個值來對你的分類器進行評估。3多值評估指標提高了在算法之間進行優劣比較的難度,假
    發表于 12-12 11:33

    清洗標注的開發集和測試集樣本

    ,則有可能在評估中引入偏差。假設你有 1000 個開發集樣本,同時分類準確為 98%,那么檢查20 個分類的樣本會比檢查 980 個正確分類
    發表于 12-19 09:48

    BPSK調制通信系統的比特仿真

    clc a=round(rand(1,1000))%生成消息碼f=2;%假設載波頻率為2for SNR=0:15%給出信噪比范圍,求比特 cp=[];%存儲BPSK映射后的消息序列 sigma
    發表于 10-15 15:47

    系統符號的變化(G)

    系統符號的變化(G):Model {  Name     "ofdm_gito"  Version   
    發表于 02-08 14:46 ?0次下載

    分類器的分類性能評價指標

    通過具體應用實例,指出目前普遍使用的正確和錯誤評價指標在不平衡數據集、語義相關多分、不同錯分代價等分類問題中評價分類器性能時存在的缺陷。
    發表于 05-03 16:51 ?0次下載

    機器學習實用指南——準確召回

    受試者工作特征(ROC)曲線是另一個二分類器常用的工具。它非常類似與準確/召回曲線,但不是畫出準確
    的頭像 發表于 06-19 15:20 ?2.1w次閱讀
    機器學習實用指南——準確<b class='flag-5'>率</b>與<b class='flag-5'>召回</b><b class='flag-5'>率</b>

    AI垃圾分類的準確召回達到99%

    這套邏輯和人類用眼睛、大腦、手臂工作的邏輯差不多,而且效率也足夠了。以塑料瓶為例,AI垃圾分類的準確召回達到99%,單張圖片的識別時間不到半秒鐘。
    的頭像 發表于 06-16 15:10 ?3227次閱讀

    一文搞懂深度學習的精密召回

    這里,我們將討論兩個重要的度量指標,即精度和召回,它們被用于度量分類模型(即分類器)的性能。特別地,我們將討論如何用這兩個
    的頭像 發表于 07-06 09:54 ?4536次閱讀
    一文搞懂深度學習的精密<b class='flag-5'>率</b>和<b class='flag-5'>召回</b><b class='flag-5'>率</b>

    CCD視覺檢測外觀缺陷,漏檢如何評估

    CCD視覺檢測外觀缺陷,漏檢該怎么評估 機器視覺篩選機做缺陷檢測的用戶都希望篩選機設備的
    發表于 07-07 17:34 ?6667次閱讀

    如何識別指紋鎖的拒絕識別

    如何識別指紋鎖的拒收率和錯誤識別? 指紋鎖是電子元件和機械部件的精確組合。安全、方便、時尚。指紋鎖的拒識無疑是指紋鎖的重要指標,
    發表于 02-28 17:08 ?1237次閱讀

    矩陣鍵盤-單片機入門課件

    矩陣鍵盤-單片機入門課件
    發表于 03-18 11:12 ?0次下載

    模型任務的評價指標體系

    全面了解一個任務的評價指標體系。 在二分類任務評價指標(上)中,我們已經學習了如何利用混淆矩陣來計算二
    的頭像 發表于 01-11 10:10 ?844次閱讀