精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習模型的三種評估方法

汽車玩家 ? 來源:博客園 ? 作者:凌逆戰 ? 2020-01-29 10:30 ? 次閱讀

經驗誤差與過擬合

錯誤率為分類錯誤的樣本數占樣本總數的比例,相應的精度=1-錯誤率,模型的實際預測輸出與樣本的真實輸出之間的差異稱為“誤差”,模型在訓練集上的誤差稱為“訓練誤差”,在新樣本上的誤差稱為“泛化誤差”。我們希望得到在新樣本上表現好的學習器,也就是泛化誤差小的學習器,但是并不是泛化誤差越小越好,我們應該盡可能出訓練樣本中學出適用于所有潛在樣本的“普遍規律”,然而模型把訓練樣本學的太好,很可能把訓練完本自身的特點當做所有潛在樣本都具有的一般性質,這樣就導致了泛化性能下降,這種現象稱為“過擬合”,相對立的是“欠擬合”,是指訓練樣本的一般性質尚未學好。欠擬合比較容易克制,例如在決策樹學習中擴展分支、在神經網絡中增加訓練輪數,然而過擬合是無法避免的,我們所能做的就是盡量“緩解”,在現實生活中,我們往往有有多種學習算法可供選擇,對于同一算法,當使用不同參數配置時,也會產生不同的模型。

評估方法

通過“訓練集”訓練出機器學習模型,通過“測試集”來測試模型對新樣本的判別能力,然后以測試集上的“測試誤差”作為泛化誤差近似,當需要注意的是,測試集應該盡可能與測試集互斥,即測試樣本盡量不在訓練樣本中出現、未在訓練過程中使用。解釋為什么(老師出了10道習題供同學們練習,考試時老師又用同樣的這10道題作為考題,這個考試成績是否能反應出同學們真實情況,機器學習的模型是希望得到泛化能力強的模型,獲得舉一反三的能力)。

我們一共包含m個樣例的數據集D={(x1,y1),{x2,y2}...,(xm,ym)}},既要訓練,又要測試,我們通常對D進行適當的處理,從中產出訓練集S和測試集T。

留出法

“留出法”直接將數據集D劃分為兩個互斥的集合,其中一個集合作為訓練集S,另一個作為測試集T,D=S∪T,S∩T=? 需要注意的是,訓練/測試的劃分要盡可能的保持數據的一致性,避免應數據的劃分過程引入額外的偏差而對最終結果產生影響,也就是兩個集合中樣本類別比例要相似,這種保留類別比例的采樣方式稱為“分層采樣”。可即使是這樣,仍然存在多種劃分方式, 例如可以把D中的樣本排序,然后把前350個正例放到訓練集中,也可以把最后350個正例放到訓練集中,.....這不同的劃分將導致不同的訓練/測試集,模型估計必然會有偏差,

因此,單次使用留出法得到的估計結果往往不夠穩定可靠,在使用留出法時,一般要采用若干次隨機劃分、重復實驗取平均值作為留出法的結果。此外我們使用留出法對數據集D進行劃分,會有一個很尷尬的局面,當訓練集S過多,訓練出的模型可能更加接近用D訓練出的結局,但是由于測試集T太少,評估結果不夠穩定精確;若令訓練集T的樣本數過多,這訓練出的模型和用整個數據集D訓練出的模型相差就更加大了,這個問題沒有完美的解決方法,常見做法是將2/3~4/5的樣本用于訓練。

交叉驗證法

“交叉驗證法”先將數據集D劃分為k個大小相似的互斥子集,即 D = D1∪D2....∪Dk, Di∩ Dj= ?(i≠j),每個子集 Di都盡可能保持數據分布的一致性,即從D中通過分層采樣得到。然后,每次用k-1 個子集的并集作為訓練集,其余的那個子集作為測試集;這樣就可獲得k組訓練/測試集,從而可進行k 次訓練和測試,最終返回的是這k 個測試結果的均值。通常把交叉驗證法稱為“k折交叉驗證”。

與留出法類似,k折交叉驗證要隨機使用不同的劃分重復p次,最終的評估結果是這p 次k 折交叉驗證結果的均值。

“留一法”是數據集D包含m個樣本,若令 k=m,得到交叉驗證的一個特例,留一法不收隨機樣本劃分方式的影響,劃分方式為m個子集,每個子集一個樣本,使得訓練集和初始數據集只少一個樣本,所以被訓練出的模型很接近實際的評估模型,但是留一法也有缺點,當數據集m很大的時候,根本無法承受訓練m個模型的計算(m等于一百萬)。

自助法

給定包含m個樣本的數據集D,我們對它進行采樣產生數據集D': 每次隨機從D中挑選一個樣本7,將其拷貝放入D' 然后再將該樣本放回初始數據集D中,使得該樣本在下次采樣時仍有可能被采到,這個過程重復執行m 次后,我們就得到了包含m個樣本的數據集D',這就是自助采樣的結果,顯然,D 中有一部分樣本會在D'中多次出現,而另一部分樣本不出現.可以做一個簡單的估計,樣本在m 次采樣中始終不被采到的概率是取極限得到

即通過自助來樣,初始數據集D 中約有36.8% 的樣本未出現在采樣數據集D'中.于是我們可將D' 用作訓練集, D\D' 用作測試集;這樣實際評估的模型與期望評估的模型都使用m個訓練樣本,而我們仍有數據總量約1/3 的、沒在訓練集中出現的樣本用于測試.這樣的測試結果,亦稱"包外估計"

自助法在數據集較小、難以有效劃分訓練/測試集是很有用;此外,自助法產生的數據集改變了初始數據集的分布,這會引起估計偏差,因此在數據量足夠大的時候還是留出法和交叉驗證法更常用一些。

調參與最終模型

在進行模型評估與選擇的時候,除了要對使用學習算法進行選擇,還需對算法參數進行設定,這就是常說的“參數調節”簡稱“調參”。對每種參數配置都訓練出模型,然后把最好的模型作為結果,但是對每種參數訓練出模型是不可行的,現實中常用的做法,是對每個參數選定一個范圍和變化步長,例如[0,0.2],步長選定0.05,則實際要評估的參數為5個,但即便是這樣同樣是不可行的,假設一個算法有3個參數,每個參數有5個候選參數,那么一共需要考慮53=125個模型,參數調的不好往往直接影響模型的關鍵性能。

這就需要在計算開銷和性能估計中進行折中考慮。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4762

    瀏覽量

    100535
  • 機器學習
    +關注

    關注

    66

    文章

    8377

    瀏覽量

    132406
收藏 人收藏

    評論

    相關推薦

    機器學習模型評估指標

    機器學習模型指標在機器學習建模過程中,針對不同的問題,需采用不同的模型
    發表于 09-06 12:51 ?1047次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>模型</b><b class='flag-5'>評估</b>指標

    三種模型評估方式

    [R - ml] 模型評估
    發表于 10-09 12:39

    常用的FBAR模型有哪三種?

    常用的FBAR模型有哪三種?
    發表于 03-11 06:16

    部署基于嵌入的機器學習模型

    還需要處理模型的更新。模型更新的速度甚至可以非常高,因為模型需要定期地根據最新的數據進行再訓練。  本文將描述一更復雜的機器
    發表于 11-02 15:09

    三種電路仿真軟件比較及器件模型加入方法

    摘要:在比較了ORCAD/PSPICE,PROTEL,Electronics Workbench三種仿真軟件各自特點的基礎上,介紹了把基于SPICE語言的器件模型加入三種軟件的方法,實
    發表于 05-10 09:03 ?95次下載

    噪聲系數測量的三種方法

    噪聲系數測量的三種方法 本文介紹了測量噪聲系數的三種方法:增益法、Y
    發表于 05-07 13:38 ?2143次閱讀

    機器學習模型評估和優化

    監督學習的主要任務就是用模型實現精準的預測。我們希望自己的機器學習模型在新數據(未被標注過的)上取得盡可能高的準確率。換句話說,也就是我們希
    發表于 10-12 15:33 ?0次下載
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>之<b class='flag-5'>模型</b><b class='flag-5'>評估</b>和優化

    NLP的介紹和如何利用機器學習進行NLP以及三種NLP技術的詳細介紹

    本文用簡潔易懂的語言,講述了自然語言處理(NLP)的前世今生。從什么是NLP到為什么要學習NLP,再到如何利用機器學習進行NLP,值得一讀。這是該系列的第一部分,介紹了三種NLP技術:
    的頭像 發表于 06-10 10:26 ?7.7w次閱讀
    NLP的介紹和如何利用<b class='flag-5'>機器</b><b class='flag-5'>學習</b>進行NLP以及<b class='flag-5'>三種</b>NLP技術的詳細介紹

    機器學習三種交叉驗證

    訓練集用來訓練模型,驗證集用于模型的選擇,而測試集用于最終對學習方法評估
    的頭像 發表于 03-15 16:30 ?2378次閱讀

    機器學習模型評估與選擇詳細資料說明

    本文檔的主要內容詳細介紹的是機器學習模型評估與選擇詳細資料說明。
    發表于 03-24 08:00 ?0次下載
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的<b class='flag-5'>模型</b><b class='flag-5'>評估</b>與選擇詳細資料說明

    機器學習模型評估的11個指標

    建立機器學習模型的想法是基于一個建設性的反饋原則。你構建一個模型,從指標中獲得反饋,進行改進,直到達到理想的精度為止。評估指標解釋了
    的頭像 發表于 05-04 10:04 ?3417次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>模型</b><b class='flag-5'>評估</b>的11個指標

    三種學習模式在于深度學習的未來

    提出來。不過,總的來說,現代深度學習可以分為三種基本的學習范式。每一都有自己的學習方法和理念,提升了
    的頭像 發表于 10-23 09:37 ?2141次閱讀
    這<b class='flag-5'>三種</b><b class='flag-5'>學習</b>模式在于深度<b class='flag-5'>學習</b>的未來

    深度學習三種學習模式介紹

    深度學習是一個廣闊的領域,它圍繞著一形態由數百萬甚至數十億個變量決定并不斷變化的算法——神經網絡。似乎每隔一天就有大量的新方法和新技術被提出來。不過,總的來說,現代深度學習可以分為
    的頭像 發表于 10-23 14:59 ?1.3w次閱讀
    深度<b class='flag-5'>學習</b>的<b class='flag-5'>三種</b><b class='flag-5'>學習</b>模式介紹

    如何評估機器學習模型的性能?機器學習的算法選擇

    如何評估機器學習模型的性能?典型的回答可能是:首先,將訓練數據饋送給學習算法以學習一個
    發表于 04-04 14:15 ?967次閱讀

    靜電放電ESD三種模型及其防護設計

    點擊關注,電磁兼容不迷路。靜電放電ESD三種模型及其防護設計ESD:ElectrostaticDischarge,即是靜電放電,每個從事硬件設計和生產的工程師都必須掌握ESD的相關知識。為了定量
    的頭像 發表于 09-15 08:02 ?3256次閱讀
    靜電放電ESD<b class='flag-5'>三種</b><b class='flag-5'>模型</b>及其防護設計