精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于學習的數據增強策略擴充你的數據集!

nlfO_thejiangme ? 來源:lq ? 2019-08-02 15:00 ? 次閱讀

數據對于深度學習來說至關重要,而數據增強策略對于提升訓練樣本數據量、改善模型穩定性和魯棒性,提高對于真實世界的適應性和泛化性具有重要的作用。

雖然在圖像分類中數據增強有著廣泛的使用,但將數據增強用于目標檢測的系統性研究還較少。此外由于目標檢測數據的標記成本比圖像分類更高,數據增強策略在有限數據的情況下除了能提高模型表現同時還能節省數據成本。

來自谷歌的研究人員針對目標檢測任務提出了一種基于學習的數據增強策略,通過在訓練數據上進行增強策略搜索和驗證集的性能測試來尋找最優的數據增強方法,有效地提升了模型的表現,同時學習到的數據增強策略對于不同數據、基礎網絡和模型架構都具有效的泛化性和適應性。值得一提的是,文章的作者來自提出著名的神經架構搜索及其相關方法的研究團隊。

通用高效的目標檢測數據增強策略

數據增強廣泛是機器學習中常用的數據處理手段,不同的數據集通常會利用針對性的數據處理手段來處理。例如MNIST大多使用尺度、旋轉和平移的操作,也有加入顏色、噪聲等變換,而針對自然圖像,更多采用進行和隨機裁剪的方法來進行。還包括以對象為中心的裁剪、針對圖像片的增減和變換等,但這些方法大都針對特定的數據來處理并集中于圖像分類問題。

但由于數據標記的成本很高,數據增強對于目標檢測有著更為重要的實際意義。由于目標檢測的復雜性使得有效的數據增強策略難以獲取。為了得到有效的數據增強策略并應用于目標檢測任務中,研究人員希望利用算法搜索到一套新穎的檢測數據增強策略,并能夠有效地應用于不同的數據集、數據尺寸、基礎網絡和檢測架構上,有效提升算法的性能。

基于離散優化增強策略搜索

對于目標檢測來說通常需要考慮目標框(bounding box, bbox)與變換后圖像連續性,研究人員針對bbox內部的圖像提出了一系列變換,同時探索了圖像整體變化時如何調整bbox的策略。通過定義一系列子策略集和多個圖像操作變換,最終將這一問題歸結為離散空間中的優化問題來進行求解。首先研究人員將圖像增強策略定義為K個子策略的無序集合,在訓練時從中隨機選取策略對圖像進行數據增強。而其中每一個策略則包含了N個圖先變換,這些圖像變換將依次作用于被增強的數據,研究的目的在于從中搜索出最有效的策略。這些變量共同定義了一個離散優化問題的搜索空間,針對目標檢測任務的數據增強,研究人員將設置K=5,N=2。其中搜索空間總共包含了五個子策略,每個子策略包含了2種圖像操作,而每個操作同時包含了這個操作對應的概率p和操作的具體數值m兩個參數。這里的概率定義的增強策略在數據樣本上進行的隨機性,而m則定義了增強的幅度。

具體來說,研究人員從實驗中總結了22中有利于檢測的數據增強算法,分別是顏色操作、幾何變換和bbox操作。

顏色操作:針對圖像的顏色通道進行操作,包括直方圖均衡、對比圖調整和亮度調整等;

幾何操作:對于圖像進行幾何變換,包括位置變換,bbox的大小和位置、旋轉、剪切變換等,需要指出的是在進行幾何變換時需要對bbox進行調整;

bbox操作:僅針對bbox內部的內容進行操作,而不改變外部的背景,可以綜合使用前面的顏色和幾何變換。

在使用過程中,研究人員將每種操作的幅度都歸一化到[0,10],對應L=6等間距的空間,對應概率也是一個M=6的等間距空間,這一取值平衡了強化學習算法計算的可追溯性和學習能力。

針對這樣的數值定義可以計算出每個策略需要搜索的空間包含(22LM)^2,而五個策略對應的空間為(22*6*6)^10~9.6*10^18如此大的搜索空間一定需要高效的方法才能進行有效的處理。在這篇文章中研究人員采用了基于RNN輸出空間表示離散值,同時利用RL算法來更新模型權重。其中PPO(proximal policy optimization)被用于搜索策略。RNN每次需要進行30步來預測輸出,這來自于5個子策略,每個子策略兩個操作,每個操作包含概率、幅度和操作本身三個參數,其乘積即為30。在訓練過程中,研究人員為了減小整體計算量從COCO數據集中選取了5K圖像來訓練增強算法。算法利用了ResNet-50作為主干網絡、RetinaNet檢測器來從零開始構建目標檢測器,并利用在7392張COCO子驗證集上的mAP作為獎勵信號來更新控制器迭代搜索空間參數。

這一算法需要消耗巨大的算力,在400個TPUs上訓練了48個小時完成了20K增強策略的訓練,最終得到的數據增強策略使得目標檢測得到了較大的提升,其中最好的幾個策略能夠廣泛應用到不同的數據集、大小和架構上去。

結果

訓練后的結果顯示,算法通過驗證集的測試得到最多的圖像增強操作是旋轉操作,同時圖像均衡和bbox在Y方向上的平移操作也是排名較為靠前的操作。研究人員首先將學習到的策略進行了整體評測,在Res-Net和RetinaNet檢測器上都實現了較大幅度的提升:

為了探索哪些操作對于目標檢測算法帶來的優勢較大,研究人員將增強操作拆解成了顏色、幾何與bbox相關操作,并分別測試了對于基準網絡的提升,下表顯示了不同操作疊加下對于目標檢測性能的影響。

此外研究人員還探索了不同模型下數據增強策略的有效性,并通過增加圖像分辨率和錨的數量實現了50.7mAP!

同時也在不同的數據上驗證了這一算法的有效性。研究人員還探索了用于訓練數據增強策略數據集的大小對于目標檢測算法提升的效果,雖然隨著訓練數據的增加,數據增強的效果逐漸減弱。

但這種方法針對小數據集和小物體的檢測卻具有明顯的效果。同時對于較為困難的AP75任務也有較好的表現,這意味著數據增強策略幫助算法學習到了bbox位置出更細粒度的空間細節特征,這也同時改善了小物體的檢測性能。下表中mAPs顯示了小物體檢測提升的情況。

在改進模型正則化方面,研究人員發現了訓練數據大的情況下損失會提升,同時隨著數據量的增加L2會變小,數據增強策略進一步減少了權重的衰減。研究人員發現在使用有效數據增強策略的同時,就不需要正則化技術來幫助網絡更好的訓練了。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4599

    瀏覽量

    92643
  • 機器學習
    +關注

    關注

    66

    文章

    8377

    瀏覽量

    132407
  • 數據集
    +關注

    關注

    4

    文章

    1205

    瀏覽量

    24643

原文標題:目標檢測數據不夠用?快來試試數據增強新方法!

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    #硬聲創作季 #深度學習 深度學習基礎-1.2.1 數據及其拆分

    數據深度學習
    水管工
    發布于 :2022年10月27日 17:48:02

    計算機視覺/深度學習領域常用數據匯總

    經歷總結的目前深度學習視覺領域研究人員常用數據。由于個人學識有限,難免有疏漏和不當的地方,望讀者朋友們不吝賜教。如果以上數據還不能滿足
    發表于 08-29 10:36

    深度學習中開發和測試的定義

    算法性能。換而言之,開發和測試的使命就是引導的團隊對機器學習系統做出最重要的改變?。所以應當這樣處理:合理地選擇開發
    發表于 11-30 16:58

    開發和測試應該有多大?

    的開發將無法檢測出這 0.1% 的差異。與我所遇到的機器學習問題相比,一個樣本容量僅為 100 的開發,規模太小了。通常來說,開發的規模應該在 1,000 到 10,000 個樣
    發表于 12-10 10:23

    詳解各種圖像數據增強技術

    機器學習或深度學習模型的訓練的目標是成為“通用”模型。這就需要模型沒有過度擬合訓練數據,或者換句話說,我們的模型對看不見的數據有很好的了解
    發表于 10-26 16:29

    AI技術的數據科學將面臨哪些挑戰

    “思考特性而不是算法”,這是在機器學習背景下評估數據的另一個有用方法。友情提示:數據擴充可能改善的現有模型,在某些情況下,甚至有助于緩解冷
    發表于 10-18 13:35 ?1499次閱讀

    Python在音頻(Audio)領域中,如何進行數據擴充呢?

    經典的深度學習網絡AlexNet使用數據擴充(Data Augmentation)的方式擴大數據,取得較好的分類效果。在深度
    的頭像 發表于 04-15 10:35 ?1w次閱讀

    八大機器學習數據

    網頁中也有一個搜索框來幫助用戶尋找想要的數據,還有所有數據的描述和使用示例,這些數據信息豐
    的頭像 發表于 01-18 09:52 ?7977次閱讀
    八大機器<b class='flag-5'>學習</b><b class='flag-5'>數據</b><b class='flag-5'>集</b>

    機器學習應用及數據

    本文介紹了包括圖像分類、交易預測、情感分類、推薦系統、股票預測等在內的若干個機器學習應用及數據
    的頭像 發表于 04-21 11:01 ?4075次閱讀

    研究人員們提出了PBA的方法來獲取更為有效的數據增強策略

    數據增強策略通常包括剪切、填充、翻轉和旋轉等,但這些基本策略對于深度網絡的訓練還是太簡單,在對于數據增強
    的頭像 發表于 08-02 15:56 ?5550次閱讀

    區塊鏈數據有怎樣的機器學習方法

    區塊鏈數據提供了一個與加密貨幣資產行為相關的獨特的數據宇宙,因此,為機器學習方法的應用提供了獨特的機會。
    發表于 11-26 09:49 ?885次閱讀

    如何使用機器學習來分析區塊鏈數據

    區塊鏈數據提供了一個與加密貨幣資產行為相關的獨特的數據宇宙,因此,為機器學習方法的應用提供了獨特的機會。然而,區塊鏈數據
    發表于 11-26 11:38 ?1826次閱讀

    基于圖像的數據增強方法發展現狀綜述

    基于圖像的數據增強能夠增加訓練樣本的多樣性,如通過翻轉、添加噪聲等基礎圖像處理操作或根據現有數據生成新的樣本進行數據
    發表于 03-23 17:17 ?1709次閱讀
    基于圖像的<b class='flag-5'>數據</b><b class='flag-5'>增強</b>方法發展現狀綜述

    NLP數據增強的最新綜述

    作為一種有效的策略數據增強 (data augmentation, DA) 緩解了深度學習技術可能失敗的數據稀缺情況。
    的頭像 發表于 03-16 09:13 ?764次閱讀

    PyTorch如何訓練自己的數據

    PyTorch是一個廣泛使用的深度學習框架,它以其靈活性、易用性和強大的動態圖特性而聞名。在訓練深度學習模型時,數據是不可或缺的組成部分。然而,很多時候,我們可能需要使用自己的
    的頭像 發表于 07-02 14:09 ?1328次閱讀