精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

研究人員們提出了PBA的方法來獲取更為有效的數據增強策略

nlfO_thejiangme ? 來源:lq ? 2019-08-02 15:56 ? 次閱讀

近年來深度學習模型的飛速發展離不開龐大的數據體量和多樣化的數據收集。收集大量的、豐富的數據是十分耗時耗力的工作,而數據增強則為研究人員們提供了另一種增加數據多樣性的可能,無需真正收集數據即可得到較為豐富多樣的訓練數據。來自伯克利的研究人員們提出了PBA(Population Based Augmentation)的方法來獲取更為有效的數據增強策略,并在實現同樣效果下實現了1000x的加速。

數據增強

數據增強策略通常包括剪切、填充、翻轉和旋轉等,但這些基本策略對于深度網絡的訓練還是太簡單,在對于數據增強策略和種類的研究相較于神經網絡的研究還是太少了。

一些常見的數據增強方法

最近谷歌針對這方面進行了深入的探索性的研究,提出了AutoAugment方法并在CIFAR-10數據集上取得了很好的成果。

這篇論文利用了強化學習等方法來搜索更好的數據增強策略,基于RNN的控制器從搜索空間中預測增強策略,而一個固定架構的子網絡則用于在增強的數據上進行訓練收斂到精度R,最后利用精度R來作為獎勵使得控制器尋求更好的數據增強策略。

AutoAugment引入了16種幾何、色彩變換并從中選擇兩種以固定的幅度來對每一批數據進行增強,所以高性能的增強方法可以通過強化學習直接由模型從數據中學習到。但這種方法的弊端在于它需要訓練一萬五千個模型到收斂,以便為強化學習模型收集足夠的樣本來學習數據增強策略。在樣本間的計算不能共享,使得它要耗費15000個P100計算時來在ImageNet上實現較好的效果,即使在較小的CIFAR-10上也要消耗5000個GPU時(這意味著需要7500-37500美元的訓練費用才能得到較好的數據增強策略)。如果可以將先前訓練的策略遷移或共享到新的訓練中去,就能更高效地實現數據增強策略的搜索與獲取。

PBA算法

為了提高算法的效率,來自伯克利的研究人員提出了PBA算法,可以在比原算法少三個數量級的計算上獲得相同的測試精度。

與AutoAugment不同,這種方法在多個小模型的副本上訓練CIFAR-10數據集,只需要在Titan XP上訓練5小時即可得到較好的數據增強策略,這一策略應用到CIFAR-100,并重新訓練一個較大的網絡可以獲得十分有效的效果。與先前需要很多天的訓練相比,這種方法耗時更短且得到的效果更好。

與AutoAugment相比,新方法給出的數據增強策略在不同模型上的表現。

研究人員從DeepMind的Population Based Training算法中借鑒了一些思想,并將其應用在了數據增強策略的生成上,將訓練中當前的結果作為生成策略的基礎,使得訓練的結果可以在不同子模型中共享,避免耗時的重復訓練。

這一改進使得通常的工作站也可以訓練大型的數據增強策略算法。與AutoAugment不同,這一方法生成了一個策略調度方法而不是一個固定的策略。這意味著,在某個訓練周期,PBA生成的數據增強策略是法f(x,t),其中x是輸入圖像,t為當前的訓練周期。而AutoAugment則會在不同的子模型上生成固定的策略fi(x)。

研究人員利用了16個小的WideResNet,每一個會學習出不同的超參數計劃,而其中表現最好的調度將會被用于訓練大型的模型,并從中得出最后的測試錯誤率。

Population Based Training方法,首先將一系列小模型用于發現超參數,而后將表現最好的模型權重(exploit)與隨機搜索結合起來(explore)。這些小模型首先在目標數據集上從零開始訓練,隨后通過將高性能的超參數復制到表現欠佳的模型上實現訓練過程的復用,而后利用超參數的擾動來實現隨機探索,以獲取更好的表現。

通過這樣的方法,研究人員得以共享不同模型間的計算,并共享不同訓練階段得到的不同的目標超參數。PBA算法通過這一手段避免了需要訓練上千個模型才能獲得高性能數據增強策略的冗長過程。下圖顯示了研究人員獲取的數據增強策略:

研究人員還提供了源碼和使用實例,如果想要給自己的數據集學習出合適的數據增強策略,可以在TUNE框架下進行,只需要簡單的定義新的數據加載器即可使用。詳情請參考代碼:

https://github.com/arcelien/pba

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 控制器
    +關注

    關注

    112

    文章

    16214

    瀏覽量

    177481
  • 神經網絡
    +關注

    關注

    42

    文章

    4765

    瀏覽量

    100568
  • 深度學習
    +關注

    關注

    73

    文章

    5493

    瀏覽量

    120999

原文標題:1000倍提速!伯克利提出新的數據增強策略訓練方法,更好更快擴充數據

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    安全研究人員用短信遙控開車門

    SEC的安全研究人員聲稱已經找到一種方法來解鎖寶馬、通用、福特和現代四大汽車制造商的車門,他們實施逆向工程破解了這些汽車的遙控系統,并可以在數小時內完成一臺車的解碼
    發表于 07-29 09:43 ?1000次閱讀

    研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

    注意力模型和LSTM等方法提高計算效率或挑選重要任務,但它們的表現都不夠好。在本篇論文中,研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀,不影響讀者的主要目標。
    的頭像 發表于 01-10 12:41 ?3575次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>“Skim-RNN”的概念,用很少的時間進行快速閱讀

    Google研究人員開發增強現實顯微鏡檢測癌細胞

    Google的研究人員開發了一種增強現實顯微鏡(ARM),該顯微鏡可以從一個經過訓練的神經網絡中獲取實時數據,以檢測癌細胞,并將其顯示在查看圖像的病理學家的視野中。
    發表于 04-23 12:09 ?2237次閱讀

    斯坦福提出基于目標的策略強化學習方法——SOORL

    為了達到人類學習的速率,斯坦福的研究人員提出了一種基于目標的策略強化學習方法——SOORL,把重點放在對
    的頭像 發表于 06-06 11:18 ?5389次閱讀
    斯坦福<b class='flag-5'>提出</b>基于目標的<b class='flag-5'>策略</b>強化學習<b class='flag-5'>方法</b>——SOORL

    一種新方法來檢測這些被操縱的換臉視頻的“跡象”

    利用深度學習“換臉”合成假視頻的技術發展之快令人驚嘆,也令人深感不安。研究人員已經研究出一種新方法來檢測這些被操縱的換臉視頻,通過有效地預測眼睛的狀態,準確率達到99%。
    的頭像 發表于 07-03 09:48 ?5754次閱讀

    一種新型獲取太陽能以及如氫氣類的清潔燃料的方法

    西澳大利亞科廷大學的研究人員開發了一種低成本、環保的方法來獲取太陽能以及如氫氣類的清潔燃料。 科廷大學的研究人員在生產太陽能等清潔燃料方面取得了突破性進展,更好的向低碳經濟轉型。
    的頭像 發表于 06-07 16:58 ?2181次閱讀

    研究人員探究大腦如何控制主動傳感

    研究中的研究人員使用增強現實技術改變主動感知行為與其產生的感官反饋之間的聯系,并更多地了解該過程的工作原理。
    的頭像 發表于 12-29 15:11 ?2954次閱讀

    研究人員提出了一系列新的點云處理模塊

    為了探索這些問題的解決辦法、來自倫敦大學學院的研究人員提出了一系列新的點云處理模塊,從效率、信息共享和點云卷積操作等方面進行了研究,得到了更寬、更深、更快效率更高的點云處理網絡,讓更
    的頭像 發表于 08-02 14:44 ?3040次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>們</b><b class='flag-5'>提出了</b>一系列新的點云處理模塊

    JD和OPPO的研究人員提出了一種姿勢引導的時尚圖像生成模型

    研究人員的主要目的在于訓練一個生成模型,將模特在當前姿勢上的圖像遷移到其他的目標姿勢上去,實現對于衣著等商品的全面展示。
    的頭像 發表于 08-02 14:50 ?2521次閱讀

    研究人員提出了一種多尺度高效率的新模型FAMED-Net

    而基于學習的方法采用了數據驅動的方法來學習出圖像特征和透射率之間的關系,克服了手工選取先驗特征的不足。隨著深度學習的方法,這種方法朝著更強大
    的頭像 發表于 08-02 15:08 ?3816次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>一種多尺度高效率的新模型FAMED-Net

    Facebook的研究人員提出了Mesh R-CNN模型

    這一研究的目標是通過單張圖像輸入,對圖像中的物體進行檢測、獲取不同物體的類別、掩膜和對應的三維網格,并對真實世界中的復雜模型進行有效處理。在2D深度網絡的基礎上,研究人員改進并
    的頭像 發表于 08-02 15:51 ?3859次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>Mesh R-CNN模型

    研究人員使用聲音技術進行藥物的傳遞

    從電信技術改造而來的技術有望實現更有效的癌癥治療。墨爾本研究人員發現,藥物可以通過聲波傳遞到各個細胞中。
    發表于 03-11 09:38 ?472次閱讀

    研究人員出了一種新的基于深度學習的策略

    蘇黎世聯邦理工學院的研究人員最近推出了一種新的基于深度學習的策略,該策略可以在不需要大量真實數據的情況下在機器人中實現觸覺傳感。在arXiv
    的頭像 發表于 03-26 15:47 ?2585次閱讀

    馬來西亞研究人員提出一種評估光伏模塊不同冷卻系統有效性的新方法

    馬來西亞多媒體大學研究人員發表的一篇新論文提供了一種評估光伏模塊不同冷卻系統有效性的新方法。所提出的技術依賴于在附加冷卻的情況下測量模塊的輸出,并將其與標準測試條件下的額定功率進行比較
    發表于 04-17 15:47 ?705次閱讀

    研究人員找到了一種更好的方法來冷卻 GaN 器件

    佐治亞理工學院的研究人員開發了一種新的鍵合技術,可以改善 GaN 器件的冷卻效果,從而轉化為各種應用的更好性能,包括無線發射器、雷達和衛星設備
    發表于 08-17 15:57 ?505次閱讀
    <b class='flag-5'>研究人員</b>找到了一種更好的<b class='flag-5'>方法來</b>冷卻 GaN 器件