国产精品无码专区在线观看_久久av高潮av无码av喷吹_亚洲成āV人片在线观看_亚洲āV午夜福利精品一区

谷歌研究人員最新提出了一種自動數據增強方法，受AutoML的啟發，他們嘗試將數據增強的過程也實現自動化，使用強化學習從數據本身中找出最佳圖像轉換策略，在不依賴于生成新的和不斷擴展的數據集的情況下，提高了計算機視覺模型的性能。

計算機視覺深度學習的成功，可部分歸因于擁有大量帶標記的訓練數據——數據的質、量和多樣性提高，模型的性能也通常會增強。但是，要收集足夠多的高質量數據訓練模型來實現良好的性能，通常非常困難。

解決這個問題的一種方法，是將圖像對稱（image symmetries）硬編碼為神經網絡結構，或者，讓專家手動設計數據增強方法，比如旋轉和翻轉圖像，這些都是訓練性能良好的視覺模型常會用到的方法。

但是，直到最近，人們很少關注如何利用機器學習來自動增強現有數據。谷歌此前推出了AutoML，代替人為設計的系統組件，讓神經網絡自動設計神經網絡和優化器，得到了良好的結果。受此啟發，谷歌研究人員不禁問自己：是否也可以讓數據增強過程自動完成？

在最新公布的論文《AutoAugment：從數據學習增強策略》（AutoAugment: Learning Augmentation Policies from Data）中，谷歌的研究人員探索了一種強化學習算法，增加了現有訓練數據集中數據的數量和多樣性。直觀地說，數據增強用于教會模型有關數據域中的圖像不變性（image invariances），讓神經網絡對這些重要的對稱性保持不變（invariant），從而改善其性能。

研究人員表示，與以前使用手工設計數據增強策略的先進深度學習模型不同，他們使用強化學習從數據本身中找出最佳圖像轉換策略。結果在不依賴于生成新的和不斷擴展的數據集的情況下，提高了計算機視覺模型的性能。

訓練數據的增強

數據增強的思路很簡單：圖像具有許多對稱性，這些對稱性不會改變圖像中存在的信息。例如，狗的鏡面反射仍然是狗。這些“不變性”中的一些對人類來說顯而易見，但有很多人類很難注意到。例如，mixup方法，通過在訓練期間將圖像置于彼此之上來增強數據，從而產生改善神經網絡性能的數據。

左圖：來自ImageNet數據集的原始圖像。右圖：通過常用數據增強方法，水平翻轉后的相同的圖像。

AutoAugment是為計算機視覺數據集設計自定義數據增強策略的自動方式，例如，AutoAugment能指導基本圖像轉換操作的選擇，例如水平/垂直翻轉圖像，旋轉圖像，更改圖像顏色等。AutoAugment不僅可以預測要合并的圖像轉換，還可以預測所使用轉換的每個圖像的概率和大小，從而不總是以相同的方式操作圖像。AutoAugment能夠從2.9 x 10^32大的搜索空間中，選擇出圖像轉換的最佳策略。

AutoAugment 根據所運行的數據集學習不同的轉換。例如，對于包含數字自然場景的街景(SVHN)圖像，AutoAugment 的重點是像剪切和平移這樣的幾何變換，它們代表了數據集中常見的失真現象。此外，由于世界上不同的建筑和房屋編號材料的多樣性，AutoAugment機構已經學會了完全反轉原始SVHN數據集中自然出現的顏色。

左：來自SVHN數據集的原始圖像。右：相同的圖像AutoAugment。在這種情況下，最優轉換是剪切圖像并反轉像素顏色的結果。

在CIFAR-10和ImageNet上，AutoAugment 不使用剪切，因為這些數據集通常不包含剪切對象的圖像，也不完全反轉顏色，因為這些轉換將導致不真實的圖像。相反，AutoAugment r的重點是稍微調整顏色和色調分布，同時保持一般的色彩屬性。這說明在CIFAR-10和ImageNet中對象的實際顏色是重要的，而在SVHN中只有相對的顏色是重要的。

結果

我們的AutoAugment 算法發現了一些最著名的計算機視覺數據集的增強策略，這些數據集被納入到神經網絡的訓練中，會產生最先進的精確性。通過增強ImageNet數據，我們獲得了83.54％ top1精度的新的最新精度，在CIFAR10上我們獲得了1.48%的錯誤率，這比科學家設計的默認數據增強提高了0.83%。在SVHN上，我們將最先進的誤差從1.30%提高到1.02%。重要的是，AutoAugment策略被發現是可轉移的——為ImageNet數據集找到的策略也可以應用于其他視覺數據集（斯坦福汽車、FGVC-Aircraft等)，從而改善神經網絡的性能。

我們很高興地看到，我們的AutoAugment算法在許多不同的競爭性計算機視覺數據集上都達到了這樣的性能水平，并期待著未來在更多的計算機視覺任務中，甚至在音頻處理或語言模型等其他領域，都能應用這種技術。在本文的附錄中包含了性能最好的策略，以便研究人員可以使用它們來改進他們在相關視覺任務上的模型。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4765

瀏覽量
100550
計算機視覺

計算機視覺

+關注

關注
8

文章
1696

瀏覽量
45929
機器學習

機器學習

+關注

關注
66

文章
8381

瀏覽量
132428

原文標題：谷歌放大招！數據增強實現自動化

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關注！文章轉載請注明出處。

反向強化學習的思路

強化學習的另一種策略（二）

發表于 04-03 12:10

深度強化學習實戰

內容2:課程一： TensoRFlow入門到熟練：課程二：圖像分類：課程三：物體檢測：課程四：人臉識別：課程五：算法實現：1、卷積神經網絡CNN2、循環神經網絡RNN3、強化學習DRL4、對抗性生成

發表于 01-10 13:42

強化學習在RoboCup帶球任務中的應用劉飛

強化學習在RoboCup帶球任務中的應用_劉飛

發表于 03-14 08:00 ?0次下載

將深度學習和強化學習相結合的深度強化學習DRL

深度強化學習DRL自提出以來，已在理論和應用方面均取得了顯著的成果。尤其是谷歌DeepMind團隊基于深度強化學習DRL研發的AlphaGo，將深度強化學習DRL成推上新的熱點和高度，成為人工智能歷史上一個新的里程碑。因此，深

發表于 06-29 18:36 ?2.8w次閱讀

基于強化學習的IEEE 802.15.4網絡區分服務策略

為了彌補IEEE 802.15.4協議原有區分服務機制的不足，提出了一種基于BCS（backoff counter scheme）與強化學習的區分服務策略。從終端節點出發，在原優先級區分服務策

發表于 03-09 16:02 ?0次下載

人工智能機器學習之強化學習

強化學習是智能系統從環境到行為映射的學習，以使獎勵信號（強化信號）函數值最大，強化學習不同于連接主義學習

發表于 05-30 06:53 ?1403次閱讀

什么是強化學習？純強化學習有意義嗎？強化學習有什么的致命缺陷？

強化學習是人工智能基本的子領域之一，在強化學習的框架中，智能體通過與環境互動，來學習采取何種動作能使其在給定環境中的長期獎勵最大化，就像在上

發表于 07-15 10:56 ?1.8w次閱讀

如何使用深度強化學習進行機械臂視覺抓取控制的優化方法概述

針對提高視覺圖像特征與優化控制之間契合度的問題，本文提出一種基于深度強化學習的機械臂視覺抓取控制優化方法，可以自主地從與環境交互產生的視覺圖像中

發表于 12-19 15:23 ?22次下載

對NAS任務中強化學習的效率進行深入思考

在一些情況下，我們會用策略函數（policy，總得分，也就是搭建的網絡在測試集上的精度（accuracy），通過強化學習（Reinforcement Learning）這種通用黑盒算法來優化。然而，因為強化學習

發表于 01-28 09:54 ?5010次閱讀

強化學習在智能對話上的應用介紹

本文主要介紹深度強化學習在任務型對話上的應用，兩者的結合點主要是將深度強化學習應用于任務型對話的策略學習上來源：騰訊技術工程微信號

發表于 12-10 19:02 ?1011次閱讀

機器學習中的無模型強化學習算法及研究綜述

根據真實環境的狀態轉移數據來預定義環境動態模型，隨后在通過環境動態模型進行策略學習的過程中無須再與環境進行交互。在無模型強化學習

發表于 04-08 11:41 ?11次下載

《自動化學報》—多Agent深度強化學習綜述

突破.由于融合了深度學習強大的表征能力和強化學習有效的策略搜索能力,深度強化學習已經成為實現人工智能頗有前景的學習范式.然而,深度

發表于 01-18 10:08 ?1572次閱讀

模擬矩陣在深度強化學習智能控制系統中的應用

訊維模擬矩陣在深度強化學習智能控制系統中的應用主要是通過構建一個包含多種環境信息和動作空間的模擬矩陣，來模擬和預測深度強化學習智能控制系統在不同環境下的表現和效果，從而優化控制策略和提

發表于 09-04 14:26 ?546次閱讀

通過強化學習策略進行特征選擇

更快更好地學習。我們的想法是找到最優數量的特征和最有意義的特征。在本文中，我們將介紹并實現一種新的通過強化學習策略的特征選擇。我們先討論強化學習，尤其是馬爾可夫決策

發表于 06-05 08:27 ?324次閱讀

如何使用 PyTorch 進行強化學習

的計算圖和自動微分功能，非常適合實現復雜的強化學習算法。 1. 環境（Environment）在強化學習中，環境是一個抽象的概念，它定義了智能體（agent）可以執行的動作（actions）、觀察到

發表于 11-05 17:34 ?227次閱讀