基于圖像的數據增強方法發展現狀綜述

摘要：

摘要: 現階段，基于深度學習的圖像處理和識別技術已經發展的十分成熟，但在某些圖像識別任務中由于深度學習技術的特點，一些深度神經網絡模型層數較多導致的學習能力較強，將圖像數據樣本中的特征學習的過于充分，使得神經網絡模型在訓練數據上出現過擬合現象。同時，基于深度學習的圖像處理算法訓練的模型的好壞與數據集的質量、規模息息相關，但由于客觀原因存在獲得的圖像數據集小、圖像質量差，樣本分布不均衡等現象。針對上述問題，研究人員提出通過使用圖像數據增強技術實現對模型的輸入數據的規模、質量和分布情況進行優化，將數據增強后的數據集用于深度學習模型將有效降低出現過擬合現象的概率。本文的主要工作是對現有的圖像數據增強技術進行討論，從傳統圖像處理方法和基于深度學習數據增強方法兩方面進行梳理總結，其中傳統圖像處理方法有幾何變換、顏色變換和像素變換;基于機器學習的圖像數據增強方法有自動數據增強方法、基于生成對抗網絡數據增強方法和基于自動編碼器和生成對抗網絡組合的數據增強方法。本文著重對圖像融合、信息刪除以及基于生成對抗網絡的圖像數據增強方法等技術進行介紹，并且對文中提出的數據增強方法的思想及其優缺點進行討論，為研究人員在不同圖像任務中利用對應的數據增強方法來優化數據集從而提高模型準確率提供研究思路。

1. 引言

隨著人工智能技術的不斷發展，基于深度學習的圖像處理技術愈發成熟，應用也越來越廣泛。由數據集驅動的人工智能技術訓練的模型往往需要巨大規模的數據集，但由于時間成本和金錢成本的限制，可能常會遇到圖像數量少、圖像質量差和類別不均衡 [1] 的情形，這給圖像識別任務帶來種種困難，數據集中圖像的質量和數量極大的影響了深度學習模型的泛化能力。由于深度學習網絡模型有著極強的學習能力，模型可能經常會將圖像數據集上數據的一般特征提取出來作為預測某一類結果的特性，這往往會導致模型在訓練集上會預測出很好的結果，而在測試集以及驗證集上的有較高的錯誤率，模型的泛化能力低 [2]。

基于圖像的數據增強能夠增加訓練樣本的多樣性，如通過翻轉、添加噪聲等基礎圖像處理操作或根據現有數據生成新的樣本進行數據集擴充、數據質量的增強。使用數據增強方法后的數據集訓練模型，以達到提升模型的穩健性、泛化能力的效果。

本文主要研究了基于圖像的數據增強技術，并對其進行歸類整理，著重介紹各類技術的特點及其解決的問題，對其存在的不足進行分析。對圖像數據增強技術待解決問題進行總結，為相關研究人員提供詳盡的技術發展狀況報告。

2. 圖像數據增強概述

2.1. 數據增強

數據增強，也叫數據增廣。數據增強方法的本質實際上是在現有的有限數據的基礎上，在不實際收集更多數據的前提下，而讓數據產生等價于更大數據量的價值，即根據現有數據樣本按照規則生成增量數據的過程。數據增強方法不僅是數據樣本量的增多，更多的是數據本身特征的“增強”。樣本數據是整體數據的抽樣，當樣本數據量足夠大時，樣本的分布情況和總體的分布情況應相似。但由于客觀原因收集的樣本數據不夠完整，這時則可通過數據增強方法生成與真實數據分布更加相似的新樣本的數據;深度學習網絡模型擁有極強的學習能力，因此學習到的一些無用的信息特征對最終的結果會產生負面影響，而數據增強技術可實現按照需求針對數據施加約束來增加先驗知識的前置過程，如將一些信息刪除或補全，來減少負面影響對處理圖像任務的模型性能的影響。

現階段數據增強方法的使用方式主要被分為兩種：離線增強和在線增強。離線增強是指對數據集執行一次性轉換，該操作可成倍增加數據樣本的數量。使用數據增強方法產生的樣本數量為增強因子數與原始數據樣本量的乘積。離線增強由于一次性處理全部數據集，因此適用于較小的數據集。在線增強使在獲取批量的數據后就對其進行數據增強操作，隨后增強后的數據就被送入機器學習模型進行訓練，由于其批量處理的特性，因此一般適用于大數據集。

2.2. 基于圖像的數據增強的分類

數據增強方法主要有作用于圖像的和作用于文本的兩類，本文主要介紹基于圖像的數據增強方法 [3]，根據是否使用機器學習技術，其被分為兩個部分進行討論：基于傳統圖像處理技術的圖像數據增強和基于機器學習的圖像數據增強技術，其中基于傳統圖像處理技術的圖像數據增強中將介紹針對圖像數據本身的幾何變換、色彩變換和像素變換?；跈C器學習的圖像數據增強技術將介紹自動數據增強技術、基于生成對抗網絡數據增強技術和基于自動編碼器和生成對抗網絡組合的數據增強方法，這些方法都是使用機器學習相關理論實現的圖像生成、圖像轉換模型。本文對于現有的圖像數據增強方法分類如圖1。

3. 傳統的圖像數據增強方法

傳統的圖像數據增強方法，通常使用圖像處理技術 [4] 來完成數據集的擴充和圖像質量優化，大致分為幾何變換、色彩變換、像素變換三大類。

3.1. 幾何變換

針對數據集進行空間幾何變換，常常會存在改變圖像原始的標簽信息或者增加一些不相關數據的情況，這稱之為不安全的轉換。例如對文字的識別任務中，對圖像進行翻轉操作是沒有意義的。但對于存在位置偏差的數據集，用幾何變換技術可以很好解決問題。但在真實情況下，訓練集與測試集的數據的差異十分復雜，除了移位旋轉等操作外，還包括其他復雜變換。因此幾何變換的應用范圍相對有限。

3.1.1. 圖像翻轉與旋轉

圖像翻轉操作包括對圖片進行垂直和水平翻轉，其中垂直翻轉實現需要水平翻轉后再圖像進行180?旋轉處理，水平翻轉比垂直翻轉應用更為廣泛。這種技術的優點是易于實現，此外圖像翻轉在CIFAR-10數據集上具有較好的效果，但對文本識別的數據集，如MNIST，使用圖像翻轉會更改其標簽信息 [5]。

Figure 1. Classification of image data augmentation methods

圖1. 基于圖像的數據增強方法分類

進行圖像旋轉后得到的圖像與原始圖像的維數是否相同取決于圖像的旋轉度數以及原始圖像的形狀。當長方形的圖像旋轉180?或者正方形的圖像旋轉90?、180?、270?時，旋轉后的圖像與原始圖像能夠保持一致的維數。與圖像翻轉操作一樣，在特定的數據集上，例如文本識別數據集MNIST，其圖像變換的安全性取決于圖像的旋轉度數，隨旋轉度數的增加，轉換后的圖片不在保留原標簽信息。

3.1.2. 圖像剪裁與縮放

圖像的隨機剪裁可視為從原始圖像上進行隨機抽樣，再將抽樣獲得的圖像數據樣本恢復為原始圖像大小。

圖像縮放分為向外縮放和向內縮放。圖像縮放與圖像剪裁不同的是向外縮放會得到比原始圖像更大尺寸的圖像，再從中剪裁出與原始圖像大小相同的圖像，向內縮放則縮小原始圖像的大小，并針對其超出邊界的部分進行填充操作從而獲得與原始圖像尺寸一致的圖像。

3.1.3. 圖像移位與邊緣填充

圖像移位是指不改變圖像的尺寸而將圖像在以坐標軸為移動參考進行橫軸和縱軸的移動，并針對邊緣部分進行填充處理。在進行了圖像移位操作后，大部分的圖像數據中對于圖像任務有用的部分將位于圖像的邊緣部分，因此深度學習模型在進行計算機視覺任務訓練時會將關注焦點轉移到任意位置，而不是僅僅針對圖像中心區域的學習，這種操作能夠有效的提高模型的魯棒性。

在對圖像數據樣本進行旋轉、移位、縮放等操作后，需要將變換后的圖像恢復到與原始圖像尺寸一致的大小，恢復的過程通過對于圖像的邊緣部分進行填充操作實現。常用的圖像填充方法包括：常數填充，使用常數值對圖像的邊緣部分進行填充，這種填充方式適用于單色背景的圖像數;邊界值填充，在原始圖像邊界的外部填充原始圖像的邊界的像素值，此方法適用于短距離移位。

3.2. 色彩變換

3.2.1. 色彩空間

數字圖像數據通過使用長、寬和通道來表示數據。

常用的色彩空間包括：

1) 通過RGB通道的變化和疊加得到不同顏色的RGB色彩空間;

2) YUV色彩空間，其中Y表示亮度，UV表示色度;

3) HSV顏色模型，H表示色調，S表示飽和度，V表示明暗程度。

此外還包括I1I2I3，L*a*b* [6] 和YcbCr [7]，在這些顏色空間中，HSV顏色空間是直觀的，其組成部分可以很容易地與物理世界相關聯 [8]。

在色彩通道上進行圖像亮度調節以及色度調劑是數據增強的一種有效方式。通常情況下，采集到的圖像數據的亮度覆蓋范圍不足，為達到深度學習對亮度魯棒性的基本要求，進行亮度轉換操作成為基于色彩空間的數據增強技術中最常用的一種方法。在圖像數據中，亮度偏暗的圖像，亮度方差也更小，從而整體的亮度范圍被壓縮。Gamma變換通過非線性變換將過亮或過暗的圖片進行調整。直方圖均衡化是更加高級的色彩空間增強方式，對對比度相近的圖像使用該技術可增強局部的對比度而不影響整體的對比度，這種方式對過亮或過暗的圖像數據能夠實現有效的數據增強。

3.2.2. 色彩空間轉換

色彩空間轉換是色彩特征提取的一種非常有效的方式。不同的色彩空間表示形式雖各有特性，但由于其同構性，可以互相轉換。圖像通常位于三維RGB顏色空間中，但RGB顏色空間在感知上不均勻，顏色的接近度并不表示顏色相似性。色彩空間轉換通過將圖像在RGB、HSV、LAB等不同的顏色空間上轉換，使以不同的方式對每個分量進行加權，對于不同的數據集，通常需要選擇合適的顏色空間轉換來提高模型的性能。

色彩空間轉換的缺點除了會消耗大量內存空間和時間，其也會產生不好的效果，例如人臉識別需要的關鍵信息使黑白黃，但若出現大量紅綠等顏色信息，則是不合理的。此外，顏色空間轉換的圖像增強效果是有限的，雖然比幾何變換更具多樣性，但不恰當的使用可能會使模型發生欠擬合。

Ze Lu等人 [9] 提出一種用于面部識別任務的色彩空間框架，提出色彩空間LuC1C2其通過比較RGB系數的顏色傳感器屬性選擇Lu亮度分量，通過RGB顏色空間的色度子空間和協方差分析來確定C1C2顏色分量的變換向量的方向。在AR、Georgia Tech、FRGC和LFW人臉圖像數據庫上實驗，確定了色彩空間LuC1C2具有更好的人臉識別性能。并且通過將LFW和FRGC數據庫上提取的LuC1C2顏色空間中的CNN特征與簡單的原始像素特征相結合，顯著提高面部驗證性能。

3.3. 像素變換

3.3.1. 噪聲

圖像噪聲是指在原始圖像上隨機疊加一些孤立的能夠引起較強的視覺效果像素點或像素塊，以擾亂圖像的可觀測信息，使其能夠更好的提高卷積神經網絡模型的泛化能力。常見的噪聲有：椒鹽噪聲、高斯噪聲、Coarse Dropout、Simplex Noise Alpha、Frequency Noise Alpha。它們都是以不同的方式生成以不同數值填充的不同大小像素遮掩點，再與原圖混合，以擾亂原始圖像的一些特征。

3.3.2. 模糊

模糊的本質上可視為對原始圖像進行卷積操作，常用的方法是高斯模糊，該方法服從的卷積核矩陣服從二維正態分布，以減少各像素點值的差異從而降低細節層次，使圖像數據的像素平滑化，達到模糊圖片的效果。模糊半徑越大，圖像就越模糊。

3.3.3. 圖像融合

圖像融合技術，通過求兩張圖像的像素值的均值將兩張圖片混合在一起，或者是隨機裁剪圖像并將裁剪后的圖像拼接在一起形成新圖像。當混合來自整個訓練集的圖像而不是僅來自同一類別的實例的圖像時，可以獲得更好的結果。圖像融合方法從人的視角看毫無意義，但從實驗的角度上觀察，確實能夠提升精度。

1) SMOTE [10]

采集到的數據集常存在的問題是樣本類別不平衡問題，樣本類別之間的較大差距會影響分類器的分類性能。SMOTE方法提出以小樣本類別合成新的樣本來解決樣本不平衡問題，該方法將提取的圖像特征映射到特征空間，確定好采樣倍率后，選取幾個最相鄰的樣本，從中隨機選取一個連線，并在連線上隨機選取一點作為新樣本點，重復至樣本均衡。杜金華 [11] 在研究中提出使用基于 SMOTE 算法的上采樣法分別對原始圖像數據集進行增強，實驗表明花崗石識別準確率有所提高。

2) MIXUP [12]

ERM方法會在各個類間形成明確的決策邊界，而Mixup方法是一種基于線性過渡的數據增強的方法，使用mixup能夠使得數據樣本之間像素點是漸變的，使樣本分類邊界模糊化，使得非0即1的預測變為較為平滑的預測效果，抑制模型在進行預測分類時的不穩定性，增強模型的泛化能力。這種方法從訓練數據中隨機抽取兩條數據將抽取到的圖像數據的像素值進行符合Beat分布的融合比例的線性加權求和，同時將樣本對應的One-hot向量標簽也對應加權求和，預測生成的新樣本與加權求和后的標簽的損失，進行反向求導并更新參數，同時抽取批量數據并進行隨機打散后進行加權求和。在CIFAR、 ImageNet圖像分類數據集語音數據集中使用該方法能夠實現模型性能的提升，并且降低模型對不完整標簽的記憶。mixup方法盡管再在程上取得很好地效果，但缺乏理論支撐，且該方法需要較長的時間才能收斂出較好的結果。ERM方法與Mixup方法的對比如圖2所示。

Figure 2. Comparison of ERM and Mixup

圖2. ERM與Mixup對比

3) CUTMIX [13]

CutMix是一種改進的隨機擦除策略，隨機擦除用一塊矩形掩碼覆蓋原始圖像，實現擦除圖像上的一部分像素信息，但其缺點是減少了訓練圖像上的包含信息的像素比例，并且需要大量的計算，較為耗時。CutMix方法將隨機選中的區域填充其他圖像的補丁區域。這種方法與Mixup方法相比，改進了混合圖像后，人眼無法主觀辨別圖像標簽的情形。在擦除區域添加其他樣本信息，進一步增強模型定位能力。CutMix在CIFAR和ImageNet分類任務以及對ImageNet上的弱監督的本地化任務領先于最新的數據增強策略，同時，在Pascal檢測和MS-COCO圖像字幕基準測試中獲得了性能提升。這種方法改進了針對輸入損壞及其模型失配檢測性能的模型魯棒性。

4) Sample Pairing [14]

Sample Pairing方法常用于圖像分類任務中的數據增強，該方法首先從訓練集中隨機選擇兩張圖片，與Mixup方法不同的是，隨機選擇圖像的方式是從訓練集中隨機抽取兩張圖片并分別進行基礎數據增強操作(如隨機翻轉等)處理后，再經像素取平均值，最后疊加合成一個新的樣本。而標簽為原樣本標簽中的一種，理論上新樣本數量平方增加。這種方法能夠顯著提高所有測試數據集分類準確性。使用GoogleNet的ILSVRC 2012數據集的top-1錯誤率從33.5%降低到29.0%，而在CIFAR-10數據集中則從8.22%降低到6.93%。當訓練集中的樣本數量非常小時，SamplePairing技術大大提高了模型預測的準確性。因此該技術對于訓練數據量有限的任務(例如醫學成像任務)更有價值。SamplePairing方法實現簡單，效率大大增加，但缺少相應的理論支撐。

3.3.4. 信息刪除

1) 隨機擦除 [15]

隨機擦除方法與添加噪聲方法相似，通過隨機選取圖像中的矩形區域，并使用隨機像素值對其遮蓋。該技術可以很容易嵌入大部分卷積神經網絡模型中。隨機擦除的好處在于迫使模型去學習有關圖像的更多描述性特征，從而防止過擬合某個特定視覺特征，確保網絡關注整個圖像，而不只是其中的一部分。隨機擦除的缺點是不一定會保留標簽(例如文本8->6)。Zhun Zhongy等人將隨機擦除方法用于圖像分類、物體檢測和人員重新識別任務，并通過該方法實現了性能的提升。使用隨機擦除方法進行大量實驗，在CIFAR、PASCAL VOC 2007、Fast-RCNN、re-ID、Market-1501、DukeMTMC-reID上表現出良好的效果。

2) CUTOUT [16]

與隨機擦除相似，Cutout是在圖像上的隨機位置使用一定大小的正方形path進行0-mask剪裁。蔣蕓等人提出了激活區域處理算法(Ac tivation Region processing algorithm) [17] 并將其嵌入到CNN模型，對網絡卷積層的特征圖進行遮蓋處理，進一步提高模型的性能，降低過擬合的風險。該方法從卷積神經網絡中提取出較為關鍵的局部特征的卷積層的素值最大的特征圖，對其上采樣后將像素值大于整個圖像素均值的像素點使用[0,1]的隨機噪聲進行遮蓋處理，輸入到下層網絡繼續訓練。算法在CIFAR和Fashion-MNIST數據集上得到更低的錯誤率。在不同的網絡結構RestNet-18、WRN-28-10、ResNext-8-64使用AR算法后，與未加任何遮擋的CNN模型相比，得到更低的錯誤率。隨機擦除、Cutout和GridMask方法的圖像增強效果如圖3所示。

Figure 3. Comparison of Rerasure, Cutout and GridMask

圖3. 隨機擦除、Cutout和GridMask對比

3) GRIDMASK [18]

Pengguang等人提出的GridMask的信息刪除方法平衡了刪除區域與保留區域的面積，其本質是對圖像進行網格覆蓋，優化了cutout和隨機擦除方法過度刪除問題，并保持圖像區域連續，易于實現且快速靈活，與以前的方法相比，GridMask在各種數據集上得到更優的效果，優于所有以前的無監督策略，包括AutoAugment [19] 提出的最佳組合策略。該方法可以用作數據擴增的新基準策略。

4. 基于深度學習的數據增強方法

在進行機器學習模型訓練的過程中，優化模型的目標就是盡可能的實現模型的損失降低，因此為了完成這一優化目標，往往需要大量的訓練數據作為支撐。傳統的數據增強技術依靠對現有數據集的微小調整，包括翻轉、旋轉和平移等調整方法，通過這些方法對數據集的調整，會產生大量具有微小的或者巨大差別的數據集，使用這種數據集的實驗方法將會把這些調整后的數據集視為與原始數據集不同的數據，從而進行模型的訓練。數據增強的作用除了能夠增加訓練的樣本數量之外，提高模型的泛化能力之外，還可以通過增加噪聲數據，從而提高模型的魯棒性。

除了傳統的數據增強技術以外，近年來，隨著機器學習的快速發展和廣泛應用，研究人員開始將機器學習技術用于數據增強領域的研究，并取得了一定科研成果。

4.1. 自動數據增強

從數據自身的特點出發，搜索適合不同特點數據集的數據增強策略能夠從體系結構搜索的角度重新定義了一種數據增強的新模式。

谷歌大腦的研究人員提出了一種自動搜索合適的數據增強策略的方法(AutoAugment) [19]，通過設計這種不改變深度學習的網絡架構的數據增強方法來實現具有更多不變性的數據增強策略，這種思想能夠避免對神經網絡架構進行修改而從策略搜索的角度對模型的訓練過程進行性能上的優化。該方法通過創建一個搜索空間用來保存數據增強策略，并針對不同的批量任務根據搜索算法從搜索空間中選擇合適的子策略，選擇的子策略能夠應用特定的圖像處理函數進行數據增強的操作，以使這樣訓練出的神經網絡能獲得最佳的驗證準確率。該算法的性能接近不使用任何無標注樣本的半監督學習方法。此外，該算法能夠實現策略的遷移，將學習到的策略應用到其他類似的數據增強任務上，能夠得到較高的準確率，并且不需要在額外的數據上對預訓練的權重進行調整。該算法中使用強化學習作為搜索算法，并提出在搜索算法的方面能夠進一步研究，得到更好的實驗性能。但這種方法在簡化設置的情況下需要較長的訓練時間。

針對計算損耗巨大的問題，谷歌大腦的研究人員又提出了一種自動數據增強的方法，稱為RandAugmentation [20]。這種方法大大縮小了數據增強所產生的樣本空間，從而將數據增強的過程與深度學習模型的訓練過程集成起來，而不是將數據增強作為獨立的任務。該論文同時也證明了自動的選擇數據增強策略的方案通常是在規模較小的數據集上訓練參數量級較低的模型而實現的自動數據增強，在此基礎上再將搜索到的數據增強策略應用到大規模數據集上的方法不是最優的 [20]。

自動數據增強是否或者何時需要作為一個單獨的搜索階段一直是困擾著研究人員，在該方面的突破也許能夠從根本上解決自動數據增強和模型的訓練過程之間的關系問題。此外

Yonggang Li等人 [21] 在2020年提出了一種新的數據增強技術，該論文提出了將可微分網絡架構搜索算法應用在數據增廣策略搜索任務上，該算法同樣針對AutoAugment中的昂貴計算導致AutoAugment方法在適用性上表現較差的問題。DADA算法提出通過Gumbel-Softmax將離散的數據增強策略選擇轉化為到一個可優化的問題。

AutoAugment作為開創性的工作，提出了自動搜索策略用于數據增強，將策略的選擇過程視作一個組合優化問題。但由于其需要消耗巨大的計算時間，導致其適用性較低，因此研究人員開始針對計算耗時問題提出不同的解決方案。除了上述的兩種針對Autoaugment的改進方法之外，還有Population Based Augmentation [22] 和Fast AutoAugment [23] 等方法。

4.2. 基于生成對抗網絡的數據增強方法

通過基于生成對抗網絡的生成建模的方式進行數據增強是現階段較為常用的手段。生成對抗網絡應用在數據增強任務上的思想主要是其通過生成新的訓練數據來擴充模型的訓練樣本，通過樣本空間的擴充實現圖像分類任務效果的提升。研究人員在原始生成對抗網絡框架的基礎上又提出了多種不同的改進方案，通過設計不同的神經網絡架構和損失函數等手段不斷提升生成對抗網絡的變體的性能。

4.2.1. DCGAN

DCGAN [24] 嘗試將圖像領域應用廣泛的CNN與生成對抗網絡GAN結合起來，提出了Deep Convolutional GANs (DCGAN)，在圖像分類任務上證明了其優于其他無監督算法。該算法的核心部分是對CNN架構進行了三處修改：(1) 使用卷積層替代了池化層。作者在GAN中的生成器中進行了此類修改，使得生成器能夠學習其自身空間的下采樣方式，而不是參數指定的下采樣方式。(2) 消除了卷積特征上的全連接層。作者嘗試將最高卷積特征分別直接連接到生成器和判別器的輸入和輸出。(3) 批量歸一化 [25]。使用批量標準化通過將輸入標準化以使零均值和單位方差為零來穩定學習，并且能夠有效解決深度生成器的所有樣本坍塌到單點的問題。將該方法用到生成器的輸出層和判別器的輸入層會導致批量歸一化模型不穩定問題，因此作者在剩余的所有層上都使用了批量歸一化的操作。DCGAN算法實現了CNN和GAN的結合，是一種有效的圖像生成模型，被廣泛的用于數據集樣本的生成。但使用該方法中，當訓練模型的時間較長時，仍然在部分模型中存在不穩定的問題。

4.2.2. CycleGAN

CycleGAN [26] 作為圖像轉換領域的重要模型，可以實現樣本數據無需配對即可進行轉換，例如將一個名人轉換成一個卡通人物，這種圖像轉換的使用能夠對樣本數據進行極大的擴充而保留原始圖像的輪廓。CycleGAN作為一種不對齊數據的圖像轉換方法現在被廣泛的用于圖像到圖像的轉換。

CycleGAN實際上是由兩個對稱的生成對抗網絡組成的環形網絡，將該模型與DCGAN進行比較后發現，該模型能夠控制圖像生成，而DCGAN模型則輸入一個噪聲后輸出一張無法控制的圖片。CycleGAN的結構如圖4所示。

圖4. CycleGAN結構：(a) 該模型由兩個映射函數組成 G:X→YG:X→Y 和 F:Y→XF:Y→X，并包括兩個對抗判別器DY和DX，DY鼓勵G將X轉換為與Y無法區分的輸出，DX則鼓勵F將Y轉換為與X無法區分的輸出。為了進一步的將映射規范化，該模型定義了兩個“循環一致性損失”，這兩個損失函數保證了將一個域轉換為另一個域并再次轉換回來的時候，與原始的域盡可能保持一致。(b) 前向循環一致性損失： x→G(x)→F(G(x))≈xx→G(x)→F(G(x))≈x，(c) 反向循環一致性損失 y→F(y)→G(F(y))≈yy→F(y)→G(F(y))≈y [26]

4.2.3. Conditional GANs

2014年，Mehdi Mirza等人提出了Conditional GAN [27]，論文中提出的模型不僅僅需要較高的逼真度而且需要在一定的條件約束下完成，由于其增加了條件約束，因此生成器和判別器的設計會發生較大的改變。通過根據附加信息對模型框架進行調整，可以用于指導數據的生成過程，這種根據條件生成數據的方式對于數據增強非常有效，研究人員在原始圖像上可以根據不同的需求條件生成增量數據，并將增量數據應用到下游的神經網絡模型中。Conditional GAN的結構如圖5所示。

Figure 5. The structure of Conditional GAN

圖5. Conditional GAN 的結構

盡管生成對抗網絡在生成圖像領域被廣泛的應用，但其訓練的不穩定性，以及要求大量訓練數據的不適用性將導致其不同的變體方法在一些時候并不能有效的實現數據增強的任務。

4.3. 基于自動編碼器和生成對抗網絡組合的數據增強方法

自動編碼器通過將其網絡結構的一般用于編碼，獲得圖像的低維向量表示，將網絡結構的另一半用于解碼，獲得根據低維向量表示重新構造的圖像數據，這種編碼解碼的方式能夠實現訓練數據樣本和噪聲數據樣本的容量擴充，實現了利用數據增強技術提高神經網絡的泛化能力和魯棒性。

在生成對抗網絡被廣泛應用到生成數據任務之后，研究人員開始提出生成對抗網絡與自動編碼器的結合形式，通過將變體的生成對抗網絡和變體的自動編碼器結合而形成一個通用的學習框架來生成細粒度類別的圖像，這種新穎的圖像生成方式同樣能夠有效的完成數據增強任務。Jianmin Bao等人 [28] 提出的CVAE-GAN通過將圖像建模為概率模型中圖像標簽和隱藏屬性的組合的形式。

CVAE-GAN首先使用編碼器將給定的訓練圖像數據和類別標簽編碼為符合給定概率分布的隱變量，再通過生成器將從隱變量中采樣得到的數據和對應的類別標簽生成圖像數據，將該圖像數據輸入到分類器和判別器中從而輸入分類標簽和判別標簽，生成器和判別器構成了一個生成對抗網絡，其中生成器嘗試通過已經學會了區分真實樣本和虛假樣本的判別器提供的的梯度來學習真實數據分布。作者還在其論文中證明了均值特征匹配也可以用于條件圖像生成任務中。CVAE-GAN方法能夠在多種圖像任務中取得較好的性能，包括圖像生成任務、圖像修復任務等，但在生成位置類別的樣本方面還存在一定的可探索性。

在自動編碼器和生成對抗網絡的組合應用方面，Yang He等人 [29] 提出了一種新穎的圖像生成方法，該方法可以被分類為一種隨機回歸方法，其學會了從單個條件輸入中產生多個不同的示例。這種方法與CVAE-GAN方法一樣結合了生成對抗網絡和自動編碼器的優勢來完成圖像生成任務。這種新提出的算法通過使用隨機回歸公式為條件圖像生成任務提供了一種新穎的解決方案，該模型可以生成準確且多樣的樣本，并且可以穩定地訓練并提供具有潛在向量表示形式的抽樣機制。該模型還應用了通道級別的dropout (channel-wise dropout)，從改進網絡結構的角度提出解決多項選擇學習思想的方法。

將圖像生成技術用于數據增強任務的方法除了生成對抗網絡以及自動編碼器和生成對抗網絡的組合形式之外，研究人員還提出了一些其他的方法。Qifeng Chen等人 [30] 提出級聯優化網絡(cascaded refinement networks， CRN)，該模型將圖像生成任務轉化為回歸問題，該模型還證明了可以通過合適結構的前饋網絡合成圖像數據，實現了將圖片無縫縮放到高分辨率，并在實驗中證明了模型的有效性。Justin Johnson等人 [31] 提出采用感知損失函數訓練前饋網絡進行圖像轉換的任務。模型通過訓練一個用于圖像轉換任務的前饋網絡，同時不需要進行像素級別的求差值操作而構造損失函數。使用感知損失函數，從預訓練好的網絡中提取高級特征。該模型同樣在圖像轉換任務中取得了不錯的性能。

5. 總結

針對圖像數據集的數據增強技術可以分為兩種類型：對數據集進行變換操作達到擴充數據集的目的;對數據集進行過采樣或欠采樣達到樣本與真實分布相似效果。

隨著深度學習技術的不斷發展，應用于計算機視覺領域的深度模型也在不斷的被提出。基于深度學習的數據增強技術主要從數據擴充的角度對模型進行性能上的提升，而不是改變深度模型的網絡結構?，F階段的傳統圖像數據增強和基于深度學習的數據增強技術都在不斷的發展和提出，將數據增強技術用于計算機視覺任務也正在成為學術研究的主流做法。傳統圖像處理方法有幾何變換、顏色變換和像素變換等，而基于深度學習的圖像數據增強技術主要包括：自動數據增強通過設計一種不改變深度網絡架構的數據增強方法來實現具有更多不變性的數據增強策略，通過創建一個搜索空間用來保存數據增強策略，并針對不同的任務根據搜索算法的運行進行適當子策略(例如剪裁、翻轉)的選擇，從而實現自動數據增強的目的;而基于生成對抗網絡的數據增強主要是基于生成對抗網絡的機制進行生成器和判別器的設計，以及生成對抗網絡的算法框架的設計;而基于自動編碼器和生成對抗網絡組合形式的數據增強方法則是通過編碼器、解碼器、生成器和判別器的設計實現數據增強任務。本文總結了傳統圖像處理方法和基于深度學習數據增強方法兩方面技術，討論了不同圖像數據增強技術的優缺點。

隨著深度學習技術的不斷革新，更多的深度模型將會被提出，而針對數據集優化的數據增強技術也會隨之發展，未來研究人員將可能更多的通過改進基于深度學習的數據增強技術來適應模型算法的結構，實現模型試驗效果的提升。

審核編輯：湯梓紅

閱讀全文

編碼器(131223) 編碼器(131223)
數據(87425) 數據(87425)
圖像(40006) 圖像(40006)

智能化紅外焦平面應用前景與發展現狀綜述

智能化紅外焦平面探測器的出現，依賴于先進的紅外材料、器件技術和工藝水平以及集成電路技術和工藝的飛速發展；

2024-02-26 09:32:33

234

機器視覺的圖像目標識別方法綜述

文章來源：MEMS引言從20世紀80年代開始，機器視覺技術的發展速度不斷加快，已經走進了人們的日常生活與工作之中。機器視覺的圖像目標識別系統的自動化程度較高，應用范圍廣，尤其在危險場所的運用，采用

2024-02-23 08:26:49

279

紅外與可見光圖像融合方法綜述

圖像融合旨在將來自不同源圖像的互補信息融合在一起，生成一幅具有更高質量、更多信息量和更清晰的圖像。紅外與可見光圖像融合（IVIF）是圖像融合領域的研究熱點。

2024-02-22 09:35:34

388

萬兆電口模塊的產業發展現狀與前景展望

本文將探討萬兆電口模塊的產業發展現狀及未來前景。市場需求增長迅速，企業、數據中心、園區網等需求不斷推動產業快速發展。產業鏈布局完整，技術創新推動產業發展。未來市場將繼續擴大，產業鏈上下游企業需加強協同合作。

2024-02-21 16:13:49

107

5G RedCap產業發展現狀分析

縱觀5G RedCap前兩年的發展，目前已經分兩個階段完成 5G RedCap 技術與產品測試。

2024-02-21 09:59:18

310

圖像跟蹤設備發展歷史

跟蹤板，根據技術發展的過程，有基于DSP的圖像跟蹤板和基于AI芯片的圖像跟蹤板兩種，其原理是通過提前在圖像跟蹤板中裝入目標圖像，跟蹤板在視場內尋找類似的目標實時檢測

2024-02-20 08:28:29

101

中長波紅外探測器的特點及發展現狀

于天基紅外探測系統探測目標的多樣化，不同任務目標對探測器的需求也十分不同。本文梳理天基紅外探測技術的發展脈絡和研究進展，對中長波紅外探測器技術及其空間應用進行綜述，基于對天基遙感應用中地面像元分辨率

2024-01-19 11:14:28

528

三坐標測量機發展現狀以及三坐標國產化的意義

隨著中國制造業不斷發展壯大，三坐標測量機作為一個關鍵的檢測設備，其發展現狀備受關注。通過國內企業的不斷努力和政府的支持，中國三坐標測量機市場蓬勃發展。同時，國產化的推動也為中國制造業帶來了更大的機遇和發展空間。相信隨著時間的推移，中國國內的三坐標測量機行業將迎來更加輝煌的明天。

2024-01-17 09:25:01

524

機器視覺的圖像目標識別方法操作要點

通過加強圖像分割，能夠提高機器視覺的圖像目標識別的自動化水平，使得圖像目標識別效果更加顯著。圖像分割的方法有很多種，不同方法分別適用于不同領域，這里重點介紹以下3種分割方法。

2024-01-15 12:17:54

122

區塊鏈技術發展現狀和趨勢

近年來，區塊鏈技術作為一項顛覆性的創新技術，引起了全球各行各業的廣泛關注。區塊鏈技術的出現，為金融、供應鏈、物聯網等各個領域帶來了很多變革的機會。本文將從區塊鏈技術的起源、發展現狀以及未來趨勢等方面

2024-01-11 10:31:44

281

FPGA圖像處理之CLAHE算法

在FPGA圖像處理--CLAHE算法(一)中介紹了為啥要用CLAHE算法來做圖像增強。

2024-01-04 12:23:13

1254

在labview怎么獲取圖像數據

在LabVIEW中獲取圖像數據主要有兩種方法：采集實時圖像和加載靜態圖像。一、采集實時圖像：首先，需要安裝合適的圖像采集設備，如相機或者視頻采集卡?？梢酝ㄟ^USB、GigE或其他接口連接設備

2024-01-04 09:48:09

409

6G關鍵技術研發的原理和發展現狀

查找及訪問的分布式哈希表技術、分布式賬本技術等。區塊鏈技術憑借其去中心化、去信任化、不可篡改等技術特性，在5G發展階段已有應用探索，即利用區塊鏈思維增強網絡拓展、網間協作、安全與隱私保護等能力。

2023-12-28 17:32:47

198

光伏行業發展現狀與發展趨勢報告

2023年12月15日，由中國光伏行業協會和宿遷市人民政府共同主辦的“2023光伏行業年度大會”在江蘇宿遷成功舉辦。中國光伏行業協會名譽理事長王勃華出席會議并作光伏行業發展現狀與發展趨勢報告。

2023-12-26 11:32:34

258

淺談圖像分割基于閾值處理的基本方法

該方法基于圖像直方圖上出現的雙峰現象。當一個圖像有雙峰現象時，其直方圖會出現兩個峰，分別對應圖像中兩種不同的顏色或亮度區域。這時我們可以使用直方圖雙峰法來自動確定合適的閾值。

2023-12-22 10:05:26

162

車載語音發展現狀及未來發展趨勢

ChatGPT 的爆火，讓其背后依賴的大模型技術快速從AI領域向各行各業延伸。2023年，大模型在汽車領域快速發展，多個車企在智能座艙、智能駕駛等場景探索大模型落地機會。

2023-12-21 14:12:26

984

機器視覺中采集的圖像太暗時要如何增強圖像亮度？

Q圖像太暗時要如何增強圖像亮度？A:通俗來講，普遍認為圖像亮度就是圖像的明暗度。我們知道一幅8bit的黑白圖像是有256個灰階的?；译A數值越接近于0亮度越低；反之，越接近255亮度越亮。機器視覺中常

2023-12-15 08:36:46

237

中國汽車信息安全發展現狀與趨勢

01? 智能網聯汽車信息安全總體發展與突破隨著整車電子電氣架構的集中化演進，5G技術的廣泛應用，基于V2X的車路云一體化方案的落地實施，汽車網絡安全的挑戰也將更加復雜和嚴峻。與此同時，新一代智能

2023-12-13 14:16:24

294

從融資看通信行業發展現狀

電子發燒友網站提供《從融資看通信行業發展現狀.pdf》資料免費下載

2023-12-13 10:15:18

千兆以太網發展現狀千兆以太網技術優勢

以太網其實是我們日常生活中都會用到的，比如大家小區里的千兆以太網等。為增進大家對以太網的了解，本文講對千兆以太網的發展現狀、千兆以太網技術優勢以及千兆以太網前景予以介紹。如果你對以太網具有興趣，不妨

2023-12-08 16:40:05

300

機器視覺中采集的圖像太暗時要如何增強圖像亮度？

Q 圖像太暗時要如何增強圖像亮度？ ? A:? 通俗來講，普遍認為圖像亮度就是圖像的明暗度。我們知道一幅8bit的黑白圖像是有256個灰階的。灰階數值越接近于0亮度越低；反之，越接近255亮度

2023-12-08 13:01:02

219

工業機器人的發展現狀和趨勢

工業機器人的發展現狀和趨勢導語：隨著科技的不斷進步，工業機器人已逐漸成為工業生產的重要組成部分。工業機器人不僅可以提高生產效率，降低成本，還可以提高產品質量和減少勞工的操作風險。本文將詳細探討

2023-12-07 17:27:18

2455

6G發展現狀揭秘

往前回溯，NB-IoT、Cat.1的出現，讓我們看到了通信技術并非一味追求高速率，而是要求廣覆蓋、大連接、低功耗、低成本，可見其目的在于“物”聯。

2023-12-07 16:10:25

367

FPGA圖像處理方法

圖像細節。 FPGA 圖像處理方法 1、圖像增強兩大方法：空間域方法和時間域方法（以后再詳述） 2、圖像濾波（1）平滑空間濾波器（2）中值濾波算法 3、圖像邊緣檢測邊緣指圖像局部強度變化最顯著的部分。邊緣主要存在與目標與

2023-12-02 13:15:02

492

圖像增強三大類別介紹

圖像增強是圖像模式識別中非常重要的圖像預處理過程。圖像增強的目的是通過對圖像中的信息進行處理，使得有利于模式識別的信息得到增強，不利于模式識別的信息被抑制，擴大圖像中不同物體特征之間的差別，為圖像的信息提取及其識別奠定良好的基礎。

2023-11-14 14:34:54

448

國內外常見PLC發展現狀分析

在聊PLC的市場格局和國產發展現狀之前，我們先來簡單了解一下PLC的作用。所謂PLC，你可以把它當成是一臺小型電腦，只不過這臺電腦是專用于工業領域，用來控制各種機械或生產的過程。比如說我們身上

2023-11-09 10:23:05

647

全球FPGA市場現狀和發展前景展望

全球FPGA市場現狀和發展前景展望當今，半導體市場格局已成三足鼎立之勢，FPGA，ASIC和ASSP三分天下。市場統計數據表明，FPGA已經逐步侵蝕ASIC和ASSP的傳統市場，并處于快速增長階段

2023-11-08 17:19:01

機器視覺：圖像配準方法分類

基于特征的配準方法主要是采用各種算法提取基準圖像和實時圖像的特征，如邊緣、角點、曲率、不變矩等，然后對提取的特征進行描述從而使其可以按照某種相似性測度進行匹配。

2023-11-06 16:54:51

288

最全綜述：圖像分割算法

閾值法的基本思想是基于圖像的灰度特征來計算一個或多個灰度閾值，并將圖像中每個像素的灰度值與閾值作比較，最后將像素根據比較結果分到合適的類別中。因此，該方法最為關鍵的一步就是按照某個準則函數來求解最佳灰度閾值。

2023-11-03 16:04:28

327

機器視覺圖像分割的方法有哪些？

現有的圖像分割方法主要分以下幾類：基于閾值（threshold）的分割方法、基于區域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等。

2023-11-02 10:26:39

199

機器視覺之圖像增強和圖像處理

一、圖像處理技術概述1.定義對原始獲取圖像進行一系列的運算處理，稱為圖像處理。圖像處理是機器視覺技術的方法基礎，包括圖像增強、邊緣提取、圖像分割、形態學處理、圖像投影、配準定位和圖像特征提取等方法

2023-10-26 08:07:47

387

高頻開關電源的發展現狀

高頻開關電源從產生發展至今，其各方面性能有了普遍提高。隨著現代電力電子技術的飛速發展，越來越多的高新技術被成功應用到高頻開關電源中，極大地提高了高頻開關電源的各方面性能。

2023-10-24 10:21:18

555

機器視覺之圖像增強和圖像處理

對原始獲取圖像進行一系列的運算處理，稱為圖像處理。圖像處理是機器視覺技術的方法基礎，包括圖像增強、邊緣提取、圖像分割、形態學處理、圖像投影、配準定位和圖像特征提取等方法。

2023-10-23 10:43:08

193

國產車規級芯片發展現狀、問題及建議

近年來，國產汽車產業蓬勃發展，成為全球最大的汽車市場之一。然而，汽車電子系統在車輛中的應用越來越廣泛，對高性能、可靠的車規級芯片需求也隨之增加。本文將探討國產車規級芯片發展的現狀，面臨的問題以及可能的解決方案和建議。

2023-10-21 15:43:14

1342

機器視覺：圖像處理技術、圖像增強技術

2023-10-20 10:17:34

313

MEMS及微系統技術現狀及發展綜述（深入）

了國內外微系統技術的現狀和發展趨勢，其技術創新點在于多功能芯片一體化、智能傳感、異質集成、堆疊式系統級封裝技術的突破和新型半導體材料的應用;文末總結了微系統技術發展的意義，并提出展望。?微系統技術融合了微電子、微

2023-10-11 17:54:27

649

汽車電子的發展與現狀

電子發燒友網站提供《汽車電子的發展與現狀.doc》資料免費下載

2023-10-10 09:50:24

機器視覺技術之空域圖像增強技術解析

用這種方式倒轉圖像的強度產生圖像反轉的對等圖像。該方式適用于增強嵌入于圖像暗色區域的白色或灰色細節，特別是當黑色面積占主導地位時。

2023-10-08 11:10:19

184

點-線特征聯合的全景圖像位姿解算方法

使用真實場景的車載激光點云和兩幅全景圖像進行試驗，驗證點-線特征聯合的位姿解算方法優于單純的點特征解算方法。

2023-09-29 08:01:00

307

基于LabVIEW的紅外測溫儀數據采集系統設計

本課題是對紅外測溫儀進行數據采集的設計。為了把從紅外測溫儀采集到的數據在溫度波形圖上直觀明了的展現出來，在充分查閱相關資料的基礎上，綜述了LabVIEW虛擬儀器開發平臺和紅外測溫儀的特點

2023-09-26 07:29:40

圖像預處理方法研究

圖像預處理的主要目的是消除圖像中無關的信息，恢復有用的真實信息，增強有關信息的可檢測性、最大限度地簡化數據，從而改進特征提取、圖像分割、匹配和識別的可靠性。一般的預處理流程為：1灰度化->2幾何變換->3圖像增強

2023-09-20 09:35:40

200

中國充電槍、充電插座市場發展現狀

作為車樁與新能源汽車在充電環節中的關鍵連接裝置，充電槍與充電插座市場顯著。在市場規模顯著的同時，市場弊端也逐漸顯現。本文將以市場現狀、行業標準、技術方向為參照進行充電槍以及充電插座的市場分析。一輛

2023-09-11 17:44:07

362

崛起中的‘芯’力量：解析中國CPU芯片企業的發展現狀

近年來，隨著全球科技界對半導體行業重視度的逐漸提升，國產產CPU芯片企業也開始嶄露頭角。從政府的大力支持到企業的不斷創新，國產已經形成了一個逐漸成熟的半導體生態系統。本文將從多個方面對國產產CPU芯片企業的發展現狀進行全面評價。

2023-08-31 09:16:22

2691

工業相機拍攝的圖像比較暗，如何增強圖像亮度

通過工業相機采集圖像后，增強圖像亮度的方法

2023-08-29 11:34:54

866

Chiplet技術的發展現狀和趨勢

、董事長兼總裁戴偉民博士以《面板級封裝：Chiplet和SiP》為題進行了視頻演講。他表示，Chiplet是集成電路技術重要的發展趨勢之一，可有效突破高性能芯片在良率、設計/迭代周期、設計難度和風險等方面所面臨的困境；而先進封裝技術則是發展Chiplet的核心技術之一。隨后，戴博士介

2023-08-28 10:31:50

749

什么是圖像分割？圖像分割的體系結構和方法

圖像分割（Image Segmentation）是計算機視覺領域中的一項重要基礎技術，是圖像理解中的重要一環。前端時間，數據科學家Derrick Mwiti在一篇文章中，就什么是圖像分割、圖像分割架構、圖像分割損失函數以及圖像分割工具和框架等問題進行了討論，讓我們一探究竟吧。

2023-08-18 10:34:04

2063

機器學習發展歷程

機器學習發展歷程：機器學習發展現狀、機器學習發展前景和機器學習發展歷史隨著科技的快速發展，全球各個行業都在加速數字化轉型，從而加速了人工智能和機器學習的發展。機器學習已經成為許多公司和組織實現商業

2023-08-17 16:30:15

1038

人工智能的發展現狀及前景

人工智能的發展現狀及前景人工智能（Artificial Intelligence，AI）是一種模擬人類智能的技術，是以計算機程序為基礎，利用數據和算法來模擬人類神經網絡，并能對數據進行學習和增強

2023-08-17 12:37:15

6246

從融資看通信行業發展現狀（上）

洞見分析經驗分享

電子發燒友網官方發布于 2023-08-16 14:21:38

從融資看通信行業發展現狀（下）

洞見分析經驗分享

電子發燒友網官方發布于 2023-08-16 14:20:05

增強現實和擴展現實的區別

現實和擴展現實的區別。增強現實（Augmented Reality，簡稱AR）是指將虛擬數字信息“疊加”到真實世界中，使得用戶在現實環境中看到虛擬的數字內容，形成增強現實場景。這種虛擬內容可以是圖像、聲音、視頻或3D模型等等。AR技術可以

2023-08-12 15:23:40

1241

光子計數CT的市場發展現狀及預測

及預測，全球光子計數CT的市場規模，從2022年的7,531萬美元，預計2028年達到9.2億萬美元。從2021年到2022年之間擴大59.5％，以及預計2023年～2028年以48.2％的年復合成長率成長。光子計數CT的市場發展現狀及預測近年來，隨著醫療技術的不斷發展和人們對健

2023-08-08 18:02:53

561

低質量圖像的生成與增強的區別圖像生成領域中存在的難點

1. 論文信息 ? 2. 引言 ? 這篇論文的研究背景是圖像生成領域中存在的一個難點 - 如何從低質量的圖像中恢復高質量的細節信息。這對很多下游應用如監控視頻分析等都是非常重要的?，F有的圖像生成方法

2023-08-03 15:36:32

974

基于多曝光圖像生成的低照度圖像增強方法

低照度圖像會使很多計算機視覺算法的魯棒性降低，嚴重影響機器人領域的許多視覺任務，如自動駕駛、圖像識別以及目標追蹤等。

2023-07-27 09:19:16

1117

光通信市場：2023年發展現狀與趨勢分析

光通信市場在2023年將繼續保持穩步增長，并且呈現出一些關鍵的發展現狀和趨勢。光芯片、光器件、光模塊等作為光通信的基礎和核心，市場規模持續增長，技術路徑持續革新。

2023-07-24 14:29:15

957

數據挖掘定義及方法數據挖掘在微電子領域的應用

　　摘要：本文首先介紹了微電子領域及該領域中半導體制造的發展現狀，然后分析了數據挖掘在半導體制造中應用的必要性和可行性。最后重點討論數據挖掘技術在研究晶圓制造質量異常問題中的應用，文章中給出了半導體

2023-07-18 15:43:20

智能樓宇的發展現狀

“聰明反被聰明誤”這句俗語廣為熟知，但你一定沒聽過“智慧反被智慧誤”。因為，聰明≠智慧，兩者之間存在著明顯區別。正所謂，“聰明人會說話，智者善于傾聽?！倍@同樣適用在當今的樓宇建筑上。

2023-07-13 15:36:06

438

家用電器電機驅動控制技術發展現狀及展望

家用電器電機驅動控制技術發展現狀及展望

2023-07-12 15:04:39

微創及無創血糖檢測方法研究現狀綜述

糖尿病作為一種進展性疾病，目前在臨床中尚無可以治愈糖尿病的方法，現有治療手段大多采用服用藥物或注射胰島素方式進行控制和緩解。

2023-07-04 09:10:33

532

深度學習低光圖像增強綜述（譯）

?pwd=gzrr? ? 密碼：gzrr Lighting the Darkness in the Deep Learning Era ? Abstract ? 低光圖像增強 (LLIE)旨在提高在照明

2023-07-03 14:43:46

1972

智能浴霸發展現狀

性能的家用電器，浴霸通常安裝在浴室或廁所的天花板上并與特制的開關相連。 ? 浴霸的發展歷程 ? 浴霸源自英文 “BATHROOMMASTER”可以直譯為“浴室大師”。它是通過特制的防水紅外線熱波管和換氣扇的巧妙組合將浴室的取暖、紅外線

2023-07-02 09:24:11

874

中山大學王鋼教授團隊在NiO/β-Ga?O?異質結在功率器件領域的研究進展

該綜述總結了NiO/β-Ga2O3異質結在功率器件領域的發展現狀，為之后設計高性能的NiO/β-Ga2O3異質結器件提供了參考，對β-Ga2O3雙極型器件未來的發展起到了積極的作用。

2023-06-30 16:36:03

787

“光儲充”電站發展現狀與難點

“光儲充”電站的建設勢必會遇到諸多挑戰，比如，在宏觀層面，分布式光伏大量接入配電網，以及電動汽車群集中高峰期充電，均會對電網造成沖擊。

2023-06-30 12:41:15

828

基于FPGA的圖像處理之直方圖均衡

最近一直在用FPGA調圖像處理相關的算法，主要是集中在圖像增強和增晰方面。

2023-06-29 09:23:28

644

單張圖像超分辨率和立體圖像超分辨率的相關工作

多階段策略在圖像修復任務中被廣泛應用，雖然基于Transformer的方法在單圖像超分辨率任務中表現出高效率，但在立體超分辨率任務中尚未展現出CNN-based方法的顯著優勢。這可以歸因于兩個

2023-06-27 11:07:57

482

數據增強使用的傳統算法方法

不斷發展進步的傳統計算機視覺技術被淘汰。近期，來自愛爾蘭垂利理工學院的研究者發表論文，分析了這兩種方法的優缺點。 ? 該論文旨在促進人們對是否保留經典計算機視覺技術知識進行討論。此外，這篇論文還探討了如何結合傳統計算機視覺與深度學習。文中提及了多個近期混合方法，這些方法既提升了計算機

2023-06-26 10:51:36

319

龍芯、海光、鯤鵬等*廠商，發展現狀**不盡相同

在國家大力鼓勵國產高科技企業，在芯片等高端產業實現突破與自主研發的背景下，一片欣欣向榮的國產芯片產業，卻在新品發布上，呈現出冰火兩重天的景象。這里就以龍芯、海光、鯤鵬等國產芯片的發展現狀舉例

2023-06-25 09:46:10

1208

基于FPGA的實時圖像邊緣檢測系統設計（附代碼）

數據高速傳輸的能力。本篇為本人當年的畢業設計部分整理，各位大俠可依據自己的需要進行閱讀，參考學習。第一篇內容摘要：本篇會介紹前言，包括課題研究的背景和意義、相關技術在國內外的發展現狀及應用、圖像

2023-06-21 18:47:51

圖像處理與機器視覺

常用的圖像增強處理方式包括灰度變換、直方圖修正、圖像銳化、噪聲去除、幾何畸變校正、頻域濾波和彩色增強等。由于圖像增強與感興趣的物體特性、觀察者的習慣和處理目的密切相關，盡管處理方式多種多樣，但它帶有

2023-06-20 15:41:44

混合現實是指什么？混合現實的發展現狀如何了？

混合現實是指什么？混合現實的發展如何了？混合現實（Mixed Reality，簡稱MR）是一種介于虛擬現實和現實世界之間的技術，它通過計算機技術將虛擬數字內容與現實世界實景融合在一起，形成新的交互

2023-06-07 17:03:05

2054

自動駕駛歷史、分級標準、發展現狀

1.汽車發展趨勢回看近幾年的汽車生產銷售狀況以及前言技術研究現狀，未來汽車的發展方向主要呈現為電動化和智能化。 1.1電動化電動汽車指全部或部分動力由電機驅動的汽車。按技術路線，電動汽車分為傳統

2023-06-06 10:54:17

工信部明確全面推進6G技術研發中國6g發展現狀概述

工信部明確全面推進6G技術研發中國6g發展現狀概述 6G即第六代移動通信標準，也被稱為第六代移動通信技術，就在5g如火如荼之際我國工信部明確全面推進6G技術研發。 6G通信網絡將實現地面蜂窩網絡

2023-06-05 18:13:57

2591

PyTorch教程-14.1. 圖像增強

在 SageMaker Studio Lab 中打開筆記本在8.1 節中，我們提到大型數據集是深度神經網絡在各種應用中取得成功的先決條件。圖像增強在對訓練圖像進行一系列隨機變化后生成相似但不同的訓練示例

2023-06-05 15:44:35

544

PyTorch教程14.1之圖像增強

電子發燒友網站提供《PyTorch教程14.1之圖像增強.pdf》資料免費下載

2023-06-05 14:24:23

無人駕駛產業與發展現狀

也會把汽車產業作為他們的核心支柱產業之一。所以勿容置疑，汽車產業是一個非常大的產業。那么在這個這么大的汽車產業范圍內，汽車行業公認的四大發展趨勢是智能化、網聯化、電動化、共享化。智能化指的是汽車會越來越智能，比如

2023-06-02 16:14:16

干貨！石墨烯發展現狀分析

石墨烯的理論研究始于1947年，迄今已有70余年的歷史。2004年，英國曼徹斯特大學天文物理學教授Andre K. Geim領導的研究小組利用微機械剝離方法首次獲得了石墨烯，標志著這一新型材料的問世。

2023-05-31 17:13:28

2342

國內外可信計算發展現狀(2)#網絡空間安全

網絡安全通信網絡

學習硬聲知識發布于 2023-05-30 20:05:48

國內外可信計算發展現狀(1)#網絡空間安全

網絡安全通信網絡

學習硬聲知識發布于 2023-05-30 20:05:21

深度解讀工控安全技術發展現狀與應用趨勢

本文將分析工控安全技術發展現狀，盤點國內外工控安全主流廠商發展態勢，分析我國工控安全市場發展現狀，展望未來工控安全技術的發展與應用趨勢。

2023-05-25 10:42:08

2736

點云分割技術的發展現狀及挑戰

中的重要研究方向之一。目前，點云分割技術已經實現了自動化和智能化，分割效果也有了顯著提高。然而，點云分割技術仍然面臨著一些挑戰，包括以下幾點：數據獲取與預處理點云數據需要通過激光掃描或圖像采集等方式獲取，而

2023-05-24 17:26:23

630

基于稀疏分解的高光譜圖像壓縮方法

高光譜圖像壓縮技術已經成為圖像處理應用領域中最熱點的領域之一，在許多領域都具備實際應用價值與發展前景。但

2023-05-20 17:03:48

805

邊緣計算網關平臺發展現狀綜述

隨著邊緣端側設備的計算與存儲能力的逐漸提升以及端側設備通信與交互能力的進一步開放，邊緣計算正在逐步興起，各個廠家正在逐漸推出自家的邊緣計算相關軟硬件產品。因此，本文就邊緣計算下端側平臺的一個發展狀況做出進一步的歸納與總結。

2023-05-18 15:49:26

光通信技術發展現狀光通信模塊作用

光通信技術自問世以來，一直都在不斷地發展和創新。目前光通信技術發展的重點在于提高數據傳輸的速率和帶寬、減小信號傳輸的損耗和失真、縮小光模和纖芯的尺寸和成本等方面。以下是光通信技術發展現狀的幾個方面

2023-05-09 16:31:58

1553

中國開源未來發展峰會“問道 AI 分論壇”即將開幕！

發展峰會“問道 AI 分論壇”將在重慶富力假日酒店舉辦，論壇將邀請國內多位一線 AI 領域大咖，從底層技術、產品設計、開源社區運營等角度詳解“AI + 開源”的發展現狀與未來方向。在“問道 AI 分

2023-05-09 09:49:41

四個維度看XR虛擬拍攝發展現狀

大屏以及LED一體機下的會議應用等，而XR虛擬拍攝作為LED重要的新增潛力市場近期也表現出較高的市場活力，本文將通過政策端、品牌端、終端以及應用場景四個方面梳理其發展現狀。一、政策端：政策持續加碼并列為中國數字經濟重點產業，國內應用

2023-05-06 16:07:54

440

LiFi技術的應用場景和發展現狀

　　LiFi技術是一個新興的短距離通訊技術，用于數據傳輸，它是在可見光通信技術基礎上發展起來的。LiFi技術利用可見光和紅外線等光譜中的可見光波段，采用LED燈作為數據傳輸的光源，通過不斷地點燈和關燈，將數字信號轉換為LED光信號，通過接收端將光信號還原成二進制數字信號。

2023-05-06 15:03:11

2000

[4.6.1]--4.6.1圖像彩色增強學習視頻

圖像識別圖像識別技術

jf_75936199發布于 2023-04-28 02:13:49

[4.1.1]--4.1.1圖像的對比度增強學習視頻

圖像識別圖像識別技術

jf_75936199發布于 2023-04-28 02:06:17

存算一體技術發展現狀和未來趨勢

存算一體

電子發燒友網官方發布于 2023-04-25 17:21:41

有償找一個大神用labview設計一個圖像處理界面

功能：①主要實現高光譜數據的讀取，顯示所有波段，并選擇其中三個波段形成偽彩圖，或選擇一個波段，形成灰度圖②對偽彩圖進行圖像增強，線性，高斯等等③圖像對應點坐標顯示，光譜顯示；（縱軸為灰度值，橫軸為波長）④圖像裁剪和保存功能⑤圖像縮放和拖動

2023-04-24 14:32:06

電力儲能行業發展現狀及發展前景

電力儲能是指將電能儲存起來，在需要時進行釋放的技術，可以提高可再生能源利用率，降低電網運行風險，同時還可以協調電網對電力需求進行柔性調控。以下是電力儲能行業發展現狀的幾個方面：　　1. 技術

2023-04-21 16:40:18

7913

國產32位MCU的發展

國產32位MCU作為中國自主研發的芯片產品，在國內外市場上取得了顯著的發展。本文將探討國產32位MCU的發展現狀、趨勢以及其在應用中的優勢。

2023-04-21 16:21:26

1776

悉尼大學最新綜述：深度學習圖像摳圖

自深度學習出現之后，研究者設計出了多種多樣的基于卷積神經網絡的解決方案。和傳統方法一樣，早期的深度學習方法依然需要依賴一定量的人工輔助信息，例如三分圖（trimap），涂抹（scribble），背景圖像等等

2023-04-20 09:31:43

399

工業機器人的發展現狀和趨勢

工業機器人的發展現狀和趨勢工業機器人較早服務于汽車工業，是目前應用范圍最廣、應用標準最高、應用成熟度最好的領域。隨著信息技術、人工智能技術的發展，工業機器人逐步拓展至通用工業領域，其中以3C電子

2023-04-19 10:56:39

7670

行業數據安全人才發展現狀分析

抽樣調研結果顯示，我國數據安全人才隊伍已初步建立，71.28%的基礎電信企業形成5人左右數據安全管理團隊，頭部互聯網企業大多成立虛擬數據安全管理委員會或工作組，形成跨部門的數據安全工作團隊。

2023-04-17 17:33:39

418

美軍VR技術應用及發展

現有VR技術應用可分為三大類：模擬作戰訓練、幫助指揮官進行任務規劃、預演與決策以及武器系統構建、評估與測試。本文將著重描述美軍在三大應用領域的發展現狀及典型系統。

2023-04-14 14:48:37

3475

已全部加載完成

搜索歷史

基于圖像的數據增強方法發展現狀綜述

評論