基于深度學習的目標檢測算法解析

目標檢測是計算機視覺領域內的熱點課題，在機器人導航、智能視頻監控及航天航空等領域都有廣泛的應用.本文首先綜述了目標檢測的研究背景、意義及難點，接著對基于深度學習目標檢測算法的兩大類進行綜述，即基于候選區域和基于回歸算法.對于第一類算法，先介紹了基于區域的卷積神經網絡(Region with Convolutional Neural Network，R-CNN)系列算法，然后從四個維度綜述了研究者在R-CNN系列算法基礎上所做的研究：對特征提取網絡的改進研究、對感興趣區域池化層的改進研究、對區域提取網絡的改進研究、對非極大值抑制算法的改進研究.對第二類算法分為YOLO(You Only Look Once)系列、SSD(Single Shot multibox Detector)算法及其改進研究進行綜述.最后根據當前目標檢測算法在發展更高效合理的檢測框架的趨勢下，展望了目標檢測算法未來在無監督和未知類別物體檢測方向的研究熱點.

1 引言

目標檢測的主要任務是從輸入圖像中定位感興趣的目標，然后準確地判斷每個感興趣目標的類別.當前目標檢測技術已經廣泛應用于日常生活安全、機器人導航、智能視頻監控、交通場景檢測及航天航空等領域.同時目標檢測是行為理解、場景分類和視頻內容檢索等其他高級視覺問題的基礎.但是，由于同一類物體的不同實例間可能存在很大的差異性，而不同類物體間可能非常相似，以及不同的成像條件和環境因素會對物體的外觀產生巨大的影響[1],使得目標檢測具有很大的挑戰性.

傳統的目標檢測算法采用類似窮舉的滑動窗口方式或圖像分割技術來生成大量的候選區域，然后對每一個候選區域提取圖像特征(包括HOG[2]、SIFT[3]、Haar[4]等)，并將這些特征傳遞給一個分類器(如SVM[5]、Adaboost[6]和Random Forest[7]等)用來判斷該候選區域的類別.由于傳統方法提取的特征存在局限性，產生候選區域的方法需要大量的計算開銷，檢測的精度和速度遠遠達不到實際應用的要求，這使得傳統目標檢測技術研究陷入了瓶頸[8].

近些年基于深度學習的目標檢測算法形成兩大類別：基于候選區域和基于回歸.基于候選區域的目標檢測算法也稱為二階段方法，將目標檢測問題分成兩個階段：一是生成候選區域(region proposal)，二是把候選區域放入分類器中進行分類并修正位置.基于回歸的目標檢測算法只有一個階段，直接對預測的目標物體進行回歸.

Sharma等人[9,10]僅僅綜述了傳統的目標檢測算法，Chahal等人[11]對基于深度學習的目標檢測算法從算法實現的角度進行了綜述，Kemal等人[12]從目標檢測算法中不平衡問題的角度進行了綜述，Zhao等人[13]從檢測框架和檢測子任務兩個角度進行了綜述.與以上研究綜述不同的是，本文從一個新穎的角度歸類綜述了近些年目標檢測領域的經典算法.在將其分為基于候選區域和基于回歸兩大類的前提下，對基于候選區域的目標檢測算法，介紹基于區域的卷積神經網絡(Region with Convolutional Neural Network，R-CNN)系列算法的發展史后，根據對不同模塊的改進研究進行歸類綜述：特征提取網絡、感興趣區域池化(Region of Interesting Pooling,ROI Pooling)層、區域提取網絡(Region Proposal Networks,RPN)、非極大值抑制(Non Maximum Suppression,NMS).對基于回歸的目標檢測算法，介紹YOLO(You Only Look Once)系列和SSD(Single Shot Multibox Detector)算法后，對基于SSD算法的改進研究進行細分論述：基于Anchor-based的改進研究和基于Anchor-free的改進研究.隨后介紹目標檢測領域流行的數據集.最后展望未來目標檢測研究的發展方向.

2 基于候選區域的目標檢測算法綜述

本節主要將近年來基于候選區域的目標檢測算法分為五個部分進行綜述，首先介紹了Faster R-CNN[14]框架的發展歷程，然后綜述了對Faster R-CNN算法的四個重要組成部分(特征提取網絡、ROI Pooling層、RPN、NMS算法)的改進研究.

2.1 R-CNN系列基礎框架的發展史

2014年，Girshick等人[15]成功將卷積神經網絡(Convolutional Neural Networks,CNN[16])運用在目標檢測領域中，提出了R-CNN算法，它將AlexNet[17]與選擇性搜索[18](selective search)算法相結合，把目標檢測任務分解為若干個獨立的步驟(如圖1所示)，首先采用選擇性搜索算法提取2000個候選區域,然后對每個候選區域進行歸一化，并逐個輸入CNN中提取特征，最后對特征進行SVM分類和區域回歸.

R-CNN[15]算法在PASCAL VOC2007[19]數據集上的檢測精度達到了58.5%，相較于傳統的目標檢測算法取得了跨越性的進展.但還存在非常多的改進空間，如：對于單張圖像提取的2000個候選區域需要逐個輸入CNN中，導致計算開銷十分巨大，嚴重影響了檢測速度；而且候選區域輸入CNN前，必須剪裁或縮放至固定大小，這會使候選區域發生形變且丟失較多的信息，導致網絡檢測精度下降.

2014年He等人[20]提出了空間金字塔網絡(Spatial Pyramid Pooling Network，SPP-Net)檢測算法，它在CNN最后一層卷積層和全連接層之間加入SPP層(如圖2所示)，使得網絡能夠輸入任意尺度的候選區域，從而每張輸入圖片只需一次CNN運算，就能得到所有候選區域的特征，這使得計算量大大減少.SPP-Net的檢測速率比R-CNN快了24～102倍，并打破了固定尺寸輸入的束縛.

2015年，Girshick等人[21]提出了Fast R-CNN算法(如圖3所示)，他們受到SPP-Net算法的啟發，將SPP層簡化成單尺度的ROI Pooling層以統一候選區域特征的大小，而且進一步提出了多任務損失函數思想，將分類損失和邊界框回歸損失統一訓練學習，使得分類和定位任務不僅可以共享卷積特征，還可以相互促進提升檢測效果.

雖然Fast R-CNN有效地加快了檢測速率，但仍然依賴于選擇性搜索算法[18]來產生候選區域.有研究表明，卷積神經網絡的卷積層具有良好的定位目標的能力，只是這種能力在全連接層被削弱了.因此，2015年Ren等人[14]提出了Faster R-CNN算法框架(結構如圖4所示)，設計了輔助生成樣本的RPN取代選擇性搜索算法.RPN是一種全卷積神經網絡(Fully Convolutional Network，FCN[22])結構,它將任意大小的特征圖作為輸入，經過卷積操作后產生一系列可能包含目標的候選區域，使算法實現了端到端的訓練，極大提高了檢測速度.

2.2 基于Faster R-CNN的改進研究

Faster R-CNN[14]算法在檢測的精度和速度上都取得了不錯的效果.它主要由四個模塊組成：特征提取網絡用于提取圖像特征；ROI Pooling層將不同大小的候選區域特征進行歸一化輸出；RPN根據圖像特征生成目標的候選區域；NMS[23]算法用于去除冗余檢測框.本小節綜述了在這四個功能模塊上的改進研究.

2.2.1 對特征提取網絡的改進研究

深度卷積神經網絡的淺層特征具有豐富的幾何信息，但對語義信息不敏感，不利于目標分類；而高層具有豐富的語義信息，但分辨率太低，不利于目標定位.僅利用最后一層卷積層的特征進行不同尺度目標的預測，效果顯然是不理想的，所以Faster R-CNN算法對于小目標的檢測精度較低.針對這個問題，有許多研究是通過融合多個卷積層的特征來提高小尺度目標的檢測效果.

2016年Kong等人[24]提出了HyperNet算法，通過融合多層卷積層的特征圖，得到具有多尺度信息的Hyper特征，該特征結合了卷積層高層的強語義信息、中層的輔助信息以及淺層的幾何信息.同年，Huang等人[25]采用多尺度思想，在特征提取網絡的高層和低層中提取多個不同尺度的特征分別進行預測.

2017年Lin等人[26]提出了特征金字塔網絡(Feature Pyramid Network，FPN),FPN構造了一種自頂向下帶有橫向連接的層次結構，提取多個不同尺度特征用于檢測，每個尺度特征都是高層特征與淺層特征融合所得，不僅具有較強的語義信息，還具有較豐富的幾何信息.

2018年Bharat等人[27]提出了圖像金字塔的尺度歸一化方法(Scale Normalization for Image Pyramids,SNIP).他們借鑒多尺度訓練思想，使用圖像金字塔網絡將圖像生成三種不同分辨率的輸入圖像，高分辨率圖像只用于小目標檢測，中等分辨率圖像只進行中等目標檢測，低分辨率圖像只進行大目標檢測.

2.2.2 對感興趣區域池化層的改進研究

ROI Pooling，即感興趣區域池化是將候選區域對應的特征圖劃分成固定數量的空間小塊，再對每個空間小塊進行最大池化或者平均池化操作，這樣就實現了不同尺度的候選區域能夠輸出同樣大小的特征圖.近年來的改進研究旨在更好保留或融合空間位置信息到ROI池化中，以提高檢測效果.

2016年Dai等人[28]提出了基于區域的全卷積神經網絡(Region-based Fully Convolutional Network，R-FCN)，他們考慮到目標檢測任務是由分類任務和定位任務組成，分類任務要求目標特征具有平移不變性，而定位任務要求目標特征具有平移敏感性.為了緩解這兩者間的矛盾，提出了位置敏感ROI池化，可以編碼每個候選區域的相對空間位置信息，使得特征具有了對位置的敏感性.在此基礎上，Zhu等人[29]提出了CoupleNet算法，設計了由兩個分支組成的耦合模塊，一個分支采用位置敏感ROI池化獲取對象的局部信息，另一分支則使用兩個ROI池化分別獲取對象的全局信息和上下文信息，然后有效的結合候選區域的局部信息、全局信息和上下文信息進行檢測.

2017年Dai等人[30,31]提出了形變卷積網絡(Deformation Convolution Network，DCN)，設計了可形變卷積和可形變ROI池化層.它們的感受野不再是一成不變的正方形，而是和物體的實際形狀相匹配，緩解了物體形變問題，使網絡學習了更多的空間位置信息，增強了定位能力.

2017年He等人[32]提出了Mask R-CNN算法，為了解決特征圖和原始圖像上的感興趣區域出現不對準問題提出了ROI Align層，并且增加了Mask預測分支，可以并行實現像素級的語義分割任務.而2018年Jiang等人[33]進一步改進了ROI Pooling提出了精準的感興趣區域池化(Precise ROI Pooling，PrROI Pooling).ROI Pooling采用的是最近鄰插值方法，它在將ROI映射到特征圖時和將ROI劃分池化區域時都存在取整近似運算，會丟失部分空間位置信息；ROI Align則取消了所有的取整運算，采用雙線性插值的方法計算每個空間塊的值，但只考慮N個插值點的值，而且N的大小是預定義的，不能根據空間塊的大小進行調整；而PrROI Pooling是采用二階積分的方法對空間塊進行池化操作，使感興趣區域保持更多的空間位置信息，實現更精準定位.

2.2.3 對區域提取網絡的改進研究

RPN是Faster R-CNN算法的主要創新點，它主要基于Anchor機制來產生大量目標候選區域.近年來的改進研究旨在產生更精確的候選區域，以提高檢測效果.

2017年，Zhao等人[34]提出了Cascade R-CNN算法，通過級聯三個區域交并比(Intersection Over Union，IOU)閾值遞增的R-CNN[15]檢測模型，對RPN產生的候選區域進行篩選，留下高IOU值的候選區域，有效提高了模型的檢測精度.與此不同，2018年Chen等人[35]在RPN階段引入上下文信息對候選區域進行微調，使得網絡定位的更加準確.

針對RPN中的Anchor機制需要人工預先設定尺度大小和長寬比等超參數的問題，2019年，Wang等人[36]提出了Guided-Anchoring方法，通過圖像特征來指導Anchor的生成.它由Anchor生成模塊和特征自適應模塊組成，其中Anchor生成模塊采用兩個分支分別預測Anchor的位置和形狀：位置預測分支預測出哪些區域作為中心點來生成Anchors；形狀預測分支則是根據位置預測分支得到的中心點來預測Anchor最佳的長和寬.特征自適應模塊根據生成的Anchor的形狀，使用一個3×3的可形變卷積來修正特征圖，以適應Anchor的形狀.

2.2.4 對NMS的改進研究

NMS算法首先人工設定一個IOU閾值，將同一類的所有檢測框按照分類置信度排序，選取分類置信度得分最高的檢測結果，去除那些與之IOU值超過閾值的相鄰結果，使網絡模型在召回率和精度之間取得較好的平衡.

NMS算法采用單一的IOU閾值會導致漏檢情況發生，為了解決這個問題，2017年，Bodla等人[37]提出了Soft NMS算法，它不是直接去除那些超過IOU閾值的相鄰結果，而是采用線性或者高斯加權的方式衰減它的置信度值，再選取合適的置信度閾值進行檢測框去重，對模型的漏檢有了很好的改善.在此基礎上，He等人[38]提出了Softer NMS算法，不是直接選取分類置信度得分最高的檢測框作為最終檢測結果，而是將與分類置信度最高的檢測框的交并比值大于一定閾值的所有檢測框的坐標進行加權平均，作為最終檢測結果，從而能夠更準確的定位物體.

2018年，Hu等人[39]提出目標關系模塊(Relation Module，RM)替代了NMS算法來對目標的檢測框進行去除冗余操作.RM借鑒了文獻[40]的思想對不同目標間的關系進行建模，并引入了注意力機制來優化檢測效果.同年，Jiang等人[33]發現檢測結果中存在分類置信度和定位準確度之間不匹配問題，所以提出了IOU-guided NMS[33]方法.他們將預測的檢測框與真值間的IOU值作為定位置信度，每一類根據定位置信度進行排序，從而改進了NMS過程，保留了定位更準確的檢測框.

針對常用的邊界框回歸損失函數(L1范數或L2范數)與IOU沒有強相關性，不能很好度量檢測框準確性的問題，2019年Hamid等人[41]提出了GIOU作為邊界框回歸損失函數，在計算檢測框與真值框IOU的基礎上，添加了對這兩個框的最小閉包區域面積的計算，通過IOU減去兩框非重疊區域占最小閉包區域的比重得到GIOU，其保留了IOU的原始性質的同時弱化了它的缺點，對邊界框的定位能力上有了大幅度的提升.

3 基于回歸的目標檢測算法綜述

基于回歸的目標檢測算法不需要候選區域生成分支，對給定輸入圖像，直接在圖像的多個位置回歸出目標的候選框和類別.本文將分成兩大系列來綜述基于回歸的目標檢測算法：YOLO[42]系列和SSD[43]系列.

3.1 YOLO系列目標檢測算法

2015年Redmon等人[42]提出了YOLO算法，將分類、定位、檢測功能融合在一個網絡當中，輸入圖像只需要經過一次網絡計算，就可以直接得到圖像中目標的邊界框和類別概率.如圖5所示，YOLO算法將整張輸入圖像劃分成S×S的網格圖，每個網格只負責物體中心落在該網格的目標物體以及只預測B個邊界框信息，然后選擇合適的置信度閾值去除那些存在目標可能性低的邊界框.雖然YOLO算法完全舍棄了候選區域生成步驟，極大提高了檢測速率，能滿足實時目標檢測的速度要求，但由于其網絡設計比較粗糙，遠遠達不到實時目標檢測的精度要求，而且存在目標不能精準定位、容易漏檢，小目標和多目標檢測效果不好等問題.

2017年Redmon等人[44]提出了YOLOv2算法，對YOLO算法進行了一系列改進，重點解決召回率低和定位精度差的問題.它借鑒了Faster R-CNN算法的Anchor機制，移除了網絡中的全連接層，使用卷積層預測檢測框的位置偏移量和類別信息.而且不同于原Anchor機制的手工設計，它利用K-Means聚類方式在訓練集中學習最佳的初始Anchor模板.不僅如此，YOLOv2添加了一個pass-through層，將淺層的特征圖連接到深層的特征圖，使網絡具有了細粒度特征.此外，YOLOv2可以采用多種數據集聯合優化訓練的方式，利用WordTree方法在ImageNet[45]分類數據集和MS COCO[46]檢測數據集上同步訓練，實現超過9000個目標類別的實時檢測任務.

2018年Redmon等人[47]提出了YOLOv3算法，它借鑒殘差網絡中跳躍連接的思路，構建了名為DarNet-53的53層基準網絡，該網絡只采用3×3和1×1的卷積層，具有與ResNet-152[48]相仿的分類準確率，但大大減少了計算量；為了處理多尺度目標，采用了3種不同尺度的特征圖來進行目標檢測，每個特征圖都是高層與淺層特征圖融合所得；在預測類別時，使用Logistic回歸方法代替Softmax方法，使得每個候選框可以預測多個類別，支持檢測具有多個標簽的對象.YOLOv3算法能滿足實時檢測任務的精度與速率的要求，成為了當前工程界首選的目標檢測算法之一.

3.2 SSD系列目標檢測算法

3.2.1 SSD算法

2016年Liu等人[43]提出了SSD算法，在回歸思想的基礎上，有效結合多尺度檢測的思想，提取多個不同尺度的特征圖進行檢測，遵循較大的特征圖用來檢測相對較小的目標，較小的特征圖檢測較大目標的策略，顯著提高了對大目標的檢測效果，對小目標檢測也有一定的提升.同時借鑒Faster R-CNN算法的Anchor機制，對提取的特征圖的每個位置上都預設固定數量的不同尺度和長寬比的先驗框(default boxes)，網絡可以直接在特征圖上進行密集采樣提取候選框進行預測，在保持實時檢測速度的同時，提高了模型的定位準確度.如圖6所示，SSD網絡是基于全卷積網絡結構，它將基礎網絡VGG16[49]的全連接層替換為了卷積層，并在VGG16[49]網絡末端添加了幾個使特征圖尺寸逐漸減小的輔助性卷積層，用于提取不同尺度的特征圖，而且直接采用卷積操作對不同尺度的特征圖進行檢測.

SSD算法在檢測的速度和精度上都超越了Faster R-CNN算法，但SSD算法提取的不同卷積層特征獨立輸入各自的檢測分支，容易出現同一個物體被不同大小的邊界框同時檢測出來的情況，即重復檢測問題.而且每層的檢測分支僅關注自己分支上特定尺度的目標，沒有考慮到不同層、不同尺度目標間的關聯性，所以對小目標檢測效果一般.

3.2.2 基于Anchor-based方式的改進

2017年Jisoo等人[50]提出了RSSD算法，其在SSD[43]算法的基礎上，對提取的不同尺度的特征采用了特殊的特征融合方式：對于每個特定的尺度特征，分別將比其大的尺度特征進行池化操作，比其小的尺度特征進行反卷積操作，然后將這些特征進行串接融合形成新的特定尺度特征.這種融合方式使得每個尺度的特征都具有其他尺度的信息，增加了不同層特征圖之間的聯系，避免了同一目標重復檢測的問題.同年，Cheng等人[51]提出了DSSD算法，將VGG16[49]替換為ResNet101[48]，增強了網絡特征提取能力，并設計了兩個特殊的模塊：預測模塊和反卷積模塊.預測模塊的結構類似殘差模塊，通過跳躍連接實現不同層特征之間的融合，從而提高特征的表征能力.反卷積模塊則是采用反卷積操作建立了一個Top-to-Down路徑，得到新的不同尺度的特征圖，這些特征圖融合了高層與淺層特征，引入了豐富的空間上下文信息，使得DSSD算法在檢測精度上有了大幅度的提升，但檢測速度有較大犧牲.在此基礎上，Lin等人[52]提出了RetinaNet算法，針對SSD算法因密集采樣導致的難易樣本嚴重失衡問題，提出了Focal Loss函數，其是在交叉熵損失函數的基礎上添加了兩個平衡因子，抑制了簡單樣本的梯度，將更多的注意力放在難分的樣本上.受Focal Loss的啟發，Li等人[53]提出了梯度協調機制(Gradient Harmonizing Mechanism,GHM)來解決樣本失衡問題，這種機制可以同時嵌入分類和回歸損失中來平衡訓練樣本的梯度，不僅減少了易分樣本的關注，而且避免了特別難分樣本對模型的負面影響.

2018年Liu等人[54]提出了RFB-Net算法，通過模擬人類視覺感受野，設計了感受野模塊(Receptive Field Block，RFB)增加網絡的特征提取能力.RFB結構借鑒了Inception[55]的思想，引入三個不同擴張率的3×3卷積層增大感受野，并且將這三個卷積的輸出以串接方式進行特征融合.此外，Zhang等人[56]提出了RefineDet算法，結合了一階段和二階段檢測算法的優點，設計了兩個模塊：物體檢測模塊和Anchor微調模塊，前者對密集的Anchors進行篩選去除一些不包含物體的負樣本，同時粗調篩選后的Anchors位置和尺寸，后者對物體檢測模塊輸出的Anchors進一步回歸，這使得網絡進行了兩次回歸任務，有效提升了網絡定位能力，并且樣本的篩選有效緩解了正負樣本不均衡問題.

SSD最新的改進研究[57～61]更加關注于合理和高效的運用FPN結構，提取具有豐富上下文信息和空間信息的多尺度特征，解決目標尺度變化問題.Ghaisi等人[58]受到神經結構搜索(Neural Architecture Search,NAS)的啟發，提出了NAS-FPN算法，該網絡模型自動搜索設計最優的FPN結構，實現跨尺度的特征融合，在網絡性能上超越了Mask R-CNN,但模型的訓練需要大量的GPU支持.此外，Zhao等人[59]提出了多層特征金字塔網絡(Multi-Level Feature Pyramid Network,MLFPN)，通過級聯多個小型的FPN子網絡，形成不同層級的不同尺度特征，并對特征進行充分的重利用和融合，使網絡性能和小目標檢測都有很大的提升.

3.2.3 基于Anchor-free方式的改進

雖然SSD算法借鑒Anchor機制的思想大幅度提高了網絡的定位能力.但Anchor機制中存在兩個人工設計的超參數：尺度大小和長寬比.這不僅需要較強的先驗知識，而且提取的候選區域太多，增加了計算開銷，還引起正負樣本不均衡問題，所以有些研究者提出了Anchor-free的改進方法.

2018年，Hei Law等人[62]提出了CornerNet算法，借鑒了文獻[63]對關鍵點檢測的思想，采用Hourglass104網絡[63]作為特征提取網絡，直接預測物體的左上角點和右下角點來得到檢測框，將目標檢測問題當作關鍵點檢測問題來解決.在此基礎上，Zhou等人[64]提出了ExtremeNet算法，在關鍵點選取和關鍵點組合方式上做出了創新，通過選取物體上下左右四個極值點和一個中心點作為關鍵點，更加直接關注物體邊緣和內部信息，使得檢測更加穩定.Duan等人[65]發現ConerNet只使用左右角點會造成大量的誤檢，為了解決這個問題，提出了CenterNet算法，它在CornerNet的基礎上添加了中心點預測分支，使得組成一個物體檢測框的要求不僅僅是左右角點能夠匹配，而且檢測框的中心點也要有對應的中心點匹配.

上述的Anchor-free的方法都是基于人體關鍵點檢測的思想，使用非常龐大的Hourglass-104[63]網絡作為特征提取網絡，與此不同的是，Zhi等人[66]提出了基于全卷積的一階段目標檢測器(Fully Convolutional One-Stage object detection，FCOS),借鑒語義分割任務的思想，采用逐像素預測方式解決目標檢測問題，完全避免了與Anchor相關的復雜計算和超參數設計，同時使用FPN結構實現多尺度目標的預測，每個預測分支中添加了中心點損失來抑制中心點偏差大的檢測框，保證每個檢測框盡可能靠近目標中心，提高了模型定位能力.

4 相關數據集綜述

當前通用目標檢測任務中流行的數據集有：PASCAL VOC2007[19]、PASCAL VOC2012[67]、MS COCO[46]、ImageNet[45]、Open Images[68]、LIVS[69]等.

PASCAL VOC[19,67]數據集主要用于圖像分類和目標檢測任務，主要流行的有PASCAL VOC2007[19]數據集和PASCAL VOC2012[67]數據集.它們包含了20個常見的類別，每張圖片都有與之對應的XML文件標注了每個待檢測目標的位置和類別.

MS COCO[46]數據集用于目標檢測、語義分割、人體關鍵點檢測和字幕生成等任務，對于目標檢測任務，它是挑戰性最大的數據集之一.該數據集中的目標大部分來自于自然場景，包含日常復雜場景的圖像，而且在進行評估時使用更加嚴格的評估標準，要求算法具有更精確的定位能力.該數據集使用JSON格式的標注文件給出每張圖片中目標像素級別的分割信息，而且數據集中共包含80個對象類別的待檢測目標，目標間的尺度變化大，具有較多的小目標物體.

ImageNet[45]數據集用于圖像分類、目標檢測和場景分類等任務，包含約1420萬張圖片，2.2萬個類別，其中約103萬張圖片擁有明確的類別標注和物體的位置標注.對于目標檢測任務，它是具有200個對象類別的重要數據集，每張圖片的批注都以PASCAL VOC數據格式保存在XML文件中.

Open Images[68]數據集是對圖像分類、目標檢測、視覺關系檢測和實例分割等任務具有統一注釋的單個數據集，對于目標檢測任務，它總共包含190萬張圖片和針對600個對象類別的1600萬個邊界框，是具有對象位置注釋的最大現有數據集.

LIVS[69]數據集是2019年提出的大型實例分割數據集，包含了1000多個類別，164000張圖像，220萬個高質量的實例分割掩碼，這是即將應用于目標檢測領域的全新數據集，而且LIVS數據集中每個對象類別的訓練樣本很少，旨在用于目標檢測在低樣本數量條件下的研究.

5 總結和展望

目標檢測是一個十分重要的研究領域，具有廣泛的應用前景.本文將近些年涌現的基于深度學習的目標檢測算法分為基于候選區域和基于回歸的前提下，對這兩類算法從發展及不同方向的改進研究角度進行了詳細的綜述.并介紹了目前目標檢測領域流行的數據集.雖然當前目標檢測算法在實際生活中得到了廣泛應用，但依然存在許多挑戰，未來目標檢測算法在以下幾個方面值得進一步研究：

一是如何有效的結合上下文信息，解決小目標和被遮擋目標在復雜現實場景的檢測；二是探索更優的或專門為檢測任務設計的特征提取網絡，以及更優的檢測框選定方法；三是現在的目標檢測算法都是基于監督學習，現實中存在海量沒有標注的數據，所以研究如何采用弱監督學習的目標檢測算法是非常有價值的；四是探索如何從已知類別的目標檢測，結合有效語義信息，遷移到未知類別的目標檢測也是一個值得研究的方向.

編輯：黃飛

閱讀全文

計算機視覺(45543) 計算機視覺(45543)
深度學習(119798) 深度學習(119798)
卷積神經網絡(11634) 卷積神經網絡(11634)

深度學習中的YOLOv2-Tiny目標檢測算法詳細設計

近年來，以卷積神經網絡（Convolutional Neural Network，DNN）為代表的深度學習算法在許多計算機視覺任務上取得了巨大突破，如圖像分類、目標檢測、畫質增強等［1-2］。然而

2020-11-30 14:01:46

10735

深度學習RCNN算法

目標檢測算法圖解：一文看懂RCNN系列算法

2019-08-29 09:50:56

目標檢測 | 已開源！全新水下目標檢測算法SWIPENet+IMA框架

，基于深度學習的方法在標準的目標檢測中取得了可喜的性能。水下目標檢測仍具有以下幾點挑戰：（1）水下場景的實際應用中目標通常很小，含有大量的小目標；（2）水下數據集和實際應用中的圖像通常是模糊的，圖像中具有

2020-07-24 11:05:39

Labview深度學習tensorflow人工智能目標檢測-教學貼【連載】

本帖最后由 wcl86 于 2021-6-3 16:23 編輯應廣大學員要求，現開通Labview深度學習tensorflow人工智能目標檢測-教學貼，有需要的學員，可以收藏本貼，接下來會

2021-05-28 11:58:52

Nanopi深度學習之路(1)深度學習框架分析

著手，使用Nanopi2部署已訓練好的檢測模型，例如硅谷電視劇的 Not Hotdog 檢測器應用，會在復雜的深度學習歷程中有些成就感。目前已有幾十種流行的深度學習算法庫，參考網址：https

2018-06-04 22:32:12

PowerPC小目標檢測算法怎么實現？

檢測系統在低功耗、輕小型化等方面提出了更高的要求。因此,完成小目標檢測任務不僅需要尋求合理的小目標檢測算法,在實現時還需要考慮處理性能和體積功耗。

2019-08-09 07:07:03

【HarmonyOS HiSpark AI Camera】基于深度學習的目標檢測系統設計

、并行處理、從目標檢測算法嵌入式平臺的實現的設計要求出發，基于深度學習的目標檢測算法特點，采用軟硬件協同設計思想進行總體架構設計，使得可編程邏輯部分可進行參數可配置以處理不同參數和結構的網絡層，具有一定

2020-09-25 10:11:49

【米爾FZ3深度學習計算卡試用體驗】深度學習體驗自定義硬件

可能是操作的不當，看看其他的怎么樣的結果。1.2 深度學習之圖像檢測基于圖片的圖像分類采取以下指令：./image_detection../configs/vgg-ssd/screw.json其采取的算法

2020-11-20 15:32:04

人臉檢測算法及新的快速算法

人臉檢測算法及新的快速算法人臉識別設備憑借著便捷的應用，以及更加新潮的技術，俘獲了不少人的好感。于是，它的應用也在日益的變得更加的廣泛。由中國電子學會主辦的全國圖形圖像技術應用大會，行業專家將介紹

2013-09-26 15:13:24

全網唯一一套labview深度學習教程：tensorflow+目標檢測：龍哥教你學視覺—LabVIEW深度學習教程

缺陷檢測算法結構通過圖像預處理得到便于檢測的圖像，隨后借助統計機器學習方法來提取圖像特征，進而實現缺陷檢測的目標。圖像預處理通常包括直方圖均衡化、濾波去噪、灰度二值化、再次濾波幾部分，以得到前后景分離

2020-08-10 10:38:12

分享一款高速人臉檢測算法

目前優化了一款高速人臉檢測算法，在 ARM設備的A73單核CPU(圖像大小:860*540最小人臉大小：60*60)速度可以高達10-15ms每幀，真正的實時人臉檢測算法，算法準確率在 FDDB數據

2021-12-15 07:01:06

基于Qualcomm FastCv的邊緣檢測算法詳解

微分邊緣檢測算法主要是基于圖像強度的一階和二階導數，而導數的計算對噪聲很敏感，噪聲的存在可能會使檢測到的邊緣變寬或在某些點處發生間斷，因此，需要使用濾波器來濾掉噪聲。大多數濾波器在降低噪聲的同時也

2018-09-21 11:45:44

基于YOLOX目標檢測算法的改進

1、介紹近年來，自動駕駛汽車不斷走進我們的視野中，面向自動駕駛的目標檢測算法也成為了國內外的研究熱點之一。安全可靠的自動駕駛汽車依賴于對周圍環境的準確感知，以便及時做出正確的決策。目標檢測是自動駕駛

2023-03-06 13:55:27

如何去實現相位模糊估計的幀同步檢測算法？

什么是同步檢測算法？如何去實現相位模糊估計的幀同步檢測算法？

2021-05-06 07:23:16

對手腕PPG信號實施PRV分析的可靠峰值和起始點檢測算法解析

本文提出了可對手腕PPG信號實施PRV分析的可靠峰值和起始點檢測算法。

2021-06-17 09:25:04

機器學習簡介與經典機器學習算法人才培養

經典機器學習算法介紹章節目標：機器學習是人工智能的重要技術之一，詳細了解機器學習的原理、機制和方法，為學習深度學習與遷移學習打下堅實的基礎。二、深度學習簡介與經典網絡結構介紹神經網絡簡介神經網絡組件簡介

2022-04-28 18:56:07

求Matlab圖像自編邊緣檢測算法

求Matlab圖像自編邊緣檢測算法,多謝了

2013-12-03 20:58:39

求一種基于機載單通道SAR數據的地面運動目標檢測算法

兩通道DPCA動目標檢測原理是什么？基于機載單通道SAR數據的地面運動目標檢測算法

2021-06-03 06:04:06

邊緣檢測算法分為哪幾種？它們有何不同？

邊緣檢測是什么？邊緣檢測算子有哪些？邊緣檢測算法分為哪幾種？它們有何不同？

2021-05-31 06:57:51

雷達目標檢測算法研究及優化

的檢測。４．３二維多策略恒虛警檢測算法設計４．３．１ＣＦＡＲ檢測畝設計考慮到高鐵場景下線性調頻連續波雷迭回波信號可能包含大量干擾因素，如地面、灌木叢、鐵軌

2018-03-29 10:53:32

雷達目標檢測算法研究及優化

目標的檢測。４．３二維多策略恒虛警檢測算法設計４．３．１ＣＦＡＲ檢測畝設計考慮到高鐵場景下線性調頻連續波雷迭回波信號可能包含大量干擾因素，如地面、灌木叢

2018-02-28 09:19:59

一種改進的基于光流的運動目標的檢測算法

摘要：討論了序列圖像的運動目標檢測算法，在傳統的光流場計算方法的基礎上，提出了基于幀間差閾值法的快速光流算法。整個算法簡單、有效，保證了序列圖像中運動目標跟

2009-01-09 12:06:23

基于像素分類的運動目標檢測算法

針對復雜環境下運動目標檢測提出一種基于像素分類的運動目標檢測算法。該算法通過亮度歸一化對圖像序列進行預處理，用以降低光照變化造成的誤檢，根據場景中不同像素點的

2009-04-10 08:51:01

基于小波變換多尺度Harris角點檢測算法

提出一種新的基于小波變換的Harris 多尺度角點檢測算法，可以在不同的尺度下獲取角點，克服了單一尺度的Harris 角點檢測算法可能存在的角點信息丟失和易受噪聲影響而檢測出

2010-01-09 11:18:25

基于修正Hung-Turner投影的快速信源數檢測算法

空間信源數檢測是陣列信號處理的關鍵問題之一，常用的信源數檢測算法需要計算采樣協方差矩陣的特征值，該文提出一種基于改進Hung-Turner 投影的多目標信源數快速檢測算法，該

2010-02-09 11:22:23

一種微分極值的邊緣檢測算法

一種微分極值的邊緣檢測算法 本文通過對邊緣點的定義，提出了一種微分極值的邊緣檢測算法。與經典微分算法相比，該算法直接在邊緣檢測窗口內提取邊界像

2010-02-22 15:03:56

無源時差定位系統的靜止目標聚類檢測算法

利用時差定位系統的定位誤差特性，基于蟻群優化算法，提出了一種蟻群聚類檢測算法，在不需要先驗信息的情況下，實現了對靜止目標的檢測。實際數據測試結果表明蟻群聚類檢

2010-03-06 11:32:42

博瓦科技智慧安防AI人員入侵檢測算法安全監測識別系統

智慧安防AI人員入侵檢測算法系統借助智能視頻分析技術和YOLO深度學習技術的支持，能夠對現場監控攝像機獲取的視頻進行實時分析和處理。系統根據預先設定的禁止入內地區，通過現場監測攝像機可以準確地監測

2023-12-11 15:37:47

運動序列目標檢測算法研究及DSP實現

由于實際場景的多樣性，目前常用的運動目標檢測算法都還存在一定程度的缺陷，因此本文提出了一種將幀差法和背景減法相結合的方法，實現快速精確地檢測和提取運動目標。實

2010-07-27 16:42:07

#硬聲創作季機器學習_10.異常檢測算法

檢測算法機器學習

深海狂鯊發布于 2022-10-29 10:46:42

基于碼本模型的運動目標檢測算法

本內容提供了基于碼本模型的運動目標檢測算法

2011-05-19 10:54:01

基于Canny檢測算法實現的目標跟蹤

為了設計一種實時高效、穩定可靠的圖像目標跟蹤系統平臺，避免因圖像邊緣提取效果差而引起跟蹤失敗，采用自適應Canny邊緣檢測算法。該自適應算法能夠很好的確定平滑參數以及高

2012-03-05 16:14:13

一種基于背景減法和幀差的運動目標檢測算法

針對幀差分法易產生空洞以及背景減法不能檢測出與背景灰度接近的目標的問題，提出了一種將背景減和幀差法相結合的運動目標檢測算法。首先利用連續兩幀圖像進行背景減法得到兩

2013-03-01 15:10:35

基于Surendra改進的運動目標檢測算法

提出了一種基于Surendra改進的運動目標檢測算法，通過對背景更新系數的改進，獲取穩定準確的背景，再將背景幀與含運動區域的圖像幀用差分運算獲得運動目標圖像。實驗結果表明，

2013-08-07 19:02:35

一種基于深度神經網絡的基音檢測算法

一種基于深度神經網絡的基音檢測算法_曹猛

2017-01-07 19:08:43

空瓶的智能檢測算法研究_劉煥軍

空瓶的智能檢測算法研究_劉煥軍

2017-01-14 22:34:29

改進的ViBe運動目標檢測算法_劉春

改進的ViBe運動目標檢測算法_劉春

2017-03-19 11:41:39

二維EMD的指紋邊緣檢測算法_賈可

二維EMD的指紋邊緣檢測算法_賈可

2017-03-19 19:04:23

改進的MIMO系統球譯碼檢測算法_仵丹

改進的MIMO系統球譯碼檢測算法_仵丹

2017-03-19 19:04:23

行人慣性導航零速檢測算法_費程羽

行人慣性導航零速檢測算法_費程羽

2017-03-19 19:07:04

基于機器視覺的色差檢測算法_范鵬飛

基于機器視覺的色差檢測算法_范鵬飛

2017-03-19 19:25:56

基于背景碼本模型的運動目標檢測算法

提出一種基于背景碼本模型的視頻圖像中運動目標的檢測算法。該算法利用歸一化的Mann-Whitney秩和統計量自適應調整判決??????閾值，使用Mean shift進行碼本中碼字和方差的更新。

2017-09-08 15:20:46

基于自適應閥值分割的慢速小目標檢測算法

針對復雜運動背景中慢速小目標檢測誤檢率高，實時性差等問題，提出了基于自適應閡值分割的慢速小目標檢測算法。首先計算連續兩幀圖像特征點的金字塔光流場，對光流場進行濾波，獲取匹配特征點集合。然后對圖像運動

2017-11-09 15:17:32

基于自適應虛擬線圈的車流量檢測算法

改進的ViBe算法，以達到快速消除鬼影的目的，更準確地完成前景目標提取。在道路上設置固定檢測區域，根據運動目標在固定檢測區域的運動軌跡來建立或者消除非固定虛擬線圈，再進一步使用虛擬線圈的車流量檢測算法實現車流量統計

2017-12-08 14:56:39

一種改進的MIMO檢測算法

本文針對現有的ML（Maximum Likelihood）檢測算法復雜度高，而傳統檢測算法性能不是很優的問題，提出了一種新的檢測算法。新的檢測算法結合ZF-OSIC和ML檢測算法，根據ZF-OSIC

2017-12-29 14:52:21

機器學習算法概覽:異常檢測算法/常見算法/深度學習

異常檢測，顧名思義就是檢測異常的算法，比如網絡質量異常、用戶訪問行為異常、服務器異常、交換機異常和系統異常等，都是可以通過異常檢測算法來做監控的，個人認為這種算法很值得我們做監控的去借鑒引用，所以我會先單獨介紹這一部分的內容。

2018-04-11 14:20:00

17375

基于SSD網絡模型的多目標檢測算法

針對現代化工廠巾視覺機器人或智能終端處理多目標檢測算法的計算任務繁重、運算速度較慢等問題，將網絡通信技術應用到算法處理巾進行了在線檢測。對TCP/IP協議進行了研究，建立了智能終端和云端之間的關系

2018-03-02 10:51:54

基于深度自編碼網絡的慢速移動目標檢測

自編碼網絡算法，在時頻域提取針對目標的深度抽象信息進行目標檢測，以準確感知環境變化。仿真結果表明，與支持向量機、超限學習機和后向傳播神經網絡等傳統機器學習相比，該方法可以有效感知環境變化，具有較高的魯棒性和

2018-03-29 11:29:40

基于yolo算法進行改進的高效衛星圖像目標檢測算法

同時目標檢測算法對于不常見的的比例或新的圖像分布缺乏一定的泛化能力。由于物體可能的方向和尺寸比例各不相同，算法有限的比例變化對于特殊目標的檢測就會失效。為了解決這一問題，研究人員對數據進行了旋轉和HSV的隨機增強，是算法對于不同傳感器、大氣條件和光照條件具有更強的魯棒性。

2018-06-01 16:35:08

11261

基于深度學習模型的點云目標檢測及ROS實現

近年來，隨著深度學習在圖像視覺領域的發展，一類基于單純的深度學習模型的點云目標檢測方法被提出和應用，本文將詳細介紹其中一種模型——SqueezeSeg，并且使用ROS實現該模型的實時目標檢測。

2018-11-05 16:47:29

17181

如何使用深度學習進行視頻行人目標檢測

近年來，隨著深度學習在計算機視覺領域的廣泛應用，基于深度學習的視頻運動目標檢測受到廣大學者的青睞。這種方法的基本原理是利用大量目標樣本數據訓練一個基于深度神經網絡的分類器，然后通過分類器在線檢測目標

2018-11-19 16:01:44

如何基于深度學習的復雜氣象條件下海上船只檢測

為了解決復雜海情環境下的不同種類和大小的艦船檢測問題，提出一種實時的深度學習的目標檢測算法。首先，提出了一種清晰圖片和模糊圖片（雨、霧等圖片）判別的方法；然后，在YOLO v2的深度學習框架的基礎上

2018-12-19 17:08:46

使用深度卷積神經網絡實現深度導向顯著性檢測算法

　針對目前基于深度卷積神經網絡的顯著性檢測算法存在對復雜場景圖像目標檢測不完整、背景噪聲多的問題，提出一種深度特征導向顯著性檢測算法。該算法是基于現有底層特征與深度卷積特征融合模型（ELD）的改進

2019-11-15 17:56:07

傳統檢測、深度神經網絡框架、檢測技術的物體檢測算法全概述

物體檢測一向是比較熱門的研究方向，它經歷了傳統的人工設計特征+淺層分類器的框架，到基于大數據和深度神經網絡的End-To-End的物體檢測框架的發展，然而許多人其實并未系統的了解過物體檢測算法的整個

2020-10-22 15:07:58

2444

如何實現一種深度特征導向顯著性檢測算法

針對目前基于深度卷積神經網絡的顯著性檢測算法存在對復雜場景圖像目標檢測不完整，背景噪聲多的問題，提出一種深度特征導向顯著性檢測算法。該算法是基于現有底層特征與深度卷積特征融合模型（ELD）的改進

2020-11-03 16:31:44

基于深度學習YOLO系列算法的圖像檢測

目前，基于深度學習算法的一系列目標檢測算法大致可以分為兩大流派：兩步走（two-stage）算法：先產生候選區域然后再進行CNN分類(RCNN系列) 一步走（one-stage）算法：直接對輸入

2020-11-27 10:15:56

3195

新型基于深度學習的目標實時跟蹤算法

　　針對基于深度學習的目標跟蹤算法模型參數多、難以部署于嵌入式設備上的問題，提出一種改進的孿生卷積網絡實時目標跟蹤算法。設計一個非對稱卷積模塊來構建整個網絡框架，通過非對稱卷積模塊的壓縮層減少模型

2021-03-11 10:41:04

基于通道注意力機制的SSD目標檢測算法

為提升原始SSD算法的小目標檢測精度及魯棒性，提出一種基于通道注意力機制的SSD目標檢測算法。在原始SSD算法的基礎上對高層特征圖進行全局池化操作，結合通道注意力機制增強高層特征圖的語義信息，并利用

2021-03-25 11:04:06

基于深度學習的疲勞駕駛檢測算法及模型

為實現復雜駕駛環境下駕駛人員疲勞狀態識別與預警，提出基于深度學習的疲勞駕駛檢測算法。利用基于 shuffle- channel思想的 MTCNN模型檢測常規攝像頭實時采集的駕駛人員人臉圖像

2021-03-30 09:17:55

基于深度學習的顯著性目標檢測的數據集和評估準則

隨著深度學習的不斷發展，基于深度學習的顯著性目標檢測已經成為計算機視覺領堿的一個研究熱點。首先對現有的基于深度學習的顯著性目標檢測算法分別從邊界/語義増強、全局/局部結合和輔助網絡個角度進行了分類

2021-04-01 14:58:13

一種融合深度和淺層特征的多視覺癲癇檢測算法

。為了獲得更妤的癲癇檢測效果，提岀了一種融合深度和淺層特征的多視角癲癇檢測算法該算法首先使用FFT和WPD來獲取EEG信號頻域和時頻域的淺層特征;然后使用CNN網絡學習得到頻域和時頻域的深度特征;進一步使用多視角TSK模糊系統對淺層和

2021-04-07 10:58:03

基于深度學習的跨域小樣本人臉欺詐檢測算法

層，提出種基于深度特征増廣的跨堿小樣夲人臉欺詐檢測算法。該算法在已有的基于全卷積神經網絡的人臉欺詐檢測深度神經網絡的中部嵌入域自適應層將卷積特征圖増廣，來適配源域和目標堿的差異，隨后根據増廣后的特征圖進行

2021-04-15 09:40:35

基于深度學習的目標檢測算法

整體框架目標檢測算法主要包括：【兩階段】目標檢測算法、【多階段】目標檢測算法、【單階段】目標檢測算法 什么是兩階段目標檢測算法，與單階段目標檢測有什么區別？兩階段目標檢測算法因需要進行兩階

2021-04-30 10:22:04

10070

基于激光雷達點云的三維目標檢測算法

文中提出了一種基于激光雷達點云的三維目標檢測算法 Voxeircnn（ Voxelization Region-based Convolutional Neural Networks），該算法

2021-05-08 16:35:24

基于強化學習的偽裝攻擊檢測算法

在移動霧計算中，霧節點與移動終端用戶之間的通信容易受到偽裝攻擊，從而帶來通信和數據傳輸的安全問題。基于移動霧環境下的物理層密鑰生成策略，提出一種基于強化學習的偽裝攻擊檢測算法。構建移動霧計算中的偽裝

2021-05-11 11:48:39

基于車輛軌跡特征的視頻異常事件檢測算法

交通領堿的異常事件檢測對于預防和及時處理交通事故有著重要作用。當前大多數交通異常事件檢測都是通過人工完成的，耗費了大量的人力，同時實時性也較差。文中針對高速公路的交通場景特點，利用深度學習中的目標

2021-05-13 14:45:33

基于CNN的無線電調頻廣播同頻干擾檢測算法

針對無線電干擾中較為突出的同頻干擾問題，將深度學習應用于干擾信號檢測，提出一種無線電調頻廣播同頻干擾檢測算法。將調頻廣播數據轉化為能體現信號特性的小波變換時頻圖，并將其作為卷積神經網絡（CNN的訓練

2021-05-25 16:53:56

一種改進的單激發探測器小目標檢測算法

基于單激發探測器（SSD）的小目標檢測算法實時性較差且檢測精度較低。為提高小目標檢測精度和魯棒性提出一種結合改進密集網絡和二次回歸的小目標檢測算法。將SSD算法中骨干網絡由ⅤGG16替換為特征提取

2021-05-27 14:32:09

基于多尺度融合SSD的小目標檢測算法綜述

針對一階段目標檢測算法在識別小目標時無法兼顧精度與實時性的問題，提出一種基于多尺度融合單點多盒探測器（SSD）的小目標檢測算法。以SSD和DSSD算法的網絡結構為基礎，設計融合模塊以實現

2021-05-27 16:32:23

基于YOLOv3的嵌入式設備視頻目標檢測算法

深度神經網絡在目標檢測領域具有優異的檢測性能，但其結構復雜、計算量大，難以在嵌入式設備上進行髙性能的實時目標檢測。針對該問題，提出一種基于 YOLOV3的目標檢測算法。采用半精度推理策略提高YOLO

2021-05-28 14:05:52

基于深度信念網絡的DDoS攻擊檢測算法

差等缺陷，為此，提出一種基于深度信念網絡（DBN）的DDoS攻擊檢測算法。分析SDN環境下DDoS攻擊的機制，通過Wininet模擬SDN的網絡拓撲結構，并使用 Wireshark完成DDoS流量數據包的收集和檢測。實驗結果表明，與ⅹ Gboost、隨機森林、支持向量機算法相比，該算法具有

2021-06-01 16:28:34

基于深度學習的發動機零件檢測算法

針對人工和傳統自動化算法檢測發動機零件表面缺陷中準確率和效率低下，無法滿足智能制造需求問題提岀了一種基于深度學習的檢測算法。以 Faster r-CNN深度學習算法為算法框架，引入聚類理論來確定

2021-06-03 14:51:54

基于深度學習的目標檢測研究綜述

的研究背景、意義及難點，接著對基于深度學習目標檢測算法的兩大類進行綜述，即基于候選區域和基于回歸算法.對于第一類算法，先介紹了基于區域的卷積神經網絡(Region with Convolutional Neural Network，R-CNN)系列算法，然后從四個維度綜述了研

2022-01-06 09:14:58

1702

基于Grad-CAM與KL損失的SSD目標檢測算法

基于Grad-CAM與KL損失的SSD目標檢測算法 來源：《電子學報》，作者侯慶山等摘要：?鑒于Single Shot Multibox Detector (SSD)算法對中小目標檢測

2022-01-21 08:40:14

786

基于深度卷積神經網絡的目標檢測研究

檢測并獲得更好的性能是一項重要的研究。首先回顧和介紹了幾類經典的目標檢測算法;然后將深度學習算法的產生過程作為切入點，以系統的方式全面概述了各種目標檢測方法;最后針對目標檢測和深度學習算法面臨的重大挑戰，討論了一些未來的方向，以促進深度學習對目標檢測的研究。

2022-02-11 08:51:11

1144

一種改進的高光譜圖像CEM目標檢測算法

一種改進的高光譜圖像CEM目標檢測算法 ? 來源：《?應用物理》?，作者付銅銅等摘要:? 約束能量最小化(Constrained Energy Minimization, CEM)目標檢測算法

2022-03-05 15:47:03

824

淺談紅外弱小目標檢測算法

紅外單幀弱小目標檢測算法主要通過圖像預處理突出小目標同時抑制背景噪聲干擾，之后采用閾值分割提取疑似目標，最后根據特征信息進行目標確認。

2022-08-04 17:20:09

4605

深度學習在目標檢測中的應用

R-CNN 算法在 2014 年提出，可以說是歷史性的算法，將深度學習應用于目標檢測領域，相較于之前的目標檢測方法，提升多達 30% 以上

2022-10-31 10:08:05

1143

基于深度神經網絡的多領域實時目標檢測算法

基于深度神經網絡的目標檢測器不斷發展，并用于多種應用，每個應用都有自己的一組要求。安全關鍵型的應用程序需要高精度和可靠性，而低延遲的任務需要節約資源的神經網絡結構。

2022-11-04 17:27:04

1060

基于MobileNet的多目標跟蹤深度學習算法

針對深度學習算法在多目標跟蹤中的實時性問題, 提出一種基于MobileNet的多目標跟蹤算法. 借助于MobileNet深度可分離卷積能夠對深度網絡模型進行壓縮的原理, 將YOLOv3主干網絡替換

2022-11-09 10:23:30

736

基于深度學習的目標檢測方法

為驗證本文算法對不同大小目標的檢測精度, 實驗中隨機選取100張圖片, 其中包含198個目標, 將其分為大、中、小三類. 由于該網絡的輸入圖像尺寸為300××300, 將圖像中的檢測目標按照其面積占圖像總面積的比例分為三類。

2022-12-05 12:20:54

974

目標檢測算法有哪些目標檢測算法原理圖

目標檢測定義，識別圖片中有哪些物體以及物體的位置（坐標位置）。其中，需要識別哪些物體是人為設定限制的，僅識別需要檢測的物體

2022-12-06 15:49:22

3833

解開車輛檢測算法之謎

解開車輛檢測算法之謎

2023-01-05 09:43:38

803

簡述深度學習的基準目標檢測及其衍生算法

基于深度學習的目標檢測方法根據有無區域提案階段劃分為區域提案檢測模型和單階段檢測模型

2023-02-27 15:31:49

814

快速入門自動駕駛中目標檢測算法

現在目標檢測算法總結 1. 目標檢測算法在機動車和行人檢測識別上應用較多，在非機動車上應用較少 2. 對于目標檢測模型增強特征表示和引入上下文信息的改進方法幾乎對任何場景和任何任務都是有利

2023-06-06 09:40:12

如何學習基于Tansformer的目標檢測算法

，也是近年來理論研究的熱點。作為計算機視覺中的基礎算法，目標檢測對后續的人臉識別、目標跟蹤、實例分割等任務都起著至關重要的作用。基于深度學習的卷積學習網絡（CNN）在目標檢測任務上取得了優越的性能，例如FasterRCNN、

2023-06-25 10:37:48

357

基于深度學習模型融合的產品工藝缺陷檢測算法簡述

?基于深度學習模型融合的工業產品（零部件）工藝缺陷檢測算法簡述 1、序言隨著信息與智能化社會的到來，工業產品生產逐漸走向智能化生產，極大地提高了生產力。但是隨著工人大規模解放，產品或零部件的缺陷

2023-07-06 14:49:57

339

無Anchor的目標檢測算法邊框回歸策略

導讀本文主要講述：1.無Anchor的目標檢測算法：YOLOv1，CenterNet，CornerNet的邊框回歸策略；2.有Anchor的目標檢測算法：SSD，YOLOv2，Faster

2023-07-17 11:17:05

558

基于強化學習的目標檢測算法案例

摘要：基于強化學習的目標檢測算法在檢測過程中通常采用預定義搜索行為，其產生的候選區域形狀和尺寸變化單一，導致目標檢測精確度較低。為此，在基于深度強化學習的視覺目標檢測算法基礎上，提出聯合回歸與深度

2023-07-19 14:35:02

基于Transformer的目標檢測算法

掌握基于Transformer的目標檢測算法的思路和創新點，一些Transformer論文涉及的新概念比較多，話術沒有那么通俗易懂，讀完論文仍然不理解算法的細節部分。

2023-08-16 10:51:26

363

深度學習算法簡介深度學習算法是什么深度學習算法有哪些

深度學習算法簡介深度學習算法是什么?深度學習算法有哪些?? 作為一種現代化、前沿化的技術，深度學習已經在很多領域得到了廣泛的應用，其能夠不斷地從數據中提取最基本的特征，從而對大量的信息進行機器學習

2023-08-17 16:02:56

6010

什么是深度學習算法？深度學習算法的應用

什么是深度學習算法？深度學習算法的應用深度學習算法被認為是人工智能的核心，它是一種模仿人類大腦神經元的計算模型。深度學習是機器學習的一種變體，主要通過變換各種架構來對大量數據進行學習以及分類處理

2023-08-17 16:03:04

1305

瑞薩電子深度學習算法在缺陷檢測領域的應用

浪費大量的人力成本。因此，越來越多的工程師開始將深度學習算法引入缺陷檢測領域，因為深度學習在特征提取和定位方面取得了非常好的效果。

2023-09-22 12:19:00

449

已全部加載完成

搜索歷史

基于深度學習的目標檢測算法解析

評論