目標(biāo)檢測是指在視頻或圖片序列中把感興趣的目標(biāo)與背景區(qū)分,是在圖像中確定目標(biāo)是否存在且確定目標(biāo)位置的過程,是計算機視覺領(lǐng)域中的主要研究方向。
目標(biāo)檢測主要應(yīng)用于人臉識別、無人駕駛、指控和安防等領(lǐng)域,起到人工智能賦能傳統(tǒng)應(yīng)用的作用。目標(biāo)檢測的核心是算法。目前,目標(biāo)檢測算法主要分為兩大類,第一類是基于手工設(shè)計特征的傳統(tǒng)算法,第二類是基于深度學(xué)習(xí)的目標(biāo)檢測算法。
常見經(jīng)典目標(biāo)檢測算法
經(jīng)典目標(biāo)檢測算法有R-CNN、SPP-Net、Fast R-CNN和R-FCN等。
R-CNN:在CVPR 2014年中Ross Girshick提出R-CNN。R-CNN的全稱是Region-CNN,是第一個成功將深度學(xué)習(xí)應(yīng)用到目標(biāo)檢測上的算法。用CNN提取出Region Proposals中的featues,然后進行SVM分類與bbox的回歸。
完整R-CNN結(jié)構(gòu)是不使用暴力方法,而是用候選區(qū)域方法(region proposal method),創(chuàng)建目標(biāo)檢測的區(qū)域改變了圖像領(lǐng)域?qū)崿F(xiàn)物體檢測的模型思路,R-CNN是以深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的物體檢測的模型 ,R-CNN在當(dāng)時以優(yōu)異的性能令世人矚目,以R-CNN為基點,后續(xù)的SPPNet、Fast R-CNN、Faster R-CNN模型都是照著這個物體檢測思路。
SPP-Net:SPP-Net是一種可以不用考慮圖像大小,輸出圖像固定長度網(wǎng)絡(luò)結(jié)構(gòu),并且可以做到在圖像變形情況下表現(xiàn)穩(wěn)定。SPP-net的效果已經(jīng)在不同的數(shù)據(jù)集上面得到驗證,速度上比R-CNN快24-102倍。SPPNet在R-CNN的基礎(chǔ)上提出了改進,通過候選區(qū)域和Feature,map的映射,配合SPP層的使用從而達到了CNN層的共享計算,減少了運算時間,后面的FastR-CNN等也是受SPPNet的啟發(fā)。
Fast R-CNN:FastR-CNN的訓(xùn)練速度是R-CNN的9倍,測試速度是R-CNN的213倍;即使和SPP-Net相比,F(xiàn)ast R-CNN的訓(xùn)練速度和測試速度,也分別有了3倍和10倍的提升。相比R-CNN,F(xiàn)ast RCNN仍然使用selective search選取2000個建議框,但是這里不是將這么多建議框都輸入卷積網(wǎng)絡(luò)中,而是將原始圖片輸入卷積網(wǎng)絡(luò)中得到特征圖,再使用建議框?qū)μ卣鲌D提取特征框。這樣做的好處是,原來建議框重合部分非常多,卷積重復(fù)計算嚴(yán)重,而這里每個位置都只計算了一次卷積,大大減少了計算量。
R-FCN:R-FCN,全稱為“Region-based fully convolutional network”。
R-FCN的網(wǎng)絡(luò)結(jié)構(gòu)如下圖,同F(xiàn)aster RCNN比起來,它有2點不同。
(1)Shared convolutional subnetwork不同。Faster RCNN是把RPN得到的RoI直接映射到Resnet101的最后一個卷積層(2048個channels),而R-FCN將Resnet101的最后一個卷積層映射到具有?個channels的特征層,作者將該特征層稱之為“position-sensitive score maps”,然后把RoI映射到該特征層;
(2)RoI-wise subnetwork不同。Faster RCNN的subnetwork經(jīng)過了全連接層做特征組合,然后執(zhí)行分類和坐標(biāo)回歸的雙任務(wù),R-FCN基于pool和vote操作后得到的特征向量,執(zhí)行分類任務(wù)。
-
算法
+關(guān)注
關(guān)注
23文章
4600瀏覽量
92646 -
目標(biāo)檢測
+關(guān)注
關(guān)注
0文章
205瀏覽量
15590
發(fā)布評論請先 登錄
相關(guān)推薦
評論