3.2.2對象檢測
圖3-5對象檢測
對象檢測中的識別對象這一任務(wù),通常會涉及為各個對象輸出邊界框和標簽。這不同于分類/定位任務(wù)——對很多對象進行分類和定位,不僅僅是對個主體對象進行分類和定位。在對象檢測中,只有兩個對象分類類別,即對象邊界框和非對象邊界框。例如,在汽車檢測中,必須使用邊界框檢測所給定圖像中的所有汽車。
如果使用視覺技術(shù)中圖像分類和定位圖像這樣的滑動窗口技術(shù),需要將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于圖像上的很多不同物體上。由于卷積神經(jīng)網(wǎng)絡(luò)會將圖像中的每個物體識別為對象或背景,因此,需要在大量的位置和規(guī)模上使用卷積神經(jīng)網(wǎng)絡(luò),這需要很大的計算量。
為了解決這一問題,計算機視覺技術(shù)研究人員建議使用區(qū)域(Region)這一概念,這樣就會找到可能包含對象的“斑點”圖像區(qū)域,運行速度就會大大提高。這是一種基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)(R-CNN),并在此基礎(chǔ)上提升算法收斂速度,提出了二次增強的Fast R-CNN,大大提升了對象檢測速度。
近年來,主要的目標檢測算法已經(jīng)轉(zhuǎn)向更快、更高效的檢測系統(tǒng)。這種趨勢在YouOnly Look Once(YOLO)、Single Shot MultiBox Detector(SSD)和基于區(qū)域的全卷積網(wǎng)絡(luò)(R-FCN)算法中尤為明顯。
-
智慧燈桿
+關(guān)注
關(guān)注
1文章
809瀏覽量
11705
發(fā)布評論請先 登錄
相關(guān)推薦
評論