精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器視覺常用的三種目標(biāo)識(shí)別方法解析

穎脈Imgtec ? 2024-03-14 08:26 ? 次閱讀

隨著機(jī)器視覺技術(shù)的快速發(fā)展,傳統(tǒng)很多需要人工來手動(dòng)操作的工作,漸漸地被機(jī)器所替代。傳統(tǒng)方法做目標(biāo)識(shí)別大多都是靠人工實(shí)現(xiàn),從形狀、顏色、長(zhǎng)度、寬度、長(zhǎng)寬比來確定被識(shí)別的目標(biāo)是否符合標(biāo)準(zhǔn),最終定義出一系列的規(guī)則來進(jìn)行目標(biāo)識(shí)別。這樣的方法當(dāng)然在一些簡(jiǎn)單的案例中已經(jīng)應(yīng)用的很好,唯一的缺點(diǎn)是隨著被識(shí)別物體的變動(dòng),所有的規(guī)則和算法都要重新設(shè)計(jì)和開發(fā),即使是同樣的產(chǎn)品,不同批次的變化都會(huì)造成不能重用的現(xiàn)實(shí)。
而隨著機(jī)器學(xué)習(xí)深度學(xué)習(xí)的發(fā)展,很多肉眼很難去直接量化的特征,深度學(xué)習(xí)可以自動(dòng)學(xué)習(xí)這些特征,這就是深度學(xué)習(xí)帶給我們的優(yōu)點(diǎn)和前所未有的吸引力。很多特征我們通過傳統(tǒng)算法無法量化,或者說很難去做到的,深度學(xué)習(xí)可以。特別是在圖像分類、目標(biāo)識(shí)別這些問題上有顯著的提升。

視覺常用的目標(biāo)識(shí)別方法有三種:Blob分析法(BlobAnalysis)、模板匹配法、深度學(xué)習(xí)法。下面就三種常用的目標(biāo)識(shí)別方法進(jìn)行對(duì)比。

Blob分析法(BlobAnalysis)

計(jì)算機(jī)視覺中的Blob是指圖像中的具有相似顏色、紋理等特征所組成的一塊連通區(qū)域。Blob分析(BlobAnalysis)是對(duì)圖像中相同像素的連通域進(jìn)行分析(該連通域稱為Blob)。其過程就是將圖像進(jìn)行二值化,分割得到前景和背景,然后進(jìn)行連通區(qū)域檢測(cè),從而得到Blob塊的過程。簡(jiǎn)單來說,blob分析就是在一塊“光滑”區(qū)域內(nèi),將出現(xiàn)“灰度突變”的小區(qū)域?qū)ふ页鰜怼?/span>
舉例來說,假如現(xiàn)在有一塊剛生產(chǎn)出來的玻璃,表面非常光滑,平整。如果這塊玻璃上面沒有瑕疵,那么,我們是檢測(cè)不到“灰度突變”的;相反,如果在玻璃生產(chǎn)線上,由于種種原因,造成了玻璃上面有一個(gè)凸起的小泡、有一塊黑斑、有一點(diǎn)裂縫,那么,我們就能在這塊玻璃上面檢測(cè)到紋理,經(jīng)二值化(BinaryThresholding)處理后的圖像中色斑可認(rèn)為是blob。而這些部分,就是生產(chǎn)過程中造成的瑕疵,這個(gè)過程,就是Blob分析。

Blob分析工具可以從背景中分離出目標(biāo),并可以計(jì)算出目標(biāo)的數(shù)量、位置、形狀、方向和大小,還可以提供相關(guān)斑點(diǎn)間的拓?fù)浣Y(jié)構(gòu)。在處理過程中不是對(duì)單個(gè)像素逐一分析,而是對(duì)圖像的行進(jìn)行操作。圖像的每一行都用游程長(zhǎng)度編碼(RLE)來表示相鄰的目標(biāo)范圍。這種算法與基于像素的算法相比,大大提高了處理的速度。

7a76940a-e199-11ee-9118-92fbcf53809c.png

針對(duì)二維目標(biāo)圖像和高對(duì)比度圖像,適用于有無檢測(cè)和缺陷檢測(cè)這類目標(biāo)識(shí)別應(yīng)用。常用于二維目標(biāo)圖像、高對(duì)比度圖像、存在/缺席檢測(cè)、數(shù)值范圍和旋轉(zhuǎn)不變性需求。顯然,紡織品的瑕疵檢測(cè),玻璃的瑕疵檢測(cè),機(jī)械零件表面缺陷檢測(cè),可樂瓶缺陷檢測(cè),藥品膠囊缺陷檢測(cè)等很多場(chǎng)合都會(huì)用到blob分析。

但另一方面,Blob分析并不適用于以下圖像:

1. 低對(duì)比度圖像;

2. 必要的圖像特征不能用2個(gè)灰度級(jí)描述;3. 按照模版檢測(cè)(圖形檢測(cè)需求)。

總的來說,Blob分析就是檢測(cè)圖像的斑點(diǎn),適用于背景單一,前景缺陷不區(qū)分類別,識(shí)別精度要求不高的場(chǎng)景。

模板匹配法

模板匹配是一種最原始、最基本的模式識(shí)別方法,研究某一特定對(duì)象物的圖案位于圖像的什么地方,進(jìn)而識(shí)別對(duì)象物,這就是一個(gè)匹配問題。它是圖像處理中最基本、最常用的匹配方法。換句話說就是一副已知的需要匹配的小圖像,在一副大圖像中搜尋目標(biāo),已知該圖中有要找的目標(biāo),且該目標(biāo)同模板有相同的尺寸、方向和圖像元素,通過統(tǒng)計(jì)計(jì)算圖像的均值、梯度、距離、方差等特征可以在圖中找到目標(biāo),確定其坐標(biāo)位置。

這就說明,我們要找的模板是圖像里標(biāo)標(biāo)準(zhǔn)準(zhǔn)存在的,這里說的標(biāo)標(biāo)準(zhǔn)準(zhǔn),就是說,一旦圖像或者模板發(fā)生變化,比如旋轉(zhuǎn),修改某幾個(gè)像素,圖像翻轉(zhuǎn)等操作之后,我們就無法進(jìn)行匹配了,這也是這個(gè)算法的弊端。

所以這種匹配算法,就是在待檢測(cè)圖像上,從左到右,從上向下對(duì)模板圖像與小東西的圖像進(jìn)行比對(duì)。

7a808f50-e199-11ee-9118-92fbcf53809c.png

在opencv中有cv2.matchTemplate(src,templ,result,match_method)方法可以調(diào)用,src是待檢測(cè)圖像,templ是模板庫,match_method是匹配的方法。

這種方法相比Blob分析有較好的檢測(cè)精度,同時(shí)也能區(qū)分不同的缺陷類別,這相當(dāng)于是一種搜索算法,在待檢測(cè)圖像上根據(jù)不同roi用指定的匹配方法與模板庫中的所有圖像進(jìn)行搜索匹配,要求缺陷的形狀、大小、方法都有較高的一致性,因此想要獲得可用的檢測(cè)精度需要構(gòu)建較完善的模板庫。

深度學(xué)習(xí)法

2014年R-CNN的提出,使得基于CNN的目標(biāo)檢測(cè)算法逐漸成為主流。深度學(xué)習(xí)的應(yīng)用,使檢測(cè)精度和檢測(cè)速度都獲得了改善。

自從AlexNet在比賽中使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)而大幅度提高了圖像分類的準(zhǔn)確率,便有學(xué)者嘗試將深度學(xué)習(xí)應(yīng)用到目標(biāo)類別檢測(cè)中。卷積神經(jīng)網(wǎng)絡(luò)不僅能夠提取更高層、表達(dá)能力更好的特征,還能在同一個(gè)模型中完成對(duì)于特征的提取、選擇和分類。

在這方面,主要有兩類主流的算法:

一類是結(jié)合RPN網(wǎng)絡(luò)的,基于分類的R-CNN系列兩階目標(biāo)檢測(cè)算法(twostage);

另一類則是將目標(biāo)檢測(cè)轉(zhuǎn)換為回歸問題的一階目標(biāo)檢測(cè)算法(singlestage)。

物體檢測(cè)的任務(wù)是找出圖像或視頻中的感興趣物體,同時(shí)檢測(cè)出它們的位置和大小,是機(jī)器視覺領(lǐng)域的核心問題之一。

7a8a40ae-e199-11ee-9118-92fbcf53809c.png

物體檢測(cè)過程中有很多不確定因素,如圖像中物體數(shù)量不確定,物體有不同的外觀、形狀、姿態(tài),加之物體成像時(shí)會(huì)有光照、遮擋等因素的干擾,導(dǎo)致檢測(cè)算法有一定的難度。進(jìn)入深度學(xué)習(xí)時(shí)代以來,物體檢測(cè)發(fā)展主要集中在兩個(gè)方向:twostage算法如R-CNN系列和onestage算法如YOLO、SSD等。兩者的主要區(qū)別在于twostage算法需要先生成proposal(一個(gè)有可能包含待檢物體的預(yù)選框),然后進(jìn)行細(xì)粒度的物體檢測(cè)。而onestage算法會(huì)直接在網(wǎng)絡(luò)中提取特征來預(yù)測(cè)物體分類和位置。

兩階算法中區(qū)域提取算法核心是卷積神經(jīng)網(wǎng)絡(luò)CNN,先利用CNN骨干提取特征,然后找出候選區(qū)域,最后滑動(dòng)窗口確定目標(biāo)類別與位置。

R-CNN首先通過SS算法提取2k個(gè)左右的感興趣區(qū)域,再對(duì)感興趣區(qū)域進(jìn)行特征提取。存在缺陷:感興趣區(qū)域彼此之間權(quán)值無法共享,存在重復(fù)計(jì)算,中間數(shù)據(jù)需單獨(dú)保存占用資源,對(duì)輸入圖片強(qiáng)制縮放影響檢測(cè)準(zhǔn)確度。

SPP-NET在最后一個(gè)卷積層和第一個(gè)全連接層之間做些處理,保證輸入全連接層的尺寸一致即可解決輸入圖像尺寸受限的問題。SPP-NET候選區(qū)域包含整張圖像,只需通過一次卷積網(wǎng)絡(luò)即可得到整張圖像和所有候選區(qū)域的特征。

FastR-CNN借鑒SPP-NET的特征金字塔,提出ROIPooling把各種尺寸的候選區(qū)域特征圖映射成統(tǒng)一尺度的特征向量,首先,將不同大小的候選區(qū)域都切分成M×N塊,再對(duì)每塊都進(jìn)行maxpooling得到1個(gè)值。這樣,所有候選區(qū)域特征圖就都統(tǒng)一成M×N維的特征向量了。但是,利用SS算法產(chǎn)生候選框?qū)r(shí)間消耗非常大。

FasterR-CNN是先用CNN骨干網(wǎng)提取圖像特征,由RPN網(wǎng)絡(luò)和后續(xù)的檢測(cè)器共享,特征圖進(jìn)入RPN網(wǎng)絡(luò)后,對(duì)每個(gè)特征點(diǎn)預(yù)設(shè)9個(gè)不同尺度和形狀的錨盒,計(jì)算錨盒和真實(shí)目標(biāo)框的交并比和偏移量,判斷該位置是否存在目標(biāo),將預(yù)定義的錨盒分為前景或背景,再根據(jù)偏差損失訓(xùn)練RPN網(wǎng)絡(luò),進(jìn)行位置回歸,修正ROI的位置,最后將修正的ROI傳入后續(xù)網(wǎng)絡(luò)。但是,在檢測(cè)過程中,RPN網(wǎng)絡(luò)需要對(duì)目標(biāo)進(jìn)行一次回歸篩選以區(qū)分前景和背景目標(biāo),后續(xù)檢測(cè)網(wǎng)絡(luò)對(duì)RPN輸出的ROI再一次進(jìn)行細(xì)分類和位置回歸,兩次計(jì)算導(dǎo)致模型參數(shù)量大。

MaskR-CNN在FasterR-CNN中加了并行的mask分支,對(duì)每個(gè)ROI生成一個(gè)像素級(jí)別的二進(jìn)制掩碼。在FasterR-CNN中,采用ROIPooling產(chǎn)生統(tǒng)一尺度的特征圖,這樣再映射回原圖時(shí)就會(huì)產(chǎn)生錯(cuò)位,使像素之間不能精準(zhǔn)對(duì)齊。這對(duì)目標(biāo)檢測(cè)產(chǎn)生的影響相對(duì)較小,但對(duì)于像素級(jí)的分割任務(wù),誤差就不容忽視了。MaskR-CNN中用雙線性插值解決像素點(diǎn)不能精準(zhǔn)對(duì)齊的問題。但是,由于繼承兩階段算法,實(shí)時(shí)性仍不理想。

一階算法在整個(gè)卷積網(wǎng)絡(luò)中進(jìn)行特征提取、目標(biāo)分類和位置回歸,通過一次反向計(jì)算得到目標(biāo)位置和類別,在識(shí)別精度稍弱于兩階段目標(biāo)檢測(cè)算法的前提下,速度有了極大的提升。

YOLOv1把輸入圖像統(tǒng)一縮放到448×448×3,再劃分為7×7個(gè)網(wǎng)格,每格負(fù)責(zé)預(yù)測(cè)兩個(gè)邊界框bbox的位置和置信度。這兩個(gè)b-box對(duì)應(yīng)同一個(gè)類別,一個(gè)預(yù)測(cè)大目標(biāo),一個(gè)預(yù)測(cè)小目標(biāo)。bbox的位置不需要初始化,而是由YOLO模型在權(quán)重初始化后計(jì)算出來的,模型在訓(xùn)練時(shí)隨著網(wǎng)絡(luò)權(quán)重的更新,調(diào)整b-box的預(yù)測(cè)位置。但是,該算法對(duì)小目標(biāo)檢測(cè)不佳,每個(gè)網(wǎng)格只能預(yù)測(cè)一個(gè)類別。

YOLOv2把原始圖像劃分為13×13個(gè)網(wǎng)格,通過聚類分析,確定每個(gè)網(wǎng)格設(shè)置5個(gè)錨盒,每個(gè)錨盒預(yù)測(cè)1個(gè)類別,通過預(yù)測(cè)錨盒和網(wǎng)格之間的偏移量進(jìn)行目標(biāo)位置回歸。

SSD保留了網(wǎng)格劃分方法,但從基礎(chǔ)網(wǎng)絡(luò)的不同卷積層提取特征。隨著卷積層數(shù)的遞增,錨盒尺寸設(shè)置由小到大,以此提升SSD對(duì)多尺度目標(biāo)的檢測(cè)精度。

YOLOv3通過聚類分析,每個(gè)網(wǎng)格預(yù)設(shè)3個(gè)錨盒,只用darknet前52層,并大量使用殘差層。使用降采樣降低池化對(duì)梯度下降的負(fù)面效果。YOLOv3通過上采樣提取深層特征,使其與將要融合的淺層特征維度相同,但通道數(shù)不同,在通道維度上進(jìn)行拼接實(shí)現(xiàn)特征融合,融合了13×13×255、26×26×255和52×52×255共3個(gè)尺度的特征圖,對(duì)應(yīng)的檢測(cè)頭也都采用全卷積結(jié)構(gòu)。

YOLOv4在原有YOLO目標(biāo)檢測(cè)架構(gòu)的基礎(chǔ)上,采用了近些年CNN領(lǐng)域中最優(yōu)秀的優(yōu)化策略,從數(shù)據(jù)處理、主干網(wǎng)絡(luò)、網(wǎng)絡(luò)訓(xùn)練、激活函數(shù)、損失函數(shù)等各個(gè)方面都進(jìn)行了不同程度的優(yōu)化。時(shí)至今日,已經(jīng)有很多精度比較高的目標(biāo)檢測(cè)算法提出,包括最近視覺領(lǐng)域的transformer研究也一直在提高目標(biāo)檢測(cè)算法的精度。總結(jié)來看,表示的選擇會(huì)對(duì)機(jī)器學(xué)習(xí)算法的性能產(chǎn)生巨大的影響,監(jiān)督學(xué)習(xí)訓(xùn)練的前饋網(wǎng)絡(luò)可視為表示學(xué)習(xí)的一種形式。依此來看傳統(tǒng)的算法如Blob分析和模板匹配都是手工設(shè)計(jì)其特征表示,而神經(jīng)網(wǎng)絡(luò)則是通過算法自動(dòng)學(xué)習(xí)目標(biāo)的合適特征表示,相比手工特征設(shè)計(jì)來說其更高效快捷,也無需太多的專業(yè)的特征設(shè)計(jì)知識(shí),因此其能夠識(shí)別不同場(chǎng)景中形狀、大小、紋理等不一的目標(biāo),隨著數(shù)據(jù)集的增大,檢測(cè)的精度也會(huì)進(jìn)一步提高。本文來源:賽那德科技,深度學(xué)習(xí)愛好者

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    目標(biāo)檢測(cè)與識(shí)別技術(shù)的關(guān)系是什么

    任務(wù)是在圖像或視頻中快速準(zhǔn)確地定位出感興趣的目標(biāo),并給出目標(biāo)的位置信息。目標(biāo)檢測(cè)技術(shù)通常包括候選區(qū)域提取、特征提取、分類器設(shè)計(jì)等步驟。 目標(biāo)識(shí)別技術(shù)
    的頭像 發(fā)表于 07-17 09:38 ?502次閱讀

    目標(biāo)智能識(shí)別系統(tǒng)

    智慧華盛恒輝多目標(biāo)智能識(shí)別系統(tǒng)是一利用現(xiàn)代計(jì)算機(jī)視覺技術(shù)和人工智能算法,從圖像或視頻中同時(shí)識(shí)別和分類多個(gè)
    的頭像 發(fā)表于 07-16 10:42 ?1.3w次閱讀

    基于Python的深度學(xué)習(xí)人臉識(shí)別方法

    基于Python的深度學(xué)習(xí)人臉識(shí)別方法是一個(gè)涉及多個(gè)技術(shù)領(lǐng)域的復(fù)雜話題,包括計(jì)算機(jī)視覺、深度學(xué)習(xí)、以及圖像處理等。在這里,我將概述一個(gè)基本的流程,包括數(shù)據(jù)準(zhǔn)備、模型選擇、訓(xùn)練過程、以及測(cè)試與評(píng)估,并附上簡(jiǎn)單的代碼示例。
    的頭像 發(fā)表于 07-14 11:52 ?1181次閱讀

    機(jī)器視覺技術(shù)中圖像分割方法有哪些

    機(jī)器視覺技術(shù)是人工智能領(lǐng)域的一個(gè)重要分支,它涉及到圖像處理、模式識(shí)別機(jī)器學(xué)習(xí)等多個(gè)學(xué)科。圖像分割是機(jī)器
    的頭像 發(fā)表于 07-04 11:34 ?775次閱讀

    伺服電機(jī)常用三種控制模式有哪些

    伺服電機(jī)是一高精度、高響應(yīng)速度的電機(jī),廣泛應(yīng)用于自動(dòng)化設(shè)備、機(jī)器人、數(shù)控機(jī)床等領(lǐng)域。伺服電機(jī)的控制模式對(duì)于整個(gè)系統(tǒng)的穩(wěn)定性、精度和性能至關(guān)重要。本文將詳細(xì)介紹伺服電機(jī)常用三種控制模
    的頭像 發(fā)表于 06-05 15:51 ?4994次閱讀

    開發(fā)者手機(jī) AI - 目標(biāo)識(shí)別 demo

    應(yīng)用的demo。 應(yīng)用程序通過相機(jī)進(jìn)行預(yù)覽,對(duì)預(yù)覽畫面中的物體進(jìn)行目標(biāo)識(shí)別,目前該應(yīng)用程序支持識(shí)別100物體。 系統(tǒng)架構(gòu) 下圖為demo應(yīng)用以及Openharmony AI子系統(tǒng)的架構(gòu)圖。
    發(fā)表于 04-11 16:14

    集成芯片管腳順序識(shí)別方法

    集成芯片管腳順序的識(shí)別方法主要依賴于芯片的類型和特征。
    的頭像 發(fā)表于 03-19 18:14 ?4908次閱讀

    機(jī)器視覺的圖像目標(biāo)識(shí)別方法綜述

    文章來源:MEMS引言從20世紀(jì)80年代開始,機(jī)器視覺技術(shù)的發(fā)展速度不斷加快,已經(jīng)走進(jìn)了人們的日常生活與工作之中。機(jī)器視覺的圖像目標(biāo)識(shí)別系統(tǒng)
    的頭像 發(fā)表于 02-23 08:26 ?688次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺</b>的圖像<b class='flag-5'>目標(biāo)識(shí)別方法</b>綜述

    貼片電感的識(shí)別方法及故障更換方法

    貼片電感的識(shí)別方法及故障更換方法 貼片電感是現(xiàn)代電子設(shè)備中常用的一電子元件,它們通常用于電源濾波、電感耦合和振蕩電路中。在使用和維修過程中
    的頭像 發(fā)表于 02-03 15:23 ?1781次閱讀

    相異步電動(dòng)機(jī)調(diào)速的方法有哪些?四常用方法解析

    相異步電動(dòng)機(jī)調(diào)速的方法有哪些?四常用方法解析?
    的頭像 發(fā)表于 02-01 16:24 ?7159次閱讀

    機(jī)器視覺的圖像目標(biāo)識(shí)別方法操作要點(diǎn)

    通過加強(qiáng)圖像分割,能夠提高機(jī)器視覺的圖像目標(biāo)識(shí)別的自動(dòng)化水平,使得圖像目標(biāo)識(shí)別效果更加顯著。圖像分割的方法有很多種,不同
    發(fā)表于 01-15 12:17 ?398次閱讀

    PCBA上電子元件極性識(shí)別方法

    【必看】PCBA上電子元件極性識(shí)別方法
    的頭像 發(fā)表于 01-11 10:18 ?1740次閱讀
    PCBA上電子元件極性<b class='flag-5'>識(shí)別方法</b>

    異步電機(jī)主要的三種調(diào)速方法解析

    異步電機(jī)主要的三種調(diào)速方法解析
    的頭像 發(fā)表于 01-07 17:50 ?2247次閱讀
    異步電機(jī)主要的<b class='flag-5'>三種</b>調(diào)速<b class='flag-5'>方法</b><b class='flag-5'>解析</b>

    保險(xiǎn)電阻的識(shí)別方法

    保險(xiǎn)電阻識(shí)別方法? 保險(xiǎn)電阻的正確識(shí)別對(duì)于電子設(shè)備的正常運(yùn)行和使用安全至關(guān)重要。本文旨在詳盡、詳實(shí)、細(xì)致地探討保險(xiǎn)電阻的識(shí)別方法,幫助讀者更好地理解和應(yīng)用該技術(shù)。 一、保險(xiǎn)電阻的基本概念和作用 保險(xiǎn)
    的頭像 發(fā)表于 12-15 10:55 ?1515次閱讀

    電源的三種常用冷卻方法

    在電源領(lǐng)域,散熱至關(guān)重要,它可直接影響電源性能、可靠性和壽命。隨著電子元件的尺寸不斷縮小,功率越來越大,有效的冷卻方法對(duì)于防止過熱和確保最佳功能至關(guān)重要。在本文中,我們將深入獨(dú)具吸引力的電源冷卻領(lǐng)域,并探討三種常用
    的頭像 發(fā)表于 12-03 10:29 ?991次閱讀