国精品无码一区二区三区_国产AV午夜精品一区二区入口_久久久久久精品免费免费麻辣

導讀

分析了Canny的優(yōu)劣，并給出了OpenCV使用深度學習做邊緣檢測的流程，文末有代碼鏈接。

在這篇文章中，我們將學習如何在OpenCV中使用基于深度學習的邊緣檢測，它比目前流行的canny邊緣檢測器更精確。邊緣檢測在許多用例中是有用的，如視覺顯著性檢測，目標檢測，跟蹤和運動分析，結(jié)構(gòu)從運動，3D重建，自動駕駛，圖像到文本分析等等。

什么是邊緣檢測？

邊緣檢測是計算機視覺中一個非常古老的問題，它涉及到檢測圖像中的邊緣來確定目標的邊界，從而分離感興趣的目標。最流行的邊緣檢測技術(shù)之一是Canny邊緣檢測，它已經(jīng)成為大多數(shù)計算機視覺研究人員和實踐者的首選方法。讓我們快速看一下Canny邊緣檢測。

Canny邊緣檢測算法

1983年，John Canny在麻省理工學院發(fā)明了Canny邊緣檢測。它將邊緣檢測視為一個信號處理問題。其核心思想是，如果你觀察圖像中每個像素的強度變化，它在邊緣的時候非常高。

在下面這張簡單的圖片中，強度變化只發(fā)生在邊界上。所以，你可以很容易地通過觀察像素強度的變化來識別邊緣。

現(xiàn)在，看下這張圖片。強度不是恒定的，但強度的變化率在邊緣處最高。（微積分復習：變化率可以用一階導數(shù)（梯度）來計算。）

Canny邊緣檢測器通過4步來識別邊緣：

去噪：因為這種方法依賴于強度的突然變化，如果圖像有很多隨機噪聲，那么會將噪聲作為邊緣。所以，使用5×5的高斯濾波器平滑你的圖像是一個非常好的主意。

梯度計算：下一步，我們計算圖像中每個像素的強度的梯度（強度變化率）。我們也計算梯度的方向。

梯度方向垂直于邊緣，它被映射到四個方向中的一個（水平、垂直和兩個對角線方向）。

非極大值抑制：現(xiàn)在，我們想刪除不是邊緣的像素（設(shè)置它們的值為0）。你可能會說，我們可以簡單地選取梯度值最高的像素，這些就是我們的邊。然而，在真實的圖像中，梯度不是簡單地在只一個像素處達到峰值，而是在臨近邊緣的像素處都非常高。因此我們在梯度方向上取3×3附近的局部最大值。

遲滯閾值化：在下一步中，我們需要決定一個梯度的閾值，低于這個閾值所有的像素都將被抑制（設(shè)置為0）。而Canny邊緣檢測器則采用遲滯閾值法。遲滯閾值法是一種非常簡單而有效的方法。我們使用兩個閾值來代替只用一個閾值：

高閾值 = 選擇一個非常高的值，這樣任何梯度值高于這個值的像素都肯定是一個邊緣。

低閾值 = 選擇一個非常低的值，任何梯度值低于該值的像素絕對不是邊緣。

在這兩個閾值之間有梯度的像素會被檢查，如果它們和邊緣相連，就會留下，否則就會去掉。

遲滯閾值化

Canny 邊緣檢測的問題：

由于Canny邊緣檢測器只關(guān)注局部變化，沒有語義（理解圖像的內(nèi)容）理解，精度有限（很多時候是這樣）。

Canny邊緣檢測器在這種情況下會失敗，因為沒有理解圖像的上下文

語義理解對于邊緣檢測是至關(guān)重要的，這就是為什么使用機器學習或深度學習的基于學習的檢測器比canny邊緣檢測器產(chǎn)生更好的結(jié)果。

OpenCV中基于深度學習的邊緣檢測

OpenCV在其全新的DNN模塊中集成了基于深度學習的邊緣檢測技術(shù)。你需要OpenCV 3.4.3或更高版本。這種技術(shù)被稱為整體嵌套邊緣檢測或HED，是一種基于學習的端到端邊緣檢測系統(tǒng)，使用修剪過的類似vgg的卷積神經(jīng)網(wǎng)絡進行圖像到圖像的預測任務。

HED利用了中間層的輸出。之前的層的輸出稱為side output，將所有5個卷積層的輸出進行融合，生成最終的預測。由于在每一層生成的特征圖大小不同，它可以有效地以不同的尺度查看圖像。

網(wǎng)絡結(jié)構(gòu)：整體嵌套邊緣檢測

HED方法不僅比其他基于深度學習的方法更準確，而且速度也比其他方法快得多。這就是為什么OpenCV決定將其集成到新的DNN模塊中。以下是這篇論文的結(jié)果：

在OpenCV中訓練深度學習邊緣檢測的代碼

OpenCV使用的預訓練模型已經(jīng)在Caffe框架中訓練過了，可以這樣加載：

sh download_pretrained.sh

網(wǎng)絡中有一個crop層，默認是沒有實現(xiàn)的，所以我們需要自己實現(xiàn)一下。

class CropLayer（object）：

def __init__（self， params， blobs）：

self.xstart = 0

self.xend = 0

self.ystart = 0

self.yend = 0

# Our layer receives two inputs. We need to crop the first input blob

# to match a shape of the second one （keeping batch size and number of channels）

def getMemoryShapes（self， inputs）：

inputShape， targetShape = inputs［0］， inputs［1］

batchSize， numChannels = inputShape［0］， inputShape［1］

height， width = targetShape［2］， targetShape［3］

self.ystart = （inputShape［2］ - targetShape［2］） // 2

self.xstart = （inputShape［3］ - targetShape［3］） // 2

self.yend = self.ystart + height

self.xend = self.xstart + width

return ［［batchSize， numChannels， height， width］］

def forward（self， inputs）：

return ［inputs［0］［：，：，self.ystart:self.yend，self.xstart:self.xend］］

現(xiàn)在，我們可以重載這個類，只需用一行代碼注冊該層。

cv.dnn_registerLayer（‘Crop’， CropLayer）

現(xiàn)在，我們準備構(gòu)建網(wǎng)絡圖并加載權(quán)重，這可以通過OpenCV的dnn.readNe函數(shù)。

net = cv.dnn.readNet（args.prototxt， args.caffemodel）

現(xiàn)在，下一步是批量加載圖像，并通過網(wǎng)絡運行它們。為此，我們使用cv2.dnn.blobFromImage方法。該方法從輸入圖像中創(chuàng)建四維blob。

blob = cv.dnn.blobFromImage（image， scalefactor， size， mean， swapRB， crop）

其中：

image：是我們想要發(fā)送給神經(jīng)網(wǎng)絡進行推理的輸入圖像。

scalefactor：圖像縮放常數(shù)，很多時候我們需要把uint8的圖像除以255，這樣所有的像素都在0到1之間。默認值是1.0，不縮放。

size：輸出圖像的空間大小。它將等于后續(xù)神經(jīng)網(wǎng)絡作為blobFromImage輸出所需的輸入大小。

swapRB：布爾值，表示我們是否想在3通道圖像中交換第一個和最后一個通道。OpenCV默認圖像為BGR格式，但如果我們想將此順序轉(zhuǎn)換為RGB，我們可以將此標志設(shè)置為True，這也是默認值。

mean：為了進行歸一化，有時我們計算訓練數(shù)據(jù)集上的平均像素值，并在訓練過程中從每幅圖像中減去它。如果我們在訓練中做均值減法，那么我們必須在推理中應用它。這個平均值是一個對應于R， G， B通道的元組。例如Imagenet數(shù)據(jù)集的均值是R=103.93， G=116.77， B=123.68。如果我們使用swapRB=False，那么這個順序?qū)⑹牵˙， G， R）。

crop：布爾標志，表示我們是否想居中裁剪圖像。如果設(shè)置為True，則從中心裁剪輸入圖像時，較小的尺寸等于相應的尺寸，而其他尺寸等于或大于該尺寸。然而，如果我們將其設(shè)置為False，它將保留長寬比，只是將其調(diào)整為固定尺寸大小。

在我們這個場景下：

inp = cv.dnn.blobFromImage（frame， scalefactor=1.0， size=（args.width， args.height），

mean=（104.00698793， 116.66876762， 122.67891434）， swapRB=False，

crop=False）

現(xiàn)在，我們只需要調(diào)用一下前向方法。

net.setInput（inp）

out = net.forward（）

out = out［0， 0］

out = cv.resize（out，（frame.shape［1］， frame.shape［0］））

out = 255 * out

out = out.astype（np.uint8）

out=cv.cvtColor（out，cv.COLOR_GRAY2BGR）

con=np.concatenate（（frame，out），axis=1）

cv.imshow（kWinName，con）

結(jié)果：

中間的圖像是人工標注的圖像，右邊是HED的結(jié)果

文中的代碼：

https://github.com/sankit1/cv-tricks.com/tree/master/OpenCV/Edge_detection

英文原文：https://cv-tricks.com/opencv-dnn/edge-detection-hed/
編輯：lyn

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

邊緣檢測

邊緣檢測

+關(guān)注

關(guān)注
0

文章
92

瀏覽量
18202
計算機視覺

計算機視覺

+關(guān)注

關(guān)注
8

文章
1696

瀏覽量
45927
深度學習

深度學習

+關(guān)注

關(guān)注
73

文章
5492

瀏覽量
120977

原文標題：在OpenCV中基于深度學習的邊緣檢測

文章出處：【微信號：vision263com，微信公眾號：新機器視覺】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

利用VLIB在TMS320C64x/64x+上實現(xiàn)Canny邊緣檢測

電子發(fā)燒友網(wǎng)站提供《利用VLIB在TMS320C64x/64x+上實現(xiàn)Canny邊緣檢測.pdf》資料免費下載

發(fā)表于 10-14 11:13 ?0次下載

利用VLIB在TMS320C64x/64x+上實現(xiàn)Canny<b class='flag-5'>邊緣</b><b class='flag-5'>檢測</b>

基于 DSP5509 進行數(shù)字圖像處理中 Sobel 算子邊緣檢測的硬件連接電路圖

）將圖像數(shù)據(jù)傳輸?shù)?DSP5509。 DSP5509 處理器：作為核心處理單元，負責接收圖像數(shù)據(jù)、執(zhí)行 Sobel 算子邊緣檢測算法，并輸出處理后的結(jié)果。存儲模塊：包括 RAM 和 Flash。RAM

發(fā)表于 09-25 15:25

使用邊緣AI和Sitara處理器進行關(guān)鍵字檢測

電子發(fā)燒友網(wǎng)站提供《使用邊緣AI和Sitara處理器進行關(guān)鍵字檢測.pdf》資料免費下載

發(fā)表于 09-02 11:30 ?0次下載

使用<b class='flag-5'>邊緣</b>AI和Sitara處理器進行關(guān)鍵字<b class='flag-5'>檢測</b>

DSP國產(chǎn)教學實驗箱_實驗案例_操作教程：5-11 邊緣檢測

檢測算法是具有嚴格定義的、可以提供良好可靠檢測的方法之一。由于它具有滿足邊緣檢測的三個標準和實現(xiàn)過程簡單的優(yōu)勢，成為邊緣

發(fā)表于 07-19 10:38

圖像邊緣檢測系統(tǒng)的設(shè)計流程

圖像邊緣檢測系統(tǒng)的設(shè)計流程是一個涉及多個步驟的復雜過程，它旨在從圖像中提取出重要的結(jié)構(gòu)信息，如邊界、輪廓等。這些邊緣信息對于圖像分析、機器視覺、圖像壓縮等領(lǐng)域至關(guān)重要。以下是一個詳細的圖像邊緣

發(fā)表于 07-17 16:39 ?299次閱讀

圖像識別算法都有哪些方法

傳統(tǒng)方法和基于深度學習的方法。傳統(tǒng)圖像識別算法 1.1 邊緣檢測邊緣檢測是圖像識別的基礎(chǔ)，它用于檢測

發(fā)表于 07-16 11:14 ?5124次閱讀

opencv圖像識別有什么算法

圖像識別算法：邊緣檢測：邊緣檢測是圖像識別中的基本步驟之一，用于識別圖像中的邊緣。常見的

發(fā)表于 07-16 10:40 ?835次閱讀

基于FPGA的實時邊緣檢測系統(tǒng)設(shè)計，Sobel圖像邊緣檢測，F(xiàn)PGA圖像處理

摘要：本文設(shè)計了一種基于 FPGA 的實時邊緣檢測系統(tǒng) ，使用OV5640 攝像頭模塊獲取實時的視頻圖像數(shù)據(jù)，提取圖像邊緣信息并通過 VGA顯示。FPGA 內(nèi)部使用流水線設(shè)計和并行運算加速

發(fā)表于 05-24 07:45

主流邊緣AI算法，在安防、零售、交通等領(lǐng)域的應用

邊緣AI可以應用在哪些場景實現(xiàn)哪些功能。 ? 市面上主流的邊緣AI算法應用 ? 目前市面上比較主流的邊緣AI算法應用，包括人臉及關(guān)鍵點

發(fā)表于 05-13 01:56 ?2899次閱讀

算法系列：基于 FPGA 的圖像邊緣檢測系統(tǒng)設(shè)計（sobel算法）

)為邊緣點。用的是邊緣檢測算法。難點： (1)掌握了 3*3 像素陣列，Gx 與 Gy 就很好計算了。注意問題：為了避免計算過程中出現(xiàn)負值，所以將正負值分開單獨計算，具體見代碼

發(fā)表于 03-26 16:40

什么是邊緣計算，邊緣計算有哪些應用？

什么是邊緣計算，邊緣計算有哪些應用？邊緣計算是一種將計算能力移動到離數(shù)據(jù)源和終端設(shè)備更近的位置的計算模型。它利用邊緣設(shè)備（如路由器、交換機、物聯(lián)網(wǎng)設(shè)備等）上的計算資源，對數(shù)據(jù)進行處理

發(fā)表于 01-09 11:29 ?1685次閱讀

邊緣計算和邊緣智能計算區(qū)別

邊緣計算和邊緣智能計算是兩個相關(guān)但不同的概念。邊緣計算指的是數(shù)據(jù)處理和存儲在靠近數(shù)據(jù)源的邊緣設(shè)備上進行，而不是在遠程云服務器上進行。邊緣智能

發(fā)表于 12-27 15:28 ?1005次閱讀

OpenCV邊緣檢測算子Laplace、LoG詳解

一階導數(shù)算子(例如 Sobel 算子)通過對圖像求導來確定圖像的邊緣，數(shù)值絕對值較高的點對應了圖像的邊緣。如果繼續(xù)求二階導，原先數(shù)值絕對值較高的點對應了過零點。因此，也可以通過找到二階導數(shù)的過零點來檢測

發(fā)表于 12-21 16:34 ?2043次閱讀

國產(chǎn)嵌入式實驗箱操作教程_創(chuàng)龍教儀：5-12 邊緣檢測（LCD顯示）

，Canny邊緣檢測算法是具有嚴格定義的、可以提供良好可靠檢測的方法之一。由于它具有滿足邊緣檢測的三個標準和實現(xiàn)過程簡單的優(yōu)勢，成為

發(fā)表于 12-14 14:09

圖像處理算法——邊緣檢測

基于邊緣檢測的分析不易受整體光照強度變化的影響，同時利用邊緣信息容易凸顯目標信息和達到簡化處理的目的，因此很多圖像理解方法都以邊緣為基礎(chǔ)。邊緣

發(fā)表于 11-30 16:56 ?1021次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

什么是邊緣檢測？邊緣檢測的算法由來

什么是邊緣檢測？

Canny邊緣檢測算法

OpenCV中基于深度學習的邊緣檢測

評論

利用VLIB在TMS320C64x/64x+上實現(xiàn)Canny邊緣檢測

基于 DSP5509 進行數(shù)字圖像處理中 Sobel 算子邊緣檢測的硬件連接電路圖

使用邊緣AI和Sitara處理器進行關(guān)鍵字檢測

DSP國產(chǎn)教學實驗箱_實驗案例_操作教程：5-11 邊緣檢測

圖像邊緣檢測系統(tǒng)的設(shè)計流程

圖像識別算法都有哪些方法

opencv圖像識別有什么算法

基于FPGA的實時邊緣檢測系統(tǒng)設(shè)計，Sobel圖像邊緣檢測，F(xiàn)PGA圖像處理

主流邊緣AI算法，在安防、零售、交通等領(lǐng)域的應用

算法系列：基于 FPGA 的圖像邊緣檢測系統(tǒng)設(shè)計（sobel算法）

什么是邊緣計算，邊緣計算有哪些應用？

邊緣計算和邊緣智能計算區(qū)別

OpenCV邊緣檢測算子Laplace、LoG詳解

國產(chǎn)嵌入式實驗箱操作教程_創(chuàng)龍教儀：5-12 邊緣檢測（LCD顯示）

圖像處理算法——邊緣檢測

搜索歷史

什么是邊緣檢測？邊緣檢測的算法由來

什么是邊緣檢測？

Canny邊緣檢測算法

OpenCV中基于深度學習的邊緣檢測

評論

什么是邊緣檢測？邊緣檢測的算法由來

什么是邊緣檢測？