精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

【連載】深度學習筆記10:三維卷積、池化與全連接

人工智能實訓營 ? 2018-10-25 20:09 ? 次閱讀


在上一講中,我們對卷積神經網絡中的卷積操作進行了詳細的解讀,但僅僅是對二維圖像,即通道數為 1 的圖像(灰度圖)進行了卷積,對于三維或者更高維的圖像卷積顯然并沒有這么簡單。

如果圖像大小為 6*6*3,那么這里的 3 指的是三個顏色通道,你可以將其理解為 3 個 6*6 的圖像的堆疊,如果要對此圖像進行卷積的話,我們的濾波器也需要變成三維的,假設采用一個 3*3*3 的濾波器對其進行卷積(這里需要注意的是,濾波器的通道數一定要等于輸入圖像的通道數),根據 ((n+2p-f)/s)+1 的計算公式我們可以知道輸出圖像的大小為 4*4*1,由一個濾波器進行卷積之后輸出圖像的通道不是 3 而是 1 了。


那么究竟如何理解三通道的卷積過程?單通道的卷積操作我們已經知道,就是直接對感受野與濾波器進行元素相乘求和,那三通道呢?我們可以將 3*3*3 的濾波器想象為一個三維的立方體,為了計算立方體濾波器在輸入圖像上的卷積操作,我們首先將這個三維的濾波器放到左上角,讓三維濾波器的 27 個數依次乘以紅綠藍三個通道中的像素數據,即濾波器的前 9 個數乘以紅色通道中的數據,中間 9 個數乘以綠色通道中的數據,最后 9 個數乘以藍色通道中的數據。將這些數據加總起來,就得到輸出像素的第一個元素值。如下圖所示:


這樣做可能還不夠。在實際圖像處理中,僅靠單濾波器很難將復雜的圖像特征進行充分提取。所以,通常而言,我們用來進行卷積的濾波器遠不止一個。下面我們用兩個濾波器對上述圖像進行卷積操作。


我們用第一個濾波器進行卷積得到一個 4*4 的輸出,然后用第二個濾波器進行卷積又得到一個 4*4 的輸出,將這個輸出放到第一個輸出后面,形成了一個 4*4*2 的輸出,這里的 2 的就是濾波器的個數。

關于多通道卷積的另一種理解類似于 DNN 中的標準神經網絡中的 Z=Wx+b 的線性計算,其中 x 為輸入的原始圖像,W 為濾波器,b 偏差項,卷積過程就類似與標準神經網絡的線性計算,完了之后利用激活函數進行激活。還有一個關鍵問題就是卷積層有多少參數,卷積層的參數通常在于濾波器 W,根據濾波器的大小,我們可以計算一個濾波器的參數數量為 f*f*nc,其中 nc 為通道熟量,那 k 個濾波器所含的參數數量則為 f*f*nc*k

卷積過程到此就差不多解釋完了。我們再看 CNN 的另一個重要操作——池化(pooling)。簡單來說,池化層是用來縮減模型大小,提高模型計算速度以及提高所提取特征的魯棒性。池化操作通常有兩種,一種是常用的最大池化(max pooling),另一種是不常用的平均池化(average pooling)。池化操作過程也非常簡單,假設池化層的輸入為一個 4*4 的圖像,我們用最大池化對其進行池化,執行最大池化的樹池是一個 2*2 的矩陣,執行過程就是將輸入矩陣拆分為不同區域,對于 2*2 的輸出而言,輸出的每個元素都是其對應區域的最大元素值。


最大池化過程就像是應用了一個 2*2 的濾波器以步幅 2 進行區域最大化輸出操作。所以簡單而言,池化的參數就是濾波器的大小 f 和步幅 s,池化的效果就相當于對輸入圖像的高度和寬度進行縮小。值得注意的是,最大池化只是計算神經網絡某一層的靜態屬性,中間并沒有什么學習過程。

池化完成之后就是標準神經網絡中的全連接層了。全連接層我們在 DNN 中有詳細介紹,這里就不再贅述。總之,一個典型的卷積層通常包括卷積層-池化層和全連接層。

下一講中,我們將一起嘗試如何利用 numpy 實現一個簡單的典型的卷積神經網絡。

本文由《自興動腦人工智能》項目部 凱文 投稿。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4762

    瀏覽量

    100541
  • 人工智能
    +關注

    關注

    1791

    文章

    46859

    瀏覽量

    237582
  • 卷積神經網絡

    關注

    4

    文章

    366

    瀏覽量

    11851
收藏 人收藏

    評論

    相關推薦

    關于卷積神經網絡,這些概念你厘清了么~

    。例如,最大值會選取窗口中的最大數據值而丟棄其它所有的值。這樣,數據量不斷減少,最終形成各個對象類別的唯一屬性。 卷積的結果是大量
    發表于 10-24 13:56

    三維觸摸面板-運用觸感功能

    可以根據乘客的習慣和需求進行個性的設置。 方向盤控制 :在方向盤上集成三維觸摸面板,駕駛員可以通過觸摸和按壓來控制車輛的巡航、多媒體、電話等功能,無需將手離開方向盤,進一步提高了駕駛的便利性和安全性
    發表于 09-18 13:55

    三維可視運用的主要技術

    三維可視技術是一種強大的工具,可用于呈現復雜的數據和概念,使人們能夠更直觀地理解信息。在當今數字化時代,三維可視已經成為許多領域中不可或缺的技術,包括工程、醫學、地理信息系統、游戲
    的頭像 發表于 07-19 13:56 ?247次閱讀

    三維可視的魅力與應用

    三維可視是一種強大的工具,它融合了藝術、科學和技術,通過在三維空間中呈現數據、概念和想法,為人們提供了一種直觀而生動的方式來理解和探索信息。這項技術在當今世界中的應用非常廣泛,涵蓋了科學、教育
    的頭像 發表于 07-17 14:19 ?224次閱讀

    神經網絡中的卷積層、層與連接

    深度學習中,卷積神經網絡(Convolutional Neural Network, CNN)是一種特別適用于處理圖像數據的神經網絡結構。它通過卷積層、
    的頭像 發表于 07-11 14:18 ?4673次閱讀

    卷積神經網絡的工作原理和應用

    卷積神經網絡(FCN)是深度學習領域中的一種特殊類型的神經網絡結構,尤其在計算機視覺領域表現出色。它通過全局平均
    的頭像 發表于 07-11 11:50 ?959次閱讀

    卷積神經網絡中層的作用

    深度學習領域,卷積神經網絡(Convolutional Neural Network, CNN)以其卓越的圖像處理和計算機視覺能力而廣受歡迎。CNN由多個層組成,其中包括卷積層、
    的頭像 發表于 07-03 15:58 ?1090次閱讀

    卷積神經網絡cnn中層的主要作用

    卷積神經網絡(Convolutional Neural Network,CNN)是深度學習領域中一種重要的神經網絡結構,廣泛應用于圖像識別、語音識別、自然語言處理等領域。在CNN中,
    的頭像 發表于 07-02 14:50 ?795次閱讀

    三維可視系統平臺介紹及優勢

    三維可視 系統平臺是一種基于三維技術開發的軟件系統,主要用于實現對三維空間中數據、模型、場景等內容的可視展示和操作。這樣的系統平臺在各個
    的頭像 發表于 06-12 16:02 ?585次閱讀
    <b class='flag-5'>三維</b>可視<b class='flag-5'>化</b>系統平臺介紹及優勢

    三維可視數據大屏的設計原理和技巧

    三維可視數據大屏設計面向交通、園區、城市、建筑、應急等領域的客戶,以孿生可視能力賦能,提供行業解決方案。雙渲染引擎,1:1還原真實世界,在模型運行流暢的基礎上提供極佳的視覺效果。今天,古河云
    的頭像 發表于 05-30 17:09 ?471次閱讀

    一種利用光電容積描記(PPG)信號和深度學習模型對高血壓分類的新方法

    層(Convolution、ReLU、LRN、Pooling)+3個連接層組成.它被認為是深度學習領域的突破性架構,是對傳統深度
    發表于 05-11 20:01

    三維可視是怎么做的?特點有哪些?

    三維可視深入我們的生活當中,它能直觀并且精準的展示企業的場景情況,但是很多小伙伴并不清楚三維可視是怎么做的?特點有哪些?今天,古河云科技小編就來給大家聊一聊這一問題。
    的頭像 發表于 04-28 15:12 ?462次閱讀
    <b class='flag-5'>三維</b>可視<b class='flag-5'>化</b>是怎么做的?特點有哪些?

    三維掃描服務項目-工廠三維掃描建模

    工廠三維掃描,廠房三維掃描,工廠數字服務,工廠三維掃描解決方案,逆向還原石化管線,完成工廠數據,為工廠設施的設計改造和維修維護提供原始
    的頭像 發表于 04-26 09:46 ?500次閱讀
    <b class='flag-5'>三維</b>掃描服務項目-工廠<b class='flag-5'>三維</b>掃描建模

    泰來三維|文物三維掃描,文物三維模型怎樣制作

    文物三維掃描,文物三維模型怎樣制作:我們都知道文物是不可再生的,要繼續保存傳承,需要文物三維數字保護,所以三維數字
    的頭像 發表于 03-12 11:10 ?560次閱讀
    泰來<b class='flag-5'>三維</b>|文物<b class='flag-5'>三維</b>掃描,文物<b class='flag-5'>三維</b>模型怎樣制作

    基于深度學習三維重建技術

    多視圖立體幾何(Multi-View Stereo,MVS)是計算機視覺中重要的研究領域,也是邁入三維計算機視覺研究的重點問題。它通過利用多張互相重疊的圖像恢復出原始三維場景的幾何結構和紋理信息,是現實中拍攝照片的逆過程。
    的頭像 發表于 12-04 10:08 ?870次閱讀
    基于<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的<b class='flag-5'>三維</b>重建技術