精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于深度學習的人臉識別算法與其網絡結構

新機器視覺 ? 來源:CSDN技術社區 ? 作者:weixin_39667398 ? 2021-03-12 11:13 ? 次閱讀

度量學習

基于深度學習的人臉識別算法,如何讓神經網絡從訓練數據中學習到有效、魯棒的生物特征是至關重要的。在這個過程中,一個良好的學習向導是不可或缺的。因此,在模型訓練的過程中,通常使用度量學習的方式,將人物面部特征間的距離,作為神經網絡特征學習的向導,來實現區分不同人物的目的。

為了讓神經網絡能夠更加有效的學習,合理的設計損失函數來度量和映射人物特征之間的距離,成為了提高人臉識別精度的主要研究方向之一。許多在分類任務中常用的損失函數,如Softmax Loss,在經過一系列的改進之后,更好的適應了人臉識別的任務。像Arcface這樣的損失函數(下圖),利用了一種附加角度對cos值進行加法約束,使得模型能夠在學習過程中合理的壓縮相同人物特征間的余弦距離的同時增大不同人物特征間的余弦距離,以此達到精準區分人物的目的。

圖示展示在利用損失函數arcface訓練一個深度卷積神經網絡過程中的計算流程。其中的改進在于,給角度加入了加性間隔m作為懲罰項來減小類間間距,并對其余弦值加入放縮s進行放縮,讓網絡變得易于訓練。

另一些損失函數,如Triplet Loss(下圖),則是通過以特定規則從訓練集中選擇樣例,提取特征,比較這些特征之間的距離,來達到聚類相同人物特征和離散不同人物特征的目的。可以看到,這種方法因為要逐次比對選擇樣例特征之間的距離并基于此來優化模型參數,所以會延長模型訓練的周期。但對于解決一些特殊場景下的困難樣例,會有較好的效果。

圖示為最初版本的Triplet Loss原理示意圖。訓練過程中需要從訓練集中選擇一個Anchor樣本以及與Anchor樣本同類的Positive樣本和與Anchor樣本異類的Negative樣本,在訓練過程中不斷的拉近同類樣本的距離并遠離異類樣本。

選擇不同的損失函數,會對模型進行識別任務時選用的距離公式(相似度計算方法)產生影響。例如,Triplet Loss在早期優化的是歐氏距離,所以在后期進行特征比對時,利用歐式距離來計算特征之間相似度就是更加自然的。此外,通過對這些損失函數進行變形,來統一各損失函數的優化距離,從而使不同的損失函數能夠運用在訓練模型的不同階段,或將不同損失函數對不同的樣例分配進行結合,從而達到更高效的訓練效率,也是目前的工作方向之一。

網絡結構

根據使用場景和計算設備的不同,通常需要選擇不同規模的神經網絡結構。隨著人臉識別在移動端的普及以及識別規模的增大,選用計算量更小、更高效的網絡結構成為了重要的研究方向。

標準的卷積神經網絡結構,以VGG16為例,通常由卷積層,池化層,全連接層和激活函數組成。該網絡通過反復堆疊3*3的小型卷積核和2*2的最大池化層,不斷加深網絡結構來提升性能。

但隨著網絡結構的進一步加深,網絡參數會隨之增多,運算開銷會變得很大,增加運算成本。同時,網絡結構的加深也會讓網絡發生退化現象,以至于在進一步訓練時無法達到預期的精度。

為解決這些問題,設計出參數少,深度深,運算快,易于訓練的輕量級網絡網絡,各種卷積結構和模塊被逐步引入到了卷積神經網絡的基礎構架中。

殘差模塊:為解決加深網絡后的網絡退化問題,使深度網絡變得可訓練而提出的結構(見下圖)。這種跳躍連接的結構讓網絡有能力在需要的時候擬合一個潛在的恒等映射函數,從而避免了在極深網絡中出現的難以訓練的問題。

分組卷積:在標準的卷積操作中,其參數量與輸入特征圖通道數,卷積核尺寸和輸出特征圖通道數有關。如圖,若輸入特征圖尺寸為H*W*c1,卷積核尺寸為h1*w1*c1,輸出特征圖尺寸為H*W*c2,標準卷幾層的參數量則為:h1*w1*c1*c2。

若使用分組卷積(見下圖),事先將輸入的特征圖按照通道數分為g組,分組卷積的參數量為則會變成標準卷積參數量的1/g:h1*w1*c1*c2/g。

分組卷積能夠在一定程度上降低卷積的參數量,但也會減弱各通道之間的相關性。

深度可分離卷積:深度可分離卷積操作是將普通卷積拆解成深度卷積和逐點卷積。深度卷積負責濾波,逐點卷積負責轉換通道。

如圖(a),對于標準卷積,其參數量為Dk*Dk*M*N。如圖(b),對于深度卷積,其參數量為:Dk*Dk*1*M。 如圖(c),對于逐點卷積,其參數量為:1*1*M*N。將兩項操作合并,可知深度可分離卷積參數量 是標準卷積的:(1/N)+(1/Dk**2)。

cafaa5e6-82ca-11eb-8b86-12bb97331649.png

棄用池化層:池化層分為平均池化和最大池化,通過制定規則對池化核覆蓋范圍內的像素進行運算,達到學習圖像邊緣及紋理結構,同時壓縮特征圖的效果。但池化層常常會導致較多的信息損失,因此,通常使用控制卷積核在特征圖上的滑動步長(如設定stride=2),來達到壓縮特征圖,提取圖像特征的目的。

減少全連接層:因為全連接層需要將每個神經元節點與其前后層的神經元分別連接,其通常會占據卷積神經網絡的大部分參數。為了減少模型的參數,會盡量減少全連接層的使用,通常利用全劇平均池化或大尺寸卷積核取代全連接層,來融合學到的特征。

同時,為了讓模型能夠更好的提取人物面部的特征,專門的人臉識別網絡在這些方面進行了優化,例如mobilefacenet在卷積網絡的尾部加入7*7卷積核壓縮特征圖,直接將特征圖轉化成相應維度的面部特征并送入全連接層這樣的操作。對于一些特殊場景下的識別任務,則會根據需求,定制出相應的結構模塊。例如,在面對面部遮擋的任務中,融入空間注意力機制,實現事先為特征熱力圖的空間分布的加權,就變得相對重要。
編輯:lyn

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4762

    瀏覽量

    100537
  • 網絡結構
    +關注

    關注

    0

    文章

    48

    瀏覽量

    11068
  • 深度學習
    +關注

    關注

    73

    文章

    5492

    瀏覽量

    120975
收藏 人收藏

    評論

    相關推薦

    深度識別算法包括哪些內容

    :CNN是深度學習中處理圖像和視頻等具有網格結構數據的主要算法。它通過卷積層、池化層和全連接層等組件,實現對圖像特征的自動提取和識別。 應
    的頭像 發表于 09-10 15:28 ?304次閱讀

    深度識別人臉識別有什么重要作用嗎

    深度學習人臉識別技術是人工智能領域的一個重要分支,它利用深度學習
    的頭像 發表于 09-10 14:55 ?411次閱讀

    深度識別人臉識別在任務中為什么有很強大的建模能力

    通過大量數據進行訓練,能夠自動學習人臉的特征表示,而不需要人為設計特征提取算法。 多層神經網絡結構深度
    的頭像 發表于 09-10 14:53 ?316次閱讀

    基于FPGA的人臉識別技術

    基于FPGA(現場可編程邏輯門陣列)的人臉識別技術,是一種結合了高效并行處理能力和靈活可編程性的先進圖像處理解決方案。這種技術在安全監控、身份認證、人機交互等領域具有廣泛應用前景。以下將詳細介紹基于FPGA的人臉
    的頭像 發表于 07-17 11:42 ?1314次閱讀

    基于Python的深度學習人臉識別方法

    基于Python的深度學習人臉識別方法是一個涉及多個技術領域的復雜話題,包括計算機視覺、深度學習
    的頭像 發表于 07-14 11:52 ?1183次閱讀

    基于OpenCV的人臉識別系統設計

    基于OpenCV的人臉識別系統是一個復雜但功能強大的系統,廣泛應用于安全監控、人機交互、智能家居等多個領域。下面將詳細介紹基于OpenCV的人臉識別系統的基本原理、實現步驟,并附上具體
    的頭像 發表于 07-11 15:37 ?1.2w次閱讀

    卷積神經網絡人臉識別中的應用

    人臉識別技術作為人工智能領域的一個重要分支,近年來取得了顯著的發展。其核心在于通過計算機對人臉圖像進行特征提取和識別,從而實現自動的人臉身份
    的頭像 發表于 07-08 10:48 ?591次閱讀

    深度學習與nlp的區別在哪

    方法,它通過模擬人腦的神經網絡結構,實現對數據的自動特征提取和學習深度學習的核心是構建多層的神經網絡結構,每一層都包含大量的神經元,這些神
    的頭像 發表于 07-05 09:47 ?813次閱讀

    深度神經網絡的設計方法

    深度神經網絡(Deep Neural Networks, DNNs)作為人工智能領域的重要技術之一,通過模擬人腦神經元之間的連接,實現了對復雜數據的自主學習和智能判斷。其設計方法不僅涉及網絡結
    的頭像 發表于 07-04 13:13 ?409次閱讀

    人臉識別模型訓練是什么意思

    人臉識別模型訓練是指通過大量的人臉數據,使用機器學習深度學習
    的頭像 發表于 07-04 09:16 ?480次閱讀

    神經網絡算法結構有哪些類型

    神經網絡算法深度學習的基礎,它們在許多領域都有廣泛的應用,如圖像識別、自然語言處理、語音識別
    的頭像 發表于 07-03 09:50 ?387次閱讀

    卷積神經網絡的基本結構和訓練過程

    卷積神經網絡(Convolutional Neural Networks,CNN)是一種在圖像識別、視頻處理、自然語言處理等多個領域廣泛應用的深度學習
    的頭像 發表于 07-02 18:27 ?761次閱讀

    神經網絡結構類型和應用實例

    神經網絡模型,作為深度學習領域的核心組成部分,近年來在圖像識別、自然語言處理、語音識別等多個領域取得了顯著進展。本文旨在深入解讀神經
    的頭像 發表于 07-02 11:33 ?375次閱讀

    人臉識別技術的原理是什么 人臉識別技術的特點有哪些

    人臉檢測是人臉識別的首要步驟。其目標是在圖像或視頻中準確地定位人臉的位置。人臉檢測算法常用的方
    的頭像 發表于 02-18 13:52 ?1661次閱讀

    如何優化PLC的網絡結構

    優化PLC的網絡結構可以提高通信的效率和穩定性。以下是一些優化PLC網絡結構的方法: (1)設計合理的拓撲結構:根據應用需求和設備分布情況,設計合理的網絡拓撲
    的頭像 發表于 12-23 08:15 ?666次閱讀
    如何優化PLC的<b class='flag-5'>網絡結構</b>?