近年來,隨著安防行業(yè)的不斷向前發(fā)展,智能化是未安防行業(yè)發(fā)展的一大發(fā)展趨勢。所謂人臉識別技術(shù),即基于人的臉部特征,對輸入的人臉圖象或者視頻流進行判斷,首先判斷其是否存在人臉。如果存在人臉,則進一步的給出每個臉的位置、大小和各個主要面部器官的位置信息。并依據(jù)這些信息,進一步提取每個人臉中所蘊涵的身份特征,并將其與已知的人臉進行對比,從而識別每個人臉的身份。
人臉識別技術(shù)原理分析
人臉由于其易采集的特性,受到很多行業(yè)客戶的關(guān)注,特別是公安、海關(guān)、商場等。人類每天都在進行人臉識別,因此也最能接受這種身份認證方式。人臉識別的研究始于上世紀中期,經(jīng)歷了數(shù)十年的努力,現(xiàn)在已經(jīng)可以應(yīng)用在我們的實際生活中,為我們提供各種便利。
人臉識別主要分為人臉檢測(face detection)、特征提取(feature extraction)和人臉識別(face recognition)三個過程.
人臉檢測:人臉檢測是指從輸入圖像中檢測并提取人臉圖像,通常采用haar特征和Adaboost算法 訓(xùn)練級聯(lián)分類器對圖像中的每一塊進行分類。如果某一矩形區(qū)域通過了級聯(lián)分類器,則被判別為人臉圖像。
特征提取:特征提取是指通過一些數(shù)字來表征人臉信息,這些數(shù)字就是我們要提取的特征。常見的人臉特征分為兩類,一類是幾何特征,另一類是表征特征。幾何特征是指眼睛、鼻子和嘴等面部特征之間的幾何關(guān)系,如距離、面積和角度等。由于算法利用了一些直觀的特征,計算量小。不過,由于其所需的特征點不能精確選擇,限制了它的應(yīng)用范圍。另外,當光照變化、人臉有外物遮擋、面部表情變化時,特征變化較大。所以說,這類算法只適合于人臉圖像的粗略識別,無法在實際中應(yīng)用。
表征特征利用人臉圖像的灰度信息,通過一些算法提取全局或局部特征。其中比較常用的特征提取算法是LBP算法。LBP方法首先將圖像分成若干區(qū)域,在每個區(qū)域的像素640x960鄰域中用中心值作閾值化,將結(jié)果看成是二進制數(shù)。圖3顯示了一個LBP算子。LBP算子的特點是對單調(diào)灰度變化保持不變。每個區(qū)域通過這樣的運算得到一組直方圖,然后將所有的直方圖連起來組成一個大的直方圖并進行直方圖匹配計算進行分類。
人臉識別:這里提到的人臉識別是狹義的人臉識別,即將待識別人臉所提取的特征與數(shù)據(jù)庫中人臉的特征進行對比,根據(jù)相似度判別分類。而人臉識別又可以分為兩個大類:一類是確認,這是人臉圖像與數(shù)據(jù)庫中已存的該人圖像比對的過程,回答你是不是你的問題;另一類是辨認,這是人臉圖像與數(shù)據(jù)庫中已存的所有圖像匹配的過程,回答你是誰的問題。顯然,人臉辨認要比人臉確認困難,因為辨認需要進行海量數(shù)據(jù)的匹配。常用的分類器有最近鄰分類器、支持向量機等。
與指紋應(yīng)用方式類似,人臉識別技術(shù)目前比較成熟的也是考勤機。因為在考勤系統(tǒng)中,用戶是主動配合的,可以在特定的環(huán)境下獲取符合要求的人臉。這就為人臉識別提供了良好的輸入源,往往可以得到滿意的結(jié)果。但是在一些公共場所安裝的視頻監(jiān)控探頭,由于光線、角度問題,得到的人臉圖像很難比對成功。這也是未來人臉識別技術(shù)發(fā)展必須要解決的難題之一。
現(xiàn)在已有一些機構(gòu)、高校在進行人臉識別新領(lǐng)域、新技術(shù)的研究。如遠距離人臉識別技術(shù),3D人臉識別技術(shù)等。遠距離人臉識別系統(tǒng)面臨兩個主要困難。一是如何從遠距離獲取人臉圖像。其次,在得到的數(shù)據(jù)并不理想的情況下如何識別身份。從某種意義上來看,遠距離人臉識別并不是一個特定的關(guān)鍵技術(shù)或基礎(chǔ)研究問題。它可看成是一個應(yīng)用和系統(tǒng)設(shè)計問題。通常有兩類解決方法用于獲取人臉圖片。一種是高清的固定式攝像機,另一種是使用PTZ控制系統(tǒng)多攝像機系統(tǒng)。后者更適合于一般情況,不過其結(jié)構(gòu)更為復(fù)雜,造價也更貴。后者需要考慮如何協(xié)調(diào)多臺攝像機的同步操作。一般地,系統(tǒng)由低分辨率廣角攝像機和高分辨率長焦攝像機組成。前者用于檢測和追蹤目標,后者用于人臉圖像采集和識別。目前遠距離人臉識別技術(shù)還處于實驗室階段,未來如果能夠解決上述問題,對人員布控這樣的應(yīng)用有著重要意義。
3D人臉識別能夠很好地克服2D人臉識別遇到的姿態(tài)、光照、表情等問題。主要原因是2D圖像無法很好地表示深度信息。通常,3D人臉識別方法使用3D掃描技術(shù)獲取3D人臉,然后建立3D人臉模型并用于識別。不過,3D人臉識別技術(shù)的缺點也是很明顯的。首先它需要額外的3D采集設(shè)備或雙目立體視覺技術(shù),其次,建模過程需要的計算量較大。相信隨著未來芯片技術(shù)的發(fā)展,當計算能力不再受到制約,采集設(shè)備成本大幅下降的時候,3D人臉識別將會成為熱門技術(shù)之一。
人臉識別在應(yīng)用中的挑戰(zhàn)
從實際測試來看,用戶的預(yù)期與當前的技術(shù)水平之間的差距還是比較大的。人臉識別技術(shù)在動態(tài)監(jiān)控應(yīng)用中面臨的壓力實際上也比較大。
1.用戶希望正確報警率要求高。而現(xiàn)實是理論上來說必須接受高誤報率。在技術(shù)方面,要達到高正確報警率,可以通過降低閾值來實現(xiàn),但是降低閾值的代價是:高誤報率。為了達到95%正確報警率,很多算法可能會產(chǎn)生300%或更高的誤報率。
2.用戶希望監(jiān)控庫足夠大,往往要求數(shù)萬或幾十萬,甚至上百萬的監(jiān)控名單,希望能捕到“大魚”。現(xiàn)實是庫容量大就必須接受高誤報率。
3. 用戶希望大規(guī)模成網(wǎng)建設(shè),能夠勾畫出監(jiān)控人員的活動軌跡。 現(xiàn)實是必須高投入,重新建專用網(wǎng)絡(luò)和相關(guān)硬件。
4. 用戶希望盡量使用目前的監(jiān)控設(shè)備(攝像機和網(wǎng)絡(luò))。 現(xiàn)實是現(xiàn)有的攝像機清晰度不夠,圖像質(zhì)量差,用于場景監(jiān)控時視頻中人臉過小,網(wǎng)絡(luò)帶寬不夠等等造成無法使用現(xiàn)有設(shè)備。
5. 用戶希望少產(chǎn)生誤報甚至不產(chǎn)生誤報。 現(xiàn)實是這樣就必將損失正確報警率和減少監(jiān)控庫容量,與用戶的想法相違。
6.光照問題
面臨各種環(huán)境光源的考驗,可能出現(xiàn)側(cè)光、頂光、背光和高光等現(xiàn)象,而且有可能出現(xiàn)各個時段的光照不同,甚至在監(jiān)控區(qū)域內(nèi)各個位置的光照都不同。
7. 人臉姿態(tài)和飾物問題
因為監(jiān)控是非配合型的,監(jiān)控人員通過監(jiān)控區(qū)域時以自然的姿態(tài)通過,因此可能出現(xiàn)側(cè)臉、低頭、抬頭等的各種非正臉的姿態(tài)和佩戴帽子、黑框眼鏡、口罩等飾物現(xiàn)象。
8. 攝像機的圖像問題
攝像機很多技術(shù)參數(shù)影響視頻圖像的質(zhì)量,這些因素有感光器(CCD、CMOS)、感光器的大小、DSP的處理速度、內(nèi)置圖像處理芯片和鏡頭等,同時攝像機內(nèi)置的一些設(shè)置參數(shù)也將影響視頻質(zhì)量,如曝光時間、光圈、動態(tài)白平衡等參數(shù)。
9.丟幀和丟臉問題
需要的網(wǎng)絡(luò)識別和系統(tǒng)的計算識別可能會造成視頻的丟幀和丟臉現(xiàn)象,特別是監(jiān)控人流量大的區(qū)域,由于網(wǎng)絡(luò)傳輸?shù)膸拞栴}和計算能力問題,常常引起丟幀和丟臉。
OpenCV是Intel公司支持的開源計算機視覺庫。它輕量級而且高效--由一系列 C 函數(shù)和少量 C++ 類構(gòu)成,實現(xiàn)了圖像處理和計算機視覺方面的很多通用算法,作為一個基本的計算機視覺、圖像處理和模式識別的開源項目,OpenCV 可以直接應(yīng)用于很多領(lǐng)域,其中就包括很多可以應(yīng)用于人臉識別的算法實現(xiàn),是作為第二次開發(fā)的理想工具。
1 系統(tǒng)組成
人臉識別系統(tǒng)可以在Linux 操作系統(tǒng)下利用QT庫來開發(fā)圖形界面,以O(shè)penCV 圖像處理庫為基礎(chǔ),利用庫中提供的相關(guān)功能函數(shù)進行各種處理:通過相機對圖像數(shù)據(jù)進行采集,人臉檢測主要是調(diào)用已訓(xùn)練好的Haar 分類器來對采集的圖像進行模式匹配,檢測結(jié)果利用PCA 算法可進行人臉圖像訓(xùn)練與身份識別,而人臉表情識別則利用了Camshift 跟蹤算法和Lucas–Kanade 光流算法。
2 搭建開發(fā)環(huán)境
采用德國Basler acA640-100gc 相機,PC 機上的操作系統(tǒng)是Fedora 10,并安裝編譯器GCC4.3,QT 4.5和OpenCV2.2 軟件工具包,為了處理視頻,編譯OpenCV 前需編譯FFmpeg,而FFmpeg 還依賴于Xvid庫和X264 庫。
3 應(yīng)用系統(tǒng)開發(fā)
程序主要流程如圖所示。
-
人臉識別
+關(guān)注
關(guān)注
76文章
4005瀏覽量
81769 -
計算機視覺
+關(guān)注
關(guān)注
8文章
1696瀏覽量
45928 -
光流法
+關(guān)注
關(guān)注
0文章
3瀏覽量
7860
發(fā)布評論請先 登錄
相關(guān)推薦
評論