人臉識別如何做到更快更準?
“只要走進裝有攝像頭的咖啡廳,就會發現服務員已提前為你準備好最喜歡的咖啡;來到公司上班,智能迎賓機器人已自動打出帶有你名字的歡迎語……”自馬云向德國總理默克爾演示了“刷臉支付”后,人們對人臉識別技術就有諸多期待,甚至描繪了上述一些具體應用場景。
2008年北京奧運會將人臉識別技術用于安防,這成為人臉識別發展的一個標志性事件,2012年后,人臉識別技術的應用更是呈現出爆發式增長,近年來已應用于金融、司法、軍隊、公安、邊檢、政府、航天、電力、工廠、教育、醫療等眾多領域。
但是,我們真的要進入人臉識別時代了嗎?或許這還沒有人們想象中的那樣快。
軌道交通視頻與安全聯盟名譽理事長、原鐵道部運輸局視頻業務主管領導田裳指出,技術(算法)、設備與環境是人臉識別應用三個缺一不可的環節。
算法的三大進步
在邁向這個時代前,人臉識別在算法上已經取得了三大進步。
近日,生物識別產業技術創新聯盟和軌道交通視頻與安全聯盟在中國科學院自動化所聯合召開了2015人臉識別技術與行業應用研討會。
據生物識別產業技術創新戰略聯盟副理事長、清華大學教授蘇光大介紹,目前基于最佳二維人臉理論的單人單張人臉識別算法已經趨于成熟,基于單人多張人臉識別的算法卻方興未艾。在應用深度學習的人臉識別技術上已經實現了一大進步。香港中文大學采用深度學習方法在 lfw(labeledfacesinthewild)人臉庫上的識別率達到了99.15%。
第二個進步則是單張人臉圖像的三維人臉重建,對視頻監控下的動態識別貢獻尤其大。因為人臉形狀特征點提取技術的提高,使得三維人臉識別技術有了很大進步。此前,有的動態人臉識別系統對于獲取的人臉圖像要求是左右角度不超過15度,兩眼間距大于30像素,但是大部分視頻監控的人臉分辨率低于30像素,安保系統識別困難。第三個進步則是對這些超低分辨率人臉圖像的重建與識別技術取得了一定進展。
在 2014年美國國家標準技術局會舉辦的權威人臉識別技術供應商測評(frvt)中,對平均人臉分辨率為67像素的visa出入境申請照測試集進行測試,2 萬庫的首選識別率排名最高的前三家公司是日本電氣(nec)、法國賽峰和日本東芝,識別率分別為98.3%、93.9%和91.8%。
蘇光大認為,這已經是國際最先進水平,但是在國內某千萬級的辨識系統招標中,要求首選識別率要達到95%就很難實現。“在2萬庫中最先進的水平是如此,在千萬級的水平上,識別率只會線性下降,再加上我國身份證有效期限比較長,容貌在此期間改變較大,怎么能達到95%?這不是逼著廠商去做假?過高的要求在現階段是不切實際的。”他強調。
蘇光大認為,當前人臉識別技術面臨的主要挑戰在于:大姿態角(大于30度)、超低分辨率(人臉分辨率小于30像素)、大年齡跨度(5年以上)和深度學習人臉識別的廣泛應用上。
受制于設備和環境的動態識別
這或許不能責怪人們對人臉識別的期望值過高。
2011年各鐵路局建設了安檢門系統,為人臉識別系統建設提供了基本的硬件條件,有些車站開始陸續上馬人臉識別系統。田裳透露,此前鐵道部在與nec等人臉識別設備提供商接觸時,大家都對視頻動態的人臉識別表示出強烈的信心。
但是,2013年在進行人臉識別的視頻測試時,測試結果卻“辜負”了期望。
軌道交通視頻與安全產業技術聯盟參與了這次測試,測試結果在該研討會上進行了發布。據該聯盟參與測試的研究人員楊柳介紹,根據攝像機角度、光線、目標正面圖像在視頻中的滯留時間、目標同時出現的數量等把從測試車站獲得的視頻分成了a、b、c三類視頻,其中a類視頻能達到車站人臉識別的要求。但是,楊柳等人發現,即使是條件比較好的北京各大車站,也只有北京南站少數幾個攝像頭錄制的視頻能夠達到a類視頻標準。
“即使是在a類視頻和1萬重點人員庫的測試情況下,也有漏報產生。”楊柳說,而且在b類以上級別時,漏報率和誤報率都相當高,從采集圖像的角度分析,人員駐留時間短,不足以將清晰的圖像采集下來,臉部角度大,與庫中的圖片不匹配,嚴重受限于現場的安裝條件。
“服務器性能的高度對測試結果的影響非常大。”楊柳強調,目前鐵路系統人臉識別配備的硬件條件比較差,特別是旅客較多時,需要將每一個人員的臉部圖像采集下來與后臺數據進行逐一比對,但是服務器處理能力差,就會造成采集圖像丟失,直接影響識別率。
與鐵路視頻動態識別面臨同樣困境的還有公安部門的視頻“落地”問題。
公安部第三研究院所副研究員尚巖峰多年從事圖像處理研究,參與過多個圖像識別公安應用項目。他指出了人臉識別總體上不成熟的三大應用:第一,在高可靠人臉驗證系統上,如支付、社保和門禁,視頻或3d模型存在欺騙問題,錯誤拒絕率(far)在小于0.01%的條件下,拒識率可能高達30%以上;第二,安防用 “認證一致性”的驗證系統在far小于0.01%時,拒識率可能高達40%以上,身份證卡內人臉圖像質量差,常小于1kb,現場用戶配合程度不高,且環境也呈現不可控因素;第三,安防用黑名單監控類應用遠未解決,在虛警率為0.01%時,識別率可能低于10%,視頻質量差,表現出低分辨率、大角度拍攝、光照差的特點,而最大的障礙在于缺少可用的訓練和測試數據。
研發了我國第一款帶有生物特征的法定電子證件的公安部第一研究所副研究員宛根訓則總結,視頻動態人臉識別要在這些基礎之上才能收到良好的效果:“采集設備為高清視頻攝像機,光線和現場環境相對可控,通道人流方向相對單一,圖像質量有較大改善。”
海量數據下如何更快
人臉識別所用到的深度學習算法是一套模擬人腦的神經網絡算法,通過收集的海量人臉照片,新型的神經網絡算法可以通過大數據訓練將圖片信息變成能夠被機器理解分析的結構化數據。
蘇光大指出:“基于深度學習的人臉識別難度在于訓練的計算復雜度高,計算機不擅長二維計算,大量耗時在深度學習上,這是要解決的問題。”
那么,在算法、硬件和環境都達到條件的情況下,如何才能實現海量數據下人臉識別的快速查詢?
在所有條件都具備時,數據量小的人臉特征隨著人員數量增長也會變成大數據。在達到接近甚至超過人臉識別準確率的前提下,每一張人臉可小于1kb。但是,北京博思廷科技有限公司總經理王巍對不同規模的人臉數據庫做了計算:1000萬人臉的數據量可達到10gb,3億人臉的數據量就是300gb。
“這樣一來,人臉識別的對比速度馬上就會降下來。”王巍說。
而速度的下降意味著不能實時識別,這對人臉識別速度要求十分高的反恐、防暴等公安安全監測而言,不是一個好消息。
例如,公安機關發現一個可能為逃犯的嫌疑對象,需要查詢某身份未知人員的確切身份時,對比幾百萬人的在逃人員身份信息庫,就會面臨很大壓力。如果要查詢的是一個無家可歸人員的信息,則要對比戶籍人臉數據庫,而一個省份的戶籍人臉可達到數千萬人。
如果要查詢某可疑人員此前在何處出現,比如地鐵,每日客流量可達到1000萬人/天,3億人/月,而且每個人可能在多個位置被抓拍多次。這樣下來,人臉識別的數據量簡直不可想象。
王巍指出,針對一個大小為1000萬的人臉庫的查重,若采用暴力對比法查,需要對比50萬億次。“制約人臉識別查詢速度的因素有兩個,一是基于數學模型的對比方法,最簡單直接的就是暴力對比,效率低、速度慢;二是受限于設備的處理速度。”王巍說。
他建議,使用兩種方法提升對比效率,一是改變對比方法,盡量避免暴力查詢,如根據人臉圖像屬性切割、歸屬成不同類別,采用二分法可以縮減查詢范圍;二是增加設備或者服務器,提高運算能力,或是采用分布式系統架構,并行查詢提升效率。
非常好我支持^.^
(2) 100%
不好我反對
(0) 0%
相關閱讀:
- [電子說] 遠景達人臉識別門禁攻略助你一臂之力 2023-10-20
- [電子說] 智能電梯攝像頭有哪些功能? 2023-10-20
- [電子說] 智慧園區通道閘管理,啟用人臉識別門禁系統更高效更安全 2023-10-16
- [電子說] 才茂智慧校園安防整體解決方案,筑牢校園安全屏障 2023-10-12
- [電子說] 華為云 API 人臉識別服務 FRS 的感知力—偷偷藏不住的你 2023-10-12
- [電子說] 基于Mediatek Genio系列之FaceMe人臉識別方案 2023-09-22
- [電子說] 人臉識別門禁在智慧景區的應用火熱 2023-10-09
- [電子說] 達實空間場景控制系統為客戶提供個性化的空間場景應用 2023-10-08
( 發表人:廣立 )