作者:徐順利
本文由麥姆斯咨詢經徐順利授權發布,如需轉載請注明來源
蘋果公司剛剛發布了最新一代的iPhone X產品,其中最引人注目的就是以深度攝像頭(True Depth)技術為硬件基礎的人臉識別應用, 短短幾天得到人們的廣泛關注。這里,僅發表個人觀點,希望拋開各種專業術語,用最簡單語言讓廣大消費者理解人臉識別的技術背景和給手機帶來的改變。
1. 最自然的識別方式蘋果產品一貫以最佳的用戶體驗著稱, 從第一代iPhone支持觸摸屏開始,每一代產品都力圖在最自然的交互方式上有所創新。無疑,人臉識別是繼觸摸屏后的又一大革命性創新。人類互相認識的最直接最自然的方式就是通過記住人臉的各種屬性和各種姿態,比如我認識你,并不是通過指紋、虹膜或者互相交換密碼。那么一部智能的機器也應該用同樣的方式認識一個人,這樣才最接近人類的自然屬性。所以,好的人臉識別技術,會帶給人們最舒服的體驗,非常容易被接受。2. 可靠的感知系統正如人類的雙眼獲得的是三維空間中的物體圖像,對于機器來說,最佳的識別方式就是擁有像人類一樣的眼睛。這里的關鍵技術就是深度攝像頭(或稱3D攝像頭)。iPhone X為了達成極致體驗,不惜在外觀設計上多開了若干個孔,為的就是給手機加上真正好的深度視覺感知。
大家對2D攝像頭已經非常熟悉了,那么如何評價一個深度攝像頭呢?蘋果公司稱之為True Depth。我給各位一些比較具體的概念:第一,當你判斷一個人臉的時候,看到的是一個人在三維空間中的臉以及臉上的細節,有人化妝、戴眼鏡、部分遮擋臉部、或者是側面對著你、甚至對你做鬼臉,大部分情況下你都可以認得出一個人。如果機器要獲得這樣的能力,必須依靠精準的深度攝像頭以及強大的算法(具體細節會在本文下節講到)。 第二,如果有人拿著一張照片、一個人臉模型、面具、或者一段視頻冒充某個人站在你面前是,你一定一眼識破。那么機器需要利用深度信息才能達到人類的智慧。 第三,手機每天需要被喚醒幾十次甚至上百次,你需要在室內、戶外、黑暗中,以各種姿勢都可以輕易解鎖手機,這就要求深度攝像頭具備很強的抗干擾能力、很快的反應速度、提供專門的紅外LED進行“照明”,以便在黑暗環境下依然可以識別到人臉,而且, 它需要有足夠長的壽命(畢竟,帶著這種高科技的手機都不便宜啊…)。
3. 數據和算法的重要性人類的認識過程是在不斷地自我學習的,并不是每一個視力正常的人都擁有相同的識別能力。孩子記住人臉的能力不如成人,一個外國人初到中國,有可能覺得中國人長得都差不多,生活一段時間后,才可以很容易地辨別每個中國人,而一個經過特殊訓練的間諜可以在很短的時間內就記住一個陌生的面孔并且準確識別。這就是學習的過程。機器也是一樣,通過對大量人臉樣本的學習以及好得算法來增強自己的識別能力。目前的大部分人臉識別方案的數據來源都是2D照片,我們每個人的身份證照片、各種公開場合的照片、注冊在各個網站或者系統的照片等等,都可以成為計算機識別人臉的樣本,通過大量的技術積累,目前的2D人臉識別技術能夠達到0.1~0.2% 的錯誤接受率,但在某些條件下可能有所限制(比如光照、墨鏡、角度、表情等等)。而且最關鍵的一點,基于2D圖像的人臉識別,容易被高清逼真的照片攻擊,所以高級別的安全應用(比如支付),往往不敢只用2D信息做認證。為了克服2D數據的限制和攻擊漏洞,在3D攝像頭普及之前,業內人士想了很多辦法來彌補其中的不足,主要思路就是首先確認使用者是一個真正的人,不是照片或者錄像, 然后利用已有的2D數據和算法進一步識別人臉。最典型的兩種方式:
一、用戶驗證時被機器要求做一個表情,比如眨眼、微笑、或者點頭等等,目前的支付寶登錄就用了這樣的方法,這樣避免了照片攻擊,如果不是頻繁操作,用戶可以接受, 但是如果需要在各種場合頻繁解鎖,那么你可能由于表情包太豐富被人注意。
二、利用深度攝像頭判斷是否是活體人臉,然后用2D算法做人臉識別。形象點說,當你通過一個具有人臉識別功能的安檢閘口的時候,機器用你的2D 圖像數據進行識別,同時需要有一位工作人員站在旁邊確認你沒有用照片作弊(但工作人員并不認識你)。如果機器本身能夠利用深度攝像頭判斷你的臉是否是真的人臉還是照片,那么就不需要額外的工作人員了。 這樣做確實避免了攻擊而且對使用者沒有表情要求,很多場合下這就是很不錯的方案了。但是這臺機器其實還是不認識三維空間的你,距離真正人類智慧還有不小差距,沒有從本質上突破2D數據的限制。
iPhone X的3D人臉識別技術遠遠超越了2D識別的認知極限,達到了百萬份之一的錯誤接受率。 如何做到呢?最關鍵的就是數據和算法。最佳的3D人臉識別技術,樣本數據來源就應該是真正的3D人臉, 也就是用通過深度攝像頭獲取人臉模型作為機器學習的樣本,這是最接近人類認識過程的方式。不過,因為深度攝像頭技術最近幾年才開始在一定范圍內推廣,過去的幾年當中,除了蘋果公司,業內只有幾家著名的公司在做這方面的投入,第一個被人們熟知的消費類3D人臉識別應用是基于Intel RealSense的Windows Hello, 用于PC平臺Windows操作系統解鎖,至今大概僅僅有4年的歷史。這種情況下,公開的3D人臉的樣本數據量非常有限,想必蘋果公司從收購深度攝像頭公司PrimeSense(2013年)那一刻起,就投入大量資源收集數據樣本了。
隨之而來的就是兩個問題。 問題一: iPhone X之后,會是誰呢?我們能否在其它手機上獲得同樣的體驗呢? 我的理解是 – 數據和算法是關鍵,誰能夠在短期內獲得大量的3D人臉數據、并且運用最好的學習方法 (專業術語叫做機器學習, 哈哈),誰就可以擁有iPhone X的人臉識別能力。對于這一行業的公司來說,這將是一個巨大的投入。 問題二:iPhone X每天都在讀取我的信息作為樣本嗎?不得而知。 可以明確的是,隨著使用者和使用次數的增多,很多新的數據會被當作是樣本的補充,不斷完善機器對人臉的認知,甚至是對你本人的更多的理解,這就好像你領養的小狗,跟你越來越親近。好的人臉識別算法,都會以不斷增強的方式學習數據,給用戶以更好的反饋。4. 安全問題關于人臉識別的安全已經有過很多的爭論。 首先是關于黑客攻擊的, iPhone X用了百萬分之一的錯誤識別率以保證你的設備不會被其它人輕易解鎖,并且超越指紋識別達到了支付級別,這也是給生物識別行業重新定義了衡量的標準。相信未來以深度攝像技術和優秀算法為基礎的技術可以很快跟進了。其次是關于人臉識別的安全規范, 如果人臉作為重要的安全憑證用在方方面面,你的臉部信息將被如何獲取、如何存儲以及如何使用,會變成這個行業的又一大難題。試想,如果今天你的臉上長出了青春痘,明天就有化妝品公司向你推銷祛痘產品,你是否會有被偷窺的感覺呢?(當然這是玩笑話)我們期待業內的領軍企業發揮社會責任感,促進整個生態的安全和健康。總之,目前的人臉識別領域,只有同時具備強大的硬件、軟件、數據等技術實力和足夠安全保障的公司或者方案商, 才能給消費者提供舒適的體驗和信心保證。iPhone X的發布,似乎是出了一道關于人臉識別的命題作文,不單單是針對手機相關行業,也影響了更廣泛的領域,甚至我們每個人。無論你喜歡還是拒絕,刷臉時代的序幕已經拉開了,你準備好了嗎?
-
人臉識別
+關注
關注
76文章
4007瀏覽量
81780
原文標題:用最簡單的語言描述人臉識別技術的核心問題
文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論