如今人臉識別技術越來越多得應用到我們生活之中,安防、交通、金融等領域都可以見到它的身影,同時人臉識別領域的公司也深受資本的青睞,涌現出了一大批的“獨角獸”。那么這其中到底哪家的技術強呢?
在知乎問題“關于人臉識別哪家強?”下,作者@MaxSam提供了一個高票回答,以一個從事人員的角度詳細解釋了這個行業。
以下為知乎@MaxSam 的回答:
本人從事人臉識別相關工作(2017年底剛剛離開該行業),這一波人工智能的投資風起來,很多人臉識別公司恨不得馬上往自己臉上貼幾噸金,有個朋友說了一句很有意思的話:
外行一般覺得很科幻,內行一般覺得很絕望,業界領袖和領袖各種打雞血。
大部分AI公司都在燒錢階段,未來變現有很大的不確定性。看看百度自動駕駛的系統和google圖像識別系統的開放可以預知未來免費是大趨勢,那可是曾經投入數百億美元。但是資本投進來,必須拉著媒體一起吆喝,不然本都回不了(進入AI行業才知道很多資本方原來什么也不懂亂投)。
人臉識別作為一項模塊技術很少有獨立應用(獨立的業務層設計),大部分只是為已有的業務軟件體系上做增強,比如客戶人臉校驗(在過去密碼基礎上增加一層),人臉檢索(比人工高效,攝像頭結果過濾),相似人臉推薦(比如婚介社交,整容設計),不過這個過程中已經死掉大量公司,因為利潤太少,非強需求。
目前相關產業公司在已知的主要商業模式中都在實踐,但賣貨,賣授權,賣服務,后臺流量變現這四大商業模式中,都沒有看到一個公司有。作為行業中人,所謂的絕望無非如下:
1. 算法再好,也只是調味料,最終出路還是做到最終產品中,通過業務層疊加開發,形成產品和方案,更多時候是一個方案服務商,更像過去傳統軟件商,規模難有爆發。
2. 使用門檻、成本很低,目前市場上終端算法部署比較低端的產品授權就500元/套(1:1的遠程接口調用所使用的前端授權),市場競爭的結果就是低價傾銷。
人臉識別目前就是為了各種噱頭立項、經費申請瓜分用的,有個公司靠這個拿國家各種科技補貼。真正賺錢都是那些中間商公司,人臉識別一家都沒有。至于未來有沒有新商業模式出現,暫且無法推斷。
題主問題比較寬泛(到底是盈利強,還是算法強,還是應用強?),人臉識別技術的衡量維度太多,但從技術比較,比如圖像比對級的1:1,1:N,N:N;衡量的標準和維度都不同。比如算法精確度上,國內國外的人臉識別技術大多數在開源OPENCV等開源庫上進行新規則添加(深度學習進行疊層運算),公司之間的識別正確率差異僅僅在小數點上,99.6%-99.7%提升意義不大,如果說在LFW上稱王稱霸就是世界一流,就要被內行笑話了。
衡量人臉識別的算法能力幾個指標:拒識率、誤識率、通過率,準確率。
先看看人臉識別的基本流程:
人臉識別最難的部分是有充分適應各大光線環境的人臉預處理算法,需要在各種復雜的光線環境中提取到人臉信息,特別是移動互聯網時代,攝像頭拍照的地方可以在斑駁的樹影下,也可以在昏暗的街燈下,以及深夜出租車內,這對算法的魯棒性考驗極大。同時還要考慮照片和視頻欺詐,二次成像的光線污染等問題。
下面說一下目前人臉識別的常見問題(不要再問人臉識別準確度了,這個是外行話)。
1:1人臉識別算法主要用于身份驗證
1:1人臉識別技術主要是利用圖像處理技術從圖像中提取人像特征點,利用生物統計學的原理進行分析建立數學模型,即人臉特征點模型。再從人臉特征點模型與被測者的人的面像進行特征分析(可以假定為無數的幾何特征點求解),根據分析的結果來給出一個相似值,通過這個值即可確定是否為同一人。簡單的說就是A/B兩張照片比對,產生的計算數值是否達到要求。
這個值我們稱之為閾值,可以從1到100(100就是極端嚴苛)很多人臉識別公司說他們的產品很容易通過,那只說了一半,如果閾值調整到5以下,幾乎大部分人都可以是相似的,而調整到95以上,同一個人在不同的背景環境拍出的照片都無法匹配。所以當一公司跟你吹牛算法準確度,先問下使用的是用什么閾值,同一人臉比對通過率,非同一人比對通過率。
1:1主要用于快速的人臉識別比對,作為身份確認的一種新方式,比如考生身份確認、公司考勤確認、各種證件照和本人確認,由于這些照片源不一定有權威統一的接口調用,所以一直沒有用起來。目前市面上做的比對來源主要有三種方式:
1. 用戶自傳照片,比如支付寶的人臉比對,用戶自傳的照片最大的問題是照片質量的合格率太低,拍照的光線、角度等因素會導致采集源的質量下降,不利于后期的大批量人臉特征碼管理。
2. 使用身份證讀卡器,讀取身份證上的照片,遺憾的是這張照片的質量極差,2K的大小,很多照片上的人臉質量實際非常差,不過也是目前用最多的方式。
3. 使用公安部旗下NCIIC的人臉比對接口(注意,不是網紋照片接口,這個接口已經不對外),使用的是直接的人臉比對接口。目前具備有這個庫調用權限的,目前所知的只有幾家,在人臉識別公司中,好像只看到一家在提供,這里先不提了。BAT應該都還沒有接入,如有大家有新發現的可以補充。
實際上,解決比對源的問題的關鍵是需要有權威的照片數據來進行比對,許多公司剛剛開始的時候采取NCIIC(公安部的一個事業單位)身份證返照接口的照片,進行消網紋處理進行比對,但人臉的很多特征點被損毀成功率大概只有6成(根據六月份發布的網絡安全法,目前網紋返照接口市面上除了銀行系統可以使用外,其他所用的身份證返照接口都是非法的,一用就被查)。
無證件的情況下,如何確認本人是XX?
曾經有一些問題是關于如何確認本人的笑話,派出所要求一個小伙證明就是本人,證明你媽是你媽。。這種奇葩問題,但是許多陌生場合也有這種尷尬,你如果沒有帶證件,警察無法看到你的照片,如何確認你就是XX就是之前經常出現的執法矛盾;如果一個人把身份證弄丟了,外面風雪交加,如何給這類人辦理酒店入住手續?這些就是身份確認的問題。公安部推身份證網上副本 身份認證可“刷臉”完成就是用來解決這個問題,我們出門不用完全依賴身份證可以確定身份,可以方便很多。
但是1:1人臉算法的巨大隱患是我們隨處可見的人臉,實際就是一個公開的鑰匙,馬云提出刷臉消費吃飯,如果沒有手機驗證碼(本身也是一重手機實名驗證),分分鐘鐘被吃垮。但是既然可以用手機,為什么還用刷臉,不是多此一舉嗎?
另外還有一些高級會所,希望實現VIP的貴賓警報服務,這個在下面的1:N和N:人臉識別算法系統中可以看到。但是1:1比對的身份應用哪家強了?
比如遠程的互聯網客戶,如何確認身份?
在互聯網買機票、車票,醫院掛號,政府惠民工程項目,以及各種證券開戶、電信開戶、互聯網金融開戶都會用到。過去的身份認證方式是非常不妥的(比如支付寶的持有注冊流程,還有一些不知名的社交APP等需要上傳身份證照片),這些資料是極其容易被盜取和轉賣的,下圖是來自百度的圖片搜索結果截圖,還有最近的一些女大學生的裸條資料泄露知乎專欄,導致犯罪分子有很多利用的漏洞,黑客軍團號稱資料2000萬,分分鐘鐘薅干一家金融平臺沒有問題:
許多金融公司喜歡把人臉識別SDK模塊嵌入到APP當中,但這個太容易繞過,所以會再加上活體檢測(市場上常見的活體檢測為隨機動作配合),但是即便加了活體檢測,也一樣可以繞過。比如下面這兩種方式:
1. 3D人臉仿真面具
2. 人臉模型實時重建
所謂道高一尺魔高一丈,這個還是增加其他的多維校驗才能確認身份,否則真有人要進行遠程攻擊,也不是很難的事情。那么活體檢測哪家強了?
1:N人臉識別算法主要用于人臉檢索
跟1:1的A/B兩張照片比對最大的區別是A/B A/C A/D……多個1:1計算,這個最大的問題是一旦BCD總和數量越大計算速度越慢,而總和超過20萬,就回出現多個相似結果(20萬人這個大數會導致有不少人長相相似),需要人工輔助定位。過去我們在電影里面看到什么“天網”識別系統只是一種理想狀態,實際應用中都是排列出多個結果,排第一的未必是需要的人。
1:N人臉識別算法主要用于排查犯罪嫌疑人、失蹤人口的全庫搜尋、一人多證的重復排查,以此相似度列出相應的結果,可以大大提高排查效率。類似的也可以用到走失兒童的項目中去,相比美帝的亞當警報、安珀警戒,國內有沒有類似的兒童走失警報及尋找機制?
這一類系統的部署需要兩個條件:
1. BCD基本庫(比如1000萬人)
2. 強大的算法硬件
1:N同時作業就是N:N了,同時相應多張照片檢索需求,檢索耗費的時間跟硬件算法關系極大,就這一領域的應用,又哪家公司強了?
N:N人臉識別算法主要用于實時多1:N檢索計算:
N:N 該算法實際上是基于1:N的算法,輸入多個求解結果。比如視頻流的幀處理所用,對服務器的計算環境要求嚴苛,目前的算法系統所支撐的輸出率非常有限。
主要的限制如下:
海量的人臉照片解析需要大量運算(目前很少看到在采集端直接解析的,都是照片剪裁)海量的人臉照片傳輸需要大量的帶寬(常見的720布控攝像頭抓取最小的人臉照片為20K)海量的人臉照片在后臺檢索需要耗費大量的運算(國內主流主機為例,最多到24路攝像頭)
由此可見,真正實現“天網”人臉檢索,一來要解決數億攝像頭的圖片處理,二來需要解決聯合庫的超算檢索,這可不是一般公司吃得消。有些小區和高級場所,對VIP客戶的識別和接待比較喜歡這種視頻校驗方式,但是實際部署使用者會受到攝像頭位置、角度,以及多人同時入場產生的問題,而且人臉庫會非常有限,不然計算時間長,體驗極差,一些所謂的迎賓機通常也就幾個人的照片(就是純粹給領導看的),實用價值大大的打折扣,有戴墨鏡或者帽子遮蔽都認不出,畢竟關鍵特征取樣有限。這又有誰強了?
拍照和直播APP的人臉圖像疊加
國內比較多的娛樂APP通過對人像圖層跟蹤處理,也是一個不錯的技術切入點,但是產品安裝包會比較大,現在做的也只是跟蹤技術,屬于底層識別,如果復雜一些的需要通過云服務實現,但是服務器算法解析速度和帶寬比較難以跟上,也不算是一種靠譜的商業模式。
人臉識別的技術發展方向:
結合三維信息:二維和三維信息融合使特征更加魯棒;
多特征融合:單一特征難以應對復雜的光照和姿態變化;
大規模人臉比對:面向海量數據的人臉比對與搜索;
深度學習:在大數據條件下充分發揮深度神經網絡強大的學習能力。
在視頻級N:N的校驗中,如果要提高通過率,很多時候是采取降低準確率的方式,降低算法隊列數量;同樣在一些比賽中為了降低誤識率,大大提高了準確率,所以算法在校驗的過程中必須遵循至少一個固定標準,追求的是速度效率還是最高準確率。
人臉識別應用的發展方向
人臉識別這玩意兒就是一個調味料,在千萬的業務解決方案中,就是一個小模塊,其他的都是業務層的開發問題,使用上,技術也未必要高精尖,如果一定要真正稱得上人工智能組成部分的,個人認為未來最大的使用端是機器人視覺交互。
人臉識別算法的應用分類派系:
人臉識別對應解決方案方向:
個人認為未來人臉識別會讓大部分的數據更加真實,而可以通過社會工程學模板做很多分析和改良,比如近期一些科學家利用人臉識別來分析一些人的健康、清晰,甚至是犯罪傾向,或許在未來還可以結合大數據,對我們過去傳統的面相分析技術做一個全新的提升,到時候算命先生都要失業了。更多機器人交互、無人機產生的攝像目標鎖定分析等科幻畫面并不是多遙遠的事情。
關于算法核心研發情況的爭論:
基本上國內每家公司都會說自己的算法牛,實際上有幾家有人臉核心算法呢?國內在完全從事算法研究的總工程師人數到目前(2016年)總計不到100人,不過也沒有現在問題也不大,中科院計算所山世光教授已經開源了(https://zhuanlan.zhihu.com/p/22451474),沒有基礎的公司不用太辛苦從零開始在OPENCV基礎上做算法升級,相信很快google微軟還會有新的算法發布。現在算法基本都是98%以上,這點差距已經不重要,算法核不核心也沒有太大問題。大家不用太過于焦慮,產品到應用階段,單單靠算法可不夠,還要考慮實際的使用。
目前做人臉識別的公司很多,集成應用的有數百家,國內的看百度,看融資,看各種報道就差不多了,只是認真沉下心來做事情的公司太少。國內的騰訊和阿里都在做(阿里支付寶用的是自己的團隊研發算法,只是特別低調,把名聲都留給自己投資的公司,阿里可不止投了一家),國內的公司吹牛逼的、炒概念的太多,就不聊了。
美國Identix公司
美國Bioscrypt公司
德國Cognitec Systems公司
西班牙Herta Security公司
日本NEC公司
日本Softwise公司
以上都是老牌人臉識別公司,美國Identix公司做的是多模認證(指紋、虹膜),而Bioscrypt公司早期起于指紋識別考勤,在政府市場的份額都不小,德國的Cognitec公司主要做政府項目的人臉識別系統,而NEC公司主要做機器人視覺識別系統,西班牙Herta公司是一家學術很濃厚的公司。此外的還有一些以色列公司技術。這些公司幾乎做的都是政府的安全項目,但公司普遍規模都很小,盈利和投資也很少見報道。Facebook公司進入這個領域,主要是進行人群的分類和應用的優化(針對性的市場推廣),項目都是作為公司原本業務的一種補充。
所以這個問題到了最后,我只能說:如果非要問人臉識別哪家強,不如問哪家公司吹牛逼強。
-
人臉識別
+關注
關注
76文章
4005瀏覽量
81774
原文標題:人臉識別技術哪家強?不如問哪家公司吹牛強!
文章出處:【微信號:icsmart,微信公眾號:芯智訊】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論