「依圖太寂寞了,我們打算來陪陪它」,馬原開了個玩笑。
在當(dāng)下的安防市場中,沒有一家人臉識別公司不把自己稱為「完整的解決方案供應(yīng)商」。
「自主研發(fā)」「全棧式技術(shù)算機(jī)識別技術(shù)」「軟硬件產(chǎn)品」「面向垂直場景的解決方案」……
這幾個條件放在一起,你能猜出是哪家公司嗎?
然而,就在技術(shù)龍頭公司仍然標(biāo)榜自己技術(shù)超群,追逐者們開始用「技術(shù)已趨于同質(zhì)化」說事之時,最大的話語權(quán)其實掌握在了「產(chǎn)品經(jīng)理」手中。
「安博會上那么多人臉識別一體機(jī),無論系統(tǒng)根據(jù)現(xiàn)場情況如何進(jìn)行了調(diào)整,你一家一家觀察下來會有一些答案。抓拍效果不說,漏檢率、識別率、誤報率、算法效率(平均硬件成本),屬性豐富程度,響應(yīng)時間等等技術(shù)指標(biāo)還是有差別的。
然后你會發(fā)現(xiàn),BAT 某家公司做的一體機(jī)簡直連及格線都達(dá)不到。」一位業(yè)內(nèi)人士指出,并不是用算法套個殼就可以標(biāo)榜自己是個有落地能力的技術(shù)公司。
換言之,比起玩概念游戲,人臉識別技術(shù)的產(chǎn)品工程化能力才會讓一家技術(shù)公司真正「露怯」。
而這個客觀問題,也是馬原直到 2018 年 9 月才成立一家人臉識別公司的眾多原因之一。
「以前在學(xué)界,包括在曠視時,我們在做項目的時候都很難解決一些問題。為什么?那個時候我們持有的更多想法是『我有好的技術(shù),如果這個場景解決不掉,那么這不是我的問題,是場景問題。」
而在后來的很多安防項目中,他經(jīng)歷過許多實際需求與產(chǎn)品功能不匹配的場景與問題,也因此看到在一個垂直場景里,與其做「最快的」,不如做「最符合預(yù)期的」。
「我們曾開玩笑說,目前的安防人臉識別系統(tǒng)應(yīng)該叫『中青年男性人臉識別系統(tǒng)』。
什么意思呢?首先白天和黑夜,黑夜肯定不好使,這個大家都不提;而且現(xiàn)在大多是白天能抓到人,現(xiàn)在大家也盡量不提這個問題。
然后,白天里面,女性識別其實解決的不太好,從證件照就開始 P 圖,然后平時日常也開始化妝,都會受影響。
而男性里面,老人和小孩都不太好,你會發(fā)現(xiàn),你能把逃犯抓得回來,但是,小孩拐賣到今天都解決不了。
逃犯抓得那么好,那為什么小孩和老人也找不回來,你會發(fā)現(xiàn)在這么一個全集里,只有角落的這一部分中青年男性你是能解決的,剩下的東西還是解決不了。
所以在安防這個場景,這些問題終究會不會解決?一定會解決,但需要時間,需要積累。」
因此,澎思科技的誕生,頗有些修正原有技術(shù)落地執(zhí)行錯誤,抓住市場紅利期機(jī)會的味道。
而今天剛剛官宣的 1.5 億人民幣 A 輪融資,也是其首次引入產(chǎn)業(yè)資本,借助 360 與富士康旗下產(chǎn)業(yè)資本(啟睿天成與鴻富創(chuàng)新)的渠道資源承接訂單、擴(kuò)充和升級產(chǎn)品線,并完善工程化能力。
「很多人覺得市場已經(jīng)很擁擠了,畢竟有「一桶筐湯」(依圖、格靈深瞳、曠視、商湯) 在前。
而且海康大華在 2012、2013 年的時候,就已經(jīng)在公安部猛推過一波人臉識別,這個行業(yè)的人知道。」如今已經(jīng)成為澎思科技CEO的馬原談到了時間維度上的市場進(jìn)入策略。
「其實那時候效果不怎么樣,而后來我們在 2014、2015 年做人臉識別的時候,所有公安都覺得你是騙子。即便給你試點,只是說『你給我裝一個攝像頭,一個星期你就給我拆走』,所有人都是這個態(tài)度。
所以從這一點上你就可以看出來,其實大的公司你會發(fā)現(xiàn)它不缺戰(zhàn)略、不缺人才、不缺視野,它知道什么東西是市場需要的,但是時間點卻不對。」
因此他指出,即便到了 2019 年,安防行業(yè)與 AI 的結(jié)合仍然遠(yuǎn)未成熟。
一方面是上面提到的做出真正全棧產(chǎn)品的技術(shù)工程化能力,而另一方面則是由安防行業(yè)幾十年來形成的特點決定的——未有效實現(xiàn)大規(guī)模聯(lián)網(wǎng),數(shù)據(jù)壁壘,是真正被遺落在信息化角落的一個行業(yè)。
「我們把山東的車拿到北京來開,如果有了罰單不會罰到我?這不可能。因為現(xiàn)在大部分各級政府委辦局的系統(tǒng)都聯(lián)網(wǎng)了。
但是你再看現(xiàn)在的監(jiān)控,現(xiàn)在的監(jiān)控全部是以區(qū)和街道為單位,全部都是分布式存儲,所有數(shù)據(jù)并沒有拉通,所以它連自己內(nèi)部都沒有拉通,就更不用提移動互聯(lián)網(wǎng)化這個事情了。」
這也就能繼續(xù)回答為何到目前為止,每個以人臉識別為基礎(chǔ)的安防項目都是以市或者區(qū)為單位來進(jìn)行,繼而能夠從更大的視角來解釋安防行業(yè)結(jié)構(gòu)的「碎片化」——
全國大大小小幾萬家公司都可以在這個市場撈口飯吃,每一家公司都可以盤踞一個地方。
「因此我覺得,現(xiàn)在有了能夠讓這個行業(yè)發(fā)生劇烈變動的條件,一個是核心算法,另一個就是傳輸能力。而劇烈的程度是,其他行業(yè)大概花了幾十年從信息化過渡到智能化的進(jìn)程,安防可能 3~5 年就要全部經(jīng)歷完一次。」馬原講述了自己對安防行業(yè)切入時機(jī)的理解。
但是,反過來看,即便數(shù)據(jù)的解析與上云以及 5G 的到來會對整個安防行業(yè)帶來顛覆性沖擊,趨于碎片化的行業(yè)結(jié)構(gòu)特點難道就沒有給像澎思這樣的初創(chuàng)公司順利切入市場的機(jī)會?
澎思在無錫的安防項目,應(yīng)該追溯到 2009 年馬原在中科院物聯(lián)網(wǎng)研究發(fā)展中心的第一份工作。
這家一家在無錫成立的行業(yè)垂直研究機(jī)構(gòu),作為核心團(tuán)隊人員,馬原當(dāng)時所在的實驗室叫 VIOT,也就是「智能視覺物聯(lián)網(wǎng)」。
「我個人當(dāng)時也是承擔(dān)省一級的課題,叫海量視頻綜合利用集成與示范應(yīng)用,面向的行業(yè)正是安防行業(yè)。」
很顯然,不太可能一家通吃的安防軟件行業(yè)與「買單意愿最強(qiáng)烈」的 2G 賽道,給了太多 AI 創(chuàng)業(yè)公司以機(jī)會,而現(xiàn)在,他們愈發(fā)不滿足于只占據(jù)一個山頭了。
以下是根據(jù)現(xiàn)場采訪做的內(nèi)容精編:
問:為什么我們這一輪要由產(chǎn)業(yè)投資,它跟我們之前的資本方有什么不一樣的地方?
馬原:對,像富士康就是給我們訂單的,360 也會有這些,因為 360 現(xiàn)在目前它不是從美國回到國內(nèi)了嘛,負(fù)責(zé)咱們國家的網(wǎng)絡(luò)安全,然后建立安全城市大腦。所以,在這個大腦版圖上我們也可以有一些協(xié)同。
問:他們看中的是你們的團(tuán)隊嗎?
馬原:我覺得綜合來看,一是團(tuán)隊,天使團(tuán)隊看團(tuán)隊,Pre-A 投資看得是產(chǎn)品能力,A 輪投資看得是整個業(yè)務(wù),是不是證明了你的想法,同時你這個人還能持續(xù)地推動這個業(yè)務(wù)不斷地增長,就是綜合地判斷了。
問:那 360 希望你們給他帶來什么呢?
馬原:短期內(nèi)不需要。
問:我們這一輪融資主要往哪些方面發(fā)展?
馬原:一方面繼續(xù)夯實泛安防的領(lǐng)域,因為安防這個行業(yè)其實已經(jīng)足夠大了,馬上就要接近萬億的市場,其實場景非常多,需要的產(chǎn)品種類也非常多。
你像海康、大華任何一家公司都是上千款、上萬款產(chǎn)品,而我們只是做其中的一個智能安防,雖然沒有那么多,產(chǎn)品也不會少。
同時,我們也會關(guān)注像富士康這樣的案例,我們會繼續(xù)觀察哪些場景,我們還能做得還不錯,能幫助他們解決一些問題,也會保持關(guān)注。
問:銷售體系是如何建立的?
馬原:還是直客為主,從今年開始,正式建渠道體系。
問:變現(xiàn)的方式我想確認(rèn)一下,我們公司現(xiàn)在已經(jīng)開始盈虧平衡了嗎?還是您對盈虧平衡的預(yù)期在什么時間可以達(dá)到?
馬原:我們預(yù)期在 3 年內(nèi),應(yīng)該就可以實現(xiàn)盈虧平衡。
問:你們是通過集成商跟公安對接嗎?
馬原:是,安防有一個模式叫準(zhǔn)直銷模式。什么意思呢?產(chǎn)品和集成是分離的,用戶會說我就要買農(nóng)夫山泉,但這個標(biāo)誰中我不管,你就要把農(nóng)夫山泉給我買來,是這個意思。我們在這個技術(shù)層面上和用戶直接交流,但是在項目層面上不一樣。只要用戶最終認(rèn)可說我就要買這個東西就行,所以這個過程中,至于是哪家集成商來集成我們的產(chǎn)品,都是根據(jù)各地情況來分配的。
比如我們在江蘇合作的電信多一點,我們在廣東合作的移動多一點,這都是有當(dāng)?shù)靥厣模驗樗袑Ξ?dāng)?shù)氐姆?wù)支持能力,有成本優(yōu)勢,這叫準(zhǔn)直銷模式。
問:,您剛才也談到曠視、商湯,他們是做平臺,而您要做更多的垂直場景,并且打穿它。其實他們也有很多落地的場景我們都可以看得到,也很重視,你們有沒有和他們在市場上,和客戶當(dāng)中有沒有正面碰到過?你們怎么說服客戶?
馬原:有碰到過啊,所以為什么我們能產(chǎn)生收入,就是說白了現(xiàn)在目前市場上沒有哪家用戶是不知道曠視和商湯的,更不用說海康大華,其實就是我們能證明我們在這個場景下我們做的比它們都好,因為我們足夠?qū)Wⅲ鋵嵾@并不是能力的問題,不是資金的問題。
這個怎么說呢?這就是時代造就的,你說雅虎、新浪、搜狐這些人做不好搜索嗎?還是做不好社交,還是做不好購物?
無非原因就是它的定位它需要什么都做。其實人的時間精力都是有限的,所以我們?yōu)槭裁凑f我們會成為安防+AI 這個賽道的頭部,因為我們現(xiàn)在所有人都 all in 在這件事情上,很專注,就把這件事情先做好。
問:怎么來看這個專注與不專注?是怎么衡量的?怎么說它們就不專注,咱們就專注?
馬原:從產(chǎn)品的迭代速度上,從算法升級的速度上,比方說你看現(xiàn)在目前在安防領(lǐng)域起碼大家看得到,依圖是跑在前面的,甚至已經(jīng)連續(xù)兩三年都是依圖比商湯曠視好那么一點點。但我們覺得依圖太孤獨了,我們打算來陪陪它。
問:您剛才提到 5G 再加「上云」,它對安防行業(yè)會有一個大的沖擊。這個沖擊是一個什么樣的沖擊,您能給我們詳細(xì)的解釋一下嗎?
馬原:我覺得就是不亞于從功能機(jī)變成智能手機(jī)的這個沖擊,整個這一波,包括像海康,包括像傳統(tǒng)制造類企業(yè),其實如果你們?nèi)ツ暝谛袠I(yè)中有過一些調(diào)研,你會發(fā)現(xiàn)去年華為在整個行業(yè)沖的非常猛。
再從海康來看,去年的 slogan 是一家以視頻為核心的物聯(lián)網(wǎng)公司,現(xiàn)在他又開始說自己是數(shù)據(jù)公司了,其實這件事情任何一個 IT 行業(yè)的終局都是數(shù)據(jù)公司。
早年你看互聯(lián)網(wǎng)在早期發(fā)展的時候,大家是 Web1.0、2.0,甚至還有什么 RSS,還有什么交互,天天給大家講交互這個事兒應(yīng)該怎么做。
你會發(fā)現(xiàn)現(xiàn)在沒有人提這個事情,為什么呢?因為 BAT 已經(jīng)形成了超大的數(shù)據(jù)壁壘,包括它后續(xù)的所有技術(shù)的研發(fā)都是靠數(shù)據(jù)驅(qū)動的。
所以這個行業(yè)如果能上云,如果 5G 能到來,能解決傳輸?shù)膯栴}、解析的問題,所以這個行業(yè)整個會被互聯(lián)網(wǎng)技術(shù)、AI 技術(shù)、云技術(shù)來改造,所以這對任何一個行業(yè)的玩家都是機(jī)遇和挑戰(zhàn),大家都需要轉(zhuǎn)型。
換句話說,站在終點那個人長什么樣子已經(jīng)很明確了,就是你既得懂硬件,還得懂軟件,還得懂云,還得懂算法的一家新型的智能互聯(lián)網(wǎng)公司,就長這個樣子。
現(xiàn)在大家是各有所長,傳統(tǒng)企業(yè)有渠道、有硬件優(yōu)勢;BAT 公司有人才、有云、有算法的優(yōu)勢,大家都要進(jìn)行融合,最終看誰活到最后一點。
問:像您剛才說,像海康、大華,他們原來都是做傳統(tǒng)硬件的公司,也開始做算法了,他們有自己硬件和渠道的東西,您覺得他們要開始做算法、做軟件的話,有什么優(yōu)劣?
馬原:優(yōu)勢在于他擁有大公司的人才、視野、資金,他都有。但這就好象你說為什么諾基亞或者摩托拉不做智能機(jī)一樣。
講一個故事,我們其實在硬件里面受了前錘子 CTO 錢晨博士的幫忙,我當(dāng)時就問他,我說我就問你一個問題,摩托羅拉怎么就黃了呢?因此我實在想不明白,這種大公司,有人、有財、有錢,它怎么可能就不會做智能機(jī)?
然后他跟我說,你知道嗎,摩托羅拉的失敗源于它的成功,這話什么意思?他說你知不知道當(dāng)今有一款手機(jī)叫 V3,我說我知道,他說就是那個手機(jī)害的,我說為什么?
他說你看那個手機(jī),你發(fā)沒發(fā)現(xiàn),諾基亞做的全是直板機(jī),那種翻蓋機(jī)都特別厚,上面下面都一樣厚,只有摩托羅拉那個 V3 它是相當(dāng)薄的,它合起來跟一個直板機(jī)一樣厚。
他說你知道這個關(guān)鍵技術(shù)在哪兒呢?在于上屏和上屏之間那個柔性電動它能做到 16 層,這個技術(shù)只有摩托羅拉有。
所以,你就發(fā)現(xiàn)好玩的事情了,是不是技術(shù)引導(dǎo)的?是不是技術(shù)先進(jìn)的?沒毛病吧,完全沒有問題,然后還獲得了很大的成功,市場還很好。
所以,在這樣的成功下,下一個時代來臨的時候,你可能就不會那么成功了,很多時候為什么人、組織會產(chǎn)生變革,會決定往前走,往往就是因為自己現(xiàn)在過的不好了。
所以,我覺得這些問題就是傳統(tǒng)企業(yè)面臨挑戰(zhàn),在這個事情上我現(xiàn)在看來,兩個企業(yè)做的很好。一個是互聯(lián)網(wǎng)的阿里,一個是傳統(tǒng)的華為,只有這兩家有神奇的辦法能夠在非常優(yōu)勢局的情況下還能不落后,還能繼續(xù)往前走,這個非常神奇,所以這就是組織的能力。
問:您覺得人臉在安防領(lǐng)域現(xiàn)在還未成熟的原因具體落實到安防場景中的人臉識別功能上有哪些?
馬原:你看人臉識別,我們現(xiàn)在大部分人用的很多是蘋果的 Face-id,還有人臉支付。
在這個場景下其實就兩張照片的比對,說白了我知道你是誰,我只是想看屏幕面前這個人是不是你,這個一比一的問題。
而在安防場景是一個只有賬號沒有密碼的過程,我只是把這個人采進(jìn)來了,這個人到底是誰,它在庫里檢索,出一個相似度。所以你會發(fā)現(xiàn),在安防場景:
1、人員是不配合的。
2、是面向全人口的。
所以,打個比方,我們開玩笑說,現(xiàn)在目前的安防人臉識別系統(tǒng)叫中青年男性人臉識別系統(tǒng),什么意思呢?
首先白天和黑夜,黑夜肯定不好使,這個大家都不提;
然后,白天里面,女性其實解決的不太好,從證件照就開始 P,然后平時日常也開始化妝,都會受影響;
而男性里面,老人和小孩都不太好,你會發(fā)現(xiàn),你能把逃犯抓得回來,但是小孩拐賣到今天都解決不了。
你會發(fā)現(xiàn)在這么一個全集里,只有角落的這一部分中青年男性你是能解決的,剩下的東西還是解決不了。
所以在安防這個場景,這些事情但是終究會不會解決,一定會解決,需要時間,需要積累。
深度學(xué)習(xí)從誕生那天起,就極大地依賴于數(shù)據(jù),但是這些數(shù)據(jù)采集的成本誰來負(fù)擔(dān)呢?國家負(fù)擔(dān)。
大部分在社會上流動的成年人,你有證件照、護(hù)照、駕照、社保照片,這些照片積累就能完成第一次模型訓(xùn)練。
后續(xù)像老人照片、小孩照片、外國人照片多種組合,怎么辦呢?沒有辦法,只能一個一個項目和場景當(dāng)中去克服。
就像海康一樣,海康的董事長說他能識別全球一百多個國家兩百多種不同的車牌。實際上車牌識別這件事,整個智能交通是從一開始的技術(shù)公司轉(zhuǎn)移到產(chǎn)業(yè)公司的,因為他能碰到這個場景,所以有這些數(shù)據(jù)就能解決這些問題,技術(shù)線就拉長了、深度就挖深了。這就是我們看到的現(xiàn)象。
所以,AI+行業(yè)這個事,我們判斷未來大概率也是一樣的,因為它天然和數(shù)據(jù)相關(guān)。就像凱撒說得一樣:我看到、我來到、我征服。
你自己不到那個地方去,你就碰不到這樣的問題,你就解決不了這樣的問題。
所以,未來人臉識別在安防領(lǐng)域的路還有很長時間要走,完全解決可能需要五年以上的時間。
問:像人臉在金融行業(yè)為什么比較成熟?
馬原:因為它確實技術(shù)難度不是那么高,就是兩張照片的比對,這個其實很多技術(shù)已經(jīng)做得很好了。
目前大家突破更多的是防偽,你拿圖片、視頻,很多防偽是靠人來配合的,上下、左邊、右邊,能不能大家不用做這么多動作,也能識別出來?這是大家目前在解決的問題。
問:現(xiàn)在安防行業(yè)政府招投標(biāo)時候主要看重哪些指標(biāo)?
馬原:很綜合,像海康說得一樣,人們問說海康到底有什么核心競爭力?感覺你也不是什么東西特別牛,但是海康胡揚(yáng)忠很得意地說過一句話:我們最牛的地方就是我們服務(wù)碎片化市場的能力。
換句話說,一個項目里面,那么多類似的產(chǎn)品,你就會發(fā)現(xiàn)海康是唯一一家能把所有的產(chǎn)品全給你供了的。
你要是那個采購方,比如說你們公司今年要裝修、買套東西,你也會傾向于誰能給我一站式解決,我就找誰。這種能力反而就成為了一種很強(qiáng)的壁壘。
上一代創(chuàng)業(yè)者主要是互聯(lián)網(wǎng)創(chuàng)業(yè),比得是長板,誰的長板最長。
比如說我購物就要用淘寶,打車就要用滴滴,外賣就要用美團(tuán),我搶占了你的心智,我的長板足夠長就 OK。但是你會發(fā)現(xiàn)傳統(tǒng)行業(yè)不是這樣的,傳統(tǒng)行業(yè)比得是誰沒有短板,任何一個短板都會導(dǎo)致競爭對手的進(jìn)入,會導(dǎo)致整個價格體系的崩塌。這是一個問題。
所以,傳統(tǒng)企業(yè)其實做起來比互聯(lián)網(wǎng)公司要難,你要不斷地豐富自己的產(chǎn)品線,你要做得足夠完整,能完整地面向場景解決問題。這個場景需要什么,你就要做什么。
所以,像馬化騰說,互聯(lián)網(wǎng)的上半場到產(chǎn)業(yè)互聯(lián)網(wǎng)的下半場,下半場比上半場難多了。
上半場你看,那個時候包括投資為什么能活?隨便五十個人、一百個人的公司,搞個 APP 就能賣掉了。我不賣給別的投資人,我賣給 BAT 也可以,那個時候真的是創(chuàng)業(yè)的黃金時代,那叫淘金時代。
現(xiàn)在這個時代是種地的時代,真正回到生產(chǎn)力的發(fā)展,一點一點把技術(shù)磨出來,把產(chǎn)品做出來,把創(chuàng)業(yè)的問題解決掉,來獲取你的價值。
問:從去年下半年開始,安防行業(yè)整體的招投標(biāo)數(shù)量就已經(jīng)相比于 2017 年減少了很多,主要原因是什么?
馬原:是這樣的,整個安防行業(yè)你要看,我們所屬的行業(yè)叫智能安防,整個安防行業(yè) 2017 年是六千億的體量,去年大概是將近七千億體量。在這個里面,智能安防的增速去年是 197%,這個比例在提高。
你看到的情況是,整個安防行業(yè)普通攝像頭建設(shè)的增速在放緩,但是每一個新增項目里面智能攝像頭的比例是在提高的。
過去一百個攝像機(jī),可能都是傳統(tǒng)攝像機(jī),而現(xiàn)在要求,所有新建的項目,智能攝像機(jī)的數(shù)量不能低于 35%,而且這個比例會隨著技術(shù)的突破逐年提高,最終會全部換成智能攝像機(jī)。終局肯定是這樣的。
我們再也不希望把視頻再拉回來到后端處理,肯定是前端就做掉了,都是一個這樣的,帶寬也小了,邊緣計算也方便、便捷,肯定是這樣的一個方向。
問:那你覺得現(xiàn)在智能攝像頭的滲透率怎么樣?
馬原:不到 5%,還是很低的。
問:從安防行業(yè)再深入到其他行業(yè),對您來說難度大嗎?
馬原:還好,不是很大,反而我們進(jìn)入那些行業(yè)的速度非常快,因為我們本身就是有一站式服務(wù)能力的,用戶讓我過來就可以了。
像其他的廠家,可能還是說要找集成商,需要曠世、商湯的算法,還要攝像頭,需要浪潮、華為服務(wù)器,需要找第三方公司做個平臺,拼一個東西給他。
但是我們?nèi)绻覀兣袛噙@個領(lǐng)域是可以做的,我們就直接沖進(jìn)去,直接把它全套的東西做好,是這樣的一個思路去做的。
我們不想在淘金路上賣鏟子,我們想直接到現(xiàn)場挖金子,這是我們的區(qū)別。
問:您剛才提到了組織的力量,這能不能理解為我們對行業(yè)的理解來自于我們的組織管理?
馬原:這個是基礎(chǔ),你要找到合適的人,把他放到合適的位置上。像申老師,為什么我們看重申老師?
她在過去 27 年里面,在計算機(jī)視覺里面,所有有商業(yè)價值的方向拿出個成績和產(chǎn)品。
很多人以為我們看重她過去 27 年的積累,不是,我們看重的是她未來 10-15 年還會像給松下那樣提供無數(shù)先進(jìn)技術(shù)的能力,這是我們看重的。
任何再來一個新技術(shù),她都會快速達(dá)到、達(dá)成、交付,這是我們需要的,這也是一個企業(yè)需要的。
比如說華為,大家說 P30 吹得有點兒太過了。但是你想想看,華為什么時候宣傳過他的中央研究院?什么時候宣傳過他的諾亞方舟實驗室?
不會的,真正的企業(yè)研究院都是趕緊把新東西做成專利、產(chǎn)品,放到市場上去。
所以,我覺得這也是下半場大家的特點,從第一階段我們靠一個技術(shù)大牛去市場上融錢,變成我們實實在在做成東西,從市場上要錢,這是我們需要的。
所以,這也是為什么我們從一開始也講了一個概念,我們是產(chǎn)業(yè)界、工業(yè)界的團(tuán)隊,目標(biāo)是不一樣的,都是一群做東西的人。
問:我希望能了解一下富士康這個項目的更多細(xì)節(jié)。你們跟富士康的合作聚焦在哪些領(lǐng)域,是生產(chǎn)流程管理,還是人員管理或者是其他方面?另外從整個改造范圍來看你們只是聚焦于跟某幾家工廠,還是說現(xiàn)在可以拓展到所有的工廠?
馬原:既有生產(chǎn)流程的優(yōu)化改造,也有人日常員工的行為管理。說白了,就是把所有的日常行為給數(shù)字化了。
過去比如說一個操場里面,孩子在操場上玩,但是誰在做什么你是不知道的。通過我們視覺檢測和識別技術(shù)都給他們歸類了,比如說現(xiàn)在有幾個人在跑步、打籃球,這個人打籃球打了多久,這個人跑步跑了多久。
最終一天下來之后,會給你一個評分,你可以這么理解,就是這樣的,如果放到教育行業(yè)就是這種感覺。
問:大概一條生產(chǎn)線上有多少個攝像頭?
馬原:反正我們管理兩千人用了一百個。
問:在生產(chǎn)流程上,攝像頭產(chǎn)生數(shù)據(jù)的可用率能達(dá)到多少?
馬原:基本都是利用起來的,因為我們都是重新測量、重新設(shè)計、重新開發(fā)的,并不是利用現(xiàn)有的攝像機(jī)。
他們一開始也提過,就像現(xiàn)在人臉識別一樣,當(dāng)初所有的國安客戶都說能不能檢索,說當(dāng)時海康、大華都吹過牛,說即便這些視頻現(xiàn)在也檢索不了,只要將來加一個服務(wù)器就全部都能搞定了。問我們是不是也是這么想的,我說我們不是,所以后來就全部重新建了。
所以,用戶都需要一個理解的過程。
問:也就是說他們?yōu)榱嗽敢飧銈兒献鳎敢鈸Q掉所有的攝像頭?
馬原:也不用換,增加就可以了,傳統(tǒng)的攝像機(jī)就是某個角落看著一個大屋子,只有一個就 OK 了,但是我們要做行為識別。你看亞馬遜 go 這種方案,會布得更密一些,畢竟要識別行為嘛。
問:您合作企業(yè),或者說我們在各個行業(yè)投入的時候,是不是也應(yīng)該形成了自己的數(shù)據(jù)庫?您剛剛說安防行業(yè)當(dāng)中,與真實場景像老年人、小孩我們都沒有辦法識別,現(xiàn)在是一個很大的問題。
那么比如說我們現(xiàn)在在和富士康做工廠方向,工廠肯定不只年輕人,稍微老一點兒的,是不是我們也形成了一定的數(shù)據(jù)庫積累?
馬原:數(shù)據(jù)就是慢慢積累起來的,像富士康這個案子,我們的數(shù)據(jù)是不能拿出來的,因為那都是蘋果的產(chǎn)線,管理非常嚴(yán)格,我們都是在現(xiàn)場訓(xùn)練的,直接把訓(xùn)練中心搬到現(xiàn)場,現(xiàn)場給他們調(diào)的。
問:我們在新加坡有研究院,我想問一下,這個研究院在做什么?我們?yōu)槭裁磿x擇在新加坡成立這個研究院?
馬原:是這樣的,說到新加坡,得到如果調(diào)研一下整個 AI 的發(fā)展過程,像我的第一個老板是李子青,他是中國華人界里面 AI 人臉識別的第一人,也是微軟亞洲研究院第一任人臉組的組長。
當(dāng)年李開復(fù)建研究院的時候是把他先拉過去的,后來他跳走了,這也是為什么后來他成為我老板的原因。后來是湯老師接了他的職位,去做人臉組的組長。
所以,做 AI 的圈子大概可以分為三大塊兒地方:
1、大陸地區(qū):主要是以中科院、清華大學(xué)為主,最大的特點就是中科院是一個大帽子,西面全是個體戶,一大批中科系小公司。
2、香港:湯老師對 AI 最大的貢獻(xiàn)在于,他把整個香港地區(qū)團(tuán)結(jié)住了,湯老師手下有不少我之前老板(李子青)的學(xué)生,大部分都沒能留下來,湯老師把這些學(xué)生團(tuán)結(jié)在一起,形成了一個很大科研實力,這是他的貢獻(xiàn)。
3、另外一撥人就是在新加坡。我前老板就是南洋理工出身的,包括像申老師,新加坡算是最后一塊兒華人圈成建制、完整的華人計算機(jī)視覺的來源,這也就是我為什么看重新加坡。
如果過了新加坡這一茬,就不知道去哪兒了,可能是***、美國這些地方去找了。所以,我們還比較慶幸,在這個時間點,還能有這么一撥人才跟我們的想法是一樣的。
我們?yōu)槭裁磿敢獍蜒芯恐行姆诺叫录悠履兀看_實有很多人,研發(fā)團(tuán)隊還是比較清靜的,現(xiàn)在國內(nèi)的 AI 已經(jīng)炒得有點兒過熱了,你稍微會點兒東西就是一個 AI 工程師,拿幾百萬年薪。
問:所以,那邊的團(tuán)隊現(xiàn)在大概多少人?
馬原:目前有大概二、三十人,目標(biāo)是三年到一百人。
問:我們未來研究院的規(guī)劃或者是期望是什么?
馬原:這就是我們技術(shù)的前哨戰(zhàn),始終保持對國際一線技術(shù)的關(guān)注,時刻跟蹤最新的技術(shù),不斷地優(yōu)化、改善我們的產(chǎn)品。
問:在您看來,人工智能什么時候才能成為一個被絕大多數(shù)傳統(tǒng)公司去認(rèn)可的一個概念呢?
馬原:最近很流行一句話可以解釋:人總是短期高估技術(shù)的實力,長期卻低估。我覺得現(xiàn)在這個階段剛剛好,就屬于剛剛過了那個最高峰又下來了,慢慢回到正常的爬山的過程。
我們有一個員工的老婆是做 3D 打印的,我就問她,3D 打印這個行業(yè)還活著嗎?她說活得很好,確實有它的作用。
而我感覺之前 3D 打印都是騙子,就是那種感覺,后來發(fā)現(xiàn)它是有它的作用的,在很多行業(yè)是在解決一些具體的問題。
我覺得人工智能接下來也是這樣,人工智能確實是整個 AI 時代非常大的一個技術(shù)周期出現(xiàn),這件事情確實可以解決很多問題。現(xiàn)在它的實力還沒到,包括人才的積累也都還沒到。
咱們今年國家才批了 35 個人工智能專業(yè),人才都還沒到,期望就到了,估值已經(jīng)到了。
在這樣大的期望下,你再重新看,突然發(fā)現(xiàn)你家六歲的孩子會彈鋼琴了,然后你就期望他明天就開始彈十級,那可能不行,但是你的孩子已經(jīng)是一個很聰明的孩子了,他一定會成才的,你的期望就會重新回調(diào),再慢慢培養(yǎng)他,把他培養(yǎng)起來。所以,就回到了一個正常產(chǎn)業(yè)健康發(fā)展速度。
問:在國家的政策方面,在您看來,對人工智能方面現(xiàn)在還有哪些不夠好的地方?
馬原:我覺得其實咱們國家對人工智能(頂層設(shè)計)這些人還是很厲害的,像我的專業(yè)是 2005 年就有了。
我當(dāng)時想考公務(wù)員都考不了,公務(wù)員要的是計算機(jī)科研技術(shù),我的專業(yè)叫智能科學(xué)技術(shù),當(dāng)時家里想讓我考公務(wù)員,我看了一遍,沒有我這個專業(yè),我什么都考不了,只能堅持繼續(xù)做人工智能。
所以,我覺得國家頂層設(shè)計還是有高人的,我們在 2012 年的時候,那個年代還能搞智能視覺物聯(lián)網(wǎng),想想看都是很不可思議的。
換句話說,我覺得我現(xiàn)在還沒有到那個高度,能夠那么早就決心開這么一個方向。當(dāng)時政府是出了 4 個億現(xiàn)金的,把這個團(tuán)隊引過來,用來做這個事情。所以,我覺得咱們還是相信國家的眼光、實力,還是很厲害的。
問:新加坡研究院他們搞出來一個體系之后,我們是怎么樣評估這個技術(shù),是怎么樣落地的?具體的指標(biāo)是什么?如何來結(jié)合這個技術(shù)我們?nèi)ゴ蛟?AI 的?
馬原:打個比方,新加坡團(tuán)隊之前做過一個事很好玩,就是在去年 10 月 1 日,在西班牙一個比賽上,是個什么場景呢?
你在超市購物的時候,可能有很多東西你會不要了,比如說這瓶水、面包、蔬菜,放了一堆東西。到每天結(jié)束的時候,會堆一堆東西。這個東西過去怎么辦呢?就是靠人一個一個放回去。
當(dāng)時他們就設(shè)計了一個這樣的場景,靠一個小機(jī)器人,有一個移動的底盤,有一個攝像機(jī),有一個機(jī)械臂,能不能讓它把這些東西放回去?就發(fā)現(xiàn)這個東西其實很復(fù)雜,不亞于一個自動駕駛的操作了。
1、我要識別它是個什么東西。
2、我要控制機(jī)械臂以正確的方式把它拿下來,拿雞蛋和拿飲料是不一樣的。
3、我要回去的過程中躲避各種人,順利地放到那個架子上,完成這樣一個任務(wù)。
如果能完成的話,你算這么一筆賬,雇這么一個小機(jī)器人和雇一個人來比的話,可能不劃算。
如果這件事確實做得還不錯,完成率也 OK,我能接受,哪怕這個過程中我今天搬了一百個,掉了十個,能不能接受?整個這個 Demo 都完成了以后,我們再評估這個事可不可行。
所以,這就是這個團(tuán)隊的特點,我們是面向場景解決問題。
你千萬不能說我就只提供視覺,別的我不管,或者是我只提供自動駕駛的底盤,別的我都不管了。
你必須把最后一公里全部走完,你必須把金子全部淘掉,不能在這個過程中只是做一個遞扳手或者是遞工具的人,你能不能全都解決掉?解決掉,我們才愿意,才能成為真正的價值。
所以,價值不是停留在技術(shù)的,而是看你是不是實際把什么事給解決掉。
問:新加坡研究院在我們公司整個的組織架構(gòu)中,它是一個什么樣的作用?它怎么樣跟我們的團(tuán)隊配合?
馬原:由于申老師過去本身就在松下做這個事情,和日本本土已經(jīng)合作了二十幾年了。所以,很多人一開始以為我們的溝通成本會很高,我說再高也比跟日本人的溝通成本低,這是大家合作得比較愉快的地方,一開始不需要那么長的磨合期。
但是現(xiàn)在的情況是,你真實的落地場景就是你的用戶,那你就要為他服務(wù),解決他的問題。這就是思維上的不一樣,這樣的科學(xué)家其實是很難找的。
問:香港和新加坡的 AI 人才各有什么樣的特點?
馬原:其實香港聚攏的人才也是從大陸吸引人才過去的。打個方面,新加坡的財政就很好,你要跟這邊建實驗室,政府能出 50% 資助,這個支持力度在國內(nèi)是不敢想象的。國內(nèi)大部分是說你投入了,你拿發(fā)票來補(bǔ)貼,或者當(dāng)?shù)匾匍_票,支持力度還是不一樣的。
問:我們和無錫有什么樣的深厚關(guān)系?
馬原:因為當(dāng)時中科院物聯(lián)網(wǎng)研究所在無錫。
問:比如說智慧園區(qū)現(xiàn)在澎思的基礎(chǔ)收費模式是什么?在整個智慧園區(qū)里,大部分?jǐn)z像頭集中在哪一個區(qū)域內(nèi)?目前你們在部署的現(xiàn)有項目里,遇到的最大技術(shù)難題是什么?
馬原:園區(qū)的話,技術(shù)還好辦,最大還是買單的問題。目前是智慧園區(qū)這個事是今年炒起來的,很熱。大部分還是源于對過去原有項目的改造,這是一波由政府推動的趨勢。
另外一個趨勢,跟咱們國家的雪亮工程相關(guān),整個安防的核心驅(qū)動力,大部分資金從這兒來。現(xiàn)在是需求到了,可能資金上還沒有完全理順,這是我們遇到的最大問題。
問:除了 AI 技術(shù),我們還需要哪些其它方面的技術(shù)投入或資源?
馬原:大部分還是基于 AI 生長出來的這套業(yè)務(wù)系統(tǒng),我們也會判斷,這個項目里面我們會做切分。如果有項目的部分,就回到項目那里,如果產(chǎn)品線,就保持產(chǎn)品線,相對進(jìn)行剝離。
問:我們現(xiàn)在提供一站式解決方案,人臉技術(shù)會單獨作為一個輸出嗎?
馬原:沒有,你說要不要單獨賣人臉這件事情?這件事看情況,有些領(lǐng)域可能你這次不賣,將來也沒有機(jī)會賣了,那你該賣就賣。比如有廠家就把商湯、曠視、依圖的源碼都買去了,那肯定就是一次買賣,就當(dāng)是一次 PR,該賣就賣。
如果有些行業(yè),你覺得將來還是有機(jī)會自己做的,那你到時候具體情況再看。
問:您在曠視待過,當(dāng)時打法是什么樣的?
馬原:曠視第一年打法是現(xiàn)在的打法,后來曠視由于跑得太快了,所以說我們那時候的很多想法沒法實現(xiàn),所以后來就出來了。
問:剛剛我們提到 AI+行業(yè),有一個自己的突出技術(shù),往這個行業(yè)怎么去布。咱們目前 100 多個人,我們是五大行業(yè)+十幾個小的細(xì)分場景,這樣會不會跑得太快了?
馬原:不是這樣,起碼目前我跟他們比,還是專注在安防這個行業(yè),只是安防里面比較碎片化。其實通用技術(shù)是通的,只是應(yīng)用模式不一樣。
比如同樣的人臉識別,在公安那兒看到你,我要抓你。放到迎賓那個地方,看到你,我要歡迎你。放到爺爺奶奶那兒,你又來接你的孫子來了,技術(shù)是一樣的,應(yīng)用模式不一樣,應(yīng)用模式一改就 OK,所以目前我們還專注在安防這個行業(yè),還沒有擴(kuò)到醫(yī)療、語音這些領(lǐng)域。
問:不同的項目會對應(yīng)不同的部門嗎?
馬原:初期做項目的人,肯定是自己人直接到現(xiàn)場去做。說白了,你要自己把這個事情摸透,弄明白,交給人,才能去告訴代理商你的加盟商,這個東西該怎么做,所以初期 0-1 一定自己做,1-10 這個過程可以借助渠道的力量去放量了。
我們設(shè)置比較機(jī)動靈活的項目組,如果創(chuàng)業(yè)公司還搞這種嚴(yán)格的視野邊界,這個就快不起來了。
我們公司要老人做新事,新人做老事,千萬不要變成老人做老事,新人做新事,這就一定會死,但這就是組織上的問題了,不斷推動老人去往新的領(lǐng)域推。
你不要干這事,這事你很成熟了,沒有意思,干新的東西去,這樣才會越打仗,越戰(zhàn)越勇,而不是發(fā)現(xiàn)一個價值,團(tuán)聚在這兒,誰也不動了,這個組織就死了。
問:你們現(xiàn)在安防民用市場有沒有布局?
馬原:我們今年會開始啟動。因為技術(shù)是這樣的,我跟你講一個車輛的例子你就理解了。20 年前(1998 年)深圳第一套電子警察誕生,那時候誰開始用?
所有攝像機(jī)裝的是路口,干嘛呢?查你的違章,你闖紅燈,掉頭等等。
后來你發(fā)現(xiàn)這個攝像機(jī)挪到道路中間了,這個相機(jī)是公安裝的,因為做車輛大數(shù)據(jù)的。你這個車不管有什么行為,你只要路過這個路口,給你拍一下,大家開車都看到了。
再后來慢慢這個東西到高速公路、停車場,北京估計 2、3 年前樓下都是打卡拿票的,這就是一個技術(shù)蔓延的速度,從行業(yè)最核心的主管部門,到行業(yè)客戶,再到民用市場,有一個過程。
就像人臉識別一樣,一開始公安先用,再是行業(yè)用,再是民用,需要有一個過程。我們此時此刻處在公安建設(shè)的高峰,其它行業(yè)的客戶在部分市場,跑得快的市場已經(jīng)開始起量了。
問:所以跟、360 下面的產(chǎn)業(yè)基金投你們與民用市場是不是有一定的聯(lián)系?
馬原:我覺得終點我們會交匯,肯定會有配合。
評論
查看更多