商湯科技作為為人工智能技術的重要一員,商湯科技徐立絲毫不敢懈怠。專注于計算機視覺和深度學習原創技術,成為國內最大的新銳人工智能公司,他表示我們進入了軟件的摩爾定律時代,軟件性能通過人工智能快速增長,用人工智能改造傳統行業挖掘藍海市場。
今日人工智能時代完全變了,第四次工業革命尚未真正開始,很多人已開講。“全球進入了一種未卜先知時代,這與抗日劇中喊八年抗戰馬上要開始一樣。”徐立說。
作為人工智能公司商湯科技聯合創始人兼CEO,徐立感受著創業的苦與樂,以及時代的喧囂和嘈雜。一方面,商湯科技專注于計算機視覺和深度學習原創技術,飛速發展,自主建立了原創深度學習平臺Parrots和深度學習超算中心,成為國內最大的新銳人工智能公司,估值超過20億美金。
另一方面,各路人馬齊齊殺到這一領域。國內外巨頭公司無不分出人馬研發人工智能,競爭日趨激烈。從2015年開始,只要一個論壇主題詞中出現人工智能幾個字,場場爆滿。
在這樣環境中,近三年人臉識別、自然語言處理和機器深度學習等等人工智能型公司紛紛創立。商湯科技是其中一員。2014年創立,經過三年發展,商湯科技將人臉識別、圖像識別、自動駕駛、人機交互、醫療圖像、人工智能芯片等多項人工智能核心技術實現應用落地。
2017年7月,商湯科技宣布完成4.1億美元B輪融資,創下當時全球人工智能企業單筆融資紀錄,同時也成為全球估值最高的人工智能獨角獸企業。
但是,商湯科技徐立絲毫不敢懈怠。新一輪融資后,他希望在包括無人駕駛、智慧醫療、深度學習芯片、增強現實平臺等方面加大研發投入以及人才引入,開拓更多技術應用場景,深化人工智能商業生態,以原創技術賦能更多行業。
視頻分析大風口
移動互聯網時代,每個人手機都會拍照很多照片,錄制短視頻。商湯科技聯合創始人之一楊帆注意到一個現象,這些照片和視頻二次價值轉化很小,其最重要的價值體現在拍完、分享那一刻,之后大多數人很少再次翻閱、利用這些照片。但是,它們占據了大量的手機存儲空間。“這是很矛盾的。” 楊帆說。
基于這種洞察,商湯科技為手機廠商提供了一個智能相冊解決方案,即利用人臉識別聚類技術,按照不同人像進行歸類,實現“一人一相冊”,輕松解決手機中成百數千張照片分類管理的難題。該方案還能找到手機中照片最多的那個小孩,從大概率來說,“那是用戶自己的小孩,系統會將該照片推薦給手機用戶做屏保”,其余照片或者可以存儲到云端,或者利用其它技術處理,實現照片的二次價值轉化。
這是一個并不復雜的實際應用案例。再往下發展,隨著AI技術進步,楊帆相信可以從照片和視頻中挖掘更價值。
商湯科技研發的智能相冊、美顏和濾鏡功能,有些已應用到華為和小米手機上。借助此類方式,商湯科技的技術已經悄無聲息影響到很多人。
11月2日,最新發布的OPPO旗艦手機R11s上,應用了商湯科技提供的AI智慧美顏技術和 “面部識別”人臉解鎖功能。
通俗來講,這類應用后面的實現方式與人臉定位、AI特效增強相關,算法的選擇尤其關鍵。
技術落地經歷了一個有意思過程。楊帆最早預設各類場景,抽象出106點來。最初從5個點,2個眼睛、1個鼻子、2個嘴角,接著衍生出21個定位點。接下來是38個點,最后是106個點位。
理論上來說,點位越多越準確。操作時要兼顧人工標注數據成本,一張106點的標注圖,成本要5-10元。從標注十萬張照片起步,5個點位全部標出來,訓練出一個5點模型,再進化,將21點算法等融合到標注工具,然后就可做到更快、更低成本標注。
最后,商湯倡導的106點標注得到非常廣泛的應用,積累到百萬級別數據時,可以通過類似方法去以較低成本標注240個點。
類似技術成熟后,為商湯打開了進入短視頻和直播業務通路。商湯正在進入一個技術進步帶來數據積累,進而做到產業化落地的正向循環。
商湯想解決計算機識物之后,真正把視頻理解發揮到一個真實應用場景當中。現在,視頻分析能力可以認出人的身份,周圍的桌子、凳子和沙發,還有顏色。再進一步發展下去還有很大可能性。
比如,搜索引擎公司現在只是基于文本,如果對于整個視頻理解能做到文本搜索水平,未來可以成為視頻搜索引擎。當然這只是商業上想象的一部分。
按照徐立和團隊設想,人工智能對當前互聯網主要的商業領域電商、搜索和游戲都將產生影響,另外,還外對安防、智能駕駛等等領域賦能,未來前景廣闊。
商業模式摸索前進
作為算法領先的公司,商湯科技在商業模式上經歷過一段摸索階段。
商湯科技屬于第一批研究視覺方面的人工智能團隊。2011年,人工指導智能變成數據驅動智能剛開始的時候,商湯已經投入此方向。2011到2013年間,在CVPR、ICCV和ECCV三大全球頂級計算機視覺學術會議上,有關深度學習的文章共29篇,其中14篇是來自于商湯團隊。團隊里包括18名教授和150多名博士,創立早期三人中必有一個博士。軟件領域快速發展,最尖端人才具有決勝性作用。
在技術平緩發展的時候,競爭比拼的是資本和財力。在技術快速進步領域,創業型公司有機會通過技術迭代形成競爭壁壘。徐立稱,“我們進入了軟件的摩爾定律時代,軟件性能通過人工智能快速增長,你只要領先帶來的時間窗口可能是一年,甚至更長,領先18個月就超出一代,是整體一倍性能。”
2015和2016年世界上最頂級視覺會議上,就論文統計數量排名而言,微軟、卡耐基梅隆大學等排在前面,商湯排在所有亞洲公司前面,領先于谷歌很多名次。
這或許是市場中,商湯科技能找到生存之地的秘訣。但是,論文落地變成商業上的案例,首先要考慮到有效需求,而且有人愿意給需求付費。
商湯科技楊帆舉過一個極端的例子——
廁所里刷臉取廁紙,可以通過設置規定,每次一人不能取太多,防止有人把廁所紙拿走,這是一個真實需求。但是,如果要落地,前提是管理方想明白,通過人工智能設備可以省出足夠多紙錢來。
照著真實需求去查看,首先關注到安防領域。安防是目前整個AI落地最快,也是短期規模最大、最重要的一個市場。目前已經有攝像頭監測很多城市,每天產生海量視頻,從這里面挑出需求的視頻片段來,費時費力。
商湯在成都給當地提供反扒系統。他們發現,把一個場景做好,真正解決問題,需要把多項技術整合在一起。比如,民警有小偷照片庫,但是,抓小偷要低成本取證,難度很大。“你不能說這個人當了一次小偷,他一輩子都是小偷,我只要街上看見他,就把他抓起來。”
商湯的方案是通過技術從海量視頻里識別出小偷,同時輔助以動作檢測。在一些特定場景,比如人群移動緩慢的地方,技術會預判出這里發生偷竊的可能性更高。這時可以布置一個大的遠景攝像頭,覆蓋幾百米范圍,還有可移動攝像頭,對焦點區域進行覆蓋。
類似的案例,需要很多不同的細小技術應用和組合。如果移植到金融領域做刷臉支付,應用到交通領域查處違章等等,不難看出,人臉識別技術在細分行業中的潛力非常大。
有時工作多得商湯團隊忙不過來。“首先拿需求,定制化產品做完了之后去賣,銷售人員堅持一個售賣原則,賣標準化的東西。你要就簽,不要就走。”徐立9月底與包括騰訊《深網》在內媒體交流時透露。
整個行業的商業模式建立有些點困擾著徐立,“技術大眾化,我們一直講智能手機是人工智能+手機,人工智能+手機還不如一個手機價錢,人工智能的錢找誰收呢?人工智能加了人臉解鎖,加了50元,這個錢向誰收?這是行業困惑。”徐立期待著大眾給技術買單的那一天。
技術不能向普通消費者收錢,走to B路線成為另一個選擇。在安防領域,商湯所作所為,一直為大華股份研發中心中央研究院院長殷俊所關注。殷俊告訴騰訊《深網》,商湯是大華的合作伙伴,雙方一直保持著接觸。
但是,作為算法領先的公司,商湯需要不斷地升級算法,而算法本身精進會不會有天花板?對此見仁見智。
現有安防領域客戶按硬件購買和后期維護付費,商湯要深入這一產業,賣硬件和服務,必須增加人員,與大華、海康等傳統安防公司比拼全方位的資本、服務,以及生產乃至供應鏈管理。
有些軟件算法驅動型公司,進入安防領域,先期通過OEM代工攝像頭方法彌補短板,這一模式在摸索當中。
另外,大華股份已經雇用了100多人進行數據標注,自主研究人工智能、深度學習等技術進行追趕。就上游數據而言,傳統公司有著遍布全國的攝像頭和網絡,獲取原始數據更便捷,成本更低。
一名要求匿名的英偉達人工智能芯片銷售人員則向騰訊《深網》表示,安防領域新型算法創業型顛覆傳統的安防公司可能性極小,經過2015火熱競爭之后,他不認為新型公司有機會顛覆大華和海康,且勝負已分,本人已經將工作重點轉向智能駕駛研發。
實際上,商湯創立前一段時間都是不停拿需求,然后做產品,發現滿足不了市場需求,再迭代。“到2015年9月份,真正在金融場景大規模試點,跟一些銀行、P2P公司簽下千萬級別的合同。”徐立說。接下來,商湯仍然將繼續拓展安防領域業務。
技術底層扎根做平臺
12月7日,商湯科技宣布與日本本田汽車簽訂長期合作協議,共同深耕自動駕駛技術,雙方將基于本田的車輛控制技術系統,融合商湯科技的視覺算法和開發平臺,共同打造適合乘用車場景的L4級自動駕駛方案。此外,本田未來還將與商湯科技在機器人方面展開合作。
運用商湯科技技術,汽車行駛視覺技術而非高精地圖,能夠覆蓋更廣場景的區域。即便車輛行駛至無高精度地圖覆蓋的區域,車輛自動駕駛功能依然可以使用。
以上是商湯涉及的諸多業務領域之一。經過不斷拓展,商湯科技目前有400多家國內外合作伙伴,“做商業化以來,每個工作日簽約一個商業客戶。”徐立表示。
商湯科技發現國內很多領域有待提升。人力成本過高,中國人口紅利下降,未來機器代替人工是一個必然趨勢。而且,國內生產效率低下,工業自動化程度與發達國家比起來,效率低很多。最終,利潤空間縮小。很多領域已經是紅海一片,如果用人工智能去改造傳統行業,就出現一個新契機,進入藍海。
徐立喜歡將商湯科技比作賣人工智能的樂高玩具,“針對特定場景,我們搭建一個樂高的車,賣給行業甲方,甲方根據這個車,直接用,或者改造一下都可以。某種意義上,商湯賣底層人工智能模塊,賦能一些行業。”
目前,像高通、英偉達、本田這樣的跨國大公司,京東、華為、小米、OPPO、vivo等處于潮流中的國內明星公司,都買了商湯“搭建的車”。
“我們做的事情,就是搭底層平臺。通常最底層平臺,很多人不愿意花大力氣做,比如中國計算機干了這么多年,一直沒有自己操作系統。”徐立說。
鑒于當前商業環境,商湯確立了1+1+X發展模型。先是技術上形成產業核心競爭力,+1是跟產業結合, +X是賦能。最終實現+合作伙伴,形成共生共贏生態。
2017年,商湯花大力氣招了350個人左右的數據標注團隊,慢慢減少對外包數據標注依賴。“一數據標注是一門技術;二,一些數據有安全性要求,脫敏的數據做訓練使用,安全更可控。”徐立說。
數據關系到競爭速度,速度關系著創業型公司生死。就深度學習而言,數據很重要。數據量每增加一個數量級,結束是幾何級增長。十億照片,增長到100個億,不管對小公司,還是大公司,都是一個比較難邁過門檻。
徐立希望商湯利用技術領先時間窗口,將護城河挖得更寬更深。這也意味著商湯的前途既可能是星辰大海,也難免各種險灘暗礁。
評論
查看更多