火爆的智能音箱真的會是一個智能家居入口嗎?BAT入局智能音箱,創業者站隊還是突圍?除了價格戰,智能音箱還能怎么賣?AI技術應用綜合集成后帶來的用戶使用場景會有哪些變革?資本市場如何看待像智能家居等前沿技術在產品中的應用?
7 月 31 日晚上8點半,“騰訊創業01CLUB”推出了第一期的社群內容分享活動。明勢資本創始合伙人黃明明、小米生態鏈副總裁唐沐擔任了本期的對話嘉賓,就智能音箱行業聊聊對產業的幾大洞見,進行了一場資本市場和頭部科技公司之間關于下一個“風口”的對話,騰訊創業01CLUB為此整理出此次對話中的幾大精華觀點:
1,智能家居發展的基礎是解決用戶剛需。
2,智能音箱技術突破難點為NLP(自然語言處理技術)。
3,面對巨頭競爭,通過合作才能獲得突破。
4,如果智能音箱要加屏幕,目前還需解決在設備交互方面的互斥矛盾點。
5,掃地機器人可能是智能家居的下一個風口。
針對這幾大觀點,兩位對話嘉賓進行了精彩的具體的分析講解和分享,以下為此次對話內容的整理:
智能家居發展的基礎是解決用戶剛需
黃明明:我先簡單介紹明勢資本在AI領域的投資邏輯和案例。
在AI領域,我們的重點是找到核心技術的落地場景,或者能夠提升行業效率的領域進行投資。我們投資的案例場景覆蓋出行、法律、醫療、工業等領域。
比如,在AI 出行領域,我們投資了易航智能和知行科技;在AI 法律方面,我們投資了思滿科技和秘塔科技;在AI 醫療方面,投了智能醫療外科手術機器人研發商術康醫療;在AI 工業領域,則投了智能工廠解決方案供應商玄羽科技。
今天我主要和小米生態鏈副總裁唐沐聊些智能音箱在技術和商業模式方面的探討。
首先是技術方面,唐總(唐沐)認為哪些底層技術的突破,推動了智能音箱這一波高速發展?目前還有哪些突出的問題是嚴重影響到用戶體驗的?比如遠場的定位,本地軟硬件計算的能力,多人的聲場還有誤喚醒,包括多輪對話的能力,哪些是核心的制約瓶頸?你認同未來智能家居的流量入口可能是智能音箱嗎?
唐沐:先說智能家居入口的問題。從2012年、2013年很多公司都在對此做嘗試、設想、去做相關的產品。當時對于公司的自家產品,對外都會有這樣的一個說法:在做爭奪智能家居入口。兄弟不才,我當時是做了路由器,所以對外喊“路由器是未來智能家居的入口”。
做了幾年之后,我發現當時喊的兇的說自己是智能家居入口,到最后都沒留下來,反而那些真的踏踏實實的,把一個產品做到滿足用戶的高頻剛需,這樣的產品才能留下來。
你要問我路由器是不是入口,其實路由器也不是,我相信路由器只是智能家居其中一個的中心節點。
智能家居的中心未必是一個設備,很有可能是幾個設備,我回想起雷總邀請我加入小米的核心訴求是希望我能探索智能家居,路由器只是其中一個重心節點,后面再做的智能音箱。
參與到智能音箱的項目后,我發現智能音箱是另外一個維度的智能家居中心。但現在我不太想強調它是一個中心,目前我們做產品的思路轉化成為:我們可以把一個產品設想的很宏大,我們可以想象很多東西給它留很多未來的發展空間的設想,但最根本的你要先把它的高頻剛需滿足掉。
智能音箱技術突破難點為NLP
唐沐:再說技術的問題。當我們開始做智能音箱的時候,我發現主要有3個核心技術要準備好:一個是ASR、一個是NLP、一個是TTS。ASR是語音轉文字的技術,語音識別技術;NLP是自然語言理解技術;TTS是文字轉語音,文字合成語音的技術,這三個技術基本上是智能音箱存在的一個基石,當這三個技術準備好了,智能音箱已經具備了橫空出世的前提了。
關于核心制約瓶頸,黃明明說的幾個都是,有很多可以通過數據的積累,人工智能自我學習、自我進步去改善的。但我認為到目前為止,可能基本上目前我還沒有看到有解決的很明確的路徑,其實是NLP(自然語言理解)。很多時候目前我們在智能音箱里面呈現出來的人工智能,它有點像是一個簡單的問答機,你提一個問題他給你一個回答,很多時候這種回答還是偏機械,離真正的人工智能還是有點距離。
黃明明:看來大家的認知至少目前都是比較一致,最核心的目前難突破的還是在NLP這個領域,可能這一波我們所謂講的深度神經網絡基本上在NLP這個領域,我問了很多大牛,短期之內想要有突破是比較難。
拋開大家都短期之內難以突破的NLP領域,我們以小米的小愛音箱為例,聊聊在技術方案的選擇(包括軟件、硬件,麥克風的陣列,遠近場的定位、輸入降噪,誤喚醒等等)你認為做哪些選擇,才能讓產品有哪些特點和優勢?
唐沐:我們做智能音箱最棒的心得是廣泛尋求合作。比如說我們在ASR領域有七八家合作伙伴,我們會把用戶的query同時發給七八家合作伙伴,等他們全部都反饋給我們結果,我們再經過一個簡單的判斷算法,來決定選取誰的結果。我們自己在技術上花費精力最大的還是NLP,這是智能音箱的核心,也人工智能語音助手的核心。
以小愛音箱為例,我們目前有兩大看家本領,一個是對用戶點歌query的理解,一個是對用戶IoT控制的理解。我們發布音箱的時間比較久,收集到的query比較多,這會極大幫助我們更深入理解用戶的訴求到底是什么。
小米2C產品形態的“收斂點”遠非硬件這么簡單
黃明明:正好唐沐這邊你講到很多方案,技術方案和很多外部的合作伙伴在合作。我也八卦一下,有媒體透露出小米目前也在跟亞馬遜Alexa合作,并且有可能考慮整合或者是說和微軟的小娜合作,推出咱們新的智能音箱的產品線,這個傳聞是有沒有點靠譜?如果是有這樣的考慮,是不是意味著我們可能會花更多的力量在硬件的生產制造方面,軟件方面我們也會和跟強有力的國外合作伙伴合作呢?
唐沐:所有傳言都是無風不起浪,谷歌、亞馬遜、微軟,這幾家在我們發布智能音箱之后都找來了,他們更多看重小米在智能硬件領域里面的供應鏈優勢跟性價比優勢。
但是大家也知道小米從來不是一個只甘心于做硬件終端的一家公司,所以我們在挑選合作伙伴的時候,一定也是在考慮在互聯網領域合作共贏的可能性。其實目前都還在談,我們不會只做硬件,而不碰里面的系統和背后的大腦的。
黃明明:非常感謝唐沐兄的坦誠,也給我們爆了好多料,我只問了一個亞馬遜,現在把谷歌都給爆出來了。我下面進入稍微挑戰一點的問題,既然剛才提到了不光是跟國外的巨頭,包括跟國內擁有海量內容甚至是壟斷性的擁有海量內容的巨頭,包括騰訊音樂、阿里這些,我們跟他的競合態勢也是回應我們今天的主題,產品之爭還是內容之爭?
面對巨頭競爭,合作共贏才能獲得突破
黃明明:現在市場上比較主流的一個聲音,因為不管咱們剛才講的語音的識別,語意的理解做的多好,最后用戶關心的是我后面想要獲取的內容,內容在巨頭手里,咱們怎么應對?
唐沐:我覺得答案一定還是合作共贏。小米雖然已經IPO,但我們內部還是認為自己是一個創業公司,我們永遠沒有辦法有財力和BAT等一些互聯網巨頭比拼內容的采購。
我認為其實各家公司都有各家公司擅長的地方,有各家公司的“基因”。比如就音樂而言,騰訊一定是有它的基因在的,否則TME也不會做這么大。所以我花了很大的精力去跟騰訊去談合作,還能讓大家都做各自擅長的事情:小米擅長是做硬件做系統,騰訊TME集團擅長做音樂,我們就強強聯手一起合作就好了。
一方面我們會和QQ音樂合作,一起為小愛音箱的用戶提供相當大部分的免費音樂。另外,我們也愿意幫助QQ音樂以及背后的這些音樂版權公司去發展音樂會員,這個應該是兩邊都非常愿意看到的。
另外,其實在合作的談判過程當中,我也欣喜地看到在國內的內容產業也越來越良性發展,已經有非常非常大的用戶群愿意去為好的內容買單,給了我們很大的信心。
我們在小愛音箱每天的兩三千萬的query數里面看到,其中占60%、70%,甚至70%、80%的,都還是對內容的獲取的query,關于對內容播放控制的query。這個可說明一點:其實語音內容必定是國內幾乎所有智能音箱的核心訴求,并且是高頻剛需。
黃明明:我也贊同唐沐的說法:每家公司的基因不同,還是要合作,每個人把自己擅長做的好的事做到最好,還是有機會,未來的競合環境到底怎么樣,確實還是隨著時間的推移,會有很多的變局。
智能音箱要加屏幕還需解決在交互上的互斥矛盾點
黃明明:我直接進入到下一個關于小米生態的問題,現在不管是亞馬遜還是國內的其他競品他們都在音箱里加入了屏幕的概念。我知道唐沐你是一個超級產品經理也是非常強調用戶體驗,智能音箱這個品類怎么看加入屏幕這個事情,小米的智能音箱會考慮加入屏幕這個事情嗎?
唐沐:其實關于智能音箱要不要帶屏幕這個考慮,確實也有過很多次的思考,但目前還是有些矛盾點需要解決。比如說在我的設想當中,語音交互是一種遠場交互,人和設備其實是可以間隔一定距離去直接做自然交互的。
但從屏幕交互來看,從帶多點觸控的手持設備出現后就是一個近場交互,遠場交互和近場交互在本質上有一些互斥。在音箱上面帶屏幕,會把一個本來大家可以做遠場交互的設備拉近,變成是一個要求人去做近場交互的設備,這兩個東西出現在同一個設備上是有一點互斥。
目前的競爭態勢到達現在這個階段的時候,我想我妄下定論可能會打臉,我也只能說到這里。我們會積極討論或者是積極去準備一個帶屏幕的音箱,因為通過長時間的觀察,我們發現其實有屏幕對于語音交互的信息反饋來說還是比較有幫助的。
黃明明:非常期待小米可能會有屏幕的智能音箱下一代產品的出現。小米的任何產品我們都離不開小米的生態,我不知道有些數字方不方便唐沐能夠介紹一下,目前通過咱們小米的智能音箱互聯互通的智能設備,有多少種類和數量?咱們用戶在實際的調用頻次,剛才你講了內容可能是主要的調用頻次,和其他的IoT,尤其智能家居調用的頻次是什么樣的比例?使用的黏性如何?
唐沐:目前連接在小米IoT云上面的設備已經超過的一個億,這一個多億的設備它是連接在我們,它在過去小米做IoT四五年的時間里面去逐步積累起來的,智能音箱從去年剛剛出現的新事物,它的出現剛好把我們過去全部連接在互聯網上的IoT設備做了一次更緊密的連接,它使得用戶通過語音控制IoT設備的黏性大大增強。
比如說其中有一個數據蠻有意思的,叫“連帶購買率”。我們從很多用戶反饋和數據里可以觀察到,有更多小米IoT設備的用戶會更傾向于購買小愛音箱,買了小愛音箱之后,日常控制IoT設備的頻度和黏性都非常高。另外一個是說購買小愛音箱的用戶,哪怕他一開始沒有其他小米IoT設備,也更傾向于在買了小愛音箱之后一段時間里面積極購入小米其他IoT生態的產品。
這使得我看到了一個希望,智能家居會比以往更加接近現實,更加落地。我們過去曾經做App去控制IoT設備,很多用戶會認為其實它并沒有改善人的生活體驗,或者是說這些設備的操控體驗,但是有了語音交互之后,很多用戶會認為開燈關燈這么簡單的操作頻繁使用的操作,用語音控制簡直是天作之合,并且很多人都養成了這樣的習慣。
黃明明:剛才提過了這個query數量排在第二,我相信你們一定會統計重復使用的頻次和黏性,比如同一個用戶連續在多長的時長之內養成用小米的智能音箱調用其他IoT設備的習慣,這樣的比例有多高?
我記得咱們那樣時候剛認識聊天,投資機會里面看了一大批的所謂的智能家居的創業項目,那個最后我們得出一個很粗暴,但是很個直接的一個結論,用App去控制智能家居有點“滑稽”,比如說關一個燈還要拿起手機找到你的App,點開選擇那個燈,再選擇關閉,還不如直接下床關燈就完了。直到語音交互出現以后,我們認為確實是智能家居這波場景尤其是以語音交互為主的場景爆發起來非常令人興奮的一個消息。
掃地機器人可能是智能家居的下一個風口
黃明明:很高興今天唐沐兄弟又站在了最前沿,智能家居入口的最前沿。其實我記得在兩年前我們天使會有一次聚會,正好和雷總,我記得在頤和園的湖邊上,我們在快走的時候,我們也聊起過一個話題,除了智能音箱之外,小米生態里面還有哪些是最有可能成為IoT的入口?我非常看好另外一個產品是掃地機器人,我不知道你的看法是什么?
我認為掃地機器人需要的有兩個核心點。一個它是要快速,比如說SLAM算法要把用戶居住的環境,不管是現在2D或者未來3D的架構,它全部會掃描清楚,把相關的數據存儲在它的數據庫里面。實際上也是一個對用戶的家居、家庭居住情況等信息十分了解的一個機器人。第二,它的形態上包括和人的交互場景也比較多,比如說它是移動的,所以很有可能成為另一個非常重要的交互或者是流量的入口。
一個是音箱,一個是機器人,都是我非常看好的領域,這兩個領域小米都有自己的布局,我們也在這個領域持續看好的創業機會,想聽聽唐沐你的看法?
唐沐:關于這點我們完全想到一塊去了。我想其實目前小愛音箱只是人工智能助手的一個容器,未來這個助手會出現在很多的設備里面,我會為最終它的終極形態就是機器人。但講出機器人的這個觀點,其實很多用戶不一定會認同,我們做產品,我們首先可以設想如果這個產品落戶在千家萬戶之后,它一定可以怎樣怎樣,但是其實第一步是最難的,怎么樣讓它落地在千家萬戶。
比如說用戶得有什么樣的實際需求才會花錢把它買到家里面?現在做機器人我覺得可能還是過于早,但是掃地機器人是我唯一看好的機器人形態。
很多好萊塢電影已經把用戶對于智能化理解的預期提高到無限高,以至于用戶會覺得買回家的機器人是一個破玩意,甚至是一個垃圾,因為它比我們所了解的我們所曾經看到的電影里面的機器人差的太遠了,機器人這個品類沒法做,但是你在機器人前面加掃地兩個字的時候是可以考慮的。
我認為,其實在到達最終機器人形態之前,是有一個產品的演化路徑。我認為要經過三大要素。
首先是語意,聲音的語意理解。AI音箱其實是搞定了AI語音的問題,它會收集非常多的query,讓大腦去識別并且理解人的意圖,但是其實AI視覺是下一個要攻克的領域,無論是通過家用攝像頭還是通過掃地機器人,都可以收集到足夠多的數據來訓練大腦理解這些圖像。第二是AI視覺的理解,第三就是它的行動部分、運動部分,這個部分的技術只要一具備,機器人形態出現就不遠了。
形象一點來說,AI音箱解決的是“機器人的嘴和耳朵”的問題,后面我們還需要解決“眼睛的問題”和“腿的問題”。終有一天,當用戶習慣身邊家里面有耳朵、有嘴、有眼睛這樣的終端出現,他們會認為也許集合成一體的產品是有機會在家里面出現,是用戶自己愿意擁有的。
黃明明:感謝唐沐,我覺得大家在很多觀點上驚人的一致,我們內部也討論過關于機器人的項目,現階段一切做成人形的所謂機器人形狀的創業產品,都會第一眼被我們pass掉,就是因為用戶通過好萊塢電影或者個人自然反應產生的期望值,都會遠超我們現有產品能夠達到的期望值。
我最后再補充一句,從今天和唐沐的對話我非常興奮,得到了非常大的干貨和信息量。不管是IoT還是剛才跟唐沐討論的,對真正的未來家庭機器人的理解,包括服務機器人的階段性的往前走的步驟、計劃和未來的展望,讓人充滿了極大的信心和樂趣和對未來的想象空間。
評論
查看更多