3月10日,由智東西、AWE、極果等聯合舉辦“GTIC 2017全球(智慧)科技峰會”在上海證大喜馬拉雅中心正式開幕。地平線機器人副總裁張永謙發表了名為“‘端+云’點亮智能家居新時代”的主題演講,詳細解構了智能家居在發展過程中的遇到的四大難點及解法:應用場景多而分散、用戶體驗復雜、技術需要發展、個性化大數據收集。
以下為張永謙演講的要點精摘:
1、目前中國的4億家庭中,有1億為中產階級家庭,智能家居市場非常龐大,智能電子設備能夠達到每年萬億市場,其它消費及服務則高達每年50萬億。
2、未來,家庭人工智能的進步趨勢:物理入口分散化到智能設備、智能家電、智能硬件上;交互方式升級到圖像、語音、觸控;以及決策過程從人類自主決策升級到AI主動推薦。
3、智能家居市場未能爆發的原因:
1)應用場景多而分散:娛樂、健康、教育、家電、玩具、攝像頭等;
2)用戶體驗復雜:真實場景下的自然交互非常困難;
3)感知、認知、傳感器融合技術等發展存在難點;
4)個性化大數據收集需要優化。
4、面對應用場景多而分散的問題,要找到主要矛盾與不變量,即主體是“人”。基于人臉、動作、人體、語音、以及各種圍繞人的家庭應用,深入解決“人”的問題。
5、在技術上要完成對智能家居最好體驗的布局,必須把圖象和語音的技術融合,只是單獨的做語音和圖象是缺位的。人的交互和獲取信息采用融合的方式,單獨的語音和圖象,或者單獨的其他任何傳感器,都不能涵蓋所有的應用場景。一定是“圖象+語音”。另外,視覺價值是高維的,80%的價值信息來自于圖象,只有20%來自于語音。
6、將來的智能家居市場是端+云的架構。端智能的價值在于:不依賴于網絡,穩定可靠;具備實時性;可過濾有價值數據。云智能的價值方便收集數據,持續優化用戶體驗;每一個智能硬件都可支持智能APP;具備移動性,升級本地智能硬件,不受空間限制。
7、智能家居自然的用戶體驗解法——語音+圖像的融合,除了依賴麥克風的被動交互,還要使用攝像頭進行主動交互,更懂用戶,更好的體驗。
以下為張永謙在“GTIC 2017全球(智慧)科技峰會”上的演講全文:
張永謙:謝謝大家,我來自地平線,地平線是由百度前IDL院長于凱博士創建的一家嵌入式人工智能的公司,今天很高興有這個機會給大家介紹一下我們對智能生活整個行業趨勢的一些思考以及我們在中間做的一些事情。
在講之前,先謝謝陳震剛才對我們的鼓勵。首先談到這個智能生活,其實在中國,大家看到我們有1億的中產階級家庭,這個市場非常大,這一億家庭他們的年平均收入在30萬到70萬人民幣左右,當然說到這個智能家居的市場,大家腦海中的第一個印象是電子設備,其實這個市場雖然很大,有一萬億,但是我們認為,他只是一個智能家居市場的非常小的一部分,真正的智能家居市場的潛力還是在于其他的家庭消費和服務,這個每年的市場是50萬億,現在這個市場是10%通過線上的方式進行,當我們談智能家居的時候,如果哪個公司或者企業能夠更方便、更快捷和更精準的幫助我們的消費者進行他在家里的消費以及獲取想要的這個服務,這個市場是最巨大的。
這個市場這么大,我們看一下對這個市場發展趨勢的一些思考,我們覺得有三個比較明顯的變化,是已經發生或者會在未來的很快的時間內發生的。第一個是物理入口,現在大家很多時候在家里面都是通過手機和PC上網,大家會發現,手機和屏幕是一個非常小的屏幕,也非常擁擠,千軍萬馬擠獨木橋,將來會有一個非常明顯的趨勢,就是整個消費和服務的接入是會分散到各個智能設備的,將來在家里,每一個硬件都是一個獨立的APP,你發現冰箱里面沒有飲料的時候,你不需要打開手機購買,你可以直接一句話告訴形象,下午給我送一打啤酒過來,將來家里的每一個智能硬件都會是一個服務的入口,這個是真正的給我們智能硬件帶來的巨大機會。
第二個是交互方式,最傳統的是通過鍵盤和觸摸屏這樣的方式,隨著語音技術的進步,這個會很快的普及到我們的生活當中,我們覺得,在不遠的將來一定會有一個更為重要、更為重量級的方式,就是通過視覺的交互,因為這個里面也是和人在家里的消費以及需要獲取服務的決策過程密切相關的。
因為現在大家可以看到,不管是通過觸控還是通過語音進行交互,其實他都是一個人的主動決策的過程,語音呢是作為最方便的一個交互方式,他有非常大的發展前景,但是他仍然是被動的。語音這個系統本身并不知道你要做什么,直到你告訴他。但是圖象這個方式,這是一個新的交互方式,是一個主動的交互方式。也就是說,在很多的場景之下,比如說舉個例子,我們可以想象一下,將來家里面在陽臺上放一個大的籃子,里面是臟衣服,現在我們有上門洗衣的服務了,這個籃子里面的衣服累計到一定程度的時候,這個陽臺有一個攝象頭,自動的聯系上門的洗衣服務,你根本不用操心,所有的是通過 主動的方式完成的。
將來的消費以及服務會更多的是通過AI主動推薦的模式,這個里面帶來的市場商業機會是會遠遠大于傳統模式的。因為這個圖象的模式相比語音和觸控是更高維的模式,在這個里面我們獲取到的信息也是遠遠大于觸控和語音這樣的二維方式帶來的信息。我們現在看到智能家居的演進過程三個比較明顯的變化,這個是會給我們帶來很大的商業機會。
說到這個變化的趨勢以后,我們對于目前智能家居市場大家都說了很多年,但是為什么一直沒有起來,我們也仔細的思考了一下,我們覺得有四個方面的原因。第一,左上角這塊,應用場景分散,比如安全娛樂、家庭服務等等,還有家里面的智能設備過于分散,比如玩具、機器人、攝象頭等等,所有這些分散的應用場景和電子設備會導致當我們想把他們智能化的時候,你是很難快速復制的。第二個挑戰,是技術,在智能家居里面你要服務人,這個人是非常難以服務的,這個里面技術的挑戰,有語音、圖象等等,我們今天要解決很多的技術難題,仍然是有很大的挑戰。第三個,數據,數據的搜集和分析是一個很難的過程,首先,家里面每個場景都是高度分散化的,每個家庭的需求也是不一樣的。
其次我們覺得,大家可能會比較容易忽視的問題,你只是拿到大數據,這其實是遠遠不夠的,因為我們今天會發現,你家里安裝上很多的接口,你搜集到很多的數據,但是這些數據很多都是沒用的數據,如果不停的把這些數據上傳到云端,這會占用很多的資源,而這些數據基本都是無效的。所以我們搜集數據的時候,我們要思考,不僅僅要搜集數據,而且要搜集真正有價值的數據。但是這個事情并不是這么容易做到的。第四個挑戰,真正的用戶體驗,我們現在人工智能的技術得到了很快的發展,但是真正讓人滿意,讓人感覺到這個交互的方式和服務的方式非常自然,這仍然是非常大的挑戰。這并不是一個純技術的問題,牽涉到很多其他的問題。有了這些挑戰,人工智能在智能生活上的普及,我們覺得一定不是一蹴而就的事情,一定需要一段時間的慢慢積累。
應對這些挑戰,我們地平線有自己的觀點,第一,應用場景分散的問題,從我們的角度來看,我必須要抓緊中間的主觀矛盾和變量,我們認為這個主要矛盾和變量就是人,我們現在人工智能的技術在智能家居這個領域就應該把人做透。比如說我們看安全,現在家里面裝很多攝象頭主要的目的是為了安全,而安全其實核心是什么呢?最主要的是想知道家里有沒有人,第二,我要知道這個人是什么人,第三,我要知道這個人的行為,他做的行為是安全的行為還是不安全的,比如小孩子進入廚房,會不會點煤氣灶,這些都是不安全的行為。這些所有的都是要人做的。比如娛樂,家庭服務、健康、教育等等,就不一一舉例了,如果你好好思考的話,這個背后主要矛盾和變量就是人。我們地平線在這里是從人臉到人的行為分析,到人體的環境,以及這個人的語音和設備的交互,我們主要的核心點就是圍繞人,把這個技術做好。在這塊再支撐巨大的分散的智能家居的需求。
第二個是技術,技術上的挑戰,我們也是把他簡化,因為人的交互方式和獲取信息的方式其實是一個融合的方式,單獨的語音和圖象,或者單獨的其他任何傳感器,都不能涵蓋所有的應用場景。所以一定是要圖象+語音。另外圖象中間,這個視覺的價值是高維的,80%的價值信息來自于圖象,只有20%來自于語音,在技術上要完成對智能家居最好體驗的布局,我們認為這個必須把圖象和語音的技術融合,只是單獨的做語音和圖象是缺位的。
第三個,數據,要獲取有價值的數據,怎么獲取呢?這個本身是不容易做到的,我們的思路也是比較清晰,就是做嵌入式的人工智能,端+ 云的方式,端側呢,大家可以看到,他在將來的人工智能的體系里面,扮演了一個非常重要的角色,現在我們談到所謂的人工智能的創意也好,什么也好,包括很多大公司,他們其實更多的是在云端做但是端上有不可取代的價值,主要是三個方面,第一,端是不依賴于網絡的,不管是在家里,還是哪里,大家會發現家里的無限網絡覆蓋很難做到完美,如果是在樓下,或者是在移動的場景中,這個網絡的覆蓋其實是非常有挑戰的事情,特別是當你牽涉到一些智能圖象處理的時候,你很難時時的把圖象傳到云端再處理回來,這個時候及時性沒有了。
還有我們怎么樣把有價值的數據傳到云端,這個就要求在端上一定要有一個自己的審核,是一個有選擇性的審核。比如我陽臺上有一個洗衣服的籃子,我就只關注這個里面衣服滿的時候,這個狀態我傳到云端。如果這個里面沒有衣服,99%的時間,這些數據是毫無意義的,就拋棄了。必須采用一個端+云的方式,這樣才有可能真正的做到最高效,而且是最有性價比的智能服務。
有了端上的智能以后,在云端可以做很多的事情,一個是可以搜集數據,持續的優化用戶的體驗另外是每一個硬件,將來都是和手機的形態一樣,他在上面都可以下載很多的智能APP,這個硬件可能已經脫離了原來的形態了,你買回來的時候可能是一個家電,也可能是一個機器人,但是隨著我們的升級,他可以變成任何一個東西。
當我們真的有了這個大數據,也對人的喜好了解以后,這個就不局限在家里了,當我們人在其他地方,到任何一個地方都可以把云端的功能使用起來。將來的智能家居市場一定是端+云的架構。
第四個,真正的用戶體驗,這個服務人是非常難的事情,我們現在服務的人工智能技術在宣傳的過程中,過多的強調我們這個技術本身,比過去傳統的技術好了很多,但是我們也要意識到,真正在這個過程當中要達到讓人滿意仍然是一個非常有挑戰的過程。舉個例子,語音,我們現在都會說我們語音可以支持遠場和近場,也可以識別一些都口音的普通話,甚至是方言,但是我們在實際應用中,我們在家里面看到很多語音的設備,如果很多人同時講話的時候,這個時候的識別率就會下降的比較厲害。
當我們考慮場景的時候,一定要讓人非常自然的使用這個技術。圖象也是一樣,我們今天在家里面有很多人工智能的方案做人臉識別,如果你離的很近的時候確實識別的很好,但是如果離的比較遠,如果是走動的狀態下,如果是背光的情況下,怎么辦?這些都要解決,只有這樣用戶體驗才能真正好,才能真正的愿意使用這個技術,這個市場才能真正的起來。另外一個,我們這個技術更多的還要依賴于攝象頭做到主動的服務,對這個用戶要懂他,只有懂他才能使用戶得到好的體驗。
剛才總結了智能家居市場的一個現狀和發展趨勢,以及我們現在看到的四個挑戰,場景非常分散,技術挑戰很大,如何搜集有價值的數據以及最后如何做到真正好的用戶體驗,我們也介紹了一些地平線的思考和做的事情。總的來說,我們地平線的核心點就一句話,我們是做嵌入式的人工智能,我們認為這是最好的切入點。我們跟別的公司鮮明的區分也很簡單,很多的人工智能公司是非常優秀和成功的,但是他們主要是依靠云端的技術,我們地平線的目標是希望讓人工智能真正的分布到每一個端上,我現在在智能家居這個領域,我們圍繞人,用最小的處理資源,比如說我們現在的技術可以在APP上做到我們介紹的所有的智能事情,以及將來我們很快的可以看到,包括很多公司,包括地平線研發的,基于生物學習的專用的處理器架構,用最小的資源做到真正的好的技術服務,給大家帶來最好的用戶體驗。
地平線本身的定位,在這里也說一下,我們的定位其實是一個2B的公司,我們不會做2C的任何產品,我們地平線希望在嵌入式的設備上,有我們自己的IP,也可能有別人的IP在這個上面支撐更多的智能設備,有玩具、家電和攝象頭,我們地平線還會提供一個智能系統支撐平臺,這個平臺之上我們希望支撐整個行業的各個合作伙伴以及我們的客戶,由他們再 去針對各種各樣的智能生活中的場景做各種各樣好的服務和應用。最后,帶給消費者最方便、最快捷、最舒適的用戶體驗,達到所有人的共同目標。
智能家居已經成為物聯網浪潮下的一個重要增長市場,智能家居和物聯網的互聯融合也在加速。行業專家認為,真正的連接是以用戶價值為中心的需求互聯,而不是簡單的技術互聯和場景互聯。對于智能家居市場的最新熱點趨勢和市場技術解讀,你不能錯過電子發燒友主辦的【第六屆智能家居技術創新研討會】。
電子發燒友舉辦【第六屆智能家居技術創新研討會】,屆時邀請業內知名大咖如微軟戰略顧問管震、和而泰智能董事長劉建偉、深圳易聯智能李學勇等來解讀最新智能家居云平臺、智能語音交互和智能家居市場痛點和最新趨勢,請直接報名。
評論
查看更多