第28屆WWDC蘋果全球開發者大會,蘋果終于壓軸重磅發布了HomePod,一款蘋果精心打造的智能音箱。但是,估計這讓很多果粉失望了,這應該是蘋果系列中極少稱得上“很丑”的產品。鑒于筆者并不懂藝術,因此凌晨著急詢問了很多美學人士,這才沒讓筆者懷疑自己的審美出現了問題。
HomePod的設計師估計是成長在80年代的中年人,因為看到HomePod的第一眼就想起了媽媽的毛線球,新世紀的年輕人哪見過這古董,當然,還有一種更難看的尼龍線球也是這個造型。
當然,HomePod雖然丑了點,但是性能一點不差,蘋果對于用戶體驗的極致追求還在,而且,HomePod是迄今為止首款回歸音箱本質的智能音箱。蘋果甚至不惜代價同時部署了麥克風陣列和揚聲器陣列,這就是蘋果的態度:不僅追求遠場語音交互的體驗,也追求極致音質帶來的享受。
靴子落地,為何要用6麥的環型陣列!
HomePod內置了蘋果Siri,這次蘋果采用了業界流行的6麥環形陣列技術。這種麥克風陣列技術適合遠場語音交互,這樣可以滿足用戶遠距離通過“Hey,Siri”與HomePod的命令交互。蘋果HomePod采用麥克風陣列技術,也表明了蘋果將Siri從近場語音交互升級到遠場語音交互的技術思路。
前幾年,語音交互應用最為普遍的就是以Siri為代表的智能手機,這個場景一般都是采用單麥克風系統。單麥克風系統可以在低噪聲、無混響、距離聲源很近的情況下獲得符合語音識別需求的聲音信號。但是,若聲源距離麥克風距離較遠,并且真實環境存在大量的噪聲、多徑反射和混響,導致拾取信號的質量下降,這會嚴重影響語音識別率。
而且,單麥克風接收的信號,是由多個聲源和環境噪聲疊加的,很難實現各個聲源的分離。這樣就無法實現聲源定位和分離,這很重要,因為還有一類聲音的疊加并非噪聲,但是在語音識別中也要抑制,就是人聲的干擾,語音識別顯然不能同時識別兩個以上的聲音。
顯然,當語音交互的場景過渡到以智能音箱、智能電視、機器人或者汽車為主要場景的時候,單麥克風的局限就凸顯出來。為了解決單麥克風的這些局限性,利用麥克風陣列進行語音處理的方法應時而生。麥克風陣列由一組按一定幾何結構(常用線形、環形)擺放的麥克風組成,對采集的不同空間方向的聲音信號進行空時處理,實現噪聲抑制、混響去除、人聲干擾抑制、聲源測向、聲源跟蹤、陣列增益等功能,進而提高語音信號處理質量,以提高真實環境下的語音識別率。
從目前國內外市場上的產品來看,Amazon Echo的方案是6+1麥的環型陣列結構,Amazon Echo Show是8麥橢圓型陣列結構,Google Home是2個麥克風結構,國內科大訊飛的叮咚音箱是7+1麥的環型陣列結構,當前聲智科技的產品線最為齊全,擁有3/4/4+1/6麥的環型陣列結構以及單麥、4麥線型、6麥L型,8麥雙L型、10麥分布式陣列等結構。
實際上,不同的陣型適應不同的場景,同時還要考慮性價比,顯然陣列結構越復雜其成本也越高。而對于智能音箱來說,由于用戶使用習慣需要360度的拾音和定向,所以環型陣列結構是最為合適的。至于選用3個,4個還是6個,則是根據定向精度和交互距離來決定,從某個角度可以理解為麥克風的數量越多定向越準,語音識別的距離也會越遠,當然,這和陣型的具體結構也有關系。
?
注意,這里的2麥克風不是陣列,并不具有陣列的一些功能和性能,2麥最通常是用在類似手機和藍牙耳機等超薄的設備上實現降噪功能,實際上,很多場合經過特殊設計的單個麥克風即可替代2麥結構。由于蘋果HomePod必須差異于Amazon Echo和Google Home,選用6個麥克風的結構非常明智,性價比最為合適,這也是聲智科技主推的麥克風陣型,事實上,根據聲智科技當前的技術,選用4個麥克風的效果也不會太差,只是語音交互距離會損失一點。
智能音箱的根本屬性還要聽音質!
智能音箱畢竟還是音箱的品類,這是成熟的品類,也不明白為何很多智能音箱的廠商非要定位自己是機器人。事實上定位于機器人對于消費市場來說反而是一個災難,因為機器人市場還是一個需要巨大投入教育的市場。因此,HomePod選擇了回歸音箱的本質,非常注重音質和聽覺體驗。
HomePod擁有非常棒的音頻技術,底部采用了7個波束形成的高頻揚聲器陣列,可以精準呈現聲學效果以及聲場控制。過分的是,在如此小的產品之中,蘋果竟然用了一個4寸的低頻揚聲器,這里就不再強調低頻揚聲器越大越好了。
不僅如此,HomePod還采用了大量音效算法,包括自動低音均衡、動態建模等等。雖然7英寸的小身材,即使調大音量,音質也不會失真。HomePod采用的是蘋果手機使用的A8處理芯片,同時兼具了實時聲學建模、音頻波束形成、多通道回聲消除技術,這使HomePod是迄今為止速度最快、音效最棒的智能音箱。筆者相信,單單憑這個理由,就有很多果粉會掏腰包。
另外,蘋果也提到了Spatial awareness技術,其實這不是什么新奇的技術,就是強調了空間感和沉浸感,也就是讓音樂在不同的場景里以不同的音效播放出來。顧名思義,當HomePod放在房間里,可以根據現場的環境來調整音樂效果。
雖然不新鮮,但是這是一個很大的進步,因為虛擬空間音效極度依賴空間的聲場環境。順便多說幾句,杜比折騰了那么多年的全景聲,應用到家庭級產品中始終就沒能解決這個問題。小米的超薄電視強調了空間音效,也就是增加了從天花板反射的聲音,但是杜比顯然無法依據用戶的家庭環境來適應最佳音效。
當然,HomePod肯定支持多房間音樂系統,如果使用多個HomePod,其音效效果將更加棒,這更適合國外喜歡聚會的年輕朋友。當前聲智科技也提供了針對多房間音樂系統的支持,同時還有一項“就近喚醒”的技術,也就是當多個語音智能設備同時存在的時候,優先響應用戶指令的是距離用戶最近的智能設備。
至于蘋果的音樂生態、家庭控制就不再重復強調了。HomePod增加的聲紋識別功能倒是一個小亮點,這樣Siri會識別用戶的聲音是否與用戶聲紋相符,不僅提升了使用效率,而且能夠為用戶的隱私提供安全保障。
那么,為什么蘋果越變越丑了呢?
似乎不僅僅HomePod,蘋果自從離開喬布斯時代以后,就再也沒推出過令人驚艷的產品,甚至,閉著眼睛都能猜到蘋果iPhone 8的造型,更不用說一直沒有變化的Mac和iPad系列了,包括AirPods的設計也是被吐槽的對象。這自然是庫克的功勞,這位供應鏈出身的CEO驅動蘋果帝國一直前行,但是太過務實的作風也讓庫克失去了對技術和藝術結合的掌控力。
顯然,HomePod是藝術妥協技術的結果,因為從布局來看,從下到上依次是高頻揚聲器陣列、麥克風陣列、4寸低頻揚聲器和主控板,這樣羅列在一起,再考慮到聲學結構設計,從技術角度來看確實也想不出更好的造型來。但是這總歸是蘋果啊,擁有全世界最牛的設計人員和技術人員,結果還是設計出來了一款沒有擺脫技術思路的產品。
有時候不得不說,讓技術或者供應鏈的大拿負責產品設計或者也是一場災難。Anyway,這是一款完全符合技術人員審美和風格的產品,因為從技術層面來說,這款音箱確實也沒毛病,而且還挑戰了技術難度,比如麥克風陣列放置中部的技術實現難度就很大。
產品的尷尬,如何應對蘋果的打法!
但是蘋果終歸是蘋果,蘋果對于產品的理解和打法還是超過了行業普通的認知。首先來看蘋果的定位,高端這是必須的。Amazon Echo是先入為主的產品,售價179美元,這接近成本的價格很要命,幾乎堵住了很多產品的出路。逼的Google不得不走低端,售價拉低到129美元,為此還棄用了麥克風陣列,犧牲了遠場語音交互的體驗。
不管怎樣,反正蘋果售價定到349美元了,這對于蘋果應該還算降價了,但是也把高端智能音箱市場的出路給堵死了。其次,蘋果既然定位高端,其產品就要給消費者帶來高端的體驗,因此蘋果堆砌了麥克風陣列和揚聲器陣列技術,再加上原本的音樂和控制生態,對于吸引一大批蘋果粉絲來說,還是穩妥的策略。當然蘋果最大的失誤就是HomePod丑了一點,否則這會讓更多廠商感覺悲觀。
從當前國外市場來看,Amaon,Google,Apple從低端到高端針對智能音箱的布局,一致都是壓縮了利潤空間,這絕對不是一款以賺錢為目標的產品,而是一款戰略級的產品。說白了,巨頭們壓根就沒指望依賴智能音箱賺多少錢,而是不能失去了這個語音入口,即便不確定未來是不是入口,至少賭錯了要比錯過更好。何況,以現在的形勢來看,聲音和圖像注定是人工智能時代的兩大核心基礎數據。
這就產生了一個難題,Amazon Echo和Google Home怎么應對?Amazon還好,畢竟市場占用率在那,而且產品線也比較齊全了,尷尬的反而是Google了,花費了那么大精力,反而只是做了其他兩家巨頭的陪襯。這還好,最尷尬的是國內做海外市場的一些廠商,比如聯想,聯想的智能音箱該怎么面對這個復雜的情況?在這樣的壓力下,會不會有更令人驚喜的產品出現,比如小米該如何行動?這也是我們這個年度最為期待的事情。
為什么HomePod需要等到年底?
蘋果HomePod預計至少等到12月份才在美國、英國、澳大利亞同步發售,而全球發貨要等到明年稍晚些時候。這是個什么情況?一款音箱竟然就要等到半年以上。而且,根據現場的朋友反饋,發布會展示的音箱,應該只是一個殼子,因為除了演示亮下燈,其他什么功能都沒有。所以,蘋果確實也著急了一點,必須要推出智能音箱才行了。
不得不說,這也是技術上頗為尷尬的事情,蘋果絕對是保證用戶體驗的,但是HomePod一下子加了兩個陣列,哪個陣列都不是簡單的事情。畢竟現在的產品已經不是純功能型的產品了,這是一個完整的技術鏈條。比如麥克風陣列,就包括了噪聲抑制、混響去除、人聲干擾抑制、聲源測向、聲源跟蹤、陣列增益、模型匹配、語音識別等等功能,這都是需要認真打磨的復雜技術體系,即便是蘋果,也需要足夠的時間積累經驗。產品考驗的是每一處的細節, 所以,很多時候,請善待你們身邊那些沒日沒夜加班的創業公司吧。
蘋果為何如此重視一款音箱?
隨著人工智能領域的不斷發展,人們開始追求更加自由的語音交互方式,遠場語音交互的優勢逐漸凸顯出來。事實上Echo出現之前,語音交互產品解決的一直都是近場問題,這是典型的由于技術限制而刻意回避場景的案例,因為近場語音交互要求人類適應機器。
但是人類之間的語音交互從來都要拉開一定的距離,所以現在需要機器適應人類。這可以說是計算機技術的一個巨大進步,也是人工智能的核心要素之一。
當然,這并非聲學領域特有的問題,當攝像頭和雷達安裝到汽車,以及GPS安裝到自行車的時候,場景變化所帶來的技術挑戰才會凸顯出來,因為真實場景所需要的技術支持并非簡單升級,而是顛覆性創新,這也是巨頭公司紛紛進入這個領域的主要原因,誰也不想在技術升級換代過程中被淘汰。
事實上,當機器獲取的融合數據足以覆蓋到人類十分之一的時候,人類確實很多時候只需要說一說、看一看或者想一想機器就能明白,但是這個時候,我們也不知道到底會產生哪些新的商業模式,畢竟從我們角度來看,廣告模式肯定不是人工智能時代的最佳商業模式。
從亞馬遜Echo暢銷,大家逐漸把目光瞄準了智能音箱。谷歌推出了Google Home,微軟也聯手哈曼卡頓、惠普等推出搭載Cortana的智能音箱。雖然,蘋果通過智能耳機Airpod搶占語音市場入口,然而,隨著亞馬遜Alexa通過Echo在智能家居市場攻城略地,似乎開始漸漸吞噬蘋果在智能家居領域的市場份額,也逐漸穩固其語音交互入口的地位,Alexa似乎成為新一代“安卓”或者“OS”。如此看來,蘋果推出HomePod的確是勢在必行。小結
即便在喬布斯時代,蘋果的每款產品發布都會被吐槽多次,但是蘋果的銷量就是最佳的回應,至少,從蘋果HomePod的性能和價格來看,HomePod的銷量也不會太差,這從Airpods上可以類比一下。特別是蘋果竟然模仿小米路線,還相當認真地對比了一下價格,最終才給出了一個比拼小米的價格。更為期待國內的各大巨頭,如何應對蘋果的戰略打法呢?
(本文作者陳孝良,博士,聲智科技創始人,曾任中科院聲學所副研究員和信息化辦公室主任,北京市公安局首屆網絡應急專家,主要從事聲學信號處理和 GPU 深度學習算法研究工作。)
評論
查看更多