湯兵城,思必馳商務拓展總監,是《電器》記者在過去三年中,采訪這家公司的第四人。可以說,從思必馳堅持To B并轉型至專注智能硬件領域以來,在資本市場每一次獲得青睞,與阿里智能、慶科、綠聯等生態伙伴的每一場合作,筆者幾乎沒有缺席。這期間,思必馳經歷了移動互聯的風口、語音交互技術的升級以及團隊人員的完善,從2014年至今,面向智能車載、智能家居和智能機器人三大垂直領域,為其提供自然語言交互解決方案的思必馳,被業內成為可與科大訊飛二分天下的語音巨頭。
圖1 思必馳商務拓展總監湯兵城
2017年3月10日,在中國家電及消費電子博覽會期間,思必馳商務拓展總監湯兵城做客《電器》雜志專訪間,從2016年云棲大會YunOS@Home專場談起,詳解伴隨三大板塊提升,思必馳是如何引領人性化智能語音交互技術。
獨家AIOS,奠定優勢基礎
談起公司在三大垂直領域的發展,可以用強勁二字來形容。據湯兵城介紹,在車載后裝市場,思必馳與阿里旗下的高德地圖合作已久,Yun OS全線產品所搭載的語音系統都是思必馳提供。在Android系統方面,與IME、瑞聯、天之眼等都保持密切合作。在車載后裝市場奠定基礎的同時,思必馳加速前裝市場,如今與奇點汽車、小鵬汽車等互聯網造車企業已經進入后期調整。在家居方面,與阿里、騰訊、小米、聯想、海爾、美的等建立合作關系,推出的產品包括電視、音箱、OTT盒子等。在智能機器人方面,與大華樂橙、360等中高端品牌合作密切。擅長唱歌跳舞的小蘿卜機器人、智能程度頗高的大華樂橙小樂機器人、360小巴迪機器人等都已經推向市場。
圖2 慶科VBS6100AI芯片模組
專注細分領域是成功的關鍵,但技術積累必不可少。能夠在這三大領域保持自然語言交互解決方案商的領先地位,與思必馳在2015年推出的對話操作系統AISpeech Operating System(簡稱:AIOS)密不可分。據湯兵城介紹,源于英文縮寫的AIOS相當于思必馳的獨家系統,它可運行于主流操作系統(Linux, Android,QNX)之上,封裝核心的語音相關技術和對話交互邏輯,同時對上層應用制定了一層領域抽象接口,支持快速集成和自定義開發。他說,思必馳把語音相關技術整合成AIOS 人機對話操作系統,作為安卓系統之上的一層標準接口,提供給硬件合作伙伴,能夠極大減少開發及維護成本。針對不同場景,AIOS又分成了AIOS for Car,AIOS for Home,AIOS for Robot等版本,而這些版本成為日后思必馳發力三大板塊的基礎。
創新模式,成就語音交互獨角獸
雖然AIOS成為很多語音創業公司效仿的重點,但對系統的重視程度難以和思必馳相提并論。據湯兵城介紹,公司會根據不同的系統量身打造AIOS,強調語音識別、語音合成、語義理解、聲紋識別、對話管理、音頻分析等技術的定制化處理,并且對接了豐富的第三方內容資源,比如酷我音樂、蝦米音樂、大眾點評以及股票天氣、故事讀物、笑話大全等。這一整套下來,正是湯兵城眼中人工智能語音交互的重要組成部分。
圖3 小米生態鏈諸葛小明床頭燈
作為人工智能重要的組成部分,湯兵城強調,思必馳從頭至尾都會把更多的精力聚焦在語音交互的體驗上。湯兵城進一步解釋說,公司做語音識別起家,相比其他人工智能公司更加專注,思必馳的聯合創始人俞凱是劍橋的語音博士,現在是上海交大教授,所以公司在自然語言處理技術等方面也更專業。此外,同科大訊飛一樣,思必馳具有全套語音技術產權,并成功實現了“產學研”結合,雄厚的技術積累也是的思必馳在系統上迭代升級非常快。相比其他語音創業公司,思必馳更專注在智能硬件在具體場景的語音交互。據悉,思必馳和上海交通大學建立了智能人機交互聯合實驗室,并達了完善的獨家知識產權協議。另外,B2B2C的商業模式與其他公司也有不同。
圖4 車蘿卜HUD
據了解,AIOS已經成為中國智能車載后裝市場中占有率最大的語音解決方案,占有率達到60%左右。采用這款系統的車載產品包括了著名的捷渡“遠界”智能后視鏡、祖師匯云龍智能后視鏡、天之眼智能后視鏡、車蘿卜HUD等,是當之無愧的獨角獸。
環形“6+1”遠場麥克風陣列,提高交互體驗
提高用戶體驗,是湯兵城在采訪中提到最多的幾個字,他舉例說,家居環境下的噪音有混響、回聲、背景噪音、人聲干擾等多種類型,此外遠距離交互也是語音交互領域要解決的一個難點。在噪聲干擾或者距離稍微遠的環境下,即使是優質的語音軟件方案也不能得到好的交互效果。針對這個問題,在AIOS軟件方案之外,思必馳研發了一個軟硬一體化的解決方案,那就是環形“6+1”遠場麥克風陣列,屬于數字信號處理范疇,6個麥克風呈環形均勻分部拾音,中間1個麥克風輔助拾音。陣列獲取聲音信息之后,利用拾音波束成形,采用獨特算法,抑制波束之外的噪聲,并融合語音信號信息,從含噪聲的語音信號中提取出純凈語音,增強說話人語音。從而可以確定信號來波方向,達到抗噪目的的同時,還增強了人的聲音。
圖5 樂橙小樂育兒機器人
據了解,用“環形6+1遠場麥克風陣列”對聲音信息進行處理之后,智能設備可以做到5米遠場交互(準確率達到92%)、360°全角度環形拾音、聲源定位精確度控制在±10°以內。“該陣列為國內首款同類產品,大大增強了降噪處理和遠場識別,再結合豐富的后端第三方資源,提高了交互體驗。”湯兵城表示,“目前,思必馳的“環形6+1遠場麥克風陣列”主要針對的是智能機器人和智能音箱等設備,未來會在更多家電產品上應用。”
迭代升級,滿足更多客戶需求
用戶通過各類硬件、家電的使用調用思必馳的云端,每天都會產生海量數據。憑借這些,首先可以進一步優化、訓練聲學模型,使得聲音識別率無限逼近于百分之百。其次,通過數據分析,可以挖掘一些新的商業模式。當然這些需要過程,眼前對思必馳而言重要的做到專注與聚焦,以及提升用戶的體驗。
圖6 聯想智能音箱
沒有時間考慮行業競爭與抄襲,思必馳正忙于拓展新領域。在本次AWE上,思必馳展示了聯想在CES發布的智能音箱,其海外版搭載亞馬遜Alexa平臺,國內版則采用了思必馳自然語言交互方案,能夠實現流暢的語音交互,涵蓋音樂播放、新聞、有聲讀物、查詢天氣、語音叫車、訂外賣等服務,是用戶的貼心助理。
此外,小米互聯網音箱、與慶科聯手打造的VBS6100AI語音模組,搭載了思必馳ASR、TTS等語音技術的方案,具備語音交互功能,高度集成了多方技術優勢。還有聲必可語控背景音樂系統、樂橙TC5S人工智能攝像機、樂橙小樂育兒機器人、諸葛小明床頭燈以及美的洗衣機,海爾馨廚冰箱等產品。
-
智能家居
+關注
關注
1924文章
9389瀏覽量
182095 -
人工智能
+關注
關注
1787文章
46026瀏覽量
234860 -
智能車載
+關注
關注
0文章
50瀏覽量
9054
發布評論請先 登錄
相關推薦
評論