電子發燒友網報道(文/黃山明)智能家居之所以被冠以“智能”的名義,其中非常重要的一點便是人機交互。通常智能家居的交互方式有許多種,生物識別技術便是其中之一,常用的有手勢控制、指紋識別、語音控制等等。
但從智能語音市場來看,近些年來國內相關市場持續穩定增長,需求旺盛,據中國語音產業聯盟數據顯示,2021年中國智能語音產業市場規模將達到285億元,預計同比增長44%。
如果從網絡來區分,語音控制通常分為兩種,一種為離線語音,另一種為在線語音。
所謂離線語音,也被稱為本地語音,顧名思義便是儲存在本地設備中的固定命令詞,這種命令詞匯通常比較簡短,方便用于喚醒與控制。
相比在線語音,離線語音的優勢在于無需聯網,不需要后臺服務器,響應快速,低延時。低成本、低功耗、體積小,支持多樣化命令詞定制開發等都是離線語音的優勢,同時為了保證能夠成功喚醒命令詞,相比在線語音,其語音識別率會有相應的降低。不過盡管如此,如今的離線語音識別率已經達到了95%以上。
當然,離線語音的劣勢也在于命令詞比較固定,采用離線語音只不過是將傳統的控制方式改為語音操控,但如果要真正做到人機交互的程度,還遠遠不夠。
并且相比在線方案,離線語音的開發周期偏久,因為量產的離線語音產品都需要重新錄詞并進行訓練。
這時候就體現出在線語音的優勢,不再受到命令詞長度和條數的限制,廠商開發也比較方便,市場方案有很多的選擇。
這也意味著用戶可以用更加豐富的詞匯與設備進行交互,而不只是局限在幾個固定的命令詞上。
不過相應地,由于需要聯網,在線語音對于網絡要求較高,同時響應速度也相對較慢,并且體積也相對較大,成本較高,這都是目前智能在線語音的一些弊端。
從目前情況來看,智能語音在語音識別率上已經有了長足的進步,但這項技術背后涉及的聲學研究、模式識別研究、通用NLP研究以及垂直場景的深度語義理解等還遠遠沒有達到完善的地步。智能語音在交互體驗、使用效果、場景性優化等方面還需要持續優化。
國內也有數家在智能語音方面較為優秀的企業,如科大訊飛已經是國內智能語音的代表企業,在實時語音翻譯上走在了行業的前列。
還有如搜狗,從2012年開始在輸入法與地圖上加入語音輸入功能,通過多年用戶大數據的沉淀與積累,搜狗提升了用戶日常生活中表達、傳遞信息的效率,用軟硬件結合起來形成商業閉環。
云知聲也在2012年將深度神經網絡應用于語音識別系統,在那時,云知聲已經建立起完整的人工智能語音技術體系,實現對核心技術的自主可控,并開始人工智能語音技術商業化落地的早期探索。
在產品上,云知聲也具備了使智能家居擁有3-5畝的高精度語音控制能力。
思必馳同樣是國內專業的對話式人工智能平臺公司,創立于2007年,目前不僅在語音識別率上有了大幅提升,同時在識別精度上也有了新的進展。比如其最新推出的直面喚醒技術,可以模擬真人使用情況,優先朝向結合距離選擇被喚醒的設備。
距離相同情況下,聲音朝向的位置先喚醒;聲音朝向相同的情況下,可以讓距離更近的先喚醒。這在如今大多數智能設備都具備語音喚醒功能情況下,有較大的商用價值。
依圖科技則是語音識別、NLP、聲紋識別間距的人工智能公司,目前依圖結合自身對企業級和公共級市場的服務經驗,將智能語音相關技術與多應用場景相結合,在智能家居領域也有不小的突破。
依圖科技基于深度學習的自然語言理解技術在過去幾年取得了長足的進步,分別在建模方式、問題描述、無監督學習上有質的突破,體現在單個任務上取得比傳統算法顯著更高的準確率。
總體來看,當前自然語言理解技術仍有較多難點需要解決,如算法上還需要改進建模方式,引入實體概念,增強模型的邏輯性;另外,還需要對現有模型進行加速使得應用的成本更低。當前自然語言理解技術逐步成熟,已被應用于智能音箱、智能客服、翻譯、智能文檔分析等多個場景。
原文標題:智能家居語音技術發展現狀
文章出處:【微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。
審核編輯:湯梓紅
-
生物識別
+關注
關注
3文章
1210瀏覽量
52510 -
智能家居
+關注
關注
1926文章
9513瀏覽量
184315 -
人工智能
+關注
關注
1791文章
46859瀏覽量
237582
原文標題:智能家居語音技術發展現狀
文章出處:【微信號:elecfans,微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論