電子發燒友網報道(文/黃山明)智能家居之所以被冠以“智能”的名義,其中非常重要的一點便是人機交互。通常智能家居的交互方式有許多種,生物識別技術便是其中之一,常用的有手勢控制、指紋識別、語音控制等等。
但從智能語音市場來看,近些年來國內相關市場持續穩定增長,需求旺盛,據中國語音產業聯盟數據顯示,2021年中國智能語音產業市場規模將達到285億元,預計同比增長44%。
如果從網絡來區分,語音控制通常分為兩種,一種為離線語音,另一種為在線語音。
所謂離線語音,也被稱為本地語音,顧名思義便是儲存在本地設備中的固定命令詞,這種命令詞匯通常比較簡短,方便用于喚醒與控制。
相比在線語音,離線語音的優勢在于無需聯網,不需要后臺服務器,響應快速,低延時。低成本、低功耗、體積小,支持多樣化命令詞定制開發等都是離線語音的優勢,同時為了保證能夠成功喚醒命令詞,相比在線語音,其語音識別率會有相應的降低。不過盡管如此,如今的離線語音識別率已經達到了95%以上。
當然,離線語音的劣勢也在于命令詞比較固定,采用離線語音只不過是將傳統的控制方式改為語音操控,但如果要真正做到人機交互的程度,還遠遠不夠。
并且相比在線方案,離線語音的開發周期偏久,因為量產的離線語音產品都需要重新錄詞并進行訓練。
這時候就體現出在線語音的優勢,不再受到命令詞長度和條數的限制,廠商開發也比較方便,市場方案有很多的選擇。
這也意味著用戶可以用更加豐富的詞匯與設備進行交互,而不只是局限在幾個固定的命令詞上。
不過相應地,由于需要聯網,在線語音對于網絡要求較高,同時響應速度也相對較慢,并且體積也相對較大,成本較高,這都是目前智能在線語音的一些弊端。
從目前情況來看,智能語音在語音識別率上已經有了長足的進步,但這項技術背后涉及的聲學研究、模式識別研究、通用NLP研究以及垂直場景的深度語義理解等還遠遠沒有達到完善的地步。智能語音在交互體驗、使用效果、場景性優化等方面還需要持續優化。
國內也有數家在智能語音方面較為優秀的企業,如科大訊飛已經是國內智能語音的代表企業,在實時語音翻譯上走在了行業的前列。
還有如搜狗,從2012年開始在輸入法與地圖上加入語音輸入功能,通過多年用戶大數據的沉淀與積累,搜狗提升了用戶日常生活中表達、傳遞信息的效率,用軟硬件結合起來形成商業閉環。
云知聲也在2012年將深度神經網絡應用于語音識別系統,在那時,云知聲已經建立起完整的人工智能語音技術體系,實現對核心技術的自主可控,并開始人工智能語音技術商業化落地的早期探索。
在產品上,云知聲也具備了使智能家居擁有3-5畝的高精度語音控制能力。
思必馳同樣是國內專業的對話式人工智能平臺公司,創立于2007年,目前不僅在語音識別率上有了大幅提升,同時在識別精度上也有了新的進展。比如其最新推出的直面喚醒技術,可以模擬真人使用情況,優先朝向結合距離選擇被喚醒的設備。
距離相同情況下,聲音朝向的位置先喚醒;聲音朝向相同的情況下,可以讓距離更近的先喚醒。這在如今大多數智能設備都具備語音喚醒功能情況下,有較大的商用價值。
依圖科技則是語音識別、NLP、聲紋識別間距的人工智能公司,目前依圖結合自身對企業級和公共級市場的服務經驗,將智能語音相關技術與多應用場景相結合,在智能家居領域也有不小的突破。
依圖科技基于深度學習的自然語言理解技術在過去幾年取得了長足的進步,分別在建模方式、問題描述、無監督學習上有質的突破,體現在單個任務上取得比傳統算法顯著更高的準確率。
總體來看,當前自然語言理解技術仍有較多難點需要解決,如算法上還需要改進建模方式,引入實體概念,增強模型的邏輯性;另外,還需要對現有模型進行加速使得應用的成本更低。當前自然語言理解技術逐步成熟,已被應用于智能音箱、智能客服、翻譯、智能文檔分析等多個場景。
但從智能語音市場來看,近些年來國內相關市場持續穩定增長,需求旺盛,據中國語音產業聯盟數據顯示,2021年中國智能語音產業市場規模將達到285億元,預計同比增長44%。
數據來源:沙利文資訊
如果從網絡來區分,語音控制通常分為兩種,一種為離線語音,另一種為在線語音。
所謂離線語音,也被稱為本地語音,顧名思義便是儲存在本地設備中的固定命令詞,這種命令詞匯通常比較簡短,方便用于喚醒與控制。
相比在線語音,離線語音的優勢在于無需聯網,不需要后臺服務器,響應快速,低延時。低成本、低功耗、體積小,支持多樣化命令詞定制開發等都是離線語音的優勢,同時為了保證能夠成功喚醒命令詞,相比在線語音,其語音識別率會有相應的降低。不過盡管如此,如今的離線語音識別率已經達到了95%以上。
當然,離線語音的劣勢也在于命令詞比較固定,采用離線語音只不過是將傳統的控制方式改為語音操控,但如果要真正做到人機交互的程度,還遠遠不夠。
并且相比在線方案,離線語音的開發周期偏久,因為量產的離線語音產品都需要重新錄詞并進行訓練。
這時候就體現出在線語音的優勢,不再受到命令詞長度和條數的限制,廠商開發也比較方便,市場方案有很多的選擇。
這也意味著用戶可以用更加豐富的詞匯與設備進行交互,而不只是局限在幾個固定的命令詞上。
不過相應地,由于需要聯網,在線語音對于網絡要求較高,同時響應速度也相對較慢,并且體積也相對較大,成本較高,這都是目前智能在線語音的一些弊端。
從目前情況來看,智能語音在語音識別率上已經有了長足的進步,但這項技術背后涉及的聲學研究、模式識別研究、通用NLP研究以及垂直場景的深度語義理解等還遠遠沒有達到完善的地步。智能語音在交互體驗、使用效果、場景性優化等方面還需要持續優化。
國內也有數家在智能語音方面較為優秀的企業,如科大訊飛已經是國內智能語音的代表企業,在實時語音翻譯上走在了行業的前列。
還有如搜狗,從2012年開始在輸入法與地圖上加入語音輸入功能,通過多年用戶大數據的沉淀與積累,搜狗提升了用戶日常生活中表達、傳遞信息的效率,用軟硬件結合起來形成商業閉環。
云知聲也在2012年將深度神經網絡應用于語音識別系統,在那時,云知聲已經建立起完整的人工智能語音技術體系,實現對核心技術的自主可控,并開始人工智能語音技術商業化落地的早期探索。
在產品上,云知聲也具備了使智能家居擁有3-5畝的高精度語音控制能力。
圖源:云知聲IPO招股書
思必馳同樣是國內專業的對話式人工智能平臺公司,創立于2007年,目前不僅在語音識別率上有了大幅提升,同時在識別精度上也有了新的進展。比如其最新推出的直面喚醒技術,可以模擬真人使用情況,優先朝向結合距離選擇被喚醒的設備。
距離相同情況下,聲音朝向的位置先喚醒;聲音朝向相同的情況下,可以讓距離更近的先喚醒。這在如今大多數智能設備都具備語音喚醒功能情況下,有較大的商用價值。
依圖科技則是語音識別、NLP、聲紋識別間距的人工智能公司,目前依圖結合自身對企業級和公共級市場的服務經驗,將智能語音相關技術與多應用場景相結合,在智能家居領域也有不小的突破。
依圖科技基于深度學習的自然語言理解技術在過去幾年取得了長足的進步,分別在建模方式、問題描述、無監督學習上有質的突破,體現在單個任務上取得比傳統算法顯著更高的準確率。
總體來看,當前自然語言理解技術仍有較多難點需要解決,如算法上還需要改進建模方式,引入實體概念,增強模型的邏輯性;另外,還需要對現有模型進行加速使得應用的成本更低。當前自然語言理解技術逐步成熟,已被應用于智能音箱、智能客服、翻譯、智能文檔分析等多個場景。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
家居控制
+關注
關注
0文章
12瀏覽量
8753 -
無線智能家居
+關注
關注
2文章
14瀏覽量
7569
發布評論請先 登錄
相關推薦
語音識別芯片:塑造智能家居控制新時代
語音識別芯片技術革新智能家居控制,用戶語音指令可輕松管理家電,實現一鍵切換場景,提高效率和響應速度,保障隱私安全,市場應用廣泛,將創造更多智能
ASR在智能家居中的應用
隨著科技的飛速發展,人工智能技術(AI)已經滲透到我們生活的方方面面,其中自動語音識別(Automatic Speech Recognition,簡稱ASR)技術在
ipc技術在智能家居中的發展
隨著科技的不斷進步,智能家居逐漸成為現代生活的一部分。IPC技術,即網絡攝像機技術,作為智能家居系統中的重要組成部分,其發展對
嵌入式熱門領域有哪些?
通過物聯網連接各種物理設備和傳感器,促使它們之間實現信息的交換和數據的共享。從智能家居到智能城市,物聯網的應用不斷擴展,為嵌入式系統工程師帶來了廣泛的就業機會和發展前景。
自動駕駛 自動駕駛
發表于 07-16 09:23
繼電器在智能家居中的應用
隨著科技的飛速發展,智能家居已經成為現代家庭不可或缺的一部分。在智能家居系統中,繼電器作為一種重要的電子控制元件,發揮著至關重要的作用。本文旨在深入探討繼電器在智能家居中的應用,分析其
探索UWB模塊的潛力:智能家居與物聯網的連接者
UWB模塊具有精準定位、快速響應、低能耗等特點,在智能家居領域展現出了巨大的潛力,正逐漸成為智能家居與物聯網的重要連接者。本文將探討UWB模塊在智能家居與物聯網中的關鍵作用、應用場景以
AI加速智能家居分布式語音技術發展
電子發燒友網報道(文/黃山明)生成式AI的出現,讓人與機器的交流將變得更加自然,也在不斷推動分布式語音入口在智能家居中的智能化水平升級,讓家庭自動化和人機交互變得更加自然、便捷和高效,能夠讓用戶在家
區塊鏈技術發展現狀和趨勢
近年來,區塊鏈技術作為一項顛覆性的創新技術,引起了全球各行各業的廣泛關注。區塊鏈技術的出現,為金融、供應鏈、物聯網等各個領域帶來了很多變革的機會。本文將從區塊鏈技術的起源、
語音數據集在智能家居安全系統中的應用與挑戰
提供了更加便捷和人性化的交互方式。本文將詳細介紹語音數據集在智能家居安全系統中的應用、面臨的挑戰以及未來的發展趨勢。
評論