在談人工智能的時候,一定不能不談語音識別,語音識別是人機交互的入口,是指機器/程序接收、解釋聲音,或理解和執行口頭命令的能力。目前國內外都有公司在語音領域有所投入,其中包括才成立幾年的初創企業,也包括中途入局的巨頭企業,電子發燒友梳理了國內10家在語音領域影響較大的企業如下,排名不分先后,如有任何紕漏,歡迎留言指正。
科大訊飛
成立于1999年,具有語音合成、語音識別、口語評測、語言翻譯、聲紋識別、人臉識別、自然語言處理等智能語音與人工智能核心技術。
主要產品介紹:
訊飛輸入法,支持語音輸入;
咪咕靈犀,中國移動和科大訊飛聯合推出的智能語音助手,支持粵語,既能語音打電話、發短信、查天氣、搜航班,還能查話費、查流量、買彩票、訂彩鈴等;
發條,一款基于科大訊飛AIUI智能引擎,通過語音交互,迅速定位用戶想要內容的AI音樂助手;
訊飛電視助手,可以語音播放、換臺;
思必馳
成立于2007年,一家專注于智能硬件領域的語音公司,主要面向智能硬件三個垂直領域:智能車載、智能家居和智能機器人,提供自然語言交互解決方案。2018年6月26日,宣布完成D輪5億元融資。
主要產品介紹:
對話操作系統AIOS系統(AISpeechOperatingSystem思必馳人工智能操作系統)——運行于Android、Linux、阿里云OS等主流操作系統之上,目前主要用于車載領域(AIOSForCar)和家居領域(AIOSForHome);
軟硬一體化的芯片模組,它提供聲源定位、個性喚醒、語音識別、語義理解、多輪對話等功能,主要用于家居和機器人領域。
云知聲
成立于2012年6月29日,一家智能語音識別AI技術企業,專注于物聯網人工智能服務。2018年7月,云知聲宣布已完成6億元人民幣C+輪融資,至此,云知聲C輪系列融資總金額已達13億元人民幣。
主要產品介紹:
面向物聯網的AI芯片UniOne,這是一款擁有自主知識產權和語音解決方案的物聯網AI芯片,也是面向AIoT(AI+IoT)的AI芯片;
基于該款芯片的智慧家居和智能音箱方案,該方案可以幫助客戶完成語音項目開發,加速客戶AI產品落地,同時為客戶定制AI語音模塊,快速量產。
出門問問
成立于2012年,一家以語音交互和軟硬結合為核心的人工智能公司,擁有自主研發的語音交互、智能推薦、計算機視覺及機器人SLAM技術。至2017年4月,出門問問共完成六輪融資,累計融資額超過2.55億美元。
主要產品介紹:
硬件產品包括:TicWatch系列、TicPods系列、TicKasa系列、TicBand、TicMirror、TicWear等,所有硬件都圍繞”出門問問”這款應用,它既是一款語音助手App也是連接所有硬件的核心。
聲智科技
成立于2016年,一家專注聲學前沿技術和人工智能交互的科技創新公司,提供從端到云的智能語音交互技術和服務方案,以及從芯片、模組、開發板到白牌產品的智能語音應用方案。
主要產品介紹:
SoundAIAzero,一款集成聲波配網、波束形成、聲源測向、噪聲抑制、混響消除、回聲消除、語音喚醒、端點檢測、語音識別、聲紋識別、語義理解、語音合成、雙工通話等全鏈條智能語音交互開發系統,兼容主流智能語音芯片和硬件架構,支持DuerOS、AliGenies、小愛平臺、騰訊叮當、Alexa等AI內容平臺;
SoundAI麥克風陣列芯片,支持USB的低功耗麥克風陣列芯片SAI101C;
SoundAI麥克風陣列模組,基于聲智科技麥克風陣列核心技術的軟硬一體化方案,實現全方向喚醒、聲源測向、定向拾音、噪聲抑制、混響消除、回聲抵消、語音識別、語義理解、聲紋識別、語音合成等功能,滿足用戶在語音交互領域的全方位需求。
捷通華聲
成立于2000年10月,是一家專注于智能語音、智能圖像、生物特征識別、智能語義等全方位人工智能技術研究與應用,全面發展人工智能云服務的高新技術企業。
主要產品介紹:
靈云開放平臺,合作伙伴可根據行業用戶實際應用場景,靈活挑選、組合應用多項項人工智能技術,嵌入到系統集成商的平臺中,可為各個行業的企業辦公自動化提供各種人工智能能力,實現智能化應用。
語音合成,應用靈云提供的TTS技術,實時、準確地將文本轉換為自然、流暢、清晰的語音;
語音識別,應用靈云提供的ASR技術,具備高識別準確率、高識別速度、領域模型可定制、支持多種處理模式等功能,同時具有SDK開發簡單、開發包資源占用小等優勢。
聲紋識別,應用靈云提供的VPR技術,通過對說話者語音和數據庫中登記的聲紋做比較,從而確定該說話人是否為本人,文成對用戶進行身份校驗和鑒別。
智能語音導航,基于靈云平臺應用靈云語音識別(ASR)、語音合成(TTS)、語義理解(NLU)等技術,允許電話呼入的客戶以開放的方式表述業務需求,系統將用戶的語音轉化為文本。
智能語音質檢,基于靈云平臺應用靈云語音識別(ASR)技術,將海量錄音數據進行智能化的自動語音轉文本、關鍵詞檢出、語速分析、靜音分析、情緒檢測等核心技術產品,可大大提高企業質檢效率、解決人工質檢局限性、提升服務質量與管理水平、降低企業運營成本,輔助業務經營決策。
SpeakIn
成立于2015年,一家全球領先的聲紋識別與身份安全人工智能公司,2018年5月SpeakIn及其全資子公司國音科技宣布完成近近億元人民幣融資,本輪融資由IDG資本領投。
主要產品介紹:
SpeakIn核心算法,使用目前學術界最前沿、基于深度學習聲紋識別技術,使用大數據訓練的深度神經網絡(DNN)能夠提取出更準確的說話人特征,擁有多種聲紋識別的前端音頻信號處理算法,極大的提高了準確度和魯棒性,確保聲紋提取和驗證的速度,并適應多種不同場景與應用的需求。
SpeakIn核心技術,包括活體檢測技術、情緒識別、人聲分離、性別識別、聲紋大數據檢索與比對、云平臺技術、動態聲紋數據庫技術、自研聲紋采集專用硬件、前瞻性研究等。
百度
主要產品介紹:
語音識別,通過場景識別優化,為車載導航,智能家居和社交聊天等行業提供語音解決方案;
長語音識別,在會議、教學或者媒體采訪中,長語音識別服務可快速準確的將長時間的語音轉化為文字,方便進行拷貝和編輯等后續的工作;
遠場語音識別,通過麥克風陣列前端處理算法,有效消除噪音,同時對目標說話人聲音進行增強,使得智能家居、智能硬件、機器人語音交互等場景下的遠場語音也可準確識別;
呼叫中心實時語音識別,通過MRCP或TCP協議進行低成本對接,將語音訊號轉化為文本流實時輸出。應用于智能客服,外呼機器人,實時電話質檢,電銷輔助機器人等場景;
呼叫中心音頻文件轉寫,可將電銷業務、客服業務、質檢業務等多場景的語音精準地轉為文字。
騰訊
語音識別,依托騰訊的語音技術,為開發者提供全面優質的語音轉文字功能。
長語音識別,依托騰訊的語音技術,為開發者提供全面優質的近場長段語音轉文字功能,目前支持漢語普通話,并涵蓋南北地域重口音。
關鍵詞檢索依托微信AI的語音技術,在給定關鍵詞文本列表的前提下,在音頻中精準定位出現了哪個或哪幾個關鍵詞、具體時間起止點以及置信度,比語音識別更高效。
語音合成,依托騰訊領先的語音技術和深度學習算法,為開發者提供全面優質的文字轉語音服務。
小米
小愛同學語音服務基于小米聲學實驗室、大數據及全生態建設,涵蓋語音、NLP、搜索推薦等技術,為開發者提供高效、便捷、智能的語音服務。小愛同學語音服務涵蓋影音視聽,實用工具,生活,知識教育,游戲趣玩,休閑娛樂,兒童等近百款自研精品技能及上千款第三方技能,且支持語音控制所有小米IoT設備。
總結
語音識別的最終目的是能夠真正的理解人類語言甚至是方言,過去幾年,人們在人工智能領域和深度學習領域的突破,讓語音識別取得了很大的進步,然而在方言識別方面,還極少公司取得比較矚目的成績,語言理解本身就是一個復雜的領域,期待未來能夠有更多突破。
更多精彩閱讀:
語音識別的兩個方法_語音識別的應用有哪些
語音識別的優缺點_語音識別功能介紹
語音識別算法有哪些_語音識別特征提取方法
怎么實現語音識別_手機語音識別怎么設置
語音識別設置能刪除嗎_語音識別系統工作流程
-
語音識別
+關注
關注
38文章
1687瀏覽量
112189 -
人工智能
+關注
關注
1787文章
45943瀏覽量
234490
發布評論請先 登錄
相關推薦
評論