語音轉寫,也叫音頻文件轉寫,是指批量將音頻文件(5小時以內)轉換成文本數據,適用于語音質檢、會議訪談等場景。
語音轉寫與語音聽寫的區別主要體現在「支持的音頻時長上」,語音轉寫支持的音頻時長是在五小時以內,語音聽寫支持的音頻時長是在一分鐘以內。因此,兩者的使用場景也略有不同,語音轉寫更多應用于貼近日常的對話、演講等長文本場景,而語音聽寫則主要應用于人機對話、輸入法、語音搜素等短文本場景。
目前,國內提供語音轉寫技術的廠商主要有:
1、科大訊飛
成立于1999年,2008年,公司在深圳證券交易所掛牌上市(股票代碼:002230)。一直深耕在人工智能領域,技術很全也很綜合,多次在語音識別、語音合成、機器翻譯、圖文識別、圖像理解、閱讀理解、機器推理等各項國際評測中取得佳績。
在語音轉寫上,通用語音識別率98%(注:安徽電子產品監督檢驗所檢測,報告編號151209010027),支持中文、英文、中英混合識別。支持12種方言,8種外語,2中民族語言,可提供公有云接口及私有化部署方案。
2、騰訊云
在語音轉寫上,字準率97%,與微信、王者榮耀的語音轉文字使用一套服務。支持中文普通話、英語。支持2種方言,4種外語,后續將陸續開放其他語種和方言的識別能力。
3、百度智能云
百度智能云致力于為企業和開發者提供全球領先的人工智能、大數據和云計算服務。
在語音轉寫上,近場中文普通話識別準確率達98%。支持普通話和略帶口音的中文識別,支持英文識別。
4、云知聲
2012年6月創立于北京,是國內頭部人工智能獨角獸企業。
在語音轉寫上,準確率可達實用標準,適用于會議轉寫、字幕生成、音頻內容分析等場景。
5、思必馳
07年創立于英國劍橋,08年回國落戶蘇州,12年完成A輪融資,是國內專業的對話式人工智能平臺公司,擁有全鏈路的智能語音語言技術。
在長語音識別轉寫上,覆蓋中文、英文、葡萄牙語等語種,粵、川、滬等方言,以及帶方言的普通話。云端連續實時語音識別率>97%。
審核編輯:符乾江
-
語音識別
+關注
關注
38文章
1724瀏覽量
112549 -
人工智能
+關注
關注
1791文章
46872瀏覽量
237598
發布評論請先 登錄
相關推薦
評論