5月27日消息,科大訊飛針對其訊飛智能錄音筆進行錄音、轉寫和編輯三大性能升級,新增支持聲源定位、12種方言和10種語種轉寫、支持智能摘要等13項功能,進一步為用戶帶來更便捷高效的錄音體驗。
去年5月,科大訊飛一槍打在了傳統錄音筆市場創新賽道上,推出業內首款帶屏錄音筆——訊飛智能錄音筆SR系列,直接催生了一個潛力不可小覷的新品類市場。
至今,SR系列已覆蓋媒體、商務、教育、律政等應用領域,進入全球115個國家、646座城市的市場,并拿下2019年雙11天貓&京東雙平臺錄音筆品類和單品銷售額第一的成績。
如今,隨著今年全國兩會如火如荼地召開,訊飛智能錄音筆亦成為人民網、文匯報、齊魯晚報、21世紀經濟報道4家媒體記者團,報道兩會的指定錄音筆,協助記者等專業團隊提高報道效率,更好地記錄民聲民意。
實現這一系列成果,訊飛智能錄音筆只花了一年。
在這背后,既是訊飛自2016年成立消費者事業群以來,在To C市場不斷摸索和布局,也是訊飛智能語音技術21年來的技術積累,在轉寫賽道上不斷研發創新。
在這個千萬級規模的錄音筆市場下,訊飛哪來的信心和底氣選擇以帶屏錄音筆殺入這個幾乎飽和,卻玩家擁擠的市場?自敲開錄音筆新品類市場后,訊飛在過去一年又取得了哪些重要的成績?市場又發生了哪些變化?
為此,智東西再度獨家對話科大訊飛聯合創始人&執行總裁胡郁、科大訊飛副總裁兼消費者事業群副總裁李傳剛,在直擊訊飛三大重磅升級的同時,進一步揭開這些答案的真實面紗。
一、三大升級亮點:支持超20種語言語種,遠程拾音準確率提升30%
“作為AI錄音筆的龍頭廠商,我們應該盡快讓用戶體驗到AI技術與錄音筆融合的真正效果。”胡郁談到,在過去一年,訊飛不斷地對錄音筆AI性能進行優化和升級,選擇在今天進行重要的三大升級,也是為了讓原有的錄音筆用戶率先體驗更新穎的智能化功能。
此次,訊飛智能錄音筆主要圍繞智能錄音、語音轉寫和智能編輯三個方面,進行13項重要升級,包括聲源定位、方言轉寫、語義分段、個人詞庫等功能。
1、智能錄音:360度聲源定位,準確率提升30%
針對錄音的專業性,訊飛智能錄音筆新增了錄音聲源定位、非人聲過濾和高增益降噪三項功能。
一是聲源定位,錄音筆能夠通過判斷聲源方位,實現更好的拾音效果;二是非人聲過濾,其與AI算法相配合,可將錄音中空白或嘈雜等無用聲去掉,保留有用人聲;三是高增益降噪,在5至15米的錄音范圍內,轉寫準確率提升30%,人聲也更加清晰。
2、語音轉寫:支持22種語言+語種,7大專業領域轉寫
這方面升級中的最大亮點在于新增了粵語、河南話、云南話和重慶話等12種方言轉寫,維吾爾語和藏語兩種少數民族語言轉寫,以及西班牙語、越南語、俄語、英語、日語和韓語等8種語種轉寫,進一步擴大錄音筆的語言應用場景。
同時,針對不同領域的專業術語轉寫,訊飛還更新了7大專業領域的轉寫支持,覆蓋IT科技、財經貿易、文化體育、醫療、政法、運營商和教育領域。同時,還新增中英文混合轉寫功能功能。
3、智能編輯:個性化詞庫,文字編輯更清晰
面對不同錄音場景、多個說話人和口語表達習慣,訊飛在智能編輯方面新增了智能語義分段、自動區分講話人、口語規整、個人詞庫和智能摘要5項功能,讓錄音筆能更智能地進行文字編輯。
例如,在區分講話人方面,錄音筆采用了訊飛的聲紋識別技術,能根據錄音及轉寫結果,自動區分并標注講話人。
“這次三大方面的功能升級,不僅能更加滿足消費者的需求和體驗,也更利于我們對市場的開拓和認知。”李傳剛說。
三大升級之于訊飛智能錄音筆,不僅是對產品性能和體驗的進一步豐富完善,提升訊飛在錄音筆新品類市場的優勢和競爭力,同時它之于錄音筆之上的訊飛消費者事業群,亦為其深入布局AI+辦公這一細分市場提供了新的技術儲備和解決方案。
“拳頭”升級,訊飛打響的帶屏智能錄音筆新戰局再度升溫。
二、21年深耕與積累,訊飛智能語音技術的硬核力量
羅馬并非一日建成。訊飛智能錄音筆能在短時間內站穩市場,并占據一定身位的領先優勢,是其長達21年的智能語音技術迭代和積累。
“過去幾年,我們的智能語音技術曾經歷了三次較大的革新與升級。”胡郁提到,這主要集中在語音識別、方言識別,以及多語種的錄音轉寫、翻譯上,而這些技術性能亦是訊飛大舉進攻細分市場的差異化競爭點。
在語音識別領域,訊飛語音識別模塊采用了基于深度全序列卷積神經網絡的語音識別框架,識別準確率達98%,同時還通過多麥克風陣列去混響和多麥克風波束成形,進一步提升信噪比。如今,其麥克風陣列與錄音筆回傳的數據進行疊加后,能夠在幾十米的范圍內獲得更好的拾音效果。
在多語言識別領域,不管是中國方言的識別,還是全球多語種的錄音轉寫和翻譯,訊飛都下足了功夫。
簡單地說,針對方言識別,訊飛采用統一的建模技術,通過少量的方言數據,進一步提升錄音筆在方言語境場景的錄音效果;另一方面,訊飛通過語音識別技術的不斷研發和優化,將多語種的轉寫和翻譯性能效果都實現了提升。
尤其在多語言識別方面,胡郁透露,目前中國科學院專門支持中國科學技術大學開展了一項多語識別先導項目,目標研發超過50個語種以上的核心技術,涉及語音識別、語音合成以及自然語言處理等技術。
“這是目前國內投資規模最大的多語種研發項目,現階段還沒有任何一家公司有這樣的資源和能力,對這種規模的多語種系統進行研發。”胡郁談到,這將進一步促進訊飛在多語言技術領域的研究。
如今,訊飛智能錄音筆的研發團隊已突破百人規模,包括硬件、軟件、UI交互等均由訊飛的核心研發力量設計。
值得一提的是,隨著訊飛在智能語音領域長達21年的布局和深耕,已打下了堅實的技術根基,技術儲備力量不斷豐富。
其中以語音識別技術為例,早在2016年,訊飛就已在國際多通道語音分離和識別大賽CHiME-4中,一鼓作氣拿下了三個項目第一。在2020年CHiME-6上,訊飛不僅在給定說話人邊界的多通道語音識別任務中奪冠,更刷新了自己在CHiME-5中的語音識別錯誤率記錄,從46.1%降至30.5%。
這二十余年的技術成果與積累,無疑為訊飛敲開錄音筆市場新品類的大門,帶來了十足的信心與底氣。
三、打響帶屏錄音筆市場第一槍,技術融合下的小爆發
一面是人工智能不斷賦能各行各業的技術浪潮,一面是當下傳統錄音筆和錄音技術的轉寫痛點,訊飛澆灌了21年的智能語音技術,終于在帶屏錄音筆這塊新市場中破了土,發了芽。
訊飛入局錄音筆市場的第一槍,為何瞄準了帶屏錄音筆?
“加入訊飛前我就在想,AI作為未來的一個技術發展方向,除了在手機、智能穿戴設備和智能音箱等智能硬件方面賦能,還能在哪里找到突破口?”李傳剛談到,作為北大MBA的導師,他經常到北大與學生們進行案例討論,當時他發現,學生幾乎人手備有一個傳統錄音筆,主要用在對知識的記錄與鞏固上。
但問題是,他們常常需要自己再花時間重復聽一遍錄音,才能將內容記錄下來。這一大量的時間和人力成本,讓李傳剛抓到了新的突破口——傳統錄音筆與AI的技術融合。
在與胡郁進行了一番溝通后,李傳剛發現訊飛也正在考慮這一方向,兩人一拍即合。經歷將近半年的硬件研發與打磨,2019年5月,訊飛智能錄音筆SR系列終于面世。
一石激起千層浪,SR系列的推出直接點燃了傳統錄音筆市場的熱情。
一方面,訊飛智能錄音筆SR系列一上市,就在2019年京東“618”中獲得錄音筆品類成交金額第一的成績,目前已進駐全國超2000家線下門店;另一方面,現階段SR系列也已拓展至國際市場,進入全球115個國家,646個城市中銷售。
“訊飛智能錄音筆SR系列最大的創新性并不在于帶屏,而在于將它是一個獨立的智能錄音設備。”在胡郁看來,在不同的場合下,用戶對錄音筆的心理依賴程度不同。
一個單獨的錄音筆,并不會像手機錄音軟件一樣受到各種干擾,它能持續獨立地使用,同時又能通過統一的賬號在手機和PC上進行后臺處理。基于后臺操作的需求,才進而衍生出大屏的需求,讓用戶的操作更加便捷。“一個獨立的能夠進行智能轉寫的設備,這才是它的顛覆性所在。”胡郁說。
隨著訊飛智能錄音筆SR系列的推出,訊飛消費者事業部的智能硬件產品線得到了很大的豐富。除了SR系列智能錄音筆外,訊飛聽見系列也正逐步朝更大的市場邁進,同時與錄音轉寫相關的硬件設備也在預期中迅速增長。
在此影響下,訊飛的AI廣告和內容服務業務,以及與政府、國企之間的業務也在加速發展。據科大訊飛2019年財報,在2019年度,訊飛的營收首次突破100億人民幣,達到100.79億元,同比增長27.30%。其中,消費者業務營收36.25億人民幣,同比增長43.99%,占總營收比進一步攀升至35.96%。
To B+To C的雙線戰略驅動下,訊飛正加速發展。
四、創新=藍海,訊飛消費者業務的三駕馬車
從一支小小的錄音筆,到如今多了一塊屏幕與AI技術協同發展成一個新品類,在訊飛智能錄音筆SR系列推出后的短短一年內,錄音筆市場經歷了翻天覆地的變化。
“對于整個錄音筆市場來說,我們打開的并不是一個存量市場,而是一個新的增量市場。”李傳剛說。
一面是整個行業在思考錄音筆市場的未來走向,不斷解決消費者的多樣化轉寫需求;一面是傳統玩家與新玩家攜手,共同建立產業聯盟,以加速推進包括轉寫技術、智能語音識別技術在傳統錄音筆中的融合發展。
隨著玩家的不斷轉型和創新發展,又將會給訊飛帶來哪些挑戰?
“整體上看,更多玩家的加入我覺的是一件好事。”胡郁談到,由于現在從傳統錄音筆向智能錄音筆轉換的過程中,最大的障礙仍然是用戶教育——如何讓用戶意識到使用智能錄音筆更有價值。
盡管訊飛開拓了新的錄音筆品類市場,但縱觀整個產業的發展,它仍是一個螺旋式上升的過程,智能化發展也將是這一產業逐漸演變的方向。在這一過程中,既要靠消費者消費習慣的轉變,也需要靠傳統錄音筆廠商自身的轉型推動。
“不管有多少玩家加入,訊飛在這市場中仍是一個龍頭地位。”胡郁說,訊飛非常有信心在這個市場中持續保持自己的領先優勢,這一信心也來自于訊飛所提供的多樣性服務,例如面向政府部門的會議寶,以及涉及面向教育、商務和律政等應用場景下的智能硬件產品。
據產業研究機構新思界最新發布的《2019-2023年錄音筆行業深度市場調研及投資策略建議報告》,2018年,我國錄音筆行業的產量約為452.12萬臺,出貨量與2017年的431.97萬臺基本持平。
整體來看,我國錄音筆市場出貨量較為穩定,市場規模仍較小。那么,在這之下的AI+錄音筆市場又將如何發展呢?
“創新永遠是藍海。”李傳剛談到,傳統錄音筆市場的需求在過去二、三十年并未產生太大變化,但隨著AI技術的賦能,錄音筆除了錄音之外,還將具有智能轉寫、智能翻譯和智能編輯等更多功能,市場規模也將進一步擴大,激發出更多原有錄音技術不足而未開發的市場。
市場仍在潛滋暗長,科大訊飛的下一步在哪里?
縱觀訊飛的消費者事業群,胡郁談到,訊飛將持續以平臺(iFLYOS操作系統)、硬件(智能硬件)、服務(廣告和運營商互聯網服務)為發展重心,進一步拉動“AI+翻譯”、“AI+辦公”、“AI+教育”三駕馬車同時往前走。
往后看,是訊飛在智能語音領域長達21年的技術基因和積累;往前看,是訊飛在AI技術熱潮下敢于嘗試技術跨界與融合創新的信心和勇氣。
結語:以AI為刃,傳統錄音筆市場的創新與變革
回顧智能錄音筆市場過去一年的發展,科大訊飛按下的,不僅是自身消費者業務加速布局智能市場的“快進鍵”,也是錄音筆行業與AI技術跨界融合下催生新市場的“啟動鍵”。在這一節點下,訊飛智能錄音筆三大技術的升級,也將為公司以及市場競爭的發展添加新的差異化競爭優勢。
談及智能錄音筆的未來,胡郁認為將有兩條路,一是與手機APP等結合,朝著極簡的方向發展,二是向更高端、更專業的定制化獨立設備前進。這條路究竟走向何方,我們尚不得而知。
但我們能看到的是,在當下傳統錄音筆結合新興技術的轉型下,有越來越多的玩家投入這片藍海市場,他們單打獨斗也好,互相結盟也罷,同一個目標無疑都是搶下這塊蛋糕。在這場愈發激烈的長跑賽道上,最終誰將真正拔得頭籌?我們拭目以待。
責任編輯:gt
-
AI
+關注
關注
87文章
30172瀏覽量
268432 -
科大訊飛
+關注
關注
19文章
789瀏覽量
61187 -
智能音箱
+關注
關注
31文章
1783瀏覽量
78499
發布評論請先 登錄
相關推薦
評論