說到聲音,你會想到什么?是人講話的聲音、汽車發動機啟動時發出的轟鳴聲,還是手指敲擊鍵盤的陣陣窸窣聲?每天縈繞于人耳的聲音其實是包羅萬象的,有關聲音的學問也與人工智能領域有著密不可分的關系。
“人耳能聽到的聲音大體上可以為幾種。”北科瑞聲科技股份有限公司副總經理黃石磊告訴《中國電子報》記者,“第一類聲音是人們日常說話的聲音,即語音;第二類是音樂;第三類聲音分別是自然界、城市生產生活中產生的聲音。這三者我們通常也稱為廣義的音頻。”所有的聲音都蘊藏著“智慧”的要義,智能系統通過機器感知技術可以實現聲音采集、識別和理解等信息處理,也可以利用更加復雜的技術進行分析,最終實現人機對話、智能判析和決策。作為人工智能產業鏈的重要細分領域之一,智能音頻處理也因此有了賦能千行百業的力量。
智能語音技術大有可為
現階段,我們正處在一個信息爆炸的時代,每個行業的發展都會產生海量的信息。正是這些浩如煙海的信息,構成了非常專業和復雜的系統。要想在這個復雜的系統下將業務流程做到標準化和規范化,智能語音的應用就顯得尤為關鍵。
“語音是人們一種最自然的交互方式,它有非接觸、可穿透等特性。”北科瑞聲科技股份有限公司總經理助理汪雪說,“基于它的特性,語音是賦能傳統行業最好的方式之一。”
汪雪表示,智能語音的應用十分自然,可以賦能非常多的應用場景。在看到智能語音市場中存在的發展機遇后,北科瑞聲選擇了智能音頻賽道,專注于人工智能語音音頻信息處理,目前已成為國內擁有全鏈條語音技術的人工智能企業。
與國外的Nuance、谷歌、蘋果、微軟和國內的科大訊飛、百度、小i機器人等眾多擁有全棧技術的智能語音企業不同,北科瑞聲對垂直領域進行了定制化研發,更多專注于與特定行業結合的智能語音技術,產品應用也面向醫療、政務和交通等特定行業。黃石磊以醫療行業為例向記者表示,運用智能語音技術可以讓每位醫務工作者都擁有一個自動化語音小助手,這個語音小助手能夠聽懂他講話,并在必要時給他提供幫助。
“各行業業務流程的信息化和規范化會涉及很多重復的工作,而通過智能化的手段可以自動完成這些重復的工作。”黃石磊對記者說,“這能夠大大提升專業工作人員的效率。”
例如在醫療信息化應用中,目前北科瑞聲正在布局的醫療行業面臨真實環境帶來的難題。黃石磊談道,除了人發出的聲音以外,周圍環境的人和各種設備都會產生聲音。他表示,當這些聲音混在一起,就會讓人們關注的聲音難以被處理。“醫院中的環境是非常嘈雜的,(在這種情況下進行語音處理)其實是對現有技術的一大考驗。”黃石磊說。
又比如,當前信息化建設的提速也讓工業互聯網屢次成為業內關注的焦點。在采訪過程中,黃石磊特別強調了智能音頻在工業互聯網領域的應用情況。他表示,工業互聯網涉及包括音頻處理在內的信號處理技術,基于語音的人機交互可以應用于人和設備的交互過程中,還可以在針對非語音實現從智能語音到智能音頻的擴展。但是目前,工業領域是一個充滿噪聲、混響、回聲等相對復雜因素的場景,智能語音、只能音頻技術在工業領域的賦能效果尚不明顯,落地場景也有待拓寬。很多企業礙于高成本和低收益,智能化轉型動力不足。作為行業伙伴的賦能者,北科瑞聲將對該領域進行更為深入的布局。
共性挑戰亟待突破
不同的應用場景會產生不同的數據和需求,比如在語音識別等場景中,用戶的需求正在不斷涌現、提升。然而,很多的智能音頻處理產品的應用和功能仍具有一定邊界,只能在理想的環境條件中發揮作用。
智能音頻處理行業的發展一波三折,在整個行業的發展過程中,深耕垂直領域和特定行業的北科瑞聲也遇到了很多企業都在面臨的共性挑戰。在黃石磊看來,第一個挑戰就來源于不同行業間的行業知識的壁壘。每一個行業都有自己獨特的符號體系和術語體系。對智能語音產品來講,要想游刃有余地在不同行業中理解并識別各種紛繁復雜的音頻信息,是比較困難的一件事。“就像人一樣,當我們從一個行業跑到另一個行業,我們也會發現自己完全聽不懂或者不理解新行業中的一些術語。”黃石磊對記者說。
第二個挑戰在于目前機器與人對語音語言理解的能力差異。黃石磊表示,人類具備抽象表達的能力,也具備察言觀色的能力。人類的語言會涉及一些隱含的意思和抽象的表達,但機器在這些方面還遠遠達不到人類理解能力。
最后一個挑戰來自于數據的獲取,這也是“先有雞還是先有蛋”的問題。黃石磊說,發展智能音頻處理行業需要先獲得語音數據,但通常只有進入到這個行業中并得到用戶認可后才能獲得數據。“理想情況下,還是應該先獲得數據。”他說,“從商業模式和技術的角度來看,(數據的獲取)是一個挑戰。”
針對如何克服這些困難,黃石磊也給出了自己的建議。他認為,從公司的角度來講,還是應該專注于核心技術的研發,比如在核心技術能力方面提供一些具體的產品形態。此外,他還特別提到要找一些已經在行業深耕的合作伙伴,進行協同發展。
就像站在巨人的肩膀上可以看得更遠,與合作伙伴的配合也可以加速公司對智能音頻對各個行業的理解。由于在整個行業中扮演的是一個“被集成者”的角色,北科瑞聲在尋找行業合作伙伴時相對而言更具優勢。黃石磊表示,合作伙伴在某些領域有一定技術和客戶基礎,公司可以借助合作伙伴已有的基礎,更快地融入到行業中去,為行業客戶提升價值,最終實現行業客戶、行業產品提供方和公司的三方共贏。
責任編輯:lq
-
自動化
+關注
關注
29文章
5512瀏覽量
79103 -
人工智能
+關注
關注
1791文章
46858瀏覽量
237552 -
智能語音
+關注
關注
10文章
781瀏覽量
48709
原文標題:北科瑞聲:智能音頻提升空間巨大
文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論