12月20日,OPPO年度重磅音頻類產品OPPOEncoFree真無線耳機媒體溝通會在北京舉行。官方宣稱,該耳機是承載了OPPO聲學基因和技術沉淀的又一力作,不僅具備高音質、低延遲的賣點,同時采用了業內先進的通話降噪AI算法技術。在硬件上,則使用了雙麥克風波束成形,通過軟硬協同對噪音進行屏蔽處理。其中,通過機器深度學習技術,AI算法通過對常見噪聲的功率圖譜分析,自動識別并分離噪聲和人聲,就算面臨嘈雜的環境,對方也能聽清通話內容,輕松自如交談。
近一兩年,隨著與智能手機協同使用的場景不斷增多,消費者越來越關注TWS耳機的通話質量。作為用戶的網友們甚至發聲:耳機音質好已經是標配,無線通話降噪才是真本事!在生活里多樣的通話場景中,往往充斥著各種嘈雜的噪聲,如何給用戶提供一個高質量的通話,成為了各大TWS耳機廠商面臨的攻堅課題。
OPPOEncoFree真無線耳機就采用了智能聽覺領域的創新公司——聲加科技的SVEAI雙麥降噪技術,是在傳統雙麥降噪的基礎之上加入了深度神經網絡,通過深度神經網絡與雙麥克風波束成形技術的強強結合,把業界非常棘手的尖銳噪音抑制的更加干凈,例如現實生活中頻繁刺耳的敲擊聲、地鐵進站的剎車聲、工地噪聲、汽笛聲等,使得OPPOEncoFree通話降噪水平達到了令人振奮的新高度。
目前基于傳統信號處理的兩麥陣列方案,是通過波束成形的原理讓麥克風拾取指定方向的目標語音信號,然后利用其空間信息削弱非語音方向的干擾噪聲。這種方案對于尖銳的高頻噪音的處理效果始終不盡人意。
為了使用戶在各種噪聲環境下都可以輕松暢聊,聲加科技潛心研發了SVE AI雙麥降噪方案。此方案融合了雙麥降噪與深度神經網絡降噪模型,在訓練集加入不同場景的噪聲,通過深度神經網絡進行語音增強,把尖銳的高頻噪聲抑制得更干凈。
SVE AI開啟前后對比(地鐵場景):
創新賦能:雙麥降噪+深度神經網絡
得益于團隊成員在通信聲學核心技術上十五年的經驗積累,聲加科技創新性地開發了SVE AI雙麥降噪技術,充分利用了麥克風信號的時域、頻域、空間域以及樣本空間中的統計信息的差異性進行語音增強,為通信終端提供高品質的語音信號。
在算法開發階段,聲加科技發現,單純利用深度神經網絡進行語音增強的方案存在局限性。對比手機、平板等高運算力設備,TWS耳機這類可穿戴設備受限于極其有限的電池與運算能力弱的藍牙芯片,深度神經網絡模型也做的比較小,導致泛化能力不足。然而現實中的噪聲環境是極其復雜的,一旦在復雜聲學場景下算法運算失效,會出現吃語音,再混進周圍干擾語音,背景噪聲起伏等問題,讓語音可懂度急劇下降,嚴重影響用戶的語音通話。
為了解決上述問題,聲加科技在雙麥降噪基礎上,融合了深度神經網絡,補充了聲波的空間信息,還利用深度神經網絡對高頻噪聲作為訓練集,把對語音通話的干擾抑制的更干凈。在將二者的優點融合,短板互補后,使得算法對于任何環境均保證穩定而一致的性能。不僅通話品質通過了嚴格的測試,表現優異,其穩定而深度的降噪效果在主觀體驗上也得到了OPPO的青睞。
專注通信聲學核心技術提供全場景語音交互技術方案
聲加科技是依托于中科院聲學所雄厚的人才和科研資源,打造產學研一體化的創新型創業公司。團隊專注于通信聲學核心技術,為B端客戶提供復雜場景下的近場、中場、遠場語音交互技術方案,以及從芯片、模組、PCBA到工業設計的一站式產品方案。憑借在聲學和語音領域的十余年的技術積累,其回聲抵消、噪聲抑制、聲源定位、混響消除、波束形成、語音喚醒等核心技術在行業內一直處于領先水平。
在TWS耳機領域,聲加科技目前已完成了單麥通話降噪、雙麥通話降噪、三麥通話降噪、雙麥+AI通話降噪、FBmic+雙麥的多傳感器融合方案、低功耗關鍵詞喚醒/有限命令詞方案等多個方案的應用落地。應用產品除了本次發布的OPPO ENCO FREE,還有華為、小米、萬魔等的多款明星產品。
最后,聲加科技表示,未來還將為客戶提供模組、芯片等多種形態的產品,為人與人通信、人與機器交互提供更清晰、更舒適、更自由的使用體驗,最終實現人機完全交融的愿景。
發布評論請先 登錄
相關推薦
評論