精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習將對音頻處理產生深遠影響 亞馬遜團隊深度噪聲抑制挑戰賽中獲勝

LiveVideoStack ? 來源:LiveVideoStack ? 作者:LiveVideoStack ? 2020-09-08 09:13 ? 次閱讀

該團隊的非實時系統是性能最好的,而它的實時系統在整個系統中排名第三,在實時系統中排名第二,盡管只使用了4%的CPU核心。

文 / Arvindh Krishnaswamy 原文鏈接: https://www.amazon.science/blog/amazon-team-takes-first-place-in-interspeech-2020-deep-noise-suppression-challenge

電子語音通信中,噪音和混響不僅會損害語音清晰度,而且會導致聽者在長時間努力理解低質量語音時感到疲勞。在COVID-19大流行期間,我們花在遠程會議上的時間越來越多,這一問題比以往任何時候都更加重要。 在今年的Interspeech會議上的深度噪聲抑制挑戰便是為了幫助解決這個問題的一個嘗試,分別在實時語音增強和非實時語音增強上進行比賽。在19個團隊中,Amazon取得了最好的結果,在非實時賽道上獲得了第一名(階段1 |階段2-final),在實時賽道上獲得了第二名。

上面是一個有噪聲的語音樣本(上圖) 下面是被研究者的系統抑制了噪聲的同一個樣本(下圖) 為了滿足真實世界的需求,我們將實時輸入限制在CPU使用量的4%(在i7-8565U內核上測量),這遠遠低于競賽所允許的最大限度。 然而,我們的實時輸入非常接近(0.03平均意見分數)的第一名,并且擊敗了其他非實時的輸入。 Amazon團隊實時和非實時噪聲抑制結果的音頻示例可以在這里找到。 我們還發表了兩篇論文(paper1-offline | paper2-real)來更詳細地描述我們的技術方法。 在Interspeech中獲勝的技術已經在Alexa通信公告和Drop in Everywhere功能中發布,并且從今天開始,我們的客戶也可以通過使用Amazon Chime蘋果macOS和微軟Windows客戶端來進行視頻會議和在線會議。

優化的感知 傳統的語音增強算法使用人工調整的語音和噪聲模型,通常假設噪聲是恒定的。 對于某些類型的噪音(例如汽車噪音),在噪音不太大或低混響的環境下,這種方法工作得相當好。不幸的是,它們經常在非平穩噪音上失敗,比如鍵盤噪音和雜音。因此,研究人員轉向了深度學習方法。

語音增強不僅需要從噪音和混響中提取原始語音,而且需要以一種人類耳朵感覺自然和愉快的方式進行。這使得自動回歸測試變得困難,并使深度學習語音增強系統的設計復雜化。 我們的實時系統實際上通過直接優化了語音的感知特征(spectral envelope and voicing),利用了人類的感知因素同時忽略了與感知無關的方面。由此產生的算法產生了最先進的語音質量,同時保持非常高的計算效率。 對于非實時系統,我們采取了一種不妥協的方法,使用改進的U-Net深度卷積網絡從增強的語音壓縮每一點可能的質量,從而贏得了輸入挑戰。

一描繪經被允許使用的研究人員的實時系統的百分比中央處理器核心降噪后的一語音樣本的平均意見分數(MOS)的變化的圖像 在深度噪聲抑制的挑戰中,經過處理的音頻示例被盲發送給人類聽眾,由他們對其進行評分,產生平均意見分數(MOS)。 在實時應用程序中,復雜性和質量之間總是需要權衡的。 右邊的圖顯示了我們如何通過增加CPU需求來進一步提高實時提交的質量,或者通過犧牲一些質量來進一步節省CPU的使用。 紅點表示提交挑戰的實時系統,圖像顯示了MOS分數相對于不同CPU負載的變化。

人們普遍認為,深度學習最終將對音頻處理產生深遠影響。 雖然仍有很多挑戰,比如數據增強,感知相關的損失函數或者處理看不見的情況,但未來依然非常令人興奮。

原文標題:亞馬遜團隊在Interspeech 2020深度噪聲抑制挑戰賽中獲得第一名

文章出處:【微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10825

    瀏覽量

    211150
  • MOS
    MOS
    +關注

    關注

    32

    文章

    1247

    瀏覽量

    93477
  • 噪音
    +關注

    關注

    1

    文章

    169

    瀏覽量

    23879
  • 亞馬遜
    +關注

    關注

    8

    文章

    2625

    瀏覽量

    83192
  • 深度學習
    +關注

    關注

    73

    文章

    5492

    瀏覽量

    120977

原文標題:亞馬遜團隊在Interspeech 2020深度噪聲抑制挑戰賽中獲得第一名

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    GPU在深度學習的應用 GPUs在圖形設計的作用

    隨著人工智能技術的飛速發展,深度學習作為其核心部分,已經成為推動技術進步的重要力量。GPU(圖形處理單元)在深度學習
    的頭像 發表于 11-19 10:55 ?244次閱讀

    深度學習RNN的優勢與挑戰

    循環神經網絡(RNN)是深度學習領域中處理序列數據的基石。它們通過在每個時間步長上循環傳遞信息,使得網絡能夠捕捉時間序列數據的長期依賴關系。然而,盡管RNN在某些任務上表現出色,它們
    的頭像 發表于 11-15 09:55 ?165次閱讀

    NPU在深度學習的應用

    設計的硬件加速器,它在深度學習的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優化的
    的頭像 發表于 11-14 15:17 ?297次閱讀

    GPU深度學習應用案例

    GPU在深度學習的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是深度
    的頭像 發表于 10-27 11:13 ?328次閱讀

    AI深度噪音抑制技術

    AI深度噪音抑制技術通過深度學習算法實現了對音頻噪聲
    的頭像 發表于 10-17 10:45 ?376次閱讀
    AI<b class='flag-5'>深度</b>噪音<b class='flag-5'>抑制</b>技術

    FPGA做深度學習能走多遠?

    的發展前景較為廣闊,但也面臨一些挑戰。以下是一些關于 FPGA 在深度學習應用前景的觀點,僅供參考: ? 優勢方面: ? 高度定制化的計算架構:FPGA 可以根據
    發表于 09-27 20:53

    深度學習算法在集成電路測試的應用

    隨著半導體技術的快速發展,集成電路(IC)的復雜性和集成度不斷提高,對測試技術的要求也日益增加。深度學習算法作為一種強大的數據處理和模式識別工具,在集成電路測試領域展現出了巨大的應用潛力。本文將從
    的頭像 發表于 07-15 09:48 ?792次閱讀

    深度學習的時間序列分類方法

    的發展,基于深度學習的TSC方法逐漸展現出其強大的自動特征提取和分類能力。本文將從多個角度對深度學習在時間序列分類的應用進行綜述,探討常用
    的頭像 發表于 07-09 15:54 ?707次閱讀

    深度學習的無監督學習方法綜述

    深度學習作為機器學習領域的一個重要分支,近年來在多個領域取得了顯著的成果,特別是在圖像識別、語音識別、自然語言處理等領域。然而,深度
    的頭像 發表于 07-09 10:50 ?513次閱讀

    深度學習的模型權重

    深度學習這一充滿無限可能性的領域中,模型權重(Weights)作為其核心組成部分,扮演著至關重要的角色。它們不僅是模型學習的基石,更是模型智能的源泉。本文將從模型權重的定義、作用、優化、管理以及應用等多個方面,深入探討
    的頭像 發表于 07-04 11:49 ?948次閱讀

    深度學習的模型優化與調試方法

    深度學習模型在訓練過程,往往會遇到各種問題和挑戰,如過擬合、欠擬合、梯度消失或爆炸等。因此,對深度學習
    的頭像 發表于 07-01 11:41 ?700次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮,機器學習深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發表于 07-01 11:40 ?1192次閱讀

    谷歌CEO皮查伊探討AI革命:影響深遠,AI將融入日常工作

    在訪談,主持人首先詢問皮查伊為何選擇使用谷歌的AI,他回應稱,AI將對我們的生活產生深遠影響。“AI的應用多種多樣,能提升用戶體驗,簡化工作流程,還能與AI進行
    的頭像 發表于 05-28 15:00 ?553次閱讀

    FPGA在深度學習應用或將取代GPU

    ,這使其在 AI 應用面臨著一些挑戰。 Larzul 表示,想要解決這些問題的解決方案便是實現現場可編程門陣列 (FPGA),這也是他們公司的研究領域。FPGA 是一種處理器,可以在制造后定制
    發表于 03-21 15:19

    GPU在深度學習的應用與優勢

    學習究竟擔當了什么樣的角色?又有哪些優勢呢?一、GPU加速深度學習訓練并行處理GPU的核心理念在于并行
    的頭像 發表于 12-06 08:27 ?1209次閱讀
    GPU在<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>中</b>的應用與優勢