精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種用于音樂源分離的新型深度學習系統

倩倩 ? 來源:互聯網分析沙龍 ? 2020-03-22 15:46 ? 次閱讀

Facebook Research最近發布了Demucs,這是一種用于音樂源分離的新型深度學習系統。根據人類對分離后聲音總體質量的評估,Demucs的性能優于先前報道的結果。

音樂源分離是經過大量研究的一種應用,稱為盲源分離。該過程包括在不借助元信息的情況下從一組混合信號中分離出一組源信號。對于音樂,各個組成部分可能包括人聲或其他樂器軌道。當空中交通管制員開始在單個揚聲器上聽到多個飛行員的混合聲音時出現問題時,源分離領域首先受到了廣泛關注。這導致英國科學家科林·切里(Colin Cherry)在1953年將這種效應稱為“雞尾酒會問題”。

在源分離領域的現有研究的推動下,研究科學家于2000年代初開始使用AI分離音樂中的聲音。如今,短時傅立葉變換產生的頻譜圖(STFT)是最新音樂源分離的核心。這些系統在每個幀和每個源的幅度譜上產生一個掩碼,并且通過在掩碼頻譜圖上運行逆STFT的同時重新使用輸入混合相位,來生成輸出音頻

建立在頻譜圖分析基礎上的系統在諸如中音鋼琴或連奏小提琴之類的樂器的源分離方面表現出色,因為它們可以產生一致的頻率和振鈴。但是,這些系統很難隔離敲擊聲音,因為敲擊樂器所產生的殘留噪聲會產生更寬的頻率范圍,并且當與多個樂器的重疊相結合時,信息就會丟失,并且掩蓋操作將使信息不再可逆。

Demucs是一種深度學習模型,可直接對原始輸入波形進行操作并為每個源生成一個波形。U-net體系結構使用卷積編碼器和解碼器,該解碼器和解碼器基于跨步卷積較大的步幅。波形模型的工作方式與常見的計算機視覺模型相似,因為它們都使用神經網絡在推斷更高級別的模式之前先檢測基本模式。

基于頻譜圖的模型優于Wave-U-Net,后者是Demucs之前最先進的基于波形的模型。Demucs建立在Wave-U-Net體系結構的基礎上,具有可調整的超參數和較長的短期內存,允許網絡處理整個數據序列,而不是單個數據點。

這些改進幫助系統解決了一個聲音超過另一個聲音的問題,因為解碼器足夠聰明,可以填充柔和的音符。

人類在MusDB數據集上評估Demucs,并將其與其他最新的源分離系統的結果進行比較。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 傅立葉變換
    +關注

    關注

    3

    文章

    99

    瀏覽量

    32351
  • 深度學習
    +關注

    關注

    73

    文章

    5492

    瀏覽量

    120977
收藏 人收藏

    評論

    相關推薦

    NPU在深度學習中的應用

    設計的硬件加速器,它在深度學習中的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優化的處理器,它與傳統的CPU和G
    的頭像 發表于 11-14 15:17 ?297次閱讀

    pcie在深度學習中的應用

    與主機系統連接,提供必要的計算支持。 2. PCIe技術概述 PCIe是一種點對點串行連接,用于計算機內部硬件組件之間的連接。它以其高速數據傳輸能力和低延遲特性而聞名,是連接高性能硬件(如GPU)的理想選擇。 高速數據傳輸 :P
    的頭像 發表于 11-13 10:39 ?288次閱讀

    一種基于深度學習的二維拉曼光譜算法

    近日,天津大學精密儀器與光電子工程學院的光子芯片實驗室提出了一種基于深度學習的二維拉曼光譜算法,成果以“Rapid and accurate bacteria identification
    的頭像 發表于 11-07 09:08 ?130次閱讀
    <b class='flag-5'>一種</b>基于<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的二維拉曼光譜算法

    GPU深度學習應用案例

    能力,可以顯著提高圖像識別模型的訓練速度和準確性。例如,在人臉識別、自動駕駛等領域,GPU被廣泛應用于加速深度學習模型的訓練和推理過程。 二、自然語言處理 自然語言處理(NLP)是深度
    的頭像 發表于 10-27 11:13 ?328次閱讀

    一種新型電流模式控制集成電路

    電子發燒友網站提供《一種新型電流模式控制集成電路.pdf》資料免費下載
    發表于 10-24 10:20 ?0次下載
    <b class='flag-5'>一種</b><b class='flag-5'>新型</b>電流模式控制集成電路

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 深度學習是AI大模型的基礎 技術支撐 :
    的頭像 發表于 10-23 15:25 ?374次閱讀

    PyTorch深度學習開發環境搭建指南

    PyTorch作為一種流行的深度學習框架,其開發環境的搭建對于深度學習研究者和開發者來說至關重要。在Windows操作
    的頭像 發表于 07-16 18:29 ?838次閱讀

    深度學習中的時間序列分類方法

    時間序列分類(Time Series Classification, TSC)是機器學習深度學習領域的重要任務之,廣泛應用于人體活動識別
    的頭像 發表于 07-09 15:54 ?707次閱讀

    深度學習與nlp的區別在哪

    深度學習和自然語言處理(NLP)是計算機科學領域中兩個非常重要的研究方向。它們之間既有聯系,也有區別。本文將介紹深度學習與NLP的區別。 深度
    的頭像 發表于 07-05 09:47 ?814次閱讀

    深度學習常用的Python庫

    深度學習作為人工智能的個重要分支,通過模擬人類大腦中的神經網絡來解決復雜問題。Python作為一種流行的編程語言,憑借其簡潔的語法和豐富的庫支持,成為了
    的頭像 發表于 07-03 16:04 ?568次閱讀

    基于深度學習的鳥類聲音識別系統

    的泛化能力,然后提出了個輕量級的鳥類聲音識別模型,以MobileNetV3為骨干構建了一種輕量級的特征提取和識別網絡。通過調整模型中的深度分離卷積,提高了模型的識別能力。設計了
    發表于 05-30 20:30

    基于機器視覺和深度學習的焊接質量檢測系統

    基于機器視覺和深度學習的焊接質量檢測系統一種創新性的技術解決方案,它結合了先進的計算機視覺和深度學習
    的頭像 發表于 01-18 17:50 ?740次閱讀

    一種基于疊層成像和波前分離新型無透鏡成像方法

    該文提出了一種基于疊層成像和波前分離新型無透鏡成像方法,其特點是快速收斂和高質量成像。在該方法中,在光源和樣品之間插入個調幅器進行光波調制。通過將這個未知的調制器橫向平移到不同的位
    的頭像 發表于 12-11 11:21 ?796次閱讀
    <b class='flag-5'>一種</b>基于疊層成像和波前<b class='flag-5'>分離</b>的<b class='flag-5'>新型</b>無透鏡成像方法

    深度學習在人工智能中的 8 常見應用

    深度學習簡介深度學習是人工智能(AI)的個分支,它教神經網絡學習和推理。近年來,它解決復雜問題
    的頭像 發表于 12-01 08:27 ?3237次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>在人工智能中的 8 <b class='flag-5'>種</b>常見應用

    基于Arduino的音樂創作系統設計

    這是款簡易的音樂創作系統。使用 Arduino 驅動無蜂鳴器和排 LED 讓音樂起舞。它巧
    的頭像 發表于 11-30 09:10 ?1180次閱讀
    基于Arduino的<b class='flag-5'>音樂</b>創作<b class='flag-5'>系統</b>設計