精品国产一区二区三区不卡免费_黄片在线免费观看一区二区三区_国产午夜福利精品集在线观看

如何從混雜的背景噪音中過濾出特定的聲音，這一“經典雞尾酒會問題”有望在AI的幫助下得以解決。

因為我們的大腦可以專注于想聽到的內容，所以人耳可以準確地從嘈雜聲中分辨出特定的聲音。然而，基于機器的“聲源分離”技術多年來卻一直讓工程師們束手無策。麻省理工學院的研究人員正在利用MV（音樂短片）訓練神經網絡，以便更好地定位聲音來源。

該團隊的深度學習系統可以“直接通過一些未經標記的YouTube視頻進行學習，分辨出每種物體對應的聲音，”麻省理工學院研究人員Hang Zhao說道。他也曾是NVIDIA研究部門的實習生。

Zhao認為，該技術極具突破性，在語音、聽力學、音樂和機器人學領域均有廣泛的應用。

通過“刷視頻”來學習

麻省理工學院開發出了一種新方法，即通過YouTube視頻中的圖像和聲音來訓練深度神經網絡。他們的目標是讓神經網絡能夠精確定位視頻中圖像的位置（精確到像素級）。

該團隊將其系統稱為PixelPlayer，并通過YouTube上的MV對PixelPlayer進行了60個小時的訓練。到目前為止，該系統已經可以識別20多種樂器。

該團隊在麻省理工學院的計算機科學和人工智能實驗室 (Computer Science and Artificial Intelligence Lab) 開展了這項研究，共開發出了三個卷積神經網絡，它們可協同工作以生成相應結果。其中一個卷積神經網絡負責對視覺輸入進行編碼，一個負責對音頻輸入進行編碼，第三個則負責基于視覺和音頻輸入合成輸出。

PixelPlayer訓練數據集由714個YouTube視頻組成。“由于我們使用了四塊NVIDIA GPU，卷積神經網絡才能夠以非常快的速度處理數據，”Zhao表示，“它大約用了一天的時間便學會了。”

PixelPlayer是一個自我監督型（self-supervised）的系統。這意味著該系統不需要人類對樂器或樂器聲音進行任何標注，也可以識別出大號和小號等樂器的外觀、樂器聲音以及發聲方式。

吹響勝利的號角

對視頻中的聲源進行定位后，PixelPlayer即可分離出其波形。目前，PixelPlayer在識別兩種或三種不同樂器時表現最佳，但該團隊的目標是盡快擴大其識別范圍。在談到分離樂器聲音的過程時，Zhao說道：“我們正在努力將一個MP3文件分離為多個MP3文件。”

PixelPlayer在音樂領域有諸多用途。據Zhao介紹，音頻工程師可以應用此款AI工具增強某些音量較低的樂器聲音，或去除某種背景噪音。此外，它還可以幫助音頻工程師改善現場錄音或重新灌錄音樂的效果。

改善助聽器功能也是研究人員為“雞尾酒會問題”開發深度學習解決方案的目的。

不僅是音樂和聽力學領域，其應用范圍還可用于識別我們周圍的聲音。例如，聆聽森林中珍稀鳥類的鳴叫聲。“機器人也可以借助該系統理解周圍環境中的聲音。”Zhao補充道。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4764

瀏覽量
100542
人工智能

人工智能

+關注

關注
1791

文章
46872

瀏覽量
237598
深度學習

深度學習

+關注

關注
73

文章
5493

瀏覽量
120980

原文標題：讓音樂更悅耳：AI助力解決“雞尾酒會問題”

文章出處：【微信號：NVIDIA-Enterprise，微信公眾號：NVIDIA英偉達企業解決方案】歡迎添加關注！文章轉載請注明出處。

如何訓練這些神經網絡來解決問題？

在神經網絡建模中，經常會出現關于神經網絡應該有多復雜的問題，即它應該有多少層，或者它的濾波器矩陣應該有多大。這個問題沒有簡單的答案。與此相關，討論網絡過擬合和欠擬合非常重要。過擬合是模

發表于 11-24 15:35 ?693次閱讀

如何<b class='flag-5'>訓練</b>這些<b class='flag-5'>神經網絡</b><b class='flag-5'>來</b>解決問題？

詳解深度學習、神經網絡與卷積神經網絡的應用

在如今的網絡時代，錯綜復雜的大數據和網絡環境，讓傳統信息處理理論、人工智能與人工神經網絡都面臨巨大的挑戰。近些年，深度學習逐漸走進人們的視線，通過深

發表于 01-11 10:51 ?1918次閱讀

從AlexNet到MobileNet，帶你入門深度神經網絡

通過堆疊卷積層使得模型更深更寬，同時借助GPU使得訓練再可接受的時間范圍內得到結果，推動了卷積神經網絡甚至是深度學習的發展。下面是AlexNet的架構：AlexNet的特點有：1.借助

發表于 05-08 15:57

基于賽靈思FPGA的卷積神經網絡實現設計

FPGA 上實現卷積神經網絡 (CNN)。CNN 是一類深度神經網絡，在處理大規模圖像識別任務以及與機器學習類似的其他問題方面已大獲成功。在當前案例

發表于 06-19 07:24

如何移植一個CNN神經網絡到FPGA中？

）第二步：使用Lattice sensAI 軟件編譯已訓練好的神經網絡，定點化網絡參數。該軟件會根據神經網絡結構和預設的FPGA資源進行分析并給出性能評估報告，此外用戶還可以在軟件

發表于 11-26 07:46

圖像預處理和改進神經網絡推理的簡要介紹

為提升識別準確率，采用改進神經網絡，通過Mnist數據集進行訓練。整體處理過程分為兩步：圖像預處理和改進神經網絡推理。

發表于 12-23 08:07

卷積神經網絡模型發展及應用

神經網絡已經廣泛應用于圖像分類、目標檢測、語義分割以及自然語言處理等領域。首先分析了典型卷積神經網絡模型為提高其性能增加網絡深度以及寬度的模

發表于 08-02 10:39

NVIDIA GPU加快深度神經網絡訓練和推斷

深度學習是推動當前人工智能大趨勢的關鍵技術。在 MATLAB 中可以實現深度學習的數據準備、網絡設計、訓練和部署全流程開發和應用。聯合高性能

發表于 02-18 13:31 ?2015次閱讀

卷積神經網絡如何識別圖像

多層卷積層、池化層和全連接層。CNN模型通過訓練識別并學習高度復雜的圖像模式，對于識別物體和進行圖像分類等任務有著非常優越的表現。本文將會詳細介紹卷積神經網絡如何識別

發表于 08-21 16:49 ?1890次閱讀

卷積神經網絡和深度神經網絡的優缺點卷積神經網絡和深度神經網絡的區別

深度神經網絡是一種基于神經網絡的機器學習算法，其主要特點是由多層神經元構成，可以根據數據自動調整神經元之間的權重，從而實現對大規模數據進行預

發表于 08-21 17:07 ?3936次閱讀

如何訓練和優化神經網絡

神經網絡是人工智能領域的重要分支，廣泛應用于圖像識別、自然語言處理、語音識別等多個領域。然而，要使神經網絡在實際應用中取得良好效果，必須進行有效的訓

發表于 07-01 14:14 ?397次閱讀

卷積神經網絡訓練的是什么

卷積神經網絡（Convolutional Neural Networks，簡稱CNN）是一種深度學習模型，廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將詳細介紹卷積

發表于 07-03 09:15 ?352次閱讀

bp神經網絡是深度神經網絡嗎

BP神經網絡（Backpropagation Neural Network）是一種常見的前饋神經網絡，它使用反向傳播算法來訓練網絡。雖然BP

發表于 07-03 10:14 ?698次閱讀

怎么對神經網絡重新訓練

重新訓練神經網絡是一個復雜的過程，涉及到多個步驟和考慮因素。引言 神經網絡是一種強大的機器學習模型，廣泛應用于圖像識別、自然語言處理、語音識別等領域。然而，隨著時間的推移，數據分布可

發表于 07-11 10:25 ?419次閱讀

殘差網絡是深度神經網絡嗎

殘差網絡（Residual Network，通常簡稱為ResNet）是深度神經網絡的一種，其獨特的結構設計在解決深層網絡訓練

發表于 07-11 18:13 ?983次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

通過YouTube視頻中的圖像和聲音來訓練深度神經網絡

評論

如何訓練這些神經網絡來解決問題？

詳解深度學習、神經網絡與卷積神經網絡的應用

從AlexNet到MobileNet，帶你入門深度神經網絡

基于賽靈思FPGA的卷積神經網絡實現設計

如何移植一個CNN神經網絡到FPGA中？

圖像預處理和改進神經網絡推理的簡要介紹

卷積神經網絡模型發展及應用

NVIDIA GPU加快深度神經網絡訓練和推斷

卷積神經網絡如何識別圖像

卷積神經網絡和深度神經網絡的優缺點卷積神經網絡和深度神經網絡的區別

如何訓練和優化神經網絡

卷積神經網絡訓練的是什么

bp神經網絡是深度神經網絡嗎

怎么對神經網絡重新訓練

殘差網絡是深度神經網絡嗎