,亚洲欧美日韩国产成人精品影院,亚洲国产欧美日韩精品一区二区三区,久久亚洲国产成人影院,久久国产成人亚洲精品影院老金,九九精品成人免费国产片,国产精品成人综合网,国产成人一区二区三区,国产成...

大家應(yīng)該都知道聲音克隆技術(shù)，通俗的來(lái)說(shuō)就是借助深度學(xué)習(xí)算法，可以完全模擬某個(gè)人的聲音，而且由機(jī)器合成的語(yǔ)音連情緒都能夠完美表達(dá)出來(lái)，基本可以以假亂真，只要不見(jiàn)面，你根本就察覺(jué)不出來(lái)向你發(fā)出聲音的知識(shí)一個(gè)機(jī)器。

語(yǔ)音克隆最大的創(chuàng)新之一是減少創(chuàng)建語(yǔ)音所需的原始數(shù)據(jù)量。過(guò)去，該系統(tǒng)需要數(shù)十甚至數(shù)百小時(shí)的音頻。但是，今天猿妹要和大家分享的這個(gè)工具5秒鐘就可以克隆成功，這個(gè)工具名叫——MockingBird。

MockingBird已經(jīng)登上Github熱榜，收獲3.5K的Star，累計(jì)分支 303（Github地址：https://github.com/babysor/MockingBird）

MockingBird具有如下特性：

支持普通話并使用多種中文數(shù)據(jù)集進(jìn)行測(cè)試

適用于 pytorch，已在 1.9.0 版本（最新于 2021 年 8 月）中測(cè)試，GPU Tesla T4 和 GTX 2060

支持 Windows + Linux

僅使用新訓(xùn)練的合成器（synthesizer）就有良好效果，復(fù)用預(yù)訓(xùn)練的編碼器/聲碼器

MockingBird如何使用

MockingBird的安裝要求如下：

首先，MockingBird需要Python 3.7 或更高版本

安裝 PyTorch

安裝 ffmpeg。

運(yùn)行pip install -r requirements.txt 來(lái)安裝剩余的必要包。

安裝 webrtcvad 用 pip install webrtcvad-wheels。

接著，你需要使用數(shù)據(jù)集訓(xùn)練合成器：

下載數(shù)據(jù)集并解壓：確保您可以訪問(wèn) train 文件夾中的所有音頻文件（如.wav）

使用音頻和梅爾頻譜圖進(jìn)行預(yù)處理：python synthesizer_preprocess_audio.py 《datasets_root》可以傳入參數(shù) --dataset {dataset} 支持 adatatang_200zh， magicdata， aishell3

預(yù)處理嵌入：python synthesizer_preprocess_embeds.py 《datasets_root》/SV2TTS/synthesizer

訓(xùn)練合成器：python synthesizer_train.py mandarin 《datasets_root》/SV2TTS/synthesizer

當(dāng)你在訓(xùn)練文件夾 synthesizer/saved_models/ 中看到注意線顯示和損失滿足您的需要時(shí)，請(qǐng)轉(zhuǎn)到下一步。

使用預(yù)先訓(xùn)練好的合成器，如果沒(méi)有設(shè)備或者不想慢慢調(diào)試，可以使用網(wǎng)友貢獻(xiàn)的模型。

訓(xùn)練聲碼器

預(yù)處理數(shù)據(jù)： python vocoder_preprocess.py 《datasets_root》

訓(xùn)練聲碼器： python vocoder_train.py mandarin 《datasets_root》

啟動(dòng)工具箱

然后你可以嘗試使用工具箱：python demo_toolbox.py -d 《datasets_root》

責(zé)任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

開(kāi)源

開(kāi)源

+關(guān)注

關(guān)注
3

文章
3251

瀏覽量
42406
克隆

克隆

+關(guān)注

關(guān)注
0

文章
22

瀏覽量
7793
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5492

瀏覽量
120977

原文標(biāo)題：5秒內(nèi)克隆你的聲音，并生成任何內(nèi)容，這個(gè)工具細(xì)思極恐...還特么的開(kāi)源~

文章出處：【微信號(hào)：AndroidPush，微信公眾號(hào)：Android編程精選】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

AI大模型與深度學(xué)習(xí)的關(guān)系

人類(lèi)的學(xué)習(xí)過(guò)程，實(shí)現(xiàn)對(duì)復(fù)雜數(shù)據(jù)的學(xué)習(xí)和識(shí)別。AI大模型則是指模型的參數(shù)數(shù)量巨大，需要龐大的計(jì)算資源來(lái)進(jìn)行訓(xùn)練和推理。深度學(xué)習(xí)

發(fā)表于 10-23 15:25 ?374次閱讀

用TPA3112設(shè)計(jì)的一個(gè)音頻功放電路，上電1-3秒后就沒(méi)有聲音輸出了，怎么解決？

用TPA3112設(shè)計(jì)的一個(gè)音頻功放電路輸入采用差分的，后來(lái)把1個(gè)輸入接地，變成了單端的了問(wèn)題很奇怪接信號(hào)發(fā)生器，上電后，1-3秒內(nèi)有音頻輸出，能夠聽(tīng)到聲音然后就沒(méi)有聲音了 FAULT輸出低折騰了很久，望高手指點(diǎn)一二

發(fā)表于 10-12 07:17

FPGA做深度學(xué)習(xí)能走多遠(yuǎn)？

。FPGA的優(yōu)勢(shì)就是可編程可配置，邏輯資源多，功耗低，而且賽靈思等都在極力推廣。不知道用FPGA做深度學(xué)習(xí)未來(lái)會(huì)怎樣發(fā)展，能走多遠(yuǎn)，你怎么看。 A：FPGA 在深度

發(fā)表于 09-27 20:53

深度識(shí)別算法包括哪些內(nèi)容

：CNN是深度學(xué)習(xí)中處理圖像和視頻等具有網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的主要算法。它通過(guò)卷積層、池化層和全連接層等組件，實(shí)現(xiàn)對(duì)圖像特征的自動(dòng)提取和識(shí)別。應(yīng)用領(lǐng)域：CNN在圖像識(shí)別、目標(biāo)檢測(cè)、視頻分

發(fā)表于 09-10 15:28 ?304次閱讀

深度學(xué)習(xí)算法在嵌入式平臺(tái)上的部署

隨著人工智能技術(shù)的飛速發(fā)展，深度學(xué)習(xí)算法在各個(gè)領(lǐng)域的應(yīng)用日益廣泛。然而，將深度學(xué)習(xí)算法部署到資源

發(fā)表于 07-15 10:03 ?1178次閱讀

深度學(xué)習(xí)算法在集成電路測(cè)試中的應(yīng)用

隨著半導(dǎo)體技術(shù)的快速發(fā)展，集成電路（IC）的復(fù)雜性和集成度不斷提高，對(duì)測(cè)試技術(shù)的要求也日益增加。深度學(xué)習(xí)算法作為一種強(qiáng)大的數(shù)據(jù)處理和模式識(shí)別工具，在集成電路測(cè)試領(lǐng)域展現(xiàn)出了巨大的應(yīng)用潛力。本文將從

發(fā)表于 07-15 09:48 ?791次閱讀

利用Matlab函數(shù)實(shí)現(xiàn)深度學(xué)習(xí)算法

在Matlab中實(shí)現(xiàn)深度學(xué)習(xí)算法是一個(gè)復(fù)雜但強(qiáng)大的過(guò)程，可以應(yīng)用于各種領(lǐng)域，如圖像識(shí)別、自然語(yǔ)言處理、時(shí)間序列預(yù)測(cè)等。這里，我將概述一個(gè)基本的流程，包括環(huán)境設(shè)置、數(shù)據(jù)準(zhǔn)備、模型設(shè)計(jì)、訓(xùn)

發(fā)表于 07-14 14:21 ?1910次閱讀

深度學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)方法綜述

應(yīng)用中往往難以實(shí)現(xiàn)。因此，無(wú)監(jiān)督學(xué)習(xí)在深度學(xué)習(xí)中扮演著越來(lái)越重要的角色。本文旨在綜述深度學(xué)習(xí)中的

發(fā)表于 07-09 10:50 ?513次閱讀

深度學(xué)習(xí)的基本原理與核心算法

處理、語(yǔ)音識(shí)別等領(lǐng)域取得了革命性的突破。本文將詳細(xì)闡述深度學(xué)習(xí)的原理、核心算法以及實(shí)現(xiàn)方式，并通過(guò)一個(gè)具體的代碼實(shí)例進(jìn)行說(shuō)明。

發(fā)表于 07-04 11:44 ?1683次閱讀

深度學(xué)習(xí)模型訓(xùn)練過(guò)程詳解

深度學(xué)習(xí)模型訓(xùn)練是一個(gè)復(fù)雜且關(guān)鍵的過(guò)程，它涉及大量的數(shù)據(jù)、計(jì)算資源和精心設(shè)計(jì)的算法。訓(xùn)練一個(gè)深度學(xué)習(xí)模型，本質(zhì)上是通過(guò)優(yōu)化

發(fā)表于 07-01 16:13 ?1089次閱讀

基于深度學(xué)習(xí)的鳥(niǎo)類(lèi)聲音識(shí)別系統(tǒng)

具體的軟硬件實(shí)現(xiàn)點(diǎn)擊http://mcu-ai.com/MCU-AI技術(shù)網(wǎng)頁(yè)_MCU-AI 鳥(niǎo)叫聲識(shí)別在鳥(niǎo)類(lèi)保護(hù)中具有重要意義。通過(guò)適當(dāng)?shù)?b class='flag-5'>聲音分類(lèi)，研究可以自動(dòng)預(yù)測(cè)該地區(qū)的生活質(zhì)量。如今，深度

發(fā)表于 05-30 20:30

深度解析深度學(xué)習(xí)下的語(yǔ)義SLAM

隨著深度學(xué)習(xí)技術(shù)的興起，計(jì)算機(jī)視覺(jué)的許多傳統(tǒng)領(lǐng)域都取得了突破性進(jìn)展，例如目標(biāo)的檢測(cè)、識(shí)別和分類(lèi)等領(lǐng)域。近年來(lái)，研究人員開(kāi)始在視覺(jué)SLAM算法中引入深度

發(fā)表于 04-23 17:18 ?1238次閱讀

【技術(shù)科普】主流的深度學(xué)習(xí)模型有哪些？AI開(kāi)發(fā)工程師必備！

深度學(xué)習(xí)在科學(xué)計(jì)算中獲得了廣泛的普及，其算法被廣泛用于解決復(fù)雜問(wèn)題的行業(yè)。所有深度學(xué)習(xí)算法都使用

發(fā)表于 01-30 15:26 ?582次閱讀

目前主流的深度學(xué)習(xí)算法模型和應(yīng)用案例

深度學(xué)習(xí)在科學(xué)計(jì)算中獲得了廣泛的普及，其算法被廣泛用于解決復(fù)雜問(wèn)題的行業(yè)。所有深度學(xué)習(xí)算法都使用

發(fā)表于 01-03 10:28 ?1766次閱讀

深度學(xué)習(xí)在人工智能中的 8 種常見(jiàn)應(yīng)用

，徹底改變了人工智能。人腦的結(jié)構(gòu)和操作啟發(fā)了這些算法。你覺(jué)得怎么樣？人工智能（AI）中有哪些典型的深度學(xué)習(xí)應(yīng)用？深度

發(fā)表于 12-01 08:27 ?3236次閱讀