動漫《名偵探柯南》里面,柯南有個變聲蝴蝶結,有了這個變聲器,柯南可以模仿任何人的聲音,從而隱藏自己的身份,這個變聲蝴蝶結就用到了語音轉換。
思必馳最新推出語音轉換技術,基于深度學習及高質量聲碼器,在保留說話人原始語音內容的同時,可以將說話人的音色轉換為指定說話人的音色,同時,可保留原說話人的語速、頻率、情感等風格特色,還支持英語、日語等多語言轉換。目前,該技術可應用于視頻配音、游戲娛樂、人工客服等場景。
語音轉換(Voice Conversion, VC)即在保留語音內容的同時,將原說話人的音色轉換成指定說話人的音色。在傳統變聲工具中,基于語音信號處理技術,可將個人音色轉換為大叔音、蘿莉音等音色,但此時的變聲比較單一,僅僅是對音色進行改變,不能進行跨語言、多情感風格的轉換,轉換效果較為機械。
隨著技術的不斷發展,語音轉換效果實現了從音色轉換到情感風格轉換的進步。近期,思必馳推出的聲音轉換技術具有情感轉換、多語言轉換、“千人單音”的特點。
(1)支持情感轉換
在實際場景中,人類的語音會隨著心情變化而發生語調變化,此時就需要聲音轉換技術對說話人的情感也能做出完美還原。目前,思必馳聲音轉換技術支持開心、沮喪、生氣等情感的轉換。
(2)支持多語言轉換
思必馳語音轉換技術不僅支持中文轉換,還支持英語、日語轉換,滿足用戶多語言需求。
(3)超高還原度,“千人單音”
思必馳聲音轉換技術可對音色進行高度還原,不論原始音色如何,都可以轉換為指定音色,做到“千人單音”。
思必馳語音轉換技術之所以能做到多風格、多語言的轉換,主要運用到了深度學習、音色分離、高質量聲碼器等技術。聲音轉換模型由聲學模型和聲碼器組成,聲學模型通過內容編碼器從錄音中提取出發音內容、韻律、情感、風格,并通過音色編碼器從目標角色音頻中提取出音色特征,最后通過聲碼器轉換為目標角色聲音。
思必馳聲音轉換技術服務將支持云端在線服務及本地部署,在視頻配音、人工客服、直播互動、游戲娛樂等領域有很大落地空間。
在動漫配音領域,動漫IP往往有固定的配音人員,有了聲音轉換技術以后,不同的配音人員均可以為該IP進行配音,避免因工作人員調動產生前后配音不一致的情況;在人工客服場景中,好聽的聲音往往更能打動消費者,通過聲音轉換技術,“甜美客服”不再一“聲”難求。在日益發達的短視頻領域,博主可通過聲音轉換技術為短視頻配上具有特色的音頻解說。
除語音轉換外,思必馳在聲音復刻、情感合成、“單人千音”等全鏈路語音交互技術上碩果累累,為智能語音的場景落地提供了多樣化的選擇。
思必馳語音技術
1.思必馳DUI平臺上線“單人千音”,各地方言AI隨心切換
2.聲音“克隆”要多久?僅需一句話,快速復刻你的聲音
3.思必馳情感語音合成“以聲傳情”,讓機器人表達更有溫度
4.1024程序員節丨點擊接收24K高保真祝福
5.語音編輯,讓智能播報更自然,思必馳TTS技術上新第一更!
6.思必馳發音人音色定制平臺,快來PICK你最愛的音色!
未來,思必馳將基于DFM-2大模型,結合全鏈路語音交互技術進行技術聯動,推動智能語音在各個領域的落地,助力產業數智化轉型。
-
語音
+關注
關注
3文章
384瀏覽量
37997 -
深度學習
+關注
關注
73文章
5493瀏覽量
120979 -
思必馳
+關注
關注
4文章
280瀏覽量
14269
原文標題:語音轉換,自由切換你的聲音,思必馳語音技術上新第二更!
文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論