AIGC大爆發,科技革新不斷,數字人在各種場景中嶄露頭角,如數字人主播、數字人解說員、數字人導購等。根據真人形象AI生成數字人分身,這項技術已經從未來走進現實。
數字人(Digital Human)是指利用計算機技術和人工智能技術,根據真實人類的外貌、動作、聲音等特征,生成的具有高逼真度以及高交互性的虛擬人物,可以為人類提供多樣化的服務。
近期,【東風生萬物】思必馳DFM-2大模型及創新技術應用成果發布會上,思必馳聯合創始人、首席科學家俞凱的數字分身重磅亮相發布會現場。
思必馳數字人生成技術
思必馳聯合創始人、首席科學家俞凱
思必馳基于DFM-2大模型推出的自然場景數字人生成技術,采用擴散生成模型,通過小數據模型訓練,實現高品質數字人生成,個性化對話生成與語音合成模型無縫結合,構建可自由交互的個性化數字形象。思必馳打造的數字人不僅能說會道,還精通粵語、四川話、上海話等各地方言及英語、法語、俄語等多國語言,可應用于智能家居、智能車載、智能軌交、市場營銷等場景,為人類生活帶來更多可能。
思必馳聯合創始人、首席科學家俞凱
真人出鏡
就像視頻中的數字人俞凱教授,無論是聲音、表情、動作還是形象,都與真人高度接近,甚至還可以根據不同場景,切換語言與人類進行交互。
數字人的打造需要運用計算機圖形學、計算機視覺、自然語言處理、智能語音等領域的知識和技術,從而生成一個從形態到聲音上都媲美真人的數字人。
思必馳基于自研的對話式語言大模型DFM-2與全鏈路綜合對話技術的聯動能力,可快速生成高品質的數字人。在外貌上,思必馳采用擴散生成模型,通過小數據模型訓練,基于真人形象,構建出可自由交互的數字形象。在語音上,思必馳通過聲音復刻、單人千音、細粒度情感及風格合成、音頻場景合成等系列技術,為數字人賦予語言能力,讓數字人變的更加鮮活。
●聲音復刻為數字人賦予真人同款聲音。思必馳聲音復刻技術服務,支持男聲、女聲、童聲及中、英文和方言復刻,可輔助用戶打造不同年齡、不同性別的數字人形象。
●情感合成讓數字人也能表達喜怒哀樂。思必馳可合成高音質、多情感的音色,呈現“高興、抱歉、撒嬌、中性”等多種情感聲音,為數字人的情感表達賦予了更多活力,提升了人機交互體驗。
●單人千音讓數字人也能說方言外語。思必馳單人千音技術可以在短時間內快速將單個發音人的音色,遷移成為粵語、四川話、上海話、蘇州話、閩南語等方言以及俄語、德語、日語、法語、泰語、西班牙語等外語,讓數字人“青出于藍而勝于藍”。
中商產業研究院發布的《2023年數字人產業發展白皮書》顯示,2022年我國數字人產業市場規模達1464億元(同比增長57%),預計2025年全國數字人相關企業數量將突破40萬家、數字人產業市場規模將達到2600億元。數字人將進入大規模應用期,轉化為現實生產力為社會創造價值。
在市場營銷領域,數字人可用于線上直播進行產品營銷推廣,降低公司的人力成本;在智能車載領域,數字人可融入車載系統,提供導航、新聞播報等服務,為用戶帶來更智慧的出行體驗;在家居領域,數字人可入駐家電大屏中,為用戶提供菜譜推薦、家務規劃、情感陪伴等服務,成為用戶貼心的數字人管家;在軌交領域,數字人可在車站提供路線導航、購票咨詢、信息咨詢等服務,降低軌交領域人力成本。
相較于真人,數字人可以不受時間或空間的限制,隨著大模型技術的應用,數字人也將持續釋放價值。未來,思必馳將基于DFM-2大模型,綜合全鏈路語音交互技術,為用戶帶來更具特色的數字人形象,加速推進AI技術的應用落地。
審核編輯:彭菁
-
計算機
+關注
關注
19文章
7421瀏覽量
87715 -
人工智能
+關注
關注
1791文章
46858瀏覽量
237552 -
思必馳
+關注
關注
4文章
278瀏覽量
14269 -
數字人
+關注
關注
0文章
119瀏覽量
1990 -
大模型
+關注
關注
2文章
2328瀏覽量
2481
原文標題:AI生成之數字人分身,音畫合一有模有樣
文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論