4 月 19 日報道,近期微軟亞洲研究院推出了名為 VASA-1 的創新模型,針對靜態肖像照片和錄音音頻片段,其能實現圖片中角色的自動化配音。
該模型,尤其擅長展現逼真的面部表情及各類情緒,且嘴唇動作高度擬真。然而,盡管研究員坦承目前仍有不足之處,如無法精準處理頭發等纖維質元素,但相較于其他類似模型,VASA-1 的表現已屬優異。
此外,研究員還透露,VASA-1 在離線批量處理模式下,可生成分辨率高達 512*512 的動態短片,幀速率為 45fps;在線直播模式下,幀速率也可達到 40fps,延遲時間僅為 170ms。而完成這一切,只需一臺搭載 NVIDIA RTX 4090 顯卡的計算機即可。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
微軟
+關注
關注
4文章
6567瀏覽量
103958 -
模型
+關注
關注
1文章
3174瀏覽量
48716 -
Vasa
+關注
關注
0文章
2瀏覽量
6561
發布評論請先 登錄
相關推薦
中國電信人工智能研究院完成首個全國產化萬卡萬參大模型訓練
近日,中國電信人工智能研究院宣布了一項重大技術突破:成功完成國內首個基于全國產化萬卡集群訓練的萬億參數大模型。
摩爾線程攜手智源研究院完成基于Triton的大模型算子庫適配
近日,摩爾線程與北京智源人工智能研究院(簡稱:智源研究院)已順利完成基于Triton語言的高性能算子庫FlagGems的適配工作。得益于摩爾線程自研統一系統計算架構MUSA,雙方在短短一周多的時間
中國電信發布首個支持30種方言混說語音大模型
中國電信人工智能研究院(TeleAI)近日發布了一項引領業界的語音識別技術——星辰超多方言語音識別大模型。這一模型突破性地支持30種方言的自
長沙北斗研究院總部基地正式奠基
長沙北斗研究院總部基地正式奠基 日前長沙北斗研究院總部基地正式奠基,項目由長沙北斗研究院牽頭建設;項目又名“北斗足跡”。項目一期預計2025年年底前建成投用。 據悉,長沙北斗研究院總部
本源入榜胡潤研究院2024全球獨角獸榜單!
胡潤研究院從2017年開始追蹤記錄獨角獸企業,這是第六次發布全球獨角獸榜。榜單顯示,截至2024年1月1日,全球共有1453家獨角獸企業,總價值4.6萬億美元,分
浙江圖靈算力研究院向知存科技頒發“年度最具影響力企業獎”
近日,浙江圖靈算力研究院生態伙伴聯誼會在杭州舉行,知存科技作為研究院生態企業之一,與賽迪研究院、中科院計算所、自動化所和中國RISC-V聯盟
微軟內部對亞洲研究院的未來持有不同看法
四位消息人士披露,微軟內部曾考慮過關閉或搬遷MSRA,但高層領導普遍傾向于維持實驗室在中國的運作。目前,微軟已在加拿大溫哥華設立MSR分中心,部分研究員已被調配至此。此舉旨在作為備用安置點,以應對可能面臨的
院士專家齊聚!京彩未來聯合重點研究院創建數字空間聯合實驗室
1月6日,京彩未來與北京大學數字中國研究院華南分院暨廣東省數字廣東研究院共同創建的“數字空間共同體聯合室驗室”正式掛牌運營。著名經濟學家管清友博士、北京大學數字中國研究院華南分院暨廣東
北京大學無錫EDA研究院揭牌
本研究院自2023年1月5日起正式投入運營,項目總投資額達3億元人民幣,下設三個研發機構,分別致力于高性能EDA技術、中國EDA產業標準以及半導體量測技術研究及其產業化。
IBM 咨詢獲 SAP 中國研究院 EcoFactory-首屆合作伙伴駭客松創新營獎,期待攜手客戶共創代碼現代化
生態 2.0 發起,由 SAP 合作伙伴微軟、SAP 中國研究院創新生態 2.0 專家委員會成員單位中國信息通信研究院共同協作舉辦。
天數智芯支持智源研究院首次完成大模型異構算力混合訓練,突破異構算力束縛
11 月 29 日,北京智源人工智能研究院副院長兼總工程師林詠華在 2023 人工智能計算大會上宣布,正式開源 700 億參數大模型 Aquila2-70B-Expr (異構先驅版), 這是首個
評論