精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

曠視AI開源新突破:上傳照片即可生成表情包視頻!

AI機械姬 ? 來源:AI機械姬 ? 作者:AI機械姬 ? 2024-07-12 11:20 ? 次閱讀

日前,曠視科技發布了一項新的開源AI人像視頻生成框架——MegActor。該框架讓用戶只需輸入一張靜態肖像圖片和一段視頻(如演講、表情包、rap),便可生成一段表情豐富、動作一致的AI人像視頻。生成的視頻長度取決于輸入的視頻長度。與阿里EMO、微軟VASA等最新AI視頻模型不同,曠視MegActor采用開源方式,供開發者社區使用。MegActor生成的視頻畫質更出色,面部細節更加豐富自然。

wKgZomaQp8CARJnFAAAUzJBUboU053.png

為了展示其泛化性,MegActor甚至可以將VASA中的人物肖像和視頻組合生成,得到生動的表情視頻。即使與阿里EMO的官方案例相比,MegActor也能生成近似的效果。

wKgaomaQp0qAR1g4AAGuNBaURo8083.png

總的來說,無論是讓肖像開口說話、唱歌、模仿搞怪表情包,MegActor都能生成逼真的效果。

論文鏈接:https://arxiv.org/abs/2405.20851

代碼地址:https://github.com/megvii-research/megactor

項目地址:https://megactor.github.io/

MegActor是曠視研究院的最新研究成果。曠視研究院是曠視公司級研究機構,旨在通過基礎創新突破AI技術邊界,以工程創新實現技術到產品的快速轉化。多年來,曠視研究院已成為全球領先的人工智能研究機構。

目前的人像視頻生成領域中,許多工作通常使用高質量的閉源數據進行訓練,以追求更好的效果。而曠視研究院始終堅持全面開源,確保實際效果的可復現性。MegActor的訓練數據全部來自公開可獲取的開源數據集,配合開源代碼,使得感興趣的從業者可以從頭開始完整復現這些效果。

為了完全復刻原始視頻的表情和動作,MegActor采用原始圖像進行驅動,這與多數廠商使用的中間表示方法(如sketch、pose、landmark)不同,能夠捕捉到細致的表情和運動信息。

曠視科技研究總經理范浩強表示,在AI視頻生成領域,我們發現目前主流的骨骼關鍵點控制方式不僅要求用戶提供難以獲取的專業控制信號,同時生成視頻的保真度也不盡如人意。通過研究發現,使用原視頻進行驅動,不僅降低了控制信號的門檻,更能生成保真且動作一致的視頻。

具體來說,MegActor主要由兩個階段構成:

wKgaomaQp2yAMbsSAAINHxF7tf0305.png

使用ReferenceNet對參考圖像進行特征提取,獲取參考圖像的外觀和背景信息;

使用PoseGuider對輸入視頻進行運動和表情信息提取,將這些信息遷移到參考圖像上。

雖然使用原始視頻進行驅動能帶來更豐富的表情細節和運動信息,但也存在ID泄露和背景干擾等挑戰。為此,MegActor采用了條件擴散模型,引入了合成數據生成框架,創建具有一致動作和表情但不同身份ID的視頻,以減輕ID泄露的問題。MegActor還分割了參考圖像的前景和背景,并使用CLIP對背景細節進行編碼,確保背景的穩定性。

在數據訓練方面,曠視研究院團隊使用公開數據集(VFHQ和CeleV)進行訓練,總時長超過700小時。為了避免ID泄露問題,團隊還使用換臉和風格化方法1:1生成合成數據,實現表情和動作一致但ID不一致的數據。此外,團隊使用注視檢測模型處理數據,獲取大約5%的高質量數據進行Finetune訓練。

wKgaomaQp4-Ad7nyAAIrJv12wFw194.png

通過新的模型框架和訓練方法,曠視研究院團隊僅使用了不到200塊V100顯卡小時的訓練時長,最終實現了以下特性:

根據輸入視頻生成任意持續時間的模仿視頻,確保角色身份一致性;

支持各種驅動視頻,如演講、唱歌、表情包等;

支持不同畫風(照片、傳統繪畫、漫畫、AI數字人等);

音頻生成方法相比,MegActor生成的視頻不僅能確保表情和動作一致,更能達到自然程度。

目前,MegActor已經完全開源,供開發者和用戶即開即用。



審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30146

    瀏覽量

    268414
  • 開源
    +關注

    關注

    3

    文章

    3251

    瀏覽量

    42406
收藏 人收藏

    評論

    相關推薦

    生成AI工具作用

    生成AI工具是指那些能夠自動生成文本、圖像、音頻、視頻等多種類型數據的人工智能技術。在此,petacloud.ai小編為您整理
    的頭像 發表于 10-28 11:19 ?175次閱讀

    重慶兩江新區與吉利汽車集團、科技簽署合作協議

    日前,重慶兩江新區與吉利汽車集團、科技簽署戰略合作協議。市委書記袁家軍,市委副書記、市長胡衡華會見了吉利控股集團董事長李書福、科技董事長兼CEO印奇一行并見證簽約。
    的頭像 發表于 09-02 14:13 ?449次閱讀

    聚焦物聯網場景,科技核心技術能力持續升級

    曾經備受青睞的“AI四小龍”之一,科技在更早的時候曾向港交所遞交上市申請,闖關未果后轉向上交所科創板。 ? 科技核心技術能力 ?
    的頭像 發表于 07-25 00:09 ?4094次閱讀

    MediaTek與快手攜手創新,端側視頻生成技術引領AI新紀元

    在科技日新月異的今天,MediaTek與快手再次攜手,于近日宣布了一項重大技術突破——高效端側視頻生成技術的誕生。這項技術不僅是對即將于2024年世界移動通信大會(MWC 2024)上亮相的先進視頻生成技術的有力延續,更是雙方在
    的頭像 發表于 07-05 11:52 ?967次閱讀

    MediaTek聯合快手推出高效端側視頻生成技術

    只需在設備上選取圖片,應用即可智能地識別照片中的人物和場景,生成自然流暢的視頻佳作,從而顯著提升視頻制作的創意表現和效率。
    的頭像 發表于 07-05 11:23 ?4757次閱讀

    阿里云視頻生成技術創新!視頻生成使用了哪些AI技術和算法

    電子發燒友網報道(文/李彎彎)日前,阿里云宣布通義實驗室研發的視頻生成模型EMO正式上線通義App,免費對所有人開放。借助這一功能,用戶可以在歌曲、熱梗、表情中任選一款模板,然后通過上傳
    的頭像 發表于 05-08 00:07 ?3323次閱讀

    與樂天國際物流在北京正式簽署戰略合作協議

    4月17日,與韓國樂天國際物流(LOTTE GLOBAL LOGISTICS)在北京正式簽署戰略合作協議。
    的頭像 發表于 04-23 11:52 ?520次閱讀
    <b class='flag-5'>曠</b><b class='flag-5'>視</b>與樂天國際物流在北京正式簽署戰略合作協議

    科技與上海家化正式簽署《AI科技創新合作框架協議》

    3月18日,在2024年上海家化“致美·致時代”年度發布會上,上海家化聯合股份有限公司與北京科技有限公司正式簽署《AI科技創新合作框架協議》,雙方將在AI賦能美業領域進一步展開深度
    的頭像 發表于 03-20 10:21 ?549次閱讀

    新火種AI|圍攻光明頂:Sora效應下的AI視頻生成競賽

    Sora的出現,讓AI視頻生成領域真正“活”了起來
    的頭像 發表于 03-16 11:12 ?602次閱讀

    除了刷屏的Sora,國內外還有哪些AI視頻生成工具

    。Sora的發布也讓AI生成視頻有了突破性進展。 ? 過去一年多,全球科技公司都在發布各種大模型,然而AI
    的頭像 發表于 02-26 08:42 ?4246次閱讀
    除了刷屏的Sora,國內外還有哪些<b class='flag-5'>AI</b><b class='flag-5'>視頻生成</b>工具

    OpenAI 在 AI 生成視頻領域扔出一枚“王炸”,視頻生成模型“Sora”

    ABSTRACT摘要2月16日凌晨,也就是中國大年初七,OpenAI在AI生成視頻領域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。這家舊金山公司周四推出的該工具使用
    的頭像 發表于 02-22 08:25 ?346次閱讀
    OpenAI 在 <b class='flag-5'>AI</b> <b class='flag-5'>生成</b><b class='flag-5'>視頻</b>領域扔出一枚“王炸”,<b class='flag-5'>視頻生成</b>模型“Sora”

    探索OpenAI Sora視頻AI生成技術及其應用如何使用指南

    OpenAI的Sora現已擴展其能力范圍,進入視頻生成領域,標志著人工智能技術在多媒體內容創作上的一個重大突破。Sora的視頻AI功能使得用戶能夠根據文本描述自動
    的頭像 發表于 02-20 12:01 ?1400次閱讀

    OpenAI新年開出王炸,視頻生成模型Sora問世

    近日,OpenAI在AI生成視頻領域取得重大突破,發布了全新的生成式人工智能模型“Sora”。該模型在
    的頭像 發表于 02-20 11:46 ?738次閱讀

    AI視頻年大爆發!2023年AI視頻生成領域的現狀全盤點

    2023年,也是AI視頻元年。過去一年究竟有哪些爆款應用誕生,未來視頻生成領域面臨的難題還有哪些?
    的頭像 發表于 02-20 10:40 ?1137次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>視頻</b>年大爆發!2023年<b class='flag-5'>AI</b><b class='flag-5'>視頻生成</b>領域的現狀全盤點

    OpenAI發布文生視頻模型Sora,引領AI視頻生成新紀元

    在人工智能(AI)領域掀起新一輪革命浪潮的,正是OpenAI最新推出的文生視頻大模型——Sora。這款被業界廣泛贊譽的模型,以其“逼真”和“富有想象力”的視頻生成能力,徹底顛覆了傳統視頻生成
    的頭像 發表于 02-19 11:03 ?887次閱讀