精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI視頻創作一條龍!達摩院“尋光”平臺炸場WAIC,突破可控編輯難題

卡奧斯開源社區 ? 來源:jf_92107760 ? 作者:jf_92107760 ? 2024-07-09 18:19 ? 次閱讀

卡奧斯智能交互引擎是卡奧斯基于海爾近40年工業生產經驗積累和卡奧斯7年工業互聯網平臺建設的最佳實踐,基于大語言模型和RAG技術,集合海量工業領域生態資源方優質產品和知識服務,旨在通過智能搜索、連續交互,實時生成個性化的內容和智能化產品推薦,為用戶提供快速、可靠的交互式搜索服務,首創了聚焦工業領域的智能交互引擎。

詳情戳:卡奧斯智能交互引擎

AIGC時代,視頻創作這事兒真的不一樣了。

就像這樣,輕輕一圈,選定目標立刻變身單獨圖層,再絲滑嵌入不同的背景視頻,場景變換so easy~

wKgaomaNDo6AR2pSAB1uboTkOdo152.gifwKgZomaNDpCAS3fcAC3awFqdVQg861.gif

想要調整一下鏡頭角度,交給AI,同樣能一鍵完成:

wKgZomaNDpKAD0bYACLCtNQOdNo851.gif

還能一鍵消除、修改目標:

wKgZomaNDpSAJ76DAH1qC9l9eeQ809.gif

后期再也不用加班加到手抽筋(doge)。

劃!重!點!這還不是實驗室里的單一技術demo,而是馬上就要開放內測,讓創作者們直接可以用起來的一站式AI視頻創作平臺——“尋光”。

就是說,傳統上分散在不同制作流程中的劇本創作、分鏡圖設計、視頻素材編輯等步驟,現在都可以在AI加持下,在同一個平臺上流暢完成。

這就是阿里達摩院在上海世界人工智能大會上帶來的最新驚喜。

演示一出,現場的觀眾都坐不住了。

wKgaomaNDpeAPdlRAAGtTIkTDyQ062.jpg

而達摩院官方,也透露出了AI視頻領域新成果背后更大的“野心”:

不對標Sora,而是走自己的路,希望更快讓AI生產力匹配人類想象力

“尋夢光影間”

所謂尋光,意指“尋夢光影間”:

即通過人工智能技術,提供全新的視頻創作模式。

wKgZomaNDpeAZgmKAADOPZ0QVVw690.jpg

與Sora等今年備受關注的AI視頻生成模型不同,尋光關注到的,是“Sora之后,視頻工作流的變革”。

達摩院認為,Sora等AI視頻生成模型給足了人們對視頻生產方式徹底變革的想象力,但一方面,AI視頻內容的可控編輯,包括對復雜劇情的理解、生成對象的一致性等,仍然是當前算法所面臨的一大挑戰。

另一方面,業界尚沒有統一的AI視頻編輯平臺,能讓創作者們一站式體驗到AI加持的視頻創作全流程。

舉個例子,OpenAI創始成員Andrej Karpathy最近也玩上了AI視頻,整出了個AI版《傲慢與偏見》。

wKgaomaNDpiAOWo2AAKn0uuR_sI796.jpg

在這個短片的制作過程中,他用到的工具包括Claude、Ideogram、Luma、ElevenLabs、VEED……而他本人也抱怨說:

老實說這個工作流非常混亂,工具與工具之間存在大量的復制粘貼,3個片段的簡單小視頻就花了我大約1個小時的時間。
這里面存在一個巨大的機會。誰正在打造100%的AI原生視頻制作平臺?

達摩院打造尋光,定位為PUGC一站式AI視頻創作平臺,目標正是針對以上問題,用AI能力重塑傳統視頻制作的全流程

具體來說,尋光可以輔助用戶創作劇本、分鏡圖等,支持對生成及上傳素材進行豐富的AI編輯,包括人物控制、場景控制、運鏡控制、目標新增/消除/修改等10多種功能。

wKgZomaNDpiAS-tLAAE9HV54ZVw851.jpg

并且在交互方面,主打“讓視頻編輯像操作PPT一樣簡單”

以分鏡設計環節為例,上傳到尋光的原始視頻素材,會由算法切分成多個分鏡頭。

在創作空間里,用戶可以方便地查看到每一個分鏡頭,并用簡單的拖拽操作對其進行調整。

在新建的空白分鏡中,除了添加已有素材,尋光平臺還支持用戶調用多種多模態生成模型,生產新的內容。

wKgaomaNDpmANaB-AAESfyvvQXc330.jpg

而在編輯功能方面,尋光強調的是精細化的編輯和控制:在AI加持下,依據用戶意圖,在語義層面而不是像素層面實現編輯;同時,視頻里的人體、人臉、前景、背景等任意局部目標,都可以進行精細化的編輯和修改。

在現場,達摩院視覺技術實驗室高級算法專家陳威華著重提到了基于視頻圖層的編輯能力

以前景圖層功能為例,用戶通過文本輸入,即可生成符合描述的、具有透明背景的視頻,并且一鍵就能將其融合到其他背景視頻當中。

wKgZomaNDpqAXsWtADDSKWQb4IU629.gif

尋光也支持圖層拆解功能,用戶在視頻第一幀選擇想要提取的物體,算法就會自動跟蹤,把整段視頻中對應的目標拆解出來,形成獨立的帶透明背景的視頻圖層。

飄動的頭發也扣得很精細的那種:

wKgZomaNDpyAXZkOAAPnGk2nWZM681.gif

另外,在對視頻全局元素的編輯方面,風格遷移上,尋光平臺提供了20+不同風格。

wKgaomaNDp6AcfFwAFySxVBqiZ4748.gif

運鏡控制上,左右平移、上下平移、推進拉遠、左右環繞等都能支持。

wKgZomaNDqCAHxsHAAFm8YcDJjs066.jpg

在對視頻局部元素的編輯方面,除了目標消除,尋光平臺還能實現人臉的精準控制:

視頻取自國風武俠動漫《少年白馬醉春風》第三集

輕輕一拉實現運動控制:

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30239

    瀏覽量

    268484
  • 人工智能
    +關注

    關注

    1791

    文章

    46896

    瀏覽量

    237672
收藏 人收藏

    評論

    相關推薦

    可靈AI全球首發視頻模型定制功能,助力AI視頻創作

    近日,快手旗下的可靈AI在全球范圍內率先推出了視頻模型定制功能,這創新之舉成功解決了AI視頻生成過程中人物IP穩定性不足的
    的頭像 發表于 11-26 14:02 ?268次閱讀

    行家放話!驍8至尊版是一條大冰龍:徹底穩了

    10月12日消息,iQOO產品經理戈藍V表示,高通驍8至尊版是一條大冰龍,很難想象,過去的好多重載游戲在我這臺手機上變成了中輕載,等通子發布會后再細聊。此前博主數碼閑聊站淺測了高通驍8至尊版量產
    的頭像 發表于 10-17 12:26 ?324次閱讀
    行家放話!驍<b class='flag-5'>龍</b>8至尊版是<b class='flag-5'>一條</b>大冰龍:徹底穩了

    AI 大模型行業應用:企業如何走出一條智能化蛻變之路?

    隨著 chatGPT 的橫空問世,我們對于人工智能在日常生活中的應用場景逐漸了解,無論是搜索、問答、文生圖還是文生視頻都出現了很多創意,甚至 AI 還可以做詩,輸入一條指令,就可以讓它當場賦詩
    的頭像 發表于 09-27 18:16 ?632次閱讀

    即夢AI上線,字節跳動挑戰Sora等AI創作平臺

    字節跳動近期動作頻頻,其剪映團隊精心研發的“即夢AI”移動版已正式登陸蘋果App Store,標志著字節在AI創作領域的又重要布局。即夢AI
    的頭像 發表于 08-07 16:47 ?546次閱讀

    商湯發布首個“可控”人物視頻生成大模型Vimi

    近日,商湯科技在人工智能領域再次取得重大突破,正式發布了其首個面向消費者的“可控”人物視頻生成大模型——Vimi。這創新技術的問世,標志著視頻
    的頭像 發表于 07-04 15:29 ?717次閱讀

    谷歌AI突破:為無聲視頻智能配音

    近日,谷歌DeepMind團隊公布了項革命性的技術——利用AI為無聲視頻生成背景音樂的“video-to-audio”技術。這技術的出現,不僅為
    的頭像 發表于 06-21 10:50 ?468次閱讀

    AI角色創作平臺「捏Ta」完成超千萬元融資

    AI角色創作平臺“捏Ta”(公司名為“看見概念”)近期完成了天使輪和Pre-A輪融資,總額超千萬元。
    的頭像 發表于 04-12 10:41 ?832次閱讀
    <b class='flag-5'>AI</b>角色<b class='flag-5'>創作</b><b class='flag-5'>平臺</b>「捏Ta」完成超千萬元融資

    迪思與百度智能云聯手發布AI視頻創作模型

    迪思傳媒與百度智能云聯手研發的AI視頻創作模型D&S-AI Video于3月25日正式亮相,并成功集成至迪思AI智鏈
    的頭像 發表于 03-26 11:46 ?686次閱讀

    云知聲AIGC內容創作平臺藍藻AI全新升級

    近日,云知聲AIGC內容創作平臺藍藻AI宣布完成全新升級,并推出超值會員服務,旨在為廣大創作者提供更豐富多元的聲音選擇,助力內容創作更高效、
    的頭像 發表于 03-16 14:05 ?1204次閱讀

    Stability AI與Morph AI共同推出體化AI視頻創作工具

    近日,業界領先的AI技術公司Stability AI與中國AI創業公司Morph AI達成重要合作。雙方宣布共同推出款革新性的all-in
    的頭像 發表于 03-05 10:44 ?849次閱讀

    阿里達摩北京公司新增AI業務

    阿里巴巴達摩(北京)科技有限公司近日進行了工商變更,經營范圍有所調整。具體來說,公司去除了智聯網、芯片技術、量子計算等數據通信、電子產品、軟件和硬件技術及產品的研究、開發等業務,而新增了人工智能應用軟件開發、人工智能基礎軟件開發,以及第
    的頭像 發表于 02-23 11:39 ?1004次閱讀

    OpenAI 在 AI 生成視頻領域扔出枚“王”,視頻生成模型“Sora”

    ABSTRACT摘要2月16日凌晨,也就是中國大年初七,OpenAI在AI生成視頻領域扔出枚“王”,宣布推出全新的生成式人工智能模型“Sora”。這家舊金山公司周四推出的該工具使用
    的頭像 發表于 02-22 08:25 ?349次閱讀
    OpenAI 在 <b class='flag-5'>AI</b> 生成<b class='flag-5'>視頻</b>領域扔出<b class='flag-5'>一</b>枚“王<b class='flag-5'>炸</b>”,<b class='flag-5'>視頻</b>生成模型“Sora”

    UCB_SWAP配置信息共16,寫入一條有效配置后,上一條需寫1使配置無效是為什么?

    UCB_SWAP配置信息共16,寫入一條有效配置后,上一條需寫1使配置無效。 經過實測發現配置是從下至上檢索,取最后一條有效配置,而不是從上至下檢索,取第
    發表于 01-24 08:31

    云知聲全新推出AIGC內容創作平臺藍藻AI

    近日,云知聲基于智能語音技術和山海大模型技術,全新推出AIGC內容創作平臺——藍藻AI,為創作者提供AI聲音克隆、
    的頭像 發表于 01-10 13:38 ?784次閱讀

    產學研三界頂級大咖分享:RISC-V場景Show暨開源生態高級別論壇定檔12/19

    和中科軟件研究所高級工程師于佳耕出席,現場為大家分享新輪處理器技術突破、RISC-V架構生態建設以及開源操作系統教學。同時,現場嘉賓還將分享勘智AI芯片的性能展示及其在開源操作系統
    發表于 12-15 18:36