精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用URL2Video可以將網頁快速生成有創意的短視頻

LiveVideoStack ? 來源:LiveVideoStack ? 作者:LiveVideoStack ? 2020-12-07 14:07 ? 次閱讀

機器學習可以實現對網頁內容的理解,并選取關鍵對象生成有趣的短視頻。Google研究團隊通過使用URL2Video可以將網頁快速生成有創意的短視頻。包括百度、快手、字節跳動等都有相關的短視頻自動化生產工具,隨著技術的成熟,將有大量的短視頻出自自動化工具之手。在12月的LiveVideoStackCon 2020 SFO線上大會上,百度美國研究院資深研究員陳曦將會介紹“無人值守的大規模AI視頻生產”。

在Google,我們正在積極探索在制作多媒體內容時,人們如何使用由機器學習和計算方法提供的創造性工具,從創作音樂、重新架構視頻,到繪畫等等都涉及到了這方面內容。尤其是視頻制作這樣一個頗具創意的過程,它可以很好地受益于這些工具,因為它需要做出一系列決策,確定哪些內容最適合目標受眾,如何在視圖中妥善排布現有資源,以及怎樣進行時間安排能夠帶來最具吸引力的描述。但假如一個人能利用現有的資源,比如一個網站,來開啟視頻創作呢?大多數企業主辦的網站都呈現了關于其產品或服務豐富的視圖內容,所有這些內容都可以被重新應用到其他多媒體格式,比如視頻,這可能使那些沒有大量資源的人能夠接觸到更廣泛的受眾。 2020年UIST上發表的“網頁端視頻的自動化制作”里,我們介紹了一種基于內容所有者提供的時間和視圖限制,將網頁自動轉換為短視頻的研究原型——URL2Video。URL2Video從HTML源中提取資源(文本、圖像或視頻)及其設計風格(包括字體、顏色、圖形布局和層次結構),并將這些可視資源組合成一系列的快照,同時保持與源頁面相似的外觀和感覺,然后根據用戶指定的縱橫比和持續時間,將這些材料重新利用,渲染成一個適合產品和服務廣告的視頻。

URL2Video概述

假設用戶提供了一個闡述他們業務的網頁URL,URL2Video會自動從頁面中選擇關鍵內容,并根據一組針對熟悉網頁設計和視頻廣告制作的設計師的訪談研究得到的啟發式算法,決定每個資源的時間和視圖展示。這些如設計師般熟知的啟發式算法捕獲常見的視頻編輯樣式,包括內容層次結構,限制一個快照中的信息量及其持續時間,為品牌提供一致的顏色和樣式等等。利用這些信息,URL2Video解析網頁,分析內容,選擇視覺突出的文本或圖像,同時保留它們的設計風格,并根據用戶提供的視頻規范進行組合。

通過在輸入的網頁中提取結構內容和設計,URL2Video做出自動編輯決策,在視頻中呈現關鍵信息。它考慮到用戶定義的輸出視頻的時間限定(比如以秒為單位的持續時間)和空間限定(比如高寬比)。

網頁分析

一個網頁的URL,URL2Video會提取它的文檔對象模型(DOM)信息和多媒體材料。出于研究模型的目的,我們將域限制在靜態網上,這些頁面包含HTML層次結構中保存的突出資源和標題,這些層次結構遵循最近的網頁設計原則,鼓勵使用重點的元素、更清晰的部分以及引導讀者感知信息的視覺焦點順序。URL2Video將這些視覺上可區分的元素標記到資源組的候選列表,每個元素可能包含一個標題、一個產品圖象、詳細描述和調用操作按鈕,并捕獲每個元素的原始素材(文本和多媒體文件)和詳細的設計規范(HTML標簽、CSS樣式和呈現位置)。然后,通過根據每個資源組的視覺外觀和注釋,包括它們的HTML標簽、呈現的尺寸還有顯示在頁面上的順序對每個組進行排序。這樣,在頁面頂部占據較大區域的資源組將獲得更高的分數。

限定型的資源選擇

在制作視頻時,我們考慮了兩個目標:(1)每個鏡頭都應該提供簡潔的視頻信息;(2)視覺設計應該與源網頁一致?;谶@些目標和用戶提供的視頻限定條件,包括預期的視頻持續時間(以秒為單位)和高寬比(通常為16:9、4:3、1:1等),URL2Video自動選擇并命令資源組優化總體優先級分數。為了使內容簡潔,它只顯示頁面中的主要元素,例如標題和一些多媒體資源。它限定了觀眾所感知內容的每個視覺元素的持續時間。這樣,簡短的視頻強調了頁面頂部最突出的信息,時間長一些的視頻則包含了更多的商業活動或產品信息。

畫面構圖與視頻渲染

根據基于DOM層次結構的有序資源列表,URL2Video并行依照從訪談研究中獲得的設計啟發,對時間和空間安排做出決策,將資源在單個鏡頭中展現出來。它將元素的圖形布局轉換為視頻的縱橫比,并應用了包括字體和顏色在內的樣式選擇。為了使視頻更具動感和吸引力,它調整了資源的顯示時間。最后,它將內容渲染為MPEG-4格式的視頻。

用戶控制

研究原型界面允許用戶查看源網頁提取的每個視頻鏡頭中的設計屬性,以及重新排版材料,更改細節設計,如顏色和字體,并更改限制條件來生成新的視頻。

在URL2Video的創作界面(左)中,用戶指定源頁面輸入的URL、目標頁面視圖的大小以及輸出視頻參數。URL2Video分析網頁,并提取主要的視覺組件。由它組成了一系列的鏡頭,并將關鍵畫面可視化為一個故事板。這些組件滿足輸入時間和空間限定后輸出呈現為視頻。用戶可以播放視頻,檢查設計屬性(右下角),并進行調整以做視頻更改,例如重新排序鏡頭(右上)。

URL2Video用例

我們在現有的各種網頁上演示了端到端的URL2Video的性能。下面我們特別展示一個實例結果,其中URL2Video將嵌入多個短視頻剪接的頁面轉換為一個12秒的輸出視頻。請注意它如何在從源網頁面捕獲的視頻中對字體和顏色選擇、時間和內容排序作出自動編輯決定的。

URL2Video從我們的Google搜索介紹頁面(頂部)識別關鍵內容,包括標題和視頻資源。通過綜合考慮顯示流程、源設計和輸出限定,URL2Video將它們轉換為視頻(12秒的橫向視頻;底部) 下面的視頻作了進一步的演示: https://www.youtube.com/watch?v=3yFYc-Wet8k&feature=youtu.be 為了評估自動生成的視頻,我們與Google的設計師進行了一項用戶研究。實驗結果表明,URL2Video能夠有效地從網頁中提取設計元素,并通過引導視頻創建的過程為設計師提供支持。

下一步

雖然目前的研究集中在視覺展示,但我們正在開發新的技術,以在視頻編輯中支持音軌和畫外音。總之,我們設想的未來是,創作者專注于做出高層決策,而機器學習模型配合其在多個平臺上為最終視頻的制作提供詳細的時間和圖形編輯建議。

致謝

我們非常感謝我們的論文合著者Zheng Sun(Research)和Katrina Panovich(YouTube)。我們還要感謝我們的同事,他們(按姓氏的字幕順序)-JordanCanedy, Brian Curless, Nathan Frey, Madison Le, Alireza Mahdian, Justin Parra,Emily Ryan, Mogan Shieh, Sandor Szego和Weilong Yang-為URL2Video作出了貢獻。我們感謝我們的領導人Tomas Izo, RahulSukthankar和Jay Yagnik的支持。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 自動化
    +關注

    關注

    29

    文章

    5512

    瀏覽量

    79106
  • 機器學習
    +關注

    關注

    66

    文章

    8377

    瀏覽量

    132409
  • 短視頻
    +關注

    關注

    1

    文章

    124

    瀏覽量

    8913

原文標題:URL2Video:把網頁自動創建為短視頻

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AIGC在視頻內容制作中的應用前景

    AIGC技術能夠顯著縮短視頻內容的制作周期。通過AI算法,可以快速生成視頻剪輯、特效、字幕和配樂等,減少人工操作的時間。例如,在
    的頭像 發表于 10-25 15:44 ?381次閱讀

    Adobe發布人工智能視頻創作工具:Firefly Video Model

    Adobe公司于10月15日正式揭曉了其最新研發的人工智能視頻創作工具——Firefly Video Model。這一創新解決方案旨在借助AI技術,賦能視頻內容創作者拓寬創意邊界,提升
    的頭像 發表于 10-15 16:20 ?681次閱讀

    視頻時鐘合成芯片怎么用

    視頻時鐘合成芯片(Video Clock Synthesizer,VCS)是一種用于生成和調整視頻信號時鐘的電子設備,廣泛應用于視頻處理、顯
    的頭像 發表于 10-10 11:17 ?209次閱讀

    Adobe推出一款人工智能視頻生產工具

    Adobe即將在今年晚些時候震撼發布其最新力作——Adobe Firefly Video Model,一款專為創意專業人士打造的生成視頻創作與編輯神器。作為Firefly圖像
    的頭像 發表于 09-12 16:37 ?450次閱讀

    MATLAB-網頁訪問與關閉

    MATLAB Web 瀏覽器中打開 url 指定的網頁。如果 url 是外部網站,web(url) 將在您的系統瀏覽器中打開該網頁。如果打
    發表于 09-05 16:23

    創建Trigger時設置的url可以傳參數嗎?

    創建Trigger時設置的url可以傳參數嗎?設置url參數的話沒有效果啊。默認url會傳遞參數嗎?在api文檔上沒有看到說明哦。
    發表于 07-15 07:30

    MediaTek聯合快手推出高效端側視頻生成技術

    的 AI 模型 I2V(image to video)Adapter 與 MediaTek 天璣 9300、天璣 8300 移動平臺強勁的 AI 算力,在端側實現由靜態圖像生成動態視頻
    的頭像 發表于 07-05 11:23 ?4757次閱讀

    Google開發專為視頻生成配樂的人工智能技術

    近日,科技巨頭Google旗下的人工智能研究實驗室DeepMind宣布了一項引人注目的技術突破——V2A技術(Video to Audio),這是一項專為視頻生成配樂的人工智能技術。這項技術的誕生,標志著人工智能在媒體創作領域邁
    的頭像 發表于 06-20 11:03 ?481次閱讀

    微軟網頁版PPT新增語音識別及字幕生成功能

    據報道,微軟計劃于今年六月份推出網頁版PowerPoint全新語音識別功能。此項功能將能夠監控PowerPoint視頻中的聲音,進而自動生成字幕。
    的頭像 發表于 05-16 14:36 ?368次閱讀

    [技術干貨]?MoneyPrinterTurbo,利用 AI 大模型,一鍵生成高清短視頻

    開始使用 步驟 1?訪問該促銷活動購買頁面,按照如下配置完成 AI 生成短視頻服務器的部署。 步驟 2?登錄彈性云服務器控制臺。使用 Linux 連接工具登錄服務器,或者在控制臺單擊“遠程登錄
    的頭像 發表于 04-07 15:11 ?1430次閱讀
    [技術干貨]?MoneyPrinterTurbo,利用 AI 大模型,一鍵<b class='flag-5'>生成</b>高清<b class='flag-5'>短視頻</b>

    Stability AI推出Stable Video 3D模型,可制作多視角3D視頻

    SV3D_u是Stable Video 3D的一個版本,僅需單幅圖片即可生成運動軌跡視頻,無須進行相機調整。擴充版本的SV3D_p加入了軌道視圖的特性,使其可以根據預設的相機路徑創建3
    的頭像 發表于 03-21 14:57 ?959次閱讀

    OpenAI 在 AI 生成視頻領域扔出一枚“王炸”,視頻生成模型“Sora”

    人工智能,根據書面命令立即創建短視頻。JAEALOT2024年2月16日2月16日凌晨,也就是中國大年初七,OpenAI在AI生成視頻領域扔
    的頭像 發表于 02-22 08:25 ?346次閱讀
    OpenAI 在 AI <b class='flag-5'>生成</b><b class='flag-5'>視頻</b>領域扔出一枚“王炸”,<b class='flag-5'>視頻生成</b>模型“Sora”

    openai發布首個視頻生成模型sora

    行業目前大概只有平均“4s”的視頻生成長度。 Sora能夠獲取現有視頻并對其進行擴展或填充缺失的幀,這一功能在視頻編輯、電影特效等領域具有應用前景,可以幫助用戶
    的頭像 發表于 02-21 16:45 ?1177次閱讀

    鴻蒙ArkUI開發-Video組件的使用

    視頻功能為例,在應用開發過程中,我們需要通過ArkUI提供的Video組件為應用增加基礎的視頻播放功能。借助Video組件,我們可以實現
    的頭像 發表于 01-23 16:59 ?1264次閱讀
    鴻蒙ArkUI開發-<b class='flag-5'>Video</b>組件的使用

    php生成動態網頁內容的方法

    PHP是一種廣泛用于Web開發的腳本語言,可用于生成動態網頁內容。在本文中,我們介紹使用PHP生成動態網頁內容的方法。 什么是動態
    的頭像 發表于 12-04 16:22 ?837次閱讀