精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

采用無監督學習的方法,用深度摘要網絡總結視頻

zhKF_jqr_AI ? 2018-01-15 10:49 ? 次閱讀

隨著在線視頻數量的爆炸式增長,想從茫茫網絡世界中找到自己想要的視頻可是要費一番功夫。于是有人就想到,何不也給視頻創作一份摘要呢?就像書的簡介一樣,觀眾只需要看看摘要,就了解視頻的大概內容了。

這的確是個好方法,不過面對如此龐大的視頻庫,如何大批量處理它們呢?在此之前,許多研究者提出了不同的方法為視頻大規模創建摘要,例如循環神經網絡(RNN)、長短期記憶(LSTM)、雙向長短期記憶網絡(bidirectional LSTM)和行列式點處理(DPP)模塊結合的方式等等。但都是需要監督的總結方式,其中并沒有一個針對所有視頻的標準答案(ground truth)。所以仍然需要無監督的摘要生成方式。

中科院和英國倫敦大學瑪麗女王學院的研究人員就生成視頻摘要提出了一種新方法,采用無監督學習的方法,用深度摘要網絡(Deep Summarization Network,DSN)總結視頻。整個過程為連續決策過程(sequential decision-making process),DSN為編碼-解碼結構,其中編碼器是一個能夠提取視頻幀特征的卷積神經網絡,解碼器是一個雙向LSTM網絡,能夠基于被選中的動作生成概率。在訓練過程中,研究人員設計了新穎的多樣性-代表性獎勵(diversity-representativeness reward)函數,可以直接判斷生成視頻摘要的多樣化和代表化。下圖是該模型學習過程的圖示:

采用無監督學習的方法,用深度摘要網絡總結視頻

深度摘要網絡(DSN)

DSN的編碼器是一個卷積神經網絡,它從輸入的長度為T的視頻框架{vt}t=1T中提取視覺特征{xt}t=1T。解碼器是一個雙向循環神經網絡(BiRNN),最上面是完全連接層。將提取的{xt}t=1T輸入到解碼器后,生成相應的隱藏狀態{ht}t=1T。每個ht都是前隱藏狀態htf和后隱藏狀態htb的連接。在實踐中,研究人員采用GoogLeNet當做CNN模型,并且用LSTM訓練提升RNN的性能。

多樣性-代表性獎勵函數

在訓練時,DSN會接收到一個獎勵R(S),來評估生成的摘要。而DSN的目標是不斷生成高質量的視頻摘要,讓獎勵最大化。通常,高質量的視頻摘要必須既有代表性,又豐富多彩。為了達到這一目的,研究人員提出了一種新穎的獎勵方式,它由多樣性獎勵Rdiv和代表性獎勵Rrep組成。

在多樣性獎勵中,Rdiv可以用以下公式表示:

y表示已選中的幀,d(xt,xt')是多樣化公式,如下表示:

選出的視頻幀越多樣(越不相像),agent收到的多樣性獎勵越高。

而代表性獎勵函數主要是測量生成的摘要是否能總結原始視頻,研究人員將其看成k中心點問題,將Rrep定義為:

在這個獎勵之下,agent能夠選出最接近特征空間聚類中心的幀。

最后,Rdiv和Rrep共同工作,指導DSN學習:

R(S)=Rdiv+Rrep

實驗測試

該模型在SumMe和TVSum兩個數據集上進行測試。SumMe有25個用戶視頻,涵蓋了假期和運動等多種話題。其中的視頻長度約為1至6分鐘,都經過了15至18人進行標注,所以每段視頻都有多個標準摘要(ground truth)。TVSum中有50段視頻,包括新聞、紀錄片等,長度2到10分鐘不等,每段都有20人標注。除此之外還有另外兩個數據集,OVP和YouTube,用來測試強化后的模型。

在進行比較時,研究人員分了好幾種情況進行對比:只用多樣性獎勵函數進行訓練(用D-DSN表示)、只用代表性獎勵函數進行訓練(用R-DSN表示)、兩種函數都有的(用DR-DSN表示)。另外,還將模型擴展到監督學習的實驗中,用DR-DSNsup表示。在SumMe和TVSum上不同版本的結果如下表所示:

可以看到,DR-DSN的結果明顯優于D-DSN和R-DSN,同時與DSNsup相比,DR-DSN的結果也非常出色。

接著,研究人員將DR-DSN與其他無監督方法進行比較,可以看到,DR-DSN在兩個數據集上比其它方法表現得都好,并且差距非常明顯。如下圖所示:

另外,在與其他監督式方法的比較中,DR-DSNsup也是完勝:

這些結果有力地證明了DSN框架的有效性。

質量評估

研究人員挑選了一段一個男人自制辣香腸三明治的視頻作為質量評估的素材。

采用無監督學習的方法,用深度摘要網絡總結視頻

上圖中可以看到,四種方法都生成了高質量的視頻摘要,它們都均勻選取了視頻的每一過程。不過最接近完整故事線的是DR-DSNsup,因為它展示了從準備食材到制作的全過程。

接著研究人員對原始預測(raw prediction)進行可視化,通過比較預測和原視頻,我們可以更深入地了解DSN學習的情況。

采用無監督學習的方法,用深度摘要網絡總結視頻

可以看到,無監督模型預測的重要性曲線與監督模型預測的有幾處相似,并且這些地方與之前人們標注認為重要的地方相吻合。這充分表明,通過多樣性-代表性獎勵函數訓練過的強化學習能很好地模仿人類學習過程,并有效地教DSN認出視頻中重要的幀。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 視頻
    +關注

    關注

    6

    文章

    1937

    瀏覽量

    72820
  • DSN
    DSN
    +關注

    關注

    0

    文章

    8

    瀏覽量

    4574
  • 無監督學習
    +關注

    關注

    1

    文章

    16

    瀏覽量

    2752

原文標題:DSN:基于深度強化學習,無監督生成視頻摘要

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    深非監督學習-Hierarchical clustering 層次聚類python的實現

    深度學習基礎-17】非監督學習-Hierarchical clustering 層次聚類-python實現
    發表于 04-28 10:07

    如何用卷積神經網絡方法去解決機器監督學習下面的分類問題?

    人工智能下面有哪些機器學習分支?如何用卷積神經網絡(CNN)方法去解決機器學習監督學習下面的分類問題?
    發表于 06-16 08:09

    利用機器學習來捕捉內部漏洞的工具運用監督學習方法可發現入侵者

    Darktrace新網絡安全公司與劍橋大學的數學家合作,開發了一種利用機器學習來捕捉內部漏洞的工具。它運用監督學習方法,查看大量未標記的數據,并找到不遵循典型模式的碎片。這些原始數據
    發表于 11-22 16:01 ?1228次閱讀

    你想要的機器學習課程筆記在這:主要討論監督學習監督學習

    with experience E(一個程序從經驗E中學習解決任務T進行某一任務量度P,通過P測量在T的表現而提高經驗E(另一種定義:機器學習數據或以往的經驗,以此優化計算機程序的性能標準。) 不同類型的機器
    發表于 12-03 17:12 ?539次閱讀

    如何用Python進行監督學習

    監督學習是一種用于在數據中查找模式的機器學習技術。監督算法給出的數據不帶標記,只給出輸入變量(X),沒有相應的輸出變量。在
    的頭像 發表于 01-21 17:23 ?4226次閱讀

    機器學習算法中有監督監督學習的區別

    監督學習的好處之一是,它不需要監督學習必須經歷的費力的數據標記過程。但是,要權衡的是,評估其性能的有效性也非常困難。相反,通過將監督學習算法的輸出與測試數據的實際標簽進行比較,可以很
    的頭像 發表于 07-07 10:18 ?5714次閱讀

    最基礎的半監督學習

    標記數據訓練的監督學習技術得到更好的結果。這是半監督學習系列文章的第1部分,對這個機器學習的重要子領域進行了簡要的介紹。 區分半監督學習,監督學習
    的頭像 發表于 11-02 16:08 ?2618次閱讀

    監督學習最基礎的3個概念

    導讀 今天給大家介紹半監督學習中的3個最基礎的概念:一致性正則化,熵最小化和偽標簽,并介紹了兩個經典的半監督學習方法。 沒看一的點這里哈:半監督學習入門基礎(一) 半監督學習 (SSL
    的頭像 發表于 11-02 16:14 ?2931次閱讀
    半<b class='flag-5'>監督學習</b>最基礎的3個概念

    為什么半監督學習是機器學習的未來?

    為什么半監督學習是機器學習的未來。 監督學習是人工智能領域的第一種學習類型。從它的概念開始,無數的算法,從簡單的邏輯回歸到大規模的神經網絡
    的頭像 發表于 11-27 10:42 ?3875次閱讀

    監督學習:比監督學習做的更好

    監督學習是人工智能領域的第一種學習類型。從它的概念開始,無數的算法,從簡單的邏輯回歸到大規模的神經網絡,都已經被研究用來提高精...
    的頭像 發表于 12-08 23:32 ?1390次閱讀

    分析總結基于深度神經網絡的圖像語義分割方法

    隨著深度學習技術的快速發展及其在語義分割領域的廣泛應用,語義分割效果得到顯著提升。對基于深度神經網絡的圖像語義分割方法進行分析與
    發表于 03-19 14:14 ?21次下載
    分析<b class='flag-5'>總結</b>基于<b class='flag-5'>深度</b>神經<b class='flag-5'>網絡</b>的圖像語義分割<b class='flag-5'>方法</b>

    機器學習中的監督學習應用在哪些領域

    監督學習|機器學習| 集成學習|進化計算| 非監督學習| 半監督學習| 自監督學習|?
    發表于 01-20 10:52 ?4919次閱讀
    機器<b class='flag-5'>學習</b>中的<b class='flag-5'>無</b><b class='flag-5'>監督學習</b>應用在哪些領域

    深度學習框架和深度學習算法教程

    基于神經網絡的機器學習方法。 深度學習算法可以分為兩大類:監督學習
    的頭像 發表于 08-17 16:11 ?1048次閱讀

    深度學習的由來 深度學習的經典算法有哪些

    深度學習作為機器學習的一個分支,其學習方法可以分為監督學習
    發表于 10-09 10:23 ?532次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>的由來 <b class='flag-5'>深度</b><b class='flag-5'>學習</b>的經典算法有哪些

    深度學習中的監督學習方法綜述

    應用中往往難以實現。因此,監督學習深度學習中扮演著越來越重要的角色。本文旨在綜述深度學習中的
    的頭像 發表于 07-09 10:50 ?539次閱讀