精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

“Image outpainting”能從一個圖像片段“推斷”出外延的部分補全成整個畫面

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-31 09:52 ? 次閱讀

圖像修復(Image inpainting)是一個已經被廣泛研究的計算機視覺問題,即恢復圖像中缺失的部分。斯坦福大學CS230課程的Mark Sabini等人提出“Imageoutpainting”,比圖像修復更進一步,能從一個圖像片段“推斷”出外延的部分,補全成整個畫面。這篇論文獲得了CS230期末poster的第一名,效果非常驚艷。

這是Painting Outside the Box: Image Outpainting這篇論文的代碼實現。這篇論文在吳恩達的斯坦福大學CS230課程中獲得了期末Poster的第一名。

圖像修復(Image inpainting)是一個已經被廣泛研究的計算機視覺問題,涉及恢復圖像中缺失的部分。

目前最先進的圖像修復方法方法包括Satoshi Iizuka等人在SIGGRAPH 2017提出的基于GAN的方法[1],以及NVIDIA的Guilin Liu等人提出的基于CNN的方法[2]。

在這個研究中,我們的目標是將[1]的方法拓展到修復圖像之外的部分(outpainting),即補全超出圖像邊界的畫面。

通過遞歸地進行outpainting,可以任意地擴展圖像。

問題描述和數據準備

給定一幅 m × n 的源圖像,生成一幅 m × (n + 2k) 的圖像,其中

要解決的問題是:m=128,n=64,k=32

數據

baseline圖像:128×128的RGB城市圖像

數據集:Place365-Standard [3]

包含36500張256×256的RGB圖像,被降低采樣到128×128

100張圖像用于驗證

Place365數據集中城市圖像的樣本

數據預處理:

給定圖像,標準化成 [0,1] →?

定義mask M:

定義補足的mask

計算

堆疊

輸出

方法

訓練Pipeline:

使用與文獻[1]類似的DCGAN結構(G,D);

給定Itr,進行預處理來得到In和Ip;

運行G(Ip)來得到outpainted的圖像Io;

在Io和ground-truthIn上運行D;

訓練Schedule:

用于調節G和D的三階段訓練;

階段i:使用Adam(Ir=0.0001,β1=0.9,β2=0.999,ε=10-8)在迭代Ti中優化損失(i);

在18:2:80的分片中選擇T1,T2,T3

α=0.0004控制MSE損失

后處理:

將Io重整化為[0,255]→

使用泊松克隆(Seamless Cloning)來將進行混合

模型

結構

除了G和D的最后一層之外,每一層都是ReLU。G和D的輸出是Sigmoid函數。其中,η是伸縮因子(dilation factors)。

Outpainting

驗證集中保留圖像樣本的修復結果,與原始ground-truth一起顯示。模型訓練了100個時段(相當于227,500次迭代),批量大小為16。

Places365的MSE損失

在Place365中訓練MSE損失。不同階段的背景顏色是不同的。在階段3中,由于將聯合損失(joint loss)進行了優化,MSE損失有小幅度增長。

本地標識符(Local Discriminator)

使用本地標識符進行訓練,減少了垂直條帶并提高了色彩保真度,但是增加了artifact和訓練時間。

擴張(dilation)的影響

網絡的訓練在城市圖像上過擬合了。在擴張不足的情況下,由于接受域有限,網絡無法outpaint。

遞歸的outpainting

在擴展和填充之后,可以將圖像輸入到網絡中。遞歸地將這個過程進行重復操作,將圖像的寬度擴大到3.5。正如期望的那樣,噪聲隨著連續迭代而混合。

結論

最終實現了圖像的outpainting;

三階段的訓練有助于其穩定性;

對于outpainting,擴張卷積對充分的神經元接受域至關重要

雖然會伴隨噪聲和誤差,但對outpainting進行遞歸是可行的。

用Keras實現Image Outpainting

在代碼實現中,我們對256*256的圖像進行了一些修改:

添加了Identity loss,即從生成的圖像到原始圖像

從訓練數據中刪除了patches(訓練pipeline)

用裁減(cropping)代替了掩膜(masking)(訓練pipeline)

添加了卷積層

結果

模型用海灘的數據訓練了200 epochs。

Recursive painting

用Keras實現Image Outpainting

1. 準備數據:

2. 構建模型

要從頭開始構建模型,你可以直接運行’outpaint.ipynb',或

你可以下載訓練完成模型,并將其移到“checkpoint/”,然后運行它。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1083

    瀏覽量

    40415
  • 計算機視覺
    +關注

    關注

    8

    文章

    1696

    瀏覽量

    45927

原文標題:吳恩達斯坦福CS230第一名:圖像超級補全,效果驚艷(附代碼)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    《DNK210使用指南 -CanMV版 V1.0》第三十七章 image圖像對比實驗

    圖像的差值的絕對值,并返回image對象,返回的圖像中較暗的部分,即兩
    發表于 11-07 09:33

    五、畫面處理器

    割是很好的選擇。例如工業處理控制及賭博時。畫面分割器有四分割、九分割、十六分割幾種,可以在臺監視器上同時顯示4、9、16攝像機的圖像
    發表于 07-10 08:54

    數字圖像處理,Digital Image Processing

    數字圖像處理,Digital Image ProcessingIntroduction and Digital Image Fundamentals?What is an Image?
    發表于 06-18 07:49

    急求51單片機輸出pwm波的程序,能從一I/O口輸出就行,之前找了很多都改不對

    急求51單片機輸出pwm波的程序,能從一I/O口輸出就行,之前找了很多都改不對
    發表于 07-15 10:57

    GoldWave如何裁剪音樂片段

    ,如圖所示,第一個綠色的按鈕指的是從來開始播放,第二按鈕指的是用鼠標選定段聲波進行播放。通過選擇不同的部分進行試聽來選取你要的片段。如圖
    發表于 12-20 16:59

    怎么設計視頻圖像畫面分割器?

    ,設計中所使用的獨立的邏輯電路較多,有的甚至使用專用的DSP芯片去處理視頻畫面的分割。雖然可以滿足對視頻圖像數據處理速度的要求,但是還需要外加CPU去協調系統工作,使得整個系統仍顯得體積較大,而且系統
    發表于 09-25 07:29

    能通過空間條件坐標和隱變量生成圖像片、并合成完整圖片的網絡模型

    在前文的架構圖中我們已經看到它由生成器和判別器兩網絡和兩套坐標系統組成,其中包括了細粒度的局域圖像片坐標系統和粗粒度的宏圖像片坐標系統。整個過程中包含了三種
    的頭像 發表于 04-22 14:37 ?4249次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>個</b>能通過空間條件坐標和隱變量生成<b class='flag-5'>圖像片</b>、并合成完整圖片的網絡模型

    Linux的源頭 從一故事說起

    Linux的起源:從一故事說起
    的頭像 發表于 01-13 16:38 ?1012次閱讀

    image圖像處理的PHP庫資料免費下載

    本文檔的主要內容詳細介紹的是image圖像處理的PHP庫資料免費下載。
    發表于 05-27 12:15 ?10次下載
    <b class='flag-5'>image</b><b class='flag-5'>圖像</b>處理的PHP庫資料免費下載

    熟悉Sivarc的畫面規則,建立程序塊與畫面對象的鏈接

    3) 創建精致屏,例如TP1200,插入畫面,例如“根畫面”,輸入文字“西門子Siva
    的頭像 發表于 09-04 17:34 ?4456次閱讀
    熟悉Sivarc的<b class='flag-5'>畫面</b>規則,建立<b class='flag-5'>一</b><b class='flag-5'>個</b>程序塊與<b class='flag-5'>一</b><b class='flag-5'>個</b><b class='flag-5'>畫面</b>對象的鏈接

    Halcon教程:Image、Regiong、XLD基礎

    讀取的3種方式: read_image( image,'filename') ? ? ? //image 是輸出對象,后面是輸入文件的路徑和名稱 讀取多圖:? 1,申明
    的頭像 發表于 01-07 11:52 ?4917次閱讀
    Halcon教程:<b class='flag-5'>Image</b>、Regiong、XLD基礎

    基于生成式對抗網絡的圖像補全方法

    圖像補全是數字圖像處理領域的重要研究方向,具有廣闊的應用前景。提出了種基于生成式對抗網絡(GAN)的圖像
    發表于 05-19 14:38 ?14次下載

    從一名為DDPM的模型說起

    DDPM模型,全稱Denoising Diffusion Probabilistic Model,可以說是現階段diffusion模型的開山鼻祖。不同于前輩GAN、VAE和flow等模型,diffusion模型的整體思路是通過種偏向于優化的方式, 逐步從一
    的頭像 發表于 01-05 15:40 ?1674次閱讀

    20解決日常問題的Python代碼片段

    在本文中,將分享20 Python 代碼片段,以幫助你應對日常編程挑戰。你可能已經知道其中片段,但有些其他片段對你來說可能是新的。趕
    的頭像 發表于 03-13 09:40 ?980次閱讀

    半導體襯底和外延的區別分析

    作為半導體單晶材料制成的晶圓片,它既可以直接進入晶圓制造流程,用于生產半導體器件;也可通過外延工藝加工,產出外延片。
    的頭像 發表于 04-24 12:26 ?3556次閱讀
    半導體襯底和<b class='flag-5'>外延</b>的區別分析