精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

一款基于GAN的AI修圖大師可以將你從這類工作中解放出來

DPVg_AI_era ? 來源:lq ? 2019-02-27 09:43 ? 次閱讀

作為一個設計師,是否整天因為繁瑣枯燥的修圖工作不勝其煩?現(xiàn)在,一款基于GAN的AI修圖大師可以將你從這類工作中解放出來。修輪廓、改表情、生發(fā)、加耳環(huán)、去眼鏡、補殘圖,你能想到的它都能一鍵搞定。

這可能是史上最牛的AI修圖大師。

在一張人臉圖片上畫上幾筆,比如說勾出一個眉毛的輪廓,它就能自動把草圖修正成真實的圖片,即使你毫無藝術(shù)細胞,也沒關(guān)系,只要能夠大致表明想修哪里,剩下的活兒就都交給它好了。

這款工具由韓國電子與電信通訊研究所的Youngjoo Jo和Jongyoul Park開發(fā),它比一般的臉部圖片編輯工具或應用程序更高級,可以改變發(fā)型、把嚴肅臉改成笑臉,甚至可以加入原本沒有的配飾,比如耳環(huán)、耳釘?shù)取_€可以在一張被部分遮擋的面部圖像上生成完整的臉部圖像,還能把圖中的人戴的太陽鏡去掉等等。

來看看這款“AI修圖大師”的神奇效果:

改變臉部輪廓特征和瞳孔顏色

生發(fā)(劃重點)、變笑臉、加頭飾,都不在話下

加個耳環(huán)、耳墜什么的,只要劃出大致位置就行了

強大的自動補全功能

草繪秒變真人,畫風夸張也沒問題

這款“神器”的開發(fā)者之一Youngjoo Jo表示:我們認為這個程序可以讓設計師不用做那么多枯燥的勞動,讓他們把更多的精力集中在創(chuàng)造性的工作上,不過這并不是說只有設計師才能使用這款工具,用戶不需要具備設計上的專業(yè)知識。

機器學習研究人員Alex Champandard表示,這款工具與過去基于GAN的面部圖片編輯程序相比實現(xiàn)了一次重大進步。

“當你面對這樣的技術(shù)創(chuàng)新時,不免會在激動之余感到一絲害怕。”這種工具將不可避免地改變設計師的日常工作節(jié)奏和內(nèi)容,但他并不認為這類工具會讓設計師面臨失業(yè)。

“現(xiàn)在的一個重要問題是,我們接下來要怎樣做,才能讓這一工具更好地服務于那些工作內(nèi)容可能出現(xiàn)重大改變的人們?如何讓這款工具成為這些人的好幫手,而不是威脅?”

SC-FEGAN:基于神經(jīng)網(wǎng)絡的人臉圖像編輯系統(tǒng)

要達到這個神奇的效果,離不開SC-FEGAN。

SC-FEGAN是一種基于神經(jīng)網(wǎng)絡的人臉圖像編輯系統(tǒng),并提供了實現(xiàn)批量輸入數(shù)據(jù)的方法。該網(wǎng)絡可以端到端地進行訓練,并生成具有逼真紋理細節(jié)的高質(zhì)量合成圖像。

該研究成果由韓國團隊發(fā)表于arXiv:

論文地址:

https://arxiv.org/pdf/1902.06838.pdf

訓練數(shù)據(jù)

恰當?shù)挠柧殧?shù)據(jù)有助于提高網(wǎng)絡訓練性能。

在訓練本模型時,作者在幾個預處理步驟之后使用CelebA-HQ數(shù)據(jù)集:

隨機選擇2組29000張圖像用于訓練,1000張圖像用于測試;

在獲得草圖和顏色數(shù)據(jù)集之前,將圖像調(diào)整為512×512像素。

為了更好的表達人臉圖像中眼睛的復雜性,作者采用基于眼睛位置的free-from mask來訓練網(wǎng)絡。

此外,還使用了free from mask和人臉分割GFC創(chuàng)建了適當?shù)牟輬D域和顏色域。

這是非常關(guān)鍵的一步。因為它使得系統(tǒng)能夠為手繪用戶輸入案例產(chǎn)生有說服力的結(jié)果。

網(wǎng)絡結(jié)構(gòu)

該網(wǎng)絡同樣也可以同時訓練生成器和鑒別器。

生成器接收帶有用戶輸入的不完整圖像,在RGB通道中創(chuàng)建輸出圖像,并將輸出圖像的掩碼區(qū)域插入到不完整輸入圖像中,以創(chuàng)建完整圖像。

鑒別器接收完成的圖像或原始圖像(沒有掩蔽)以確定給定輸入是真實的還是假的。

在對抗訓練中,識別器的額外用戶輸入也有助于提高性能。 此外,團隊還發(fā)現(xiàn)與一般GAN損失不同的額外損失對于恢復大的擦除部分是有效的。

該網(wǎng)絡架構(gòu)如下圖所示:

圖注:SC-FEGAN的網(wǎng)絡架構(gòu)。除了輸入和輸出,LRN應用于所有卷積層之后。使用tanh作為發(fā)生器輸出的激活函數(shù)。采用SN卷積層作為鑒別器。

生成器

生成器是基于U-net,所有卷積層使用3x3大小核的門控卷積。在除了其他soft gate之外的特征映射卷積層之后應用局部信號歸一化(LRN)。LRN適用于除輸入層和輸出層之外的所有卷積層。

生成器的編碼器接收尺寸為512×512×9的輸入張量:具有在編輯時要被去除區(qū)域的不完整RGB通道圖像,描述被去除部分結(jié)構(gòu)的二進制草圖、RGB顏色筆劃圖、二元掩模和噪音(如下圖所示)。

草圖和顏色域數(shù)據(jù)集以及批處理的輸入。我們使用HED邊緣檢測器提取草圖。使用GFC ,通過分割區(qū)域的中間顏色生成顏色圖。 網(wǎng)絡的輸入包括不完整的圖像、掩模、草圖、顏色和噪聲。

編碼器使用2個步幅內(nèi)核卷積對輸入進行7次下采樣,然后在上采樣之前進行擴張卷積。

解碼器使用轉(zhuǎn)置的卷積進行上采樣。然后,添加跳躍連接(skip connection)以允許與具有相同空間分辨率的先前層連接。

除了使用tanh函數(shù)的輸出層之外,我們在每一層之后都使用了leaky ReLU激活函數(shù)。

總的來說,我們的發(fā)生器由16個卷積層組成,網(wǎng)絡的輸出是相同大小的輸入(512×512)的RGB圖像。

在將損失函數(shù)應用于輸入圖像之前,用輸入圖像替換了掩模外部的圖像的剩余部分。這種替換允許發(fā)電機專門在編輯區(qū)域上進行訓練。發(fā)生器受到了PartialConv中引入的損失的訓練:每像素損失、感知損失、風格損失和總方差損失。還使用通用GAN損失函數(shù)。

鑒別器

該鑒別器有SNPatchGAN結(jié)構(gòu)。同時,也使用3×3大小卷積內(nèi)核,并應用了gradient penalty損失。還增加了額外的一項,避免了鑒別器輸出patch的值接近于零。

總體損失函數(shù)如下:

其中,發(fā)生器用LG進行訓練,鑒別器用LD進行訓練。D(I)是鑒別器給定輸入I的輸出。

而當編輯大面積區(qū)域時,額外損失(如Lstyle和Lpercept)是非常關(guān)鍵的。

多種場景修圖俱佳,AI修圖大師大顯身手

那么,這款AI修圖大師的修圖結(jié)果如何呢?

首先將結(jié)果與Coarse-Refined net結(jié)構(gòu)和U-net結(jié)構(gòu)網(wǎng)絡進行了比較。在測試Coarse-Refined net結(jié)構(gòu)時,注意到細化階段模糊了輸出。而下圖便展示了在Coarse-Refined net上使用本文方法后的結(jié)果。

在U-net和Coarse-Refined net上使用本文方法后的結(jié)果

本文的系統(tǒng)不僅在上述細節(jié)方面,在大面積區(qū)域修改方面也是具有優(yōu)勢的。

有/沒有VGG損失的訓練結(jié)果

在處理自由形狀遮掩情況時,本文系統(tǒng)所產(chǎn)生的結(jié)果也較好。

與Celebf-HQ驗證集上的Deepfillv1進行定性比較

下圖顯示了使用草圖和顏色輸入的各種結(jié)果。實驗結(jié)果表明,該系統(tǒng)能夠使用戶很直接地編輯人臉圖像的發(fā)型、臉型、眼睛、嘴巴等特征。

系統(tǒng)的面部圖像編輯結(jié)果。 它表明系統(tǒng)可以正確地改變面部的形狀和顏色。 還表明可以用于改變眼睛的顏色或擦除不必要的部分。 特別是右下角的兩個結(jié)果表明系統(tǒng)也可以用于新的發(fā)型修飾。

GAN生成的圖像結(jié)果通常顯示出對訓練數(shù)據(jù)集的高度依賴性。在本研究中,研究人員將HED應用于所有的區(qū)域,通過調(diào)度它來擴展掩蔽區(qū)域,能夠獲得特殊的結(jié)果,產(chǎn)生面部圖像和耳環(huán)。

下圖顯示了這些有趣結(jié)果的選擇。這些例子表明,該網(wǎng)絡能夠?qū)W習小細節(jié),即使是很小的輸入也能產(chǎn)生合理的結(jié)果。

特別的結(jié)果

總結(jié)

本文提出了一種基于端到端可訓練生成網(wǎng)絡的自由形狀掩模、草圖、顏色輸入的圖像編輯系統(tǒng)。

實驗結(jié)果表明,與其他研究相比,該網(wǎng)絡架構(gòu)和損失功能顯著改善了修復效果。并在許多情況下顯示了各種成功和逼真的編輯結(jié)果。

該系統(tǒng)在一次性修復大面積區(qū)域方面表現(xiàn)極佳,使用者不需要費力就可以產(chǎn)生高質(zhì)量和逼真的效果。

堪稱AI修圖大師!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4762

    瀏覽量

    100539
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1083

    瀏覽量

    40418
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1919

    瀏覽量

    72992

原文標題:最強GAN修圖魔術(shù)師:美顏生發(fā)摘眼鏡、草繪秒變真人臉

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    THS4521接在dac902之后輸出給tpa6211,從揚聲器中放出來的聲音非常小怎么解決?

    電路如圖所示,THS4521接在dac902之后,然后輸出給tpa6211,但此時,從揚聲器中放出來的聲音非常小,后來我去掉ths4521這級之后,音量大小就有了很大改善,不知為何,求解
    發(fā)表于 11-07 08:22

    TLV320AI3101在錄音播放出來的聲音頻譜上可以明顯看出有斷篇和失真破音,怎么解決?

    你好,我們現(xiàn)在錄音播放出來的聲音頻譜上可以明顯看出有斷篇和失真破音的問題。在比較嘈雜的環(huán)境 錄音。 相關(guān)硬件接口如圖,問題出在寄存器配置嗎?這方面是菜鳥,請高手知道
    發(fā)表于 11-04 06:36

    將音頻文件放到SD卡,用DSP5509A將其讀取出來并發(fā)送給AIC23,為什么播放出來的音樂都是雜音?

    我將音頻文件放到SD卡,用DSP5509A將其讀取出來,并發(fā)送給AIC23,但是播放出來的音樂感覺全是雜音,請問是對AIC23的配置不對嗎?我放在SD卡的文件是MP3文件,比特率
    發(fā)表于 10-25 08:28

    lm4673功放出來的聲音很小,調(diào)節(jié)放大倍數(shù)的電阻聲音無明顯變化是怎么回事?

    請問lm4673功放出來的聲音很小,調(diào)節(jié)放大倍數(shù)的電阻聲音無明顯變化,調(diào)節(jié)隔直電容,聲音也沒有變大,這是怎么回事。lm4673在生產(chǎn)過程怎么提高良品率
    發(fā)表于 10-24 07:44

    求助,關(guān)于tpa3118音頻問題求解

    求助,求助,我一款播放器用了三個tpa3118功放ic,基本上是按照官方的參考設計,但是出來的音頻怎么聽都不舒服,高頻有點刺耳,聲音太硬,低頻部分同樣播放首歌,同樣的這款芯片,另外的設備播
    發(fā)表于 10-22 07:38

    tpa3118做了個雙功放,功放出來有滋滋的底噪,怎么解決?

    我做了個雙功放,功放出來有滋滋的底噪,怎么弄都解決不了,求助大神
    發(fā)表于 10-21 08:05

    如何用5509A產(chǎn)生個白噪聲,經(jīng)AIC23播放出來然后再用AIC23采集這個聲音?

    怎樣用5509A產(chǎn)生個白噪聲,經(jīng)AIC23播放出來然后再用AIC23采集這個聲音
    發(fā)表于 10-15 06:26

    TAS5825m在未接喇叭的情況下,輸出音量加大后能聽到有聲音播放出來,怎么解決?

    目前我們在用TAS5825m這顆功放,發(fā)現(xiàn)在未接喇叭的情況下,輸出音量加大后能聽到有聲音播放出來;請問有什么辦法可以杜絕或者改善此種現(xiàn)象嗎?
    發(fā)表于 09-30 07:31

    富唯智能協(xié)作機器人在食品飲料行業(yè)的柔性應用

    富唯智能協(xié)作機器人在食品和飲料供應鏈中廣泛應用于包裝和機床管理等次級流程。協(xié)作機器人可以在潮濕的溫室、冷藏室、加熱爐等環(huán)境工作,將員工從重復性工作中
    的頭像 發(fā)表于 09-09 15:12 ?177次閱讀
    富唯智能協(xié)作機器人在食品飲料行業(yè)的柔性應用

    測試工作中的哎呀,當時怎么沒有想到

    在我們的測試工作中,是不是經(jīng)常遇到這樣的情形,發(fā)生了線上問題,產(chǎn)品、研發(fā)或者測試同學拍腦袋:當時怎么沒有想到,怎么給漏掉了呢?明明是個非常簡單的事情,用大拇指都能想到的驗證場景,為何當時就漏測了
    的頭像 發(fā)表于 09-06 09:45 ?214次閱讀
    測試<b class='flag-5'>工作中</b>的哎呀,當時怎么沒有想到

    Pura 70系列AI大師再上新!小藝AI開啟魔幻新體驗

    大師又驚喜更新了AI功能,可以顯著拓寬照片視野,開啟全新的體驗。 用戶只需在圖庫中選擇需
    的頭像 發(fā)表于 08-01 13:22 ?336次閱讀

    用LM358P和IRF631搭建了個恒流源,運放出來的波形失真嚴重,為什么?

    是恒流源的原理,第二張圖片是我用Multisim仿真的波形,仿真結(jié)果是:運放出來的波形失真嚴重,mos的源極電流也失真很嚴重,而且底部截止失真了,請問這是為什么?
    發(fā)表于 08-01 06:18

    協(xié)作機器人在食品和飲料中的的應用

    富唯智能協(xié)作機器人在食品和飲料供應鏈中廣泛應用于包裝和機床管理等次級流程。協(xié)作機器人可以在潮濕的溫室、冷藏室、加熱爐等環(huán)境工作,將員工從重復性工作中
    的頭像 發(fā)表于 05-16 14:39 ?338次閱讀
    協(xié)作機器人在食品和飲料中的的應用

    拿來就能用 | ESP AI音箱方案介紹

    機器人。該系統(tǒng)可以接收用戶的語音指令,將其展示在屏幕上,并調(diào)用OpenAIAPI進行處理,生成相應的回復。回復將顯示在ESP-BOX屏幕上,然后播放出來。案例研究
    的頭像 發(fā)表于 03-21 08:03 ?591次閱讀
    拿來就能用 | ESP <b class='flag-5'>AI</b>音箱方案介紹

    英飛凌聯(lián)手日本歐姆龍推出了一款集成GaN技術(shù)的V2X充電樁

    近日,英飛凌聯(lián)手日本歐姆龍推出了一款集成GaN技術(shù)的V2X 充電樁。
    的頭像 發(fā)表于 01-19 10:23 ?1095次閱讀
    英飛凌聯(lián)手日本歐姆龍推出了<b class='flag-5'>一款</b>集成<b class='flag-5'>GaN</b>技術(shù)的V2X充電樁