精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

EditGAN圖像編輯框架將影響未來(lái)幾代GAN的發(fā)展

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:Nathan Horrocks ? 2022-04-06 16:29 ? 次閱讀

編輯貓、汽車(chē)甚至古董畫(huà)照片的愿望,由于一種稱為EditGAN的生成性對(duì)抗網(wǎng)絡(luò)(GAN)模型,從未像現(xiàn)在這樣容易實(shí)現(xiàn)。來(lái)自 NVIDIA,多倫多大學(xué)和 MIT 研究人員的工作建立了 DatasetGAN ,這是一種人工智能視覺(jué)模型,可以用最少16個(gè)人類(lèi)注釋的圖像來(lái)訓(xùn)練,并像其他需要100X更多圖像的方法一樣有效地執(zhí)行。EditGAN 利用了前一個(gè)模型的功能,允許用戶使用簡(jiǎn)單的命令(如繪圖)編輯或操作所需的圖像,而不會(huì)影響原始圖像質(zhì)量。

什么是 EditGAN ?

根據(jù) paper :“ EditGAN 是第一個(gè) GAN 驅(qū)動(dòng)的圖像編輯框架,它同時(shí)提供非常高精度的編輯,只需要很少的帶注釋的訓(xùn)練數(shù)據(jù)(并且不依賴外部分類(lèi)器),可以實(shí)時(shí)交互運(yùn)行,允許對(duì)多個(gè)編輯進(jìn)行簡(jiǎn)單的合成,并可處理真正的嵌入式、生成的圖像,甚至是域外圖像。”

該模型學(xué)習(xí)特定數(shù)量的編輯向量,這些編輯向量可以交互地應(yīng)用于圖像。本質(zhì)上,它形成了對(duì)圖像及其內(nèi)容的直觀理解,用戶可以利用這些信息進(jìn)行特定的修改和編輯。該模型從相似的圖像中學(xué)習(xí),并識(shí)別圖像中對(duì)象的不同組件和特定部分。用戶可以利用它對(duì)不同子部分進(jìn)行有針對(duì)性的修改,或在特定區(qū)域內(nèi)進(jìn)行編輯。由于模型的精確性,圖像在用戶設(shè)置的參數(shù)之外不會(huì)失真。

“該框架允許我們學(xué)習(xí)任意數(shù)量的編輯向量,然后可以以交互速率直接應(yīng)用于其他圖像。”研究人員在他們的研究中解釋道。“我們的實(shí)驗(yàn)表明, EditGAN 可以以前所未有的細(xì)節(jié)和自由度處理圖像,同時(shí)保持完整的圖像質(zhì)量。我們還可以輕松地組合多種編輯,并在 EditGAN 的訓(xùn)練數(shù)據(jù)之外執(zhí)行合理的編輯。我們?cè)诟鞣N圖像類(lèi)型上演示了 EditGAN ,并在數(shù)量上優(yōu)于幾種預(yù)處理的圖像標(biāo)準(zhǔn)編輯基準(zhǔn)任務(wù)的編輯方法。”

從增加微笑、改變別人看的方向、創(chuàng)造新的發(fā)型,或者給汽車(chē)一套更好的輪子,研究人員展示了模型的內(nèi)在性,只需要很少的數(shù)據(jù)注釋。用戶可以根據(jù)所需的編輯繪制簡(jiǎn)單的草圖或遮罩,并引導(dǎo) AI 模型實(shí)現(xiàn)修改,例如更大的貓耳或更酷的汽車(chē)前燈。人工智能然后渲染圖像,同時(shí)保持非常高的精度和原始圖像的質(zhì)量。之后,同樣的編輯可以實(shí)時(shí)應(yīng)用于其他圖像。

poYBAGJNT3iAFP43AAFEfxepoiI936.png

poYBAGJNT3iAFP43AAFEfxepoiI936.png

圖 2 分配給圖像不同部分的像素示例。人工智能可以識(shí)別不同的區(qū)域,并可以根據(jù)人工輸入進(jìn)行編輯。

這是怎么工作的?

Edigan 將圖像的每個(gè)像素指定給一個(gè)類(lèi)別,例如輪胎、擋風(fēng)玻璃或車(chē)架。這些像素在人工智能潛在空間內(nèi)控制,并基于用戶的輸入,用戶可以輕松靈活地編輯這些類(lèi)別。 Edigan 操縱 only 與所需更改相關(guān)的像素。人工智能根據(jù)訓(xùn)練模型時(shí)使用的其他圖像知道每個(gè)像素代表什么,因此你無(wú)法嘗試將貓耳朵添加到汽車(chē)中以獲得準(zhǔn)確的結(jié)果。但是,當(dāng)在正確的模型中使用時(shí), EditGAN 是一個(gè)非凡的工具,可以提供出色的圖像編輯效果。

pYYBAGJNT3qAAggwAANRBkD8Lts841.png

pYYBAGJNT3qAAggwAANRBkD8Lts841.png

圖 3 Edigan 可以訓(xùn)練各種各樣的圖像,從動(dòng)物到環(huán)境,形成對(duì)其內(nèi)容的詳細(xì)理解。

EditGAN 的潛能

人工智能驅(qū)動(dòng)的照片和圖像編輯有可能簡(jiǎn)化攝影師和內(nèi)容創(chuàng)作者的工作流程,并實(shí)現(xiàn)創(chuàng)新和數(shù)字藝術(shù)的新水平。 EditGAN 還使新手?jǐn)z影師和編輯能夠制作高質(zhì)量的內(nèi)容,以及偶爾的病毒性模因。

“這個(gè)人工智能可能會(huì)改變我們編輯照片的方式,也許最終會(huì)改變視頻。它允許人們通過(guò)簡(jiǎn)單的文本命令拍攝圖像并對(duì)其進(jìn)行修改。如果你有一張汽車(chē)照片,你想讓車(chē)輪更大,只需鍵入“ make wheels bigger ”,然后噗 – 這是一張完全真實(shí)的照片,上面是同一輛車(chē)輪更大的汽車(chē)。”—— Fortune magazine

EditGAN 將來(lái)也可能用于其他重要應(yīng)用。例如, EditGAN 的編輯功能可用于創(chuàng)建具有特定特征的大型圖像數(shù)據(jù)集。當(dāng)針對(duì)不同的計(jì)算機(jī)視覺(jué)任務(wù)訓(xùn)練下游機(jī)器學(xué)習(xí)模型時(shí),這種特定的數(shù)據(jù)集可能很有用。

此外, EditGAN 框架可能會(huì)影響未來(lái)幾代 GAN 的發(fā)展。雖然當(dāng)前版本的 EditGAN 側(cè)重于圖像編輯,但類(lèi)似的方法也可能用于編輯 3D 形狀和對(duì)象,這在為游戲、電影或 metaverse 創(chuàng)建虛擬 3D 內(nèi)容時(shí)非常有用。

關(guān)于作者

Nathan Horrocks 是 NVIDIA Research 的內(nèi)容營(yíng)銷(xiāo)經(jīng)理。他重點(diǎn)強(qiáng)調(diào)了 NVIDIA 實(shí)驗(yàn)室在世界各地進(jìn)行的驚人研究。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4940

    瀏覽量

    102817
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46862

    瀏覽量

    237587
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    1919

    瀏覽量

    73002
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    字節(jié)發(fā)布SeedEdit圖像編輯模型

    近日,字節(jié)跳動(dòng)公司在其豆包大模型團(tuán)隊(duì)的官方網(wǎng)站上,正式公布了其最新的通用圖像編輯模型——SeedEdit。這款創(chuàng)新性的圖像編輯模型,為用戶提供了前所未有的便捷圖像編輯體驗(yàn)。 據(jù)官方介紹
    的頭像 發(fā)表于 11-12 10:43 ?201次閱讀

    圖像采集卡的接口類(lèi)型有哪些?

    圖像采集卡又稱圖像捕獲卡,是一種能獲取數(shù)字視頻圖像信息并進(jìn)行存儲(chǔ)和播放的硬件設(shè)備。它的作用是圖像信號(hào)采集到計(jì)算機(jī)中,以數(shù)據(jù)文件的形式保存在
    的頭像 發(fā)表于 10-24 17:07 ?128次閱讀
    <b class='flag-5'>圖像</b>采集卡的接口類(lèi)型有哪些?

    未來(lái)AI大模型的發(fā)展趨勢(shì)

    上得到了顯著提升。未來(lái),算法和架構(gòu)的進(jìn)一步優(yōu)化推動(dòng)AI大模型在性能上實(shí)現(xiàn)新的突破。 多頭自注意力機(jī)制、前饋神經(jīng)網(wǎng)絡(luò)等關(guān)鍵技術(shù)的改進(jìn),增強(qiáng)模型的表達(dá)能力和泛化能力。 多模態(tài)融合 : AI大模型正逐漸從單一模態(tài)向多模態(tài)
    的頭像 發(fā)表于 10-23 15:06 ?431次閱讀

    DMA與C64x的框架組件結(jié)合使用

    電子發(fā)燒友網(wǎng)站提供《DMA與C64x的框架組件結(jié)合使用.pdf》資料免費(fèi)下載
    發(fā)表于 10-16 10:29 ?0次下載
    <b class='flag-5'>將</b>DMA與C64x的<b class='flag-5'>框架</b>組件結(jié)合使用

    變阻器的未來(lái)發(fā)展趨勢(shì)和前景如何?是否有替代品出現(xiàn)?

    變阻器是一種用于調(diào)節(jié)電路中電阻值的電子元件,廣泛應(yīng)用于各種電子設(shè)備和系統(tǒng)中。隨著科技的不斷進(jìn)步和應(yīng)用領(lǐng)域的擴(kuò)展,變阻器的未來(lái)發(fā)展趨勢(shì)和前景備受關(guān)注。 未來(lái)變阻器趨向于智能化和多功能化
    發(fā)表于 10-10 14:35

    嵌入式系統(tǒng)的未來(lái)趨勢(shì)有哪些?

    (ML)技術(shù)的快速發(fā)展,嵌入式系統(tǒng)更多地整合這些先進(jìn)技術(shù),以支持智能決策和自動(dòng)化。在設(shè)備上直接運(yùn)行AI和ML模型,進(jìn)行圖像識(shí)別、自然語(yǔ)言處理、預(yù)測(cè)分析等任務(wù),極大提升嵌入式系統(tǒng)的智
    發(fā)表于 09-12 15:42

    圖像處理器的發(fā)展歷史

    圖像處理器(Image Processor)的發(fā)展歷史是一段充滿創(chuàng)新與突破的歷程,它伴隨著計(jì)算機(jī)技術(shù)的不斷進(jìn)步和圖像處理需求的日益增長(zhǎng)而逐漸成熟。以下是對(duì)圖像處理器
    的頭像 發(fā)表于 08-14 09:42 ?609次閱讀

    全球SiC與GaN市場(chǎng)發(fā)展趨勢(shì),未來(lái)迎來(lái)快速增長(zhǎng)

    在近期的慕尼黑上海電子展上,YoleGroup的分析師邱柏順深入剖析了全球碳化硅(SiC)和氮化鎵(GaN)市場(chǎng)的發(fā)展趨勢(shì),提供了對(duì)未來(lái)電力電子行業(yè)的深刻見(jiàn)解。隨著科技的進(jìn)步和市場(chǎng)需求的變化,寬禁帶
    的頭像 發(fā)表于 07-22 11:46 ?347次閱讀
    全球SiC與<b class='flag-5'>GaN</b>市場(chǎng)<b class='flag-5'>發(fā)展</b>趨勢(shì),<b class='flag-5'>未來(lái)</b><b class='flag-5'>將</b>迎來(lái)快速增長(zhǎng)

    計(jì)算機(jī)視覺(jué)怎么給圖像分類(lèi)

    圖像分類(lèi)是計(jì)算機(jī)視覺(jué)領(lǐng)域中的一項(xiàng)核心任務(wù),其目標(biāo)是輸入的圖像自動(dòng)分配到預(yù)定義的類(lèi)別集合中。這一過(guò)程涉及圖像的特征提取、特征表示以及分類(lèi)器的設(shè)計(jì)與訓(xùn)練。隨著深度學(xué)習(xí)技術(shù)的飛速
    的頭像 發(fā)表于 07-08 17:06 ?514次閱讀

    微軟AI新成果:將不可編輯PDF轉(zhuǎn)化為可編輯文檔

    市面現(xiàn)有相關(guān)軟件雖能將PDF轉(zhuǎn)為可編輯版,但易喪失原始布局。微軟研究論文名為《從不可編輯文檔生成可編輯文檔的方法和系統(tǒng)》,其獨(dú)特之處在于運(yùn)用AI技術(shù)保持了字體、色彩、布局及圖像格式等視
    的頭像 發(fā)表于 05-30 10:11 ?619次閱讀

    谷歌模型怎么用PS打開(kāi)文件和圖片

    )或ONNX模型(.onnx)等。這些模型文件是二進(jìn)制的,并且是為特定的機(jī)器學(xué)習(xí)框架設(shè)計(jì)的,而不是為圖像編輯軟件如PS設(shè)計(jì)的。
    的頭像 發(fā)表于 02-29 18:25 ?1369次閱讀

    機(jī)器視覺(jué)圖像采集卡:關(guān)鍵的圖像處理設(shè)備

    機(jī)器視覺(jué)圖像采集卡是一種用于采集和處理圖像數(shù)據(jù)的關(guān)鍵設(shè)備,它在現(xiàn)代工業(yè)生產(chǎn)和科學(xué)研究中起著至關(guān)重要的作用。本文探討機(jī)器視覺(jué)圖像采集卡的工作原理、應(yīng)用領(lǐng)域以及
    的頭像 發(fā)表于 02-22 16:23 ?462次閱讀
    機(jī)器視覺(jué)<b class='flag-5'>圖像</b>采集卡:關(guān)鍵的<b class='flag-5'>圖像</b>處理設(shè)備

    放下你的PhotoShop!無(wú)限圖像編輯已開(kāi)源!

    我們知道擴(kuò)散模型生成圖像是通過(guò)反轉(zhuǎn)采樣來(lái)進(jìn)行的,重點(diǎn)是識(shí)別噪聲。LEDITS++從DDPM反演中提取特征,并提出一種有效的反演方法,大大減少所需的步驟,同時(shí)降低重建誤差。當(dāng)反向擴(kuò)散過(guò)程公式化為SDE時(shí)
    的頭像 發(fā)表于 12-10 10:09 ?845次閱讀
    放下你的PhotoShop!無(wú)限<b class='flag-5'>圖像編輯</b>已開(kāi)源!

    jpg如何轉(zhuǎn)psd格式?

    jpg如何轉(zhuǎn)psd格式? JPG格式轉(zhuǎn)換為PSD格式是一個(gè)比較簡(jiǎn)單的過(guò)程,只需使用合適的圖像編輯軟件即可完成。在本文中,我提供詳盡、詳實(shí)、細(xì)致的步驟,幫助你完成這個(gè)轉(zhuǎn)換過(guò)程。 首先,我們需要
    的頭像 發(fā)表于 12-09 16:09 ?2402次閱讀

    基于springboot和vue框架的Java

    和Vue項(xiàng)目的環(huán)境,并展示從前端到后端的完整開(kāi)發(fā)流程。接著,重點(diǎn)關(guān)注前后端分離的開(kāi)發(fā)模式,并介紹如何通過(guò)RESTful API進(jìn)行數(shù)據(jù)交互。最后,分享一些實(shí)踐中的經(jīng)驗(yàn)和技巧,以及對(duì)未來(lái)發(fā)展
    的頭像 發(fā)表于 12-03 15:15 ?963次閱讀