精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你的DragGAN并不需要點(diǎn)跟蹤!中科大和上海AI Lab提出FreeDrag:無(wú)需點(diǎn)跟蹤即可穩(wěn)定拖動(dòng)語(yǔ)義內(nèi)容

CVer ? 來(lái)源:CVer ? 2023-07-13 14:36 ? 次閱讀

近日,在AIGC的廣闊世界里出現(xiàn)了一個(gè)火熱的圖像編輯方法—即通過(guò)在給定圖像上通過(guò)把語(yǔ)義內(nèi)容從原位置(handle point)拖動(dòng)到目標(biāo)位置(target point)的方式進(jìn)行精細(xì)的定制化編輯操作。比如令人印象深刻的讓你家貓咪對(duì)你wink的神奇操作:

4957bb74-213c-11ee-962d-dac502259ad0.gif

這一驚人效果來(lái)自于發(fā)表在SIGGRAPH 2023會(huì)議上的 [Drag Your GAN] 論文(簡(jiǎn)稱為DragGAN)。并且DragGAN的代碼一經(jīng)發(fā)出就在短短幾周內(nèi)狂攬30K star,引發(fā)廣大網(wǎng)友的“Drag”熱潮。有了DragGAN的加持,各種AI畫圖工具的「阿喀琉斯之踵」再也不是弱點(diǎn),哪里不滿意就只修哪里!

499056c8-213c-11ee-962d-dac502259ad0.png

圖 1 DragGAN 由于內(nèi)容突變發(fā)生跟蹤點(diǎn)丟失

近日,中科大和上海AI Lab的研究者們又發(fā)布了一項(xiàng)相關(guān)研究—FreeDrag。研究者們表明,先前的DragGAN由兩個(gè)交替迭代進(jìn)行的過(guò)程構(gòu)成:(1)運(yùn)動(dòng)監(jiān)督(motion supervision)過(guò)程指導(dǎo)handle point向著對(duì)應(yīng)的target point進(jìn)行移動(dòng);(2)點(diǎn)跟蹤(point tracking)過(guò)程則負(fù)責(zé)定位移動(dòng)后handle point的精確位置從而為下次移動(dòng)提供方向和約束特征。因此DragGAN 嚴(yán)重依賴于點(diǎn)跟蹤的精確性。然而,點(diǎn)跟蹤的策略本質(zhì)上是不穩(wěn)定的,因?yàn)樗[式地假設(shè)每次移動(dòng)后在默認(rèn)的搜索區(qū)域內(nèi)有且僅有一個(gè)點(diǎn)完美繼承了handle point的特征。這個(gè)假設(shè)會(huì)在以下兩種情況下失效:i) 圖像內(nèi)容發(fā)生劇烈變化導(dǎo)致的跟蹤丟失(圖1) ii) 搜索區(qū)域內(nèi)的相似點(diǎn)導(dǎo)致的跟蹤錯(cuò)誤(圖2),例如輪廓線和馬腿等。錯(cuò)誤的點(diǎn)跟蹤會(huì)為下一次移動(dòng)提供錯(cuò)誤的方向和約束特征,造成誤差累積從而損害編輯的質(zhì)量。

49e8ad96-213c-11ee-962d-dac502259ad0.png

圖 1 DragGAN 由于相似點(diǎn)的存在發(fā)生錯(cuò)誤的點(diǎn)跟蹤

方法介紹

為了防止不穩(wěn)定的點(diǎn)跟蹤過(guò)程不可避免地?fù)p害圖像編輯的質(zhì)量,中國(guó)科學(xué)技術(shù)大學(xué)和上海AI Lab的研究者們共同提出FreeDrag, 一種以特征為導(dǎo)向的基于點(diǎn)的交互式編輯框架。FreeDrag通過(guò)引入自適應(yīng)更新的模板特征,模糊定位和線性搜索技術(shù),在無(wú)需進(jìn)行精確點(diǎn)跟蹤的情況下即可實(shí)現(xiàn)更加穩(wěn)定可靠的拖動(dòng)編輯。

4a36d854-213c-11ee-962d-dac502259ad0.png

圖 2 FreeDrag 的流程圖

4a603474-213c-11ee-962d-dac502259ad0.png

圖 3 DragGAN的點(diǎn)跟蹤和FreeDrag 點(diǎn)定位的比較。

DragGAN 要求精確定位4a77ee16-213c-11ee-962d-dac502259ad0.png的位置,而FreeDrag 通過(guò)約束特征差異限制定位點(diǎn)4a871d96-213c-11ee-962d-dac502259ad0.png4a77ee16-213c-11ee-962d-dac502259ad0.png附近,但不要求確定4a77ee16-213c-11ee-962d-dac502259ad0.png的具體位置。

動(dòng)態(tài)更新的模板特征

4ab0008a-213c-11ee-962d-dac502259ad0.png

研究者們首先提出了動(dòng)態(tài)更新的模板特征技術(shù)來(lái)緩解跟蹤點(diǎn)丟失問(wèn)題。模板特征通過(guò)衡量每次移動(dòng)的質(zhì)量來(lái)決定是否更新,即通過(guò)控制4abf0788-213c-11ee-962d-dac502259ad0.png的值來(lái)決定每次更新的比例。更大的4abf0788-213c-11ee-962d-dac502259ad0.png意味著更大的更新程度。移動(dòng)質(zhì)量越高更新程度越大。移動(dòng)質(zhì)量通過(guò)衡量移動(dòng)結(jié)束后4a871d96-213c-11ee-962d-dac502259ad0.png處的特征4ae36cc2-213c-11ee-962d-dac502259ad0.png和上一次的模板特征值4af1ec7a-213c-11ee-962d-dac502259ad0.png的?????? L1 距離 (4b01fc32-213c-11ee-962d-dac502259ad0.png) 來(lái)度量,4b01fc32-213c-11ee-962d-dac502259ad0.png越小說(shuō)明移動(dòng)質(zhì)量越高。模板特征的更新過(guò)程不依賴于handle point 的位置和特征,從而擺脫了對(duì)精確的點(diǎn)跟蹤的負(fù)擔(dān),同時(shí)自適應(yīng)的更新策略帶來(lái)的平滑性賦予了模板特征更好的魯棒性來(lái)克服劇烈的內(nèi)容變化,避免編輯內(nèi)容的異常丟失。

模糊定位和線性搜索

緊接著,研究者們提出模糊定位和線性搜索技術(shù)來(lái)緩解跟蹤點(diǎn)模糊問(wèn)題。FreeDrag 通過(guò)移動(dòng)距離4b1d6f30-213c-11ee-962d-dac502259ad0.png和特征差異4b2e4c10-213c-11ee-962d-dac502259ad0.png來(lái)為每次的移動(dòng)定位適合的目標(biāo)點(diǎn),即公式(10)。定位主要分為三種情況:繼續(xù)向target point移動(dòng)(移動(dòng)質(zhì)量高);保持當(dāng)前位置不動(dòng)(移動(dòng)不徹底),點(diǎn)回退(移動(dòng)異常)。

4b3d9d96-213c-11ee-962d-dac502259ad0.png

相比于DragGAN要求的精確的點(diǎn)跟蹤,公式(10)搜尋的定位點(diǎn)是“模糊”因?yàn)樗⒉灰笏褜andle point的準(zhǔn)確位置,而是通過(guò)約束特征差異確保定位點(diǎn)在handle point附近, 因此擺脫了精確定位的負(fù)擔(dān)。此外,公式(10) 只在原始handle point 和 target point 形成的直線上進(jìn)行點(diǎn)搜索,這種線性搜索策略有效地緩解了相鄰區(qū)域內(nèi)相似點(diǎn)的干擾,保障了運(yùn)動(dòng)監(jiān)督的可靠性,進(jìn)一步提高點(diǎn)移動(dòng)的穩(wěn)定性。

實(shí)驗(yàn)對(duì)比

DragGAN 和 FreeDrag 在各類場(chǎng)景上的對(duì)比如下圖(圖4)所示,可以發(fā)現(xiàn)FreeDrag可以有效地防止handle point的異常消失(如圖4第一個(gè)例子中消失的嘴巴和第二個(gè)例子中消失的眼鏡),同時(shí)有力地避免了由于內(nèi)容突變和相似點(diǎn)干擾導(dǎo)致的異常編輯,保障了點(diǎn)移動(dòng)的可靠性(如圖4第三個(gè)例子中大象的眼睛和第四個(gè)例子中的馬腿)。此外,從圖4的(5)-(8)例子可以觀察到FreeDrag 可以通過(guò)穩(wěn)定的點(diǎn)移動(dòng)更有效更精確地實(shí)現(xiàn)預(yù)定的編輯目標(biāo)。進(jìn)一步的,在各類場(chǎng)景上的大量實(shí)驗(yàn)(圖5) 充分驗(yàn)證了FreeDrag 可以通過(guò)穩(wěn)定的點(diǎn)移動(dòng)實(shí)現(xiàn)更高的編輯質(zhì)量,助力交互式的基于點(diǎn)的圖像編輯達(dá)到新的高度。

4b57b8ca-213c-11ee-962d-dac502259ad0.png

圖 4 DragGAN 和 FreeDrag 在各類場(chǎng)景上的對(duì)比圖

4bb0c122-213c-11ee-962d-dac502259ad0.png

圖 5 DragGAN 和 FreeDrag 在更多場(chǎng)景下的對(duì)比圖

視頻對(duì)比如下:

左邊兩張圖分別為原始圖片和編輯目標(biāo)(紅色為handle point, 藍(lán)色為target point)

右邊分別為為DragGAN 和FreeDrag的處理過(guò)程(gif)

4cf50d7c-213c-11ee-962d-dac502259ad0.png

對(duì)于拖動(dòng)大象眼睛的例子,可以觀察到,DragGAN 在移動(dòng)大象眼睛的過(guò)程中發(fā)生了圖像布局的突變?cè)斐牲c(diǎn)跟蹤丟失,點(diǎn)跟蹤丟失導(dǎo)致無(wú)法為之后的運(yùn)動(dòng)提供有效的運(yùn)動(dòng)監(jiān)督,進(jìn)而無(wú)法實(shí)現(xiàn)預(yù)定的編輯目的。相比而言,得益于動(dòng)態(tài)更新的模板特征的平滑性,F(xiàn)reeDrag 可以更好地避免圖像內(nèi)容的急劇變化,從而更可靠地將眼部特征拖向預(yù)定的位置。

對(duì)于拖動(dòng)馬腿的例子,可以觀察到, DragGAN在移動(dòng)馬腿過(guò)程中發(fā)生了錯(cuò)誤的點(diǎn)跟蹤,從而為之后的運(yùn)動(dòng)監(jiān)督提供了錯(cuò)誤的優(yōu)化方向,進(jìn)而降低了圖像質(zhì)量,這種錯(cuò)誤會(huì)在多次迭代中累計(jì)導(dǎo)致編輯結(jié)果質(zhì)量的急劇下降。相比而言, FreeDrag 的模糊定位和線性搜索策略有效地緩解了相似點(diǎn)的干擾,為點(diǎn)移動(dòng)提供了可靠的監(jiān)督信號(hào),從而高質(zhì)量地實(shí)現(xiàn)預(yù)定的編輯目的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1083

    瀏覽量

    40418
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4750

    瀏覽量

    68357
  • AIGC
    +關(guān)注

    關(guān)注

    1

    文章

    356

    瀏覽量

    1509

原文標(biāo)題:你的DragGAN并不需要點(diǎn)跟蹤!中科大和上海AI Lab提出FreeDrag:無(wú)需點(diǎn)跟蹤即可穩(wěn)定拖動(dòng)語(yǔ)義內(nèi)容

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    中科大人口模型講義

    中科大人口模型講義[hide] [/hide]
    發(fā)表于 09-15 12:01

    微機(jī)原理與接口技術(shù) 中科大教材

    微機(jī)原理與接口技術(shù) 中科大教材[/hide]
    發(fā)表于 12-07 11:15

    中科大發(fā)的論文《新一代TSC2046觸摸屏控制器》

    中科大發(fā)的論文《新一代TSC2046觸摸屏控制器》
    發(fā)表于 08-03 08:12

    51單片機(jī)C語(yǔ)言編程入門(中科大)

    51單片機(jī)C語(yǔ)言編程入門(中科大)
    發(fā)表于 08-06 12:20

    中科大嵌入式課件全集

    本帖最后由 eehome 于 2013-1-5 09:46 編輯 中科大嵌入式課件全集
    發(fā)表于 08-14 21:52

    溷沌數(shù)字通信(中科大出版的)

    溷沌數(shù)字通信(中科大出版的)
    發(fā)表于 08-16 16:49

    光電信號(hào)處理!!!(何兆湘 華中科大)

    光電信號(hào)處理?。?!(何兆湘 華中科大)
    發(fā)表于 08-16 19:47

    51單片機(jī)C語(yǔ)言編程入門(中科大)

    51單片機(jī)C語(yǔ)言編程入門(中科大)
    發(fā)表于 08-17 16:02

    51單片機(jī)資料(中科大

    51單片機(jī)資料(中科大),超高新掃描版,上傳給初學(xué)者{:7:}
    發(fā)表于 06-23 12:51

    中科院中科大2003年量子力學(xué)考研試題答案

    中科院—中科大2003年量子力學(xué)考研試題答案
    發(fā)表于 11-25 16:05 ?0次下載
    <b class='flag-5'>中科院中科大</b>2003年量子力學(xué)考研試題答案

    人口模型講義 (中科大課程)

    人口模型課件 (中科大課程講義)
    發(fā)表于 09-15 11:59 ?24次下載

    AMD高管表示,我們的32核Threadripper處理器只需要風(fēng)冷散熱即可并不需要水冷機(jī)

    要的是英特爾因?yàn)槭褂昧死渌畽C(jī)給處理器超頻而被玩家質(zhì)疑。對(duì)于這一點(diǎn),AMD高管在E3直播活動(dòng)上有意無(wú)意地指出他們家的32核Threadripper處理器只需要風(fēng)冷散熱即可并不需要水冷機(jī)
    發(fā)表于 06-14 11:28 ?1598次閱讀

    《日本經(jīng)濟(jì)新聞》報(bào)道:中科大為何能對(duì)中國(guó)AI領(lǐng)域產(chǎn)生很的影響?

    近日,《日本經(jīng)濟(jì)新聞》的一則報(bào)道指出:在左右著企業(yè)、國(guó)家和地區(qū)發(fā)展的人工智能領(lǐng)域,中科大少年班的人才支撐著中國(guó)的發(fā)展。中國(guó)自動(dòng)駕駛公司百度的總裁張亞勤、前阿里云人工智能首席科學(xué)家的閔萬(wàn)里、AI芯片
    的頭像 發(fā)表于 07-18 09:40 ?7485次閱讀

    在醫(yī)療AI領(lǐng)域砥礪前行的中科大學(xué)子

    作為國(guó)字號(hào)的科研基石,中科大依靠學(xué)術(shù)層面的踏實(shí)耕耘,很大程度上影響了中國(guó)的醫(yī)療科技風(fēng)向。 談?wù)撘凰髮W(xué)撐起一個(gè)城市的代表,中科大和合肥的CP組合,一定榜上有名。 在合肥的“大湖名城 創(chuàng)新高地”立城
    的頭像 發(fā)表于 05-10 09:36 ?4857次閱讀

    不需要點(diǎn)表的工業(yè)網(wǎng)關(guān)應(yīng)用案例:如何提升工業(yè)企業(yè)生產(chǎn)效率與質(zhì)量?

    不需要點(diǎn)表的工業(yè)網(wǎng)關(guān)解決方案。技術(shù)團(tuán)隊(duì)在車間各個(gè)關(guān)鍵設(shè)備節(jié)點(diǎn)安裝了新的工業(yè)網(wǎng)關(guān)。由于不需要點(diǎn)表,安裝過(guò)程極為簡(jiǎn)便,技術(shù)人員僅需將網(wǎng)關(guān)與設(shè)備連接,并進(jìn)行簡(jiǎn)單的網(wǎng)絡(luò)設(shè)置,即可完成部署。整個(gè)車間的網(wǎng)關(guān)部署時(shí)間比之前預(yù)計(jì)縮短了 [X]%
    的頭像 發(fā)表于 11-13 10:27 ?90次閱讀
    <b class='flag-5'>不需要點(diǎn)</b>表的工業(yè)網(wǎng)關(guān)應(yīng)用案例:如何提升工業(yè)企業(yè)生產(chǎn)效率與質(zhì)量?