精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

讓AI學會畫手的方法來了,給輸入加個buff就能控制生成細節

OpenCV學堂 ? 來源:量子位 ? 2023-02-21 11:00 ? 次閱讀

給畫畫AI加個buff,畫起圖像就像開了掛。

加個人體骨骼綁定buff,Stable Diffusion直接快進到生成3D動漫:

82535af4-b13a-11ed-bfe3-dac502259ad0.gif

加個抽象到爆的草圖buff,AI變著風格生成“完全一致”的狗子:

8283c95a-b13a-11ed-bfe3-dac502259ad0.png

就連號稱“AI殺手”的手部細節,也能在控制之下畫得惟妙惟肖:

84172f50-b13a-11ed-bfe3-dac502259ad0.png

這個名叫ControlNet的新AI插件,可以說是給畫畫AI來了最后的“臨門一腳”——

原本AI無法控制的手部細節、整體架構,有了它之后,加上Stable Diffusion這樣的擴散模型,足以生成任何人們想要的圖像。

發出不到兩天,ControlNet就在GitHub上火了,目前已經狂攬4.6k星:

844befe2-b13a-11ed-bfe3-dac502259ad0.png

△“讓我們控制擴散模型”

各種效果圖更是在推特上爆火,試玩過的網友直呼:

游戲結束!

8465c746-b13a-11ed-bfe3-dac502259ad0.png

所以,這個ControlNet究竟給擴散模型加了什么buff?

給AI畫畫模型加buff

ControlNet的原理,本質上是給預訓練擴散模型增加一個額外的輸入,控制它生成的細節。

這里可以是各種類型的輸入,作者給出來的有8種,包括草圖、邊緣圖像、語義分割圖像、人體關鍵點特征、霍夫變換檢測直線、深度圖、人體骨骼等。

那么,讓大模型學會“按輸入條件生成圖片”的原理是什么呢?

ControlNet整體思路和架構分工如下:

849670da-b13a-11ed-bfe3-dac502259ad0.png

具體來說,ControlNet先復制一遍擴散模型的權重,得到一個“可訓練副本”(trainable copy)。

相比之下,原擴散模型經過幾十億張圖片的預訓練,因此參數是被“鎖定”的。而這個“可訓練副本”只需要在特定任務的小數據集上訓練,就能學會條件控制。

據作者表示,即使數據量很少(不超過5萬張圖片),模型經過訓練后條件控制生成的效果也很好。

“鎖定模型”和“可訓練副本”通過一個1×1的卷積層連接,名叫“0卷積層”。

0卷積層的權重和偏置初始化為0,這樣在訓練時速度會非常快,接近微調擴散模型的速度,甚至在個人設備上訓練也可以。

例如一塊英偉達RTX 3090TI,用20萬張圖像數據訓練的話只需要不到一個星期:

84dc0e88-b13a-11ed-bfe3-dac502259ad0.png

作者基于當前大火的Stable Diffusion進行了具體實現,主要架構如下:

85209db4-b13a-11ed-bfe3-dac502259ad0.png

針對不同的輸入,作者也給出了對應不同的模型,生成效果也都不錯。

例如這是采用Canny邊緣檢測算法檢測出的邊緣,用于生成圖像:

85747290-b13a-11ed-bfe3-dac502259ad0.png

這是基于霍夫變換的直線檢測算法生成的直線草圖,用于生成各種風格的室內設計:

8594a8a8-b13a-11ed-bfe3-dac502259ad0.png

當然,自己作畫也可以,例如這是基于用戶草圖生成的小龜:

85b49ece-b13a-11ed-bfe3-dac502259ad0.png

提取深度圖,并讓AI生成一幅相似的圖像,直接舉一反五:

85de83a6-b13a-11ed-bfe3-dac502259ad0.png

語義分割下的游泳池圖像,不僅水里有倒影細節,建筑也變化多樣:

8617b98c-b13a-11ed-bfe3-dac502259ad0.png

不過目前來看,最受歡迎的還是基于人體姿態估計算法,控制動漫人物的動作生成:

8633039a-b13a-11ed-bfe3-dac502259ad0.png

看到這里,是不是已經有了大膽的想法?(手動狗頭)

曾開發爆火AI上色插件

這個項目的作者Lvmin Zhang,2021年本科畢業于東吳大學,目前在斯坦福大學讀博。

他最出名的項目之一,是2017年開發的AI上色插件style2paints,目前GitHub上已經有15.9k星。

8693c266-b13a-11ed-bfe3-dac502259ad0.png

style2paints也經過了好幾次迭代,目前即將更新到第五版。

這是第四版的效果,只需要線稿,AI就能自動給你的圖像完成上色:

86b1f2a4-b13a-11ed-bfe3-dac502259ad0.png

除了這個項目以外,他也是CV頂會的常客了。

86de6cf8-b13a-11ed-bfe3-dac502259ad0.png

One More Thing

值得一提的是,現在已經有基于ControlNet的國內產品上線了。

這個產品名叫稿定AI,包含照片轉插畫、插畫線稿上色、插畫優化翻新等功能,正是基于ControlNet打造。

作畫效果大概是醬嬸的:

870cdc00-b13a-11ed-bfe3-dac502259ad0.png

感興趣的小伙伴們可以去試玩一波了~

項目地址: https://github.com/lllyasviel/ControlNet

參考鏈接: [1]https://lllyasviel.github.io/Style2PaintsResearch/ [2]https://twitter.com/search?q=controlnet&src=typed_query [3]https://www.gaoding.com/ai

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30146

    瀏覽量

    268414
  • 數據集
    +關注

    關注

    4

    文章

    1205

    瀏覽量

    24644

原文標題:讓AI學會畫手的方法來了,給輸入加個buff就能控制生成細節,華人小哥出品丨GitHub 4.6k星

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    生成AI如何在智能家居中落地?

    ,創造新內容的能力為新的應用開辟了許多可能性,尤其在智能家居中,生成AI更是大有可為。 ? 通過生成AI,智能家居可以學習家庭成員的行為模式,了解他們的喜好和需求,并根據這些信息來
    的頭像 發表于 07-27 00:19 ?1626次閱讀

    如何快速學會AD?

    最近看完了AD視頻教程,怎么感覺一點都沒用呢?求教大家,如何才能快速入手AD,學會畫板子?(是不是方法有問題,感覺學的很迷茫啊!)
    發表于 08-15 09:36

    舒心貼進駐《機會來了》科技庫,4大黑科技你安全高效告別疼痛

    設計、方便更換,醫用泡棉電極片、延長使用壽命,舒心貼在制作上完善各個細節,集萬千寵愛于一身,只為使用者更好的體驗。這4大黑科技,有沒有你覺得很神奇呢?舒心貼針對疼痛管理帶來的改變
    發表于 02-01 11:17

    如何通過使用gm/Id的方法來簡化設計運放?

     一直想通過使用gm/Id的方法來簡化設計運放;  但在實際設計過程中遇到較多的問題;  然后參考了一些國外的文獻,發現他們好多用此方法設計OTA;如果是常規的一些opa,可能Av的估算并不是那么
    發表于 06-24 07:37

    可以通過哪些方法來改善MCU掃描附近AP時出現的故障

    有客戶反應,XR系列MCU在連接進行掃描附近AP時,掃描不出所需要的AP,但第二次或者第三次就能掃描出來了。當mcu執行掃描動作時,掃描不出所需要的ap時,可以通過哪些方法來改善這種情況。
    發表于 12-29 06:00

    qmail郵件服務器加個病毒防火墻

    qmail郵件服務器加個病毒防火墻 近期郵件病毒泛濫,正好從網上看到幾篇關于qmail防毒的文章,于是邊做邊比較了一下網上的幾種方
    發表于 02-01 13:42 ?728次閱讀

    如何通過簡單的方法來增加手機的續航時間

    通過這篇文章告訴大家如何通過簡單的方法來了解手機的續航時間。
    發表于 01-19 09:20 ?6111次閱讀

    AI安防行業帶來了翻天覆地的變化 視頻監控是安防最重要的部分

    AI的興起這兩年的安防行業變得熱鬧起來,新概念和新產品層出不窮,無論是傳統企業還是新興企業,無一不在AI技術上大秀“肌肉”。AI似乎安防
    發表于 01-14 15:52 ?774次閱讀

    AI助手輸入更智能

    輸入更智能:搜狗輸入法發布業內首個AI助手
    的頭像 發表于 08-20 11:20 ?3570次閱讀

    西安交大畢業生機械學會寫字

    機械也會寫字了! 最近,西安交大畢業生杭凱宇研發出一款算法,只需提前設計好路線,機械就能寫出英文單詞“SCIENCE”,平均控制精度高達 0.42 ± 0.34 mm。 通過該算法
    的頭像 發表于 06-15 15:31 ?1969次閱讀

    AI算法5秒鐘就能克隆你的聲音

    今天,大家介紹一個算法。 AI 算法 5 秒鐘,就能克隆你的聲音,你信嗎? 聽聽這段音頻,猜猜看是 AI 合成音,還是真人錄音? 答案是:AI
    的頭像 發表于 11-17 10:05 ?6922次閱讀

    企業很著急尋找的沖床曲軸磨損修復方法來了

    企業很著急尋找的沖床曲軸磨損修復方法來了
    發表于 05-05 16:26 ?0次下載

    生成AI,切蛋糕的刀還是做蛋糕的

    伴隨著AIGC的突然爆火,生成AI是搶走蛋糕,還是做大蛋糕
    的頭像 發表于 11-23 10:22 ?688次閱讀
    <b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>,切蛋糕的刀還是做蛋糕的<b class='flag-5'>手</b>?

    在線研討會 | 9 月 19 日,利用 GPU 加速生成AI 圖像內容生成

    生成AI 已經展示出其在藝術、設計、影視動畫、互娛、建筑等領域加速內容創作的價值,可以簡化耗時任務,內容創作回歸創意,并具有重塑無數行業的潛力。生成
    的頭像 發表于 09-14 17:40 ?467次閱讀
    在線研討會 | 9 月 19 日,利用 GPU 加速<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 圖像內容<b class='flag-5'>生成</b>

    生成AI觸手可及 ——AirBox 正式開放預定

    生成AI觸手可及 ——AirBox 正式開放預定
    的頭像 發表于 04-26 08:34 ?817次閱讀
    <b class='flag-5'>讓</b><b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>觸手可及 ——AirBox 正式開放預定