精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AIGC時代的ImageNet!百萬生成圖片助力AI生成圖片檢測器研發

CVer ? 來源:CVer ? 2023-07-04 15:53 ? 次閱讀

1 引言:

在這個AIGC爆發的時代,人人都可以利用AI算法生成高質量的文本,圖像,音頻內容。其中,由Midjourney, Stable Diffusion等圖像生成方法制作的圖像,其逼真程度讓人贊嘆。人眼已經難以對其真假進行區分了。這不禁喚起了人們的隱憂:大量虛假圖片將會在互聯網上廣泛傳播。虛假圖片的泛濫會引發多種社會安全問題。例如,虛假新聞會擾亂社會秩序,混淆視聽。惡意的人臉圖片造假則會引發金融欺詐,造成信任危機。例如,下圖為Midjourney生成的特朗普被捕圖片。這類圖片在社交媒體上廣泛傳播,對政治領域造成了不良影響。因此,對這些AI生成的圖像進行有效監管是非常有必要的。

cc0de970-1828-11ee-962d-dac502259ad0.jpg

圖2 AI生成的特朗普被捕圖片,來源于https://news.sina.com.cn/c/2023-04-15/doc-imyqmchz0199110.shtml

考慮到人眼已經難以對真假圖片進行區分,我們急需一種AI生成圖像檢測器以區分AI制作的圖像和真實的圖像。然而,現在大規模數據集的缺失妨礙了檢測器的開發。因此,我們提出了百萬量級的GenImage數據集,致力于構建AIGC時代的ImageNet。

2 數據集介紹:

cc65a674-1828-11ee-962d-dac502259ad0.jpg

表1 虛假圖片檢測數據集概覽

過去業界也有推出一些數據集。他們主要有三個特點。第一個是數據規模小,第二個是都是基于GAN的,第三個是局限于人臉數據。隨著時間推移,數據規模慢慢地在增加,生成器也從GAN時代過渡到Diffusion時代,數據的范圍也在增加。但是一個大規模的,以Diffusion模型為主的,涵蓋各類通用圖像的數據集仍然是缺失的。

基于此,我們提出一個對標imagenet的genimage數據集。真實的圖片采用了ImageNet。虛假的圖片采用ImageNet的標簽進行生成。我們利用了八個先進的生成器來生成,分別是Midjourney, Stable Diffusion V1.4, Stable Diffusion V1.5, ADM, GLIDE, Wukong,VQDM和BigGAN。這些生成器生成的圖片總數基本與真實圖片一致。每個生成器生成的圖片數量也基本一致。每一類生成的圖片數量基本一致。

這個數據集具有以下優勢:

1. 大量的數據:超過百萬對圖片對。

2. 豐富的圖片內容:利用ImageNet進行構建,具有豐富的標簽
3. 先進的生成器:覆蓋Midjourney, Stable Diffusion等Diffusion生成器。

在真實世界中檢測器往往會遇到各種各樣的困難。我們經過實驗發現,檢測器往往在兩種情況下性能下降嚴重。第一種是面對訓練集中未出現的生成器生成的圖片時。第二種是面對退化的圖像。例如,CNNSpot在Stable Diffusion V1.4上訓練后,在Midjourney上測試僅有52.8的準確率。當訓練和測試生成器同為Stable Diffusion V1.4,在面對模糊的圖像時,CNNSpot準確率僅僅為77.9。基于此,我們在這個數據集基礎上對檢測器提出兩個挑戰:

1. 交叉生成器:檢測器在一種生成器生成的數據上訓練,在其他生成器生成的數據上驗證。這個任務目的是考察檢測器在不同生成器上的泛化能力。

2. 退化圖像識別:檢測器需要對于低分辨率,模糊和壓縮圖像進行識別。這個任務主要考察檢測器在真實條件(如互聯網上傳播)中面對低質量圖像時的泛化問題。

我們相信這個數據集的提出將大大有助于人們開發AI生成圖片檢測器。

3 實驗:

我們做了一些實驗來考察這個數據集,我們發現在某個生成器上訓練的ResNet-50模型在其他的測試準確率會明顯降低。然而在真實情況下我們難以得知遇到的圖像的生成器是什么。因此檢測器對于不同生成器生成圖片的泛化能力很重要。

cc9d592a-1828-11ee-962d-dac502259ad0.jpg

表2 使用ResNet 50在不同生成器上交叉驗證

我們對比了現有方法在Stable Diffusion V1.4上訓練,然后在各種生成器上測試的結果,見圖3。我們也評測了各種生成器上訓練,然后在各種生成器上測試的結果。見圖4。圖4中,Testing Subset那一列中的每一個數據點,都是在八個生成器上訓練,然后在一個生成器上測試得到的平均結果。然后我們將這些測試集上的結果平均,得到最右側的平均結果。

cccf86d4-1828-11ee-962d-dac502259ad0.jpg

表3 在Stable Diffusion V1.4上訓練,不同測試集上測試

cce87dce-1828-11ee-962d-dac502259ad0.jpg

表4 在不同生成器上訓練,不同測試集上測試

我們對測試集進行退化處理,采用不同參數下的低分辨率,JPEG壓縮和高斯模糊,評測結果如下

cd47e6b0-1828-11ee-962d-dac502259ad0.jpg

表5 在不同退化圖像上驗證結果

那么采集這么多數據是不是有用呢?我們做了相關實驗,證明通過提升數據類比和每類的圖片數量,我們是可以提高性能的。

cd8a9c3a-1828-11ee-962d-dac502259ad0.jpg

表6 提升圖片數量的結果

針對GenImage數據集對于不同圖片的泛化能力,我們發現他對于人臉和藝術類圖片也能達到很好的效果。

cdb835f0-1828-11ee-962d-dac502259ad0.jpg

表7 泛化到藝術類和人臉類圖片的結果

cdf037de-1828-11ee-962d-dac502259ad0.jpg

圖3 測試所用的藝術類和人臉類圖片展示

4 展望

隨著AI生成圖片能力的不斷提升,對于AI生成的圖片實現有效檢測的需求將會越來越迫切。本數據集致力于為真實環境下的生成圖片檢測提供有效訓練數據。我們使用ResNet-50在本數據集中訓練,然后在真實推文中進行檢測。如下圖4,ResNet-50能夠有效識別真圖和假圖。這個結果證明了GenIamge可以用于訓練模型以判別真實世界的虛假信息。我們認為,該領域未來值得努力的方向是不斷提升檢測器在GenImage數據集上的準確率,并進而提升其在真實世界面對虛假信息的能力。

ce1fd2a0-1828-11ee-962d-dac502259ad0.jpg

圖4.1 真實推文展示(真圖)

ce5e4cd8-1828-11ee-962d-dac502259ad0.jpg

圖4.2 真實推文展示(假圖)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 檢測器
    +關注

    關注

    1

    文章

    860

    瀏覽量

    47654
  • 數據集
    +關注

    關注

    4

    文章

    1205

    瀏覽量

    24648
  • AIGC
    +關注

    關注

    1

    文章

    357

    瀏覽量

    1510

原文標題:AIGC時代的ImageNet!百萬生成圖片助力AI生成圖片檢測器研發

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    LABVIEW怎么生成圖片,然后調用圖片

    ,然后把這個圖片保存起來,以便別的地方調用。六個輸入項中,第一個是分類選擇,因為這種分子式結構一共有6類。1.第一個的分類選擇,是為了選結構形式,如下一共有六種:2.選擇完參數后 生成圖片如下:3.把
    發表于 12-08 11:21

    改進的基于混沌理論的檢測器生成算法

    為提高抗體的生成速度,依據人工免疫系統的混沌特性,提出一種基于混沌方法的新的檢測器生成算法,利用混沌的遍歷性,并結合信息論中熵的概念來產生均勻的初始檢測器集合,利
    發表于 12-25 12:45 ?17次下載

    基于VC++的生成公章圖片的簡易工具

    學習VC也沒多久,將我做的這個小工具和大家分享一下。其主要功能就是可以自定義生成公章圖形并保存為bmp圖片,希望對大家有點用。具體實現的方法如下: 步驟一:生成
    發表于 10-29 11:56 ?19次下載

    DTFM信號生成檢測?(2)

    本文介紹DTFM信號生成檢測之二,DTMF檢測器實現。
    發表于 03-11 13:15 ?1446次閱讀
    DTFM信號<b class='flag-5'>生成</b>與<b class='flag-5'>檢測</b>?(2)

    16、24、32全套字庫圖片生成應用程序軟件免費下載

    本文檔的主要內容詳細介紹的是16、24、32全套字庫圖片生成應用程序軟件免費下載。
    發表于 09-19 16:04 ?19次下載
    16、24、32全套字庫<b class='flag-5'>圖片</b><b class='flag-5'>生成</b>應用程序軟件免費下載

    電子印章圖片生成器的應用程序免費下載

    本文檔的主要內容詳細介紹的是電子印章圖片生成器的應用程序免費下載。
    發表于 07-03 08:00 ?334次下載
    電子印章<b class='flag-5'>圖片</b><b class='flag-5'>生成</b>器的應用程序免費下載

    如何使用TensorFlow Hub的ESRGAN模型來在安卓app中生成超分圖片

    從一張低分辨率的圖片生成一張對應的高分辨率圖片的任務通常被稱為單圖超分(Single Image Super Resolution - SISR)。盡管可以使用傳統的插值方法(如雙線性
    的頭像 發表于 11-26 09:40 ?3463次閱讀

    條件生成對抗模型生成數字圖片的教程

    這次我們在上次的例子中在提升一下,這次我們選用條件生成對抗模型(Conditional Generative Adversarial Networks)來生成數字圖片
    的頭像 發表于 12-10 18:36 ?726次閱讀

    AIGC最新綜述:從GAN到ChatGPT的AI生成歷史

    本調查全面回顧了生成模型的歷史、基本組件、AIGC 從單模態交互和多模態交互的最新進展。我們從單峰性的角度介紹了文本和圖像的生成任務和相關模型。我們從多模態的角度來介紹上述模態之間的交叉應用。最后,我們討論了
    的頭像 發表于 03-13 10:13 ?2725次閱讀

    GTC 2023主題直播:使用Picasso服務構建圖片和視頻生成式模型

    我們很高興Getty Images將使用Picasso服務構建Edify圖片和Edify視頻生成式模型。
    的頭像 發表于 03-22 11:31 ?840次閱讀
    GTC 2023主題直播:使用Picasso服務構建<b class='flag-5'>圖片</b>和視頻<b class='flag-5'>生成</b>式模型

    智慧有數 浪潮信息發布生成AI存儲解決方案

    與管理瓶頸,浪潮信息在"數智未來"AIGC數據應用創新論壇上,正式發布面向生成AI的存儲解決方案,該方案以極致融合、極致性能、極致節能,和熱溫冷冰四級數據全生命周期管理,助力開啟
    的頭像 發表于 07-11 09:46 ?405次閱讀

    IBM 謝東:IBM watsonx 助力生成AI 的企業應用

    ,企業在探索利用生成AI 促進自身業務發展時所面臨的挑戰以及應對措施。 以下是他的發言摘要: IBM 全球副總裁、IBM 大中華區首席技術官 謝東 (圖片來源:2023 中國 AIGC
    的頭像 發表于 09-06 18:20 ?586次閱讀
    IBM 謝東:IBM watsonx <b class='flag-5'>助力</b><b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 的企業應用

    AIGC與傳統內容生成的區別

    AIGC(Artificial Intelligence Generated Content,人工智能生成內容)與傳統內容生成在多個方面存在顯著區別。以下是對這兩者的對比: 一、數據類型與處理
    的頭像 發表于 10-25 15:13 ?277次閱讀

    AIGC生成內容的優勢與挑戰

    人工智能生成內容(AIGC,Artificial Intelligence Generated Content)是指利用人工智能技術自動生成文本、圖像、音頻和視頻等內容的過程。隨著深度學習、自然語言
    的頭像 發表于 10-25 15:36 ?327次閱讀

    AIGC與傳統內容生成的區別 AIGC的優勢和挑戰

    AIGC(Artificial Intelligence Generated Content,生成內容)與傳統內容生成在多個方面存在顯著區別,同時AIGC也展現出其獨特的優勢和面臨的挑
    的頭像 發表于 11-22 16:04 ?119次閱讀