精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大腦視覺信號被Stable Diffusion復現圖像!

新機器視覺 ? 來源:量子位 ? 2023-03-16 10:26 ? 次閱讀

導讀

“現在Stable Diffusion已經能重建大腦視覺信號了!”

一個聽起來細思極恐的“AI讀腦術”研究,在網上掀起軒然大波:

32fc8f98-c378-11ed-bfe3-dac502259ad0.jpg

這項研究聲稱,只需用fMRI(功能磁共振成像技術,相比sMRI更關注功能性信息,如腦皮層激活情況等)掃描大腦特定部位獲取信號,AI就能重建出我們看到的圖像!

330a216c-c378-11ed-bfe3-dac502259ad0.jpg

例如這是一系列人眼看到的圖像,包括戴著蝴蝶結的小熊、飛機和白色鐘樓:

3312c6fa-c378-11ed-bfe3-dac502259ad0.jpg

AI看了眼人腦信號后,立馬就給出這樣的結果,屬實把該抓的重點全都抓住了:

331d6f4c-c378-11ed-bfe3-dac502259ad0.gif

再發展一步,這不就約等于哈利波特里的讀心術了嗎??

34ee7e06-c378-11ed-bfe3-dac502259ad0.png

更有網友感到驚嘆:如果說ChatGPT開放API是件大事,那這簡直稱得上瘋狂。

3512a524-c378-11ed-bfe3-dac502259ad0.png

所以,這究竟是怎么一回事?

用Stable Diffusion可視化人腦信號

這項研究來自日本大阪大學,目前已經被CVPR 2023收錄:

35262d6a-c378-11ed-bfe3-dac502259ad0.png

研究希望能從人類大腦活動中,重建高保真的真實感圖像,來理解大腦、并解讀計算機視覺模型和人類視覺系統之間的聯系。

要知道,此前雖然有不少腦機接口研究,致力于從人類大腦活動中讀取并重建信號,如意念打字等。

然而,從人類大腦活動中重建視覺信號——具有真實感的圖像,仍然挑戰極大。

例如這是此前UC伯克利做過的一項類似研究,復現一張人眼看到的飛機片段,但計算機重建出來的圖像卻幾乎看不出飛機的特征:

35309a34-c378-11ed-bfe3-dac502259ad0.jpg

△圖源UC伯克利研究Reconstructing Visual Experiences from Brain Activity Evoked by Natural Movies

這次,研究人員重建信號選用的AI模型,是這一年多在圖像生成領域地位飛升的擴散模型。

當然,更準確地說是基于潛在擴散模型(LDM)——Stable Diffusion。

整體研究的思路,則是基于Stable Diffusion,打造一種以人腦活動信號為條件的去噪過程的可視化技術。

它不需要在復雜的深度學習模型上進行訓練或做精細的微調,只需要做好fMRI(功能磁共振成像技術)成像到Stable Diffusion中潛在表征的簡單線性映射關系就行。

它的概覽框架是這樣的,看起來也非常簡單:

僅由1個圖像編碼器、1個圖像解碼器,外加1個語義解碼器組成。

353da54e-c378-11ed-bfe3-dac502259ad0.jpg

具體怎么work?

如下圖所示,第一部分為本研究用到的LDM示意圖。

其中ε代表圖像編碼器,D代表圖像解碼器,而τ是一個文本編碼器(CLIP)。

3550921c-c378-11ed-bfe3-dac502259ad0.jpg

重點是解碼分析,如下圖所示,模型依次從大腦早期(藍色)和較高(黃色)視覺皮層內的fMRI信號中,解碼出重建圖像(z)和相關文本c的潛在表征。

然后將這些潛在表征當作輸入,就可以得到模型最終復現出來的圖像Xzc。

3564b850-c378-11ed-bfe3-dac502259ad0.jpg

最后還沒有完,如編碼分析示意圖,作者還構建了一個編碼模型,用來預測LDM不同組件(包括圖像z、文本c和zc)所對應的fMRI信號,它可以用來理解Stable Diffusion的內部過程。

357a3540-c378-11ed-bfe3-dac502259ad0.jpg

可以看到,采用了zc的編碼模型在大腦后部視覺皮層產生的預測精確度是最高的。(zc是與c進行交叉注意的反向擴散后,z再添加噪聲的潛在表征)

3584d482-c378-11ed-bfe3-dac502259ad0.jpg

相比其它兩者,它生成的圖像既具有高語義保真度,分辨率也很高。

359d6326-c378-11ed-bfe3-dac502259ad0.jpg

還有用GAN重建人臉圖像的

看完這項研究,已經有網友想到了細思極恐的東西:

這個AI雖然只是復制了“眼睛”所看到的東西。
但是否會有一天,AI能直接從人腦的思維、甚至是記憶中重建出圖像或文字?

35dddfdc-c378-11ed-bfe3-dac502259ad0.jpg

“語言的用處不再存在了”

35f8543e-c378-11ed-bfe3-dac502259ad0.png

于是有網友進一步想到,如果能讀取記憶的話,那么目擊證人的證詞似乎也會變得更可靠了:

360e982a-c378-11ed-bfe3-dac502259ad0.png

還別說,就在去年真有一項研究基于GAN,通過fMRI收集到的大腦信號重建看到的人臉圖像:

3614f224-c378-11ed-bfe3-dac502259ad0.jpg

不過,重建出來的效果似乎不怎么樣……

36291312-c378-11ed-bfe3-dac502259ad0.jpg

顯然,在人臉這種比較精細的圖像生成上,AI“讀腦術”還有很長一段路要走。

對于這種大腦信號重建的研究,也有網友提出了質疑。

例如,是否只是AI從訓練數據集中提取出了相似的數據?

3639f768-c378-11ed-bfe3-dac502259ad0.jpg

對此有網友回復表示,論文中的訓練數據集和測試集是分開的:

365692c4-c378-11ed-bfe3-dac502259ad0.jpg

作者們也在項目主頁中表示,代碼很快會開源。可以先期待一下~

366d19e0-c378-11ed-bfe3-dac502259ad0.png

作者介紹

本研究僅兩位作者。

一位是2021年才剛剛成為大阪大學助理教授的Yu Takagi,他主要從事計算神經科學和人工智能的交叉研究。

最近,他同時在牛津大學人腦活動中心和東京大學心理學系利用機器學習技術,來研究復雜決策任務中的動態計算。

另一位是大阪大學教授Shinji Nishimoto,他也是日本腦信息通信融合研究中心的首席研究員。

研究方向為定量理解大腦中的視覺和認知處理,谷歌學術引用3000+次。

那么,你覺得這波AI重建圖像的效果如何?

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1083

    瀏覽量

    40418
  • AI
    AI
    +關注

    關注

    87

    文章

    30198

    瀏覽量

    268447
  • 深度學習
    +關注

    關注

    73

    文章

    5493

    瀏覽量

    120985

原文標題:CVPR 2023|大腦視覺信號被Stable Diffusion復現圖像!“人類的謀略和謊言不存在了”

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Stable Diffusion的完整指南:核心基礎知識、制作AI數字人視頻和本地部署要求

    的,其目的是消除對訓練圖像的連續應用高斯噪聲,可以將其視為一系列去噪自編碼器。Stable Diffusion由3個部分組成:變分自編碼器(VAE)、U-Net和一個文本編碼器。添加和去除高斯噪聲的過程
    的頭像 發表于 09-18 10:06 ?2319次閱讀
    <b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>的完整指南:核心基礎知識、制作AI數字人視頻和本地部署要求

    Stability AI開源圖像生成模型Stable Diffusion

    Stable Diffusion 的很多用戶已經公開發布了生成圖像的樣例,Stability AI 的首席開發者 Katherine Crowson 在推特上分享了許多圖像。基于 AI
    的頭像 發表于 09-21 15:37 ?2912次閱讀

    大腦視覺信號Stable Diffusion復現圖像

    這項研究聲稱,只需用fMRI(功能磁共振成像技術,相比sMRI更關注功能性信息,如腦皮層激活情況等)掃描大腦特定部位獲取信號,AI就能重建出我們看到的圖像
    的頭像 發表于 03-06 10:56 ?1692次閱讀

    大腦視覺信號Stable Diffusion復現圖像!“人類的謀略和謊言不存在了”

    它不需要在復雜的深度學習模型上進行訓練或做精細的微調,只需要做好fMRI(功能磁共振成像技術)成像到Stable Diffusion中潛在表征的簡單線性映射關系就行。
    的頭像 發表于 03-08 10:21 ?737次閱讀

    高性能計算HPC照亮AIGC未來:PC集群+Stable Diffusion 打造極致游戲體驗

    隨著計算能力和技術水平的不斷提高,PC集群和Stable Diffusion集成在游戲行業中的應用將會更加廣泛,可以為游戲開發者和分析師提供更多一流的工具和技術支持,從而推動整個游戲產業迎來新的發展機遇。
    的頭像 發表于 04-20 11:46 ?804次閱讀
    高性能計算HPC照亮AIGC未來:PC集群+<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> 打造極致游戲體驗

    一文讀懂Stable Diffusion教程,搭載高性能PC集群,實現生成式AI應用

    PC Farm、生成式AI和Stable Diffusion模型都是非常有用的工具和技術,可以幫助用戶快速構建和管理計算機集群,生成高質量的數據和圖像,提高模型的泛化能力和魯棒性。
    的頭像 發表于 05-01 07:47 ?2292次閱讀
    一文讀懂<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>教程,搭載高性能PC集群,實現生成式AI應用

    使用OpenVINO?在算力魔方上加速stable diffusion模型

    Stable Diffusion 是 stability.ai 開源的 AI 圖像生成模型,實現輸入文字,生成圖像的功能。Stable
    的頭像 發表于 05-12 09:10 ?1406次閱讀
    使用OpenVINO?在算力魔方上加速<b class='flag-5'>stable</b> <b class='flag-5'>diffusion</b>模型

    驚!大腦視覺信號Stable Diffusion復現成視頻!

    大腦活動中重建人類視覺任務,尤其是功能磁共振成像技術(fMRI)這種非侵入式方法,一直是受到學界較多的關注。因為類似這樣的研究,有利于理解我們的認知過程。
    的頭像 發表于 06-02 16:51 ?939次閱讀
    驚!<b class='flag-5'>大腦</b><b class='flag-5'>視覺</b><b class='flag-5'>信號</b><b class='flag-5'>被</b><b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b><b class='flag-5'>復現</b>成視頻!

    優化 Stable Diffusion 在 GKE 上的啟動體驗

    Diffusion 等應運而生。Stable Diffusion 是一個文字生成圖像Diffusion 模型,它能夠根據給定任何文本輸
    的頭像 發表于 06-03 08:35 ?851次閱讀

    基于一種移動端高性能 Stable Diffusion 模型

    ? Stable Diffusion (SD)是當前最熱門的文本到圖像(text to image)生成擴散模型。盡管其強大的圖像生成能力令人震撼,一個明顯的不足是需要的計算資源巨大,
    的頭像 發表于 06-12 10:14 ?757次閱讀
    基于一種移動端高性能 <b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> 模型

    iPhone兩秒出圖,目前已知的最快移動端Stable Diffusion模型來了

    近日,Snap 研究院推出最新高性能 Stable Diffusion 模型,通過對網絡結構、訓練流程、損失函數全方位進行優化,在 iPhone 14 Pro 上實現 2 秒出圖(512x512
    的頭像 發表于 06-12 15:25 ?745次閱讀
    iPhone兩秒出圖,目前已知的最快移動端<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>模型來了

    樹莓派能跑Stable Diffusion了?

    Stable Diffusion是一種文本到圖像生成的大型深度學習模型,它可以根據文本的描述生成詳細的圖像,也可以用于其他任務,如圖像修復、
    的頭像 發表于 07-26 11:46 ?1502次閱讀

    Stable Diffusion的完整指南:核心基礎知識、制作AI數字人視頻和本地部署要求

    13400;i3 12100;i7 12700 ;i9 12900? 在當今的數字時代,人工智能正在逐步改變人們的生活和工作方式。其中,Stable Diffusion作為一種深度學習技術,受到廣泛關注。它能夠通過對圖像或視頻
    的頭像 發表于 09-07 14:12 ?2132次閱讀
    <b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>的完整指南:核心基礎知識、制作AI數字人視頻和本地部署要求

    Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業界領先的前身Stable Diffusion更快、更強大,而Stab
    的頭像 發表于 02-19 16:03 ?896次閱讀
    Stability AI試圖通過新的<b class='flag-5'>圖像</b>生成人工智能模型保持領先地位

    UL Procyon AI 發布圖像生成基準測試,基于Stable Diffusion

    UL去年發布的首個Windows版Procyon AI推理基準測試,以計算機視覺工作負載評估AI推理性能。新推出的圖像生成測試將提供統一、精確且易于理解的工作負載,用以保證各支持硬件間公平、可比的性能表現。
    的頭像 發表于 03-25 16:16 ?839次閱讀