精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

驚!大腦視覺信號被Stable Diffusion復現成視頻!

CVer ? 來源:量子位 ? 2023-06-02 16:51 ? 次閱讀

現在,AI可以把人類腦中的信息,用高清視頻展示出來了!

例如你坐在副駕所欣賞到的沿途美景信息,AI分分鐘給重建了出來:

e8e12ad0-fae1-11ed-90ce-dac502259ad0.gif

看到過的水中的魚兒、草原上的馬兒,也不在話下:

e8f91f00-fae1-11ed-90ce-dac502259ad0.gif

e90528ea-fae1-11ed-90ce-dac502259ad0.gif

這就是由新加坡國立大學和香港中文大學共同完成的最新研究,團隊將項目取名為MinD-Video。

e914e28a-fae1-11ed-90ce-dac502259ad0.png

Cinematic Mindscapes: High-quality Video Reconstruction from Brain Activity 主頁:https://mind-video.com/ 論文:https://arxiv.org/abs/2305.11675 代碼:https://github.com/jqin4749/MindVideo

這波操作,宛如科幻電影《超體》中Lucy讀取反派大佬記憶一般:

e91f001c-fae1-11ed-90ce-dac502259ad0.gif

引得網友直呼:

推動人工智能和神經科學的前沿。

e94a5302-fae1-11ed-90ce-dac502259ad0.png

值得一提的是,大火的Stable Diffusion也在這次研究中立了不小的功勞。

e9588300-fae1-11ed-90ce-dac502259ad0.png

怎么做到的?

從大腦活動中重建人類視覺任務,尤其是功能磁共振成像技術(fMRI)這種非侵入式方法,一直是受到學界較多的關注。

因為類似這樣的研究,有利于理解我們的認知過程。

但以往的研究都主要聚焦在重建靜態圖像,而以高清視頻形式來展現的工作還是較為有限。

之所以會如此,是因為與重建一張靜態圖片不同,我們視覺所看到的場景、動作和物體的變化是連續、多樣化的。

而fMRI這項技術的本質是測量血氧水平依賴(BOLD)信號,并且在每隔幾秒鐘的時間里捕捉大腦活動的快照。

相比之下,一個典型的視頻每秒大約包含30幀畫面,如果要用fMRI去重建一個2秒的視頻,就需要呈現起碼60幀。

因此,這項任務的難點就在于解碼fMRI并以遠高于fMRI時間分辨率的FPS恢復視頻。

為了彌合圖像和視頻大腦解碼之間差距,研究團隊便提出了MinD-Video的方法。

整體來看,這個方法主要包含兩大模塊,它們分別做訓練,然后再在一起做微調。

e96f0e18-fae1-11ed-90ce-dac502259ad0.png

這個模型從大腦信號中逐步學習,在第一個模塊多個階段的過程,可以獲得對語義空間的更深入理解。

具體而言,便是先利用大規模無監督學習與mask brain modeling(MBM)來學習一般的視覺fMRI特征。

然后,團隊使用標注數據集的多模態提取語義相關特征,在對比語言-圖像預訓練(CLIP)空間中使用對比學習訓練fMRI編碼器

在第二個模塊中,團隊通過與增強版Stable Diffusion模型的共同訓練來微調學習到的特征,這個模型是專門為fMRI技術下的視頻生成量身定制的。

如此方法之下,團隊也與此前的諸多研究做了對比,可以明顯地看到MinD-Video方法所生成的圖片、視頻質量要遠優于其它方法。

e97b83f0-fae1-11ed-90ce-dac502259ad0.png

而且在場景連續變化的過程中,也能夠呈現高清、有意義的連續幀。

e98d88ac-fae1-11ed-90ce-dac502259ad0.png

研究團隊

這項研究的共同一作,其中一位是來自新加坡國立大學的博士生Zijiao Chen,目前在該校的神經精神疾病多模式神經成像實驗室(MNNDL_Lab)。

另一位一作則是來自香港中文大學的Jiaxin Qing,就讀專業是信息工程系。

除此之外,通訊作者是新加坡國立大學副教授Juan Helen ZHOU。

據了解,這次的新研究是他們團隊在此前一項名為MinD-Vis的功能磁共振成像圖像重建工作的延伸。

MinD-Vis已經被CVPR 2023所接收。

e99ee28c-fae1-11ed-90ce-dac502259ad0.png

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30146

    瀏覽量

    268421
  • 人工智能
    +關注

    關注

    1791

    文章

    46859

    瀏覽量

    237579
  • 視覺
    +關注

    關注

    1

    文章

    146

    瀏覽量

    23893

原文標題:驚!大腦視覺信號被Stable Diffusion復現成視頻!"AI讀腦術"又來了!

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    PCB視頻板 —— 開啟視覺盛宴的關鍵之匙

    PCB 視頻板是一種專門用于處理視頻信號的印制電路板。它作為電子元器件的支撐體和電氣連接的載體 ,主要功能是承載與視頻處理相關的電子元件,如視頻信號處理器、解碼器、編碼器等。通過其上面
    的頭像 發表于 09-06 14:18 ?101次閱讀

    示波器的波形存儲與復現,再也不怕瞬時信號抓不住了

    示波器和虛擬USB示波器來進行。Chrent臺式示波器的波形存儲與復現使用信號源模擬一個信號。通過BNC線將這個信號連接到示波器上。在示
    的頭像 發表于 09-05 08:06 ?1902次閱讀
    示波器的波形存儲與<b class='flag-5'>復現</b>,再也不怕瞬時<b class='flag-5'>信號</b>抓不住了

    實操: 如何在AirBox上跑Stable Diffusion 3

    StableDiffusion3Medium是一種多模態擴散變換器(MMDiT)文本到圖像模型,在圖像質量、排版、復雜提示理解和資源效率方面具有顯著提升的性能。目前瑞莎團隊使用StableDiffusion3Medium開源模型,通過SOPHONSDK移植到SG2300X處理器系列產品上進行本地TPU硬件加速推理,實現在radxaAirbox上離線快速生成特
    的頭像 發表于 07-23 08:34 ?216次閱讀
    實操: 如何在AirBox上跑<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> 3

    STM32F4在APP運行時導致IAP程序修改怎么解決?

    IAP程序修改無法運行,導致過程IAP卡死。 已驗證該錯誤發生在APP程序(地址0x08020000)中,僅IAP程序的首地址0x08000000和0x08000004兩個數據改寫,且每次復現
    發表于 05-17 09:32

    怎樣檢測測電路的差分信號和單端信號?

    在檢測電路信號之前,首先要知道什么是測電路,什么是信號。盲目測試或使用不正確的測量方法可能會導致錯誤的波形甚至損壞儀器,危及安全。 1、差分
    的頭像 發表于 03-26 11:00 ?733次閱讀
    怎樣檢測<b class='flag-5'>被</b>測電路的差分<b class='flag-5'>信號</b>和單端<b class='flag-5'>信號</b>?

    UL Procyon AI 發布圖像生成基準測試,基于Stable Diffusion

    UL去年發布的首個Windows版Procyon AI推理基準測試,以計算機視覺工作負載評估AI推理性能。新推出的圖像生成測試將提供統一、精確且易于理解的工作負載,用以保證各支持硬件間公平、可比的性能表現。
    的頭像 發表于 03-25 16:16 ?837次閱讀

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關注。此模型具備從單張圖像中生成多視圖3D視頻的能力,為視頻制作領域帶來了革命性的突破。
    的頭像 發表于 03-22 10:30 ?788次閱讀

    Stability AI推出Stable Video 3D模型,可制作多視角3D視頻

    SV3D_u是Stable Video 3D的一個版本,僅需單幅圖片即可生成運動軌跡視頻,無須進行相機調整。擴充版本的SV3D_p加入了軌道視圖的特性,使其可以根據預設的相機路徑創建3D視頻
    的頭像 發表于 03-21 14:57 ?959次閱讀

    韓國科研團隊發布新型AI圖像生成模型KOALA,大幅優化硬件需求

    由此模型的核心在于其運用了“知識蒸餾”(knowledge distillation)技術,這使得開源圖像生成工具Stable Diffusion XL可大幅縮小其規模。原Stable Dif
    的頭像 發表于 03-01 14:10 ?587次閱讀

    OpenAI視頻模型Sora的架構及應用場景

    LDM 就是 Stable Diffusion 使用的模型架構。擴散模型的一大問題是計算需求大,難以擬合高分辨率圖像。為了解決這一問題,實現 LDM時,會先訓練一個幾乎能無損壓縮圖像的自編碼器,能把 512x512 的真實圖像壓縮成 64x64 的壓縮圖像并還原。
    發表于 02-20 15:13 ?612次閱讀
    OpenAI<b class='flag-5'>視頻</b>模型Sora的架構及應用場景

    Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業界領先的前身Stable Diffusion更快、更強大,而Stable
    的頭像 發表于 02-19 16:03 ?895次閱讀
    Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

    一種新的分割模型Stable-SAM

    SAM、HQ-SAM、Stable-SAM在提供次優提示時的性能比較,Stable-SAM明顯優于其他算法。這里也推薦工坊推出的新課程《如何將深度學習模型部署到實際工程中?
    的頭像 發表于 12-29 14:35 ?624次閱讀
    一種新的分割模型<b class='flag-5'>Stable</b>-SAM

    NeurIPS23|視覺 「讀腦術」:從大腦活動中重建你眼中的世界

    在這篇 NeurIPS23 論文中,來自魯汶大學、新加坡國立大學和中科院自動化所的研究者提出了一種視覺 「讀腦術」,能夠從人類的大腦活動中以高分辨率出解析出人眼觀看到的圖像。 人類的感知不僅由客觀
    的頭像 發表于 12-24 21:35 ?495次閱讀
    NeurIPS23|<b class='flag-5'>視覺</b> 「讀腦術」:從<b class='flag-5'>大腦</b>活動中重建你眼中的世界

    免費開源圖像修復工具lama-cleaner介紹

    Lama Cleaner 是由 SOTA AI 模型提供支持的免費開源圖像修復工具。可以從圖片中移除任何不需要的物體、缺陷和人,或者擦除并替換(powered by stable diffusion)圖片上的任何東西。
    的頭像 發表于 12-04 10:23 ?2818次閱讀
    免費開源圖像修復工具lama-cleaner介紹

    LDR6020 VR串流線方案:實現同時充電傳輸視頻信號

    ,將用戶帶入一個虛擬的三維環境中,感受到身臨其境的視覺和聽覺體驗。那么VR中的視頻信號和音頻信號是如何進行傳輸的呢,今天我們華光昱能Hangalaxy就來詳細講解VR串流中的有線串流。 VR有線串流簡介:而在VR中,有線串流
    的頭像 發表于 11-27 09:24 ?602次閱讀
    LDR6020 VR串流線方案:實現同時充電傳輸<b class='flag-5'>視頻信號</b>