精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NerfingMVS:引導優化神經輻射場實現室內多視角三維重建

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-02-13 11:20 ? 次閱讀

本文是對我們ICCV 2021被接收的文章NerfingMVS: Guided Optimization of Neural Radiance Fields for Indoor Multi-view Stereo 的介紹。在這個工作中,我們通過對神經輻射場(NeRF)進行引導優化,實現了室內的多視角三維重建(multi-view stereo)。很榮幸地,我們的文章被接收為ICCV 2021的Oral論文,目前項目代碼已開源,歡迎大家試用和star~

a062c806-ab48-11ed-bfe3-dac502259ad0.png

a07158bc-ab48-11ed-bfe3-dac502259ad0.gif

效果展示

arXiv:https://arxiv.org/abs/2109.01129

主頁:https://weiyithu.github.io/NerfingMVS/

Code:https://github.com/weiyithu/NerfingMVS

概述

熟悉3D視覺領域的朋友們都知道,近一年來NeRF大火。NeRF概括來說是一個用MLP學習得到的神經輻射場。它的訓練數據是多視角的RGB圖片。學得的神經輻射場可以表示場景的三維結構,從而實現新視角的視圖合成。對NeRF更加具體的介紹,請大家參考林天威:https://zhuanlan.zhihu.com/p/360365941

既然Nerf可以表示場景的三維信息,一個自然的想法是能不能將NeRF應用到室內場景三維重建任務中呢。NeRF有著一些優勢:相較于傳統的MVS,SfM算法,NeRF蘊含了整個場景的信息,所以有潛力重建出低紋理區域的三維結構;而相較于另一個在線優化的深度估計算法CVD ,NeRF不需要顯示地對不同視角的像素進行匹配,這一點在室內場景是很難做到的。但可惜的是,原生NeRF在室內場景中存在形狀輻射歧義(shape-radiance ambiguity)的問題。這個問題的大致意思是NeRF可以合成出高質量的新視角的RGB圖片,但它卻沒有學會場景的三維結構。

為了解決這個問題,我們提出了NerfingMVS。我們方法的核心是用網絡預測出來的深度先驗去引導神經輻射場的優化過程。我們首先用SfM得到的稀疏深度訓練一個專屬于當前場景的單目深度網絡。之后用這個單目深度網絡預測的深度圖來指導NeRF的學習。最后我們根據視角合成的結果利用濾波器去進一步提升深度圖的質量。在ScanNet上的實驗結果表明,我們的方法超過了當前最好方法的性能,并且我們還提升了新視角RGB圖片的質量以及縮短了三倍的NeRF訓練時間。

方法

a90a4970-ab48-11ed-bfe3-dac502259ad0.jpg

我們的方法分為三個步驟:場景敏感的深度先驗,神經輻射場的引導優化,基于合成視圖的深度圖濾波。

場景敏感的深度先驗:與CVD類似,我們同樣利用了神經網絡預測出來的深度先驗。但不同的是,為了進一步提升深度先驗在當前場景的精度,我們利用SfM重建出的稀疏深度對單目深度網絡進行了微調(finetune)。這一步的目的其實是讓這個深度網絡過擬合在當前場景上。具體來說,我們使用了COLMAP算法得到了多視角融合的點云,并將點云投影到各個視角下得到每個視角的稀疏深度。由于多視角融合的點云是經過了幾何一致性校驗的,因此雖然深度是稀疏的,但也是相對準確的。此外,由于尺度歧義的問題,我們使用了尺度不變的損失函數:

a939fe54-ab48-11ed-bfe3-dac502259ad0.png

神經輻射場的引導優化:我們發現如果簡單地在室內場景應用NeRF無法得到正確的三維重建結果。這其實就是所謂的形狀輻射歧義現象,換句話說,NeRF可以很好地擬合出訓練視角的RGB圖片(圖(a)),但卻沒有學到正確的場景3D結構(圖(c))。造成這個問題的本質原因是對于同一組RGB圖片,會有多個神經輻射場與之對應。此外,現實室內場景的RGB圖片會比較模糊并且圖片之間的位姿變換也會比較大,這導致了網絡的學習能力下降,加劇了這個問題。

a94f5c68-ab48-11ed-bfe3-dac502259ad0.jpg

為了解決這個問題,我們利用深度先驗去指導NeRF的采樣過程。我們首先根據幾何一致性校驗計算得到每個視角深度先驗的誤差圖。具體來講,我們將每個視角的深度投影到其它視角下并與其它視角的深度計算相對誤差。NeRF中每個視角下每條ray的采樣中心點為對應位置處的深度先驗,采樣范圍由誤差圖決定。誤差越小,深度先驗的置信度越高,那么采樣范圍就越小;反之,誤差越大,深度先驗的置信度越低,那么采樣范圍就越大。

a96e42a4-ab48-11ed-bfe3-dac502259ad0.jpg

基于合成視圖的深度圖濾波:為了進一步提升深度圖的質量,我們最后進行了一步濾波。這步操作是基于一個假設:如果渲染出的RGB都不對,那么對應位置處算出來的深度也往往是錯的。因此我們可以根據渲染得到的RGB與真實RGB之間的誤差計算逐像素的置信度圖:

a98438ac-ab48-11ed-bfe3-dac502259ad0.png

這個置信度圖可以被用來濾波,我們這里使用的是平面雙邊濾波器(plane bilateral filtering)。

實驗結果

與SOTA方法對比:

a9a1190e-ab48-11ed-bfe3-dac502259ad0.jpg

a9d9900e-ab48-11ed-bfe3-dac502259ad0.jpg

無論是從定量還是定性的結果來看,我們的方法都達到了當前最好性能,甚至超過了一些有監督的方法:DELTAS,Atlas,DeepV2D。

視圖合成結果:

a9f5be0a-ab48-11ed-bfe3-dac502259ad0.jpg

前兩行是訓練視角,后兩行是新視角。盡管視圖合成不是我們的主要任務,我們的方法仍顯著地提升了NeRF視圖合成的結果。訓練視角的提升也說明了我們的方法可以幫助NeRF聚焦在更重要的區域并提升網絡的性能。此外,我們將NeRF的訓練時間縮短至三分之一。

In-the-wild結果展示:

我們用手持相機在家拍攝了一些demo。

aa06ff76-ab48-11ed-bfe3-dac502259ad0.gif

aa6ad9c4-ab48-11ed-bfe3-dac502259ad0.gif

總結與討論

在這個工作中,我們將傳統SfM算法與NeRF結合解決室內多視角重建問題。我們方法的核心是將深度先驗引入NeRF中指導它的采樣過程。在真實室內場景數據集ScanNet上的實驗結果表明,NerfingMVS取得了很好的效果。當然我們的方法現在也存在一些limitations:1. 盡管我們大大加速了NeRF的訓練過程,但現在仍無法達到實時。2. 我們需要SfM提供位姿和稀疏深度,因此比較依賴COLMAP的重建結果。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4601

    瀏覽量

    92671
  • 數據集
    +關注

    關注

    4

    文章

    1205

    瀏覽量

    24649
  • 3D視覺
    +關注

    關注

    4

    文章

    430

    瀏覽量

    27493

原文標題:ICCV 2021 Oral | NerfingMVS:引導優化神經輻射場實現室內多視角三維重建

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    怎樣去設計一種基于RGB-D相機的三維重建無序抓取系統?

    為什么要開發一種三維重建無序抓取系統?三維重建無序抓取系統是由哪些部分組成的?三維重建無序抓取系統有哪些關鍵技術和創新點?
    發表于 07-02 06:29

    如何去開發一款基于RGB-D相機與機械臂的三維重建無序抓取系統

    基于RGB-D相機與機械臂的三維重建無序抓取系統有哪些關鍵技術?如何去開發一款基于RGB-D相機與機械臂的三維重建無序抓取系統?基于RGB-D相機與機械臂的三維重建無序抓取系統是由哪些部分組成的?
    發表于 09-08 06:12

    無人機三維建模的信息

    建模。(參考另外室內建模也是三維重建吧,基于激光掃描的。其他資料:三維重建技術在無人機方面的應用如何?三維重建未來的學術前景如...
    發表于 09-16 06:55

    基于紋理映射的醫學圖像三維重建

    提出了一種基于紋理映射的體繪制算法,提高了圖像的重建效率,增強了圖像的重建效果。算法實現了對二醫學圖像序列的三維重建,在目前通用的個人計算
    發表于 12-14 11:10 ?19次下載

    基于FPGA的醫學圖像三維重建系統設計與實現

    目前大部分的醫學圖像三維重建過程都是在PC機上完成的,由于PC機本身性能的限制和重建算法的復雜性,使得重建效率不高。針對這個問題,設計與實現了一個基于FPGA(Field Progra
    發表于 03-15 13:52 ?44次下載

    基于MC算法的光刻仿真微結構的三維重建_宮珊珊

    基于MC算法的光刻仿真微結構的三維重建_宮珊珊
    發表于 03-18 09:06 ?0次下載

    為什么說三維重建才是計算機視覺的靈魂?

    權龍教授為我們介紹了三維重建的歷史發展與應用前景。
    的頭像 發表于 07-02 14:18 ?3.1w次閱讀

    透明物體的三維重建研究綜述

    透明物體的三維重建一直以來都被認為是很有挑戰性的問題。不同于傳統重建算法對物體表面的漫反射屬性假設,因為透明物體與光線之間存在復雜的,如反射和折射等,與視角相關的光學效應,將導致傳統重建
    發表于 04-21 14:21 ?4次下載
    透明物體的<b class='flag-5'>三維重建</b>研究綜述

    基于分布式傳感的實時三維重建系統

    基于分布式傳感的實時三維重建系統
    發表于 06-25 11:25 ?15次下載

    NVIDIA Omniverse平臺助力三維重建服務協同發展

    計算機視覺的進步為元宇宙的數字孿生應用打下堅實基礎。在計算機視覺中,三維重建是指根據單視圖或者視圖的圖像重建三維信息的過程。數字孿生開發者可借助
    的頭像 發表于 10-13 09:45 ?1149次閱讀

    深度學習背景下的圖像三維重建技術進展綜述

    根據三維模型的表示形式可以將圖像三維重建方法分類為基于體素的三維重建、基于點云的三維重建和基于網格的三維重建,其中基于網格的
    的頭像 發表于 01-09 14:26 ?2386次閱讀

    視角圖像做三維場景重建 (CVPR&apos;22 Oral)

    最近,有方法提出基于隱式神經表示做三維重建。NeRF [3] 通過可微分的體積渲染技術從圖像中學習隱式輻射。NeRF可以實現有真實感的
    的頭像 發表于 02-20 10:11 ?2745次閱讀

    三維重建:從入門到入土

    經典三維重建系統的整個pipeline從相機標定、基礎矩陣與本質矩陣估計、特征匹配到運動恢復結構(SFM),從SFM到稠密點云重建、表面重建、紋理貼圖。熟悉SFM的工程師已經是行業內的佼佼者,能掌握
    的頭像 發表于 03-03 10:17 ?1146次閱讀

    如何實現整個三維重建過程

    在計算機視覺中,三維重建是指根據單視圖或者視圖的圖像重建三維信息的過程。由于單視頻的信息不完全,因此三維重建需要利用經驗知識,而
    發表于 09-01 11:06 ?1616次閱讀
    如何<b class='flag-5'>實現</b>整個<b class='flag-5'>三維重建</b>過程

    基于光學成像的物體三維重建技術研究

    隨著計算機科學和數字成像技術的飛速發展,光學成像技術在許多領域中得到了廣泛應用,其中之一便是物體三維重建。物體三維重建技術是一種通過計算機處理圖像數據,獲得物體三維信息的技術。光學成像技術作為物體
    的頭像 發表于 09-15 09:29 ?861次閱讀
    基于光學成像的物體<b class='flag-5'>三維重建</b>技術研究