精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

輻射場的實時密集單眼SLAM簡析

3D視覺工坊 ? 來源:泡泡機器人SLAM ? 2023-01-30 11:24 ? 次閱讀

摘要

我們提出了一個新的幾何和光度3D映射管道,用于從單眼圖像中準確和實時地重建場景。為了實現這一目標,我們利用了最近在密集單眼SLAM和實時分層容積神經輻射場方面的進展。我們的見解是,密集的單眼SLAM通過提供準確的姿勢估計和具有相關不確定性的深度圖,為實時適應場景的神經輻射場提供了正確的信息

通過我們提出的基于不確定性的深度損失,我們不僅實現了良好的光度測量精度,還實現了巨大的幾何精度。事實上,我們提出的管道比競爭對手的方法實現了更好的幾何和光度測量精度(PSNR提高了179%,L1深度提高了86%),同時實時工作并只使用單眼圖像。

主要貢獻

我們提出了第一個結合密集單眼SLAM和分層體積神經輻射場優點的場景重建管道。

我們的方法從圖像流中建立精確的輻射場,不需要姿勢或深度作為輸入,并且可以實時運行。

我們在Replica數據集上實現了單眼方法的最先進性能。

主要方法

ecfcaede-9784-11ed-bfe3-dac502259ad0.png

我們管道的輸入包括連續的單眼圖像(這里表示為Img 1和Img 2)。從右上角開始,我們的架構使用Instant-NGP擬合一個NeRF,我們使用RGB圖像I和深度D對其進行監督,其中深度由其邊緣協方差ΣD加權。

Rosinol等人[23]的啟發,我們從密集的單眼SLAM計算這些協方差。在我們的案例中,我們使用Droid-SLAM。我們在第3.1節提供了關于信息流的更多細節。藍色顯示的是Droid-SLAM的貢獻和信息流,同樣,粉紅色是Rosinol的貢獻,而紅色是我們的貢獻。

1. 追蹤

密集SLAM與協方差 我們使用Droid-SLAM作為我們的跟蹤模塊,它為每個關鍵幀提供密集的深度圖和姿勢。從一連串的圖像開始,Droid-SLAM首先計算出i和j兩幀之間的密集光流pij,使用的架構與Raft相似。

Raft的核心是一個卷積GRU(圖2中的ConvGRU),給定一對幀之間的相關性和對當前光流pij的猜測,計算一個新的流pij,以及每個光流測量的權重Σpij。

有了這些流量和權重作為測量值,DroidSLAM解決了一個密集束調整(BA)問題,其中三維幾何被參數化為每個關鍵幀的一組反深度圖。這種結構的參數化導致了解決密集BA問題的極其有效的方式,通過將方程組線性化為我們熟悉的相機/深度箭頭狀的塊狀稀疏Hessian H∈R (c+p)×(c+p) ,其中c和p是相機和點的維度,可以被表述為一個線性最小二乘法問題。

從圖中可以看出,為了解決線性最小二乘問題,我們用Hessian的Schur補數來計算縮小的相機矩陣HT,它不依賴于深度,維度小得多,為R c×c。通過對HT=LLT的Cholesky因子化,其中L是下三角Cholesky因子,然后通過前置和后置求解姿勢T,從而解決相機姿勢的小問題。

此外,給定姿勢T和深度D,Droid-SLAM建議計算誘導光流,并再次將其作為初始猜測送入ConvGRU網絡,如圖2左側所示,其中Π和Π-1,是投影和背投函數。

圖2中的藍色箭頭顯示了跟蹤循環,并對應于Droid-SLAM。然后,受Rosinol等人的啟發,我們進一步計算密集深度圖和Droid-SLAM的姿勢的邊際協方差(圖2的紫色箭頭)。

為此,我們需要利用Hessian的結構,我們對其進行塊狀分割如下:

ed23497c-9784-11ed-bfe3-dac502259ad0.png

其中H是Hessian矩陣,b是殘差,C是塊狀相機矩陣,P是對應于每個像素每個關鍵幀的反深度的對角矩陣。我們用?ξ表示SE(3)中相機姿態的謊言代數的delta更新,而?d是每個像素反深度的delta更新。

E是相機/深度對角線Hessian的塊矩陣,v和w對應于姿勢和深度的殘差。從這個Hessian的塊分割中,我們可以有效地計算密集深度Σd和姿勢ΣT的邊際協方差:

ed2c4eaa-9784-11ed-bfe3-dac502259ad0.png

最后,鑒于跟蹤模塊計算出的所有信息--姿勢、深度、它們各自的邊際協方差以及輸入的RGB圖像--我們可以優化我們的輻射場參數,并同時完善相機的姿勢。

ed3b0878-9784-11ed-bfe3-dac502259ad0.png

2. 建圖

鑒于每個關鍵幀的密集深度圖,有可能對我們的神經體積進行深度監督。不幸的是,由于其密度,深度圖是非常嘈雜的,因為即使是無紋理的區域也被賦予了一個深度值。圖3顯示,密集的單眼SLAM所產生的點云是特別嘈雜的,并且包含大的離群值(圖3的頂部圖像)。

根據這些深度圖監督我們的輻射度場會導致有偏見的重建。 Rosinol等人的研究表明,深度估計的不確定性是一個很好的信號,可以為經典的TSDF體積融合的深度值加權。受這些結果的啟發,我們使用深度不確定性估計來加權深度損失,我們用它來監督我們的神經體積。

圖1顯示了輸入的RGB圖像,其相應的深度圖的不確定性,所產生的點云(在用σd≤1.0對其不確定性進行閾值化以實現可視化),以及我們使用不確定性加權的深度損失時的結果。鑒于不確定性感知的損失,我們將我們的映射損失表述為:

ed8e320a-9784-11ed-bfe3-dac502259ad0.png

我們對姿勢T和神經參數Θ進行最小化,給定超參數λD來平衡深度和顏色監督(我們將λD設置為1.0)。特別是,我們的深度損失是由以下公式給出的。

ed963086-9784-11ed-bfe3-dac502259ad0.png

其中,D*是渲染的深度,D、ΣD是由跟蹤模塊估計的密集深度和不確定性。我們將深度D*渲染為預期的射線終止距離。每個像素的深度都是通過沿著像素的射線取樣的三維位置來計算的,在樣本i處評估密度σi,并將得到的密度進行alpha合成,與標準的體積渲染類似:

ed9da7ee-9784-11ed-bfe3-dac502259ad0.png

顏色的渲染損失如下:

eda67cac-9784-11ed-bfe3-dac502259ad0.png

3. 架構

我們的管道由一個跟蹤線程和一個映射線程組成,兩者都是實時和并行運行的。追蹤線程不斷地將關鍵幀活動窗口的BA重投影誤差降到最低。

映射線程總是優化從跟蹤線程收到的所有關鍵幀,并且沒有一個有效幀的滑動窗口。這些線程之間的唯一通信發生在追蹤管道生成新關鍵幀時。

在每一個新的關鍵幀上,跟蹤線程將當前關鍵幀的姿勢與它們各自的圖像和估計的深度圖,以及深度的邊際協方差,發送到映射線程。

只有跟蹤線程的滑動優化窗口中當前可用的信息被發送到映射線程。跟蹤線程的有效滑動窗口最多包括8個關鍵幀。

只要前一個關鍵幀和當前幀之間的平均光流高于一個閾值(在我們的例子中是2.5像素),跟蹤線程就會生成一個新的關鍵幀。最后,映射線程還負責渲染,以實現重建的交互式可視化。

主要結果

edb16194-9784-11ed-bfe3-dac502259ad0.pngedbf6e42-9784-11ed-bfe3-dac502259ad0.png

edcba6ee-9784-11ed-bfe3-dac502259ad0.png







審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Gru
    Gru
    +關注

    關注

    0

    文章

    12

    瀏覽量

    7470
  • SLAM
    +關注

    關注

    23

    文章

    405

    瀏覽量

    31713
  • NGP
    NGP
    +關注

    關注

    0

    文章

    12

    瀏覽量

    6665

原文標題:NeRF-SLAM:實時密集單眼SLAM 輻射場的實時密集單眼SLAM

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    新能源電池產業鏈及投資機會-磷酸亞鐵鋰

    新能源電池產業鏈及投資機會-磷酸亞鐵鋰  一、前言
    發表于 12-25 09:34 ?964次閱讀

    【設計技巧】rtos的核心原理

    rtos的核心原理rtos全稱real-time operating system(實時操作系統),我來簡單分析下:我們都知道,c語句中調用一個函數后,該函數的返回地址都是放在堆棧中的(準確
    發表于 07-23 08:00

    計算密集型的程序

    人工智能學習1. 人工智能應用場景網絡安全、電子商務、計算模擬、社交網絡 … …2. 人工智能必備三要素數據,算法,計算力計算力之CPU、GPU對比:CPU主要適合I\O密集型的任務GPU主要適合
    發表于 09-07 06:14

    輻射劑量實時成像測量系統的研究

    輻射劑量實時成像測量系統的研究 本文利用閃爍體的吸收發光特點,并結合計算機斷層掃描技術,提出了對核輻射劑量分布進行
    發表于 10-21 08:38 ?804次閱讀

    電動汽車用鋰離子電池技術的國內外進展

    電動汽車用鋰離子電池技術的國內外進展
    發表于 11-10 13:53 ?765次閱讀

    PCB線路板電鍍銅工藝

    PCB線路板電鍍銅工藝   一.電鍍工藝的分類:   酸性光亮銅電鍍電鍍鎳/金電鍍錫   二.工藝流程:
    發表于 11-17 14:01 ?3948次閱讀

    EPON技術

    EPON技術 EPON是一個新技術,用于保證提供一個高品質與高帶寬利用率的應用。   EPON在日本、韓國、中國大陸、中國臺灣及其它以以太網絡為基礎的地區都
    發表于 01-22 10:43 ?824次閱讀

    鼠標HID例程(中)

    鼠標 HID 例程 緊接《鼠標 HID 例程(上)》一文,繼續向大家介紹鼠 標 HID 例程的未完的內容。
    發表于 07-26 15:18 ?0次下載

    5G AAU 功放控制和監測模塊

    5G AAU 功放控制和監測模塊
    發表于 10-28 12:00 ?2次下載
    5G AAU 功放控制和監測模塊<b class='flag-5'>簡</b><b class='flag-5'>析</b>

    用于SLAM的神經隱含可擴展編碼

    我們提出了NICE-SLAM,一個密集的RGB-D SLAM系統,它具有實時性、可擴展性、預測性和對各種挑戰性場景的魯棒性。
    的頭像 發表于 01-30 11:19 ?638次閱讀

    密集單目SLAM的概率體積融合概述

    我們提出了一種利用深度密集單目 SLAM 和快速不確定性傳播從圖像重建 3D 場景的新方法。所提出的方法能夠密集、準確、實時地 3D 重建場景,同時對來自
    的頭像 發表于 01-30 11:34 ?591次閱讀

    OV2SLAM(高速視覺slam)

    視覺里程計最近幾年越來越受到學術界以及工業界的認可,以ORB和VINS為代表的視覺SLAM已經可以滿足絕大多數場景,而OV2SLAM在其他VSLAM中脫穎而出,其實時性以及具體的回環性能在測試中都得到了認可。
    的頭像 發表于 03-21 17:16 ?1349次閱讀

    用于神經SLAM的矢量化對象建圖

    vMAP 是一種基于神經的對象級密集 SLAM 系統,可根據 RGB-D 輸入流實時自動構建對象級場景模型。
    的頭像 發表于 06-15 09:29 ?683次閱讀
    用于神經<b class='flag-5'>場</b><b class='flag-5'>SLAM</b>的矢量化對象建圖

    AFE8092幀同步特性

    AFE8092幀同步特性
    的頭像 發表于 08-24 13:37 ?560次閱讀
    AFE8092幀同步特性<b class='flag-5'>簡</b><b class='flag-5'>析</b>

    什么是SLAM?基于3D高斯輻射SLAM優勢分析

    基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數,通過可微分渲染捕獲稠密的光度信息,具有高保真度。
    的頭像 發表于 04-01 12:44 ?549次閱讀