精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種用于視覺定位的2D-3D匹配方法GAM

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-02-16 10:18 ? 次閱讀

主要內容:

提出了一種新的2D-3D匹配方法,幾何輔助匹配(GAM),使用外觀信息和幾何上下文來改進2D-3D特征匹配,可以在保持高精度的同時增強2D-3D匹配的recall,將GAM插入到分層視覺定位pipeline中,表明GAM可以有效地提高定位的魯棒性和準確性,其實驗表明,GAM可以找到比手工啟發(fā)式和學習的方法更正確的匹配,在多個視覺定位數據集上獲得了最先進的結果。

Contributions:

提出了GAM,首先根據視覺外觀為每個2D點建立多個候選匹配,然后根據幾何上下文過濾不正確的匹配。

提出了一種稱為BMNet的深度神經網絡來處理多對多候選匹配,它可以預測每個2D-3D匹配的幾何先驗并輸出全局最優(yōu)匹配集。

提出了一種具有新場景檢索策略的分層視覺定位方法,進一步提高了姿態(tài)估計的魯棒性。

所提出的定位方法在多個數據集上優(yōu)于最先進的方法。

幾何輔助匹配:

583fcf36-ad34-11ed-bfe3-dac502259ad0.png

58593cbe-ad34-11ed-bfe3-dac502259ad0.png

網絡架構:

5877fa6e-ad34-11ed-bfe3-dac502259ad0.png

589dd0e0-ad34-11ed-bfe3-dac502259ad0.png

58b3f028-ad34-11ed-bfe3-dac502259ad0.png

Hungarian Pooling:

如果直接訓練g(g;θ),網絡參數將很難學習,因為幾何一致性可能與監(jiān)督沖突,如下圖所示。

58cad842-ad34-11ed-bfe3-dac502259ad0.png

2D圖像點與在3D空間中接近的兩個3D點匹配,在相同的相機姿勢下,它們可能都有小的重投影誤差,網絡易于根據提取的幾何特征為它們生成相似的權重,這兩種對應關系都被認為是幾何一致的。

然而其中只有一個是inlier,其余的則是outlier,多個對應具有相似的幾何特征但具有不同標簽的這種差異使得網絡難以收斂。

為了解決這個問題,將匈牙利算法引入到網絡中進行端到端訓練。匈牙利算法可以找到全局最優(yōu)的一對一匹配,因為只選擇了兩個對應關系中的一個,所以可以消除幾何一致性和監(jiān)督之間的差異。

基于由g(g;θ)預測的權重向量w和二分圖g,權重矩陣w被構造為:

58e217c8-ad34-11ed-bfe3-dac502259ad0.png

其中W的未填充元素被設置為0,然后將匈牙利算法應用于該權重矩陣W獲得匹配M的最大權重。分配向量s由下列公式獲得:

58efcd46-ad34-11ed-bfe3-dac502259ad0.png

由于輸出邊緣來自輸入邊緣的子集,引入匈牙利算法的層可以被視為一個特殊的采樣層,稱之為匈牙利池,端到端訓練中使用的反向傳播公式如下:

590280bc-ad34-11ed-bfe3-dac502259ad0.png

分層定位pipeline:

59195f26-ad34-11ed-bfe3-dac502259ad0.png

對于查詢圖像,提取其全局特征和局部特征,全局特征用于粗略定位以確定要匹配的3D點集,提取的局部特征和結合相應描述符的3D點集都被送到GAM中以獲得全局最優(yōu)2D-3D對應。

整個定位過程分為三個模塊,即場景檢索、2D-3D特征匹配和先驗引導姿態(tài)估計。

場景檢索:

594184ba-ad34-11ed-bfe3-dac502259ad0.png

596cbdce-ad34-11ed-bfe3-dac502259ad0.png

2D-3D特征匹配:

根據場景檢索的順序執(zhí)行GAM并輸出匹配的2D-3D對應,對于第k個場景597d6ad4-ad34-11ed-bfe3-dac502259ad0.png,獲取其3D點和相應的描述子來構建3D特征集,在從查詢圖像提取的2D局部特征和3D特征之間執(zhí)行GAM,輸出匹配M的最大權重,根據歐氏距離執(zhí)行kNN比率匹配,當描述子被歸一化時,這可以通過矩陣運算有效地實現。

先驗引導的姿態(tài)估計:

由于M中仍然存在一些錯誤匹配,在RANSAC循環(huán)中應用PnP解算器,在RANSAC loop中,采樣2D-3D對應的概率由BMNet預測的似然決定,這使得能夠以更大的機會對可能的inlier進行采樣。

實驗:

首先進行了2D-3D匹配實驗,表明GAM以比手工制作的方法和學習方法更高的精度找到更多的真實匹配。

數據集:MegaDepth數據集中選擇一個位置作為2D-3D匹配評估的測試數據集。

將GAM與傳統(tǒng)手工制作方法和學習匹配方法進行了比較 使用最近鄰(NN)匹配器從描述符空間中的每個2D點的所有3D點中找到最近鄰,手工制作的異常值剔除方法包括比率測試(ratio)、距離閾值(distance)和彼此最近的鄰居(cross check),因為沒有其他基于學習的方法直接用于2D-3D特征匹配,因此將最近提出的一些在2D-2D匹配中表現良好的方法遷移到2D-3D進行比較,將LGCNet和OANet的輸入從2D-2D對應替換為2D3D對應,即LGCNet-2D3D和OANet2D3D

598c397e-ad34-11ed-bfe3-dac502259ad0.png

評估GAM在視覺定位方面的有效性以及提出的視覺定位框架: 數據集:Aachen Day-Night

599b47a2-ad34-11ed-bfe3-dac502259ad0.png

與SOTA定位方法的比較: 數據集:Cambridge Landmarks 和Aachen Day-Night

59b3d696-ad34-11ed-bfe3-dac502259ad0.png59cbcd96-ad34-11ed-bfe3-dac502259ad0.png

總結:


提出了一種用于視覺定位的2D-3D匹配方法GAM,同時使用外觀信息和幾何上下文來提高匹配性能,在保持高精度的同時提高了2D-3D匹配的召回率,其引入了一種新的二部匹配神經網絡BMNet以提取2D-3D對應的幾何特征,并可以學習全局幾何一致性以預測每個對應的真實匹配的可能性,還將匈牙利算法集成到BMNet中作為一個特殊的池層以端到端的方式找到最大權重匹配,使得定位能夠獲得更正確的匹配從而提高了定位的魯棒性和準確性。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4764

    瀏覽量

    100543
  • gam
    gam
    +關注

    關注

    0

    文章

    5

    瀏覽量

    7269
  • 匹配器
    +關注

    關注

    0

    文章

    6

    瀏覽量

    5724

原文標題:用幾何信息來輔助基于特征的視覺定位(arxiv 2022)

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種將NeRFs應用于視覺定位任務的新方法

    視覺定位旨在估計在已知環(huán)境中捕獲的給定圖像的旋轉和位置,大致可以分為絕對姿態(tài)回歸(APR),場景坐標回歸(SCR)和分層方法(HM)。
    的頭像 發(fā)表于 10-28 10:03 ?139次閱讀
    <b class='flag-5'>一種</b>將NeRFs應<b class='flag-5'>用于</b><b class='flag-5'>視覺</b><b class='flag-5'>定位</b>任務的新<b class='flag-5'>方法</b>

    3D視覺引導的多SKU紙箱拆解

    在物流和包裝行業(yè)中,處理多種SKU紙箱的拆解是個常見的操作難題。傳統(tǒng)方法往往因為紙箱的尺寸、形狀和重量多樣性而遇到困難。為了解決這個問題,富唯智能提出了一種基于3D
    的頭像 發(fā)表于 07-05 18:11 ?580次閱讀
    <b class='flag-5'>3D</b><b class='flag-5'>視覺</b>引導的多SKU紙箱拆解

    蘇州吳中區(qū)多色PCB板元器件3D視覺檢測技術

    3D視覺檢測相較于2D視覺檢測,有其獨特的優(yōu)勢,不受產品表面對比度影響,精確檢出產品形狀,可以測出高度(厚度)、體積、平整度等。在實際應用中可以與2
    的頭像 發(fā)表于 06-14 15:02 ?369次閱讀
    蘇州吳中區(qū)多色PCB板元器件<b class='flag-5'>3D</b><b class='flag-5'>視覺</b>檢測技術

    英倫科技的15.6寸2D-3D可切換光場裸眼3D顯示屏有哪些特點?

    隨著科技的快速發(fā)展,人類對于視覺體驗的追求也在不斷攀升。從平面的2D圖像到立體的3D影像,我們直在探索如何讓虛擬世界更加逼真。如今,英倫科技憑借其創(chuàng)新實力,推出了
    的頭像 發(fā)表于 05-28 11:17 ?334次閱讀
    英倫科技的15.6寸<b class='flag-5'>2D-3D</b>可切換光場裸眼<b class='flag-5'>3D</b>顯示屏有哪些特點?

    有了2D NAND,為什么要升級到3D呢?

    2D NAND和3D NAND都是非易失性存儲技術(NVM Non-VolatileMemory),屬于Memory(存儲器)的一種。
    的頭像 發(fā)表于 03-17 15:31 ?930次閱讀
    有了<b class='flag-5'>2D</b> NAND,為什么要升級到<b class='flag-5'>3D</b>呢?

    Nullmax提出多相機3D目標檢測新方法QAF2D

    今天上午,計算機視覺領域頂會CVPR公布了最終的論文接收結果,Nullmax感知部門的3D目標檢測研究《Enhancing 3D Object Detection with 2D De
    的頭像 發(fā)表于 02-27 16:38 ?1084次閱讀
    Nullmax提出多相機<b class='flag-5'>3D</b>目標檢測新<b class='flag-5'>方法</b>QAF<b class='flag-5'>2D</b>

    工業(yè)自動化,3D視覺在五金件上下料中的應用

    3D視覺引導五金件上下料是一種先進的自動化解決方案,結合了3D視覺技術和機器人技術,實現對五金件的高效、準確上下料操作。以下是關于
    的頭像 發(fā)表于 02-21 11:38 ?468次閱讀
    工業(yè)自動化,<b class='flag-5'>3D</b><b class='flag-5'>視覺</b>在五金件上下料中的應用

    介紹一種使用2D材料進行3D集成的新方法

    美國賓夕法尼亞州立大學的研究人員展示了一種使用2D材料進行3D集成的新穎方法
    的頭像 發(fā)表于 01-13 11:37 ?1032次閱讀

    一種用于2D/3D圖像處理算法的指令集架構以及對應的算法部署方法

    二維(2D)和三維(3D)雙模視覺信息在自動駕駛、工業(yè)機器人、人機交互等前沿領域具有廣泛的應用前景。
    的頭像 發(fā)表于 01-05 10:35 ?431次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>用于</b><b class='flag-5'>2D</b>/<b class='flag-5'>3D</b>圖像處理算法的指令集架構以及對應的算法部署<b class='flag-5'>方法</b>

    用于3D對象檢測的點云深度學習方法

    隨著激光雷達傳感器(“光檢測和測距”的縮寫,有時稱為“激光掃描”,現在在些最新的 iPhone 上可用)或 RGB-D 攝像頭(一種 RGB-D 攝像頭)的興起,
    的頭像 發(fā)表于 01-03 10:32 ?945次閱讀
    兩<b class='flag-5'>種</b>應<b class='flag-5'>用于</b><b class='flag-5'>3D</b>對象檢測的點云深度學習<b class='flag-5'>方法</b>

    OpenHarmony開源GPU庫Mesa3D適配說明

    介紹的是另外一種開源實現的方式:mesa3D。 Mesa3D 圖形庫就是OpenGL API的一種開源實現。新版本還支持OpenCL、OpenGL ES等等。Mesa
    發(fā)表于 12-25 11:38

    文了解3D視覺2D視覺的區(qū)別

    文了解3D視覺2D視覺的區(qū)別 3D視覺
    的頭像 發(fā)表于 12-25 11:15 ?2884次閱讀

    2D圖像和LiDAR的3D點云之間的配準方法

    建立2D-3D的對應關系首先通過交叉區(qū)域檢測,在兩個模態(tài)中去除離群區(qū)域,然后利用交叉模態(tài)潛在空間的最近鄰原則進行2D-3D特征匹配。
    發(fā)表于 12-22 11:29 ?1983次閱讀
    <b class='flag-5'>2D</b>圖像和LiDAR的<b class='flag-5'>3D</b>點云之間的配準<b class='flag-5'>方法</b>

    2D3D視覺技術的比較

    作為個多年經驗的機器視覺工程師,我將詳細介紹2D3D視覺技術的不同特點、應用場景以及它們能夠解決的問題。在這個領域內,
    的頭像 發(fā)表于 12-21 09:19 ?1065次閱讀

    通過將異步獲取的圖像與LiDAR點云對準的方案

    實現圖像與其重建對象之間的精確2D-3D對應關系對于準確的圖像定位至關重要,一種有前景的方法涉及在圖像和激光雷達平面之間建立對應關系,激光雷達平面可以被視為來自激光雷達點云地圖的重建對
    發(fā)表于 12-12 14:46 ?706次閱讀