3D視覺介紹
我們生活在三維空間中,如何智能地感知和探索外部環(huán)境一直是個熱點難題。2D視覺技術(shù)借助強大的計算機視覺和深度學習算法取得了超越人類認知的成就,而3D視覺則因為算法建模和環(huán)境依賴等問題,一直處于正在研究的前沿。近年來,3D視覺技術(shù)快速發(fā)展,并開始結(jié)合深度學習算法,在智能制造、自動駕駛、AR/VR、SLAM、無人機、三維重建、人臉識別等領(lǐng)域取得了優(yōu)異的效果。
3D視覺是計算機視覺的終極體現(xiàn)形式
2D視覺技術(shù)主要在二維空間下完成工作,三維信息基本上沒有得到任何利用,而三維信息才真正能夠反映物體和環(huán)境的狀態(tài),也更接近人類的感知模式。近年來,學術(shù)界和工業(yè)界推出了一系列優(yōu)秀的算法和產(chǎn)品,被廣泛應用到各個領(lǐng)域。
學術(shù)界:CVPR、ECCV、ICCV三大頂會每年和3D視覺相關(guān)主題的文章數(shù)量保持在十分之一左右,主要關(guān)注3D點云的識別與分割、單目圖像深度圖的生成、3D物體檢測、語義SLAM、三維重建、結(jié)構(gòu)光等。
工業(yè)界:3D視覺技術(shù)被廣泛應用到人臉識別、智能機器人、自動駕駛、AR等領(lǐng)域,國內(nèi)外相關(guān)公司推出了一系列產(chǎn)品。OPPO、華為和蘋果等公司推出的3D+AI識別功能,通過掃描人臉三維結(jié)構(gòu)完成手機解鎖;自動駕駛領(lǐng)域通過分析3D人臉信息,判斷司機駕駛時的情緒狀態(tài);SLAM方式通過重建周邊環(huán)境,完成建圖與感知;AR領(lǐng)域通過三維重建技術(shù)完成目標的重現(xiàn)。
3D視覺技術(shù)學習的難點?
3D視覺是一個范圍較廣的概念,涉及到硬件選型、離散數(shù)學、非線性優(yōu)化、最優(yōu)化理論、矩陣論、多視圖幾何、空間變換、點云處理、計算機視覺、SLAM、深度學習等相關(guān)知識點,對初學者來說,幾乎沒有一個完整明確的學習路線可以參考,入門較為困難,難以深入,許多人走了很多彎路還是沒有取得較好結(jié)果。然而,有價值的東西一般都很難,如果能夠完全掌握,一定會非常有競爭力。
目前關(guān)于3D視覺的書籍和論文過于零散,初學者很難掌握關(guān)鍵知識點,而且對于一些算法,不能夠真正理解,許多人因為較高門檻以及不正確的學習方式,最終選擇了放棄,錯過了讓自己升值的機會。
3D視覺技術(shù)學習路線
基于3D視覺領(lǐng)域缺少完整的知識路線,我和幾個朋友共同完成了3D視覺技術(shù)學習路線總結(jié),并以思維導圖的形式呈現(xiàn)出來,主要包括0~16個小結(jié),其中每個小結(jié)代表特定區(qū)域的知識點。學習路線的總結(jié),需要較寬的知識面,由于自身有一定的知識盲區(qū),若有缺漏之處還望指出,后續(xù)將會不斷更新維護該學習路線~
-
計算機視覺
+關(guān)注
關(guān)注
8文章
1696瀏覽量
45928 -
3D視覺
+關(guān)注
關(guān)注
4文章
429瀏覽量
27493
原文標題:超詳細的3D視覺技術(shù)學習路線
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論