如今,深度學習算法的發展越來越迅速,并且在圖像處理以及目標對象識別方面已經得到了較為顯著的突破,無論是對檢測對象的類型判斷,亦或者對檢測對象所處方位的檢測,深度學習算法都取得了遠超過傳統機器學習算法的準確率。當前,可以機器人技術分為以下兩種學科的跨學科分支,即工程和科學。其包含計算機科學、機械工程、電子信息工程等。機器人的設計與制造和用于機器人的運動規劃控制、傳感器反饋和信息處理的技術系統在機器人鄰域都有涉及。機器人視覺也是當下研究生的一個大熱門,其包含機器人對目標環境對象的視覺信息處理以及圖像方面的處理。從工程角度來說,他可以代替人的視覺系統,使得機器人可以代替人們取完成一些高危任務。
伴隨著當前智能化社會的進步,其次,目前計算機視覺和機器人等人工智能化的前言技術發展得到了學術界和人們廣泛的關注,并對我國工業領域以及社會生活產生了巨大的貢獻。目前移動智能體的自主能力成為了當前一個主要熱門的研究方向。移動智能體需要能實現完全自主的運動,還需要擁有對周邊環境信息的感知能力、動態環境剖析能力以及對危險環境的判斷和執行能力。相對人類的視覺來說,目前移動智能體的視覺判斷速度相對較慢,精確度也不高,智能體可能無法在短時間內做出較為精準的判斷。在平時生活中,人們可以從自己的所見的景象、視頻中,獲取目標物體的大致信息,如物體的位置和它們的外型、大小等。這樣能使得人類通過自己的視覺顯示,反饋給自己的大腦,并快速識別鎖定所需要關注的目標,不需要過多的下意識的思考。例如,在駕駛汽車行駛時,我們必須做到及時的對前方以及兩側路段進行判斷。因此當下針對智能體來,擁有一定的自主能力,且具有速度快、精確度較高的多目標識別算法是十分重要的,一個好的算法能提高智能體的自主能動性,精確感知周邊環境,并結合傳感器做出及時、準確的判斷,所以,當前針對自主移動智能體的開發,其實時性和準確性也就成為了尤為重要的指標。
智能體對目標識別和跟蹤在工業生產、偵察安全防控以及人們生活中都擁有者廣泛的應用前景,其也是機器人領域的重要研究方向之一。當前,深度學習技術的飛速發展以及工業相機、激光雷達等傳感技術不斷提高,給目標識別奠定了良好的基礎。本文基于深度學習方法研究了機器人的目標識別和跟蹤進行了研究。
1 深度學習目標識別算法國內外研究現狀
國內對目標識別技術的相關研究相對于西方一些國家起步較晚。上世紀八十年代,相關科研工作者提出將反向傳播算法用于神經網絡中,并首次提出了卷積神經網絡的概念。
隨著時代的進步發展, Krizhevsky 等人提出了基于深度學習的卷積神經網絡目標識別算法,該算法在著名 ImageNet 數據集上的檢測效果比第二名手工特征提取算法高了十幾個百分比,在當時取得了最好的檢測效果。深度學習也因為 ILSVC 賽事的推動下快速發展,通過賽事對目標識別加以一定的要求,使得大量學者開始使用當下較為熱門的深度學習相關技術去對目標識別算法進行研究。
如今,全球有好多高校已經專門設立了人工智能與計算機視覺研究實驗室。并成功開發出了許多運用目標識別算法的實用應用軟件。此外,一些著名公司如微軟、微軟公司等,也開始投入大量資金和精力,進行智能識別的相關研究,使得目標識別算法逐步開始在工業生產中應用起來。
國內在目標識別技術和深度學習研究比國外起步較晚,但近些年發展的勢頭卻很迅猛。近年來,在一大批優秀科研技術人員的努力下,取得了很多豐碩的成果。涌現出了一大批相關產業的科技公司,如大疆、科大訊飛等。
2 機器人視覺國內外研究現狀
機器視覺技術的產生最早是在歐美及日本等國家,最早的一批較為有名的機器視覺相關產業公司也在這些國家,如光源供應商日本 Moritex、鏡頭廠家美國 Navitar、德國 Schneider等。不難發現,對于上個世紀歐美等較發達國家在該技術上有一個較為超前的地位。
一直到上世紀九十年代初,我國也開始涌現出不少與視覺技術相關的公司,其覆蓋了很多工業及生活領域,如車牌自動識別、材料表面缺陷檢測等。但是由于生產的產品本存在一定的問題且市場需求較小。一直到九八年開始,我國的機器視覺技術才得到了重視。進入新世紀以后,國內很多企業開始有針對性的針對當下需求來確定所需要的機器視覺技術方案,并自主研發相關科研技術。近年來,由于政府的大力支持引導,我國的機器視覺行業得到了空前的發展。
3 目標識別與跟蹤技術的發展
1深度學習主流算法結構
1.1卷積神經網絡
在21世紀初期,卷積神經網絡主要應用于任務分配以及視覺識別。圖像分類是機器中類別的問題用以提取特征以及辨別圖像。新型的CNN 神經網絡架構表現出以多個網絡或多種網絡級聯組合應用的新態勢,神經網絡形態的快速進化為紛繁復雜的科研領域提供了智能高效的數據分析手段。卷積神經網絡(CNN) 算法是用于識別和分類圖像等高維數據的新興技術,具有相對較低的計算成本和較高的準確性。CNN 的隱藏層是卷積層和池化層。這些層可以提取圖像的潛在特征,并通過訓練映射輸入圖像和輸出類別之間的函數關系。也就是說,這些層可以從人工分類中學習分類標準。
1.2RBM (受限玻爾茲曼機)
在過去十年中,RBM 的理論和應用得到了廣泛的研究。以圖像處理為例,原來的 RBM 只適用于處理二值圖像。為了處理真實圖像,提出了一系列 RBM 變體,如高斯二進制 RBM(GRBM)、協方差 RBM(cRBM)、均值和協方差 RBM (mcRBM) 和尖峰板 RBM (ssRBM)。受限玻爾茲曼機 (RBM) 是具有二分交互作用的概率圖模型,這些模型的一個特征是觀察到的單位給定隱藏單元的狀態,它們是獨立的,反之亦然。這是由于交互圖的二部性,并且不依賴于單元的狀態空間。通常RBM 是用二進制單位定義的,但也考慮了其他類型的單位,包括連續、離散和混合類型單位。
1.3 AE (自動編碼器)
自編碼器是一類人工神經網絡,由編碼器和解碼器這兩個主要組件組成。編碼器是一組神經層,將其輸入的原始維度限制為一個更小的維度,稱為潛在空間。解碼器是一組層,其目的是將潛在空間擴展回輸入的原始維度。自動編碼器通常使用反向傳播算法進行訓練,其中所需的輸出與輸入相同,這使其成為一種無監督學習方法。
1.4RNN (循環神經網絡)
循環神經網絡(RNN) 對于處理數據的順序性質至關重要,其中時間序列類型的數據就是一個典型示例。RNN 具有一種具有循環連接的神經元。這些連接用作內存,使 RNN 能夠從順序數據中學習時間動態性。目前,LSTM神經網絡模型在人類活動識別方面表現出最先進的性能。
2目標識別算法模型
Wenling Xue等學者為了減少不同天氣條件的影響,提出了一種新方法GMM來模擬包含不同天氣數據的目標。高斯分量密度的加權和可用于表示 GMM,GMM是參數概率密度函數。GMM可用于在不同天氣條件下擬合目標的特性;功能數量越多,系統性能越高。為了估計GMM參數,使用訓練有素的先前模型和訓練數據。GMM是圍繞用于檢測的最佳似然比測試構建的,使用簡單但有效的貝葉斯適應模型來推導天氣影響。與SVM相比,GMM的識別率提高了。但存在著如何選擇正確的閾值以及如何對背景噪聲進行建模以提高識別率等問題。Fan Zhang等學者提出一種改進的YOLO深度學習模型,自動識別玉米葉片的氣孔,并采用熵率超像素算法對氣孔參數進行精確測量。根據氣孔圖像數據集的特點,對YOLOv5的網絡結構進行了修改,在不影響識別性能的情況下,大大縮短了訓練時間。優化YOLO深度學習模型中的預測因子,降低了誤檢率。同時,根據氣孔物體的特點,對16倍和32倍的下采樣層進行了簡化,提高了識別效率。實驗表明該方法快速可靠。Hui Zeng等學者對非結構化網絡物理系統環境交際機器人多模態感知模型進行構建。改進的PSOBT-SVM 在不改變SVM分類器數量的情況下優化了分類精度,并證明了其在多模態觸覺信號分類方面的準確性。
3目標識別和跟蹤技術
運動物體檢測是識別給定區域或區域中物體的物理運動的任務。在過去的幾年中,移動物體檢測因其廣泛的應用而受到廣泛關注,如視頻監控、人體運動分析、機器人導航、事件檢測、異常檢測、視頻會議、交通分析和安全。此外,運動目標檢測是計算機視覺和視頻處理領域非常重要和有效的研究課題,因為它是視頻目標分類和視頻跟蹤活動等許多復雜過程的關鍵步驟。因此,從給定的視頻幀序列中識別移動對象的實際形狀變得相關。然而,由于動態場景變化、光照變化、陰影的存在、偽裝和引導問題等各種挑戰,檢測運動中物體的實際形狀的任務變得很棘手。幀間差分法是檢測運動物體最常用的方法,它分別找到當前幀和前一個連續幀以及當前幀和下一個連續幀之間的差異,然后,該算法選擇兩個不同幀之間的最大像素強度值,接下來,將得到的差異幀劃分為不重疊的塊,并計算每個塊的強度總和和平均值,隨后,它使用閾值和強度平均值找到每個塊的前景和背景像素。
幀間差分方法的缺點是在目標細節識別中比較粗糙。傳統的幀間差分方法對閾值的選擇范圍要求較高。如果閾值不合理,則檢測效果不理想,輪廓不清晰、破損。然而,幀間差分算法相對簡單、速度快、易于硬件實現,能夠適應實時性要求高的應用環境。因此,該算法具有很強的實用性。
可以在幀間差分算法的基礎上提出一種優化改進的目標檢測與跟蹤算法,構建兩次區域限定與Kalman濾波算法融合的檢測方法。該算法能夠迅速、準確地提取目標區域,且對目標位置具有較高的可預測性。
4 基于深度學習的機器人目標識別和發展趨勢
目標檢測是計算機視覺、深度學習、人工智能等。它是更復雜的計算機視覺任務的重要前提,例如目標跟蹤、事件檢測、行為分析和場景語義理解。它旨在定位從圖像中提取感興趣目標,準確確定類別并給出每個目標的邊界框目標。已廣泛應用于汽車自動駕駛、視頻圖像檢索、智能視頻監控、醫學圖像分析、工業檢測等領域。傳統的人工提取特征檢測算法主要包括預處理、窗口滑動、特征提取、特征選擇、特征分類和后處理六個步驟,一般針對特的識別任務。它的缺點主要是數據量小,可移植性差,沒有針對性,時間復雜度高,窗口冗余,對多樣性沒有魯棒性變化,只有在特定的簡單環境下才有良好的性能。目標檢測作為計算機視覺中最基本和最具挑戰性的問題之一近年來備受關注。基于深度學習的檢測算法已被廣泛應用在很多領域,但深度學習還有一些問題有待探索:
減少對數據的依賴。
實現小物體的高效檢測。
多類別目標檢測的實現。
現如今隨著科學技術的進步,以前很多機器視覺領域的技術都得到了長足的發展,但是在某些方面還是存在著一定的不足。比如說機器人的目標識別方面:機器人在對物體進行識別時,大目標通常都能正常檢測出來,但是對于小目標受限于目標大小和周圍環境影響等等會出現漏檢等情況。在目標跟蹤方面
專門應用于目標跟蹤任務的訓練集較少,無法適應當前多變的跟蹤環境,完成訓練任務。
當前的訓練模型受限于目標的遮擋、外觀的強烈變化等等問題,使得算法無法實現長時間的精確跟蹤。除此以外跟蹤時,由于受到外界因素影響,可能會有一些相似對象,從而使得跟蹤出現錯誤。
但是我相信經過人們對于機器視覺領域的不斷研究,未來會有越來越多的基于深度學習的方法去優化目標跟蹤任務中出現的一系列情況,比如說采用大規模視頻數據的數據集進行離線訓練等等,在目標識別領域未來也將會降低環境對檢測的影響能更加精準的檢測各種大小的目標,并且最終將兩種技術更好的結合在一起應用到機器人技術應用的各個方面。
審核編輯:湯梓紅
-
機器人
+關注
關注
210文章
28205瀏覽量
206532 -
目標識別
+關注
關注
0文章
41瀏覽量
10433 -
深度學習
+關注
關注
73文章
5492瀏覽量
120978
發布評論請先 登錄
相關推薦
評論