本文主要是關于機器視覺的相關介紹,并著重對機器視覺的應用場景進行了詳盡的闡述。
機器視覺
機器視覺是人工智能正在快速發展的一個分支。簡單說來,機器視覺就是用機器代替人眼來做測量和判斷。機器視覺系統是通過機器視覺產品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標轉換成圖像信號,傳送給專用的圖像處理系統,得到被攝目標的形態信息,根據像素分布和亮度、顏色等信息,轉變成數字化信號;圖像系統對這些信號進行各種運算來抽取目標的特征,進而根據判別的結果來控制現場的設備動作。
機器視覺是一項綜合技術,包括圖像處理、機械工程技術、控制、電光源照明、光學成像、傳感器、模擬與數字視頻技術、計算機軟硬件技術(圖像增強和分析算法、圖像卡、 I/O卡等)。一個典型的機器視覺應用系統包括圖像捕捉、光源系統、圖像數字化模塊、數字圖像處理模塊、智能判斷決策模塊和機械控制執行模塊。 [2] 機器視覺系統最基本的特點就是提高生產的靈活性和自動化程度。在一些不適于人工作業的危險工作環境或者人工視覺難以滿足要求的場合,常用機器視覺來替代人工視覺。同時,在大批量重復性工業生產過程中,用機器視覺檢測方法可以大大提高生產的效率和自動化程度。
一個典型的工業機器視覺系統包括:光源、鏡頭(定焦鏡頭、變倍鏡頭、遠心鏡頭、顯微鏡頭)、 相機(包括CCD相機和COMS相機)、圖像處理單元(或圖像捕獲卡)、圖像處理軟件、監視器、通訊 / 輸入輸出單元等。
系統可再分為
一、采集和分析分開的系統。
影像擷取卡(Frame Grabber)與影像處理器
影像攝影機
定焦鏡頭鏡頭
顯微鏡頭
照明設備
Halogen光源LED光源
高周波螢光燈源
閃光燈源
其他特殊光源
影像顯示器
LCD
機構及控制系統
精密桌臺
伺服運動機臺
二、采集和分析一體的系統
智能相機(圖像采集和分析一體)
其他配套外圍設備:光源、顯示、PLC控制系統等等。
機器視覺檢測系統采用CCD照相機將被檢測的目標轉換成圖像信號,傳送給專用的圖像處理系統,根據像素分布和亮度、顏色等信息,轉變成數字化信號,圖像處理系統對這些信號進行各種運算來抽取目標的特征,如面積、數量、位置、長度,再根據預設的允許度和其他條件輸出結果,包括尺寸、角度、個數、合格 / 不合格、有 / 無等,實現自動識別功能。
典型結構
一個典型的機器視覺系統包括以下五大塊:
照明
照明是影響機器視覺系統輸入的重要因素,它直接影響輸入數據的質量和應用效果。由于沒有通用的機器視覺照明設備,所以針對每個特定的應用實例,要選擇相應的照明裝置,以達到最佳效果。光源可分為可見光和不可見光。常用的幾種可見光源是白熾燈、日光燈、水銀燈和鈉光燈。可見光的缺點是光能不能保持穩定。如何使光能在一定的程度上保持穩定,是實用化過程中急需要解決的問題。另一方面,環境光有可能影響圖像的質量,所以可采用加防護屏的方法來減少環境光的影響。照明系統按其照射方法可分為:背向照明、前向照明、結構光和頻閃光照明等。其中,背向照明是被測物放在光源和攝像機之間,它的優點是能獲得高對比度的圖像。前向照明是光源和攝像機位于被測物的同側,這種方式便于安裝。結構光照明是將光柵或線光源等投射到被測物上,根據它們產生的畸變,解調出被測物的三維信息。頻閃光照明是將高頻率的光脈沖照射到物體上,攝像機拍攝要求與光源同步。
鏡頭
FOV(Field of Vision)=所需分辨率*亞象素*相機尺寸/PRTM(零件測量公差比)
鏡頭選擇應注意:
①焦距②目標高度 ③影像高度 ④放大倍數 ⑤影像至目標的距離 ⑥中心點 /節點⑦畸變
視覺檢測中如何確定鏡頭的焦距
為特定的應用場合選擇合適的工業鏡頭時必須考慮以下因素:
· 視野 - 被成像區域的大小。
· 工作距離 (WD) - 攝像機鏡頭與被觀察物體或區域之間的距離。
· CCD - 攝像機成像傳感器裝置的尺寸。
· 這些因素必須采取一致的方式對待。如果在測量物體的寬度,則需要使用水平方向的 CCD 規格,等等。如果以英寸為單位進行測量,則以英尺進行計算,最后再轉換為毫米。
參考如下例子:有一臺 1/3” C 型安裝的 CCD 攝像機(水平方向為 4.8 毫米)。物體到鏡頭前部的距離為 12”(305 毫米)。視野或物體的尺寸為2.5”(64 毫米)。換算系數為 1” = 25.4 毫米(經過圓整)。
FL = 4.8 毫米 x 305 毫米 / 64 毫米
FL = 1464 毫米 / 64 毫米
FL = 按 23 毫米鏡頭的要求
FL = 0.19” x 12” / 2.5”
FL = 2.28” / 2.5”
FL = 0.912” x 25.4 毫米/inch
FL = 按 23 毫米鏡頭的要求
注:勿將工作距離與物體到像的距離混淆。工作距離是從工業鏡頭前部到被觀察物體之間的距離。而物體到像的距離是 CCD 傳感器到物體之間的距離。計算要求的工業鏡頭焦距時,必須使用工作距離
高速相機
按照不同標準可分為:標準分辨率數字相機和模擬相機等
。要根據不同的實際應用場合選不同的相機和高分辨率相機:
按成像色彩劃分,可分為彩色相機和黑白相機;
按分辨率劃分,像素數在38萬以下的為普通型,像素數在38萬以上的高分辨率型;
按光敏面尺寸大小劃分,可分為1/4、1/3、1/2、1英寸相機;
按掃描方式劃分,可分為行掃描相機(線陣相機)和面掃描相機(面陣相機)兩種方式;(面掃描相機又可分為隔行掃描相機和逐行掃描相機);
按同步方式劃分,可分為普通相機(內同步)和具有外同步功能的相機等。
圖像采集卡
圖像采集卡只是完整的機器視覺系統的一個部件,但是
它扮演一個非常重要的角色。圖像采集卡直接決定了攝像頭的接口:黑白、彩色、模擬、數字等等。
比較典型的是PCI或AGP兼容的捕獲卡,可以將圖像迅速地傳送到計算機存儲器進行處理。有些采集卡有內置的多路開關。例如,可以連接8個不同的攝像機,然后告訴采集卡采用那一個相機抓拍到的信息。有些采集卡有內置的數字輸入以觸發采集卡進行捕捉,當采集卡抓拍圖像時數字輸出口就觸發閘門。
視覺處理器
視覺處理器集采集卡與處理器于一體。以往計算機速度較慢時,采用視覺處理器加快視覺處理任務。采集卡傳輸圖像到存儲器,進而計算分析。當前主流配置的PLC,且配置較高,視覺處理器已經幾乎退出市場。
機器視覺應用有哪些
TOP 1:人臉識別
人臉識別是人工智能視覺與圖像領域中最熱門的應用, 今年 2 月,《麻省理工科技評論》發布「2017 全球十大突破性技術」榜單,來自中國的技術「刷臉支付」位列其中。這是該榜單創建 16 年來首個來自中國的技術突破。
人臉識別技術目前已經廣泛應用于金融、司法、軍隊、公安、邊檢、政府、航天、電力、工廠、教育、醫療等行業。據業內人士分析,我國的人臉識別產業的需求旺盛,需求推動導致企業敢于投入資金。目前,該技術已具備大規模商用的條件,未來三到五年將高速增長。而今年,這一技術有望在金融與安防領域迎來大爆發。
TOP 2:視頻/監控分析
視頻/監控分析是人工智能視覺與圖像領域中第二大熱門應用。
人工智能技術可以對結構化的人、車、物等視頻內容信息進行快速檢索、查詢。這項應用使得讓公安系統在繁雜的監控視頻中搜尋到罪犯的有了可能。在大量人群流動的交通樞紐,該技術也被廣泛用于人群分析、防控預警等。
視頻/監控領域盈利空間廣闊,商業模式多種多樣,既可以提供行業整體解決方案,也可以銷售集成硬件設備。將技術應用于視頻及監控領域在人工智能公司中正在形成一種趨勢,這項技術應用將率先在安防、交通甚至零售等行業掀起應用熱潮。
TOP 3:圖片識別分析
靜態圖片識別應用熱度在視覺與圖像領域中排名第三。將人工智能技術單純用于圖片識別分析的應用企業數量并不如預想的多,可能有一下幾個方面原因:
1、目前視頻監控方向的盈利空間大,眾多企業的注意力都放在了視頻監控領域;
2、人臉識別屬于圖片識別的一個應用場景,做人臉識別的大多數企業同時也在提供圖片識別服務,但是銷售效果不佳,主要贏利點還在于人臉識別;
3、圖片識別大多商用場景還屬于藍海,潛力有待開發;
4、圖片數據大多被大型互聯網企業所掌握,創業公司數據資源稀少。
TOP 4:駕駛輔助/智能駕駛
隨著汽車的普及,汽車已經成為人工智能技術非常大的應用投放方向,但就目前來說,想要完全實現自動駕駛/無人駕駛,距離技術成熟還有一段路要走。
不過利用人工智能技術,汽車的駕駛輔助的功能及應用越來越多,這些應用多半是基于計算機視覺和圖像處理技術來實現。
TOP 5:三維圖像視覺
三維圖像視覺主要是對于三維物體的識別,應用于三維視覺建模,三維測繪等領域。
TOP 6:工業視覺檢測
機器視覺可以快速獲取大量信息,并進行自動處理。在自動化生產過程中,人們將機器視覺系統廣泛地用于工況監視、成品檢驗和質量控制等領域。
機器視覺系統的特點是提高生產的柔性和自動化程度。運用在一些危險工作環境或人工視覺難以滿足要求的場合;此外,在大批量工業生產過程中,機器視覺檢測可以大大提高生產效率和生產的自動化程度。
TOP 7:醫療影像診斷
醫療數據中有超過 90% 的數據來自醫療影像。醫療影像領域擁有孕育深度學習的海量數據,醫療影像診斷可以輔助醫生,提升醫生的診斷的效率。
2015 年 4 月,IBM 成立了 Watson Health 部門,開始進軍醫療行業。2015 年 8 月 6 日,IBM 宣布以 10 億美元的價格收購醫療影像公司 MergeHealthcare,并將其與新成立的 WatsonHealth 合并。2016 年 2 月,IBM 又斥資 26 億美元收購醫療數據公司 TruvenHealthAnalytics。今年 2 月份,在 HIMSS17 大會上 Watson Health 公布了 IBM 的第
TOP 8:文字識別
計算機文字識別,俗稱光學字符識別,它是利用光學技術和計算機技術把印在或寫在紙上的文字讀取出來,并轉換成一種計算機能夠接受、人又可以理解的格式。這是實現文字高速錄入的一項關鍵技術。
TOP 9:圖像及視頻編輯
2016 年,Google 舉行了一場人工智能作家的畫展。通過一個名叫DeepDream的藝術生成器,谷歌可以將神經網絡由內部傳送到外部。不是識別圖像,而是創作圖像。有人稱這些機器做的畫為機器之夢。
目前市場上也出現了很多運用及機器學習算法對圖像進行處理,可以實現對圖片的自動修復、美化、變換效果等操作。并且越來越受到用戶青睞。
機器視覺在應用場景上逐漸突破工業檢測,其應用邊界逐步向智能生活領域拓展。由于機器視覺在智能生活、智能制造兩個領域具有不同的技術特點和應用進展,所以機器視覺于這兩個領域的行業發展趨勢也不盡相同。
機器視覺軟件的介紹與選擇
一、機器視覺軟件選型要點
1、定位器的準確性
目標或特征的準確定位是一個檢測體系或由視覺引導的運動體系的重要功用。傳統的物體定位選用的是灰度值有關來辨認物體。盡管這種技能得到了廣泛的運用,可是,它在圖象質量變差的狀況,就缺少穩定性。圖象質量變差可能是因為雜亂、亮度不一樣和隱瞞等要素的影響。相反,幾何目標定位法是一種最新的辦法,它運用目標的概括來辨認目標及其特征。維視圖像自主研發的圖像處理軟件多數采用幾何目標定位法,且效率極高,可以有效的幫助用戶解決定位問題。
2、工具庫還是應用軟件
機器視覺軟件主要以兩種典型的方式出售:一種是包含多種處理算法的工具庫,另一種是專門實現某一類特殊工作的應用軟件。這兩種各有利弊,需要第一時間確認這一特性后再做選擇。維視圖像提供的圖像處理軟件包含這兩種,既可以提供專業應用又滿足客戶變化多樣的需求。
3、編程和操作方便
簡練、直觀的圖形界面是簡單運用和設置的要害。當今機器視覺商品之間的主要區別在于他們的圖形接口。接口大概從“設置”和“操作”這兩方面來評估。對一個工程師來講,它大概十分復雜,而關于一個操作者來說應十分簡單。
4、亞像素精度
視覺體系的分辯率是體系能分辯的最小特征。例如,1’’的視覺規模(FOV)運用一個640x480像素的計算機圖象將得到1/640的分辯率或0.00156’’。實際上,機器視覺算法具有亞像素的才能。也就是說,這些算法可以丈量或得出比一個像素更小的單位。
5、易于升級
機器視覺體系可運用在各種場合,他們的運用規模可從時尚的攝像機到監督體系。當挑選一個體系時應思考體系將來的升級。依據通用目的的視覺軟件體系十分好晉級。最終用戶大概依據附加的攝像機、照明的改變、視覺東西的改變等來思考將來對體系的需要。
6、圖象預處理算法
大部分的圖像處理軟件提供預處理算法,所以需要比較其提供的豐富程度,效率等。
7、體系集成
假如你對機器視覺技能不是很精通,那么針對你的項目就需要一個體系集成商,理想的視覺商品能被體系集成商廣泛承受。
二、常用機器視覺軟件介紹
1. OpenCV,開源免費的圖像處理庫
OpenCV是近年來推出的開源、免費的計算機視覺庫,利用其所包含的函數可以很方便地實現數字圖像和視頻處理。同時利用面向對象的VC++ 6.0編程工具,用C++語言進行程序編寫 OpenCV算法庫為VC++編程處理數字圖像提供了很大的方便,其必將成為圖像視頻處理領域的強有力的工具。
缺點:由于是開源軟件,因此其版本繁多,函數庫復雜,執行效率收到應用,比較適用于科研和學習,不適合工業應用。
2. Halcon,強大的圖像處理庫
HALCON是德國MVtec公司開發的一套完善的標準的機器視覺算法包,擁有應用廣泛的機器視覺集成開發環境。它節約了產品成本,縮短了軟件開發周期——HALCON靈活的架構便于機器視覺,醫學圖像和圖像分析應用的快速開發。在歐洲以及日本的工業界已經是公認具有最佳效能的Machine Vision軟件
缺點:價格比較貴,每次分發需要重新購買授權。
3. NI Vision,快速驗證的圖像處理庫(含視覺助手、VBAI)
結語
關于機器視覺的相關介紹就到這了,如有不足之處歡迎指正。
-
機器視覺
+關注
關注
161文章
4345瀏覽量
120111 -
人臉識別
+關注
關注
76文章
4005瀏覽量
81769
發布評論請先 登錄
相關推薦
評論