導讀
提取多種多樣字符的信息有利于在日常生活和工業生產中落實標準化和規范化的要求。友思特 Neuro-T的OCR模型基于無代碼深度學習算法,輕松實現了精準高效的字符檢測。
在現代生活和工業領域,字符檢測技術應用正變得越來越重要。無論是在日常生活中對掃描文檔的自動識別,還是在工業生產線上的自動化檢測,準確提取和解析字符信息都是關鍵。
然而,這一任務面臨著諸多挑戰。首先,字符的多樣性和變異性,如字體、排版和手寫體的不同,使得識別過程復雜且易出錯。其次,實際應用中常見的數據噪聲和格式不規范問題,會影響檢測的準確性。再者,大規模數據處理需要高效的實時性能,這對系統的處理能力提出了嚴格要求。
針對這些難點,友思特技術人員基于Neuro-T的OCR模型,使用深度學習的方式,通過訓練強大的模型和優化算法,結合前置傳統圖像處理算法,能夠在各種復雜環境下實現高效的字符檢測,為生活和工業應用提供了可靠的技術支持。
友思特Neuro-T支持的深度學習模型類型
友思特 Neuro-T 支持九種不同的深度學習模型:
監督學習 | ||
分類 | 將圖像分類為多個缺陷類別(一副圖像只能包含一類缺陷) | |
分塊分類 | 通過將高分辨率圖像分割成小塊來進行分類(一幅圖像可能包含多類缺陷) | |
實例分割 | 在像素級檢測缺陷的精確形狀和位置(能在一張圖像中檢測出多個缺陷) | |
目標檢測 | 識別物體數量并確定其位置 | |
OCR字符識別 | 識別圖像中的文字(英文、數字、特殊符號) | |
旋轉 | 自動將原始圖像旋轉到正確方向 | |
GAN對抗生成網絡 | 生成與真實缺陷相似的人工缺陷圖像 | |
無監督學習 | ||
異常分類 |
以熱力圖的形式為二元分類提供基礎,僅對正常圖像進行訓練 *正常/缺陷 |
|
異常分割 | 像素級別檢測缺陷區域,僅對正常圖像進行訓練 |
Neuro-T的OCR模型訓練字符檢測模型的具體操作步驟
新建項目→新建數據集→導入圖像數據
2. 創建標簽集→選擇模型類型(OCR)
3. 標注數據
可以使用手動標注或自動標注的方式對圖像進行字符內容的標注。
(1)手動標注
將圖像中的文字旋轉到合適的朝向;
選擇繪制矩形框、設置大小寫類型以及字符排布方向;
在圖像中需要標注的字符位置繪制矩形框并填寫字符內容。
(2)自動標注
Neuro-T自動學習平臺的OCR深度學習模型提供了兩種自動標注方式:
①預訓練模型自動標注:
使用Neuro-T平臺自帶的預訓練OCR模型對數據集進行自動批量快速標注,再微調標注結果。
②自定義模型自動標注:
手動標注部分圖像來訓練OCR模型,選擇用于標注的OCR模型,再應用到想要標注的圖像上即可。
4. 劃分訓練集和測試集
自動或手動按預設比例將圖像集分配為訓練集和測試集。
5. 訓練生成OCR模型并查看模型結果
在模型訓練頁面輸入訓練的模型名字即可進行OCR模型訓練,無需參數設置,最后可以查看OCR模型的評估指標結果。
正則匹配技術
通過OCR模型識別客戶檢測對象中的字符內容,往往還沒能解決客戶的需求。客戶需要的是自動化從中提取分析出所需要的信息,并且排除冗余信息,或者替換部分檢測信息為其他字符內容。這個時候,我們通常會選用正則匹配的方式來為客戶實現。
正則匹配(正則表達式匹配)是一種用于在文本中查找特定模式的技術。正則表達式(regex)是一種強大的文本處理工具,可以用于匹配、搜索、替換文本。它廣泛應用于數據驗證、文本處理、數據清理等場景。
例如”d{3}-d{4}-d{4}”用于匹配類似”020-1234-5678”的電話號碼信息。
例如”^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}$”用于匹配郵箱地址。
客戶案例
場景1:工件的蝕刻/凹刻字符檢測
金屬工件表面通過物理或化學反應形成的凹陷字樣的字符檢測需求。由于字符內容與背景無明顯顏色差異,需要搭配一定的光源進行打光來凸顯字符內容的輪廓,再行調用OCR模型進行字符檢測。
場景2:醫藥溶媒字符檢測
檢測醫療袋裝溶媒上面的字符,并使用正則匹配的方式,從中提取出溶媒種類、容量、濃度等信息傳輸至上位機。
場景3:物流紙箱打標字符檢測
物流紙箱位于傳送帶上實時傳送,架設 IDS 相機進行實時動態拍攝并返回上位機字符識別結果。由于紙箱粗糙表面存在噪點對字符識別造成干擾,且字符印刷顏色較淺,直接識別存在一定的難度,因此采用包括灰度化、Gamma校正、提高全局對比度、二值化、高通濾波和開運算等一系列圖像處理操作,得到的圖像再調用OCR模型進行檢測,返回檢測結果。
場景4:飲料包裝生產日期檢測
檢測易拉罐底部或盒裝飲料頂部的印刷字符,并從中提取出產品的生產日期。
其余常見場景
①車牌識別:
②高鐵票識別:
通過正則匹配的方式從檢測到的字符數組中匹配提取出包括站點、時間、座位等信息。
* 客戶現場真實數據保密,替代圖片來源網絡,侵刪。
友思特字符檢測系統套裝
Neuro-T
Neuro-T 使用簡單的圖形用戶界面,通過自動優化深度學習模型結構和訓練參數來創建出性能最佳的模型,無需任何深度學習經驗,即可運行自己的深度學習項目。在系統中,Neuro-T 是用于訓練模型的核心工具。
2D 工業相機
友思特 2D 工業相機結合了支持USB3視覺標準的高質量全局快門傳感器技術和具有成本效益的uEye XCP相機平臺,是流行的USB2接口的uEye LE相機系列的最佳、高性能和長期替代品。借助友思特自研視覺軟件 VST-2D,對接IDS相機的實時圖像流,即可獲取PCB的實時圖像數據。
了解更多?歡迎訪問官網,探索豐富案例:https://viewsitec.com/neurocle/
審核編輯 黃宇
-
OCR
+關注
關注
0文章
144瀏覽量
16330 -
深度學習
+關注
關注
73文章
5493瀏覽量
120998 -
字符檢測
+關注
關注
0文章
3瀏覽量
682
發布評論請先 登錄
相關推薦
評論