導(dǎo)讀
提取多種多樣字符的信息有利于在日常生活和工業(yè)生產(chǎn)中落實(shí)標(biāo)準(zhǔn)化和規(guī)范化的要求。友思特 Neuro-T的OCR模型基于無代碼深度學(xué)習(xí)算法,輕松實(shí)現(xiàn)了精準(zhǔn)高效的字符檢測。
在現(xiàn)代生活和工業(yè)領(lǐng)域,字符檢測技術(shù)應(yīng)用正變得越來越重要。無論是在日常生活中對掃描文檔的自動(dòng)識別,還是在工業(yè)生產(chǎn)線上的自動(dòng)化檢測,準(zhǔn)確提取和解析字符信息都是關(guān)鍵。
然而,這一任務(wù)面臨著諸多挑戰(zhàn)。首先,字符的多樣性和變異性,如字體、排版和手寫體的不同,使得識別過程復(fù)雜且易出錯(cuò)。其次,實(shí)際應(yīng)用中常見的數(shù)據(jù)噪聲和格式不規(guī)范問題,會影響檢測的準(zhǔn)確性。再者,大規(guī)模數(shù)據(jù)處理需要高效的實(shí)時(shí)性能,這對系統(tǒng)的處理能力提出了嚴(yán)格要求。
針對這些難點(diǎn),友思特技術(shù)人員基于Neuro-T的OCR模型,使用深度學(xué)習(xí)的方式,通過訓(xùn)練強(qiáng)大的模型和優(yōu)化算法,結(jié)合前置傳統(tǒng)圖像處理算法,能夠在各種復(fù)雜環(huán)境下實(shí)現(xiàn)高效的字符檢測,為生活和工業(yè)應(yīng)用提供了可靠的技術(shù)支持。
友思特Neuro-T支持的深度學(xué)習(xí)模型類型
友思特 Neuro-T 支持九種不同的深度學(xué)習(xí)模型:
監(jiān)督學(xué)習(xí) | ||
分類 | 將圖像分類為多個(gè)缺陷類別(一副圖像只能包含一類缺陷) | |
分塊分類 | 通過將高分辨率圖像分割成小塊來進(jìn)行分類(一幅圖像可能包含多類缺陷) | |
實(shí)例分割 | 在像素級檢測缺陷的精確形狀和位置(能在一張圖像中檢測出多個(gè)缺陷) | |
目標(biāo)檢測 | 識別物體數(shù)量并確定其位置 | |
OCR字符識別 | 識別圖像中的文字(英文、數(shù)字、特殊符號) | |
旋轉(zhuǎn) | 自動(dòng)將原始圖像旋轉(zhuǎn)到正確方向 | |
GAN對抗生成網(wǎng)絡(luò) | 生成與真實(shí)缺陷相似的人工缺陷圖像 | |
無監(jiān)督學(xué)習(xí) | ||
異常分類 |
以熱力圖的形式為二元分類提供基礎(chǔ),僅對正常圖像進(jìn)行訓(xùn)練 *正常/缺陷 |
|
異常分割 | 像素級別檢測缺陷區(qū)域,僅對正常圖像進(jìn)行訓(xùn)練 |
Neuro-T的OCR模型訓(xùn)練字符檢測模型的具體操作步驟
新建項(xiàng)目→新建數(shù)據(jù)集→導(dǎo)入圖像數(shù)據(jù)
2. 創(chuàng)建標(biāo)簽集→選擇模型類型(OCR)
3. 標(biāo)注數(shù)據(jù)
可以使用手動(dòng)標(biāo)注或自動(dòng)標(biāo)注的方式對圖像進(jìn)行字符內(nèi)容的標(biāo)注。
(1)手動(dòng)標(biāo)注
將圖像中的文字旋轉(zhuǎn)到合適的朝向;
選擇繪制矩形框、設(shè)置大小寫類型以及字符排布方向;
在圖像中需要標(biāo)注的字符位置繪制矩形框并填寫字符內(nèi)容。
(2)自動(dòng)標(biāo)注
Neuro-T自動(dòng)學(xué)習(xí)平臺的OCR深度學(xué)習(xí)模型提供了兩種自動(dòng)標(biāo)注方式:
①預(yù)訓(xùn)練模型自動(dòng)標(biāo)注:
使用Neuro-T平臺自帶的預(yù)訓(xùn)練OCR模型對數(shù)據(jù)集進(jìn)行自動(dòng)批量快速標(biāo)注,再微調(diào)標(biāo)注結(jié)果。
②自定義模型自動(dòng)標(biāo)注:
手動(dòng)標(biāo)注部分圖像來訓(xùn)練OCR模型,選擇用于標(biāo)注的OCR模型,再應(yīng)用到想要標(biāo)注的圖像上即可。
4. 劃分訓(xùn)練集和測試集
自動(dòng)或手動(dòng)按預(yù)設(shè)比例將圖像集分配為訓(xùn)練集和測試集。
5. 訓(xùn)練生成OCR模型并查看模型結(jié)果
在模型訓(xùn)練頁面輸入訓(xùn)練的模型名字即可進(jìn)行OCR模型訓(xùn)練,無需參數(shù)設(shè)置,最后可以查看OCR模型的評估指標(biāo)結(jié)果。
正則匹配技術(shù)
通過OCR模型識別客戶檢測對象中的字符內(nèi)容,往往還沒能解決客戶的需求。客戶需要的是自動(dòng)化從中提取分析出所需要的信息,并且排除冗余信息,或者替換部分檢測信息為其他字符內(nèi)容。這個(gè)時(shí)候,我們通常會選用正則匹配的方式來為客戶實(shí)現(xiàn)。
正則匹配(正則表達(dá)式匹配)是一種用于在文本中查找特定模式的技術(shù)。正則表達(dá)式(regex)是一種強(qiáng)大的文本處理工具,可以用于匹配、搜索、替換文本。它廣泛應(yīng)用于數(shù)據(jù)驗(yàn)證、文本處理、數(shù)據(jù)清理等場景。
例如”d{3}-d{4}-d{4}”用于匹配類似”020-1234-5678”的電話號碼信息。
例如”^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}$”用于匹配郵箱地址。
客戶案例
場景1:工件的蝕刻/凹刻字符檢測
金屬工件表面通過物理或化學(xué)反應(yīng)形成的凹陷字樣的字符檢測需求。由于字符內(nèi)容與背景無明顯顏色差異,需要搭配一定的光源進(jìn)行打光來凸顯字符內(nèi)容的輪廓,再行調(diào)用OCR模型進(jìn)行字符檢測。
場景2:醫(yī)藥溶媒字符檢測
檢測醫(yī)療袋裝溶媒上面的字符,并使用正則匹配的方式,從中提取出溶媒種類、容量、濃度等信息傳輸至上位機(jī)。
場景3:物流紙箱打標(biāo)字符檢測
物流紙箱位于傳送帶上實(shí)時(shí)傳送,架設(shè) IDS 相機(jī)進(jìn)行實(shí)時(shí)動(dòng)態(tài)拍攝并返回上位機(jī)字符識別結(jié)果。由于紙箱粗糙表面存在噪點(diǎn)對字符識別造成干擾,且字符印刷顏色較淺,直接識別存在一定的難度,因此采用包括灰度化、Gamma校正、提高全局對比度、二值化、高通濾波和開運(yùn)算等一系列圖像處理操作,得到的圖像再調(diào)用OCR模型進(jìn)行檢測,返回檢測結(jié)果。
場景4:飲料包裝生產(chǎn)日期檢測
檢測易拉罐底部或盒裝飲料頂部的印刷字符,并從中提取出產(chǎn)品的生產(chǎn)日期。
其余常見場景
①車牌識別:
②高鐵票識別:
通過正則匹配的方式從檢測到的字符數(shù)組中匹配提取出包括站點(diǎn)、時(shí)間、座位等信息。
* 客戶現(xiàn)場真實(shí)數(shù)據(jù)保密,替代圖片來源網(wǎng)絡(luò),侵刪。
友思特字符檢測系統(tǒng)套裝
Neuro-T
Neuro-T 使用簡單的圖形用戶界面,通過自動(dòng)優(yōu)化深度學(xué)習(xí)模型結(jié)構(gòu)和訓(xùn)練參數(shù)來創(chuàng)建出性能最佳的模型,無需任何深度學(xué)習(xí)經(jīng)驗(yàn),即可運(yùn)行自己的深度學(xué)習(xí)項(xiàng)目。在系統(tǒng)中,Neuro-T 是用于訓(xùn)練模型的核心工具。
2D 工業(yè)相機(jī)
友思特 2D 工業(yè)相機(jī)結(jié)合了支持USB3視覺標(biāo)準(zhǔn)的高質(zhì)量全局快門傳感器技術(shù)和具有成本效益的uEye XCP相機(jī)平臺,是流行的USB2接口的uEye LE相機(jī)系列的最佳、高性能和長期替代品。借助友思特自研視覺軟件 VST-2D,對接IDS相機(jī)的實(shí)時(shí)圖像流,即可獲取PCB的實(shí)時(shí)圖像數(shù)據(jù)。
了解更多?歡迎訪問官網(wǎng),探索豐富案例:https://viewsitec.com/neurocle/
審核編輯 黃宇
-
OCR
+關(guān)注
關(guān)注
0文章
146瀏覽量
16408 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5512瀏覽量
121414 -
字符檢測
+關(guān)注
關(guān)注
0文章
3瀏覽量
694
發(fā)布評論請先 登錄
相關(guān)推薦
評論