資料介紹
摘 要
本論文詳細介紹了一款低成本便攜式的OCR文字識別 ,TTS語音播報系統的實現方案。本次研發的盲人導讀儀系統,核心的軟硬模塊子子系統包括:500萬高清攝像頭JPEG圖像采集子系統,大功率NRF2401圖像傳輸子系統,MFC上位機圖像解碼子系統,OCR模式識別子系統, TTS文本語音子系統。本文將對設計的各個子系統詳細闡述。
關鍵詞:模式識別OCR; TTS語音播報系統; OV5640五百萬像素采集系統;
OCR blind reading meter based on template matching
This paper introduces in detail a low-cost portable OCR character recognition, the implementation scheme of TTS speech broadcasting system. The research and development of the blind reading meter system, the core of hard and soft module a subsystem including: 5 million hd camera JPEG image acquisition subsystem, high-power NRF2401 image transmission subsystem, MFC PC image decoding subsystem, OCR pattern recognition subsystem, TTS text-to-speech subsystem. This article will be to the design of each subsystem in detail
Key words: OCR pattern recognition; TTS speech broadcasting system; OV5640 mega pixels acquisition system。
1緒論
書籍是人類進步的階梯,視覺障礙的弱勢群體如果想要閱讀一些文獻資料,傳統的方法要依賴盲文,憑借手觸覺去感知文字,由于盲文的發行量相對較少,加上他笨重,體積大,致使收到很大限制。隨著計算機的領域的飛速發展,OCR (Optical Character Recognition,光學字符識別) ,TTS(Text To Speech,從文本到語音),OV5640(高清攝像頭)日益成熟,這些新興技術,將為視覺殘障人士帶來福音,將視覺文字變成聽覺語音,自此弱勢的殘障人士可以打破視覺閱讀障礙,享受文本書籍的知識殿堂。
1.1課題的背景與意義
我國的印刷體漢字識別是從70年代開始研究,大致可以分為如下3個階段:
第一階段:20世紀70年代末期到20時期,主要是算法和方案探索。
第二階段:20世紀90年代,中文OCR技術從實驗室走向市場。
第三階段:21世紀初至今,主要是印刷體漢字識別技術和系統性能的提高,包括漢英混排識別率的提高和穩健性的增強。
1.2 OCR的研究現狀及研究意義
現有的文字技術一般采用光學的方式將文本圖像信息采集到計算機中,因此該技術被稱為光學字符識別(Optical Character Recognition, OCR)技術,經過將近一個研究,OCR已經成為現如今模式是被領域里最活躍的研究方向之一。它綜合了人工智能,計算機圖像,數字圖像處理等多方面的內容,并在計算機領域及其相關領域得到了廣泛的應用。近些年來,我國的中文印刷體文檔識別發展十分
隨著社會的發展,科學文化的進步,越來越多的視覺障礙人式(包括先天性行殘疾人士,或者因意外事故及其傷病視力下降乃至失去視覺的殘疾人士)更加渴望閱讀這個時代最前沿的書籍期刊,鑒于盲文的厚重,不便于攜帶,印刷量小,延遲性高等缺點,市場上主流的OCR識別器售價相對較高,一種低成本,高識別率的OCR盲人導讀儀的研發有相當大的現實意義,其核心算法也有著極其廣泛的社會應用:
1.使用OCR進行印刷體版文稿的自動識別錄入,這類產品的缺點是對于表格,插圖,公式需要手工進行干預。
2圖形,圖像,公式,文本,中英文交疊等混版復雜版面進行自動切分的印刷識別系統的算法研究提供解決思路。
3郵件自動分揀系統,郵件的自動分揀系統東是郵政系統提高心寒分揀速度和質量的極為有效手段之一國內外已經普遍使用,其核心算法是書寫體的識別。
4 手寫體表格數據自動錄入系統,應用于政府,保險,醫療等個行業的申報表,調查表等表格數據的處理與錄入【1】。 。
1.3研究的主要內容和預期目標
該系統致力于實現一種低成本,便攜式,易操作,高識別率的簡易OCR中文識別系統。根據基于模板匹配的OCR的自身特點,以及現階段研究水平,調研了中文OCR在各個行業的應用市場,如下對基于模板匹配的盲人導讀儀的各個系統和實現原理及算法進行簡要講解。
1.3.1 核心子系統解決方案概述
1. 基于OV5640 500萬像素的自動對焦的高清攝像頭模組,實現JPEG,BMP高清圖像采集存儲。
2. 基于大功率NRF2401的無線傳圖子系統,可以實現一點對多點,單點對單點實時圖像采集傳輸。
3基于VS2010 MFC上位機算法處理子系統,SerialPort串口接收模塊,Cimage類進行數據流圖像解碼編碼,微軟公司開源MicroSoft Image documentOCR控件作為核心算法將采集解碼得到圖片文字解碼出來,顯示到Edit文本框,將文字編碼串口發送科科大訊飛模塊。
4基于科大訊飛模組XFS5512CE文字語音轉碼解碼芯片將OCR識別的文字進行語音播報,實現文本到語音的轉換。
1.3.2 預期目標
1. STM32F103RBT6能正常驅動500萬OV5640高清模組,實現圖形采集
2. NRF2401能實現無線傳圖,文字解碼信息發送
3.MFC數據流解碼JPEG,OCR文字識別,OCR解碼發送
4.下位機驅動科大訊飛模塊,實現文字解碼發送。
2基于模板匹配中文OCR語音導讀儀工作原理
2.1 OCR工作原理
與普通印刷體文檔是被相比,中文印刷體文檔識別在對文檔所包含的文字字符識別過程中。一個完整的中文印刷體文檔識別系統應包括如下諸多模塊:
文檔圖像預處理。該部分完成對原始文檔圖像預處理,使得原始文檔圖像能夠達到識別的要求。
文檔圖像版面分析,該部分實現文檔圖像中文本,表格和圖像等不同區域的分離,并在識別出每個區域的類別后交由不同的處理模塊進行進一步的分析和處理。
文檔圖像中的多字符識別,該部分處理通過文檔版面分析得到的文本區域,包括漢字識別和公式識別的模塊。漢字識別模塊負責包括中文字符在內的所有字符的識別。
文檔圖像中圖形圖像暫存模塊。該部分負責處理通過文檔版面分析得帶的圖像圖像區域。
版面分析過程中,分析得到的文字區域,圖像區域和表格區域將被分別切割成單獨的圖像,其中文字圖像區域將送至印刷體漢字識別模塊進行處理。與其他的數字圖像模式識別應用類似,印刷體的漢字識別的基本過程包括圖像預處理。圖像分割,圖像分割,特征提取,圖像分類等過程。圖像的預處理通過圖像增強,文字字符切割等步驟形成單個漢字字符圖像,圖像分割則在單個漢字圖像中提起漢字輪廓,特征提取則是是依據漢字輪廓提取代表的各個漢字模式的本質的表達形式,即各種特性,形成漢字模板庫(可以理解為字典)并存儲在計算機中。識別時,圖像分類過程將漢字的模式特性和漢字的模板庫元素逐一匹配,在用一定的匹配準則進行判別。最后在模板庫中找出最接近的位置漢字的模板元素,該模版元素的漢字就是識別的結果。
- OV5640資料包分享 41次下載
- ATK OV5640 AF V1.1圖下載 8次下載
- STM32驅動攝像頭ov5640的驅動源碼 7次下載
- 自動對焦攝像頭模塊OV5640原理圖 46次下載
- CMOS圖像傳感器OV5640用戶手冊.pdf 52次下載
- 基于stm32控制OV7670攝像頭 133次下載
- 基于D3 CAMERA MEZZ OV5640圖像傳感器的參考設計
- 機器視覺中基于灰度統計的快速模板匹配算法詳細概述 7次下載
- Leopard Imaging 10232017 LI-OV5640攝像頭圖解資料下載 31次下載
- OV5640_datasheet 86次下載
- 模板匹配 5次下載
- STM32工程模板 55次下載
- 基于模板匹配的圖像跟蹤技術 0次下載
- 基于模板匹配的電子元器件針腳檢測方法
- 基于改進模板匹配的芯片缺陷檢測方法
- OpenCV邊緣模板匹配算法原理詳解 1076次閱讀
- OCR實戰教程 859次閱讀
- OpenMV如何實現旋轉模板匹配呢 1703次閱讀
- 3D模板匹配算法概述 1446次閱讀
- 如何通過OV5640攝像頭顯示在VGA顯示屏上 2989次閱讀
- 函數模板與類模板的基本概念及實現原理 1610次閱讀
- 基于HALCON的形狀匹配算法的研究和心得總結 4200次閱讀
- 微雪電子OV5640 攝像頭模塊B型簡介 3746次閱讀
- 微雪電子OV5640攝像頭模塊A型簡介 5878次閱讀
- 微雪電子OV5640 攝像頭模塊C型簡介 2915次閱讀
- 飛凌嵌入式500W攝像頭介紹 2303次閱讀
- 天嵌科技OV5640攝像頭模塊-CMOS攝像頭介紹 1.2w次閱讀
- 基于OmniVision的OV5640設計的USB攝像頭模塊 5661次閱讀
- ov7620怎么接線_ov7620硬件連接 8818次閱讀
- 一文看懂ov7620與ov7670的區別 5.1w次閱讀
下載排行
本周
- 1TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 2開關電源基礎知識
- 5.73 MB | 6次下載 | 免費
- 3100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 4嵌入式linux-聊天程序設計
- 0.60 MB | 3次下載 | 免費
- 5基于FPGA的光纖通信系統的設計與實現
- 0.61 MB | 2次下載 | 免費
- 651單片機窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費
- 751單片機大棚環境控制器仿真程序
- 1.10 MB | 2次下載 | 免費
- 8基于51單片機的RGB調色燈程序仿真
- 0.86 MB | 2次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33564次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關電源設計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數字電路基礎pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅動電路設計》 溫德爾著
- 0.00 MB | 6653次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537796次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191185次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多