作者:Softnautics 市場營銷總監Prasant Agarwal
解決方案總監 Ranganathan SK
文本是人類最具智慧、最有影響力的創造之一。文本中所蘊含的豐富、精確的高級語義可以幫助我們理解周遭世界,并用于構建可部署在真實環境中的自主運行解決方案。因此,自然環境下的自動文本讀取,也稱為場景文本檢測/識別或 Photo OCR(Optical Character Recognition,光學字符識別),已成為計算機視覺領域中關注度和重要性日益提高的研究課題。
隨著人類語言書寫形式的演進,已經發展出數千種獨特的字體系。再加上大小寫(大寫/小寫/全大全小/小型大寫)、斜體(意大利體/羅馬體)、縮放體(橫向縮放)、粗細、指定大小(顯示/文本)、波痕體、襯線(總體分為襯線體和無襯線體),這一數量可以擴充到數百萬,使得文本識別成為機器學習領域中一個振奮人心的專業學科。
為什么賽靈思技術成為開發 OCR 解決方案的不二之選?
如今,賽靈思豐富多樣的強大平臺已為 70% 的新開發提供支持,引領著基于 FPGA 系統的設計發展趨勢。Softnautics 之所以選擇賽靈思技術來實現這個解決方案,是因為它同時集成了 Vitis AI 堆棧和強大的硬件功能。
賽靈思 Vitis 是一款免費、開源的開發平臺,可將硬件模塊封裝成軟件可調用功能,同時與標準的開發環境、工具和開源庫兼容。它能夠根據軟件和算法自動適配賽靈思硬件,無需具備 VHDL 或 Verilog 專業知識。
選擇正確的賽靈思平臺
綜合全面且豐富多樣的賽靈思工具集和生態系統使原型設計成為高度可預測的過程,這有助于加快解決方案的開發速度,從而將總體開發時間縮短高達 70%。
Softnautics 選擇賽靈思 Ultrascale+ 平臺是因為它提供了最優秀的應用處理和 FPGA 加速功能。此外,它還提供了優異的高層次綜合(HLS)功能。與此前的平臺相比,系統級單位功耗性能提高了 4 倍。它支持賽靈思 Vitis AI,后者為使用加速庫構建 AI 推斷提供了廣泛功能。
Softnautics 采用了賽靈思 Vitis AI 堆棧并運用該軟件提供加速,開發出混合應用,同時實現了 LSTM 功能,通過將 TensorFlow-lite 移植/遷移到 ARM 進行有效的序列預測。它使用 N2Cube 軟件在處理側(PS)運行。圖像預處理/后處理通過 Vivado 使用 HLS 實現,而 Vitis 的作用是使用連接文本提議網絡(CTPN)完成推斷。最終,Softnautics 將該解決方案用于視頻流水線中的實時場景文本檢測,并使用可靠的數據集對模型進行改進。
場景文本檢測
目前已有多種實現方案可供使用,新的實現方案也在研究中。在自然場景進行文本檢測和識別時,仍然可能會遇到一系列的艱巨挑戰。與文檔中的腳本相比,自然場景下的檢測和識別困難主要源于以下三大差異:
語言、顏色、字體、大小、方向等造成的多樣化和可變性 書寫文本的背景色彩鮮艷 場景文本的縱橫比和布局可能會有很大的不同
這種解決方案廣泛適用于要求對視頻流進行實時文本檢測的眾多領域,具有較高的精確度和快速識別能力。部分典型應用領域如:
泊車驗證 — 一些市鎮按照城市規定正在使用移動 OCR 自動驗證車輛是否按照市鎮規定泊車。城市泊車檢查員使用配備有 OCR 功能的移動設備掃描車輛牌照,并通過在線數據庫查看是否允許該車輛泊車。 移動文檔掃描 — 各種移動應用允許用戶為文檔拍照,然后將其轉換成文本。與采用傳統的文檔掃描儀相比,這種 OCR 工作的難度更大,因為照片在圖像角度、光照條件和文本質量方面往往無法預測。 數字資產管理 — 該軟件有助于對圖像、視頻和動畫等富媒體資產進行組織管理。DAM 系統的主要特征之一就是能搜索富媒體。通過在上傳的圖像和視頻幀上運行 OCR,DAM 能讓富媒體變得可搜索,并使用有意義的標簽豐富它。
Softnautics 團隊一直深耕基于賽靈思 FPGA 的解決方案,在賽靈思技術方面積累了豐富的經驗,并深刻理解各種復雜性。因此,該公司僅用不到四個星期便推動這一解決方案從構思到概念驗證的飛速進展。依托公司針對端到端解決方案構建的專業知識,您能夠在賽靈思平臺上借助最快速的概念實現服務,可視化您的構想,大幅加快上市進程。
原文標題:智能 OCR 解決方案使用 Xilinx Ultrascale+ 和 Vitis AI 進行開發
文章出處:【微信公眾號:FPGA開發圈】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
FPGA
+關注
關注
1630文章
21796瀏覽量
605179 -
賽靈思
+關注
關注
32文章
1794瀏覽量
131439 -
AI
+關注
關注
87文章
31490瀏覽量
269883 -
OCR
+關注
關注
0文章
146瀏覽量
16405
原文標題:智能 OCR 解決方案使用 Xilinx Ultrascale+ 和 Vitis AI 進行開發
文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發圈】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論