每當遇到以上情景,你是不是都希望有一個神奇的裝置,哪兒需要掃哪里,迅速將文字轉成計算機可編輯的數據?
說曹操曹操就到,訊飛開放平臺印刷文字識別技術閃亮登場!作為OCR系列服務的新成員,帶來處理大量非數據文本的神器。
1數字時代的剛需技術
大數據時代下,雖然我們每天在計算機上獲取,編輯大量的文本,但計算機以外的各種文本一直在我們的工作和學習中占據重要位置。而將這些文本錄入也一直耗費著大量的時間和人力。
如何高效處理海量非結構化數據,使它們能快速轉化為計算機可處理的數據,方便進一步數據庫采集、管理、分析和決策,已成為下階段的行業大方向。作為處理圖片文字數據的AI技術——OCR(optical character recognition 光學字符識別),正是一種有效的解決方案,在越來越多用戶需求的真實場景中實踐。
訊飛開放平臺重磅推出的OCR系列產品,基于訊飛AI研究院獨創的基于深度神經網絡模型端到端文字識別系統,識別文字符號的數字影像,并將其轉換為對應的電腦等設備可編輯的數字文本,最終達到識別的文字結果可編輯、可處理的目的,其中印刷文字識別技術面向的就是印刷字體的轉化。
2印刷文字識別應用廣泛
正如文章開頭我們提到的,生活中有很多需要將印刷字體轉換為設備可編輯的文本場景。而作為OCR家族的重要成員,印刷文字識別在這時候就大有作為,下面小編就帶大家看一看——
1.資料/文檔處理
工作或者科研學習中,要應對大量的會議材料、書刊雜志、電子資料(如PDF),印刷識別技術可以方便將這些資料的文字轉化為可編輯和整理格式
2.卡證信息錄入
在需要錄入身份證、駕駛證、銀行卡、營業執照等信息的場景下,印刷識別技術可以減輕手動錄入的壓力,更高效。
3.視頻/圖片內容審核
計算機可以處理電子字符,但對圖片上和視頻中的字體無法識別,通過印刷文本識別技術,可以將圖片中的印刷字體以及視頻中的字幕、彈幕、畫面文字轉換為計算機可處理的文本,增強審核能力。(圖片、視頻中的印刷字體可使用印刷文字識別技術)
4.書摘筆記
讀書時,看到不錯的金句和段落想要摘錄或分享,印刷文字識別技術只需要隨手一拍就能生成文本。
5.隨手記錄
在微信、微博等內容平臺看到有價值的圖片內容會隨手保存Mark,或是用截屏把手機頁面內容保存到相冊,但這些圖片信息散亂在手機各處,很難進行歸納、整理和檢索
6.醫療、金融、圖書檔案管理行業電子化
醫療單據、票據、病例等資料電子化入庫;金融企業證照、年報、財報、票據等紙質資料的結構化錄入;圖書檔案的電子數據庫的搭建,更新。都能通過印刷文字識別技術達到減少人力錄入成本,提高效率的目的。
7.拍照翻譯
在國外旅行時,遇到指示牌/路牌、餐館菜單、商品標簽、入境卡等多種場景量身定制。利用印刷文字識別+翻譯,隨手一拍,翻譯內容即刻顯示。
如4月20日上市的訊飛翻譯機2.0,就帶有2.4英寸的液晶顯示屏和攝像頭,支持中文與英、日、韓、法、西、德、俄、意、葡、泰、阿拉伯語的在線拍照互譯,并支持中英離線拍照互譯。
3訊飛印刷文字識別技術優勢
我們為什么用OCR?因為可以快速將文字轉為可在設備上編輯的數字文本。因此能夠得到用戶青睞的OCR小編認為應能夠準確生成文本,所見即所得,同時對不同字體,不同環境,不同顏色形狀的文本準確識別。
產品優勢
準確率業界領先地位
印刷文字識別的識別率高達90%
復雜場景支持
支持掃描體以及復雜自然場景下的文字識別,對方向有旋轉的文字,支持文字與水平軸小于±15°夾角偏轉。
識別不同語言
目前支持識別中文、英文、中英文混合的文字內容的識別。
在中文人工智能助手咪咕靈犀的翻譯功能模塊,接入訊飛開放平臺的OCR與翻譯能力,提供圖片中文字的識別與翻譯能力。
接入簡單便捷
以上,大家可以看到訊飛開放平臺的印刷文字識別技術在準確率,識別能力方面表現出色,同時支持不同語言以及混合語言的識別。
-
人工智能
+關注
關注
1792文章
47442瀏覽量
238992 -
文字識別
+關注
關注
0文章
16瀏覽量
8648
發布評論請先 登錄
相關推薦
評論