色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

cnocr和tesseract的使用方法和效果

科技綠洲 ? 來源:Python實用寶典 ? 作者:Python實用寶典 ? 2023-11-02 14:37 ? 次閱讀

今天嘗試了一下cnocr和tesseract,給大家分別講講兩個模塊的使用方法和效果。

1.準備

開始之前,你要確保Pythonpip已經(jīng)成功安裝在電腦上噢,如果沒有,請訪問這篇文章:超詳細Python安裝指南 進行安裝。如果你用Python的目的是數(shù)據(jù)分析,可以直接安裝Anaconda:Python數(shù)據(jù)分析與挖掘好幫手—Anaconda

Windows環(huán)境下打開Cmd(開始—運行—CMD),蘋果系統(tǒng)環(huán)境下請打開Terminal(command+空格輸入Terminal),準備開始輸入命令安裝依賴。

當然,我更推薦大家用VSCode編輯器,把本文代碼Copy下來,在編輯器下方的終端運行命令安裝依賴模塊,多舒服的一件事啊:Python 編程的最好搭檔—VSCode 詳細指南

在終端輸入以下命令安裝我們所需要的依賴模塊:

pip install cnocr

看到 Successfully installed xxx 則說明安裝成功。

如果你只想使用cnocr,那么只需要安裝上述的cnocr包即可。如果你想試試其他語言的OCR識別,Tesseract 是更好的選擇。

首先,無論是Windows還是macOS,你都需要安裝 pytesseract:

pip install pytesseract

其次,還需要安裝Tesseract. Tesseract 在macOS下可以使用brew安裝:

brew install tesseract

Windows下安裝tesseract則相對復(fù)雜。

需要先下載安裝tesseract的程序,然后下載中文簡體字預(yù)訓(xùn)練好的模型包(盡管本教程不會用tesseract,但還是給大家提供了)。

你可以在Python實用寶典公眾號后臺回復(fù):**tesseract **打包下載。

下載完成后,將tesseract-ocr-setup-4.00.00dev.exe安裝到Tesseract-OCR指定目錄下,復(fù)制該目錄路徑增加到Path中:

圖片

并將訓(xùn)練好的模型文件chi_sim.traineddata放入該目錄中,這樣安裝就完成了。

2.cnocr 識別圖片的中文

cnocr 主要針對的是排版簡單的印刷體文字圖片,如截圖圖片,掃描件等。目前內(nèi)置的文字檢測和分行模塊無法處理復(fù)雜的文字排版定位。

盡管它分別提供了單行識別函數(shù)和多行識別函數(shù),但在本人實測下,單行識別函數(shù)的效果非常糟糕,或者說要求的條件十分苛刻,基本上連截圖的文字都識別不出來。

不過多行識別函數(shù)還不錯,使用該函數(shù)識別的代碼如下:

from cnocr import CnOcr
ocr = CnOcr()
res = ocr.ocr('test.png')
print("Predicted Chars:", res)

圖片版代碼:

圖片

用于識別這個圖片里的文字:

圖片

效果如下:

圖片

如果不是很吹毛求疵,這樣的效果已經(jīng)很不錯了。

3.pytesseract 識別圖片的英文

如果你的OCR目的不是中文而是英文,是需要別的模型的。這里給大家分享Tesseract-OCR,它是一款由HP實驗室開發(fā),由Google維護的開源OCR引擎。

Tesseract-OCR 可擴展性很強,你可以基于它訓(xùn)練屬于自己的OCR模型。

現(xiàn)在給大家看看它分類英文的效果,代碼如下:

import pytesseract
from PIL import Image
image = Image.open('test2.png')
code = pytesseract.image_to_string(image, lang='eng')
print(code)

圖片版代碼:

圖片

識別的圖片:

圖片

效果如下:

圖片

英文效果真的很不錯,不過官方預(yù)訓(xùn)練好的中文模型效果就比較一般了。

如果你想試試Tesseract識別中文,只需要將代碼中的eng改為chi_sim即可,不過相信我,效果不忍直視。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2722

    瀏覽量

    47574
  • 編輯器
    +關(guān)注

    關(guān)注

    1

    文章

    806

    瀏覽量

    31211
收藏 人收藏

    評論

    相關(guān)推薦

    linux的tesseract-ocr安裝

    1. 在ubuntu下可以自動安裝sudo apt-get install tesseract-ocr
    發(fā)表于 07-15 06:40

    示波器的使用方法

    示波器的使用方法 1 示波器使用        本節(jié)介紹示波器的使用方法。示波器種類、型號很多,功能也不同。
    發(fā)表于 01-14 13:06 ?1.8w次閱讀

    Matlab使用方法和程序設(shè)計

    Matlab使用方法和程序設(shè)計 實驗一 Matlab使用方法和程序設(shè)計一、
    發(fā)表于 10-17 00:18 ?5399次閱讀
    Matlab<b class='flag-5'>使用方法</b>和程序設(shè)計

    多路輸出的使用方法

    多路輸出的使用方法  
    發(fā)表于 10-27 14:20 ?1648次閱讀

    示波器的使用方法

    數(shù)字萬用表使用方法和示波器的使用方法詳解。
    發(fā)表于 03-14 10:38 ?32次下載

    基于zed的tesseract移植過程記錄

    于是今天就打算把這個軟件移植到Zynq上,在PC上之前就已經(jīng)成功安裝了tesseract了,并且利用自帶的測試圖片試了下,沒問題。
    發(fā)表于 02-10 18:50 ?1533次閱讀

    AT指令使用方法

    AT指令使用方法
    發(fā)表于 07-21 14:18 ?23次下載

    xilinx 原語使用方法

    xilinx 原語使用方法
    發(fā)表于 10-17 08:57 ?11次下載
    xilinx 原語<b class='flag-5'>使用方法</b>

    CC debuger的使用方法

    CC debuger的使用方法
    發(fā)表于 10-18 10:07 ?5次下載

    ORCAD PSPICE 使用方法

    ORCAD PSPICE 使用方法
    發(fā)表于 10-18 14:52 ?39次下載
    ORCAD PSPICE <b class='flag-5'>使用方法</b>

    xilinx原語使用方法

    xilinx原語使用方法
    發(fā)表于 10-19 08:50 ?15次下載
    xilinx原語<b class='flag-5'>使用方法</b>

    git使用方法

    git使用方法
    發(fā)表于 10-24 09:45 ?19次下載
    git<b class='flag-5'>使用方法</b>

    示波器的使用方法(三):示波器的使用方法詳解

    示波器的使用方法并非很難,重點在于正確使用示波器的使用方法。往期文章中,小編對模擬示波器的使用方法和數(shù)字示波器的使用方法均有所介紹。為增進大家對示波器的
    的頭像 發(fā)表于 12-24 20:37 ?3322次閱讀

    關(guān)于兩個Python開源識別工具的效果

    回復(fù)希望出一篇 OCR 相關(guān)的文章,今天嘗試了一下 cnocrtesseract 兩個 Python 開源識別工具的效果,給大家分別講講兩個工具的使用方法和對比
    的頭像 發(fā)表于 10-17 11:36 ?757次閱讀
    關(guān)于兩個Python開源識別工具的<b class='flag-5'>效果</b>

    OCR如何自動識別圖片文字

    回復(fù)希望出一篇 OCR 相關(guān)的文章,今天嘗試了一下 cnocrtesseract 兩個 Python 開源識別工具的效果,給大家分別講講兩個工具的使用方法和對比
    的頭像 發(fā)表于 10-31 16:45 ?801次閱讀
    OCR如何自動識別圖片文字
    主站蜘蛛池模板: 欧美性猛交AAA片| old老男人野外树林tv| 精品久久久久久电影网| se01短视频在线观看| 亚洲精品动漫免费二区| 欧美精品一区二区蜜臀亚洲| 狠狠色狠狠色综合日日小说| xxx日本免费| 伊人久久综合网站| 我的美女奴隶| 青青草原91| 啦啦啦 中文 中国 免费 高清在线| 国产精品AV无码免费播放| 99久久精品国产亚洲AV| 亚洲免费视频网站| 涩里番app黄版网站| 嗯好大好猛皇上好深用力| 九色PORNY蝌蚪视频首页| 国产99久久九九精品无码不卡| 99精品无码AV在线播放| 一级毛片视频免费| 晓雪老师我要进你里面好爽| 欧洲videosdesrxotv| 免费伦理片网站| 久久精品一区二区影院| 好爽别插了无码视频| 国产午夜伦鲁鲁| 国产电影尺度| 俄罗斯XBXBXB兽交| 扒开美女嫩bbb| babesvideos欧美最新| 99精品国产免费观看视频| 中文字幕一区二区视频| 在公交车上被JB草坏了被轮J了 | 国产亚洲精品久久久久苍井松| 囯产免费久久久久久国产免费 | 久久精品亚洲视频| 精品国产手机视频在在线| 好硬好湿好大再深一点动态图| 国产人成高清在线视频99| 国产乱码免费卡1卡二卡3卡四卡 |