精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

easyocr:超級簡單且強大的OCR文本識別工具

科技綠洲 ? 來源:Python實用寶典 ? 作者:Python實用寶典 ? 2023-10-30 09:30 ? 次閱讀

今天給大家介紹一個超級簡單且強大的OCR文本識別工具: easyocr .

這個模塊支持70多種語言的即用型OCR,包括中文,日文,韓文和泰文等。

下面是這個模塊的實戰教程

1.準備

開始之前,你要確保Pythonpip已經成功安裝在電腦上,如果沒有,可以訪問這篇文章:超詳細Python安裝指南 進行安裝。

如果你用Python的目的是數據分析,可以直接安裝Anaconda:Python數據分析與挖掘好幫手—Anaconda,它內置了Python和pip.

此外,推薦大家用VSCode編輯器,它有許多的優點:Python 編程的最好搭檔—VSCode 詳細指南

請選擇以下任一種方式輸入命令安裝依賴

  1. Windows 環境 打開 Cmd (開始-運行-CMD)。
  2. MacOS 環境 打開 Terminal (command+空格輸入Terminal)。
  3. 如果你用的是 VSCode編輯器 或 Pycharm,可以直接使用界面下方的Terminal.
pip install easyocr

它會安裝除了模型文件之外的所有依賴,模型文件則會在運行代碼的時候下載

對于Windows,如果在安裝 Torch 或 Torchvision 時報錯了,請按照https://pytorch.org 的官方說明安裝 Torch 和 Torchvision。

如果你想使用顯卡進行計算,你需要搜索下載CUDA,并在Pytorch網站上,確保選擇正確的CUDA版本。如果僅打算在CPU模式下運行,請選擇CUDA = None。

2.實戰教程

這個模塊用起來真的非常簡單,三行代碼完事了:

import easyocr
reader = easyocr.Reader(['ch_sim','en'])
result = reader.readtext('test.png')

運行的過程中會安裝所需要的模型文件,像下面這樣:

圖片

不過它的下載速度非常慢,而且經常會失敗,因此這里給出第二個解決方案:先下載好模型文件,再將其放置到所需要的位置:

上滑查看更多

文字檢測模型(CRAFT)(必須)

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/craft_mlt_25k.zip

中文(簡體)模型(識別中文必須)

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese_sim.zip

中國(傳統)模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese.zip

拉丁模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/latin.zip

日本模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/japanese.zip

韓文模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/korean.zip

泰文模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/thai.zip

阿拉伯文模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/arabic.zip

如果下載速度太慢,請在Python實用寶典公眾號后臺回復: easyocr , 下載我上傳到微云網盤的文字檢測模型(CRAFT)和中文簡體模型文件包。

下載完模型后,將文件放到下面這個位置。

Windows:C:Users用戶名.EasyOCRmodel
Linux~/ .EasyOCR / model

**如下圖所示:
**

圖片

重新執行腳本不會再提醒下載模型了:

import easyocr
reader = easyocr.Reader(['ch_sim'])
result = reader.readtext('test.png')
print(result)

我隨便截了一個直播彈幕的圖片保存在腳本所在的文件夾下,命名為test.png:

結果如下:

圖片

基本上所有應該識別的文字都識別出來了,效果非常不錯。

另外也可以看到,輸出采用列表格式,每個item分別表示對應文字的邊界框,識別文本結果和置信度。

這個模塊還能識別多語種的情況:

我將這張圖片命名為test2.jpg,修改代碼中對應的圖片名稱:

import easyocr
reader = easyocr.Reader(['ch_sim','en'])
result = reader.readtext('test2.jpg')
print(result)

效果如下:

圖片

這張圖片很復雜,而且是中英文混雜在一起的情況,但是可以看到模型除了左上角的水印,圖片中的文字基本都是識別出來了,盡管有部分文字識別錯誤,但還在可以接受的范圍之內。

不過需要注意的是,雖然可以一次性識別許多種語言,但并非所有語言都可以一起用,通常是公共語言和一個特殊語種可以一起識別,相互兼容,比如英語和日語。

如果你的電腦沒有GPU或者顯存不足,可以加一個gpu=false的參數僅使用CPU運行:

reader = easyocr.Reader(['ch_sim','en'], gpu = False)

另外,這個模塊還支持直接使用命令行運行,相當方便,大家可以試試:

easyocr -l ch_sim en -f test.png --detail=1 --gpu=True
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3172

    瀏覽量

    48711
  • python
    +關注

    關注

    56

    文章

    4782

    瀏覽量

    84453
  • OCR
    OCR
    +關注

    關注

    0

    文章

    144

    瀏覽量

    16329
收藏 人收藏

    評論

    相關推薦

    首發 | 告別手動錄入,開放平臺OCR上線印刷文字識別

    的就是印刷字體的轉化。二、印刷文字識別應用廣泛正如文章開頭我們提到的,生活中有很多需要將印刷字體轉換為設備可編輯的文本場景。而作為OCR家族的重要成員,印刷文字識別在這時候就大有作為,
    發表于 05-17 15:18

    Python OCR 識別庫-ddddocr

    ;, 'rb') as f: image = f.read()res = ocr.classification(image)print(res)識別結果3n3d8342總結ddddocr 讓驗證碼變得如此簡單
    發表于 03-30 17:26

    【KV260視覺入門套件試用體驗】七、VITis AI字符和文本檢測(OCR&Textmountain)

    _pt sample_ocr.jpg OCR 該網絡用于光學字符識別,包括文本檢測和文本識別
    發表于 09-26 16:31

    什么是OCR

    什么是OCR OCR的英文全稱: OCR是英文Optical Character Recognition的縮寫,意思是光學字符識別,也可簡單
    發表于 04-10 12:55 ?6682次閱讀

    基于FPGA的OCR文字識別技術的深度解析

    OCR在通用文字識別等場景下有廣泛應用,基于FPGA異構加速的OCR識別相比CPU/GPU實現具有延時小、成本低的優勢。我們設計了多FPGA芯片協同的異構加速架構,能快速適配業務
    發表于 01-26 12:19 ?3983次閱讀

    關于開放平臺OCR上線印刷文字識別的介紹

    我們為什么用OCR?因為可以快速將文字轉為可在設備上編輯的數字文本。因此能夠得到用戶青睞的OCR小編認為應能夠準確生成文本,所見即所得,同時對不同字體,不同環境,不同顏色形狀的
    的頭像 發表于 09-27 09:51 ?2614次閱讀

    如何使用Python開發截圖識別OCR的小工具

     你一定用過那種“OCR神器”,可以把圖片中的文字提取出來,極大的提高工作效率。今天,我們就來做一款實時截圖識別的小工具。顧名思義,運行程序時,可以實時的把你截出來的圖片中的文字識別
    的頭像 發表于 01-04 11:27 ?3480次閱讀

    OCR識別技術

    在爬蟲對驗證碼進行破解時,經常需要對圖片中的文字內容進行識別,這時就需要用到OCR技術了,那么 OCR識別技術是如何實現對文字內容“即拍即得”的呢?
    的頭像 發表于 03-12 09:07 ?4768次閱讀

    機器視覺運動控制一體機應用例程|OCR字符識別應用

    應用背景 OCR字符識別的應用場景非常廣泛,例如在生產型企業領域中,OCR具有多樣性的應用,比如讀取儀表儀器上的文本,進行實時監控、讀取產品上的生產日期、批號,以此來獲得產品的信息和可
    的頭像 發表于 02-24 17:27 ?1369次閱讀
    機器視覺運動控制一體機應用例程|<b class='flag-5'>OCR</b>字符<b class='flag-5'>識別</b>應用

    樹洞OCR文字識別跨平臺的OCR工具

    ./oschina_soft/tools-ocr.zip
    發表于 05-30 09:42 ?5次下載
    樹洞<b class='flag-5'>OCR</b>文字<b class='flag-5'>識別</b>跨平臺的<b class='flag-5'>OCR</b>小<b class='flag-5'>工具</b>

    OCR算法能較好識別水平排布的常規文本

    OCR技術發展到今天,對于常規文本識別已經達到了較高的準確率。
    的頭像 發表于 08-08 16:04 ?1324次閱讀

    OCR光學圖文識別

    使用OCR功能,您可以簡單地將掃描的PDF和基于圖像的PDF轉換為具有可編輯、可選擇和可搜索內容的各種格式,例如MicrosoftOffice格式、PPT、頁面或純文本文檔(TXT文件)。
    的頭像 發表于 08-19 15:23 ?855次閱讀

    OCR實戰教程

    OCR 是光學字符識別(英語:Optical Character Recognition,OCR)是指對文本資料的圖像文件進行分析識別處理,
    的頭像 發表于 02-24 10:36 ?957次閱讀
    <b class='flag-5'>OCR</b>實戰教程

    介紹一款簡單強大的時序圖繪制工具

    Wavedrom 是一款功能強大簡單易用的文本轉圖表工具,被廣泛應用于生成時序圖、波形圖等交互式波形。其特點在于使用
    的頭像 發表于 08-15 12:26 ?1.1w次閱讀
    介紹一款<b class='flag-5'>簡單</b><b class='flag-5'>強大</b>的時序圖繪制<b class='flag-5'>工具</b>

    OCR如何自動識別圖片文字

    OCR 是光學字符識別(英語:Optical Character Recognition,OCR)是指對文本資料的圖像文件進行分析識別處理,
    的頭像 發表于 10-31 16:45 ?741次閱讀
    <b class='flag-5'>OCR</b>如何自動<b class='flag-5'>識別</b>圖片文字