华人澳洲中文论坛

热图推荐

    几款开源的OCR辨认名目,保藏备用

    [复制链接]

    2023-3-17 15:29:27 30 0

    跟着科技的开展,OCR场景随处可见,得多APP也集成如身份证辨认,银行卡辨认的功用,包罗微信都反对截图文件中的文字提取。当初,各大厂商均有提供各种场景的OCR辨认的API。然而,有时分咱们也想本人来折腾一下。这时候候,就能借助一些主流开源框架来疾速达到咱们的目的。
    OCR引擎tesseract
    Tesseract,一款由HP试验室开发由Google保护的开源OCR引擎,开源,收费,反对多言语,多平台;


    http://github.com/tesseract-ocr/tesseract.git
    tesseract.js
    js版本的Tesseract OCR,反对一百多种言语,使用也是十分简略,能够用npm装置,也能够间接在页面援用js




    http://github.com/naptha/tesseract.js.git
    PaddleOCR
    PaddleOCR是百度开源一套OCR,旨在打造一套丰硕、当先、且实用的OCR工具库,助力开发者训练出更好的模型,并运用落地。






    http://github.com/PaddlePaddle/PaddleOCR.git
    EasyOCR
    EasyOCR是用Python编写基于Tesseract的OCR辨认库,用于图象辨认输入文本,目前反对80多种言语。


    http://github.com/JaidedAI/EasyOCR.git
    妹妹ocr
    MMOCR 是基于 PyTorch 和 妹妹detection 的开源工具箱,专一于文本检测,文本辨认以及相应的上游工作,如症结信息提取。


    http://github.com/open-妹妹lab/妹妹ocr.git
    simple-ocr-OpenCV
    基于opencv 和numpy开源的OCR辨认引擎


    http://github.com/goncalopp/simple-ocr-opencv.git
    OCR工具OCRmyPDF
    OCRmyPDF是基于tesseract-ocr开发、训练的文字辨认提取的开源名目


    http://github.com/ocrmypdf/OCRmyPDF.git
    Umi-OCR
    基于 PaddleOCR 完成的一款开源的文字辨认工具,


    个别开源名目,辨认率确定没有商用的那末高,只要经过训练本人的字库来进步辨认率。文字辨认场景,有时分就会波及到图片处置,这里又会关联到其它弱小的图象处置开源名目,如:OpenCV。这些名目中,PaddleOCR相对于来讲会更合乎咱们常见的业务场景,也反对咱们本人去训练。

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题37

    帖子45

    积分215

    图文推荐