V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
black11black
V2EX  ›  问与答

话说 Python 调用 OCR 有什么比较成熟的方案吗?

  •  
  •   black11black · 2020-10-25 16:55:31 +08:00 via Android · 2407 次点击
    这是一个创建于 1489 天前的主题,其中的信息可能已经有所发展或是发生改变。
    如题,有大量漫画图片需要识别,每张图是纯色背景,上面是印刷体的字(数字版,非扫描),含有中文、英文、日文。

    请问有成熟的 OCR 方案吗?最好是 python 的,因为撸起来比较快,没有的话 java 也行
    13 条回复    2020-10-26 16:29:30 +08:00
    just1
        1
    just1  
       2020-10-25 16:59:48 +08:00
    成熟当然是调 api
    black11black
        2
    black11black  
    OP
       2020-10-25 17:03:10 +08:00 via Android
    @just1 没有本地开源的方案吗,api 主要问题是 qps 跟不上
    renmu123
        3
    renmu123  
       2020-10-25 17:41:08 +08:00 via Android
    pytesseract 你想要开箱即用的话只有找成熟的 api
    yangyaofei
        4
    yangyaofei  
       2020-10-25 19:31:57 +08:00 via Android
    cnocr
    djoiwhud
        5
    djoiwhud  
       2020-10-25 19:34:19 +08:00
    估计只能花钱买付费的。免费的东西准确率估计非常低。当然,你的需求估计付费的准确率也不会很高。
    longbye0
        6
    longbye0  
       2020-10-25 21:05:09 +08:00
    minami
        7
    minami  
       2020-10-25 21:50:03 +08:00
    百度的 paddleocr
    xchaoinfo
        8
    xchaoinfo  
       2020-10-25 23:15:52 +08:00 via Android
    有 GPU 的话,自己网上找个 pytorch 项目训练下,
    没有的话,tesseract 自己训练下,识别率还可以,就是慢,pytesseract 可以调用
    免费的 API 有限制,付费吧
    black11black
        9
    black11black  
    OP
       2020-10-26 06:15:26 +08:00
    @jackrelative 感谢回复,我感觉我这已经是实验室环境了,纯色背景+字,对 OCR 这个领域没什么了解,做的这么菜的吗。
    Hconk
        10
    Hconk  
       2020-10-26 08:54:42 +08:00 via iPhone
    chineseocr,你这种非自然场景的印刷体不要太简单。
    Hconk
        11
    Hconk  
       2020-10-26 08:58:24 +08:00 via iPhone
    @Hconk 日文不行。
    black11black
        12
    black11black  
    OP
       2020-10-26 10:21:31 +08:00
    @Hconk 有成熟的开源项目吗,中文的
    Hconk
        13
    Hconk  
       2020-10-26 16:29:30 +08:00
    @black11black github 搜一下就有,chineseocr
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   965 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 20:17 · PVG 04:17 · LAX 12:17 · JFK 15:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.