tesseract 和 pytesseract 识别结果为何完全不同

2020-05-11 22:55:54 +08:00
 cmmulxuk

不是说 pytesseract 是 tesseract 的命令封包吗,为什么完全默认的情况下,pytesseract 识别率比 tesseract 差这么多啊,字库也是默认的,没加任何参数。网上搜了一圈也没找到答案。

2728 次点击
所在节点    Python
8 条回复
wangsongyan
2020-05-12 00:43:55 +08:00
图片一样,还有版本?
cz5424
2020-05-12 09:12:49 +08:00
有遇到过类似,不过我是猜测是 macos 的版本跟 Linux 版本有识别率差距
jacklin96
2020-05-12 11:38:55 +08:00
默认参数的没试过 用自己训练的库并添加参数之后 准确率没什么区别
tony9413
2020-05-12 11:41:41 +08:00
2 楼正解
sadfQED2
2020-05-12 12:50:47 +08:00
你自己手动把参数加上看看,带上那个文本类型参数
nicevar
2020-05-12 13:02:54 +08:00
pytesseract 就那么一丁点代码没必要网上去搜什么答案, tesseract 是你自己配置的, 你确定是调用的同一个 tesseract?配置数据一样, 参数一样? 是不是你从哪弄来的代码有对图片进行处理?
CY4suncheng
2020-05-12 17:28:57 +08:00
是要做 OCR 么?其实申请个百度之类的 API,识别的还挺准的
cmmulxuk
2020-05-13 20:05:33 +08:00
只安装了一个版本,既然 pytesseract 可以用,那应该不是版本问题。问题没有解决,通过处理图片,准确率上来了,就懒的管了,将就用了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/670735

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX