tesseract 和 pytesseract 识别结果为何完全不同

2020-05-11 22:55:54 +08:00

cmmulxuk

不是说 pytesseract 是 tesseract 的命令封包吗，为什么完全默认的情况下，pytesseract 识别率比 tesseract 差这么多啊，字库也是默认的，没加任何参数。网上搜了一圈也没找到答案。

2774 次点击

所在节点

8 条回复

wangsongyan

2020-05-12 00:43:55 +08:00

图片一样，还有版本？

cz5424

2020-05-12 09:12:49 +08:00

有遇到过类似，不过我是猜测是 macos 的版本跟 Linux 版本有识别率差距

jacklin96

2020-05-12 11:38:55 +08:00

默认参数的没试过用自己训练的库并添加参数之后准确率没什么区别

tony9413

2020-05-12 11:41:41 +08:00

2 楼正解

sadfQED2

2020-05-12 12:50:47 +08:00

你自己手动把参数加上看看，带上那个文本类型参数

nicevar

2020-05-12 13:02:54 +08:00

pytesseract 就那么一丁点代码没必要网上去搜什么答案, tesseract 是你自己配置的, 你确定是调用的同一个 tesseract?配置数据一样, 参数一样? 是不是你从哪弄来的代码有对图片进行处理?

CY4suncheng

2020-05-12 17:28:57 +08:00

是要做 OCR 么？其实申请个百度之类的 API，识别的还挺准的

cmmulxuk

2020-05-13 20:05:33 +08:00

只安装了一个版本，既然 pytesseract 可以用，那应该不是版本问题。问题没有解决，通过处理图片，准确率上来了，就懒的管了，将就用了。

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.