微信图片的 OCR 识别率很高啊, Python 有没有识别率这么高的库用啊?

2023-07-27 08:04:35 +08:00
 minghan0313

不太了解这块,前几天搜的 tesseract ,对固定格式的字体学习后识别率会高一些,但是不固定字体的文本或者有背景图的字体识别率不是很理想。

问 GPT 他说自己的知识库是 2021 年的,不清楚现在什么库比较好用。。

5210 次点击
所在节点    问与答
18 条回复
paidaxtis
2023-07-27 08:36:53 +08:00
paddleocr ,或者阿里读光
lxrmido
2023-07-27 09:10:12 +08:00
paddleocr +1
zong400
2023-07-27 09:57:19 +08:00
@paidaxtis 阿里的 ocr 又贵又不准,我们转百度了
yushiro
2023-07-27 10:01:37 +08:00
如果你可以用在线 ocr ,腾讯有 ocr api 接口,企业认证以后每个月有 1000 次的免费额度。
99s
2023-07-27 10:05:10 +08:00
paddleocr +10086
Sting1226
2023-07-27 10:28:11 +08:00
有背景的,简单的 ps 里条一下色阶就可以了,复杂的操作就复杂点了。总之就是去掉背景。
panggmai
2023-07-27 15:18:17 +08:00
easyocr 不错
huluhulu
2023-07-27 15:35:01 +08:00
OcrLiteOnnx 可以,我经常用
minghan0313
2023-07-27 15:40:52 +08:00
朋友想找我实现个功能,就是识别地方新闻节目后的一些公告信息。

我想法是每 5 秒钟截个图,ocr 扫一下,字符数量超过多少或者有部分关键字就保存图片。

像这种量付费的估计用不起了 0.0
suke119
2023-07-27 17:27:19 +08:00
paddleocr 确实可以 已经做成服务了,比微信的强
IDAEngine
2023-07-27 17:39:23 +08:00
EasyOCR 很不错的
busterian
2023-07-27 18:53:32 +08:00
腾讯接口吧, 有免费额度的。而且腾讯接口 ocr 功能齐全包括手写还有表格识别。单说手写识别准确率能把我的鸡爪字 99%识别出来已经很厉害了
paidaxtis
2023-07-27 21:06:55 +08:00
@zong400 读光有免费的,一键部署
paceewang1
2023-07-28 10:50:26 +08:00
@minghan0313 你这场景难道不是爬虫?
minghan0313
2023-07-28 11:30:02 +08:00
@paceewang1 我觉得算是吧。不过公告信息一般就是新闻结束后的 10 分钟内会出现。
minghan0313
2023-07-31 10:08:06 +08:00
paddleocr 识别率真的是好高!
pytth
2023-11-21 16:44:54 +08:00
minghan0313
2023-11-22 08:35:53 +08:00
@pytth 感谢指路,收藏先。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/960062

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX