求推荐 Python 好用的 ocr

198 天前
 shiyuu

我每天都会用 python 脚本下载 cacti 的流量图进行保存 现在有额外的需求,就是要把所有的流量值都用文字记录起来。 试过 EasyOCR 、PaddleOCR 、百度的 baidu-aip 效果都不太理想 用同样的 ocr 同时试过连续识别 10 张,不是缺少数值,就是想要的关键字和值不在同一个元组里。 也就是 ORC 的结果比较乱,不在一个元组还能处理判断一下,但是缺少数值是最致命的

3057 次点击
所在节点    Python
24 条回复
NoOneNoBody
198 天前
纯英文的不要用混合或者中文识别,直接用英文模组效果更好
paopjian
198 天前
是不是你图太大了,直接裁切目标区域试试
noahlias
198 天前
liewstar
198 天前
我用 CnOcr 帮你试了一下,就这张图来说,没有丢数值,识别出来的数值也是有规律的
f165af34d4830eeb
198 天前
换个思路,python 调用 openai 的 api (
shiyuu
198 天前
重新用 easyocr 只导入英文获取了一遍,主要是 433 坐标左右的值我最重要的,6 月 7 日那天就都不出来。
requests 下载到图片的大小分辨率都是统一的


shiyuu
198 天前
@liewstar 我试试 CnOcr 这个看看
Hconk
198 天前
像这种固定位置的图裁切一下再识别就不需要考虑结构化的问题了,识别效果应该也有提升
whileFalse
198 天前
不能直接获取 cacti 的请求吗
Sawyerhou
198 天前
楼上说的有道理,只用英文,加裁剪,理论上这个图片识别难度不高。
anubu
198 天前
感觉有点像前两天在站里看到的 XY 问题,cacti 把数据画成图片,python 脚本从图片里读取数据,这种基于图片的数据传递方式似乎有点抽象。当然也有可能是有具体的业务场景需要,或者可以尝试抛一个更深的问题出来看看。
shiyuu
198 天前
@whileFalse 普通账号,只能看图,而且我试了没法下载图上的 csv ,需求就类似下面链接里的这样,只能通过 orc 来识别了
https://www.cnblogs.com/choujin/p/11794163.html
shiyuu
198 天前
@anubu https://www.cnblogs.com/choujin/p/11794163.html
其实就像链接里的这样,但是是普通账号只能看图,也没法下载 csv 表格,我就只能通过普通账户的 cookies ,用 response 专门下载那一张图进行保存
shiyuu
198 天前
我都已经把彩色转换成灰度图像了,但是图上 MAX 最大值的 7.34T 却没有识别出来,其他的倒是都识别了
ZekeChin
198 天前
试试 paddleOCR ?
kenvix
198 天前
这种专用任务可以考虑自己训练一个基于 YOLO 的专用识别模型。脚本都是现成的,很容易就搭起来了
ZekeChin
198 天前
@ZekeChin 抱歉原文没看清,可以试试 MiniCPM-Llama3-V ,如果有 GPU 的话 q4 llama.cpp 部署 效率应该也不会太差。帮忙试了 OP 关注的值
ZekeChin
198 天前
@kenvix YOLO 是做目标检测的吧?现在都可以做文本识别了吗,进化这么快
lairdnote
198 天前
这个是环形数据库 为什么不直接读数据库 要用 ocr 去识别呢
shiyuu
198 天前
我现在只能用最笨的办法,把图片裁剪到只剩下一个我需要的值,再进行 ocr ,目前已经 100%识别了。


这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1048112

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX