OCR 怎么提高准确率？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 453 天前的主题，其中的信息可能已经有所发展或是发生改变。

最近有一大批图片需要识别，都是一个样式的，算是很标准的图片。
上面 16 个字符（数字大写字母）
下面 6 个数字
暂时就是用 umi-ocr 工具
发现默认的英文中文，识别出来都有些问题。1000 多张会有 10 个左右有问题。
识别出来上面不是 16 个字符。
求解怎么弄好点。

OCR

准确率

识别

15 条回复 • 2024-08-05 09:57:54 +08:00

busier

2024-08-04 13:25:59 +08:00 via iPhone

你都确定是一个样式了先将图片除了那 16 个字符外面，多余的部分裁剪掉啊

Daybyedream

2024-08-04 14:49:12 +08:00

@busier 处理的是已经裁剪过了的只有两列东西。就是有些 F 识别成 9 ，有些 YL 之类的识别错。

trungdieu031

2024-08-04 17:08:21 +08:00

标注或合成一部分数据，自己训练/微调一个模型

akira

2024-08-04 17:29:31 +08:00

试试传统 ocr + 大语言模型的方案，例如 llama index 这些

tool2dx

2024-08-04 17:35:16 +08:00

提不了，类似 GPT 回答 100%正确率一样，不太可能。

可以多个模型交叉验证，或者做一次识别后文字的 rasterization ，对比图片前后相似度。

miaomiao888

2024-08-04 17:55:03 +08:00

想要高精度就别用离线了，试试合合 OCR ，业界精度最高。

weiwoxinyou

2024-08-04 17:58:59 +08:00

如果是标准的数字和字母，不需要什么高级算法，纯按传统的图片识别方式就行，python 直接调 opencv 的 api 就行

uTOmOuk3L6sb4MSI

2024-08-04 18:29:57 +08:00 via iPhone

@weiwoxinyou 我问了 ChatGPT 说 opencv 本身没有用于字符识别的 api

paopjian

2024-08-04 20:12:57 +08:00

固定角度固定文本大小,直接用图形匹配?或者弄两个模型交叉验证?

Les1ie

2024-08-04 20:17:40 +08:00

paddleocr 效果很棒，资源占用少，离线部署简单

Daybyedream

2024-08-04 20:21:15 +08:00

@weiwoxinyou 大概懂了，直接一个个字符截出来然后识别？这样？反正就那么几个

Daybyedream

2024-08-04 20:21:37 +08:00

@trungdieu031 我去研究下

seeu2ex

2024-08-04 23:17:19 +08:00 via iPhone

如果是线条加数字英文的话可以试试调对比度等，直接给去除无用线条，在加深可用部分的颜色深度

SWALLOWW

2024-08-05 09:43:20 +08:00

微信有没有接口

yaleyu

2024-08-05 09:57:54 +08:00

图片剪裁一下，然后二值化一下，paddleocr, easyocr, rapidocr 都识别一次，再对比一下识别结果，应该不会出错。