OCR 怎么提高准确率？

最近有一大批图片需要识别，都是一个样式的，算是很标准的图片。
上面 16 个字符（数字大写字母）
下面 6 个数字
暂时就是用 umi-ocr 工具
发现默认的英文中文，识别出来都有些问题。1000 多张会有 10 个左右有问题。
识别出来上面不是 16 个字符。
求解怎么弄好点。

busier

212 天前

你都确定是一个样式了先将图片除了那 16 个字符外面，多余的部分裁剪掉啊

Daybyedream

212 天前

@busier 处理的是已经裁剪过了的只有两列东西。就是有些 F 识别成 9 ，有些 YL 之类的识别错。

trungdieu031

212 天前

标注或合成一部分数据，自己训练/微调一个模型

akira

212 天前

试试传统 ocr + 大语言模型的方案，例如 llama index 这些

tool2dx

212 天前

提不了，类似 GPT 回答 100%正确率一样，不太可能。

可以多个模型交叉验证，或者做一次识别后文字的 rasterization ，对比图片前后相似度。

miaomiao888

212 天前

想要高精度就别用离线了，试试合合 OCR ，业界精度最高。

weiwoxinyou

212 天前

如果是标准的数字和字母，不需要什么高级算法，纯按传统的图片识别方式就行，python 直接调 opencv 的 api 就行

uTOmOuk3L6sb4MSI

212 天前

@weiwoxinyou 我问了 ChatGPT 说 opencv 本身没有用于字符识别的 api

paopjian

212 天前

固定角度固定文本大小,直接用图形匹配?或者弄两个模型交叉验证?

Les1ie

212 天前

paddleocr 效果很棒，资源占用少，离线部署简单

Daybyedream

212 天前

@weiwoxinyou 大概懂了，直接一个个字符截出来然后识别？这样？反正就那么几个

seeu2ex

212 天前

如果是线条加数字英文的话可以试试调对比度等，直接给去除无用线条，在加深可用部分的颜色深度

yaleyu

211 天前

图片剪裁一下，然后二值化一下，paddleocr, easyocr, rapidocr 都识别一次，再对比一下识别结果，应该不会出错。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.