OCR 怎么提高准确率?

46 天前
 Daybyedream
最近有一大批图片需要识别,都是一个样式的,算是很标准的图片。
上面 16 个字符(数字大写字母)
下面 6 个数字
暂时就是用 umi-ocr 工具
发现默认的英文中文,识别出来都有些问题。1000 多张会有 10 个左右有问题。
识别出来上面不是 16 个字符。
求解怎么弄好点。
1575 次点击
所在节点    问与答
15 条回复
busier
46 天前
你都确定是一个样式了 先将图片除了那 16 个字符外面,多余的部分裁剪掉啊
Daybyedream
46 天前
@busier 处理的是已经裁剪过了的只有两列东西。就是有些 F 识别成 9 ,有些 YL 之类的识别错。
trungdieu031
46 天前
标注或合成一部分数据,自己训练/微调一个模型
akira
46 天前
试试 传统 ocr + 大语言模型的 方案, 例如 llama index 这些
tool2dx
46 天前
提不了,类似 GPT 回答 100%正确率一样,不太可能。

可以多个模型交叉验证,或者做一次识别后文字的 rasterization ,对比图片前后相似度。
miaomiao888
46 天前
想要高精度就别用离线了,试试合合 OCR ,业界精度最高。
weiwoxinyou
46 天前
如果是标准的数字和字母,不需要什么高级算法,纯按传统的图片识别方式就行,python 直接调 opencv 的 api 就行
uTOmOuk3L6sb4MSI
46 天前
@weiwoxinyou 我问了 ChatGPT 说 opencv 本身没有用于字符识别的 api
paopjian
46 天前
固定角度固定文本大小,直接用图形匹配?或者弄两个模型交叉验证?
Les1ie
46 天前
paddleocr 效果很棒,资源占用少,离线部署简单
Daybyedream
46 天前
@weiwoxinyou 大概懂了,直接一个个字符截出来然后识别?这样?反正就那么几个
Daybyedream
46 天前
@trungdieu031 我去研究下
seeu2ex
46 天前
如果是线条加数字英文的话可以试试调对比度等,直接给去除无用线条,在加深可用部分的颜色深度
SWALLOWW
45 天前
微信有没有接口
yaleyu
45 天前
图片剪裁一下,然后二值化一下,paddleocr, easyocr, rapidocr 都识别一次,再对比一下识别结果,应该不会出错。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1062378

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX