1
busier 97 天前 via iPhone
你都确定是一个样式了 先将图片除了那 16 个字符外面,多余的部分裁剪掉啊
|
2
Daybyedream OP @busier 处理的是已经裁剪过了的只有两列东西。就是有些 F 识别成 9 ,有些 YL 之类的识别错。
|
3
trungdieu031 97 天前
标注或合成一部分数据,自己训练/微调一个模型
|
4
akira 97 天前
试试 传统 ocr + 大语言模型的 方案, 例如 llama index 这些
|
5
tool2dx 97 天前
提不了,类似 GPT 回答 100%正确率一样,不太可能。
可以多个模型交叉验证,或者做一次识别后文字的 rasterization ,对比图片前后相似度。 |
6
miaomiao888 97 天前
想要高精度就别用离线了,试试合合 OCR ,业界精度最高。
|
7
weiwoxinyou 97 天前
如果是标准的数字和字母,不需要什么高级算法,纯按传统的图片识别方式就行,python 直接调 opencv 的 api 就行
|
8
uTOmOuk3L6sb4MSI 97 天前 via iPhone
@weiwoxinyou 我问了 ChatGPT 说 opencv 本身没有用于字符识别的 api
|
9
paopjian 97 天前
固定角度固定文本大小,直接用图形匹配?或者弄两个模型交叉验证?
|
10
Les1ie 97 天前
paddleocr 效果很棒,资源占用少,离线部署简单
|
11
Daybyedream OP @weiwoxinyou 大概懂了,直接一个个字符截出来然后识别?这样?反正就那么几个
|
12
Daybyedream OP @trungdieu031 我去研究下
|
13
seeu2ex 97 天前 via iPhone
如果是线条加数字英文的话可以试试调对比度等,直接给去除无用线条,在加深可用部分的颜色深度
|
14
SWALLOWW 96 天前
微信有没有接口
|
15
yaleyu 96 天前
图片剪裁一下,然后二值化一下,paddleocr, easyocr, rapidocr 都识别一次,再对比一下识别结果,应该不会出错。
|