|      1busier      2024-08-04 13:25:59 +08:00 via iPhone 你都确定是一个样式了 先将图片除了那 16 个字符外面,多余的部分裁剪掉啊 | 
|      2Daybyedream OP @busier 处理的是已经裁剪过了的只有两列东西。就是有些 F 识别成 9 ,有些 YL 之类的识别错。 | 
|      3trungdieu031      2024-08-04 17:08:21 +08:00 标注或合成一部分数据,自己训练/微调一个模型 | 
|  |      4akira      2024-08-04 17:29:31 +08:00 试试 传统 ocr + 大语言模型的 方案, 例如 llama index  这些 | 
|  |      5tool2dx      2024-08-04 17:35:16 +08:00 提不了,类似 GPT 回答 100%正确率一样,不太可能。 可以多个模型交叉验证,或者做一次识别后文字的 rasterization ,对比图片前后相似度。 | 
|  |      6miaomiao888      2024-08-04 17:55:03 +08:00 想要高精度就别用离线了,试试合合 OCR ,业界精度最高。 | 
|      7weiwoxinyou      2024-08-04 17:58:59 +08:00 如果是标准的数字和字母,不需要什么高级算法,纯按传统的图片识别方式就行,python 直接调 opencv 的 api 就行 | 
|  |      8uTOmOuk3L6sb4MSI      2024-08-04 18:29:57 +08:00 via iPhone @weiwoxinyou 我问了 ChatGPT 说 opencv 本身没有用于字符识别的 api | 
|      9paopjian      2024-08-04 20:12:57 +08:00 固定角度固定文本大小,直接用图形匹配?或者弄两个模型交叉验证? | 
|  |      10Les1ie      2024-08-04 20:17:40 +08:00 paddleocr  效果很棒,资源占用少,离线部署简单 | 
|      11Daybyedream OP @weiwoxinyou 大概懂了,直接一个个字符截出来然后识别?这样?反正就那么几个 | 
|      12Daybyedream OP @trungdieu031 我去研究下 | 
|      13seeu2ex      2024-08-04 23:17:19 +08:00 via iPhone 如果是线条加数字英文的话可以试试调对比度等,直接给去除无用线条,在加深可用部分的颜色深度 | 
|  |      14SWALLOWW      2024-08-05 09:43:20 +08:00 微信有没有接口 | 
|      15yaleyu      2024-08-05 09:57:54 +08:00 图片剪裁一下,然后二值化一下,paddleocr, easyocr, rapidocr 都识别一次,再对比一下识别结果,应该不会出错。 |