要微调 OCR 产品,提高手机拍屏照片中的序列号识别率(大写字母、数字),字形固定,有什么推荐方案?拍的是内网设备,物理隔离外网

155 天前
 drymonfidelia
2103 次点击
所在节点    程序员
14 条回复
mMartin
155 天前
paddleocr 啊 训练部署都简单 只不过是百度的 有恶心人的地方
drymonfidelia
155 天前
@mMartin 现在用的就是 paddleocr ,每天都内存泄露把 256GB 内存占满,需要每小时重启
mMartin
155 天前
@drymonfidelia #2 不至于内存泄露吧 我们一直用 应该是你们用法有问题
raycool
155 天前
排查下吧,换个部署方案。
同用 paddleocr
无内存泄漏问题。
drymonfidelia
155 天前
@mMartin
@raycool 这个内存泄露的问题我三个多月前就在 v2 问过了,有样本代码 /t/1030071 现在越来越严重了
goxxoo
154 天前
国外有一家 Tesseract OCR, 我用的识别率 100% 大写字母和数字, C#的 应该也有其他平台,本地调用
ShareDuck
154 天前
@mMartin #1 之前试用过,没有深入了解。可以具体说说有什么恶心人的东西吗?好让我们今后避坑。
NightFlame
154 天前
paddleocr + 1
mMartin
154 天前
@ShareDuck #7 内部代码结构混乱 有路径写死的地方 paddle 臃肿
elboble
154 天前
cnocr ?可以 docker 部署
KIMI360
154 天前
intern vl ,glm4v 这些视觉模型也可以试试。
zuiyue123
154 天前
有好多开源的 可以试试
beginor
154 天前
没人关注 phi-3-vision 么?
tarasha
154 天前
换个部署方案吧。转 onnx ,有显卡的话用 trt 更快(启动慢)。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1057733

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX