接近 1000 万张不同分辨率的图片,其中某个特定分辨率的大概有 300 万左右。
图片上固定位置有类似水印相机的附加文字。
对附加文字进行识别,用识别内容重命名图片,分文件夹归类整理。
一个查询工具,通过文字查询符合条件的图片,可预览可批量导出。
需要至少三个查询条件。
识别率要求至少 95%。越高越好。
淘宝上找人用 PaddleOCR 跑了下,识别率只有 90%左右。已放弃。
希望能使用 PaddleOCR 或者其他类似开源项目继续优化将识别率提升上去。
如果开源项目实在不行,不排除使用阿里、百度之类付费 OCR 服务的可能。
做过 OCR 有兴趣的朋友请带 ID 加我: TW9ycm93bGVzcw==
谢谢大家。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.