想问下如果数字位置不固定(相对不固定,上下左右可能有误差,不会满屏幕飞),颜色不固定(可能会有红色的,黄色的,还可能有其他颜色,猜测,也可能没有)的话,有没有比较完善的方案可以将数字识别出来?
因为红色的在拍照时会有像下图中所示的问题,有一层类似于光圈的东西在文字外,造成二值化效果很不理想。
可以用的包括但不限于 opencv,Tesseracr 等等,机器学习的话也算吧,但不是第一梯队。
毕竟只是个小项目,没必要费那么大劲,而且我也不是专业搞这个的,也未必能搞的很好🤣。
识别的过程的话大概就是定位,切割,灰度化,二值化,识别,差不多就这几步吧。最好是用 Python 来搞,比较熟。感谢大家!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.