图像识别和 ocr 方面的问题请教

2017-10-09 23:46:39 +08:00
 ballshapesdsd
现在需求是这样的,我们想做王者荣耀的直播,现有的数据只有视频,想通过视频提取出这些信息:比赛双方的队伍名字,比赛双方的阵容,ban 和 pick 的英雄。队伍人头比分变化,队伍的总比分变化,队伍经济变化,每个选手名字,每个选手对应的英雄,每个英雄的装备出装变化, 全场 首杀 信息,连续 3 杀信息,5 杀,10 杀信息,防御塔破坏信息,杀每一条大小龙的队伍。还有最好能通过小地图记录每个英雄的位置。

想问一下目前 python 下中文 ocr 效果最好的库是什么,还有要实现通过小地图记录每个英雄的位置需要图像识别吗,我注意到英雄离的比较近的时候头像是会有压盖的,这种情况怎么准确识别部分图像?

有没有对 ai 这方面了解的,请指导一下,以前没接触过这些。好像我们目前用不到图像识别太高端的技术,因为要识别的图像都是不变的,只是位置有变化,还有可能会压盖
1102 次点击
所在节点    问与答
2 条回复
SorryChen
2017-10-10 00:08:46 +08:00
我只说用神经网络的方法...别的我也不了解…像那种比分识别什么的很简单基本一个 cnn 就搞定了,小地图英雄追踪如果理解为目标追踪的话,遮挡是很多人研究的问题,最近看了一篇效果比较好的论文 real-time recurrent regression networks for object tracking... 其他技术我也不了解啦,我只说了点用神经网络的方法
SorryChen
2017-10-10 00:19:44 +08:00
小地图的背景应该是不变的,这种情况下你做一个前后帧的差异检测应该就能识别出英雄了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/396315

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX