图像识别和 ocr 方面的问题请教

现在需求是这样的，我们想做王者荣耀的直播，现有的数据只有视频，想通过视频提取出这些信息：比赛双方的队伍名字，比赛双方的阵容，ban 和 pick 的英雄。队伍人头比分变化，队伍的总比分变化，队伍经济变化，每个选手名字，每个选手对应的英雄，每个英雄的装备出装变化，全场首杀信息，连续 3 杀信息，5 杀，10 杀信息，防御塔破坏信息，杀每一条大小龙的队伍。还有最好能通过小地图记录每个英雄的位置。

想问一下目前 python 下中文 ocr 效果最好的库是什么，还有要实现通过小地图记录每个英雄的位置需要图像识别吗，我注意到英雄离的比较近的时候头像是会有压盖的，这种情况怎么准确识别部分图像？

有没有对 ai 这方面了解的，请指导一下，以前没接触过这些。好像我们目前用不到图像识别太高端的技术，因为要识别的图像都是不变的，只是位置有变化，还有可能会压盖

SorryChen

2017-10-10 00:08:46 +08:00

我只说用神经网络的方法...别的我也不了解…像那种比分识别什么的很简单基本一个 cnn 就搞定了，小地图英雄追踪如果理解为目标追踪的话，遮挡是很多人研究的问题，最近看了一篇效果比较好的论文 real-time recurrent regression networks for object tracking... 其他技术我也不了解啦，我只说了点用神经网络的方法

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/396315

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.