现在我识别一个 1080p 视频中的实心球,实心球会是各种颜色,但是一定是纯色,当然可能受天气影响,光照等,会有一些变化。实心球大概 25 个像素的大小。
之前的做法是,用的 yolov4 tiny 的网络,1920x1080resize 成 608x608 的输入,简单粗暴的标了几百个图片,两个 class,人和实心球。现在误检测很多,而且在实心球和背景颜色相近时也很难检测出来。现在后处理的逻辑是很多的,但是还是没法用,误检测太多,很多纯色的小区域,甚至足球排球都能识别成实心球。
我没想到什么办法,只能说现在多标一些数据,做做数据增强啥的。
有没有大佬提个建议,感谢!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.