求一个少量图片就能实现物体检测项目

2023-09-06 22:27:37 +08:00
 OilMoe

公司最近要折腾这种东西,想要实现的功能类似拍照打卡的感觉。但是我也不是这个方向的,能做的就是上 yolo 系列打打标签,训练了一下。但效果不尽人意,总是在一些比较奇怪的角度下,将某些不在数据集中的东西识别成了其他物体。不仅数据集数量也很少(普遍十几张,多点也就 60 张左右),而且物体有大有小,唯一优势可能就是物体本身不会发生形变。公司也有 4090 的显卡,不太担心显存的问题。

1320 次点击
所在节点    程序员
5 条回复
dayeye2006199
2023-09-06 23:14:59 +08:00
60 几张其实也差不多了,记得做一下图片增量 -- 旋转,翻转,调调亮度,尽量让模型见一下一些奇怪的角度
RVRGnXxwawP5kwKW
2023-09-07 00:41:41 +08:00
可以在某个大型相似任务的数据集上训练,然后在自己的数据集上 finetune 。
zzzzzzy
2023-09-07 09:57:12 +08:00
一楼的思路是正确的,拍照打卡这种需求,每台手机拍出来的照片也大不相同,各个手机品牌对于拍照的算法也不一样,摄像头也不一样,你需要根据少量的数据集的基础上拓展这个数据集,包括一楼提到的旋转、翻转、调整亮度、锐化、放大、缩小等操作,这样才能提供识别成功率。
OilMoe
2023-09-07 10:56:11 +08:00
@dayeye2006199 #1 yolo 5 自带了数据增强的配置文件,使用它的可以吗?还有请问一下,是否可以将沿路拍的东西(不是选择的标志物,比如地板,墙壁)放在训练集中,来防止模型将地板和标志物混淆这种情况有帮助吗
OilMoe
2023-09-07 11:03:08 +08:00
@zzzzzzy #3 yolo 5 是否可以将沿路拍的东西(不是选择的标志物,比如地板,墙壁)放在训练集中,来防止模型将地板和标志物混淆这种情况有帮助吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/971549

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX