求一个少量图片就能实现物体检测项目

2023-09-06 22:27:37 +08:00

OilMoe

公司最近要折腾这种东西，想要实现的功能类似拍照打卡的感觉。但是我也不是这个方向的，能做的就是上 yolo 系列打打标签，训练了一下。但效果不尽人意，总是在一些比较奇怪的角度下，将某些不在数据集中的东西识别成了其他物体。不仅数据集数量也很少(普遍十几张，多点也就 60 张左右)，而且物体有大有小，唯一优势可能就是物体本身不会发生形变。公司也有 4090 的显卡，不太担心显存的问题。

1458 次点击

所在节点

程序员

5 条回复

dayeye2006199

2023-09-06 23:14:59 +08:00

60 几张其实也差不多了，记得做一下图片增量 -- 旋转，翻转，调调亮度，尽量让模型见一下一些奇怪的角度

RVRGnXxwawP5kwKW

2023-09-07 00:41:41 +08:00

可以在某个大型相似任务的数据集上训练，然后在自己的数据集上 finetune 。

zzzzzzy

2023-09-07 09:57:12 +08:00

一楼的思路是正确的，拍照打卡这种需求，每台手机拍出来的照片也大不相同，各个手机品牌对于拍照的算法也不一样，摄像头也不一样，你需要根据少量的数据集的基础上拓展这个数据集，包括一楼提到的旋转、翻转、调整亮度、锐化、放大、缩小等操作，这样才能提供识别成功率。

OilMoe

2023-09-07 10:56:11 +08:00

@dayeye2006199 #1 yolo 5 自带了数据增强的配置文件，使用它的可以吗？还有请问一下，是否可以将沿路拍的东西（不是选择的标志物，比如地板，墙壁）放在训练集中，来防止模型将地板和标志物混淆这种情况有帮助吗

OilMoe

2023-09-07 11:03:08 +08:00

@zzzzzzy #3 yolo 5 是否可以将沿路拍的东西（不是选择的标志物，比如地板，墙壁）放在训练集中，来防止模型将地板和标志物混淆这种情况有帮助吗

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/971549

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX