图像识别求助!

243 天前
 sonnyclarity492

现在的任务大概如下: 提供图片,要求检测出属于猫、狗、人类或其他,并在此基础上,给出对象属于猫的什么种类,狗的种类等等。最后,将父类(一级标签)和子类(二级标签)一起返回

图像识别算法不限,算力资源暂不考虑,检测时间尽可能快。


目前打算用 yolo v8 来实现,但是以前没接触过 CV 相关,看了文档 “二级标签” 也不知道咋整 +_+

我的想法是:给图片打同级双标签,不知道是否可行;一级标签过滤,二级标签再训练一遍感觉可行;只打一个标签,但是标签文本同时含有父类和子类,感觉也可行。

请各方大佬不吝赐教!

1465 次点击
所在节点    机器学习
7 条回复
DocHelper
243 天前
flymemory
243 天前
如果一级父类不多,没有特别高的分类速度要求,可以先训练一个总的一级标签的模型,再分别训练各自的二级标签的模型,这通常来说是最稳的,yolov8 是个比较快上手的选择
indexError
243 天前
检测到分类应该是固定的吧。
训练二级,手动把二级和一级组成字典。
ktyang
243 天前
要我的话只训练二级,一级去数据库里查,一把梭看天命。不过训练两个模型也可以,也可以互相确认一下,但是结果不一致的时候的融合逻辑得想清楚。
sonnyclarity492
243 天前
@DocHelper 老哥不愧是 DcoHelper 待我研究研究
sonnyclarity492
243 天前
@flymemory @ktyang @indexError
我现在准备先分二级标签梭哈,然后字典 map 。

一级标签有 20 个,二级有 180 个
DocHelper
242 天前
@sonnyclarity492 不过简单一点做就直接一个分类头+两个 loss
一个分类头估计所有二级标签的概率
第一个 loss 计算 二级标签分类的交叉熵
然后再把属于同一一级标签的所有二级标签的 logits 加起来 得到所有一级标签的 logits 在这之上再算一个交叉熵

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1035099

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX