有没有方法可以对大量图片进行无监督分类,或者增量地依据个人喜好二分类?另外存储场景一般怎么处理?

2021-03-31 20:53:27 +08:00
 Licsber
大量图片(目前 50W 张 中等尺寸 /大尺寸 不断增加中) 尺寸都不尽相同
包含部分简短的可能不确切的文本描述( caption )

增量地依据喜好二分类的意思是:
先标注部分图片为喜欢 然后通过深度学习(存疑)等奇怪方法 自动将图片分为两类
然后再对某些错误标注进行重新分类 这样逐渐应用到其他未标注图片 /新增图片上
也可以按照喜好值(如 0-10 )进行 11 分类任务 /直接回归任务 有没有这样比较成熟的方法或者简单介绍?

依据个人喜好是不是会训练出奇怪的人工智能?(

图片是风格可能不一致 可能是相机拍摄图片 也可能是插画等类型的人工图片

看了诸如 K 聚类的方法 先是提取固定大小的特征 再依照特征分类 这样能做到部分图片的归类

另外就是这种大量图片的存储场景一般怎么处理,现在是按照 md5 值等参数进行打散文件夹存储
在 mac 上表现就是时不时的 mdsync 进程 cpu 占用 100% 自己的学生机存储空间又不够 只能放本地
看过 minio 、gridfs 等方案 有没有用过的 dalao 说说
568 次点击
所在节点    问与答
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/766999

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX