• 请不要在回答技术问题时复制粘贴 AI 生成的内容
forty
V2EX  ›  程序员

求推荐 AI 图片分类的现成服务

  •  
  •   forty · May 27, 2024 · 2771 views
    This topic created in 717 days ago, the information mentioned may be changed or developed.

    手头有大量图片,以及一些分类标签的名单列表,需要根据图片找到对应的标签。 比如输入图片 1 ,期望得出标签:风景,夜晚。

    我试了一下某大厂的,不能用我提供的标签去分,而是它自己的标签,比如我期望的是“人物,女性”,然而它给出的是“眼睛,鼻子,咖啡”

    20 replies    2024-09-25 09:22:42 +08:00
    abelyao
        1
    abelyao  
       May 27, 2024
    反过来想,输入图片,问它内容是否为“风景”,是的话你就打上标签“风景”咯,以此类推
    forty
        2
    forty  
    OP
       May 27, 2024
    如果有几百个基本标签,那 1 个图片得问上几百次?还是说有支持 1 次问全部的?不知道哪家的 api 支持
    mumbler
        3
    mumbler  
       May 27, 2024
    你先给每个标签准备一个标准图片,计算出向量,然后新图片也计算向量,相似度排序看与哪个标签的标准图片最接近,就先粗分到这个标签下,然后用大模型询问复核一下是否与这个标签匹配
    safilar
        4
    safilar  
       May 27, 2024
    @mumbler 你这个方法是不错,有实践过么
    jimrok
        5
    jimrok  
       May 27, 2024
    这个不是做一个微调就行了吗,你用 restnet 50 的模型,改一下分类,载入原来的权重,重新训练一下就行了。问一下 gpt4 ,马上给你一套代码。
    lizhisty
        6
    lizhisty  
       May 27, 2024
    @jimrok 老哥 restnet 50 是什么
    rming
        7
    rming  
       May 27, 2024
    用 yolo 微调下
    mightybruce
        8
    mightybruce  
       May 27, 2024
    这个图片分类属于计算机视觉的经典任务。
    常见的有好几种方案
    第一种,图片元数据信息 尤其是 exif 信息,可以直接利用来打上标签,然后就用这个做文本做索引查找,

    第二种,这个属于少量自己训练的计算机视觉任务,叫做 image classification

    如果你一点都不懂 AI, 不建议自己训练, 百度飞浆 可以看看,easydl 提供了这些
    https://ai.baidu.com/easydl/vision/

    第一步需要你把图片做分类, 并完成标注,这个手动的话要耗费很多时间的

    自动标注最好借助一些平台来做

    第二步 选取训练集, 做有监督的训练学习

    第三步 用剩下的测试集 测试效果
    jimrok
        9
    jimrok  
       May 27, 2024
    @lizhisty 残差网络,多打了一个 t ,resnet ,何凯明在微软研究院搞出来的图像分类模型,曾经的 imgnet 的冠军。
    jimrok
        10
    jimrok  
       May 27, 2024
    图像识别已经是深度学习非常成熟的领域,一般都不建议重新训练一个模型,现有的模型选一个速度和准确率都能接受的模型,做一个微调就行,因为现有的模型对图片的纹理特征都完成了比较好的训练,只需要基于现有的权重,重新训练,就能得到特定领域的模型。
    ZnductR0MjHvjRQ3
        11
    ZnductR0MjHvjRQ3  
       May 27, 2024
    这种服务应该没有,如果你找的是你认为很通用的,但是市面上没有的话,就只能自己微调了,yolo8 很好用
    chenuu
        12
    chenuu  
       May 27, 2024
    azure 有自定义视觉这个能力
    qq316107934
        13
    qq316107934  
       May 27, 2024
    试试 zero shot 分类然后算向量相似度,自己卡一个阈值,参考 CLIP 模型
    mumbler
        14
    mumbler  
       May 27, 2024
    @safilar 都跑了一年多了,不过不是图片分类,而是视频内容搜索
    fjkfwz406
        15
    fjkfwz406  
       May 27, 2024
    clip
    suke119
        16
    suke119  
       May 28, 2024
    每一种图片 20-40 张,越多模型越准确 准备好分类,然后训练下 最后准确率在 99%以上,前端时间刚给别人定制过一个
    huang86041
        17
    huang86041  
       May 28, 2024
    我使用的图库应用 MT-Photos 里面就包含 AI 识别,而且他也开源了。用的 Chinese-CLIP
    省事的话,你直接用他的 docker 部署一个。搜 mt-photos-ai
    或者你直接搜 Chinese-CLIP ,自己定制一个。
    andforce
        18
    andforce  
       Aug 30, 2024
    目前回复中好像没有开箱即用的,蹲一个
    laoli123
        19
    laoli123  
       Sep 5, 2024
    @suke119 #16 你好 你是用的 YOLO 训练的吗?
    ChanKc
        20
    ChanKc  
       Sep 25, 2024
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   944 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 105ms · UTC 20:07 · PVG 04:07 · LAX 13:07 · JFK 16:07
    ♥ Do have faith in what you're doing.