V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
primitive
V2EX  ›  职场话题

模型训练开发方向怎么样

  •  
  •   primitive · 136 天前 via Android · 1190 次点击
    这是一个创建于 136 天前的主题,其中的信息可能已经有所发展或是发生改变。
    本人目前在做深度学习模型推理的算子公共平台,主要是对算子进行封装提供 api 。感觉没有深入到芯片编译器,也没上升到算法业务,容易被替代。

    目前想看模型训练方向,但是了解下来感觉模型训练主要是在围绕 pytorch 进行调参,性能优化也是用工具打监控,最后调 batch 改多核等。我觉得训练核心是围绕框架进行尝试,感觉很容易被替代,好处是更近业务,要的人多,不知道前辈们怎么看。

    或者另一个方向去做推理引擎,这个我不太了解,感觉推理引擎市面上没几家在做,比较窄。
    2 条回复    2024-08-05 14:23:18 +08:00
    kennyInTheHouse
        1
    kennyInTheHouse  
       135 天前
    如果考虑模型训练开发,最好就是去现在比较知名的几家 AI 产品公司,除了围绕不同的框架,还要考虑底层的算法设计优化,这样可替代性会低一些。

    推理引擎自研的还是比较少,如你所说太窄了。

    (其实这些 AI 岗位都容易被替代,目标还是尽量让自己兼容性强一些。

    个人拙见。
    TArysiyehua
        2
    TArysiyehua  
       135 天前
    有用,但是跟楼上说的那样,要自己的兼容性强一点。
    原因很简单,你说的模型训练都是针对于 Lora 等这种小模型,调调参数,换一下算法,底层的理论基础跟自己没啥关系,在 AI 还不是很确定的这几年,确实很容易替换,我目前差不多也这样。
    这工作说白了就是一个胶水层,负责跟大模型与上层打交道。然后根据业务训练出专有的小模型。
    等真正的 AI 核心都稳固的差不多了,还是很有前景的,原因就跟现在的开发模式差不多,有几个人整天研究底层框架,操作系统内核,虚拟机呢?大部分都不是,这些方向上的岗位需求少,人要求也高。

    大部分人还是搞业务的,这个时候在此基础上的调参,RAG ,Lora 什么的就相当于一个框架,这个框架连接了底层的 AI 核心,只要你这玩意弄的足够好,未来说不定大家都用你的,就跟 Sping 这些玩意一样。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3321 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 11:59 · PVG 19:59 · LAX 03:59 · JFK 06:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.