模型训练开发方向怎么样

137 天前
 primitive
本人目前在做深度学习模型推理的算子公共平台,主要是对算子进行封装提供 api 。感觉没有深入到芯片编译器,也没上升到算法业务,容易被替代。

目前想看模型训练方向,但是了解下来感觉模型训练主要是在围绕 pytorch 进行调参,性能优化也是用工具打监控,最后调 batch 改多核等。我觉得训练核心是围绕框架进行尝试,感觉很容易被替代,好处是更近业务,要的人多,不知道前辈们怎么看。

或者另一个方向去做推理引擎,这个我不太了解,感觉推理引擎市面上没几家在做,比较窄。
1196 次点击
所在节点    职场话题
2 条回复
kennyInTheHouse
136 天前
如果考虑模型训练开发,最好就是去现在比较知名的几家 AI 产品公司,除了围绕不同的框架,还要考虑底层的算法设计优化,这样可替代性会低一些。

推理引擎自研的还是比较少,如你所说太窄了。

(其实这些 AI 岗位都容易被替代,目标还是尽量让自己兼容性强一些。

个人拙见。
TArysiyehua
136 天前
有用,但是跟楼上说的那样,要自己的兼容性强一点。
原因很简单,你说的模型训练都是针对于 Lora 等这种小模型,调调参数,换一下算法,底层的理论基础跟自己没啥关系,在 AI 还不是很确定的这几年,确实很容易替换,我目前差不多也这样。
这工作说白了就是一个胶水层,负责跟大模型与上层打交道。然后根据业务训练出专有的小模型。
等真正的 AI 核心都稳固的差不多了,还是很有前景的,原因就跟现在的开发模式差不多,有几个人整天研究底层框架,操作系统内核,虚拟机呢?大部分都不是,这些方向上的岗位需求少,人要求也高。

大部分人还是搞业务的,这个时候在此基础上的调参,RAG ,Lora 什么的就相当于一个框架,这个框架连接了底层的 AI 核心,只要你这玩意弄的足够好,未来说不定大家都用你的,就跟 Sping 这些玩意一样。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1062321

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX