本人目前情况:从事后端开发工作,工作涉及过一点 Agent 的知识,对于 MCP 、RAG 有一些模糊的认识
希望达到的目标:学习一些关于大模型相关的知识,模型微调(对这个比较感兴趣,需要学习哪些东西?)、部署、大模型应用开发,快速入门到能找到工作的水平
问题:哪些知识是必须的?有没有比较完整的学习路线?对于底层比较原理性的东西是否可以先跳过,工作后再深入学习?
请各位大佬多多指教!
![]() |
1
TimePPT PRO 不建议看 fine tuning 相关的内容,这个基本上不属于工程范畴。如果硬学,可以从理解 LORA 开始……
Prompting 相关的可以看这个 https://www.promptingguide.ai/zh 模型部署没啥难的,现在各家云平台基本上很成熟的 pipeline 了,且大厂有自己的 pipeline 技术栈和要求,找几家云服务厂商看下官方部署文档就 ok 了 |
![]() |
2
TimePPT PRO @TimePPT 还有微调要真想玩玩,记得 Azure / Amazon AWS 都有专门的模型微调平台,或者 OpenAI 自己部分模型支持微调,直接后台或者调接口就行。
想上手训模型微调模型,可以试着看看 pytorch / transfermers 的文档,看看能不能看进去,遇到不懂的概念再顺手查? |
3
iOCZS 4 小时 2 分钟前
这类书籍多得汗牛充栋了吧
|
4
emSaVya 3 小时 49 分钟前
不明白后端去做 mlops 会有啥收益吗?你做后端产品做出增量来了 好歹有点 kpi 收益。你做 mlops 有啥收益啊 做得好功劳是模型/策略/算法的 服务挂了 锅是你的。
|
5
nayenizhenmei 3 小时 39 分钟前
我也一直找不到学习的路径和开源项目,我也知道一些书籍有,但更想看一些网络上的帖子教程
|
![]() |
6
huangyezhufeng 2 小时 38 分钟前
“底层比较原理性的东西是否可以先跳过”
个人认为可以的 “模型微调”需要学习的东西 我建议看 Natural Language Processing with Transformers ,Huggingface 工程师写的,可以跟着敲代码,也没那么多底层细节。适合 Learning by doing. 后面想补 LLM 底层原理知识,可以看 Build a Large Language Model (From Scratch)和 Super Study Guide: Transformers & Large Language Models. 如果对深度学习基础不熟,可以先从一些基础的知识学起。比如读一下 Neural Networks and Deep Learning(NNDL)。 https://datahonor.com/blog/2025/02/20/dl_book/ 这里简单写了上面几本书和其他一些相关书籍的书评,也可以参考看下。 |