创业团队招云原生大模型训推平台研发工程师(可以远程)

355 天前
 NascentCoreAI
工作亮点
- 业界最热门的大模型及 AGI 赛道初创团队
- Google 等世界顶级大模型 AI 算力平台技术专家带队;
- 解决中国算力卡脖子难题,为中国大模型团队提供低成本、高性价比算力;
- 与全球业界顶尖工程团队、高校教授、研究机构定时交流前沿技术;
- 混合办公(北京、或远程)、平等沟通、极致扁平化团队;
- 内部信息完全公开,为工程师打开产品、商业的大门;
- 丰厚期权;
关键词
- 大模型/LLM 、Generative AI 、AIGC 、Python 、PyTorch 、Kubernetes/K8s 、容器、云原生、微服务、分布式系统、Kubeflow 、Volcano 、Golang/Go
能力要求
- 有强烈意愿让大模型普惠大众
- 计算机及计算机相关专业本科或以上学历;熟悉计算机科学基本知识:分布式系统原理、计算机网络、数据结构和算法
- 享受高质量代码、坚持高质量软件工程实践(测试、集成、架构)、持续关注前沿技术、抱有 AI 信仰、坚信 AI 改变世界
- 乐于并且善于与团队进行远程合作,在各种场合下卓越的沟通能力(代码、文档、即时通信工具、音视频会议、线下会议等等)
- 精通 Golang 、同时熟悉至少另外一种系统编程语言
- 精通 MPI ( https://www.open-mpi.org/ 、PyTorch Distributed ( https://pytorch.org/tutorials/beginner/dist_overview.html )等并行计算框架
- 精通 Kubernetes 资源调度机制,熟悉开源第三方调度系统,如 Volcano ( https://volcano.sh/zh/)
- 熟悉 Kubeflow ( https://www.kubeflow.org/)、MLFlowhttps://mlflow.org/) 或其他一种云原生机器学习平台
- 熟悉容器、云原生等基本技术概念,熟悉 Docker 、Kubernetes ;特别是 Kubernetes 扩展机制:CRD 、Operator 、Scheduler 等
- 熟悉 PyTorch DeepSpeed Megatron-LM 等相关框架
- 熟悉 Linux 开发环境、熟练使用 Git Shell GitHub 等等软件开发工具
岗位职责
- 研发基于 K8s 的云原生大模型训推平台,基于 K8s 扩展机制的资源调度系统、任务管理系统,支持大模型训练、推理任务( PyTorch 、DeepSpeed 、Megatron-LM )的编排、管理;
- 参与大模型训练、推理应用的开发;
- 参与私有化部署客户现场交付,根据用户需求、IT 资产具体情况,制定可靠、高效的交付部署方案;
- 参与线上系统、私有化部署系统的支持,持续迭代优化系统稳定性、可靠性、性能等;
- 参与制定公司整体软件工程规范,持续迭代优化公司软件工程质量、提升工程团队研发效能、提升产品服务质量;
薪酬待遇
- 30-50K x 12 薪
- 丰厚期权
工作地点
- 北京、上海、苏州、或远程
联系人
- 巩女士,Email: jobs@sxwl.ai ,手机:15910555162 (微信同手机号)-
1193 次点击
所在节点    酷工作
2 条回复
howfree
355 天前
要求对我来说有点高,我再努力努力
xuzhzzz
355 天前
主要没有 AI 大模型相关的经验

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/997768

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX