这是一个创建于 405 天前的主题,其中的信息可能已经有所发展或是发生改变。
薪酬待遇
工作地点
工作亮点
- 背靠 Google 等世界顶级研发团队工程经验;
- 目标远大:为中国大模型和 AGI 提供高性价比算力;
- 与业界顶尖研发团队定时交流、探索前沿技术;
关键词
- 大模型、AIGC 、Kubeflow 、Kubernetes 、Golang
能力要求
- 计算机及计算机相关专业本科或以上学历,熟悉计算机科学基本知识:分布式系统原理、计算机网络、数据结构和算法
- 精通 Golang
- 精通 Kubeflow 、Volcano ( https://volcano.sh/zh/) 或其他一种云原生机器学习平台
- 精通 Docker 、Kubernetes ;及 Kubernetes 扩展机制:CRD 、Operator 、Scheduler 等
- 熟悉 Linux 开发环境、容器、云原生等基本技术概念
- 熟悉 PyTorch DeepSpeed Megtron-LM 等相关框架
- 熟悉 Python
岗位职责
- 研发基于 K8s 的云原生大模型训练平台
- 设计、实现 K8s 扩展机制支持大模型训练任务( PyTorch 、DeepSpeed 、Megtron-LM )的编排、管理
- 编写部署和运维软件工具和脚本
联系人