能力要求
- 计算机及计算机相关专业本科或以上学历
- 熟悉计算机科学基本知识:分布式系统原理、计算机网络、数据结构和算法
- 熟悉 Linux 开发环境、公有云、容器、云原生等基本技术概念
- 精通 Docker 、Kubernetes 等
- 精通 Kubernetes 扩展机制:CRD 、Operator 、Scheduler 等
- 精通 Golang
- 熟悉 Kubeflow 或其他机器学习平台
- 熟悉 Python 等其他编程语言
- 了解 PyTorch DeepSpeed 等相关框架
岗位职责
- 参与设计、开发基于 K8s 的云原生深度学习训练平台
- 设计、实现 K8s 扩展机制支持深度学习计算任务( PyTorch 、DeepSpeed )的创建、编排、管理
- 编写部署和运维软件工具和脚本
公司:算想未来(北京)科技有限责任公司
HR:15910555162 (同微信)