这是一个创建于 1683 天前的主题,其中的信息可能已经有所发展或是发生改变。
岗位描述:
1 、负责阿里巴巴业务监控系统和应急协同平台工具的设计和开发工作;
2 、负责阿里巴巴全球运行指挥中心( GOC )的业务监控及应急值守工作(可能短期外派美国工作)
3 、负责跟研发协同平台、运维平台等阿里中台产品深度打通,在中台产品中输出 GOC 监控技术及方案;负责从机房、网络服务器、操作系统、应用、业务层面的纵向打通,为业务稳定运行提供全方面的监控服务及产品;
4 、负责阿里集团业务故障的应急响应及相应平台产品的优化改造。
岗位要求:
1 、 本科以上学历,有 3 年以上互联网行业相关工作经验,对研发 /运维 /监控至少一个领域有深入的了解及丰富的经验;
2 、 有 2~3 年互联网公司运维平台或中间件研发经验(开发语言不限);有 JAVA 后端研发经验或前端研发经验者优先;
3 、对监控理念有较深的理解,了解国内外先进的监控解决方案;有监控系统研发或运维经验,熟悉业界常用开源监控系统架构及工作原理(如 zabbix/ prometheus/open-falcon 等),能够根据不同监控问题制定相应监控解决方案;有开源监控系统二次开发经验更佳;
4 、有线上故障排查和应急处理经验者优先。
5 、对问题有清晰的分析逻辑和全局思维,能提出具有创造性的解决思路和方案,并有良好的沟通能力及团队合作意识。
PS:本岗位有机会接触阿里最前沿的 AIOps 及 ChatOps 技术,欢迎有识之士加入,共同在智能运维领域打造核心竞争力产品。