V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
daya0576
V2EX  ›  酷工作

[蚂蚁金服] [上海/杭州] Java 开发 # SRE # aiops

  •  
  •   daya0576 · 2019-03-14 21:08:30 +08:00 · 1305 次点击
    这是一个创建于 1840 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我来自蚂蚁金服国际的 SRE 团队,主要职责一方面保证国际业务的稳定性, 另一方面目标是期望利用数据分析,机器学习等来实现告警智能降噪,问题定位及自愈。

    wechat: echo ZGF5YTA1NzY= | base64 -D


    职位描述:
    1、 负责蚂蚁金服所有应用的故障发现、故障应急、演练等技术风险领域的功能研发;
    2、 负责蚂蚁金服所有变更的技术风险,对所有技术风险故障负责;
    3、 参与蚂蚁金服重大项目(比如双 11,双 12 )和产品的设计过程,对技术风险领域进行评审和分析;
    4、 负责技术风险平台应用架构设计和系统实施,使系统体系化并具有前瞻性,能快速发现业务风险和及时管控;独立完成大型项目的系统分析设计,并负责核心模块研发; 负责完成系统 Code Review 的任务,确保相关代码的有效性和正确性,并能够通过 Code Review 提供相关性能以及安全的建议;
    5、参与智能化系统建设,提供工程保证,并可以对具体算法提供建议;
    6、对业界在机器学习和数据挖掘等领域有一定预判,促进团队在数据收集的基础上,落实数据智能化分析;

    职位要求:
    • 3 年以上的大规模集群实战运维经验,熟悉软件开发和系统架构;
    • 系统工程能力扎实过硬,深入了解系统( linux )及上下游链路服务(网络 /io 等),具有很强技术敏感度和故障排查经验,并能进行技术方案的整合;
    • 熟悉服务管理、单元部署、自动扩容等运维系统建设,对成本控制和效能提升有深刻的理解和实践;
    • 具有良好的团队协作、沟通能力,乐于分享,良好的客户服务意识;
    • 掌握至少一门编程语言,具备 PYTHON/GO/JAVA 能力 ,有一定的运维系统建设项目经验,具有开源项目开发经验者优先;
    • 具有 AWS、Google Cloud Platform 使用经验者优先;
    • 具有 hadoop/spark/Flink/storm/elasticsearch/kafka 等分布式计算系统及消息队列系统开发 /运维经验者优先 ;
    • 良好的外语沟通能力,具备海外工作经验者优先。

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   4537 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 10:06 · PVG 18:06 · LAX 03:06 · JFK 06:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.