V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
cmai

K8S 中 Java 应用的 pod 发生 OOM,大家是如何保留 dump 文件并拿下来分析呢

  •  
  •   cmai · Nov 17, 2022 · 2636 views
    This topic created in 1269 days ago, the information mentioned may be changed or developed.
    7 replies    2022-11-18 13:44:29 +08:00
    chendy
        1
    chendy  
       Nov 17, 2022   ❤️ 1
    dump 到某个 volume 里
    cmai
        2
    cmai  
    OP
       Nov 17, 2022
    @chendy 会不会多个应用出现互相覆盖 dump 文件的情况呢
    cmai
        3
    cmai  
    OP
       Nov 17, 2022
    或者 dump 到一半 pod 已经被杀死了
    mantou99
        4
    mantou99  
       Nov 17, 2022 via Android
    @cmai 会,kubernetes 的 resource limit 是管理集群分配资源的。OOM 了建议去测试环境找问题,毕竟 OOM 一般都不是突然就炸了,总有个过程
    swulling
        5
    swulling  
       Nov 17, 2022 via iPhone   ❤️ 2
    如果能稳定复现,可以在 prestop 阶段加 dump 命令。dump 到云盘或者 hostpath 。文件名可以用 hostname 拿到容器名称,加上时间戳就不会冲突

    之前参考过的一个例子
    https://gist.github.com/Pamir/79741ea098dcf473f61bcf45c3ff9b43
    swulling
        6
    swulling  
       Nov 17, 2022 via iPhone
    忘了说,这个需要配合一些 soft prevent oom 的方法。避免真的 oom 来不及 dump 。比如

    https://github.com/artsy/docker-preoomkiller
    cmai
        7
    cmai  
    OP
       Nov 18, 2022
    @swulling 多谢,我先了解一下
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2879 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 02:31 · PVG 10:31 · LAX 19:31 · JFK 22:31
    ♥ Do have faith in what you're doing.