rancher pod 不定期自动重启, exitCode 137 Error,怎么排查?

2023-06-26 15:46:11 +08:00
 lawsiki
pod 运行的是 Java 服务,目前一天大概重启了两三次,时间不固定,找不到原因,求大佬们解惑

jvm 参数为:-Xms1024m -Xmx3072m -XX:+HeapDumpOnOutOfMemoryError

![]( )
pod 的配额限制

![]( )
pod 重启信息(时区有问题,实际时间+8 小时)

![]( )
宿主机 /var/log/message 信息

查看了重启前的 pod 日志,没有打印异常信息,直接被中断了

看了下宿主机的日志只有一句“failed to exit within 30 seconds of signal 15 - using the force”
514 次点击
所在节点    问与答
2 条回复
zhpitt
2023-06-28 11:17:18 +08:00
之前类似的情况用虚拟机跑的程序,是程序中调用了 random 随机数导致的 可以从这个方向排查下
lawsiki
2023-06-28 21:21:46 +08:00
@zhpitt 感谢回复,不过应该不是这个原因导致的,最近一段时间都没有涉及到随机数的需求

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/951801

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX