docker 不定期 down 掉问题

2021-09-08 10:06:28 +08:00
 lander
hi 各位,遇到一个诡异的问题,业务环境的 postgres docker 容器会不定期挂掉。查了半个月实在找不到排查思路了,在此请教下各位,提前谢过。
1. docker 版本:1.11.2 +devicemapper
2. var/log/messages:
Jun 15 06:43:38 xxx systemd: Stopping Docker Application Container Engine...
Jun 15 06:43:38 xxx docker: time="2021-06-15T06:43:38.108240531+08:00" level=info msg="Processing signal 'terminated'"
Jun 15 06:43:38 xxx docker: time="2021-06-15T06:43:38+08:00" level=info msg="stopping containerd after receiving terminated"
Jun 15 06:43:38 xxx docker: time="2021-06-15T06:43:38.110994105+08:00" level=error msg="failed to receive event from containerd: rpc error: code = 13 desc = \"transport is closing\""
Jun 15 06:43:38 xxx systemd: Stopped Docker Application Container Engine.
Jun 15 06:43:38 xxx systemd: Closed Docker Socket for the API.
Jun 15 06:43:38 xxx systemd: Stopping Docker Socket for the API.
Jun 15 06:43:44 xxx systemd: Starting Docker Socket for the API.
Jun 15 06:43:44 xxx systemd: Listening on Docker Socket for the API.
Jun 15 06:43:44 xxx systemd: Starting Docker Application Container Engine...
看着是被第三方什么东西给停掉了,目前服务器上安装的有青藤云的 agent 但是没开扫描,目前看着没啥证据是青藤云导致的,卸载了问题依旧
3. 检查 docker inspect 和 docker logs 日志,没啥有用的信息
4. 尝试使用 auditctl 和 stap 之类的工具尝试追踪是啥程序给停掉了,折腾了几天也没啥发现。。
1211 次点击
所在节点    问与答
5 条回复
hzfyjgw
2021-09-08 10:15:42 +08:00
AngryPanda
2021-09-08 10:16:24 +08:00
宿主机操作系统是什么?
hzfyjgw
2021-09-08 10:16:33 +08:00
尝试更新 docker 版本试试
hzfyjgw
2021-09-08 10:21:46 +08:00
@AngryPanda #2 docker 版本:1.11.2 +devicemapper 看这个驱动 应该是 Centos 的
chinvo
2021-09-08 10:23:36 +08:00
内存不够? CPU 吃紧?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/800559

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX