怎么检测一个进程是否还正常?

2015-01-04 21:14:10 +08:00
 haython
一个命令行下运行的php脚本,或者python脚本,或者其它什么脚本吧,是常驻的,怎么能检测这个脚本是否还正常运行?碰到好几次脚本的进程还在,但是已经卡死在那里了
3937 次点击
所在节点    程序员
16 条回复
horsley
2015-01-04 22:22:09 +08:00
你常驻的脚本必然是一个无限循环,你可以在每次循环结束的时候更新一个变量,存放更新时候的时间,再想办法造一个借口把这个变量信息暴露到外面去(或者写出到一个磁盘文件),那么当你读到这个暴露的信息,发现这个时间距离现在已经超过很多次循环应该用掉的时间,例如循环是一分钟一次的任务,但是上一次写入时间已经是5分钟前,认为脚本已经卡死需要重新启动
datou552211
2015-01-04 23:18:02 +08:00
我一般加一个HTTP服务,访问一下,返回简单的信息。tcp也行
NewYear
2015-01-04 23:18:50 +08:00
是windows还是非windows

windows有系统api可以查询窗口是不是没有响应状态
user32.dll里的IsHungAppWindow(句柄)[返回0,窗口正常,返回1,窗口没有响应]
standin000
2015-01-04 23:19:48 +08:00
linux 下进程有个zombie状态,处于这个状态基本是卡死了。
lululau
2015-01-04 23:21:43 +08:00
写日志
haython
2015-01-04 23:24:39 +08:00
@horsley 感觉不是特别的“优雅”
haython
2015-01-04 23:25:19 +08:00
@datou552211 还得维护http服务
haython
2015-01-04 23:26:11 +08:00
@NewYear 我用的是linux,不过感觉windows这个挺不错的
hahastudio
2015-01-04 23:40:17 +08:00
观测一个 while True 的程序,无非就是:
1. 让它自己报告状态,那么日志的方式是最常用的,因为你可以自定义汇报等级,信息细度
2. 你自己问它的状态,那么你就需要额外一个服务提供询问的操作,这个服务必须简单,简单到不会出错,不然你看不到结果,不知道是业务部分挂了,还是询问部分挂了

我个人推荐日志
bombless
2015-01-04 23:46:49 +08:00
看io吧,卡死的程序经常就没有io了。
一部分程序跑进一个死循环或者开始了一个很长的计算结果占满了一个核经常也是不良情况的兆头。
9hills
2015-01-05 00:01:43 +08:00
你的脚本不打日志么?
RemRain
2015-01-05 00:12:00 +08:00
@horsley 的方案最靠谱,隔一段时间输出点东西,或者往外写点东西,证明自己还活着。类似 linux 下的看门狗,如果一段时间不喂狗,系统自动重启。

@standin000 zombie 不叫卡死,zombie 是进程已经结束了,但父进程还没给他收尸。
GhostFlying
2015-01-05 00:20:33 +08:00
第一反应就是 watchdog,写文件或者什么都可以
haython
2015-01-05 00:22:38 +08:00
@9hills 只有屏幕输出和错误的日志存储到Mongo
9hills
2015-01-05 09:55:20 +08:00
@haython 这个设计不好,本地日志也是要打的,另外周期性的日志也是要的。不是不优雅,这是最简单的办法
standin000
2015-01-06 09:12:00 +08:00
@RemRain 我的经验是父进程很少收尸,只得靠自己。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/159189

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX