对于无状态的操作,怎样才可以监控操作的状态呀😱

2019-02-25 11:56:57 +08:00
 ns2250225
EX:用 Ansible 推送一个 Nginx 的配置到三台主机,推送完之后 Reload 一下,可是怎样才可以保证三台主机都 Reload 成功,如果其中一台 Reload 失败,则通知回滚(要么全部成功,要么全部失败)。有遇到过类似情况的小伙伴吗?求指导,🎄
1725 次点击
所在节点    程序员
11 条回复
rochek
2019-02-25 12:30:47 +08:00
调用一个进程,如果你去 wait 的话会有返回值的,看着个返回值就可以。
d0m2o08
2019-02-25 12:37:15 +08:00
[root@rac1 data]# nginx -s reload > /dev/null 2>&1 && echo true || echo false
false
[root@rac1 data]# vim /etc/nginx/conf.d/test.conf
[root@rac1 data]# nginx -s reload > /dev/null 2>&1 && echo true || echo false
true

是这样么
d0m2o08
2019-02-25 12:38:08 +08:00
ansible 剧本是可以判断返回值的
xiangyuecn
2019-02-25 12:45:28 +08:00
像分布式事物,复杂的一比。就算只涉及到两台机器。没接触过,搞不来,搞不好就陷入无限循环。

需要判断 成功 的 成功 是否真的 成功 (然后 成功 的 成功 真的成功 不存在!)
ns2250225
2019-02-25 12:47:34 +08:00
@xiangyuecn 😂,所以来求助呀
ns2250225
2019-02-25 12:52:58 +08:00
@d0m2o08 感谢回复啊,可是如果返回失败,回滚的时候,又要重新推配置过去,然后又要重新检查,如果失败有会进入循环,就像#4 所说的那样,😭
d0m2o08
2019-02-25 13:15:11 +08:00
@ns2250225 哈哈我没注意审题,我原来搞过用 git 更新配置文件,本地写个 shell 拉下来之后 reload,失败通过 git 回滚再 reload, 批量的肯定所有机器环境都是一样的,有某个机器失败了肯定是这个环境和其它机器不一样,再单独处理它
owenliang
2019-02-25 13:20:49 +08:00
需要把推送任务自身作为一个持久化的记录保存起来,这样才能在异常情况下重新发现&check。
real3cho
2019-02-25 14:25:01 +08:00
薛定谔的推送
ns2250225
2019-02-25 14:26:51 +08:00
@real3cho 😂
lincanbin
2019-02-25 22:38:21 +08:00
公司以前有个老同事也在用 Ansible,我记得他一个习惯就是 Ansible 跑三遍。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/538411

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX