关于基于 intel 编译编译的 openmpi4 运行多节点作业卡住咨询

2024-01-18 10:14:42 +08:00
Just4L  Just4L

请教各位大佬,最近遇到一个问题,网上资料实在太少,遂来请教。

1 、环境

2 、现象

2.1 单节点多进程

单节点运行多进程没问题

2.2 多节点多进程

程序会 hang 住,会在 complete_setup 处卡住 pFkbjxK.png

请问有没有大佬可以帮忙指点一二的

872 次点击
所在节点   程序员  程序员
2 条回复
xchaoinfo
xchaoinfo
2024-01-18 15:12:38 +08:00
测试下 ssh 免密登录是否配置好了, 记得要 ssh 包括自己在内的所有节点。
Just4L
Just4L
2024-01-18 15:17:03 +08:00
@xchaoinfo #1 你好,ssh 免密登陆都做好了,包括自己和其他节点。
就是同样配置,设置。非 intel 编译的 openmpi 运行就没有问题。intel 编译的就会遇到,所以想问下是不是 intel 编译 openmpi 的时候有些什么特殊设置来着

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1009572

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX