关于基于 intel 编译编译的 openmpi4 运行多节点作业卡住咨询

250 天前
 Just4L

请教各位大佬,最近遇到一个问题,网上资料实在太少,遂来请教。

1 、环境

2 、现象

2.1 单节点多进程

单节点运行多进程没问题

2.2 多节点多进程

程序会 hang 住,会在 complete_setup 处卡住

请问有没有大佬可以帮忙指点一二的

731 次点击
所在节点    程序员
2 条回复
xchaoinfo
250 天前
测试下 ssh 免密登录是否配置好了, 记得要 ssh 包括自己在内的所有节点。
Just4L
250 天前
@xchaoinfo #1 你好,ssh 免密登陆都做好了,包括自己和其他节点。
就是同样配置,设置。非 intel 编译的 openmpi 运行就没有问题。intel 编译的就会遇到,所以想问下是不是 intel 编译 openmpi 的时候有些什么特殊设置来着

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1009572

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX