我正在使用 slurm 和 munge。除了一个节点之外,其他节点都运行正常。
但是在一个节点上,即使没有任何有效的配置,也可以通过 ssh 连接到它。
我检查了 sshd 和 system-auth 文件。它们在所有节点上完全相同。我验证了 munge 能够解码服务器和客户端上的密钥。我还检查了 auth 日志以查看是否有一些线索。但我找不到任何线索。
有人能帮忙吗
答案1
检查 sshd 的 pam 配置 (/etc/pam.d/sshd) 以及其中包含的文件。要检查用户是否在节点上运行作业并仅在这种情况下允许登录,可以使用 pam_slurm 模块(可能位于集群的其他节点上)。模块作为 contrib 分发在主目录中slurm 存储库