通过存储集群上的安全头节点进行 Rsync

Question 1

只需通过 NFS 或类似方式在头节点上安装后端存储即可。几乎每个 HPC 集群都这样做。

Answer

只需通过 NFS 或类似方式在头节点上安装后端存储即可。几乎每个 HPC 集群都这样做。

Question 2

您可以通过其他 SSH 连接建立 SSH 连接隧道，以获得看起来像从 LAN 计算机到后端的连接（无论如何对 rsync 来说）。不幸的是，这确实需要在客户端进行配置。最简单的方法是将以下内容添加到客户端的 ssh cofig 文件中：

Host storagebackend
    ProxyCommand ssh -e none user@headnode exec nc %h %p 2>/dev/null

（注意：假设 netcat 安装nc在头节点上。如果没有，则需要安装它或调整命令。）

然后使用 rsync 从客户端“直接”同步到存储后端。请注意，您需要进行两次身份验证，首先是向头节点进行身份验证，然后是向后端进行身份验证。如果您使用公钥身份验证，则两个私钥文件都需要位于客户端计算机上。

让客户端更加透明可能比较棘手；您能详细说明一下这个需求吗？我能想到一些技巧，比如在头节点上使用 netcat 的包装脚本，并让其自动提供“真正的”后端服务器名称……

Answer

您可以通过其他 SSH 连接建立 SSH 连接隧道，以获得看起来像从 LAN 计算机到后端的连接（无论如何对 rsync 来说）。不幸的是，这确实需要在客户端进行配置。最简单的方法是将以下内容添加到客户端的 ssh cofig 文件中：

Host storagebackend
    ProxyCommand ssh -e none user@headnode exec nc %h %p 2>/dev/null

（注意：假设 netcat 安装nc在头节点上。如果没有，则需要安装它或调整命令。）

然后使用 rsync 从客户端“直接”同步到存储后端。请注意，您需要进行两次身份验证，首先是向头节点进行身份验证，然后是向后端进行身份验证。如果您使用公钥身份验证，则两个私钥文件都需要位于客户端计算机上。

让客户端更加透明可能比较棘手；您能详细说明一下这个需求吗？我能想到一些技巧，比如在头节点上使用 netcat 的包装脚本，并让其自动提供“真正的”后端服务器名称……

相关内容