NFSv3 与 NFSv4 性能下降

Question

... 25000 个小文件

我的第一个倾向是一般系统开销和文件系统 I/O，尽管它不是磁盘I/O 因为您是从 tmpfs 运行，所以是导致可变性的罪魁祸首，也可能与 kerberos 安全设置一起......从来没有人说过，增加安全性可以提高性能。

但，除非你运行实时内核为了排除变异性，您会看到一些变异性。然后得出结论，因为 NFS v3 与 v4 或任何其他 NFS 参数可能大多不正确，您将追寻自己的尾巴。

你没有提到许多其他重要的事情 -

您是系统上唯一的另一个人吗（nfs 服务器和 nfs 客户端）
是否有任何其他网络负载；
涉及的网络布局和硬件以及是否有可能产生影响？您设置网络并完全控制交换机/路由器，或者这一切都是由您从未见过的人设置和管理的

我对 debian 不熟悉，但是在 RHEL 中有调谐默认配置文件是吞吐量性能其中 * 广泛适用的调整，可在各种常见服务器工作负载中提供出色的性能。* 其他可能有益的配置文件是延迟性能,网络延迟，或者网络吞吐量。这是我能告诉你的最好的信息，你需要对其进行更多研究：https://www.redhat.com/sysadmin/linux-tuned-tuning-profiles

https://www.redhat.com/sysadmin/linux-tuned-tuning-profiles

你说25,000 个文件，每个文件小于 10kb。总共大约 250MB，在我看来，用作参考太少了，除非您的两个系统在硬件上相同，在操作系统设置和配置上也相同，唯一的变量是 NFS v3 与 v4.0/4.1/4.2，否则您将用数字追你的尾巴。

无论如何，我试图了解挂载协议的 NFS v3 与 v4.0/4.1/4.2 以及 udp 与 tcp 之间是否存在性能差异。在相同的服务器上使用 RHEL 8.8，具有 Xeon 24 核 cpu 和 768GB 的 RAM，通过test.tar复制一个大小约为 25GB的文件rsync -P来显示速度，并使用它tmpfs来帮助排除磁盘 I/O，我没有看到性能上的差异，这是超过 100gbps 的 InfiniBand，使用 Mellanox 交换机，只有我在实验室环境中的服务器和网络上。在复制几分钟后，所有不同的 NFS 参数都能达到观察到的最大值约 490 MB/s，平均约 470 MB/s - 有趣的是，重新启动后，第一次复制可以达到速度慢至 340 MB/s，但进行后续复制时，我最终会达到 490 MB/s 的峰值。这就是我愿意花时间来了解我是否应该在集群设置中使用带有 UDP 的 NFS v3 与 v4.2 和 TCP 的情况；我确实发现proto=rdma我的一个文件副本的速度比 TCP 提高了 5% 到 15%；所以proto=rdma是最好的。在 1gbps 网络上，我发现的所有内容都在 nfs 服务器端async，而不是sync导致任何显着的速度提高，在 infiniband 上它没有影响。您的 NFS 参数的某些组合是否会导致 NFS v4.2 比 v3 慢，我可能不知道。但要问NFS v4.2 比 v3 慢吗 根据我试图理解的内容，我会说不，并且根据 v3 的 nfs v.2 的改进记录，它应该会更好。pnfsnfs v4也支持。

我还发现 RHEL 7.9 和 8.8 在 infiniband 和 NFS 方面存在显着的速度差异； RHEL 8.8 中的ascp将达到 1.0 GB/秒，而 RHEL 7.9 中则低于 600 MB/秒，NFS 中也存在类似差异，其中 RHEL 8.8 更好，与rhel8.8nfs-utils-1.3相比。nfs-utils-2.whatever我不知道 debian、书呆子还是 Bullseye，如果您运行的操作系统和最新的 NFS 版本不同……在我看来，所有这些都很重要。 我希望看到更多发布的 NFS v4.2 性能数据，作为管理员应该期望看到的数据，以了解配置是否正确或是否存在问题。

NFS 速度测试第一步的建议：

制作一个test.tar文件；对于 1gbps 网络，我会将其设置为 2 到 10 GB 之间的任何位置
- dd if=dev/zero of=test.tar bs=10G count=1
- du -sh test.tar
用于rsync -P <source> <destination>将 `test.tar 复制到 nfs_server 和 nfs_client 或从 nfs_server 和 nfs_client 复制
- 观察报告的最大速度
- 完成后观察平均报告速度
- 观察第二次和后续调用，因为第一次可能是与 NFS 无关的首次开销；您必须进行 3 次或更多后续尝试以确保时代的发展。
mount -t tmpfs -o size=100G tmpfs /scratch在 nfs_server 和 nfs_client 上执行 a 操作，并test.tar在向每个系统复制或从每个系统复制时将其定位到那里，以帮助排除磁盘 I/O。相应地调整大小，我假设使用具有 128GB 以上 RAM 的服务器。你显然希望这个 tmpfs 比你的大test.tar。
exportfs -s在服务器端注意同步或异步等导出选项
mount在客户端注意挂载选项，例如 nfsvers和proto和mountprotoofudp|tcp|rdma
注意一个scp 安全副本作为健全性检查，在两个系统之间通过 ssh 进行传输，在 1gbps 网络上，传输速度应约为 112 MB/秒，如果不是，并且明显低于约 105 MB/秒，则不会因其他原因而减慢速度，因此不要期望 NFS 能够以 100% 的速度运行。 10gb test.tar 以 112 MB/秒的速度运行应该需要 89 秒。我也通过 samba 复制到 Windows 10 电脑上看到了这一点。
所有这些都是为了让同类之间的比较变得简单，从这里开始，第 2 步将安排一个场景，其中您有许多较大的文件与许多较小的文件。

Answer 1

... 25000 个小文件

我的第一个倾向是一般系统开销和文件系统 I/O，尽管它不是磁盘I/O 因为您是从 tmpfs 运行，所以是导致可变性的罪魁祸首，也可能与 kerberos 安全设置一起......从来没有人说过，增加安全性可以提高性能。

但，除非你运行实时内核为了排除变异性，您会看到一些变异性。然后得出结论，因为 NFS v3 与 v4 或任何其他 NFS 参数可能大多不正确，您将追寻自己的尾巴。

你没有提到许多其他重要的事情 -

您是系统上唯一的另一个人吗（nfs 服务器和 nfs 客户端）
是否有任何其他网络负载；
涉及的网络布局和硬件以及是否有可能产生影响？您设置网络并完全控制交换机/路由器，或者这一切都是由您从未见过的人设置和管理的

我对 debian 不熟悉，但是在 RHEL 中有调谐默认配置文件是吞吐量性能其中 * 广泛适用的调整，可在各种常见服务器工作负载中提供出色的性能。* 其他可能有益的配置文件是延迟性能,网络延迟，或者网络吞吐量。这是我能告诉你的最好的信息，你需要对其进行更多研究：https://www.redhat.com/sysadmin/linux-tuned-tuning-profiles

https://www.redhat.com/sysadmin/linux-tuned-tuning-profiles

你说25,000 个文件，每个文件小于 10kb。总共大约 250MB，在我看来，用作参考太少了，除非您的两个系统在硬件上相同，在操作系统设置和配置上也相同，唯一的变量是 NFS v3 与 v4.0/4.1/4.2，否则您将用数字追你的尾巴。

无论如何，我试图了解挂载协议的 NFS v3 与 v4.0/4.1/4.2 以及 udp 与 tcp 之间是否存在性能差异。在相同的服务器上使用 RHEL 8.8，具有 Xeon 24 核 cpu 和 768GB 的 RAM，通过test.tar复制一个大小约为 25GB的文件rsync -P来显示速度，并使用它tmpfs来帮助排除磁盘 I/O，我没有看到性能上的差异，这是超过 100gbps 的 InfiniBand，使用 Mellanox 交换机，只有我在实验室环境中的服务器和网络上。在复制几分钟后，所有不同的 NFS 参数都能达到观察到的最大值约 490 MB/s，平均约 470 MB/s - 有趣的是，重新启动后，第一次复制可以达到速度慢至 340 MB/s，但进行后续复制时，我最终会达到 490 MB/s 的峰值。这就是我愿意花时间来了解我是否应该在集群设置中使用带有 UDP 的 NFS v3 与 v4.2 和 TCP 的情况；我确实发现proto=rdma我的一个文件副本的速度比 TCP 提高了 5% 到 15%；所以proto=rdma是最好的。在 1gbps 网络上，我发现的所有内容都在 nfs 服务器端async，而不是sync导致任何显着的速度提高，在 infiniband 上它没有影响。您的 NFS 参数的某些组合是否会导致 NFS v4.2 比 v3 慢，我可能不知道。但要问NFS v4.2 比 v3 慢吗 根据我试图理解的内容，我会说不，并且根据 v3 的 nfs v.2 的改进记录，它应该会更好。pnfsnfs v4也支持。

我还发现 RHEL 7.9 和 8.8 在 infiniband 和 NFS 方面存在显着的速度差异； RHEL 8.8 中的ascp将达到 1.0 GB/秒，而 RHEL 7.9 中则低于 600 MB/秒，NFS 中也存在类似差异，其中 RHEL 8.8 更好，与rhel8.8nfs-utils-1.3相比。nfs-utils-2.whatever我不知道 debian、书呆子还是 Bullseye，如果您运行的操作系统和最新的 NFS 版本不同……在我看来，所有这些都很重要。 我希望看到更多发布的 NFS v4.2 性能数据，作为管理员应该期望看到的数据，以了解配置是否正确或是否存在问题。

NFS 速度测试第一步的建议：

制作一个test.tar文件；对于 1gbps 网络，我会将其设置为 2 到 10 GB 之间的任何位置
- dd if=dev/zero of=test.tar bs=10G count=1
- du -sh test.tar
用于rsync -P <source> <destination>将 `test.tar 复制到 nfs_server 和 nfs_client 或从 nfs_server 和 nfs_client 复制
- 观察报告的最大速度
- 完成后观察平均报告速度
- 观察第二次和后续调用，因为第一次可能是与 NFS 无关的首次开销；您必须进行 3 次或更多后续尝试以确保时代的发展。
mount -t tmpfs -o size=100G tmpfs /scratch在 nfs_server 和 nfs_client 上执行 a 操作，并test.tar在向每个系统复制或从每个系统复制时将其定位到那里，以帮助排除磁盘 I/O。相应地调整大小，我假设使用具有 128GB 以上 RAM 的服务器。你显然希望这个 tmpfs 比你的大test.tar。
exportfs -s在服务器端注意同步或异步等导出选项
mount在客户端注意挂载选项，例如 nfsvers和proto和mountprotoofudp|tcp|rdma
注意一个scp 安全副本作为健全性检查，在两个系统之间通过 ssh 进行传输，在 1gbps 网络上，传输速度应约为 112 MB/秒，如果不是，并且明显低于约 105 MB/秒，则不会因其他原因而减慢速度，因此不要期望 NFS 能够以 100% 的速度运行。 10gb test.tar 以 112 MB/秒的速度运行应该需要 89 秒。我也通过 samba 复制到 Windows 10 电脑上看到了这一点。
所有这些都是为了让同类之间的比较变得简单，从这里开始，第 2 步将安排一个场景，其中您有许多较大的文件与许多较小的文件。

NFSv3 与 NFSv4 性能下降

服务器

使用 NFSv3 的客户端 1

使用 NFSv4.2 的客户端2

编辑：9月10日 11:53

编辑：9月11日 9:33

编辑：9月11日18:29（回应@ron的回答）

9月12日10:55（测试结果）

亲切的问候

答案1

相关内容