运行带最新补丁的 Ubuntu 22.04.2。此主机是运行内核 Linux adam408 5.19.0-35-generic #36~22.04.1-Ubuntu 的 NFS 客户端
通过 25Gb 以太网与 Cisco Nexus 结构进行连接。
NFS 安装可以正常安装,但性能非常慢且不稳定。用户可以运行
/usr/bin/time -p /usr/bin/ls -l /nfsdata/dir/ | wc -l 并获得以下内容
实际 9.36 用户 0.03 系统 0.57 7127
实际时间从 1.5 秒到 10 秒或更长不等。该命令始终会完成,但需要很长时间。目录中只有 7127 个文件。
以下是挂载选项:fsserver:/nfsdata/dir on /nfsdata/dir type nfs4 (rw,relatime,vers=4.2,rsize=65536,wsize=65536,namlen=255,hard,nosharecache,proto=tcp,timeo=600,retrans=2,sec=sys,clientaddr=10.1.1.140,local_lock=none,addr=10.1.1.250)
更多背景和历史:
这发生在小型集群的所有节点上。所有节点都运行相同的操作系统内核和补丁级别。在操作系统更新之前(从 ubuntu 20.04 到 22.04.2),这不是问题。
我们尝试调整 fstab 中的各种设置,如 nordirplus、mountvers、sync 以及许多其他设置,但均无效。我们还调查了网络,主机和交换机接口现在都显示错误。Netapp NFS 服务器和主机之间的 ping 时间不到毫秒,没有数据包丢失。似乎没有其他应用程序受到影响。NetApp 是全新的,已完全修补。无论我们访问的是 NetApp NFS 服务器还是另一个 Ubuntu NFS 服务器,我们都会遇到此性能问题。主机和 NFS 服务器都在同一个子网上,因此不涉及路由。
我们已经没有什么主意了。
以前有人见过这个吗?
答案1
听起来就像发生在我们身上的事情。Ubuntu 22.04.2 上 Apache/NFS 的速度出人意料地变慢
问题与最新内核有关https://bugs.launchpad.net/ubuntu/+source/linux/+bug/2009325