最近更新我的 ubuntu 20.04 服务器后,我的网站开始出现故障。
更新前,它会在不到一秒的时间内做出响应。
更新后,它会在几分钟内做出响应。
经过一番研究,我发现用于在两个应用服务器之间共享网站的 NFS 客户端的网络使用率非常高。客户端陷入 iowait 状态,这是导致 Web 服务器故障的原因。
我的监控图表显示,更新时每个客户端的网络利用率增加了两倍。
我一直努力尝试去了解哪些配置可能是解决过度网络使用所必需的,但无济于事。
这是我的出口示例:
/volume/exports/html *(rw,async,no_subtree_check,no_root_squash)
以及我当前的客户端 fstab:
10.x.x.x:/volume/exports/html /var/www/html nfs4 fsc,noatime,vers=4.2,nodev,nosuid,tcp,hard,intr,async 0 0
=====
nfsstat 显示约 25% 的调用是访问,25% 是 getattr,25% 是序列,25% 是 putfh。
运行 tcpdump 没有帮助,因为流量大约为 35mb/s 并且我没有看到任何明显的访问模式。
答案1
检查您是否没有使用破坏 nfs 内核模块的最新内核:https://bugs.launchpad.net/ubuntu/+source/linux/+bug/2009325