I/O 无法挂载 nfs（偶尔）- 服务器超时

Question 1

这不是一个真正的答案，而只是一些故障排除技巧：

确保问题与 NFS 有关，使用其他协议（例如 SMB）导出同一卷（请参阅这里了解说明）。您是否遇到了同样的错误？或者，尝试使用以下方法复制scp：
```
[nathan@ebisu ~] scp root@ark:/mnt/bigraid/backup/backup.ark/test.img .
```
这是否仅在复制单个大文件时发生，或者如果您在许多小文件中复制相同数量的数据，是否也会遇到相同的错误？
```
split test.img
rsync -a --progress x* /mnt/raid/backup/backup.extra/disk
```
根据这一页，高 retrans 值表明

服务器上可用的 NFS 内核线程数不足以处理来自此客户端的请求

因此，尝试通过设置变量来增加线程数RPCNFSDCOUNT。根据您的发行版，可以在/etc/sysconfig/nfs或中设置/etc/default/nfs-kernel-server（这就是我在 Debian 上的位置）。尝试类似
```
RPCSVCGSSDOPTS=16
```
同一页面还建议您在客户端上将块大小设置为 32。假设您正在从挂载共享/etc/fstab，请将这些选项添加到相关行：
```
rsize=32768,wsize=32768,intr,noatime
```
除了增加读/写块大小之外，这些选项还将

还确保如果出现挂起，NFS 操作可以中断，并且还将确保在远程 NFS 文件系统上访问的文件的 atime 不会不断更新。

Answer

这不是一个真正的答案，而只是一些故障排除技巧：

确保问题与 NFS 有关，使用其他协议（例如 SMB）导出同一卷（请参阅这里了解说明）。您是否遇到了同样的错误？或者，尝试使用以下方法复制scp：
```
[nathan@ebisu ~] scp root@ark:/mnt/bigraid/backup/backup.ark/test.img .
```
这是否仅在复制单个大文件时发生，或者如果您在许多小文件中复制相同数量的数据，是否也会遇到相同的错误？
```
split test.img
rsync -a --progress x* /mnt/raid/backup/backup.extra/disk
```
根据这一页，高 retrans 值表明

服务器上可用的 NFS 内核线程数不足以处理来自此客户端的请求

因此，尝试通过设置变量来增加线程数RPCNFSDCOUNT。根据您的发行版，可以在/etc/sysconfig/nfs或中设置/etc/default/nfs-kernel-server（这就是我在 Debian 上的位置）。尝试类似
```
RPCSVCGSSDOPTS=16
```
同一页面还建议您在客户端上将块大小设置为 32。假设您正在从挂载共享/etc/fstab，请将这些选项添加到相关行：
```
rsize=32768,wsize=32768,intr,noatime
```
除了增加读/写块大小之外，这些选项还将

还确保如果出现挂起，NFS 操作可以中断，并且还将确保在远程 NFS 文件系统上访问的文件的 atime 不会不断更新。

Question 2

在我看来，这很像网络问题。有些网卡（尤其是 Realtek 芯片）不太符合标准，尤其是在 1Gbps 速度下，并且中间有一个交换机。因此，您应该尝试：

无需开关即可连接两者
更换以太网电缆
强制将连接速度设置为 1000Mbps 全双工，看看问题是否仍然存在
强制将连接速度设置为 100Mbps 全双工，看看问题是否仍然存在（大多数情况下，不稳定性不会在 100Mbps 时显示，尽管这不是您想要的设置，但它会帮助您缩小不兼容性的范围）
检查ifconfig错误ethtool -S ethX
检查 MTU 的使用情况ifconfig并将其设置为1500如果更高
用于ping -f检查两者之间是否丢包，尤其是当-s(ping 数据包大小) 值较高时 - 连接不稳定将要当你运行类似程序ping -f -s 10000几秒钟时会出现数据包丢失

Answer

在我看来，这很像网络问题。有些网卡（尤其是 Realtek 芯片）不太符合标准，尤其是在 1Gbps 速度下，并且中间有一个交换机。因此，您应该尝试：

无需开关即可连接两者
更换以太网电缆
强制将连接速度设置为 1000Mbps 全双工，看看问题是否仍然存在
强制将连接速度设置为 100Mbps 全双工，看看问题是否仍然存在（大多数情况下，不稳定性不会在 100Mbps 时显示，尽管这不是您想要的设置，但它会帮助您缩小不兼容性的范围）
检查ifconfig错误ethtool -S ethX
检查 MTU 的使用情况ifconfig并将其设置为1500如果更高
用于ping -f检查两者之间是否丢包，尤其是当-s(ping 数据包大小) 值较高时 - 连接不稳定将要当你运行类似程序ping -f -s 10000几秒钟时会出现数据包丢失

Question 3

我收到了相同的错误消息（但这不是相同的问题，因为我每次都能重现该错误！）。

更详细地运行 rsync( rsync -vv) 显然目标文件系统已满！

rsync: writefd_unbuffered failed to write 4 bytes to socket [sender]: Broken pipe (32) test/file1 is uptodate test/file2 is uptodate test/file3 is uptodate rsync: recv_generator: mkdir "test/file4" failed: No space left on device (28) * Skipping any contents from this failed directory * rsync: recv_generator: mkdir "test/file5" failed: No space left on device (28) rsync: close failed on "test/file6": Input/output error (5) rsync: connection unexpectedly closed (78708 bytes received so far) [sender] rsync error: error in rsync protocol data stream (code 12) at io.c(600) [sender=3.0.6]

Answer

我收到了相同的错误消息（但这不是相同的问题，因为我每次都能重现该错误！）。

更详细地运行 rsync( rsync -vv) 显然目标文件系统已满！

rsync: writefd_unbuffered failed to write 4 bytes to socket [sender]: Broken pipe (32) test/file1 is uptodate test/file2 is uptodate test/file3 is uptodate rsync: recv_generator: mkdir "test/file4" failed: No space left on device (28) * Skipping any contents from this failed directory * rsync: recv_generator: mkdir "test/file5" failed: No space left on device (28) rsync: close failed on "test/file6": Input/output error (5) rsync: connection unexpectedly closed (78708 bytes received so far) [sender] rsync error: error in rsync protocol data stream (code 12) at io.c(600) [sender=3.0.6]

I/O 无法挂载 nfs（偶尔）- 服务器超时

答案1

答案2

答案3

相关内容