我有一台运行 Ubuntu Server 14.04 的服务器,几个月来一直使用 rsnapshot 定期备份到 NFS 挂载的 NAS,没有任何问题。上周我们在交换机上添加了几台机器,开始出现备份和 NFS 挂载问题。
Rsnapshot 将运行其 rsync 命令,该命令将正常运行一两个小时,然后似乎停止执行任何操作。rsync 命令将显示为top
处于“不可中断的睡眠”状态 ( 31948 root 25 5 79640 56328 452 D 0.0 0.1 15:13.86 /usr/bin/rsync -a --delete --numeric-ids --relative --delete-excluded --exclude-from=/etc/rsnapshot.excludefile /home /mnt/.private/backup/daily.0/localhost/
)。
一旦发生这种情况,我就无法再查看 NFS 挂载。如果我尝试 ls 该目录,ls 命令将冻结,除非我找到该 ls 命令的 PID 并将其终止,否则服务器上的负载将急剧上升。
到了这个阶段之后,我唯一能重新回到 NFS 挂载的方法就是物理重启 NAS 盒。
有什么想法吗?感谢您提供意见!
答案1
我最终解决了这个问题。事实证明,向交换机添加新机器与此无关。在我们添加这些机器的同一天,其中一位用户创建了一个大文件(约 260GB)。NFS 无法复制该文件。我的解决方案是--max-size=100G
在 rsnapshot 中添加 rsync 命令。这意味着一个大文件没有得到备份,但我现在接受这一点,因为错过一个可能影响一个用户的文件比整个备份失败要好。