我们正在尝试追踪 SUSE 12 服务器上发生的问题 - 本周两次特定的 NFS 共享被卸载,但目前我们无法确定原因。
我们的服务器...
- 几周前才安装
- 仅运行单个 SAP 实例,除了标准 SUSE 12 之外没有其他应用程序
- 操作系统中仅定义了 3 个用户 - 所有 Unix 管理员,没有最终用户
- 没有 cron 作业,只有 4 个自定义 shell 脚本(我们已经检查并给出了所有明确的信息)
- 没有 NFS 导出,没有接口进入该服务器(例如没有入站 ftp),SUSE 12 防火墙阻止除我们明确定义的端口之外的所有端口。
话虽如此,我们无法确定 2 个特定的 NFS 挂载正在卸载什么/如何卸载。
我们看过的事情...
- 系统日志中没有相关条目
- 任何用户的历史文件中都没有 umount 命令
- 卸载发生在相隔几天的不同时间
- 2 个挂载的文件系统位于同一目标服务器上,但是我们还有来自同一目标服务器的另外 2 个挂载仍然处于连接状态,因此它尚未卸载所有内容。
- 挂载的文件系统有一个由我们指定的名称 - 即它不是一个通用名称,也不是 SAP 应用程序使用/已知的文件系统
- 未配置自动卸载
- 我们的测试环境中有另一台相同的 SUSE 服务器,它从未遇到过此问题
我们可以做些什么来帮助我们捕获正在执行的 umount 命令或类似的命令,以便我们可以确定是什么导致文件系统被卸载?或者 NFS/SUSE 是否有任何原因可能会卸载这些特定的文件系统?
谢谢。
答案1
NFS 协议有一个空闲超时,超过该超时后 NFS 挂载将被卸载。
可能存在网络问题,防火墙在一段时间不活动后切断连接。尝试监控网络连接。
答案2
Suse 最终承认这是一个错误,并从 2017 年底开始将修复程序引入到稳定内核中。我们已成功将其应用到我们的环境中,自此以来尚未发现问题发生。