我们在 RHEL 机器上运行 DB2 LUW。DB2 崩溃了,IBM 回复说 DB2 尝试访问的文件(通过 open64())已卸载或无效。
我们什么都没做,只是重启了数据库,一切似乎都运行正常。此外,有问题的文件现在看起来完全正常:
$ cd /db/log/TEAMS/tmsinst/NODE0000/TEAMS/T0000000/
$ ls -l
total 557604
-rw------- 1 tmsinst tmsinst 570425344 Jan 14 10:24 C0000000.CAT
$ file C0000000.CAT
C0000000.CAT: data
$ lsattr C0000000.CAT
------------- C0000000.CAT
$ ls -l
total 557604
-rw------- 1 tmsinst tmsinst 570425344 Jan 14 10:24 C0000000.CAT
有了这些事实(如果我误解了手头的数据,请纠正我),什么可能导致文件系统“自发卸载或在短时间内变得无效”?
我的下一步该怎么做?
这是戴尔硬件,我们运行了他们的诊断工具对该硬件进行测试,结果显示没有问题。
答案1
我猜是底层硬件问题,例如驱动器断开连接并重新连接到总线。检查/var/log/messages
(并运行dmesg
)并查找有关断开连接的异常 scsi 或 sata 消息等。