我遇到了备份磁盘不属于 RAID 或类似磁盘的问题(因此如果磁盘坏了,RAID 控制器不会发出通知)。有时磁盘会完全坏掉,只剩下挂载点,如果您尝试使用 cd 进入该挂载点,则无法访问该挂载点。
如果磁盘坏了,我有什么办法可以监控/收到警报吗?我可以使用 zabbix,并且找到了一些可以使用的智能脚本,但我不确定这是否会起作用,因为磁盘坏了时没有/dev/sdb
或/dev/sda
无法使用智能脚本。
如果有人有脚本可以分享或者有想法,我将不胜感激。
答案1
/var/log/syslog
应该包含一些与设备断开连接相关的信息;即使没有构建像 ELK(ElasticSearch、Logstash、Kibana)这样的堆栈来分析日志,你也应该能够使用以下工具捕获此类事件秒。
答案2
我写了一个nagios 插件您可能能够适应 Zabbix。当我们的一堆 Linux 服务器由于随机磁盘错误而变为只读时,我写了它。它帮助我们尽早发现问题,并且代码可以测试写入文件,但我们禁用了它,以便检查可以以非 的形式运行root
。