我的服务器的电源按钮有问题,经常自动重启。通常都会有警告信号,比如 /var/log 中的 acpid 日志文件开始发送垃圾信息,持续大约 10 小时左右。
有没有一种简单的方法可以让我监视 acpid 日志并在有新活动时通过电子邮件通知我?
我不认为自己非常先进,所以任何你能提供的关于完成这类事情的“指南”都会非常有帮助,非常感谢。谢谢!
答案1
你可以使用类似日志监测. 甚至像这样的简单脚本(它是伪代码,您需要根据您的环境对其进行修改):
#!/bin/bash
GREP_STRING=`grep -c <error string> <acpid log location>`
if [ $GREP_STRING -ne 0 ]
then
<send email notification>
fi
将其放入 cron 中,每小时左右运行一次,当出现异常时,您就会收到一封电子邮件,通知您。
答案2
您可以使用操作系统安全评估中心HIDS 在日志文件上设置规则,同时从您的主机获取安全信息。
设置非常简单:
- 下载来源
- 解压并运行 ./install.sh
- 选择本地安装
- 回答问题(电子邮件、支票等)
/var/ossec/rules/local_rules.xml
按以下指定进行编辑- 使用以下命令启动 OSSEC
/var/ossec/bin/ossec-control start
本地规则.xml
<group name="local,syslog,">
<rule id="100001" level="13">
<regex>^.*Your string.*$</regex>
<description>I've just picked up a fault in the AE35 unit. It's going to go 100% failure in 72 hours</description>
</rule>
</group>
规则可以非常灵活和复杂。请参阅这张桌子了解规则中涉及的参数。
如果您不想要或不需要其他安全功能,您可以通过删除标签include
下的线条来停用它们rules
。
答案3
我会建议纳吉奥斯这是我工作的地方运行的程序,用于监控网络上的多台机器。它非常好用,我还没有专门用它来做你正在做的事情,但你当然可以设置它在发生错误时给你发送电子邮件。
这里有一份在 Ubuntu 上安装它的指南http://beginlinux.com/blog/2008/11/install-nagios-3-on-ubuntu-810/还有一个用于安装http://www.debianhelp.co.uk/nagiosinstall.htm。
答案4
我在用着扎比克斯使用 IPMI 工具按需重启故障服务器。另外,我认为操作系统安全评估中心也是一个不错的选择,但是在投入生产之前你确实需要进行实验和调试......