我的一台服务器几天就会崩溃一次。
它执行低流量静态网络服务 + 低流量动态网络服务(PHP、具有小数据的本地 MYSQL、APC、MEMCACHE)+ 一些后台作业(如 XML 文件处理)。
我唯一知道的线索是,在服务器崩溃前几个小时,它开始交换数据(见截图http://awesomescreenshot.com/075xmd24)服务器有大量可用内存。
服务器详细信息:Ubuntu 11.10 oneiric i386 scalarizr(0.7.185)python 2.7.2、chef 0.10.8、mysql 5.1.58、apache 2.2.20、php 5.3.6、memcached 1.4.7 Amazon EC2(us-west-1)
我如何检测服务器崩溃的原因?当服务器崩溃时,外界将无法再访问它。
答案1
安装后linux-crashdump
,至少您会获得崩溃前的内核日志缓冲区以及专业人员梳理问题以确定根本原因所需的所有数据。