Rackspace Linux 服务器崩溃

Rackspace Linux 服务器崩溃

我最近将个人使用的裸机服务器迁移到了云端,我非常高兴。除了一件事:我的服务器大约每周崩溃一次

Rackspace 非常棒,非常有帮助,我希望继续使用他们的服务并向其他人推荐他们。但对于这个问题,我被告知服务器只是内存不足,我需要调查一下。虽然我对此没有意见,而且这似乎是我的问题,但我从未听说过 Linux 机器因内存不足而崩溃。根据我的经验,最坏的情况是,它会运行得非常慢,或者内核会开始终止进程​​。

一些细节:

  • 运行 Gentoo Linux(最新)
  • 512MB RAM,1G交换空间
  • 已安装并正在运行的服务:
    • 2 个 Apache 2 procs(1 个最少,用于提供静态/缓存资源和代理;第二个有 cgi、mod_perl 和 mod_jk)
    • 2 个 Tomcat 实例(1 个有我制作的 2 个应用程序,另一个仅用于 Nexus)
    • MySQL
  • 当崩溃发生时:
    • 服务器可以 ping 通
    • ssh 连接无限期挂起
    • 控制台将允许输入用户名但从不出现密码提示。60 秒后它会超时并且我会收到另一个登录提示。重复。
    • 无法联系服务(http、tomcat、mysql);连接将挂起并且不会报告 404、找不到服务器等。
    • 软启动不起作用,硬启动需要多次执行(即使重启尝试之间等待 30 分钟)

多年来,我一直在服务器上运行同样的设置,但只有 256MB RAM。唯一的区别是我在虚拟机上。

我的问题可以表现为以下两种形式:有谁遇到过与 Rackspace 云或其他云主机类似的问题吗?(如果是,解决方案是什么?)或;有什么好方法可以追踪我的问题?我设置了一个 cron,每分钟输出uptime一次并发free送到一个文件,以便我可以在下次崩溃后检查它,但这似乎很不安全。

全面披露:我是一名职业软件开发人员,所以我的大部分经验都来自软件开发人员,但我有大约 15 年在个人和专业用途上使用 Linux 桌面和服务器的经验。

答案1

跟踪内存使用情况的另一种好方法是安装sar在 Linux 机器上。如果您使用的是 Debian,它可以列为sysstat。使用sar -r将为您提供内存和网络统计信息中发生的情况。

相关内容