我有几个 Centos Linux 服务器,它们有一个非常简单的任务,它们为 php 运行 nginx + fastcgi,并且在它们之间挂载了一些 NFS,只读
他们有一些 RPC 命令来从主服务器使用 wget 启动一些下载进程,没什么特别的,但是它们的行为非常不稳定,它们只是关闭了,我们试图监控内存、处理器使用情况,甚至网络连接,它们并没有加载那么多,最大网络连接数高达……最大 250,处理器使用率为 15%,内存,嗯,甚至没有填满,2.5GB,最大 8GB,
我不知道为什么 Linux 服务器会这样瘫痪,它们甚至不是公共服务器,没有安装域名,也没有为网站提供公共服务。
我发现的唯一问题是,如果我不每隔几个小时重新启动网络服务......服务器就会变得非常慢,启动应用程序也很慢,但不会出现高资源使用率的情况......也许 Centos 不会释放超时连接,或者类似的东西......它是基于 Red Hat 的对吗?
我不是 Linux 专家,但我确信有些人可以轻松地回答这个问题,甚至能告诉我该怎么做……
我还没有安装 snort 或其他东西来查看我们是否受到了一些 DOS 攻击,但每小时重新启动网络的计划脚本应该让系统重新上线,但它却没有......
先感谢您
答案1
旧内核,ext3 遇到扩展时会出现错误。文件系统可能在某个地方损坏,偶尔会遇到这种情况,可能是在写博客时。
将 ext3tools 升级到最新版本,对文件系统进行 fsck。查看是否有比您正在运行的版本更新的内核版本。虽然 ext3 很稳定,但您可能会遇到一些针对 ext3(和 xfs)的最新补丁。
答案2
我已经派技术人员到现场,这是服务器宕机时屏幕上显示的内容(见图片链接)
http://ft.beejive.com/icq/648/480731375/img0328152705_kv044e.jpg
这很奇怪,消息中没有内核恐慌,我不知道这可能是什么
答案3
只是一个随机的想法,您可能会查看 /etc/resolv.conf 文件中的 DNS 条目和文件系统中的其他网络位置。尝试“挖掘”您的名称服务器以及路由器从中获取信息。
正如您所说,我很想研究 /etc/sysconfig/network 文件和相关位置以进行查找。
干杯!