Ubuntu 频繁崩溃

Ubuntu 频繁崩溃

我运行的是 Ubuntu-14.04 x64 最小版。它有 64GB RAM、Hexa Core(3.2ghz)和一些其他统计数据,对于我目前的使用情况来说,它们相当强大(我认为)。系统运行 mysql 服务器和带有 php5 的 apache2。我的网站每天的浏览量约为 10-20k。但正如我提到的,服务器相当强大,所以我没有遇到任何性能问题。

问题是它有时会关闭。kern.log我找不到任何有用的信息,所以我需要知道我可以检查哪些日志以获取更多信息。或者任何其他提示什么可能导致服务器关闭。这是一个真正的关机,而不是重启顺便提一句。

hid-generic 0003:0557:2221.0002: can't reset device, 0000:00:1a.0-1.6/input1, status -110

这是我从 kern.log 获得的唯一消息,我知道它告诉了我一些有关 hid 的信息,它实际上不应该连接到服务器,因为服务器是租用的。

更新 目前它每 3 周关闭一次。不是每天。

更新 内核消息导致

lsusb -t

/:  Bus 01.Port 1: Dev 1, Class=root_hub, Driver=ehci-pci/2p, 480M
|__ Port 1: Dev 2, If 0, Class=Hub, Driver=hub/6p, 480M
    |__ Port 6: Dev 3, If 0, Class=Human Interface Device, Driver=usbhid, 12M
    |__ Port 6: Dev 3, If 1, Class=Human Interface Device, Driver=usbhid, 12M

发现lsusb -v 第一个是鼠标,第二个是键盘。

更新刚才我也遇到了这个错误

perf samples too long (2510 > 2500), lowering kernel.perf_event_max_sample_rate to 50000

答案1

我建议关闭 acpi 以排除错误传感器或基于条件的关机,如果您禁用 acpi,那么唯一的其他方法就是通过脚本或某人远程输入关机命令。

最好调整你的 grub — — 当新的内核出现时,你不必不断地更改它。

sudo nano /etc/default/grub

改变路线

GRUB_CMDLINE_LINUX=""

阅读类似

GRUB_CMDLINE_LINUX="noapic"

或者

GRUB_CMDLINE_LINUX="acpi=off"

然后保存

sudo update-grub

完成。

但是,作为系统管理员,我会告诉你,如果你真的想提供网页服务,那就买一台装有 Debian 的专用服务器。现在它们很便宜。你可以每月花 40 美元获得 100MBPS 不限流量的线路。ISP配置是一个免费的控制面板,具有您可能需要的所有功能。

答案2

我有一些 IT 服务器管理经验,64 GB 的 RAM 听起来像是你的问题的根源,这种配置为硬件故障留下了很多可能性,从你的描述来看,听起来你的一个内存条变热了,它发生了故障,导致系统关闭以防止损坏,现在是夏天,我会在这里尝试一个排除法解决方案,从只使用 x4 内存条配置开始,你可能有 x4 16GB 内存条,其中一个可能有故障,隔离它们以查看哪一个坏了,其次,你知道 Ubuntu 有其操作系统的服务器版本,为什么你要运行带有服务器应用程序的桌面操作系统最低版本?安装 Ubuntu 服务器操作系统,vervid monkey 64 位服务器可用,它可能有处理 64gb 内存配置的例程,如果这两个修复没有改变任何行为,那么你就知道它不是操作系统或内存条的问题..排除法,不是那样的,所以一定是那样的......

答案3

也许您需要收集更多信息 - 如果上面提到的 memtestx86+ 没有发现内存问题 - 那么应该可以发现其他一些提示。

我们使用 kibana 将日志文件收集到中央服务器上以供进一步调查:

https://www.elastic.co/products/kibana

这可能是发现问题的一种方法......

相关内容