继续从服务器因不那么明显的原因崩溃。
所发生事件的简短概述
我的服务器(运行 Debian)经常崩溃。
一切都会正常工作,直到出现明显的滞后。日志中有 oops 消息dmesg
。它们看起来并不致命,但有时服务器会变得无响应。服务器运行的节点(它是虚拟化的)的管理界面表示,在此期间(当它没有响应时)CPU 负载会失控。
所以...
我和我的朋友(维护多个服务器)交谈过,他说他也遇到了这个问题。但仅限于运行 GitLab CE 的服务器上。
我有 GitLab CE(从安装deb https://packages.gitlab.com/gitlab/gitlab-ce/debian/ jessie main
)。所以我尝试停止 GitLab 服务。
由于我停止了所有 GitLab 进程,问题就消失了。一切都运行得很好。
我做错了什么?是否有一些配置陷阱可以使我的服务器崩溃而不留下任何信息痕迹? rcu_shed 停顿消息仍然出现,但服务器不再崩溃。