server-crashes

解读每天新安装的 NVMe RAID0 崩溃的 SMART 日志
server-crashes

解读每天新安装的 NVMe RAID0 崩溃的 SMART 日志

Ubuntu 20.04 系统已经稳定运行了一年,直到主板上安装了第二和第三个 NVMe 驱动器以形成 2x1TB RAID0 阵列。从那时起,这个 RAID0 阵列每天 24 小时都有大量 IO 负载,系统每天大约崩溃一次。 nvme smart-logs /dev/nvme1n1并且nvme smart-logs /dev/nvme1n2包含一些非零条目,特别num_err_log_entries是Thermal Management T1 Trans Count和Thermal Management T1 Total Time。 这 3 个条目均位于0...

Admin

Windows 2008 开始每周定期崩溃
server-crashes

Windows 2008 开始每周定期崩溃

在过去的几周里,我的服务器每周都会崩溃一次,通常是在周末,那时办公室里没有人使用服务器,而在此之前,我的服务器非常非常稳定。我一直在尝试寻找问题根源,但找不到。 检查事件查看器时,我总是一次又一次地收到相同的错误,这导致服务器中的服务停止工作,直到需要重新启动,因为几乎没有任何功能可以工作 我总是在系统部分收到以下错误 事件 ID 2019 (srv) 事件 ID 1059(DHCP 服务器) 事件 ID 1054(组策略) 事件 ID 1058(组策略) 事件 ID 7031(服务控制管理器事件日志提供程序) 事件 ID 7000(服务控制管...

Admin

监控
server-crashes

监控

我在 Ubuntu 12.04 精确服务器上运行用于网页抓取项目的 Python 脚本和 Scrapy 框架。这些脚本全天运行。 该项目处于开发/测试阶段。所以我不知道该项目的系统要求是什么。 我以 512MB RAM 和 30GB 硬盘启动它。由于硬盘空间不足,系统崩溃了。因此我必须再次设置服务器,并以 512MB RAM 和 100GB 硬盘重新启动我的项目。 由于 RAM/SWAP 容量较小,系统再次崩溃。 有没有办法检查 RAM 和硬盘? 因此,在server crash它终止所有程序并向我发送...

Admin

Server 2012 DFS 新成员问题
server-crashes

Server 2012 DFS 新成员问题

我正在尝试向我们的 DFS 拓扑添加新成员。我们有 3 个运行 Windows Server 2012 的 DC(VM - VMware),两个服务器位于主站点,第三个服务器位于我们的 DR 站点。目前,我们主站点的两台服务器正在复制 DFS(全网格),并且运行良好。 我曾多次尝试将第三个 DC 添加到我们的 DFS 拓扑中,每次我配置复制路径(例如 E:\MSI)并单击“确定”时,MMC 管理单元都会崩溃。以下是崩溃信息,知道是什么原因造成的吗?我所做的相当简单,不明白为什么会发生这种情况。 Windows 崩溃错误: gnature: Prob...

Admin

在 VirtualBox 中运行的 Linux 上的内核 oops 破坏了服务器上的一些与 IO 相关的功能
server-crashes

在 VirtualBox 中运行的 Linux 上的内核 oops 破坏了服务器上的一些与 IO 相关的功能

我们在 Windows 7 机器上的 VirtualBox 中运行 CentOS 版本 6.3 时遇到了问题。症状如下: 几个小时甚至几天内一切都正常。然后某物发生破坏系统的情况。 发生此事后我们还能做什么: 访问 Web 服务器 使用现有的 SSH 会话运行 top 和 free 什么不起作用: 启动新的 SSH 会话(输入用户名和密码后挂起) 在现有 SSH 会话中运行 ls(挂起) SSI 包括从我们的 Web 服务器获取远程机器的数据 可能更多 当发生这种情况时,我们在服务器上看到以下内容: 平均负载从基本为零上升到 3 左右...

Admin

memtest86+ 在服务器上崩溃
server-crashes

memtest86+ 在服务器上崩溃

我们有几台 DELL 1950 服务器。其中一台服务器安装了 CentOS6.3,并且会随机重启,所以我怀疑是硬件问题(没有生成日志)。其他四台服务器不会随机重启。 我们在五台服务器上运行了 memtest86+,其中三台的 memtest86+ 崩溃了(显示奇怪的彩色屏幕,就像视频卡出现故障一样)。 我测试了旧的 memtest86(不是 +),没有任何服务器崩溃。我还测试了其他 RAM 测试实用程序,没有任何工具出现故障。 你们当中有人经历过这样的事情吗? ...

Admin

Apache httpd 进程和 PHP 内存不足
server-crashes

Apache httpd 进程和 PHP 内存不足

我有一个在 centos 上运行 apache-php-mysql 的 VPS,并且安装了一个 drupal 网站。该 VPS 有 256MB 的 RAM(可能是我所有问题的根源……也许我只是需要更多)。每当我尝试同时从多个浏览器选项卡(大约 8 个……而不是 800 个)打开我的网站时,apache 就会崩溃!我的日志中有以下内容: [2012 年 10 月 24 日星期三 11:26:31] [错误] [客户端 xxx] PHP 致命错误:内存不足(已分配 28049408)(试图分配 201335 字节)位于 xxx 第 2139 行,引用者:xxx...

Admin

VMware ESXi VM 上的 Debian 版 Docker 经常崩溃
server-crashes

VMware ESXi VM 上的 Debian 版 Docker 经常崩溃

大约一个月前,我在 VMware ESXi 8.0U2 虚拟机(最新 vSphere 版本)上的 Debian 12 上安装了最新版本的 Docker。 我试图让 VNC 运行,但其他优先事项占据了上风,所以现在我只是使用 Gnome 通过 VMware 远程控制台访问 VM。 它安装了最新版本的 VMware Tools: $ sudo apt-get install open-vm-tools open-vm-tools-desktop open-vm-tools is already the newest version (2:12.2.0-1+deb...

Admin

如果单个主机的单个进程内发生错误,将会有多少个查询失败?
server-crashes

如果单个主机的单个进程内发生错误,将会有多少个查询失败?

语境: 我有一组 H 主机为 API 提供服务,其中每个主机使用 P(恒定)数量(python,但不相关)的进程(异步,但也无关紧要)为 API 提供服务。 我可以访问以下信息(以图表形式): 整个集群的平均(每秒)查询接收器数量,R(t) 平均延迟(处理请求所需的时间)L= L(t),它也随时间而变化。 平均值是秒数,涵盖所有进程/主机 主机的数量H(t),由于自动缩放,它会随着时间而变化。 可能会发生错误,导致整个进程和其中所有进程内的查询终止,但其余进程仍继续工作。 错误率(例如每个主机每天的崩溃次数)是已知且恒定的E。 问题:我想计算崩...

Admin

Digital Ocean Droplet 在调整大小后崩溃。我无法弄清楚问题所在
server-crashes

Digital Ocean Droplet 在调整大小后崩溃。我无法弄清楚问题所在

我目前在 Digital Ocean 的 Ubuntu 22.04 上运行带有 FastCGI 进程管理器 (PHP-FPM) 的 Apache2 Web 服务器。最近,我想在服务器上添加一个额外的网站。为此,我决定使用他们的 Resize 工具来升级计划。然而,调整大小后,所有服务都关闭了,让我无法通过 SSH 访问服务器。服务器已经关闭了 24 小时,我无法找出问题所在。 我只能通过他们的恢复控制台访问服务器,但选项有限,而且速度极慢。请耐心等待。 /var/log/apache2/error.log 在 Apache 错误日志中记录最后一行后,服务器关...

Admin

我的 Ubuntu 服务器崩溃了,但我不知道是什么原因导致的
server-crashes

我的 Ubuntu 服务器崩溃了,但我不知道是什么原因导致的

我的服务器出现以下错误。如果需要更多详细信息,请告诉我。 Modules linked in: xt_nat veth nft_chain_nat xt_MASQUERADE nf_nat nf_conntrack_netlink xfrm_user xfrm_algo br_netfilter bridge stp llc overlay ip6t_REJECT nf_reject_ipv6 xt_hl ip6_tables ip6t_rt ipt_REJECT nf_reject_ipv4 xt_LOG nf_log_syslog xt_comment ...

Admin

Windows Server 2022 Standard 导致 HTTP 模块崩溃,导致服务器重启。我需要帮助来追踪确切的问题。如何做?
server-crashes

Windows Server 2022 Standard 导致 HTTP 模块崩溃,导致服务器重启。我需要帮助来追踪确切的问题。如何做?

我不知道这是服务器内存的问题,还是我的某个 SSD 的问题,或者是与软件相关的问题。在过去的几个月里,崩溃已经发生了 4 次以上。 我需要一些帮助来弄清楚如何尽快阻止这种情况发生。有什么想法吗? 以下是堆栈跟踪: SYSTEM_THREAD_EXCEPTION_NOT_HANDLED (7e) This is a very common BugCheck. Usually the exception address pinpoints the driver/function that caused the problem. Always note thi...

Admin

我怎样才能阻止我的 MySQL 服务器宕机?
server-crashes

我怎样才能阻止我的 MySQL 服务器宕机?

我有一个基于 Ubuntu 机器上的 MySQL 服务器的网站。每隔几周,我的一个用户就会抱怨网站无法正常工作,而我(使用service mysql status)发现这是因为 MySQL 服务器已关闭。我重新启动它(使用service mysql restart),网站又可以正常工作了。在 中/var/log/mysql/error.log,我看到的唯一错误消息是以下形式[ERROR] [MY-013134] [Server] Table 'XXX' is marked as crashed and should be repaired。但是,重新启动服务...

Admin

“等待设备超时”&dev-disk-by\x2duuid.swap/service 因依赖性/超时而失败?
server-crashes

“等待设备超时”&dev-disk-by\x2duuid.swap/service 因依赖性/超时而失败?

我的服务器(运行 Centos Stream 版本 8)昨天晚上停止响应 http。我今天早上尝试通过 SSH 进入它,但没有成功,只剩下一个空的挂起的 PuTTy 屏幕。我通过我的网络主机的控制面板(Hetzner)进行了自动重置,几分钟后它就恢复了,一切似乎都正常工作。 我以为是空间不够了,结果确实df显示 /dev/md2 已满 100%(尽管它显示其大小为 9.8G,但实际空间为 9.5G)。我删除了一些东西,将空间减少到 50%。不过,里面没有新文件,我觉得它已经满了一个月或更长时间了…… 然后我查看了/var/log/messages最新的报告,...

Admin

Apache2 服务器已关闭 - AH00170
server-crashes

Apache2 服务器已关闭 - AH00170

我在使用 Ubuntu 22.04.1 + PHP 7.4 的 Apache2 服务器上遇到了几个星期的问题 由于没有明显原因,服务器自行瘫痪,并且网站仍在建设中,因此无法接收流量。 服务器崩溃之前我收到的最后一条日志包含以下几行: [Fri Mar 03 10:42:44.687695 2023] [mpm_prefork:notice] [pid 756] AH00163: Apache/2.4.52 (Ubuntu) OpenSSL/3.0.2 configured -- resuming normal operations [Fri Mar 03 1...

Admin