解决没有日志条目的随机服务器冻结问题

解决没有日志条目的随机服务器冻结问题

我们在运行于 .NET Framework 4.7.2 下的 C# 应用程序时遇到了一个非常特殊且独特的问题,该应用程序在 Windows 10 操作系统上以信息亭模式运行,该操作系统在 Lenovo ThinkStation P320 Tiny 硬件上运行(在不同的硬件上也发现了同样的问题)。

环境描述:

该场景包括一个始终运行的应用程序,具有自动日/夜切换开/关功能。
当应用程序不处于视频通话模式时,它会连续循环播放一些视频/电影。
该应用程序在系统启动时以信息亭模式在 Windows 上运行。连接到 Mini-PC(联想)的外围设备包括:

  • 主显示器(平板电脑触摸屏)
  • 辅助显示器(40 英寸电视)
  • 扫描器
  • USB 网络摄像头
  • USB 麦克风
  • USB 局域网

用户与系统的唯一可能的交互是在受控环境中使用可触摸平板电脑进行的。

问题描述 :

我们遇到了一种看似随机的机器死机现象:
主显示器和辅显示器打开时图像固定,网络接口不响应 ping 命令。
操作系统在此期间不跟踪任何执行情况(系统事件日志中没有崩溃、没有转储、没有活动进程运行)。
即使将鼠标和键盘连接到 Mini-PC,也无法重新获得对操作系统的控制权。
我们几个月前开始这个项目时,并没有确切的时间出现这种问题。在
与用作目标的 Lenovo ThinkStation P320 Tiny 硬件不同的不同型号的硬件上也遇到了同样的问题。

我们尝试在 Lenovo BIOS 设置实用程序中启用系统事件日志,但没有成功,但我们没有遇到任何错误。我们尝试
强制从 Windows 生成转储,但操作系统无法执行此操作。
我们已联系 Lenovo 供应商(即使实际上问题也发生在不同的硬件上),通过执​​行诊断工具来识别任何硬件不兼容或我们公司的固有问题。
配置:未发现任何问题。

在这种情况下,唯一的办法就是移除 Mini-PC 电源。
重启时,通过分析应用程序和系统日志,在 Mini-PC 被阻止(冻结)的时间段内没有检测到任何问题,在冻结之前或重启之后的时间段内也没有检测到任何问题。

问题:

考虑到无论从应用程序的角度还是从操作系统的角度,都无法获得有关系统诊断和问题分析的信息,我们希望了解如何排除故障,或者启用低级日志或转储,以便我们更多地了解迷你电脑冻结时的状态或导致冻结的可能原因。

答案1

如果软件无法记录问题,那么问题肯定是硬件故障。通常,驱动程序\软件交互问题会导致内核崩溃 (BSOD)。

检查事项:

  • 设备是否过热?(确保自助服务终端通风良好)
  • 电源有问题吗?(漏接地/接地故障、电压下降和尖峰?使用 UPS 来平滑电源。打电话给电工修复接地故障。)
  • 电源故障或价格低廉。(这种情况可能发生在使用相同 PSU 的多个设备上。请测试 PSU。)
  • 附近是否有大型电磁干扰源?(例如:MRI 机器、特斯拉线圈)
  • BIOS 错误。(可能存在于所有具有特定固件的设备中。请检查更新。)

相关内容