我有一台 QNAP TS-412。它有 4 个 4TB WD Red 硬盘,采用 RAID10 结构。
这个可怜的东西工作起来相当辛苦。它几乎每天 24 小时以每秒 20-30MB 的速度运行,作为一堆办公室电脑和少量服务器的备份设备。
在过去的两周里,它似乎莫名其妙地每 16 小时左右就会重启一次。这种负荷已经持续了大约 3 年,只有每 18 个月左右才会暂停一次,以升级驱动器容量。
我可以通过控制台(或通过 SSH)查看重启的原因吗?
答案1
使用终端连接到您的 QNAP 并查看/mnt/HDA_ROOT/.logs
。具体来说,kmsg
您应该会看到大量深层信息,供您细读、解释和最终启迪。
另一个选项是进入 Web UI >> 选择系统管理 >> 系统日志 >> 顶部的选项卡将允许您通过 UI 访问各种文件。
至于要寻找什么,通常都是一盘散沙,看看哪些东西看起来不好,而谷歌告诉你的东西更糟糕。
答案2
如果你启用 ssh 登录那么
ssh admin@<qnap_ip_addr_here>
password: admin
然后查看/var/log
grep ERR *log
具体查看 hal_lib.log 和 hal_lib.log.bak
寻找类似的东西。我不认为我的硬盘温度是 60C,并且怀疑硬盘温度有时是否读取不正确。这些可能是设置阈值而不是实际读数。不确定。
hal_lib.log:Get_Temp_Threshold() called, SYS_ERROR_TEMP=70
hal_lib.log:Get_Temp_Threshold() called, HDD_ERROR_TEMP=60
hal_lib.log:Get_Temp_Threshold() called, CPU_ERROR_TEMP=85
hal_lib.log:Get_Temp_Threshold() called, CPU_ERROR_TEMP=85
我也很好奇其他人是否也看到这个:
manaRequest.cgi:Tue Oct 21 16:45:48 2014
PD_Is_Exist: can't retrieve port_id value!
hal_daemon:Tue Oct 21 16:45:59 2014
root_get_fan_speed(978): NOT implement.
se_sys_get_SAS_HBA_info(3606):System Error.
disk_manage.cgi:Tue Oct 21 16:46:03 2014
您可能需要进入 QNAP qui(硬件)并禁用智能风扇速度设置并切换到手动速度(始终中等?)
当它显示“root_get_fan_speed(979): NOT implement.”时,我感到怀疑。因为风扇速度在 gui 中似乎是正确的。当我选择中等速度时,大约为 9k,而当我选择高速时,则为 >10k
答案3
根据 Wesley 的回答,我在日志中找不到任何内容。因此,我去了现场,将 QNAP 机箱换成了我手上的备用机箱,并将旧驱动器放入新机箱中。
似乎已经稳定运行了两天多了,而且负载仍然相同。我怀疑硬件因过热问题而出现故障,因为它在相当温暖的地方待了很长时间。
答案4
您还可以通过 ssh 进入 NAS 并执行以下命令来检查重建是否繁忙以及需要多长时间:
# cat /etc/mdstat
您将看到 RAID 重建,包括剩余时间。