我在服务器上使用 SSD 已有一年多了。偶尔,服务器会出现蓝屏/完全无响应。我发现这是因为 SSD 在系统运行时离线,因为在重新启动(软重置)后,BIOS 将无法检测到 SSD——除非我完全关闭系统电源并重新打开。然后 SSD 被检测到。我更换了电缆等。这是什么原因造成的?会不会是 SSD 坏了?(它只是“离线”是没有道理的)。运行 Windows Server 2008...日志也没有告诉我任何信息。
这是 OCZ oynx,固件是最新的。我的 HDTune 结果显示它有很多坏扇区,但我不确定我是否相信这个结果。
编辑
HD Sentinel 表面测试显示大约有 19 个坏扇区。一旦我拿到我的备份 ssd(corsair),我将重新格式化/重新初始化它,看看是否能解决问题。
答案1
SSD 总是会磨损,有一个专门用于“重新映射”的区域。如果您的驱动器无法重新映射并显示坏块,则意味着您用完了备用块并且您的 SSD 已损坏。如果它仍在保修期内,请将其丢弃或 RMA。
答案2
SSD 上的扇区并未映射到实际扇区。当您写入“扇区”时,SSD 的固件实际上是将数据写入底层 SSD 尚未使用的部分。它将始终选择写入次数最少的部分,以实现“磨损均衡”。也就是说,除非出现问题,否则任何磁盘实用程序都不应该看到坏扇区。我建议更换驱动器,看看是否有帮助。
顺便说一句:每个 SSD 附带的空间都比操作系统轮询时实际声称的空间多出一定百分比。当实际扇区由于写入次数过多而开始死亡时,将使用这个额外的缓冲空间。这与写入均衡相结合,这就是 SSD 制造商声称其设备的平均故障间隔时间与物理驱动器相同(甚至更长)的原因。但是,如果您的写入负载异常高,这可能不是真的。
答案3
最可能的原因:
- 固件漏洞。固态硬盘 (SSD) 相对而言非常“新”,固件没有像旋转式锈蚀驱动器中的固件那样经过数十年的测试和发展。这就是为什么这么多人仍然推荐英特尔固态硬盘 (SSD),而不是其他具有更好价格/容量或价格/性能的品牌:英特尔固态硬盘 (SSD) 已被证明具有非常可靠的固件,而大多数其他品牌都存在灾难性的(数据丢失)漏洞。如果您运行的是最新版本的固件,您所能做的就是向 OCZ 提交支持案例并向他们提供他们要求的任何诊断数据。
- SATA/SAS 驱动程序存在问题:检查更新(您没有提到操作系统,但我猜是 Windows)。对 TRIM 等功能的支持一度相当不稳定。
- 有缺陷的 BIOS/raid 固件:确保这些是制造商提供的最新版本
- 驱动器存在实际硬件问题,可能是控制器、闪存芯片,甚至是 PCB 或连接器。您所能做的就是 RMA 驱动器。