我们利用一些“备用”部件构建了一些运行 Windows Server 2016 的服务器,其规格如下:
- 超微X10DRH-iT
- 双 E5-2620 v3
- 256GB 寄存 ECC DDR4 RAM
- 1 个 Adaptec 71685 RAID 控制器
- 8 个英特尔 DC S3500 80GB SSD
- 4 个英特尔 DC S3500 240GB SSD
- 4 个 300GB 15k SAS 硬盘
- 2 个 OCZ RevoDrive 350 480GB
- 1 个 OCZ RevoDrive 350 960GB
我们将这些服务器用于高性能 Oracle DB 测试环境。
问题是,经过一段时间(实际上非常随机)并且没有处于重负载或任何其他情况下,OCZ 350 驱动器开始出现故障,Windows 事件日志中充斥着ocz10xx Adapter \Device\RaidPort2 received srs interrupt.
警告Request failed on \Device\0000004a, physical disk 2.
,并最终破坏了部分 Oracle 表空间文件。
在这种状态下,东芝 SSD 实用程序工具仅报告第一个 480GB 驱动器正常,另外两个驱动器丢失。
这些“警告”不会停止,直到我们完全关闭服务器、拔掉电源线、等待一段时间并再次打开电源。此时表空间文件仍然损坏,因此我们必须重新创建它们并闪回(或重新导入)数据库。
所有驱动程序和固件等都是最新的。
我们尝试在 BIOS 中设置有关电源、中断、时序、PCIe 等的所有可以想象到的组合,并将卡切换到不同的插槽,但都无济于事。
有人知道我们可以尝试什么吗?除了丢弃硬件,如果可能的话!
答案1
OCZ Revodrive 实际上是一款单卡 RAID0 设置。它的可靠性很差和性能一致性。除了一些“有趣”(或爱好)的测试外,我不会使用它做任何其他事情。
如果你真的想要使用 3x RevoDrives,请尝试更换 PCI-E 插槽并一次使用单个 RevoDrive 运行。但是我强烈建议购买更好的 SSD,如英特尔 P3000 或 P4000 系列(即使是二手的)。