Solaris 11 随机挂起：需要帮助找出原因

Question

您没有提供有助于诊断此问题的所有详细信息。

这些崩溃发生多久了？（例如，这是不是新安装？）
您能否展示输出zpool history或者解释一下您是否在存储池中使用了压缩或重复数据删除？
您如何连接到 P2000？（光纤、SAS、iSCSI）
DL385 G7 中安装了哪些 HBA 卡？
P2000 的磁盘布局是什么样的？（它是 SAN，因此不适合 ZFS 解决方案）
你任何适用于 Solaris 的 HP 管理代理安装？
是你的系统固件最新？
ILO 是否已配置？您检查过其日志吗？RAM 的运行状况如何？
你有自动服务器恢复看门狗BIOS 中配置了什么？这会在系统崩溃后触发重新启动。它还有助于确定这是硬件问题还是软件问题。

所以我问这些问题是什么时候开始的，因为如果这是一个新的安装时，您有一些选择。从磁盘布局来看，这旨在成为一个基于 ZFS 的大型存储系统。不过，设置中有几个危险信号...

首先，您将 SAN 中的多个虚拟磁盘暴露给 ZFS。基本上，您在 P2000 SAN 中定义了 30 个单独的 RAID0 阵列，并将它们呈现给 Solaris。如果您丢失了一个磁盘，则需要重新启动才能识别新设备。

二、操作系统的选择可能是一个问题，因为HP 尚未认证或完全支持 ProLiant 系统上的 Solaris 11。如果这纯粹是一个存储单元，并且您没有运行任何 Solaris 专用软件，NexentaStor是一个支持服务器硬件的安全解决方案。我的大部分 ZFS 存储解决方案都是在 HP 硬件上构建的。即使印第安纳公开赛会更容易支持一些。

但如果您需要解决真正的崩溃问题，我们需要知道系统上发生了什么。可能存在导致崩溃的日志。您可能还核心文件这可能会有用。连接到 SAN 的方法也有点重要，因为我见过 Solaris 和 HP/Broadcom 设备出现奇怪的 NIC 问题。话虽如此，我敢打赌这与网络有关……

Answer 1

您没有提供有助于诊断此问题的所有详细信息。

这些崩溃发生多久了？（例如，这是不是新安装？）
您能否展示输出zpool history或者解释一下您是否在存储池中使用了压缩或重复数据删除？
您如何连接到 P2000？（光纤、SAS、iSCSI）
DL385 G7 中安装了哪些 HBA 卡？
P2000 的磁盘布局是什么样的？（它是 SAN，因此不适合 ZFS 解决方案）
你任何适用于 Solaris 的 HP 管理代理安装？
是你的系统固件最新？
ILO 是否已配置？您检查过其日志吗？RAM 的运行状况如何？
你有自动服务器恢复看门狗BIOS 中配置了什么？这会在系统崩溃后触发重新启动。它还有助于确定这是硬件问题还是软件问题。

所以我问这些问题是什么时候开始的，因为如果这是一个新的安装时，您有一些选择。从磁盘布局来看，这旨在成为一个基于 ZFS 的大型存储系统。不过，设置中有几个危险信号...

首先，您将 SAN 中的多个虚拟磁盘暴露给 ZFS。基本上，您在 P2000 SAN 中定义了 30 个单独的 RAID0 阵列，并将它们呈现给 Solaris。如果您丢失了一个磁盘，则需要重新启动才能识别新设备。

二、操作系统的选择可能是一个问题，因为HP 尚未认证或完全支持 ProLiant 系统上的 Solaris 11。如果这纯粹是一个存储单元，并且您没有运行任何 Solaris 专用软件，NexentaStor是一个支持服务器硬件的安全解决方案。我的大部分 ZFS 存储解决方案都是在 HP 硬件上构建的。即使印第安纳公开赛会更容易支持一些。

但如果您需要解决真正的崩溃问题，我们需要知道系统上发生了什么。可能存在导致崩溃的日志。您可能还核心文件这可能会有用。连接到 SAN 的方法也有点重要，因为我见过 Solaris 和 HP/Broadcom 设备出现奇怪的 NIC 问题。话虽如此，我敢打赌这与网络有关……

Solaris 11 随机挂起：需要帮助找出原因

答案1

相关内容