Exchange 2003 邮件存储中的高物理磁盘队列

Exchange 2003 邮件存储中的高物理磁盘队列

我有一个 raid 10 阵列,包含 10 个 7200 SATA rpm 磁盘。工作时间内我的磁盘队列长度平均约为 100。以下设置正确:

  1. 该阵列有一个邮件存储,其中有 95 个活动邮箱。(这是唯一的东西,没有日志或系统文件)
  2. 平均邮箱大小约为 400 兆字节
  3. 该阵列是一个 1.3 TB 的大分区,与 RAID 条带对齐
  4. 邮件存储空间约为 48 GB(用于存储 etm 和 stm 文件)
  5. 邮件存储刚刚进行了碎片整理
  6. 事务日志位于另一个平均磁盘队列少于 1 的阵列上

这个数字看起来高吗?如果是,这个设置有什么问题吗?我应该看看其他计数器吗?

评论后更新:

  1. 阵列本身似乎还不错,前几周经过几天的 Jetstress 测试,它获得了良好的结果
  2. 阵列上没有页面文件:-)
  3. 有 symantec AV 软件。从任务管理器来看,IO 读取和 IO 写入最高的两个是conduit.exe(symantec 反垃圾邮件/病毒)和 store.exe。conduit 的读取次数为 1800 万次,写入次数为 2500 万次,store 的读取次数为 1.44 亿次,写入次数为 900 万次。截至目前,由于我有网关服务器,因此我正在考虑将 AV 从后端服务器中移除。

答案1

这已经超出了“相当高”的范围——极其地, 令人震惊地高。我的邮箱数量是这个数字的两倍多,运行在 RAID-5 上,使用的是老旧的 7,200RPM Ultra160 SCSI 驱动器,磁盘队列少得多。

除了 Exchange 之外,还有其他因素正在破坏您的磁盘。我会打开 Perfmon 并绘制每个单独进程的“进程”对象中的“每秒 IO 数据操作数”,看看哪个进程导致了这么多 IO。

编辑:

您在评论中链接给 Jim B 的文章中有一些非常好的性能计数器,值得一看。我也想知道,您是否已将虚拟内存页面文件放到这些磁盘上,并且看到了过多的页面调度。

在阅读了这篇文章和关于 Entourage 的链接文章后,我确实有些怀疑,您可能遇到了与这些客户端相关的一些问题。不过,Outlook Anywhere(又名 RPC over HTTP)不会导致与 Entourage 相同的问题——那是完全不同的东西(MAPI over HTTP,与 Entourage 客户端使用的 WebDAV 不同)。

无需询问就可以,但是您在事件日志中看到任何奇怪的东西吗?

更新后进行编辑:

您真正想要的并不是读取/写入的总数。您真正想要的是每个间隔的读取/写入增量。打开 Perfmon,清除默认计数器,并添加一些计数器:

  • 目的:过程 -柜台:数据操作/秒 -实例:管道程序
  • 目的:过程 -柜台:数据操作/秒 -实例:商店

你也可以看看Microsoft Exchange 用户监视器(关于其用法的精彩文章可参见http://www.msexchange.org/tutorials/Microsoft-Exchange-Server-User-Monitor.html)。这不会显示 WebDAV 会话,但它可以让您了解传统基于 MAPI 的用户正在做什么。

答案2

哇!这太高了。平均队列长度应该等于或小于物理磁盘主轴的数量,因此您的机器的抖动程度比应有的程度高出一个数量级。此链接列出了所有会导致磁盘 I/O 的 Exchange 操作,因此根据 Sam 和 Evan 的建议,您还应验证是否存在任何此类活动的异常情况(例如邮件循环)。

答案3

这个数字相当高,你有没有 AV 软件?另外看看 \process*\io data operations/sec。这应该能告诉你是 store.exe 还是其他什么东西导致了 IO。如果是 store.exe,我猜是什么东西正在扫描你的邮箱。

答案4

你也可以看看进程监控,它会单独记录磁盘上的每次访问。如果 Exchange 以外的其他程序正在使用您的磁盘,您会看到它在 ProcMon 中很快填满磁盘访问列表。

您没有提到您有多少 RAM,尽管您提到的规格表明您可能拥有合理的数量。如果您运行的内存少于 2 GB,您可能会看到机器访问页面文件时出现这种行为。确保任务管理器中使用的 RAM 量小于服务器中安装的物理内存量。

相关内容