我们目前正在考虑从传统的服务器环境转移到 SAN/VMWare 环境。
我被要求收集我们主要服务器(DC、文件服务器、Exchange)的性能统计数据,以查看它是否适合我们的环境或者我们是否会遇到 SAN 性能问题。
我已经运行了一些超过 8 小时的预定基线,其中包括许多计数器,但生成的日志太大而无法使用 - perfmon 需要大约三分钟才能打开它们,或者允许我们查看不同的计数器。
尽管我通常知道哪些内容对于查看性能有用,但是什么样的列表才适合进行监控并且可以为我们提供一个有用的起点,并且还知道哪些计数器对此有用。
我在想
- CPU 性能
- 磁盘/文件
- 网络使用情况
- 活动目录(GPO、登录等)
但是,哪些计数器最有用?还有哪些领域是我们应该特别关注的?
答案1
最有可能让您丧命的是磁盘 IO。收集每秒事务数和每秒读取/写入的扇区数将帮助您开始确定 SAN 上需要什么。还要留意内存和页面文件的使用情况,它们可能会对您的磁盘 IO 统计数据造成不良影响,并且为您的虚拟机配置一些额外的内存很简单。
网络可能是下一个最重要的,但这非常简单 - 每秒的总传输量和数据包数,确保它不会太荒谬。
根据我的经验,CPU 是现代系统最不可能出现的瓶颈。除非您有多台机器持续占用 CPU,否则我倾向于不担心它。如果 CPU 不足,配置额外的 VM 服务器很简单。
答案2
经过进一步的研究,我认为这是一个很好的通用计数器列表:
逻辑磁盘
- 平均磁盘秒/读取
- 平均磁盘秒/写入
- % 空闲时间
记忆
- 已使用已提交字节数百分比
- 可用兆字节数
- 空闲系统页表条目
- 页数/秒
- 池非分页字节数
- 池分页字节数
网络
- 每秒总计字节数
- 输出队列长度
物理磁盘
- % 空闲时间
- 平均磁盘秒/读取
- 平均磁盘秒/写入
- 平均磁盘队列长度
- 平均磁盘字节数/秒
过程
- 句柄数
- 私人字节
- 线程数
处理器
- % 中断时间
- 处理器时间百分比
- 用户时间百分比
系统
- 处理器队列长度
- 终端服务器(可选)
- 活跃期
- 非活动会话
- 总会话数
答案3
对于磁盘限制,我喜欢监视每个物理磁盘的“\PhysicalDisk(...)\Current Disk Queue Length”。
对于使用 perfmon 查看事物的问题:虽然这可能超出了你正在做的事情的范围,但我使用 check_nt 插件和安装在客户端上的 nsclient++ 使用 Nagios 监控 windows 计数器。然后我可以使用n2rrd,我还可以使用 rrdtool 创建自定义图形。
您列出的所有内容通常都在 vmware/san 环境中运行。这实际上只是一个 SAN 和虚拟服务器需要多强大以及正确的架构的问题。如果您愿意花钱购买昂贵的 san,供应商应该能够告诉您需要什么。
答案4
虚拟机与典型的服务器不同,您会在不同方面遇到问题。大多数情况下,CPU 不是瓶颈资源,但 RAM 才是。使用虚拟机之前您需要真正了解的事情:
- 磁盘吞吐量您的存储负载有多快?MB/读取、MB/写入,包括平均值和峰值(如本主题其他地方所述,RRDTool 非常适合此用途)。您是否知道峰值何时出现,以及它们是否与存储在同一 ESX 群集上的其他 VM 上的 I/O 峰值重合。在我们的环境中,备份是 I/O 峰值时间,但我们在白天会出现突发情况。这个问题的答案将告诉您是否可以使用文件支持的磁盘,或者是否必须将现有 LUN 定向到 VM。
- 网络吞吐量了解您需要的速度。如上所述,当我们开始尝试使 NIC 饱和时,备份就是其中的一个方面。了解您要处理的数据量。我非常肯定有些 NIC 可以进行 VLAN 标记,如果您的网络基础设施支持,这可以缓解负载平衡问题。
- 内存蠕变了解您的程序。我们有一个程序会消耗分配给它的每一点内存,这会导致 VMWare 控制台发出抱怨并抱怨使用情况并建议给它更多。如果您的资金不像我们那么严重不足,希望您的 ESX 服务器能够配置大量 RAM。在我们的环境中,我们认为虚拟机是“贪婪的”,如果它需求超过 1GB 的 RAM。您的可能有所不同。
确定您是否可以使用文件支持磁盘或是否需要直接呈现的 LUN 可能需要一些了解。直接呈现的 LUN 是指您的存储阵列将 LUN 直接呈现给虚拟机,通过使用神经传导阻滞。您可以在没有 NPIV 的情况下做到这一点,但这可能太危险了,所有全新的光纤通道硬件都应该支持它,ESX 3.5 肯定支持它。直接呈现消除了存储阵列和虚拟机冲击 I/O 之间的抽象层,从这个意义上讲,它可以提供更好的性能。但是,直接呈现的设置比较棘手,并且在“理解它”阶段的启动时间更长。
文件备份磁盘非常简单。此外,它们可以非常简单地在存储阵列之间移动(对于某些简单值,涉及复制多 GB 文件),而直接演示需要(通常非常昂贵的)阵列级复制软件才能完成。低 I/O 负载在文件备份上工作得很好,甚至一些更高的 I/O 负载也是如此。我们正在为超过 3000 名用户在文件备份磁盘上运行完整的 Exchange 2007 安装。备份可能会更快,但在白天,用户不会注意到任何减速。