准确预测随机 I/O 性能趋势，以进行容量规划

Question 1

sar在这里，它很好地完成了这项工作；它将收集每秒读取/写入的事务数以及扇区数，然后可以使用这些数据以相对不错的精度重放您的 IO 工作负载（就读取/写入比率以及事务大小而言，这是决定您的 IO 有多“随机”的因素）。它并不完美，但根据我的经验，它足以完成您正在查看的那种估计。

Answer

sar在这里，它很好地完成了这项工作；它将收集每秒读取/写入的事务数以及扇区数，然后可以使用这些数据以相对不错的精度重放您的 IO 工作负载（就读取/写入比率以及事务大小而言，这是决定您的 IO 有多“随机”的因素）。它并不完美，但根据我的经验，它足以完成您正在查看的那种估计。

Question 2

所以，这看起来像是一个监控和容量报告问题。如果你要开始测量趋势统计数据，我会全面进行，这样你就可以进行比较、关联等。

就工具而言，开源世界中有 ganglia、zenoss、nagios 等，以及许多其他供应商的产品。

您可以对其进行配置以跟踪、测量和存储您感兴趣的 KPI，然后定期报告它们。

考虑到您对 RAM 使用情况的查询，将内存统计信息、交换使用情况和 CPU 也包括在内是有意义的，这样您就可以在同一时间段内全面比较它们，并查看哪些受到限制等。

一旦捕获了数据，您就可以将其全部存储在一个大型数据库中以供报告，可能还会保留历史数据，例如，存储每 5 秒的指标，持续 6 个月，然后按分钟存储，然后按 5 分钟存储，然后按小时存储，直到更远。这类事情可以编写脚本并通过 cron、autosys 等运行。

这些报告将为您提供管理层想要的信息 - 即带有漂亮图表的内容。

对于日常管理，您可以通过控制台查看图表/数字上的实时信息，了解您在任何特定时刻的表现。

Answer

所以，这看起来像是一个监控和容量报告问题。如果你要开始测量趋势统计数据，我会全面进行，这样你就可以进行比较、关联等。

就工具而言，开源世界中有 ganglia、zenoss、nagios 等，以及许多其他供应商的产品。

您可以对其进行配置以跟踪、测量和存储您感兴趣的 KPI，然后定期报告它们。

考虑到您对 RAM 使用情况的查询，将内存统计信息、交换使用情况和 CPU 也包括在内是有意义的，这样您就可以在同一时间段内全面比较它们，并查看哪些受到限制等。

一旦捕获了数据，您就可以将其全部存储在一个大型数据库中以供报告，可能还会保留历史数据，例如，存储每 5 秒的指标，持续 6 个月，然后按分钟存储，然后按 5 分钟存储，然后按小时存储，直到更远。这类事情可以编写脚本并通过 cron、autosys 等运行。

这些报告将为您提供管理层想要的信息 - 即带有漂亮图表的内容。

对于日常管理，您可以通过控制台查看图表/数字上的实时信息，了解您在任何特定时刻的表现。

Question 3

我们用收集因为我们可以将所有必要的信息拉到一个文件中，并在需要时重播统计数据。这样您就可以看到每个记录间隔的 IOPS 数量、上下文切换、内存统计数据。您可以按磁盘细分，也可以只查看系统的整体情况。Collectl 还支持 lustre。

这是了解整个系统性能的绝佳工具。祝你好运，根据观察，SATA 磁盘在进行随机访问时通常最高可达 200-300 IOPS。

Answer

我们用收集因为我们可以将所有必要的信息拉到一个文件中，并在需要时重播统计数据。这样您就可以看到每个记录间隔的 IOPS 数量、上下文切换、内存统计数据。您可以按磁盘细分，也可以只查看系统的整体情况。Collectl 还支持 lustre。

这是了解整个系统性能的绝佳工具。祝你好运，根据观察，SATA 磁盘在进行随机访问时通常最高可达 200-300 IOPS。

Question 4

根据您的存储后端（IBM SVC/DS8000），您可能能够直接从中提取与随机 IOPS 相关的统计信息。

要从服务器提取统计信息，你可以使用纳米。它是免费的（就像啤酒一样）。最初由 IBM 为 AIX 开发，也可以在 Linux 上运行。

Answer

根据您的存储后端（IBM SVC/DS8000），您可能能够直接从中提取与随机 IOPS 相关的统计信息。

要从服务器提取统计信息，你可以使用纳米。它是免费的（就像啤酒一样）。最初由 IBM 为 AIX 开发，也可以在 Linux 上运行。

相关内容