dd 写入与读取性能

Question 1

您需要使用写入同步标志来测试性能，以确保您实际上是在磁盘上写入而不是在缓存上写入。用于conv=fdatasync在写入结束后强制同步缓冲区。看这里了解详情。

time dd .... conv=fdatasync

对于读取测试，在测试之前丢弃缓存：

flush
echo 3 | sudo tee /proc/sys/vm/drop_caches
time dd ....

Answer

您需要使用写入同步标志来测试性能，以确保您实际上是在磁盘上写入而不是在缓存上写入。用于conv=fdatasync在写入结束后强制同步缓冲区。看这里了解详情。

time dd .... conv=fdatasync

对于读取测试，在测试之前丢弃缓存：

flush
echo 3 | sudo tee /proc/sys/vm/drop_caches
time dd ....

Question 2

你用的命令是什么？dd做非常与性能相关的不同事物取决于选项。

但从你写的内容来看，

我认为您正在读取小块，这些块将根据您的要求大致从磁盘中读取。

您可以写入小块，当内核认为有时间执行此操作时，这些小块将被写入磁盘，而不是在dd将它们写出时。

这已经可以解释其中的差异了，对吧？

Answer

你用的命令是什么？dd做非常与性能相关的不同事物取决于选项。

但从你写的内容来看，

我认为您正在读取小块，这些块将根据您的要求大致从磁盘中读取。

您可以写入小块，当内核认为有时间执行此操作时，这些小块将被写入磁盘，而不是在dd将它们写出时。

这已经可以解释其中的差异了，对吧？

Question 3

我非常怀疑您能否从中获得有意义的基准dd。dd只是向您展示了不同设备之间执行的大型顺序读取或大型顺序异步写入。只要您的工作负载主要包括在这些文件系统之间复制大文件，就可以了。不过，我怀疑这就是你的工作量。

最好的选择是分析磁盘使用情况并使用真实的 I/O 基准测试套件（链接bonnie++或其他东西）来测试更改各种可调参数的效果。对于数据库，我期望有大量的随机读取。对主数据文件进行设置noatime和执行操作data=writeback（定期进行备份）可能是利用我们迄今为止所掌握的信息所能做的最好的事情。

要回答似乎是您更大的问题，这是因为异步写入（如由进行的写入dd）可以在内存中缓冲并提交到磁盘。他们是种类只要队列和缓冲区可以填满，您就必须等待它们再次可用（通过提交到磁盘），然后才能堆叠更多内容。

另一方面，读取在定义上是 I/O 绑定的，因此您通常不会进行相同的异步操作。您可以尝试read_ahead_kb诸如此类的操作，以便将更多顺序数据读入内存，以应对不久的将来工作负载的要求。

这就是我目前所能想到的回答。如果您有任何疑问，请告诉我。

Answer