为什么文件系统密集型脚本在 RAM 磁盘上速度不快

Question 1

一般来说，所有操作首先发生在 RAM 中——文件系统被缓存。该规则也有例外，但这些相当特殊的情况通常源于非常具体的要求。因此，在您开始进行缓存刷新之前，您将无法辨别其中的差异。

另一件事是，性能取决于很多在确切的文件系统上 - 有些目标是更轻松地访问大量小文件，有些目标是高效地与大文件进行实时数据传输（多媒体捕获/流媒体），有些强调数据一致性，而另一些则可以设计为具有内存/代码占用空间小。

回到你的用例：在一个循环中，你生成了大约 20 个新进程，其中大多数只创建一个目录/文件（请注意，()创建一个子 shell 并为每个匹配find生成cat） - 瓶颈确实不是文件系统（如果您的系统使用ASLR而且你没有一个好的快速熵源，你的系统的随机性池也会很快耗尽）。用 Perl 编写的 FUSE 也是如此——它不是适合这项工作的工具。

Answer

一般来说，所有操作首先发生在 RAM 中——文件系统被缓存。该规则也有例外，但这些相当特殊的情况通常源于非常具体的要求。因此，在您开始进行缓存刷新之前，您将无法辨别其中的差异。

另一件事是，性能取决于很多在确切的文件系统上 - 有些目标是更轻松地访问大量小文件，有些目标是高效地与大文件进行实时数据传输（多媒体捕获/流媒体），有些强调数据一致性，而另一些则可以设计为具有内存/代码占用空间小。

回到你的用例：在一个循环中，你生成了大约 20 个新进程，其中大多数只创建一个目录/文件（请注意，()创建一个子 shell 并为每个匹配find生成cat） - 瓶颈确实不是文件系统（如果您的系统使用ASLR而且你没有一个好的快速熵源，你的系统的随机性池也会很快耗尽）。用 Perl 编写的 FUSE 也是如此——它不是适合这项工作的工具。

Question 2

比我对主要由小交易组成的测试的评论的回复要长一些。

工作量不足以测试

如果您想对文件系统进行压力测试，您将需要更大的工作集。

根据您的盒子上有多少内存，即使是数十或数千个文件夹创建操作也不会显示两者之间的明显差异。因此，修改您的工作负载以充分测试文件系统，同时考虑将用作缓冲区的内存。

有多种方法可以设计测试来抵消系统内存和其他会影响测试结果的因素的优势。

或者，您可以使用标准化测试套件，例如 bonnie++

Answer