循环设备性能问题

Question 1

将文件系统放入 RAM 中，只是为了在其上创建块设备支持文件，这是相当奇怪的……另外，ramfs 近年来不太受欢迎，取而代之的是更好的可调 tmpfs。我不认为有了内核大页支持，您应该会看到速度上的很大差异，但是，您的 ramfs 仍然相对较慢，通常，ramfs 比 tmpfs 快，而我的 tmpfs（在老式 DDR3 上！）相同的 bs 开箱即用 >6 GB/s。

不使用 ramfs/tmpfs，只需创建一个内存盘。您在这里找到的许多指令都有点旧 - 您可能需要也可能不需要brd内核模块来创建/dev/ram0可以直接使用的（或 ram1、2...）设备。我会推荐这回答：

sudo modprobe brd rd_nr=1 rd_size=$((4 * 1048576))

另外，另一方面：16k 的尺寸对于这个来说确实很小。在 512k 或 1M 的块中工作可能会更快。 “但是，”你说，“这不明智，因为我的 dm 将使用 16k 块！”。

嗯，这是你可以通过你在之上所做的事情来影响的md。此外，用户态速度在这里可能并不重要——复制的速度将很大程度上受到内核和用户态之间上下文切换数量的影响。

要预览您可以获得多快的速度，请尝试添加iflag=direct来自 ramdisk 的 dd 调用（并哭泣）：

sudo dd if=/dev/ram0 of=/dev/null iflag=direct bs=16k
262144+0 records in
262144+0 records out
4294967296 bytes (4,3 GB, 4,0 GiB) copied, 0,457708 s, 9,4 GB/s
sudo dd if=/dev/ram0 of=/dev/null iflag=direct bs=1M
4096+0 records in
4096+0 records out
4294967296 bytes (4,3 GB, 4,0 GiB) copied, 0,220438 s, 19,5 GB/s

Answer

将文件系统放入 RAM 中，只是为了在其上创建块设备支持文件，这是相当奇怪的……另外，ramfs 近年来不太受欢迎，取而代之的是更好的可调 tmpfs。我不认为有了内核大页支持，您应该会看到速度上的很大差异，但是，您的 ramfs 仍然相对较慢，通常，ramfs 比 tmpfs 快，而我的 tmpfs（在老式 DDR3 上！）相同的 bs 开箱即用 >6 GB/s。

不使用 ramfs/tmpfs，只需创建一个内存盘。您在这里找到的许多指令都有点旧 - 您可能需要也可能不需要brd内核模块来创建/dev/ram0可以直接使用的（或 ram1、2...）设备。我会推荐这回答：

sudo modprobe brd rd_nr=1 rd_size=$((4 * 1048576))

另外，另一方面：16k 的尺寸对于这个来说确实很小。在 512k 或 1M 的块中工作可能会更快。 “但是，”你说，“这不明智，因为我的 dm 将使用 16k 块！”。

嗯，这是你可以通过你在之上所做的事情来影响的md。此外，用户态速度在这里可能并不重要——复制的速度将很大程度上受到内核和用户态之间上下文切换数量的影响。

要预览您可以获得多快的速度，请尝试添加iflag=direct来自 ramdisk 的 dd 调用（并哭泣）：

sudo dd if=/dev/ram0 of=/dev/null iflag=direct bs=16k
262144+0 records in
262144+0 records out
4294967296 bytes (4,3 GB, 4,0 GiB) copied, 0,457708 s, 9,4 GB/s
sudo dd if=/dev/ram0 of=/dev/null iflag=direct bs=1M
4096+0 records in
4096+0 records out
4294967296 bytes (4,3 GB, 4,0 GiB) copied, 0,220438 s, 19,5 GB/s

Question 2

读取循环设备会产生开销，在对其进行基准测试时，尤其是在对内存速度进行基准测试时，这一点会很明显。如果您期望循环设备与直接传输一样快，那么这意味着内核不允许在内部多次复制数据，即使您正在通过多个抽象层，这可能涉及大量额外的系统调用。显然，内核实现还不够好。

除了常规开销之外，tmpfs 文件上的循环设备也可能产生副作用。因此，性能可能会很差，具体取决于文件的创建方式。

# truncate -s 1500M /dev/shm/f
# du /dev/shm/f
0   /dev/shm/f

创建文件truncate使其稀疏，因此它实际上不占用任何空间。

直接读取文件时没有任何变化：

# cat /dev/shm/f > /dev/null
# du /dev/shm/f
0   /dev/shm/f

然而，循环设备则不同：

# losetup --find --show /dev/shm/f
/dev/loop1
# cat /dev/loop1 > /dev/null
# du /dev/shm/f
1536000 /dev/shm/f

因此，读取循环设备会导致 tmpfs 文件被分配。这意味着 RAM 已为其分配，因此可能必须为其释放其他 RAM。如果存在交换空间，则该过程甚至可能涉及交换。

这是一种可能意想不到的副作用。

您可以尝试使用适当的 ramdisk 设备，而不是使用带有循环设备的 tmpfs，并希望它比文件循环的开销更少。

Answer