CEPH 的原始空间使用情况

Question 1

一个可能造成混淆的因素是 GB 与 GiB/TB 与 TiB（以 10 为基数/以 2 为基数），但这并不能解释这里的所有差异。

Ceph/RBD 将尝试“懒惰地”为您的卷分配空间。这就是为什么尽管您创建了四个 5TB 卷，但它报告使用了 16TB，而不是 20TB。但 16TB 大于 RBD 支持的文件系统的“活动”内容的总和，正如您所说，只有大约 11TB。需要注意以下几点：

当您删除 RBD 支持的文件系统中的文件时，文件系统会在内部将块标记为空闲，但通常不会尝试将它们“返回”到底层块设备 (RBD)。如果您的内核 RBD 版本足够新（3.18 或更新），您应该能够使用将fstrim释放的块返回到 RBD。我怀疑您在这些文件系统上创建并删除了其他文件，对吗？

除了所示的净数据使用量之外，还有一些文件系统开销df。除了“超级块”和其他文件系统内部数据结构之外，RBD 分配数据的粒度也会产生一些开销。我认为 RBD 总是会分配 4MB 的块，即使只使用了其中的一部分。

Answer

一个可能造成混淆的因素是 GB 与 GiB/TB 与 TiB（以 10 为基数/以 2 为基数），但这并不能解释这里的所有差异。

Ceph/RBD 将尝试“懒惰地”为您的卷分配空间。这就是为什么尽管您创建了四个 5TB 卷，但它报告使用了 16TB，而不是 20TB。但 16TB 大于 RBD 支持的文件系统的“活动”内容的总和，正如您所说，只有大约 11TB。需要注意以下几点：

当您删除 RBD 支持的文件系统中的文件时，文件系统会在内部将块标记为空闲，但通常不会尝试将它们“返回”到底层块设备 (RBD)。如果您的内核 RBD 版本足够新（3.18 或更新），您应该能够使用将fstrim释放的块返回到 RBD。我怀疑您在这些文件系统上创建并删除了其他文件，对吗？

除了所示的净数据使用量之外，还有一些文件系统开销df。除了“超级块”和其他文件系统内部数据结构之外，RBD 分配数据的粒度也会产生一些开销。我认为 RBD 总是会分配 4MB 的块，即使只使用了其中的一部分。

Question 2

我不是 ceph 专家，但让我猜一下。

如果没有选项，则无法挂载块设备discard。因此，您写入和删除的任何数据都不会显示在文件系统上 ( /mnt/part1)，但由于它曾经被写入且未被修剪，因此它会保留在底层文件系统上。

如果您查看USED池并将其相加，您会得到 16777GB，这与ceph -s显示的值相等。如果将其乘以二（两个副本），您会得到 33554GB，这几乎就是已使用的空间。

Answer

我不是 ceph 专家，但让我猜一下。

如果没有选项，则无法挂载块设备discard。因此，您写入和删除的任何数据都不会显示在文件系统上 ( /mnt/part1)，但由于它曾经被写入且未被修剪，因此它会保留在底层文件系统上。

如果您查看USED池并将其相加，您会得到 16777GB，这与ceph -s显示的值相等。如果将其乘以二（两个副本），您会得到 33554GB，这几乎就是已使用的空间。

相关内容