为什么在 inode 中使用间接指针不会产生相同的空间量？

Question

inode 级别的原始层次结构大致如下：

你可以直接在 inode 中存储一个或几个块号。这意味着您要为索引节点多使用几个字节，但对于小文件，您不必分配一个完整的块，该块大部分是空的。

下一级是一个间接寻址：您分配一个块来存储块指针。 inode 中仅存储该间接块的地址。这不会以某种方式使用“更少的空间”，并且大多数文件系统，甚至是早期的文件系统，都是这样工作的（在索引节点/文件名附近有一个指针，该指针指向一个块，该块存储文件的块号）。

但是当这个区块的空间用完时你该怎么办？您必须分配另一个块，但是您在哪里存储对此块的引用？您可以只将这些引用添加到索引节点，但为了存储更大的文件，索引节点会变大。并且您需要较小的索引节点，以便尽可能多的索引节点可以放入单个块中（更少的磁盘访问来读取更多的索引节点）。

因此，您使用两级间接块：您只需添加一指向 inode 的指针，那么就有一个完整的块来存储指向间接块的指针，间接块存储文件本身的块地址。

依此类推，您可以添加更高级别的间接块，或者在某个阶段停止，直到达到所需结构的文件可能的最大大小。

因此，重点不是“总共使用更少的空间”，而是“使用一种有效使用块的方案来实现文件大小的预期分布，即许多小文件，一些较大的文件和很少的大文件”。

另一方面，页表的工作方式却截然不同。

编辑

回答评论中的问题：

数据块具有固定大小（最初为 512 字节，IIRC），它是底层硬盘块大小的倍数。所以数据块大小不能“减少”。

正如我在上面尝试描述的，让 inode 不占用太多空间的全部目的是使索引节点访问速度更快（或者，让缓存 inode 占用更少的内存——当时，当带有 inode 的 unix 文件系统被发明时，计算机有一个很多内存比今天少）。它是不是关于以某种方式总共节省空间。正如您自己所说，所有内容都必须存储在某个地方，如果它没有使用位置 X 的空间，它将使用位置 Y 的空间。

仅仅向 inode 添加可变数量的块指针是不切实际的，因为 inode 必须占用固定量的空间 - 您要使用 inode 编号来计算块地址以及 inode 信息所在的块内的偏移量存储。如果每个 inode 都有不同的大小，则无法做到这一点。所以一定有一些间接形式。

页表的工作方式不同，因为硬件以不同的方式实现它们 - 就是这样。层次结构具有固定的深度，始终相同（尽管有时是可配置的）。虽然从磁盘读取块的速度很慢，但这对于页表来说并不重要。因此设计问题完全不同。

Answer 1