Apache Tomcat 达到最大文件限制后，mkdir：特定文件夹上出现“设备上没有剩余空间”

Question 1

在大多数情况下（显然不是您的情况），原因是您用完了 iNode。

要检查此运行 df -i：

Filesystem            Inodes   IUsed   IFree IUse% Mounted on
[...]
                       25600   25600       0  100% /foo

这里您可以看到 iNode 的使用率为 100%。

坏消息是，根据https://superuser.com/questions/585641/changing-max-inode-count-number-in-ext3-filesystem-in-cent-os您需要使用 -i 选项重新创建文件系统，以增加 inode 的数量。

Answer

在大多数情况下（显然不是您的情况），原因是您用完了 iNode。

要检查此运行 df -i：

Filesystem            Inodes   IUsed   IFree IUse% Mounted on
[...]
                       25600   25600       0  100% /foo

这里您可以看到 iNode 的使用率为 100%。

坏消息是，根据https://superuser.com/questions/585641/changing-max-inode-count-number-in-ext3-filesystem-in-cent-os您需要使用 -i 选项重新创建文件系统，以增加 inode 的数量。

Question 2

我找到了“如何解决这种情况”这个问题的答案。我不知道这件事发生的所有细节，但我知道的足以给出答案。

简短回答：卸载磁盘，chkdsk -f在其上运行，然后重新安装可以解决并防止问题再次发生。作为替代方案，创建一个新磁盘（记住我们在 AWS 上）并将所有数据复制到新磁盘（这rsync -a是我选择的命令）并使用它来替换原始磁盘也可以解决和防止问题。

较长的答案：磁盘文件系统 (ext4) 在最初创建磁盘快照时似乎已达到某种不稳定状态。当后来将 200GB 的原始快照扩展（使用resize2fs）到 1TB 时，似乎在某种意义上它一直在内部记住 200GB 的原始大小，从而产生各种奇怪的现象，最终导致操作系统无法关闭句柄，从而使 Tomcat 达到其文件限制，从而导致一切都崩溃。

这是最长的答案，包含更多侦查工作细节：当我们在两个不同的设置上同时发生这种病症时，我们取得了突破。检查这些设置上的所有参数并进行比较后，我们意识到df -h驱动器上显示的是以下结果：

/dev/xvdc            1008G  197G  760G  19% /mnt/eternal

现在，这之前并没有引起我们的注意，因为磁盘仍然有足够的空间。但两个设置上的磁盘使用量完全相同（197G），这没有理由发生。从这里开始，事情很快就展开了。如前所述，我们的 AWS 实例是从具有 200GB 磁盘快照的映像创建的，该映像在单个实例上使用时会扩展resize2fs- 通常最大大小为 1TB。我们最终能够通过启动新实例、调整为 1TB 并创建一个 300GB 的大文件来重新创建“坏状态”。完成后，系统没有冻结，但确实表现出相同的奇怪行为：

/dev/xvdc            1008G  197G  760G  19% /mnt/eternal

并且磁盘上的数据显然超过 197GB。因此，我们在两个单独的干净设置上尝试了上述两种方法（chkdsk 和重新创建磁盘），在每个设置上都不再出现奇怪的行为。

我们最好的猜测是，在创建 AMI 的某个时刻，快照过程中出现了问题 - 最有可能是因为我们拍摄了“未重启快照”（虽然我们通常不会这样做，而且我也没有证据支持这一点，所以我希望我们的 DevOps 不会因为我无缘无故地责怪她而生我的气！）。总而言之，这是一次有趣的经历。

Answer