磁盘已满时 HDFS 数据节点启动失败

Question 1

根据此默认 HDFS 参数，dfs.datanode.du.reserved是每个卷的。因此，如果您将其设置为 10 GB，并且您的数据节点为 HDFS 配置了 4 个卷，它将留出 40 GB 供非 DFS 使用。

Answer

根据此默认 HDFS 参数，dfs.datanode.du.reserved是每个卷的。因此，如果您将其设置为 10 GB，并且您的数据节点为 HDFS 配置了 4 个卷，它将留出 40 GB 供非 DFS 使用。

Question 2

也许您应该手动将数据从一个卷移动到另一个数据节点内：

3.12. 在单个数据节点上，如何平衡磁盘上的块？

Hadoop 目前没有自动执行此操作的方法。要手动执行此操作：

关闭相关的DataNode
使用 UNIX mv 命令将单个块副本和元对从一个目录移动到另一个目录（在选定主机上）。在具有 HDFS-6482（Apache Hadoop 2.6.0+）的版本中，您还需要确保在磁盘之间移动块时，子目录命名的目录结构保持完全相同。例如，如果块副本及其元对位于 /data/1/dfs/dn/current/BP-1788246909-172.23.1.202-1412278461680/current/finalized/subdir0/subdir1/ 下，而您想要将其移动到 /data/5/ 磁盘，则必须将其移动到其下的相同子目录结构中，即 /data/5/dfs/dn/current/BP-1788246909-172.23.1.202-1412278461680/current/finalized/subdir0/subdir1/。如果不保留此结构，移动后 DN 将无法再找到副本。
重新启动 DataNode。

Answer

也许您应该手动将数据从一个卷移动到另一个数据节点内：

3.12. 在单个数据节点上，如何平衡磁盘上的块？

Hadoop 目前没有自动执行此操作的方法。要手动执行此操作：

关闭相关的DataNode
使用 UNIX mv 命令将单个块副本和元对从一个目录移动到另一个目录（在选定主机上）。在具有 HDFS-6482（Apache Hadoop 2.6.0+）的版本中，您还需要确保在磁盘之间移动块时，子目录命名的目录结构保持完全相同。例如，如果块副本及其元对位于 /data/1/dfs/dn/current/BP-1788246909-172.23.1.202-1412278461680/current/finalized/subdir0/subdir1/ 下，而您想要将其移动到 /data/5/ 磁盘，则必须将其移动到其下的相同子目录结构中，即 /data/5/dfs/dn/current/BP-1788246909-172.23.1.202-1412278461680/current/finalized/subdir0/subdir1/。如果不保留此结构，移动后 DN 将无法再找到副本。
重新启动 DataNode。

Question 3

对于你的情况，在集群数据节点上均匀地平衡数据可能会帮助你避免磁盘被填满，即使整个集群有空间，你也可以强制定期运行 hadoop oob 平衡器。这将对块进行混洗，因此所有数据节点都将消耗相同数量的磁盘空间

    hadoop balancer

你可以为这个脚本指定一个阈值，HDFS 块将达到这个阈值，默认值是 10，如果你认为 10% 不够，你可以指定一个较低的数字，我看到你已经使用了 HDFS 上 90% 的空间，所以你可以指定 5

    hadoop balancer 5

检查这些链接1 链接2有关平衡器的更多信息

Answer

对于你的情况，在集群数据节点上均匀地平衡数据可能会帮助你避免磁盘被填满，即使整个集群有空间，你也可以强制定期运行 hadoop oob 平衡器。这将对块进行混洗，因此所有数据节点都将消耗相同数量的磁盘空间

    hadoop balancer

你可以为这个脚本指定一个阈值，HDFS 块将达到这个阈值，默认值是 10，如果你认为 10% 不够，你可以指定一个较低的数字，我看到你已经使用了 HDFS 上 90% 的空间，所以你可以指定 5

    hadoop balancer 5

检查这些链接1 链接2有关平衡器的更多信息

Question 4

我认为您真正想要的是将 dfs.datanode.du.reserved 设置为某个非零值，以便数据节点确保系统的 HDFS 卷上始终有那么多可用空间。

注意：dfs.datanode.du.reserved 用于整个系统，不是按卷。

根据HDFS-1564，有关于制作每个卷选项的讨论，但尚未计划用于任何特定版本。

Answer

我认为您真正想要的是将 dfs.datanode.du.reserved 设置为某个非零值，以便数据节点确保系统的 HDFS 卷上始终有那么多可用空间。

注意：dfs.datanode.du.reserved 用于整个系统，不是按卷。

根据HDFS-1564，有关于制作每个卷选项的讨论，但尚未计划用于任何特定版本。

相关内容