在 Linux 文件系统中我可以在哪里看到 Hadoop HDFS 的文件？

Question 1

您可以使用hdfs fsck实用程序来定位块的名称，然后您可以在本地文件系统中手动找到它：

$ echo "Hello world" >> test.txt
$ hdfs dfs -put test.txt /tmp/
$ hdfs fsck /tmp/test.txt -files -blocks
/tmp/test.txt 12 bytes, 1 block(s):  OK
    0. BP-1186293916-10.25.5.169-1427746975858:blk_1075191146_1451047 len=12 repl=1

记下该blk_....字符串。使用它来定位文件：

$ find /hadoop/hdfs/data/current/BP-1186293916-10.25.5.169-1427746975858/current/finalized -name 'blk_1075191146*'
/hadoop/hdfs/data/current/BP-1186293916-10.25.5.169-1427746975858/current/finalized/subdir22/subdir29/blk_1075191146_1451047.meta
/hadoop/hdfs/data/current/BP-1186293916-10.25.5.169-1427746975858/current/finalized/subdir22/subdir29/blk_1075191146

$ cat /hadoop/hdfs/data/current/BP-1186293916-10.25.5.169-1427746975858/current/finalized/subdir22/subdir29/blk_1075191146
Hello world

您可以看到带有解释的完整示例这里

Answer

您可以使用hdfs fsck实用程序来定位块的名称，然后您可以在本地文件系统中手动找到它：

$ echo "Hello world" >> test.txt
$ hdfs dfs -put test.txt /tmp/
$ hdfs fsck /tmp/test.txt -files -blocks
/tmp/test.txt 12 bytes, 1 block(s):  OK
    0. BP-1186293916-10.25.5.169-1427746975858:blk_1075191146_1451047 len=12 repl=1

记下该blk_....字符串。使用它来定位文件：

$ find /hadoop/hdfs/data/current/BP-1186293916-10.25.5.169-1427746975858/current/finalized -name 'blk_1075191146*'
/hadoop/hdfs/data/current/BP-1186293916-10.25.5.169-1427746975858/current/finalized/subdir22/subdir29/blk_1075191146_1451047.meta
/hadoop/hdfs/data/current/BP-1186293916-10.25.5.169-1427746975858/current/finalized/subdir22/subdir29/blk_1075191146

$ cat /hadoop/hdfs/data/current/BP-1186293916-10.25.5.169-1427746975858/current/finalized/subdir22/subdir29/blk_1075191146
Hello world

您可以看到带有解释的完整示例这里

Question 2

您无法使用 cat 或类似命令直接从终端浏览 HDFS。HDFS 是一个逻辑文件系统，并不直接映射到 Unix 文件系统。您应该有一个 HDFS 客户端，并且您的 Hadoop 集群应该正在运行。当您浏览 HDFS 时，您将从 namenode 获取目录结构，从 datanode 获取实际数据。

虽然您无法浏览，但数据由 datanode 守护进程存储在那里。其路径由dfs.数据.目录hdfs-site.xml 中的属性。

目录结构由 namenode 守护进程存储，其路径由dfs.名称.目录hdfs-site.xml 中的属性

Answer

您无法使用 cat 或类似命令直接从终端浏览 HDFS。HDFS 是一个逻辑文件系统，并不直接映射到 Unix 文件系统。您应该有一个 HDFS 客户端，并且您的 Hadoop 集群应该正在运行。当您浏览 HDFS 时，您将从 namenode 获取目录结构，从 datanode 获取实际数据。

虽然您无法浏览，但数据由 datanode 守护进程存储在那里。其路径由dfs.数据.目录hdfs-site.xml 中的属性。

目录结构由 namenode 守护进程存储，其路径由dfs.名称.目录hdfs-site.xml 中的属性

Question 3

Hadoop 在每个数据节点上以块的形式本地存储数据，并且该属性可在hdfs-site.xml归档于dfs.数据.目录财产

大多数情况下是

$HADOOP_HOME/data/dfs/data/hadoop-${user.name}/current

Answer

Hadoop 在每个数据节点上以块的形式本地存储数据，并且该属性可在hdfs-site.xml归档于dfs.数据.目录财产

大多数情况下是

$HADOOP_HOME/data/dfs/data/hadoop-${user.name}/current

Question 4

您可以导航到由Hadoop只需编写以下命令：

更合适的命令是 hdfs dfs -ls

Linux 终端上给出的命令将显示以下输出/目录中第一列显示文件的权限，第二列显示用户文件和第三列显示姓名文件的

Answer

您可以导航到由Hadoop只需编写以下命令：

更合适的命令是 hdfs dfs -ls

Linux 终端上给出的命令将显示以下输出/目录中第一列显示文件的权限，第二列显示用户文件和第三列显示姓名文件的

在 Linux 文件系统中我可以在哪里看到 Hadoop HDFS 的文件？

答案1

答案2

答案3

答案4

相关内容