EC2 上的 Hadoop 流式传输作业处于“待处理”状态

Question

对不起，我是个白痴。

作业永远处于“待定”状态，因为尽管集群中的 datanode 进程正在运行，但 taskTracker 进程却没有运行。

它们失败了，因为由于设置错误，它们运行的帐户没有对本地 mapred 缓存目录的写入权限，所以它们在启动时全部终止。因此，作业跟踪器没有节点来分配作业。

一旦纠正了这个问题，任务就可以正常运行。

Answer 1

对不起，我是个白痴。

作业永远处于“待定”状态，因为尽管集群中的 datanode 进程正在运行，但 taskTracker 进程却没有运行。

它们失败了，因为由于设置错误，它们运行的帐户没有对本地 mapred 缓存目录的写入权限，所以它们在启动时全部终止。因此，作业跟踪器没有节点来分配作业。

一旦纠正了这个问题，任务就可以正常运行。

相关内容