如何让网格管理员“接受”已消失的主机?

如何让网格管理员“接受”已消失的主机?

使用gridengine-master6.2u5-7.3 (Ubuntu Trusty),我们的/var/lib/gridengine/spool/qmaster/messages系统不断填充:

12/07/2016 04:11:43|worker|tools-grid-master|E|got load report of unknown exec host "tools-exec-1204.eqiad.wmflabs"

tools-exec-1204.eqiad.wmflabs是不再存在的主机。)

我怎样才能说服网格管理员“继续前进”,即“接受”它确实收到了来自未知主机的负载报告,或者从其收件箱中“删除”该负载报告?

答案1

显然,问题在于主机已关闭并从 DNS 中删除,但仍在 中引用host_aliases。从 中删除主机条目host_aliases并重新启动网格主机以重新读取host_aliases( service gridengine-master restart) 导致错误停止。

相关内容