使用gridengine-master
6.2u5-7.3 (Ubuntu Trusty),我们的/var/lib/gridengine/spool/qmaster/messages
系统不断填充:
12/07/2016 04:11:43|worker|tools-grid-master|E|got load report of unknown exec host "tools-exec-1204.eqiad.wmflabs"
(tools-exec-1204.eqiad.wmflabs
是不再存在的主机。)
我怎样才能说服网格管理员“继续前进”,即“接受”它确实收到了来自未知主机的负载报告,或者从其收件箱中“删除”该负载报告?
答案1
显然,问题在于主机已关闭并从 DNS 中删除,但仍在 中引用host_aliases
。从 中删除主机条目host_aliases
并重新启动网格主机以重新读取host_aliases
( service gridengine-master restart
) 导致错误停止。