NTPD 问题 - 同步后慢慢失去作用

NTPD 问题 - 同步后慢慢失去作用

RHEL 5 工作站。多年来一直运行顺利。我最近进行了一次“pup”,然后进行了一次干净的重启。之后系统出现了一些启动问题:即 MySQL 拒绝启动。它只是“....”持续了 5-10 分钟,然后我进行了另一次启动并跳过了该步骤(使用“交互式”)。这是唯一不想正常启动的服务。

现在系统启动后,我发现它不想与 NTP 主服务器保持同步,并且在 48 小时后拒绝除 root 之外的任何 SSH。

NTPD:此服务正常启动并锁定 4 台服务器。它几乎立即开始失去优势,现在(3 天后)已落后近 40 小时。如果我停止/启动该服务,它会获得锁定,重置系统时钟并再次开始失去优势。'hwclock' 设置正确并保持其时间。

登录:当我(重新)启动 ntp 服务器时,我可以正常登录。我认为这个问题是由于与 LDAP 失去同步造成的。这似乎可以通过 /var/log/messages 中的 LDAP 错误得到验证。

有什么建议去哪里看吗?

附录:尝试删除“漂移”文件。过了一会儿,它又重新创建为 0.000。

来自/var/log/messages:

Jan 17 06:54:01 aeolus ntpdate[5084]: step time server 129.95.96.10 offset 30.139216 sec
Jan 17 06:54:01 aeolus ntpd[5086]: ntpd [email protected] Tue Oct 25 12:54:17 UTC 2011 (1)
Jan 17 06:54:01 aeolus ntpd[5087]: precision = 1.000 usec
Jan 17 06:54:01 aeolus ntpd[5087]: Listening on interface wildcard, 0.0.0.0#123 Disabled
Jan 17 06:54:01 aeolus ntpd[5087]: Listening on interface wildcard, ::#123 Disabled
Jan 17 06:54:01 aeolus ntpd[5087]: Listening on interface lo, ::1#123 Enabled
Jan 17 06:54:01 aeolus ntpd[5087]: Listening on interface eth0, fe80::213:72ff:fe20:4080#123 Enabled
Jan 17 06:54:01 aeolus ntpd[5087]: Listening on interface lo, 127.0.0.1#123 Enabled
Jan 17 06:54:01 aeolus ntpd[5087]: Listening on interface eth0, 10.127.24.81#123 Enabled
Jan 17 06:54:01 aeolus ntpd[5087]: kernel time sync status 0040
Jan 17 06:54:02 aeolus ntpd[5087]: frequency initialized 0.000 PPM from /var/lib/ntp/drift
Jan 17 06:54:02 aeolus ntpd[5087]: system event 'event_restart' (0x01) status 'sync_alarm, sync_unspec, 1 event, event_unspec' (0xc010)

您可以看到 30 秒的偏移。这是在大约一分钟的操作之后。

答案1

我建议删除漂移文件,停止 NTP 守护进程,然后在启动服务之前执行 ntpdate。我的理解是您的硬件时钟有问题。

答案2

您可能知道,ntpd 会尝试测量内部硬件时钟的漂移并相应地调整系统的时钟(以防无法联系到服务器,并防止过度同步)。漂移值存储在一个文件中;通常/etc/ntp/drift(取决于您的发行版)。听起来好像其中记录了一个错误的值;或者其他一些更改的参数(功耗等)影响了硬件特性,以至于存储的漂移值不再正确。

停止守护进程,重命名/删除文件(或者直接清空它),然后重新启动守护进程。它将在接下来的几天内从头开始测量漂移并采取相应措施。

LDAP 和 SSH(以及其他登录服务)依赖于所涉及系统的系统时钟没有太大差异,因此如果您的时间相差 40 小时,他们感到不安也是完全自然的。:)

相关内容