在我们的 3 个 Linux 机器 centos 7.1 中,我们在日志中看到以下消息,然后 ntpd 服务停止了,因为偏移量超过了 1000 秒。
systemd:时间已更改
ntpd[2626]: 0.0.0.0 0617 07 panic_stop -26789 s; set clock manually within 1000 s.
所有这 3 个 Linux 机器都在 ESX 机器下。还请注意,除了这些 Linux 机器之外,许多其他 Linux 机器也在同一 ESX 机器下。
我们在这些盒子中配置了外部 NTP 服务器,并且这些 ntp 服务器没有问题。
鉴于上述情况,由于该问题导致 NTP 服务自动停止,除了人工干预之外,系统时钟还有哪些可能性会发生变化。
答案1
推测答案:如果断电,板载时钟可能会漂移。也许板载电池快没电了。如果机器断电一段时间并且断电,则重新启动时设置的时间可能超出 ntpd 的最大允许调整范围。
如果您使用的是虚拟机,那么只需要控制虚拟机服务器上的服务。
我目前有一台 CentOS 7.1 机器(不是 VM)...在这个月里,它断电了 47 分钟 + 57 分钟 + 1 天 7 分钟 + 2 分钟。机房里进行了一些电气工作。查看“last -x shutdown reboot”:
[root@boxymcboxface ~]# last -x shutdown reboot
reboot system boot 3.10.0-229.el7.x Sun Jan 15 16:41 - 16:43 (8+00:02)
shutdown system down 3.10.0-229.el7.x Sun Jan 15 16:38 - 16:41 (00:02)
reboot system boot 3.10.0-229.el7.x Sun Jan 15 16:16 - 16:38 (00:22)
shutdown system down 3.10.0-229.el7.x Sat Jan 14 09:09 - 16:16 (1+07:07)
reboot system boot 3.10.0-229.el7.x Fri Jan 13 12:18 - 09:09 (20:50) ** first ntpd panic_stop seen @ Jan 13 12:38:39 **
shutdown system down 3.10.0-229.el7.x Fri Jan 13 11:21 - 12:18 (00:57) ** down for 57 mins **
reboot system boot 3.10.0-229.el7.x Tue Nov 22 11:49 - 11:21 (51+23:31)
shutdown system down 3.10.0-229.el7.x Tue Nov 22 11:02 - 11:49 (00:47)
第一个 panic_stop 消息:
ntpd[733]: 0.0.0.0 c617 07 panic_stop -1027 s; set clock manually within 1000 s.
每次重启后查看时钟设置会很有趣。但只能看到最新消息。'dmesg |grep clock':
[ 0.810823] rtc_cmos 00:08: setting system clock to 2017-01-15 16:40:57 UTC (1484498457)
因此,看起来在 57 分钟的时间内,当电源可能中断约 30 分钟时,时钟漂移了 (太快) 17 分钟。
答案2
虚拟化很容易出现时钟漂移。CPU 一次只能做一件事,因此跟踪许多机器的时间非常棘手。
以下是在 VMWare 中计时的最佳实践:http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=1006427