今天早上醒来时,发现一个页面显示我们的集群已关闭。它马上就恢复了。我发现日志错误日志中有关于 IO 耗时超过 15 秒的条目。我们的监控服务器曾尝试 ping 服务器,但出现超时错误。
我检查了我们的一个监控工具,看看凌晨 4:30 发生了什么。似乎是我们的一个大型数据库的统计数据正在更新。该工具显示我们的磁盘已满。我看到其中一个磁盘的繁忙时间百分比非常高。
现在 sqlagent 正在按字母顺序对后续数据库进行相同的操作!我们确实启用了自动更新统计信息 - 但我认为这是根据需要发生的。我现在没有启用任何统计信息更新作业(据我所知 - 并且作业监视器没有显示任何正在运行的作业),所以我不确定是什么原因造成的。此外,现在是半夜,因此这些系统上不会有用户更新行。
http://support.microsoft.com/default.aspx?scid=kb;en-us;195565- 证实了我对自动统计的按需特性的想法。
昨晚 6:30 左右也发生了同样的事情 - 在同一个大型数据库中 - 来自一些精选统计员的声明。
sqlagent 正在运行命令。
磁盘位于 SAN 上,我们正在运行最新版本的 sql 2005。
答案1
答案2
今晚关闭自动更新统计数据,看看问题是否重现。如果没有,那么您可能需要自行管理统计数据更新。