网站瘫痪了,只有我一个人。我应该如何诊断(检查哪些日志文件?)(Nginx + php5-fpm)

网站瘫痪了,只有我一个人。我应该如何诊断(检查哪些日志文件?)(Nginx + php5-fpm)

概括

我一直在 VPS 上运行一个网站,第一次遇到了宕机(约 4 分钟)。但是该网站只对我而言宕机,我在明显的日志文件中看不到任何内容。我应该在哪里查看?

php5-fpm.log 中没有任何时间或 20 分钟内的条目。错误日志中没有任何内容。

nginx 访问日志中的唯一条目是“它是否对所有人都关闭了,还是只有我的服务关闭了”。

我还应该去哪里寻找?

详细的

服务器:Ubuntu 12.04,LEMP 堆栈

我收到错误信息:“此网页不可用”。但是根据其他 ping 检查器显示,只有我家的网站无法访问(我家的电脑无法使用)。其他网站都运行正常。

它只停机了几分钟,我没时间找别人试试。我向我的域名提供商核实了一下,他们说没有停机时间。

Nginx 访问日志:

(Advagg 是一个聚合 css 和 js 文件的 drupal 模块。如果它失败了,网站就会出现没有样式的情况)。

127.0.0.1 - - [06/Mar/2014:22:24:20 +0000] "GET /authcache-varnish-get-key HTTP/1.1" 302 46 "http://www.downforeveryoneorjustme.com/mysite.net" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.146 Safari/537.36"
127.0.0.1 - - [06/Mar/2014:22:24:21 +0000] "GET / HTTP/1.1" 302 46 "http://www.downforeveryoneorjustme.com/mysite.net" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.146 Safari/537.36"
127.0.0.1 - - [06/Mar/2014:22:24:38 +0000] "GET /sites/default/files/advagg_css/css__1394144677.css HTTP/1.1" 404 325 "-" "Drupal (+http://drupal.org/)"
127.0.0.1 - - [06/Mar/2014:22:24:39 +0000] "GET /sites/default/files/advagg_js/js__1394144677.js HTTP/1.1" 404 325 "-" "Drupal (+http://drupal.org/)"
127.0.0.1 - - [06/Mar/2014:22:25:00 +0000] "GET /sites/default/files/advagg_css/css__1394144700.css HTTP/1.1" 404 325 "-" "Drupal (+http://drupal.org/)"
127.0.0.1 - - [06/Mar/2014:22:25:01 +0000] "GET /sites/default/files/advagg_js/js__1394144700.js HTTP/1.1" 404 325 "-" "Drupal (+http://drupal.org/)"

答案1

除非您有(或可以获得)Netflow 或同等日志并仔细查看它们,否则您可能无法找出发生了什么(即使这样,这也是一项艰巨的工作)

通常,处理此类问题的最佳方法是进行监控,并掌握相关知识和工具,以便在问题发生时进行检查。作为网络管理员,您应该在几乎任何系统上安装一个简单的工具“mtr”(或 Windows 或 Android 等效工具)。它结合了 traceroute 和 ping,并显示网络问题出现的位置。

另一个工具(但需要更多工作/费用)是设置(或购买)系统监控,例如从远程系统使用 Nagios 和 Cacti。

虽然不可能知道导致停机的原因,但最可能的原因包括

  1. 您的 DSL 连接或等效连接已断开并重新连接,或者

  2. 出现路由异常,路由器宕机,因此在 BGP 重新收敛(即找到另一条路径)时,您失去了连接。这可能潜伏在您和服务器之间的任何地方。

相关内容