httpd 进程 CPU 占用高

Question 1

尝试将 %P（和 %D）添加到您的日志文件 - 然后您应该能够将“top”中看到的内容与您的访问日志关联起来。

Answer

尝试将 %P（和 %D）添加到您的日志文件 - 然后您应该能够将“top”中看到的内容与您的访问日志关联起来。

Question 2

[通知] 子进程 pid 22782 退出信号分段错误 (11)

这里肯定出了问题，您应该将其添加ulimit -c unlimited到开头，/etc/init.d/httpd以便在下次出现段错误时获取核心转储。mod_jk 可能是问题的根源，因为日志中有一个与 mod_jk 相关的错误。

Answer

[通知] 子进程 pid 22782 退出信号分段错误 (11)

这里肯定出了问题，您应该将其添加ulimit -c unlimited到开头，/etc/init.d/httpd以便在下次出现段错误时获取核心转储。mod_jk 可能是问题的根源，因为日志中有一个与 mod_jk 相关的错误。

Question 3

我在列表中看到了 mod_perl。这个站点是用 PERL 编写的应用程序吗？如果是这样，那么编写不当的 PERL 代码就是问题的根源。

同样的评价也适用于 PHP。PHP 应用程序不以性能著称，而 CMS 应用程序则以资源消耗大而闻名。如果您是托管服务提供商，最好禁止此 CMS 软件包或收取更高的费用以弥补额外的资源。

但是，如果您是为了自己使用而运行此 CMS，由于它是开源的，您应该在 StackOverflow 上发布另一个问题，命名软件包并询问如何追踪和修复编写不当的代码。

Answer

我在列表中看到了 mod_perl。这个站点是用 PERL 编写的应用程序吗？如果是这样，那么编写不当的 PERL 代码就是问题的根源。

同样的评价也适用于 PHP。PHP 应用程序不以性能著称，而 CMS 应用程序则以资源消耗大而闻名。如果您是托管服务提供商，最好禁止此 CMS 软件包或收取更高的费用以弥补额外的资源。

但是，如果您是为了自己使用而运行此 CMS，由于它是开源的，您应该在 StackOverflow 上发布另一个问题，命名软件包并询问如何追踪和修复编写不当的代码。

Question 4

我再也没有看到分段错误，但我仍然看到来自 httpd 的高 CPU 使用率。我能够对具有 CPU 的 httpd 进程运行 strace，并得到以下结果：

   # strace -c -p 28964
    Process 28964 attached - interrupt to quit
    ^CProcess 28964 detached
    % time     seconds  usecs/call     calls    errors syscall
    ------ ----------- ----------- --------- --------- ----------------
     88.94    0.006093           0     98299      4562 lstat
      3.01    0.000206           0      2740           getcwd
      2.28    0.000156           0      2158         2 read
      2.26    0.000155           0       541        37 open
      1.68    0.000115           0      1321      1321 readlink
      1.52    0.000104           0      1678       822 access
      0.32    0.000022           0       502           fstat
      0.00    0.000000           0        25           write
      0.00    0.000000           0       507           close
      0.00    0.000000           0       547       478 stat
      0.00    0.000000           0        23           poll
      0.00    0.000000           0         2           rt_sigaction
      0.00    0.000000           0         2           rt_sigprocmask
      0.00    0.000000           0         2           writev
      0.00    0.000000           0         3           setitimer
      0.00    0.000000           0         1           sendfile
 ...
    ------ ----------- ----------- --------- --------- ----------------
    100.00    0.006851                108381      7224 total

lstat 中的 4562 错误是同一类型的错误，并在日志文件中显示如下：

# strace -f -t -o /var/log/strace.output -p 28964

strace.输出

28964 07:10:38 lstat("/var", {st_mode=S_IFDIR|0755, st_size=4096, ...}) = 0
28964 07:10:38 lstat("/var/www", {st_mode=S_IFDIR|0755, st_size=94, ...}) = 0
28964 07:10:38 lstat("/var/www/vhosts", {st_mode=S_IFDIR|0755, st_size=4096, ...}) = 0
28964 07:10:38 lstat("/var/www/vhosts/example.com", {st_mode=S_IFDIR|0777, st_size=4096, ...}) = 0
28964 07:10:38 lstat("/var/www/vhosts/example.com/httpdocs", {st_mode=S_IFDIR|0777, st_size=4096, ...}) = 0
28964 07:10:38 lstat("/var/www/vhosts/example.com/httpdocs/sites", {st_mode=S_IFDIR|0755, st_size=30, ...}) = 0
28964 07:10:38 lstat("/var/www/vhosts/example.com/httpdocs/sites/all", {st_mode=S_IFDIR|0755, st_size=66, ...}) = 0
28964 07:10:38 lstat("/var/www/vhosts/example.com/httpdocs/sites/all/modules", {st_mode=S_IFDIR|0755, st_size=12288, ...}) = 0
28964 07:10:38 lstat("/var/www/vhosts/example.com/httpdocs/sites/all/modules/views", {st_mode=S_IFDIR|0755, st_size=4096, ...}) = 0
28964 07:10:38 lstat("/var/www/vhosts/example.com/httpdocs/sites/all/modules/views/includes", {st_mode=S_IFDIR|0755, st_size=4096, ...}) = 0
28964 07:10:38 lstat("/var/www/vhosts/example.com/httpdocs/sites/all/modules/views/includes/sites", 0x7fff1e627370) = -1 ENOENT (No such file or directory)

上面列出的文件夹都位于本网站目录中，是 Drupal CMS 的一部分。但是列出的最后一个

/var/www/vhosts/example.com/httpdocs/sites/all/modules/views/includes/sites

不存在，而且实际上应该是

/var/www/vhosts/example.com/httpdocs/sites

它确实存在。看起来 lstat 正在尝试读取一个不存在的目录....？

-1 ENOENT (No such file or directory)

解决此问题并找出丢失目录错误根源的最佳方法是什么？

Answer