在过去的几天里,我的网站性能非常低迷,查询执行时间很长。本周我的 CPU 使用率达到 100% 左右 4 次。以下是top
其中一次的输出
top - 00:08:03 up 3 days, 21:47, 2 users, load average: 6.06, 1.95, 0.84
Tasks: 92 total, 2 running, 90 sleeping, 0 stopped, 0 zombie
%Cpu(s): 86.1 us, 12.9 sy, 0.0 ni, 0.0 id, 0.0 wa, 1.0 hi, 0.0 si, 0.0 st
KiB Mem: 1017948 total, 773520 used, 244428 free, 107200 buffers
KiB Swap: 0 total, 0 used, 0 free. 257228 cached Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
28433 www-data 20 0 854660 69288 5608 S 98.7 6.8 0:47.36 apache2
28469 www-data 20 0 529692 7692 3012 S 0.7 0.8 0:00.13 apache2
28514 root 20 0 24820 1488 1064 R 0.7 0.1 0:00.08 top
25 root 20 0 0 0 0 S 0.3 0.0 1:00.70 kworker/0:1
28518 postgres 20 0 370016 6984 4276 S 0.3 0.7 0:00.01 postgres
1 root 20 0 33384 1288 0 S 0.0 0.1 0:11.70 init
2 root 20 0 0 0 0 S 0.0 0.0 0:00.13 kthreadd
3 root 20 0 0 0 0 S 0.0 0.0 0:09.40 ksoftirqd/0
5 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H
7 root 20 0 0 0 0 S 0.0 0.0 0:45.06 rcu_sched
8 root 20 0 0 0 0 R 0.0 0.0 1:54.47 rcuos/0
9 root 20 0 0 0 0 S 0.0 0.0 0:00.00 rcu_bh
10 root 20 0 0 0 0 S 0.0 0.0 0:00.00 rcuob/0
11 root rt 0 0 0 0 S 0.0 0.0 0:00.00 migration/0
Apache 似乎占用了大量 CPU,但我不知道原因。直到几天前,它都运行正常。我通过删除未使用的模块优化了 Apache,将其调整为只有少数备用子进程运行,但这似乎没有什么区别。我还安装了mod-evasive
和mod-qos
以防止 DDOS。这是我的 Apache 配置
Timeout 30
KeepAlive On
MaxKeepAliveRequests 100
KeepAliveTimeout 5
<IfModule mpm_prefork_module>
StartServers 1
MinSpareServers 1
MaxSpareServers 3
MaxClients 10
MaxRequestsPerChild 3000
</IfModule>
<IfModule mpm_worker_module>
StartServers 1
MinSpareThreads 5
MaxSpareThreads 15
ThreadLimit 25
ThreadsPerChild 5
MaxClients 25
MaxRequestsPerChild 200
</IfModule>
<IfModule mpm_event_module>
StartServers 1
MinSpareThreads 5
MaxSpareThreads 15
ThreadLimit 25
ThreadsPerChild 5
MaxClients 25
MaxRequestsPerChild 200
</IfModule>
<IfModule mod_spamhaus.c>
MS_METHODS POST,PUT,OPTIONS,CONNECT
MS_WhiteList /etc/spamhaus.wl
MS_CacheSize 256
</IfModule>
这是我的 VirtualHost 配置
<VirtualHost *:80>
RewriteEngine On
RewriteCond %{HTTP_HOST} ^example.com [nocase]
RewriteRule ^(.*) http://www.example.com$1 [last,redirect=301]
ServerName example.com
ServerAlias www.example.com
ServerAdmin [email protected]
WSGIDaemonProcess example python-path=/home/abc/example:/home/abc/example/env/lib/python2.7/site-packages
WSGIProcessGroup example
WSGIApplicationGroup %{GLOBAL}
WSGIScriptAlias / /home/abc/example/wsgi.py
DocumentRoot /home/abc/example
<Directory />
Require all granted
</Directory>
Alias /static/ /home/abc/example/static/
<Directory /home/abc/example/static>
Order deny,allow
Allow from all
</Directory>
Alias /media/ /home/abc/example/media/
<Directory /home/abc/example/media>
Order deny,allow
Allow from all
</Directory>
ErrorLog ${APACHE_LOG_DIR}/error.log
CustomLog ${APACHE_LOG_DIR}/access.log combined
</VirtualHost>
这是我的.htaccess
文件
<FilesMatch "\.(ico|svg|woff|eot|ttf)$">
Header set Cache-Control "max-age=31536000, public"
</FilesMatch>
<FilesMatch "\.(jpg|png|gif|css|js|json)$">
Header set Cache-Control "max-age=604800, public"
</FilesMatch>
<IfModule mod_mime.c>
AddType application/javascript js
AddType application/vnd.ms-fontobject eot
AddType application/x-font-ttf ttf ttc
AddType font/opentype otf
AddType application/x-font-woff woff
AddType image/svg+xml svg svgz
AddEncoding gzip svgz
</Ifmodule>
<IfModule mod_deflate.c>
AddOutputFilterByType DEFLATE text/html text/plain text/css application/json
AddOutputFilterByType DEFLATE application/javascript
AddOutputFilterByType DEFLATE text/xml application/xml text/x-component
AddOutputFilterByType DEFLATE application/xhtml+xml application/rss+xml application/atom+xml
AddOutputFilterByType DEFLATE image/x-icon image/svg+xml application/vnd.ms-fontobject application/x-font-ttf font/opentype
</Ifmodule>
我使用 memcached 来缓存大多数查询。包含少量基本查询的网页速度更快(但仍然不如以前快),而包含复杂查询的网页则需要花费大量时间。此类网页的服务器响应时间已从 0.2 秒增加到 4 秒(使用 Google PageSpeed Insights 测量)。
我使用的是 PostgreSQL 9.3 数据库。以下是我使用 PgTune 调整的 postgresql.conf。
default_statistics_target = 50
maintenance_work_mem = 60MB
constraint_exclusion = on
checkpoint_completion_target = 0.9
effective_cache_size = 704MB
work_mem = 6MB
wal_buffers = 8MB
checkpoint_segments = 16
shared_buffers = 240MB
max_connections = 80
以下是过去一个月的 CPU、磁盘和带宽使用情况图表
虽然带宽在过去一周左右有所增加,但实际流量并没有增加。过去 15-20 天,我平均每天有 1500 名访客。带宽使用量的增加可能是机器人活动的增加。
我的网站是一个托管在 droplet 上的 Django 应用程序,配置为 - 1GB Ram、30GB SSD 磁盘、Ubuntu 14.04 x64。我已经尝试了所有我能想到的可能的方法,但无论如何也找不到问题所在。我不太擅长处理服务器,现在我唯一能想到的就是从 Apache 切换到 nginx,从 PostgreSQL 切换到 MySQL。任何能帮助我弄清楚如何解决这个问题的建议都将不胜感激。
答案1
删除未使用的模块有时会产生相反的效果,例如服务器无法有效地缓存,但假设这不是问题,我认为可能发生的另一个问题是内存不足,因此发生所谓的“磁盘抖动”(高 IO),这在虚拟主机上尤其有可能。同一虚拟主机上的邻居可能发布了一个新网站,占用了更大的内存,而您则没有内存。此外,查看分析数据以找出流量突然激增的原因以及流量来自何处。