Amazon EC2 实例 - m1.medium Ubuntu 12.04 - 三天前开始崩溃

Amazon EC2 实例 - m1.medium Ubuntu 12.04 - 三天前开始崩溃

环境:

Amazon EC2 Instance - m1.medium
Ubuntu 12.04
Apache 2.2.22 - Running a Drupal Site
Using MySQL DB Server

RAM info:

~$ free -gt
         total       used       free     shared    buffers     cached
Mem:             3          1          2          0          0          0
-/+ buffers/cache:          0          2
Swap:            0          0          0
Total:           3          1          2

Hard drive info:

Filesystem      Size  Used Avail Use% Mounted on
/dev/xvda1      7.9G  4.7G  2.9G  62% /
udev            1.9G  8.0K  1.9G   1% /dev
tmpfs           751M  180K  750M   1% /run
none            5.0M     0  5.0M   0% /run/lock
none            1.9G     0  1.9G   0% /run/shm
/dev/xvdb       394G  199M  374G   1% /mnt

问题

大约两天前,该网站开始出现故障,因为 MySQL 服务器被 Apache 关闭,并显示以下消息:

kernel: [2963685.664359] [31716]   106 31716   226946    22748   0
        0             0 mysqld
kernel: [2963685.664730] Out of memory: Kill process 31716 (mysqld) 
        score 23 or sacrifice child
kernel: [2963685.664764] Killed process 31716 (mysqld) 
        total-vm:907784kB, anon-rss:90992kB, file-rss:0kB
kernel: [2963686.153608] init: mysql main process (31716)
        killed by KILL signal
kernel: [2963686.169294] init: mysql main process ended, respawning

这表明虚拟机占用了 0.9GB,但我的 RAM 有 2GB 可用,因此仍有 1GB 可用。我知道在 Linux 中应用程序可以分配比物理可用内存更多的内存。我不知道这是否是问题所在,这是第一次发生这种情况。显然,MySQL 服务器尝试重新启动,但显然没有内存可供其使用,因此无法重新启动。这是它的错误日志:

Plugin 'FEDERATED' is disabled.
The InnoDB memory heap is disabled
Mutexes and rw_locks use GCC atomic builtins
Compressed tables use zlib 1.2.3.4
Initializing buffer pool, size = 128.0M
InnoDB: mmap(137363456 bytes) failed; errno 12
Completed initialization of buffer pool
Fatal error: cannot allocate memory for the buffer pool
Plugin 'InnoDB' init function returned error.
Plugin 'InnoDB' registration as a STORAGE ENGINE failed.
Unknown/unsupported storage engine: InnoDB
[ERROR] Aborting

[Note] /usr/sbin/mysqld: Shutdown complete

我只是重启了 Mysql 服务。大约两个小时后,它又出现了。我重启了它。然后 9 小时后,它又出现了。于是我想到了 apache.conf 的 MaxClients 参数,于是我去查看了一下。它被设置为 150。我决定把它降到 60。如下所示:

<IfModule mpm_prefork_module>
    ...
    MaxClients            60
</IfModule>

<IfModule mpm_worker_module>
    ...
    MaxClients            60
</IfModule>

<IfModule mpm_event_module>
    ...
    MaxClients           60
</IfModule>

完成上述操作后,我重启了 apache2 服务,一天中四分之三的时间里,一切都运行顺利。从晚上开始,MySQL 服务再次关闭,但这次它不是被 Apache2 服务杀死的。相反,它调用了 OOM-Killer 并显示以下消息:

kernel: [3104680.005312] mysqld invoked oom-killer: gfp_mask=0x201da, order=0, 
                         oom_adj=0, oom_score_adj=0
kernel: [3104680.005351]  [<ffffffff81119795>] oom_kill_process+0x85/0xb0
kernel: [3104680.548860] init: mysql main process (30821) killed by KILL signal

现在我没主意了。一些文章指出,理想的做法是使用以下命令更改内核行为(将其包含在文件 /etc/sysctl.conf 中)

vm.overcommit_memory = 2
vm.overcommit_ratio = 80

因此不会发生过度承诺。我想知道这是不是可行的方法?请记住,我不是服务器管理员,我只有基础知识。

提前致谢。

相关内容