node.js、mongodb、redis，在 ubuntu 生产中性能下降，RAM 是空闲的，CPU 100%

Question 1

经过几天的反复试验，我很高兴地说我已经了解了瓶颈所在，我会将其发布在这里，以便其他人可以从我的发现中受益。

问题在于我与 socket.io 一起使用的发布/订阅连接，特别是 socket.io 用于处理套接字实例进程间通信的 RedisStore。

在意识到我可以使用 redis 轻松实现我自己的 pub/sub 版本后，我决定尝试一下，并从 socket.io 中删除了 redisStore，保留默认的内存存储（我不需要向所有连接的客户端广播，而只需要在可能连接在不同进程上的 2 个不同用户之间广播）

最初，我仅声明了 2 个全局 redis 连接 x 进程来处理每个连接客户端上的发布/订阅，应用程序使用的资源较少，但我仍然受到 CPU 使用率持续增长的影响，因此没有太大变化。但后来我决定尝试为每个客户端创建 2 个新的 redis 连接，以便仅在其会话中处理其发布/订阅，然后在用户断开连接后关闭连接。然后在生产中使用一天后，CPU 仍然在 0-5%... 宾果！没有进程重新启动，没有错误，具有我期望的性能。现在我可以说 node.js 很棒，很高兴选择它来构建这个应用程序。

幸运的是，redis 被设计用于处理许多并发连接（与 mongo 不同），默认情况下它设置为 10k，在单个 redis 实例上为大约 5k 个并发用户留下了空间，这对我来说目前已经足够了，但我读到它可以被推高到 64k 个并发连接，所以我相信这种架构应该足够稳固。

此时我正在考虑为 redis 实现某种连接池，以进一步优化它，但不确定这是否不会再次导致发布/订阅事件在连接上建立，除非每次都销毁并重新创建它们以清理它们。

无论如何，感谢您的回答，我很想知道您的想法，以及您是否有任何其他建议。

干杯。

Answer

经过几天的反复试验，我很高兴地说我已经了解了瓶颈所在，我会将其发布在这里，以便其他人可以从我的发现中受益。

问题在于我与 socket.io 一起使用的发布/订阅连接，特别是 socket.io 用于处理套接字实例进程间通信的 RedisStore。

在意识到我可以使用 redis 轻松实现我自己的 pub/sub 版本后，我决定尝试一下，并从 socket.io 中删除了 redisStore，保留默认的内存存储（我不需要向所有连接的客户端广播，而只需要在可能连接在不同进程上的 2 个不同用户之间广播）

最初，我仅声明了 2 个全局 redis 连接 x 进程来处理每个连接客户端上的发布/订阅，应用程序使用的资源较少，但我仍然受到 CPU 使用率持续增长的影响，因此没有太大变化。但后来我决定尝试为每个客户端创建 2 个新的 redis 连接，以便仅在其会话中处理其发布/订阅，然后在用户断开连接后关闭连接。然后在生产中使用一天后，CPU 仍然在 0-5%... 宾果！没有进程重新启动，没有错误，具有我期望的性能。现在我可以说 node.js 很棒，很高兴选择它来构建这个应用程序。

幸运的是，redis 被设计用于处理许多并发连接（与 mongo 不同），默认情况下它设置为 10k，在单个 redis 实例上为大约 5k 个并发用户留下了空间，这对我来说目前已经足够了，但我读到它可以被推高到 64k 个并发连接，所以我相信这种架构应该足够稳固。

此时我正在考虑为 redis 实现某种连接池，以进一步优化它，但不确定这是否不会再次导致发布/订阅事件在连接上建立，除非每次都销毁并重新创建它们以清理它们。

无论如何，感谢您的回答，我很想知道您的想法，以及您是否有任何其他建议。

干杯。

Question 2

您有源代码可以转储吗？可能是数据库连接未关闭？进程正在等待永不关闭的 HTTP 连接。

您能发布一些日志吗？

执行 ps -ef 并确保没有任何东西仍在运行。我见过 Web 进程留下僵尸进程，除非您执行 kill -9 ，否则它们不会消失。有时关机不起作用或无法完全起作用，这些线程或进程会占用 RAM，有时还会占用 CPU。

它可能是代码中某处的无限循环，或者是持有数据库连接的崩溃进程。

您使用了哪些 NPM 模块？它们都是最新的吗？

你捕获到了异常吗？请参见： http://geoff.greer.fm/2012/06/10/nodejs-dealing-with-errors/ 看： https://stackoverflow.com/questions/10122245/capture-node-js-crash-reason

一般提示：

http://clock.co.uk/tech-blogs/preventing-http-raise-hangup-error-on-destroyed-socket-write-from-crashing-your-nodejs-server

http://blog.nodejitsu.com/keep-a-nodejs-server-up-with-forever

http://hectorcorrea.com/blog/running-a-node-js-web-site-in-production-a-beginners-guide

https://stackoverflow.com/questions/1911015/how-to-debug-node-js-applications

https://github.com/dannycoates/node-inspector

http://elegantcode.com/2011/01/14/taking-baby-steps-with-node-js-debugging-with-node-inspector/

Answer