MySQL 错误：无法创建线程来处理由许多 Gunicorn API 请求触发的新连接（errno = 11）

Question 1

max_connections        = 20000

太高了。200 更现实。如果你尝试使用 20K 连接打开同时，你的系统也存在架构问题。

API 请求应该在几毫秒内就可以完成访问，从而不会堆积 20K 个实时连接。

如果你的客户端（Apache、Tomcat 等）允许 20K 线程运行，那么那是一个问题。

状态/变量分析

观察结果：

版本：5.7.23-0ubuntu0.16.04.1
16 GB RAM
正常运行时间 = 05:08:49；某些 GLOBAL STATUS 值可能尚无意义。
您没有在 Windows 上运行。
运行 64 位版本
您似乎正在运行全部（或大部分）InnoDB。

更重要的问题：

很多SHOW命令——发生了什么事？

许多查询使用内部临时表或进行全表扫描。降低long_query_time并打开 slowlog 以查看最糟糕的情况。

详细信息和其他观察结果：

( innodb_buffer_pool_size / _ram ) = 2048M / 16384M = 12.5%-- 用于 InnoDB 缓冲池的 RAM 百分比

( (key_buffer_size / 0.20 + innodb_buffer_pool_size / 0.70) / _ram ) = (16M / 0.20 + 2048M / 0.70) / 16384M = 18.3%-- 大多数可用 RAM 应用于缓存。--http://mysql.rjweb.org/doc.php/memory

( Innodb_buffer_pool_pages_free / Innodb_buffer_pool_pages_total ) = 67,332 / 131056 = 51.4%-- 缓冲池的百分比当前未使用 -- innodb_buffer_pool_size 是否大于必要的？

( Uptime / 60 * innodb_log_file_size / Innodb_os_log_written ) = 18,529 / 60 * 256M / 122842112 = 674-- InnoDB 日志轮换之间的分钟数从 5.6.8 开始，可以动态更改；请确保也更改 my.cnf。--（轮换之间建议 60 分钟有点武断。）调整 innodb_log_file_size。（无法在 AWS 中更改。）

( innodb_flush_method ) = innodb_flush_method =-- InnoDB 应如何要求操作系统写入块。建议使用 O_DIRECT 或 O_ALL_DIRECT (Percona) 来避免双重缓冲。（至少对于 Unix 而言。）有关 O_ALL_DIRECT 的注意事项，请参阅 chrischandler

( Com_rollback ) = 65,020 / 18529 = 3.5 /sec-- InnoDB 中的回滚。-- 回滚频率过高可能表明应用程序逻辑效率低下。

( Handler_rollback ) = 35,725 / 18529 = 1.9 /sec ——为什么会有这么多的回滚？

( Innodb_rows_deleted / Innodb_rows_inserted ) = 250,597 / 306605 = 0.817-- 流失 -- “不要排队，直接执行。”（如果 MySQL 被用作队列。）

( innodb_flush_neighbors ) = 1-- 将块写入磁盘时进行小幅优化。-- 对于 SSD 驱动器使用 0；对于 HDD 使用 1。

( innodb_io_capacity ) = 200-- 磁盘每秒的 I/O 操作数。慢速驱动器为 100；旋转驱动器为 200；SSD 为 1000-2000；乘以 RAID 因子。

( innodb_print_all_deadlocks ) = innodb_print_all_deadlocks = OFF-- 是否记录所有死锁。-- 如果您受到死锁的困扰，请启用此功能。注意：如果您有大量死锁，这可能会将大量数据写入磁盘。

( (Com_show_create_table + Com_show_fields) / Questions ) = (1 + 19522) / 140291 = 13.9%-- 不合理的框架 -- 花费大量精力重新发现模式。-- 向第三方供应商投诉。

( local_infile ) = local_infile = ON -- local_infile = ON 存在潜在的安全问题

( (Queries-Questions)/Queries ) = (24488180-140291)/24488180 = 99.4%-- 存储例程内的查询比例。--（如果很高的话还不错；但它会影响其他一些结论的有效性。）

( Created_tmp_disk_tables ) = 19,628 / 18529 = 1.1 /sec-- 创建频率磁盘“临时”表作为复杂 SELECT 的一部分 - 增加 tmp_table_size 和 max_heap_table_size。检查临时表的规则，了解何时使用 MEMORY 而不是 MyISAM。也许较小的架构或查询更改可以避免使用 MyISAM。更好的索引和查询的重新表述更有可能有所帮助。

( Created_tmp_disk_tables / Questions ) = 19,628 / 140291 = 14.0%-- 需要磁盘临时表的查询的百分比。-- 更好的索引/没有 blob/等等。

( Created_tmp_disk_tables / Created_tmp_tables ) = 19,628 / 22476 = 87.3%-- 溢出到磁盘的临时表的百分比 -- 可能增加 tmp_table_size 和 max_heap_table_size；改进索引；避免 blob 等。

( Com_rollback / Com_commit ) = 65,020 / 765 = 8499.3%-- 回滚：提交率 -- 回滚成本高昂；更改应用程序逻辑

( (Com_insert + Com_update + Com_delete + Com_replace) / Com_commit ) = (669 + 24 + 164 + 1) / 765 = 1.12-- 每次提交的语句数（假设所有都是 InnoDB）-- 低：可能有助于将查询分组到事务中；高：长事务会给各种事物带来压力。

( Select_scan ) = 25,262 / 18529 = 1.4 /sec-- 全表扫描 -- 添加索引/优化查询（除非它们是小表）

( Select_scan / Com_select ) = 25,262 / 38182 = 66.2%-- 执行全表扫描的选择百分比。（可能会被存储例程欺骗。）-- 添加索引/优化查询

( innodb_autoinc_lock_mode ) = 1-- Galera：愿望 2 -- 2 = “交错”；1 = “连续”是典型的；0 = “传统”。

( slow_query_log ) = slow_query_log = OFF-- 是否记录慢速查询。（5.1.12）

( long_query_time ) = 10-- 定义“慢速”查询的截止时间（秒）。-- 建议 2

( Aborted_clients / Connections ) = 1,010 / 1457 = 69.3%-- 由于超时导致线程中断 -- 增加 wait_timeout；最好使用 disconnect

( thread_cache_size ) = 500-- 需要保留多少个额外进程（使用线程池时不相关）（从 5.6.8 开始自动调整大小；基于 max_connections）

( thread_cache_size / max_connections ) = 500 / 500 = 100.0%

( thread_cache_size / Max_used_connections ) = 500 / 136 = 367.6% -- 线程缓存大于可能的连接数没有任何好处。浪费空间才是缺点。

异常大：

Com_kill = 0.39 /HR
Com_show_charsets = 0.39 /HR
Com_show_fields = 1.1 /sec
Com_show_slave_hosts = 0.39 /HR
Com_show_storage_engines = 0.78 /HR
Com_show_warnings = 38 /HR
Handler_read_next / Handler_read_key = 5,206
Innodb_dblwr_pages_written / Innodb_dblwr_writes = 62.7
Performance_schema_file_instances_lost = 1
gtid_executed_compression_period = 0.054 /sec
wait_timeout = 1.0e+6

异常字符串：

ft_boolean_syntax = + -><()~*:&
innodb_fast_shutdown = 1
optimizer_trace = enabled=off,one_line=off
optimizer_trace_features = greedy_search=on, range_optimizer=on, dynamic_range=on, repeated_subselect=on
session_track_system_variables = time_zone, autocommit, character_set_client, character_set_results, character_set_connection
slave_rows_search_algorithms = TABLE_SCAN,INDEX_SCAN

Answer

max_connections        = 20000

太高了。200 更现实。如果你尝试使用 20K 连接打开同时，你的系统也存在架构问题。

API 请求应该在几毫秒内就可以完成访问，从而不会堆积 20K 个实时连接。

如果你的客户端（Apache、Tomcat 等）允许 20K 线程运行，那么那是一个问题。

状态/变量分析

观察结果：

版本：5.7.23-0ubuntu0.16.04.1
16 GB RAM
正常运行时间 = 05:08:49；某些 GLOBAL STATUS 值可能尚无意义。
您没有在 Windows 上运行。
运行 64 位版本
您似乎正在运行全部（或大部分）InnoDB。