我有一个 5 节点生产 MariaDb 10.3 Galera 集群,已经运行了一年多。在过去的几周里,任何客户端建立数据库连接都需要 10 多秒。我们的代码在 Python 中运行,但即使使用桌面客户端也需要 10 到 13 秒才能连接。连接后,一切都很好。我检查过的另一个站点中有一个类似的集群在运行,连接大约需要 1 秒或更短的时间。在任何给定时间连接的活跃客户端都少于 10 个,并且在负载方面没有任何额外的东西。我甚至不知道从哪里开始寻找......
答案1
通过终端查看日志后,tail -f /var/log/syslog | grep mysql
我每隔几秒就会看到 DNS 解析错误。添加跳过名称解析修改 mysql.cnf 文件并重启节点后,问题就解决了。问题出现的原因是由于下游路由器阻止了子网的互联网访问。这是一个封闭系统,但可以通过 GRE 隧道访问互联网。