我有这种情况:
srv01 srv02 srv03
srv03 上有一个 gluster 卷“vol1”,所有服务器都可以使用它来进行 i/o。vol1 包含大量混合侧图像,大小从几 kbs 到 3-4Mb 不等,总量约为 1.5TB。
Gluster 版本是 3.6.2
这不是一个万灵药,需要一些调整,但效果很好。
现在我必须将 srv03 的砖块复制到其他服务器。
问题是srv03的cpu飙升到100%,无法满足正常请求。网络流量很低。
选项包括:
cluster.data-self-heal-algorithm:完整
cluster.self-heal-daemon:关闭
性能.缓存大小: 1gb
我必须在复制运行时保持服务运行,欢迎提出建议
答案1
我正在处理类似的情况。如果你的瓶颈是 CPU,我认为减少 CPUcluster.background-self-heal-count
应该会有所帮助(默认值为 16)。换句话说,“当你的客户端尝试打开 17 个文件时,它会在第 17 个文件上挂起,等待自我修复”(https://botbot.me/freenode/gluster/msg/45681458/)。