proxmox 上的 ZFS raidz3 存在 IO 问题

proxmox 上的 ZFS raidz3 存在 IO 问题

我正在运行 Proxmox 6.2-11,配备 256GB ECC RAM 和以下 raidz3 池:

pool: rpool
state: ONLINE
scan: scrub repaired 0B in 0 days 15:25:14 with 0 errors on Sun Jan 10 15:49:29 2021
config:

NAME STATE READ WRITE CKSUM
rpool ONLINE 0 0 0
raidz3-0 ONLINE 0 0 0
ata-HGST_HUS726T6TALE6L4_V8JDUHAR-part4 ONLINE 0 0 0
ata-HGST_HUS726T6TALE6L4_V8JDWWAR-part4 ONLINE 0 0 0
ata-HGST_HUS726T6TALE6L4_V8JB5AYR-part4 ONLINE 0 0 0
ata-HGST_HUS726T6TALE6L4_V8JBYYTR-part4 ONLINE 0 0 0
ata-ST6000NM0115-1YZ110_ZAD9MHXH-part4 ONLINE 0 0 0
ata-ST6000NM0115-1YZ110_ZAD9M248-part4 ONLINE 0 0 0
ata-ST6000NM0115-1YZ110_ZAD9MQ9E-part4 ONLINE 0 0 0
ata-ST6000NM0115-1YZ110_ZAD9MN5A-part4 ONLINE 0 0 0

errors: No known data errors


NAME SIZE ALLOC FREE CKPOINT EXPANDSZ FRAG CAP DEDUP HEALTH ALTROOT
rpool 43.6T 9.71T 33.9T - - 10% 22% 1.00x ONLINE -

在 proxmox 主机上,几周以来我感觉 IO 等待时间大幅增加 (2-3%),通过 iotop 看到 txg_sync 最大 IO 为 95-99.99%。在其中一个客户机实例 /Debian/ 上,我可以看到 jdb2/vda1-8 大部分时间再次达到 99.99%。

客户机和主机上都有足够的可用 RAM。问题可能出在哪里?

答案1

升级到 PVE 6.3(ZFS 0.8.4 -> 0.8.6),问题暂时消失。

相关内容