我的 Ubuntu 18.04.3 LTS 存储服务器已经运行了半年,非常稳定。它使用 zfs (raidZ) 作为存储分区。
该服务器在某种程度上作为另一台服务器的备份镜像运行,该服务器使用 znapzend 频繁发送快照。(我有点感觉当 znapzend 开始发送时池会消失,但为什么只有存储数据集而不是数据库,我不知道)如果我没记错的话,两台服务器应该具有相同的 zfs 池设置,包括快照和配额。两台服务器最近都进行了完整的系统更新。“主”服务器显示数据集没有问题,它们并没有在那里消失。
备份上的池已设置 refreservation 和 refquota,以便为快照保留足够的空间。
pool quota none default
pool refquota none default
pool refreservation none default
pool/db quota none default
pool/db refquota 100G local
pool/db refreservation 100G local
pool/storage quota none default
pool/storage refquota 2T local
pool/storage refreservation 2T local
在对整个 Ubuntu 系统进行最新更新之后,池/存储不断从文件系统中消失,但仍在 zfs 中列出。
root@server:~# mount | grep pool
pool on /pool type zfs (rw,xattr,noacl)
pool/db on /pool/db type zfs (rw,xattr,noacl)
root@server:~# zfs list
NAME USED AVAIL REFER MOUNTPOINT
pool 2.11T 1.40T 104K /pool
pool/db 109G 90.6G 9.40G /pool/db
pool/storage 2.01T 1.39T 629G /pool/storage
我的监控报告每天几次池/存储返回文件系统然后再次消失:
5:21 报告,数据集返回:
Host: backup
Alias: backup
Address: 192.168.1.11
Service: Filesystem /pool/storage
Event: UNKN -> OK
Output: OK - 52.9% used (1.06 of 2.00 TB), trend: +342.55 GB / 24 hours
Perfdata: /pool/storage=1109740.5;1677721.6;1887436.8;0;2097152 fs_size=2097152;;;; growth=4962844.988964;;;; trend=350775.45978;;;0;87381.333333
6:07 再次消失:
Host: backup
Alias: backup
Address: 192.168.1.11
Service: Filesystem /pool/storage
Event: OK -> UNKN
Output: UNKN - filesystem not found
Perfdata:
我也没有看到 zpool status 有什么问题
root@server:~# zpool status
pool: pool
state: ONLINE
scan: scrub repaired 0B in 4h43m with 0 errors on Tue Aug 27 15:01:28 2019
config:
NAME STATE READ WRITE CKSUM
pool ONLINE 0 0 0
raidz1-0 ONLINE 0 0 0
sda ONLINE 0 0 0
sdb ONLINE 0 0 0
这是怎么回事?我该怎么做才能调查此行为?