zfs 数据集在文件系统上消失但仍保留在 zfs 列表中

zfs 数据集在文件系统上消失但仍保留在 zfs 列表中

我的 Ubuntu 18.04.3 LTS 存储服务器已经运行了半年,非常稳定。它使用 zfs (raidZ) 作为存储分区。

该服务器在某种程度上作为另一台服务器的备份镜像运行,该服务器使用 znapzend 频繁发送快照。(我有点感觉当 znapzend 开始发送时池会消失,但为什么只有存储数据集而不是数据库,我不知道)如果我没记错的话,两台服务器应该具有相同的 zfs 池设置,包括快照和配额。两台服务器最近都进行了完整的系统更新。“主”服务器显示数据集没有问题,它们并没有在那里消失。

备份上的池已设置 refreservation 和 refquota,以便为快照保留足够的空间。

pool                          quota           none       default
pool                          refquota        none       default
pool                          refreservation  none       default
pool/db                       quota           none       default
pool/db                       refquota        100G       local
pool/db                       refreservation  100G       local
pool/storage                  quota           none       default
pool/storage                  refquota        2T         local
pool/storage                  refreservation  2T         local

在对整个 Ubuntu 系统进行最新更新之后,池/存储不断从文件系统中消失,但仍在 zfs 中列出。

root@server:~# mount | grep pool
pool on /pool type zfs (rw,xattr,noacl)
pool/db on /pool/db type zfs (rw,xattr,noacl)
root@server:~# zfs list
NAME         USED  AVAIL  REFER  MOUNTPOINT
pool        2.11T  1.40T   104K  /pool
pool/db   109G  90.6G  9.40G  /pool/db
pool/storage  2.01T  1.39T   629G  /pool/storage

我的监控报告每天几次池/存储返回文件系统然后再次消失:

5:21 报告,数据集返回:

Host:     backup
Alias:    backup
Address:  192.168.1.11
Service:  Filesystem /pool/storage
Event:    UNKN -> OK
Output:   OK - 52.9% used (1.06 of 2.00 TB), trend: +342.55 GB / 24 hours
Perfdata: /pool/storage=1109740.5;1677721.6;1887436.8;0;2097152 fs_size=2097152;;;; growth=4962844.988964;;;; trend=350775.45978;;;0;87381.333333

6:07 再次消失:

Host:     backup
Alias:    backup
Address:  192.168.1.11
Service:  Filesystem /pool/storage
Event:    OK -> UNKN
Output:   UNKN - filesystem not found
Perfdata: 

我也没有看到 zpool status 有什么问题

root@server:~# zpool status
  pool: pool
 state: ONLINE
  scan: scrub repaired 0B in 4h43m with 0 errors on Tue Aug 27 15:01:28 2019
config:

                NAME        STATE     READ WRITE CKSUM
                pool        ONLINE       0     0     0
                  raidz1-0  ONLINE       0     0     0
                    sda     ONLINE       0     0     0
                    sdb     ONLINE       0     0     0

这是怎么回事?我该怎么做才能调查此行为?

相关内容