“多重声明的块”是当块似乎属于多个文件时 fsck 报告的一种错误。这会导致数据损坏,因为写入其中一个文件时两个文件都会发生更改。
但区块被多重认领的最初原因可能是什么?它们是如何创建的以及我如何避免它们?
答案1
就像声明的那样很早就由左宗棠他自己,可以有两个即时的原因 ”倍增已声明的区块” 由 fsck 报告:
一种是索引节点表中的一个或多个块被写入错误的位置,从而覆盖索引节点表中的另一个块。
这通常是由某些内核错误触发的。 (你可以读到 T'Tso 能够描述一些容易识别的模式 => 不是随机的,因为外部引起的任何虚假损坏都会产生。)。
这种情况特别发生在 EXT 系列文件系统新功能的早期,主要是因为罕见的竞争条件:
- 和比加洛克
- 延迟分配,
- 最近,正如指出的那样弗罗斯特舒茨在OP的评论中,关于 fast_commit 功能。
第二种情况是块分配位图被损坏,使得一些正在使用的块被标记为空闲,并且然后重新挂载文件系统并将文件写入文件系统,以便为新文件重新分配块。
在一些损坏之后,这些问题的出现更加随机,其根本原因不太可能是内核错误。
这包括不干净的关闭、写得不好的应用程序、与硬件环境相关的不合理的安装选项等。内存和其他硬件故障。
当然,人们不应该忘记fsck
自己产生错误报告的可能责任,甚至在尝试修复某些其他文件系统不一致时甚至不应该忘记问题的根本原因,实际上已经有
你怎样才能避免它们,那么,根据上面的内容,你只能期望限制它们发生的概率:
- 保持低科技含量;-) 避免在全新功能可用后立即对其进行设置,
- 使用ECC内存和可靠的存储设备,
- 微调您的文件系统选项(有时提供
mkfs
)并明智地选择安装选项(与环境保持一致), - 在沙盒中运行所有不受信任的软件。
- 最终作为 T'Tso 工作如果发生崩溃,请运行
e2croncheck
:
我现在实际上正在做的是每次崩溃后,我都会重新启动,登录并在登录后立即运行 e2croncheck。这使我能够在任何潜在的文件系统损坏变得严重之前注意到它...... E2croncheck 更方便,因为当 e2fsck 在一个终端窗口中运行时我可以做其他事情。
答案2
网络/共享存储(例如光纤通道、iscsi、SAN、JBOD 设备等)可能会出现多重声明的块。使用这些设置,如果配置不正确,则两个系统(虚拟或裸机)可以访问相同的块。当设置不正确时,可以将块分配给不同的块设备,并分配给不同的设备。由于这些系统不知道其他系统正在对块执行什么操作,因此它们可能会导致这些错误。
为了避免这些错误,请确保将块设备仅分配给一台设备,从而将对块设备的访问限制为一个系统。确保尽可能使用“锁”。锁是指 blockdev 被标记为正在使用,因此可以被另一个系统使用(这是简化的解释)。