Ubuntu 22.04 服务器在 fstrim 之后定期只读

Ubuntu 22.04 服务器在 fstrim 之后定期只读

运行 Dell 7625 服务器(AMD Epyc,2 x A30 GPU)用于中小型本地研究项目。

我们将原来的磁盘换成了 8TB 的三星 EVO 870s,其中一个运行操作系统。

每周当 fstrim 运行其周期时,磁盘都会变成只读状态,只能通过硬重启才能恢复。fsck 不执行任何操作,然后在 ss 完成后告诉我们一切正常

这让管理员和用户非常恼火。我们是否应该完全禁用 fstrim,并且只在有人有物理访问权限时手动运行它?

我们已尝试在日志文件中隔离进程失败的确切点(我们通过手动启动 fstrim 复制了该问题)。

磁盘是全新的(尽管这通常并不意味着什么),我们尝试旋转到另一个磁盘并得到相同的模式。

建议对 SSD 使用 fstrim 来延长磁盘的使用寿命,但停机成本远远超过购买新磁盘的 500 美元,并且所有内容都已同步,因此磁盘死机并不像每周不断重新启动服务器那样严重。

我想问题是:

我们可以关闭 fstrim 吗?这是我们必须修复的更深层次硬件问题的征兆吗(我不确信这是磁盘的问题,因为我们旋转了它们,不同的批号来自不同的供应商);我们还旋转了物理磁盘位置。我们喜欢在 OS 磁盘上留出空间,但我们可以改变这一点,拥有较大的 OS 磁盘本身是否有问题?我没有读到任何表明情况如此的文章,但这是我们的一个理论。

欢迎提出任何建议,如果这里有任何违反问题规范的地方,请提前道歉,这是我第一次提问,很乐意根据需要提供日志等。

相关内容