刚刚在一台配备 2 个 10Tb 硬盘的新服务器上安装了 LVM Raid 1,磁盘 I/O 每秒都在杀死其他所有东西

刚刚在一台配备 2 个 10Tb 硬盘的新服务器上安装了 LVM Raid 1,磁盘 I/O 每秒都在杀死其他所有东西

我用 2× 10Tb 硬盘在基于 LVM 的 RAID1(不是硬件 RAID)上复制了一些数据:

/dev/mapper/users-users  9.1T  1.9G  8.6T   1% /home

现在它正在阻止我的 I/O,导致我的鼠标、键盘、视频被阻塞/解除阻塞/阻塞/解除阻塞......

我在想硬件层面可能出了问题,但不知道那会是什么。想知道首先要测试什么才能做出更好的诊断。

我在同一个驱动器阵列中还有另外 2 个驱动器,但它们未设置为 RAID 模式。

查看它的输出iotop告诉我,写入磁盘的速度约为 2Mb/s,几乎是永久的写入...当我查看磁盘 LED 时,我可以看到它们反复出现,也可以听到寻道磁头的声音。

尝试观看视频时,它失败得非常厉害。这里甚至无法用“断断续续”这个词来形容。它就像每隔一秒就出现一张图像,甚至更多。因此,对于整个计算机来说,这真的是一个很大的 I/O 杀手。

想知道是否有人以前遇到过这样的问题,以及如果可能的话可以做些什么来解决它(我当然希望这是可能的!)

我的主板是 SupermicroX11DPH-T我还从 Supermicro 那里得到了一个案例745BAC-R1K28B2 4U 全塔式机箱。我正在运行 Ubuntu 18.04 LTS。服务器是新的,安装也是新的(即不是从 16.04 升级,或者谁知道是什么...)

有没有办法知道是否是特定硬盘或其他硬件设备导致了问题?


输出为 free。我没有交换,我几乎不使用 512Gb 的 RAM。

$ free -m
            total      used      free    shared  buff/cache   available
Mem:       515636      2676    510291       114        2668      509935
Swap:       30047         0     30047

下面是 的输出mdstat。从我对 raid 的了解来看,这看起来很正常。

$ cat /proc/mdstat 
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md0 : active raid1 sdf1[2] sde1[0]
      9766302720 blocks super 1.2 [2/2] [UU]
      bitmap: 4/73 pages [16KB], 65536KB chunk

unused devices: <none>

至于 CPU,它是 2× Xeon Silver 4216。它是 16 核/CPU,我目前已打开超线程,因此它看起来像 64 个 CPU。

相关内容