I/O 效率低下的原因？

Question 1

有两套工具可以获取一些块级设备统计信息。第一个是延迟性来自布伦丹·格雷格的性能工具。它生成磁盘操作延迟的简单直方图，例如：

>=(ms) .. <(ms)   : I/O      |Distribution                          |
     0 -> 1       : 1913     |######################################|
     1 -> 2       : 438      |#########                             |
     2 -> 4       : 100      |##                                    |
     4 -> 8       : 145      |###                                   |
     8 -> 16      : 43       |#                                     |
    16 -> 32      : 43       |#                                     |
    32 -> 64      : 1        |#                                     |

工具集中的另一个脚本iosnoop显示命令及其操作，例如：

COMM         PID    TYPE DEV      BLOCK        BYTES     LATms
/usr/bin/mon 31456  R    8,0      9741888      4096       2.14
/usr/bin/mon 31456  R    8,0      9751408      4096       0.16
/usr/bin/mon 31456  R    8,0      20022728     4096       1.44
/usr/bin/mon 31456  R    8,0      19851752     4096       0.26
jbd2/sda3-41 416    WS   8,0      130618232    65536      1.89
jbd2/sda3-41 416    WS   8,0      209996928    65536      1.92
jbd2/sda3-41 416    WS   8,0      210006528    8192       1.94

然后是块跟踪包记录低级块操作blktrace，然后显示各种信息，以及许多其他命令，包括来自（的blkparse简单摘要）bttpdf 用户指南）：

$ sudo blktrace /dev/sda  # ^C to stop
=== sda ===
  CPU  0:                  180 events,        9 KiB data
  CPU  1:                 1958 events,       92 KiB data
  Total:                  2138 events (dropped 0),      101 KiB data
$ ls -ltra # one file per cpu
-rw-r--r--    1 root   root       8640 Nov  5 10:16 sda.blktrace.0
-rw-r--r--    1 root   root      93992 Nov  5 10:16 sda.blktrace.1
$ blkparse -O -d combined.output  sda.blktrace.*  # combine cpus
$ btt -i combined.output 
    ALL           MIN           AVG           MAX           N
Q2Q               0.000001053   0.106888548   6.376503027         253
Q2G               0.000000795   0.000002266   0.000011060         184
G2I               0.000000874   0.000979485   0.002588781         328
Q2M               0.000000331   0.000000599   0.000002716          70
I2D               0.000000393   0.000480112   0.002435491         328
M2D               0.000002044   0.000028418   0.000126845          70
D2C               0.000080986   0.001925224   0.010111418         254
Q2C               0.000087025   0.002603157   0.010120629         254
...

例如，D2C 是硬件设备执行一项操作所需的时间。

您还可以sudo smartctl -a /dev/sda在每张光盘上运行以查看是否显示任何故障。

Answer

有两套工具可以获取一些块级设备统计信息。第一个是延迟性来自布伦丹·格雷格的性能工具。它生成磁盘操作延迟的简单直方图，例如：

>=(ms) .. <(ms)   : I/O      |Distribution                          |
     0 -> 1       : 1913     |######################################|
     1 -> 2       : 438      |#########                             |
     2 -> 4       : 100      |##                                    |
     4 -> 8       : 145      |###                                   |
     8 -> 16      : 43       |#                                     |
    16 -> 32      : 43       |#                                     |
    32 -> 64      : 1        |#                                     |

工具集中的另一个脚本iosnoop显示命令及其操作，例如：

COMM         PID    TYPE DEV      BLOCK        BYTES     LATms
/usr/bin/mon 31456  R    8,0      9741888      4096       2.14
/usr/bin/mon 31456  R    8,0      9751408      4096       0.16
/usr/bin/mon 31456  R    8,0      20022728     4096       1.44
/usr/bin/mon 31456  R    8,0      19851752     4096       0.26
jbd2/sda3-41 416    WS   8,0      130618232    65536      1.89
jbd2/sda3-41 416    WS   8,0      209996928    65536      1.92
jbd2/sda3-41 416    WS   8,0      210006528    8192       1.94

然后是块跟踪包记录低级块操作blktrace，然后显示各种信息，以及许多其他命令，包括来自（的blkparse简单摘要）bttpdf 用户指南）：

$ sudo blktrace /dev/sda  # ^C to stop
=== sda ===
  CPU  0:                  180 events,        9 KiB data
  CPU  1:                 1958 events,       92 KiB data
  Total:                  2138 events (dropped 0),      101 KiB data
$ ls -ltra # one file per cpu
-rw-r--r--    1 root   root       8640 Nov  5 10:16 sda.blktrace.0
-rw-r--r--    1 root   root      93992 Nov  5 10:16 sda.blktrace.1
$ blkparse -O -d combined.output  sda.blktrace.*  # combine cpus
$ btt -i combined.output 
    ALL           MIN           AVG           MAX           N
Q2Q               0.000001053   0.106888548   6.376503027         253
Q2G               0.000000795   0.000002266   0.000011060         184
G2I               0.000000874   0.000979485   0.002588781         328
Q2M               0.000000331   0.000000599   0.000002716          70
I2D               0.000000393   0.000480112   0.002435491         328
M2D               0.000002044   0.000028418   0.000126845          70
D2C               0.000080986   0.001925224   0.010111418         254
Q2C               0.000087025   0.002603157   0.010120629         254
...

例如，D2C 是硬件设备执行一项操作所需的时间。

您还可以sudo smartctl -a /dev/sda在每张光盘上运行以查看是否显示任何故障。

Question 2

我猜想这dstat会使用文件描述符级别的 I/O 统计信息，即应用程序调用write()，并且一旦系统调用返回dstat就会看到增加的数据。

但这并不意味着数据实际上已经被写入。我猜想这些看似暂停的阶段是将缓冲区写入块设备的阶段。这是有道理的，在这些时间内，I/O 等待值甚至高于dstat测量数据传输的阶段。

iotop区分磁盘和缓存的写入和读取。也许该工具可以提供有趣的附加信息。

Answer

我猜想这dstat会使用文件描述符级别的 I/O 统计信息，即应用程序调用write()，并且一旦系统调用返回dstat就会看到增加的数据。

但这并不意味着数据实际上已经被写入。我猜想这些看似暂停的阶段是将缓冲区写入块设备的阶段。这是有道理的，在这些时间内，I/O 等待值甚至高于dstat测量数据传输的阶段。

iotop区分磁盘和缓存的写入和读取。也许该工具可以提供有趣的附加信息。

I/O 效率低下的原因？

答案1

答案2

相关内容