PostgreSQL 慢提交性能

Question 1

服务器的fsync性能慢得令人难以置信，难以形容，令人吃惊。您的软件 RAID 1 设置存在严重问题。糟糕的fsync性能几乎肯定是导致您出现性能问题的原因。

桌面只是速度很慢fsync。

synchronous_commit = off您可以通过设置来解决性能问题，但代价是在崩溃后丢失一些数据commit_delay。真的需要整理服务器上的磁盘性能，但是，速度慢得令人瞠目结舌。

为了进行比较，以下是我在笔记本电脑上得到的结果（i7、8GB RAM、中档 128G SSD、9.2 版的 pg_test_fsync）：

Compare file sync methods using one 8kB write:

        open_datasync                    4445.744 ops/sec
        fdatasync                        4225.793 ops/sec
        fsync                            2742.679 ops/sec
        fsync_writethrough                            n/a
        open_sync                        2907.265 ops/sec

无可否认，这款 SSD 可能不具备硬断电安全功能，但当我们谈论服务器成本时，一款像样的断电安全 SSD 的成本并不会很高。

Answer

服务器的fsync性能慢得令人难以置信，难以形容，令人吃惊。您的软件 RAID 1 设置存在严重问题。糟糕的fsync性能几乎肯定是导致您出现性能问题的原因。

桌面只是速度很慢fsync。

synchronous_commit = off您可以通过设置来解决性能问题，但代价是在崩溃后丢失一些数据commit_delay。真的需要整理服务器上的磁盘性能，但是，速度慢得令人瞠目结舌。

为了进行比较，以下是我在笔记本电脑上得到的结果（i7、8GB RAM、中档 128G SSD、9.2 版的 pg_test_fsync）：

Compare file sync methods using one 8kB write:

        open_datasync                    4445.744 ops/sec
        fdatasync                        4225.793 ops/sec
        fsync                            2742.679 ops/sec
        fsync_writethrough                            n/a
        open_sync                        2907.265 ops/sec

无可否认，这款 SSD 可能不具备硬断电安全功能，但当我们谈论服务器成本时，一款像样的断电安全 SSD 的成本并不会很高。

Question 2

这是pg_test_fsync我的服务器上的输出，具有非常相似的配置 - 2 个消费级磁盘上的 Linux 软件 RAID1（WD10EZEX-00RKKA0）：

# ./pg_test_fsync -s 3
Compare file sync methods using one 8kB write:
(in wal_sync_method preference order, except fdatasync
is Linux's default)
        open_datasync                     115.375 ops/sec
        fdatasync                         109.369 ops/sec
        fsync                              27.081 ops/sec
        fsync_writethrough                            n/a
        open_sync                         112.042 ops/sec
...

您是否在完全空闲的服务器上测试过这一点？

也许您有未对齐的分区。请检查：

parted /dev/sda unit s print

这是我的服务器的输出：

Model: ATA WDC WD10EZEX-00R (scsi)
Disk /dev/sda: 1953525168s
Sector size (logical/physical): 512B/4096B
Partition Table: msdos

Number  Start       End          Size         Type     File system     Flags
 1      2048s       67110911s    67108864s    primary  ext4            boot, raid
 2      67110912s   603981823s   536870912s   primary                  raid
 3      603981824s  608176127s   4194304s     primary  linux-swap(v1)
 4      608176128s  1953523711s  1345347584s  primary                  raid

检查Start列中的每个数字是否能被 2048（即 1MiB）整除。对于好的 4096B 对齐，能被 4 整除就足够了，但对齐感知实用程序会从 1MiB 边界开始分区。

另外，也许您正在使用非默认安装选项，例如data=journal，这会对性能产生很大影响。显示您的：mount -v | grep ^/dev/。这是我的：

/dev/md0 on / type ext4 (rw,barrier,usrjquota=aquota.user,grpjquota=aquota.group,jqfmt=vfsv0)
/dev/md2 on /home type ext4 (rw,barrier,usrjquota=aquota.user,grpjquota=aquota.group,jqfmt=vfsv0)
/dev/md1 on /var type ext4 (rw,barrier,usrjquota=aquota.user,grpjquota=aquota.group,jqfmt=vfsv0)

也许您的某个磁盘坏了。在每个没有 RAID 的磁盘上创建一个分区（也许您在两个磁盘上都保留了一些交换分区 - 使用这些 - 无论如何，交换上的 RAID 是没有用的）。在那里创建文件系统并pg_test_fsync在每个驱动器上运行 - 如果其中一个出现问题，那么一个好的文件系统必须等到两个都镜像后才能出现问题。

检查您的 BIOS 是否设置为使用 AHCI 模式而不是 IDE 模式。服务器将受益于本机命令队列，这在 IDE 模式下不可用。

忽略与 SSD 的比较。比较起来很荒谬。

Answer