我已经设置了一对相同的服务器,这些服务器具有 RAID 阵列(8 核、16GB RAM、12x2 TB RAID6)和 3 个 10GigE 接口,以托管一些高可用性服务。
系统当前运行的是 Debian 7.9 Wheezy oldstable(因为 corosync/pacemaker 在 8.x 稳定版和测试版上不可用)。
- 本地磁盘性能约为写入 900 MB/s,读取 1600 MB/s。
- 机器之间的网络吞吐量超过700MB/s。
- 通过 iSCSI,每台机器可以以超过 700 MB/s 的速度写入对方的存储。
但是,无论我如何配置 DRBD,吞吐量都限制为 100MB/s。这看起来确实像是某种硬编码限制。我可以通过调整设置来可靠地降低性能,但它永远不会超过 1Gbit(每次达到 122MB/s 持续几秒钟)。我对此真的很纠结。
- 普通内核 3.18.24 amd64
- drbd 8.9.2~rc1-1~bpo70+1
配置分为两个文件global-common.conf
::
global {
usage-count no;
}
common {
handlers {
}
startup {
}
disk {
on-io-error detach;
# no-disk-flushes ;
}
net {
max-epoch-size 8192;
max-buffers 8192;
sndbuf-size 2097152;
}
syncer {
rate 4194304k;
al-extents 6433;
}
}
和cluster.res
:
resource rd0 {
protocol C;
on cl1 {
device /dev/drbd0;
disk /dev/sda4;
address 192.168.42.1:7788;
meta-disk internal;
}
on cl2 {
device /dev/drbd0;
disk /dev/sda4;
address 192.168.42.2:7788;
meta-disk internal;
}
}
从属设备的输出cat /proc/drbd
:
version: 8.4.5 (api:1/proto:86-101)
srcversion: EDE19BAA3D4D4A0BEFD8CDE
0: cs:SyncTarget ro:Secondary/Secondary ds:Inconsistent/UpToDate C r-----
ns:0 nr:4462592 dw:4462592 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:16489499884
[>....................] sync'ed: 0.1% (16103024/16107384)M
finish: 49:20:03 speed: 92,828 (92,968) want: 102,400 K/sec
主服务器的输出vmstat 2
(两台机器几乎完全空闲):
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
r b swpd free buff cache si so bi bo in cs us sy id wa
0 0 0 14952768 108712 446108 0 0 213 254 16 9 0 0 100 0
0 0 0 14952484 108712 446136 0 0 0 4 10063 1361 0 0 99 0
0 0 0 14952608 108712 446136 0 0 0 4 10057 1356 0 0 99 0
0 0 0 14952608 108720 446128 0 0 0 10 10063 1352 0 1 99 0
0 0 0 14951616 108720 446136 0 0 0 6 10175 1417 0 1 99 0
0 0 0 14951748 108720 446136 0 0 0 4 10172 1426 0 1 99 0
iperf
两个服务器之间的输出:
------------------------------------------------------------
Client connecting to cl2, TCP port 5001
TCP window size: 325 KByte (default)
------------------------------------------------------------
[ 3] local 192.168.42.1 port 47900 connected with 192.168.42.2 port 5001
[ ID] Interval Transfer Bandwidth
[ 3] 0.0-10.0 sec 6.87 GBytes 5.90 Gbits/sec
显然,初始同步应该有点慢,但不会这么慢......此外,它实际上对任何尝试限制同步率的行为都没有反应drbdadm disk-options --resync-rate=800M all
。
答案1
在较新版本的 DRBD(8.3.9 及更新版本)中,有一个需要调整的动态重新同步控制器。在较旧版本的 DRBD 中,设置syncer {rate;}
就足够了;现在它更多地被用作动态重新同步速度的轻度建议起点。
动态同步控制器通过 DRBD 配置的磁盘部分中的“c-settings”进行调整($ man drbd.conf
有关每个设置的详细信息,请参阅)。
由于这些节点之间有 10Gbe,并且由于使用了协议 C,因此假设延迟较低,以下配置应该可以使事情进展得更快:
资源 rd0 { 协议C; 磁盘 { c-填充目标10M; c-最大速率700M; c-计划-提前 7; c-最小速率4M; } 在 cl1 { 设备/dev/drbd0; 磁盘/dev/sda4; 地址 192.168.42.1:7788; 元磁盘内部; } 在 cl2 { 设备/dev/drbd0; 磁盘/dev/sda4; 地址 192.168.42.2:7788; 元磁盘内部; } }
如果还不满意,请尝试调高max-buffers
至 12k。如果还不满意,请尝试c-fill-target
以 2M 为增量调高。
答案2
其他人建议我使用这些设置:
disk {
on-io-error detach;
c-plan-ahead 0;
}
net {
max-epoch-size 20000;
max-buffers 131072;
}
而且性能非常出色。
编辑: 根据@Matt Kereczman 和其他人的建议,我最终改为这样:
disk {
on-io-error detach;
no-disk-flushes ;
no-disk-barrier;
c-plan-ahead 0;
c-fill-target 24M;
c-min-rate 80M;
c-max-rate 720M;
}
net {
# max-epoch-size 20000;
max-buffers 36k;
sndbuf-size 1024k ;
rcvbuf-size 2048k;
}
重新同步速度较高:
cat /proc/drbd
version: 8.4.5 (api:1/proto:86-101)
srcversion: EDE19BAA3D4D4A0BEFD8CDE
0: cs:SyncSource ro:Primary/Secondary ds:UpToDate/Inconsistent C r---n-
ns:133246146 nr:0 dw:2087494 dr:131187797 al:530 bm:0 lo:0 pe:5 ua:106 ap:0 ep:1 wo:d oos:4602377004
[>....................] sync'ed: 2.8% (4494508/4622592)M
finish: 1:52:27 speed: 682,064 (646,096) K/sec
使用以下设置重新同步时,写入速度非常快(本地写入速度的 80%,全线速):
# dd if=/dev/zero of=./testdd bs=1M count=20k
20480+0 enregistrements lus
20480+0 enregistrements écrits
21474836480 octets (21 GB) copiés, 29,3731 s, 731 MB/s
读取速度还可以:
# dd if=testdd bs=1M count=20k of=/dev/null
20480+0 enregistrements lus
20480+0 enregistrements écrits
21474836480 octets (21 GB) copiés, 29,4538 s, 729 MB/s
稍后编辑:
完全重新同步后,性能非常好(线速写入,本地速度读取)。重新同步很快(5/6 小时),并且不会对性能造成太大影响(线速读取,线速写入)。我肯定会将 c-plan-ahead 设置为零。如果使用非零值,重新同步时间太长了。
答案3
c-plan-ahead 必须设置一个正值才能启用动态同步速率控制器。磁盘
c-plan-ahead 15; // 5 * RTT / 0.1s unit,in my case is 15 c-fill-target 24; c-max-rate 720M;