如果 LTO-3 完整备份需要多盘磁带。我的下一步硬件准备是什么?

如果 LTO-3 完整备份需要多盘磁带。我的下一步硬件准备是什么?

好的。有一些给定因素需要考虑

我使用 Backup Exec 12.x/​​13.x,拥有包括 Exchange 在内的服务器 2003/2008 环境。

我正在进行备份到磁盘(完整/差异),它与备份到 LTO(完整/差异)无关。由于多种原因,我不想仅仅将数据从磁盘备份到磁带,而是希望将数据直接备份到 LTO。

我目前有一个 LTO-3 驱动器,没有装载机/机器人/库。LTO 驱动器的盒子里有一个Adaptec 39160 Ultra160 SCSI 卡。我目前使用一盘磁带进行完整备份(每周一盘),一盘磁带进行差异备份(每周四天,在取出磁带之前)。完整备份正在达到 372.5GB 的极限,当它达到极限时,备份在周六无法完成,它仍然在等待周一早上的磁带。

Ward 提到在周一下午/晚上正常工作时间之后放入第二盘 LTO3 完整磁带。此问题比较如下:

正常流量

  • 周五插入 LTO3 磁带 1,用于第 1 周的完整备份
  • 周一插入 LTO3 磁带进行差分
  • 周二、周三、周四的差异使用周一插入的磁带
  • 重复第二周

2 个 LTO3 磁带用于完整备份流程

  • 周五插入 LTO3 磁带 1,用于第 1 周的完整备份
  • 周一插入 LTO3 磁带 2 进行第 1 周的完整备份
  • 周一插入 LTO3 磁带 1 进行第一周的完整备份(用于验证过程)
  • 周一插入 LTO3 磁带 2 进行第 1 周的完整备份(用于验证过程)
  • 周二插入 LTO 3 磁带进行差分
  • 周三、周四的差异使用周二插入的磁带
  • 重复第二周

额外的磁带交换耗费了周一 6 个多小时的时间(从我放入第二盘磁带开始算起)。如果我在下午 5 点进行交换,我会在这里一直待到午夜才换磁带。这还不包括周六/周日/周一等待磁带的空闲时间。

现在我可以关闭验证过程,节省两次磁带交换,并将“备份”过程缩短几个小时,但如果我不关闭验证,我就不能只放入磁带 2,然后在一天结束时走开。将备份溢出到第二盘磁带上会延长备份过程,但它也会

  • 增加轮换的磁带数量(成本)
  • 增加运输中的磁带数量(前往异地存储的公文包的大小/重量)
  • 我需要下班后留在现场进行验证,这增加了备份过程的复杂性
  • 增加了从我的办公室管理备份/恢复的复杂性,因为我的办公室不在服务器机房旁边。如果在家里处理此类问题,难度将增加四倍。

是的,我不会在周六去那里坐上 6 个小时以上,照看磁带驱动器。我想在工作之外拥有自己的生活。每天工作 12 小时已经够糟糕了。我不会永远把自己束缚在每周工作 6 天的环境中。

磁带驱动器是 Dell PowerVault 110T LTO3。备份服务器使用千兆以太网,仅使用单个 NIC,大约 12 小时就可以填满一盘磁带。

我可以更改备份过程,将其中一台更密集的服务器分离到其自己的 LTO 上的完整备份,以暂时推迟这个决定,但很快我认为我需要选择以下选项之一:

  1. 购买 LTO-3 驱动器,充分利用第二盘物理磁带。这是一个不太理想的选择,只有当 LTO-3 驱动器比 LTO-4 驱动器便宜很多时才有意义,但事实并非如此。

  2. 购买 LTO-4 驱动器并使用 LTO-4 磁带进行完整备份,使用 LTO-3 磁带进行差异备份,直到 LTO-3 磁带被淘汰,新的 LTO4 磁带与 LTO3 磁带的价格相同。这可能会让我在未来几年内度过周末备份而不必更换磁带。这也部分解决了擦鞋问题,因为 LTO4 的最低速度低于 LTO3。

  3. 购买可以自动送入磁带的设备。我假设没有可以添加到 PowerVault 110T 的东西,这意味着要购买一台将磁带和加载器集成在一个单元中的新设备。与只购买驱动器并手动加载磁带相比,这可能不划算,但使用自动加载 LTO4 将是最方便的。我会让我的上司在单磁带驱动器和自动加载驱动器之间做出决定。

Evan Anderson 在另一个解决方案中提到,你可以购买这个价格范围内的驱动器

 LTO-4 (internal drive, 1 tape / day) - $2,766.00  
 LTO-4 (autoloader, 1 tape / day) - $4,566.00

但我不知道他或您会推荐什么实际驱动器以及必要的控制器。如果您不介意查找,请向我显示您的解决方案的 newegg URL(或戴尔、惠普或任何您最喜欢的供应商),或者只需给我一个品牌和型号,我很乐意亲自完成这项工作。

我希望在备份轮换变得过于繁琐之前,在将来的某个时候购买一些必需品。我可能还有几个月的时间。

Xenny 提到了服务器的年龄和备份速度。Exchange 服务器已有 6 年历史(尽管硬盘要新得多)。还有一些已有 4 年历史的服务器和消费级 SATA 硬盘(WD6400AAKS)。我认为“新”的服务器目前已有 2 年历史。

从旧 Exchange 服务器备份到磁盘的速度最快可达 2184 MB/分钟,但一般来说,在此设置下,备份到磁盘的速度与备份到磁带的速度一样慢。事实上,备份到磁盘的速度有时比备份到 LTO-3 磁带驱动器的速度要慢。我还遇到过驱动器故障和缺少托架来添加更多驱动器的问题。一般来说,备份到磁盘比 LTO3/4 转换更成问题,但如果我想要了解该主题,那么这属于 serverfault 上的另一个问题。

我从最近的备份中挑选一些数字,让您了解速度。这不是完整的列表,但可以让您了解所涉及的各种速度。我计划很快以oldspeed MB/min newspeed MB/min 的格式更新此列表,其中 oldspeed 是旧的 SCSI 320 LTO3,newspeed 是 SAS LTO4。

DC C:~850 MB/分钟
DC 系统状态 ~700 MB/分钟
Exchange Server C:和系统状态~500 MB/分钟~600 MB/分钟
Exchange Server D:~1400 MB/分钟~1200 MB/分钟
Exchange Server 第一个存储组~1100 MB/分钟~700MB/分钟
Web 服务器 C:~600 MB/分钟~950 MB/分钟
Web 服务器 E:~1700 MB/分钟~1950 MB/分钟
文件服务器 C:~500 MB/分钟
文件服务器 E:~1500 MB/分钟~2200 MB/分钟
文件服务器 G:~1800 MB/分钟~2400 MB/分钟
文件服务器系统状态 ~650 MB/分钟
传真服务器 C:~400 MB/分钟~550 MB/分钟
会计服务器 C:~1300 MB/分钟~1775 MB/分钟
会计服务器 D:~1500 MB/分钟~2250 MB/分钟
会计 SQL 实例 ~1600 MB/min
应用程序服务器C:和系统状态~700 MB/min ~900 MB/min
备份服务器C:700 MB/min ~1800 MB/min
备份服务器E:1350 MB/min ~2900 MB/min

监控文件服务器时,我看到的数字让我认为 RAID 控制器阻碍了传输速率。控制器是 SATA 1.5,但驱动器支持 3.0。我注意到,将卷从 RAID 1 更改为 RAID 10 后,备份速度并没有提高。不幸的是,将持续读取速度翻倍对 LTO3 磁带驱动器的备份没有影响。

一般来说,直接备份到 LTO 可以让我很好地了解我的服务器 I/O 受限的情况。备份速度低于 1500 MB/分钟的服务器通常磁盘速度较慢,而备份速度介于 1500 MB/分钟和 2400 MB/分钟之间的服务器仍然很容易实现。例如,Exchange 2003 服务器的磁盘空间不足,并继续将第一个存储组的数据库扩展到磁盘较慢的部分。该服务器将被具有更快处理器和更多磁盘的 Exchange 2010 服务器取代。其他服务器将进行磁盘升级和/或添加 SSD。

http://en.wikipedia.org/wiki/Tape_drive提到“当擦鞋发生这种情况时,它会严重影响可达到的数据速率以及驱动器和磁带的使用寿命。”但它没有提到擦鞋会降低磁带的有效容量。在查看了银行的存档磁带后,我可以确认 LTO3 磁带上浪费了大约 2% 到 15% 的空间。这还不足以阻止我转向 LTO4 或自动加载机,但这可能是很严重的。对于使用 Backup Exec 的用户,您可以通过以下方式计算擦鞋浪费:

  • 执行备份作业,备份大约 100% 的磁带原始容量,无需压缩。运行测试时,禁用驱动器和软件上的压缩。
  • 查看备份执行程序的媒体选项卡,并将“已用容量”列与“数据”列进行比较。如果压缩已关闭并且数字匹配,则说明您根本没有弄错。

在我的例子中,我有一个存档 LTO3 磁带,其中“已使用”空间为 272.4 GB,但“数据”空间只有 233.67 GB,另一个磁带有 400.6 GB,而“数据”空间为 395.19 GB。我还尝试过不压缩地备份到 LTO4,结果“已使用”空间为 833 GB,而“数据”空间只有 786.77 GB。显然,我的环境和您的环境会有所不同,但在此之前我没有想过要测试它。希望这能让您清楚地了解如何确定备份环境中有多少浪费的磁带。

编辑:新信息http://www.fujifilmusa.com/shared/bin/LTO_Overview.pdf显示 LTO3 和 LTO4 的最小磁带速度。看起来 IBM LTO4 的最小速度实际上低于 IBM LTO3。无论如何,我的普通服务器太慢了,无法在不擦鞋的情况下为 LTO3/4 提供数据。我担心即使我的备份到磁盘本地卷也会太慢而无法快速为驱动器提供数据,但我必须对此进行测试。

从上面的 PDF 中提取 IBM 全高驱动器信息我得到

LTO4 : 30-120MB/s 800GB native (45-240MB/s compressed)
LTO3 : 40- 80MB/s 400GB native (60-160MB/s compressed)
LTO2 : 18- 35MB/s 200GB native (27- 70MB/s compressed)
LTO1 : 15- 15MB/s 100GB native (30- 30MB/s compressed)  


更新:我用于备份的服务器开始出现停止错误,因此我将磁带驱动器移至另一台服务器。旧 SCSI 控制器是 Adaptec 160,“新”控制器是基于 LSI 的 320(至少我假设外部连接器是 320,因为服务器内的 4 个硬盘驱动器在服务器管理中提到 320 SCSI)。

新服务器的情况让我暂时无法备份到磁盘,直到我获得一个用于直接连接存储的外部机箱。总的来说,这个 LTO 讨论让我决定为我的服务器购买更多硬盘。我将重新配置 RAID 阵列以提高备份速度,并希望提高整体设置的可靠性。

更新 2:下面的比较使用了一个旧的文件服务器,其 raid 控制器将所有传输限制在 ~40MB/s,因此理想的速度约为 2400MB/分钟。这是测试擦鞋边缘所需的速度。据推测,数据流不会完全规则,并且会在整个测试过程中强制速度匹配。

我不再知道我在旧 LTO3 驱动器的速度测试中使用的缓冲区大小和缓冲区数量,但这并没有改变太多,通过调整缓冲区,我可能获得了 100MB/分钟的增益。测试数据是大约 20GB 的扫描 tif 和 jpg。我在星期五下午做了这些测试,我没有重复测试足够多次来平均数据或以其他方式清除无效数据。下班后测试、选择不同的数据和其他变量可能会明显影响这些测试。

所有测试都使用相同的服务器。旧驱动器位于 PCIx 的 320 SCSI LVD 控制器上。新驱动器位于 PCIe LSI 3801E SAS 控制器上。驱动器控制器和/或 LTO3 磁带驱动器可能是瓶颈。我不会测试单个组件,只会测试旧配对与新配对。运行 Backup Exec 的服务器有 4GB 内存、32 位 Server 2008 标准、奔腾 D 3.2GHz 双核 CPU。

网络连接是通过 1Gb 交换机实现的,两台服务器都在同一台交换机上。我打开了远程桌面连接,但备份 + 该连接时,Gb 连接的利用率最差也不超过 50%,平均使用率约为 25%。

因此,尽管测试方法很粗糙,但我有理由相信瓶颈不在我忽略的变量中。

简短测试结果
使用 Dell LTO3 驱动器和 LTO3 磁带压缩开启,速度约为 1500 MB/分钟,块大小为 64KB(测试了许多缓冲区数量,最佳结果列在此处)

~1800 MB/分钟使用 Quantum Superloader3 LTO 4 驱动器和 LTO3 磁带(与上述磁带相同),压缩开启,块大小为 64KB,缓冲区大小为 64KB,缓冲区计数为 10,高水位计数为 0,写入单块模式开启,写入 SCSI 直通模式开启

~2150 MB/分钟使用 Quantum Superloader3 LTO 4 驱动器和 LTO3 磁带(与上述磁带相同),压缩开启,块大小为 256KB,缓冲区大小为 256KB,缓冲区计数为 10,高水位计数为 0,写入单块模式开启,写入 SCSI 直通模式开启
~2200 MB/分钟使用 Quantum Superloader3 LTO 4 驱动器和 LTO3 磁带(与上述磁带相同),压缩关闭,256KB 块大小,256KB 缓冲区大小,缓冲区计数 10,高水位计数 0,写入单块模式开启,写入 SCSI 直通模式开启

~2050 MB/分钟使用 Quantum Superloader3 LTO 4 驱动器,其中 LTO4 磁带压缩处于开启状态,块大小为 256KB,缓冲区大小为 256KB,缓冲区计数为 10,高水位计数为 0,写入单块模式处于开启状态,写入 SCSI 直通模式处于开启状态
~2250 MB/分钟使用 Quantum Superloader3 LTO 4 驱动器,其中 LTO4 磁带压缩已关闭,块大小为 256KB,缓冲区大小为 256KB,缓冲区计数为 10,高水位计数为 0,单块写入模式已打开,SCSI 直通写入模式已打开

~2050 MB/分钟使用 Quantum Superloader3 LTO 4 驱动器,其中 LTO4 磁带压缩处于开启状态,块大小为 256KB,缓冲区大小为 1MB,缓冲区计数为 10,高水位计数为 0,写入单块模式处于开启状态,写入 SCSI 直通模式处于开启状态
~2300 MB/分钟使用 Quantum Superloader3 LTO 4 驱动器,其中 LTO4 磁带压缩已关闭,块大小为 256KB,缓冲区大小为 1MB,缓冲区计数为 10,高水位计数为 0,单块写入模式已打开,SCSI 直通写入模式已打开

~2200 MB/分钟使用 Quantum Superloader3 LTO 4 驱动器,其中 LTO4 磁带压缩处于开启状态,块大小为 256KB,缓冲区大小为 1MB,缓冲区计数为 20,高水位计数为 0,写入单块模式处于开启状态,写入 SCSI 直通模式处于开启状态
~2300 MB/分钟使用 Quantum Superloader3 LTO 4 驱动器,LTO4 磁带压缩关闭,256KB 块大小,1MB 缓冲区大小,缓冲区计数 20,高水位计数 0,写入单块模式开启,写入 SCSI 直通模式开启

显然,调整块大小比缓冲区大小更重要。无论使用块或缓冲区大小,如果源数据无法跟上磁带驱动器的最小数据匹配率,关闭压缩将获得更好的性能。不幸的是,这是每个驱动器的设置,而不是每个作业或每个磁带格式的设置,因此您不能只将压缩限制为完整备份或仅限于 LTO3。您还必须测试硬件/软件组合的问题有多大。当然,性能上的这种影响很小,更重要的测试是优化 600GB 到 800GB 的完整备份,而不是 20GB。一旦我完成了几周或几个月的备份,我会尝试再次更新。

答案1

另外,请注意 100MB/分钟远低于 LTO 3 磁带流的最低速度,因此磁带停止和启动时可能会损失相当多的容量(即,压缩率可能高于 1.5:1,但这会在磁带上的数据间隙中丢失)。对于 LTO 4 来说,情况可能会更糟,因为我认为最低速度已经提高了。

磁盘 - 磁盘 - 磁带将有助于解决最低速度问题,并免费为您提供一些容量。

如果您不这样做,请强烈考虑对要备份的服务器上的磁盘进行某种形式的计划碎片整理。对于相当现代的硬件,1000 MB/分钟对于千兆以太网来说不是一个很大的吞吐量水平。我预计,即使是 2 年前的机器,您也应该能够获得 1800MB/分钟(仅以 30MB/秒的速度从服务器磁盘读取),因此还有改进的空间。

编辑:对于 LTO 3,您确实需要 256KB 块大小来获得最佳性能。

WRT 擦鞋,如果缓冲区短暂地空了,磁带就没有时间倒带,因此它会在磁带上留下间隙。

答案2

不可避免地,备份会超出您最初计划的容量。以下是我对您所处情况的建议和看法:

  1. 因此完整备份超出了一盘磁带的容量。那么使用两盘磁带。

  2. 遵循 Symantec 的建议并继续执行磁盘备份,然后将这些磁盘备份备份到磁带。安排将磁盘备份安排在使用资源较少的几个小时之后进行。安排将磁带备份安排在磁盘备份完成后的一天中的任何时间进行,因为磁带备份不会对生产系统产生任何影响。

  3. 将您本周的备份(完整备份和差异备份)视为同一套备份的一部分。如果每周需要两到三盘磁带,那就这样吧。

  4. 安排磁带备份仅在您更换磁带的那一周进行。

我遇到了类似的情况,我正在使用 dell powervault 110t lto2 驱动器,这是我的操作:

  1. 星期六,我对磁盘进行了完整备份(将完整备份保存到磁盘文件夹)。

  2. 从周日到周五,我将增量备份到磁盘(另一个用于增量备份的磁盘文件夹)。

  3. 周一到周五,我将完整和增量备份到磁带上,并备份到磁盘文件夹。当磁带达到其容量时,我就会将其换出。如果它在半夜达到容量,我会在第二天早上将其换出,磁带工作就完成了。

  4. 周五完成磁带备份工作后,我会更换下周的磁带。我取出的两盘磁带是本周的完整磁带和增量磁带,将进行为期 4 周的轮换。现在我知道所有当前周的备份数据都在一个磁带集上,存储在异地。

冲洗并重复

答案3

我们做了一些和 joe 类似的事情:

  1. 星期六:完整备份到磁盘,完成后开始将其完整备份到磁带
  2. 星期一:一天结束时,放入第二盘磁带并完成备份
  3. 周一至周五:仅对磁盘进行差异备份

如果你真的必须独立于磁盘磁盘备份来执行磁盘磁带备份,我会忍受两个备份稍微不同步:

  1. 星期六启动磁盘和磁盘磁带,磁盘将完成,磁盘磁带将在星期一等待第二盘磁带
  2. 在星期一完成磁盘磁带(我仍然会等到一天结束的时候才放入磁带)。
  3. 周一至周五,进行磁盘差异分析(实际上,我知道你没有说你这样做,但我假设你会这样做)
  4. 周二至周五,进行磁盘磁带差异分析

我认为在两种不同的介质上备份略有不同的文件集不会有什么问题。在几乎所有情况下,您都会从磁盘备份中恢复文件,而磁带只是一种后备方法或一种组织多个备份集的简单方法。

答案4

这里有一个选项可以帮你度过一段时间:

您是否考虑过将备份拆分成两个单独的数据集?根据文件的组织方式,您可能能够轻松地将其拆分成两个逻辑块(即按部门)。您将在周四晚上对第一个数据集进行完整备份,并在周五晚上对第二个数据集进行完整备份。此后的每个晚上都会在单个磁带上运行两个作业,每个数据集都有一个差异。

这样,您就不必在周末上班,也不必在等待验证完成时开车接送乘客。此外,您还能获得额外的保护,不必将所有鸡蛋都放在一个篮子里。

相关内容