业务关键数据的长期存储

业务关键数据的长期存储

这是一个非常棘手的问题,从某种程度上来说,这不是一个技术问题,也可能不属于这里,但是

Server Fault 适用于以专业身份管理或维护计算机的系统管理员

我确实这么做了...无论如何,这是我的任务之一。

想象一下,您有 5000 多张双面 A4 纸。公司数据,所有业务都至关重要。
您需要以某种方式备份它们。目前提出的解决方案包括:

  1. PDF -> 在线存储
  2. PDF -> DVD / 蓝光 / 磁带
  3. PDF -> 便携式 HDD/SSD/闪存驱动器。
  4. 购买/租赁/租用/“偷”一台大型复印机,然后进行复印。
  5. ???

上述问题亟待解决:

  1. 如果存储合作伙伴破产了怎么办?
  2. DVD 会随着时间而腐烂,磁带也一样。
  3. 这些也会随着时间而破裂。
  4. 昂贵、缓慢、笨重,对树木不友好。

问题:

长期至中期数据保存和归档的黄金标准是什么?您在工作场所解决过类似的问题吗?

初始加载后,每月需要添加大约 100 页。检索应该很容易,但可能不频繁。
理想情况下,我想保证在我离开公司后很长时间内该解决方案仍然可行,并且不需要大量资金来保持可维护性,因此存储许多 DVD 不仅不是理想的选择,也不是一个好的长期解决方案。

虽然直接复印当然是最简单的方法,但它并不是最环保的方法,而且远远不是。它也不太易于管理,难以搜索、索引等。而且很重,难以物理存储。

原则上,我很喜欢将所有内容以电子方式存储的想法,但实际的机制需要透明且简单。我真的不想永远为此负责,支持办公室用户搞砸事情并丢失文件。我也不想依赖单一的存储供应商,如果 Dropbox(我们有一个在线备份解决方案 ATM,但它不是 Dropbox。)破产或遭遇灾难性事件,有多少使用其服务的企业会陷入困境,无计可施?

这里有一些预算灵活性,但我怀疑任何比我们目前的在线备份(大约 2500 美元/年)花费更多的东西,都会被视为不太受欢迎,而不是把它放在床底下的鞋盒里。毫无疑问,如果我什么都不做,明天就辞职,就会发生这种情况。

有任何想法吗?

-编辑-

这样做的原因有两个。

1)在办公室发生烧毁的情况下,提供关键业务文件的合理安全备份。

2)满足数据存档法律WRT英国企业税法等等。

编辑2:

拥有某种用于索引文档的机制也会非常有用。

答案1

将数据保存为 PDF 之类的格式可能比较安全,因为有免费工具可以读取它。您所说的数据量相当小(每年 1,200 页),因此即使以 300 dpi 的扫描分辨率,您所说的也只是每年数十 GB。

不过,物理存储设备问题永远不会消失。无论你使用什么介质来存储电子数据(磁带、光盘等),最终都需要更新到较新的介质。随着新格式取代旧格式,规划和预算“将数据转移到新格式”。

我可能会将光学介质作为首选,因为你的数据太少了。我还计划刻录 3 份副本,并每 2 - 3 年刷新一次介质。

如果光学介质太小,我会使用 LTO 磁带,每 4 - 5 年更新一次介质。不过,对于如此少量的数据来说,这会非常昂贵。

答案2

有特定的系统在内部使用 DVD,并时不时地将数据迁移到新媒体。查阅数字保存。

由于存储需求增长相当快,因此建议每隔几年就切换到更新、更大类型的介质。

假设您以纸质形式获取数据,则需要:

  1. 在邮件入口处列出数据。这可能意味着给每张纸一个唯一的条形码。
  2. 扫描它。使用条形码标识符作为文件名。将论文存档。
  3. 归档数据。将数据放在修订安全归档系统上。文件服务器不够好,因为如果文件可写,可能会发生一些事情。
  4. 使其可供其他系统读取。

在客户案例中,大型组织的所有发票都必须转移到在线系统 (SAP)。档案存储现在已经经历了几次迭代。目前他们正在转向蓝光。

另一方面,如今所有东西都存储在磁盘上,因此,也许您可​​以采取以下方式:http://www.eurostor.com/german/iTernity.D.php

答案3

我们的解决方案:扫描为 PDF -> 备份到磁带

我们有一台文档扫描仪,扫描速度约为每分钟 30 页,可生成 OCR PDF 文件。我们将这些文件备份到磁带(具体来说是 LTO4)上,磁带的使用寿命为 50 到 100 年(在这个时间段内,找到磁带驱动器可能比较困难,但还是有数据恢复机构可以恢复 8 英寸软盘)。

答案4

第一步,备份:对文档进行 OCR,然后将所有单词重新排列成一系列关于天主教会、主业会和圣殿骑士团的小说。您应该有足够的输入数据来编写大约 10 部小说,并且每年或以后每年都会增加一部。维护一个查找表,其中包含单词在源文档中的原始位置(按源顺序)以及它在小说中的最终位置;将重复的单词存储在表中的一个条目中。确保出版协议并出版数百万本小说。使用图书销售收入来资助 OCR 和单词重新排列操作。将原始文件撕碎并将其作为仓鼠床上用品出售。如果您发现输入文档中缺少词汇,有时可能需要下订单购买十字架、反物质或前往异国他乡的机票。

第二步,恢复/访问:无需存储数据副本 - 您所需要的只是查找表和二手书店。

由于查找表是您的单点故障,您仍需要备份它。由于采用了霍夫曼编码方案,与输入文档相比,它将非常小,因此可能可以复制到 DVD。对于异地备份,请坐在壁炉前,一边读出查找表,一边拍摄自己的视频。将您的视频表演作品放在泰特现代美术馆中,永久展示艺术与技术的融合。

相关内容