背景
我在一个研究生物医学数据的研究部门工作,我们目前正在考虑修改我们的 IT 结构。我们有几台仪器每天产生数 GB 的数据,连接到网络隔离的计算机。数据在网络中传输,经过中间步骤处理,然后传输到大学的国家数据存储服务。
我们需要改进的是中间步骤,即短期存储数据(约 3 个月),在此期间研究人员可以访问数据,而无需从远程数据中心查询数据。事实上,中间服务器用于多种不同目的,并且通常会耗尽空间。我们打算购买一台 NAS,专门用于短期存储仪器数据。我有责任提出替代方案。
我首先列出了我们需要,由此我们得出了以下要求:
- 至少 8TB 空间:对于现代设置来说,这应该不是问题
- Gb带宽:同上
- 机架式:这样 NAS 在物理上就靠近我们拥有的其他服务器
- 可扩展:以防我们的数据量在不久的将来增加(我认为它会)
- 最低限度的维护:我们没有自由(经济上和官僚上)聘请全职系统管理员,因为只有最精通技术的科学家才能帮助进行服务器维护。我们都不是 IT 专业人士……
问题)
我开始阅读有关存储系统的文章,关于元的最常见问题列表是一个很好的资源。同样,我发现了两个类似的问题,询问研究环境中的存储:
然而,这两个问题似乎都侧重于长期存储,也侧重于单个设备,而我最感兴趣的是弄清楚在这种情况下哪些功能/规格/品质是有价值的。
根据先前的知识和最近的阅读,我认为在我们的案例中选择 NAS 时有几个方面可能很重要:
支持 SAS 驱动器- 这真的很重要吗?我知道 SAS 驱动器通常质量更高,但假设阵列中有冗余,那么如果 SATA 磁盘坏了会有什么大不了的?
链路聚合- 我不得不说,我对网络层和与之相关的设备了解不多,但我对链路聚合的有限理解是,有了多个网卡,NAS 理论上可以将带宽增加一倍/三倍,同样,多个链路可用于纠错(至少根据 Synology 的说法)。如果能提供任何可能帮助我理解这一点并将现实与营销言论区分开来的其他信息,我将不胜感激。
多个网络- 由于某些计算机上的隔离标准,我们能够让 NAS 在两个互不相见的不同 VLAN 中可用,这对我们来说是有意义的。如果 NAS 有两个以太网端口,那么将它连接到两个不同的网络并完成它是否就这么简单?
热插拔等- 这方面似乎有许多不同的说法。我的理解是,热插拔是指连接到 NAS 的额外磁盘,当一个磁盘发生故障时,首先写入数据。这是正确的吗?如果是这样,热插拔是一个很酷的功能,还是即使阵列运行单/双冗余也必须具备的功能?
另一个版本的“热插拔”(我不确定它叫什么)允许在服务器在线时更换磁盘,因此它是一种热替换(Drobo 提供类似功能)。这是常见功能,还是 Drobo 独有的功能?是否有类似的技术可用?是否存在我可能不知道的“陷阱”?否则,我认为它非常有趣,因为它允许在线扩展存储空间。
上面列出的功能是我一直在思考的一些功能,我真的很感激能对这些功能以及可能我可能错过的其他功能提供一些见解。
答案1
购买基于 ZFS任何使用NexentaStor将是一个好的开始,但听起来你也想要/需要供应商的支持。
就像PogoStorage 存储总监会起作用。
另一个不错的罐头选择是DataON NexentaStor祭品。
这两家供应商都可以针对您的存储和性能需求定制解决方案。这种要求并不罕见,因此与了解您所在领域的供应商交谈会很有帮助。
为什么选择 ZFS?
- 容量和性能方面具有出色的可扩展性。
- 智能缓存。这与您的特定应用程序有关。工作集数据将出现在更快的存储层 (SSD) 上。这就是 ZFS L2ARC 缓存。
- 如果您通过 NFS 或 CIFS 进行安装,则可以实现写入加速。ZFS ZIL 设备可实现这一点。
- 它是极强的弹性。
所有的勾都已命中:
- SAS 驱动器。是的。它们很重要,而且比基于 SATA 的解决方案更稳定。
- 链路聚合。当然。如果有大量消费者,我更喜欢从存储单元到交换机使用 10GbE。端到端 10GbE 甚至更好,具体取决于您预期的工作量。
- 多个网络当然是可能的。考虑从存储阵列到交换机的中继。
- 热插拔驱动器。这是必需的。它允许您在系统运行时更换磁盘。但是,在这种容量级别,您可能还需要一个热备用驱动器,如果驱动器发生故障,它将立即投入使用。
答案2
几乎所有 NAS(除较小的消费级型号外)或 SAN 都支持在线扩展,这意味着如果您需要更多空间,您只需插入更多驱动器,现有卷就可以扩展以包含新驱动器。
具有多个端口的 SAN 和 NAS 设备可用于链路聚合或从多个网络进行访问。但是,这两种功能因产品而异。许多产品会明确列出链路聚合支持,但我怀疑您找不到列出从多个网络进行访问的产品。这不是一个常见的请求功能。
你似乎搞糊涂了热插拔和热备援。
- 热插拔驱动器允许您在通电时更换驱动器。
- A热备援(也称为在线备用,或简称为备用)是物理插入但没有数据的驱动器。如果阵列中的另一个驱动器发生故障,阵列会将故障驱动器上的数据重建到热空间上。
SATA 驱动器可以正常工作,只要您使用 SAN/NAS 制造商推荐的驱动器即可。SATA 驱动器至少应为企业级,并被评定为可用于 RAID 阵列。这些类型的驱动器具有特殊固件,使其更适合用于阵列。使用标准消费驱动器(尤其是未经 SAN/NAS 制造商认证的驱动器)经常会导致奇怪的故障情况。就整体可靠性和稳定性而言,这绝对是一个一分钱一分货的例子。
购物问题与主题无关
然而,购物问题与主题无关,因此不会提供具体的产品推荐。
我建议您联系几家 SAN/NAS 制造商(Synology、Drobo、HP、Dell、EMC)并描述您的需求。他们会推荐产品,您可以在其中进行选择。
在执行此操作之前,您需要了解或决定以下一些事项:
- 您需要什么样的吞吐量?仅仅因为您的服务器上有一个千兆以太网端口并不意味着 a) 您的服务器实际上可以以千兆速度在磁盘上和磁盘外移动数据,以及 b) 您使用的是 1 千兆带宽。
- 这个问题的答案将决定 SAN/NAS 控制器所需的性能、网络接口的数量以及磁盘的保护策略(即 RAID 级别)。
- 您使用了多少空间?
- 您希望拥有多大的空间?
- 你有多想能够轻松成长?
- 您打算如何备份这些数据?
答案3
如果您需要 SAS 驱动器的速度,支持 SAS 驱动器是个不错的选择。它们的成本高于 SATA,但不如 SSD,速度介于两者之间。如果速度不是问题,支持也不错,但不值得为此付出更多。
链路聚合正是您提到的,将两个真实 NIC 组合成一个更快的单个 NIC 的能力,我从未听说过错误更正,但也许我只是没有在正确的地方寻找。
多网络通常只涉及连接和配置网卡。
您给出的热插拔的第一个定义似乎更像是热备用/热备份,即您安装了一个磁盘,当另一个正在使用的磁盘发生故障时,可以使用该磁盘。第二个定义是我一直理解的热插拔,即在更换磁盘时无需关闭机器即可更换磁盘的能力。
至于进一步的考虑,从长远来看,ewwhite 的回答可能会更有用;)