旧服务器中的坏盘

旧服务器中的坏盘

我有一台 1998 年的 Netware 3.12 服务器,运行一切在我们的校园里:总帐、采购、工资单、学生信息、成绩,应有尽有。服务器有一个 Adaptec RAID 控制器,带有两个卷:

  1. RAID 1,2 个 17GB scsi 磁盘,Seagate ST318417W
  2. RAID 5、3 个 4GB scsi 磁盘、2 个 Seagate ST34573W 和 1 个 ST34572W。

我们目前正处于替换该系统的项目的早期阶段,但你不能就这样直接进入一个新系统,因此我需要让该服务器至少运行到 2011 年 11 月。

本周,我们有两块硬盘发生故障。幸运的是,它们来自不同的卷,我们暂时可以继续运行,但考虑到这些故障的性质,我非常怀疑,如果不恢复 RAID 冗余,我能否在 11 月之前避免这台服务器发生灾难性故障——只要任何地方再发生一块硬盘故障,我就完全完蛋了。

幸运的是,我们拥有与两个驱动器完全匹配的“备用”驱动器,但这些备用驱动器的状况未知。我尝试仅将它们替换进去,但 RAID 控制器不够智能,无法处理这种情况,导致系统无法启动。

至于 RAID 控制器本身,我可以在 POST 期间通过 Ctrl-A 快捷键进入实用程序,但我无法从那里做很多有用的事情。要实际管理卷,我必须先启动到 Netware,此时我可以使用 Netware 来CI/O Array Management Software Version 2.0实际查看卷信息。我怀疑管理事物的正常方法是从带有控制器软件的特殊软盘启动,但该软盘早已不见踪影。

通过 RAID 软件中的选项,我思考替换现有 RAID 卷中的磁盘的唯一支持方法是物理添加磁盘,启动并将其配置为卷的“备用”,强制卷使用备用磁盘替换现有的故障磁盘(此时我只是猜测),以便故障磁盘成为备用磁盘,修复卷,从卷中移除备用磁盘,然后关闭并移除磁盘。然后从头开始处理另一个故障磁盘。所有这些都会造成大量停机时间,假设我可以让它工作并且我的备用磁盘没有任何问题。

至于寻找可靠的备件,我根本不知道从哪里开始寻找新的 4GB scsi 驱动器,甚至不知道我正在寻找哪个确切的 scsi 系统,因为它随着时间的推移经历了几次不同的迭代。

另一个选择是将其迁移到虚拟机 (hyper-v),但我们在此领域进行的所有尝试都没有取得很大进展。安装这台机器时我刚刚高中毕业,因此它需要的 netware 和 dos 知识水平比我以前开发的要低,或者如果我已经忘记了的话(我也不是 dos 新手)。

我遇到的问题部分在于这是一个高使用率的服务器,将它关闭几天来解决问题并不是很顺利。

至于问题,我正在寻找任何可能在这种情况下有帮助的东西:推荐一个可以找到这个时代的好备件的地方,使用类似的控制器修复 RAID 卷或从旧的 netware 服务器构建 hyper-v vm 的个人经验,软盘上一行有更好的 RAID 控制器软件,推荐一个在内布拉斯加州的好的 Novell 顾问,可以解决问题,我还没有考虑过的其他选择,等等。

更新:
对于备份,我们有良好的(最近通过恢复验证)备份仅数据—— 对于实际运行的软件来说什么也没有。

更新 2:
这只是一份进度报告,我目前在 VMWare Virtual Server 2.0 中安装了可运行的 Netware 3.12,这在很大程度上要归功于我在此处找到的指南:
http://cerbulescubogdan.blogspot.com/2010/11/novell-netware-312-on-vmware.html

下一步是准备空的 netware 卷以匹配我现有服务器上的附加卷,转储 C:\ 驱动器和我现有服务器上的 netware 卷上的所有内容,并从该信息中找出需要添加到 netware 的模块,安装我的许可证(如果它有任何用处的话,我们仍然有那个磁盘),然后移动数据。

我已获准在年初之后关闭服务器一周(遗憾的是不能提前关闭),因此,除了创建空卷外,其余工作都必须等到那时才能完成。

最后更新(2011 年 1 月 5 日):
本周,我能够让备用服务器在两个 RAID 阵列中工作,并且不会丢失数据。现在,控制器将两者列为“FAULT TOLLERANT”(耶!)。我还能够在上次更新的基础上继续努力,现在在 VMWare Server 2.0 中拥有一个可以运行的“备用”服务器。备用服务器可以运行并使用我们的 ERP 软件,但我无法将其投入生产,因为我(目前)无法从该框中打印(我不知道为什么)。即便如此,如果我别无选择,这台虚拟机还是可以在紧急情况下使用,在它和修复后的 RAID 阵列之间,我可以放心地忍受这种情况,直到 11 月我可以报废这台机器。

结语(2012 年 1 月 16 日):
用全新系统替换此服务器的项目确实按计划启动。万岁,不再有网络软件!万岁,Sql Server!国王已死。国王万岁!

我们仍计划让旧服务器继续运行一段时间,直到 8 月份财政年度后审计完成。但如果从现在到那时发生故障,没有人会抱怨太多。

答案1

获取(并继续以每日或更频繁的方式获取)共享文件数据的良好备份现在。如果您丢失了机器,您可能无法找到恢复它所需的软盘(是的)。如果可能的话,请获取 Netware 启动的 DOS 分区的副本。

这听起来像是 Adaptec AAA-131 RAID 卡(或那个时代的产品)。如果我是对的,你不会找到更好的管理软件,因为不存在这样的软件(请参阅http://www.adaptec.com/en-us/downloads/novell_netware/novell_netware/productid=aaa-131&dn=aaa-131.html(这是最新可用版本)。我“过去”使用过很多此类卡,它们工作正常。

如果是 AAA-131在配置时要格外小心。没有办法在不清除这些卡上的磁盘的情况下配置 RAID 集。这意味着,例如,如果您拆下盒子并连接一些测试磁盘,然后清除配置并在其上创建 RAID 集,当您重新插入“生产”磁盘时,如果没有卡先格式化它们,将无法使用它们。是的。就是这么糟糕。

Novell Netware 将在 VMware 虚拟机管理程序中运行。我建议与具有丰富 Novell Netware 经验的人(这里就有人——我指的就是你,Sysadmin1138——有这方面经验)签约,帮助您将服务器的内容移至虚拟环境中,至少您可以让其继续运行。

如果您的客户端计算机是现代的并且安装了 Microsoft 网络客户端,您可能会发现迁移到基于 Windows Server 的计算机实际上会快速而简单。将 Windows Server 计算机与 Netware 服务器同名,公开与 Netware 计算机具有相同 UNC 命名约定的共享目录结构,复制所有文件,并在目标计算机上复制权限(手动)。这可能并不难,您可以事先在测试实验室中“分阶段”迁移,并使用它测试一些客户端,以确定从脚本/用户环境角度需要更改哪些内容。

您可能可以从 eBay 上买到一些备用硬件。但是,您购买的任何旧产品都会存在可靠性问题。

如果我是你,我会找一个擅长 Windows Server 的人来帮助你完成从该机器迁移的过程现在。考虑到您几乎随时都可能丢失 Netware 机箱的全部内容,管理层可能会花一些钱。更换机箱不需要大量马力(考虑到您要更换的内容),因此软件许可和备份将是您最大的成本。通过使用擅长编写脚本并能够规划通过登录和启动脚本更改与客户端相关的设置的细节的顾问,可以最大限度地减少与客户端相关的迁移问题。

答案2

我知道,因为我曾经这样做过(嗨,埃文),VMWare 确实对 NetWare 有很好的支持。即使是对那些非常老旧的东西(你正在运行的东西)。那个年代的 NetWare 在空闲时会 NOOP CPU,而不是 HALTing ,所以无论在 VM 中给出什么 CPU 都会被固定。这就是 VMWare 工具的用途,它们让它不这样做。VMWare 自 90 年代以来就一直存在(甚至在 BrainShare 上设立了展位好几年了),并且不得不这样做,这就是他们获得支持的原因。微软的虚拟化技术还很新,他们从来没有虚拟化过 NetWare,所以它在那里不起作用。

如果这台服务器真的像你说的那么重要,那么申请一些 VMWare 许可证应该很容易。至少,申请一个 VMWare Workstation 许可证,这至少可以让这台服务器进入虚拟环境。如果真的需要的话,VMWare Server 是免费的(我相信)。完成这项工作后,您可以考虑将其移动到 ESXi 之类的东西,直到可以更正式地替换它为止。

还有其他选择,这取决于您的 Linux 技能。Novell 花了相当多的时间让 Xen(不是 KVM,而是 Xen,尽管两者都使用 qemu)支持 NetWare。它可能适用于 NW3.12,但您需要确保使用完全虚拟化模式,而不是半虚拟化。

该服务器足够新,应该有一个 CD-ROM 驱动器,这可能是您的救命稻草。完成备份后,如果您愿意,请将其启动到 ISO-Linux。它无法获取数据,但应该可以看到硬盘。此时,将dd两个卷完整复制到网络上的其他地方。这些驱动器映像可以直接由 qemu 用作虚拟驱动器。

有多种方法可以将 dd 生成的映像转换为 VMware VMDK,但我自己没有使用过。谷歌搜索,有可用的。

答案3

这对于你的问题来说没什么帮助(坦白地说,你已经有备用的了,而我对寻找老式磁盘的唯一有用建议是“将驱动器型号输入到 Google Shopping“),但在你触摸其他任何东西之前你应该确保你有一个好的备份,并且可以成功地将其恢复到可用的新机器上

如果这台机器真的像您描述的那样重要,那么现在就应该是您的零优先级。如果您有一段时间没有对备份进行成功的恢复测试,那么您应该认为它们毫无价值,并且您需要确保如果这台机器出现故障并死机,您实际上可以恢复。
如果另一个磁盘死机,并且您没有可用的备份,那么情况就大体如此了。无论您是否准备好,您都将立即迁移到新系统。

仅我的 3.50 美元。

答案4

上面的建议非常好。也试试这个 - 在备用的现代硬件上,尝试从上次完整备份中恢复整个系统。确保备用机器不在网络上。

你可能会说,那是什么?你没有备份和/或恢复程序?那么,现在你知道下周要做什么了吗?

相关内容