最佳系统管理员事故

最佳系统管理员事故

我正在寻找您遇到的系统管理员事故的有趣故事。删除 CEO 的电子邮件、格式化错误的硬盘等。

我将添加我自己的故事作为答案。

答案1

我很高兴发现 linux“killall”命令(杀死所有与指定名称匹配的进程,可用于阻止僵尸进程)和 solaris“killall”命令(杀死所有进程并停止系统,可用于在高峰时段停止生产服务器并让你的所有同事嘲笑你一周)之间的区别。

答案2

我负责我们公司的网络代理,当时是 Netscape 的产品。在管理表单中(这是一个基于 Web 的界面)玩的时候,有一个很大的按钮(我发誓它是红色的)写着删除用户数据库。我想,没问题。看看我点击它时它给我的选项是什么。如果没有选项,肯定会出现确认提示。

是的,没有确认。没有选择。没有更多用户。

因此,我找到 Solaris 系统管理员先生并告诉他我迫切需要从磁带进行恢复,而他回答说:“我没有备份那个盒子。”

“呃,再来一次。”​​我回答道。

“我没有备份那个盒子。它在我的备份轮换清单上,但我还没有开始做。”

“该服务器已经投入生产近 8 个月了!”我尖叫道。

耸肩他回答道,“抱歉。”

答案3

很多年前,我工作的公司有一位客户,他每晚都会将他们的 NT 4.0 服务器备份到爵士乐(就像一个大容量的 zip 磁盘)。

我们设置了一个批处理文件,作为夜间的计划任务运行。每天早上,他们会从驱动器中收集昨晚的磁盘,晚上离开之前,他们会按顺序插入下一张磁盘。

无论如何,批处理文件看起来像这样(Jaz 驱动器是驱动器 F:)...

@echo off
F:
deltree /y *.*
xcopy <important files> F:

不管怎样,一天晚上他们忘了放磁盘。更改驱动器 F: 失败(驱动器中没有磁盘),批处理文件继续运行。批处理文件的默认工作目录?C:。我第一次看到备份例程破坏它正在备份的服务器。

那天我学到了一些有关系统管理(和异常处理)的知识。

吉姆。

PS:如何修复?“deltree /y F:\*.*”。

答案4

我喜欢每个人都用“我年轻/没经验”来修饰他们的故事,好像他们再也不会这样做了。即使是最有经验的专业人士也可能发生意外。

我自己最糟糕的时刻是如此糟糕,以至于我现在想起来仍然会心悸……

我们有一个 SAN,上面有生产数据。这对公司至关重要。我的“导师”决定扩展一个分区以释放一些磁盘空间。你知道这会导致什么吗?他说 SAN 软件可以在生产时间内实时执行此操作,而且没有人会注意到。警钟本应开始响起,但却出奇地安静。他说他“以前”做过很多次,没有问题。但问题是 - 他让我点击“你确定吗?”按钮!因为我刚来公司,所以我以为这个人知道自己在说什么。大错特错。好消息是 LUN 得到了扩展。坏消息是……好吧,当我开始在 Windows 机器上看到磁盘写入错误时,我知道有坏消息了。

我很高兴我穿了棕色裤子。

我们不得不解释为什么午餐时间 1TB 的数据消失了。那真是糟糕的一天。

这其实是个好原则——在你做你怀疑的事情之前,想象一下如果出了问题你不得不向管理层解释。如果你想不出一个好的答案来解释你的行为,那就不要做。

相关内容