这个问题更多的是关于礼仪而不是实际的服务器问题。
我的一个客户有 2 台服务器经常停止响应(一开始很快,然后变得非常迟缓,需要 1 分钟才能执行完ls
,然后就完全停止了)。我建议我们把它关机维护,但他希望我设置一个脚本,在每次服务器锁定时重新启动它。更糟糕的是,服务器互相监视,重新启动命令必须有 60 秒的延迟(关机,等待 60 秒,然后启动)。这样做的问题是,它们很有可能在 60 秒内相继锁定。两个关机命令可以互相发送,并且两台服务器会同时关闭。没有人能够发送启动命令。就在几分钟前,我们因为这个原因停机了 2 个小时。
现在,我的客户希望我“设置一个标志”,这样关机命令就不会被重复发送。但是,这并不能消除同时挂起的问题,服务器最终还是会一起宕机。
在我看来,重启服务器根本不是一个好的解决方案。我建议我们找到根本原因并修复它。我还建议他使用,watchdog
但他拒绝了,所以暂时搁置了。我甚至放弃了,并说他应该启动一个小型专用服务器进行监控,但他仍然想要我来做。
我现在的困境是,我是否应该按他说的做(每次挂起时重新启动服务器)或者简单地未经许可登录他的服务器并应用所需的修复结束这一切。因为这个,我们根本无法前进。你们有什么建议?
答案1
我建议你尽最大努力研究,向你的客户解释情况和风险。如果他仍然希望你按照他的方式做事,那就按他的方式做。他是老板/客户,他应该得到他想要的。即使这没有意义。或者,如果你担心这种情况会损害你的声誉或给你自己带来其他严重问题,你可以辞职或拒绝为该客户提供服务。
我想我们中的许多人都经历过类似的情况,尽管情况没有那么糟糕。客户/公司的决定会影响到我们的工作,使我们陷入这种困难的境地。财务、政策、战略业务关系、缺乏教育、权力滥用等都可能成为问题。为了做正确的事情而奋斗很糟糕,但当你知道这是错的时候却不得不做错事更糟糕。人们应该向你征求你的专业意见。只要确保你警告过他们,这样当事情变糟时,没有人会认为这是你的错。