妥善接管（UNIX）生产服务器的技巧

Question 1

正如其他人所说，这看起来是一种松散的局面。

（从结尾开始）

全新部署

当然，您不能只是关闭服务器并让安装程序发挥它的魔力。

总体流程

获取备份服务器的预算（备份作为数据的存储）
创建数据快照，并在执行之前将其放置在那里任何事物
获得管理层的签字！
收集需求列表（是否需要 wiki、谁在使用 VMWare 实例，...）
- 来自管理层和
- 来自用户
获得管理层的签字！
关闭未列出的服务一周（一个服务一次 - 如果您只想关闭外部服务，但怀疑它仍可能在同一主机上的应用程序中使用，则 iptables 可能是您的朋友）
- 没有反应？-> 最终备份，从服务器中删除
- 反应？-> 与服务用户交谈
- 收集新需求和获得管理层的批准！
所有未列出的服务都停机一个月了，没有任何反应？->rm -rf $service（听起来有些刺耳，但我的意思是停止这项服务）
获取备用服务器的预算
每次将一个服务迁移到备用服务
获得管理层的签字！
关闭迁移的服务器（断电）
发现更多人向你尖叫 -> 耶，你刚刚找到了剩菜
收集新需求
重新启动并迁移服务
重复最后 4 个步骤，直到一个月内没有人来找你
重新部署服务器（并获得管理层批准！）
冲洗并重复整个过程。
- 重新部署的服务器是你的新备用服务器

你得到了什么？

所有服务的清单（为您和管理层）
文档（毕竟你需要为管理层写下一些东西，为什么不好好做一下并为你和管理层做点什么呢）

我曾经经历过那样的事情，那根本就没什么乐趣 :(

为什么你需要得到它经管理层签字？

让问题显而易见
确保你不会被解雇
解释风险的机会
- 如果他们不想让你做这件事也没关系，但毕竟这是他们在获得足够的意见来判断投资是否值得后做出的决定。

哦，还要向他们介绍总体计划在你开始之前，对最坏和最好情况下会发生的情况进行了一些估计。

它将要如果没有文档，无论是否重新部署都会花费大量时间。没有必要考虑后门，恕我直言，如果您没有文档，滚动迁移是达到可以为公司带来价值的理智状态的唯一方法。

Answer

正如其他人所说，这看起来是一种松散的局面。

（从结尾开始）

全新部署

当然，您不能只是关闭服务器并让安装程序发挥它的魔力。

总体流程

获取备份服务器的预算（备份作为数据的存储）
创建数据快照，并在执行之前将其放置在那里任何事物
获得管理层的签字！
收集需求列表（是否需要 wiki、谁在使用 VMWare 实例，...）
- 来自管理层和
- 来自用户
获得管理层的签字！
关闭未列出的服务一周（一个服务一次 - 如果您只想关闭外部服务，但怀疑它仍可能在同一主机上的应用程序中使用，则 iptables 可能是您的朋友）
- 没有反应？-> 最终备份，从服务器中删除
- 反应？-> 与服务用户交谈
- 收集新需求和获得管理层的批准！
所有未列出的服务都停机一个月了，没有任何反应？->rm -rf $service（听起来有些刺耳，但我的意思是停止这项服务）
获取备用服务器的预算
每次将一个服务迁移到备用服务
获得管理层的签字！
关闭迁移的服务器（断电）
发现更多人向你尖叫 -> 耶，你刚刚找到了剩菜
收集新需求
重新启动并迁移服务
重复最后 4 个步骤，直到一个月内没有人来找你
重新部署服务器（并获得管理层批准！）
冲洗并重复整个过程。
- 重新部署的服务器是你的新备用服务器

你得到了什么？

所有服务的清单（为您和管理层）
文档（毕竟你需要为管理层写下一些东西，为什么不好好做一下并为你和管理层做点什么呢）

我曾经经历过那样的事情，那根本就没什么乐趣 :(

为什么你需要得到它经管理层签字？

让问题显而易见
确保你不会被解雇
解释风险的机会
- 如果他们不想让你做这件事也没关系，但毕竟这是他们在获得足够的意见来判断投资是否值得后做出的决定。

哦，还要向他们介绍总体计划在你开始之前，对最坏和最好情况下会发生的情况进行了一些估计。

它将要如果没有文档，无论是否重新部署都会花费大量时间。没有必要考虑后门，恕我直言，如果您没有文档，滚动迁移是达到可以为公司带来价值的理智状态的唯一方法。

Question 2

您是否有理由相信前任政府留下了一些不好的东西，还是您只是看了很多电影？

我并不是想开玩笑，我只是想知道你认为存在什么样的威胁以及这种威胁有多大的可能性。如果你认为某种严重破坏性问题确实存在的可能性非常高，那么我建议你处理它就像是一次成功的网络入侵。

无论如何，在您处理这个问题时，您的老板都不希望出现停机中断的情况——如果系统出现故障（无论是真正的故障还是流氓管理员），他们对整理系统的计划停机和计划外停机的态度如何？以及他们的态度是否现实，以及您对此处确实出现问题的可能性的评估如何。

无论您做什么，请考虑以下事项：

拍摄系统 r 的图像现在就好。在做其他任何事情之前。事实上，拿走两个，把一个放在一边，不要再碰它，直到你知道你的系统发生了什么，如果有的话，这是你接管系统时的记录。

将“第二”组映像恢复到某些虚拟机，并使用这些映像来探测正在发生的事情。如果您担心在某个日期之后触发某些事件，那么请在虚拟机中将日期向前设置一年左右。

Answer

您是否有理由相信前任政府留下了一些不好的东西，还是您只是看了很多电影？

我并不是想开玩笑，我只是想知道你认为存在什么样的威胁以及这种威胁有多大的可能性。如果你认为某种严重破坏性问题确实存在的可能性非常高，那么我建议你处理它就像是一次成功的网络入侵。

无论如何，在您处理这个问题时，您的老板都不希望出现停机中断的情况——如果系统出现故障（无论是真正的故障还是流氓管理员），他们对整理系统的计划停机和计划外停机的态度如何？以及他们的态度是否现实，以及您对此处确实出现问题的可能性的评估如何。

无论您做什么，请考虑以下事项：

拍摄系统 r 的图像现在就好。在做其他任何事情之前。事实上，拿走两个，把一个放在一边，不要再碰它，直到你知道你的系统发生了什么，如果有的话，这是你接管系统时的记录。

将“第二”组映像恢复到某些虚拟机，并使用这些映像来探测正在发生的事情。如果您担心在某个日期之后触发某些事件，那么请在虚拟机中将日期向前设置一年左右。

Question 3

首先，如果你要花额外的时间在这上面，我建议你得到报酬对此表示赞同。从你的话来看，似乎你已经接受了无偿加班的事实 - 我认为不应该这样，尤其是当你因为别人的过错而陷入困境时（可能是管理层、老系统管理员或两者兼而有之）。

关闭服务器并启动到单用户模式（init=/bin/sh 或 grub 中的 1）以检查以 root 登录运行的命令。此时停机是必要的，向管理层明确表示，如果他们想确保能够保留数据，那么除了停机之外别无选择。

之后检查所有 cronjobs，即使它们看起来合法。还要尽快执行完整备份 - 即使这意味着停机。如果需要，您可以将完整备份转换为正在运行的虚拟机。

然后，如果您能获得新的服务器或功能强大的虚拟机，我实际上会逐个将服务迁移到新的干净环境中。您可以分几个阶段进行此操作，以最大限度地减少可察觉的停机时间。您将获得对服务非常必要的深入了解，同时恢复对基础系统的信心。

与此同时，你可以使用以下工具检查 rootkitchkroot工具。跑步涅瑟斯在服务器上寻找旧管理员可能利用的安全漏洞。

编辑：我想我没有尽可能好地回答你问题的“优雅”部分。第一步（进入单用户模式检查登录陷阱）可能可以跳过 - 旧的系统管理员给你 root 密码并设置登录来执行的操作与自己rm -rf /删除所有文件几乎相同，因此这样做可能毫无意义。对于备份部分：尝试使用rsync基于解决方案，这样你就可以在线完成大部分初始备份并最大限度地减少停机时间。

Answer

首先，如果你要花额外的时间在这上面，我建议你得到报酬对此表示赞同。从你的话来看，似乎你已经接受了无偿加班的事实 - 我认为不应该这样，尤其是当你因为别人的过错而陷入困境时（可能是管理层、老系统管理员或两者兼而有之）。

关闭服务器并启动到单用户模式（init=/bin/sh 或 grub 中的 1）以检查以 root 登录运行的命令。此时停机是必要的，向管理层明确表示，如果他们想确保能够保留数据，那么除了停机之外别无选择。

之后检查所有 cronjobs，即使它们看起来合法。还要尽快执行完整备份 - 即使这意味着停机。如果需要，您可以将完整备份转换为正在运行的虚拟机。

然后，如果您能获得新的服务器或功能强大的虚拟机，我实际上会逐个将服务迁移到新的干净环境中。您可以分几个阶段进行此操作，以最大限度地减少可察觉的停机时间。您将获得对服务非常必要的深入了解，同时恢复对基础系统的信心。

与此同时，你可以使用以下工具检查 rootkitchkroot工具。跑步涅瑟斯在服务器上寻找旧管理员可能利用的安全漏洞。

编辑：我想我没有尽可能好地回答你问题的“优雅”部分。第一步（进入单用户模式检查登录陷阱）可能可以跳过 - 旧的系统管理员给你 root 密码并设置登录来执行的操作与自己rm -rf /删除所有文件几乎相同，因此这样做可能毫无意义。对于备份部分：尝试使用rsync基于解决方案，这样你就可以在线完成大部分初始备份并最大限度地减少停机时间。

Question 4

您对安全问题有点儿过于偏执了。其实没必要这么偏执。（因为您说的是陷阱）。查看已安装的软件列表。查看正在运行的服务（netstat、ps 等），查看 cron 作业。禁用以前的系统管理员用户帐户而不删除该帐户（只需将 shell 指向 nologin 即可轻松完成）。查看日志文件。我认为通过这些步骤，以及您对公司需求的了解（您可以猜测服务器的用途），我认为您应该能够维护它们而不会出现任何重大失误。

Answer

您对安全问题有点儿过于偏执了。其实没必要这么偏执。（因为您说的是陷阱）。查看已安装的软件列表。查看正在运行的服务（netstat、ps 等），查看 cron 作业。禁用以前的系统管理员用户帐户而不删除该帐户（只需将 shell 指向 nologin 即可轻松完成）。查看日志文件。我认为通过这些步骤，以及您对公司需求的了解（您可以猜测服务器的用途），我认为您应该能够维护它们而不会出现任何重大失误。

妥善接管（UNIX）生产服务器的技巧

答案1

总体流程

你得到了什么？

为什么你需要得到它经管理层签字？

答案2

答案3

答案4

相关内容