我是一名中等水平的 Web 开发人员。我从未管理过任何高流量网站。通常,我观察到只有高流量网站才会因维护而关闭。stackoverflow.com 也会因维护而关闭。
我总是想知道。他们做了什么样的维护?我的意思是,这个过程是自动化的。
用户请求-->网络服务器-->服务器端程序-->数据库服务器。
有什么需要维护的?
答案1
通常最高交通站点不停机维护。它们被设计成不需要停机。(根据站点的不同,这可能非常棘手。这不仅仅是运行多个服务器的情况,尽管这显然是起点。)
但是,“站点停机维护”通常意味着以下任何一种情况:
- Web 应用软件升级(添加新功能等)
- 硬件更改(例如,移动到不同的数据中心;在切换期间)
- 出现了严重问题,他们正在尝试修复(例如,数据中心发生断电;将 DNS 条目更改为指向其他地方的静态“站点已关闭”页面,直到电源恢复)
答案2
他们可能希望对服务器上运行的许多不同软件进行更新(或修复),包括(但不限于):
- 操作系统
- 网络服务器软件本身
- 任何脚本框架
- 数据库
- ETC
除此之外,他们还可能进行硬件维护,例如添加新硬盘、升级主板、安装更快的 RAM 或更换网卡。实际上,有很多东西(包括硬件和软件)都可以升级或修改。
现在,如果他们有一个备份服务器(或者一个集群或类似的东西),这可以是透明的,但如果它实际上是一个为页面提供服务的盒子......那么它几乎必须关闭。
答案3
因为你有编程背景,所以我将以此为基础进行类比。想象一下,系统管理员就像编程一样,只是每隔几个小时你就会被要求用不同的语言编写代码。有时是 Pascal。
确实,尽管它可能意味着任何事情。有时老鼠会咬进一个温暖的地方。或者一个单点故障会暴露出来。消除停机时间是我们追求的目标……就像编写在第一次编译时就完美运行的代码一样。
答案4
可能是服务器、框架、数据库的升级;迁移到新的数据中心并关闭旧服务器,这样就没有人可以连接;修补这些服务器上运行的操作系统或软件
基本上任何可能导致网站在一定时间内不可用的事情