resilience

简单检查以确认对域控制器的访问
resilience

简单检查以确认对域控制器的访问

我正在准备在新网络(将托管关键任务应用程序)上进行一系列弹性测试。 作为其中的一部分,我应该确认域控制器的弹性。我们在这个环境中有 2 个 DC,我需要能够确认当我拔掉其中一个 DC 的电源时,剩余的 DC 会接替剩余的 DC。 我可以做什么最简单的测试来确认 DC2 成功覆盖 DC1? 这么简单的事情gpupdate /force就够了吗?或者有更好的,简单的测试?我们要测试的东西太多了,所以测试得越少越好。 ...

Admin

应用滚动更新时如何处理正在进行的请求?
resilience

应用滚动更新时如何处理正在进行的请求?

给定一组进行滚动更新的 Web 服务器(例如通过 kubernetes 滚动更新),如果在向其中一个处于终止等待状态的 Web 服务器发出 SIGTERM 信号之前几毫秒向该 Web 服务器发出请求, 服务器是否应该向客户端发出信号,告知它正在接收 SIGTERM 信号,并告诉客户端使用不同的(或相同的)网络地址(可能会有延迟)“再试一次”? 否则,服务器是否可以自动将请求重定向到已经卷起的 Web 服务器的另一个 pod/实例? 在 kubernetes 的特定情况下,是否可以将请求发送回服务并让其知道在至少一个 pod 推出后将其发送回? ...

Admin

网络弹性设计
resilience

网络弹性设计

我正在尝试为服务器场和 DMZ 设计具有弹性的多站点网络,以实现入站和出站弹性。 我首先想满足以下弹性: 1.对于位于服务器场中的服务器,出站可以在两个内部防火墙 A 和 B 之间自动进行故障转移。(例如,如果防火墙 A 发生故障,服务器将自动通过防火墙 B 进行路由)2.用户网络 A 可以通过内部防火墙 A 访问服务器场,用户网络 B 可以通过内部防火墙 B 访问服务器场3.入站连接可通过 WAN A(65.1.1.1/27)或 WAN B(128.1.1.1/27)进行,应保留相同的路由路径(我知道这可能可以使用 BGP 实现多宿主路由以保留相同的 WA...

Admin

预防性配置设置可确保长时间运行的 PHP 脚本不会造成 MySQL 事务挂起和故障
resilience

预防性配置设置可确保长时间运行的 PHP 脚本不会造成 MySQL 事务挂起和故障

我想知道是否有一个 PHP/MySQL 配置选项(或选项组合)可以防止少数地方的长时间运行的 PHP 脚本创建挂起和休眠的 MySQL 事务,这些事务累积起来并可能导致整个 MySQL 服务器崩溃。 以下是我想要避免的情况: 假设我启动了一个新网站,其中某个部分有一个非常低效的 PHP 循环,该循环从未得到解决或无法预见。一旦网站启动并且流量巨大,查询就会出现,我们会收到 504 错误。 此时,我们积累了大量处于休眠状态的 MySQL 连接,如果达到最大连接限制,数据库服务器和网站其余部分就会随之瘫痪。这一切都是因为一个页面上的一个查询。 我希望做的是防止性...

Admin

使用两个可用的 Solr 节点实现 Drupal 的 Solr 弹性的最佳方法是什么?
resilience

使用两个可用的 Solr 节点实现 Drupal 的 Solr 弹性的最佳方法是什么?

我正在尝试找出在两个节点上结合 Drupal 7 部署 solr(6.6.6)的最佳方法,以提供某种弹性。 第一个问题是 Drupal 仅支持单个 solr 实例的概念。因此,即使实现了多个 solr 服务器,Drupal 外部的负载平衡在环境中的某个地方是需要的。这是额外的复杂性,我希望至少在短期内避免。 第二个问题是我只有 2 个服务器可用。因此 SolrCloud 无法用作 ZooKeeper 节点,这意味着我只能使用单个 solr 服务器,无法恢复,而且对于我的小环境来说,这可能有点过头了。 我可以将两个 solr 服务器配置为主/从服务器,但...

Admin

Windows Server 2008 R2 的“驱动器扩展器”/“存储空间”功能
resilience

Windows Server 2008 R2 的“驱动器扩展器”/“存储空间”功能

我有一台 Hyper-V 主机,配备 4 个物理 HDD,每个 300 GB,这台机器将托管几个 VM,每个 VM 的大小大约为 150GB。 VM 并非任务关键型,但我仍然需要某种针对 HDD 故障的保护,并且宁愿避免使用 RAID(请接受,出于各种原因,我宁愿寻找软件解决方案)。首先,我考虑的是这样的设置: HDD 1: VM A full image backup of VM B HDD 2: VM B full image backup of VM A etc. 因此,如果磁盘 1 出现故障,我可以从磁盘 2 恢复两台机器,反...

Admin

更好的多路径系统
resilience

更好的多路径系统

我们很幸运,我们的每台服务器都有多个 NIC/HBA/CNA 连接到多个交换机,这种方法使我们的平台多次保持正常运行。不过,上周我们遇到了一个问题,我不知道该如何解决。 我们有一个交换机,承载着我们大量崩溃的流量(细节并不重要,但它是 Cisco 6509,它发生了严重的 CPU 崩溃,并且没有自动恢复)。不幸的是,它的线路卡仍在工作(即 L1 和 L2 处于运行状态),但丢失了所有上行链路。连接的服务器如下; 带有 Veritas Storage Foundation 的 Windows Server 2003 32 位 EE SP2 Oracle ...

Admin

我们如何保持 Active Directory 在多个站点间的弹性?
resilience

我们如何保持 Active Directory 在多个站点间的弹性?

我负责一家约 100 名员工的公司的大部分 IT 工作,该公司分布在全球约 5 个站点。我们使用 Active Directory 进行身份验证,主要通过 LDAP 为 Linux (CentOS 5) 系统提供服务。 我们经历了一系列事件,两个主要站点之间的 IP 隧道出现故障,一个站点的辅助域控制器无法联系另一个站点的主域控制器。似乎辅助域控制器在与主域控制器失去连接后几分钟内就开始拒绝用户身份验证。 我们如何使辅助域控制器更能应对停机?有没有办法让它缓存整个目录和/或至少在本地保存足够的信息以应对长达数小时的断线? (如果这有任何区别的话,我们都...

Admin

NetApp 文件服务器是否是弹性 HTTP/S 服务器?
resilience

NetApp 文件服务器是否是弹性 HTTP/S 服务器?

我是 FC SAN 类型的人,虽然我们使用 NetApp 30xx 文件服务器进行大量非必要存储,但我真的不是专家。 我对一个非常有弹性(即 3 或 4 个“9”)的基本静态 HTTP/S Web 服务器有一个新的要求,它将从大约 16-20 TB 的目录/池中发送出较大(2-8GB)的文件。 客户端数量永远不会超过 100 个,并且此文件服务器/Web 服务器与这些客户端之间的带宽不会超过 2-3Gbps,因此整体性能实际上不是问题。因此,我的问题是,当 NetApp 文件服务器仅用作 HTTP/S 服务器时,它的可靠性/弹性如何? 显然,如果我询问...

Admin