fault-tolerance

VMware ESXi/vSphere 容错带宽要求是多少
fault-tolerance

VMware ESXi/vSphere 容错带宽要求是多少

我计划部署一个由 2 个 ESXi/vSphere 服务器组成的集群,并让它们以容错模式运行。虚拟服务器主要为 IIS 和 SQL。物理服务器将配备单个 Xeon E5-2697(2.7Ghz 12 核)CPU、64GB RAM 和用于 ESXi FT 通信的专用网络控制器。假设这些虚拟服务器以最大负载运行,ESXi FT 需要多少带宽才能使冗余节点与主节点保持同步?1 Gbit 以太网连接是否足够,还是我应该改用 10 Gbit 以太网? 谢谢! ...

Admin

为了实现冗余,我应该使用哪些 TLD 作为 NS 记录?(需要 DNSSEC 支持)
fault-tolerance

为了实现冗余,我应该使用哪些 TLD 作为 NS 记录?(需要 DNSSEC 支持)

问题 作为一般做法,对名称服务器使用多个 TLD 是一个好主意吗? 我应该如何选择最适合作为我的 NS 名称根服务器的 TLD? 更多信息 我正在切换超过 800 个 DNS 区域交给外包 DNS 提供商。 我最初计划将区域名称设置为 nsX.company.com,但我认为最好有多个 TLD,.net例如.org和.info 由于我计划在 company.com 上支持 DNSSec,所以我认为所有第一层名称服务器也必须支持它。 这个问题的部分灵感来自我们的提供商 UltraDNS。在我们的域名配置屏幕中,他们会主动验证,如果我们的名称服务器...

Admin

记录 2 个静态 IP 的 DNS - 容错
fault-tolerance

记录 2 个静态 IP 的 DNS - 容错

我在 DMZ 中有一个 Web 服务器,可以通过 2 个不同的公共静态 IP 地址访问,这两个 IP 地址由 2 个不同的 ISP 通过 2 个不同的互联网连接提供。 我想创建一个记录,比如说“myserver.contoso.com”,在正常情况下(循环)对两个 IP 进行负载平衡。 然而,主要目标是,如果一个互联网上行链路(即一个公共静态 IP)中断,服务器仍然可以访问。 我该怎么做才能实现这个目标? 更新 仅供参考:我创建了一个 DNS 记录“pippo.disney.com”,其中包含 2 个记录“A”,TTL 为 5 分钟,一切正常!希望这...

Admin

为什么 keepalived 需要状态
fault-tolerance

为什么 keepalived 需要状态

来自文档 ! MASTER and BACKUP state are determined by the priority ! even if you specify MASTER as the state, the state will ! be voted on by priority (so if your state is MASTER but your ! priority is lower than the router with BACKUP, you will lose ! the MASTER state) 那么为什么要定义...

Admin

容错 KVM 主机
fault-tolerance

容错 KVM 主机

我将使用 QEMU+KVM 创建一个简单的虚拟主机基础设施。它应该非常简单,没有云或任何其他很酷的东西。目前唯一的要求是数据的容错能力(主机的磁盘映像在线备份)。欢迎实时迁移,但不是强制性的。你建议什么方法?现在我正在考虑 DRBD。 ...

Admin

如何让 Hyper-V 中的虚拟机继续在故障转移群集中运行。2 个节点,服务器 2019
fault-tolerance

如何让 Hyper-V 中的虚拟机继续在故障转移群集中运行。2 个节点,服务器 2019

如果我遗漏了一些显而易见的东西,请原谅我,但我对服务器和故障转移群集非常陌生。我还没有找到一个能完全回答我所寻找的问题。 我的目标是使用集群中的两个或多个服务器让虚拟机 100%(或接近)运行。这是用于访问控制系统的,因此它需要始终处于运行状态并无缝故障恢复,以便客户端工作站可以访问它。据我所知,这正是故障转移集群的设计目的,应该非常适合此目的。 我有 3 台物理服务器,其中 2 台是集群服务器,1 台是域控制器。使用 iSCSI,我在共享存储中安装了 VM,并且可以在任何节点或 DC 上运行它并通过 RDP 连接到它,但当其中一个节点断开连接时。每次发生这...

Admin

“降级”的 RAID 6 阵列和“干净”的 RAID 5 阵列之间有什么区别?
fault-tolerance

“降级”的 RAID 6 阵列和“干净”的 RAID 5 阵列之间有什么区别?

假设您有两个 RAID 阵列,一个有 N 个磁盘,另一个有 N+1 个磁盘。具有 N 个磁盘的阵列格式化为RAID 5并保持原样,而另一个数组被格式化为RAID 6在其中一个磁盘被移除之前。现在两个阵列都有 N 个磁盘,N-1 个磁盘的可用存储空间,并且可以承受一个(或多个)磁盘的丢失。 除了 RAID 控制器使用的任何元数据之外,这两个阵列之间还有什么区别吗(在数据布局、性能和可靠性方面)?我是否可以将缺少一个磁盘的 RAID 6 阵列转换为缺少一个预期磁盘的 RAID 5,并且只需进行最少的“重塑”/“重写”? 我知道 RAID 5 和 RAID 6 中...

Admin

计算纠删码存储的条带数
fault-tolerance

计算纠删码存储的条带数

我正在设置一个 ceph 集群(对我来说是第一次),最终将由分布在 10 台主机上的约 100 个磁盘组成。我将使用单个擦除编码数据池来最大化磁盘空间;我的限制是效率约为 80%,容错能力为 2 个磁盘。这可以通过 ak=8 m=2 擦除码最简单地实现,也可以通过 k=16 m=4 实现,并具有最多可容忍 4 个磁盘故障的优势。 因此,我想知道增加条带数量有哪些缺点;我想到了一些缺点(例如,由于文件碎片增加而导致 CPU 和网络开销增加),但鉴于我对这个主题的了解很少,我不确定。我真的很感激任何关于这个主题的见解。 ...

Admin

可抢占节点上的独立 mysql 5.7 实例,哪些设置可以使其以最具容错性的方式运行?
fault-tolerance

可抢占节点上的独立 mysql 5.7 实例,哪些设置可以使其以最具容错性的方式运行?

简单来说,我有一个独立 mysql 实例在托管于可抢占节点。这意味着至少每 24 小时,底层节点就会被杀死一次,并且永远无法保证彻底关闭。 在采用这种方式之前,我通过在不同负载下模拟此场景、执行写入操作以及通过触发内核恐慌来杀死底层节点来测试设置:即使经过数千次重启也没有问题。 在现实世界中,有时 - 比如说每月超过 3000 个 mysql 实例 - 一个数据库会损坏,并且需要恢复(强制恢复、完全转储、重新加载转储)。 我可以配置哪些最佳选项来确保 mysql 以某种方式运行,即使服务器频繁关闭,也不会写入不一致的数据?牺牲性能不是问题。 该磁盘是 Goo...

Admin

如何选择正确的 AWS EC2 实例来提供 MySQL 服务
fault-tolerance

如何选择正确的 AWS EC2 实例来提供 MySQL 服务

最近我们注意到我们的应用程序出现了一些与 MySQL 加载相关的错误。大型数据库(约 32 GB)上的一些基本查询耗时比预期的要长。 为了服务 MySQL 服务器,我们使用 m6d.xlarge 实例,平均每天的访问量为 3000,尽管我们看到了增长趋势,有时我们有 5000 个或更多的用户,所以我想在永久增长之前解决服务器的问题。因此,我打算添加另一个实例,例如 t4g.2xlarge,具有 8 个 CPU 并能够获得额外积分。 请注意,我们在服务器上只使用 MySQL,因此服务器上没有任何其他障碍,所有负载都在 MySQL 服务器上,有时服务器负载高达 ...

Admin

VMware ESXi 中的打印服务器冗余
fault-tolerance

VMware ESXi 中的打印服务器冗余

我遇到了一个难题,那就是如何才能让两台打印服务器的正常运行时间达到最高。最好的解决方案是,让其中一台服务器作为主打印服务器,另一台服务器作为辅助服务器,一旦主服务器因某种原因离线,辅助服务器就可以继续执行主服务器的工作(接管打印作业等)。 但我对任何可能解决我的问题的方法都表示感谢! 这是我的设置: 在 ESXi 6.7 上运行虚拟机 在 Windows Server 2019 上运行的打印服务器 我将在同一台主机上运行 2 个打印服务器,或者如果有必要,则在 2 个主机上运行它。 我已经研究过 NLB、故障转移群集和 VMware 容错,但到目前为止还没有...

Admin

Vmware Esxi Vcenter 6.7 虚拟机的容错功能呈灰色
fault-tolerance

Vmware Esxi Vcenter 6.7 虚拟机的容错功能呈灰色

我对 VMWARE 还很陌生。我正尝试在 Vcenter 6.7 上为我的一个 VMS 实现容错,但出于某种原因,“容错”选项卡显示为灰色。我的 vcenter 中有 2 个 esxi 服务器,它们都位于同一个集群中,并且已启用 HA 和 DRS。我已在 Vmotion 内核上为 esxi1 和 2 启用了容错日志记录。有人能帮忙吗,如何解决这个问题?任何帮助都将不胜感激! ...

Admin

在 IaaS 中保存预写日志 (WAL) 的最佳方法(容错、低成本)?
fault-tolerance

在 IaaS 中保存预写日志 (WAL) 的最佳方法(容错、低成本)?

我正在为“云原生” DBMS 开展一个绿地项目,“云原生”意味着它所做的保证(例如 ACID)将取决于某些支持 IaaS 服务(例如对象存储、托管消息队列等)的存在。目标是减少 DBMS 的代码库大小和操作开销,适用于您已经在 IaaS 环境中运行的情况。 任何 DBMS 都需要的一个功能是预写日志 (WAL),用于在崩溃后重放状态。实现 WAL 的简单、“云无关”方式是将其作为 DBMS 守护进程管理的磁盘文件。在云设置中,这隐式转换为 WAL 日志驻留在本地连接的“临时”磁盘中,或驻留在通过 iSCSI 等方式连接到 VM 的虚拟机管理程序的 SAN(...

Admin

ESXi 容错网络问题-FT 流量泛滥?
fault-tolerance

ESXi 容错网络问题-FT 流量泛滥?

我设置了一个 2 节点 vSphere 集群。每个节点都配备了 4x1GE NIC。我在每个节点中设置了一个 vSwitch,使用所有 4 个 vmnic 作为适配器和以下端口: 管理:vmKernel 端口 -> 在 vmnic0 上处于活动状态,在 vmnic1-2-3 上处于待机状态 vMotion 和 FT -> 在 vmnic3 上处于活动状态,在 vmnic0-1-2 上处于待机状态 工作负载 -> 在 vmnic0-1-2-3 上处于活动状态 根据原始虚拟端口进行路由。 我知道该解决方...

Admin