cluster

心跳令牌失败
cluster

心跳令牌失败

我今天有一个新的:这个! root@lab-web2:/etc/heartbeat# systemctl status heartbeat ● heartbeat.service - Heartbeat High Availability Cluster Communication and Membership Loaded: loaded (/lib/systemd/system/heartbeat.service; enabled; vendor preset: enabled) Active: active (running) since Wed 20...

Admin

我需要具有主-主复制的简单键值或 SQL DB
cluster

我需要具有主-主复制的简单键值或 SQL DB

我正在创建自托管 DNS 服务,任何用户都可以在其服务器上运行该服务。目的是通过公开列表对可用网站进行家长控制并阻止广告和钓鱼网站。服务包含: DNS 服务器 DoH 桥接器使 DNS 服务器在 Android 上运行(作为私有 DNS) Web 界面用于控制应阻止哪些域名以及加载黑名单。 问题是:为了使我的 DNS 服务更具容错能力,用户应该能够将其安装在多台服务器、vps-es 等上。 我希望每个节点都能自给自足,并且当用户配置其域名(例如,dns.johndoe.me)以使用多个 A 记录(用于多个服务器)时,他不需要任何其他操作,只需打开http...

Admin

在 VirtualBox 上设置 Kubernetes 环境以学习 CI/CD 管道(DevSecOps)
cluster

在 VirtualBox 上设置 Kubernetes 环境以学习 CI/CD 管道(DevSecOps)

我正计划学习 K8s。我对学习其相关技术很感兴趣,例如 CI/CD 管道和 devsecops。我知道这些都是很宽泛的主题。但我相信正确的设置将帮助我同时学习所有这些。 据我所知,从开发到生产主要有三种环境:开发、准备和生产。也许可以有额外的设置用于手动软件测试等。还有 Kubernetes 在文件。 我学习这门课程的资源是我的个人笔记本电脑和 VirtualBox。因此,我想尝试为不同的环境创建虚拟机,并通过允许虚拟机相互通信来尝试 CI/CD 管道 (devsecops) 设置。但是,当我看到针对学习环境的不同设置建议时,我不太确定如何实现这一点。此外,...

Admin

Druid 协调器无法与集群的其余部分通信
cluster

Druid 协调器无法与集群的其余部分通信

我正在部署一个包含 Hadoop、Spark 和 Apache Druid 的 5-KVM 集群以进行测试,但我遇到了有关 Druid 的问题。正在运行的集群组织如下: hadoop-master:还托管 Druid 主节点(协调员-霸主(英文): hadoop-worker1:还托管 Druid 第一个数据节点(中层经理和历史(英文): hadoop-worker2:还托管 Druid 的第二个数据节点; spark-worker1:还托管 Druid 查询节点(经纪人和路由器)。 我还配置了一个 Zookeeper 集群,分布在所有这些机器上以及sp...

Admin

Samba 安装导致系统挂起
cluster

Samba 安装导致系统挂起

我使用 2 个节点 + quorum 的 pcs 设置了一个集群 [root@konor2 etc]# pcs status Cluster name: wildflycluster Status of pacemakerd: 'Pacemaker is running' (last updated 2023-06-01 09:52:35 +02:00) Cluster Summary: * Stack: corosync * Current DC: konor2c (version 2.1.5-7.el9-a3f44794f94) - partit...

Admin

使用 Pacemaker 管理 raid6 设备
cluster

使用 Pacemaker 管理 raid6 设备

我正在设置 4 个主机,每个主机都导出一个本地存储iscsi设备target其他每台主机都将其导入,这样每台主机都可以同时访问所有 4 个存储设备。我建立了一个LVM共享卷组包括所有这 4 个iscsi设备。在这个卷组中,我创建了 4 个逻辑卷,每个卷都与一个iscsi导入的设备一起烘焙。最后,我使用LVM共享VG同步机制,使用lvmlockd和dlm确保每次只有一个主机可以使用这些逻辑卷。最后,我raid6在这 4 个逻辑卷之上构建了一个阵列,这样原则上最多可以有 2 个主机停机而不会中断存储服务。 我使用pacemaker,从导出iscsi卷target...

Admin

为什么“module load intel”无法加载 libfftw3?
cluster

为什么“module load intel”无法加载 libfftw3?

我在集群 (centos) 中尝试运行一个程序 (pw.x),该程序需要加载三个模块:intel、impi 和 quantum-espresso。现在,我收到一条错误消息,提示 pw.x: error while loading shared libraries: libfftw3.so.3: cannot open shared object file: No such file or directory 因此,我运行了一个ldd pw.x命令来检查发生了什么,然后我发现: linux-vdso.so.1 => (0x00007fff8158300...

Admin

如何向具有一个接受读写操作的节点的 galera 集群添加 2 个缺失的节点?
cluster

如何向具有一个接受读写操作的节点的 galera 集群添加 2 个缺失的节点?

我正在运行一个有 3 个节点的 galera 集群,有 3TB 的数据。昨晚由于短暂断电和 UPS 故障,我完全丢失了 2 个节点和 /var/lib/mysql 文件夹中的所有内容。目前,我正在单个节点上运行所有应用程序,并且我已经尝试了 12 个小时将其他 2 个节点添加到集群中。我每晚都会运行一次 Percona XtraBackup,所以我有备份。 目前情况: Node1:已启动并正在运行(我尝试重新启动 mysql 服务) Node2:关闭(/var/lib/mysql 中没有数据) Node3:关闭(/var/lib/mysql 中没有数据) ...

Admin

如何在多台机器之间同步 UID 和 GID,同时尽量减少对用户体验的影响?
cluster

如何在多台机器之间同步 UID 和 GID,同时尽量减少对用户体验的影响?

我有两个工作站(WS 1 和 WS 2)和一个服务器(S),它们都运行 Ubuntu 22.04。这些机器以前是独立管理的,因此用户可以在其中部分或全部机器上拥有帐户,并且它们上存在不同的组。 我想设置一个包含这些机器的集群,以便根据它们的可用资源向它们提交 slurm 作业。我/nfs在 S 上创建了一个目录并设置了一个 NFS 服务器,并在 WS 上安装了 NFS 客户端并挂载/nfs在它们上。 我看见Slurm 快速入门指南时钟、UID 和 GID 应在所有设备上同步。如何才能在尽可能不影响用户的情况下实现此目的? 我发现有几个问题需要解决: 使用 ...

Admin

家庭服务器具有不同的操作系统而不是多台 PC?
cluster

家庭服务器具有不同的操作系统而不是多台 PC?

我只是在想,不用为我的家人购买功能强大的笔记本电脑和 PC,是否可以只创建一台功能强大的 PC,预装不同的操作系统,然后将程序甚至整个操作系统传输到小型客户端上网本或迷你 PC 上?并且只使用一个真正高端的 GPU 进行游戏、视频编辑、编程等。即使我没有考虑为不同的用户并行使用,这也比为孩子购买一台游戏 PC、另一台用于工作、另一台轻量级电脑为妻子购买一台纯 Linux 电脑用于银行业务、另一台用于度假等要容易和便宜得多。即使在本地网络上,如果它在外部连接上会滞后,这可能吗? 如果可能的话我应该用它做什么,我怎...

Admin

为什么非root安装的软件可以在整个集群中运行?
cluster

为什么非root安装的软件可以在整个集群中运行?

我最近在一个有十几个节点(每个节点有几个核心)的集群上的帐户文件夹中本地安装了一个新的 python3 和另一个 python 包。 我最初以为我只能在安装程序的节点上运行程序,该节点大概是集群的门户节点,即我登录的地方。但是,我注意到我甚至可以提交在集群上的任何节点上运行此类程序的作业。我还确保我确实使用的是新安装的 python3.x,而不是很久以前已经存在的 python2.x。这发生在两个不同的集群上(一个使用 PBS 作业系统,另一个使用 LSF Lava)。 那么为什么这是可能的呢? ...

Admin

集群仲裁中的 50/50 是什么意思?
cluster

集群仲裁中的 50/50 是什么意思?

集群仲裁中的 50/50 是什么意思? 表格链接:https://docs.microsoft.com/en-us/azure-stack/hci/concepts/quorum#cluster-quorum-overview ...

Admin

Pacemaker 检查是否为主
cluster

Pacemaker 检查是否为主

我有几个 shell 脚本在运行 while 循环,它们非常昂贵,因为它们通过运行“pcs status”来检查系统是否是主系统。还有人知道更便宜的方法吗?proc 中的某些内容或可能是 /var/lib/pacemaker/? 任何帮助,将不胜感激。 提前致谢! ...

Admin