我已经配置了具有少量资源的 corosync 集群。
有自定义的 systemd 服务“jira”,并且 systemctl 直接返回其状态。
问题:如何配置 corosync 以尊重失败的 systemd 服务?
声称crm status
资源是开始即使service jira status
看到它不活跃
我在日志中没有看到任何有用的内容。
[电子邮件保护]~# crm 状态 堆栈:corosync 当前 DC:vjira1-testing(版本 1.1.16-94ff4df)-具有仲裁的分区 最后更新时间:2017 年 12 月 5 日星期二 13:51:42 最后更改:2017 年 12 月 5 日星期二 12:21:17,由 hacluster 通过 vjira2-testing 上的 crmd 进行 配置了 2 个节点 配置了 5 个资源 在线:[ vjira1-测试 vjira2-测试 ] 完整资源列表: 资源组:group_jira fs_jira (ocf::heartbeat:Filesystem):已启动 vjira1-testing fs_attachments(ocf::heartbeat:Filesystem):已启动 vjira1-testing service_jira (systemd:jira): 已启动 vjira1-testing 主/从集:ms_drbd [drbd] 大师:[ vjira1-测试 ] 从属:[ vjira2-testing ] [电子邮件保护]~# 服务 jira 状态 ● jira.service - 集群控制的 jira 已加载:已加载(/etc/systemd/system/jira.service;静态) 插入:/run/systemd/system/jira.service.d └─50-起搏器.conf 活动:失败(结果:退出代码)自 2017-12-05 星期二 14:03:59 CET;1 秒前 进程:6340 ExecStop=/opt/atlassian/jira/bin/catalina.sh stop 40(代码=退出,状态=1/失败) 进程:6040 ExecStart=/opt/atlassian/jira/bin/catalina.sh 启动(代码=退出,状态=0/成功) 进程:5995 ExecStartPre=/opt/atlassian/jira/bin/catalina.sh configtest(代码=已退出,状态=0/成功) 主 PID:6070(代码=已杀死,信号=KILL) 12月05日 14:03:59 vjira1-testing catalina.sh[6340]: .8MMMMM: :NMMMMN. 12 月 05 日 14:03:59 vjira1-testing catalina.sh[6340]: .MMMMMM。 .MMMMM~。 12 月 05 日 14:03:59 vjira1-testing catalina.sh[6340]: .MMMMMN .MMMMM?. 12月05日 14:03:59 vjira1-testing catalina.sh[6340]: Atlassian JIRA 12月05日 14:03:59 vjira1-testing catalina.sh[6340]: 版本:7.2.1 12 月 05 日 14:03:59 vjira1-testing catalina.sh[6340]: 如果您在启动或...de 时遇到问题 12 月 05 日 14:03:59 vjira1-testing catalina.sh[6340]: 服务器启动日志位于 /...ut 12 月 05 日 14:03:59 vjira1-testing catalina.sh[6340]: 找到 PID 文件,但没有匹配的进程…… 12 月 05 日 14:03:59 vjira1-testing systemd[1]: jira.service: 控制进程已退出,代码=...=1 12 月 05 日 14:03:59 vjira1-testing systemd[1]: 单元 jira.service 进入失败状态。 提示:有些线条被省略了,使用 -l 可以完整显示。
谢谢。
答案1
由于错过了监视操作,起搏器资源无法获取服务的当前状态。
操作监控间隔=20
不幸的是,我没有找到关于它的有用文档,也没有找到 systemd 资源代理实现。如果有任何链接,我将不胜感激。
工作原语配置如下crm configure show
:
原始服务_jira systemd:jira \ 操作开始间隔=0 超时=60 \ 操作停止间隔=0 超时=90 \ 操作监控间隔=10 \ meta 目标角色=已开始
答案2
我有一个关联从那里您可以将op monitor interval
参数与如何使用它关联起来。
另外,还有一种方法可以获得如何使用它的简短说明,这里有一个例子。
[root@cp2 ~]# crm
crm(live)# ra meta systemd:postfix
systemd unit file for postfix (systemd:postfix)
Postfix Mail Transport Agent
Operations' defaults (advisory minimum):
start timeout=100
stop timeout=100
status timeout=100
monitor timeout=100 interval=60