如何使用 Nagios 监控 Citrix XenApp?

如何使用 Nagios 监控 Citrix XenApp?

我从来没能在网上找到任何好的用于监控 Citrix XenApp 客户端桌面的东西。

通常,只有当用户登录并尝试启动应用程序时,才会出现导致节目停止的问题。

监控 Windows 服务是否启动很少有帮助,有时甚至那些已锁定并显示为已启动但仍需要重新启动。

那么社区如何解决 Citrix XenApp 客户端桌面监控问题?如何确保最终用户可以登录并启动他们的应用程序?

我在 serverfault 上发现了一些有关 Citrix EdgeSight 的信息,只要它可以在用户会话开始失败时提醒我们,我就不会反对 Nagios 之外的解决方案。

答案1

根据我的经验,仅仅对服务器、服务等进行“活动”检查并没有多大好处。

性能不佳的 XenApp 服务器几乎与完全停止服务的服务器一样糟糕 - 无论哪种情况,用户都无法高效工作,并且您的帮助台会接到大量电话。

我在我的雇主那里使用 EdgeSight,它是为监控 XenApp 而定制的,但它已经显得老旧了,很久没有升级了,更不用说重大升级了(开发早已停止,EdgeSight 现已合并到 XenDesktop 中)。

以下是我想到的一些替代方案,我打算自己研究一下(顺便说一下,与这些替代方案都无关):

现在,至于使用 Nagios 进行监控,我假设它可以从 Windows 节点获取性能指标?我会特别关注这些性能指标(不是详尽的列表):

  • CPU使用率(短峰值通常没问题,~95+% 时超过几秒钟,或 ~80+% 时超过 30 秒通常表示存在问题)
  • CPU中断时间(驱动程序问题可能导致 CPU 能力被中断消耗,从而无法供应用程序使用)
  • 上下文切换/秒(高水平的上下文切换表明逻辑 CPU 核心太少,无法处理工作负载)
  • 可用 RAM(内存不足会导致过多的分页,进而损害用户性能)
  • 磁盘繁忙时间百分比(磁盘持续繁忙表明存在磁盘瓶颈)
  • 磁盘读/写延迟(高磁盘延迟会立即损害用户体验。磁盘/RAID 控制器/SAN 能否提供足够的 I/O?)
  • 磁盘可用空间(没有磁盘空间,没有工作空间,没有生产力)
  • 活动的 XenApp 会话(通常,您可以定义一个经验法则,即服务器上可以轻松容纳的最大会话数。考虑在负载评估器中包含“用户数”,因此接近此限制的服务器不太可能获得新的用户会话)

从您的实时环境中获取这些指标的一些性能历史记录,确定您的“红色/黄色/绿色”值,然后设置警报。

答案2

最明显的检查是 check_tcp 到端口 1494(标准 ica 端口),如果不起作用,用户将无法登录。

监视 Web 界面的端口 8080(ica xml)也很有用。

哦,还有一点:监控店面网页界面,如果出现故障,用户也将无法登录。

答案3

除了 Natxo 的良好建议之外,不要忘记监控 TCP 2598,它代替 1494 用于会话可靠性应用程序。

还要监控场内所有服务器的活动会话数。如果一台服务器停止接受新登录,您会看到其数量低于正常水平和/或其他服务器的当前数量。

我对 Nagios 不太熟悉;快速搜索没有显示实际执行登录的合成事务。但是,如果你能找到或编写一个,那将是金子——实际上登录应用程序是最正确的测试 XenApp 是否正常运行的方法。

相关内容