我从来没能在网上找到任何好的用于监控 Citrix XenApp 客户端桌面的东西。
通常,只有当用户登录并尝试启动应用程序时,才会出现导致节目停止的问题。
监控 Windows 服务是否启动很少有帮助,有时甚至那些已锁定并显示为已启动但仍需要重新启动。
那么社区如何解决 Citrix XenApp 客户端桌面监控问题?如何确保最终用户可以登录并启动他们的应用程序?
我在 serverfault 上发现了一些有关 Citrix EdgeSight 的信息,只要它可以在用户会话开始失败时提醒我们,我就不会反对 Nagios 之外的解决方案。
答案1
根据我的经验,仅仅对服务器、服务等进行“活动”检查并没有多大好处。
性能不佳的 XenApp 服务器几乎与完全停止服务的服务器一样糟糕 - 无论哪种情况,用户都无法高效工作,并且您的帮助台会接到大量电话。
我在我的雇主那里使用 EdgeSight,它是为监控 XenApp 而定制的,但它已经显得老旧了,很久没有升级了,更不用说重大升级了(开发早已停止,EdgeSight 现已合并到 XenDesktop 中)。
以下是我想到的一些替代方案,我打算自己研究一下(顺便说一下,与这些替代方案都无关):
现在,至于使用 Nagios 进行监控,我假设它可以从 Windows 节点获取性能指标?我会特别关注这些性能指标(不是详尽的列表):
- CPU使用率(短峰值通常没问题,~95+% 时超过几秒钟,或 ~80+% 时超过 30 秒通常表示存在问题)
- CPU中断时间(驱动程序问题可能导致 CPU 能力被中断消耗,从而无法供应用程序使用)
- 上下文切换/秒(高水平的上下文切换表明逻辑 CPU 核心太少,无法处理工作负载)
- 可用 RAM(内存不足会导致过多的分页,进而损害用户性能)
- 磁盘繁忙时间百分比(磁盘持续繁忙表明存在磁盘瓶颈)
- 磁盘读/写延迟(高磁盘延迟会立即损害用户体验。磁盘/RAID 控制器/SAN 能否提供足够的 I/O?)
- 磁盘可用空间(没有磁盘空间,没有工作空间,没有生产力)
- 活动的 XenApp 会话(通常,您可以定义一个经验法则,即服务器上可以轻松容纳的最大会话数。考虑在负载评估器中包含“用户数”,因此接近此限制的服务器不太可能获得新的用户会话)
从您的实时环境中获取这些指标的一些性能历史记录,确定您的“红色/黄色/绿色”值,然后设置警报。
答案2
最明显的检查是 check_tcp 到端口 1494(标准 ica 端口),如果不起作用,用户将无法登录。
监视 Web 界面的端口 8080(ica xml)也很有用。
哦,还有一点:监控店面网页界面,如果出现故障,用户也将无法登录。
答案3
除了 Natxo 的良好建议之外,不要忘记监控 TCP 2598,它代替 1494 用于会话可靠性应用程序。
还要监控场内所有服务器的活动会话数。如果一台服务器停止接受新登录,您会看到其数量低于正常水平和/或其他服务器的当前数量。
我对 Nagios 不太熟悉;快速搜索没有显示实际执行登录的合成事务。但是,如果你能找到或编写一个,那将是金子——实际上登录应用程序是最正确的测试 XenApp 是否正常运行的方法。