最近我的服务器出现了问题,我的 nagios 无法 ping 它并失去了与 NRPE 守护进程的连接,在我的主机提供商界面中我可以看到服务器处于活动状态,但我无法从我的网络 ping 它,所以我有直接从界面重新启动它。
我意识到这可能是网卡问题。有什么建议吗?
答案1
如果您无法 ping 通,那么在重新启动界面之前您可以检查几项内容:
解析配置文件:确保您正在 ping 到 IP 和主机名。 ping 网关或同一子网内的任何主机,以确保那里没有问题。请注意,有时网关 ping 会被阻止,因此 ping 到您确定没有被阻止的地址。
#ping mit.edu
#ping 8.8.8.8
如果您可以通过 IP 地址执行 ping 操作,但不能通过主机名执行 ping 操作,请确保您在 /etc/resolv.conf 文件中设置了正确的 DNS 名称服务器
#less /etc/resolv.conf
跟踪路由:如果根本无法 ping 通服务器,请使用 Traceroute 来跟踪网络问题。 Traceroute 提供有关网络服务器路径的详细信息。您始终可以从您自己的工作站或网关路由器查明服务器是否已关闭
#traceroute mit.edu
路线:如果跟踪路由指出您无法到达自己的网关,则检查路由设置:
#route
如果配置 :您可以检查 RX 或 TX 是否有错误计数报告。如果您发现任何错误计数,您可能需要检查交换机或与您的网络管理员联系,以澄清他们方面是否存在任何问题
# ifconfig -a
eth0 Link encap:Ethernet HWaddr 00:50:XX:XXX:XX:XX
inet addr:172.16.33.74 Bcast:172.16.33.79 Mask:255.255.255.240
inet6 addr:XXXXXXXXXXXXX/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:831836 errors:0 dropped:0 overruns:0 frame:0
TX packets:400887 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:646034732 (616.1 MiB) TX bytes:337464272 (321.8 MiB)
错误报告: 检查 /var/log 或 dmesg 是否有错误报告
# dmesg | less
# tail -f /var/log/messages