问题: 我的 EC2 实例(用于托管基于 tomcat 的 Web 应用程序)无响应。它停止提供网页,并且不允许我通过 SSH 登录。如果我从 AWS 控制台重新启动它,它就会恢复工作。
版本:Ubuntu 18.04.1 LTS
日志分析:
我在系统日志中发现以下内容:
systemd-networkd[621]: Failed to save lease data /run/systemd/netif/leases/2: No space left on device
systemd-networkd[621]: eth0: Failed to save link data to /run/systemd/netif/links/2: No space left on device
systemd-timesyncd[519]: Network configuration changed, trying to establish connection.
systemd-timesyncd[519]: Synchronized to time server 91.189.94.4:123 (ntp.ubuntu.com).
systemd-resolved[651]: Failed to write private resolv.conf contents: No space left on device
systemd-networkd[621]: Failed to save lease data /run/systemd/netif/leases/2: No space left on device
systemd-networkd[621]: eth0: Failed to save link data to /run/systemd/netif/links/2: No space left on device
systemd-networkd[621]: eth0: Could not set DHCPv4 address: Connection timed out
systemd-timesyncd[519]: Network configuration changed, trying to establish connection.
systemd-networkd[621]: eth0: Failed
systemd-timesyncd[519]: Synchronized to time server 91.189.94.4:123 (ntp.ubuntu.com).
systemd-resolved[651]: Failed to write private resolv.conf contents: No space left on device
systemd-networkd[621]: Failed to save network state to /run/systemd/netif/state: No space left on device
原因:
以上日志表明/run
空间不足,并且 systemd-networkd 无法执行写入操作。
这是有关 的挂载信息/run
。目前它只使用了 1%,因为我是在实例重新启动并再次开始工作后记录的。
Filesystem Size Used Avail Use% Mounted on
udev 3.9G 0 3.9G 0% /dev
tmpfs 798M 760K 797M 1% /run
tmpfs 5.0M 0 5.0M 0% /run/lock
tmpfs 798M 0 798M 0% /run/user/1000
研究:
我浏览了网络并发现了以下相关问题,但无法得到具体的解决方案:
查询:
- 空间不足的原因是什么?系统是否生成了从未清理过的临时文件?
- 目前已为 分配了 798M 的空间
/run
。分配更多空间是解决方案吗?如果是,那么我应该为其分配多少空间?