我在 Proxmox 中运行的全新 18.04 LXC 容器上安装了 Landscape Server 19.10(快速启动)。安装过程中没有出现任何问题,Web GUI 运行正常,我能够将客户端计算机连接到服务器。
不幸的是,我在 Web GUI 的通知窗格中注意到该脚本更新安全数据库每次运行时都会反复失败(根据 /etc/cron.d/landscape-server,每小时都会失败一次)。
检查更新安全数据库.log手动运行脚本会出现以下错误:
Dec 19 16:40:36 update-security-db ERR Traceback (most recent call last):
Dec 19 16:40:36 update-security-db ERR File "./process-usns", line 7, in <module>
Dec 19 16:40:36 update-security-db ERR canonical.landscape.scripts.usn.run()
Dec 19 16:40:36 update-security-db ERR File "/opt/canonical/landscape/canonical/landscape/scripts/batch.py", line 77, in __call__
Dec 19 16:40:36 update-security-db ERR code = self.run()
Dec 19 16:40:36 update-security-db ERR File "/opt/canonical/landscape/canonical/landscape/scripts/usn.py", line 40, in run
Dec 19 16:40:36 update-security-db ERR changeset = update_from_usn_tool_db(db)
Dec 19 16:40:36 update-security-db ERR File "/opt/canonical/landscape/canonical/landscape/model/package/usn.py", line 237, in update_from_usn_tool_db
Dec 19 16:40:36 update-security-db ERR "WHERE id = %(temp)s.pkg_id" % {"temp": temp_table})
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/store.py", line 109, in execute
Dec 19 16:40:37 update-security-db ERR return self._connection.execute(statement, params, noresult)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/databases/postgres.py", line 306, in execute
Dec 19 16:40:37 update-security-db ERR return Connection.execute(self, statement, params, noresult)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/database.py", line 241, in execute
Dec 19 16:40:37 update-security-db ERR raw_cursor = self.raw_execute(statement, params)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/databases/postgres.py", line 316, in raw_execute
Dec 19 16:40:37 update-security-db ERR return Connection.raw_execute(self, statement, params)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/database.py", line 374, in raw_execute
Dec 19 16:40:37 update-security-db ERR self._run_execution(raw_cursor, args, params, statement)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/database.py", line 392, in _run_execution
Dec 19 16:40:37 update-security-db ERR statement, params or (), error)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/database.py", line 454, in _check_disconnect
Dec 19 16:40:37 update-security-db ERR return function(*args, **kwargs)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/tracer.py", line 248, in trace
Dec 19 16:40:37 update-security-db ERR attr(*args, **kwargs)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/databases/postgres.py", line 463, in connection_raw_execute_error
Dec 19 16:40:37 update-security-db ERR statement, params, "SQL server cancelled statement")
Dec 19 16:40:37 update-security-db ERR storm.exceptions.TimeoutError: 'SQL server cancelled statement', 'UPDATE package SET usn_id = new_package_usn_6KqW4Z.usn_id FROM new_package_usn_6KqW4Z WHERE id = new_package_usn_6KqW4Z.pkg_id', ()
每次都会发生此错误更新安全数据库运行。手动运行脚本时,我注意到它成功地从 Ubuntu 服务器获取了 USN 文件。然后它将文件传递给进程_usns脚本。脚本运行几分钟后退出并显示上面显示的 SQL 错误。
我基本上直接在新容器上安装了 Landscape-server-quickstart,然后在新容器上再次尝试该过程也遇到了同样的问题。奇怪的是,日志似乎暗示 SQL 服务器在处理新下载的 USN 文件时存在一些问题。脚本运行时 CPU 和内存利用率很好(我的容器有 4GB RAM 和 2vCPU)。这让我很担心,因为我设置 Landscape 的主要原因是执行多台计算机的补丁管理。
更新:今天,我在 Ubuntu Server 18.04 的新映像上启动了一个 KVM 虚拟机。出现了与以前完全相同的错误(很好奇这个问题是否仅在 LXC 中运行时才会发生)。
答案1
经过一些调试,我发现这个问题是由于 SQL 服务器超时导致的usn.py更新了数据库。这可能是因为我的 LXC 主机运行负载很高,并且其系统规格低于 Landscape 推荐的规格。当安全更新日志中触发错误时,PostgreSQL 日志也明确引用了此超时。
以下命令/opt/canonical/landscape/canonical/landscape/model/package/usn.py:235在我的计算机上花费的时间比平时更长,从而触发数据库超时。
store.execute(
"UPDATE package SET usn_id = %(temp)s.usn_id FROM %(temp)s "
"WHERE id = %(temp)s.pkg_id" % {"temp": temp_table})
我通过在该命令前添加以下内容来快速解决这个问题。
store.execute("SET LOCAL statement_timeout = 10000")
我对 SQL 不太熟悉,但这基本上应该会暂时将超时时间增加到 10000 毫秒,这足以处理数据库事务。设置为较低的值时也可以,但为了以防万一,我将其设置为较高的值。我无法找到 Landscape 最初设置的超时值。
补丁完成后,错误消失,USN 更新正常运行。这是一个肮脏的黑客行为,但据我所知,它是有效的。
答案2
如果其他人遇到此问题和上述问题,并且问题不是 SQL 命令运行时间过长,则可能是由于内存不足错误造成的。我使用的 VM 只有 2GB 内存。
默认情况下,快速启动不会设置交换文件,因此您可以通过执行以下操作来解决此问题:
- 创建交换文件
sudo fallocate -l 1G /swapfile
- 仅 root 可以访问
sudo chmod 600 /swapfile
- 标记为交换文件
sudo mkswap /swapfile
- 允许系统使用它
sudo swapon /swapfile
- 验证其是否正常工作
sudo swapon --show
然后您需要添加到 fstab 以使其永久生效。https://www.digitalocean.com/community/tutorials/how-to-add-swap-space-on-ubuntu-20-04