recoll 可执行文件占用 CPU 数天,索引目录占 18GB,我应该将 v1.17 升级到 1.20 吗?

recoll 可执行文件占用 CPU 数天,索引目录占 18GB,我应该将 v1.17 升级到 1.20 吗?

我对 ubuntu 自带的桌面搜索工具“recoll”有些问题。(我的系统是 15.04)

实际上,有几个子问题,但也许它们都是相关的。我怀疑所有问题都可以通过升级软件和重建文档索引来解决。

我有一个 recoll 索引,它已经增长到 18 GB 的文件

du -sh  ~/.recoll/xapiandb
18G     /home/knb/.recoll/xapiandb

该目录包含几个子目录和文件。

recollindex进程运行时,它会以 100% 的 CPU 运行数天,直到我用 终止它才会停止kill -9 PID。为什么会这样?如何诊断它正在处理哪些文件/目录,或者正在处理哪些文件/目录?互联网上的研究给出了不确定的答案。重建索引能解决 100%CPU 问题吗?

将此目录从我的企业备份软件(我对其没有太多控制权)中排除是一种好的做法吗?

我是否应该时不时地删除索引以使其更有效?或者,删除后,它是否会简单地构建相同的 18 GB 索引,或者更糟的是,构建一个不完整的索引?

我应该将 recoll 升级到最新版本吗?

Recoll 版本:Recoll 1.17.3 + Xapian 1.2.19 - 默认为 15.04。

Wily werewolf,无论如何,15.10 都会包含 Recoll 1.20。

(根据https://launchpad.net/ubuntu/+source/recoll

答案1

即使索引量很大,recoll 几天内都会占用 CPU,这完全不正常。您可以通过激活日志文件来检查它正在做什么,但我认为您应该先更新版本,因为 1.17 太旧了。

recoll backports PPA 上有最新的 recoll 软件包: https://launchpad.net/~recoll-backports/+archive/ubuntu/recoll-1.15-on

升级后,您应该停止旧索引器,删除索引:rm -rf ~/.recoll/xapiandb并使用新版本重建它。

如果此时问题仍然存在,请使用 recoll 常规支持渠道之一,例如在 bitbucket 上打开一个问题: https://bitbucket.org/medoc/recoll/issues?status=new&status=open

答案2

我正在使用 recoll Recoll 1.24.3 + Xapian 1.4.12,我有 32GB 的 RAM,一个 x360 AMD 5200U GPU 和 8 个处理器,它确实占用了我的系统。我的解决方案是使用 nice 来运行它

sudo apt 安装很好

然后启动 recoll(我使用 gui,然后从菜单中启动更新索引)

很好-n-10回忆

这样 CPU 占用率就从 100% 降到了 12%。有关 nice 的更多信息,请点击此处 https://www.geeksforgeeks.org/priority-of-process-in-linux-nice-value/

-n 值

-20 个最优先的进程

20 个最低优先级进程

你可以使用以下命令更改正在运行的进程的 nice 值

雷尼斯-15

其中 pid 是进程 ID。

另一种方法是从名称中获取 pid

renice -15 $(pidof recoll)

不过 renice 需要 sudo 权限

相关内容