无法在 Ubuntu 下使用 Recoll 索引 .odt 文件

无法在 Ubuntu 下使用 Recoll 索引 .odt 文件

Recoll 无法索引打开文档文件。

当检查 Recoll 中的设置时,我得到了下一个缺失助手列表:

External applications/commands needed for your file types and not found, as stored by the last indexing pass in /home/pf/.recoll/missing:
  python:chm (application/x-chm)
  python:libxml2/python:libxslt1 (application/vnd.oasis.opendocument.text application/vnd.oasis.opendocument.text-flat-xml application/vnd.openxmlformats-officedocument.spreadsheetml.sheet application/vnd.openxmlformats-officedocument.wordprocessingml.document application/vnd.sun.xml.writer image/svg+xml)
  python:midi (audio/x-karaoke)

我不关心 midi 文件和 x-chm 之类的东西,但我真的希望打开文档文件被索引。

我安装了下一个软件包易于

libxml2-dev 
libxslt1-dev
python-lxml

我还安装了下一个包点子

lxml

我找不到其他方法来解决我的问题。任何帮助都将不胜感激。

答案1

对于 20.04 --

我发现lesbonscomptes.com/recoll/pages/features.html#doctypes 回忆版本 >= 1.26 不需要 Open Office 文件的帮助程序。这似乎是正确的。我安装recoll在测试 20.04 系统上,它只要求帮助程序antiword。我安装了它。从头开始索引后,它成功地在 .odt 文件中找到了单词

在此处输入图片描述

对于 18.04 --

recoll您安装的用于索引 OpenOffice 文件的软件包是

python-libxslt1

参考这里

我设法通过安装此依赖项修复了 debian 中 ods 文件未索引的问题:apt-get install python-libxslt1

我也总是安装

python-mutagen
python-chm
ibimage-exiftool-perl

答案2

感谢我收到的所有提示。

我尝试重建索引,但出现错误。我删除了$HOME/.recoll目录,从头开始重建索引,有关缺少某些帮助程序的消息消失了。

发生了什么事?我猜想 Recoll 的索引可能在从 Ubuntu 18.04 升级到 20.04 时变得混乱了。

最后,从头重建索引后问题似乎得到了解决。

顺便说一下,其他失踪的帮手已经出现了:

python3:mutagen (application/ogg audio/mpeg video/mp4)
python3:rarfile/python3:unrar (application/x-rar)
unrtf (text/rtf)
wpd2html (application/vnd.wordperfect)

但我希望利用 Organic Marble 提供的信息解决这个新问题https://lesbonscomptes.com/recoll/pages/features.html

相关内容