xpdf

pdftotext 给出乱码输出
xpdf

pdftotext 给出乱码输出

如果有人能帮忙我会很感激 我尝试通过 pdftotext 从多个 pdf 文件中输出文本。不幸的是,我的输出结果总是像这样:“* * * $ * # 2 % 最初我以为问题在于字体是 Arial,所以我安装了 Arial 字体,但没有任何变化。使用不同的编码选项也没有带来任何更好的结果。在安装 Arial 字体之前,evince 无法在 pdf 文件中显示文本,但安装后 pdf 可以正常显示,所以我认为这是主要问题,但显然不是。 我正在使用 Centos 6.7 提前感谢您的任何反馈。 ...

Admin

PowerShell 意外令牌错误
xpdf

PowerShell 意外令牌错误

问题:我在 Windows 10 中通过 PowerShell ISE 运行以下脚本 cd C:\Users\xyz\Desktop\pdfs $FILES= ls *.pdf foreach ($f in $FILES) { "C:\Program Files\xpdf-tools-win-4.01.01\bin32\pdftotext.exe" -enc UTF-8 "$f" } 我收到以下错误 表达式或语句中出现意外标记“enc” 表达式或语句中出现意外标记“UTF-8” 我该如何纠正这些错误? 我怀疑,虽然我并不确定,错误是由于错...

Admin

如何在没有大纲窗格的情况下启动 xpdf(1)?
xpdf

如何在没有大纲窗格的情况下启动 xpdf(1)?

我正在尝试配置xpdf(1)因此它默认不显示大纲窗格。 我已设法设置一个键绑定,以~/.xpdfrc使用以下命令切换大纲窗格的可见性: bind t any toggleOutline 我无法弄清楚如何默认禁用大纲窗格。我发现Xpdf 工具配置文件手册但这没有帮助。 轮廓是左侧的窗格。(该图取自维基百科。) ...

Admin

xpdf 复制粘贴和 unicode
xpdf

xpdf 复制粘贴和 unicode

自从更新到 debian jessie 后,使用 xpdf 复制和粘贴 PDF 文件时出现了问题:只有 ASCII 中包含的字母/符号才能正确复制。所有其他符号/字母都有些乱码。 例如,我有一个包含德语单词“Würde”的 PDF 文件。从 xpdf 复制并粘贴后,我得到的结果为:“Würde”。其他 PDF 阅读器(例如 acroread、zathura)可以正常工作。所有包含非 ASCII 文本/符号的 PDF 文件都会出现此问题。 在 /etc/xpdf/xpdfrc 中我有: 文本编码 UTF-8 我用 Latin1 和 ASCII 进行了...

Admin

如何使用 for 循环并输出到不同的目录
xpdf

如何使用 for 循环并输出到不同的目录

usage: pdftotext [options] <PDF-file> [<text-file>] 我正在使用 pdftotext (xpft,用法同上) 将目录 (和子目录) 中的所有 pdf 转换为文本文件。结构是否保留并不重要,我只是想将文件写入不同的目录。 我已经将 cmd cd 指向目录(“C:\input”说)。 因此,如果给定输入文件的路径是 C:\input\filename.pdf 我想输出到 C:\output\filename.txt 我的命令: for /r %i in (*....

Admin

如何从嵌入子集字体的 PDF 中提取文本
xpdf

如何从嵌入子集字体的 PDF 中提取文本

閱讀文本的pdf对于普通的嵌入字体文件来说,它工作正常,但对于嵌入子集字体来说,它却失败了。有没有什么解决方法可以解决这个问题? ...

Admin

当文件存在时,显示“没有该文件或目录”
xpdf

当文件存在时,显示“没有该文件或目录”

我正在尝试在 Linux(可能是红帽)OVH 共享服务器上运行 XPDF。 我已设法获得 ftp ssh 访问权限并将 64 位二进制文​​件放入一个文件夹中。 问题是:即使文件具有正确的权限,如果我尝试运行它,我也会收到文件未找到的问题(我正在考虑缺少链接......) 长话短说 : myusername@ssh1:~/xpdf$ file pdftotext pdftotext: ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked (uses shared...

Admin

从 PDF 文件中提取背景图像?
xpdf

从 PDF 文件中提取背景图像?

我有一个 PDF 文件,其中包含我工作的建筑物的地图,如下所示: http://www.libsys.und.edu/dev/FloorPlans_All.pdf 原始源文件已丢失,我被要求提取地图图像,最好没有覆盖在它们上面的文本和图标。事实证明,这非常困难。 到目前为止,我已经尝试过以下 GUI 程序: Adobe Reader:允许我选择文本,但不允许选择背景图像 FoxIt PDF Viewer:允许我选择文本,但不能选择背景图像 Ubuntu 10.10 上的 XPDF:允许我选择文本,但不能选择背景图像 还有以下命令行程序: p...

Admin

来自 pdftotext 的文本和对齐
xpdf

来自 pdftotext 的文本和对齐

我在 Linux 上使用 texttopdf 从多页 pdf 中提取所有文本,一切都很好,除了每页的对齐方式不同,尽管在原始 pdf 中并非如此,但这里是前 3 页的示例: Instructor First Number Students Who Number Students Who Subject Course Section Instructor Last Name ...

Admin

如何在 Centos 5.5 上安装 Xpdf
xpdf

如何在 Centos 5.5 上安装 Xpdf

我想在 CentOS 5.5 服务器上安装 xPDF。没有 GUI,我只需要控制台应用程序。 有人能给我一份简单的指南吗? ...

Admin

pdftotext - 错误:ToUnicode CMap 中的 bfchar 块中的非法条目
xpdf

pdftotext - 错误:ToUnicode CMap 中的 bfchar 块中的非法条目

我正在一堆 pdf 上运行 pdftotext,其中一些抛出了这个错误: Error: Illegal entry in bfchar block in ToUnicode CMap 我查看了输出文件,它们看起来没什么问题,所以我不确定这是否是一个重大错误,但我很担心。有人知道这个错误是什么、是什么原因造成的以及会造成多大的损失吗? ...

Admin

如何在 Xpdf 中使用 h、j、k、l(类似 Vi)进行导航?
xpdf

如何在 Xpdf 中使用 h、j、k、l(类似 Vi)进行导航?

man xpdf内容如下: 以前版本的 xpdf 包含“viKeys”X 资源。它不再可用,但以下绑定是等效的: bind h any scrollLeft(16) bind l any scrollRight(16) bind k any scrollUp(16) bind j any scrollDown(16) 但我无法使用这些键进行导航。它们有用吗?我需要进行任何特殊配置吗? ...

Admin