如何删除从 PDF 复制的文本中的不可见字符

如何删除从 PDF 复制的文本中的不可见字符

如果我从 PDF 复制一些文本,文本看起来是正确的,但是文本编辑器将文本视为一个长序列。

该行在记事本中的显示方式:

记事本

我能够直观地看到文本存在问题的唯一方法是通过 Cmder 将文本复制到 vi 中:

六

文本在十六进制编辑器中显示如下:

氢键

我曾尝试使用 Puretext 去除粘贴时不可见的字符,但是没有效果:

纯文本

尝试将字符复制并粘贴到编辑器的替换对话框中并将其替换为空格,但没有任何结果。

我发现唯一有效的方法是手动删除每个“空格”并将其替换为实际空格。

推荐使用什么方法可以轻松删除粘贴时或使用搜索和替换时的这些不可见字符?

答案1

以下是简单的解决方案:

我使用的 PDF 查看器是 SumatraPDF。如果我使用 Chrome 作为 PDF 查看器,它不会引入不间断空格复制到复制的文本中。

Chrome PDF 查看器会在复制的文本中插入正确的空格。

通过更改用于这些特定 PDF 的 PDF 查看器,问题得到解决。

我已经使用各种 PDF 测试了这一点,问题仅出在这些特定的 PDF 上。

相关内容