从 pdf 文件复制法语文本

从 pdf 文件复制法语文本

我有一篇法语论文,正在阅读中,为了更好地理解其中的部分内容,我尝试复制一些文本并将其用于谷歌翻译,但是如果我复制文本,我得到的只是垃圾,就像粘贴的文本一样。很可能是编码有问题。更奇怪的是,我可以正确地从文档的第一封面页复制文本,这些文本也是法语的,但从其余部分,我从剪贴板粘贴的文本中得到的只是一堆垃圾字符。关于如何阅读这篇论文的部分内容,有什么想法吗?

答案1

涉及的pdf?

我尝试了一些方法,比如改变编码、转换和重新编码,但我认为你处于所描述的情况这里

最好的办法是将 PDF 保存为图像(TIFF 或 PNG),然后将它们重新组合在一起并进行 OCR。

相关内容