如何从命令行翻译大型 PDF?

如何从命令行翻译大型 PDF?

我有一个很大的 pdf 文件 (83 MB),我想翻译它。我尝试使用 拆分文件,pdftk然后使用 翻译每个部分https://www.onlinedoctranslator.com/en/(文件不能大于 10 MB)但这非常耗费人力。首选的翻译器是 Google 引擎。如果没有简单的方法可以自动完成此任务,如果您能给我一些提示,告诉我如何将 pdf 拆分为大小相等的部分(以 MB 为单位),那将会很有帮助。

答案1

看看translate-shell

这将安装一个名为的命令trans,您可以告诉它进行翻译。示例来自项目页面。

Translate Shell(以前称为 Google Translate CLI)是一款命令行翻译器,由 Google Translate(默认)、Bing Translator、Yandex.Translate 和 Apertium 提供支持。它可让您在终端中轻松访问以下翻译引擎之一:

$ trans 'Saluton, Mondo!'
Saluton, Mondo!

Hello, World!

Translations of Saluton, Mondo!
[ Esperanto -> English ]
Saluton ,
    Hello,
Mondo !
    World!

默认情况下,会显示带有详细说明的翻译。您也可以简要翻译文本:(仅显示最相关的翻译)

$ trans -brief 'Saluton, Mondo!'
Hello, World!

您还可以告诉它使用一种语言:

trans :fr word

还有更多:

trans -browser firefox :fr http://www.w3.org/

将打开带有法语翻译 www.w3.org 的 Firefox。

没有直接翻译 PDF 的方法。文件的方法:

trans :fr file://input.txt

现在关于 PDF:

sudo apt install poppler-utils

使用该工具,您可以从 pdf 创建文本文件。

pdftotext your.pdf your.txt
  • 添加-layout以保留布局
  • -opw {password}如果有密码则添加

你可以输入文件

trans file://your.txt

下一步:返回 PDF

sudo apt-get install enscript ghostscript

并转换为 postscript,然后转换为 pdf:

enscript -p output.ps your.txt
ps2pdf output.ps your2.pdf

我在一个包含一些单词的 PDF 上使用了此功能。不保证它可以在大型文件上工作,因此如果此方法有效,请在下面评论。

相关内容