

无论我给 catdvi 什么输入,它都会给出相同的错误:“不以此导言开始”。



This is the first paragraph of a typical document. It is
produced in a `12~point' size. A \emph{point} is a unit
of length used by printers. One point is approximately
$1/72$~inch. In a `12~point' font the height of the
parentheses is 12~points (i.e. about $1/6$~inch) and the
letter~`m' is about 12 points long. 

This is the second paragraph of the document. There are
also `10 point' and `11 point' styles available in LaTeX.
The required size is specified in the `documentstyle'
command. If no such size is specified then the 10~point
size is assumed.



编辑:哦,很抱歉。我以为 catdvi 是 LaTeX 中的标准功能。我在以下 Wiki 页面上找到了它:在“转换为纯文本”下。


catdvi像大多数名称中带有 的命令行实用程序一样,它们dvi对 DVI 文件而不是 TeX 文件进行操作。因此,如果您想使用catdvi(或dvi2tty)从 TeX 文件中提取文本,您首先必须使用latex不是 pdflatex) 生成 DVI 文件。然后,您可以在生成的 DVI 文件上运行catdvi(或) 以将其转换为纯文本。dvi2tty

还有其他实用程序,例如detex从 TeX 文件中提取文本。但结果与catdvi或不同dvi2tty

顺便说一句:还有一些程序可以将 PDF 转换为纯文本,例如pandocpdftotext
