无论我给 catdvi 什么输入,它都会给出相同的错误:“不以此导言开始”。
为了简洁起见,我不会在这里发布我的整个项目,而只是粘贴一个示例:
\documentclass[a4paper,12pt]{article}
\begin{document}
This is the first paragraph of a typical document. It is
produced in a `12~point' size. A \emph{point} is a unit
of length used by printers. One point is approximately
$1/72$~inch. In a `12~point' font the height of the
parentheses is 12~points (i.e. about $1/6$~inch) and the
letter~`m' is about 12 points long.
This is the second paragraph of the document. There are
also `10 point' and `11 point' styles available in LaTeX.
The required size is specified in the `documentstyle'
command. If no such size is specified then the 10~point
size is assumed.
\end{document}
有人知道发生了什么事吗?
编辑:哦,很抱歉。我以为 catdvi 是 LaTeX 中的标准功能。我在以下 Wiki 页面上找到了它:https://en.m.wikibooks.org/wiki/LaTeX/Export_To_Other_Formats在“转换为纯文本”下。
答案1
catdvi
像大多数名称中带有 的命令行实用程序一样,它们dvi
对 DVI 文件而不是 TeX 文件进行操作。因此,如果您想使用catdvi
(或dvi2tty
)从 TeX 文件中提取文本,您首先必须使用latex
(不是 pdflatex
) 生成 DVI 文件。然后,您可以在生成的 DVI 文件上运行catdvi
(或) 以将其转换为纯文本。dvi2tty
还有其他实用程序,例如detex
从 TeX 文件中提取文本。但结果与catdvi
或不同dvi2tty
。
顺便说一句:还有一些程序可以将 PDF 转换为纯文本,例如pandoc
或pdftotext
。