适合初学者的 LaTeX 字数统计！

Question 1

我不相信任何软件工具可以做到这一点。典型的、传统的手工方法是打印文档，计算典型页面上的字数，然后乘以感兴趣的页数（适当考虑任何插图或表格）。据我所知，除了强迫症患者外，没有人真正计算过任何长度的文档中的每个字。

Answer

我不相信任何软件工具可以做到这一点。典型的、传统的手工方法是打印文档，计算典型页面上的字数，然后乘以感兴趣的页数（适当考虑任何插图或表格）。据我所知，除了强迫症患者外，没有人真正计算过任何长度的文档中的每个字。

Question 2

对于 Linux：

将 pdf 文档转换为文本文件pdftotext -nopgbrk <file>.pdf，然后运行wc -w <file>.txt，输出字数。还有一些选项可以pdftotext裁剪 pdf 文件，例如无页眉或页脚。

Answer

对于 Linux：

将 pdf 文档转换为文本文件pdftotext -nopgbrk <file>.pdf，然后运行wc -w <file>.txt，输出字数。还有一些选项可以pdftotext裁剪 pdf 文件，例如无页眉或页脚。

Question 3

暗示回复：显然最好的解决方案就是我的解决方案。:D

不，说真的，这不可能……“最佳解决方案”是任何你能够轻松理解使用并能获得大部分所需内容的方法。例如，Herbert 的pdftotextplus解决方案wc对于 Linux 用户来说就是小菜一碟，因为这些工具是任何 Linux 发行版的标准配置，但 Windows 用户必须开始在 Google 中搜索程序。一个用户不关心图注中的字数，另一个用户只需要计算正文中的字数……没有通用的解决方案。

话虽如此，TeXcount（texcount在命令行中）是一个非常好的选择。它是一个 Perl 脚本，用于计算 LaTeX 文件文本中的单词数。您的计算机中可能已有此脚本，因为它可用作 TeX Live 和 MikTeX 包，因此您可以从命令行独立调用此脚本作为 LaTeX 的外部工具，也可以在 LaTeX 文件内部调用，如我的链接答案所示，甚至可以用作在线工具（可通过其主页作为 Web 服务使用）。

无论如何，相对于texcount许多其他解决方案，其主要优势在于它是专门针对 LaTeX 的。该脚本具有处理大多数常见宏的规则，因此它可以计算文本、标题、标题、图形或公式中的单词数，显然不包括 LaTeX 命令（纯粹主义者的控制序列）和注释。甚至可以提供颜色编码的输出，显示已计算文本的哪些部分。

运行后texdoc texcount您可以查看手册并了解有关这些选项的更多信息。

Answer