如何计算每页的所有字符(不包括脚注)?

如何计算每页的所有字符(不包括脚注)?

我正在寻找一种计算方法每页所有字符。我希望页面正文中的所有字符都计算在内,包括空格和标点符号,但不包括脚注。

答案1

恐怕我没有解决这个问题的办法,但这里至少有一些想法和提示可能会有所帮助。

在一个较旧的问题中,列出了多种计算字符的选项: 如何计算包括空格在内的所有字符? 不幸的是,这些不是按页计算的,您必须检查它们计算空格和标点符号的能力。

我最好的猜测是将 PDF 转换为文本,然后计算文本中的字符数:即我上面链接的问题的批准答案。然后,您需要先以某种方式将 PDF 拆分为页面,然后按页进行处理。您可用的命令取决于您运行的操作系统类型:也许其他人可以提供帮助。

不幸的是,我不确定如何使用这种方法来排除脚注。您可以在不带脚注的情况下排版文档,例如重新定义脚注宏以将其从输出中排除,然后在此基础上进行计数。

更手动的方法可能是打开 PDF,然后将文本(不包括脚注)复制粘贴到文本编辑器中,然后在那里进行字符计数。如果文档很大,这种方法不太优雅,而且很繁琐,但应该不需要任何特殊工具。

直接操作 .tex 文件的工具,如特克斯考特,不运行实际的排版,因此不知道分页符在哪里,所以我猜你必须对 PDF 文件进行处理。但是,你仍然可以尝试对文档总数进行比较。默认情况下,TeXcount 将分别对标题、正文和脚注等进行计数。

请注意,TeXcount 在计算字符数(选项-char)时不包括空格,而要计算标点符号,则必须包含选项-all-nonspace-char。您仍然可以通过先计算字符数(单词中的字母)(包括标点符号)来获得粗略的估计,然后计算单词数,将它们加在一起以估计总字符数:单词数将给出空格数的合理估计。

答案2

不是一个答案,但很多年前我写了一个简短的lua程序,可以计算行数、单词数,并列出所有出现的字符(例如A的数量A's 等)。这在拖船可以在https://tug.org/TUGboat/tb31-1/tb97glister.pdf

您或其他人也许能够修改它以满足您的需要。

相关内容