我想打印文档中某个部分的字数统计。但是 section 并不意味着 \section{...}。它只是表示任意的段落集合。字数统计应排除标题和脚注。
\begin{document}
stuff
% start word count
paragraph #1 \footnotes{...}
\begin{figures}...\end{figures}
paragraph #2
% end word count
\wordcount
% or some other command that prints the word count
other stuff
\end{document}
我是否要使用某种容器?LaTeX 等同于 div 标签?或者我是否仍使用 \section{...} 但隐藏部分标题?
如果能得到解决方案我们将非常感激!
答案1
这可以使用特克斯考特,这是一个 Perl 脚本。您可能已在 TeX 安装中安装了该脚本,或者可以在 Web 大小上找到该脚本以及您可以试用的在线 Web 应用程序。
TeXcount 设置生成子计数的断点。
默认情况下,所有章节/节标题都设置了断点,您必须关闭它:使用-sub=none
脚本的命令行选项或选择子计数:无在网络界面中。
可以使用表单上的 TeX 注释行在文档中插入断点
%TC:break breakpoint-title
在这里输入您自己的断点标题(允许空格),然后它将启动一个新的子计数。
另一种方法是定义一个宏,例如\CountSection
,它接受一个参数(即断点标题),并指定 TeXcount 应该在那里插入一个断点:
%TC:breakmacro \CountSection countsection
其中countsection
是任何非空字符串(无空格),它将只作为标题的前缀来指示其计数类型。这仍然需要选项-sub=none
。
您可以在Web应用程序首先。您不必输入完整的文档,只需输入一段代码即可。
让我详细说明并回答评论中的问题:首先,一个关于如何获取与输出到控制台一起工作的子计数的示例;其次,如何获取文档中包含的计数。
TeXcount 使用断点将计数拆分为子计数。没有“结束断点”:子计数会一直持续到下一个断点。
另一方面,如果你真正需要的是忽略文档中的某些部分,而不是将其分成多个段,那么可以使用以下方法标记要忽略的段:
%TC:ignore
...
%TC:endignore
有两种方法可以插入断点以将文档拆分为子计数区域:要么使用指令在文档中明确设置断点%TC:breakpoint
,要么指定自动设置断点的宏。默认情况下 ( -sub=section
),TeXcount 会在\chapter
、\section
等处添加断点;使用选项-sub=none
可以避免这种情况。然后,您可以使用%TC:breakmacro
指令指定应设置断点的其他宏。
这是一个简短的示例,它不是完整的文档,只是一段代码:
%% Use \CountSection to set subcount breakpoints
\newcommand\CountSection[1]{} % No output in document
% Set macro handling rule: ignore text in argument
%TC:macro \CountSection [ignore]
% Specify that \CountSection sets a new breakpoint
%TC:breakmacro \CountSection Subcount
Any text occurring before a breakpoint will be part of the initial subcount
named \textit{top}.
\CountSection{First count section}
This text will be counted as part of the subcount labeled \textit{First count
section}, which will continue until the next breakpoint.
\CountSection{Second count section}
This will be counted as another subcount.
%TC:break Subcount text at the end
This will be the final subcount induced by an explicit breakpoint.
您可以尝试在自己的计算机上或在线 Web 应用程序中通过 TeXcount 运行它,然后尝试看看它是如何工作的。如果您\section
向代码中添加宏,除非您指定,否则这些宏将添加额外的断点-sub=none
。顺便说一句,-sub
只是的缩写-subcount
,仅用于在几个初始断点宏的替代方案之间进行选择,而不是指定您自己的。
TeXcount 默认将计数(和其他输出)输出到控制台。您也可以将输出写入文件,这通常对于将输出导入文档或将输出写入 HTML 很有用。
将计数导入文档有几个技巧,所有这些技巧都要求 TeXcount 将输出写入文件,然后将该文件导入文档。有一些TeXcount FAQ 中提供了相关信息, 和StackExchange 上的示例. 可以使用模板自定义输出格式 (StackExchange 示例),但这个有点高级,在开始之前你应该让计数工作正常进行。