

我对 LaTex 有很好的了解,但我花了一段时间挖掘有关 catcode 的信息,但由于它们不太为人所知,所以我还没有看到任何可以帮助解决我的问题的适用示例。


因此,如果我想在 LaTex 中输入数据,我必须重新格式化数据表,以在列之间添加“与”符号,并在行尾添加双反斜杠。有没有一种直接的方法来创建一个新环境,重新定义空格、制表符和双反斜杠,插入一个表格环境,然后撤消重新定义,这样它们就不会对其余代码产生任何影响,比如

% catcode 10 is spaces and tabs, catcode 4 is an ampersand 

\catcode{5}=\\ % catcode 5 is the return character
% I haven't a clue how to define it as a double-backslash   

% I have no idea how I would undo the definitions from above, because if I said   
% I'm not sure it would make any sense
% catcode 10 already points to catcode 4
% and I haven't seen anyone use an undo command for catcodes yet 

希望我清楚自己想要做什么,但实际上我只是想更好地理解重新定义 catcode,然后撤消重新定义。希望这个问题也能帮助其他 Tex 用户。谢谢你的帮助!

该解决方案不需要使用 catcode。就我而言,我需要能够在 overleaf.com(它只是一个在线 latex 编辑器和编译器)上实现该解决方案,但除此之外,我没有任何限制。


TeX 维护着猫码数组;在 8 位引擎和0x110000Unicode 引擎(XeTeX 和 LuaTeX)中,此数组的长度为 256(从 0 开始索引)。数组中的每个条目应为 4 位数字。


\catcode<number> = <4-bit number>

=和其周围的空格是可选的);第一个<number>必须在允许的范围内,即对于 8 位引擎(Knuth TeX,pdftex)为 0-255,对于 Unicode 引擎为 0-1114111。

如果在非赋值上下文中使用,则\catcode<number>返回数组中的相应条目。例如,\the\catcode`a返回 11(在标准设置下)。

数字可以采用标准 TeX 方式之一输入:十进制表示的整数、八进制数、十六进制数或字符代码:

\catcode 97 = 11
\catcode '141 = 11
\catcode "61 = 11
\catcode `a = 11
\catcode `\a = 11

都是等效的,并为字符分配acatcode 11;更严格地说,它们将数字 11 分配给猫码索引为 97 的数组。<number>也可以是返回上下文中的数字的任何内容(计数器的值、标记\chardef\mathchardef标记\numexpr、内部数组条目)。此外,赋值中的右侧可以以不同的格式表示。例如


将分配a与 相同的类别代码b(无论 的当前类别代码是什么)b。常见的习语是\catcode<number>=\active,其中\active\chardef值为 13 的标记。

因此,你的\catcode{10}=\catcode{4}语法是错误的。请注意,如果不循环遍历数组,就无法判断“将类别代码 10 的所有字符更改为类别代码 4”;在 8 位引擎中

  \ifnum\catcode\count255=10 \catcode\count255=4 \fi
  \advance\count255 by 1

会将类别代码 10 的字符更改为类别代码 4 的字符。

当 TeX 在标记化阶段,解释输入并从中形成标记,它将相应的类别代码附加到字符标记上。


 \maketabularfromfile{<table specs>}{<filename>}


a   b c
1   2 3
4   5 6


  % confine the changes
  \catcode`\ =4   % space is column separator
  \catcode`\^^I=4 % tab is column separator
  \catcode`\^^M=\active % end-of-line is active
  \begingroup\lccode`~=`\^^M \lowercase{\endgroup\def~}{\\}%
  \@@input #2 % use the primitive \input




我使用<TAB>s 作为第二列的分隔符,仅作为示例(网站很可能会将它们转换为空格)。





有许多软件包可以做到这一点。在下面的 MWE 中,你可以找到一些示例csvsimplepgfplotstable,但还有其他的:datatool功能更强大,即使可能不适合初学者。我建议您阅读他们的文档,然后把\catcodes 留给 egreg & Co。

我已经在 Overleaf 上创建了我的示例,使用了常用的 pdfLaTeX 编译器。


% you can set some option for all your table if you write this 
\pgfplotstableset{string type, 
    every head row/.style={before row=\toprule,after row=\midrule},
    every last row/.style={after row=\bottomrule}}

\usepackage{filecontents}% only needed to create the csv in this example
% the following filecontents* environments are needed only to create the text files, you don't need the if you already have yourfile....dat
Paulinho,van Duck,.56,M
Paulette,de la Quack,.52,F
Name Surname Length Gender
Paulinho {van Duck} .56 M
Paulette {de la Quack} .52 F

\verb|pgfplotstable| accepts space, tab, comma, semicolon, colon, braces, and ampersand as 

    col sep=space, 

With \verb|\pgfplotstabletypeset|, you don't even need a file, you can type your data directly.

    col sep=space, 
    Name Surname Length Gender
    Paulinho {van Duck} .56 M
    Paulette {de la Quack} .52 F

\verb|csvsimple| accepts comma (the default), semicolon, pipe, and tab as separators.

Here I also merged the two colums "Name" and "Surname", and inverted the two colums "Gender" and "Length":
    Ducks and drakes & Gender & {Length} \\
    & & {(\si{\metre})} \\
    \csvreader[head to column names,
        late after line=\\]{yourfilecommasep.dat}{}%
        {\Name\ \Surname & \Gender & \Length}




更改 catcode 总是有点棘手,尤其是在有空格的情况下,并且如果此处的输入可能也包含带空格的括号项目。

因此我只更改了行尾的 catcode。




\def\mytabular@parse#1 %
% some complications to insert toprule but then midrule only once
% after header line
       \mytabular@parse####1 #1%
}\zzzzzzzzzzzzzzzzzzzzz{ }%


    Name Surname Length Gender
    Paulinho {van Duck} .56 M
    Paulette {de la Quack} .52 F


