正则表达式捕获问题

Question 1

我觉得你的任务最好使用语法来完成。不幸的是，目前还没有这样的包（预计明年某个时候会有一个），所以我们只能使用正则表达式。如果你使用 LuaTeX，使用 LPeg 可能会有希望，但我对这些发展一无所知。

首先，为什么会有这种行为：我只是遵循了 Perl。这些函数的主要任务extract是提取它们匹配的内容，在你的情况下是整个字符串，而次要的效果是捕获组也被捕获了。但据我所知，Perl 不提供不捕获整个匹配的方法，只能避免捕获单个组。如果我错了，并且该任务有可接受的语法，我肯定会考虑将其添加到l3regex。

在您的情况中（事实上，在大多数情况下），您捕获的各个组具有不同的状态 [嗯... 这让我觉得返回一个序列序列可能更有意义]。因此，当循环遍历序列时，您无论如何都必须跟踪索引，检查其模数值4（或其他值）是什么，或者逐个从序列开头删除项目。捕获整个匹配项这一事实仅意味着用替换4，5或从序列中丢弃另一个项目。

您可能对进行替换而不是提取感兴趣，有关此处适用的示例，请参阅我的另一个答案中的代码。

Answer

我觉得你的任务最好使用语法来完成。不幸的是，目前还没有这样的包（预计明年某个时候会有一个），所以我们只能使用正则表达式。如果你使用 LuaTeX，使用 LPeg 可能会有希望，但我对这些发展一无所知。

首先，为什么会有这种行为：我只是遵循了 Perl。这些函数的主要任务extract是提取它们匹配的内容，在你的情况下是整个字符串，而次要的效果是捕获组也被捕获了。但据我所知，Perl 不提供不捕获整个匹配的方法，只能避免捕获单个组。如果我错了，并且该任务有可接受的语法，我肯定会考虑将其添加到l3regex。

在您的情况中（事实上，在大多数情况下），您捕获的各个组具有不同的状态 [嗯... 这让我觉得返回一个序列序列可能更有意义]。因此，当循环遍历序列时，您无论如何都必须跟踪索引，检查其模数值4（或其他值）是什么，或者逐个从序列开头删除项目。捕获整个匹配项这一事实仅意味着用替换4，5或从序列中丢弃另一个项目。

您可能对进行替换而不是提取感兴趣，有关此处适用的示例，请参阅我的另一个答案中的代码。

Question 2

正则表达式将结果映射到一个序列中。

  \seq_map_inline:Nn \l_uiy_result_seq { item:~##1\par }

您可以通过参考序列的 LaTeX3 手册从序列中提取感兴趣的值。

Answer

正则表达式将结果映射到一个序列中。

  \seq_map_inline:Nn \l_uiy_result_seq { item:~##1\par }

您可以通过参考序列的 LaTeX3 手册从序列中提取感兴趣的值。

正则表达式捕获问题

答案1

答案2

相关内容