使用正则表达式提取唯一多次出现的两个值（发送到宏变量）

Question

我认为最好先用分号分割参数，然后从每个项目中提取数据。

\documentclass{article}
\usepackage{xparse,l3regex}

\ExplSyntaxOn
\NewDocumentCommand{\hpsplit}{sm}
 {
  \IfBooleanTF{#1}
   { \hpcolos_hpsplit:V #2 }
   { \hpcolos_hpsplit:n { #2 } }
 }

\seq_new:N \l__hpcolos_hpsplit_seq
\seq_new:N \l__hpcolos_entry_seq

\cs_new_protected:Nn \hpcolos_hpsplit:n
 {
  \seq_set_split:Nnn \l__hpcolos_hpsplit_seq { ; } { #1 }
  \seq_map_function:NN \l__hpcolos_hpsplit_seq \hpcolos_hpentry:n
 }
\cs_generate_variant:Nn \hpcolos_hpsplit:n { V }

\cs_new_protected:Nn \hpcolos_hpentry:n
 {
  \regex_split:nnN { \s* ([0-9]+)[\:0-9-]* \Z } { #1 } \l__hpcolos_entry_seq
  \hpcolos_index_entry:
 }

\cs_new_protected:Nn \hpcolos_index_entry:
 {
  Book~is~``\seq_item:Nn \l__hpcolos_entry_seq { 1 }''
  ---
  Chapter~is~``\seq_item:Nn \l__hpcolos_entry_seq { 2 }''
  \par
 }
\cs_generate_variant:Nn \tl_trim_spaces:n { f }
\ExplSyntaxOff

\begin{document}

\hpsplit{1 Corintios 2:4-5; Mateo 15:1-10;Salmos 118:16}

\end{document}

我定义了最后一个函数\hpcolos_index_entry:来打印数据，请根据您的喜好进行定义。

诀窍是使用\regex_split:nnN根据正则表达式拆分给定的标记列表：捕获组中的匹配部分将被记住，其余部分将被丢弃。因此，第一种情况将设置序列以包含1 Corintios和2。和诗句编号之前的空格2将被删除，因为它们不在捕获组中。

如果您想将宏传递给命令，请使用\hpsplit*{\foo}，其中\foo扩展为如上所述的圣经参考列表。

Answer 1

我认为最好先用分号分割参数，然后从每个项目中提取数据。

\documentclass{article}
\usepackage{xparse,l3regex}

\ExplSyntaxOn
\NewDocumentCommand{\hpsplit}{sm}
 {
  \IfBooleanTF{#1}
   { \hpcolos_hpsplit:V #2 }
   { \hpcolos_hpsplit:n { #2 } }
 }

\seq_new:N \l__hpcolos_hpsplit_seq
\seq_new:N \l__hpcolos_entry_seq

\cs_new_protected:Nn \hpcolos_hpsplit:n
 {
  \seq_set_split:Nnn \l__hpcolos_hpsplit_seq { ; } { #1 }
  \seq_map_function:NN \l__hpcolos_hpsplit_seq \hpcolos_hpentry:n
 }
\cs_generate_variant:Nn \hpcolos_hpsplit:n { V }

\cs_new_protected:Nn \hpcolos_hpentry:n
 {
  \regex_split:nnN { \s* ([0-9]+)[\:0-9-]* \Z } { #1 } \l__hpcolos_entry_seq
  \hpcolos_index_entry:
 }

\cs_new_protected:Nn \hpcolos_index_entry:
 {
  Book~is~``\seq_item:Nn \l__hpcolos_entry_seq { 1 }''
  ---
  Chapter~is~``\seq_item:Nn \l__hpcolos_entry_seq { 2 }''
  \par
 }
\cs_generate_variant:Nn \tl_trim_spaces:n { f }
\ExplSyntaxOff

\begin{document}

\hpsplit{1 Corintios 2:4-5; Mateo 15:1-10;Salmos 118:16}

\end{document}

我定义了最后一个函数\hpcolos_index_entry:来打印数据，请根据您的喜好进行定义。

诀窍是使用\regex_split:nnN根据正则表达式拆分给定的标记列表：捕获组中的匹配部分将被记住，其余部分将被丢弃。因此，第一种情况将设置序列以包含1 Corintios和2。和诗句编号之前的空格2将被删除，因为它们不在捕获组中。

如果您想将宏传递给命令，请使用\hpsplit*{\foo}，其中\foo扩展为如上所述的圣经参考列表。

使用正则表达式提取唯一多次出现的两个值（发送到宏变量）

答案1

相关内容