重新格式化字符串并删除子字符串中的前导零

Question 1

\documentclass{article}

\def\foo#1{\xfoo#1\relax}
\def\xfoo#1--#2-#3\relax{#1, p.\ \number#2, fig.\ \number#3\relax}
\begin{document}

\foo{2011-10-29--2-03}

\end{document}

Answer

\documentclass{article}

\def\foo#1{\xfoo#1\relax}
\def\xfoo#1--#2-#3\relax{#1, p.\ \number#2, fig.\ \number#3\relax}
\begin{document}

\foo{2011-10-29--2-03}

\end{document}

Question 2

下面的代码类似于大卫的，但它并不假设页码或图号仅由数字组成。要使它起作用，我们需要删除前导零。

\documentclass{article}

\ExplSyntaxOn
\NewExpandableDocumentCommand{\ConvertID}{m}
 {
  \mflxvii_convert:n { #1 }
 }

\cs_new:Nn \mflxvii_convert:n
 {
  \__mflxvii_convert:w #1 \q_stop
 }

\cs_new:Npn \__mflxvii_convert:w #1--#2-#3 \q_stop
 {% #1 is a date in ISO format, #2 is a page number, #3 is a figure number
  #1,~
  p.\ \__mflxvii_convert_eat:N #2 \q_nil ,~
  f.\ \__mflxvii_convert_eat:N #3 \q_nil
 }

\cs_new:Nn \__mflxvii_convert_eat:N
 {
  \quark_if_nil:NF #1
   {
    \str_if_eq:nnTF { #1 } { 0 }
     {% a zero, restart
      \__mflxvii_convert_eat:N
     }
     {% not a zero, finish up
      #1 \__mflxvii_convert_deliver:w
     }
   }
 }

\cs_new:Npn \__mflxvii_convert_deliver:w #1 \q_nil { #1 }

\ExplSyntaxOff

\begin{document}

\ConvertID{2011-10-29--22-03}

\ConvertID{2011-10-29--022-3}

\ConvertID{2011-10-29--22-a2}

\edef\test{\ConvertID{2011-10-29--22-a2}}
\texttt{\meaning\test}

\end{document}

如果不考虑可扩展性，这里有一个变体matexmatics 的答案

\documentclass{article}

\ExplSyntaxOn
\NewDocumentCommand{\ConvertID}{m}
 {
  \mflxvii_convert:n { #1 }
 }

\seq_new:N \l__mflxvii_convert_seq
\tl_new:N \l__mflxvii_convert_tl

\cs_new_protected:Nn \mflxvii_convert:n
 {
  \seq_set_split:Nnn \l__mflxvii_convert_seq { - } { #1 }
  \seq_item:Nn \l__mflxvii_convert_seq { 1 } -
  \seq_item:Nn \l__mflxvii_convert_seq { 2 } -
  \seq_item:Nn \l__mflxvii_convert_seq { 3 } ,~
  p.\nobreakspace \__mflxvii_convert_eat:e { \seq_item:Nn \l__mflxvii_convert_seq { 5 } },~
  f.\nobreakspace \__mflxvii_convert_eat:e { \seq_item:Nn \l__mflxvii_convert_seq { 6 } }
 }

\cs_new_protected:Nn \__mflxvii_convert_eat:n
 {
  \tl_set:Nn \l__mflxvii_convert_tl { #1 }
  \regex_replace_once:nnN { \A 0* } { } \l__mflxvii_convert_tl
  \tl_use:N \l__mflxvii_convert_tl
 }
\cs_generate_variant:Nn \__mflxvii_convert_eat:n { e }

\ExplSyntaxOff

\begin{document}

\ConvertID{2011-10-29--22-03}

\ConvertID{2011-10-29--022-3}

\ConvertID{2011-10-29--22-a2}

\end{document}

Answer

下面的代码类似于大卫的，但它并不假设页码或图号仅由数字组成。要使它起作用，我们需要删除前导零。

\documentclass{article}

\ExplSyntaxOn
\NewExpandableDocumentCommand{\ConvertID}{m}
 {
  \mflxvii_convert:n { #1 }
 }

\cs_new:Nn \mflxvii_convert:n
 {
  \__mflxvii_convert:w #1 \q_stop
 }

\cs_new:Npn \__mflxvii_convert:w #1--#2-#3 \q_stop
 {% #1 is a date in ISO format, #2 is a page number, #3 is a figure number
  #1,~
  p.\ \__mflxvii_convert_eat:N #2 \q_nil ,~
  f.\ \__mflxvii_convert_eat:N #3 \q_nil
 }

\cs_new:Nn \__mflxvii_convert_eat:N
 {
  \quark_if_nil:NF #1
   {
    \str_if_eq:nnTF { #1 } { 0 }
     {% a zero, restart
      \__mflxvii_convert_eat:N
     }
     {% not a zero, finish up
      #1 \__mflxvii_convert_deliver:w
     }
   }
 }

\cs_new:Npn \__mflxvii_convert_deliver:w #1 \q_nil { #1 }

\ExplSyntaxOff

\begin{document}

\ConvertID{2011-10-29--22-03}

\ConvertID{2011-10-29--022-3}

\ConvertID{2011-10-29--22-a2}

\edef\test{\ConvertID{2011-10-29--22-a2}}
\texttt{\meaning\test}

\end{document}

如果不考虑可扩展性，这里有一个变体matexmatics 的答案

\documentclass{article}

\ExplSyntaxOn
\NewDocumentCommand{\ConvertID}{m}
 {
  \mflxvii_convert:n { #1 }
 }

\seq_new:N \l__mflxvii_convert_seq
\tl_new:N \l__mflxvii_convert_tl

\cs_new_protected:Nn \mflxvii_convert:n
 {
  \seq_set_split:Nnn \l__mflxvii_convert_seq { - } { #1 }
  \seq_item:Nn \l__mflxvii_convert_seq { 1 } -
  \seq_item:Nn \l__mflxvii_convert_seq { 2 } -
  \seq_item:Nn \l__mflxvii_convert_seq { 3 } ,~
  p.\nobreakspace \__mflxvii_convert_eat:e { \seq_item:Nn \l__mflxvii_convert_seq { 5 } },~
  f.\nobreakspace \__mflxvii_convert_eat:e { \seq_item:Nn \l__mflxvii_convert_seq { 6 } }
 }

\cs_new_protected:Nn \__mflxvii_convert_eat:n
 {
  \tl_set:Nn \l__mflxvii_convert_tl { #1 }
  \regex_replace_once:nnN { \A 0* } { } \l__mflxvii_convert_tl
  \tl_use:N \l__mflxvii_convert_tl
 }
\cs_generate_variant:Nn \__mflxvii_convert_eat:n { e }

\ExplSyntaxOff

\begin{document}

\ConvertID{2011-10-29--22-03}

\ConvertID{2011-10-29--022-3}

\ConvertID{2011-10-29--22-a2}

\end{document}

Question 3

下面的答案使用\seq_set_split:Nnn来拆分的参数\FormatDatePageFig。它适用\int_to_arabic:n于此序列的最后一项。

\documentclass[border=6pt]{standalone}
\ExplSyntaxOn
\seq_new:N \l__mf_format_seq
\NewDocumentCommand { \FormatDatePageFig } { m }
  {
    \seq_set_split:Nnn \l__mf_format_seq { - } {#1}
    \seq_item:Nn \l__mf_format_seq { 1 } -
    \seq_item:Nn \l__mf_format_seq { 2 } -
    \seq_item:Nn \l__mf_format_seq { 3 } , ~ p. ~
    \seq_item:Nn \l__mf_format_seq { 5 } , ~ fig. ~
    \int_to_arabic:n { \seq_item:Nn \l__mf_format_seq { 6 } }
  }
\ExplSyntaxOff
\begin{document}
\FormatDatePageFig{2011-10-29--2-03}
\end{document}

Answer

下面的答案使用\seq_set_split:Nnn来拆分的参数\FormatDatePageFig。它适用\int_to_arabic:n于此序列的最后一项。

\documentclass[border=6pt]{standalone}
\ExplSyntaxOn
\seq_new:N \l__mf_format_seq
\NewDocumentCommand { \FormatDatePageFig } { m }
  {
    \seq_set_split:Nnn \l__mf_format_seq { - } {#1}
    \seq_item:Nn \l__mf_format_seq { 1 } -
    \seq_item:Nn \l__mf_format_seq { 2 } -
    \seq_item:Nn \l__mf_format_seq { 3 } , ~ p. ~
    \seq_item:Nn \l__mf_format_seq { 5 } , ~ fig. ~
    \int_to_arabic:n { \seq_item:Nn \l__mf_format_seq { 6 } }
  }
\ExplSyntaxOff
\begin{document}
\FormatDatePageFig{2011-10-29--2-03}
\end{document}

Question 4

以下解决方案使用 LuaLaTeX，适用于任何 utf8 编码的字符串，而不仅仅是 ASCII 编码的字符串。它不假设页码或图号分别恰好由 1 或 2 位数字组成。

\documentclass{article}
\usepackage{luacode} % for 'luacode' environment
\begin{luacode}

  function Convert ( s )
    s1=unicode.utf8.sub( s , 1 , 10 )
    
    s2=unicode.utf8.match ( unicode.utf8.sub(s,13) , "^.-%-" )
    s2=tonumber(unicode.utf8.sub(s2,1,-2))
    
    s3=unicode.utf8.match( s , "-%d*$" )
    s3=tonumber(unicode.utf8.sub ( s3, 2 ))
    
    return ( s1 .. ", p.\\ " .. s2 .. ", fig.\\ " .. s3)
  end

\end{luacode}
\newcommand\Convert[1]{\directlua{tex.sprint(Convert("#1"))}}

\begin{document}
\Convert{2011-10-29--2-03}

\Convert{2023-12-30--0123-01234}
\end{document}

Answer

以下解决方案使用 LuaLaTeX，适用于任何 utf8 编码的字符串，而不仅仅是 ASCII 编码的字符串。它不假设页码或图号分别恰好由 1 或 2 位数字组成。

\documentclass{article}
\usepackage{luacode} % for 'luacode' environment
\begin{luacode}

  function Convert ( s )
    s1=unicode.utf8.sub( s , 1 , 10 )
    
    s2=unicode.utf8.match ( unicode.utf8.sub(s,13) , "^.-%-" )
    s2=tonumber(unicode.utf8.sub(s2,1,-2))
    
    s3=unicode.utf8.match( s , "-%d*$" )
    s3=tonumber(unicode.utf8.sub ( s3, 2 ))
    
    return ( s1 .. ", p.\\ " .. s2 .. ", fig.\\ " .. s3)
  end

\end{luacode}
\newcommand\Convert[1]{\directlua{tex.sprint(Convert("#1"))}}

\begin{document}
\Convert{2011-10-29--2-03}

\Convert{2023-12-30--0123-01234}
\end{document}

重新格式化字符串并删除子字符串中的前导零

答案1

答案2

答案3

答案4

相关内容