第一种方法

第一种方法

后续行动这个答案,我怎样才能让命令有一个可选参数来\getValue指定我查找单元格值的列,以便它具有以下语法?

\getValue\<macro name>%
[<optional column number with default of 2, and the counting starts with 1 at the very first column>]%
{<search phrase>}%
{<data of the csv file>}

例如,\getValue\SndParThrd[4]{Second Parameter}{mydata}(调整以下代码后)应该存储44\SndParThrd

此外,\getValue\SndParFrst{Second Parameter}{mydata}应存储3\SndParFrst

\begin{filecontents*}{test.csv}
Third Parameter  , 7 , 9  , 
First Parameter  , 5 , 10 ,
Second Parameter , 3 , 6  , 44
\end{filecontents*}

\documentclass{article}
\usepackage{xparse}

\ExplSyntaxOn
% Step 1: reading the file
\ior_new:N \l__diaa_csv_ior
\ior_new:N \l__diaa_csv_str_bool
\NewDocumentCommand \ReadCSV { s m >{ \SplitArgument {1} {,} }O{ 1,2 } m }
  {
    \IfBooleanTF {#1}
      { \bool_set_true:N \l__diaa_csv_str_bool }
      { \bool_set_false:N \l__diaa_csv_str_bool }
    \diaa_csv_read:nnnn {#2} #3 {#4}
  }
\cs_new_protected:Npn \diaa_csv_read:nnnn #1 #2 #3 #4
  {
    \prop_new:c { g__diaa_csv_#1_prop }
    \ior_open:NnTF \l__diaa_csv_ior {#4}
      { \__diaa_csv_read:cnn { g__diaa_csv_#1_prop } {#2} {#3} }
      { \msg_error:nnn { diaa } { file-not-found } {#4} }
  }
\msg_new:nnn { diaa } { file-not-found }
  { File~`#1'~not~found. }
\cs_new_protected:Npn \__diaa_csv_read:Nnn #1 #2 #3
  {
    \bool_if:NTF \l__diaa_csv_str_bool
      { \ior_str_map_inline:Nn }
      { \ior_map_inline:Nn }
        \l__diaa_csv_ior
        {
          \prop_put:Nxx #1
            { \clist_item:nn {##1} {#2} }
            { \clist_item:nn {##1} {#3} }
        }
  }
\cs_generate_variant:Nn \__diaa_csv_read:Nnn { c }
%
% Step 2: getting the values
\NewDocumentCommand \getValue { m m m }
  { \tl_set:Nx #1 { \diaa_csv_item:nn {#2} {#3} } }
\NewExpandableDocumentCommand \CSVItem { m m }
  { \diaa_csv_item:nn {#1} {#2} }
\cs_new:Npn \diaa_csv_item:nn #1 #2
  { \prop_item:cn { g__diaa_csv_#2_prop } {#1} }
\ExplSyntaxOff

\begin{document}

\ReadCSV{mydata}{test.csv}

\getValue\rdPar{Third Parameter}{mydata}
\rdPar

\edef\stPar{\CSVItem{First Parameter}{mydata}}%
\stPar

\end{document}

答案1

这是修改后的版本Phelype Oleinik 的回答您在问题中链接的。第一种方法更短,第二种方法更好。:-)

第一种方法

CSV 文件中的列号从 1 开始。新命令具有以下语法:

\ReadCSV[*] {label} [key column] {value columns} {file}

在哪里键列默认为 1,并且值列是一个以逗号分隔的列号列表(仅存储这些列的值以\ReadCSV允许稍后通过\getValue和检索\CSVItem)。

\getValue {\macro} [value column] {key} {label}

这就是你在问题中所要求的。值列默认为 2。内容值列对应于指定钥匙存储在\macro(可以是expl3标记列表变量)。

\CSVItem {key} [value column] {label}

此命令完全可扩展。它以递归方式扩展为值列对应于指定钥匙值列默认为 2,如\getValue

\begin{filecontents*}{test.csv}
Third Parameter  , 7 , 9  ,
First Parameter  , 5 , 10 ,
Second Parameter , 3 , 6  , 44
\end{filecontents*}

\documentclass{article}
\usepackage{xparse}

\ExplSyntaxOn
% Step 1: reading the file
\ior_new:N \l__diaa_csv_ior
\bool_new:N \l__diaa_csv_str_bool
\seq_new:N \l__diaa_csv_tmp_seq

% str mode (bool/star), label, key column, value columns, file
\NewDocumentCommand \ReadCSV { s m O{1} m m }
  {
    \IfBooleanTF {#1}
      { \bool_set_true:N \l__diaa_csv_str_bool }
      { \bool_set_false:N \l__diaa_csv_str_bool }
    \diaa_csv_read:nnnn {#2} {#3} {#4} {#5}
  }

% label, key column, value columns, file
\cs_new_protected:Npn \diaa_csv_read:nnnn #1 #2 #3 #4
  {
    \seq_set_split:Nnn \l__diaa_csv_tmp_seq { , } {#3}
    \seq_map_inline:Nn \l__diaa_csv_tmp_seq
      { \prop_new:c { g__diaa_csv_#1_##1_prop } }

    \ior_open:NnTF \l__diaa_csv_ior {#4}
      {
        \__diaa_csv_read:nn {#1} {#2}
        \ior_close:N \l__diaa_csv_ior
      }
      { \msg_error:nnn { diaa } { file-not-found } {#4} }
  }

\msg_new:nnn { diaa } { file-not-found }
  { File~`#1'~not~found. }

% label, key column
\cs_new_protected:Npn \__diaa_csv_read:nn #1 #2
  {
    \bool_if:NTF \l__diaa_csv_str_bool
      { \ior_str_map_inline:Nn }
      { \ior_map_inline:Nn }
        \l__diaa_csv_ior
        {
           \seq_map_inline:Nn \l__diaa_csv_tmp_seq
             {
               \prop_put:cxx { g__diaa_csv_#1_####1_prop }
                 { \clist_item:nn {##1} {#2} }
                 { \clist_item:nn {##1} {####1} }
             }
        }
  }

% Step 2: getting the values
% macro or tl var, value column, key, label
\NewDocumentCommand \getValue { m O{2} m m }
  { \tl_set:Nx #1 { \diaa_csv_item:nnn {#3} {#2} {#4} } }

% key, column containing the desired value, label
\NewExpandableDocumentCommand \CSVItem { m O{2} m }
  { \diaa_csv_item:nnn {#1} {#2} {#3} }

% key, column containing the desired value, label
\cs_new:Npn \diaa_csv_item:nnn #1 #2 #3
  { \prop_item:cn { g__diaa_csv_#3_#2_prop } {#1} }
\ExplSyntaxOff

\begin{document}

% Use default column for the key (1)
\ReadCSV{mydata}{2,4}{test.csv} % discard the third column

\getValue\rdPar[4]{Second Parameter}{mydata}
\rdPar                         % 44

\getValue\rdPar{Second Parameter}{mydata}
\rdPar                         % 3

\getValue\rdPar{Third Parameter}{mydata}
\rdPar                         % 7

\edef\rdPar{\CSVItem{First Parameter}{mydata}}%
\rdPar                         % 5

\edef\rdPar{\CSVItem{First Parameter}[4]{mydata}}%
\ifx\rdPar\empty
  \textlangle empty\textrangle
\else
  \rdPar
\fi

\end{document}

在此处输入图片描述

第二种方法

这是基于以前的代码,但是:

  • \seq_set_split:Nnn现在使用而不是函数来解析 CSV 行,clist以免忽略空单元格;

  • 它更节省内存(仅l3prop使用一个来存储所有选定的列);

  • 列寻址不同:当使用\getValue或检索值时\CSVItem,列 1 是第一个选定的列,列 2 是第二个选定的列,等等。因此,使用这些函数检索值时的默认列号为 1(而不是 2)。

  • \getValue现在有一个执行全局分配的明星版本。

由于您想自动检测列数,我必须更改语法,\ReadCSV如下所示:

\ReadCSV[*] [key column] {label} [value columns] {file}

键列默认为 1,如上所述。但是,当值列为空白,第一行文件读取以确定数量n列,值列定义为从 2 到n(含)。

读取文件时,将忽略列分隔符逗号两侧的空格,并且删除每个单元格内容周围的一组外括号(如果有)(foo, bar以下示例 CSV 文件中的单元格说明了这一点)。

\begin{filecontents*}{test.csv}
Third Parameter  , 7 , 9          ,
First Parameter  , 5 , {foo, bar} ,
Second Parameter , 3 , 6          , 44
\end{filecontents*}

\documentclass{article}
\usepackage{xparse}

\ExplSyntaxOn
% Step 1: reading the file
\ior_new:N \l__diaa_csv_ior
\bool_new:N \l__diaa_csv_str_bool
\seq_new:N \l__diaa_csv_tmp_seq

% str mode (bool/star), key column, label, value columns, file
\NewDocumentCommand \ReadCSV { s O{1} m O{} m }
  {
    \IfBooleanTF {#1}
      { \bool_set_true:N \l__diaa_csv_str_bool }
      { \bool_set_false:N \l__diaa_csv_str_bool }
    \diaa_csv_read:nnnn {#3} {#2} {#4} {#5}
  }

% label, key column, value columns, file
\cs_new_protected:Npn \diaa_csv_read:nnnn #1 #2 #3 #4
  {
    \tl_if_blank:nTF {#3}       % Detect number of columns and use 2 to last
      {
        \ior_open:NnTF \l__diaa_csv_ior {#4}
          {
            \bool_if:NTF \l__diaa_csv_str_bool
              { \ior_str_get:NN }
              { \ior_get:NN }
              \l__diaa_csv_ior \l_tmpa_tl

            \ior_close:N \l__diaa_csv_ior
            \seq_set_split:NnV \l_tmpa_seq { , } \l_tmpa_tl
            \seq_clear:N \l__diaa_csv_tmp_seq
            \int_step_inline:nnn { 2 } { \seq_count:N \l_tmpa_seq }
              { \seq_put_right:Nn \l__diaa_csv_tmp_seq {##1} }
          }
          { \msg_error:nnn { diaa } { file-not-found } {#4} }
      }
      { \seq_set_split:Nnn \l__diaa_csv_tmp_seq { , } {#3} } % explicit columns

    \ior_open:NnTF \l__diaa_csv_ior {#4}
      {
        \prop_new:c { g__diaa_csv_#1_prop }
        \__diaa_csv_read:nn {#1} {#2}
        \ior_close:N \l__diaa_csv_ior
      }
      { \msg_error:nnn { diaa } { file-not-found } {#4} }
  }

\msg_new:nnn { diaa } { file-not-found }
  { File~`#1'~not~found. }

\cs_generate_variant:Nn \prop_put:Nnn { cxV }

% label, key column
\cs_new_protected:Npn \__diaa_csv_read:nn #1 #2
  {
    \bool_if:NTF \l__diaa_csv_str_bool
      { \ior_str_map_inline:Nn }
      { \ior_map_inline:Nn }
        \l__diaa_csv_ior
        {
          \seq_set_split:Nnn \l_tmpa_seq { , } {##1} % split one CSV row
          \tl_clear:N \l_tmpa_tl
          \seq_map_inline:Nn \l__diaa_csv_tmp_seq
            {
              \tl_put_right:Nx \l_tmpa_tl { { \seq_item:Nn \l_tmpa_seq {####1} } }
            }

          \prop_put:cxV { g__diaa_csv_#1_prop }
            { \seq_item:Nn \l_tmpa_seq {#2} }
            \l_tmpa_tl
        }
  }

% Step 2: getting the values
% star → global assignment, macro or tl var, value column, key, label
\NewDocumentCommand \getValue { s m O{1} m m }
  {
    \IfBooleanTF {#1} { \tl_gset:Nx } { \tl_set:Nx }
      #2 { \diaa_csv_item:nnn {#4} {#3} {#5} }
  }

% key, value column, label
\NewExpandableDocumentCommand \CSVItem { m O{1} m }
  { \diaa_csv_item:nnn {#1} {#2} {#3} }

\cs_generate_variant:Nn \tl_item:nn { f }

% key, value column, label
\cs_new:Npn \diaa_csv_item:nnn #1 #2 #3
  {
    \tl_item:fn { \prop_item:cn { g__diaa_csv_#3_prop } {#1} } {#2}
  }
\ExplSyntaxOff

\begin{document}

% Use default column for the key (1). The second empty optional argument (list
% of value columns) means we want to autodetect the value columns; then, the
% first column is for keys and all other columns are used as value columns.
\ReadCSV{mydata}{test.csv}

\getValue\rdPar{Second Parameter}{mydata}
\rdPar                         % 3

\getValue\rdPar[2]{Second Parameter}{mydata}
\rdPar                         % 6

\getValue\rdPar[3]{Second Parameter}{mydata}
\rdPar                         % 44

\getValue\rdPar{Third Parameter}{mydata}
\rdPar                         % 7

\edef\rdPar{\CSVItem{First Parameter}{mydata}}%
\rdPar                         % 5

\edef\rdPar{\CSVItem{First Parameter}[2]{mydata}}%
\rdPar                         % foo, bar

\edef\rdPar{\CSVItem{First Parameter}[3]{mydata}}%
\ifx\rdPar\empty
  \textlangle empty\textrangle
\else
  \rdPar
\fi

\end{document}

在此处输入图片描述

答案2

带着readarray包裹...

\begin{filecontents*}{test.csv}
Third Parameter  , 7 , 9  , 
First Parameter  , 5 , 10 ,
Second Parameter , 3 , 6  , 44
\end{filecontents*}

\documentclass{article}
\usepackage{readarray,pgffor}
\newcommand\getValue[3][2]{%
  \def\tmpA{#2}%
  \foreach\z in{1,...,\nrows}{%
    \arraytomacro#3[\z,1]\tmpB
    \ifx\tmpA\tmpB #3[\z,#1]\fi
  }%
}

\begin{document}
\readarraysepchar{,}
\readdef{test.csv}\mydata
\readarray\mydata\myarray[-,\ncols]
\nrows{} rows in data

Cell(2,2): \myarray[2,2]

Cell(3,4): \myarray[3,4]

\getValue{Third Parameter }{\myarray}
and
\getValue[4]{Second Parameter }{\myarray}
\end{document}

在此处输入图片描述

请注意,默认情况下,输入数据中的前导/尾随空格会被保留。但是,使用\readarray*代替\readarray会删除前导/尾随空格(在这种情况下,搜索字段规范也必须删除这些空格)。

\begin{filecontents*}{test.csv}
Third Parameter  , 7 , 9  , 
First Parameter  , 5 , 10 ,
Second Parameter , 3 , 6  , 44
\end{filecontents*}

\documentclass{article}
\usepackage{readarray,pgffor}
\newcommand\getValue[3][2]{%
  \def\tmpA{#2}%
  \foreach\z in{1,...,\nrows}{%
    \arraytomacro#3[\z,1]\tmpB
    \ifx\tmpA\tmpB #3[\z,#1]\fi
  }%
}

\begin{document}
\readarraysepchar{,}
\readdef{test.csv}\mydata
\readarray*\mydata\myarray[-,\ncols]
\nrows{} rows in data

Cell(2,2): \myarray[2,2]

Cell(3,4): \myarray[3,4]

\getValue{Third Parameter}{\myarray}
and
\getValue[4]{Second Parameter}{\myarray}
\end{document}

相关内容