检查文件中是否存在匹配的条目

检查文件中是否存在匹配的条目

我有一个包含列表的文件,如下所示:

apple
orange
pear
pineapple

我如何创建一个宏来检查某项是否在该列表中。例如:

  • \isfruit{pear}返回“1”。
  • \isfruit{carrot}返回“0”。

答案1

如果文件不太长,你可以这样做

\documentclass{article}

\makeatletter
\newread\@readisfruit
\newcommand\isfruit[3][]{%
  \begingroup\endlinechar=\m@ne
  \openin\@readisfruit=#2
  \def\@tempa{#3}%
  \def\@result{0}%
  \loop\unless\ifeof\@readisfruit
    \read\@readisfruit to \@tempb
    \ifx\@tempa\@tempb\def\@result{1}\fi
  \repeat             
  \closein\@readisfruit
  \edef\x{\endgroup\if!\noexpand#1!\@result\else\edef\noexpand#1{\@result}\fi}\x}
\makeatother

\begin{document}
\isfruit{village.dat}{pear}

\isfruit[\result]{village.dat}{carrot}\show\result

\end{document}

但是,它不可扩展,因此我提供了一个可选参数:用于存储结果的控制序列名称。

替代定义

正如 Ahmed Musa 所观察到的,如果文件很长,读取文件会非常耗时,尤其是测试执行多次时。我们可以利用捕获文件

\usepackage{catchfile}

\CatchFileDef{\village}{village.dat}{\endlinechar=`| }
\makeatletter
\newcommand{\isfruitA}[3][]{%
  \ifcsname loaded@#2\endcsname\else
    \expandafter\CatchFileDef\csname loaded@#2\endcsname{#2}{\endlinechar=`| }%
  \fi
  \begingroup\expandafter\let\expandafter\@tempa\csname loaded@#2\endcsname
  \edef\x{\endgroup\noexpand\in@{\unexpanded{#3}|}{\unexpanded\expandafter{\@tempa}}}\x
  \ifin@ \def\@result{1}\else \def\@result{0}\fi
  \if!\noexpand#1!\@result\else\edef#1{\@result}\fi}
\makeatother

现在\isfruitA{village.dat}{pear}将打印 1(在定义一个扩展到 的内容的宏之后village.dat,行与行之间用 分隔|,我们假设它不会出现在字符串中)。如果我们调用

\isfruitA[\result]{village.dat}{orange}

测试结果(0 或 1)将被放入宏中\result。该文件将只被读取一次。一些包,如字符串可以用来避免繁琐的测试\ifin@

答案2

我会尽力回答这个问题。也许有人能改进我的答案。

我以这种方式创建宏,宏在设置为\isfruit期间读取文件。每一行都将被读取并保存在列表中。之后,我将列表与参数进行比较。enlinechar-1

\documentclass{article}
\usepackage{filecontents}
\begin{filecontents*}{fruit.tex}
apple
orange
pear
pineapple
\end{filecontents*}
\usepackage{etoolbox}
\newread\InputFruit
\newcommand*\isfruit[2]{%
     \begingroup%
      \def\MyList{}
      \openin\InputFruit=#1
       \endlinechar=-1%
       \loop\unless\ifeof\InputFruit
        \read\InputFruit to \reserveda
         \listxadd\MyList{\reserveda}
        \repeat
        \closein\InputFruit
      \xifinlist{#2}{\MyList}{in list}{not in list}
    \endgroup%
     }%
\begin{document}
\isfruit{fruit.tex}{apple}

\isfruit{fruit.tex}{foo}
\end{document}

答案3

@Marco Daniel:宏中有一些空格未被内部 取消\endlinechar=-1。它们将以水平模式显示在文档中。此外,分配\endlinechar=-1%应该是。此外,我将在命令之外\endlinechar=-1 %进行分支,以便用户 有机会更改两个回调。并且您的列表分隔符(在 中默认使用)可能存在于要测试的原始列表中。\xifinlist\isfruit\isfruit\xifinlist

\documentclass{article}
\usepackage{filecontents}
\begin{filecontents*}{fruit.tex}
apple
orange
pear
pineapple
\end{filecontents*}
\begingroup
\catcode`\|=3
\endlinechar=-1
\makeatletter
\gdef\ifinfruitlist#1#2{%
  \begingroup
  \endlinechar=-1
  \def\MyList{}
  \openin\@inputcheck=#1 %
  \loop\unless\ifeof\@inputcheck
    \read\@inputcheck to \reserveda
    \edef\MyList{\ifx\MyList\@empty\else
      \unexpanded\expandafter{\MyList}|
      \fi\unexpanded\expandafter{\reserveda}}
  \repeat
  \closein\@inputcheck
  \@expandtwoargs\in@{|#2|}{|\unexpanded\expandafter{\MyList}|}
  \expandafter\endgroup
  \ifin@\expandafter\@firstoftwo\else\expandafter\@secondoftwo\fi
}
\endgroup

\begin{document}
\ifinfruitlist{fruit.tex}{apple}{in list}{not in list}
\ifinfruitlist{fruit.tex}{foo}{in list}{not in list}
\end{document

上述解决方案效率低得令人无法接受。如果列表长达十页,并且感兴趣的标记是列表中的第一个,那么我们必须先读取整个文档,然后再检查测试字符串是否存在。以下是更高效的实现:

\documentclass{article}
\begin{filecontents*}{fruit.tex}
apple
orange
pear
pineapple
\end{filecontents*}

\makeatletter
\gdef\ifinfruitlist#1#2{%
  \begingroup
  \def\reserved@b{#2}%
  \endlinechar=-1 %
  \openin\@inputcheck=#1 %
  \@tempswafalse\@testfalse
  \def\do{%
    \if@tempswa
      \closein\@inputcheck
    \else
      \ifeof\@inputcheck
        \@tempswatrue
      \else
        \read\@inputcheck to\reserved@a
        \ifx\reserved@a\reserved@b
          \@testtrue\@tempswatrue
        \fi
      \fi
      \expandafter\do
    \fi
  }%
  \do
  \expandafter\endgroup
  \if@test\expandafter\@firstoftwo\else\expandafter\@secondoftwo\fi
}
\makeatother

\begin{document}
\ifinfruitlist{fruit.tex}{pear}{in list}{not in list}
\ifinfruitlist{fruit.tex}{foo}{in list}{not in list}
\end{document}

答案4

LuaTeX 非常适合这样的任务。下面是 ConTeXt 中基于 luatex 的解决方案。

\startbuffer[fruits]
apple
orange
pear
pineapple
\stopbuffer

%% Save the contents of fruits buffer in \jobname-fruits.tmp
\savebuffer[fruits][fruits] 

\startluacode
  local data = {}
  local find = string.find
  function commands.doiffruitelse(file, fruit)
      if not data[file] then
          data[file] = io.loaddata(file) or ""
      end
      return commands.testcase(find(data[file], "%f[%a]"..fruit.."%f[%A]") ~= nil)
  end
\stopluacode

\def\doiffruitelse#1%
    {\ctxcommand{doiffruitelse("\jobname-fruits.tmp", "#1")}}

\def\isFruit#1%
    {\doiffruitelse{#1}{1}{0}}

\starttext
\startlines
\isFruit{pear}
\isFruit{carrot}
\stoplines
\stoptext

这使用io:loaddata()函数 froml-io.lua来加载文件的内容,commands使用表来分隔 lua 命令的命名空间,使用commands.testcase函数来提供 do-if-else 功能。实际的匹配是使用string.find函数完成的。我使用边界模式匹配单词边界。

相关内容