如何使用 while 循环读取两个输入文件

Question 1

如果您可以保证某些字符永远不会出现在第一个文件中，那么您可以使用粘贴。

例如，您确信这@永远不会发生：

paste -d@ file1 file2 | while IFS="@" read -r f1 f2
do
  printf 'f1: %s\n' "$f1"
  printf 'f2: %s\n' "$f2"
done

请注意，只要保证该字符不会出现在第一个文件中就足够了。这是因为填充最后一个变量时read会忽略。IFS因此，即使@发生在第二个文件中，它也不会被分割。

使用一些 bash 功能来获得可以说是更干净的代码的示例，并使用默认分隔符选项卡进行粘贴：

while IFS=$'\t' read -r f1 f2
do
  printf 'f1: %s\n' "$f1"
  printf 'f2: %s\n' "$f2"
done < <(paste file1 file2)

使用的 Bash 功能：ANSI C 字符串（$'\t'）和流程替代（<(...)）到避免子 shell 中的 while 循环问题。

如果您不能确定任何字符都不会出现在两个文件中，那么您可以使用两个文件描述符。

while true
do
  read -r f1 <&3 || break
  read -r f2 <&4 || break
  printf 'f1: %s\n' "$f1"
  printf 'f2: %s\n' "$f2"
done 3<file1 4<file2

没有经过太多测试。可能会在空行处中断。

文件描述符编号 0、1 和 2 已分别用于 stdin、stdout 和 stderr。 3 及以上的文件描述符（通常）是免费的。 bash 手册警告不要使用大于 9 的文件描述符，因为它们是“内部使用的”。

请注意，打开的文件描述符被继承给 shell 函数和外部程序。继承打开文件描述符的函数和程序可以读取（和写入）文件描述符。在调用函数或外部程序之前，您应该注意关闭所有不需要的文件描述符。

这是与上面相同的程序，其中实际工作（打印）与元工作（并行从两个文件中逐行读取）分开。

work() {
  printf 'f1: %s\n' "$1"
  printf 'f2: %s\n' "$2"
}

while true
do
  read -r f1 <&3 || break
  read -r f2 <&4 || break
  work "$f1" "$f2"
done 3<file1 4<file2

现在我们假装我们无法控制工作代码，并且该代码无论出于何种原因都会尝试从文件描述符 3 中读取。

unknowncode() {
  printf 'f1: %s\n' "$1"
  printf 'f2: %s\n' "$2"
  read -r yoink <&3 && printf 'yoink: %s\n' "$yoink"
}

while true
do
  read -r f1 <&3 || break
  read -r f2 <&4 || break
  unknowncode "$f1" "$f2"
done 3<file1 4<file2

这是一个示例输出。请注意，第一个文件中的第二行是从循环中“窃取”的。

f1: file1 line1
f2: file2 line1
yoink: file1 line2
f1: file1 line3
f2: file2 line2

以下是在调用外部代码（或任何与此相关的代码）之前应如何关闭文件描述符的方法。

while true
do
  read -r f1 <&3 || break
  read -r f2 <&4 || break
  # this will close fd3 and fd4 before executing anycode
  anycode "$f1" "$f2" 3<&- 4<&-
  # note that fd3 and fd4 are still open in the loop
done 3<file1 4<file2

Answer