从大型目录中一次高效地连接和删除 1000 个文件

Question 1

您不需要循环，您可以告诉cat读取所有文件：

cat /var/abc/*.csv > file1.csv && rm /var/abc/*.csv

只要文件不是太多（但限制很大）。

在两个命令之间使用&&可确保文件仅在成功“复制”时才被删除。

但有一些注意事项：

您不能在与要连接的原始文件相同的文件夹中运行此命令，否则将rm删除聚合，您将丢失所有内容；
如果新的 CSV 文件出现在的开始cat和的参数扩展之间rm，它们将被删除而不被复制；
如果任何 CSV 文件在连接后被修改，这些修改将会丢失。

您可以通过在创建输出文件之前存储文件列表来缓解前两个警告：

set -- /var/abc/*.csv
cat -- "$@" > file1.csv && rm -- "$@"

复制文件后，这仍然会丢失对文件所做的任何更改。

要一次连接 1000 个文件（每 1000 个原始 CSV 生成一个 CSV）以及任意数量的文件，您可以在目标目录中按以下步骤操作：

find /var/abc -maxdepth 1 -type f -name \*.csv | split -d -l 1000 - csvlists
for file in csvlists*; do cat $(cat $file) > concat${file##csvlists}.csv && rm $(cat $file); done

/var/abc这将找到named中的所有文件，并在以( , ...)*.csv开头的文件中一次列出1000个文件。然后循环读取每个文件列表，并将列出的 CSV 文件连接到名为 etc. 的文件中以匹配列表。复制每组文件后，原始文件将被删除。csvlistscsvlists00csvlists01forconcat00.csv

此版本假定 CSV 文件的名称不包含空格、换行符等。

Answer

您不需要循环，您可以告诉cat读取所有文件：

cat /var/abc/*.csv > file1.csv && rm /var/abc/*.csv