我的目录中有 4000 个具有唯一文件名的文本文件。
有没有Linux命令仅连接 1-100 个文件。
cat 1.txt ... 100.txt > 1.100.txt
cat 101.txt ... 200.txt > 2.200.txt
.......
.......
cat 3901.txt ... 4000.txt > 40.4000.txt
请提出建议。
答案1
和zsh
:
files=( *(N.n) ) i=0
while (( $#files )) {
() {cat -- $@ > $((++i)).$@[-1]} $files[1,100]
files[1,100]=()
}
globn
限定符按数字对文件名进行排序,您可以将其更改为Om
按O
修改m
时间从最旧到最新的顺序。
答案2
您只能head
选择 100 个文件。
例如:
cat $(ls -1 --sort=time | head -n 100) > 1.100.txt
(您可以将 更改--sort
为其他内容或将其删除以按名称排序)
如果文件名中可能出现空格或换行符,则不能使用ls
但find -print0
安全(使用 null 作为分隔符):
find . -type f -print0 | head -z -n 100 | xargs -0 cat > 1.100.txt
答案3
我要提醒您,ls
在任何 Bash 循环中使用 的输出时都要小心,因为它会让您产生一种错误的安全感,认为它总是有效。 (考虑文件名中的空格会发生什么......)它在这种情况下确实有效 - 但如果文件名的唯一部分是数字和连续的,那么一般来说有一个更好的(如果稍微复杂一些)方法可以做到这一点。
Bash 具有内置的整数数学功能,您可以使用该seq
命令来构造一个循环来执行您想要的操作:
i=0
while :; do
(( i += 1 ))
(( i >= 4000 )) && break
files_to_catenate=
for i in $(seq $i $((i + 99))); do
files_to_catenate+=( "${i}.txt")
done
cat "${files_to_catenate[@]}" > "$((i / 100)).${i}.txt"
done
答案4
这有点令人毛骨悚然,但是:您可以按照以下方式运行:
for a in {1..40}
do
echo cat "{$((a*100-99))..$(($a*100))}.txt > $a.$(($a*100)).txt"
done
回声
cat {1..100}.txt > 1.100.txt
cat {101..200}.txt > 2.200.txt
...
cat {3901..4000}.txt > 40.4000.txt
如果你喜欢它:for a in.....done | bash