我想逐行读取一个大的文本数据文件。示例代码:
lines=0
while IFS=$' \t\n'
do
lines=$(($lines+1))
read val
echo "lines=$lines val=$val"
done < myfile
问题:循环读取到了文件末尾!
$ wc -l myfile
41788 myfile
一开始一切顺利,我可以看到打印的数据,但循环在 41788 之后不会停止。计数器继续以空行运行,我必须按 CTRL-C'it 才能停止。
检查了数据文件,没有什么特别的。 size=5088370 字节,字段以制表符分隔 (1)。
$ file myfile
myfile: ISO-8859 text, with CRLF line terminators
有任何线索知道这里发生了什么吗?我错过了什么 ?
(1) 这些字段实际上是用 读取的read -a val
,但我尝试了上面的简化代码来减少我的 MCWE。
答案1
你是说只要 IFS 设置$' \t\n'
成功,你的循环就会运行。它应该是这样的:
while IFS=$' \t\n' read -r val
do
((lines++))
echo "lines=$lines val=$val"
done < myfile
的默认值IFS
应该是$' \t\n'
这样设置的,这样设置可能是多余的。我还相信read
默认情况下会读取整行,并且我认为即使将 IFS 设置为$' '
仍会导致它读取整行。
如果你想read
用空格分隔,可以使用-d
如下开关:
read -r -d' ' val
do
((lines++))
echo "lines=$lines val=$val"
done < myfile
这将循环遍历 中的每个空格分隔的字符串myfile
。