如何读取偶尔包含额外换行符的输入文件？

Question 1

这是一个仅依赖于前导空格的解决方案。它不依赖于预期的字段数量。

这GNU 手册sed提供了一种“连接以空格开头的行”的方法：

sed -E ':a ; $!N ; s/\n\s+/ / ; ta ; P ; D'

该手册声称可移植（非 GNU）变体是：

sed -e :a -e '$!N;s/\n  */ /;ta' -e 'P;D'

Answer

这是一个仅依赖于前导空格的解决方案。它不依赖于预期的字段数量。

这GNU 手册sed提供了一种“连接以空格开头的行”的方法：

sed -E ':a ; $!N ; s/\n\s+/ / ; ta ; P ; D'

该手册声称可移植（非 GNU）变体是：

sed -e :a -e '$!N;s/\n  */ /;ta' -e 'P;D'

Question 2

这应该可以达到所需的效果：

#!/usr/bin/env bash

while read line; do
    declare -a array=($line)
    if  test ${#array[@]} != 3; then
        read line2
        array+=($line2)
    fi
    f1=${array[0]}
    f2=${array[1]}
    echo $f1 $f2
done

run with : test.sh < inputfile

它检查一行是否包含三个项目，如果没有，则加入下一行。

Answer

这应该可以达到所需的效果：

#!/usr/bin/env bash

while read line; do
    declare -a array=($line)
    if  test ${#array[@]} != 3; then
        read line2
        array+=($line2)
    fi
    f1=${array[0]}
    f2=${array[1]}
    echo $f1 $f2
done

run with : test.sh < inputfile

它检查一行是否包含三个项目，如果没有，则加入下一行。

Question 3

既然你awk无论如何都在使用它，为什么不完全依赖它呢？尝试

read f1 f2 <<< $(awk '{while (NF < 3) {getline X; $0 = $0 FS X};  print $1, $2}' file)

Answer

既然你awk无论如何都在使用它，为什么不完全依赖它呢？尝试

read f1 f2 <<< $(awk '{while (NF < 3) {getline X; $0 = $0 FS X};  print $1, $2}' file)

Question 4

假设输入数据的每个格式正确的行都由三个单词组成（此处宽松地定义为不包含任何空白字符的字符串），您可以预处理输入数据：

<input_file tr -s '[:blank:]' '\n' | paste - - - | column -t

<newline>在这里，我们用单个替换任何空白字符（包括字符） <newline>，将结果重新排列为三个单词的行，并很好地格式化输出 - 考虑到您的问题，最后一个是不必要的装饰步骤。

Answer

假设输入数据的每个格式正确的行都由三个单词组成（此处宽松地定义为不包含任何空白字符的字符串），您可以预处理输入数据：

<input_file tr -s '[:blank:]' '\n' | paste - - - | column -t

<newline>在这里，我们用单个替换任何空白字符（包括字符） <newline>，将结果重新排列为三个单词的行，并很好地格式化输出 - 考虑到您的问题，最后一个是不必要的装饰步骤。

如何读取偶尔包含额外换行符的输入文件？

答案1

答案2

答案3

答案4

相关内容