删除 MS EXCEL CSV 文件末尾的空行

Question 1

您的 csv 文件将有 windows 行尾。所以你需要先将它们转换为linux格式。

dos2unix yourfile会为你做的。

如果您的盒子上没有dos2unix，也可以通过以下方式实现相同的目的...

sed "s/\r//" infile >outfile         # UnxUtils sed v4.0.7 or higher
tr -d \r <infile >outfile            # GNU tr version 1.22 or higher

一旦文件转换为 Unix 格式，通常的sed命令应该按预期工作。

注意空行中的空格：sed '/^\s*$/d' yourfile

全部在一个 sed 命令中：

sed -e 's/\r// -e /^\s*$/d' yourfile > outputfile

Answer

您的 csv 文件将有 windows 行尾。所以你需要先将它们转换为linux格式。

dos2unix yourfile会为你做的。

如果您的盒子上没有dos2unix，也可以通过以下方式实现相同的目的...

sed "s/\r//" infile >outfile         # UnxUtils sed v4.0.7 or higher
tr -d \r <infile >outfile            # GNU tr version 1.22 or higher

一旦文件转换为 Unix 格式，通常的sed命令应该按预期工作。

注意空行中的空格：sed '/^\s*$/d' yourfile

全部在一个 sed 命令中：

sed -e 's/\r// -e /^\s*$/d' yourfile > outputfile

Question 2

“空白”行很可能包含空白字符（在 DOS 或 Windows 程序编写的文件中，回车符是一个值得注意的可疑之处）。我们可以改变模式来考虑这些：

sed -i -e '/^[[:space:]]*$/d' \
    "${File_Path}"*_{PROD,DEV,UAT}.csv

（注意还要引用变量扩展！）

Answer

“空白”行很可能包含空白字符（在 DOS 或 Windows 程序编写的文件中，回车符是一个值得注意的可疑之处）。我们可以改变模式来考虑这些：

sed -i -e '/^[[:space:]]*$/d' \
    "${File_Path}"*_{PROD,DEV,UAT}.csv

（注意还要引用变量扩展！）

Question 3

如果先合并然后删除空行，效率会稍微高一些。你可以这样做：

cat *_PROD.csv > MERGED_PROD.csv
dos2unix MERGED_PROD.csv
perl -i.bak -ne 'print if /\S/' MERGED_PROD.csv

最后一个 Perl 行将原件的副本保留MERGED_PROD.csv在MERGED_PROD.csv.bak.您可以在上面的命令中替换-i.bak为 just以跳过备份。-i

Answer

如果先合并然后删除空行，效率会稍微高一些。你可以这样做：

cat *_PROD.csv > MERGED_PROD.csv
dos2unix MERGED_PROD.csv
perl -i.bak -ne 'print if /\S/' MERGED_PROD.csv

最后一个 Perl 行将原件的副本保留MERGED_PROD.csv在MERGED_PROD.csv.bak.您可以在上面的命令中替换-i.bak为 just以跳过备份。-i

相关内容