检查文本文件是否包含所有条目且格式正确

检查文本文件是否包含所有条目且格式正确

我有一个像这样的文件

0001;4;5;30;33;41;52
0002;9;37;39;41;43;49
0003;10;11;29;30;36;47
0004;1;5;6;27;42;59
0005;1;2;6;16;19;46
0006;7;13;19;22;40;47
0007;3;5;20;21;38;56
... etc

第一个数字是计数器,后面的六个数字是 1 或 2 位数字。

该文件有数千行这样的。它从 1 开始,一直到 9999。

有没有办法检查是否缺少一行?我的意思是,如果从第一行到最后一行的所有数字都存在?

我的意思是这样的:

0001;4;5;30;33;41;52      // first line
0002;9;37;39;41;43;49
0003;10;11;29;30;36;47
...
9999;3;4;8;12;55;88       // last line

0001 到 9999 之间是否少了一行?

假设这样:

0001;4;5;30;33;41;52     
0002;9;37;39;41;43;49
0003;10;11;29;30;36;47
0004;1;5;6;27;42;59
0006;7;13;19;22;40;47

看? 0005 不见了。

作为奖励,最好检查一下所有七个数字是否由;而不是任何其他字符分隔。

谢谢

答案1

AWK解决方案(假设你的如果它打印出第一个就好了):

样本文件input.csv

0001;4;5;30;33;41;52
0002;9;37;39;41;43;49
0003;10;11;29;30;36;47
0005;1;2;6;16;19;46
0006;7;13;19;22;40;47
0007;3;5;20;21;38;56
0008;1;5,6;27;42;59
0009;10;1;6;27;42;59

对于条件检查是否缺少一行:

awk -F';' 'NR!=int($1){ printf "%04d is missing\n",NR; exit }' input.csv

输出:

0004 is missing

对于条件检查是否全部数字由以下分隔;:

awk -F';' 'NF!=7{printf "Incorrect number of fields: %d on record %d\n",NF,NR; exit}' input.csv

输出:

Incorrect number of fields: 6 on record 7

答案2

除了接受的答案之外,要查找任何包含不需要的字符的行:

grep '[^0-9;]' filename

它将输出文件中包含非数字或分号字符的任何行。用于grep -n查找这些违规行的行号。

相关内容