解析文本文件并以新格式输出

Question 1

您的输入似乎与 C 类似，因此理论上用 C 解析器解析它会更好。如果您使用正则表达式，即使对于简单的任务，您也必须处理不同的空格、多行输入等。问题是，C 解析器不解析注释，而您显然想要这样做。

这是一个 perl 脚本，它给出了示例的预期输出。

#!/usr/bin/perl -n
#
BEGIN { $i = 0; }

if (m!^\s*(.+)\s+([^ ]+);\s*/\*\s*(\d+)\s*(\d+)\s*\*/\s*$!)
{
    print "$i,$1,$2,$3,$4\n";
    $i+=1
}

如果将此脚本保存script.pl在所在文件夹中input.txt，请按如下方式使用它：

./script.pl < input.txt > output.txt

Answer

您的输入似乎与 C 类似，因此理论上用 C 解析器解析它会更好。如果您使用正则表达式，即使对于简单的任务，您也必须处理不同的空格、多行输入等。问题是，C 解析器不解析注释，而您显然想要这样做。

这是一个 perl 脚本，它给出了示例的预期输出。

#!/usr/bin/perl -n
#
BEGIN { $i = 0; }

if (m!^\s*(.+)\s+([^ ]+);\s*/\*\s*(\d+)\s*(\d+)\s*\*/\s*$!)
{
    print "$i,$1,$2,$3,$4\n";
    $i+=1
}

如果将此脚本保存script.pl在所在文件夹中input.txt，请按如下方式使用它：

./script.pl < input.txt > output.txt

Question 2

没有正则表达式的 awk 替代方案：

$ echo "int A[4];   /* 0  16*/" |awk '{gsub(/[/*;]/,"");for (i=1;i<=NF;i++) printf("%s, %s", (i==1?NR-1:""),(i==NF?$i"\n":$i))}'
#Output:
0, int, A[4], 0, 16

陷阱：

$ echo "long int C[2]; /*32  8*/" |awk '{gsub(/[/*;]/,"");for (i=1;i<=NF;i++) printf("%s, %s", (i==1?NR-1:""),(i==NF?$i"\n":$i))}'
#Output
0, long, int, C[2], 32, 8

Answer

没有正则表达式的 awk 替代方案：

$ echo "int A[4];   /* 0  16*/" |awk '{gsub(/[/*;]/,"");for (i=1;i<=NF;i++) printf("%s, %s", (i==1?NR-1:""),(i==NF?$i"\n":$i))}'
#Output:
0, int, A[4], 0, 16

陷阱：

$ echo "long int C[2]; /*32  8*/" |awk '{gsub(/[/*;]/,"");for (i=1;i<=NF;i++) printf("%s, %s", (i==1?NR-1:""),(i==NF?$i"\n":$i))}'
#Output
0, long, int, C[2], 32, 8

Question 3

perl -lane '
   /^\s*\/\*/ and $,=",",next;
   print $a++,join ", ", grep /./, map { m!^/\*+\K(\S*)|([^*]*)(?=\*+/$)|(.+[^;]);?$! } @F
'

Answer

perl -lane '
   /^\s*\/\*/ and $,=",",next;
   print $a++,join ", ", grep /./, map { m!^/\*+\K(\S*)|([^*]*)(?=\*+/$)|(.+[^;]);?$! } @F
'

解析文本文件并以新格式输出

答案1

答案2

答案3

相关内容