读取文件并查找所有出现的地方，并为出现的地方之间的内容生成哈希值

Question 1

大部分都可以是

awk -F"|" -v OFS="|" '
function md5(lines){
  func="printf \"%s\" \""lines"\"|md5sum|cut -f1 -d\ " ;
  func | getline v;
  return v
}
/Record/{
  if(s>0)
    print r,l,c,md5(line);
  s=1;
  r=$2;
  c=1;
  l=NR;
  line=$0
}
!/Record/{
  line=line"\n"$0;
  c+=1
}
END{
  print r,l,c,md5(line);
}' file

简单代码解释：

将字段分隔符（输入和输出）更改为|
分配md5函数（感谢皮埃尔·奥利维尔·瓦雷斯对于想法）计算适当的输入行的 md5sum。（也许有更好的方法，欢迎您发表评论）
对于包含Record单词的行，将必要的字段放入变量中，并将计数器中断为 1，并从单词第二次出现开始打印上一个格式化行Record（对于第二次打印第一次，对于第三次打印第二次，依此类推）。
对于没有Record单词的行，只需将自己添加到line变量中，并将 1 添加到计数器中c
完成后打印最后格式化的行（因为最后一行存储在内存中，并且应该在遇到下一个Record单词但已到达文件结尾时打印）

Answer

大部分都可以是

awk -F"|" -v OFS="|" '
function md5(lines){
  func="printf \"%s\" \""lines"\"|md5sum|cut -f1 -d\ " ;
  func | getline v;
  return v
}
/Record/{
  if(s>0)
    print r,l,c,md5(line);
  s=1;
  r=$2;
  c=1;
  l=NR;
  line=$0
}
!/Record/{
  line=line"\n"$0;
  c+=1
}
END{
  print r,l,c,md5(line);
}' file

简单代码解释：

将字段分隔符（输入和输出）更改为|
分配md5函数（感谢皮埃尔·奥利维尔·瓦雷斯对于想法）计算适当的输入行的 md5sum。（也许有更好的方法，欢迎您发表评论）
对于包含Record单词的行，将必要的字段放入变量中，并将计数器中断为 1，并从单词第二次出现开始打印上一个格式化行Record（对于第二次打印第一次，对于第三次打印第二次，依此类推）。
对于没有Record单词的行，只需将自己添加到line变量中，并将 1 添加到计数器中c
完成后打印最后格式化的行（因为最后一行存储在内存中，并且应该在遇到下一个Record单词但已到达文件结尾时打印）

Question 2

基于科斯塔斯的回答。

1）创建一个文件parse.awk，内容如下：

/^Record/ {
  if (s>0) {
    printf ("%s|%s|", r,l)
    system("echo '"line"' | md5sum - | awk '{print $1}' ");
  }
  s=1;
  r=$2;
  c=1;
  l=NR;
  line="$0";
}
!/^Record/ {
  line=line"\n""$0";
  c+=1
}
END {
  printf ("%s|%s|", r,l)
  system("echo '"line"' | md5sum - | awk '{print $1}' ");
}

参见科斯塔斯的解释。该脚本只是执行 printf结果行的开头（而不是打印，即放置换行符） system(echo $line | md5sum)来打印 md5 - 和换行符

2) 运行awk -F"|" -f parse.awk myfile

3）享受结果：

1111|1|cb36533781d8dd00011a85b0db9b87b3
2222|4|521331bb249e8a668afa2199fa8d289a
3333|6|6c2564464187094e9db3159d26ade2a5

Answer

基于科斯塔斯的回答。

1）创建一个文件parse.awk，内容如下：

/^Record/ {
  if (s>0) {
    printf ("%s|%s|", r,l)
    system("echo '"line"' | md5sum - | awk '{print $1}' ");
  }
  s=1;
  r=$2;
  c=1;
  l=NR;
  line="$0";
}
!/^Record/ {
  line=line"\n""$0";
  c+=1
}
END {
  printf ("%s|%s|", r,l)
  system("echo '"line"' | md5sum - | awk '{print $1}' ");
}

参见科斯塔斯的解释。该脚本只是执行 printf结果行的开头（而不是打印，即放置换行符） system(echo $line | md5sum)来打印 md5 - 和换行符

2) 运行awk -F"|" -f parse.awk myfile

3）享受结果：

1111|1|cb36533781d8dd00011a85b0db9b87b3
2222|4|521331bb249e8a668afa2199fa8d289a
3333|6|6c2564464187094e9db3159d26ade2a5

读取文件并查找所有出现的地方，并为出现的地方之间的内容生成哈希值

答案1

答案2

相关内容