使用 bash 用随机数据填充文本文件的列

使用 bash 用随机数据填充文本文件的列

我有一个格式的文件

<string> <string> <string>
..
..

我正在尝试使用 sed 将第三列字符串替换为随机数据。第三列字符串长度是固定的,为 48 位数字

我能够使用 read 修复解决方案

while read a b c; do
    echo $a $b $(cat /dev/urandom | tr -dc '0-1' | fold -w 48 | head -n 1)
done < input > output

但是循环处理时间太长。如何使用 sed 来实现这一点?

答案1

cat /dev/urandom | tr -dc '0-1'是一种非常缓慢的获取随机数的方法——因为它不能解析为 ASCII 数字,所以你会丢弃大量数据。

您可以使用odhexdump将数据转换为数字,或者也许awk替换第三个字段:

$ awk -v cmd="od -t u2 -A n /dev/urandom | tr -d ' \n' | fold -w 48" '{cmd | getline a; $3=a}1' foo
a b 544404963198532458179603539139474299576034345258
a b 288743886427692659230387417952036728563243415446
a b 862132599821016414678116482868514114597223157825
a b 033164829235119519053106724136729063192651002644
a b 344594724128550250448115260033862902855932105599
a b 312488113115218631189450762993316672549312384472
a b 536218132619476215470461793189974621744028599402
a b 312943765306550325469516346331872556359574159859
a b 530561655804530239462031928466172515137971221356
a b 295271911741933346066441964722122556255551414840

od -t u2 -A n /dev/urandom | tr -d ' \n' | fold -w 48将随机数据转换为双字节unsigned int,然后我们用从输出tr中删除空格。od

awk对于基于列的文本处理来说非常好。<command> | getline方法允许您运行<command> 一次然后读取awk命令持续期间的输出。

比强制输出为所需格式更简单的方法od是使用hexdump

hexdump -e '"%u"' /dev/urandom | fold -w 48

答案2

使用 perl字节::随机::安全模块:

$ perl -MBytes::Random::Secure=random_bytes_hex -alne '
  print join " ", @F[1..2], random_bytes_hex(24)
' file
<string> <string> 56fe375ade090e9838c13b5bbb799c2fac26d42da3f01691
<string> <string> 8bf748fb4d372e701af5ae0075a9de58c8ce3b05210c24bd
<string> <string> 345c58a5983e7bade8fed0311267daeea9ed314b1efe33d1

该模块在 Ubuntu 中可通过以下包获取libbytes-random-secure-perl

相关内容