我有这个脚本来从网站收集信息并将其输出到文本文件。它下载该站点,然后使用 grep 提取信息。我需要使用格式化来输出它们,就像我想做的那样。
#!/usr/bin/env bash
echo Enter an url
read url
mkdir site
cd site
wget -r -l1 --follow-tags=a --no-check-certificate $url
grep -r -E -o -H "\b[a-zA-Z0-9.-]+@[a-zA-Z0-9.-]+\.[a-zA-Z0-9.-]+\b" * | sort -u >> ~/email.txt
grep -r -E -o -H "\(?[[:digit:]]{5}\)?[[:space:]]?[[:digit:]]{6}" * | sort -u >> ~/phone.txt
cd ..
rm -rf site
当我运行这个时,我得到如下输出:
www.example.com/en/contact:91112223334
...
www.example.com/en/contact:[email protected]
我想制作表格格式。
电子邮件.txt
网址 | 电子邮件 |
---|---|
www.example.com | [电子邮件受保护] |
电话.txt
网址 | 电话 |
---|---|
www.example.com | 0 111 222 33 34 |
我需要按照表中所示设置电话号码的格式。我尝试过使用 awk 但没成功。