如何用最少的资源从该文本中生成 URL?

如何用最少的资源从该文本中生成 URL?

输入:

nyeeeeeeeeeeeeeee.txt:sadfsadf
sadjflsajfd:jasdlfjalsfd
foo/asdfsafd.txt:laksjdlfajsfd

输出:

<a href="nyeeeeeeeeeeeeeee.txt">nyeeeeeeeeeeeeeee.txt</a>:sadfsadf
<a href="sadjflsajfd">sadjflsajfd</a>:jasdlfjalsfd
<a href="foo/asdfsafd.txt">foo/asdfsafd.txt</a>:laksjdlfajsfd

所以我需要将 INPUT 转换为 OUTPUT,区别在于 OUTPUT 是“可点击的”,因为这是在 HTML 文件中。

问:我如何使用 awk、sed 或 perl 来做到这一点?

我知道我可以“逐行读取”,但是最有效的资源效率方法是什么? (我只需要 1 个解决方案,而不是所有 sed/awk/ 等):是分隔符。

答案1

严格按照您的要求:

sed 's/\([^:]\+\)/<a href="\1">\1<\/a>/' input.txt
awk -F ':' -vOFS=':' '$1="<a href=\""$1"\">"$1"</a>"' input.txt
while IFS=':' read -r url text; do echo "<a href=\"$url\">$url</a>:$text"; done < input.txt

但对于真正的 HTML 生成,您还必须处理 HTML 编码:

perl -MHTML::Entities -pe 's!([^:]+)(.*)!"<a href=\"".($t=encode_entities($1))."\">$t".encode_entities($2)!e' input.txt

相关内容