GNU Recode - 正确解码混合 HTML 字符/数字编码文本？

2024-6-11 • tag-icon

我最近发现 GNU 重新编码可以用来解码 HTML 实体，但是当我查看一个恶意软件时，我注意到它似乎是混合的 HTML 字符/实体编码，例如这个。我将 URL 从恶意域更改为 example.com：

https&colon;//example&period;com/

当我将其通过管道传输到时recode html..ascii，我得到以下内容，它解码数字实体，但不解码字符实体。

https&colon;//example&period;com/

我没有找到有关处理的格式的良好文档recode，有没有办法让它进行第二遍解码字符实体，或者是否有更好的 cli 工具可以用来解码它？

相关内容