GNU Recode - 正确解码混合 HTML 字符/数字编码文本?

GNU Recode - 正确解码混合 HTML 字符/数字编码文本?

我最近发现 GNU 重新编码可以用来解码 HTML 实体,但是当我查看一个恶意软件时,我注意到它似乎是混合的 HTML 字符/实体编码,例如这个。我将 URL 从恶意域更改为 example.com:

https://example.com/

当我将其通过管道传输到 时recode html..ascii,我得到以下内容,它解码数字实体,但不解码字符实体。

https://example.com/

我没有找到有关 处理的格式的良好文档recode,有没有办法让它进行第二遍解码字符实体,或者是否有更好的 cli 工具可以用来解码它?

相关内容