我最近发现 GNU 重新编码可以用来解码 HTML 实体,但是当我查看一个恶意软件时,我注意到它似乎是混合的 HTML 字符/实体编码,例如这个。我将 URL 从恶意域更改为 example.com:
https://example.com/
当我将其通过管道传输到 时recode html..ascii
,我得到以下内容,它解码数字实体,但不解码字符实体。
https://example.com/
我没有找到有关 处理的格式的良好文档recode
,有没有办法让它进行第二遍解码字符实体,或者是否有更好的 cli 工具可以用来解码它?