wget 输出 3 字节引号

wget 输出 3 字节引号

我跑了一个wget -b.从日志中,我试图获取已成功下载的文件列表,为此我做了一个,grep saved wget-log | awk -F '"' '{print $2}'但没有成功。进一步调查让我注意到文件名是用 3 字节的左右双引号 (0xE2 0x80 0x9D) 括起来的,而不是常规的双引号 (0x22)。

这是 wget 的正常行为,还是我这边的一些环境变量,类似的东西?我可以让 wget 使用常规引号,或者在其日志记录中仅使用标准 ASCII 字节吗?我知道其他绕过它的方法,例如用 sed 替换字节。我对此非常感兴趣:我花了几分钟在谷歌上寻找对此的任何评论,但找不到任何东西,就好像以前没有人注意到这一点一样。

答案1

似乎是 Unicode 语言环境中设计的。对此有一条评论wget 的邮件列表。语言翻译文件还包含引号的翻译,因此您可以根据所使用的语言获得“正确的”引号。

您可以通过使用非 Unicode 语言环境使其使用常规引号。

LC_ALL=C wget ...

或者

LC_CTYPE=C wget ...

相关内容