我通常使用GNU wget以递归方式抓取网站。
但我想获取一些包含大量不同语言的 Unicode URL 的网站,并且想将 Unicode 保留在文件名中。(这是一个例子。)
wget 有命令行开关--local-encoding
,--remote-encoding
但它们似乎不支持 Windows 的本机文件系统编码 UTF-16。我认为这是因为 wget 是为 *nix 设计的,而 *nix 从未将 UTF-16 作为文件名的系统编码,并且 wget 的 Windows 端口不是官方的。
我怎样才能在 Windows 下执行此操作并保持文件使用正确的 Unicode?