在 Windows 上递归下载网站并保留 Unicode 文件名

在 Windows 上递归下载网站并保留 Unicode 文件名

我通常使用GNU wget以递归方式抓取网站。

但我想获取一些包含大量不同语言的 Unicode URL 的网站,并且想将 Unicode 保留在文件名中。(这是一个例子。

wget 有命令行开关--local-encoding--remote-encoding但它们似乎不支持 Windows 的本机文件系统编码 UTF-16。我认为这是因为 wget 是为 *nix 设计的,而 *nix 从未将 UTF-16 作为文件名的系统编码,并且 wget 的 Windows 端口不是官方的。

我怎样才能在 Windows 下执行此操作并保持文件使用正确的 Unicode?

相关内容