如何使用 WGET 下载所有文件，包括.java 文件。

Question 1

您可以使用--reject或--exclude-directories跳过内容：

wget ... --reject '*backup*' ...
wget ... --exclude-directories '*backup*' ...

Answer

您可以使用--reject或--exclude-directories跳过内容：

wget ... --reject '*backup*' ...
wget ... --exclude-directories '*backup*' ...

Question 2

这完全取决于网站的目录结构。在大多数情况下，除非您要盗版该网站（不要这样做，好吗？），否则您将只能获得服务器上可能存在的任何 Java 代码的编译输出。

您想要镜像整个站点，因此不要-r使用-w：

wget -mpEk --exclude-directories '*backup*' --reject '*backup*' --no-parent --robots=off <FTP USER INFO> <URL>

输入 URL 时，请使用最底层的目录，如果无法使其在下面的public_html级别工作，请尝试删除--no-parent，具体取决于您的 .htaccess 的设置方式和目录结构，可能是您的文件不在您要抓取的内容之内，在这种情况下，由于您有 FTP 凭据，也许使用命令sftp会更符合您的要求。

Answer

这完全取决于网站的目录结构。在大多数情况下，除非您要盗版该网站（不要这样做，好吗？），否则您将只能获得服务器上可能存在的任何 Java 代码的编译输出。

您想要镜像整个站点，因此不要-r使用-w：

wget -mpEk --exclude-directories '*backup*' --reject '*backup*' --no-parent --robots=off <FTP USER INFO> <URL>

输入 URL 时，请使用最底层的目录，如果无法使其在下面的public_html级别工作，请尝试删除--no-parent，具体取决于您的 .htaccess 的设置方式和目录结构，可能是您的文件不在您要抓取的内容之内，在这种情况下，由于您有 FTP 凭据，也许使用命令sftp会更符合您的要求。

如何使用 WGET 下载所有文件，包括.java 文件。

答案1

答案2

相关内容