Wget 命令返回网络服务器上所有网页的

Question 1

您无法从客户端执行此操作，但您可以查找站点地图，有时http://www.example.com/robots.txt文件可能包含一个列表。可能有一种方法可以向谷歌索要一份列表，并且在回程机器上可能有最后一个。

Answer

您无法从客户端执行此操作，但您可以查找站点地图，有时http://www.example.com/robots.txt文件可能包含一个列表。可能有一种方法可以向谷歌索要一份列表，并且在回程机器上可能有最后一个。

Question 2

您可以告诉 wget 递归下载整个网站，但它是通过每个页面上的链接来完成的。如果它不知道 page1、page2 和 page3 在那里，它将永远不会检索它们。

坦率地说，幸运的是，HTTP 并不是这样工作的。

Answer

您可以告诉 wget 递归下载整个网站，但它是通过每个页面上的链接来完成的。如果它不知道 page1、page2 和 page3 在那里，它将永远不会检索它们。

坦率地说，幸运的是，HTTP 并不是这样工作的。

Question 3

这不可能。没有 HTTP 请求方法，HTTP 检索请求始终获取特定的 URL 作为参数。

Answer

这不可能。没有 HTTP 请求方法，HTTP 检索请求始终获取特定的 URL 作为参数。

Question 4

正如 Rens 和 franziskus 所说，从 page1 无法做到这一点，唯一的机会取决于您要复制的网站的设置方式。

它不太可能出现在根目录中，但子目录（假设您知道它们存在）可能会以这样的方式配置，即它们为您提供文件列表（某种可视化 ftp）。但您将要利用大多数网站管理员试图向您隐藏的东西：他们网站的内部结构。

我成功地利用了这一点来获取我确信存在但无法通过网站导航找到的信息。它仅适用于极少数网站。

Answer

正如 Rens 和 franziskus 所说，从 page1 无法做到这一点，唯一的机会取决于您要复制的网站的设置方式。

它不太可能出现在根目录中，但子目录（假设您知道它们存在）可能会以这样的方式配置，即它们为您提供文件列表（某种可视化 ftp）。但您将要利用大多数网站管理员试图向您隐藏的东西：他们网站的内部结构。

我成功地利用了这一点来获取我确信存在但无法通过网站导航找到的信息。它仅适用于极少数网站。

相关内容