使用包含 # 的 URL 进行 Wget

使用包含 # 的 URL 进行 Wget

我正在尝试下载网址那就像http://www.somesite.com/restaurants.html#photo=22x00085

我将其放在单引号中,但它只下载http://www.somesite.com/restaurants.html这不是正确的页面。

有解决办法吗?

答案1

wget运行良好。URI 语法指定分段– 该#foo部分 – 完全在客户端进行解释,而不是在检索文档本身时使用。

例如,如果它是一个 HTML 页面,浏览器可能会向下滚动到命名部分,或者 - 在您的情况下 - 触发一些显示特定照片的 JavaScript 代码。

换句话说,就wgetURI 而言

  • http://www.somesite.com/restaurants.html#photo=22x00085
  • http://www.somesite.com/restaurants.html

...指向同一页面 /restaurants.html。剩下的就由您的浏览器来完成了。restaurants.html#photo=22x00085在浏览器中打开应该没问题。

答案2

如果不访问正确的链接,我就无法判断它是哪一个,但只有两个选项:

答案3

这不是图像的 URL。这是使用脚本或其他代码来获取图像的页面的 URL。尝试在关闭 JavaScript 的情况下加载页面。这就是 wget 为您获取的内容。

要查找图片的 URL,请尝试通过浏览器访问该页面,然后右键单击照片。应该有一个选项可以查看有关图片的信息,包括其 URL。

如果不起作用,可能是因为图像是通过 Flash 或其他客户端程序加载的。您可以使用 Fiddler 或 Wireshark 来查看它正在加载的 URL。

如果您向我们提供包含图像的网站的实际 URL,我们可以帮助您确定图像的加载方式。

相关内容