我有一个网站,页面上有文本输入字段和提交按钮。
我需要在该文本字段中输入 1 到 100 的数字,并在单击提交按钮后保存结果页面。所以我需要下载 100 页。
我会在这些下载的页面中寻找我需要的信息。
我怎样才能做到这一点?
答案1
如果网站使用提交表单数据GET
,则当您单击提交时,您应该在浏览器的地址栏上看到已提交的数据。类似以下内容:
http://www.somesite.com/someform?numbers=1
如果是这种情况,您可以在 for 循环中运行该命令:
修改(根据需要更改路径)并运行此命令:
FOR /L %i IN (1,1,100) DO ("C:\Program Files\GnuWin32\bin\wget.exe" --output-document "C:\Users\SomeUserName\SomeDir\%i.html" http://www.somesite.com/someform?numbers=%i)
解释:
for 循环具有以下格式:(start,step,end)
。因此,上述循环将以 1 为增量遍历从 1 到 100 的所有数字。在每次迭代中,它将变量的值设置%i
为当前数字。
Wget 会从给定的 URL 下载网页。使用上一步中的地址,它会将 中的数字替换numbers=1
为 1 到 100 中的每个数字,下载相应的网页并将其保存为目录中的“number”.html C:\Users\SomeUserName\SomeDir\%i.html
。
如果您需要更多帮助,请发布您将使用的网站表单的 URL。