答案1
该网站大量使用 javascript (jQuery)。
我建议首先执行以下操作:
- 安装 Firefox
- 安装篡改数据添加在
- 加载网站,开始篡改
- 使用查询工具并查看自动生成的 XMLHttpRequests(参见篡改数据日志)
也许这已经足以识别相关请求及其创建方式。如果这不起作用,您将不得不阅读 javascript 源代码。
由于所有请求很可能只是HTTP 获取和HTTP POST带有特定参数的请求,您可以开始使用诸如 之类的工具进行自动化curl
。此外,scrapy
确实看起来很有希望,似乎带来了很多不错的功能(虽然我自己没有测试过)。
除了使用带有 Temper Data 插件的 Firefox,您还可以使用任何其他浏览器来捕获 HTTP 流量,例如wireshark。