如何自动从 URL 不变的网站多个页面抓取数据

如何自动从 URL 不变的网站多个页面抓取数据

我正在尝试通过提取网页上的数据来收集 Excel 表格。地点包含 27 页数据,我想将它们集中到 Excel 中的一个表中。但是,URL 不会随页面变化。我观看了一个 YouTube 视频,该视频使用宏和 VBA 为网站导入此类数据表,该网站的 URL 会随每个选定表而变化。但是,我不确定在这种情况下该怎么做。

当我检查元素时,我发现更改页面是使用此信息完成的:

<input name="TextBoxPageIndex" type="text" value="1" id="TextBoxPageIndex" style="width:35px;">

“值”会随着每个页码而变化。我不太清楚如何将其写入 VBA 模块,因为我对这个东西很陌生。

任何帮助将非常感激!

答案1

您可能能够使用 Selenium IDE 来记录浏览页面和抓取每个页面内容所需的一组示例操作。

http://www.seleniumhq.org/docs/02_selenium_ide.jsp

相关内容