如何提取和之间的所有内容在多个 HTML 文件中

如何提取和之间的所有内容在多个 HTML 文件中

我已经尝试提取这些数据几个小时了,但没有成功。我要么只想从 HTML 中提取所有表格标签并将它们保存到单独的文件中,要么提取这些标签之间的所有内容。我正在尝试使用 Notepad++ 来完成。

我得到了这个来选择它:

<table\b[^>]*>(.*?)</table>$  

但如果我将其添加为书签,它只会添加第一行。另外,我无法同时为太多文件添加书签。

您能给出建议吗?我是否应该下载另一个 reg exp 应用程序?

答案1

抓取工具 Wiki有一个从网站表格中提取数据的工具。

相关内容