从 HTML 文件中提取文本

从 HTML 文件中提取文本

在 Windows 中,我该如何解析一个充满 HTML 文件的文件夹并提取特定标签对之间的所有字符串?

理想情况下,所有这些都会放入一个 CSV 文件中,其中一个字段用于文件名,第二个字段用于每个字符串(例如,H2 标签内的所有内容),每个文件有一个或多个记录。

相关内容