在 Windows 中,我该如何解析一个充满 HTML 文件的文件夹并提取特定标签对之间的所有字符串?
理想情况下,所有这些都会放入一个 CSV 文件中,其中一个字段用于文件名,第二个字段用于每个字符串(例如,H2 标签内的所有内容),每个文件有一个或多个记录。
在 Windows 中,我该如何解析一个充满 HTML 文件的文件夹并提取特定标签对之间的所有字符串?
理想情况下,所有这些都会放入一个 CSV 文件中,其中一个字段用于文件名,第二个字段用于每个字符串(例如,H2 标签内的所有内容),每个文件有一个或多个记录。