我计划制作一个使用 CLI 中的 DOM 结构识别 HTML 的工具。由于现在许多网站都使用 JavaScript 生成许多 DOM 元素,因此从下载的静态 HTML 文件中提取信息变得越来越困难。我还想通过 Linux/bash 等命令行脚本自动分析它们。
现在,我正在寻找一种在 HTML 文件中执行 JavaScript 后检索和操作动态重建的 DOM 结构的方法。 (另请注意,我正在寻找模拟调用单击等事件处理程序的方法。)
有什么工具或方法可以做到这一点吗?
我计划制作一个使用 CLI 中的 DOM 结构识别 HTML 的工具。由于现在许多网站都使用 JavaScript 生成许多 DOM 元素,因此从下载的静态 HTML 文件中提取信息变得越来越困难。我还想通过 Linux/bash 等命令行脚本自动分析它们。
现在,我正在寻找一种在 HTML 文件中执行 JavaScript 后检索和操作动态重建的 DOM 结构的方法。 (另请注意,我正在寻找模拟调用单击等事件处理程序的方法。)
有什么工具或方法可以做到这一点吗?