这是我到目前为止所拥有的:
- 当网络浏览器运行时启动
- 下载当前网页的所有内容并扫描“感兴趣的内容”
- 所述“感兴趣的内容”的输出摘要/详细信息
但我只能将此输出放入屏幕上的文件中。这是我完全保留在 cli 中的东西,我相信这可能是我所能接受的。我这里错了吗?
我希望能够与浏览器进行交互,就像扩展/附加组件一样。哪些已知方法或路线可用于对我的项目进行建模?
答案1
我不会为此使用 bash,但某些浏览器的控制可以通过使用(额外的)JavaScript 扩展页面来完成,并且 bash 可以与之通信。
我没有从头开始开发这样的 Web 浏览器驱动程序(并且不想比我已经做过的更深入地研究 JavaScript),而是选择了硒以及一个自定义程序(在我的例子中是 Python),它从预定目录中的文件读取命令。这些命令是文本文件,由其他程序(bash、python,但可以是任何东西)编写,可以安排单个操作和重复操作、后台任务(如果没有计划执行其他操作)。对于新的、不可预见的任务,必须调整自定义程序并重新启动网络浏览器,但在初始开发阶段之后,很少需要此类扩展。