我想解决的问题是这样的。我浏览一个包含一个接一个的有序文本块的网站。我想在这个页面上运行一个脚本,该脚本进入网页源,提取这些文本块,然后将每个文本块输出到一个文件中。
我该怎么做这样的事情?我可以从 vimperator shell 执行此操作吗?
(我可以编写文本提取和输出部分,我想用 Python。其他部分目前超出了我的能力范围)
答案1
可以从 Vimperator 写入文件,如下所述这里。另外,从您的描述来看,您实际上并不需要 Python,您可以提取文本并从同一个 JavaScript 文件中写入它。
您可以像这样写入文件:(从 Vimperator 命令行)
:js var f = new io.File('~/extracted.txt'); f.write('extracted text');
要提取文本,您可以使用原生 JavaScript,或者您也可以获取 JQuery 并使用其选择器。我还没有尝试过,但听起来绝对可行。