从本地服务获取网页

从本地服务获取网页

我正在使用 ubuntu 的 google-desktop 服务(已放弃的软件包)。您可以在浏览器中的网页上获取 Google-desktop 搜索结果。我想知道是否有办法使用 wget 命令获取该网页或任何其他方法在终端中获取该页面。

google 桌面搜索的位置栏上显示的 URL 是:

本地主机:33327/搜索?标志=8&hl=en_US&num=10&q=hemingway&start=0&s=JD1G1cWkjb88GSZ1EPB3LVgcSwo

这是我的计算机上显示的搜索查询 hemingway 的示例 URL。

答案1

这是可能的通过 检索页面wget。最简单的方法是复制 Google Desktop 生成的 URL 并将其粘贴到 中wget "URL HERE"

但是,如果您希望从终端完成所有操作而无需先使用 Google Desktop 进行搜索,那么这将取决于 Google Desktop 是否必须在向您提供链接之前生成结果,以及它使用的端口是否保持不变。

如果您可以在 Google Desktop 中搜索“PIE”,然后在打开的网页中修改 URL,使其显示“CAKE”而不是“PIE”,然后返回“CAKE”的结果。如果可行,那么您只需将 URL 复制到终端中并对其进行修改即可获得您想要的结果:

wget "http://localhost:33327/search?flags=8&hl=en_US&num=10&q=SEARCH+REQUEST+HERE&start=0&s=JD1G1cWkjb88GSZ1EPB3LVgcSwo"

这应该可以工作,您可以随意在 Bash 脚本或其他脚本中使用它。

但是,在终端中查看搜索结果又是另一回事。您可以简单地使用终端编辑器nano打开 HTML 文件,但这样您就只能看到原始 HTML 代码,而这并不是查看搜索结果最容易的事情。可以编写一个脚本,将结果抓取为终端中可读的内容,但这需要花费大量精力才能正确调整,并且超出了本问题的范围。如果您想使用 Google 桌面搜索,那么我建议您简单地在浏览器中打开网页,就像它设计的那样。

相关内容