适用于 Windows 的命令行 HTTP 爬虫? 2024-6-12 • windows command-line website web-crawler 可能重复: 如何下载整个网站 有人能推荐一个可以从命令行调用并配备设置的网站爬虫吗? 这需要在 Windows 环境中运行。 保存数据、跟踪样式表链接等都不是问题。我只需要爬虫程序从某个页面开始,解析它,然后跟踪同一域上的所有链接,这样最终网站上的所有页面都已被请求一次。 背景:我正在建立一个网站,该网站经常从办公室上传。该网站结合了来自各种来源的数据,具有多个级别的缓存。我不希望新上传后第一个访问该网站的用户必须等到页面生成并保存在缓存中。 答案1 wget --mirror 相关内容 编辑 Ubuntu 14.04 上的有线连接不断断开 当我输入此查找命令时,终端仅显示>符号[重复] 如何设置包含另一个变量的 bash 变量? [复制] 如何使用 wrapfigure 环境换行文本和表格 如何为文档/用户设置单独的驱动器? lua-visual-debug 软件包似乎在 MacTeX 2016 上损坏 [关闭] Linux 内核更新卡住了 Dovecot 删除所有标记为已删除的电子邮件,无论其位于哪个文件夹中 使用 phc2sys 进行 ptp 从时钟与远程主时钟同步时出错