httrack

想要打印出我整个网站的 HTML/CSS
httrack

想要打印出我整个网站的 HTML/CSS

我最近将一个网站从一家托管公司迁移到另一家,同时更改了域名(他们全都做了)。网站已启动并运行,但有很多坏链接 - 我现在只能自己处理,想打印出所有 HTML/CSS 并搜索旧链接,以便更改它们。我查看了 HTTRACK,无法让它执行此操作。非常感谢大家对其他选项的想法。谢谢! ...

Admin

使用 HTTrack 下载 PHP 网站上的特定目录
httrack

使用 HTTrack 下载 PHP 网站上的特定目录

我需要从以下位置复制 PHP/HTML 文件: https://example.com/file.php?page=1 https://example.com/file.php?page=2 https://example.com/file.php?page=3 https://example.com/file.php?page=4 … 我在 HTTrack 中使用了这个。但它没有下载任何文件: -* +https://example.com/file.php?page=* -mime:*/* +mime:text/html 你能给出一个正确的方...

Admin

是否可以使用 httrack 为目标文件夹添加时间戳?
httrack

是否可以使用 httrack 为目标文件夹添加时间戳?

我正在使用 httrack 通过命令行备份我的网站: httrack https://www.example.com -O "websites/example.com" -%v 是否可以向目标文件夹添加时间戳以获取如下目标文件夹: websites/example.com-2019-07-18 ...

Admin

如何使用 httrack 下载网站的部分内容(包括资产)?
httrack

如何使用 httrack 下载网站的部分内容(包括资产)?

我想下载http://www.example.com/foobar从那里链接的每个 HTML 页面,其中 URL 以 开头http://www.example.com/foobar。我还想下载链接的每个非 HTML 资产,无论其路径如何。我试过: httrack http://www.example.com/foobar -mime:text/html +http://www.example.com/foobar* 并补充道: +http://www.example.com/foobar +http://www.example.com/foobar/...

Admin

HTTRACK 正在部分下载
httrack

HTTRACK 正在部分下载

我们正在HTTRACK下载整个网站以供离线查看。 问题是,即使使用 4 级 ( -r4) 下载整个网站,一些链接仍然无法工作。 例如如果你使用 httrack 来捕获网站: http://advaitasharada.sringeri.net/display/bhashya/Gita 它只截取了其中的一部分,但右侧保留了链接。其他链接包含《薄伽梵歌》的其他章节,标有 #fragments。 http://advaitasharada.sringeri.net/display/bhashya/Gita#BG_C02(该链接仅在浏览器点击时有效) ...

Admin

Httrack 和 cookies,我的文件看起来像是没有记录
httrack

Httrack 和 cookies,我的文件看起来像是没有记录

我想要下载网页中课程的所有视频和图像.. 我在用追踪命令行..我已经使用扩展 chrome 下载了我的 cookies... cookies.txt我已经在项目文件夹中设置了... 在我的 cookie 中,我以高级会员身份登录网页 但当我用我的 httrack 扫描时,它没有访问高级部分和索引.html看起来普通用户,未登录 这是我使用的命令 httrack https://www.MYWEB.com/courses/take/Courses/ -O /root/websites/proyectXDD -p3 -B -d -b0 我该怎...

Admin

如何下载需要登录的网站的内容?
httrack

如何下载需要登录的网站的内容?

我尝试使用 Httrack 和 Sitesucker 下载需要登录的网站的内容,但它下载的网页都是类似登录表单、注册和 seekpasswords.html 的内容,没有实际内容。该网站非常类似于 treehouse 或 Udemy,我已购买了课程,但课程将于下个月到期,所以我希望看看我是否可以在内容消失之前保存它(这是否违法?我不知道)。 不过 Httrack 和 Sitesucker 都没有询问我的登录信息。因此,我该如何下载内容,或者说这根本就不可能? 谢谢! ...

Admin

恢复 HTTrack 镜像会话并接受更多 URL
httrack

恢复 HTTrack 镜像会话并接受更多 URL

我正在使用 HTTrack(Mac OS X 终端上的命令行版本)镜像一个网站,镜像突然停止了: PANIC! : Too many URLs : >99999 [3031]f5641dz61e6fd4 (36896 bytes) - OK Done. Thanks for using HTTrack! 进而 * My-Names-iMac:~ username$ (我镜像的网站有大约 150,000 个页面)。我的问题与这个虽然作为命令行工具的初学者,我不确定我是否理解我应该输入什么以及按照什么顺序输入才能从开始的地方恢复中断的下载,...

Admin

如何从在线博客创建电子书
httrack

如何从在线博客创建电子书

我想创建一本在线博客的电子书,以便方便地离线阅读所有帖子。 怎么做呢?我应该从哪里开始呢?也许可以使用 HTTrack 进行下载?以及如何将 html 转换为电子书? ...

Admin

如何下载网站目录中所有编号为(1;2;...;97)的文件
httrack

如何下载网站目录中所有编号为(1;2;...;97)的文件

我一直尝试使用 wget 和 WinTTrack 下载网站上的所有 .png 文件,但似乎找不到方法。更糟糕的是,我知道目录中的所有图片都是从 1.png 到 97.png 编号的... 有什么办法吗?我将不胜感激 ^_^ ...

Admin

克隆基于 GET 请求的网站
httrack

克隆基于 GET 请求的网站

我正在尝试创建一个网站的静态克隆,因为它运行在一些古老的 CMS 上,而它随时都会崩溃。 我尝试过使用httrack和wget,但都不起作用。 问题在于,该网站使用的链接系统与 WordPress 默认使用的类似:单个文件,使用 GET 请求来提供适当的内容(example.com/index.php?name=News)。 HTTrack 只是假设它们是同一个文件并立即停止。Wget 会下载所有内容,但不会替换链接(也不可能提供带有问号的文件)。 是否有支持这种链接模式的工具? ...

Admin

httrack 获取 tumblr 照片帖但没有获取照片集;为什么?
httrack

httrack 获取 tumblr 照片帖但没有获取照片集;为什么?

我正在尝试保存 tumblr 图片帖子。 对于只有一张图片的帖子,像这样 http://textsfromthepurikyua.tumblr.com/post/124075150094/textsfromthepurikyua-image-cure-heart httrack -n 获取该图像。(我通常会设置一系列排除项来删除大量无关文件,但这并不重要。) 对于包含多张图片的帖子,例如 http://textsfromthepurikyua.tumblr.com/post/124494287912/textsfromthepurikyua-photos...

Admin

HTTrack 可以下载子目录吗?
httrack

HTTrack 可以下载子目录吗?

我在网上找到了一款非常有用的工具 HTTrack,我想知道我是否可以下载子目录,而不是整个网站。例如,我不会下载 www.example.com 及其所有子目录,而是下载 www.example.com/sub/directory 及其所有子目录。 ...

Admin

无法使用 WinHTTrack 复制/镜像网站页面
httrack

无法使用 WinHTTrack 复制/镜像网站页面

我在用追踪复制/镜像网站并面临一个问题。 我正在谈论这网站。考虑一下我想涵盖这包含所有内部链接的页面(您可以从该页面看到类似问题 6.11、问题 6.10)。因此,我尝试了以下操作: 输入项目名称和URL: 设置选项可以上下移动 然后我开始镜像,过程完成了,但是当我浏览 index.html 时,主页显示正确,但是进一步的链接(如前所述,问题 6.11、6.10 等的 sab 页面)没有显示 - 只显示文件名提要。(自己尝试一下看看出了什么问题) 我该如何解决这个问题? ...

Admin

如何使用 HTTrack 从带有重音字符的 URL 下载 gzip 压缩文件?
httrack

如何使用 HTTrack 从带有重音字符的 URL 下载 gzip 压缩文件?

我正在使用 HTTrack 下载一个网站,但结果参差不齐。多个目录返回了同一 HTML 文件的 2 个或更多版本。任何给定目录中的这些重复项可能包括: 一个名为 índice.html(注意重音符号 í)的文件在浏览器中显示为乱码。仔细研究后发现,这是一个扩展名不正确的 .z 存档,其中包含正确的 HTML 文件 一个名为 índice.html.z 的文件,它是一个包含该文件可读版本的档案 一个名为 índice-2.html 的文件,它是原始 índice.html 的良好版本,在浏览器中完全可读 一个名为 índice-2.html.z 的文件,它...

Admin