具有特定模式的 Httrack 过滤链接

Question

您已经非常接近了 - 您只需要将域名添加到您的扫描规则中，如下所示：

httrack http://web.archive.org/web/20011209181356/http://www.emag.ro:80/ -* +web.archive.org/web/20011209181356/http://www.emag.ro/*

或者，要获取该域的所有存档版本，您可以使用：

httrack http://web.archive.org/web/20011209181356/http://www.emag.ro:80/ -* +web.archive.org/web/*/http://www.emag.ro/*

但随后您将需要使用这些命令行选项（或在“仅限专家”下的 GUI 中设置这些选项）来启用整个域的遍历

乙... 可以在目录结构中上下移动
d...但保持在同一个主域上

请参见下面的截图。这是您想要实现的吗？

Answer 1

您已经非常接近了 - 您只需要将域名添加到您的扫描规则中，如下所示：

httrack http://web.archive.org/web/20011209181356/http://www.emag.ro:80/ -* +web.archive.org/web/20011209181356/http://www.emag.ro/*

或者，要获取该域的所有存档版本，您可以使用：

httrack http://web.archive.org/web/20011209181356/http://www.emag.ro:80/ -* +web.archive.org/web/*/http://www.emag.ro/*

但随后您将需要使用这些命令行选项（或在“仅限专家”下的 GUI 中设置这些选项）来启用整个域的遍历

乙... 可以在目录结构中上下移动
d...但保持在同一个主域上

请参见下面的截图。这是您想要实现的吗？

相关内容