我已经阅读 stackexchange 多年了,并且总是设法找到我必须处理的问题的答案。然而这一次,我要问一个问题,因为我找不到解决我现在面临的问题的方法。
我目前正在开展一个研究项目,需要为网站创建站点地图。我有超过 10GB 的 php 文件,是从在线论坛(现已失效)下载的。这些文件都在一个文件夹中,因此我无法根据文件夹重建原始结构。
我想知道是否有一个工具/脚本(我并不关心它所用的语言)来分析 php 文件并输出某种站点地图/结构(XML、HTML 或其他)
这些文件是用 phpBB 创建的;我正在使用 Debian 和 Ubuntu(两台不同的 PC)。欢迎任何建议。提前谢谢了
答案1
软件包:网络检查
Description-en: 网站链接和结构检查器
webcheck是一款为网站管理员提供的网站检查工具。它抓取给定的网站并生成许多 html 页面形式的报告。它易于使用并生成简单、清晰和可读的报告。
Features of webcheck include: * support for http, https, ftp and file schemes * view the structure of a site * track down broken links * find potentially outdated and new pages * list links pointing to external sites * can run without user intervention
它生成的报告之一是站点地图。