从本地 PHP 论坛页面构建站点地图

从本地 PHP 论坛页面构建站点地图

我已经阅读 stackexchange 多年了,并且总是设法找到我必须处理的问题的答案。然而这一次,我要问一个问题,因为我找不到解决我现在面临的问题的方法。

我目前正在开展一个研究项目,需要为网站创建站点地图。我有超过 10GB 的 php 文件,是从在线论坛(现已失效)下载的。这些文件都在一个文件夹中,因此我无法根据文件夹重建原始结构。

我想知道是否有一个工具/脚本(我并不关心它所用的语言)来分析 php 文件并输出某种站点地图/结构(XML、HTML 或其他)

这些文件是用 phpBB 创建的;我正在使用 Debian 和 Ubuntu(两台不同的 PC)。欢迎任何建议。提前谢谢了

答案1

软件包:网络检查

Description-en: 网站链接和结构检查器

webcheck是一款为网站管理员提供的网站检查工具。它抓取给定的网站并生成许多 html 页面形式的报告。它易于使用并生成简单、清晰和可读的报告。

Features of webcheck include:
 * support for http, https, ftp and file schemes
 * view the structure of a site
 * track down broken links
 * find potentially outdated and new pages
 * list links pointing to external sites
 * can run without user intervention

主页:http://arthurdejong.org/webcheck/

它生成的报告之一是站点地图。

相关内容