我如何才能检测哪个程序生成了网站的 HTML?

我如何才能检测哪个程序生成了网站的 HTML?

我正在做一些研究,其中涉及比较网站。有些设计很糟糕,出于病态的好奇心,我想知道是什么程序(Word、Dreamweaver 等)生成了它们。有没有可以检测这种情况的工具?谷歌搜索没有找到任何结果。

Word HTML 很容易被检测到,因为它的标记很差,但其他应用程序则更难被检测到。

答案1

一些网页创作程序会插入<meta name="generator" content="...">标签。当然,这样的标签也可以由作者手写,关于这种标签的讨论似乎围绕着如何防止程序发出这种标签的问题(通常有有效的答案)。

有多种方法可以启发式地检测使用了哪些软件。例如,可以通过使用 Word 中的“过滤输出”和后处理来清理 Word HTML,但通常类似症状class=MsoNormal仍然存在。

答案2

线索也可能存在于页面的 URL 中。例如,文件扩展名 .jsp .pl .asp .cfm 表示 Java Server Pages、Perl、.Net 和 ColdFusion 等。这些也经常被删除以简化 URL 并隐藏技术。

相关内容