我正在寻找 W3C 日志分析器。我知道有很多,但很难选择一个好的。我想知道是否有人可以提出一些建议?
答案1
答案2
我用
统计。
两者都将分析W3C 扩展日志格式,均已获得GNU 通用公共许可证 (GPL)。两者在显示结果的格式上有差异,如果您为许多网站生成统计数据,则某些用户可能更喜欢其中一种。
我也用过模拟但它对我而言的主要优势是原始速度,而我现在没有足够大的日志文件来使用第三个分析器。
这三者在显示结果的格式和广泛性方面存在差异,如果您为许多网站制作统计数据和图表,某些用户可能会更喜欢其中一种。许多网络托管公司都提供其中几种供客户在线使用。
您使用的平台可能是一个问题。所有这三个(以及更多!)都可以在 GNU/Linux 发行版存储库中找到,例如 Ubuntu 9.04,并且通常在安装后即可运行。您可能需要做更多工作才能让所需的那个在其他平台上运行(例如,我认为 awstats 需要 perl;webalizer 来自作者的 C 源代码或 Linux-x86 或 solaris 可执行文件)。
要在众多可用的分析器中做出选择,您需要确定需要哪些报告、想要哪些报告以及不想要哪些报告,然后将该列表与各种工具提供的报告进行比较。根据自己的需要定制输出可以更轻松地获取所需的信息。您可能需要考虑多次运行数据以提供不同的报告,可能使用不同的工具。例如,快速运行数据以识别意外错误(网站上其他页面引用的缺失文件或图形 (404) 和意外错误代码)对网站管理员很有帮助。数据提供商对这些报告不太感兴趣,但可能想知道哪些页面最受欢迎、使用的搜索字符串以及访问者数量。网络管理员可能想知道平均和峰值总负载以及哪些页面产生的负载最多,以便他们可以询问何时进行了正确的优化。最终,人们开始提出一些问题,但没有任何工具可以很好地回答这些问题,但使用几种不同的分析器的经验可能会将这一天推迟一段时间。
谷歌不分析来自服务器的日志,但与该区域相关,提供网站管理员工具这些信息从 Google 的角度提供有关网站的信息,这些信息是通过网站抓取获得的。除了显示网站在 Google 中针对某些搜索词的排名以及哪些其他网站链接到您的网站之外,它还提供了其他信息,例如 Google 未索引哪些页面(例如由于 robots.txt 限制)以及无法找到哪些页面。在查找网站上的错误和缺失材料时,这些都是服务器上日志文件分析的有用补充。
答案3
微软还发布了一款名为 LogParser 的日志分析器。还有一个 LogParser Studio 可让您针对日志运行查询。以下是一些解释这些工具及其用法的链接。