我有自己的服务器(具有根访问权限)。
我需要访问我的网站等的用户的统计数据......
我看过一款名为 Webalyzer 的应用程序...这是一个好的选择吗?
我在 Ubuntu 9 系统上运行 apache2......
如果您知道任何适用于服务器的优质统计应用程序,请告诉我。
还有一个后续问题:所有统计数据都保存在日志文件中,对吗?那么这些日志文件会变得多大?如果可以将它们拆分就好了,但不知道 Webalyzer 是否可以做到这一点……
答案1
Webalizer非常擅长从 Apache 日志中挖掘统计数据 - 谁访问了网站、来自哪个 IP 地址、这些 IP 反向解析到的域名类型(.com、.net、.co.uk、.ru 等)、他们的浏览器声明是什么(通常但并非总是如此)、用户使用的操作系统是什么(同样,前提是浏览器如实报告)等等。它完全不具侵入性;您的网页上没有任何特殊内容,每次加载页面时都不会向外部服务器发出额外请求,等等。
谷歌分析另一方面, 是在客户端级别工作的。您网站上的每个页面都会通过脚本标记调用 Google Analytics,以便他们可以为您捕获这些信息(以及许多其他信息)。使用起来非常简单,但每次加载页面时都会向其服务器发出额外请求。另外,请注意,一些广告拦截器也会阻止 Google Analytics;GA 需要 Javascript,有些人(虽然不是很多)可能已将其关闭。
这两个是最大的,每个都有不同的方法。Webalizer 完全本地化(因此是私有的)和非侵入性可能很有吸引力;GA 的范围和分析功能可能很有吸引力。
答案2
要处理大型日志文件,您可能需要研究日志轮换器:http://www.cyberciti.biz/faq/how-do-i-rotate-log-files/
答案3
有一款基于 PHP 的本地开源 Google Analytics 替代品,名为皮维克尽管仍处于大力开发之中,但已经值得仔细研究。
答案4
Analog 已针对 Ubuntu 进行了预打包。它易于安装,只需极少的安装即可运行良好。Report magic 可用于改进输出格式。
统计信息的数据位于 /var/log/apache 中。它们由 logrotate 自动为您旋转和压缩。文件的大小取决于查询数量、日志格式和您网站上的 URL 大小。除非您的服务器非常繁忙,否则它们不应该太大。
awstats 也适用于 Ubuntu,但设置起来不那么容易。它确实在自己的日志文件中保留了统计数据。我声称能够跟踪访问。