最强大的开源网络分析工具?

最强大的开源网络分析工具?

需要一些关于选择开源网络分析工具的建议,包括页面标记和日志文件分析类型。我知道其中一些:piwik、open web analytics、awstats 等等... 其中最好的是什么(页面标记类型和日志文件分析类型)?

答案1

在日志文件分析器领域,这些是最广泛使用的:

  • 统计
  • Webalizer
  • 模拟
  • W3Perl

Analog 和 Webalizer 是用 C 编写的,速度更快(每秒 10000-20000 行)。

正如@MadHatter 之前提到的,Analog 是由一位前剑桥统计学家开发的,这使得 Analog 成为一种真正精确和技术性的工具,但自 2005 年以来它不再开发。

Webalizer 不再开发但它比 Analog 更容易使用。

AWStat 和 W3Perl 都是用 Perl 编写的,它们是最活跃的项目,但比 Analog 和 Webalizer(每秒 3000/4500 行)慢得多。它们产生的数据和数据呈现方式各不相同。

AWStat 以一种非常有吸引力的方式显示统计数据,但产生的统计数据比 W3Perl 少。

我建议您通过这些链接获取更多信息:

http://www.aardal.com/stats/docs/uk/speed.html
http://www.w3perl.com/
http://awstats.sourceforge.net/

我的建议是:

  • 如果您需要详细统计数据,并且没有太多 GB 的日志文件,请使用 W3Perl
  • 如果您需要的文件大小不太多并且想要一个漂亮的图形表示,那么 AWSt 就是一个不错的选择。
  • 如果您有大量日志文件需要分析,请使用 Webalizer。
  • 如果您需要真正准确的统计数据、巨大的日志文件,并且您有 C 开发经验(或者您认识任何可以提供帮助的人),可以使用 Analog。

关于页面标记,赢家无疑是 Google Analytics,其收集和生成的数据比其他解决方案要好,但也许有一天 Google 会为此收费……

W3Counter 和 Xiti 是需要您在要监控的每个网页上安装图像的提供商(免费版本)。两者都适用于小型网站。

Open Web Analytics 和 Pikwik 都是很棒的开源解决方案。两者都相当成熟和稳定,但它们需要 MySQL 数据库和 PHP 支持。

如果您不需要“自制”解决方案,我肯定会选择 Google Analytics,而在开源项目中,我会选择 Open Web Analytics,因为它比 Piwik 更成熟。

答案2

我对 piwik 非常满意。我只是怀念根据网站调整小部件的可能性。我用它来检查我的 drupal 网站,而且还有一个适用于 drupal 的模块。

答案3

在我看来,最好的日志分析工具是模拟。它的速度非常快(对每个人来说,DNS 查找的速度都一样慢),由一位前剑桥统计学家编写,并且具有非常有用的页面告诉你 - 以及你的管理层 -不能尽管有奇怪的商业声明,但仍可以从您的网络日志中正确了解。

但我无法对页面标记发表评论;抱歉。

答案4

我想说(虽然作为联合创始人我有偏见 ;-)雪犁是最强大的基于开源标记的网络分析工具。

SnowPlow 具有松散耦合的分布式架构,它使用 Hadoop 和 Hive,因此它可以扩展到数百万甚至数十亿个事件 - 这是 MySQL 或其他基于 RDBMS 的解决方案无法做到的。

SnowPlow 的另一项重大创新是,您的事件数据存储在一个干净、不可变、非规范化、原子的“平面文件”结构中 - 换句话说,就是一个分析数据仓库。这使得使用 Hive 进行大量非常复杂的分析成为可能,并且可以直接与第三方数据(例如 CRM 或销售数据)连接。同样,这比其他解决方案更强大,其他解决方案往往会将原子数据折叠成聚合体、截断旧数据或使用令人费解的规范化结构,这些结构很难直接查询或连接到其他来源。

您可以阅读更多关于SnowPlow 的技术架构如下

相关内容