开始使用 PDL 进行聚类分析 PDL::Stats::Kmeans

开始使用 PDL 进行聚类分析 PDL::Stats::Kmeans

我想首先要问的问题是“perl 数据语言已经死了吗?”我没有找到任何活跃的讨论或用户问答

抱歉没有更好地标记这个,我没有代表'

我的问题领域是分析电力开关事件并回接无功和电阻负载的读数,旨在指向工厂硬件的特定项目。

所以我想到了聚类分析并转向 PDL

在我写的 perl 脚本中

use PDL::Stats::KMeans;
my $sql = "select resistv_chg,reactv_chg from metered_events where matched_event_id is not null";
my $pdl = rdbi2D( $dbh, $sql );  # pdl info tells me that i have a 2D array of 1400 x 2
my $k = $pdl->kmeans( {} );

在 perldebug 中,执行对 kmeans() 的调用会启动一系列输出,所有这些对我来说都意味着什么都没有,考虑到我的安装,我应该期望大约 10 到 15 个不同的集群 这些天有人对 PDL 有什么想法吗?有没有更好的工具选择

答案1

正如您将看到的文档,默认找到3个簇。如果您正在寻找 10 个集群,则需要

my $k = $pdl->kmeans( {NCLUS => 10} );

有一系列简短的博客文章使用 PDL 进行 k 均值从这里开始

Perl 非常活跃,每个月都会发布新版本的 PDL,但是 上的流量更多堆栈溢出,irc 和邮件列表

相关内容