推荐用于统计的 Linux 发行版?

推荐用于统计的 Linux 发行版?

鉴于,Python和许多其他用于统计的开源库在 Linux 中比 Windows/OSX 有更好的支持(吡咯我想到了),我觉得很奇怪,以前没有人问过这个问题。所以我现在这样做:

进行统计/数据分析/机器学习的 Linux 发行版人员更喜欢/推荐什么?

PS:我觉得问这个问题有点尴尬,因为通过使用 Python 和 R 的内置包管理,理论上我应该不会遇到与基本系统的任何冲突。 :P

答案1

我想你会发现引擎盖下的发行版并不重要。特别是如果您使用 R 和 Python。

通常人们使用以下方式管理自己的 Python 版本虚拟环境或者虚拟环境包装器并将他们想要的各种软件包安装到其中,而不是尝试与发行版的 Python 共存。

大多数编程语言(例如 Perl、Python、Ruby 和 R)现在都提供此管理层。红宝石有rvm, Perl 有perlbrew,并且 R 有租金

此外,他们还提供自己的包管理层来系统地安装各种库和工具,因此发行版对于这些类型的工具来说实际上并不重要。

例子

现在我的笔记本电脑上安装了几个版本的 Ruby:

$ rvm list

rvm rubies

   ruby-1.9.2-head [ x86_64 ]
   jruby-1.5.6 [ amd64-java ]
   ruby-1.9.2-p290 [ x86_64 ]
=> ruby-1.9.2-p180 [ x86_64 ]
   ree-1.8.7-2011.03 [ x86_64 ]

我目前设置为使用 ruby​​-1.9.2-p290:

$ which ruby
~/.rvm/rubies/ruby-1.9.2-p180/bin/ruby

该版本还安装了几个 gem(库):

$ gem list|head -10
abstract (1.0.0)
actionmailer (3.0.10, 3.0.5)
actionpack (3.0.10, 3.0.5)
activemodel (3.0.10, 3.0.5)
activerecord (3.0.10, 3.0.5)
activeresource (3.0.10, 3.0.5)
activesupport (3.0.10, 3.0.5)
akami (1.2.0)
albino (1.3.3)
anemone (0.7.2)

大多数管理层都提供与此相同的功能。例如perlbrew

$ perlbrew list
  local (5.14.0)
* perl-5.14.0

$ which perl
~/apps/perl5/perlbrew/perls/perl-5.14.0/bin/perl

Python 和 R 没有什么不同。以这种方式管理环境的优点是,我的安装全部维护在我的主目录中,因此我可以将它们从一台机器移动到另一台机器,并将它们与我的工作一起保存,而不是浪费时间管理发行版本身的这些资源。

相关内容