我是工程学院的初级系统管理员。其中一位教授从雅虎获得了 45 台服务器(Dell Poweredge 1690)的捐赠。以下是他的要求:
Linux 上的 Hadoop(mapreduce)(Linux 和 Hadoop 的哪种版本?)
hadoop 上的 pig
Windows 上的 Dryad
Linux 上的 MPI
可能是其他软件,比如云计算
我想使用 VMware 创建一个集群,以便能够最佳地利用硬件。我对虚拟化非常陌生。有人能建议我怎么做吗?我真的很期待参与这个项目,因为它会给我带来很好的体验和一些实践经验。
这将是许多学生同时登录的实验室。我计划使用 LDAP 身份验证,通过我们的 Active Directory 对学生进行身份验证。
那么我该怎么做呢?在这种情况下什么策略是最好的?任何意见都值得赞赏。谢谢。
答案1
听起来你还有一大堆知识要攀登,我怀疑如果你不先花一年左右的时间学习所有的技术,你是否能够充分地设计出你想要的东西。
话虽如此,我还是会忘记使用像 Hadoop 这样花哨的东西。您没有提到您有什么样的存储,但我会尝试将某种 SAN 组合在一起,可能由 FreeNAS 提供支持,提供 iSCSI 目标。Hyper-V Server 是免费的,能够形成多达 16 个节点的集群。SCVMM 相当便宜,有教育折扣,并且能够提供带有 AD Auth 的自助服务门户,允许学生或研究人员访问集群、部署预配置的 VM 或配置自己的 VM(许多配置选项)。可以根据您的需求添加其他技术,使其或多或少复杂(这是您将接触“云”的地方 [我讨厌这个营销术语,但它显然是您所知道的] 技术,可实现高可用性、动态负载平衡、工作负载分散、主动管理等)。
VMWare 的产品可以提供许多相同的功能,但我对他们的产品线不太熟悉,所以我无法说它是否会更便宜。
不幸的是,您的问题对于您希望实现的目标非常模糊。本网站有大量系统管理员,我们知道,一套良好的需求是项目成功的关键。将一堆技术投入到项目中并希望它们能够协同工作,这只会酿成灾难。我们很乐意与您合作,但在开始项目之前,您确实需要一套良好的所需结果。