将所有内部服务器迁移至云端

将所有内部服务器迁移至云端

背景

我的一位客户是一家依赖 IT 的、以工作流为导向的律师事务所,拥有约 50 个席位。他们的一位客户(一家受 FSA 监管的抵押贷款机构)对他们进行了审计,并告知他们单一站点对业务连续性构成了威胁。我建议我们将他们的业务分为两部分:

  1. 客户端——电脑、显示器、椅子、桌子、局域网交换机、路由器和防火墙

  2. 服务器端 - 运行 Active Directory、Exchange、SQL、SharePoint 和其他业务线应用程序的虚拟机、“机器人”工作机和远程桌面服务(总共约 14 台虚拟机)

我们的想法是,可以存储设备并做出安排,以便在备用位置快速重现至少一个容量减少的客户端环境,甚至可以让用户在需要时从家里进行连接。

服务器端代表着更大的挑战,因为它包括从他们的 IP 连接(目前是 ADSL,很快会是 100 Mbps 光纤)发布的服务和大约 3TB 的数据,不包括备份。我建议我们将整个服务器端环境从他们目前自托管的现场服务器机房移到托管设施中。我仍然希望保持相同级别的隐私 - 除了少数已发布的服务外,这些服务必须与互联网隔离,并且最好通过 DMZ 中的 Web 服务器 VM 提供服务。

目前有两个服务器机房,每个机房包含一个复制 SAN 节点和一个 Hyper-V 群集主机。再加上冗余光纤通道和以太网链路,这意味着即使整个服务器机房丢失,系统仍将继续运行。我希望托管服务器端环境能够同样地抵御单个数据中心的丢失。

基本上,我想要从本地自托管中获得的安全性、可用性和控制力,但在云端,地理分布至少有 30 公里。我也不想自己购买套件并安装,也不想担心硬件的使用寿命和更换、备份等。

问题

  1. 我是否应该尝试在数据中心复制 SAN 和 Hyper-V 群集,或者大型托管商和云提供商是否有其他方法来确保可用性?

  2. 看起来 Amazon AWS 拥有所有必要的功能(EC2、EBS、S3、VPC、VPN 等),但只有一个欧盟数据中心。我能期待什么样的可用性?例如,如果他们的爱尔兰数据中心发生重大中断(例如,想象一下飞机降落在那里),托管在那里的服务会发生什么?一般的可靠性问题又如何呢?

  3. 可以使用 Windows Azure、Rackspace Cloud 或任何其他云服务提供商来完成此操作吗?

感谢您考虑我的问题。

答案1

我建议将您的主要操作保留在内部,并将您的服务器和数据复制在外部作为备份。

EC2 在这方面非常出色。为您需要的每台服务器构建机器映像,并将您的数据与它们分开。每当您在内部机器上修补软件时,请安排在您的 EC2 机器上制作相应的补丁。这将使您的备份资源成本保持在较低水平,因为您大多数时间都不需要机器运行,因此您只需支付存储费用,而不是机器成本。

还要通过网络推送数据。初始迁移将花费超过 3 天的时间,但增量迁移应该会顺利得多。

通过将 EC2 作为备份,您可以避免/最小化硬件成本,避免在日常业务中依赖远程站点和互联网连接,并为自己提供在中断时快速启动服务的能力。

直接问答

我是否应该尝试在数据中心复制 SAN 和 Hyper-V 群集,或者大型托管商和云提供商是否有其他方法来确保可用性?

他们有自己的方法来确保可靠性。您可以支付更高可用性 SLA 的服务费用。无论如何都要有备份。

看起来 Amazon AWS 拥有所有必要的功能(EC2、EBS、S3、VPC、VPN 等),但只有一个欧盟数据中心。我能期待什么样的可用性?例如,如果他们的爱尔兰数据中心发生重大中断(例如,想象一下飞机降落在那里),托管在那里的服务会发生什么?一般的可靠性问题又如何呢?

如果出现问题,那就会出现问题。如果您仅依赖它们,请复制到其他数据中心。就我个人而言,我建议仅将它们用作备份,我不会太担心。如果欧盟出现问题,以至于您的公司和 EC2 EU 离线,那么生活就会发生。对于一家拥有 50 名员工的公司,我不会将这种风险考虑在超过 2 个远程站点(您的办公室和一个 EC2 数据中心)上。

可以使用 Windows Azure、Rackspace Cloud 或任何其他云服务提供商来完成此操作吗?

可能吧,但我只熟悉亚马逊的服务。

答案2

迁移到云并不只是将所有服务器迁移到其他地方。您的基础设施必须能够在云中运行。否则,您将无法获得与您自己的服务器机房相媲美的弹性。它们是完全不同的环境。

阅读有关 Chaos Monkey 的文章Netflix以及来自编码恐怖

答案3

我的一位客户是一家依赖 IT 的、以工作流为导向的律师事务所,拥有约 50 个席位。他们的一位客户(一家受 FSA 监管的抵押贷款机构)对他们进行了审计,并告知他们单一站点对业务连续性构成了威胁。我建议我们将他们的业务分为两部分:

通过拥有一个具有基础架构副本和可接受的 RPO/RTO 的 DR 站点,在某些情况下,授予其运营级别和服务概述的 DR 站点可能更适合 PROD,并完全利用其数据中心 + 基础架构来实现 prod/dr 场景。

  1. 客户端——电脑、显示器、椅子、桌子、局域网交换机、路由器和防火墙

  2. 服务器端 - 运行 Active Directory、Exchange、SQL、SharePoint 和其他业务线应用程序的虚拟机、“机器人”工作机和远程桌面服务(总共约 14 台虚拟机)

扩展活动目录站点,可以做到

我们的想法是,可以存储设备并做出安排,以便在备用位置快速重现至少一个容量减少的客户端环境,甚至可以让用户在需要时从家里进行连接。

瘦客户端、采用 Citrix 服务器托管模型是推荐的最佳实践。

服务器端代表着更大的挑战,因为它包括从他们的 IP 连接(目前是 ADSL,很快会是 100 Mbps 光纤)发布的服务和大约 3TB 的数据,不包括备份。我建议我们将整个服务器端环境从他们目前自托管的现场服务器机房移到托管设施中。我仍然希望保持相同级别的隐私 - 除了少数已发布的服务外,这些服务必须与互联网隔离,并且最好通过 DMZ 中的 Web 服务器 VM 提供服务。

MPLS 连接到提供商和多个区域 +dmz,并满足隐私、安全和审计的要求。验证提供以提供安全港、saas70(现为 ssae16)、pci。

目前有两个服务器机房,每个机房包含一个复制 SAN 节点和一个 Hyper-V 群集主机。再加上冗余光纤通道和以太网链路,这意味着即使整个服务器机房丢失,系统仍将继续运行。我希望托管服务器端环境能够同样地抵御单个数据中心的丢失。

可以做什么,取决于因素、数据库架构、许可版本(标准/企业)所需的 rpo/rto 和对数据流的更多洞察。

基本上,我想要从本地自托管中获得的安全性、可用性和控制力,但在云端,地理分布至少有 30 公里。我也不想自己购买套件并安装,也不想担心硬件的使用寿命和更换、备份等。

对于安全高级变更控制、日志管理、入侵检测……时区相隔 6 小时的数据中心之间的典型响应时间应小于 70 毫秒

问题

  1. 我是否应该尝试在数据中心复制 SAN 和 Hyper-V 群集,或者大型托管商和云提供商是否有其他方法来确保可用性?

不建议在设施上进行块级复制,这可能会变得昂贵,应用程序/数据库软件堆栈上有许多其他选项可以处理这个问题。

  1. 看起来 Amazon AWS 拥有所有必要的功能(EC2、EBS、S3、VPC、VPN 等),但只有一个欧盟数据中心。我能期待什么样的可用性?例如,如果他们的爱尔兰数据中心发生重大中断(例如,想象一下飞机降落在那里),托管在那里的服务会发生什么?一般的可靠性问题又如何呢?

如果您所在的一台主机宕机了,那么您的应用程序也会宕机。还有其他公司也可以提供这项服务,有些公司与亚马逊合作得很好,请参阅 Datapipe。

  1. 可以使用 Windows Azure、Rackspace Cloud 或任何其他云服务提供商来完成此操作吗?

Stratosphere 是一个有趣的方法,你可能想研究一下,如果你想讨论的话可以联系我

感谢您考虑我的问题。

答案4

很抱歉,有点晚了,但 Jeff Ferland 对繁荣的预测是正确的。

您关于飞机降落在爱尔兰数据中心的问题也可以理解为如果飞机降落在您的客户办公室或服务器机房会发生什么。这两种情况都是灾难性的,超出了任何人的控制范围,并将导致您的客户数据丢失。

如果您担心这种事情发生在您的客户身上,您应该采取措施将您的客户转移到场外的本地服务器。

如果您担心保护您的业务,您的客户协议应该有一个条款,保护您免于对您无法控制的事件以及可能在您控制范围内的某些事件承担责任。

相关内容