我有一个客户正在向 Glacier 上传多个 TB 的数据。他们使用 Snowball 获得了 65 TB 的数据,他们将通过上传处理剩余的约 25 TB。目前他们使用 FastGlacier 直接上传到 Glacier,但该工具在他们唯一的 Windows 机器(一个满是 Mac 的商店)上运行,并且由于排队太多数据而不断崩溃。此外,该程序在搜索/浏览商店方面还有很多不足之处,因为为了查看 Glacier 中的文件,您需要下载清单(需要 4-6 小时的准备时间)。
为了保持一致性,我们希望上传到用于 Snowball 的 S3 共享,并使用生命周期管理规则以相同的 0 天过渡到 Glacier,但不想为此花费大量的 S3 成本。我知道 S3 成本是基于一个月的平均使用量,但不确定如何估算。
答案1
AWS存储服务概述 白皮书(两个链接)说“您可以指定一个绝对或相对的时间段(包括 0 天),在此之后指定的 Amazon S3 对象应转换到 Amazon Glacier”。
S3 生命周期规则假设您无法在上传后 30 天内将 S3 数据转换为不频繁访问存储类别。但是您可以立即转换到 glacier - “0 天”似乎是一个有效的设置。
我自己尝试过。我创建了一个新存储桶,并设置了生命周期规则,在 0 天后转换为 glacier。我使用 S3 标准类上传了一个小文件。文件上传后 5 到 8 小时内更改为 glacier 存储类。我无法更准确地说,因为我没有看到有关此问题的任何日志,而且我只是偶尔检查一下。
您可以考虑使用存储网关,但这依赖于在本地运行虚拟机。它将数据存储在 S3 中,因此您必须使用生命周期规则进行转换。考虑到需要的时间,上传客户端可能更容易。