Amazon Redshift Spectrum 允许您直接针对存储在 Amazon S3 中的数据运行查询。这似乎也是新 Amazon S3 Select 服务的目的。这两项服务之间的主要区别是什么?为什么我应该选择其中一种而不是另一种?
答案1
S3 Select 专注于使用 SQL 从 S3 检索数据:
S3 Select 允许应用程序使用简单的 SQL 表达式从对象中检索数据子集。通过使用 S3 Select 仅检索应用程序所需的数据,您可以实现显著的性能提升 – 在许多情况下,与传统的 S3 检索相比,您可以获得高达 400% 的改进。
Redshift Spectrum 支持直接从 AWS Redshift 集群查询 S3 数据:
Amazon Redshift Spectrum 可让您针对 Amazon S3 中的 EB 级数据运行 Amazon Redshift SQL 查询。借助 Redshift Spectrum,您可以将 Amazon Redshift 的分析能力扩展到数据仓库中本地磁盘上存储的数据之外,从而查询 Amazon S3“数据湖”中的大量非结构化数据
Athena 专注于从 S3 提取、转换和加载 (ETL) 数据,并与 AWS Glue 良好集成:
Athena 使用起来很简单。只需指向 Amazon S3 中的数据,定义架构,然后使用标准 SQL 开始查询即可。大多数结果可在几秒钟内提供。使用 Athena,无需进行复杂的 ETL 作业来准备数据以供分析。这使得任何具有 SQL 技能的人都可以轻松快速地分析大规模数据集。