Amazon Athena是一种交互式查询服务,可使用标准SQL轻松分析Amazon S3中的数据。 Athena是无服务器的,因此无需管理任何基础结构,您只需为运行的查询付费。雅典娜易于使用。只需指向Amazon S3中的数据,定义架构,然后开始使用标准SQL进行查询。大多数结果将在几秒钟内交付。使用Athena,不需要复杂的ETL作业即可准备数据进行分析。这使具有SQL技能的任何人都可以轻松地快速分析大规模数据集。 Athena与AWS Glue数据目录是现成的集成,可让您跨各种服务创建统一的元数据存储库,对数据源进行爬网以发现模式,并使用新的和修改后的表和分区定义填充目录,并维护模式版本控制。
无服务器,无ETL Athena是无服务器的。您可以快速查询数据,而无需设置和管理任何服务器或数据仓库。只需指向Amazon S3中的数据,定义架构,然后使用内置查询编辑器开始查询。 Amazon Athena允许您利用S3中的所有数据,而无需设置复杂的过程来提取,转换和加载数据(ETL)。
只为扫描的数据付费 使用Amazon Athena,您只需为运行的查询付费。您需要为查询扫描的每TB数据支付5美元。您可以将每次查询的成本节省30%到90%,并且可以通过将数据压缩,分区并将其转换为列格式来获得更好的性能。雅典娜直接在Amazon S3中查询数据。除了S3,没有其他存储费用
基于Presto构建,运行标准SQL Amazon Athena将Presto与ANSI SQL支持一起使用,并可以使用多种标准数据格式,包括CSV,JSON,ORC,Avro和Parquet。 Athena是快速,即席查询的理想选择,但它也可以处理复杂的分析,包括大型联接,窗口函数和数组。 Amazon Athena的可用性很高;并使用跨多个设施和每个设施中多个设备的计算资源执行查询。 Amazon Athena使用Amazon S3作为其基础数据存储,从而使您的数据具有高可用性和持久性。
甚至对于大型数据集也具有交互性能 使用Amazon Athena,您不必担心拥有足够的计算资源来获得快速的交互式查询性能。 Amazon Athena会自动并行执行查询,因此大多数结果会在几秒钟内返回。