模块11:数据湖安全与权限管理

Introduction

安全的多租户环境始终是组织在云上构建分析应用程序的首要任务之一。 Amazon EMR提供了一套全面的功能来构建高度安全的多租户Hadoop集群资源和数据。在本讲习班中,您将学习如何使用IAM角色和策略,Kerberos,加密(静态和传输中)和Apache Ranger保护Amazon EMR集群,从而为在Amazon EMR上运行的常见服务提供细粒度的访问控制和审计。 该研讨会将引导您实践以下概念:

Part 1

  • 使用FreeIPA服务器托管域以及该实验的用户,组
  • 创建安全配置以关联到Amazon EMR集群
  • 使用安全配置启动以Kerberos方式运行的Amazon EMR集群
  • 使用EMRFS对Amazon S3中的数据集实施基于存储的授权

Part 2

  • 将Apache Ranger Server启动为边缘节点,以对Amazon EMR上运行的应用程序实施细粒度的授权和审核

Starting the lab

对于本研讨会,我们将使用CloudFormation设置和创建研讨会实验室所需的资源。 先决条件

重要信息:在启动CloudFormation堆栈之前,需要为EMR群集创建默认的IAM角色。 步骤1)为EMR创建默认的IAM角色 要在您的账户中创建默认的EMR IAM角色,请运行以下AWS CLI命令:

aws emr create-default-roles –region us-west-2

有关为EMR创建默认IAM角色的更多信息,请参见以下链接: https://docs.aws.amazon.com/cli/latest/reference/emr/create-default-roles.html

步骤2)确保您在us-west-2(Oregon)区域中已有一个EC2密钥对。如果您在俄勒冈州还没有密钥对,请按照EC2密钥对文档在俄勒冈州创建密钥对。

一旦为EMR创建了默认的IAM角色,并且在俄勒冈州拥有一个EC2密钥对(请参阅前面的步骤),就可以启动Workshop CloudFormation堆栈。要启动堆栈,请单击以下链接:

https://console.aws.amazon.com/cloudformation/home?region=us-west-2#/stacks/new?stackName=EMR-Multitenancy-Workshop&templateURL=https://emr-workshops-us-west-2.s3-us-west-2.amazonaws.com/multitenancy-workshop/cloudformation/CrossRealmMaster.template

您上面的链接将您带到us-west-2中的CloudFormation控制台。在那里,单击“下一步”按钮。在“指定详细信息”页面上,在“密钥名称”字段下选择密钥对,然后单击“下一步”(将所有其他设置保留为默认设置),然后按照控制台的说明启动/创建堆栈。

注意:完成堆栈创建大约需要15-20分钟。