introdução ao aws data pipeline
DESCRIPTION
Deck de slides do webinar sobre o serviço AWS Data Pipeline, um orquestrador orientado a dadosTRANSCRIPT
Introdução ao AWS Data Pipeline:
ETL na Nuvem da AWS
José Papo
AWS Tech Evangelist
@josepapo
Amazon S3
Amazon
DynamoDB
Amazon
RDS
Amazon
Redshift
On
Premise
HDFS
(Amazon EMR)
Amazon S3
Amazon
DynamoDB
Amazon
RDS
Amazon
Redshift
On
Premise
HDFS
(Amazon EMR)
Amazon S3
Amazon
DynamoDB
Amazon
RDS
Amazon
Redshift
On
Premise
HDFS
(Amazon EMR)
Amazon S3
Amazon
DynamoDB
Amazon
RDS
Amazon
Redshift
On
Premise
HDFS
(Amazon EMR)
Input Datanode
Activity
Output Datanode
Input Datanode com validação de pré-condição
Atividade com notificações de falha ou delay
Ouput Datanode
Amazon S3
logs
Custom
Precondition
EMR usage-by-geo job
Amazon EC2
report generation
Amazon
DynamoDB
event data
Amazon RDS
demographics
Amazon Redshift
DW table
Amazon
Redshift
DW table
Hive
script
Amazon S3
logs
Custom
Precondition
EMR usage-by-geo job
Amazon EC2
report generation
Amazon
DynamoDB
event data
Amazon RDS
demographics
Amazon Redshift
DW table
Amazon
Redshift
DW table
Hive
script
Nós gerenciamos Você gerencia
Instancias
EC2
EMR Clusters Recursos On Premise
Instancias
EC2
EMR Clusters
Na AWS On Premises
Alta Frequencia $1/mês $2.50/mês
Baixa Frequencia $.60/mês $1.50/mês
DEMO!
OBRIGADO! awshub.com.br
slideshare.net/AmazonWebServicesLATAM
José Papo
AWS Tech Evangelist
@josepapo