tendências de big data
Post on 14-Apr-2017
298 Views
Preview:
TRANSCRIPT
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Thiago Paulino | Arquiteto de Soluções
2016
Padrões de Arquitetura e Melhores Práticas de Big Data na AWSTendências de Big Data
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
O que esperar dessa sessão?
• Desafios de Big Data• Como simplificar o processamento dos dados?• Que tecnologias devo utilizar?
• Porque?• Como?
• Arquitetura de Referência• Padrões de Desenho
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Big Data crescendo, sempre
Volume
Velocidade
Variedade
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Evolução de Big Data
Batch•Relatórios
Tempo Real•Alertas
Predição• Forecast
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Várias ferramentas
Glacier
S3 DynamoDB
RDS
EMR
Redshift
Data Pipeline
Kinesis Cassandra Kinesis-
enabled app
Lambda ML
ElastiCache
DynamoDBStreams
SQS
Elastic SearchKinesis Firehose
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Diferencie-se
• Empresas muito parecidas• Pense com números• “Erre certo”
http://amzn.to/1Wb1Lrw
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
http://imdb.to/1kRJDgn
Diferencie-se
• Empresas muito parecidas• Pense com números• “Erre certo”
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Existe uma arquitetura de referência?Que ferramentas deveria utilizar?
Como? Por quê?
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Princípios Arquiteturais
• “Data Bus” Desacoplado• Dados → Armazenamento→ Processamento→ Respostas
• Ferramenta certa para o trabalho certo• Estrutura de dados, latência, taxa de transferência, padrões de
acesso• Usar idéias com Arquitetura Lambda
• Log imutável (append-only), batch/speed/serving layer• Aproveitar serviços gerenciados da AWS
• Baixa ou nenhuma administração• Big data ≠ $$$$$$
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Simplificando o processamento de Big Data
Ingerir /Coletar
Armazenar Processar /Analizar
Consumir / Visualizar
dados respostas
Tempo para as respostas (Latência)Taxa de transferência
Custo
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Ingerir /Coletar
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Tipos de Dados
• Transacional• Leituras e escritas em BD
(OLTP)• Cache
• Search• Logs• Streams
• Arquivos• Arquivos de log (/var/log)• Coletores de logs e frameworks
• Stream• Logs• Sensores & dados de IoT
BD
Armazenamento de Arquivos
Armazenamento de Streams
A
iOS Android
Web Apps
Logstash
Logg
ing
IoT
Aplic
açõe
s
Dados Transacionais
Arquivos
Streams
Mobile Apps
Dados Indexados
Search
Collect Store
Logg
ing
IoT
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Armazenar
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Armazenamento de Streams
A
iOS Android
Web Apps
Logstash
Amazon RDS
Amazon DynamoDB
AmazonES
AmazonS3
ApacheKafka
AmazonGlacier
AmazonKinesis
AmazonDynamoDB
AmazonElastiCache
Sear
ch
SQL
Não
SQL
Ca
che
Arm
azen
amen
to d
e St
ream
sFi
le
Stor
age
Dados Transacionais
Arquivos
Streams
Mobile Apps
Dados Indexados
BD
Arquivos
Search
Coletar Armazenar
Logg
ing
IoT
Aplic
açõe
s
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Opções de Armazenamento de Streams
• Serviços Gerenciados AWS• Amazon Kinesis → streams• DynamoDB Streams → tabela + streams• Amazon SQS → fila• Amazon SNS → pub/sub
• Não Gerenciados• Apache Kafka → stream
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Porque armazenamento de Streams?• Desacoplar consumidores & produtores• Buffer persistente• Coletar múltiplas streams
• Preservar ordenação• Streaming MapReduce• Consumo paralelo
4 4 3 3 2 2 1 14 3 2 1
4 3 2 1
4 3 2 1
4 3 2 14 4 3 3 2 2 1 1
Produtor 1
Shard 1 / Partition 1
Shard 2 / Partition 2
Consumidor 1
Count of Red = 4
Count of Violet = 4
Consumidor 2
Count of Blue = 4
Count of Green = 4
Produtor 2
Produtor 3
Produtor N
Key = Red
Key = Green
Key = Blue
Key = Violet
Kafka TopicDynamoDB Stream Kinesis Stream
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
E filas e Pub/Sub?• Desacoplar produtores &
consumidores/assinantes• Buffer persistente• Coletar múltiplas streams
• Sem ordenação• Sem consumo paralelo
Não Amazon SQS• Amazon SNS pode
rotear para mais filas SQS ou funções ʎ
• Sem streaming MapReduce
Consumidores
Produtores
Produtores
Amazon SNS
Amazon SQS
fila
Tópico
Função
ʎ
AWS Lambda
Amazon SQSfila
Assinante
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Qual armazenamento de storage devo usar?AmazonKinesis
DynamoDB Streams
Amazon SQSAmazon SNS
Kafka
Gerenciado Sim Sim Sim NãoOrdenação Sim Sim Não SimEntrega Pelo menos 1 vez Exatamente 1 vez Pelo menos 1 vez Pelo menos 1 vez
Retenção 7 dias 24 horas 14 dias ConfigurávelReplicação 3 AZ 3 AZ 3 AZ ConfigurávelTaxa Transferência Sem Limite Sem Limite Sem Limite # NodesClientes Paralelos Sim Sim Não (SQS) SimMapReduce Sim Sim Não SimTamanho Registro 1MB 400KB 256KB ConfigurávelCusto Baixo Alto (custo
tabela) Baixo-Médio Baixo (+admin)
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Armazenamento de Arquivos
A
iOS Android
Web Apps
Logstash
Amazon RDS
Amazon DynamoDB
AmazonES
AmazonS3
ApacheKafka
AmazonGlacier
AmazonKinesis
AmazonDynamoDB
AmazonElastiCache
Sear
ch
SQL
NoS
QL
Ca
che
Arm
azen
amen
to d
e St
ream
sAr
maz
enam
ento
de
Arqu
ivos
Transacional
Arquivos
Streams
Mobile Apps
Indexado
BD
Search
Coletar Armazenar
Logg
ing
IoT
Aplic
açõe
s
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Por que o S3 é bom para Big Data?• Suportado nativamente por frameworks de Big Data (Spark, Hive, Presto, etc.) • Sem necessidade de rodar clusters para storage (diferente do HDFS)• Permite rodar clusters Hadoop transientes & utilizar instâncias EC2 Spot• Múltiplos clusters distintos podem usar os mesmos dados• Número ilimitado de objetos• Alta taxa de transferência – sem limite agregado de taxa de transferência• Alta disponibilidade – tolera falha nas AZs• Desenhado para durabilidade de 99.999999999%• Tiered-storage (Standard, IA, Amazon Glacier) com políticas de ciclo de vida• Seguro – criptografia em trânsito com SSL, em descanso com client/server-side• Baixo custo
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
O que dizer sobre HDFS e Amazon Glacier?
• Usar HDFS para dados frequentemente acessados (quente)
• Usar Amazon S3 Standard para dados frequentemente acessados
• Usar Amazon S3 Standard – IA para dados que não são frequentemente acessados
• Usar Amazon Glacier para arquivar dados frios
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
BD + Search
A
iOS Android
Web Apps
Logstash
Amazon RDS
Amazon DynamoDB
AmazonES
AmazonS3
ApacheKafka
AmazonGlacier
AmazonKinesis
AmazonDynamoDB
AmazonElastiCache
Sear
ch
SQL
NoS
QL
Ca
che
Arm
azen
amen
to d
e St
ream
sAr
quiv
os
Transacionais
Arquivos
Streams
Mobile Apps
Indexados
Coletar Armazenar
Logg
ing
IoT
Aplic
açõe
s
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Quanto só se tem um martelo, tudo parece como um prego
A Lei de Maslow ou Martelo de Maslow,
popularmente mencionado com a frase
“se tudo o que você tem é um martelo, tudo parece
como um prego” é do livro “A Psicologia da Ciência”,
de Abraham Maslow.Fonte: https://en.wikipedia.org/wiki/Law_of_the_instrument
http://amzn.to/1MVHgO5
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Fonte: https://creativemarket.com/DearthCo/26223-When-you-are-a-hammer...
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
BD + Search – Anti-Pattern
RDBMS
BD + Search
Aplicações
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Search + BD – Anti-Pattern
Elastic Search
Search + BD
Aplicações
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Melhor prática – Ferramenta certa para o trabalho certo
Data TierSearchAmazon
Elasticsearch Service
Amazon CloudSearch
CacheRedisMemcached
SQLAmazon AuroraMySQLPostgreSQLOracleSQL Server
NoSQLCassandraAmazon
DynamoDBHBaseMongoDB
Applications
BD + Search
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Renove a caixa de ferramentas
• Persistência poliglota
http://amzn.to/1qUc0oq
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Views Materializadas
Amazon ElasticSearch
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Que tipo de armazenamento devo usar?
• Estrutura de Dados → Schema fixo, JSON, key-value
• Padrões de Acesso → Armazene os dados no formato que você irá acessar
• Características de acesso a dados → Quente, morno, frio
• Custo → Melhor custo benefício
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Estruturas de Dados e Padrões de Acesso
Padrões de Acesso O que usar?Put/Get (Key, Value) Cache, NoSQL
Relacionamentos Simples → 1:N, M:N NoSQL
Cross table joins, transação, SQL SQL
Faceting, Search Search
Estrutura de dados O que usar?
Schema fixo SQL, NoSQL
Sem Schema (JSON) NoSQL, Search
(Key, Value) Cache, NoSQL
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Qual a temperatura do seu padrão de acesso aos dados?
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Quente Morno Frio
Volume MB–GB GB–TB PB
Tamanho do Item B–KB KB–MB KB–TB
Latência ms ms, sec min, hrs
Durabilidade Baixo–Alto Alto Muito Alto
Taxa de acesso Muito Alto Alto BaixoCusto/GB $$-$ $-¢¢ ¢
Dados Quentes Dados Mornos Dados Frios
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Cache SQL
Taxa de AcessoAlto Baixo
Custo/GBAlto Baixo
LatênciaBaixo Alto
GlacierE
stru
tura NoSQL
Quente Morno Frio
Baixo
Alto
S3
Search
HDFS
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Que tipo de armazenamento devo usar?
Amazon ElastiCache
AmazonDynamoDB
AmazonAurora
AmazonElasticsearch
Amazon EMR (HDFS)
Amazon S3 Amazon Glacier
LatênciaMédia
ms ms ms, sec ms,sec sec,min,hrs ms,sec,min(~ tamanho)
hrs
Volume de Dados
GB GB–TBs(sem limite)
GB–TB(64 TB Max)
GB–TB GB–PB(~nodes)
MB–PB(sem limite)
GB–PB(sem limite)
Tamanho Item B-KB KB(400 KB max)
KB(64 KB)
KB(1 MB max)
MB-GB KB-GB(5 TB max)
GB(40 TB max)
Taxa de Acesso Alta - Muito Alta
Muito Alta(sem limite)
Alta Alta Baixa – Muito Alta
Baixa –Muito Alta(sem limite)
Muito Baixa
Custo armazenamentoGB/mês
$$ ¢¢ ¢¢ ¢¢ ¢ ¢ ¢/10
Durabilidade Baixo - Moderada
Muito Alta Muito Alta
Alta Alta Muito Alta Muito Alta
Quente Morno Frio
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Desenho orientado a custo
• Exemplo: Deveria utilizar Amazon S3 ou DynamoDB?“Estou desenhando um projeto que irá aumentar consideravelmente o uso do Amazon S3 pelo meu time. Espero que você me ajude com algumas questões. A etapa atual do projeto requer trabalhar com muitos arquivos pequenos, talvez chegue a um bilhão durante o pico. O tamanho total deve ser na orderm de 1.5 TB por mês…”
Taxa de acesso (Escritas/seg)
Tamanho Objeto(Bytes)
Tamanho Total(GB/month)
Objetos por mês
300 2048 1483 777,600,000
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Desenho orientado a custo
• Exemplo: Deveria utilizar Amazon S3 ou DynamoDB?
https://calculator.s3.amazonaws.com/index.html
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Amazon S3 ou DynamoDB?Taxa de acesso (Escritas/seg)
Tamanho Objeto(Bytes)
Tamanho Total(GB/month)
Objetos por mês
300 2048 1483 777,600,000
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Taxa de acesso (Escritas/seg)
Tamanho Objeto(Bytes)
Tamanho Total(GB/month)
Objetos por mês
Cenario 1 300 2,048 1,483 3,888,00
Cenario 2 300 32,768 23,730 3,888,00
Amazon S3
Amazon DynamoDB
usar
usar
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Processar /Analizar
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
AnalizarA
iOS Android
Web Apps
Logstash
Amazon RDS
Amazon DynamoDB
AmazonES
AmazonS3
ApacheKafka
AmazonGlacier
AmazonKinesis
AmazonDynamoDB
Amazon Redshift
Impala
Pig
Amazon ML
Streaming
AmazonKinesis
AWSLambda
Amaz
on E
last
ic
Map
Redu
ce
AmazonElastiCache
Sear
ch
SQL
NoS
QL
Ca
che
Proc
essa
men
to
Stre
amin
gBa
tch
Inte
rati
vo
Logg
ing
Stre
am
Stor
age
IoT
Aplic
açõe
s
File
St
orag
e
Quente
Frio
Morno
Quente
Quente
ML
Transacionais
Arquivo
Stream
Mobile Apps
Indexados
Coletar Armazenar Analizar
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Processar / Analizar
• Análise de dados é um processo de inspeção, limpeza, transformação, e modelagem de dados com o objetivo de descobrir informações úteis, chegar a conclusões e suportar a tomada de decisão.
• Exemplos• Dashboards Interativos → Análise Interativa• Relatórios diários/semanais/mensais → Análise em Batch• Alertas billing/fraude, métricas de 1 min. → Análise em Tempo Real• Análise de sentimento, modelos de predição → Machine learning
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Análise Interativa
• Grande quantidade de dados (mornos/frios)• Latência de segundos para retornar respostas
• Exemplo: Dashboards self-service
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Análise em Batch
• Utiliza uma grande quantidade de dados (quente ou morno)• Leva minutos ou horas para retornar respostas
• Exemplos: Gerar relatórios diários, semanais ou mensais
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Análise em Tempo Real
• Utiliza uma pequena quantidade de dados e faz perguntas• Leva um pequeno período de tempo (milisegundos ou segundos) para
retornar as respostas
• Tempo Real (evento)• Responder em tempo real a eventos que chegam em streams de dados• Exemplo: Billing/Alertas de Fraude/Advertisement/Recomendação
• Quase Tempo Real (micro batch)• Operações quase em tempo real em pequenos quantidades de eventos em
streams de dados• Exemplo: Métricas de 1 minuto
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Predição via Machine Learning
• ML dá a computadores a habilidade de aprender sem serem explicitamente programados
• Algoritmos de Machine Learning• Aprendizado Supervisionado ← programa que “ensina”
• Classificação ← Esta transação é uma fraude? (sim ou não)• Regressão ← Qual o valor total desse cliente?
• Aprendizado Não Supervisionado ← deixe ele aprender sozinho• Clustering ← Segmentação de Marketing
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Frameworks e ferramentas de análise
• Machine Learning• Mahout, Spark ML, Amazon ML
• Análise Interativa• Amazon Redshift, Presto, Impala, Spark
• Processamento em Batch• MapReduce, Hive, Pig, Spark
• Processamento de Streams• Micro batch: Spark Streaming, KCL, Hive, Pig• Tempo real: Storm, AWS Lambda, KCL
Amazon Redshift
Impala
Pig
Amazon Machine Learning
Streaming
AmazonKinesis
AWSLambda
Amaz
on E
MR
Stre
ams
Batc
hIn
tera
tivo
ML
Analyze
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Que tecnologia de stream eu devo usar?Spark Streaming Apache Storm Amazon Kinesis Client
LibraryAWS Lambda Amazon EMR (Hive, Pig)
Escala / Taxa de Transferência
~ Nós ~ Nós ~ Nós Automático ~ Nós
Batch ou Tempo Real
Tempo Real Tempo Real Tempo Real Tempo Real Batch
Gerenciamento Sim (Amazon EMR) Faça você mesmo Amazon EC2 + Auto Scaling
Gerenciado pela AWS Sim (Amazon EMR)
Tolerância a Falhas Single AZ Configurável Multi-AZ Multi-AZ Single AZ
Linguagens de Programação
Java, Python, Scala Qualquer linguagem via Thrift
Java, via MultiLangDaemon ( .Net, Python, Ruby, Node.js)
Node.js, Java, Python Hive, Pig, Linguagens de Streaming
Latência da Consulta (menor é melhor)
Baixa AltaBaixa Baixa
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Qual tecnologia de processamento de dados eu devo utilizar?
AmazonRedshift
Impala Presto Spark Hive
Latência Consulta Baixa Baixa Baixa Baixa Média (Tez) – Alta (MapReduce)
Durabilidade Alta Alta Alta Alta Alta
Volume de Dados 1.6 PB Max
~Nós ~Nós ~Nós ~Nós
Gerenciado Sim Sim (Amazon EMR)
Sim(Amazon EMR)
Sim(Amazon EMR)
Sim (Amazon EMR)
Armazenamento Nativo HDFS / S3A* HDFS / S3 HDFS / S3 HDFS / S3
Compatibilidade com SQL
Alto Médio Alto Baixo (SparkSQL) Médio (HQL)
Latência da Consulta (menor é melhor)
Baixa AltaBaixa Baixa
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
E sobre ETL?Store Analyze
https://aws.amazon.com/big-data/partner-solutions/
ETL
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Consumir / Visualizar
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Coletar Armazenar Analizar Consumir
A
iOS Android
Web Apps
Logstash
Amazon RDS
Amazon DynamoDB
AmazonES
AmazonS3
ApacheKafka
AmazonGlacier
AmazonKinesis
AmazonDynamoDB
Amazon Redshift
Impala
Pig
Amazon ML
Streaming
AmazonKinesis
AWSLambda
Amaz
on E
last
ic
Map
Redu
ce
AmazonElastiCache
Sear
ch
SQL
NoS
QL
Ca
che
Stre
am
Proc
essi
ngBa
tch
Inte
ract
ive
Logg
ing
Arm
azen
amen
to S
trea
ms
IoT
Aplic
açõe
s
Amaz
enam
ento
Arq
uivo
s
Anal
ysis
& V
isua
lizat
ion
Quente
Frio
Morno
Quente
Lento
Quente
ML
Rápido
Rápido
Transacional
Arqquivos
Streams
Not
eboo
ks
Predictions
Apps & APIs
Mobile Apps
IDE
Search
ETL
Amazon QuickSight
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Consumir
• Predições
• Análise e Visualização
• Notebooks• • IDE
• Aplicações & API
Consume
Anál
ise
e Vi
sual
izaç
ão
Amazon QuickSight
Not
eboo
ks
Predições
Apps & APIs
IDE
Armazenar Analizar ConsumirETL
Business Users
Cientistas de Dados,
Desenvolvedores
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Colocando tudo juntoColetar Armazenar Analizar Consumir
A
iOS Android
Web Apps
Logstash
Amazon RDS
Amazon DynamoDB
AmazonES
AmazonS3
ApacheKafka
AmazonGlacier
AmazonKinesis
AmazonDynamoDB
Amazon Redshift
Impala
Pig
Amazon ML
Streaming
AmazonKinesis
AWSLambda
Amaz
on E
last
ic
Map
Redu
ce
AmazonElastiCache
Sear
ch
SQL
NoS
QL
Ca
che
Stre
am
Proc
essi
ngBa
tch
Inte
ract
ive
Logg
ing
Stre
am
Stor
age
IoT
Appl
icat
ions
File
St
orag
e
Anal
ysis
& V
isua
lizat
ion
Quente
Frio
Morno
Quente
Lento
Quente
ML
Rápido
Rápido
Amazon QuickSight
Transacional
Arquivos
Streams
Not
eboo
ks
Predictions
Apps & APIs
Mobile Apps
IDE
Search
ETL
Arquitetura de Referência
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Padrões de arquitetura
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Cenário 1: Enterprise Data Warehouse
Data Warehouse Architecture
Data Sources
AmazonS3
AmazonEMR
AmazonS3
AmazonRedshift
AmazonQuickSight
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Multi-Stage Decoupled “Data Bus”
• Múltiplos estágios• Armazenamento desacoplado do processamento
Armazenar Processar Armazenar ProcessarDados Respostas
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Cenário 2: Capturando e analisando dados de sensores
Data Sources
AmazonS3
AmazonRedshift
AmazonQuickSight
AmazonKinesisEnabled
App
AmazonKinesisEnabled
App
AmazonDynamoDB
RepostingDashboard
Customer Access
AmazonKinesis
1
2 3 4 5
6 7 8 9
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Cenário 3: Analise de sentimento e redes sociais
Social Media Data
AmazonEC2
AmazonLambda
AmazonML
AmazonKinesis
AmazonS3
AmazonSNS
1 2 4 5 6
3 7
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Sumário
• “Data Bus” Desacoplado• Dados → Armazenamento→ Processamento→ Respostas
• Ferramenta certa para o trabalho certo• Estrutura de dados, latência, taxa de transferência, padrões de
acesso• Usar idéias com Arquitetura Lambda
• Log imutável (append-only), batch/speed/serving layer• Aproveitar serviços gerenciados da AWS
• Baixa ou nenhuma administração• Big data ≠ $$$$$$
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Obrigado!
Thiago Paulino | Arquiteto de Soluções
top related