nosqlbr cassandra
DESCRIPTION
Presentation at NoSQLbrTRANSCRIPT
Ben [email protected]@bcoverston
Apache Cassandra: Uma Introdução
Eu
Ben Coverston Diretor de Operações DataStax Como é que um gringo fala Português? Morou em Santa Catarina de 1994-1996
Datastax e Cassandra
Júlio 2008 Contribuído de Facebook á comunidade
Março 2009 Introduzido à incubadora Apache
DataStax, Fundado Abril 2010 Primeira conferência: Augusto 2010
Quem está usando Ela?
Financeiro Governo Mídia Social Publicidade Energia Varejo Saúde
Cassandra, você é diferente
Como é diferente?
O melhor combinação de Escalabilidade Performance Disponibilidade
Escalabilidade
Através uma esquema distribuída Sem ponto único de falha Todos os nós são o mesmo
O fracasso é inevitável
Então…
ou…
A falta é um caso especial
? ?
Nós de Cassandra
Nós de Cassandra (cont.)
Falha com Cassandra
Modelagem de dados com Apache Cassandra
Flexível Fundado em Big Table Escalável
Feito Em Big Table
Google Finance Google Reader Gmail Google App Engine Google Book Search YouTube . . .
Dados Primitivas Column Family
chave nome : valor nome : valor nome :valor
chave nome : valor nome : valor nome : valor
chave nome : valor nome: valor
chave nome : valor nome : valor nome : valor
nome : valor
Twissandra
Aplicação escrito em Cassandra www.twissandra.com
UsuáriosColumn Family Usuários
alice nome : Allison senha : *
bob nome : Roberto
senha : *
eve nome : Evelyn senha : *
chuck nome : Carlos senha : * site : datastax.com
EstadoColumn Family Tweets
LMNO timestamp : 175695372
corpo : estou tão equivicado? user : carlos
AXML timestamp : 125695372
corpo: recebeu a minha mensagem?
user : alice
DEXDL timestamp : 155695372
corpo: ouvi o que diz. user : eve
BADFO timestamp : 135695372
corpo : manda-me a senha.
user : mallory
Pesquisando Dados em Twissandra
Quem esta seguindo um usuário? A quem segue um usuário? Monstra os meus tweets.
UserLine Monstra os tweets de todos que eu
estou seguindo. TimeLine
Column Family Followers
Quem Segue Alice?
alice bob : mallory : trent :
Column Family Following
Quem é seguido por Alice?
alice bob : carlos : david :
Column Family UserLine
UserLine do Alice
alice 125695372 : AXML
126695372 : XCVL
127695372 : XENY
bob 125795372 : SDFG
126895372 : XCVN
eve 125694372 : FDHL
arthur 125600000 : AXML
125800000 : XCVL
127900000 : XENY
Column Family Timeline
TimeLine do Alice
bob 125795372 : SDFG
126895372 : XCVN
eve 1279900000 : FDHL
arthur 125600000 : AXML
125800000 : XCVL
127900000 : XENY
alice 125795372 : SDFG
125800000 : XCVL
1279900000 : FDHL
Bob da um novo estadoColumn Family Tweets
LUMP timestamp : 200000000 body : Oi
Aliceuser : bob
AXML timestamp : 125695372
body : recebeu a minha mensagem?
user : alice
DEXDL timestamp : 155695372
body : ouvi o que diz. user : eve
BADFO timestamp : 135695372
body : manda-me a senha!
user : mallory
Column Family UserLine
bob 127695372 : XENY
126695372 : XCVL
200000000 : LUMP
Column Family TimeLine
UserLine e TimeLine
alice 125795372 : SDFG
125800000 : XCVL
1279900000 : FDHL 200000000 : LUMP
125695372 : AXML
bob 125795372 : SDFG
126895372 : XCVN
200000000 : LUMP
eve 1279900000 : FDHL
200000000 : LUMP
Usando o Timeline
alice
Column Family Tweets
LMNO timestamp : 175695372
body : am I always the third wheel? user :
chuck
AXML timestamp : 125695372
body : bob did you get my message? user :
alice
DEXDL timestamp : 155695372
body : I heard what you said user : eve
BADFO timestamp : 135695372
body : send me your password!
user : mallory
Vista Geral
O que é um “Column Family”? Modelar Data Estático Modelar ‘Queries’ ou Perguntas
What’s new in Apache Cassandra 1.0
Compressão Memtable Thresholds LevelDB Desempenho Outras Coisas…
Compressão
Compressão
2-4x redução no tamanho dos dados 25-35% melhoria na velocidade a ler 5-10% melhoria na velocidade a
escrever O melhor quando as colunas são um
tanto congruente
Gerência Memória
Gerência Memória e Espaço Disquete
Cache filharas fora do ‘Heap’ Afinação do Armazenamento Reclamação do Armazenamento Disque
Compacção
Compacção Overview
Compacção ‘Tiered’
Compacção ‘Leveled’
Desempenho
Desempenho
Ler Improvado pelas fatias Improvado por leitura nomeada
Escrever Alocação Arena pelos Memtables Diminuição da Fragmentação
Rede Redução das cópias
Desempenho(Cont.)
Outros Coisas…
Hints
Reexecutar os dados a processor quando falha
Armazenado e otimizada para reexecutar
Recolocação dos Nós Compacção Multi-threaded
Também Hadoop
Existe intergeração com Hadoop Brisk DataStax Enterprise
Cassandra e muito bom para OLTP E bom também dos aplicações analíticas Sem ETL (Extratar, Transformar,
Carregar)
Mas Informacões
www.datastax.com
Free Documentation Technical White Papers Technical Articles Tutorials User Forums User/Customer Case Studies FAQ’s Videos Blogs Software downloads
[email protected]@datastax.com