um servidor escalável para bases massivas de dados geográficos€¦ · hbase hbase caracter...

20
sua_figura.png Introdu¸ ao Trabalhos Relacionados Metodologia Conclus˜ oes Um Servidor Escal´ avel para Bases Massivas de Dados Geogr´ aficos Leandro da Silva Santos Orientador: Tiago Garcia de Senna Carneiro Co-orientador: Ricardo Augusto Rabelo Oliveira Departamento de Computa¸c˜ ao UFOP 14 de julho de 2011 Leandro da Silva Santos 1 / 18

Upload: others

Post on 03-Jul-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

Um Servidor Escalavel para Bases Massivas deDados Geograficos

Leandro da Silva Santos

Orientador: Tiago Garcia de Senna CarneiroCo-orientador: Ricardo Augusto Rabelo Oliveira

Departamento de ComputacaoUFOP

14 de julho de 2011

Leandro da Silva Santos 1 / 18

Page 2: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

O Problema

1 IntroducaoO Problema

2 Trabalhos RelacionadosHDFSMapReduceHBase

3 MetodologiaMetodoAnalise de Complexidade

4 Conclusoes

Leandro da Silva Santos 2 / 18

Page 3: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

O Problema

O Problema

Caracterısticas:Dado na escala do terabytes.Quantidade massiva de clientes.Servico em tempo real.

Leandro da Silva Santos 3 / 18

Page 4: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

HDFSMapReduceHBase

1 IntroducaoO Problema

2 Trabalhos RelacionadosHDFSMapReduceHBase

3 MetodologiaMetodoAnalise de Complexidade

4 Conclusoes

Leandro da Silva Santos 4 / 18

Page 5: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

HDFSMapReduceHBase

HDFS

Caracterısticas:

Alta disponibilidade.Alta largura de banda.Escabilidade.Gerenciamento pratico.

Entidades:

Namenode.Datanode.

Leandro da Silva Santos 5 / 18

Page 6: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

HDFSMapReduceHBase

HDFS

Figura: Arquitetura do sistema de arquivo distribuıdo HDFS [1].

Leandro da Silva Santos 6 / 18

Page 7: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

HDFSMapReduceHBase

MapReduce

Caracterısticas:

Simplicidade.Ocultacao do paralelismo.

Entidades:

Master.Worker Map.Worker Reduce.

Leandro da Silva Santos 7 / 18

Page 8: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

HDFSMapReduceHBase

MapReduce

Figura: Modelo de programacao MapReduce [2].

Leandro da Silva Santos 8 / 18

Page 9: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

HDFSMapReduceHBase

MapReduce

Modelo de programacao:

Implementacao de duas funcoes.map: map(chave, valor)− > list(chave, valorintermediario).Processa um par de entrada (chave, valor).Produz um conjunto de pares intermediarios.reduce(chave, list(valorintermediario))− > list(valor).Combina todos os valores intermediarios para uma chave.Produz um conjunto que contem os valores de saıda.

Leandro da Silva Santos 9 / 18

Page 10: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

HDFSMapReduceHBase

MapReduce

Figura: Exemplo de execucao de um programa MapReduce. Contador depalavras [3].

Leandro da Silva Santos 10 / 18

Page 11: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

HDFSMapReduceHBase

HBase

Caracterısticas:

Banco de dados semi-estruturado.Capacidade de indexacao na escala do terabytes.Recuperacao da informacao em tempo real.

Entidades:

Colunas.Linhas.TimeStamp.

Leandro da Silva Santos 11 / 18

Page 12: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

HDFSMapReduceHBase

HBase

Figura: Modelo de dados basico do sistema HBase [4].

Leandro da Silva Santos 12 / 18

Page 13: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

MetodoAnalise de Complexidade

1 IntroducaoO Problema

2 Trabalhos RelacionadosHDFSMapReduceHBase

3 MetodologiaMetodoAnalise de Complexidade

4 Conclusoes

Leandro da Silva Santos 13 / 18

Page 14: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

MetodoAnalise de Complexidade

Metodo Proposto

Primeira etapa

Processamento do dado

Figura: Modelo de processamento do dado. [5].

Leandro da Silva Santos 14 / 18

Page 15: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

MetodoAnalise de Complexidade

Metodo Proposto

Segunda etapaIndexacao do dado.

Figura: Modelo de indexacao utilizando a QuadTree [6].

Leandro da Silva Santos 15 / 18

Page 16: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

MetodoAnalise de Complexidade

Analise de Complexidade

Complexidade de tempo e espaco relacionadas ao:Numero de niveis do modelo de visualizacao - n.

O(n).

Leandro da Silva Santos 16 / 18

Page 17: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

1 IntroducaoO Problema

2 Trabalhos RelacionadosHDFSMapReduceHBase

3 MetodologiaMetodoAnalise de Complexidade

4 Conclusoes

Leandro da Silva Santos 17 / 18

Page 18: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

Conclusao

Necessidade de encontrar mais trabalhos relacionados asetapas propostas na metodologia.

Experimentar os recursos existentes - HDSF, MapReduce eHBase.

Leandro da Silva Santos 18 / 18

Page 19: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

D. Borthakur, The Hadoop Distributed File System:Architecture and Design, The Apache Software Foundation,2007.

J. Dean and S. Ghemawat, “Mapreduce: simplified dataprocessing on large clusters,” Commun. ACM, vol. 51, pp.107–113, January 2008.

Tarn, “Map-reduce on mongo,”http://sharpthinking.com.au/author/tarn.aspx, visitado em04/07/2011.

F. Chang, J. Dean, S. Ghemawat, W. C. Hsieh, D. A. Wallach,M. Burrows, T. Chandra, A. Fikes, and R. E. Gruber,“Bigtable: A distributed storage system for structured data,”in Proceedings of the 7th USENIX Symposium on OperatingSystems Design and Implementation (OSDI’06), 2006.

Leandro da Silva Santos 18 / 18

Page 20: Um Servidor Escalável para Bases Massivas de Dados Geográficos€¦ · HBase HBase Caracter sticas: Banco de dados semi-estruturado. Capacidade de indexac~ao na escala do terabytes

sua_figura.png

IntroducaoTrabalhos Relacionados

MetodologiaConclusoes

[Online]. Available:http://labs.google.com/papers/bigtable.html

K. P. Pridal, “Tiles a la google maps: Coordinates, tile boundsand projection - conversion to epsg:900913 (epsg:3785) andepsg:4326 (wgs84),” http://www.maptiler.org/google-maps-coordinates-tile-bounds-projection/, visitado em11/07/2011.

“Bing maps tile system,”http://msdn.microsoft.com/en-us/library/bb259689.aspx,visitado em 03/07/2011.

Leandro da Silva Santos 18 / 18