métodos de acesso métrico - uspwiki.icmc.usp.br/images/2/2c/scc578920131-conceitos_onion.pdf · 3...

50
Métodos de Acesso Métrico Arthur Emanuel de O. Carosia Profa. Dra. Cristina Dutra de Aguiar Ciferri http://www.icmc.usp.br/img/novafaixa.png

Upload: others

Post on 28-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Métodos de Acesso Métrico

Arthur Emanuel de O. Carosia Profa. Dra. Cristina Dutra de Aguiar Ciferri

http://www.icmc.usp.br/img/novafaixa.png

Page 2: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Índice

Conceitos Básicos Métodos de Acesso Onion-tree

2

Page 3: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Índice

Conceitos Básicos Métodos de Acesso Onion-tree

3

Page 4: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Dados Complexos

Não possuem relação de ordem total, ao contrário dos dados convencionais.

Ex: dados multimídia.

4

Page 5: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Dados Complexos

Não possuem relação de ordem total, ao contrário dos dados convencionais.

Ex: dados multimídia.

>

< ?

5

Page 6: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Dados Complexos

Não possuem relação de ordem total, ao contrário dos dados convencionais.

Comparados por similaridade.

6

Page 7: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Dados Complexos

Não possuem relação de ordem total, ao contrário dos dados convencionais.

Comparados por similaridade. Naturalmente representados em um espaço métrico.

7

Page 8: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Espaço Métrico

Definido como M = <S, d> S: domínio de elementos d: função de distância sobre os elementos de S

•  Distância entre dois elementos do domínio

•  Quanto menor a distância, mais similares os elementos são.

8

Page 9: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Espaço Métrico

A função de distância deve atender às condições: Identidade d(s1,s1) = 0 Simetria

d(s1, s2) = d(s2, s1) Não negatividade

0 ≤ d(s1, s2) ≤ ∞ Desigualdade triangular

d(s1, s2) ≤ d(s1, s3) + d(s2, s3) onde s1, s2, s3 ∈ S

9

s1

s2

s3

s1

s1

s2

Page 10: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Consultas por Similaridade Consulta por Abrangência

Consulta aos k vizinhos mais próximos

10

Page 11: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Índice

Conceitos Básicos Métodos de Acesso Onion-tree

11

Page 12: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Métodos de Acesso

Estrutura de dados e conjunto de algoritmos que manipulam esta estrutura.

12

Page 13: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Métodos de Acesso

Estrutura de dados e conjunto de algoritmos que manipulam esta estrutura. - Inserção

- Remoção - Busca - Bulk-loading

13

Page 14: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Métodos de Acesso Multidimensionais

Estrutura de dados com o objetivo de indexar coleções de números que representam objetos espaciais. Rápida recuperação de objetos que satisfaçam relacionamentos topológicos. Uso de aproximações para indexar os dados.

14

Page 15: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Métodos de Acesso Métricos (Bola)

Particionam o espaço de dados em várias regiões. Escolhe elementos representantes e agrupam os demais elementos à sua volta. Hierarquia de elementos representantes.

15

Page 16: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Métodos de Acesso

16

Page 17: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Métodos de Acesso

Guttman, A. (1984). R-trees: a dynamic index structure for spatial searching. In Proceedings of the 1984 ACM SIGMOD International Conference on Management of Data, pages 47–57, Boston, USA.

17

Page 18: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Métodos de Acesso

Ciaccia, P., Patella, M., and Zezula, P. (1997). M-tree: an efficient access method for similarity search in metric spaces. In Proceedings of the 23rd International Conference on Very Large Data Bases (VLDB), pages 426–435, Athens, Greece.

18

Page 19: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Métodos de Acesso

Traina-Jr, C., Traina, A. J. M., Seeger, B., and Faloutsos, C. (2000). Slim-trees: high performance metric trees minimizing overlap between nodes. In Proceedings of the 7th International Conference on Extending Database Technology (EDBT), pages 51–65, Konstanz, Germany.

19

Page 20: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Métodos de Acesso

Pola, I. R. V., Traina-Jr, C., and Traina, A. J. M. (2007). The MM-tree: A memory-based metric tree without overlap between nodes. In Proceedings of the 12th East European Conference on Advances in Databases and Information Systems (ADBIS), pages 157–171.

20

Page 21: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Métodos de Acesso

Carelo, C., Pola, I., Ciferri, R., Traina, A., Traina Jr, C., and Ciferri, C. (2011). Slicing the metric space to provide quick indexing of complex data in the main memory. Information Systems, pages 79-98.

21

Page 22: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

22

Índice

Conceitos Básicos Métodos de Acesso Onion-tree

Page 23: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

MAM baseado em memória primária

23

Page 24: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

MAM baseado em memória primária

Rápida construção Otimizar subconsultas de consultas complexas Não necessita minimizar acessos a disco

24

Page 25: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

MAM baseado em memória primária Pode dividir o espaço do nó em mais que 4 regiões disjuntas, conforme a necessidade

25

Page 26: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

MAM baseado em memória primária Pode dividir o espaço do nó em mais que 4 regiões disjuntas, conforme a necessidade Extensão da MM-tree

26

Page 27: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

MAM baseado em memória primária Pode dividir o espaço do nó em mais que 4 regiões disjuntas, conforme a necessidade Extensão da MM-tree Algoritmo de Expansão

Algoritmo de Substituição de Representantes Algoritmos de Consulta Estendidos

27

Page 28: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

MAM baseado em memória primária Pode dividir o espaço do nó em mais que 4 regiões disjuntas, conforme a necessidade Extensão da MM-tree Não possui operações de: - Bulk-loading - Remoção

28

Page 29: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

Algoritmo de expansão Aumenta de forma flexível a quantidade de regiões disjuntas em cada nó

29

Page 30: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

Algoritmo de expansão Aumenta de forma flexível a quantidade de regiões disjuntas em cada nó

30 Expansão 0 Expansão 1 Expansão 2

Page 31: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

Políticas de expansão:

Fixa (F-Onion-tree)

Variável (V-Onion-tree)

31

Page 32: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

Políticas de expansão:

Fixa (F-Onion-tree)

Variável (V-Onion-tree)

Keep Small

Strategy

32

Page 33: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

Algoritmo de substituição de representantes

Na inserção, identifica se o subespaço do nó folha pode ser melhor dividido a partir de outros representantes

33

Page 34: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

Algoritmo de substituição de representantes

Na inserção, identifica se o subespaço do nó folha pode ser melhor dividido a partir de outros representantes

Si passa a ser o primeiro

representante do nó (S1)

34

!!!"

"!

""

!#

$

!!

!"

"!

""

!# $

Page 35: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

Algoritmo de substituição de representantes

Políticas de substituição

1. Keep Small Strategy

2. Minimize Expansions

3. Maximize Expansions

35

Page 36: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

Algoritmos de consulta estendidos Estende os algoritmos de consulta da MM-tree para considerar as regiões adicionais criadas

Algoritmo de busca pelos k-vizinhos mais próximos: nova seqüência para a visitação das regiões do nó.

36

Page 37: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree Algoritmos de consulta estendidos – KNN

1. Visita a expansão E na qual se encontra o elemento Sq 2. Visita as outras regiões, de acordo com a proximidade ao elemento da query 3. Expansões E – 1 e E + 1, Expansões E – 2 e E + 2 ....

37

Page 38: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

38

Onion-tree Algoritmos de consulta estendidos – KNN

1. Visita a expansão E na qual se encontra o elemento Sq 2. Visita as outras regiões, de acordo com a proximidade ao elemento da query 3. Expansões E – 1 e E + 1, Expansões E – 2 e E + 2 ....

38

Expansão 1 Regiões IV, VI, V

Page 39: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

39

Onion-tree Algoritmos de consulta estendidos – KNN

1. Visita a expansão E na qual se encontra o elemento Sq 2. Visita as outras regiões, de acordo com a proximidade ao elemento da query 3. Expansões E – 1 e E + 1, Expansões E – 2 e E + 2 ....

39

Expansão 1 Regiões IV, VI, V

Expansão 0 Regiões I, III, II

Page 40: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

40

Onion-tree Algoritmos de consulta estendidos – KNN

1. Visita a expansão E na qual se encontra o elemento Sq 2. Visita as outras regiões, de acordo com a proximidade ao elemento da query 3. Expansões E – 1 e E + 1, Expansões E – 2 e E + 2 ....

40

Expansão 2 Regiões VII, IX,

VIII, X

Expansão 1 Regiões IV, VI, V

Expansão 0 Regiões I, III, II

Page 41: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree Algoritmo de Inserção

Leva em consideração a distância entre o novo elemento a ser inserido e os elementos representantes do nó

41

Page 42: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

Algoritmo de Inserção

F-Onion-tree 1 Expansão

42

Page 43: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

a b

..... I II III VII'

a b

43

Algoritmo de Inserção

F-Onion-tree 1 Expansão

Page 44: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

a b

..... I II III VII'

a b

c

44

Algoritmo de Inserção

F-Onion-tree 1 Expansão

Page 45: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

a b

..... I II III VII'

a b

c d(a,c)

45

Algoritmo de Inserção

F-Onion-tree 1 Expansão

Page 46: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

a b

..... I II III VII'

a b

c d(b,c)

46

Algoritmo de Inserção

F-Onion-tree 1 Expansão

Page 47: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

a b

..... I II III VII'

a b

c

47

c

Algoritmo de Inserção

F-Onion-tree 1 Expansão

Page 48: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

a b

..... I II III VII'

a b

c d

c

48

Algoritmo de Inserção

F-Onion-tree 1 Expansão

Page 49: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

a b

c d ..... I II III VII'

a b

c d

49

Algoritmo de Inserção

F-Onion-tree 1 Expansão

Page 50: Métodos de Acesso Métrico - USPwiki.icmc.usp.br/images/2/2c/SCC578920131-Conceitos_Onion.pdf · 3 s 1 s 1 s 2 . Consultas por Similaridade Consulta por Abrangência Consulta aos

Onion-tree

a b a b

c d .....

c I II III VII'

d

I II VII'

...

50

Algoritmo de Inserção

F-Onion-tree 1 Expansão