procedimentos automÁticos e semi-automÁticos de regionalizaÇÃo por Árvore geradora mÍnima...

24
PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina da Costa Freitas

Upload: luna-pinheiro-cunha

Post on 07-Apr-2016

223 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO

POR ÁRVORE GERADORA MÍNIMA

Marcos Corrêa NevesGilberto Câmara

Renato M. AssunçãoCorina da Costa Freitas

Page 2: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Objetivos

• Desenvolvimento de um método de regionalização eficiente.– Teoria de Grafo.– Técnicas de otimização.

• Abordagem de regionalização semi-automática:– dirigida pelo usuário.

Page 3: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Regionalização

• Agrupamento de objetos-área em regiões homogêneas e espacialmente contíguas.

Page 4: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Regionalização

• Utilidade do procedimento:– facilitar a análise dos dados.– melhorar a representatividade dos valores dos atributos

e taxas associados aos objetos.– Redução dos efeitos de imprecisão dos atributos e do

posicionamento geográfico dos eventos.

Page 5: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Regionalização via AGM

• Grafo representa a estrutura de vizinhança.• Cada objeto é um vértice.• Objetos vizinhos são ligados por uma aresta.• Custos associados às aresta (medida de

similaridade entre os objetos). • Grafo dá origem a Árvore Geradora Mínima

(árvore de custo mínimo).

Page 6: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Regionalização via AGM

Algoritmo de Prim

Page 7: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Regionalização via AGM

• Fase de “poda” da AGM:– Escolha da aresta que forme dois grupos de objetos

homogêneos.– São retiradas k-1 arestas sucessivamente, formando k

árvores disjuntas. • Medida utilizada:

– Baseada na Soma dos Quadrados dos Desvios (SSD) entre os atributos dos objetos e os valores médios.

Page 8: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Regionalização via AGM

• Soma dos quadrados dos desvios:

m

j

n

ijijT xxSSD

1 1

2

sendo:

n, o número total de objetos (nós) em T;

ijx, o atributo j do objeto i ;m, o número de atributos considerados na análise;jx, o valor médio do atributo j, dado por:

Page 9: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Regionalização via AGM

• Custo da aresta na fase de poda:

ll

TbTaT SSDSSDSSDlarestadacusto

TT

TaTa TbTb

Page 10: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Regionalização via AGM

• Busca exaustiva pela aresta que melhor divide a árvore.

• Para k regiões, k-1 buscas são conduzidas.

Page 11: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Otimização

• Utilização de técnicas de otimização visando a melhorar a eficiência na fase de poda.

• Como um problema de otimização:

Sf :

lTbTa SSDSSDSSDf

},,,{ 121 nSSSS

Page 12: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Otimização

• Elementos de Busca Local (Expansão da Vizinhança e Busca Tabu).

• Duas soluções são vizinhas se suas arestas correspondentes são incidentes em um mesmo vértice.

SS11SS44SS22

SS33

Page 13: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Estratégia de busca

• Passo1: escolher a solução inicial Si em S. Fazer S* = Si ; k* = k = 0; e incluir Si na lista de soluções analisadas (T).

• Passo 2: Fazer k = k + 1. Escolher na lista T a solução que terá a vizinhança expandida, gerando o conjunto de soluções promissoras (V*).

• Passo 3: Avaliar as soluções em V*; escolher a melhor solução, Sj, em V*; Armazenar soluções avaliadas em T.

• Passo 4: Se f(Sj) < f(S*), então: S* = Sj; k* = k.• Passo 5: Verificar condição de parada (k - k* > 8). Senão

satisfeita, voltar ao passo 2.

Page 14: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Estratégia de busca

• Solução que terá a vizinhança expandida:– Solução que apresentar um menor valor para f’ .

– f’ evita busca em ramos da árvore com poucos vértices.

),max(' TbTa SSDSSDf

Page 15: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Estratégia de Busca

Page 16: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Estratégia de Busca

valores de f

0

5

10

15

20

25

30

iteração

f

Page 17: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Estratégia de Busca

• Próximas podas:– Laço de controle externo executado k-1 vezes

• Ponto de partida mais apropriado:– vértice “central”.

• Tende a ter valores de atributos médios;• próximos a solução ótima.

Page 18: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Estratégia de Busca

Vértice central

Page 19: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Regionalização semi-automática

• Os grupos “naturais”:– dependentes de uma série de escolhas:

• relacionadas ao objetivo da classificação.• atributos, medidas de similaridade, algoritmos,

métricas de avaliação, “correção das variáveis”.– Requisitos adicionais para as regiões (número de

objetos, população mínima, extensão da área, ...).

Page 20: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Observações sobre a AGM

• A AGM contém informações que não são visíveis em resultados de classificação:– ramos de similaridade em diferentes níveis, nós-folhas

e vértices centrais (global e locais).– hierarquia entre os objetos.– Possibilidades de fusão (ou subdivisão) de Regiões.

Page 21: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Observações sobre a AGM

Page 22: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Regionalização semi-automática

• O uso da AGM:– Não somente como um passo intermediário e escondido

dentro do processo de regionalização.– Como ferramenta de exploração dos dados.– Como suporte à regionalização guiada pelo usuário:

• Representando o status do processo de regionalização.

• Verificação de ligação válida na fusão de regiões.• Seleção de subconjuntos de objetos similares.

Page 23: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Regionalização semi-automática

• Seleção de regiões:– comparações;– gráficos;– sumários estatísticos;– outras informações.

• Edição das regiões.

Page 24: PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina

Conclusões

• É possível melhorar a eficiência da regionalização via AGM utilizando técnicas de otimização

• A AGM explicita a similaridade entre os objetos;• A AGM torna algumas informações visíveis podendo ser

utilizada como ferramenta em análise exploratória dos dados espaciais.

• A AGM pode funcionar como suporte à regionalização guiada pelo usuário.