sahga – um algoritmo genético híbrido com representação ... · sahga – um algoritmo...

49
SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise de dados geoespaciais Tese de doutorado em Computação Aplicada Adair Santa Catarina Orientadores: Dr. Antônio Miguel Vieira Monteiro Dr. João Ricardo de Freitas Oliveira INPE – Abr/2009

Upload: vuxuyen

Post on 30-Nov-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise de dados geoespaciais

Tese de doutorado em Computação Aplicada

Adair Santa Catarina

Orientadores: Dr. Antônio Miguel Vieira MonteiroDr. João Ricardo de Freitas Oliveira

INPE – Abr/2009

Page 2: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

2

Roteiro

Introdução

Referencial Teórico:

Representação do espaço bi-dimensional e vizinhança espacial;

Algoritmos Genéticos;

Model Breeders;

Species Distribution Models.

SAHGA Model Breeder

SAHGA SDM

Conclusões

Referências Bibliográficas

Page 3: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

3

Introdução

Dados Organizados

GIS

Geoco

mputação

Informações

Dados

Page 4: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

4

Introdução

Dados Organizados

• Model Breeders (Openshaw, 1997);• GARP (Stockwell e Peters, 1999).

Informações

Negligenciam os relacionamentos espaciais XDependência

Espacial(Lei de Tobler)

Page 5: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

5

É possível incorporar os relacionamentos espaciais em sistemas semi-automáticos de análise de dados geoespaciais baseados em AG?Estes sistemas são capazes de operar sobre um modelo generalizado de relacionamentos espaciais?Os relacionamentos espaciais afetam os resultados fornecidos por tais sistemas?O conhecimento pré-existente, acerca dos fatores ambientais que afetam o problema em estudo, pode ser representado nestes sistemas?

Questões

Page 6: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

6

Hipótese Central

É possível incorporar aos AG, utilizados em sistemas de análise de dados geoespaciais, uma estrutura para representação explícita de relacionamentos espaciais, a GPM – Generalized Proximity Matrix, possibilitando-os considerar os efeitos da dependência espacial nos fenômenos estudados.

Verificação da hipótese prova de conceitoSAHGA – Spatially Aware Hybrid Genetic Algorithm

SAHGA MB dados sócio-econômicosSAHGA SDM duas espécies de aves

Page 7: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

7

Roteiro

Introdução

Referencial Teórico:

Representação do espaço bi-dimensional e vizinhança espacial;

Algoritmos Genéticos;

Model Breeders;

Species Distribution Models.

SAHGA Model Breeder

SAHGA SDM

Conclusões

Referências Bibliográficas

Page 8: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

8

Representação do Espaço 2D

Polígonos ou grades regulares:

Page 9: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

9

Generalized Proximity Matrix (GPM)

Aguiar et al., 2003.Estrutura da GPM:

Conjunto de objetos O:Células regulares;Polígonos.

Grafo (G):Nós = objetos;Arcos = relacionamentos.

Matriz de proximidade (V):Conjunto de valores Wij que indicam o quanto dois objetos Oi e Oj estão relacionados;Wij relacionamentos no espaço absoluto ou relativo.

Page 10: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

10

Algoritmos Genéticos (AG)

Page 11: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

11

Simulated Annealing

Metropolis (1953); Kirkpatrick et al. (1983):

( )⎪⎭

⎪⎬

⎪⎩

⎪⎨

>⎟⎟⎠

⎞⎜⎜⎝

⎛ −−≤

=ij

k

ij

ij

c ggsec

ggggse

jaceitarPk exp

1)(

gi e gj = níveis energéticos;ck = temperatura.

Extensão do método de busca local;Habilidade para fugir da armadilha do ótimo local.

Page 12: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

12

Model Breeders

Openshaw & Openshaw (1997), Santa Catarina et al. (2005):

y = f(x1, x2, ..., xn);

Núcleo de otimização utilizam AG;Vantagens: modelos simples de compreender e eficiência computacional;Desvantagem: simplificação do fenômeno observado e grande consumo de tempo para resposta ótima.

Page 13: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

13

Species Distribution Models (SDM)

Fonte: Adaptado de Siqueira (2005)

Page 14: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

14

Tipos de Modelos usados em Ecologia

Analíticos;Mecanicistas;Empíricos SDM.

Fonte: Adaptado de Guisan e Zimmerman (2000)

Page 15: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

15

Avaliação dos SDM

Matriz de Confusão

Fonte: Adaptado de Siqueira (2005)

Fonte: Adaptado de Meyer (2005)Fonte: Braga (2000)

Page 16: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

16

Roteiro

Introdução

Referencial Teórico:

Representação do espaço bi-dimensional e vizinhança espacial;

Algoritmos Genéticos;

Model Breeders;

Species Distribution Models.

SAHGA Model Breeder

SAHGA SDM

Conclusões

Referências Bibliográficas

Page 17: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

17

SAHGA Model Breeder

Codificação:

Função de aptidão:

( ) Constanteˆ1 11

0 +⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛⋅⋅= ∑ ∑∑

= ==

n

k

NRE

jij

NRE

jkjijki

ii

WXWCXX

( )∑=

−=m

iii XXAptidão

1

2

00ˆ

Dados de entrada:

Page 18: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

18

Núcleo de Otimização – SAHGA

Page 19: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

19

Operadores Genéticos – SAHGA

Seleção pelo método da roleta;Cruzamento aritmético de Michalewicz (1996):

( )( ) 212

211

11

ppcppcββ

ββ+−=

−+=

Mutação uniforme [-4; 4];Busca local (SA) mutação uniforme [-0,5; 0,5];Elitismo.

Padronização das variáveis de entrada:

sxXX p

−=

Page 20: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

20

Parâmetros do SAHGA

Grefenstette (1986), De Jong e Spears (1991) e Santa Catarina e Bach (2003).

Page 21: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

21

Estudo de Caso – SAHGA MBX0 = Número de filhos nascidos vivos;X1 = Número de domicílios com banheiro;X2 = Número de domicílios cujo responsável tem 8 ou mais anos de estudo;X3 = Número de domicílios onde a renda é maior que 3 salários mínimos.

Fonte: IBGE (2007)

Page 22: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

22

Modelos Ajustados – SAHGA MB

Desconsiderando a GPM:

0025,03185,37114,25605,1ˆ3210 +⋅−⋅+⋅= pppp XXXX

Cada estado está relacionado apenas consigo mesmo Wii = 1

Aptidão mínima = 0,9298.

Considerando a GPM:

Aptidão mínima = 1,0737.011,00,43491,35397,1ˆ

3210 −⋅−⋅+⋅= pppp XXXX

Configuração dos parâmetros = Default

Page 23: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

23

Conclusões – SAHGA MB

Modelos ajustados estimam adequadamente X0em função das variáveis independentes;Trabalha com diferentes tipos de modelos, utilizando a mesma estrutura de codificação:

Adaptação para modelos quadráticos

( ) ( )Constanteˆ

1

1

1

1

1

2

20 +

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎛⋅

⋅+

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎛⋅

⋅= ∑∑

∑=

=

=

=

=n

kNRE

jij

NRE

jkjij

kNRE

jij

NRE

jkjij

ki i

i

i

i

W

XWCX

W

XWCXX

Page 24: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

24

Roteiro

Introdução

Referencial Teórico:

Representação do espaço bi-dimensional e vizinhança espacial;

Algoritmos Genéticos;

Model Breeders;

Species Distribution Models.

SAHGA Model Breeder

SAHGA SDM

Conclusões

Referências Bibliográficas

Page 25: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

25

SAHGA SDM

Codificação (=):

Dados de entrada:

Função de aptidão:( ) Constanteˆ

1 110 +⎟

⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛⋅⋅= ∑ ∑∑

= ==

n

k

NRE

jij

NRE

jkjijki

ii

WXWCXX

( ) ( ) ( )( )( ) ( )( )∑

= ⎟⎟

⎜⎜

⎪⎩

⎪⎨⎧

<=≥=

≥=<=⋅+−=

m

i iiii

iiiiii

XeXouXeXse

XeXouXeXseXXAptidão

1 0000

00002

005,0ˆ15,0ˆ0,1

5,0ˆ15,0ˆ0,01,0ˆ

Page 26: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

26

Estudos de Caso – SAHGA SDM

Distribuição potencial de duas espécies de aves:

Strix varia Thalurania furcata boliviana

Page 27: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

27

Estudos de Caso – SAHGA SDM

Comparação SAHGA SDM x GARP (SR e BS)openModeller Desktop v1.0.6 (CRIA et al., 2008);

SAHGA SDM:Modelos com e sem relacionamentos espaciais;Construção da GPM:

Parâmetros: Hard.

Page 28: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

28

Espécie Strix varia

Dados:Base exemplo do DesktopGarp (Kansas University, 2007);1218 pontos de presença 100 selecionados;7 layers geográficos: temperatura, precipitação e relevo;100 pontos de pseudo-ausência modelo BioClim (Nix, 1986) openModeller Desktop;Treino (50%) e teste (50%);GPM raio de 100 km.

Page 29: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

29

Modelo BioClim – Strix varia

Page 30: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

30

Modelos S1 e S2 – Strix varia

Modelo S1 Modelo S2

Page 31: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

31

Distribuição Potencial – Modelos S1 e S2

Page 32: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

32

Modelos SGSR e SGBS – Strix varia

Modelo SGSR Modelo SGBS

Page 33: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

33

Distribuição Potencial – Modelos SGSR e SGBS

Page 34: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

34

Espécie Thalurania furcata boliviana

Dados:Base exemplo do openModeller Desktop;65 pontos de presença;8 layers geográficos: precipitação e temperatura;50 pontos de pseudo-ausência modelo BioClim openModeller Desktop;Treino (40P/30A) e teste (25P/20A); GPM raio de 100 km.

Page 35: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

35

Modelo BioClim – Thalurania furcata boliviana

Page 36: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

36

Modelos T1 e T2 – Thalurania furcata boliviana

Modelo T1 Modelo T2

Page 37: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

37

Distribuição Potencial – Modelos T1 e T2

Page 38: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

38

Modelos TGSR e TGBS – Thalurania furcata boliviana

Modelo TGSR Modelo TGBS

Page 39: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

39

Distribuição Potencial – Modelos TGSR e TGBS

Page 40: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

40

Roteiro

Introdução

Referencial Teórico:

Representação do espaço bi-dimensional e vizinhança espacial;

Algoritmos Genéticos;

Model Breeders;

Species Distribution Models.

SAHGA Model Breeder

SAHGA SDM

Conclusões

Referências Bibliográficas

Page 41: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

41

Conclusões

Sistemas de análise de dados geoespaciais que utilizam AG negligenciam os efeitos da dependência espacial;

Prova de conceito SAHGA – Spatially Aware Hybrid Genetic Algorithm relacionamentos espaciais GPM;

Algoritmo de uso múltiplo:SAHGA MB Dados sócio-econômicos;SAHGA SDM Strix varia e Thalurania furcata boliviana.

Page 42: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

42

Conclusões

SAHGA MB:

Ajuste de modelos sem e com relacionamentos espaciais (GPM);

Modelos ajustados são distintos influência dos relacionamentos espaciais.

Ambos estimam adequadamente o valor padronizado da variável dependente.

Page 43: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

43

Conclusões

SAHGA SDM:

Page 44: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

44

Conclusões

Representação de conhecimento do especialista:No espaço relativo SAHGA MB:

Associações entre estados independem da distância;Válida para alguns estados.

No espaço absoluto SAHGA SDM:Pesos Wij variam em função da distância;0 – 50 km = 1,0; 50 – 100 km = 0,5.

Adaptabilidade do algoritmo modelos mais complexos:

Adaptação da estrutura cromossômica;Reescrita da função de aptidão.

Page 45: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

45

Trabalhos Futuros

Geração automática da GPM:Relacionamentos pré-definidos: toca, intercepta, perto de, etc.

Outros tipos de modelos:Estruturas cromossômicas e funções de aptidão pré-definidas;

Rotinas de pré-análise de dados;Geração automática de pontos de pseudo-ausência;GPM dinâmicas:

Análise de dados espaço-temporais.

Page 46: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

46

Roteiro

Introdução

Referencial Teórico:

Representação do espaço bi-dimensional e vizinhança espacial;

Algoritmos Genéticos;

Model Breeders;

Species Distribution Models.

SAHGA Model Breeder

SAHGA SDM

Conclusões

Referências Bibliográficas

Page 47: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

47

Referências BibliográficasAGUIAR, A. P. D. et al. Modeling spatial relations by generalized proximity matrices. In: Brazilian Symposium on Geoinformatics, 5, 2003. Campos do Jordão - SP. Anais eletrônicos... São José dos Campos: INPE, Nov. 2003. Disponível em: <http://www.geoinfo.info/geoinfo2003/papers/geoinfo2003-11.pdf>. Acesso em: 04/07/2006.

BRAGA, A. C. S. Curvas ROC: aspectos funcionais e aplicações. 2000. 243 p. Tese (Doutorado em Engenharia de Produção e Sistemas) - Universidade do Minho, Braga.

CENTRO DE REFERÊNCIA EM INFORMAÇÃO AMBIENTAL; ESCOLA POLITÉCNICA DA USP; INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS. openModeller. 2008. Disponível em: <http://openmodeller.sourceforge.net/>. Acesso em: 12/07/2008.

DE JONG, K. A. An analysis of the behavior of a class of genetic adaptive systems. 1975. 256 p. Tese (Ph. D. in Computer and Communication Sciences) - University of Michigan, Ann Arbor.

GREFENSTETTE, J. J. Optimization of control parameters for genetic algorithms. IEEE transactions on systems, man and cybernetics, v. 16, n. 1, p. 122-128, Jan./Fev. 1986.

GUISAN, A.; ZIMMERMANN, N. E. Predictive habitat distribution models in ecology. Ecological Modelling,v. 135, n. 2-3, p. 147-186, Dez. 2000.

HOLLAND, J. H. Adaptation in natural and artificial systems. Cambridge: MIT Press, 1992. 228 p.

Page 48: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

48

Referências BibliográficasKANSAS UNIVERSITY. DesktopGarp. 2007. Disponível em: <http://www.nhm.ku.edu/desktopgarp/>. Acesso em: 03/05/2008.

KIRKPATRICK, S.; GELATT, C. D.; VECCHI, M. P. Optimization by simulated annealing. Science, v. 220, n. 4598, p. 671-680, Maio 1983.

METROPOLIS, N. et al. Equation of state calculations by fast computing machines. The Journal ofChemical Physics, v. 21, n. 6, p. 1087, Jun. 1953.

MEYER, E. M. Ecological niche modelling: inter-model variation, best-subset models selection. In: Workshop on Biodiversity Data Modelling, 2005. Cidade do México. Anais eletrônicos... Copenhague: GBIF, Abr. 2005. Disponível em: <http://www.gbif.org/prog/ocb/modeling_workshop/bangalore/presentations/ENMIV>. Acesso em: 21/10/2007.

MICHALEWICZ, Z. Genetic algorithms + data structures = evolution programs. 3. ed. Berlin: Springer-Verlag, 1996. 387 p.

NIX, H. A. A biogeographic analysis of Australian elapid snakes. In: LONGMORE, R. (Ed.) Atlas of elapid snakes of Australia. Canberra: Australian government publishing service, v.7, 1986. p. 4–15. (Australianflora and fauna series).

OPENSHAW, S.; OPENSHAW, C. Artificial intelligence in geography. West Sussex: John Wiley & Sons, 1997. 348 p.

Page 49: SAHGA – Um algoritmo genético híbrido com representação ... · SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise

49

Referências BibliográficasPEDROSA, B. M. Ambiente computacional para modelagem dinâmica. 2003. 71 p. Tese (Doutorado em Computação Aplicada) - Instituto Nacional de Pesquisas Espaciais, São José dos Campos.

SANTA CATARINA, A.; BACH, S. L. Estudo do efeito dos parâmetros genéticos sobre a solução otimizada e sobre o tempo de convergência em algoritmos genéticos com codificações binária e real. Acta Scientiarum. Technology, v. 25, n. 2, p. 147-152, Jul./Dez. 2003.

SIQUEIRA, M. F. Uso de modelagem de nicho fundamental na avaliação do padrão de distribuição geográfica de espécies vegetais. 2005. 107 p. Tese (Doutorado em Ciências de Engenharia Ambiental) -Universidade de São Paulo, São Carlos.

STOCKWELL, D. R. B.; PETERS, D. The GARP modeling system: problems and solutions to automated spatial prediction. International Journal of Geographical Information Science, v. 13, n. 2, p. 143-158, Mar. 1999.