estudo de simulac˘ao de extremos espaciais com~...

25
ESTUDO DE SIMULAC ¸ ˜ AO DE EXTREMOS ESPACIAIS COM BASE EM PROCESSOS MAX-STABLE Ricardo Alves de OLINDA 1 Vitor Augusto OZAKI 2 Blanchet JULIETTE 3 Paulo Justiniano RIBEIRO JUNIOR 4 RESUMO: A maioria dos modelos matem´aticos desenvolvidos para eventos raros ao baseados em modelos probabil´ ısticos para extremos. Embora as ferramentas para modelagem estat´ ıstica de extremos univariados e multivariados estejam bem desenvolvidas, a extens˜ao dessas ferramentas para modelar extremos espaciais integra uma ´area de pesquisa em desenvolvimento muito ativa atualmente. Uma abordagem natural para tal modelagem ´ e a teoria de extremos espaciais e os processos max-stable, caracterizando-se pela extens˜ao de dimens˜oes infinitas da teoria de valores extremos multivariados e consequentemente, verificando-se a dependˆ encia extrema por meio do coeficiente extremo. Neste trabalho descreve-se a simula¸ ao de tais processos em diferentes configura¸c˜oes, de forma que possa contribuir na modelagem associada aos mapas de riscos de extremos espaciais. Verifica-se tamb´ em o comportamento isotr´ opico e anisotr´opico desses modelos via simula¸ ao Monte Carlo, implementando-se nesses modelos novas fun¸c˜ oes de correla¸c˜ ao existentes na geoestat´ ıstica. Os modelos propostos consideram o espa¸co euclidiano e uma transforma¸c˜ ao denominada espa¸co clim´ atico. Essa metodologia baseia-se no teorema proposto por De Haan (1984) e nos modelos de Smith (1990) e Schlather (2002). Estimativas s˜ao realizadas por meio da axima verossimilhan¸ ca pareada, comparando-se o comportamento das estimativas dos parˆ ametros em estudo. Assintoticamente ´ e vi´avel a simula¸ ao de extremos espaciais com base em processos max-stable, tendo em vista a possibilidade de diagnosticar padr˜oes de eventos extremos, possibilitando-se, por exemplo, identificar por meio de mapas os 1 Universidade Estadual da Para´ ıba – UEPA, Departamento de Estat´ ıstica, CEP: 58429-500, Campina Grande, PB, Brasil. E-mail: [email protected] 2 Universidade de S˜ao Paulo USP, Escola Superior de Agricultura “Luiz de Queiroz”, Departamento de Ciˆ encias Exatas, CEP: 13418-900, Piracicaba, S˜ao Paulo, Brasil. E-mail: [email protected] 3 Ecole Polytechnique ed´ erale de Lausanne, EPFL-FSB-MATHAA-STAT, Station 8, 1015 Lausanne, Switzerland, E-mail: [email protected] 4 Universidade Federal do Paran´ a – UFPR, Centro Polit´ ecnico Jardim das Am´ ericas, Departamento de Estat´ ıstica, CEP: 81531-990, Curitiba, Paran´ a, Brasil. E-mail: [email protected] 132 Rev. Bras. Biom., S˜ao Paulo, v.31, n.1, p.132-156, 2013

Upload: lamminh

Post on 19-Jan-2019

218 views

Category:

Documents


0 download

TRANSCRIPT

ESTUDO DE SIMULACAO DE EXTREMOS ESPACIAIS COMBASE EM PROCESSOS MAX-STABLE

Ricardo Alves de OLINDA1

Vitor Augusto OZAKI2

Blanchet JULIETTE3

Paulo Justiniano RIBEIRO JUNIOR4

RESUMO: A maioria dos modelos matematicos desenvolvidos para eventos raros

sao baseados em modelos probabilısticos para extremos. Embora as ferramentas

para modelagem estatıstica de extremos univariados e multivariados estejam bem

desenvolvidas, a extensao dessas ferramentas para modelar extremos espaciais integra

uma area de pesquisa em desenvolvimento muito ativa atualmente. Uma abordagem

natural para tal modelagem e a teoria de extremos espaciais e os processos max-stable,

caracterizando-se pela extensao de dimensoes infinitas da teoria de valores extremos

multivariados e consequentemente, verificando-se a dependencia extrema por meio

do coeficiente extremo. Neste trabalho descreve-se a simulacao de tais processos

em diferentes configuracoes, de forma que possa contribuir na modelagem associada

aos mapas de riscos de extremos espaciais. Verifica-se tambem o comportamento

isotropico e anisotropico desses modelos via simulacao Monte Carlo, implementando-se

nesses modelos novas funcoes de correlacao existentes na geoestatıstica. Os modelos

propostos consideram o espaco euclidiano e uma transformacao denominada espaco

climatico. Essa metodologia baseia-se no teorema proposto por De Haan (1984) e nos

modelos de Smith (1990) e Schlather (2002). Estimativas sao realizadas por meio da

maxima verossimilhanca pareada, comparando-se o comportamento das estimativas dos

parametros em estudo. Assintoticamente e viavel a simulacao de extremos espaciais com

base em processos max-stable, tendo em vista a possibilidade de diagnosticar padroes de

eventos extremos, possibilitando-se, por exemplo, identificar por meio de mapas os

1Universidade Estadual da Paraıba – UEPA, Departamento de Estatıstica, CEP: 58429-500,Campina Grande, PB, Brasil. E-mail: [email protected]

2Universidade de Sao Paulo – USP, Escola Superior de Agricultura “Luiz de Queiroz”,Departamento de Ciencias Exatas, CEP: 13418-900, Piracicaba, Sao Paulo, Brasil. E-mail:[email protected]

3Ecole Polytechnique Federale de Lausanne, EPFL-FSB-MATHAA-STAT, Station 8, 1015Lausanne, Switzerland, E-mail: [email protected]

4Universidade Federal do Parana – UFPR, Centro Politecnico Jardim das Americas, Departamentode Estatıstica, CEP: 81531-990, Curitiba, Parana, Brasil. E-mail: [email protected] Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013

efeitos direcionais resultantes de fenomenos meteorologicos. Sendo assim, estametodologia podera ser importante para a gestao adequada de riscos e catastrofesambientais nos paıses que tem a sua economia profundamente dependente doagronegocio.

PALAVRAS-CHAVE: Funcao de correlacao; coeficiente extremo; espaco climatico;

simulacao monte carlo.

1 Introducao

A maioria dos modelos matematicos desenvolvidos para eventos raros saobaseados em modelos probabilısticos para extremos, ajustando-se aos dadospor meio de tecnicas estatısticas. Estudos comprovam que essas tecnicas saoinsuficientes para lidar com a tarefa de modelar extremos georeferenciados, ouseja, extremos espaciais (SMITH et al., 2009). Extremos espaciais referem-se aum elemento teorico que pode ser definido como uma tecnica que busca descreveros padroes existentes nos dados espaciais e estabelecer, preferencialmente, de formaquantitativa, o relacionamento entre as diversas variaveis geograficas e seus extremos(SANG e GELFAND, 2009; KUNIHAMA et al., 2011; KOJADINOVIC et al.,2012). Uma metodologia capaz de avaliar essa tecnica e o processo max-stable(SCHLATHER e TAWN, 2003; HASHORVA, 2006; SMITH e STEPHENSON, 2009;COLES e TAWN, 1991; COLES, 1993).

O processo max-stable surge de uma generalizacao infinito-dimensional dateoria de valores extremos(TVE ) que, por sua vez, fornece uma generalizacaonatural das estruturas de dependencia extrema em espacos contınuos. Os processosmax-stable foram desenvolvidos, inicialmente, por De Haan em 1984. A partir daı,varios autores, tais como, Smith (1990), Schlather (2002), Kabluchko, Schlathere De Haan (2009), Ribatet (2011), Davison e Gholamrezaee (2011), Blanchet eDavison (2011), desenvolvem o processo max-stable no sentido de torna-lo maisflexıvel em sua aplicacao. Aplicacoes recentes para dados de precipitacao podemser encontrados em Buishand (2008), Smith (2009), Padoan e Ribatet (2010),Davison et al. (2012) e Olinda et al.(2013), extremos de neve Blanchet e Lehning(2010), Blanchet e Davison (2011) e dados de temperatura maxima Davison eGholamrezaee (2011). Kojadinovic et al. (2012) propoem uma classe de bondade deajustes baseando-se em testes de comparacoes entre estimadores nao-parametricose estimadores parametricos. Davison et al. (2012) analisam os progressos recentesda modelagem estatıstica de extremos espaciais e os principais elementos da teoriade valores extremos e da geoestatıstica.

A modelagem estatıstica de extremos espaciais pode ser utilizada parasolucionar uma serie de problemas reais, tanto no ambiente urbano como emtematicas rurais. Em muitas regioes do Brasil tem-se observado um aumento nafrequencia de eventos extremos que, em parte, explicam o numero crescente dedesastres naturais, como deslizamentos de terras e inundacoes, que sao responsaveispor um numero alarmante de mortes nas grandes cidades e por catastrofes no setor

Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013 133

agrıcola, tornando o segmento de financas e seguro rural sensıveis as mudancasclimaticas. Dessa forma, faz-se necessario verificar a presenca ou a ocorrencia dealteracoes na variabilidade do clima em escala local, para que se tenha mais acuraciaem afirmar a ocorrencia ou nao de catastrofes ambientais na regiao estudada(GALAMBOS, 1987).

Este trabalho tem os seguintes objetivos: descrever um algoritmo de simulacaopara extremos espaciais com base em processos max-stable; propor novas funcoesde correlacao a tais processos, em conjunto com a estimacao por maximaverossimilhanca pareada; avaliar o comportamento dos modelos de extremosespaciais considerando-se o processo isotropico1 e anisotropico2 e por fim, descreverpor meio de mapas, a variabilidade e o extremo espacial dos efeitos direcionaisextremos resultantes de fenomenos meteorologicos.

2 Processo max-stable

O processo max-stable e uma extensao da teoria de valores extremosmultivariados (HSING et al., 2004). Devido a isso, para o caso de dimensoesinfinitas, ao tentar ajustar esse processo, depara-se com o mesmo problema quese tem nos ajustes finito dimensional, sendo assim, antes de analisar este problema,faz-se uma breve revisao dos principais aspectos da teoria de extremos univariadoe multivariado e posteriormente, desenvolve-se este processo aos modelos propostosnesta pesquisa.

2.1 Teoria de valores extremos para variaveis aleatorias univariadas

Teorema 1 (Teorema de Fisher-Tippett) Seja Mn = max(Y1, Y2, . . . , Yn) emque Yi, i = 1, 2, . . . , n, sao variaveis aleatorias independentes e identicamentedistribuıdas (i.i.d.). Para algumas sequencias numericas (constantes em n) an > 0e bn ∈ R, tem-se que

limn→∞

(FY (y))n

= P(a−1n (Mn − bn) ≤ y

) d−→ Z(y), (1)

para alguma variavel aleatoria Z nao degenerada 3. Reciprocamente, cada funcaode distribuicao Z do tipo valor extremo aparece como um dos limites em (1) e defato, aparece quando Z e, ela mesma, a funcao de distribuicao de cada Yi.

Pelo Teorema 1 pode-se, entao, estimar a distribuicao assintotica de Mn−bnan

diretamente da famılia Z sem fazer nenhuma referencia a distribuicao de Y pois

1Um fenomeno diz-se isotropico quando a magnitude do vetor de distancias permanecerconstante, qualquer que seja a direcao deste vetor.

2Quando o fenomeno em estudo revela diferentes padroes de dependencia espacial, ou seja,apresenta uma variabilidade que nao e a mesma em todas as direcoes, o fenomeno em estudo echamado de anisotropico.

3Quando a massa de probabilidade de uma variavel aleatoria esta centrada em um unico valor davariavel aleatoria a mesma e definida como variavel aleatoria degenerada, caso contrario, define-secomo variavel aleatoria nao degenerada.

134 Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013

tem-se que a distribuicao Z (que corresponde a distribuicao dos maximos Mn =max(Y1, . . . , Yn) em que Yi, i = 1, . . . , n, sao variaveis aleatorias i.i.d.) convergepara um dos tres tipos de distribuicoes de valores extremos, Gumbel, Frechet ouWeibull. A expressao seguinte incorpora os tres tipos de distribuicoes de valoresextremos

Z (y;µ, σ, ξ) = exp

{−[1− ξ (y − µ)

σ

]1/ξ}, (2)

em que 1 − ξ (y − µ) /σ > 0, σ > 0 e µ e σ arbitrario. Outros resultados teoricose exemplos cujas distribuicoes pertencem a cada um dos tres domınios da atracaopodem ser encontrados em Leadbetter et al. (1983), Resnick (1987), Galambos(1987), Kotz e Nadarajah (2000).

2.2 Teoria de valores extremos para variaveis aleatorias multivariadas

Suponha que {Yi = (Yi1, . . . , YiK) , i = 1, 2, . . .} seja um processo aleatorioK -dimensional com funcao de distribuicao distribuicao F (y) = F (y1, . . . , yK) =P {Yik ≤ yk, k = 1, . . . ,K}. Seja Mn = (Mn1, . . . ,MnK) denotado o vetor demaximos pareados, em que Mnk = max {Yik, 1 ≤ i ≤ n}. Se existem constantesde normalizacao an > 0, bn ∈ R de tal forma que

P {Mn ≤ any + bn} = P {Mnk ≤ ankyk + bnk, k = 1, . . . ,K} (3)

= Fn (an1y1 + bn1, an2y2 + bn2, . . . , anKyK + bnK)

= Fn (any + bn)d−→ Z (y) ,

como n→ ∞ e para que a distribuicao limite Z (y) seja nao degenerada e necessarioque cada Z nao degenerada pertenca a famılia generalizada de valores extremos(GEV ), entao a distribuicao Z e chamada de distribuicao K -dimensional de valorextremo multivariado e F pertence ao domınio de atracao do maximo de Z, ou seja,DAM (Z ). Outras consideracoes teoricas dessas distribuicoes encontram-se em DeHaan e Resnick (1977), De Haan (1985); Coles (2001); De Haan e Pickands (1986).

2.3 Processo max-stable e unidades marginais de Frechet

Teorema 2 Seja S um conjunto de ındices e {Yi (s)}s∈S , i = 1, . . . , n sendon repeticoes de um processo aleatorio contınuo. Suponhem-se duas sequenciasnumericas an (s) > 0 e bn (s) ∈ R tais que

limn→∞

maxni=1 Yi (s)− bn (s)

an (s)

d−→ Z(s), s ∈ S. (4)

Note que (4) nao garante a existencia do limite, uma vez que, Z pode ser umavariavel aleatoria degenerada, sendo assim, De Haan (1984) mostra que a classe dos

Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013 135

processos limitados correspondem ao processo max-stable e portanto, enfatiza seuuso para modelar maximos anuais de extremos espaciais, por exemplo.

Teorema 3 (Teorema de Haan) Seja {Yj , Uj}j≥1 um processo de Poisson

homogeneo em Rd × R+, com medida de contagem Π (·) =∑j

I(Yj ,Uj) (·) e medida

de intensidade νd(y)× u−2du, em que I(Yj ,Uj) (A) e a funcao indicadora do numero

aleatorio de pontos num conjunto limitado A ⊂ Rd ×R+, ν e uma medida positiva.Para uma funcao mensuravel f (y − s) (s ∈ S) tem-se que

∫Rd

f (y − s) νd(y) = 1,

∀s ∈ S.O processo estocastico

Z (s) = maxj=1,2,...

{Ujf (Yj − s)} , s ∈ S (5)

e um processo estacionario max-stable. O Teorema 3 e utilizado em dois metodospara simulacao de campos aleatorios max-stable e ambos surgem de processospontuais, em certo sentido, fornece o numero de eventos sobre os quais o maximo etomado. O primeiro metodo foi desenvolvido por Smith (1990), o qual representaeste processo em termos de fenomenos ambientais, por exemplo, fenomenos detempestade. O segundo metodo proposto por Schlather (2002), surge a partir decampos aleatorios Gaussianos que sao escalados pela realizacao de um processopontual.

2.4 Modelo de Smith

Teorema 4 (Modelo de Tempestade de Smith) Seja {(ηi, yi) , i ∈ N} o numerode pontos de um processo de Poisson em (0,∞)×Rd com intensidade η−2dη×νd (y),em que ν e uma medida positiva em R. Seja

{f (y, s) , y ∈ Rd, s ∈ S

}denotado uma

funcao nao-negativa, para todos os s ∈ S, ou seja∫Rd

f (y, s) νd (y) = 1.

Entao o processo aleatorio

Z∗ =

{maxi∈N

{ηif (yi, s)} , s ∈ S,}

(6)

e max-stable com unidades marginais de Frechet.Smith (1990), da a seguinte interpretacao fısica para o processo definido em

(6):

1. O espaco Rd pode ser interpretado como um espaco de “centros detempestade”, por exemplo, “locais de tempestade”;

2. A funcao f (yi, s) representa a forma de uma tempestade centrada em yi, e ηa magnitude da tempestade;

136 Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013

3. Finalmente, ηif (yi, s) representa a quantidade de chuva recebida no locals para uma tempestade de magnitude ηi centrada em s e Z∗ (·) em (6) ea precipitacao maxima observada no local s sobre um numero infinito detempestades independentes.

Suponha que S ⊆ R2 e que {Yj}j≥1 sejam pontos aleatorios em R2. ParaK ≥ 2, a funcao de distribuicao geralK -dimensional sob a representacao do processomax-stable (5) nao permite nenhuma forma analıtica fechada, isto e, conhecida, umaclasse bivariada de modelos espaciais pode ser avaliada considerando-se o modeloda Equacao (6), f , e uma densidade Gaussiana bivariada e ν e uma medida deLebesgue (PADOAN e RIBATET, 2010). Neste caso, para locais si e sj a funcaode distribuicao bivariada e definida por

P [Z (0) ≤ zi, Z (h) ≤ zj ] =

exp

[− 1

ziΦ

(a (h)

2+

1

a (h)log

zjzi

)− 1

zjΦ

(a (h)

2+

1

a (h)log

zizj

)], (7)

em que Φ e a funcao de distribuicao normal padrao, h = (si − sj)T, 0 e a

origem, a (h) =(hTΣ−1h

)1/2e Σ e a matriz de covariancias de f, com covariancia

σ12 e desvios padrao σ1, σ2 > 0.O resultado da distribuicao bivariada de Z∗ definido em (7) para duas estacoes

s1 e s1 e entao

P {Z∗ (s1) ≤ z1, Z∗ (s2) ≤ z2} =

exp

{− 1

z1Φ

(a

2+

1

alog

z2z1

)− 1

z2Φ

(a

2+

1

alog

z1z2

)}, (8)

em que a e a distancia de Mahalanobis definida por

a2 = (s1 − s2)TΣ−1 (s1 − s2) . (9)

2.5 Modelo de Schlather

Teorema 5 (Modelo de Tempestade de Schlather) Seja Y (·) um processoestacionario em Rd de tal forma que E [max {0, Y (s)}] = 1 e {ηi, i ∈ N} denotado ospontos de um processo de Poisson em R+ com medida de intensidade η−2dη. Entaoum processo estacionario max-stable com unidades marginais de Frechet pode serdefinido por

Z∗ = maxi∈N

{ηi} ×maxi∈N

{0, Yi (s)} , (10)

Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013 137

em que Yi(·) sao copias i.i.d. da variavel aleatoria Y .Tal como acontece no modelo de Smith, o processo definido na Equacao

(10) tambem tem interpretacao pratica. Imagine-se ηiYi (·) como se tratando deeventos diarios de precipitacao espacial, diferindo-se apenas em suas magnitudesηi. A diferenca desse modelo para o modelo de Smith e a nao existencia de umaforma determinıstica, ou seja, uma funcao de densidade normal multivariada paraas tempestades, mas uma forma aleatoria impulsionada pelo processo Y (·). Osmodelos de Smith e Schlather tem forte ligacao. Para ver isso, considere o casopara o qual Yi (s) = f0 (y − si) em que f0 e uma funcao densidade de probabilidadee si e um processo de Poisson homogeneo em Rd. Com esta informacao particular,o modelo (10) e identico ao modelo (6).

Pressupostos adicionais sao necessarios para obter, novamente, modelos uteisa partir de (10). Schlather (2002) propoe adotar Yi (·) como sendo a parte positivade um processo estacionario Gaussiano com funcao de correlacao ρ (h), de tal formaque E [max {0, Yi (s)}] = 1. Com esses novos pressupostos, pode-se mostrar que afuncao de distribuicao acumulada bivariada e definida por

P [Z∗ (s1) ≤ z1, Z∗ (s2) ≤ z2] =

exp

[−1

2

(1

z1+

1

z2

)(1 +

√1− 2 (ρ (h) + 1)

z1z2

(z1 + z2)2

)], (11)

em que h e um vetor de distancia euclidiana ∥s1 − s2∥ entre duas estacoes. Nestetrabalho implementa-se novas funcoes de correlacao para o modelo proposto porSchlather.

2.6 Dependencia espacial e o coeficiente extremo

Teorema 6 Seja Z(·) um campo aleatorio estacionariomax-stable com unidadesmarginais de Frechet. A dependencia extrema sobre K localizacoes fixas em S podeser resumida pelo coeficiente extremo, definido como

P [Z (s1) ≤ z, . . . , Z (sK) ≤ z] = exp

(−θKz

), (12)

em que 1 ≤ θK ≤ K com o limite inferior e o limite superior correspondendoa dependencia completa e independencia, respectivamente e portanto, fornece umamedida do grau de dependencia espacial entre as estacoes. Baseando-se no Teorema6, θK pode ser tratado, convenientemente, como o numero efetivo de estacoesindependentes.

Um caso especial da Equacao (12) e considerar o caso bidimensional docoeficiente extremo definido por

P [Z (s1) ≤ z, Z (s2) ≤ z] = exp

{−θs1s2

z

}. (13)

138 Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013

Apos Schlather e Tawn (2003), θs1s2 e chamado de funcao do coeficiente extremo,que vem a fornecer informacoes suficientes sobre a dependencia extrema em muitosproblemas praticos, embora nao caracterizam a distribuicao completa.

As funcoes do coeficiente extremo para os modelosmax-stable apresentados nasEquacoes (8) e (11) podem ser obtidas, para nao causar confusao com o processo dediferenciacao, diretamente de sua funcao de distribuicao bivariada. Substituindo-sez1 e z2 por z na Equacao (8), tem-se que

P [Z (s1) ≤ z, Z (s2) ≤ z] = exp

{−1

(a

2+

1

alog 1

)− 1

(a

2+

1

alog 1

)}= exp

{−1

zΦ(a2

)− 1

zΦ(a2

)},

conforme (7),θs1s2 = 2Φ (a/2) . (14)

A distancia de Mahalanobis a definida em (9) atribui diferentes pesos para diferentescomponentes do vetor (s1 − s2). Os casos limitantes a → 0+ e a → +∞corespondem, respectivamente, a dependencia perfeita, θs1s2 = 1, e independencia,θs1s2 = 2. Para uma dada estacao s1, superfıcies {s2 ∈ S, θs1s2 = c} estao, deacordo com (14), de tal forma que (9) e constante. Se Σ e esferica, segue-se queessas superfıcies sao cırculos em duas dimensoes e esferas em tres dimensoes. Casocontrario, elas sao elipses e elipsoides, respectivamente.

A mesma ideia pode ser empregada na Equacao (11), isto e, fazendo-se z1 =z2 = z tem-se que,

P [Z (s1) ≤ z, Z (s2) ≤ z] =

= exp

{−1

2

(1

z+

1

z

)(1 +

√1− 2 (ρ (∥s1 − s2∥) + 1)

z2

4z2

)}

= exp

{−1

z

(1 +

√2− ρ (∥s1 − s2∥)

2

)}.

de acordo com (13),

θs1s2 = 1 +

{1− ρ (∥s1 − s2∥)

2

}1/2

. (15)

Nesse caso, o coeficiente extremo envolve a distancia euclidiana entre dois locais s1e s2. Para uma dada estacao s1, as superfıcies com o mesmo coeficiente extremoc ∈ [1, 2], ou seja, superfıcies {s2 ∈ S, θs1s2 = c}, estao, de acordo com (15), de talforma que ∥s1 − s2∥ = c′. Tais superfıcies sao cırculos em duas dimensoes e esferasem tres dimensoes (BLANCHET; DAVISON, 2011).

Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013 139

2.7 Metodo de maxima verossimilhanca pareada

Como em geral dados espaciais, obtidos por meio de estacoes meteorologicas, li-dam com um numero consideravel de localidades e complexo escrever analiticamentea distribuicao conjunta (BLANCHET e DAVISON, 2011). Consequentemente,substitui o procedimento de ajuste da “maxima verossimilhanca total” pela“maxima verossimilhanca pareada”. Padoan et al. (2010) propuseram asubstituicao da verossimilhanca total por uma funcao de verossimilhanca pareada.Esta ideia tambem e usada por Blanchet e Davison (2011), Davison e Gholamrezaee(2011), Davison et al. (2012) e por Olinda et al. (2013).

Seja K = {s1, . . . , sK} ⊂ S denotando-se os pontos amostrais, por exemplo,estacoes meteorologicas cujos maximos sao usados para ajustar os modelos aos

dados. Seja z(i)d denotado o d -esimo maximo observado para a i -esima estacao,

transformado de maneira que a serie temporal(z(i)1 , . . . , z

(i)D

)em cada estacao tenha

distribuicao de Frechet unitaria, aqui d ∈ {1, . . . , D}. Seja L(ψ; z) a funcao deverossimilhanca para o i -esimo e j -esimo local, em que i = 1, . . . ,K − 1 e j =i+ 1, . . . ,K, sendo K o numero de estacoes dentro da regiao de estudos S. Entaoo logaritmo da funcao de verossimilhanca pareada pode ser escrito como

ℓp

(ψ; z

(i)d , z

(j)d

)= log

[L(ψ; z

(i)d , z

(j)d

)]=∑i<j

D∑d=1

logf(z(i)d , z

(j)d ;ψ

), (16)

em que cada f(z(i)d , z

(j)d ;ψ

)e uma funcao de densidade de probabilidade

marginal bivariada, baseando-se nos dados, que encontram-se no i -esimo e j -esimo local. A fim de limitar o comportamento caracterizado por um processomax-stable (5) que exige distribuicoes de Frechet unitarias, considera-se a bijecao(Y

(i)d , Y

(j)d

)= g

(Z

(i)d , Z

(j)d

)na Equacao (16). O primeiro somatorio e sobre todos

os pares distintos de estacoes, ou seja, todos os termos K(K − 1)/2.Pode ser demonstrado, utilizando-se expansao em serie de Taylor, o Teorema

Central do Limite e a Lei Fraca dos Grandes Numeros (DAVISON, 2003), que aEquacao (16) implica em

ψ∼N(ψg,H (ψg)

−1J (ψg)H (ψg)

−1), (17)

em que ψg e o valor que minimiza a Informacao de Kullback–Leibler 4, J (ψg) e avariancia da funcao escore e H (ψg) e a informacao de Fisher.

O uso do metodo da maxima verossimilhanca pareada e um caso especıficodo procedimento de estimacao por maxima verossimilhanca completa, com atrativo

4A Informacao de Kullback–Leibler e uma medida da similaridade entre o modelo estatıstico e averdadeira distribuicao dos dados. Assume-se que a distribuicao dos dados seja g(y) e que o modeloestatıstico proposto para aproximar g(y) seja f (y), entao KL(f ; g) = E{log g(Y )}−E{log f(Y )},satisfazendo: (i) KL(f ; g) ≥ 0 e (ii) I(f ; g) = 0, se e somente se, g(y)=f (y).

140 Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013

de envolver algumas simplificacoes no processo. A tıtulo de ilustracao, considere ogradiente do logaritmo da funcao de verossimilhanca pareada,

∇ℓp (y;ψ) =∑i<j

D∑d=1

∇ log f(y(i)d , y

(j)d ;ψ

),

para cada i e j fixo,

D∑d=1

= ∇ log f(y(i)d , y

(j)d ;ψ

)= 0,

e um estimador nao viesado, ou seja, ∇ℓp (y;ψ) e nao viesado tambem para umacombinacao linear de estimadores nao viesados. Isto leva a uma modificacao naEquacao (17).

ψ∼N(ψ,H (ψ)

−1J (ψ)H (ψ)

−1), D → ∞,

ou seja,

H(ψ) = −∑i<j

D∑d=1

∂2 log f(y(i)d , y

(j)d ;ψ

)∂ψ∂ψT

; (18)

J(ψ) =∑i<j

D∑d=1

∂ log f(y(i)d , y

(j)d ;ψ

)∂ψ

∂ log f(y(i)d , y

(j)d ;ψ

)∂ψT

, (19)

em que H (ψ) = E[∇2ℓp (ψ,Y )

](Matriz de informacao de Fisher) e J (ψ) =

V ar [ℓp (ψ,Y )] sao as esperancas com respeito as densidades completas (varianciada funcao escore).

Na pratica, para obter os “erros padrao”, calculam-se os estimadores de H(ψ)

e J(ψ), o estimador de H(ψ) e obtido por H ˆ(ψ) = ∇2ℓp(ψ;y); isto e, a matriz

Hessiana avaliada em ψ. Normalmente, “otimizadores padrao” sao capazes deobter estimadores baseados em diferencas finitas para H(ψ) de modo que nenhum

trabalho adicional e necessario para obter H ˆ(ψ). J(ψ) pode ser obtido utilizando-se

o estimador J ˆ(ψ) = ∇ℓp(ψ;y)∇ℓp(ψ;y)T

2.8 Algoritmo de estimacao do modelo

Para estimar os parametros por meio da maxima verossimilhanca pareadarequer a maximizacao da Equacao (16) com respeito aos R-esimos parametros domodelo. Blanchet e Davison (2011) constataram que a funcao optim do software Rnao apresentou resultados satisfatorios para aplicacao em profundidade maxima deneve na Suıca: a superfıcie de ℓp apresentou muitos maximos locais. Sendo assim,adotou-se o algoritmo proposto por Blanchet e Davison (2011), descrito a seguir.Dado um conjunto de (R− 1) parametros ψ−r, pode-se encontrar o valor ψ−r quemaximiza a funcao de uma variavel ℓp

(·,ψ−r

), por meio do algoritmo iterativo:

Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013 141

1. Dar “chutes” iniciais ao vetor de parametros ψ = (ψ1, . . . , ψR)T;

2. Para j em 1, . . . , R:a) Encontrar os valores que maximizam ψ a funcao de verossimilhanca pareadacom respeito a magnitude ψr, considerando a ordem dos parametros, ψ−r,

fixos, isto e, ψr = argmaxψr

ℓp(ψr,ψ−r

);

b) Entao atualiza-se o j -esimo componente de ψ para ψ;

3. Ir ao passo 2, quando nao houver mudanca em algum ψr incrementando ologaritmo da funcao de verossimilhanca pareada.

2.9 Criterio de Informacao Takeuchi - TIC

Quando varios modelos M1,M2, . . ., sao ajustados aos dados, quer-se saberqual se deve preferir para a modelagem de nossos dados. Se dois modelos temexatamente a mesma maximizacao do logaritmo da funcao de verossimilhanca, deve-se preferir aquele que tem menos parametros, porque ele tera uma menor variancia.No entanto, se esses dois modelos diferem apenas por uma pequena variabilidade,para esta pequena variabilidade vale a pena ter parametros adicionais? Pararesponder a esta questao, recorre-se a Informacao de Kullback-Leibler.

Define-se uma amostra aleatoria Y1, . . . , Yn (variaveis aleatorias i.i.d.) extraıdade uma densidade desconhecida g, ignorando-se g, ajusta-se o modelo estatısticof(y;ψ), maximizando-se o logaritmo da funcao de verossimilhanca. A Informacaode Kullback-Leibler mede a discrepancia do modelo ajustado f a partir do unico everdadeiro modelo g, isto e,

KL(fψ , g

)=

∫log

(g (y)

f (y; g)

)g (y) dy. (20)

Consequentemente, para a selecao de modelos, escolhe-se modelos queminimizem KL(fψ , g). Porem, KL(fψ , g) nao e suficiente como uma medida

para discriminar modelos, tendo em vista que, varios modelos podem satisfazerKL(fψ , g). Para resolver este problema suponha que disponha de uma estimativa

de ψ, precisa-se da media KL(f ˆψ, g) sobre a distribuicao de ψ. Intuitivamente,

por causa de sua maior variancia amostral, sera penalizado modelos que possuemum maior numero de parametros ψ do que aqueles com menos parametros.

Usa-se o fato de que ψg minimiza a Informacao de Kullback-Leibler, entao, aderivada parcial em relacao a ψ pode ser escrita da seguinte forma

Eg

[KL

(f ˆψ

, g)]

.= KL

(fψ , g

)− 1

2tr{J(ψg

)−1H(ψg

)}, (21)

em que H(ψg

)e definido pela Equacao (20).

Ao utilizar o estimador de maxima verossimilhanca pareada trabalha-se soberro de especificacao, portanto, o AIC nao e apropriado. Outro estimador da

142 Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013

Equacao (21), que permite o erro de especificacao, e o Criterio de InformacaoTakeuchi (TAKEUCHI, 1976), definido por

TIC = −2ℓ(ψ)− 2tr

{JH−1

}.

Em conformidade com o AIC, o melhor modelo correspondera aquele que minimizaa Equacao (21).

3 Resultados e discussao

Descreve-se neste capıtulo alguns resultados preliminares do comportamentodos modelos via simulacao, verificando-se o comportamento isotropico e anisotropicodos modelos de Smith e Schlather, descritos nas secoes 2.4 e 2.5 respectivamente,associando-se o grau de dependencia espacial por meio do coeficiente extremodescrito na secao 2.6.

3.1 Estudo de simulacao do processo max-stable

No estudo de simulacao assume-se que os pontos aleatorios {Uj}j≥1 de um

processo de poisson homogeneo pertencem ao R2, de modo que, o campo aleatorioseja definido no plano, sendoW um conjunto compacto. A simulacao de um processoestacionario max-stable nao e tao simples, tendo em vista que envolve a definicao doTeorema 3. Consequentemente, a representacao espectral de um processomax-stableenvolve os maximos sobre uma sequencia infinita de pontos {Yj , Uj}j≥1. Mas, emsituacoes praticas o numero de pontos gerados tem que ser, necessariamente, finito.No entanto, a simulacao de um processo max-stable pode ser realizada sob algumascondicoes particulares, conforme Schlather (2002) tem demonstrado. A princıpio, asimulacao de um campo aleatorio max-stable consiste das seguintes etapas essenciaisresumidas neste algoritmo iterativo.

Algoritmo iterativo: Simulacao de M realizacoes de um campo aleatoriomax-stable:

1. Definir uma grid regular ou irregular de K pontos (localizacoes) em R2;

2. Definir um conjunto W ⊆ R2 com medida de Lebesgue finita |W|;

3. Gerar uma sequencia de pontos {yj}j≥1 distribuıdos uniformemente em W;

4. Simular uma sequencia u1, ..., un, n = 1, ... a partir de distribuicoesunitarias de Frechet;

5. Calcular Z (sk) = maxn {ujf (yj − sk)} , k = 1, ..., K;

6. Repetir os passos 3-5 M vezes.

A fim de realizar simulacoes do processo max-stable, define-se uma amostra noconjunto W com um numero finito de pontos {Yj , Uj}j≥1. Maiores detalhes podem

ser vistos em Schlather (2002).

Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013 143

3.2 Simulacao do Modelo de Smith

Nesta secao, por meio de simulacoes, avaliam-se varias formas de dependenciaextrema do modelo de tempestade de Smith definido na Equacao (21) caracterizadopor meio da matriz de covariancias Σ, incluindo-se variacoes de dependencia sobo processo isotropico e anisotropico, a fim de avaliar as propriedades de amostrasfinitas do estimador de maxima verossimilhanca pareada (Tabela 1). Os resultadosda simulacao para estas diversas estruturas podem ser visualizados na Figura 1. Amatriz de covariancias Σ tem interpretacoes intimamente relacionadas aos dadosmeteorologicos e define diretamente a dependencia extrema. Em particular, oestudo e direcionado assumindo-se que o modelo e de valor extremo Gaussiano,os parametros do modelo sao σ1, σ2 e σ12, que definem a matriz de covariancias deuma distribuicao normal bivariada. Note que, para locais fixos, sobre a regiao deestudos, a matriz de covariancias determina a dependencia espacial forte, moderada,mediana dos eventos extremos entre as localizacoes.

Table 1 - Configuracoes da modelagem de extremos espaciais (isotropico eanisotropico) sob processos max-stable utilizando-se diferentes matrizesde covariancias (Σ)

Estrutura da dependencia espacial σ21 σ2

2 σ12 ρΣ1 500 500 0 0Σ2 300 500 0 0Σ3 300 500 150 0,38Σ4 800 1000 500 0,40Σ5 2000 3000 1500 0,55Σ6 40 60 20 0,61

As K estacoes meteorologicas definem diretamente a dependencia extremano mapa do estado do Parana, as simulacoes sao executadas usando-se uma gridirregular de pontos (localizacoes) ao longo dessa regiao. Na pratica, gera-sepontos aleatorios a partir de uma variavel uniforme sobre um intervalo [a, b] paracada eixo e, em seguida estas realizacoes definem o plano de coordenadas dessespontos. Seis modelos de Smith sobre o processo max-stable sao simulados comdiferentes matrizes de covariancias Σ: mesmo peso de variancias em ambas direcoes(Σ1), diferentes pesos de variancias em ambas direcoes (Σ2), correlacao espacial(Σ3), mediana correlacao espacial (Σ4), moderada correlacao espacial (Σ5), fortecorrelacao espacial (Σ6). As matrizes Σ1 e Σ2 representam o caso isotropico,conforme visto na Figura 1. Pode-se tambem observar na Figura 2, os graficosde contornos, que por sua vez, definem os coeficientes extremos em ambos os casosisotropico e anisotropico. Utiliza-se tecnicas de simulacao com aproximacao diretada decomposicao de Cholesky.

O caso anisotropico surge quando Σ nao e esferica, isto e, Σ nao e escrita naforma Σ = σ2IK , em que σ2 > 0 e IK e uma matriz identidade de K localizacoes.O resultado da anisotropia geometrica (por exemplo, Journel e Huijbregts, 1978)

144 Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013

Figure 1 - Seis configuracoes do modelo de Smith nos casos isotropicos eanisotropicos no espaco bidimensional, sob o processo max-stable comdiferentes matrizes de covariancias (Σ).

pode ser visto calculando-se o coeficiente extremo definido na Equacao (14). Emmuitos conjuntos de dados, existem maiores continuidades de valores ao longo decertas direcoes do que de outras. Nestes modelos anisotropicos, o peso maior e dadoas amostras alinhadas com a direcao de maxima continuidade, compensando mesmoum maior afastamento em termos de distancia geometrica.

A decomposicao espectral da matriz de covariancias Σ, pode ser escrita comoΣ = UΛUT , em que U e a matriz de rotacao e Λ e a matriz diagonal de autovalorespositivos, na qual pode ser escrita como:

Σ−1 = UTΛ−1U =(Λ−1/2U

)T (Λ−1/2U

), (22)

em que Λ−1/2 denota a matriz diagonal composta da raiz quadrada recıproca deelementos da diagonal de Λ. Se λ1 denota o primeiro elemento da matriz Λ, entao

(22) pode ser escrita como Σ−1 = λ−11 V TV , em que V = λ

1/21 Λ−1/2U . A distancia

de Mahalanobis definida na Equacao (9) pode ser escrita como

a2 =1

λ1(s1 − s2)

TV TV (s1 − s2) =

1

λ1[V (s1 − s2)]

TV (s1 − s2) ,

que e exatamente o que existe entre s1 = V s1 e s2 = V s2 no caso isotropico, istoe, quando se usa uma matriz de covariancias esferica K -dimensional λ1IK em (21).

Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013 145

Figure 2 - Seis configuracoes do coeficiente extremo nos casos isotropicos eanisotropicos do modelo de Smith, no espaco bidimensional, sob oprocesso max-stable com diferentes matrizes de covariancias (Σ).

Sendo assim, o modelo anisotropico de Smith em S (aqui denotado pelo estado doParana), e justamente o modelo de Smith no espaco transformado S = V S.

A Tabela 2 resume o desempenho dos estimadores da matriz de covarianciasΣ, baseando-se em K=100 localizacoes e N=200 observacoes, isto e, para cadalocalizacao, sao geradas n repeticoes independentes a partir do processo max-stablee tambem ajusta-se o modelo usando-se o mesmo numero de observacoes para cadalocal. Estimativas e desvios padrao foram obtidos utilizando-se o metodo de maximaverossimilhanca pareada, baseando-se em 1.000 simulacoes reportadas para cadaestrutura de dependencia espacial. O logarıtmico da funcao de verossimilhanca,dado K localizacoes, e composto de K(K − 1)/2 pares distintos.

Para K grande a maximizacao da funcao de verossimilhanca e computacional-mente exigente, por isso, em alguns casos pode ser necessario implementar umalinguagem de programacao mais geral, por exemplo, a linguagem C em favorda reducao do tempo computacional. Uma boa correspondencia com os valoresverdadeiros e alcancada. Nao ha evidencias de vies, mesmo nos casos em que seesperava um menor desempenho, como no caso da forte e moderada dependenciaespacial. Esta e uma boa informacao pois outros metodos, como por exemplo,o proposto por de Haan e Pereira (2006) executa um mal desempenho no casode dependencias moderadas. Estes resultados corroboram com Padoan (2008)ao realizar um estudo de simulacao sobre o processo max-stable para extremosespaciais. Os mesmos resultados foram obtidos por Padoan et al. (2010), quando

146 Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013

Table 2 - Estimativas das variancias e covariancias e desvios padrao da matrizΣ, sob o processo max-stable, para o modelo de Smith. Erros padraoencontram-se dentro de parenteses e os valores verdadeiros estao dentrode colchetes

σ21 σ2

2 σ12

Σ1 : 477,82(20,27)[500] 488,11(21,35)[500] 15,86(14,63)[0]Σ2 : 324,42(14,12)[300] 505,08(21,85)[500] -5,56(12,61)[0]Σ3 : 315,68(13,66)[300] 496,28(21,49)[500] 96,14(12,79)[150]Σ4 : 872,52(36,91)[800] 1008,01(43,19)[1000] 533,67(32,01)[500]Σ5 : 1995,32(84,75)[2000] 2429,27(62,18)[3000] 1439,53(67,03)[1500]Σ6 : 40,69(1,72)[40] 61,50(2,66)[60] 31,34(1,80)[20]

estudaram o desempenho do criterio de verossimilhanca composta, proposto porVarin e Vidoni (2005), para o ajuste do modelo de Smith no processo max-stable.

De modo geral, o algoritmo de simulacao que esta sendo implementado nesteartigo apresenta resultados satisfatorios, permitindo-se uma modelagem simultaneados parametros marginais e da dependencia no contexto espacial. A simulacaopor meio da funcao de maxima verossimilhanca pareada para extremos espaciais,sob o processo max-stable, permite, por exemplo, identificar e observar alteracoes defenomenos climaticos e meteorologicos de pequena e grande escala, possibilitando-sequantificar por meio de mapas os efeitos associados aos processos isotropicos eanisotropicos. Sendo assim, esta metodologia podera ser importante para a gestaoadequada de riscos e catastrofes ambientais nos paıses que tem a sua economiaprofundamente dependente do agronegocio.

Na Tabela 3 apresentam-se o desempenho dos estimadores da matriz decovariancias Σ sob diferentes configuracoes no que se refere ao conjunto de dados(N = 10, 50, 100, 500) e com diferentes numeros de localizacoes (K = 10, 50, 100).Estao listados os resultados baseando-se em 1.000 simulacoes sob o enfoque deextremos espaciais, considerando-se a matriz de covariancias Σ3. Como esperado,as simulacoes apontam para existencia de uma moderada variacao quando N epequeno, e uma pequena variancia para N grande. Sendo assim, pode-se observarque, para uma amostra fixa, o numero de localizacoes nao tem impacto sobre osresultados da estimacao. No entanto, pode-se observar que o aumento do numerode localizacoes nao tem muito efeito sobre as estimativas mas, uma reducao davariabilidade pode ser observada. Por exemplo, uma comparacao entre 50 e 200localizacoes com 50 observacoes na Tabela 3, particularmente mostra que, com ocrescente numero de localizacoes as estimativas de variancia diminuem.

3.3 Simulacao do Modelo de Schlather

Examinam-se varias formas de dependencia extrema com o modelo detempestade de Schlather definido na Equacao (15). Seis simulacoes desse modelocom S correspondendo ao estado do Parana e apresentado na Figura 3, comas seguintes funcoes de correlacao Matern, Cauchy e Powered Exponential. Os

Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013 147

Table 3 - Estimativas das variancias e covariancias e desvios padrao (em parenteses)da matriz de covariancias Σ3, com diferentes numeros de observacoes (N )e localizacoes (K ) sob o modelo de Smith

K N=50 N=100 N=200 N=400 parametros

σ21

50 285,43(11,97) 285,43(11,97) 285,43(11,97) 285,43(11,97)300

100 307,08(12,02) 307,08(12,02) 307,08(12,02) 307,08(12,02)200 373,07(71,69) 320,41(21,00) 320,41(21,00) 320,41(21,00)

σ22

50 509,74(20,58) 509,74(11,27) 509,74(20,58) 509,74(20,58)500

100 491,70(21,25) 491,70(12,08) 491,70(21,25) 491,70(21,25)200 574,10(25,64) 527,09(30,54) 527,09(30,54) 527,09(30,54)

σ1250 141,58(11,27) 141,58(20,58) 141,58(11,27) 141,58(11,27)

150100 152,43(12,08) 152,43(21,25) 152,43(12,08) 152,43(12,08)200 181,80(15,41) 157,98(18,54) 157,98(18,54) 157,98(18,54)

graficos da parte superior da Figura 3 representam o caso isotropico. Pode-severificar a isotropia calculando-se o coeficiente extremo definido na Equacao (9).A metodologia implementada no modelo de Smith, pode ser utilizada no modelo deSchlather, aplicando-se o espaco transformado S = HS, em que se pode adotar oespaco tridimensional

H =

cosϑ −senϑ 0c2senϑ c2 cosϑ 0

0 0 c3

c2 e c3 ∈ R∗+, (23)

como para o modelo de Smith, o angulo ϑ define o efeito da dependencia direcional.Blanchet e Davison (2011) adotam o termo espaco climatico para o espaco

transformado S = HS na qual a isotropia e alcancada. Neste trabalho adota-se omesmo termo para o espaco transformado. Os graficos da parte inferior da Figura 3ilustram o espaco climatico transformado, permitindo-se uma anisotropia para omodelo de Schlather, com a mesma matrix H, correspondente ao caso anisotropicoda Figura 1, em comparacao com os graficos da parte inferior da Figura 3, ocoeficiente extremo corresponde as elipses, que por sua vez, permite modelos deefeitos direcionais. Observar-se na Figura 4, os graficos de contornos, que por suavez, definem os coeficientes extremos em ambos os casos isotropicos e anisotropicos.

A anisotropia geometrica induzida pela matriz H e um caso especial doalcance da anisotropia (ZIMMERMAN, 1993). No ambito nao-extremo, essa ideiafoi estendida aos modelos nao geometricos anisotropicos, na qual as covarianciasaninhadas sao usadas como parametros de alcance em diferentes direcoes, mas emgeral isso nao define uma funcao de covariancia valida. Ecker e Gelfand (2003)introduziram o produto de geometria anisotropica, em que as funcoes de covarianciasao produtos geometricos de covariancias anisotropicas. Transformacoes de espacotambem foram usados por Sampson e Guttorp (1992) para o modelo nao estacionariocom estruturas de covariancia espacial, permitindo transformacoes mais complexasdo que a transformacao considerada nesse trabalho.

Alem desses metodos globais, os metodos locais para modelagem da anisotropiae formas mais gerais de nao estacionariedade tambem existem, estes podem ser

148 Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013

Figure 3 - Oito configuracoes do modelo de Schlather sob o espaco bidimensionalcom funcoes de correlacao: Whittle-Matern, Powered Exponential,Cauchy e Whittle-Matern, da esquerda para direita, respectivamente

Figure 4 - Oito configuracoes do coeficiente para o modelo de Schlather sobo espaco bidimensional com funcoes de correlacao: Whittle-Matern,Powered Exponential, Cauchy e Whittle-Matern, da esquerda paradireita, respectivamente.

divididos em tres grandes famılias (SCHABENBERGER e GOTWAY, 2005).A abordagem de espaco movel proposta por Haas (1990), estima uma funcaode covariancia local na vizinhanca. O metodo de ponderacao em processosestacionarios (FUENTES, 2001) permite escrever a funcao de covariancia naoestacionaria como uma mistura ponderada de covariancias isotropicas, onde os pesosdependem da localizacao.

Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013 149

Fuentes et al. (2010) usam uma mistura de processos de Dirichlet5 como basepara uma aproximacao mais flexıvel via copulas para modelagem espaco-temporal detemperaturas extremas, mas nao corresponde a um modelo de processo max-stable.Seria muito valioso aplicar essas ideias no contexto max-stable, mas as dificuldadesde implementacao de uma funcao de verossimilhanca completa parece ser um grandeobstaculo (BLANCHET; DAVISON, 2011). A ideia de transformacao do espacofoi proposta por Cooley, Nychka e Naveau (2007) na modelagem de precipitacaonos Estados Unidos, em vez de usar as coordenadas geograficas tridimensionais(longitude, latitude, altitude) na localizacao das estacoes, os autores trabalhamem um “espaco climatico”, ou seja, o espaco bidimensional dado pela altitude eprecipitacao media para os meses de Abril a Outubro.

Ao contrario de Cooley, Nychka e Naveau (2007), Blanchet e Davison (2011)atribuem transformacoes de valores finitos a grandezas finitas, dando mais pesopara altitude atraves de c3, e definindo uma direcao principal de dependencia aolongo do eixo ϑ. Neste trabalho adota-se a metodologia utilizada por Blanchet eDavison (2011), um espaco de dimensao superior pode, evidentemente, ser utilizadopara S. Em particular, pode-se utilizar o espaco de quatro dimensoes (longitude,latitude, altitude e media de precipitacao). A dependencia entre pares de estacoesdiminui quando a distancia aumenta, uma maneira de modelar regioes fracamentedependente e aumentar a distancia entre elas. Isto pode ser feito por meio da adicaode uma coordenada em S igual a 0 na regiao Norte, e 1 na regiao Sul.

Se outras coordenadas forem consideradas, isto e, longitude, latitude, altitude,entao a matriz H da transformacao do espaco climatico definido na Equacao (23)pode ser escrita no caso mais geral, como uma matriz 4 × 4 com uma coluna deelementos 0. No entanto, por razoes computacionais, pode ser melhor considerar arotacao da matriz U , conforme visto na Equacao (22) , como sendo uma matriz derotacao no plano (latitude, longitude) e, assim, para definir

H =

cosϑ − sinϑ 0 0c2 sinϑ c2 cosϑ 0 0

0 0 c3 00 0 0 c4

.

No espaco climatico em quatro dimensoes S = HS, o quadrado dadistancia entre duas estacoes s1 e s2 e {H (s1 − s2)}T {H (s1 − s2)}, mas a quartacoordenada de s1 − s2 e 0 se as duas estacoes pertencerem a mesma regiao. Oquadrado da distancia pode ser igual ao espaco climatico (longitude, latitude,altitude) se as duas estacoes estiverem na mesma regiao. Sendo assim, aumenta-sea distancia entre as regioes climaticas e, portanto, diminui-se a dependenciaentre elas, sem aumentar a distancia entre as estacoes da mesma regiao. Diantedo exposto pode-se observar, tanto o modelo de Smith quanto no modelo de

5Em matematica, sobretudo na analise real, a funcao de Dirichlet, em honra a Johann PeterGustav Lejeune Dirichlet, fornece um exemplo de funcao que e descontınua em todos os pontosdo domınio. A funcao de Dirichlet e um exemplo de funcao real limitada que nao e integravel aRiemann.

150 Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013

Schlather, sob o pressuposto de isotropia e anisotropia, que os processos max-stablesao assintoticamente plausıveis para modelagem de extremos geograficos e naidentificacao de mapas de riscos. Estes modelos fornecem otimas funcoes, a fim demelhor compreender, prever e quantificar riscos ambientais. Este fato e corroboradopor Olinda et al. (2013) ao aplicarem a teoria de extremos espaciais aos dados deprecipitacao maxima mensal do estado do Parana. Os referidos autores atentam naimportancia de se trabalhar em um espaco transformado, ou seja, espaco climatico,de modo a permitir a anisotropia no modelo proposto por Schlather (2002).

Comentarios finais

Considera-se os modelos e metodos descritos ao longo deste trabalho como umpasso para uma modelagem mais flexıvel de maximos espaciais, em concordanciacom o paradigma classico em processos max-stable e distribuicoes espaciaisextremas. Estas abordagens envolvem os seguintes passos:

1. construcao de um modelo marginal generalizado de valor extremo paralocalizacoes sobre valores maximos que permite a extrapolacao para osmaximos em todo o domınio espacial, permitindo-se transformar os maximosa partir de sua escala original para uma distribuicao em unidades marginaisde Frechet;

2. construcao de um modelo espacial sobre o processo max-stable para valoresmaximos transformados, levando-se em consideracao a sua dependenciaespacial por meio de uma funcao de covariancia apropriada;

3. ajuste de maxima verossimilhanca pareada do modelo indicado por 1 e 2, comselecao de modelo usando-se criterios de informacao;

4. avaliacao do ajuste desses modelos utilizando-se o coeficiente extremo pareadoem diferentes localizacoes;

Embora o surgimento natural, a partir da construcao probabilıstica do processomax-stable, na transformacao da etapa (1) possa parecer estranho, tendo emvista que, a interpretacao da escala em unidades marginais de Frechet e apenasindiretamente ligada ao processo fısico subjacente, os resultados demonstramboa aplicabilidade no contexto espacial. A modelagem conjunta de parametros,juntamente com o bom comportamento dos estimadores, tudo a um custocomputacional moderado, tornaram-se os principais benefıcios deste trabalho. Aimplementacao dos metodos utilizados encontram-se nos pacotes SpatialExtremes(RIBATET, 2011) e geoR (RIBEIRO Jr e DIGGLE, 2001) do software R (RDevelopment Core Team, 2013), com modificacoes em alguns codigos para quese pudesse concluir o processo de simulacao. A novidade esta em utilizaresses metodos, de maneira explıcita, em funcoes de correlacao existentes nageoestatıstica, considerando-se o processo isotropico e anisotropico. Os codigosencontram-se disponıveis no apendice do trabalho de tese de Olinda (2012),

Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013 151

no seguinte endereco: http://www.teses.usp.br/teses/disponiveis/11/11134/tde-17092012-103936/pt-br.php

O processo de simulacao utilizado neste trabalho apresentou resultadossatisfatorios sendo bastante rapido e robusto, permitindo uma boa eficienciacomputacional na modelagem de observacoes extremas. Sendo assim, aimplementacao de novas funcoes de correlacao ao processo max-stable podera,por exemplo, auxiliar na identificacao de alteracoes de fenomenos climaticos emeteorologicos em pequena e grande escala, possibilitando-se quantificar por meiode mapas os efeitos associados aos processos isotropicos e anisotropicos, auxiliandona modelagem de efeitos direcionais resultantes de fenomenos ambientais.

Agradecimentos

Os autores agradecem a Fundacao Escola Nacional de Seguros- FUNENSEGpela bolsa de doutorado concedida a Ricardo Alves de Olinda e aos dois revisorespelos comentarios e sugestoes que muito contribuıram para melhorar a qualidadedo trabalho.

OLINDA, R. A.; OZAKI, V. A.; JULIETTE, B; RIBEIRO JR, P. J. Simulationstudy based on spatial extremes max-stable processes. Rev. Bras. Biom., SaoPaulo, v.31, n.1, p.132-156, 2013.

ABSTRACT:

The most mathematical models developed for rare events are based on probabilistic

models for extremes. Although the tools for statistical modeling of univariate and

multivariate extremes are well-developed, the extension of these tools to model spatial

extremes data is currently a very active area of research. A natural approach for such

modeling is the theory of extreme spatial and max-stable process, characterized by

infinite dimensional extension of multivariate extreme value theory, check the extreme

dependence through the extreme coefficient. This article describes the simulation. This

work describe the simulation of such processes in different configurations, so that it

can contribute to the modeling associated risk maps for spatial extremes. Checking

also the isotropic and anisotropic behavior of these models via Monte Carlo simulation,

by implementing the new correlation functions these models existing in geostatistics.

The proposed models consider the Euclidean space and a transformation called climatic

space, which makes it possible to explain the presence of directional effects resulting from

synoptic weather patterns. This methodology is based on the theorem proposed by De

Haan (1984) and Smith (1990) models and Schlather (2002). Estimates are performed

using maximum pairwise likelihood, comparing the behavior of the estimates of the

parameters under study. Asymptotically is viable the simulation of spatial extremes

based in max-stable processes, possibiliting of diagnosis extreme events, enabling, for

example, identify by maps directional effects resulting from meteorological phenomena.

Therefore, this methodology could be important for the appropriate management of

environmental risks and disasters in countries that have their economy deeply dependent

of the agribusiness.

152 Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013

KEYWORDS: Correlation function; extreme coefficient; climatic space; Monte Carlo

simulation.

References

BUISHAND, T. A.; DE HANN L.; ZHOU, C. On spatial extremes: with applicationto a rainfall problem, Ann. Appl. Stat., Beachwood, v.2, n.2, p.624–642, 2008.

BLANCHET, J.; LEHNING, M. Mapping snow depth return levels: smooth spatialmodeling versus station interpolation, Hydrol. Earth Syst. Sci., Gottingen, v.14,n.12, p.2527–2544, 2010.

BLANCHET, J.; DAVISON, A. C. Spatial modelling of extreme snow depth, Ann.Appl. Stat.tics, Beachwood, v.5, n.3, p.1699-1725, 2011.

BROYDEN, C.G. Quasi-newton methods and their application to functionminimization, Math. Comput., Providence, v.21, p.368–381, 1967.

COLES, S. G. Regional modeling of extreme events via max-stable processes, J. R.Stat. Soc., London, v.55, p.797-816, 1993.

COLES, S. G. An introduction to statistical modelling of extreme values, New York:Springer, 2001. 221p.

COLES, S. G.; TAWN, J. A. Modelling extreme multivariate events, J. R. Stat.Soc. Series B (Methodol.), London, v.53, n.2, p.377-392, 1991.

COOLEY, D.; NAVEAU, P.; PONCET, P. Variograms for spatial max-stablerandom fields. New York: Springer, 2006. v.187, p.373-390.

COOLEY, D.; DAVIS, R. A.; NAVEAU P. Prediction for max-stable processes viaan approximated conditional density. Fort Collins: Department of Statistics, 2007.23p.

COOLEY, D.; NYCHKA, D.; NAVEAU, P. Bayesian spatial modeling of extremeprecipitation return levels, J. Am. Stat. Assoc., London, v.102, p.824–840, 2007.

DAVISON, A. C. Statistical models. New York: Cambridge University Press, 2003.738p.

DAVISON, A. C.; HINKLEY, D. V. Bootstrap methods and their application. NewYork: Cambridge University Press, 1997. 834p.

DAVISON, A. C.; GHOLAMREZAEE, M. M. Geostatistics of extremes. J. R. Soc.Series A, London, v.3, p.581-608, 2011.

DAVISON, A. C.; PADOAN, S.; RIBATET, M. Statistical modelling of spatialextremes (with discussion), Stat. Sci., Bethesda, v.27, n.2, p.161-186. 1012.

DE HAAN, L. A spectral representation for max-stable processes. Ann. Probab.,Beachwood, v.12, p.1194-1204, 1984.

Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013 153

DE HAAN, L. Extremes in higher dimensions: the model and some statistics.Session of the International Statistical Institute, The Hague: InternationalStatistical Institute, 1985. v.8, p.26-36.

DE HAAN, L.; RESNICK, S. I. Limit theory for multivariate sample extremes.Springer, Verlag, v.40, p.317-337, 1977.

DE HAAN, L.; PICKANDS, J. Stationary min-stable stochastic processes. Probab.Theory Relat. Fields, New York, v.72, p.477-492, 1986.

DE HAAN, L.; PEREIRA, A. E. Spatial extremes: Models for the stationary case.Ann. Stat., Philadelphia, v.34, n.1, p.146-168, 2006.

DE HAAN, L.; ZHOU, C. On extreme value analysis of a spatial process. Stat. J.,Philadelphia, v.6, n.1, p.71–81, 2008.

DIGGLE, P. J.; RIBEIRO Jr., P. J. Model-Based geostatistics. New York: Springer,2007. 230p.

ECKER, M. D.; GELFAND, A. E. Spatial modeling and prediction under stationarynon-geometric range anisotropy. Environ. Ecol. Stat., New York, v.10, n.1, p.165-178, 2003.

FISHER, R. A.; TIPPETT, L. H. C. Limiting forms of the frequency distribution ofthe largest or smallest member of a sample. Proc. Camb. Philos. Soc., Cambridge,v.24, p.180–190, 1928.

FUENTES, M.; HENRY, J.; REICH, B. Nonparametric spatial models for extremes:Application to extreme temperature data. Extremes, New York, v.16, p.75-101, 2013

GALAMBOS, J. Asymptotic theory of extreme order statistics. Florida: Krieger,1987. 414p.

GENTON, M. G.; MA, Y.; SANG, H. On the likelihood function of gaussian max-stable processes, Biometrika, London, v.87, p.1-8, 2011.

GRUNENFELDER, C.; DAVISON, A. C. Prediction based on pairwise likelihood.2010. 62p. Master (Thesis) - Ecole Polytechnique Federale de Lausanne: Lausanne,2010.

HABERLANDT, U. Geostatistical interpolation of hourly precipitation from raingauges and radar for a large-scale extreme rainfall event. J. Hydrol., MarylandHeights, v.332, p.144-157, 2007.

HASHORVA, E. A novel class of bivariate max-stable distributions. Stat. Probab.Lett., Maryland Heights, v.76, p.1047–1055, 2006.

HSING, T.; KLUPPELBERG, C.; KUHN, G. Dependence estimation andvisualization in multivariate extremes with applications to financial data. Extremes,New York, v.7, p.99–121, 2004.

JOUNEL, A.; HUIJBREGTS, C. Mining geostatistics. New York: Academic Press,1978. 305p.

154 Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013

KABLUCHKO, Z.; SCHLATHER, M.; DE HAAN, L. Stationary max-stablefields associated to negative definite functions, Ann. Probab., Beachwood, v.37,p.2042–2065, 2009.

KOJADINOVIC, I.; SHANG, H.; YAN, J. A class of goodness-of-fit tests for spatialextremes models based on max-stable processes. Estat. ME, p.1-32, 2012.

KOTZ, S.; NADARAJAH, S. Extreme value distributions: Theory and applications.London: Imperial College Press, 2000. 190p.

KUNIHAMA, T.; OMORI, Y.; ZHANG, Z. Efficient estimation and particle filterfor max-stable processes. J. Times Ser. Anal., London, v.74, p.1-20, 2011.

LEADBETTER, M. R.; LINDGREN, G.; ROOTZEN, H. Extremes and relatedproperties of random sequences and processes. New York: Springer, 1983. 346p.(Series in statistics).

OLINDA, R. A. Modelagem estatıstica de extremos espaciais com base em processosmax-stable aplicados a dados meteorologicos no estado do Parana. 2012. 164p. Tese(Doutorado em Estatıstica e Experimentacao Agronomica) - Escola Superior deAgricultura Luiz de Queiroz, Universidade de Sao Paulo, Piracicaba, 2012.

OLINDA, R. A.; BLANCHET, J.; OZAKI, V. A.; RIBEIRO Jr, P. J. Spatialmodeling applied to extreme precipitation data in the State of Parana. 164p.Disponıvel em: ¡prof [email protected]¿. 2013.

RIBEIRO Jr, P. J.; DIGGLE, P. J. GeoR: a package for geostatistical analysisR-NEWS, v.1, p.15-18. Disponıvel em: ¡http://CRAN.R-project.org/doc/Rnews¿,2001.

PADOAN, S.; RIBATET, M.; SISSON, S. Likelihood-based inference for max-stableprocesses, Am. Stat. Assoc., Podova, v.105, p.263-277, 2010.

POON, S.; ROCKINGER, M.; TAWN, J. Extreme value dependence in financialmarkets: Diagnostics, models, and financial implications. Rev. Financial Stud.,Taiwan, v.17, p.581–610, 2004.

R DEVELOPMENT CORE TEAM. R: a language and enviroment for statisticalcomputing. Vienna: R Foundation for Statistical Computing. Disponıvel em:¡http://www.R-project.org¿. Acesso em: 05 jan. 2013.

RESNICK, S. I. Extreme values, regular variation, and point processes. New York:Springer, 1987. 320p.

RIBATET, M. SpatialExtremes: modelling spatial extremes. Lausane, 2011. 108p.

ROOTZEN, H. Extremes of moving averages of stable processes. Ann. Probab.,Beachwood, v.6, p.847-869, 1978.

SAMPSON, P. D.; GUTTORP, P. Nonparametric estimation of nonstationaryspatial covariance structure. J. Am. Stat. Assoc., London, v.87, n.417, p.108-119,1992.

SANG, H.; GELFAND, A. E. Continuous spatial process models for spatial extremevalue. J. Agric., Biol. Environ. Stat., London, v.15, n.1, p.49–65, 2009.

Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013 155

SCHLATHER, M. Models for stationary max-stable random fields. Extremes, NewYork, v.5, p.33-44, 2002.

SCHLATHER, M.; TAWN, J. A. A dependence measure for multivariate and spatialextreme values: properties and inference, Biometrika, London, v.90, n.1, p.139–156,2003.

SMITH, R. L. Max-stable processes and spatial extremes. Unpublished. p.1-32, 1990.

SMITH, E. L.; STEPHENSON, A. G. An extended gaussian max-stable processmodel for spatial extremes, J. Stat. Plann. Infer., New York, v.139, n.4,p.1266–1275, 2009.

SMITH, R. L.; TEBALDI, C.; NYCHKA, D.; MEARNS, L. O. Bayesian modelingof uncertainty in ensembles of climate models. JASA, New York, v.104, p.97-116,2009.

TAKEUCHI, K. Distribution of informational statistics and a criterion of modelfitting. Suri–Kagaku Mathematic Sci.), Tokyo, v.153, p.12–18, 1976.

VARIN, C. On composite marginal likelihoods. Adv. Stat. Anal., New York, v.92,p.1–28, 2008.

WEBSTER, R.; OLIVER, M. Geostatistics for environmental scientists, London:John Wiley, 2001. 271p.

ZIMMERMAN, D. Another look at anisotropy in geostatistics. Math. Geol.,Edmonton, v.25, n.4, p.453-470, 1993.

Recebido em 20.05.2013.

Aprovado apos revisao em 05.08.2013.

156 Rev. Bras. Biom., Sao Paulo, v.31, n.1, p.132-156, 2013