modelos de regress˜ao para distribui¸c˜oes zaig …neste caso, ℓ1(β) ´e a func¸˜ao de...

6
Modelos de regress˜ ao para distribui¸c˜oes ZAIG com dados longitudinais: algumas t´ ecnicas de diagn´ostico Maria Kelly Venezuela ([email protected]) Rinaldo Artes ([email protected]) Insper - Instituto de Ensino e Pesquisa 1 Introdu¸c˜ ao Em muitas situa¸ c˜oespr´aticas,´ e comum a existˆ encia de vari´aveis geradas por meio de combina¸ c˜aode vari´aveis discretas e cont´ ınuas. A distribui¸ c˜ao ZAIG (Zero-adjusted inverse gaussian) ´ e uma distri- bui¸ c˜ao de probabilidade n˜ao-negativa e semi-cont´ ınua, com probabilidade positiva de assumir o valor zero e que, para valores maiores do que zero, comporta-se como uma distribui¸ c˜ao normal inversa (Jong e Heller, 2008). No caso de estudos transversais, a estima¸ c˜ao de modelos de regress˜ao para vari´aveis respostas ZAIG pode ser feita por meio da biblioteca GAMLSS criada para a plataforma R (www.r-project.org). No presente trabalho, s˜ ao desenvolvidas t´ ecnicas diagn´ osticas para modelos de regress˜ao para parˆ ametros de distribui¸ c˜oes multivariadas com distribui¸ c˜oes marginais ZAIG, estimados por meio de fun¸ c˜oesdeestima¸ c˜aoan´ alogas ` as fun¸ c˜oesdeestima¸ c˜ao de independˆ encia propostas por Liang e Zeger (1986). As t´ ecnicas de diagn´ostico baseiam-se nos trabalhos de Venezuela et al. (2007) e Venezuela (2008), que consideram equa¸ c˜oes de estima¸ c˜ao para modelos de regress˜ao com dados longitudinais, entretanto, definidas apenas para vari´aveis respostas cont´ ınuas. Algumas dessas t´ ecnicas s˜ ao aqui estendidas para o caso em que h´a mistura de uma distribui¸ ao discreta com uma cont´ ınua, como ´ eo caso da distribui¸ c˜aoZAIG. Na pr´oxima se¸ c˜ao,s˜ ao apresentados conceitos b´asicos sobre fun¸ c˜oes de estima¸ c˜ao. Na Se¸ c˜ao2, apresentamos modelos de regress˜ao para distruibui¸ c˜oes ZAIG com dados longitudinais. A proposta deste trabalho est´a apresentada na Se¸ c˜ao 3 que envolve a defini¸ c˜ao de algumas medidas de diagn´ostico capazes de detectar poss´ ıveis pontos influentes ou aberrantes quando os dados em painel s˜ ao modelados por uma ZAIG. Na ´ ultima se¸ c˜ao, esses resultados s˜ ao ilustrados com uma aplica¸ c˜ao a dados reais para an´ alise da taxa de mortalidade no trˆansito em munic´ ıpios da regi˜ ao sudeste no per´ ıodo de 2000 a 2002. Esses dados foram extra´ ıdos do site IPEADATA: www.ipeadata.gov.br. 1.1 Fun¸ c˜oesdeestima¸c˜ ao Nesta se¸ c˜ao, introduzimos alguns conceitos sobre fun¸ c˜oes de estima¸ c˜ao baseados em Artes e Botter (2005) e Jørgensen e Labouriau (1994). Uma fun¸ c˜aodeestima¸ c˜ao ψ ´ e uma fun¸ c˜ao dos dados (y) e dos parˆ ametros de interesse (θ). Sejam A i (θ), i =1,...,n, matrizes n˜ao estoc´asticas, n˜ao singulares e de pesos que, eventualmente, podem ser fun¸ c˜aode θ. Sejam a i = a i (y i ; θ), i =1,...,n, vetores com m´ edia zero mutuamente independentes, satisfazendo as mesmas condi¸ c˜oes das fun¸ c˜oes de estima¸ c˜ao regulares (ver Artes e Botter (2005), por exemplo). Crowder (1987) mostra que a fun¸ ao de estima¸c˜ ao ´ otima dentre as da classe das fun¸ c˜oes de estima¸ c˜aolineares´ e dada por Ψ o (θ)= n i=1 A o i (θ) a i (y i ; θ), (1) 1

Upload: others

Post on 18-May-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Modelos de regressao para distribuicoes ZAIG com

dados longitudinais: algumas tecnicas de diagnostico

Maria Kelly Venezuela ([email protected])Rinaldo Artes ([email protected])

Insper - Instituto de Ensino e Pesquisa

1 Introducao

Em muitas situacoes praticas, e comum a existencia de variaveis geradas por meio de combinacao devariaveis discretas e contınuas. A distribuicao ZAIG (Zero-adjusted inverse gaussian) e uma distri-buicao de probabilidade nao-negativa e semi-contınua, com probabilidade positiva de assumir o valorzero e que, para valores maiores do que zero, comporta-se como uma distribuicao normal inversa(Jong e Heller, 2008). No caso de estudos transversais, a estimacao de modelos de regressao paravariaveis respostas ZAIG pode ser feita por meio da biblioteca GAMLSS criada para a plataforma R(www.r-project.org).

No presente trabalho, sao desenvolvidas tecnicas diagnosticas para modelos de regressao paraparametros de distribuicoes multivariadas com distribuicoes marginais ZAIG, estimados por meio defuncoes de estimacao analogas as funcoes de estimacao de independencia propostas por Liang e Zeger(1986). As tecnicas de diagnostico baseiam-se nos trabalhos de Venezuela et al. (2007) e Venezuela(2008), que consideram equacoes de estimacao para modelos de regressao com dados longitudinais,entretanto, definidas apenas para variaveis respostas contınuas. Algumas dessas tecnicas sao aquiestendidas para o caso em que ha mistura de uma distribuicao discreta com uma contınua, como e ocaso da distribuicao ZAIG.

Na proxima secao, sao apresentados conceitos basicos sobre funcoes de estimacao. Na Secao 2,apresentamos modelos de regressao para distruibuicoes ZAIG com dados longitudinais. A propostadeste trabalho esta apresentada na Secao 3 que envolve a definicao de algumas medidas de diagnosticocapazes de detectar possıveis pontos influentes ou aberrantes quando os dados em painel sao modeladospor uma ZAIG. Na ultima secao, esses resultados sao ilustrados com uma aplicacao a dados reais paraanalise da taxa de mortalidade no transito em municıpios da regiao sudeste no perıodo de 2000 a 2002.Esses dados foram extraıdos do site IPEADATA: www.ipeadata.gov.br.

1.1 Funcoes de estimacao

Nesta secao, introduzimos alguns conceitos sobre funcoes de estimacao baseados em Artes e Botter(2005) e Jørgensen e Labouriau (1994).

Uma funcao de estimacao ψ e uma funcao dos dados (y) e dos parametros de interesse (θ). SejamAi(θ), i = 1, . . . , n, matrizes nao estocasticas, nao singulares e de pesos que, eventualmente, podem serfuncao de θ. Sejam ai = ai(yi;θ), i = 1, . . . , n, vetores com media zero mutuamente independentes,satisfazendo as mesmas condicoes das funcoes de estimacao regulares (ver Artes e Botter (2005), porexemplo). Crowder (1987) mostra que a funcao de estimacao otima dentre as da classe das funcoesde estimacao lineares e dada por

Ψo(θ) =n

i=1

Aoi (θ) ai(yi;θ), (1)

1

sendo Aoi (θ) =

[

E(

∂ai∂θ

)⊤Cov(ai)

−1

]

, com Cov(ai) = Var(ai)1/2R(ai)Var(ai)

1/2, em que R(ai) e a

verdadeira matriz de correlacao de ai, para i = 1, . . . , n e t = 1, . . . , Ti.

Sob condicoes gerais de regularidade (Artes e Botter, 2005), demonstra-se que estimador de θ, θ,

obtido a partir da raiz da funcao de estimacao Ψ e consistente e que√

n(θn − θ) D−→ Np

(

0,J−1Ψ (θ)

)

,sendo

Jn(θ) = limn→∞

n S⊤n (θ) V−1

n (θ) Sn(θ), (2)

com Sn(θ) =∑n

i=1Sψi (θ)

n e Vn(θ) =∑n

i=1Vψi

(θ)

n , em que Sψi(θ) = E

∂ψi(yi;θ)

∂θ⊤

e Vψi(θ) =

E

ψi(yi;θ)ψ⊤i (yi;θ)

.

O processo iterativo para calcular θ pode ser expresso por

θ(m+1)

= θ(m) − S−1(θ

(m)) Ψ(θ

(m)), (3)

em que m = 0, 1, 2, ... e o numero de iteracoes. O ındice m no lado direito das equacoes acima indicaque as matrizes e os vetores sao atualizados pelas estimativas de θ da m-esima iteracao.

2 Modelos de regressao ZAIG com dados em painel

Admita uma amostra de tamanho n, sendo que cada unidade amostral tenha sido observada em Tinstantes de tempo; admita tambem independencia entre observacoes de diferentes unidades amos-trais. Assuma que yit corresponda ao valor da variavel resposta para a unidade amostral i no ins-tante de tempo t, i = 1, . . . , n e t = 1, . . . , T e que yit segue uma distribuicao ZAIG com yit =

0, com probabilidade νit,Cit, com probabilidade (1 − νit),

, sendo Cit uma variavel aleatoria contınua, cuja funcao densi-

dade de probabilidade e dada por fit = f(yit; µit, σit) =(√

2πy3itσit

)−1

exp[

−(yit − µit)2/(2yitµ

2itσ

2it)

]

,

em que µit e o parametro de posicao e σit, o de dispersao.

A funcao densidade de probabilidade de yit pode ser escrita como

pit = p(yit; νit, µit, σit) =

νIyit=0

it (1 − νit)Iyit>0

fIyit>0

it

, (4)

sendo Iy∈A uma variavel indicadora que recebe o valor 1 se y pertence ao conjunto A. De acordo comMartinez (2008), escrever pit como a equacao (4) a deixa fatorada em dois termos: o primeiro quedepende apenas de νit e envolve todo o suporte definido para a variavel resposta; e o segundo quedepende de µit e σit e envolve apenas a parte contınua da variavel resposta.

Associados a yit, considere a existencia de tres vetores coluna de covariaveis fixas xit, zit e qit dedimensoes p, q e r, respectivamente, tais que g1(νit) = x⊤

itβ, g2(µit) = z⊤itγ e g3(σit) = q⊤itδ, sendo

β, γ e δ vetores parametricos e g1, g2 e g3 funcoes de ligacao contınuas, inversıveis e duplamentediferenciaveis, com i = 1, . . . , n e t = 1, . . . , T .

Se considerarmos o vetor de parametros θ = (β⊤,γ⊤, δ⊤)⊤, no caso de total independencia entretodas observacoes, a funcao de verossimilhanca para a funcao densidade de probabilidade definida

em (4) fica dada por L(θ) = L1(β)L2(γ, δ), em que L1(β) =∏ni=1

∏Tt=1 ν

Iyit=0

it (1 − νit)Iyit>0 e

L2(γ, δ) =∏

i,t:yit>0 fIyit>0

it .

Martinez (2008) destaca que a funcao de verossimilhanca tambem fica fatorada em dois termos,ja que o componente discreto L1(β) envolve apenas os parametros utilizados para modelar a proba-bilidade de ocorrencia de zero e o componente contınuo L2(γ, δ) envolve os parametros usados paramodelar a distribuicao condicional da variavel resposta no caso contınuo.

O logaritmo da funcao de verossimilhanca para θ = (β⊤,γ⊤, δ⊤)⊤ e da forma

ℓ(θ) = ℓ1(β) + ℓ2(γ, δ), (5)

2

em que

ℓ1(β) =n

i=1

T∑

t=1

ℓit(νit) =n

i=1

T∑

t=1

[

Iyit=0 ln(νit) + Iyit>0 ln(1 − νit)]

,

ℓ2(γ, δ) =∑

i,t:yit>0

ℓit(µit, σit) =∑

i,t:yit>0

− ln

(

2πy3it

)

− ln (σit) −(yit − µit)

2

2yitµ2itσ

2it

.

Neste caso, ℓ1(β) e a funcao de log-verossimilhanca de um modelo com resposta binaria e ℓ2(γ, δ), deum modelo com resposta contınua.

A seguir, os resultados acima serao estudados em dois contextos: o primeiro em que o parametrode dispersao e constante e o segundo em que se modela o parametro de dispersao como funcao de umvetor de covariaveis.

2.1 Homogeneidade do parametro de dispersao

Nesta secao, assuma que σit = σ e que ha independencia entre as observacoes.

Para a construcao da equacao de estimacao correspondente a θ1 = (β⊤,γ⊤, σ)⊤, elaboramos umvetor ai com as propriedades descritas para a funcao de estimacao otima (1). Considerando a funcaode log-verossimilhanca definida em (5), notamos que a estimacao de β depende apenas de ℓ1(β).Assim, definimos aβi = (i − νi)

⊤, em que i = (Iyi1=0, . . . , IyiT=0)⊤ e νi = (νi1, . . . , νiT )⊤,

para todo i = 1, . . . , n e t = 1, . . . , T . Ja a estimacao do vetor (γ⊤, σ)⊤ depende apenas daparte fatorada ℓ2(γ, σ) definida na funcao de log-verossimilhanca. Neste caso, definimos aγi =(∂ℓi1(µi1, σ)/∂µi1, . . . , ∂ℓiT (µiT , σ)/∂µiT )⊤ e aσi = (∂ℓi1(µi1, σ)/∂σ, . . . , ∂ℓiT (µiT , σ)/∂σ)⊤, conside-rando aqui apenas os ındices i e t quando a resposta yit for maior do que zero, isto e, i, t : yit > 0.

A consequencia disso e que as funcoes de estimacao construıdas para γ e σ a partir de (1) tambemdependerao apenas das respostas yit maiores do que zero. Para construir uma unica funcao de es-timacao para os tres vetores parametricos β, γ e σ que dependa de todas as respostas yit, comi = 1, . . . , n e t = 1, . . . , T , utilizamos uma proposicao desenvolvida em Martinez (2008, ProposicaoA.1.1, p.108).

Com isso, a funcao de estimacao correspondente a θ1 fica expressa por:

Ψ1(θ1) =n

i=1

A1ia1i =n

i=1

M⊤1iΛ1iΩ

−1i a1i =

n∑

i=1

X⊤i H1iV1i(i − νi)

Z⊤i H2iV2i(yi − µi)1⊤T V3i(si − σi)

,

sendo M1i = diag Xi,Zi,1T , Λ1i = diag H1i,H2i, IT , Ωi = diag

V−11i , IT , IT

e

a1i =(

a⊤βi,a

⊤γi,a

⊤δi

)⊤=

(

(i − νi)⊤, (V2i(yi − µi))⊤, (V3i(si − σi))⊤)⊤

, com Xi = (xi1, . . . ,xiT )⊤,

Zi = (zi1, . . . , ziT )⊤, H1i = diag

∂νit∂g1(νit)

, H2i = diag

∂µit∂g2(µit)

Iyit>0

, V−11i = diagνit(1 −

νit), V2i = diag

σ−2∗it µ−3∗

it

, V3i = diag

σ−3∗it

, yi = (yi1, . . . , yiT )⊤, µi = (µ∗i1, . . . , µ

∗iT )⊤,

si = (si1, . . . , siT )⊤, σi = (σ2∗i1 , . . . , σ2∗

iT )⊤, 1T e um vetor unitario de ordem T , IT e uma matrizidentidade de ordem T e diagat indica uma matriz diagonal cujo t-esimo elemento da diagonal

principal e dado por at. Ainda, temos que µe∗it =

0, se yit = 0µeit, se yit > 0

, σe∗it =

0, se yit = 0σe, se yit > 0

e

sit = (yit−µit)2

yitµ2it

com i = 1, . . . , n e t = 1, . . . , T .

Por (2), temos que√

n(θ1 − θ1)D−→ Np(0,J−1

1 ), com J1 = limn→∞ n S⊤1 (θ1)K

−11 (θ1) S1(θ1),

em que S1(θ1) = −∑ni=1 M⊤

1iW1iM1i e K1(θ1) =∑n

i=1 A1iΣ1iA⊤1i, sendo W1i = Λ1iΩ

−1i B1iΛ1i,

Σ1i = Cov(a1i) e

B1i =

IT 0 0

0 V2iNi 0

0 0 V4iNi

, sendo V4i = diag

2σ−2∗it

e Ni = diag (1 − νit) .

3

2.2 Heterogeneidade do parametro de dispersao

Seja θ2 = (β⊤,γ⊤, δ⊤)⊤. A funcao de estimacao correspondente a θ2, obtida sob a hipotese deindependencia entre as observacoes e sob a definicao em (1), e dada por:

Ψ2(θ2) =n

i=1

A2ia2i =n

i=1

M⊤2iΛ2iΩ

−1i a2i =

n∑

i=1

X⊤i H1iV1i(i − νi)

Z⊤i H2iV2i(yi − µi)

Q⊤i H3iV3i(si − σi)

sendo M2i = diag Xi,Zi,Qi, Λ2i = diag H1i,H2i,H3i e a2i =(

(i − νi)⊤, (V2i(yi − µi))⊤,

(V3i(si − σi))⊤)⊤

, com Qi = (qi1, . . . ,qiT )⊤, H3i = diag

∂σit∂g3(σit)

, V2i = diag

σ−2∗it µ−3∗

it

, V3i =

diag

σ−3∗it

, σi = (σ2∗i1 , . . . , σ2∗

iT )⊤ e σe∗it =

0, se yit = 0σeit, se yit > 0

, para i = 1, . . . , n e t = 1, . . . , T .

Por (2), temos que√

n(θ2 − θ2)D−→ Np(0,J−1

2 ), com J2 = limn→∞ n S⊤2 (θ2)K

−12 (θ2) S2(θ2),

sendo S2(θ2) = −∑n

i=1 M⊤2iW2iM2i e K2(θ2) =

∑ni=1 A2iΣ2iA

⊤2i, sendo W2i = Λ2iΩ

−1i B2iΛ2i,

Σ2i = Cov(a2i) e

B2i =

IT 0 0

0 V2iNi 0

0 0 V4iNi

, sendo V4i = diag

2σ−2∗it

.

3 Tecnicas de diagnostico

Considerando as propostas de Venezuela et al. (2007) e Venezuela (2008), a seguir, serao definidas paraos modelos propostos na Secao 2 algumas medidas de diagnostico mais usuais em modelos linearesgeneralizados (Paula, 2004) importantes para deteccao de pontos alavanca, influentes e aberrantes.

Reescrevendo (3) na forma de um processo iterativo de mınimos quadrados reponderados queemprega uma matriz de pesos Wi e uma variavel dependente modificada zi, na convergencia do

processo iterativo para estimar θ, temos θ =(

M⊤WM)−1

M⊤Wz, em que M = (M⊤1 , . . . ,M⊤

n )⊤,

W = diag(Wi) e z = (z⊤1 , . . . , z⊤n )⊤, com zi = τ i + (BiΛi)−1ai e τ i = Miθ.

O resıduo ordinario, que e a diferenca entre os valores observado e ajustado, fica dado por rO =

W1/2

(z− τ ) = (I−H)W1/2

z, sendo τ = (τ⊤1 , ..., τ⊤

n )⊤, I a matriz identidade e H uma matriz bloco

diagonal dada por H = diag(Hi), com Hi = W1/2i Mi(M

⊤WM)−1M⊤i W

1/2i , para todo i = 1, . . . , n.

Como W1/2

z faz o papel do vetor resposta, podemos chamar H de matriz de projecao ortogonal (oumatriz chapeu) como na regressao normal linear em que W e a identidade.

Para detectar pontos aberrantes, definimos o resıduo padronizado por (rPD)it =e⊤

(it)ˆW

1/2(z−τ )√

1−hit,

em que e(it) e um vetor de tamanho conveniente com valor 1 na posicao referente a observacao yit e 0nas demais posicoes, com i = 1, ..., n e t = 1, ..., T .

A distancia de Cook (Cook, 1977), utilizada para detectar pontos influentes, e definida por

(DC)it = (rPD)2ithit

(p+q+r)(1−hit). Se a modelagem for sob homogeneidade do parametro de dispersao,

entao r = 1.

4 Aplicacao a dados reais

Nesta secao, serao analisados dados sobre mortalidade no transito em municıpios da regiao sudeste, noperıodo de 2000 a 2002. A variavel resposta considerada na analise e: y raiz quadrada da taxa anual demortalidade por acidentes de transito por 100 mil habitantes. Ja as variaveis independentes sao: Ano,variavel categorizada que indica o ano referente a observacao (= 0, se perıodo de 2000; = 1, se perıodo

4

de 2001; e = 2, se perıodo de 2002); Lnpop, logaritmo natural do numero de habitantes no municıpio,segundo o Censo 2000; Propurb, proporcao da populacao residente na area urbana do municıpio em2000; Propmasc, proporcao de homens na populacao do municıpio em 2000; Prop2029, proporcaode residentes no municıpio com idade entre 20 e 29 anos; e IDHE, ındice de desenvolvimento humanoeducacao do municıpio em 2000.

Admitimos que a variavel resposta y possa ser modelada por uma distribuicao ZAIG sob hetero-geneidade do parametro de dispersao. Para as matrizes de covariaveis, definimos xit = zit = qit =(1, Ano01it, Ano02it, Lnpopit, Propmascit, Prop2029it, IDHEit)

⊤, com t = 1 se Ano= 2000, t = 2 seAno= 2001 e t = 3 se Ano= 2002. Alem disso, Ano01t e Ano02t sao variaveis indicadoras queassumem o valor 1, respectivamente, quando t = 2 e t = 3.

Foram ajustados os seguintes modelos: νit =exp(x⊤

itβ)

1+exp(x⊤itβ)

, µit = exp(x⊤itγ) e σit = exp(x⊤

itδ).

As estimativas pontuais do vetor de parametros θ2 foram obtidas por meio da biblioteca GAMLSSdisponıvel no software R; as correcoes nos erros-padrao e as medidas de diagnostico foram obtidas pormacros desenvolvidas nesse pacote computacional.

A Figura 1 apresenta os graficos das medidas de diagnostico (matriz de projecao, distancia deCook e resıduo padronizado) obtidas para cada um dos vetores dos parametros de regressao: β, γ eδ. Observamos que a cidade Alvaro de Carvalho (SP) e destacada como um ponto alavanca quandomodelados os tres vetores de parametros. Para modelagem da probabilidade (β), a resposta da cidadeItabira (MG) no ano de 2002 e considerada influente e aberrante; para modelagem da media (γ), temosas cidades de Serra da Saudade (MG) e Josenopolis (MG), ambas no ano de 2001 se destancando nosgraficos da distancia de Cook e resıduo padronizado. Na modelagem da dispersao (δ), e influente eaberrante a informacao oriunda da cidade Barra do Turvo (SP), ano 2000.

Referencias

Artes, R. e Botter, D. A. (2005). Funcoes de Estimacao em Modelos de Regressao, 9a Escola deModelos de Regressao - ABE, Sao Pedro - SP.

Cook, R. D. (1977). Detection of influential observations in linear regressions, Technometrics 19: 15–18.

Crowder, M. (1987). On linear and quadratic estimating function, Biometrika 74: 591–597.

Jong, P. e Heller, G. Z. (2008). Generalized Linear Models for Insurance Data, Cambridge UniversityPress.

Jørgensen, B. e Labouriau, R. S. (1994). Exponential families and theoretical inference, Lecture notes,University of British Columbia.

Liang, K.-Y. e Zeger, S. L. (1986). Longitudinal analysis using generalized linear models, Biometrika

73: 13–22.

Martinez, R. O. (2008). Modelos de regressao beta inflacionados, Tese de doutorado, IME-USP, SaoPaulo. 158p.

Paula, G. A. (2004). Modelos de regressao com apoio computacional, Notas de aulas, Departamentode Estatıstica, Universidade de Sao Paulo.URL: http://www.ime.usp.br/∼giapaula/mlgs.html

Venezuela, M. K. (2008). Equacao de estimacao generalizada e influencia local para modelos de

regressao beta com medidas repetidas, Tese de doutorado, IME-USP, Sao Paulo. 153p.

Venezuela, M. K., Botter, D. A. e Sandoval, M. C. (2007). Diagnostic techniques in generalizedestimating equations, Journal of Statistical Computation and Simulation 77: 879–888.

5

Medidas de diagnostico para modelagem da PROBABILIDADE (β)

0 1000 2000 3000 4000 5000

0.00

00.

005

0.01

00.

015

0.02

00.

025

Índice i

H p

or o

bser

vaçã

o

( Álvaro de Carvalho , SP , 2000 )( Álvaro de Carvalho , SP , 2001 )

0 1000 2000 3000 4000 5000

0.00

00.

002

0.00

40.

006

0.00

80.

010

0.01

2

Índice i

Dis

tânc

ia d

e C

ook

( Itabira , MG , 2002 )

0 1000 2000 3000 4000 5000

−5

05

1015

Índice i

Res

íduo

pad

roni

zado

( Itabira , MG , 2002 )

Medidas de diagnostico para modelagem da MEDIA (γ)

0 1000 2000 3000 4000 5000

0.00

00.

005

0.01

00.

015

0.02

00.

025

0.03

0

Índice i

H p

or o

bser

vaçã

o

( Álvaro de Carvalho , SP , 2002 )( Álvaro de Carvalho , SP , 2000 )

( Álvaro de Carvalho , SP , 2001 )

0 1000 2000 3000 4000 5000

0.00

00.

005

0.01

00.

015

Índice i

Dis

tânc

ia d

e C

ook

( Serra da Saudade , MG , 2001 )( Josenópolis , MG , 2001 )

0 1000 2000 3000 4000 5000

−20

−15

−10

−5

05

10

Índice i

Res

íduo

pad

roni

zado

( Serra da Saudade , MG , 2001 )( Josenópolis , MG , 2001 )

Medidas de diagnostico para modelagem da DISPERSAO (δ)

0 1000 2000 3000 4000 5000

0.00

00.

005

0.01

00.

015

0.02

0

Índice i

H p

or o

bser

vaçã

o

( Álvaro de Carvalho , SP , 2001 )( Álvaro de Carvalho , SP , 2002 )

( Álvaro de Carvalho , SP , 2000 )

0 1000 2000 3000 4000 5000

0.00

00.

005

0.01

00.

015

Índice i

Dis

tânc

ia d

e C

ook

( Barra do Turvo , SP , 2000 )

0 1000 2000 3000 4000 5000

−5

05

10

Índice i

Res

íduo

pad

roni

zado

( Barra do Turvo , SP , 2000 )

Figura 1: Graficos das medidas de diagnostico (matriz de projecao, distancia de Cook e resıduo padronizado)obtidas para cada um dos vetores dos parametros de regressao: β, γ e δ.

6