distribui˘c~ao skew normal: aproxima˘c~oes, generaliza˘c ... · para os valores a=1.59413,...

37
Distribui¸ ao Skew Normal: Aproxima¸ oes,Generaliza¸c˜ oes e Aplica¸c˜ oes Murilo Coutinho Silva Orientador: Pushpa Narayan Rathie Resumo Esse trabalho trata sobre distribui¸c˜ oes assim´ etricas advindas da distribui¸c˜ ao Nor- mal, al´ em de formas gerais para qualquer distribui¸c˜ ao. Utilizando-se de f´ormulas de assimetriza¸ c˜ao como a de Azzalini (1986) e a de Fern´ andez e Steel (1998) compomos distribui¸ c˜oesassim´ etricas para a Normal. Esse trabalho prop˜oe tamb´ emgeneraliza¸c˜ oes para as f´ormulas de assimetriza¸c˜ ao. Al´ em disso, nesse artigo utilizaremos uma aproxima¸ ao da distribui¸c˜ ao Normal, proposta em ”On a new Invertible Generalized Logistic Distribution Approximation to Normal Distribution”de Pushpa N. Rathie e Prabhata K. Swamee para aproximar a distribui¸ c˜ao Skew-Normal em express˜oes bem definidas. 1 Introdu¸c˜ ao Nestase¸c˜ ao definimos algumas f´ormulas que ser˜ao importante para o desenvolvimento deste trabalho e para uma melhor compreens˜ao do leitor do que est´a por vir. 1.1 Distribui¸c˜ ao de Rathie-Swamee Queremos propor uma aproxima¸ ao invers´ ıvel para a Skew-Normal. Para isso utilizaremos a seguinte fun¸c˜ ao densidade de probabilidade e sua distribui¸c˜ ao acumulada: f (z)= [a + b(1 + p)|z| p ]exp[z(a + b|z| p )] {exp[z(a + b|z| p )] + 1} 2 (1.1) F (z)= {exp[z(a + b|z| p )] + 1} 1 (1.2) onde z ∈ℜ, a, b, p > 0. Essadistribui¸c˜ ao foi estudada em ”On a new Invertible Generalized Logistic Distribution Approximation to Normal Distribution”de Pushpa N. Rathie e Prabhata K. Swamee. 1

Upload: trinhlien

Post on 26-Apr-2019

213 views

Category:

Documents


0 download

TRANSCRIPT

Distribuicao Skew Normal:

Aproximacoes, Generalizacoes e Aplicacoes

Murilo Coutinho Silva

Orientador: Pushpa Narayan Rathie

Resumo

Esse trabalho trata sobre distribuicoes assimetricas advindas da distribuicao Nor-mal, alem de formas gerais para qualquer distribuicao. Utilizando-se de formulas deassimetrizacao como a de Azzalini (1986) e a de Fernandez e Steel (1998) compomosdistribuicoes assimetricas para a Normal. Esse trabalho propoe tambem generalizacoespara as formulas de assimetrizacao.

Alem disso, nesse artigo utilizaremos uma aproximacao da distribuicao Normal,proposta em ”On a new Invertible Generalized Logistic Distribution Approximation toNormal Distribution”de Pushpa N. Rathie e Prabhata K. Swamee para aproximar adistribuicao Skew-Normal em expressoes bem definidas.

1 Introducao

Nesta secao definimos algumas formulas que serao importante para o desenvolvimento destetrabalho e para uma melhor compreensao do leitor do que esta por vir.

1.1 Distribuicao de Rathie-Swamee

Queremos propor uma aproximacao inversıvel para a Skew-Normal. Para isso utilizaremosa seguinte funcao densidade de probabilidade e sua distribuicao acumulada:

f(z) =[a+ b(1 + p)|z|p]exp[−z(a+ b|z|p)]

{exp[−z(a+ b|z|p)] + 1}2(1.1)

F (z) = {exp[−z(a+ b|z|p)] + 1}−1 (1.2)

onde z ∈ ℜ, a, b, p > 0.

Essa distribuicao foi estudada em ”On a new Invertible Generalized Logistic DistributionApproximation to Normal Distribution”de Pushpa N. Rathie e Prabhata K. Swamee.

1

Para os valores a=1.59413, b=0.07443 e p=1.939 essa distribuicao aproxima muitobem a distribuicao Normal, com um erro maximo de 4.10−4 em z=0 para a funcao dedensidade e 7.757 10−5 em z=±2.81 para a funcao de distribuicao, aproximadamente.

1.2 Geracao de Distribuicoes Assimetricas

1.2.1 Formula de Azzalini

Podemos encontrar varias distribuicoes assimetricas pela seguinte formula:

h(x) = 2.g(x).G(w(x)) (1.3)

onde h(x) e a funcao densidade de probabilidades assimetrica, g(x) e uma funcao de densi-dade simetrica em torno da origem, G(x) e uma funcao de distribuicao acumulada de umaoutra funcao de densidade simetrica em torno da origem qualquer, e w(x) e uma funcaoımpar qualquer.

1.2.2 Skew Normal

Para a distribuicao Normal, podemos formar a distribuicao Skew-Normal (Sn(z)), comw(z) = c.z, c ∈ ℜ e z ∈ ℜ :

Sn(z) = 2.ϕ(z).Φ(c.z) (1.4)

onde ϕ(z) e a funcao de densidade e probabilidade da distribuicao Normal padrao e Φ(z)sua funcao de distribuicao acumulada.

Generalizando com um parametro de posicao µ ∈ ℜ e um parametro de escala σ > 0temos:

Sn(z) =2

σ.ϕ

(z − µ

σ

).Φ

(c.z − µ

σ

)(1.5)

Analogamente a Eq.(1.4), que e a Skew-Normal formada pela distribuicao N(0, 1), a Eq.(1.5)e a Skew-Normal formada pela distribuicao N(µ, σ2).

A distribuicao Skew-Normal foi primeiramente dada por O’Hagan e Leonard (1976), mas foiAzzalini (1985, 1986) que descobriu suas propriedades e demonstrou uma serie de resultadosimportantes.

Para a Eq.(1.5) temos media, variancia, assimetria e curtose dadas respectivamente por:

E[z] = µ+ σ√

2/πρ (1.6)

V ar[z] = σ2(1− 2ρ2/π) (1.7)

γ1 =4− π

2

(√

2/πρ)3

(1− 2ρ2/π)3/2(1.8)

γ2 = 2(π − 3)(√

2/πρ)4

(1− 2ρ2/π)2(1.9)

2

Onde ρ = c√1+c2

Propriedades:

Seja Z uma variavel aleatoria com distribuicao Normal Padrao. Para c ∈ ℜ, sendo v =c/√1 + c2 e Xc ∼ SN(c). Assuma tambem que W e Y sao distribuicoes Normais padrao

independentes. Entao seguem as seguintes propriedades:

(i) SN(0)=N(0,1)

(ii) X2c ∼ χ2

1

(iii) −Xc ∼ SN(−c)

(iv) A funcao geratriz de momentos de Xc e Mc(t) = 2exp[t2/2]Φ(vt)

(v) SN(c) e a distribuicao condicional de W dado que Y < cW .

(vi) Xc → |Z| quando c → ∞ e Xc → −|Z| quando c → −∞ (convergencia em distribuicao).

(vii) Se Z1 = min{Y,W} e Z2 = max{Y,W} entao Z1 ∼ SN(−1) e Z2 ∼ SN(1).

A distribuicao Skew Normal tras problemas ja que nao conseguimos fazer o calculo explıcitode Φ(c.z), e com isso tambem nao conseguimos uma formula explıcita para a distribuicaoSkew-Normal.

Posteriormente utilizaremos as funcoes dadas nas Eq.(1.1) e Eq.(1.2) para propor aprox-imacoes para a Skew-Normal.

1.2.3 Fernandez and Steel

No trabalho de Fernandez and Steel de 1998 foi apresentada a seguinte formula geradora dedistribuicoes assimetricas, utilizando-se de fatores inversos:

h(x) =2

α+ 1/αf(xαsinal[x]) (1.10)

onde α ∈ (0,∞). Generalizaremos esta distribuicao nesse trabalho e desenvolveremos muitaspropriedades.

1.3 Funcao H

A funcao H [ver Mathai e Saxena (1978)] e definida por:

3

Hm,np,q

[z

∣∣∣∣ (a1, A1), . . . , (an, An), (an+1, An+1), . . . , (ap, Ap)(b1, B1), . . . , (bm, Bm), (bm+1, Bm+1), . . . , (bq, Bq)

](1.11)

=1

2πi

∫L

∏mj=1 Γ(bj +Bjs)

∏nj=1 Γ(1− aj −Ajs)∏q

j=m+1 Γ(1− bj −Bjs)∏p

j=n+1 Γ(aj +Ajs)z−sds

onde

(1) i =√−1,

(2) z(= 0) e uma variavel complexa,

(3) zs = exp (s (ln |z|+ i arg z)),

(4) O produto vazio e interpretado como unidade,

(5) m, n, p e q sao inteiros nao negativos satisfazendo 0 ≤ n ≤ p, 0 ≤ m ≤ q (ambos n em sao nao negativos),

(6) Aj (j = 1, . . . , p) e Bj (j = 1, . . . , q) sao quantidade positivas,

(7) aj (j = 1, . . . , p) e bj (j = 1, . . . , q) sao numeros complexos dos quais, nenhum dospolos, Γ(bj + Bjs) (j = 1, . . . ,m) coincidem com os polos de Γ(1 − aj − Ajs) (j =1, . . . , n) i.e. Ak(bh + ν) = Bh(ak − λ − 1) para ν, λ = 0, 1, . . ., h = 1, . . . ,m,k = 1, . . . , n,

(8) O contorno L vai de −i∞ ate +i∞ de modo que os polos de Γ(bj+Bjs) (j = 1, . . . ,m)ficam a esquerda de L e os polos de Γ(1− aj − Ajs) (j = 1, . . . , n) ficam a direita deL.

Em Braaksma (1964), p 278, foi mostrado que a funcao H faz sentido e define umafuncao analıtica de z nos dois seguintes casos:

(i) δ > 0, z = 0 onde

δ =

q∑j=1

Bj −p∑

j=1

Aj

(ii) δ = 0, e 0 < |z| < D−1 onde

δ =

p∏j=1

AAj

j /

q∏j=1

BBj

j

Os valores da funcao H nao depende da escolha do contorno L.

Quando os polos dem∏j=1

Γ(bj −Bjs) sao simples,

4

Hm,np,q (z) =

m∑h=1

∞∑v=0

m∏j =1h

Γ

(bj −Bj

bh + v

Bh

)q∏

j=m+1

Γ

(1− bj +Bj

bh + v

Bh

) ×

n∏j=1

Γ

(1− aj +Aj

bh + v

Bh

)p∏

j=n+1

Γ

(aj −Aj

bh + v

Bh

) (−1)vz(bh+v)/Bh

v!Bh(1.12)

para z = 0 se δ > 0 e para 0 < |z| < D−1 se δ = 0

Quando os polosn∏

j=1

Γ(1− aj +Ajs) sao simples,

Hm,np,q (z) =

m∑h=1

∞∑v=0

m∏j =1h

Γ

(1− aj −Aj

1− ah + v

Ah

)q∏

j=m+1

Γ

(aj +Aj

1− ah + v

Ah

) ×

n∏j=1

Γ

(bj +Bj

1− ah + v

Ah

)p∏

j=n+1

Γ

(1− bj −Bj

1− ah + v

Ah

) (−1)vz(1−ah+v)/Ah

v!Ah(1.13)

para z = 0 se δ < 0 e para |z| > D−1 se δ = 0.As funcao H e aplicada nesse artigo na construcao dos momentos e na inversao da dis-

tribuicao.

2 Aproximacao da Distribuicao Skew Normal

O leitor ja deve ter notado que a formula da distribuicao Skew Normal dada pela Eq.(1.4)contem em sua composicao a funcao de distribuicao acumulada de Normal que infelizmentee definida por uma integral ou por funcoes especiais.

Tal formulacao e prejudicial em termos computacionais e praticos pois temos que calcularnumericamente esta integral.

Propomos uma solucao para este problema utilizando uma aproximacao quase perfeitada distribuicao Skew Normal tendo em mao a distribuicao dada pelas formulas (1.1) e (1.2).

5

2.1 Aplicando a formula de Rathie Swamee na formula de Azzalini

Para aproximarmos a Skew-Normal fazemos g(x)=f(z)(Eq.(1.1)) , e G(x)=F(z)(Eq.(1.2)),na Eq.(1.3) obtendo assim:

h(z) = 2.f(z).F (c.z) =2.[a+ b(1 + p)|z|p].exp[−z(a+ b|z|p)]

{exp[−z(a+ b|z|p)] + 1}2.{exp[−cz(a+ b|cz|p)] + 1}(2.1)

Generalizando com um parametro de posicao µ ∈ ℜ e um parametro de escala σ > 0 temos:

Sna(z) =2.[a+ b(1 + p)| z−µ

σ |p].exp[− z−µσ (a+ b| z−µ

σ |p)]σ{exp[− z−µ

σ (a+ b| z−µσ |p)] + 1}2.{exp[−c z−µ

σ (a+ b|c z−µσ |p)] + 1}

(2.2)

Notamos entao que temos uma aproximacao na qual conseguimos nos livrar da integraloutrora presente. Lembramos ao leitor que a, b e p sao constantes dadas na secao 1.1. Comoos erros da aproximacao da normal sao muito pequenos temos erros muito pequenos para adistribuicao Skew Normal tambem. Mais a frente no trabalho iremos comparar melhor essasdistribuicoes.

2.1.1 Momentos

Vamos calcular agora os momentos de h(z), para isso considere o caso geral:

E(xn)=

∫ ∞

−∞xn.h(x)dx=

∫ ∞

−∞xn.2.f(x).F (cx)dx=

=

∫ 0

−∞xn.2.f(x).F (cx)dx+

∫ ∞

0

xn.2.f(x).F (cx)dx=

=

∫ ∞

0

(−x)n.2.f(−x).F (−cx)dx+

∫ ∞

0

xn.2.f(x).F (cx)dx=

=

∫ ∞

0

(−1)n.xn.2.f(x).F (−cx)dx+

∫ ∞

0

xn.2.f(x).F (cx)dx=

=

∫ ∞

0

2.xn.f(x)[(−1)n.F (−cx) + F (cx)]dx

Usando a identidade 1-F(-cx)=F(cx), temos para n par:

=

∫ ∞

0

2.xn.f(x)[F (−cx) + F (cx)]dx=

∫ ∞

0

2.xn.f(x)dx

Ou seja os momentos pares sao iguais aos momentos da distribuicao simetrica f(x). Essesmomentos ja foram calculados em ”On a new Invertible Generalized Logistic DistributionApproximation to Normal Distribution”e sao dados por:∫ ∞

0

2.xn.f(x)dx = 2∞∑r=0

(−1)r(r + 1)[aIn + b(1 + p)In+p] (2.3)

Onde:

6

Iβ = [a(1 + r)]−β−1

∞∑k=0

[− b

(1 + r)pap+1

]k.Γ[β + 1 + (p+ 1)k]

k!=

= [a(r + 1)]−β−1H1,11,1

[(r + 1)pap+1

b

∣∣∣∣ (1, 1)(1 + β, p+ 1)

](2.4)

Para n ımpar, teremos:

∫ ∞

0

2.xn.f(x)[−F (−cx) + F (cx)]dx=

∫ ∞

0

2.xn.f(x)[2.F (cx)− 1]dx=

=

∫ ∞

0

4.xn.f(x).F (cx)dx-

∫ ∞

0

2.xn.f(x)dx

O resultado da segunda integral e o mesmo que o dado em (2.3), ja a primeira integraltemos que calcular, para isso utilizaremos as series:

(y + 1)−1 =

∞∑j=0

(−1)j .yj (2.5)

(x+ 1)−2 =∞∑r=0

(−1)r.(r + 1)xr (2.6)

Com y=exp[−cz(a+ b|cz|p)] e x=exp[−z(a+ b|z|p)]∫ ∞

0

zn.f(z).F (cz)dx=

∫ ∞

0

zn.[a+ b(1 + p)|z|p].exp[−z(a+ b|z|p)]{exp[−z(a+ b|z|p)] + 1}2.{exp[−cz(a+ b|cz|p)] + 1}

dz=

=

∫ ∞

0

zn.[a+ b(1 + p)zp].

∞∑r=0

(−1)r.(r + 1)exp[−z(r + 1)(a+ bzp)]

∞∑j=0

(−1)j .exp[−cjz(a+

b(|c|z)p)]dz=

=

∞∑r=0

∞∑j=0

(−1)r+j .(r + 1)

∫ ∞

0

zn.[a+ b(1 + p)zp]exp[−z(a.(r + 1 + c.j))− b.zp+1.(r + 1 +

j.c.|c|p)]dz=

=∞∑r=0

∞∑j=0

(−1)r+j .(r + 1)[a.Jn + b(1 + p)Jn+p] (2.7)

Onde:

Jβ =

∫ ∞

0

zβexp[−z(a.(r + 1 + c.j))].exp[−b.zp+1.(r + 1 + j.c.|c|p)]dz=

7

=

∫ ∞

0

zβexp[−z(a.(r + 1 + c.j))].∞∑k=0

(−b(r + 1 + jc|c|p))k

k!.z(p+1)kdz=

=∞∑k=0

(−b(r + 1 + jc|c|p))k

k!.

Γ(β + (p+ 1)k + 1)

(a(r + 1 + cj))β+(p+1)k+1=

= [a(r + 1 + cj)]−β−1H1,11,1

[(a(r + 1 + cj))p+1

b(r + 1 + cj|c|p)

∣∣∣∣ (1, 1)(1 + β, p+ 1)

](2.8)

Portanto, para n ımpar temos:

E(zn) = 2.∞∑r=0

(−1)r(r + 1)

2.

∞∑j=0

(−1)j [a.Jn + b(1 + p)Jn+p]

− [a.In + b(1 + p)In+p]

(2.9)

2.2 Caso particular quando c=1

O caso particular quando c = 1 e muito interessante pois podemos calcular explicitamentea funcao de distribuicao acumulada da Skew Normal aproximada.

Considerando c=1 nas Eq.(2.1) e Eq.(2.2), com z ∈ ℜ, a, b, p, σ > 0 e µ ∈ ℜ, obtemos:

h(z) = 2.f(z).F (z) =2.[a+ b(1 + p)|z|p].exp[−z(a+ b|z|p)]

{exp[−z(a+ b|z|p)] + 1}3(2.10)

Sna(z) =2.[a+ b(1 + p)| z−µ

σ |p].exp[− z−µσ (a+ b| z−µ

σ |p)]σ{exp[− z−µ

σ (a+ b| z−µσ |p)] + 1}3

(2.11)

Conseguimos facilmente obter a distribuicao acumulada fazendo a substituicao u={exp[-z(a+b|z|p)]+1} e calculando a integral, que por fim obtemos:

H(z) = {exp[−z(a+ b|z|p)] + 1}−2 (2.12)

E portanto:

SNA(z) =

{exp

[−z − µ

σ

(a+ b

∣∣∣∣z − µ

σ

∣∣∣∣p)]+ 1

}−2

(2.13)

Podemos tambem calcular z em funcao de H o que e muito importante em varios casoscomo no calculo de quantis. De (2.12) e facil concluir que:

z =1

aln

( √H

1−√H

)− b

az|z|p (2.14)

8

E usando a inversao de Lagrange obtemos:

z =

∞∑n=0

(− ba)n.Γ(np+ n+ 1)

n!Γ(np+ 2)

[1

aln

(1−

√H√

H

)]np+1

, H ≤ 0.25

∞∑n=0

(− ba)n.Γ(np+ n+ 1)

n!Γ(np+ 2)

[1

aln

( √H

1−√H

)]np+1

, H ≥ 0.25

z =

−(a

b)1/p 1

pH1,1

1,2

[( ba)1/p 1

aln(

1−√H√

H

) ∣∣∣∣ (p+1p, p+1

p)

(1p, 1p), (0, 1)

], H ≤ 0.25

(ab)1/p 1

pH1,1

1,2

[( ba)1/p 1

aln( √

H1−

√H

) ∣∣∣∣ (p+1p, p+1

p)

(1p, 1p), (0, 1)

], H ≥ 0.25

2.2.1 Momentos

Calcularemos agora o n-esimo momento de h(z). Para o caso em que c = 1 temos umaforma mais compacta nao precisando separar os momentos pares e ımpares, para realizaresse calculo precisaremos separar o problema em duas integrais, uma para z>0 e outra paraz<0, do seguinte modo:

E(zn)=

∫ ∞

−∞zn.h(z)dz=

∫ 0

−∞zn.h(z)dz+

∫ ∞

0

zn.h(z)dz=

=

∫ ∞

0

(−z)n.h(−z)dz︸ ︷︷ ︸II

+

∫ ∞

0

zn.h(z)dz︸ ︷︷ ︸I

Para o Calculo de I utilizaremos a serie binomial:

(x+ 1)−3 =∞∑r=0

(−1)r(r + 2)(r + 1)

2xr (2.15)

Para z>0 na equacao (2.10) temos:

h(z) =2.[a+ b(1 + p)zp].exp[−z(a+ bzp)]

{exp[−z(a+ bzp)] + 1}3(2.16)

9

Entao usando (2.15) em (2.16), com x = exp[−z(a+ bzp)], temos:

h(z) = [a+ b(1 + p)zp]

∞∑r=0

(−1)r(r + 2)(r + 1)exp[−z(r + 1)(a+ bzp)] (2.17)

Utilizando-se de (2.17), realizamos o calculo de I:∫ ∞

0

zn.h(z)dz =∞∑r=0

(−1)r(r + 2)(r + 1)[aI(n;r+1) + b(1 + p)I(n+p;r+1)] (2.18)

Onde:

I(β;θ) =

∫ ∞

0

zβexp[−zθ(a+ bzp)] (2.19)

Calculando (2.19):

I(β;θ) = [aθ]−β−1

∞∑k=0

[− b

θpap+1

]k.Γ[β + 1 + (p+ 1)k]

k!=

= [aθ]−β−1H1,11,1

[θpap+1

b

∣∣∣∣ (1, 1)(1 + β, p+ 1)

](2.20)

Para o calculo de II, faremos o mesmo processo feito no calculo de I, mas primeiramente,fazendo z=-z para z>0 na equacao (2.10) temos:

h(−z) =2.[a+ b(1 + p)zp].exp[z(a+ bzp)]

{exp[z(a+ bzp)] + 1}3=

=2.[a+ b(1 + p)zp].exp[−2.z(a+ bzp)]

{exp[−z(a+ bzp)] + 1}3(2.21)

Usando novamente a serie (2.15) em (2.21), com x = exp[−z(a+ bzp)], obtemos:

h(−z) = [a+ b(1 + p)zp]∞∑r=0

(−1)r(r + 2)(r + 1)exp[−z(r + 2)(a+ bzp)] (2.22)

Utilizando-se de (2.19),(2.20) e (2.22) realizamos o calculo de II:∫ ∞

0

(−1)n.zn.h(−z)dz =∞∑r=0

(−1)r+n(r + 2)(r + 1)[aI(n;r+2) + b(1 + p)I(n+p;r+2)] (2.23)

Como o resultado desejado e I+II, temos portanto o n-esimo momento:

E(zn) =∞∑r=0

(−1)r(r+2)(r+1)[aI(n;r+1)+b(1+p)I(n+p;r+1)+(−1)n(aI(n;r+2)+b(1+p)I(n+p;r+2))]

(2.24)

10

2.2.2 Graficos e comparacoes

Ja vimos que as equacoes propostas sao boas aproximacoes para a Skew-Normal, podemoscomparar tambem, os graficos das equacoes propostas com os graficos da Skew-Normal.

A figura (1) mostra a Skew-Normal com c=1 e a funcao h(z) proposta, a figura (2) e aSkew-Normal Acumulada com c=1 e a distribuicao acumulada H(z).

Perceba que nao conseguimos perceber diferencas entre os graficos, o que realca a pre-cisao da aproximacao. O grafico 5 corresponde a diferenca entre os valores de H(z) e daSkew-Normal Acumulada.

Observe tambem, figura (3) que o erro maximo entre a Skew-Normal e H(z)ocorre paraz=2.82 e vale 0.000154776.

Utilizando-se dos momentos podemos aproximar a media, variancia, curtose e assime-tria e comparar aos valores da verdadeira Skew-Normal. Essa comparacao e feita na tabelaabaixo:

Funcao proposta Erro Normal AssimetricaMedia 0.564053 0.000136 0.564189Variancia 0.680923 0.0007671 0.6816901Assimetria 0.13204 0.004908 0.136948Curtose 3.04421 0.017534 3.061744

z

0.1

0.2

0.3

0.4

SnHzL

z

0.1

0.2

0.3

0.4

hHzL

Figura 1: Skew-Normal c=1 e h(z)

11

z

0.2

0.4

0.6

0.8

1.0

SNHzL

z

0.2

0.4

0.6

0.8

1.0

HHzL

Figura 2: Skew-Normal Acumulada c=1 e H(z)

-2 -1 1 2 3 4 5z

-0.00005

0.00005

0.00010

0.00015

HHzL - SNHzL

Figura 3: Diferenca entre H(z) e a Skew-Normal Acumulada c=1

2.2.3 Entropia de Renyi, quando c=1

A entropia de Renyi, para essa distribuicao e definida por:

Hα(z) =1

1− α. ln

[∫ ∞

−∞(2.f(z).F (z))αdz

](2.25)

Calculando primeiramente a integral dentro do logaritmo:∫ ∞

−∞(2.f(z).F (z))αdz =

∫ 0

−∞2α.f(z)α.F (z)αdz +

∫ ∞

0

2α.f(z)α.F (z)αdz =

=

∫ ∞

0

2α.f(−z)α.F (−z)αdz +

∫ ∞

0

2α.f(z)α.F (z)αdz =

12

=

∫ ∞

0

2α.f(z)α.[F (−z)α + F (z)α]dz =

=

∫ ∞

0

2α.f(z)α.exp[−zα(a+ b.|z|p)] + 1

{exp[−z(a+ b.|z|p)] + 1}αdz =

=

∫ ∞

0

2α.[a+ b(1 + p)zp]α.exp[−zα(a+ b.zp)].{exp[−zα(a+ b.zp)] + 1}{exp[−z(a+ b.zp)] + 1}3α

dz

Temos entao a soma de duas integrais:∫ ∞

0

2α.[a+ b(1 + p)zp]α.exp[−2zα(a+ b.zp)]

{exp[−z(a+ b.zp)] + 1}3αdz (2.26)

∫ ∞

0

2α.[a+ b(1 + p)zp]α.exp[−zα(a+ b.zp)]

{exp[−z(a+ b.zp)] + 1}3αdz (2.27)

Para o calculo dessas integrais, consideraremos que α e um numero natural e as series:

[a+ b(1 + p)zp]α =

α∑i=0

(αi )aα−i[b(1 + p)zp]i (2.28)

(1 + x)m = 1 +∞∑k=1

m(m− 1)...(m− k + 1)

k!xk (2.29)

Tomando entao, m = −3α e x = exp[−z(a+ b.zp)] e jogando em (2.27):∫ ∞

0

2α.α∑

i=0

(αi )aα−i[b(1 + p)]i.zpi].exp[−zα(a+ b.zp)] x

x

[1 +

∞∑k=1

(−1)k3α(3α+ 1)...(3α+ k − 1)

k!.exp[−zk(a+ b.zp)]

]dz =

= 2α.

α∑i=0

(αi )aα−i[b(1 + p)]i[

∫ ∞

0

zpi.exp[−zα(a+ b.zp)]dz +

+

∞∑k=1

(−1)k3α(3α+ 1)...(3α+ k − 1)

k!.

∫ ∞

0

zpi.exp[−z(α+ k)(a+ b.zp)]]dz =

= 2α.α∑

i=0

(αi )aα−i[b(1 + p)]i

[Ipi;α +

∞∑k=1

(−1)k3α(3α+ 1)...(3α+ k − 1)

k!.Ipi;α+k

](2.30)

Onde Iβ;θ e o mesmo que o dado em (2.19). E analogamente temos para (2.26):

13

2α.α∑

i=0

(αi )aα−i[b(1 + p)]i

[Ipi;2α +

∞∑k=1

(−1)k3α(3α+ 1)...(3α+ k − 1)

k!.Ipi;2α+k

](2.31)

Portanto a entropia de Renyi e:

Hα(z) =1

1−α ln

[2α.

α∑i=0

(αi )aα−i[b(1 + p)]i

][Ipi;α + Ipi;2α+

+∞∑k=1

(−1)k3α(3α+ 1)...(3α+ k − 1)

k!.(Ipi;α+k + Ipi;2α+k)] (2.32)

2.3 Caso particular para c=-1

Considerando agora c=-1 em (1.4) podemos achar uma boa aproximacao para a Skew-Normalcom c=-1, do mesmo modo que fizemos anteriormente tendo em mao as Eq.(2.1) e Eq.(1.5),z ∈ ℜ, a, b, p, σ > 0 e µ ∈ ℜ:

h(z) = 2.f(z).F (−z) =

=2.[a+ b(1 + p)|z|p].exp[−z(a+ b|z|p)]

{exp[−z(a+ b|z|p)] + 1}2.

1

{exp[z(a+ b|z|p)] + 1}=

=2.[a+ b(1 + p)|z|p].exp[−2z(a+ b|z|p)]

{exp[−z(a+ b|z|p)] + 1}3(2.33)

E analogamente:

Sna =2.[a+ b(1 + p)| z−µ

σ |p].exp[−2 z−µσ (a+ b| z−µ

σ |p)]σ{exp[− z−µ

σ (a+ b| z−µσ |p)] + 1}3

(2.34)

Para obter H(z) faremos a substituicao u={exp[-z(a+b|z|p)]+1}:∫−2(u− 1)

u3du = 2u−1 − u−2 =

2u− 1

u2

E portanto:

H(z) =2{exp[−z(a+ b|z|p)] + 1} − 1

{exp[−z(a+ b|z|p)] + 1}2(2.35)

Analogamente:

SNA(z) =2{exp[− z−µ

σ (a+ b| z−µσ |p)] + 1} − 1

{exp[− z−µσ (a+ b| z−µ

σ |p)] + 1}2(2.36)

14

Para calcular z em funcao de H, voltamos primeiramente a (2.35) com a sub-stituicao u={exp[-z(a+b|z|p)]+1}:

H =2u− 1

u2⇒ H.u2 − 2u+ 1 = 0 ⇒ u =

2±√4− 4H

2H

Mas u =2−

√4− 4H

2Hnao convem na situacao em questao, portanto ficamos com:

{exp[−z(a+ b|z|p)] + 1} =1 +

√1−H

H⇒

⇒ z =1

aln

(H

1 +√1−H −H

)− b

az|z|p (2.37)

E usando a inversao de Lagrange obtemos:

z =

∞∑n=0

(− ba)n.Γ(np+ n+ 1)

n!Γ(np+ 2)

[1

aln

(1 +

√1−H −H

H

)]np+1

, H ≤ 0.75

∞∑n=0

(− ba)n.Γ(np+ n+ 1)

n!Γ(np+ 2)

[1

aln

(H

1 +√1−H −H

)]np+1

, H ≥ 0.75

z =

−(a

b)1/p 1

pH1,1

1,2

[( ba)1/p 1

aln(

1+√1−H−HH

) ∣∣∣∣ (p+1p, p+1

p)

(1p, 1p), (0, 1)

], H ≤ 0.75

(ab)1/p 1

pH1,1

1,2

[( ba)1/p 1

aln(

H1+

√1−H−H

) ∣∣∣∣ (p+1p, p+1

p)

(1p, 1p), (0, 1)

], H ≥ 0.75

O erro maximo, em valor absoluto, entre H(z) e a Skew-Normal Acumulada, para c=-1,e 0.000154776, e ocorre em z=-2.82. Alguns graficos foram tracados para a visualizacao daSkew-Normal com c = −1, e mais um grafico dos erros entre H(z) e a distribuicao Skew-Normal acumulada, que podem ser vistos nas figuras (4) e (5).

2.3.1 Momentos

Os momentos de (2.33) sao muito similares aos momentos de (2.10), de fato podemos observarque se h(z) e dado por (2.10) entao h(-z) e igual a funcao proposta em (2.33). Entao,observando a relacao:

15

z

0.1

0.2

0.3

0.4

hHzL

z

0.2

0.4

0.6

0.8

1.0

HHzL

Figura 4: h(z), Aproximacao da Skew-Normal com c=-1

-5 -4 -3 -2 -1 1 2z

-0.00015

-0.00010

-0.00005

0.00005

0.00010HHzL - SNHzL

Figura 5: Erro entre H(z) e a Skew-Normal Acumulada, com c=-1

E(zn)=

∫ ∞

−∞zn.h(−z)dz=

∫ 0

−∞zn.h(−z)dz+

∫ ∞

0

zn.h(−z)dz=

=

∫ ∞

0

(−1)n.zn.h(z)dz+

∫ ∞

0

zn.h(−z)dz =

= (−1)n[∫ ∞

0

zn.h(z)dz +

∫ ∞

0

(−1)n.zn.h(−z)dz

]Concluımos que o n-esimo momento de (2.33) e igual ao n-esimo momento de (2.10) vezes(−1)n, ou seja, para (2.33):

E(zn) =∞∑r=0

(−1)r(r+2)(r+1)[(−1)n(aI(n;r+1)+b(1+p)I(n+p;r+1))+aI(n;r+2)+b(1+p)I(n+p;r+2)]

(2.38)

16

Onde Iβ;θ e o mesmo dado em (2.19).

2.4 Distribuicao Z2

Sabe-se que a distribuicao Z2 para a Skew-Normal tende a uma distribuicao Qui-Quadradocom 1 grau de liberdade. Vamos entao calcular a distribuicao Z2 para h(z), para descobrir-mos se Z2 tendera de fato a uma Qui-Quadrado:

Chamando y=z2 temos z = ±√y, entao:

g(y) = h(z)

∣∣∣∣dzdy∣∣∣∣z=

√y

+ h(z)

∣∣∣∣dzdy∣∣∣∣z=−√

y

=

=2[a+ b(p+ 1)y

p2 ]

2√y

(exp[

√y(a+ by

p2 )]

(exp[√y(a+ by

p2 )] + 1)3

+exp[−√

y(a+ byp2 )]

(exp[−√y(a+ by

p2 )] + 1)3

)

g(y) =[a+ b(p+ 1)y

p2 ]

√y

.exp[

√y(a+ by

p2 )]

{exp[√y(a+ byp2 )] + 1}2

(2.39)

Que e uma otima aproximacao para a Qui-Quadrado com 1 grau de liberdade. E essaaproximacao tambem e inversıvel:

G(y) =1− exp[−√

y(a+ byp2 )]

{exp[−√y(a+ by

p2 )] + 1}

(2.40)

Comparada a Qui-Quadrado, essa distribuicao tem um erro maximo de 0.000156087 emy=7.9, como se pode observar na figura (6).

5 10 15y

-0.00010

-0.00005

0.00005

0.00010

0.00015

GHyL -QHyL

Figura 6: Diferenca entre G(y) e a Qui-Quadrado

17

3 Generalizacao da distribuicao Skew Normal

Nessa secao vamos demonstrar uma formacao da Skew-Normal de Azzalini a partir da Nor-mal bivariada. Com a mesma logica, queremos propor uma nova formula que generaliza aSkew-Normal de Azzalini.

3.1 Skew-Normal a partir da Normal Bivariada

Considere que (x, y) tenha distribuicao normal bivariada com vetor de medias µ=(0,0) e

matriz de variancia-covariancia Σ=

(1 ρρ 1

), onde ρ e o coeficiente de correlacao entre x e y.

Considere agora a restricao:

x > 0

Pergunta: Qual a distribuicao de y dado que x > 0?Temos:

P{y|x > 0} = P{x>0,y}P{x>0}

Mas P{x > 0}=1/2, entao:

P{y|x > 0} = 2P{x > 0, y} = 2

∫ ∞

0

1

2π√1− ρ2

exp

[− 1

2(1− ρ2)

{x2 + y2 − 2ρxy

}]dx

Completando quadrados obtemos:

= 2

∫ ∞

0

1

2π√1− ρ2

exp[−y2/2

]exp

[− 1

2(1− ρ2)(x− ρy)2

]dx =

Fazendo a substituicao: z = − x−ρy√1−ρ2

; Obtemos:

= 2ϕ(y)

∫ ρ√1−ρ2

y

−∞

1√2π

exp[−z2/2

]dz =

= 2ϕ(y)Φ

(ρ√

1− ρ2y

)(3.1)

Ou seja temos a distribuicao de y dado que x > 0 e Skew-Normal com c = ρ/√1− ρ2.

3.2 Aplicacao: O problema da distribuicao de pesos no exercito

Nesta secao mostraremos uma possıvel aplicacao da Skew Normal por simulacao apenas parater uma nocao de possıveis aplicacoes interessantes. Mais a frente neste trabalho utilizare-mos dados reais para ajustar a distribuicao Skew Normal e para a generalizacao que iremospropor.

18

Podemos pensar nesta formulacao da distribuicao Skew Normal baseada da distribuicaoNormal Bivariada dada anteriormente para uma aplicacao como a seguir.

Numa cidade 10.000 jovens compareceram para o alistamento no exercito nacional.Porem por um problema de tempo e recursos, nao seria possıvel avaliar todos os jovenspara a selecao, por isso decidiu-se dispensar os rapazes com altura abaixo da media popula-cional para a avaliacao. Depois, com os jovens restantes, fizeram-se varios testes e medicoes,dentre eles o peso de cada indivıduo.

Considerando que a distribuicao de pesos e alturas segue uma distribuicao Normal Bivariada

com vetor de medias µ = (85; 1.75) e matriz de variancia-covariancia Σ=

(1 ρρ 1

), pergunta-

se:

a) Qual a distribuicao estatıstica dos pesos dos rapazes que serao avaliados?b) Qual a probabilidade de algum dos selecionados pesar menos do que 80kg?c) Deseja-se estimar a correlacao existente entre peso e altura, mas o exercito so possui asobservacoes dos pesos dos jovens que serao avaliados. Como estimar o coeficiente de cor-relacao baseando-se nessa amostra e utilizando a Skew Normal?

Considere tambem para a resolucao do problema que o valor real do coeficiente de cor-relacao e ρ = 1/

√2, valor que foi usado para a geracao dos dados.

Resolucao do item a:

Tendo o que foi feito na secao 3.1, podemos concluir que considerando a distribuicao condi-cional dos pesos dados que a altura e maior que 1.75m e uma Skew-Normal com c = ρ√

1−ρ2.

Portanto se Y e a variavel peso e X a variavel altura, temos:

P{Y |(x > 1.75)} = 2f [y]F [y]

Podemos observar na figura (7) o que ocorre. Foi gerada uma amostra de 10.000 elementosda Normal Bivariada com vetor de medias e matriz de variancia-covariancia dados, depoisdisso dessa amostra foram retirados os elementos com altura menor que 1.75m sobrandoassim 4932 elementos. O histograma e composto pelos valores dos pesos dos 4932 elementosrestantes e foi comparado a Skew-Normal com c = 1.

Resolucao do item b:

Como temos uma Skew-Normal com c = 1, podemos entao usar a aproximacao propostanesse trabalho, o que facilita enormemente as contas. De fato podemos dispensar o uso de umcomputador usando apenas uma calculadora cientıfica. Queremos entao achar P{Z < 80}onde Z tem distribuicao Skew-Normal com c = 1, parametro de posicao 85kg e parametro deescala 10kg. Entao usando a Eq.(2.13) com z = 80, µ = 85, σ = 10, a = 1.59413, b = 0.07443e p = 1.939, temos:

P{Z < 80} = SNA[80] = 0.095

19

50 60 70 80 90 100 110 120Kg

Figura 7: Histograma dos pesos dos jovens que serao avaliados

Portanto temos 9.5% de chance de encontrarmos um indivıduo com menos de 80kg.

Resolucao do item c:Para estimar o coeficiente de correlacao ρ basta lembrar que c = ρ/

√1− ρ2. Estimando

entao ρ pelo metodo de momentos, temos para a amostra gerada pela distribuicao NormalBivariada:

85 + 10√2/πρ =

n∑i=1

xi

n⇒ ρ = 0.706261

Que e um valor bem proximo da correlacao verdadeira de 0.707107.

3.3 Generalizacao da formula

3.3.1 Nova formula para Normal Assimetrica

Vamos agora generalizar da distribuicao Skew Normal. Considerando ainda o vetor (x,y)descrito na secao 3.1, considere agora a restricao:

a < x < b

Pergunta: Qual a distribuicao de y dado que a < x < b?Temos:

Sk[y] = P{y|(a < x < b)} = P{(a<x<b),y}P{(a<x<b)} =

20

= ϕ(y)P{a<x<b}

∫ b

a

1√2π√1− ρ2

exp

[− 1

2(1− ρ2)(x− ρy)2

]dx =

Fazendo a substituicao: z = x−ρy√1−ρ2

; Obtemos:

= ϕ(y)Φ(b)−Φ(a)

∫ b−ρy√1−ρ2

a−ρy√1−ρ2

1√2π

exp[−z2/2

]dz

Sk[y] = ϕ(y)

Φ

[b−ρy√1−ρ2

]− Φ

[a−ρy√1−ρ2

]Φ(b)− Φ(a)

(3.2)

A Eq.(3.2) e uma generalizacao da Eq.(1.4).

Relacoes:

Considere c = p√1−ρ2

, a, b, c ∈ ℜ. Seja Z uma variavel aleatoria com distribuicao Nor-

mal Padrao. Considere ainda que Xc ∼ Sk[c] e X−c ∼ Sk[−c], onde Sk[c] e a Skew-Normalde Azzalini dada pela Eq.(1.4), e que X(a,b) ∼ Sk[a, b] onde Sk[a, b] e a nova distribuicaoassimetrica proposta pela Eq.(3.2), entao:

(i) a = 0 e b → ∞ ⇒ X(a,b) → Xc. (Convergencia em distribuicao).

(ii) b = 0 e a → −∞ ⇒ X(a,b) → X−c. (Convergencia em distribuicao).

(iii) ρ = 0 ⇒ X(a,b) → Z,∀a, b ∈ ℜ (Convergencia em distribuicao).

3.3.2 Media

Vamos agora calcular a media da nova distribuicao proposta:

E[y] =

∫ ∞

−∞ySk[y]dy =

∫ ∞

−∞yP{y|(a < x < b)}dy =

=

∫ ∞

−∞y

1

P{a < x < b}

∫ b

a

1

2π√1− ρ2

exp

{− 1

2(1− ρ2){x2 + y2 − 2ρxy}

}dxdy =

= 1P{a<x<b}

∫ b

a

ϕ(x)

∫ ∞

−∞y

1√2π√

1− ρ2exp

{− 1

2(1− ρ2)(y − ρx)2

}dydx =

Fazendo a substituicao z = y−ρx√1−ρ2

, obtemos:

= 1P{a<x<b}

∫ b

a

ϕ(x)

∫ ∞

−∞(z√1− ρ2 + ρx)ϕ(z)dzdx =

21

= 1P{a<x<b}

∫ b

a

ϕ(x)

∫ ∞

−∞ρxϕ(z)dzdx =

ρ

P{a < x < b}

∫ b

a

xϕ(x)dx =

=ρ[exp{−a2/2} − exp{−b2/2}]√

2π[Φ(b)− Φ(a)](3.3)

3.3.3 Funcao geratriz de momentos

Vamos agora calcular a FGM da nova distribuicao proposta:

E[exp{ty}] =∫ ∞

−∞exp{ty}Sk[y]dy =

∫ ∞

−∞exp{ty}P{y|(a < x < b)}dy =

=

∫ ∞

−∞exp{ty} 1

P{a < x < b}

∫ b

a

1

2π√1− ρ2

exp

{− 1

2(1− ρ2){x2 + y2 − 2ρxy}

}dxdy =

= 1P{a<x<b}

∫ b

a

ϕ(x)

∫ ∞

−∞exp{ty} 1

√2π√1− ρ2

exp

{− 1

2(1− ρ2)(y − ρx)2

}dydx =

Fazendo a substituicao z = y − ρx, obtemos:

= 1P{a<x<b}

∫ b

a

ϕ(x)

∫ ∞

−∞exp{t(z + ρx)} 1√

2π(1− ρ2)exp

{− 1

2(1− ρ2)z2}dzdx =

exp{

12 (1− ρ2)t2

}Φ(b)− Φ(a)

∫ b

a

exp{ρtx}ϕ(x)dx

Portanto:

My[t] =exp{t2/2}

2(Φ(b)− Φ(a))

[Erf

[b− ρt√

2

]− Erf

[a− ρt√

2

]](3.4)

Ou equivalentemente:

MX [t] = exp{t2/2}Φ(b− ρt)− Φ(a− ρt)

Φ(b)− Φ(a). (3.5)

Na figura (8) o leitor pode observar os graficos da distribuicao Skew Normal Generalizadadada pela Eq.(3.2) comparados com o grafico da distribuicao Normal Padrao.

22

-3-3 -1 1 2 3y

0.1

0.2

0.3

0.4

-3-3 -1 1 2 3y

0.3

0.6

0.9

Figura 8: Skew-Normal Generalizada com parametros a = −1, b = 2 e ρ = 0.95 (a esquerda)e a = 1, b = 2 e ρ = 0.95 (a direita)

3.3.4 Distribuicao X2(a,b), Generalizacao da distribuicao Qui-Quadrado

Ja mencionamos que se um variavel aleatoria X tem distribuicao Skew Normal, entao X2

tem distribuicao Qui-Quadrado com 1 grau de liberdade, portanto podemos generalizar adistribuicao Qui-Quadrado descobrindo a distribuicao de probabilidade de X2

(a,b) onde X(a,b)

tem distribuicao Skew Normal Generalizada dada pela Eq.(3.2).Entao, considerando ainda o vetor (x,y) descrito na secao 3.1, e chamando z=y2 onde y temdistribuicao Skew Normal Generalizada, temos y = ±

√z, e portanto:

g(z) = h(y)

∣∣∣∣dydz∣∣∣∣y=

√z

+ h(y)

∣∣∣∣dydz∣∣∣∣y=−

√z

=

g(z) = P (y|{a < x < b})∣∣∣∣dydz

∣∣∣∣y=

√z

+ P (y|{a < x < b})∣∣∣∣dydz

∣∣∣∣y=−

√z

=

=1

P ({a < x < b})ϕ(√z)

2√z

∫ b

a

(exp

[− 1

2(1−ρ2) (x− ρ√z)]+ exp

[− 1

2(1−ρ2) (x+ ρ√z)])

√2π(1− ρ2)

dx =

SkQ[z] =

ϕ[√z]

[b−ρ

√z√

1−ρ2

]− Φ

[a−ρ

√z√

1−ρ2

]+Φ

[b+ρ

√z√

1−ρ2

]− Φ

[a+ρ

√z√

1−ρ2

])2√z(Φ[b]− Φ[a])

(3.6)

Relacoes:

Se X ∼ SkQ(a, b, ρ) e Z ∼ χ21, entao:

(i) a = 0 e b → ∞ ⇒ X → Z (convergencia em distribuicao).

(ii) b = 0 e a → −∞ ⇒ X → Z (convergencia em distribuicao).

(iii) ρ = 0 ⇒ X → Z (convergencia em distribuicao), ∀a, b ∈ ℜ

23

3.4 Outras generalizacoes

Existem mais duas restricoes que valem a pena serem explicitadas, sao elas:

x > k, k ∈ ℜ

Usando a Eq.(3.2) com a = k e b → ∞, obtemos a distribuicao Skew Normal estendida deBirnbaum (1950):

Sk[y] = ϕ(y)

Φ

[ρy−k√1−ρ2

]1− Φ(k)

(3.7)

Usando a Eq.(3.3) obtemos:

E[y] =ρ[exp{−k2/2}]√

2πΦ(−k)(3.8)

Usando a Eq.(3.4) obtemos:

My[t] =exp{t2/2}2Φ(−k)

[1− Erf

[k − ρt√

2

]](3.9)

Ou equivalentemente:

MY [t] = exp{t2/2}Φ(ρt− k)

Φ(−k). (3.10)

E para:

x < k, k ∈ ℜ

Usando a Eq.(3.2) com a → −∞ e b = k obtemos:

Sk[y] = ϕ(y)

Φ

[k−ρy√1−ρ2

]Φ(k)

(3.11)

Usando a Eq.(3.3) obtemos:

E[y] = −ρ[exp{−k2/2}]√2πΦ(k)

(3.12)

Usando a Eq.(3.4) obtemos:

My[t] =exp{t2/2}2Φ(k)

[1 + Erf

[k − ρt√

2

]](3.13)

Ou equivalentemente:

MY [t] = exp{t2/2}Φ(k − ρt)

Φ(k). (3.14)

24

3.5 Aplicacoes

3.5.1 Temperatura na reserva ecologica do IBGE

Nos usamos dados de temperatura na estacao climatologica do IBGE para aplicacoes dadistribuicao Skew Normal. Primeiramente nos ajustamos a distribuicao Normal aos dadosobtendo o histograma da Figura (9). Alem disso, plotamos o QQPlot dos dados, que podeser visto na Figura (11). Podemos ver que a distribuicao Normal nao resulta em um bomajuste devido ao fato de que a cauda esquerda da distribuicao real dos dados e mais longado que a cauda da distribuicao Normal.

Figura 9: Histograma dos dados e a distribuicao Normal estimada.

Notamos entao que a distribuicao Normal nao e o melhor ajuste para os dados devidoa assimetria dos mesmos. Deste modo, aproximando os parametros µ, σ e c para a dis-tribuicao Skew Normal por µ = 28.155517, σ = 3.276348 e c = −1.883828, conseguimosuma ajuste muito melhor do que usando a distribuicao Normal. Podemos notar essa mel-horia de ajuste nos graficos da distribuicao empırica da dados comparados aos graficos dasrespectivas funcoes de distribuicao na figura (10), e pelo QQPlot da distribuicao Skew Nor-mal dado na figura (12).

Para a distribuicao Normal o desvio absoluto medio em torno da distribuicao empırica e0.0257 e o desvio absoluto maximo e 0.0683. Ja para a distribuicao Skew Normal, o desvioabsoluto medio em torno da distribuicao empırica e 0.01499 e o desvio absoluto maximo e0.0561. Usamos o teste de Kolmogorov-Smirnov para testar a qualidade do ajuste a 1% e5% de significancia.

25

20 25 30 35x

0.2

0.4

0.6

0.8

1Normal

20 22 24 26 28 30 32x

0.2

0.4

0.6

0.8

1

Skew Normal

Figura 10: Ajuste para a distribuicao Normal (esquerda) e para a distribuicao Skew Normal(direita).

−3 −2 −1 0 1 2 3

1820

2224

2628

3032

Normal Q−Q Plot

Theoretical Quantiles

Sam

ple

Qua

ntile

s

Figura 11: QQPlot da distribuicao Normal

3.5.2 Dados de evaporacao da reserva ecologica do IBGE.

Usamos dados de evaporacao (mm) na reserva ecologica do IBGE para esta aplicacao. Essesdados sao muito assimetricos e por isso nos os ajustamos com a distribuicao Skew NormalGeneralizada dada por (3.2) alem de um parametro de posicao e um parametro de escalaobtendo otimos resultados.

Nos aproximamos os parametros µ, σ, a, b e ρ por µ = 0.3, σ = 4.1, a = 0.2, b = 2.8,

26

−3 −2 −1 0 1

1820

2224

2628

3032

Theoretical Quantiles

Sam

ple

Qua

ntile

s

Skew Normal Q−Q Plot

Figura 12: QQPlot da distribuicao Skew Normal.

ρ = 0.99. Na figura (13) podemos ver o ajuste da distribuicao Skew Normal Generalizadapara a distribuicao empırica dos dados. O desvio absoluto medio em torno da distribuicaoempırica dos dados e 1.214 10−2, o desvio absoluto maximo e 4.087 10−2 e o erro medioquadratico e 2.21 10−4. Usamos novamente o teste de Kolmogorov-Smirnov para testar oajuste a 1% e 5% de significancia.

x

0.2

0.4

0.6

0.8

1Generalized Skew-Normal

Figura 13: Ajuste para a distribuicao Skew Normal Generalizada

27

4 Generalizacao da formula de Fernandez and Stell

4.1 Generalizacao

Podemos tentar generalizar a Eq.(1.10) para dois parametros quaisquer a e b, ao invez deconsiderarmos apenas os recıprocos α e 1/α.Desse modo terıamos:

h(x) = c.f(x.a|x|/x+1

2 .b−|x|/x+1

2 ) (4.1)

onde a, b > 0, x ∈ (−∞,∞) e f(x) e uma funcao de densidade de probabilidade simetrica.

Sabemos que devemos ter

∫ ∞

−∞h(x)dx = 1, entao podemos determinar c:

1 = c.

∫ ∞

−∞f(x.a

|x|/x+12 .b

−|x|/x+12 )dx =

= c.

∫ 0

−∞f(x.b)dx+ c.

∫ ∞

0

f(x.a)dx =

Substituindo u = xb; dx = du/b; v = xa; dx = dv/a:

= c.

∫ 0

−∞f(u)/bdu+ c.

∫ ∞

0

f(v)/adv = c.[1

2b+

1

2a] ⇒

⇒ c2 [1/b+ 1/a] = 1 ⇒ c.[a+b

ba ] = 2

Portanto:

c =2ab

a+ b(4.2)

Temos entao nossa distribuicao:

h(x) =

{2ab/(a+ b)f(x.a

|x|/x+12 .b

−|x|/x+12 ), x = 0

2ab/(a+ b)f(0), x = 0

(4.3)

4.2 Propriedades

i) Se a = 1b , temos:

h(x) = (2a. 1a )/(a+ 1a )f(x.a

|x|/x+12 .a

|x|/x−12 ) =

= 2α+1/αf(α

sinal[x])

28

Que e a funcao de Fernandez and Steel dada em (1.10).

ii) Se a = b temos:

h(x) = (2a2/(2a)f(x.a|x|/x+1

2 .a−|x|/x+1

2 ) = a.f(ax)

Considerando a = 1σ , temos h(x) = f(xσ)

σ , onde σ e o parametro de escala. A distribuicaoh(x) nao e assimetrica nesse caso.

4.3 Momentos

Vamos agora calcular o n-esimo momento:

E(xn) =

∫ ∞

−∞xn.2ab/(a+ b)f(x.a

|x|/x+12 .b

−|x|/x+12 )dx =

= 2ab/(a+ b)

∫ 0

−∞xnf(bx)dx+ 2ab/(a+ b)

∫ ∞

0

xnf(ax)dx

Fazendo as substituicoes adequadas para a resolucao das integrais e colocando os termoscomuns em evidencia, obtemos:

E(xn) = 2ab/(a+ b)[(−1)n

bn+1 + 1an+1

] ∫ ∞

0

xnf(x)dx =

2((−1)n.an+1 + bn+1)

(a+ b)(ab)n

∫ ∞

0

xnf(x)dx (4.4)

Portanto temos o primeiro momento (media) e o segundo momento:

E(x) =2(b− a)

ab

∫ ∞

0

xf(x)dx (4.5)

E(x2) =2(a3 + b3)

(a+ b)a2b2

∫ ∞

0

x2f(x)dx =(a3 + b3)

(a+ b)a2b2(V ar(x)) (4.6)

Onde V ar(x) e a variancia de f(x).Podemos tambem calcular a Variancia de h(x) pela formula:

V ar(x) = E(x2)− (E(x))2.

4.4 Funcao de distribuicao acumulada

Considere h(x) e a, b > 0, queremos:∫ X

−∞h(x)dx = H(x)

Para X < 0:

29

= 2ab/(a+ b)

∫ X

−∞f(bx)dx = 2a/(a+ b)

∫ bX

−∞f(u)du = 2a/(a+ b)F (bX)

Para X > 0

= 2ab/(a+ b)

∫ X

−∞h(x)dx = 2ab/(a+ b)

[∫ 0

−∞f(bx)dx+

∫ X

0

f(ax)dx

]=

= 2ab/(a+ b)

[12b +

1a

∫ aX

0

f(v)dv

]=

= 2ab/(a+ b)[

12b +

1a (F (aX)− 1/2)

]Podemos entao juntar, em uma unica expressao, para formarmos a funcao de distribuicaoacumulada:

H(x) =2ab

a+ b

[1

bF

(b

2(x− |x|)

)+

1

aF(a2(x+ |x|)

)− 1

2a

](4.7)

4.5 Entropias de Renyi e Shannon, e Informacao de Fisher

A entropia de Shannon Entropy para (4.1) e

Sh(x) = −∫ ∞

−∞h(x). lnh(x)dx

Sh(x) = Sh(z)− ln(c) (4.8)

onde Sh(z) e a entropia de Shannon para a distribuicao f(z).A entropia de Renyi para (4.1) e dada por

Rα(x) =1

1−α ln

[∫ ∞

−∞h(x)αdx

]Rα(x) = Rα(z)− ln(c) (4.9)

onde Rα(z) e a entropia de Renyi para a distribuicao f(z).

A informacao de Fisher (4.1) e para um parametro θ de f(X) e

I(θ) = E[(

ddθ lnh(x)

)2]=

∫ ∞

∞c

(d

dθln f(x.a

1+|x|/x2 .b

1−|x|/x2 )

)2

f(x.a1+|x|/x

2 .b1−|x|/x

2 )dx =

30

c

∫ 0

−∞

(d

dθln f(x.b)

)2

f(x.b)dx+ c

∫ ∞

0

(d

dθln f(x.a)

)2

f(x.a)dx ⇒

I(θ) = IF (θ) (4.10)

onde IF (θ) e a informacao de Fisher para o parametro θ da distribuicao f(z).

A informacao de Fisher para o parametro a da distribuicao h(x) dada por (4.1) e

I(a) = k2 + 2kc

∫ ∞

0

d

daf(ax)dx+ c

∫ ∞

0

[d

daln f(ax)

]2f(ax)dx (4.11)

onde k = ba(a+b) e c e dado por (4.2).

A informacao de Fisher para o parametro b da distribuicao h(x) dada por (4.1) e

I(b) = k2 + 2kc

∫ 0

−∞

d

dbf(bx)dx+ c

∫ 0

−∞

[d

dbln f(bx)

]2f(bx)dx (4.12)

onde k = ba(a+b) e c e dado por (4.2).

A informacao de Fisher para x da distribuicao h(x) dada por (4.1), e

I(x) = abIF (z) (4.13)

onde IF (z) e a informacao de Fisher para a distribuicao f(z).

4.6 Caso especial: Normal

Definimos a distribuicao Normal por:

ϕ(x) =e−x2/2

√2π

(4.14)

Desse modo, utilizando a formula (4.3) temos a distribuicao assimetrica:

h(x) =2ab

a+ bϕ(x.a

|x|/x+12 .b

−|x|/x+12 ) (4.15)

Se a=b, temos:

h(x) = aϕ(ax) = ae−x2a2/2/√2π

Portanto temos uma distribuicao Normal com media 0 e variancia 1/a2.Momentos de h(x), utilizando (4.4):

31

E(xn) =2((−1)n.an+1 + bn+1)

(a+ b)(ab)n

∫ ∞

0

xn e−x2/2

√2π

dx =

=2n/2((−1)n.an+1 + bn+1)

(a+ b)(ab)nΓ((n+ 1)/2)√

π(4.16)

A funcao geratriz de momentos para (4.15) e

Mx(t) =a

a+ bet

2/2b2[1− erf

[t√2b

]]+

b

a+ bet

2/2a2

[1 + erf

[t√2a

]](4.17)

Ou equivalentemente

Mx(t) =2a

a+ bet

2/2b2Φ(−t/b) +2b

a+ bet

2/2a2

Φ(t/a) (4.18)

Utilizando-se de (4.16), temos:

E(x) =2(b− a)

ab

∫ ∞

0

xe−x2/2

√2π

dx =2(b− a)√

2πab(4.19)

E(x2) =a3 + b3

(a+ b)a2b2(4.20)

V ar(x) =1

a2b2

[a3 + b3

a+ b− 2(b− a)2

π

](4.21)

4.6.1 Estimadores de Maxima Verossimilhanca

Considere que nos temos uma amostra x1, x2, ..., xn e queremos estimar a e b, para faz-ermos isso primeiramente colocamos os dados em ordem crescente. Deste modo temos asobservacoes negativas x1, x2, ..., xn′ , e as observacoes positivas xn′+1, ..., xn. Assim, o esti-mador de maxima verossimilhanca a para a e solucao da equacao

a3n′∑i=0

x2i + a2b

n′∑i=0

x2i = nb (4.22)

E o estimador de maxima verossimilhanca b para b e solucao da equacao

b3n∑

i=n′+1

x2i + b2a

n∑i=n′+1

x2i = na. (4.23)

32

4.6.2 Entropias de Renyi e Shannon, e informacao de Fisher para a distribuicaoNormal Assimetrica

A entropia de Shannon para essa distribuicao, usando (4.8) e

Sh(x) =1

2ln(2πe)− ln(c) (4.24)

A entropia de Renyi para esta distribuicao, usando (4.9) e

Rα(x) =1

2ln(2π)− ln(α)

2(1− α)− ln(c) (4.25)

A informacao de Fisher para a, b e x, usando (4.11), (4.12) e (4.13) e

I(a) =b(3a+ 2b)

a2(a+ b)2(4.26)

I(b) =a(3b+ 2a)

b2(b+ a)2(4.27)

I(x) = ab (4.28)

Nos calculamos a informacao de Relativa de Fisher que e definida para duas funcoes dedensidade e probabilidade ρ1(x) e ρ2(x) por

I(p1, p2) =

∫R

f1(x)

[d

dxln

(f1(x)

f2(x)

)]2dx. (4.29)

se ρ1(x) = h(x, a, b) and ρ2(x) = h(x, c, d), entao temos a informacao relativa de Fisher

I(ρ1, ρ2) =a3(b2 − d2

)2+ b3

(a2 − c2

)2a2b2(a+ b)

(4.30)

Nos plotamos as informacao relativa de Fisher para os parametros a, b, c, d na figura 16 e nafigura 17 . Alguns graficos da distribuicao dada pela Eq. (4.15), para alguns valores de a eb, sao dados nas figuras (15) e (14).

33

-3 -2 -1 1 2 3x

0.1

0.2

0.3

0.4

0.5

0.6

hHxL

-3 -2 -1 1 2 3x

0.2

0.4

0.6

0.8

1.0

H@xD

Figura 14: Normal Assimetrica (FDP e Funcao de distribuicao) a = 3 and b = 1

-3 -2 -1 1 2 3x

0.1

0.2

0.3

0.4

0.5

0.6

hHxL

-3 -2 -1 1 2 3x

0.2

0.4

0.6

0.8

1.0

H@xD

Figura 15: Normal Assimetrica (FDP e Funcao de distribuicao) a = 1 and b = 3

0 2 4 6 80

3

6

9

12

15

a

I@hHx

,a,2L

,hHx

,1,1LD

0 2 4 6 80

3

6

9

12

15

b

I@hHx

,1,bL

,hHx

,2,0

.5LD

Figura 16: I(ρ1, ρ2) para b = 2, c = 1, d = 1, e I(ρ1, ρ2) para a = 1, c = 2, d = 0.5

34

0 2 4 6 80

3

6

9

12

15

c

I@hHx

,6,2L

,hHx

,c,2LD

0 2 4 6 80

3

6

9

12

15

d

I@hHx

,2,5L

,hHx

,1,dLD

Figura 17: I(ρ1, ρ2) para a = 6, b = 2, d = 2, e I(ρ1, ρ2) para a = 2, b = 5, c = 1

35

Referencias

[1] Swamee, P.K.; Rathie, P.N. Invertible Alternatives to normal and Lognormal distribu-tion, J.Hydrol. Eng.(2006) ASCE, Accepted for publication.

[2] Swamee, P.K.; Rathie, P.N. On a new Invertible Generalized Logistic Distribution Ap-proximation to Normal Distribution,J.Hydrol. Eng., 2006

[3] Kotz, S.; Read, B.C.; Balakrishnan, N.; Vidakovic, B. Encyclopaedia of StatisticalSciences. 16 Volume Ser. 2nd Edition. John Wiley & Sons. 2005

[4] Luke, Yudell L. The Special Functions and their Approximations. Volume 1.Kansas City. Academic Press. 1969)

[5] Mathai, A. M., Saxena, R.K., The H-Function with Applications in Statistics anOther Disciplines. New Delhi. Wiley Eastern Limited. 1978.

[6] Springer, M. D. The Algebra of Random Variables. University of Arkansas. JohnWiley & Sons. 1978.

[7] Bickel, P.J.; Doksum, K.A. Mathematical Statistics: basic ideas and selected topics.Vol.1. Segunda Edicao. Pearson Prentice Hall

[8] Kotz, S.; Balakrishnan, N.; Johnson, N.L. Continuous Univariate Distribu-tions.John Wiley & Sons

[9] Thomas, J.A.; Cover,T.M. Elements of Information Theory. Segunda Edicao. JohnWiley & Sons. 2006

[10] Coutinho, M. et.al. H-Functions and Statistical Distributions. Ganita. Vol.59. pgs 23-37. 2008.

[11] Yanez,R.J. et.al. Fisher information of special functions and second-order differentialequations. Journal of Mathematical Physics. 2008

[12] Adelchi Azzalini, Pagina pessoal . Disponıvel em:http://azzalini.stat.unipd.it/SN/ .

[13] Azzalini, A.; Capitanio,A. Applications of the Multivariate Skew Normal Distribution.Journal of the Royal Statistical Society. Vol 61. Blackwell Publishing for the RoyalStatistical Society. 1999.

[14] Liseo, B.; Loperfido, N. A Bayesian interpretation of the multivariate Skew-Normaldistribution. Statistic and Probability Letters. Vol.61. Issue 4. Pgs 395-401. 2003

[15] Azzalini, A. A class of distributions which includes the normal ones. Scand. J. Statit.pgs 171-178. 1985

[16] Lin,T.I.; Lee,J.C.; Yen, S.Y. Finite Mixture Modelling Using the Skew Normal Distri-bution. Statistical Sinica. pgs 909-927. 2007.

36

[17] Gomez, H.W. et.al. A new class of skew normal distributions. Communications inStatistics: Theory and Methods.vol 33, pgs 1465-1480. 2003.

[18] Ferreira, J.T.A.S.; Steel, M.F.J. A constructive Representation of univariate SkewedDistributions. Journal of the American Statistical Association. 2006.

[19] Fernandez,C.; Steel, M.F.J. On Bayesian modelling of fat tails skewness. J. Amer.Statist. Assoc. pgs 359-371. 1998.

37