estatística para dados direccionais - moodle-arquivo · introduçãomedidas...

47
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese Estatística para dados direccionais Susana Barbosa Mestrado em Ciências Geofísicas 2012-2013 Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Upload: duongcong

Post on 10-Nov-2018

230 views

Category:

Documents


0 download

TRANSCRIPT

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Estatística para dados direccionais

Susana Barbosa

Mestrado em Ciências Geofísicas 2012-2013

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Dados direccionais

observações de direcções no plano ou no espaço

2-D (plano): dados circulares

3-D (espaço): dados esféricos

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Estatística circular

Estatística circular

métodos estatísticos para análise de dados circulares

“A curious byway of statistics. . . somewhere between theanalysis of linear and the analysis of spherical data”

(Fisher 1993)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Dados circulares

I direcção representada por um ângulo medido em relaçãoa uma direcção “zero” arbitrária

I não há uma ordenação natural das observações

I 0 = 2π (o início e o fim coincidem)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Dados circulares em geofísica

Medidas

I ventoI ondulaçãoI ...

Aplicações

I produção de energia renovávelI riscos, protecção costeiraI ...

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

Direcção tomada por 76 tartarugas após serem libertadas(Stephens, 1969)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

Direcção tomada por 76 tartarugas após serem libertadas(Stephens, 1969)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

Direcção tomada por 76 tartarugas após serem libertadas(Stephens, 1969)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

Direcção do eixo maior de 164 formas de feldspato em basalto(Fisher, 1993)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Representação de dados circulares

(x = r cos α, y = r sinα)⇐⇒ (r , α)

r = 1 (na estatística circular o interesse é apenas na direcção)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Direcção média

A direcção média (direcção preferencial) não deve sercalculada a partir da média dos ângulos!

Exemplo:

(45 + 90 + 135)/3 = 90

(0 + 45 + 315)/3 = 120

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Direcção média

O valor da média angular depende

I origem (arbitrária)I sentido (horario, anti-horario)

=⇒ é necessária uma medida alternativa da média para dadosdireccionais

=⇒ como a variância depende da média, é também necessáriauma medida alternativa de dispersão para dados direccionais

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Direcção média

n observações (xi , yi)⇔ (cos αi , sinαi), i = 1, ...,n

Vector resultante: R = (∑n

i=1 cos αi ,∑n

i=1 sinαi) ≡ (C,S)

A média circular α0 é definida como

α0 = arctg(S/C))

Nota: quando R = 0 não existe uma direcção média (observações distribuídasuniformemente sobre o círculo, não há uma direcção preferencial)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Dispersão circular

A variância circular é definida como

S = 1− 1n∑n

i=1 cos(αi − α0) = 1− ||R||/n

onde R é o vector resultante R = (∑n

i=1 cos αi ,∑n

i=1 sinαi)

N: 0 < S < 1

S ∼ 0 observações com a mesma direcção

S ∼ 1 observações dispersas pela circunferência unitária

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Distribuição de probabilidade circular

Distribuição circular: distribuição de probabilidade paravariáveis angulares em que toda a probabilidade estáconcentrada na circunferência do ciclo unitário

A função densidade de probabilidade circular f (θ) verifica

f (θ) ≥ 0

´ 2π0 f (θ)dθ = 1

f (θ) = f (θ + k2π)∀k

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Distribuição uniforme

A função densidade de probabilidade da distribuição circularuniforme é

f (θ) = 12π , θ ∈ [0,2π)

(todas as direcções têm igual probabilidade)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Distribuição de von Mises

A fdp da distribuição de von Mises é

f (θ) = 12πI0(k)

exp[kcos(θ − µ)], θ ∈ [0,2π), k > 0

onde

I0(k) é uma função de Bessel modificada de ordem 0,

I0(k) = 12π

´ 2π0 exp[k cosθdθ]

(“distribuição normal circular” - distribuição mais comum para dadoscirculares simétricos e unimodais)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Distribuição de von Mises

µ- direcção média

a distribuição de von Mises tem o valor máximo para θ = µ

a distribuição é simétrica em torno de µ

k - parâmetro de dispersão

k → 0 distribuição von Mises→ distribuição uniforme

k →∞ distribuição concentrada na direcção de µ

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Testes de hipótese para dados circulares

I Testes de Uniformidade

I Testes de Homogeneidade

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Testes de uniformidade

Distribuição uniforme

f (θ) = 12π , θ ∈ [0,2π)

(todas as direcções têm igual probabilidade)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Teste de Rayleigh

Assumindo que a distribuição dos dados é de Von Mises comparâmetro de dispersão k

H0 : k = 0

H1 : k > 0

(distribuição unimodal com direcção média desconhecida)

H1 : k > 0 & µ = µ0

(distribuição unimodal com direcção média µ0)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

H0 : k = 0H1 : k > 0

P-value: 0.15

H0 : k = 0H1 : k > 0 & µ = π

P-value: 0.96

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

H0 : k = 0H1 : k > 0

P-value: 0

H0 : k = 0H1 : k > 0 & µ = π

P-value: 0

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Teste de KuiperTeste não-paramétrico de uniformidade

H0 : a distribuição dos dados é uniforme (todas as direcções têmigual probabilidade)

P-value > 0.15 P-value:< 0.01

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Outros testes de uniformidade não-paramétricos

I Teste de Watson

I Teste de espaçamento de Rao

I Teste de Ajne

I ...

Vantagens dos testes não-paramétricos

- amostras pequenas

- dados não-unimodais

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Testes de homogeneidade

Para duas amostras de dados circulares

I a direcção média (direcção preferencial) das duaspopulações é a mesma?

I a variância circular (dispersão) é igual?

Em ambos os casos assume-se que os dados são amostras depopulações com distribuição de von Mises

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Teste de Watson

H0 : µ1 = µ2

P-value < 0.05

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Teste de Watson

H0 : µ1 = µ2

P-value < 0.05

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Teste de Rao

H0 : k1 = k2

P-value > 0.1

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Teste de Rao

H0 : k1 = k2

P-value < 0.01

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Intervalos de confiança - exemplo

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Intervalos de confiança - exemplo

mle.vonmises(x)

mu: 2.974( 0.1080 )

kappa: 2.308( 0.3966 )

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Intervalos de confiança - exemplo

Bootstrap ConfidenceIntervals

Confidence Level:95 %

Mean Direction:Low = 2.7 High = 3.2

ConcentrationParameter:Low = 1.8 High = 3.1

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Correlação circular

O coeficiente de correlação circular para dois conjuntos de dadoscirculares (αi , βi ), i = 1, ...,n com direcção média µ e ν (em relação àmesma direcção inicial e com o mesmo sentido de rotação) é dado por

ρc =E [cos(α− β − µ+ ν)− cos(α + β − µ− ν)]

2√

E [sin2(α− µ)]E [sin2(β − ν)]

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Correlação circular

Propriedades do coeficiente de correlação circular

I ρc(α, β) = ρc(β, α)

I |ρc(α, β)| ≤ 1

I ρc = 0 se α e β são independentes (o inverso não éverdadeiro)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Correlação circular

O coeficiente de correlação circular amostral para duas amostras(αi , βi ), i = 1, ...,n com direcção média α e β é dado por

rc =

∑ni=1 sin(αi − α)sin(βi − β)√∑ni=1 sin2(αi − α)sin2(βi − β)

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

rc = 0.90P-value < 0.01

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Exemplo

rc = 0.21P-value = 0.07

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013

Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese

Referências

Batschelet, E. (1981). Circular Statistics in Biology, AcademicPress

Jammalamadaka, S.R. & Sengupta, A. (2001). Topics inCircular Statistics. World Scientific, River Edge, N.J.

Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013