climatologia ii – aca226 prof. humberto rocha estatÍstica bÁsica – revisão séries temporais...
TRANSCRIPT
Climatologia II – ACA226Prof. Humberto Rocha
ESTATÍSTICA BÁSICA – Revisão
Séries Temporais – introdução
Referências sugeridas: 1- Estatística, P.L. Costa Neto, Ed. Edgard Blucher2 - Statistical methods in the atmospheric sciences, D. Wilks (2ª ed. Elsevier 2006)
Universo
Amostra
Definições
Variáveis aleatórias (v.a.): aquelas às quais existe um número Real associado a cada evento (ou possibilidade de ocorrência);
Série temporal : uma série de eventos discretos, ordenados no tempo.
Universo (ou população): conjunto de todos os elementos (ou dados) com uma certa característica comum;
Amostra: subconjunto do universo;
Climatologia II - ACA226 (Iag/USP)
Procedimentos básico para iniciar uma análise de séries temporais quanto à qualidade dos dados e interpretação de padrões gerais
Detecção de erros (grosseiros, sistemáticos, aleatórios); Inspeção visual; dispersão dos dados
Distribuição de Frequência (histogramas)
Medidas de posição : Amplitude, Média, Mediana, Moda
Medidas de Dispersão: Variância ; Desvio padrão ; Coef. variação
Alguns métodos Estatísticos análise de séries temporaisRegressão Linear
Determinísticos Componentes PrincipaisAnálise Espectral
Estocásticos (AR, MA, ARIMA ...)
evidência de erros ?
Climatologia II - ACA226 (Iag/USP)
Inspeção VisualDispersão dos dados
0
51015
2025
3035
4045
50
0 10 20 30 40 50
05
10
1520
2530
354045
50
0 20 40 60 80 100
Outlier
Série temporal de uma v.a. Eventos discretos
Periódica !?
Média estacionária !?
Variância não-estacionária !?
Amplitude de variação da série temporal Relação
entre duas v.a. Y e X
Climatologia II - ACA226 (Iag/USP)
Y
X
Distribuição de Frequências
Amostra: temperatura média durante 11 dias em SPDia Tmed (C) 1 22,02 23,53 23,94 22,55 23,76 24,67 24,18 23,29 22,810 23,411 24,2
N=11
Max = 24,6 C
Min = 22,0 C
Tendo-se uma amostra de v.a., deve-se identificar inicialmente:
N = no de dados (domínio, ou período se for série temporal)Máximo e mínimoClasse = subintervalos no domínio da amostra
Define-se a amplitude da classe:Por ex arbitrar igual a 0,5 C (homogênea)
Climatologia II - ACA226 (Iag/USP)
i Classe i fi P(fi) fac Pac(%)1 22,0-22,4 1 1/11=0,091 1 1/11=9,12 22,5-22,9 2 2/11=0,183 3 3/11=27,33 23,0-23,4 2 2/11=0,185 5 5/11=45,54 23,5-23,9 3 3/11=0,278 8 8/11=72,74 24,0-24,4 2 2/11=0,181 10 10/11=90,95 24,5-24,9 1 1/11=0,091 11 11/11=100
22 23 24
30
20
10
0
100
75
50
25
0
P(fi)% (fi)
fac Pac(%)
classeClimatologia II - ACA226 (Iag/USP)
(Prop) Área sob a curva da frequência relativa é:
NotasDefinição das classes
Homogênea: no de classes mínimo ~ 5.log n (sugestão inicial)
Heterogênea: quando há desproporcionalidade. Exemplo = precipitação diária (mm dia-1)
amplitudenn
amplitudefn
amplitudenfretângulos ii
i i
i amplitude
nffP i
i
aheterogênehomogênea
16
75 4
1 0,1 0,7 2,5 4,0
1ª Classe = 1 mm d-1 (por ex suprimindo os eventos de dias sem chuva)Climatologia II - ACA226 (Iag/USP)
À uma v.a. x pode-se associar uma função f(x) proporcional à probabilidade de ocorrência de x tal que
F(x) será uma
A probabilidadede de x ocorrer entre (a,b) é
Se (a,b) = (-, +) P=1
Função Densidade de Probabilidade (fdp)
1)( dxxffdp
curvadaabaixo
hachuradaáreadxxfbaxP
Nb
a
)(,
f(x)
xa b
Climatologia II - ACA226 (Iag/USP)
Média (também chamada de primeiro momento)
(Prop.1) Somando-se algebricamente uma constante c a uma v.a. xi, a média altera-se igualmente pela soma algébrica de c
(Prop.2) multiplicando-se uma constante c a xi, a média fica multiplicada por c
n
iixn
X1
1Medidas de Posição
Z
X
CXZ ii
iX
deslocamento da média, mantendo-se o padrão de variação
Climatologia II - ACA226 (Iag/USP)
Mediana : ordenando-se os n valores de uma v.a. xi em ordem crescente, a mediana (md) será igual
Moda : é o valor de máxima frequência
parnsenenordemdevaloresdosmédiaà
ímparnsenordemdevalorao
,122
,2
1
0;000
2
2
mxmx dxyd
dxdy
Exemplo de distribuição bimodal
m0
Climatologia II - ACA226 (Iag/USP)
Histograma (exemplo anterior)
22 23 240
10
20
30
0.0
20.0
40.0
60.0
80.0
100.0
22 23
Pac
25
P(fi)
244,23x
75,230 m 5,23md
Mediana é o valor de X que corresponde a 50% de probabilidade de ocorrência do evento
50%
I II
Mediana divide o histograma em áreas iguais
III AA
Climatologia II - ACA226 (Iag/USP)
Assimetria de histogramas
xmd0m x md 0m
mdmx 0
f(x)
x
x x
f(x) f(x)
Simétrico
superiores valoresdos viésx
Assimetria positiva: predominam valores abaixo da média
Assimetria negativa: predominam valores acima da média
aa
constante
a
axfaxf
inferiores valoresdos viésx
Climatologia II - ACA226 (Iag/USP)
Assimetria da fdp
Assimetria definida como
n
iia xx
na
1
31
áreaI )( II0)( áreaaa
Climatologia II - ACA226 (Iag/USP)
dxxfdxxfIIPIPIII
Quantis: divide o histograma em área iguais (chamados também de percentis ou fractis), ex: tercil, quartil...
I II III IV
Quartil
41 adeProbabilid
IVIIIIII AAAA
Climatologia II - ACA226 (Iag/USP)
Medidas de Dispersão
1) Desvio da média
2) Amplitude
3) Variância: é o desvio quadrático médio (σ2 para universo, s2 para amostra)
4) Desvio-Padrão:
5) Coeficiente de variação: Adimensional
xxd i
minmax xxR
22
11
i
i xxn
s
2ss
2xUnidade
xUnidade
xsvc ..
s2 baixa s2 alta
Achatamento do histograma
Climatologia II - ACA226 (Iag/USP)
• É um processo estocástico cuja distribuição de probabilidade não se altera quando deslocada no tempo, ou no espaço.
Consequentemente, parâmetros como média, variância, não se alteram em uma série temporal.
ex: Tendência linear indica alteração da média da série histórica;
Salto da série indica dois segmentos distintos de tempo, com médias distintas entre si.
Processo Estacionário
A distribuição Normal
x
2)(
Sx de padrão desviox x demédia
21 2
2
x
exfNormalfdp
Climatologia II - ACA226 (Iag/USP)
quando média =0 desvio-padrão = 1 então
chama-se distribuição Normal padrão (ou padronizada)
Normalização ou Variável Normalizada
Obedece à seguinte transformação na v.a. Xi
Também chamada variável reduzida ou padronizada (standardized)
(Prop.) Média de Z é zero.
Transformações Normalizantes
s
XXZ ii
Climatologia II - ACA226 (Iag/USP)
xyxy
xy
lnlim que se- tem,1 b)
te)insuficienser pode simples, (mais ln a)
0
4,0.....1,0
fdp(z)
zi
Simétrica
aa
Propriedades da Normalização (e vantagens)
zi
t
xi
t
x
s2
s2
s
s
extremos no período
Mesmo padrão de oscilação
Variação positiva ou negativa em multiplos do desvio-padrão
Conceito de anomalia da média
Climatologia II - ACA226 (Iag/USP)
Aderência de Dados : como a distribuição de uma amostra ajusta-se à uma distribuição teórica
Ex: Precipitação diária geralmente não se ajusta à Normalou se ajusta mais da log-Normal
Nota: quantifica-se a aderência com testes específicos (como o teste do qui-quadrado, por exemplo, após aulas de Reg. Linear)
2
2
2))((
21log
xLn
ex
xfNormalfdp
Climatologia II - ACA226 (Iag/USP)
(quando a distribuição de Ln(x) é Normal)
Como duas v.a. variam simultaneamente ?
Covariância de x,y (def): '
1'1 '
'''11,cov yxyxn
yyxxn
yxn
ii
y
i
n
i x
i
ii
i
x
y
x y
0'x
0'x
Climatologia II - ACA226 (Iag/USP)
0'y 0'y
Covariância alta (distante de zero)
(e neste caso positiva)
Covariância baixa
(aproxima-se de zero)
y
xy
x