conceitos bÆsicos de estatística aula 2 - cm.de.iscte.ptcm.de.iscte.pt/aula2vi.pdf · intervalos...

66
Conceitos BÆsicos de Estatstica Aula 2 ISCTE - IUL, Mestrados de Continuidade Diana Aldea Mendes [email protected] 13 de Setembro de 2011 DMQ, ISCTE-IUL ([email protected] ) Estatstica 13 de Setembro de 2011 1 / 65

Upload: ledat

Post on 23-Jan-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

Conceitos Básicos de Estatística

Aula 2

ISCTE - IUL, Mestrados de Continuidade

Diana Aldea Mendes

[email protected]

13 de Setembro de 2011

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 1 / 65

Estatística Aplicada

(Revisões)

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 2 / 65

Programa

Introdução

Estatística Aplicada

Medidas de estatística descritiva com destaque para as medidas deassimetria e de curtose.Variáveis aleatórias.Distribuições: Normal, Qui-quadrado, t-Student e F-Snedecor.Intervalos de confiança e testes de hipóteses.

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 3 / 65

Estatística Descritiva

A Estatística Descritiva consiste na apresentação, análise einterpretação de um conjunto de dados (amostra), através da criaçãode instrumentos adequados:

representação gráfica (séries temporais, dispersão, caixas de bigodes,etc)distribuições de frequênciascálculo de valores numéricos que caracterizam os dados de uma formaglobal: medidas de estatística descritiva.

Essas medidas designam-se por parâmetros, quando os dados sereferem a uma população e por estatísticas, quando os dados dizemrespeito a uma amostra

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 4 / 65

Estatística Descritiva

A estatística incide sobre as características relevantes dos elementosque constituem as amostras e as populações. Cada característica égeralmente representada por uma variável, pois os elementos podemter diferentes posicionamentos relativamente a essa característica.

Variáveis

DiscretasContínuas

A escolha da técnica mais adequada para o tratamento estatísticoestá condicionada pela natureza das variáveis: dados qualitativos equantitativos.

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 5 / 65

Estatística Descritiva

Distribuições de frequências (gráficos de barras) para uma variáveldiscreta e para uma variável contínua

0

4

8

12

16

20

24

28

10 15 20 25 30 35 40

Series: PETROLEOSample 1986M01 2003M11Observations 215

Mean 20.94995Median 19.96000Maximum 39.53000Minimum 10.25000Std. Dev. 5.271820Skewness 0.823380Kurtosis 3.524400

Jarque­Bera 26.75686Probability 0.000002

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 6 / 65

Medidas de Estatística Descritiva

Medidas de tendência central (posição, localização): identificam ocentro de uma distribuição

Média (mean, average)Mediana (median)Moda (mode)

Medidas de tendência não-central (posição, localização): apontampara outras posições da distribuição

Quartis (Qi, i = 1, 2, 3, 4)Decis (Di, i = 1, 2, ..., 10)Percentis (Pi, i = 1, 2, ..., 100)

Medidas de dispersão (variabilidade)

variância (variance)desvio padrão (standard deviation)

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 7 / 65

Medidas de tendência central

A média denota-se por µ para uma população e por x para umaamostra

Média de uma amostra (x1, x2, ..., xn) onde n é o tamanho da amostrae xi é o valor da observação i na amostra, é dada por

x =x1 + x2 + ...+ xn

n=

n∑

i=1xi

n,

Exemplo: Dada uma amostra de 5 observações 90, 95, 80, 60, 75, amédia é:

x =90+ 95+ 80+ 60+ 75

5=

4005= 80.

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 8 / 65

Medidas de tendência central

1 1.5 2 2.5 3 3.5 4 4.5 550

55

60

65

70

75

80

85

90

95

100

média

mean = 80; std = 13.6931 = median

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 9 / 65

Medidas de tendência central

0 10 20 30 40 50 60 70 80 90 100­2.5

­2

­1.5

­1

­0.5

0

0.5

1

1.5

2

2.5

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 10 / 65

Medidas de tendência central

­4

­2

0

2

4

6

8

0 100 200 300 400 500T

LOG

VOL

LOGVOL vs. T

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 11 / 65

Medidas de tendência central

Mediana: Me - é um outro nome atribuido ao percentile 50% erepresenta o centro posicional da distribuiçãoCálculo da mediana de um amostra

ordenar os dados em ordem crescente: do mais pequeno para o maiorse n (o número de dados na amostra) é ímpar, então a mediana é onúmero do meio (central)

Me = x n+12

se n é par, então a mediana é a média dos dois números do meio(centrais)

Me =x n+2

2+ x n

2

2Exemplo 1: amostra com um número ímpar de dados: 2, 8, 3, 4, 1

ordenar os dados: 1, 2, 3, 4, 8, logo Me = 3

Exemplo 2: amostra com um número par de dados: 2, 8, 3, 4, 1, 8ordenar os dados: 1, 2, 3, 4, 8, 8 logo Me = (3+ 4)/2 = 3.5

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 12 / 65

Medidas de tendência central

A moda (Mo) é o valor ou categoria que ocorre com a maiorfrequência

Exemplo: a moda da amostra: 9, 2, 7, 11, 14, 7, 2, 7 é o 7, pois a suafrequência é 3As distribuições podem ser:

Unimodais —1 valor de MoBimodais —2 valores de MoMultimodais —vários valores de MoAmodais —Não regista qualquer valor de destaque

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 13 / 65

Medidas de dispersão

Variância:

σ2 = Var (x) = ∑ni=1 (xi − µ)2

npopulação

s2 = Var (x) = ∑ni=1 (xi − x)2

n− 1amostra

Desvio padrão (Standard Deviation): é a mais comum medida devariabilidade. Define-se para uma população (σ) e para uma amostra(s) como a seguir:

σ =

√∑n

i=1 (xi − µ)2

ne s =

√∑n

i=1 (xi − x)2

n− 1

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 14 / 65

Outras medidas

Momento Estatístico

Se x1, x2, ..., xn são os n valores assumidos pela variável X, definimos omomento de ordem t dessa variável como:

mt =∑n

i=1 xti

n

Note que se t = 1 temos a média aritmética.O momento de ordem t centrado em uma constante K, com K 6= 0 édefinido como:

mKt =

∑ni=1 (xi − K)t

n

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 15 / 65

Assimetria

Assimetria (skewness) é o grau de afastamento que uma distribuiçãoapresenta do seu eixo de simetria. Este afastamento pode acontecer dolado esquerdo ou do lado direito da distribuição, chamado de assimetrianegativa ou positiva respectivamente.

Coeficiente do momento de assimetria

sk =m3

s3 =1n ∑n

i=1 (xi − x)3√(1n ∑n

i=1 (xi − x)2)3

Temos entãosk = 0 distribuição simétricask > 0 distribuição assimétrica positivask < 0 distribuição assimétrica negativa

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 16 / 65

Assimetria

1 2 3 4 5 6 7 8 90

2

4

6Distrib. simétrica

1 2 3 4 5 6 7 8 90

2

4

6

8Assim. positiva (enviesada à esquerda)

1 2 3 4 5 6 7 80

2

4

6

Assim. negativa (enviesada à direita)

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 17 / 65

Curtose

Curtose é o grau de achatamento da distribuição. Ou o quanto umacurva de frequência será achatada em relação a uma curva normal dereferência.

Para o cálculo do grau de curtose de uma distribuição utiliza-se ocoeficiente do momento de curtose

k =m4

s4 =1n ∑n

i=1 (xi − x)4(1n ∑n

i=1 (xi − x)2)2

Temos então k = 3 distribuição mesocúrticak > 3 distribuição leptocúrticak < 3 distribuição platicúrtica

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 18 / 65

Curtose

­6 ­4 ­2 0 2 4 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

x

f(x)

Curtose

leptocúrtica

mesocúrtica

platicúrtica

x=0.13333

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 19 / 65

Output Eviews (PSI20): distribuição não-normal, assimétrica positiva(sk > 0) e platicúrtica (k < 3)

50

100

150

200

250

300

350

90 92 94 96 98 00 02 04 06

pt

PT

t

0

100

200

300

400

500

600

80 120 160 200 240 280 320

Series: PTSample 1/02/1990 5/12/2008Observations 4790

Mean 149.5132Median 151.5150Maximum 312.1800Minimum 58.83000Std. Dev. 66.51653Skewness 0.384446Kurtosis 2.054050

Jarque­Bera 296.5841Probability 0.000000

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 20 / 65

Probabilidade de um Acontecimento

Um tratamento estatístico é sempre um tratamento numérico, mesmoque a natureza das variáveis envolvidas não o seja.Assim, torna-se necessário encontrar um processo que permita atribuirvalores reais aos resultados elementares de qualquer experiênciaaleatória. Fazer tais atribuições de valores, não é mais do que definirfunções reais no espaço de acontecimentos ΩNo entanto, não podem ser quaisquer funções.Têm que ser definidas de modo a que, ao trabalhar com elas, não seperca nenhuma informação sobre a forma como se distribuiam asprobabilidades, em relação aos acontecimentos da experiênciaaleatória inicial;Tem que se poder estar seguro em relação à interpretação dequalquer intervalo ou valor real, e ainda assegurar a validade dasoperações entre acontecimentos.

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 21 / 65

Probabilidade de um Acontecimento

Se uma experiência é repetida um número grande de vezes, n, e oacontecimento A é observado nA vezes, então a probabilidade de A é

P (A) ' nA

n, se n é suficientamente grande

onde nA é a frequência do acontecimento A e nAn é a frequência

relativa de A.Considere uma experiência aleatória cuja espaço de amostragem é S ecom pontos de amostragem E1, E2, .... Para cada acontecimentoEi ∈ S define-se um número P(Ei) (a probabilidade do Ei) quesatisfaz as seguintes três condições:

0 ≤ P(Ei) ≤ 1 para todo o iP(S) = 1Propriedade de aditividade ∑S P (Ei) = 1

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 22 / 65

Variáveis Aleatórias

Definição: uma variável aleatória (v.a.) é uma regra (função) queasigna um valor numérico (x) a cada resultado possível de umaexperiência aleatória (ω), isto é

X : Ω→ R

ω → X (ω) = x

Uma variável aleatória é discreta se só assume um número finito ouinfinito numerável de valores distintosUma variável aleatória diz-se contínua se assumir um número infinitonão numerável de valores distintosA função (densidade) de probabilidade de uma v.a. X é umafunção fX que associa a cada valor possível x de X a sua

probabilidade de ocorrência: fX (x) = P (X = x) . Tem-se que

0 ≤ fX (x) ≤ 1 e ∑xi

fX (xi) = 1.

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 23 / 65

Variáveis Aleatórias

Variávelaleatória

Discreta Contínua

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 24 / 65

Variáveis Aleatórias

A distribuição de probabilidades pode ainda ser descrita através dafunção de distribuição cumulativa F(x), que, para cada x, dá aprobabilidade da v.a. assumir um valor inferior ou igual ax : F (x) = P (X ≤ x) (probabilidade acumulada até x), onde

0 ≤ F (x) ≤ 1, F (x) é não-decrescentelim

x→−∞F (x) = 0 e lim

x→+∞F (x) = 1

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 25 / 65

Variáveis Aleatórias

Se X é uma variável aleatória contínua, então, se existe uma funçãonão-negativa fX (x) ≥ 0, ∀x ∈ R e integrável com∫ +∞

−∞fX (x) dx = 1

tal que

P (a ≤ X ≤ b) =∫ b

afX (x) dx, ∀a, b ∈ R

então denotamos a função fX (x) por função densidade deprobabilidades (fdp) da v.a. X.Também podemos descrever a distribuição de probabilidades atravésda função de distribuição cumulativa

F (x) = P (X ≤ x) =∫ x

−∞fX (t) dt ⇒ F′ (x) = fX (x)

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 26 / 65

Variáveis Aleatórias

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 5­1

Experimento: Lançar 2 Moedas. Seja X = #cabeças.

T

T4 possibilidades

T

T

H

H

H H

Distribuição de probabilidades

0 1 2 x

Valor de x Probabilidade

0 1/4 = .25

1 2/4 = .50

2 1/4 = .25

.50

.25

Prob

abili

ty

Determinar P(x) , i.e., P(X = x) , para todo o x:

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 27 / 65

Variáveis Aleatórias

x

fX

a b

Área a sombreado = P (a < X < b)

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 28 / 65

Variáveis Aleatórias - Valor esperado e Variância

Definição: o valor esperado (média) de uma v.a. X denota-se porµ e é definida como a seguir:

µ = E (X) = ∑x

x fX (x) = ∑x

x P (x) , X discreta

µ = E (X) =∫ +∞

−∞x fX (x) dx, X contínua

Definição: Se X é uma variável aleatória com média µ, então avariância de X é definida por

σ2 = Var (X) = ∑x(x− µ)2 fX (x) = ∑ x2fX (x)−µ2 = E

((X− µ)2

)O desvio padrão de X define-se por

σ =√

Var (X) =√

∑x(x− µ)2 fX (x) =

√∑ x2fX (x)− µ2

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 29 / 65

Variáveis Aleatórias

Example

Continuação da experiência de lansamento de 2 moedas: temos a seguintetabela

x P (x)0 0.251 0.52 0.25

Calcular o valor esperado

E (X) = ∑x

x P (x) = ( 0︸︷︷︸x1

× 0.25︸︷︷︸P(x1)

) + ( 1︸︷︷︸x2

× 0.50︸︷︷︸P(x2)

) + (2× 0.25) = 1

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 30 / 65

Variáveis Aleatórias

Teorema: Se fX (x) é a função probabilidade de uma variávelaleatória X e g (X) é alguma função de variável X, então o valoresperado da função g é dado por

E (g (X)) = ∑x

g (X) fX (x)

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 31 / 65

Variáveis Aleatórias

Propriedades

E (c) = cE (cX) = cE (X)E (aX+ bY) = aE (X) + bE (Y)E (XY) = E (X)E (Y) + cov(X, Y) (se X, Y são independentes, entãoE (XY) = E (X)E (Y))Var (X) = E

(X2)− (E (X))2

Var (c) = 0Var (aX+ b) = a2Var (X)Var(X± Y) = Var(X) +Var(Y)± 2cov(X, Y) (se X e Y sãoindependentes, então Var(X± Y) = Var(X) +Var(Y))

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 32 / 65

Variáveis Aleatórias Bidimensionais

Usa-se quando há interesse por dois resultados simultâneos (porexemplo, altura X e peso Y de duas pessoas)

Sejam E um experimento aleatório e Ω o espaço amostral associado aE e sejam X = X(ω) e Y = Y(ω) duas funções, cada umaassociando um número real a cada resultado ω ∈ Ω. Então o par(X, Y) designa-se variável aleatória bidimensional.Para (X, Y) variável aleatória bidimensional e para ∀ (x, y) ∈ R2

define-se a função de distribuição conjunta de (X, Y) por:

FX,Y (x, y) = P (X ≤ x, Y ≤ y) = ∑xi≤x

∑yj≤y

PX,Y(xi, yj

), (discreto)

FX,Y (x, y) = P (X ≤ x, Y ≤ y) =∫ x

−∞

∫ y

−∞PX,Y (x, y) dxdy, (contínuo)

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 33 / 65

Variáveis Aleatórias Bidimensionais

Propriedades da função de distribuição conjunta

0 ≤ FX,Y (x, y) ≤ 1, ∀ (x, y) ∈ R2

FX,Y(x+4x, y+4y

)≥ FX,Y (x, y) , ∀4x,4y ≥ 0

limx,y→+∞

FX,Y (x, y) = 1

limx→−∞

FX,Y (x, y) = 0 e limy→−∞

FX,Y (x, y) = 0

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 34 / 65

Variáveis Aleatórias Bidimensionais

Seja (X, Y) uma variável aleatória bidimensional. Então

PX,Y (x, y) = P (X = x, Y = y) , ∀ (x, y) ∈ R2

diz-se a função (densidade) de probabilidade conjunta de (X, Y).PX,Y (x, y) ≥ 0, ∀ (x, y) ∈ R2

∑x ∑y PX,Y (x, y) = 1 (discreto)∫ +∞−∞

∫ +∞−∞ PX,Y (x, y) dxdy = 1 (contínuo)

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 35 / 65

Variáveis Aleatórias Bidimensionais

A partir do conhecimento do comportamento conjunto de (X, Y) étambém possível analisar separadamente X e Y uma vez que

limx→+∞

FX,Y (x, y) = FY (y) e limy→+∞

FX,Y (x, y) = FX (x)

Função (densidade) de probabilidade marginal de X; pX (x)

pX (x) = P (X = x, Y qualquer) = ∑y

PX,Y (x, y)

pX (x) = P (X = x, Y qualquer) =∫ +∞

−∞PX,Y (x, y) dy

Função (densidade) de probabilidade marginal de Y; pY (y)

pY (y) = P (X qualquer, Y = y) = ∑x

PX,Y (x, y)

pY (y) = P (X qualquer, Y = y) =∫ +∞

−∞PX,Y (x, y) dx

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 36 / 65

Variáveis Aleatórias Bidimensionais

Dada uma variável aleatória bidimensional (X, Y), diz-se que as v.a.unidimensionais que a integram, X e Y, são independentes, se a suafunção de probabilidade conjunta, PX,Y (x, y), for igual ao produto dasfunções de probabilidade marginais correspondentes, isto é:

PX,Y (x, y) = pX (x)× pY (y) , ∀ (x, y) ∈ R2

Teorema: Se X e Y são variáveis aleatórias independentes então asvariáveis aleatórias U = g(X) e V = h(Y) são também independentes

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 37 / 65

Variáveis Aleatórias Bidimensionais

Sejam X e Y duas variáveis aleatórias discretas. A funçãoprobabilidade condicionada (condicional) da v.a. Y exprime aprobabilidade de Y assumir o valor y quando é especificado o valor xpara X. Define-se por

P (Y = y | X = x) =P (X = x, Y = y)

P (X = x)=

PX,Y (x, y)pX (x)

Tem-se analogamente

P (X = x | Y = y) =P (X = x, Y = y)

P (Y = y)=

PX,Y (x, y)pY (y)

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 38 / 65

Variáveis Aleatórias Bidimensionais

Define-se a covariância entre X e Y, e denota-se por Cov(X, Y),como sendo

Cov(X, Y) = E[(X− µX)(Y− µY)]

= ∑x

∑y(x− µX)(y− µY)PX,Y (x, y)

= E (XY)− E (X)E (Y)

A covariância mede a intensidade da relação linear existente entreduas variáveis e assume valores reais.

Teorema: Se X e Y forem independentes então

Cov(X, Y) = 0

O recíproco não é, em geral, verdadeiro, isto é: Cov(X, Y) = 0 nãoimplica que X e Y sejam v.a. independentes

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 39 / 65

X

Y

a) Relação linear positiva X

Y

b) Relação linear negativa X

Y

c) Ausência de relação

X

Y

d) Relação não­lin. posit. X

Y

e) Relação linear positivacom menor grau de relação que em a)

X

Y

f) Relação linear positivaCom maior grau de relação que em a).

X

Y

a) Relação linear positiva X

Y

a) Relação linear positiva X

Y

b) Relação linear negativa X

Y

c) Ausência de relação

X

Y

d) Relação não­lin. posit. X

Y

e) Relação linear positivacom menor grau de relação que em a)

X

Y

f) Relação linear positivaCom maior grau de relação que em a).

X

Y

f) Relação linear positivaCom maior grau de relação que em a).

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 40 / 65

Distribuição normal: caracterizada por dois parâmetros: média µ edesvio-padrão σ e dada pela função densidade de probabilidades (fdp)

f (x) =1

σ√

2πe−(x−µ)2/2σ2

, −∞ < x < ∞

Uma v.a. normalmente distribuída com µ = 0 e σ = 1 diz-se que temuma distribuição normal padrão (standard). Denota-se por Z e asua fdp é dada por f (z) = 1√

2πe−z2/2, −∞ < z < ∞

Trata-se de uma função em forma de sino, simétrica em relação amédia com área abaixo do gráfico =1.

Notação: X ∼ N(µ, σ2) e Z ∼ N (0, 1)

Padronizar uma variável aleatória normal:

z-score Z =X− µX

σX⇔ X = µX + σXZ, µZ = 0, σ2

Z = 1.

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 41 / 65

Distribuições ContínuasDistribuição normal

­6 ­4 ­2 0 2 4 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

x

f(x)

Distribuição normal

sigma=1.36, mu=0.1

sigma=0.57, mu=0.1

sigma=1.7, mu=0.1

x=0.13333

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 41 / 65

Distribuições ContínuasDistribuição Qui-Quadrado

Seja um conjunto de k variáveis Zi (i = 1, ..., k) tal que:cada variável Zi segue uma distribuição normal padronizada,Zi ∼ N(0, 1)as variáveis Zi são mutuamente independentes

A variável aleatória X = ∑i Z2i , segue uma Distribuição

Qui-quadrado com k graus de liberdade quando a sua funçãodensidade de probabilidades tem a forma

f (x) =1

2k/2Γ (k/2)e−x/2x(k/2)−1, Γ função gamma

Notação: X = ∑i Z2i ∼ χ2

(k)

Média: µ = k e Variância: σ2 = 2kÉ uma distribuição assimétrica, que se aproxima da distribuiçãonormal, à medida que k aumenta

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 42 / 65

Distribuições ContínuasDistribuição Qui-Quadrado

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 43 / 65

Distribuições ContínuasDistribuição t-Student

Sejam duas variáveis independentes Z ∼ N (0, 1) e V ∼ χ2(k).

Define-se a nova variável

X =Z√V/k

.

A variável X tem uma distribuição t de Student com k graus deliberdade se a sua função densidade de probabilidades tem a forma

f (x) =Γ(

k+12

)√

kπΓ(

k2

) (1+x2

k

)− k+12

, −∞ < x < ∞, k > 0

Notação: X ∼ t(k)Média: µ = 0 para k > 1 e Variância: σ2 = k

k−2 para k > 2Distrib. simétrica em relação à origem, que se aproxima da distrib.normal à medida que k aumenta;

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 44 / 65

Distribuições ContínuasDistribuição t-Student

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 45 / 65

Distribuições ContínuasDistribuição F de Snedecor

Sejam duas variáveis independentes V1 ∼ χ2(k1)

e V2 ∼ χ2(k2)

.Define-se a nova variável

X =V1/k1

V2/k2.

A variável X segue uma distribuição F com k1 e k2 graus de liberdadese a sua função densidade de probabilidades tem a forma

f (x) =Γ(

k1+k22

)Γ(

k12

)Γ(

k22

)(

k1k2

) k12 x

k12 −1

(k2 + k1x)k1+k2

2

Notação: X ∼ F(k1,k2)

Média: µ = k2k2−2 para k2 > 2

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 46 / 65

Distribuições ContínuasDistribuição F de Snedecor

Variância: σ2 =2k2

2(k1+k2−2)k1(k2−2)2(k2−4)

para k2 > 4

É uma distribuição positiva e assimétrica e os seus valoresencontram-se em tabelas

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 47 / 65

Inferência Estatística (Estatística Inferencial, Indutiva)

A inferência estatística tem como objectivos tirar conclusões sobreos parâmetros da população a partir da recolha, tratamento e análisedos dados de uma amostra, obtida dessa população.

População(desconhecida)

Amostra(conhecida)

Amostragemaleatória

Inferênciaestatística

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 48 / 65

Inferência Estatística

Parâmetro —Medida usada para descrever a distribuição dapopulação

a média µ e a variância σ2 são parâmetros de uma distribuição Normal

Estatística —Função de uma amostra aleatória que não depende deparâmetros desconhecidos

Média amostral, Variância amostral

Num problema de inferência estatística a estimação dos parâmetrospode ser

pontual (estatística, estimador = é a v.a. que estima (pontualmente)um parâmetro (populacional) )por intervalos (intervalos de confiança)

Estimação pontual: procedimento que vai permitir obter um valorque seja o “melhor” (de acordo com algum critério) para umparâmetro desconhecido θ.Um estimador de θ é uma v.a. com uma dada distribuição.Chama-se estimativa de θ e representa-se por θ, um valor concretoassumido pelo estimador.DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 49 / 65

Inferência Estatística - Propriedades dos estimadores

O estimador Θ do parâmetro θ, diz-se centrado ou não enviesadose e só se E(Θ) = θ.Dados dois estimadores centrados para θ, Θ e Θ′ diz-se que Θ é maiseficiente do que Θ′ se

Var[Θ] ≤ Var[Θ′].

Um estimador diz-se suficiente, quando utiliza toda a informaçãodisponível na amostra.

Seja X1, ..., Xn uma amostra aleatória de dimensão n extraída de umapopulação com média µ e variância σ2. Então,

X = ∑ni=1 Xi

ne S2 =

∑ni=1(

Xi −X)2

n− 1

são estimadores centrados de µ e σ2, respectivamente.

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 50 / 65

Inferência Estatística - Estimação por Intervalos

Na estimação por intervalos, em vez de se indicar um determinadovalor estimado para certo parâmetro da população, constrói-se umintervalo que, com certo grau de certeza, previamente fixado, ocontenha.

Um intervalo de confiança para um parâmetro θ, a um grau deconfiança 1− α, é um intervalo aleatório (Linf , Lsup) tal que:

P(Linf < θ < Lsup) = 1− α, α ∈ (0, 1)

onde α deve ser um valor muito reduzido por forma a temosconfianças elevadas.

α é o nível de confiança (significância), ou seja o erro que estamosa cometer

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 51 / 65

Intervalo de confiançaIC para a média quando a variância é conhecida

Seja X1, ..., Xn uma amostra aleatória de dimensão n. Consideramosque a v. a. X tem um distribuiçao normal, i.e., X ∼ N

(µ, σ2) .

Se σ é conhecido, então considere-se a nova variável

Z =X− µ

σ/√

n∼ N (0, 1) .

Fixamos α (o nível de significância) e notamos por zα/2 o valor críticode Z tal que P (Z > zα/2) = α/2. Então

P (−zα/2 < Z < zα/2) = 1− α⇔ P(−zα/2 <

X− µ

σ/√

n< zα/2

)= 1− α

e portanto o intervalo a (1− α)× 100% de confiança para µ é

X− zα/2σ√n< µ < X+ zα/2

σ√n

(1)

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 52 / 65

Intervalo de confiançaIC para a média quando a variância é desconhecida

Se a variância σ é desconhecida e a amostra é grande, então podemossubstituir σ → SSe a amostra é pequena, a variável obtida no caso anterior já não énormal. Mas, se a população é normal, então a variável aleatória

T =(X− µ

)S/√

n∼ t(n−1)

tem distribuição t-Student com n− 1 graus de liberdade.Então, o intervalo a (1− α)× 100% de confiança para µ é

x− tα/2,(n−1)s√n< µ < x+ tα/2,(n−1)

s√n

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 53 / 65

Intervalo de confiança

Diminuindo o grau de confiança de 99% a 95%, aumentamos o riscode estar errados: de 1% de risco passamos a 5% de risco, ou sejatemos mais possibilidades (5/100 em vez de 1/100) de que o IC nãocontenha a média populacional.

Ao aumentar o risco, o intervalo deve ser mais preciso

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 54 / 65

Testes (ensaios) de hipóteses

Decisão estatística: tomar uma decisão baseando-nos numa amostraExemplos:

Verificar se mais de metade da população irá consumir um novoproduto lançado no mercado;Testar se um sistema educacional é melhor em média que outroDecidir se um novo medicamento cura ou não uma certa doença

Uma hipótese estatística é uma afirmação acerca dos parâmetros deuma ou mais populações (testes paramétricos) ou acerca dadistribuição da população (testes de ajustamento, não-paramétricos).

Os testes de hipóteses têm como objectivo decidir, com base nainformação fornecida pelos dados de uma amostra, sobre a aceitaçãoou não de uma dada hipótese (conjectura sobre aspectosdesconhecidos da(s) população(ões)).

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 55 / 65

Testes de hipóteses

Formular duas hipóteses:

hipótese nula H0 (aqui se especifica o valor do parâmetro ou adistribuição a verificar)hipótese alternativa H1

A resposta num teste de hipóteses é dada na forma rejeição ou nãorejeição de H0

Os pontos de fronteira chamam-se valores críticos

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 56 / 65

Testes de hipóteses

A tomada de decisões no processo de inferência posui riscos, o quedetermina a aparição dos erros de decisão

Tipos de erros:

Erro do tipo I: rejeitar H0 sendo H0 verdadeira (erro de rejeição);Erro do tipo II: não rejeitar H0 sendo H0 falsa (erro de não-rejeição).

Definem-se

α = P(erro do tipo I) = P (Rejeitar H0|H0 é verdadeira), onde αchama-se nível de significância do teste. Em geral, atribuir-se umvalor muito baixo à probabilidade do erro do tipo I (0.05 ou 0.01)β = P(erro do tipo II) = P(Não-rejeitar H0|H0 é falsa), onde 1− βchama-se potência do teste

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 57 / 65

Testes de hipóteses

Procedimento Geral dos Testes de Hipóteses (Testes deSignificância ou Teste Estatístico)

Pelo contexto do problema identificar o parâmetro de interesseEspecificar a hipótese nula H0 e a hipótese alternativa apropriada H1Escolher o nível de significância, αEscolher uma estatística de teste adequada (variável aleatória utilizadapara decidir: por exemplo média amostral)Definir a região crítica ou região de rejeição —RCDeterminar o valor real da estatística de testeDecidir sobre a rejeição ou não de H0

Se o valor calculado ∈ RC rejeita-se H0Se o valor calculado /∈ RC não se rejeita H0

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 58 / 65

Testes de hipóteses

­5 ­4 ­3 ­2 ­1 0 1 2 3 4 50

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

Não rejeitar H0

Rejeitar H0 Rejeitar H0

Região críticaRegião crítica

Região de aceitação

Valor crítico Valor crítico

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 59 / 65

Testes de hipóteses

Teste bilateral:

H0 : µ = µ0

H1 : µ 6= µ0

Teste unilateral à direita:

H0 : µ = µ0

H1 : µ > µ0

Os valores da estatística de teste que nos levarão a rejeitar H0 econcluir que µ > µ0, também nos levarão a rejeitar qualquer valormenor do que µ0.Teste unilateral à esquerda

H0 : µ = µ0

H1 : µ < µ0

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 60 / 65

Testes de hipóteses

­5 ­4 ­3 ­2 ­1 0 1 2 3 4 50

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

­5 ­4 ­3 ­2 ­1 0 1 2 3 4 50

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

Região crítica

Rejeitar H0

Região de aceitação

Não rejeitar H0

Região de aceitação

Não rejeitar H0

Valor crítico

Região crítica

Rejeitar H0

Valor crítico

H1: mu < mu0H1: mu > mu0

Testes unilaterais

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 61 / 65

Testes de hipóteses

A indicação do valor observado da estatística do teste, seguido daconsulta de uma tabela para a procura de um valor crítico, tem sidorecentemente “substituído”pelo cálculo de: a probabilidade de seobservar um valor igual ou mais extremo do que o observado, se ahipótese nula é verdadeira —chama-se a isto valor de prova; valor p( p-value, possível calcular com ajuda do qualquer software )Podemos interpretar o valor do p-value como o maior nível designificância que levaria à não rejeição da hipótese nula (ou o menorque levaria à rejeição).Assim, quanto menor for o p-value, menor é a consistência entre osdados e a hipótese nula (Quanto mais baixo for o valor-p maior é aevidência contra a hipótese nula.)Habitualmente adopta-se como regra de decisão:

rejeitar H0 se p-value ≤ α

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 62 / 65

Testes de hipóteses

Examples

Máquina de encher pacotes de açúcar. O peso de cada pacote deve ser ≈8g (isto é, µ = 8). Será que a máquina está a funcionar correctamente?

SolutionTemos então a hipótese nula

H0 : µ = 8

contra a hipótese alternativa H1 : µ 6= 8. Seja X - variável aleatória querepresenta o peso de um pacote de açúcar, com E (X) = µ e Var (X) = 1.Vamos considerar que numa amostra aleatória de 25 observações:X1, ..., X25 observou-se x = 8.5. Quer-se saber se, ao nível de significânciade 5%, se pode afirmar que a máquina continua afinada.

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 63 / 65

Testes de hipóteses

Estatística do teste:

Z0 =X− 8

1/√

25e para α = 0.05→ a = 1.96 donde se obtem a região crítica:

Z0 < −1.96 ou Z0 > 1.96.

Com x = 8.5 obtém-se

z0 =8.5− 81/√

25= 2.5.

Como z0 > 1.96 rejeita-se H0, ou seja existe evidência (ao nível designificância considerado) de que a máquina está desafinada.Considerando agora um valor-p, temos que: quando z0 = 2.5, para estevalor H0 não é rejeitada se

α ≤ 2 (1−Φ (2.5)) = 0.0124

ou seja, p = 0.0124.DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 64 / 65

DMQ, ISCTE-IUL ([email protected]) Estatística 13 de Setembro de 2011 65 / 65