capítulo 4 - faculdade de ciências exatas e da...

31
Slide 1 Ana M. Abreu - 2006/07 Capítulo 4 Inferência Estatística Resenha Intervalo de Confiança para uma proporção Intervalo de Confiança para o valor médio de uma variável aleatória Intervalo de Confiança para a variância de uma variável aleatória Intervalo de Confiança para a diferença de duas proporções Intervalo de Confiança para a diferença dos valores médios de duas variáveis aleatórias

Upload: trandung

Post on 09-Nov-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Slide 1

Ana M. Abreu - 2006/07

Capítulo 4Inferência Estatística

Resenha

Intervalo de Confiança para uma proporção

Intervalo de Confiança para o valor médio de uma variável aleatória

Intervalo de Confiança para a variância de uma variável aleatória

Intervalo de Confiança para a diferença de duas proporções

Intervalo de Confiança para a diferença dos valores médios de duas variáveis aleatórias

Slide 2

Ana M. Abreu - 2006/07

Resenha� As duas maiores áreas de aplicação da

inferência estatística envolvem o uso de amostras aleatórias para:

�(1) estimar o valor de um parâmetro da população ou de um intervalo de valores que esse mesmo parâmetro pode tomar;

�(2) testar alguma hipótese sobre a população ou, em particular, sobre um certo parâmetro da população.

� Este capítulo aborda a primeira situação e ocapítulo 5 a segunda.

Slide 3

Ana M. Abreu - 2006/07

� A proporção amostral p (“p-chapéu” ) é a melhor estimativa pontual da proporção populacional p. A média amostral “ x-barra” é a melhor estimativa pontual da média populacional µ.

Definições• Estimador� é uma fórmula ou um processo que usa os valores

da amostra para estimar um parâmetro populacional.

• Estimativa❖ é um valor específico, ou intervalo de valores,

usado para aproximar o valor do parâmetro de uma população.

• Estimativa pontual❖ é um valor único usado para aproximar o valor do

parâmetro de uma população.

ˆ

Slide 4

Ana M. Abreu - 2006/07

� O grau de confiança é habitualmente escrito como 1 - αααα, onde αααα é o complementar do grau de confiança, ou seja, é o nível de significância. Assim, dizer que temos um grau de confiança de 0.95 (ou 95%) é o mesmo do que dizer que temos um nível de significância αααα = 0.05. Do mesmo modo, se 1 - αααα =0.99 (99%) então αααα = 0.01.

Definição

Grau de confiança / Nível de significância

Slide 5

Ana M. Abreu - 2006/07

p = proporção populacional

p =ˆ xn proporção amostral

(pronuncia-se‘p-chapéu’)

de x sucessos numa amostra de dimensão n

Notação para proporções

q = 1 - p = proporção amostralde insucessos numa amostra de dimensão n

ˆ ˆ

Slide 6

Ana M. Abreu - 2006/07

DefiniçãoIntervalo de Confiança

� Um intervalo de confiança (ou intervalo de estimativas) éum intervalo de valores usado para estimar o verdadeir o valor de um parâmetro populacional.

� O nível de confiança é a probabilidade 1 —αααα(frequentemente representada através da expressão

em percentagem) de que o intervalo de confiança, de facto, contenha o verdadeiro valor do parâmetro.

� É usual trabalhar com valores na ordem de 90%, 95%, ou 99%.

� (αααα = 10%), (αααα = 5%), (αααα = 1%)

Slide 7

Ana M. Abreu - 2006/07

DefiniçãoValores críticos

�Um valor crítico é um valor de referência para “separar” os valores das estatísticas amostrais que são prováveis de ocorrer daqueles que não osão. O valor z1- αααα/2 é um valor crítico pois é um valor de z com a característica de separar a área igual a αααα/2 na cauda direita da distribuição Normal Standard (Ver Figura 4-1).

Slide 8

Ana M. Abreu - 2006/07

Como determinar z1−1−1−1− α/α/α/α/2 para um intervalo de confiança de 95%

zα/α/α/α/2z1−1−1−1− α/α/α/α/2

Valores Críticos

α/α/α/α/2 = 2.5% = .025

αααα =5%

Figura 4-1

Slide 9

Ana M. Abreu - 2006/07

Intervalo de Confiança para a proporção de uma população

p ± z 1−1−1−1− αααα / / / / 2222

p – z 1−1−1−1− αααα / / / / 2222 < p < p + z 1−1−1−1− αααα / / / / 2222

(p – z 1−1−1−1− αααα / / / / 2222 , p + z 1−1−1−1− αααα / / / / 2 2 2 2 )

ˆ ˆˆ p q n

ˆ p q n

ˆ ˆ p q n

ˆ p q n

ˆ p q n

ˆ ˆ

Slide 10

Ana M. Abreu - 2006/07

�1. Verifique que são verdadeiras as seguintes condições:�a amostra é uma amostra aleatória� são válidas as condições da distribuição binomial, a

qual pode ser aproximada pela distribuição Normal (recorde que para a aproximação ser válida tem que s e verificar np ≥≥≥≥ 5 e nq ≥≥≥≥ 5).

�2. Na tabela correspondente à distribuição Normal, encontre o valor crítico z 1−α1−α1−α1−α2 que corresponde ao nível de confiança pretendido.

�3. Calcule

Procedimento para construir um

intervalo de confiança para p

ˆ p q n

Slide 11

Ana M. Abreu - 2006/07

�4. Use os cálculos já efectuados para determinar o intervalo de confiança na forma, por exemplo,

p – z 1−1−1−1− αααα / / / / 2222 < p < p + z 1−1−1−1− αααα / / / / 2222 ˆ ˆ

�5. Apresente os resultados com 3 casasdecimais.

Procedimento para construir um

intervalo de confiança para p

ˆ p q n

ˆ p q n

Slide 12

Ana M. Abreu - 2006/07

Dimensão da amostra para estimar a proporção p

Quando se conhece uma estimativa de p, :

onde d é a diferença máxima entre p e .

n= ˆ p q z1-α 2

d

2

Quando não se conhece uma estimativa de p:

p

p

n 14

z1-α 2

d

2

Slide 13

Ana M. Abreu - 2006/07

Estimação da média populacional: σσσσ conhecido

1. O valor do desvio padrão populacional, σσσσ , é conhecido.

2. Uma ou ambas as condições seguintes são satisfeitas: A população tem distribuição Normalou n>30.

Pressupostos

Slide 14

Ana M. Abreu - 2006/07

Intervalo de Confiança para a média de uma população

x ± z 1−1−1−1− α/α/α/α/2 • σσσσ/ n

x – z 1−1−1−1− αααα / / / / 2222 • σσσσ/ n < µ < x + z 1−1−1−1− αααα / / / / 2222• σσσσ/ n

(x – z 1−1−1−1− αααα / / / / 2222 • σσσσ/ n , x + z 1−1−1−1− αααα / / / / 2 2 2 2 • σσσσ/ n)

Slide 15

Ana M. Abreu - 2006/07

Procedimento para construir umIntervalo de Confiança para µ

quando σσσσ é conhecido1. Verifique que os pressupostos são válidos.

2. Determine o valor crítico z1−1−1−1− α/α/α/α/2 que corresponde ao nível de significância pretendido.

3. Calcule σσσσ/ n e, em seguida, z 1−1−1−1− α/α/α/α/2 • σσσσ/ n .

5. Apresente os resultados com 3 casas decimais.

x – z 1−1−1−1− α/α/α/α/2 • σσσσ/ n < µ < x + z 1−1−1−1− α/α/α/α/2 • σσσσ/ n

4. Calcule x –z 1−1−1−1− α/α/α/α/2 • σσσσ/ n e x + z 1−1−1−1− α/α/α/α/2 • σσσσ/ n .

Apresente os valores na forma:

Slide 16

Ana M. Abreu - 2006/07

Dimensão da amostra para estimar a média µµµµ

(z1- α/2) •σ•σ•σ•σn =

d

2

onde d é a diferença máxima entre x e µµµµ. No caso de o valor não dar inteiro, aproxima-se para o inteiro imediatamente a seguir.

Slide 17

Ana M. Abreu - 2006/07

Estimação da média populacional: σσσσ desconhecido

1. O valor do desvio padrão populacional, σσσσ, é desconhecido.

2. Uma ou ambas as condições seguintes são satisfeitas: A população tem distribuição Normalou n>30.

Pressupostos

Slide 18

Ana M. Abreu - 2006/07

2. Se n 30, consulte a tabela da distribuição t de Student para encontrar o valor do quantil 1- α/α/α/α/2 da distribuição t de Student com n-1 graus de liberdade.

Procedimento para construir um intervalo de confiança para µ

quando σσσσ é desconhecido1. Verifique que os pressupostos são satisfeitos

4. Calcule x –t1−1−1−1− α/α/α/α/2 • s / n e x + t1−1−1−1− α/α/α/α/2 • s / n .

Apresente os valores na forma:

5. Apresente os resultados com 3 casas decimais.

3. Calcule s / n e, em seguida, t 1−1−1−1− α/α/α/α/2 • s / n .

x – t1−1−1−1− α/α/α/α/2 • s / n < µ < x + t1−1−1−1− α/α/α/α/2 • s / n

Slide 19

Ana M. Abreu - 2006/07

2. Se n>30, consulte a tabela da distribuição Norma l para encontrar o valor do quantil 1- α/α/α/α/2.

Procedimento para construir um intervalo de confiança para µ

quando σσσσ é desconhecido

1. Verifique que os pressupostos são satisfeitos

5. Apresente os resultados com 3 casas decimais.

3. Calcule s / n e, em seguida, z1−1−1−1− α/α/α/α/2 • s / n .

x – z1−1−1−1− α/α/α/α/2 • s / n < µ < x + z1−1−1−1− α/α/α/α/2 • s / n

4. Calcule x –z1−1−1−1− α/α/α/α/2 • s / n e x + z1−1−1−1− α/α/α/α/2 • s / n .

Apresente os valores na forma:

Slide 20

Ana M. Abreu - 2006/07

Estimação da variânciapopulacional:

Pressupostos

1. A amostra é uma amostra aleatória.2. A população deve ter distribuição Normal

(mesmo se a amostra for de dimensão grande).

Slide 21

Ana M. Abreu - 2006/07

Intervalo de Confiança para avariância de uma população

< σσσσ2 <(n-1)s2(n-1)s2

χχχχ2(α/2α/2α/2α/2; n-1) χχχχ2

(1-α/2α/2α/2α/2; n-1)

onde:n é a dimensão da amostras2 é a variância da amostra

χχχχ2(α/2α/2α/2α/2; n-1) é o quantil α/2α/2α/2α/2 da distribuição qui-

quadrado com n-1 graus de liberdade

Slide 22

Ana M. Abreu - 2006/07

Procedimento para construir umintervalo de confiança para σσσσ2 ou σσσσ1. Verifique que os pressupostos são válidos.

2. Consulte a tabela da distribuição χχχχ2 para encontrar os valores críticos χχχχ2

(α/2α/2α/2α/2; n-1) e χχχχ2(1-α/2α/2α/2α/2; n-1) .

3. Determine os extremos do intervalo de confiança pretendido usando as seguintes desigualdades:

< σσσσ2 <χχχχ2

(1-α/2α/2α/2α/2; n-1)χχχχ2(α/2α/2α/2α/2; n-1)

(n-1)s2 (n-1)s2

4. Se pretender obter um intervalo de confiança para σσσσ, calcule a raiz quadrada dos extremos do intervalo anterior e substitua σσσσ2 por σσσσ.

Slide 23

Ana M. Abreu - 2006/07

Com o mesmo significado temos p2, n

2, x

2, p

2e q

2,

mas provenientes da população 2.

Notação para Duas Proporções

Para a população 1, seja:p

1= proporção populacional

n1 = dimensão da amostrax1 = nº de sucessos na amostra

p1

= x1 (a proporção amostral)

q1

= 1 – p1

^

n1

^

^^

Slide 24

Ana M. Abreu - 2006/07

Intervalo de Confiança para

estimar p1 - p

2

( p1

– p2 ) ± z 1−1−1−1− α/α/α/α/2

^^ n1 n2

p1

q1

p2 q

2+^ ^^ ^

Este intervalo só se aplica se as amostras forem grandes, isto é, se n1>30 e n2>30.

Slide 25

Ana M. Abreu - 2006/07

Definições

Duas Amostras IndependentesOs valores de uma amostra aleatória de uma população não estão relacionados ou emparelhados com os valores da outra amostra aleatória proveniente da outra população.

Se os valores de uma amostra estiverem relacionados com os valores da outra amostra, as amostras são dependentes . Um exemplo de tais amostras são as designadas por amostras emparelhadas .

Slide 26

Ana M. Abreu - 2006/07

Pressupostos

1. As duas amostras são independentes.

2. Ambas as amostras são amostrasaleatórias.

3. Uma ou ambas as condições seguintes são satisfeitas: As amostras têm dimensão grande (com n1 > 30 e n2 > 30) ou ambas as amostras são provenientes de populações com distribuição Normal.

Slide 27

Ana M. Abreu - 2006/07

Intervalo de Confiança

+n1 n2

s1 s222

onde x1 é a média da amostra 1, s12 é a variância da

amostra 1 e n1 é a dimensão da amostra 1.

Analogamente no que diz respeito a x2, s22 e n2,

relativamente à amostra 2.

Quando σσσσ1 e σσσσ2 são desconhecidos:

(x1 – x2) ± z 1−1−1−1− α/α/α/α/2

Slide 28

Ana M. Abreu - 2006/07

Intervalo de Confiança

+n1 n2

σσσσ1 σσσσ222

onde x1 é a média da amostra 1, σσσσ12 é a variância

da população 1 e n1 é a dimensão da amostra 1.

Analogamente no que diz respeito a x2, σσσσ22 e n2,

relativamente à amostra e à população 2.

Quando σσσσ1 e σσσσ2 são conhecidos:

(x1 – x2) ± z 1−1−1−1− α/α/α/α/2

Slide 29

Ana M. Abreu - 2006/07

Pressupostos

1. As amostras são emparelhadas.

2. As amostras são amostras aleatórias.

3. Uma ou ambas as seguintes condições são satisfeitas: O nº de pares da amostra é grande ( n> 30) ou as diferenças entre os pares de valores são provenientes de uma população com distribuição aproximadamente Normal.

Slide 30

Ana M. Abreu - 2006/07

sd = desvio padrão das diferenças resultantes de cada par de observações.

n = nº de pares de observações.

µd = valor médio das diferenças resultantes de cada par de indivíduos da população.

d = valor médio das diferenças resultantes de cada par de observações

(x1-y1=d1, …, xn-yn=dn).

Notação para Amostras Emparelhadas

Slide 31

Ana M. Abreu - 2006/07

Intervalo de Confiança

onde t1−α1−α1−α1−α/2 tem n –1 graus de liberdade.

sdnd – t1−α1−α1−α1−α/2 < µd < d + t1−α1−α1−α1−α/2

sdn