mmo01 05 amostragem e estimativa

21
1 © Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá 1 Estatística Básica Unidade V : Amostragem e estimativa Professores Fabrina Bolzan Martins/Marcelo de Paula Corrêa IRN/UNIFEI Fabrina Bolzan Martins/Marcelo P. Côrrea © Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá Estimação de uma proporção populacional Uma agência de pesquisa fez entrevistas com 700 adultos para saber qual a opinião dos brasileiros sobre o casamento homossexual. Os resultados mostraram que 47% são favoráveis, 51% são contra e 2% não opinaram. Será que a estatística amostral de 47% a favor pode ser representativa como proporção amostral ? Como estimar a proporção populacional ? Hipóteses a considerar: A amostra é uma amostra aleatória simples (AAS) ? As condições para uma Distribuição Binomial são satisfeitas? (n° fixo de tentativas independentes, 2 categorias de resultados, probabilidade constante p/cada tentativa) np ≥ 5 e nq ≥ 5? Caso sim, a Distribuição Normal pode ser usada para aproximar a Distribuição Binomial. Como p e q são? É possível usar a amostra para estimá-los? Estimação 2 Fabrina Bolzan Martins/Marcelo P. Côrrea

Upload: lea-beray

Post on 20-Dec-2015

220 views

Category:

Documents


0 download

DESCRIPTION

MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa

TRANSCRIPT

Page 1: MMO01 05 Amostragem e Estimativa

1

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá 1

Estatística Básica

Unidade V: Amostragem e estimativa

ProfessoresFabrina Bolzan Martins/Marcelo de Paula Corrêa

IRN/UNIFEI

Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimação de uma proporção populacional

�Uma agência de pesquisa fez entrevistas com 700 adultos para saber qual aopinião dos brasileiros sobre o casamento homossexual. Os resultadosmostraram que 47% são favoráveis, 51% são contra e 2% não opinaram.

�Será que a estatística amostral de 47% a favor pode ser representativa comoproporção amostral ? Como estimar a proporção populacional ?

�Hipóteses a considerar:

� A amostra é uma amostra aleatória simples (AAS) ?

� As condições para uma Distribuição Binomial são satisfeitas? (n° fixo de tentativasindependentes, 2 categorias de resultados, probabilidade constante p/cada tentativa)

� np ≥ 5 e nq ≥ 5? Caso sim, a Distribuição Normal pode ser usada para aproximar aDistribuição Binomial. Como p e q são? É possível usar a amostra para estimá-los?

Estimação

2Fabrina Bolzan Martins/Marcelo P. Côrrea

Page 2: MMO01 05 Amostragem e Estimativa

2

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

● INTRODUÇÃO: Em pesquisas científicas, quando se deseja conhecer ascaracterísticas de uma população, é comum se observar apenas aamostra de seus elementos, e a partir dos resultados dessa amostra,obter valores aproximados (ou estimativas) para as característicaspopulacionais de interesse � levantamento por amostragem!

● Amostragem � representatividade e metodologia adequada.

● CONCEITO: A amostragem é definida de acordo com o processo deseleção, podendo ser:

�Probabilística: amostras selecionadas de forma aleatória. Cada elemento dapopulação tem uma probabilidade conhecida de participar da amostra.

�Não probabilística: há escolha deliberada dos elementos da amostra � podeprejudicar a representatividade da amostra.

3Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

● TIPOS DE AMOSTRAGEM:

● Amostragem aleatória simples (AAS): para a seleção é necessário ter oconjunto de todos os elementos da população e enumerá-los.

�Ocorre através de sorteio, sem restrição.

�Cada elemento da população tem a mesma probabilidade de pertencer aamostra .

● Amostragem sistemática (AS): quando é possível obter característicasparecidas com a AAS de maneira + fácil e rápida.

● Amostragem estratificada (AE): consiste em dividir a população em ksubgrupos denominados estratos � + homogêneos. Sobre os estratossão feitas as seleções das amostras.

4Fabrina Bolzan Martins/Marcelo P. Côrrea

Page 3: MMO01 05 Amostragem e Estimativa

3

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimação de uma proporção populacional (observações importantes)

�Uma AAS de n valores é possível se toda amostra de tamanho n tiver a mesmachance de ser escolhida (mesma probabilidade).� Portanto, a coleta de dados deve ser criteriosa! Quaisquer outros tipos de amostragem

podem invalidar o trabalho!

�Diferentes amostras geram diferentes resultados. Diferenças amostrais sãoflutuações do acaso e não significa o uso de um método de amostrageminfundado.� Obs: No caso do exemplo, o que não poderia ser feito era fazer o estudo na parada

gay, ou então, no clube dos ‘machões’! Os resultados seriam tendenciosos.

�Se desejamos estimar a proporção populacional a partir de um único valor, amelhor estimativa é a proporção amostral ⇒ estimativa pontual, já que:� ela não é viesada, já que a proporção amostral tende a se centralizar em torno da

proporção populacional (não subestima, ou superestima, p)

� é a mais consistente: o desvio padrão das proporções amostrais tende a ser menor doque qualquer outro estimador não-viesado.

Estimação

5Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimação de uma proporção populacional (notação)

p → proporção populacional

Ex: Na pesquisa com 200 estudantes verificou-se que 80 deles fumam �

proporção amostral é

xp̂

n

ˆ ˆq 1 p

=

= −

→ proporção amostral de x sucessos em uma amostra de tamanho n

→ proporção amostral de x fracassos em uma amostra de tamanho n

Estimação

6

Porém, não sabemos o quão boa é uma estimativa pontual. E, portanto, devemosdeterminar o intervalo de valores usado para estimar o verdadeiro valor de p.

Isto é, para qual intervalo de confiança o verdadeiro valor de p se encontra.

Fabrina Bolzan Martins/Marcelo P. Côrrea

0,40 80/200ˆ ==p 0,60ˆ =q

Page 4: MMO01 05 Amostragem e Estimativa

4

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

� Estimador: Um estimador é uma característica da amostra

Os principais estimadores são:

• (I) A média da amostra é um estimador da média da população µ;

• (ii) A variância amostral, s2 é um estimador da variância populacional σ2;

• (iii) A proporção amostral é um estimador amostral da proporçãopopulacional P ou π.

� Estimativa: Uma estimativa é um valor particular de um estimador

• Assim é uma estimativa. O estimador é a expressão (fórmula)

enquanto que a estimativa é o valor particular que ele assume (número).

Estimação

7Fabrina Bolzan Martins/Marcelo P. Côrrea

x

2=x

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Intervalo de confiança (ou estimativa intervalar)

�Não sabemos o quão boa é uma estimativa pontual. Assim, o Intervalo deConfiança serve para determinar o intervalo de valores usado para estimar overdadeiro valor de p (pontual).

�É uma faixa de valores usados para estimar o verdadeiro valor de umparâmetro populacional

�Esse intervalo está associado a um Nível de Confiança, que é a taxa desucesso do procedimento usado para se determinar o Intervalo de Confiança.

�O Nível de Confiança é a proporção de vezes que o Intervalo de Confiançarealmente contém o parâmetro populacional, supondo que o processo deestimação seja repetido um grande n° de vezes.

�O Nível de Confiança é dado como uma probabilidade ou área (1 – α). Osvalores comuns para Nível de Confiança são 90%, 95% e 99% (α = 0,10; 0,05e 0,01, respectivamente)

+ comum: bom equilíbrio entre precisão (largura do Intervalo de Confiança)

e confiabilidade (Nível de Confiança)

Estimação

8Fabrina Bolzan Martins/Marcelo P. Côrrea

Page 5: MMO01 05 Amostragem e Estimativa

5

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Mais detalhes sobre o Nível de Confiança

�O Nível de Confiança ser refere à taxa de sucesso do procedimento usado paraestimar a proporções populacionais (p). ∴ não se refere à própria p.

�é a probabilidade de que o intervalo estimado contenha o parâmetropopulacional

Assim, devemos dizer: “é x% confiável de que o Intervalo de Confiança, detanto a tanto, contém realmente o verdadeiro valor de p”.

NÃO devemos dizer: “há x% de chance de que o verdadeiro valor de p estáentre tanto e tanto”.

�p é uma constante fixa, embora desconhecida, e não é uma VA. Portanto, nãoexiste probabilidade associada a p.� Por exemplo, para um bebê que já nasceu, não existe probabilidade de que ele seja

homem ou mulher. Isto é, o bebê é ou não é mulher (ou homem, tanto faz).

�Por exemplo, um Nível de Confiança = 95% diz que o procedimento usadoresultará, a longo prazo, em limites de Intervalo de Confiança que contenham p95% das vezes!

Estimação

9Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

αααα/2 αααα/2

z–αααα/2zαααα/20

Valores Críticos (zαααα/2)

�Escore z (ou variável aleatória padronizada, VAP) que está na fronteira vertical que separa uma área αααα/2 na cauda direita da Distribuição Normal padrão.

Assim como o valor Crítico z–αααα/2 está associado a uma área αααα/2 na caudaesquerda da Distribuição Normal.

zαααα/2 corresponde a área de (1 – αααα/2)

Para que usamos isso ?

A distribuição amostral das proporções amostrais podem, em certos casos, ser aproximada por umaDistribuição Normal. Tais proporções têm uma chance pequena (isto é, αααα) de cair em uma das caudas (αααα/2).

Portanto, há uma probabilidade de (1 – αααα) de que a proporção amostral caia na área restante.

Assim, o Valor Crítico é o valor que separa estatísticas amostrais que têm chance de ocorrer daquelas que não têm.

Estimação

10Fabrina Bolzan Martins/Marcelo P. Côrrea

Área com chance

Área sem chance

Page 6: MMO01 05 Amostragem e Estimativa

6

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Valores Críticos (exemplo)

�Determinar o Valor Crítico correspondente ao Nível de Confiança de 95%.

αααα = 0,05 ⇒ αααα/2 = 0,025

Área = 1 – 0,0025 = 0,975 ⇒ Pela tabela: zαααα/2 = 1,96

CUIDADO!!! PROCURAR POR 0,975 NA TABELA! (E NÃO POR 0,950)

αααα/2 = 0,025 αααα/2 = 0,025

z–αααα/2 = –1,96 zαααα/2 = 1,960

Nível de Confiança = 95%

NC αααα zαααα/2

90% 0,10 1,645

95% 0,05 1,960

99% 0,01 2,575

Estimação

11Fabrina Bolzan Martins/Marcelo P. Côrrea

Ver tabela

97,5% chance de ocorrer está entre -1,96<Z <1,96

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Margem de Erro para proporções (E) e determinação do Intervalo deConfiança

�A margem de Erro é a diferença máxima provável (com probabilidade = 1 – αααα)entre a proporção amostral (p̂) e proporção populacional (p � “verdade”).

Portanto, o Intervalo de Confiança para proporção populacional (p) é dado por:

n

qpzE

ˆˆ2α=

ˆ ˆp E p p E

ou

p̂ E

− < < +

±

Estimação

12Fabrina Bolzan Martins/Marcelo P. Côrrea

Margem de erro para proporções

Intervalo de confiança para

proporção populacional (p)

são proporçõesamostrais de sucesso efracasso

q̂ p̂

Page 7: MMO01 05 Amostragem e Estimativa

7

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Margem de Erro para proporções (E) e determinação do Intervalo deConfiança

Exemplo: Determine o Intervalo de Confiança para aquele estudo sobre a opinião dos brasileiros sobre o casamento homossexual, considerando um Nível de Confiança de 95%.

2

ˆ ˆpq 0,47.0,53E z 1,96 0,036973

n 700

IC 0,47 0,036973 p 0,47 0,036973

IC 0,433 p 0,507

α= = =

⇒ − < < +

⇒ < <

Com base nos resultados, há 95% de confiança que os limites 43,3% e

50,7% contém a verdadeira porcentagem de pessoas que são

favoráveis ao casório homossexual.

Com esses valores não dá para afirmar que a população é a favor

ou contra o casamento homossexual.

Estimação

13Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Média e desvio padrão de proporções amostrais

�Quando np ≥ 5 e nq ≥ 5 a distribuição amostral das proporções éaproximadamente normal. Assim,

�Ambos são relativos à n tentativas e, portanto, podemos, também, determinar µµµµ e σσσσ por tentativa.

npq e np =σ=µ

np = p

n

npq pq

n n

µ = ⇒ µ

σ = ⇒ σ =

média das proporções amostrais

desvio padrão das proporções amostrais

Estimação

14Fabrina Bolzan Martins/Marcelo P. Côrrea

Page 8: MMO01 05 Amostragem e Estimativa

8

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Tamanho amostral (n)

�Quantos devemos entrevistar ? Qual o tamanho da amostra?

�Caso conheçamos uma estimativa de p̂:

�Caso não conheçamos uma estimativa de p̂:

� Quando não conhecemos p̂, substituímos o produto (p̂. q̂) por 0,25 �

� N é irrelevante: não depende do tamanho da população (exceto para populaçõespequenas, sem reposição)

� n deve ser sempre arredondado para o inteiro maior e mais próximo

No exemplo dado, quantas pessoas devemos entrevistar para que tenhamos 95% de confiança em que p̂ não tenha erro maior que 4% ?

2

2

2 2

ˆ ˆz pqˆ ˆpqE z n

n E

αα= ⇒ =

2 22

2 2

ˆ ˆz pq 1,96 .0,47.0,53n n 598,09 599 pessoas

E 0,04

α= ⇒ = = =

Estimação

15Fabrina Bolzan Martins/Marcelo P. Côrrea

5,0ˆ e 5,0ˆ == qp

[ ]2

22 25,0

E

zn

⋅= α

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

E se não conhecêssemos p̂ ?

Estimação

2 22

2 2

ˆ ˆz pq 1,96 .0,25n n 600,25 601 pessoas

E 0,04

α= ⇒ = = =

Se não conhecemos as proporções amostrais a partir de um estudo anterior, devemos entrevistar mais pessoas!

16Fabrina Bolzan Martins/Marcelo P. Côrrea

Page 9: MMO01 05 Amostragem e Estimativa

9

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Exemplo: Um estudo quer determinar a porcentagem de famílias que usam e-mail. Quantas famílias devem ser entrevistadas para que tenhamos 90% deconfiança em que a porcentagem amostral não terá erro maior do que quatropontos percentuais?

αααα = 0,10 ⇒ αααα/2 = 0,05

Área = 1 – 0,05 = 0,95 ⇒ Pela tabela: zαααα/2 = 1,645

Exemplo: Se assumisse que 16,9% das famílias usassem e-mail, qual seria onúmero de entrevistas a serem realizadas?

Estimação

Se não conhecemos as proporções amostrais a partir de um estudo anterior, devemos entrevistar mais pessoas!

17Fabrina Bolzan Martins/Marcelo P. Côrrea

[ ]2

22 25,0

E

zn

⋅= α

[ ]81,422

0016,0

6765,0

04,0

25,0645,12

2

=∴⋅

=n 423 entrevistas

[ ]2

22 ˆˆ

E

qpzn

⋅⋅= α [ ]

51,2370016,0

380031,0

04,0

831,0169,0645,12

2

=∴⋅⋅

=n

238 entrevistas

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Apenas para finalizar nosso estudo sobre as proporções, vamosdeterminar a estimativas da proporção amostral e do erro a partir de umIntervalo de Confiança

Exemplo (Triola pg 240): De um artigo sabe-se “dos 71 sujeitos, 70% estavam emabstinência de fumo havia 8 semanas . Use a afirmativa paracalcular E e

limite superior de confiança limite inferior de confiançap̂

2

limite superior de confiança limite inferior de confiançaE

2

+=

−=

Estimação

18Fabrina Bolzan Martins/Marcelo P. Côrrea

Muitas vezes tem apenas o valor de um IC � pode calcular a proporção amostral e o E amostral

81% à 58%IC95% =p̂

695,02

0,810,58p̂ ∴

+= 115,0

2

0,58-0,81p̂ ∴=

Page 10: MMO01 05 Amostragem e Estimativa

10

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimação da média populacional

Vamos abordar o assunto a partir de duas situações distintas:

a) σσσσ conhecido (geralmente irreal, conhecer σ sem saber µ)

�Como se observa em populações com Distribuição Normal: Não existem outliers e oshistogramas não se afastam muito de uma normal (distribuição das médiasamostrais)

�Às vezes n = 30 não é suficiente para determinar uma Distribuição Normal e otamanho amostral deve ser maior.

�Se p̂ é a melhor estimativa pontual de p, então a média amostral x̅ é a melhorestimativa pontual de µµµµ.

�x̅ é a estatística mais consistente para µµµµ (< desvio padrão), além de ser umestimador não-viesado (tende a se centralizar em torno de µµµµ)

�Intervalo de Confiança: x̅ é a melhor estimativa µµµµ. Mas, quão boa é? A diferençaentre x̅ e µµµµ pode ser definida como um ERRO (desvio).

Estimação

19Fabrina Bolzan Martins/Marcelo P. Côrrea

Estimativa pontual, IC, tamanho da amostra para µ

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimação da média populacional

Vamos abordar o assunto a partir de duas situações distintas

a) σσσσ conhecido (geralmente irreal, conhecer σ sem saber µ)

20

/2

Como é o desvio-padrão das médias amostrais (x).n

Então, E z n

α

σ

σ=

Sempre que a população tiver uma Distribuição Normal com média µµµµ e desvio padrão σσσσ,a distribuição amostral das x̅ é exatamente uma Distribuição Normal com média µµµµ edesvio padrão σσσσ/√n.

Se a população não tiver Distribuição Normal, amostras grandes terão distribuiçõesaproximadamente normais.

Fabrina Bolzan Martins/Marcelo P. Côrrea

nx

σσ =

Page 11: MMO01 05 Amostragem e Estimativa

11

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimação da média populacional

�Interpretação: Há uma probabilidade (1 – αααα) de que a média amostral sejadiferente de µµµµ (ou seja, esteja em erro) não superior a E

�Assim, o Intervalo de Confiança para uma pop de média µ e σ conhecido é:

x̅ – E < µµµµ < x̅ + E = 1-α ou x̅ ± E ou (x̅ – E : x̅ + E)

�Arrendondamento:

� Se o conjunto original de dados é conhecido: Arredondar os limites para uma casadecimal a mais.

� Se o conjunto original de dados é desconhecido: Arredondar os limites para mesmonúmero de casas de x̅.

�Interpretação do Intervalo de Confiança:

� Correta: Estamos x % confiantes que o intervalo x̅ – E, x̅ + E realmente contenha overdadeiro valor de x̅.

� Errada: Há x % de chance de que µ esteja entre x̅ – E; x̅ + E.

Estimação

21Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimação da média populacional

�Tamanho amostral para estimar µ

● Exemplo: Desejamos estimar o nível médio de coliformes fecais num lago. Quantasamostras devem ser coletadas aleatoriamente se desejamos estar 95% confiantes em que amédia amostral estará a menos de duas unidades da média de todo o lago? Suponha que odesvio padrão esperado para tais estudos seja de 20 unidades.

N n

N 1

−−

caso a pop seja finita, multiplicar n pelo fator de correção:

/ 2

2 2

/ 2

0,05 z 1,96

z 1,96.20n 384,16 385 amostras

E 2

α

α

α = ⇒ =

σ = = = =

2

2/

E

zn

σ= α arredondar para o inteiro maior mais próximo

Estimação

22Fabrina Bolzan Martins/Marcelo P. Côrrea

Page 12: MMO01 05 Amostragem e Estimativa

12

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimação da média populacional (exemplo)

�Um estudo de NPS possui um arquivo com 128 amostragens realizadas em umdia. A média dessa amostragem é de 79,0 dB. Suponha que a amostra seja umaAAS e que σ = 7,3 dB. Usando um Nível de Confiança = 95%, determine:

a) A margem de erro b) O Intervalo de Confiança para µ

σ = 7,3 dB (conhecido); n = 128 > 30; vamos supor que ⌠ outliers

α = 0,05 → zα/2= 1,96

/ 2

7,3a) E z =1,96 1,26466

n 128

b) x E x E

79,0 1,26466 79,0 1,26466

77,7 80,3

ou 79,0 1,3 ou (77,7:80,3)

α

σ= =

− < µ < +

− +< µ <

< µ <

±

Se selecionarmos muitas amostras de n=128 e construíssemos o Intervalo de

Confiança, 95% destas amostras conteriam o valor de µ.

Obs: Se um estudo indica que a média local seja, p.ex., 85 dB é muito provável que esse

valor não seja o valor correto de µ

Estimação

23Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimação da média populacional (exemplo)

�Para a amostra da temperatura corporal selecionou-se 106 indivíduos (n=106),com média de 98,20ºF. Suponha que a amostra seja aleatória simples e que σseja 0,62ºF. Usando um nível de confiança de 90%, encontre:

a) A margem de erro b) O Intervalo de Confiança para µ

σ = 0,62 ºF (conhecido); n = 106 > 30; vamos supor que ⌠ outliers

α = 0,10 → zα/2= 1,645

Se selecionarmos muitas amostras de n=106 e construíssemos o Intervalo de

Confiança, 90% destas amostras conteriam o valor de µ.

Estimação

24Fabrina Bolzan Martins/Marcelo P. Côrrea

09911,0106

62,0645,12 =⋅==

nzE

σα

30,9810,98

09911,020,9809911,020,98

<<

+<<−

+<<−

µµ

µ ExEx

a)

b)

Page 13: MMO01 05 Amostragem e Estimativa

13

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimação da média populacional

b) σσσσ desconhecido

� Novamente.... AAS, população normalmente distribuída ou n > 30

� Se a população é normal, a distribuição das x̅ é exatamente uma Distribuição Normalcom µµµµ e σσσσ.

� Se a população não é normalmente distribuída, grandes amostras resultam numadistribuição aproximadamente normal, com média µµµµ e desvio padrão σσσσ/√n.

� Ao invés da Distribuição Normal, usaremos, neste caso, a distribuição de Student

xt

(s / n )

−µ=

– Estimativa de σ a partir de s: maior incerteza

– Usa valores Críticos maiores que zα/2: tαααα/2

(isto é, Intervalo de Confiança “mais largo”)

Willian Gosset (1876-1937): Funcionário da Guiness que precisava de uma distribuição para amostras pequenas. Como a empresa não permitia publicações,

ele usou o pseudônimo Student.

Estimação

25Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimação da média populacional

b) σσσσ desconhecido xt

(s / n )

−µ=

/ 2 / 2

sE t , onde t tem n 1 graus de liberdade

n

E o IC é dado por: x E x E

α α = − − < µ < +

Além disso:

Estimação

26

Mas o que são graus de liberdade ?

É o número de valores amostrais que podem variar após restrições impostas aos dados amostrais.Geralmente é dado por n – 1.

Ex: 10 medidas têm média 50. Pode-se atribuir os 9 primeiros valores e, assim, o 10° está determinado. Se asoma das 10 medidas é, p.ex., 500 então x10 = 500 – (x1 + ... + x9). Como esses 9 valores podem serdeterminados livremente, dizemos que há 9 graus de liberdade.

Graus de liberdade = tamanho amostral -1 ���� liberdade que se perde ao trabalhar com amostra aoinvés da população!

Fabrina Bolzan Martins/Marcelo P. Côrrea

Page 14: MMO01 05 Amostragem e Estimativa

14

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

● Tabela de distribuição t (clique aqui)

● Exemplo do uso da tabela:

Se n = 20 (AAS, selecionada de uma população com Distribuição Normal).

Determine tα/2 p/ Nível de Confiança de 95%.

GL = n –1 = 19 ⇒ tabela ⇒ tα/2 = 2,093 (duas caudas)

Estimação

27Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimação da média populacional – σσσσ desconhecido (exemplo)

�Voltemos ao estudo de NPS que possui um arquivo com 128 amostragens(AAS) realizadas em um dia. A média dessa amostragem é de 79,0 dB e odesvio padrão s = 7,3 dB. Usando um Nível de Confiança = 95%, determine:

a) A margem de erro b) O Intervalo de Confiança para µ

s = 7,3 dB (σ desconhecido); n = 128 > 30; vamos supor que ⌠ outliers

α = 0,05 → tα/2 ⇒ devemos fazer n – 1 = 127 ⇒∴ tα/2 = 1,979 (statdisk)

/ 2

s 7,3a) E t =1,979 1,27692

n 128

b) x E x E

79,0 1,27692 79,0 1,27692

77,7 80,3

ou 79,0 1,3 ou (77,7:80,3)

α= =

− < µ < +

− +< µ <

< µ <

±

Estamos 95% confiantes de que os limites 77,7 e 80,3 dB contém µ.

A tabela apresenta tα/2 para n = 100 e n = 200. Veja que para n=100, tα/2 =

1,984 (pouca diferença)

Estimação

28Fabrina Bolzan Martins/Marcelo P. Côrrea

Abrir Statdisk

Page 15: MMO01 05 Amostragem e Estimativa

15

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

● Propriedades da distribuição t de Student�é diferente para tamanhos amostrais (n) diferentes

� tem forma de sino, semelhante a distribuição normal padrão, mas tem maior variabilidade(com distribuições maiores) quando as amostras são pequenas

� tem média em t = 0 (Distribuição Normal Padrão ⇒ z = 0)

� tem desvio padrão > 1 e variável com o tamanho amostral (Distribuição Normal ⇒ σ = 1)

�A medida que o tamanho amostral se torna maior (com n grande), a distribuição deStudent se aproxima da Distribuição Normal Padrão

● Podemos determinar a estimativas da média amostral (pontual) e do erro a partir de um Intervalo de Confiança

limite superior de confiança limite inferior de confiançax

2

limite superior de confiança limite inferior de confiançaE

2

+=

−=

estimativa pontual de µ

29

Estimação

Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Distribuição t de Student

30

Estimação

Fabrina Bolzan Martins/Marcelo P. Côrrea

K = n = 1K= n =10

Page 16: MMO01 05 Amostragem e Estimativa

16

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Como escolher a distribuição apropriada ?

σσσσ conhecido ?

Pop tem Distribuição Normal ?

Pop tem Distribuição Normal ?

n > 30 ?

Usar Distribuição Normal (z) Usar métodosnão-paramétricos

Usar Student (t)

Usar métodosnão-paramétricos

n > 30 ?

SIM NÃO

SIM

SIM

SIM

SIM

NÃONÃO

NÃO NÃO

31

Estimação

Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Estimando a variância e o desvio padrão da população

(Distribuição qui-quadrado): de uma população normalmente distribuída comvariância σ², selecionamos aleatoriamente amostras independentes de tamanho n ecalculamos a variância amostral s² para cada amostra. A estatística amostral temuma distribuição qui-quadrado.

�Hipóteses: AAS e População normalmente distribuída (muito importante!)

�Lembrando que se temos uma população de Distribuição Normal, com variância σ2 e selecionamos amostras independentes de tamanho n, a variância amostral de cada amostra é dada por:

�A relação χχχχ2 é dada por:

2 2

2n (x ) ( x)

sn(n 1)

−=

−∑ ∑

2

22 )1(

σχ

sn −=

32

Estimação

Fabrina Bolzan Martins/Marcelo P. Côrrea

n = tamanho amostrals² variância amostral

σ²=variância populacional

Page 17: MMO01 05 Amostragem e Estimativa

17

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Características da distribuição qui-quadrado

�Tem n – 1 graus de liberdade (porém, pode ter mais)

�Não é simétrica (diferentemente da Distribuição Normal Padrão e t)

�χ2 ≥ 0 (nunca negativos)

�Quanto > n° GL, mais a distribuição qui-quadrado se aproxima de umaDistribuição Normal

33

Estimação

Fabrina Bolzan Martins/Marcelo P. Côrrea

Não simétrica

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Variância e o desvio padrão da população (distribuição qui-quadrado)

Exemplo

�Valores Críticos de χ2 que determina regiões que contém uma área de 0,025em cada cauda para uma amostra de n = 10.

2

Eχ2

0,025

0,025

Tabela distribuição qui-quadrado

Tabela → área à direitaGL = 9; A = 0,025χD

2 = 19,023

GL = 9; A = 1 – 0,025 = 0,975χE

2 = 2,700

34

Estimação

Fabrina Bolzan Martins/Marcelo P. Côrrea

Page 18: MMO01 05 Amostragem e Estimativa

18

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Intervalo de Confiança para σσσσ2 na distribuição qui-quadrado2 2

2

2 2

D E

2 2

2 2

D E

2 2 2 2

D E 12 2

(n 1)s (n 1)s

(n 1)s (n 1)s

Obs : α α−

− −< σ <

χ χ

− −< σ <

χ χ

χ = χ χ = χ

s2 é a melhor estimativa de σ2 → estimador não-viesados é comumente usado como a melhor estimativa de σ (principalmente para n grande,viés pequeno)

Aproximação:Se usar o conjunto original de dados: Uma casa a mais do que o conjuntoSe usar s ou s2: Mesmo número de casas decimais

35

Estimação

Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Exemplo: Intervalo de Confiança para σσσσ2

�Construa uma estimativa de Intervalo de Confiança de 95% de confiança para o desviopadrão de um conjunto de dados de 105 temperaturas máximas diárias medidas emItajubá. Sabe-se que as temperaturas são normalmente distribuídas e essa amostra temmédia de 26,50°C e desvio padrão de 4,50°C. Obs: Nenhum outlier foi detectado e astemperaturas são medidas com precisão de uma casa decimal.

Temos 95% de confiança que os limites 3,96 e 5,21°C contém o verdadeiro valor de σ.

Estamos 95% confiantes que o desvio padrão das temperaturas máximas de Itajubá está entre

3,96 e 5,21°C.

Atenção! NÃO se expressa desvio padrão como s ± E. Somente 3,96 < σ < 5,21°C ou (3,96 :

5,21)°C

36

Estimação

Fabrina Bolzan Martins/Marcelo P. Côrrea

Page 19: MMO01 05 Amostragem e Estimativa

19

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá

Exemplo: Intervalo de Confiança para σσσσ2

�Foram levantados dados de 106 temperaturas corporais. Use as características abaixopara determinar o intervalo de confiança a 95% para o σ.

�A) A população parece ter uma distribuição normal; B) média amostral é 98,20ºF; c) s =0,62ºF; d) n=106; e) não há outliers.

Opsm. Ia quase me esquecendo!

Lista de exercícios #12

37

Estimação

Fabrina Bolzan Martins/Marcelo P. Côrrea

2

Eχ2

0,025

0,025

74,22

129,561

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá 38

Estimação

Fabrina Bolzan Martins/Marcelo P. Côrrea

Page 20: MMO01 05 Amostragem e Estimativa

20

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá 39Fabrina Bolzan Martins/Marcelo P. Côrrea

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá 40Fabrina Bolzan Martins/Marcelo P. Côrrea

Page 21: MMO01 05 Amostragem e Estimativa

21

© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá 41Fabrina Bolzan Martins/Marcelo P. Côrrea