mmo01 05 amostragem e estimativa
DESCRIPTION
MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e Estimativa MMO01 05 Amostragem e EstimativaTRANSCRIPT
1
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá 1
Estatística Básica
Unidade V: Amostragem e estimativa
ProfessoresFabrina Bolzan Martins/Marcelo de Paula Corrêa
IRN/UNIFEI
Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimação de uma proporção populacional
�Uma agência de pesquisa fez entrevistas com 700 adultos para saber qual aopinião dos brasileiros sobre o casamento homossexual. Os resultadosmostraram que 47% são favoráveis, 51% são contra e 2% não opinaram.
�Será que a estatística amostral de 47% a favor pode ser representativa comoproporção amostral ? Como estimar a proporção populacional ?
�Hipóteses a considerar:
� A amostra é uma amostra aleatória simples (AAS) ?
� As condições para uma Distribuição Binomial são satisfeitas? (n° fixo de tentativasindependentes, 2 categorias de resultados, probabilidade constante p/cada tentativa)
� np ≥ 5 e nq ≥ 5? Caso sim, a Distribuição Normal pode ser usada para aproximar aDistribuição Binomial. Como p e q são? É possível usar a amostra para estimá-los?
Estimação
2Fabrina Bolzan Martins/Marcelo P. Côrrea
2
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
● INTRODUÇÃO: Em pesquisas científicas, quando se deseja conhecer ascaracterísticas de uma população, é comum se observar apenas aamostra de seus elementos, e a partir dos resultados dessa amostra,obter valores aproximados (ou estimativas) para as característicaspopulacionais de interesse � levantamento por amostragem!
● Amostragem � representatividade e metodologia adequada.
● CONCEITO: A amostragem é definida de acordo com o processo deseleção, podendo ser:
�Probabilística: amostras selecionadas de forma aleatória. Cada elemento dapopulação tem uma probabilidade conhecida de participar da amostra.
�Não probabilística: há escolha deliberada dos elementos da amostra � podeprejudicar a representatividade da amostra.
3Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
● TIPOS DE AMOSTRAGEM:
● Amostragem aleatória simples (AAS): para a seleção é necessário ter oconjunto de todos os elementos da população e enumerá-los.
�Ocorre através de sorteio, sem restrição.
�Cada elemento da população tem a mesma probabilidade de pertencer aamostra .
● Amostragem sistemática (AS): quando é possível obter característicasparecidas com a AAS de maneira + fácil e rápida.
● Amostragem estratificada (AE): consiste em dividir a população em ksubgrupos denominados estratos � + homogêneos. Sobre os estratossão feitas as seleções das amostras.
4Fabrina Bolzan Martins/Marcelo P. Côrrea
3
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimação de uma proporção populacional (observações importantes)
�Uma AAS de n valores é possível se toda amostra de tamanho n tiver a mesmachance de ser escolhida (mesma probabilidade).� Portanto, a coleta de dados deve ser criteriosa! Quaisquer outros tipos de amostragem
podem invalidar o trabalho!
�Diferentes amostras geram diferentes resultados. Diferenças amostrais sãoflutuações do acaso e não significa o uso de um método de amostrageminfundado.� Obs: No caso do exemplo, o que não poderia ser feito era fazer o estudo na parada
gay, ou então, no clube dos ‘machões’! Os resultados seriam tendenciosos.
�Se desejamos estimar a proporção populacional a partir de um único valor, amelhor estimativa é a proporção amostral ⇒ estimativa pontual, já que:� ela não é viesada, já que a proporção amostral tende a se centralizar em torno da
proporção populacional (não subestima, ou superestima, p)
� é a mais consistente: o desvio padrão das proporções amostrais tende a ser menor doque qualquer outro estimador não-viesado.
Estimação
5Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimação de uma proporção populacional (notação)
p → proporção populacional
Ex: Na pesquisa com 200 estudantes verificou-se que 80 deles fumam �
proporção amostral é
xp̂
n
ˆ ˆq 1 p
=
= −
→ proporção amostral de x sucessos em uma amostra de tamanho n
→ proporção amostral de x fracassos em uma amostra de tamanho n
Estimação
6
Porém, não sabemos o quão boa é uma estimativa pontual. E, portanto, devemosdeterminar o intervalo de valores usado para estimar o verdadeiro valor de p.
Isto é, para qual intervalo de confiança o verdadeiro valor de p se encontra.
Fabrina Bolzan Martins/Marcelo P. Côrrea
0,40 80/200ˆ ==p 0,60ˆ =q
4
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
� Estimador: Um estimador é uma característica da amostra
Os principais estimadores são:
• (I) A média da amostra é um estimador da média da população µ;
• (ii) A variância amostral, s2 é um estimador da variância populacional σ2;
• (iii) A proporção amostral é um estimador amostral da proporçãopopulacional P ou π.
� Estimativa: Uma estimativa é um valor particular de um estimador
• Assim é uma estimativa. O estimador é a expressão (fórmula)
enquanto que a estimativa é o valor particular que ele assume (número).
Estimação
7Fabrina Bolzan Martins/Marcelo P. Côrrea
x
2=x
p̂
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Intervalo de confiança (ou estimativa intervalar)
�Não sabemos o quão boa é uma estimativa pontual. Assim, o Intervalo deConfiança serve para determinar o intervalo de valores usado para estimar overdadeiro valor de p (pontual).
�É uma faixa de valores usados para estimar o verdadeiro valor de umparâmetro populacional
�Esse intervalo está associado a um Nível de Confiança, que é a taxa desucesso do procedimento usado para se determinar o Intervalo de Confiança.
�O Nível de Confiança é a proporção de vezes que o Intervalo de Confiançarealmente contém o parâmetro populacional, supondo que o processo deestimação seja repetido um grande n° de vezes.
�O Nível de Confiança é dado como uma probabilidade ou área (1 – α). Osvalores comuns para Nível de Confiança são 90%, 95% e 99% (α = 0,10; 0,05e 0,01, respectivamente)
+ comum: bom equilíbrio entre precisão (largura do Intervalo de Confiança)
e confiabilidade (Nível de Confiança)
Estimação
8Fabrina Bolzan Martins/Marcelo P. Côrrea
5
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Mais detalhes sobre o Nível de Confiança
�O Nível de Confiança ser refere à taxa de sucesso do procedimento usado paraestimar a proporções populacionais (p). ∴ não se refere à própria p.
�é a probabilidade de que o intervalo estimado contenha o parâmetropopulacional
Assim, devemos dizer: “é x% confiável de que o Intervalo de Confiança, detanto a tanto, contém realmente o verdadeiro valor de p”.
NÃO devemos dizer: “há x% de chance de que o verdadeiro valor de p estáentre tanto e tanto”.
�p é uma constante fixa, embora desconhecida, e não é uma VA. Portanto, nãoexiste probabilidade associada a p.� Por exemplo, para um bebê que já nasceu, não existe probabilidade de que ele seja
homem ou mulher. Isto é, o bebê é ou não é mulher (ou homem, tanto faz).
�Por exemplo, um Nível de Confiança = 95% diz que o procedimento usadoresultará, a longo prazo, em limites de Intervalo de Confiança que contenham p95% das vezes!
Estimação
9Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
αααα/2 αααα/2
z–αααα/2zαααα/20
Valores Críticos (zαααα/2)
�Escore z (ou variável aleatória padronizada, VAP) que está na fronteira vertical que separa uma área αααα/2 na cauda direita da Distribuição Normal padrão.
Assim como o valor Crítico z–αααα/2 está associado a uma área αααα/2 na caudaesquerda da Distribuição Normal.
zαααα/2 corresponde a área de (1 – αααα/2)
Para que usamos isso ?
A distribuição amostral das proporções amostrais podem, em certos casos, ser aproximada por umaDistribuição Normal. Tais proporções têm uma chance pequena (isto é, αααα) de cair em uma das caudas (αααα/2).
Portanto, há uma probabilidade de (1 – αααα) de que a proporção amostral caia na área restante.
Assim, o Valor Crítico é o valor que separa estatísticas amostrais que têm chance de ocorrer daquelas que não têm.
Estimação
10Fabrina Bolzan Martins/Marcelo P. Côrrea
Área com chance
Área sem chance
6
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Valores Críticos (exemplo)
�Determinar o Valor Crítico correspondente ao Nível de Confiança de 95%.
αααα = 0,05 ⇒ αααα/2 = 0,025
Área = 1 – 0,0025 = 0,975 ⇒ Pela tabela: zαααα/2 = 1,96
CUIDADO!!! PROCURAR POR 0,975 NA TABELA! (E NÃO POR 0,950)
αααα/2 = 0,025 αααα/2 = 0,025
z–αααα/2 = –1,96 zαααα/2 = 1,960
Nível de Confiança = 95%
NC αααα zαααα/2
90% 0,10 1,645
95% 0,05 1,960
99% 0,01 2,575
Estimação
11Fabrina Bolzan Martins/Marcelo P. Côrrea
Ver tabela
97,5% chance de ocorrer está entre -1,96<Z <1,96
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Margem de Erro para proporções (E) e determinação do Intervalo deConfiança
�A margem de Erro é a diferença máxima provável (com probabilidade = 1 – αααα)entre a proporção amostral (p̂) e proporção populacional (p � “verdade”).
Portanto, o Intervalo de Confiança para proporção populacional (p) é dado por:
n
qpzE
ˆˆ2α=
ˆ ˆp E p p E
ou
p̂ E
− < < +
±
Estimação
12Fabrina Bolzan Martins/Marcelo P. Côrrea
Margem de erro para proporções
Intervalo de confiança para
proporção populacional (p)
são proporçõesamostrais de sucesso efracasso
q̂ p̂
7
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Margem de Erro para proporções (E) e determinação do Intervalo deConfiança
Exemplo: Determine o Intervalo de Confiança para aquele estudo sobre a opinião dos brasileiros sobre o casamento homossexual, considerando um Nível de Confiança de 95%.
2
ˆ ˆpq 0,47.0,53E z 1,96 0,036973
n 700
IC 0,47 0,036973 p 0,47 0,036973
IC 0,433 p 0,507
α= = =
⇒ − < < +
⇒ < <
Com base nos resultados, há 95% de confiança que os limites 43,3% e
50,7% contém a verdadeira porcentagem de pessoas que são
favoráveis ao casório homossexual.
Com esses valores não dá para afirmar que a população é a favor
ou contra o casamento homossexual.
Estimação
13Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Média e desvio padrão de proporções amostrais
�Quando np ≥ 5 e nq ≥ 5 a distribuição amostral das proporções éaproximadamente normal. Assim,
�Ambos são relativos à n tentativas e, portanto, podemos, também, determinar µµµµ e σσσσ por tentativa.
npq e np =σ=µ
np = p
n
npq pq
n n
µ = ⇒ µ
σ = ⇒ σ =
média das proporções amostrais
desvio padrão das proporções amostrais
Estimação
14Fabrina Bolzan Martins/Marcelo P. Côrrea
8
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Tamanho amostral (n)
�Quantos devemos entrevistar ? Qual o tamanho da amostra?
�Caso conheçamos uma estimativa de p̂:
�Caso não conheçamos uma estimativa de p̂:
� Quando não conhecemos p̂, substituímos o produto (p̂. q̂) por 0,25 �
� N é irrelevante: não depende do tamanho da população (exceto para populaçõespequenas, sem reposição)
� n deve ser sempre arredondado para o inteiro maior e mais próximo
No exemplo dado, quantas pessoas devemos entrevistar para que tenhamos 95% de confiança em que p̂ não tenha erro maior que 4% ?
2
2
2 2
ˆ ˆz pqˆ ˆpqE z n
n E
αα= ⇒ =
2 22
2 2
ˆ ˆz pq 1,96 .0,47.0,53n n 598,09 599 pessoas
E 0,04
α= ⇒ = = =
Estimação
15Fabrina Bolzan Martins/Marcelo P. Côrrea
5,0ˆ e 5,0ˆ == qp
[ ]2
22 25,0
E
zn
⋅= α
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
E se não conhecêssemos p̂ ?
Estimação
2 22
2 2
ˆ ˆz pq 1,96 .0,25n n 600,25 601 pessoas
E 0,04
α= ⇒ = = =
Se não conhecemos as proporções amostrais a partir de um estudo anterior, devemos entrevistar mais pessoas!
16Fabrina Bolzan Martins/Marcelo P. Côrrea
9
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Exemplo: Um estudo quer determinar a porcentagem de famílias que usam e-mail. Quantas famílias devem ser entrevistadas para que tenhamos 90% deconfiança em que a porcentagem amostral não terá erro maior do que quatropontos percentuais?
αααα = 0,10 ⇒ αααα/2 = 0,05
Área = 1 – 0,05 = 0,95 ⇒ Pela tabela: zαααα/2 = 1,645
Exemplo: Se assumisse que 16,9% das famílias usassem e-mail, qual seria onúmero de entrevistas a serem realizadas?
Estimação
Se não conhecemos as proporções amostrais a partir de um estudo anterior, devemos entrevistar mais pessoas!
17Fabrina Bolzan Martins/Marcelo P. Côrrea
[ ]2
22 25,0
E
zn
⋅= α
[ ]81,422
0016,0
6765,0
04,0
25,0645,12
2
=∴⋅
=n 423 entrevistas
[ ]2
22 ˆˆ
E
qpzn
⋅⋅= α [ ]
51,2370016,0
380031,0
04,0
831,0169,0645,12
2
=∴⋅⋅
=n
238 entrevistas
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Apenas para finalizar nosso estudo sobre as proporções, vamosdeterminar a estimativas da proporção amostral e do erro a partir de umIntervalo de Confiança
Exemplo (Triola pg 240): De um artigo sabe-se “dos 71 sujeitos, 70% estavam emabstinência de fumo havia 8 semanas . Use a afirmativa paracalcular E e
limite superior de confiança limite inferior de confiançap̂
2
limite superior de confiança limite inferior de confiançaE
2
+=
−=
Estimação
18Fabrina Bolzan Martins/Marcelo P. Côrrea
Muitas vezes tem apenas o valor de um IC � pode calcular a proporção amostral e o E amostral
81% à 58%IC95% =p̂
695,02
0,810,58p̂ ∴
+= 115,0
2
0,58-0,81p̂ ∴=
10
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimação da média populacional
Vamos abordar o assunto a partir de duas situações distintas:
a) σσσσ conhecido (geralmente irreal, conhecer σ sem saber µ)
�Como se observa em populações com Distribuição Normal: Não existem outliers e oshistogramas não se afastam muito de uma normal (distribuição das médiasamostrais)
�Às vezes n = 30 não é suficiente para determinar uma Distribuição Normal e otamanho amostral deve ser maior.
�Se p̂ é a melhor estimativa pontual de p, então a média amostral x̅ é a melhorestimativa pontual de µµµµ.
�x̅ é a estatística mais consistente para µµµµ (< desvio padrão), além de ser umestimador não-viesado (tende a se centralizar em torno de µµµµ)
�Intervalo de Confiança: x̅ é a melhor estimativa µµµµ. Mas, quão boa é? A diferençaentre x̅ e µµµµ pode ser definida como um ERRO (desvio).
Estimação
19Fabrina Bolzan Martins/Marcelo P. Côrrea
Estimativa pontual, IC, tamanho da amostra para µ
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimação da média populacional
Vamos abordar o assunto a partir de duas situações distintas
a) σσσσ conhecido (geralmente irreal, conhecer σ sem saber µ)
20
/2
Como é o desvio-padrão das médias amostrais (x).n
Então, E z n
α
σ
σ=
Sempre que a população tiver uma Distribuição Normal com média µµµµ e desvio padrão σσσσ,a distribuição amostral das x̅ é exatamente uma Distribuição Normal com média µµµµ edesvio padrão σσσσ/√n.
Se a população não tiver Distribuição Normal, amostras grandes terão distribuiçõesaproximadamente normais.
Fabrina Bolzan Martins/Marcelo P. Côrrea
nx
σσ =
11
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimação da média populacional
�Interpretação: Há uma probabilidade (1 – αααα) de que a média amostral sejadiferente de µµµµ (ou seja, esteja em erro) não superior a E
�Assim, o Intervalo de Confiança para uma pop de média µ e σ conhecido é:
x̅ – E < µµµµ < x̅ + E = 1-α ou x̅ ± E ou (x̅ – E : x̅ + E)
�Arrendondamento:
� Se o conjunto original de dados é conhecido: Arredondar os limites para uma casadecimal a mais.
� Se o conjunto original de dados é desconhecido: Arredondar os limites para mesmonúmero de casas de x̅.
�Interpretação do Intervalo de Confiança:
� Correta: Estamos x % confiantes que o intervalo x̅ – E, x̅ + E realmente contenha overdadeiro valor de x̅.
� Errada: Há x % de chance de que µ esteja entre x̅ – E; x̅ + E.
Estimação
21Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimação da média populacional
�Tamanho amostral para estimar µ
● Exemplo: Desejamos estimar o nível médio de coliformes fecais num lago. Quantasamostras devem ser coletadas aleatoriamente se desejamos estar 95% confiantes em que amédia amostral estará a menos de duas unidades da média de todo o lago? Suponha que odesvio padrão esperado para tais estudos seja de 20 unidades.
N n
N 1
−−
caso a pop seja finita, multiplicar n pelo fator de correção:
/ 2
2 2
/ 2
0,05 z 1,96
z 1,96.20n 384,16 385 amostras
E 2
α
α
α = ⇒ =
σ = = = =
2
2/
E
zn
σ= α arredondar para o inteiro maior mais próximo
Estimação
22Fabrina Bolzan Martins/Marcelo P. Côrrea
12
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimação da média populacional (exemplo)
�Um estudo de NPS possui um arquivo com 128 amostragens realizadas em umdia. A média dessa amostragem é de 79,0 dB. Suponha que a amostra seja umaAAS e que σ = 7,3 dB. Usando um Nível de Confiança = 95%, determine:
a) A margem de erro b) O Intervalo de Confiança para µ
σ = 7,3 dB (conhecido); n = 128 > 30; vamos supor que ⌠ outliers
α = 0,05 → zα/2= 1,96
/ 2
7,3a) E z =1,96 1,26466
n 128
b) x E x E
79,0 1,26466 79,0 1,26466
77,7 80,3
ou 79,0 1,3 ou (77,7:80,3)
α
σ= =
− < µ < +
− +< µ <
< µ <
±
Se selecionarmos muitas amostras de n=128 e construíssemos o Intervalo de
Confiança, 95% destas amostras conteriam o valor de µ.
Obs: Se um estudo indica que a média local seja, p.ex., 85 dB é muito provável que esse
valor não seja o valor correto de µ
Estimação
23Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimação da média populacional (exemplo)
�Para a amostra da temperatura corporal selecionou-se 106 indivíduos (n=106),com média de 98,20ºF. Suponha que a amostra seja aleatória simples e que σseja 0,62ºF. Usando um nível de confiança de 90%, encontre:
a) A margem de erro b) O Intervalo de Confiança para µ
σ = 0,62 ºF (conhecido); n = 106 > 30; vamos supor que ⌠ outliers
α = 0,10 → zα/2= 1,645
Se selecionarmos muitas amostras de n=106 e construíssemos o Intervalo de
Confiança, 90% destas amostras conteriam o valor de µ.
Estimação
24Fabrina Bolzan Martins/Marcelo P. Côrrea
09911,0106
62,0645,12 =⋅==
nzE
σα
30,9810,98
09911,020,9809911,020,98
<<
+<<−
+<<−
µµ
µ ExEx
a)
b)
13
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimação da média populacional
b) σσσσ desconhecido
� Novamente.... AAS, população normalmente distribuída ou n > 30
� Se a população é normal, a distribuição das x̅ é exatamente uma Distribuição Normalcom µµµµ e σσσσ.
� Se a população não é normalmente distribuída, grandes amostras resultam numadistribuição aproximadamente normal, com média µµµµ e desvio padrão σσσσ/√n.
� Ao invés da Distribuição Normal, usaremos, neste caso, a distribuição de Student
xt
(s / n )
−µ=
– Estimativa de σ a partir de s: maior incerteza
– Usa valores Críticos maiores que zα/2: tαααα/2
(isto é, Intervalo de Confiança “mais largo”)
Willian Gosset (1876-1937): Funcionário da Guiness que precisava de uma distribuição para amostras pequenas. Como a empresa não permitia publicações,
ele usou o pseudônimo Student.
Estimação
25Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimação da média populacional
b) σσσσ desconhecido xt
(s / n )
−µ=
/ 2 / 2
sE t , onde t tem n 1 graus de liberdade
n
E o IC é dado por: x E x E
α α = − − < µ < +
Além disso:
Estimação
26
Mas o que são graus de liberdade ?
É o número de valores amostrais que podem variar após restrições impostas aos dados amostrais.Geralmente é dado por n – 1.
Ex: 10 medidas têm média 50. Pode-se atribuir os 9 primeiros valores e, assim, o 10° está determinado. Se asoma das 10 medidas é, p.ex., 500 então x10 = 500 – (x1 + ... + x9). Como esses 9 valores podem serdeterminados livremente, dizemos que há 9 graus de liberdade.
Graus de liberdade = tamanho amostral -1 ���� liberdade que se perde ao trabalhar com amostra aoinvés da população!
Fabrina Bolzan Martins/Marcelo P. Côrrea
14
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
● Tabela de distribuição t (clique aqui)
● Exemplo do uso da tabela:
Se n = 20 (AAS, selecionada de uma população com Distribuição Normal).
Determine tα/2 p/ Nível de Confiança de 95%.
GL = n –1 = 19 ⇒ tabela ⇒ tα/2 = 2,093 (duas caudas)
Estimação
27Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimação da média populacional – σσσσ desconhecido (exemplo)
�Voltemos ao estudo de NPS que possui um arquivo com 128 amostragens(AAS) realizadas em um dia. A média dessa amostragem é de 79,0 dB e odesvio padrão s = 7,3 dB. Usando um Nível de Confiança = 95%, determine:
a) A margem de erro b) O Intervalo de Confiança para µ
s = 7,3 dB (σ desconhecido); n = 128 > 30; vamos supor que ⌠ outliers
α = 0,05 → tα/2 ⇒ devemos fazer n – 1 = 127 ⇒∴ tα/2 = 1,979 (statdisk)
/ 2
s 7,3a) E t =1,979 1,27692
n 128
b) x E x E
79,0 1,27692 79,0 1,27692
77,7 80,3
ou 79,0 1,3 ou (77,7:80,3)
α= =
− < µ < +
− +< µ <
< µ <
±
Estamos 95% confiantes de que os limites 77,7 e 80,3 dB contém µ.
A tabela apresenta tα/2 para n = 100 e n = 200. Veja que para n=100, tα/2 =
1,984 (pouca diferença)
Estimação
28Fabrina Bolzan Martins/Marcelo P. Côrrea
Abrir Statdisk
15
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
● Propriedades da distribuição t de Student�é diferente para tamanhos amostrais (n) diferentes
� tem forma de sino, semelhante a distribuição normal padrão, mas tem maior variabilidade(com distribuições maiores) quando as amostras são pequenas
� tem média em t = 0 (Distribuição Normal Padrão ⇒ z = 0)
� tem desvio padrão > 1 e variável com o tamanho amostral (Distribuição Normal ⇒ σ = 1)
�A medida que o tamanho amostral se torna maior (com n grande), a distribuição deStudent se aproxima da Distribuição Normal Padrão
● Podemos determinar a estimativas da média amostral (pontual) e do erro a partir de um Intervalo de Confiança
limite superior de confiança limite inferior de confiançax
2
limite superior de confiança limite inferior de confiançaE
2
+=
−=
estimativa pontual de µ
29
Estimação
Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Distribuição t de Student
30
Estimação
Fabrina Bolzan Martins/Marcelo P. Côrrea
K = n = 1K= n =10
16
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Como escolher a distribuição apropriada ?
σσσσ conhecido ?
Pop tem Distribuição Normal ?
Pop tem Distribuição Normal ?
n > 30 ?
Usar Distribuição Normal (z) Usar métodosnão-paramétricos
Usar Student (t)
Usar métodosnão-paramétricos
n > 30 ?
SIM NÃO
SIM
SIM
SIM
SIM
NÃONÃO
NÃO NÃO
31
Estimação
Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Estimando a variância e o desvio padrão da população
(Distribuição qui-quadrado): de uma população normalmente distribuída comvariância σ², selecionamos aleatoriamente amostras independentes de tamanho n ecalculamos a variância amostral s² para cada amostra. A estatística amostral temuma distribuição qui-quadrado.
�Hipóteses: AAS e População normalmente distribuída (muito importante!)
�Lembrando que se temos uma população de Distribuição Normal, com variância σ2 e selecionamos amostras independentes de tamanho n, a variância amostral de cada amostra é dada por:
�A relação χχχχ2 é dada por:
2 2
2n (x ) ( x)
sn(n 1)
−=
−∑ ∑
2
22 )1(
σχ
sn −=
32
Estimação
Fabrina Bolzan Martins/Marcelo P. Côrrea
n = tamanho amostrals² variância amostral
σ²=variância populacional
17
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Características da distribuição qui-quadrado
�Tem n – 1 graus de liberdade (porém, pode ter mais)
�Não é simétrica (diferentemente da Distribuição Normal Padrão e t)
�χ2 ≥ 0 (nunca negativos)
�Quanto > n° GL, mais a distribuição qui-quadrado se aproxima de umaDistribuição Normal
33
Estimação
Fabrina Bolzan Martins/Marcelo P. Côrrea
Não simétrica
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Variância e o desvio padrão da população (distribuição qui-quadrado)
Exemplo
�Valores Críticos de χ2 que determina regiões que contém uma área de 0,025em cada cauda para uma amostra de n = 10.
2
Eχ2
Dχ
0,025
0,025
Tabela distribuição qui-quadrado
Tabela → área à direitaGL = 9; A = 0,025χD
2 = 19,023
GL = 9; A = 1 – 0,025 = 0,975χE
2 = 2,700
34
Estimação
Fabrina Bolzan Martins/Marcelo P. Côrrea
18
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Intervalo de Confiança para σσσσ2 na distribuição qui-quadrado2 2
2
2 2
D E
2 2
2 2
D E
2 2 2 2
D E 12 2
(n 1)s (n 1)s
(n 1)s (n 1)s
Obs : α α−
− −< σ <
χ χ
− −< σ <
χ χ
χ = χ χ = χ
s2 é a melhor estimativa de σ2 → estimador não-viesados é comumente usado como a melhor estimativa de σ (principalmente para n grande,viés pequeno)
Aproximação:Se usar o conjunto original de dados: Uma casa a mais do que o conjuntoSe usar s ou s2: Mesmo número de casas decimais
35
Estimação
Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Exemplo: Intervalo de Confiança para σσσσ2
�Construa uma estimativa de Intervalo de Confiança de 95% de confiança para o desviopadrão de um conjunto de dados de 105 temperaturas máximas diárias medidas emItajubá. Sabe-se que as temperaturas são normalmente distribuídas e essa amostra temmédia de 26,50°C e desvio padrão de 4,50°C. Obs: Nenhum outlier foi detectado e astemperaturas são medidas com precisão de uma casa decimal.
Temos 95% de confiança que os limites 3,96 e 5,21°C contém o verdadeiro valor de σ.
Estamos 95% confiantes que o desvio padrão das temperaturas máximas de Itajubá está entre
3,96 e 5,21°C.
Atenção! NÃO se expressa desvio padrão como s ± E. Somente 3,96 < σ < 5,21°C ou (3,96 :
5,21)°C
36
Estimação
Fabrina Bolzan Martins/Marcelo P. Côrrea
19
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá
Exemplo: Intervalo de Confiança para σσσσ2
�Foram levantados dados de 106 temperaturas corporais. Use as características abaixopara determinar o intervalo de confiança a 95% para o σ.
�A) A população parece ter uma distribuição normal; B) média amostral é 98,20ºF; c) s =0,62ºF; d) n=106; e) não há outliers.
Opsm. Ia quase me esquecendo!
Lista de exercícios #12
37
Estimação
Fabrina Bolzan Martins/Marcelo P. Côrrea
2
Eχ2
Dχ
0,025
0,025
74,22
129,561
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá 38
Estimação
Fabrina Bolzan Martins/Marcelo P. Côrrea
20
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá 39Fabrina Bolzan Martins/Marcelo P. Côrrea
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá 40Fabrina Bolzan Martins/Marcelo P. Côrrea
21
© Marcelo de Paula Corrêa (2011) – Universidade Federal de Itajubá 41Fabrina Bolzan Martins/Marcelo P. Côrrea