aula 1. introdução à inferência estatística capítulo 10, bussab&morettin “estatística...
Post on 07-Apr-2016
234 Views
Preview:
TRANSCRIPT
Aula 1. Introdução à InferênciaEstatística
Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição
PopulaçãoCaracterísticas
Informações contidasnos dados
Conclusõessobre as
característicasda população
Técnicas de amostragem
Análisedescritiva
Inferênciaestatística
Estatística
Amostra / dados
População é o conjunto de todos os elementosou resultados sob
investigação
Amostra é qualquer subconjunto da
população
População ↔ Amostra
Exemplo 10.1: Consideramos uma pesquisa para estudar os salários dos 500funcionários da Companhia M&B. Seleciona-se uma amostra de 36 indivíduos, e anotam-se os seus salários.
População = 500 salários correspondentes aos 500 funcionários
Amostra = 36 salários de funcionários selecionados
Esperamos que amostra reflita as caraterísticas principais da distribuiçãopopulacional de salários da empresa =
Amostra representativa
População ↔ Amostra
Exemplo 10.3: Consideramos uma pesquisa para estudar a duração de vida útilde um novo tipo de lâmpadas, pois acredita-se que a duração desse novo tipo é maior. Então 100 lâmpadas do novo tipo são deixadas acesas até queimarem.
População = a vida útil de todas as lâmpadas fabricadas ou que venham a ser fabricadas por essa empresa; = a distribuição de vida útil de lâmpada fabricada por empresa
Amostra = tempos de vida observada de 100 lâmpadas selecionados
Esperamos que amostra reflita as caraterísticas principais da distribuiçãopopulacional de vida útil de lâmpadas produzidas pela empresa =
Amostra representativa
PopulaçãoCaracterísticas
Técnicas de amostragem
Amostra / dadosA.A.S.
AmostragemAleatóriaSimples
Aleatoriamente sorteia-se um elemento da população, sendo que todos os elementostêm a mesma chance de ser escolhidos. Repete-se o procedimento até que sejamsorteadas as n unidades da amostra.
AAS com/sem reposição. AAS com reposição implica a propriedade de independência entre unidades selecionadas. Isso facilita o tratamento matemáticode propriedades de estimadores que vamos construir em cima de amostra.
Amostra / dados
Amostra aleatória simples
Amostra Aleatória Simples de tamanho de uma variável aleatória, com dada distribuição, é o conjunto de variáveis aleatóriasindependentes cada uma com a mesma distribuiçãode .
Amostra / dados
Amostra aleatória simples
Amostra Aleatória Simples de tamanho de uma variável aleatória, com dada distribuição, é o conjunto de variáveis aleatóriasindependentes cada uma com a mesma distribuiçãode .
PopulaçãoCaracterísticas
é v.a.
Amostra / dados
Amostra aleatória simples
Amostra Aleatória Simples de tamanho de uma variável aleatória, com dada distribuição, é o conjunto de variáveis aleatóriasindependentes cada uma com a mesma distribuiçãode .
PopulaçãoCaracterísticas
é v.a.
Em caso de população contínua, com função de densidade , a densidadeconjunta da amostra será dada por tal que
Estatística
Qualquer função de amostra chamaremosestatística
𝑋= 1𝑛∑𝑖=1𝑛
𝑋𝑖 𝑆2= 1𝑛−1∑𝑖=1
𝑛
(𝑋 𝑖− 𝑋 )2
𝑋(1)=min (𝑋 1 ,𝑋 2 , …, 𝑋𝑛 )𝑋(𝑛)=max (𝑋 1 , 𝑋 2 , …,𝑋𝑛)
-gêsima maior observação da amostra
𝑊=𝑋(𝑛)− 𝑋(1)
Amostra ↔amostra
amostra é vetor aleatório
amostra é vetor de números observados
estatística é variável aleatória
estatística é valor observado de
estatística é variável aleatória
estatística é valor observado de
distribuição populacionaldistribuição amostral da
estatística
distribuição populacionaldistribuição amostral da
estatística
Distribuição amostral da médiaTeorema. Seja uma variável aleatória com média e variância, e seja uma amostra aleatória simples (AAS) devariável . Então
𝐸 ( 𝑋 )=𝐸( 1𝑛∑𝑖=1𝑛
𝑋 𝑖)= 1𝑛∑𝑖=1𝑛
𝐸 (𝑋 𝑖)=1𝑛∑
𝑖=1
𝑛
𝜇= 1𝑛𝑛𝜇=𝜇
𝑉𝑎𝑟 ( 𝑋 )=𝑉𝑎𝑟 ( 1𝑛∑𝑖=1𝑛
𝑋 𝑖)= 1𝑛∑𝑖=1𝑛
𝑉𝑎𝑟 (𝑋 𝑖 )=1𝑛∑
𝑖=1
𝑛
𝜎2= 1𝑛𝑛𝜎2=𝜎2
Distribuição amostral da média
𝑍= 𝑋−𝜇𝜎 /√𝑛
=√𝑛 (𝑋−𝜇 )𝜎 ≈𝑁 (0 ,1 )
aprox
Distribuição amostral da média
Teorema. Seja uma variável aleatória normal com média e variância , , e seja uma amostra aleatória simples (AAS) de variável . Então
𝑍= 𝑋−𝜇𝜎 /√𝑛
=√𝑛 (𝑋−𝜇 )𝜎 𝑁 (0 ,1 )
distribuição populacionaldistribuição amostral da
estatística
Exemplo 10.11
Uma máquina está regulada para encher pacotes de café automaticamentesegundo a distribuição normal com média de 500 gramas e desvio padrão de10 gramas. Colhendo-se uma amostra de pacotes e pesando-os. Qualé a probabilidade de encontramos a média defirindo de 500 g. de menos de2 gramas.
Distribuição amostral de proporção
distribuição populacional
Distribuição amostral de proporção
distribuição amostra
𝑍= 𝑋−𝜇𝜎 /√𝑛
=√𝑛 (𝑋−𝜇 )𝜎 ≈𝑁 (0 ,1 )
𝑍=√𝑛(�̂�−𝑝)
√𝑝 (1−𝑝)≈𝑁 (0 ,1 )
Exemplo 10.12
Suponha que 30% dos estudantes de uma escola sejam mulheres. Colhemos umaAAS de estudantes e calculamos proporção de mulheres na amostra.Qual probabilidade de que difere de em menos de 0,01?
𝐸 (�̂� )=𝑝 ,𝑉𝑎𝑟 (�̂� )=𝑝 (1−𝑝)𝑛
�̂� ≈𝑁 (𝑝 ,𝑝 (1−𝑝 )
𝑛 )=𝑁 (0.3 ,0.021)
Da relação
),(12
ppεzn
segue que o tamanho amostral n, dados e a margem de erro , tem a forma
, )(1n
ppzε
onde z é tal que = P(-z Z z) e Z ~ N(0,1).
Dimensionamento da amostra
Entretanto, nesta expressão, n depende de p(1-p), que é desconhecido.
Como calcular o valor de n?
Pela figura observamos que:• a função p(1-p) é uma parábola simétrica em torno de p = 0,5;
Assim, na prática, substituímos p(1-p) por seu valor máximo, obtendo
, 0,252
εzn
que pode fornecer um valor de n maior do que o necessário.
Gráfico da função p(1-p), para 0 p 1.
• o máximo de p(1-p) é 0,25, alcançado quando p = 0,5.
Pergunta: É possível reduzir o tamanho da amostra quando temos alguma informação a respeito de p?
Em alguns casos, podemos substituir a informação p(1-p), que aparece na expressão de n, por um valor menor que 0,25.
Por exemplo, sabemos que:
• p não é superior a 0,30, ou• p é pelo menos 0,80, ou• p está entre 0,30 e 0,60.
Resposta: Depende do tipo de informação sobre p.
Vimos que, se nada sabemos sobre o valor de p, no cálculo de n, substituímos p(1-p) por seu valor máximo, e calculamos
. 0,252
εzn
Se temos a informação de que p é no máximo 0,30 (p 0,30), então o valor máximo de p(1-p) será dado por 0,3x0,7 = 0,21.
Redução do tamanho da amostra
Logo, reduzimos o valor de n para
. 0,212
εzn
Agora, se p é pelo menos 0,80 (p 0,80), então o máximo valor de p(1-p) é 0,8x0,2 = 0,16, e temos
. 0,162
εzn
Mas, se 0,30 p 0,60, o máximo valor de p(1-p) é 0,5x0,5=0,25 e, neste caso, não há redução, ou seja,
.0,252
εzn
Exemplo 3:No Exemplo 2, suponha que temos a informação de que no máximo 30% dos alunos da USP foram ao teatro no último mês.
conseguindo uma redução de 2401- 2017 = 384 estudantes.
Portanto, temos que p 0,30 e, como vimos, o máximo de p(1-p) neste caso é 0,21.
,estudantes 20170,210,021,960,21
22
εzn
Assim, precisamos amostrar
Intervalo de confiança para p
Vimos que a estimativa intervalar para p tem a forma: , ε pε ; p ˆˆ
nppzp
nppzp p ; γIC )()()( ˆ1ˆˆˆ1ˆˆ ;
Na prática, substituímos a proporção desconhecida p pela proporção amostral , obtendo o seguinte intervalo de confiança com coeficiente de confiança :
p̂
com e z tal que = P(-z Z z) na N(0,1).n
ppzε )(
1
top related