1/144
ModelagemEstatística
2/144
População e Amostra
População: Conjunto dos elementos que se
deseja abranger no estudo considerado.
Amostra: Subconjunto dos elementos da
população.
3/144
População
Finita - Alunos do mestrado, funcionários de
uma empresa, eleitores etc.
Infinita - Nascimentos em um cidade, produção
de uma máquina etc.
4/144
População e Amostra
Censo: Estudo através do exame de todos os
elementos da população.
Amostragem: Estudo por meio do exame de
uma amostra.
5/144
Técnicas de Amostragem
Amostragem probabilística (aleatória) - a probabilidade de um elemento da população ser escolhido é conhecida.
Amostragem não probabilística (não aleatória) - Não se conhece a probabilidade de um elemento da população ser escolhido para participar da amostra.
6/144
Amostragem Aleatória Simples
Faz-se uma lista da população e sorteiam-se os
elementos que farão parte da amostra.
Cada subconjunto da população com o mesmo
nº de elementos tem a mesma chance de ser
incluído na amostra.
pr = n/N
7/144
DISTRIBUIÇÕES AMOSTRAIS
8/144
Parâmetro e Estatística
Parâmetro - característica relacionada à
população.
Estatística - característica relacionada à
amostra.
9/144
Parâmetros
Média
Proporção p
Desvio Padrão
etc
10/144
Estatísticas
Média X
Proporção p
Desvio Padrão s
etc
11/144
Distribuições Amostrais
Qualquer característica de uma amostra aleatória (estatística) é uma variável aleatória.
Em outras palavras, se tomarmos várias amostras de forma parecida, os resultados da característica (estatística) que nos interessa variarão por causa da aleatoriedade do sorteio.
12/144
Distribuições Amostrais
Distribuição Amostral - Distribuição de
probabilidades de uma estatística.
13/144
Exemplo
A população de um estudo é composta de 4
pessoas (N=4) e a variável de interesse é a
altura.
X1=1,50m X2=1,60m
X3=1,70m X4=1,80m
14/144
Parâmetros
N=4 X1=1,50m X2=1,60m
X3=1,70m X4=1,80m
Média populacional:= 1,65m
Desvio Padrão: = 0,1118m
15/144
Exemplo
Retira-se uma amostra aleatória simples com 2
elementos (n=2), com reposição.
Qual será a média amostral?
Qual é a distribuição de probabilidades da média
amostral?
16/144
AmostraX3 X1X3 X2X3 X3X3 X4X4 X1X4 X2X4 X3X4 X4
ExemploAmostra
X1 X1X1 X2X1 X3X1 X4X2 X1X2 X2X2 X3X2 X4
17/144
X1,601,651,701,751,651,701,751,80
AmostraX3 X1X3 X2X3 X3X3 X4X4 X1X4 X2X4 X3X4 X4
ExemploX
1,501,551,601,651,551,601,651,70
AmostraX1 X1X1 X2X1 X3X1 X4X2 X1X2 X2X2 X3X2 X4
18/144
X1,501,551,601,651,551,601,651,70
X1,601,651,701,751,651,701,751,80
-
ExemploAmostra
X1 X1X1 X2X1 X3X1 X4X2 X1X2 X2X2 X3X2 X4
AmostraX3 X1X3 X2X3 X3X3 X4X4 X1X4 X2X4 X3X4 X4
Total
Prob.1/161/161/161/161/161/161/161/16
Prob.1/161/161/161/161/161/161/161/16
1
19/144Distribuição Amostral da
Média
0,0625
0,06250,12500,18750,2500
1/162/163/164/163/162/161/16
1
P(X)X1,501,551,601,651,701,751,80Total
P(X)
0,12500,1875
20/144Distribuição Amostral da
Média
1/16 1/16
2/16
3/16
4/16
2/16
3/16
1,50 1,55 1,60 1,65 1,70 1,75 1,80
21/144
Calcular o valor esperado (média) e o desvio
padrão da média amostral.
Distribuição Amostral da
Média
22/144
E(X) = x = (xi.pi)
VAR(X) = x = pi.(xi-x)2
Média eVariância
X P(X)
x1 p1
x2 p2
... ...
xn pn
Total 1
23/144
Distribuição Amostral da Média
0,0625
0,06250,12500,18750,2500
1/162/163/164/163/162/161/16
1
P(X)X1,501,551,601,651,701,751,80Total
P(X)
0,12500,1875
24/144
X = E(X) = 1,65 m
X = 0,0791 m
Distribuição Amostral da Média
30/144
Distribuição Amostral da Média
Características
= xa)
31/144
Distribuição Amostral da MédiaCaracterísticas
população finita
=nx
N - 1N - n
população infinita oumuito grande ou
amostragem com reposição
=nx
b)
32/144
c) A distribuição da média amostral é normal.
Distribuição Amostral da Média
Características
33/144
Exercício
Uma fábrica de pneus alega que a vida média dos pneus é 30.000 Km, com desvio padrão de 2.000 Km. Tomando-se como verdadeiros estes dados, qual é a probabilidade de uma amostra com 40 pneus apresentar vida média menor que 29.500 Km?
34/144
Exercício
n
=x
= 316,22777x =x2000
40
35/144
X3029,5
Exercício
P(X<29500)
36/144
Exercício
-1,58Z
0
0,057053
29500 =
= -1,5829.500 - 30.000
316,23
37/144
Exercício
Um lote com 100 pneus apresenta vida útil média de 30.000 Km, com desvio padrão de 2.000 Km. Qual é a probabilidade de uma amostra aleatória simples com 40 pneus apresentar vida média de menos que 29.500 Km?
38/144
=x2000
40
100 - 40
100 - 1
Exercício
=nx
N - 1N - n
= 246,18298x
39/144
X3029,5
Exercício
P(X<29500)
40/144
Exercício
-2,03Z
0
0,021178
29500 =
= -2,0329.500 - 30.000
246,18
41/144
Exercício 1
Se a vida útil média de uma peça é 5.000 horas, com desvio padrão de 200 horas, qual é a probabilidade de que uma amostra com 25 produtos apresente média superior a 5.100 horas?
0,00621
42/144
Exercício 2
Um banco informa que o saldo médio das 2000 contas de pessoas físicas é $ 500, com desvio padrão de $ 100. Se uma amostra aleatória de 50 correntistas (pessoa física) daquele banco for retirada, qual é a probabilidade do saldo médio ser menor que $ 480?
43/144
Exercício
População finita : Resp = 0,076359
População infinita: Resp = 0,079270
44/144
Modelagem Estatística
Distribuição Amostral
da Proporção
45/144
Distribuição Amostral da Proporção
Plano de amostragem
p - prop. populacional p - prop. amostral
População
p
Amostra
p
46/144
Exemplo
A população de um estudo é composta de 4
pessoas (N=4) e a variável de interesse é a
proporção de pessoas altas (altura > 1,75m).
N=4 X1=1,50m X2=1,60m
X3=1,70m X4=1,80m
47/144
Parâmetro
N=4 X1=1,50m X2=1,60m
X3=1,70m X4=1,80m
Proporção populacional: 1/4 = 0,25
48/144
Exemplo
Retira-se uma amostra aleatória simples com 2
elementos (n=2), com reposição.
Qual será a proporção amostral?
Qual é a distribuição de probabilidades da
proporção amostral?
53/144
proporção = número de pessoas altas
tamanho da amostra
Binomial (n=2 , p=1/4)
Distribuição Amostral da Proporção
65/144
Distribuição Amostral da Proporção
Características
= ppa)
66/144
população finita
população infinita oumuito grande ou
amostra com reposição
b)
=p n
p.(1-p)
=p N - 1N - n
n
p.(1-p)
Distribuição Amostral da Proporção
Características
67/144
c1) A distribuição das proporções amostrais é binomial no caso de população infinita. Quando o tamanho da amostra for grande, esta distribuição pode ser aproximada por uma distribuição normal.
c2) A distribuição das proporções amostrais é hipergeométrica no caso de população finita. Quando o tamanho da amostra for grande, esta distribuição pode ser aproximada por uma distribuição normal.
Distribuição Amostral da Proporção
Características
68/144
Exercício
Uma fábrica de pneus alega que 99% de seus produtos possuem vida útil longa (duram mais que 30.000 Km). Tomando-se como verdadeiros estes dados, qual é a probabilidade de uma amostra com 400 pneus apresentar menos que 2% dos pneus com vida útil menor que 30.000 Km?
69/144
Exercício
= 0,004975p
=p n
p.(1-p)
=p 400
0,01.0,99
70/144
Exercício
P0,01 0,02
P(p<0,02)
71/144
Exercício
Z 0,02 =
= 2,010,02 - 0,01
0,004975
Z0 2,01
0,977784
76/144
Exercício 3
Um banco informa que apenas 10% dos 5000 clientes possuem saldo médio acima de $500. Se uma amostra aleatória de 100 correntistas daquele banco for retirada, qual é a probabilidade de haver mais de 15 clientes na amostra com saldo acima de $500?
77/144
Exercício
População finita : Resp = 0,046479
População infinita: Resp = 0,047460
78/144
Modelagem Estatística
Estimação
79/144
Estimação de Parâmetros
População Amostra
p
2
P
S2
X
80/144
Estimação
PopulaçãoAmostra
P
S2
X
?
Conhecidas as estatísticas
(amostra), estimar quais são os
parâmetros (população).
81/144
Estimação
Pontual Estima-se apenas um valorpara o parâmetro.
Intervalar Estima-se um intervalo de valores onde deve-se encontrar o parâmetro (intervalo de confiança).
82/144
Propriedades Desejáveis de um Estimador
Não-tendenciosidade ou justeza: um
estimador é justo (não tendencioso, não
viesado; não viciado) se sua média (ou valor
esperado) for o próprio parâmetro que se
pretende estimar.
83/144
Tendenciosidade
Ex:Média
X
E( ) =
X X
=Xi
n=
Não-tendencioso
84/144
Tendenciosidade
Ex: Proporção
Não-tendencioso
E( ) =
P pP
=P Xi
n=
85/144
E ( ) = 2 n -1 2
Tendenciosidade
(Xi -X
n
^2=
nTendencioso
86/144
E( ) =
2E ( ) = n -1 2
Tendenciosidade
(Xi -X
n 2
= n
Tendencioso
Não-tendencioso
(Xi -X
n-1 2
= S2 = 2 2E(s2) =
87/144
Consistência
Um estimador é consistente se o aumento do
tamanho da amostra leva a uma redução da
variância.
88/144
Eficiência
Um estimador não-tendencioso (E1) é mais
eficiente que outro estimador não-tendencioso
(E2) se a variância de E1 for menor que a
variância de E2.
2E1
2E2
<
89/144
Eficiência
x x x
x x x
x x x
x x xx x x
x x x
x x xx
x xx x x
x x xx x xx x x
x x x
x x x x
x x
x x x
x x x
x x xx
x x
x x x
x x x
x x x
x x xx x x
x x x
x x xx
x xx x x
x x xx x xx x x
x x x
x x x x
x x
x x x
x x x
x x xx
x x
x x x
x x xx x x
x x xx
x x x x x
x x xx x x
x x x
x x x
x x xx
x x
x x x
x x x
x x x
x x xx x x
x x x
x x x
x x xx x x
x x x
x x xx
x xx x x
x x x
x x x x
x xx x x
x x xx
x xx x x
x x x
x x x
x x x
x x x
x x x
x x x
Não-tendenciososE1 E2 E3
Tendencioso
E1 é mais eficiente que E2
90/144
Métodos de Estimação
Como selecionar o melhor estimador?
Método da Máxima Verossimilhança
Método dos Mínimos Quadrados
Métodos Bayesianos
...
91/144
Intervalos deConfiança
Problema: Estimar 2 limites, dentro dos quais
deve se encontrar o valor real, com um
determinado nível de confiança.
92/144
Exemplo: Média
População infinita (valor real = ) (desconhecido)
93/144
Exemplo: Média
Amostra: média amostral ( )
E( ) =
X
X
=X
n
94/144
Exemplo
População infinita (valor real = ) (desconhecido)
= 10
95/144
ExemploDistribuição Amostral
Amostra: média amostral ( )
X
=X
10
25= 2
96/144
Exemplo
Qual a probabilidade de ser maior que ?X
97/144
Exemplo
Qual a probabilidade de ser maior que ?X
0,50
98/144
Exemplo
Qual a probabilidade de ser maior que 1,96 vezes o desvio padrão?
Qual a probabilidade da distância entre a média populacional (µ) e a média amostral (X) ser maior do que 1,96 vezes o desvio padrão da distribuição amostral da média?
X -
99/144
Exemplo
Qual a probabilidade da distância entre a média populacional (µ) e a média amostral (X) ser maior do que 3,92?
=X
10
25= 2 1,96 . 2 = 3,92
100/144
Exemplo
Qual a probabilidade de ser maior que
1,96 vezes o desvio padrão?
X -
-1,96 0 1,96
0,025 0,025
Resp: 5%
101/144
Exemplo: Média
Se alguém afirmar que X estará a menos de
1,96 vezes o desvio padrão da média (para
mais ou para menos), terá 95% de
probabilidade de estar certo e 5% de
probabilidade de estar errado.
102/144
Simbologia
Probabilidade de erro admitida
(probabilidade do parâmetro encontrar- se
fora do intervalo a ser criado).
No exemplo,
103/144
Simbologia
Grau de confiança(probabilidade
do parâmetro encontrar-se no
intervalo)
No exemplo,
104/144
Simbologia
Limite do I.C. na distribuição
padronizada.
No exemplo,
105/144
Limites
O intervalo é construído somando-se e
diminuindo-se Z vezes o desvio padrão da média
amostral obtida.
106/144
Limites
+-_X xInt. Conf.:
A média da amostra não se diferenciará da
média populacional em mais que Z vezes o
desvio padrão (da distribuição amostral)
107/144
Limites
nx
= N -1N -n
nx
=
+-_X xInt. Conf.:
População infinita
População finita
108/144
Exemplo
Foi retirada uma amostra com 64 elementos de uma população com desvio padrão igual a 100. A média encontrada foi 300. Construir um intervalo para a média com:
a) 90% de confiança
109/144
Exemplo
0Z0,05
5%
110/144
Xn
Exemplo
+-Lim= 300 1,645 64
100 Linf = 279,4
Lsup = 320,620,5625
111/144
Exemplo
b) 99% de confiança
Linf = 267,8
Lsup = 332,2+-Lim= 300 2,575
64100
32,1875
112/144
Encontrar, na tabela da normal reduzida, os
valores de Z para:
Exemplo
113/144
Encontrar, na tabela da normal reduzida, os
valores de Z para:
Exemplo
114/144
+-_X x
Intervalo de Confiança
Média ( conhecido)
n x
= N -1N -n
n x
=
Int. Conf.:
População infinita
População finita
115/144
Intervalo de ConfiançaMédia
( desconhecido)
Normalmente, não se conhece o desvio padrão da população cuja média se deseja estimar.
Então, utiliza-se um estimador pontual para o desvio padrão populacional.
116/144
s n-1Xi - X)2
s = Desvio padrão da amostra
Intervalo de ConfiançaMédia
( desconhecido)
117/144
Nesta situação, a distribuição correta a ser utilizada é a
distribuição “t” de Student, com (n-1) graus de
liberdade. (supondo que a população seja normal).
Obs: se a amostra for grande, pode utilizar-se a
distribuição normal como aproximação.
Intervalo de ConfiançaMédia
( desconhecido)
118/144
0 t
normal
Intervalo de ConfiançaMédia
( desconhecido)
t
119/144
+-_X t x
Interv.Conf. Média ( desconhecido)
n x
s= N -1
N -n
n x
s=
Int. Conf.:
População infinita
População finita
^
^
^
120/144
Limites do Intervalo
t - valor limite da distribuição t, para a
probabilidade de erro , com (n-1) graus de
liberdade.
tabela t.
121/144
Exemplo
Encontrar o valor limite de t/2 para:
a) = 1%, com 19 graus de liberdade (amostra
com 20 elementos)
2,861
122/144
Encontrar o valor limite de t/2 para:
a) = 10%, com 19 graus de liberdade (amostra
com 20 elementos)
1,729
Exemplo
123/144
Encontrar o valor limite de t/2 para:
a) = 5%, com 19 graus de liberdade (amostra
com 20 elementos)
2,093
Exemplo
124/144
Encontrar o valor limite de t/2 para:
a) = 5%, com 29 graus de liberdade (amostra
com 30 elementos)
2,045
Exemplo
125/144
Encontrar o valor limite de t/2 para:
a) = 5%, com graus de liberdade
1,960
Comparar este resultado com Z0,025.
8
Exemplo
126/144
Na construção de um motor, o diâmetro dos cilindros é
de grande importância. Em uma pesquisa feita com 5
blocos com 4 cilindros cada (20 furos), o diâmetro
médio encontrado foi 82 mm e o desvio padrão 0,1 mm.
Construir um intervalo com 95% de confiança para este
parâmetro.
Exemplo
127/144
n = 20 (19 graus de liberdade)
s = 0,1 mm
X = 82 mm
= 5% - da tabela: t19 = 2,093
Exemplo
128/144
IC :
LS = 82,05 mm LI = 81,95 mm
81,95 < < 82,05 com 95% de confiança
ns
tc+-
_X 2,093
200,1+-82
0,05
Exemplo
129/144
Intervalo de confiança para
a proporção
População com proporção p (desconhecida).
Amostra com n elementos e proporção p
conhecidos.
130/144
Distribuição Amostral da Proporção
LI P LS
(1-)p
131/144
Intervalo de Confiança
Limites:
+-_P n
P(1-P)(População infinita)
132/144
Exemplo
Foi retirada uma amostra com 100 itens de um grande lote de peças, sendo encontrados 10 defeituosos. Construa um intervalo de confiança com 3% de erro para a percentagem de defeituosos no lote.
133/144
Exemplo
0Z0,05
1,5%
134/144
Lim= 0,10 2,17 +-100
pn
Exemplo
Linf = 0,035
Lsup = 0,165
0,0651
0,10.0,90
135/144
Tamanho de Amostras
136/144
Z/2 n+-
_X
erro máximo (e)
Intervalo de ConfiançaMédia
(população infinita)
137/144
Tamanho de Amostras
Média
n
e = Z/2 (erro máximo ou margem de erro)
n = (População infinita)2
e Z/2 x
138/144
Tamanho de Amostras
Média
n = (População finita)2
Z/2 x x N2
2Z/2 x + e (N-1)
2 2
n = (População infinita)2
e Z/2 x
139/144
Estimação “a priori” do desvio padrão:
Estudos passados
Amostra piloto
Fixando-se um valor teórico
Tamanho de Amostras
140/144
Intervalo de ConfiançaProporção
+-_P n
p(1-p)(População infinita)
erro máximo (e)
141/144
Tamanho de Amostras
Proporção
ne = Z/2
p (1-p)
n = (População infinita)p (1-p)Z/22
e2
142/144
Tamanho de Amostras
Proporção
n = (População infinita)p (1-p)Z/22
e2
x p (1-p) x NZ/22
e (N-1)2x p (1-p) + Z/22
n = (População finita)
143/144
Estimação “a priori” da proporção:
Estudos passados
Amostra piloto
Fixando-se um valor teórico (0,5)
Tamanho de Amostras
144/144
Tamanho de Amostras
Se p = 0,5 máximo tamanho de amostra.
n = x 0,25Z2
e2
n = 0,25 x Z x N2
0,25 x Z + e x (N-1)2 2
(população infinita)
(população finita)