inferencia estatistica-recente.docx
TRANSCRIPT
1
1. Introdução
Até agora o que fizemos foi desenvolver modelos probabilísticos que se adequavam a
situações reais. Em particular, indicámos quando os modelos Binomial e Normal eram
adequados. Todos estes modelos se referem a distribuições, de probabilidade, que envolvem
parâmetros, que até agora foram supostos conhecidos. Para que as probabilidades associadas
a eventos sejam calculadas é necessário conhecer o valor destes parâmetros.
No estudo das probabilidades realizado até agora, o nosso objectivo era calcular a
probabilidade de acontecimentos pré-especificados, mas do ponto de vista prático é
importante poder deduzir informações, relativas a uma população, mediante a utilização de
amostras dela extraídas. Esta é a grande diferença entre Probabilidade e Estatística. No estudo
de Probabilidade estamos interessados em definir modelos que possam ser aplicados a
situações reais. Estes modelos envolvem distribuições de probabilidade totalmente
conhecidas, isto é, não apenas a forma da densidade, mas também os seus parâmetros são
conhecidos. No estudo da Estatística supõe-se que o modelo probabilístico é conhecido, isto
é, sabe-se qual a distribuição de probabilidade que modela a situação real, mas os parâmetros
desta distribuição são desconhecidos, e devem ser estimados a partir dos dados.
O objectivo principal da Inferência estatística, é estimar os parâmetros populacionais (média,
variância etc), deduzidos a partir da estatística amostral correspondente. Os mecanismos mais
usuais para "inferir" alguma coisa sobre estes parâmetros são:
Estimação pontual - o objectivo é "encontrar" os valores do parâmetro desconhecido.
Estimação por intervalos - o objectivo é encontrar um intervalo que contenha o
parâmetro de interesse com uma probabilidade especificada.
Testes de hipóteses: o objectivo é criar conjecturas sobre os valores possíveis do
parâmetro e verificar se, estas conjecturas, são muito ou pouco prováveis (isto é, testar
as hipóteses).
2
2. Distrbuição amostral
É a distribuição de probabilidade de um estimador ( ou estatística) da amostra formada
quando amostras de tamanho nsão colhidas varias vezes de uma população.
Por exemplo, se o estimador da amostra for a sua média, a distribuição será uma distribuição
amostral de médias das amostras.
Um estimador é uma característica da amostra.
Como a amostra é aleatória um estimador é uma variável aleatória. Assim tudo o que foi visto
em probabilidade sobre variáveis aleatórias, aplica-se aos estimadores. A distribuição de
probabilidade de um estimador é denominada de distribuição amostral.
Os principais estimadores são:
(I) A média da amostra, X que é um estimador da média da população: μ
(ii) A variância amostral, S2 que é um estimador da variância populacional: σ 2
(iii) A proporção amostral, P, que é um estimador amostral da proporção populacional π.
Estimativa
Uma estimativa é um valor particular de um estimador
Assim X=2 é uma estimativa. O estimador é a expressão (fórmula) enquanto que a
estimativa é o valor particular que ele assume (número).
Cálculo dos principais estimadores.
Se (X1,X2, ...,X n) é uma amostra aleatória de tamanho “n” extraída de uma população, então:
a) X=∑ X i
n é uma estimativa da média populacional quando a amostra não está
agrupada e X=∑ f i X i
né uma estimativa da média da amostra quando a amostra está
agrupada em uma distribuição de frequências (por ponto ou por valores).
3
b¿ S¿2=∑i=1
n
( X i−X )2
n−1
é uma estimativa da variância populacional quando a amostra não está
agrupada e S2=
∑i=1
n
f i ( X i−X )2
n−1
é uma estimativa da variância populacional quando a amostra
está agrupada em uma distribuição de frequências. Note-se que agora a variância é calculada
Com “n−1” no denominador. Isto se deve ao facto de que a variância for calculada com “n”
no denominador, a média de sua distribuição amostral não será igual a variância populacional
o que caracterizaria um estimador tendencioso.
Embora a variância seja calculada com “n−1” no denominador com o objectivo de que as
estimativas variem em torno do parâmetro, isto não irá ocorrer se a amostragem for sem
reposição de população finita. Neste caso é necessário utilizar, ainda, uma correcção para a
variância que consiste em multiplicá-la pelo valor N−1
N. Evidentemente esta correcção só
será necessária se a população for pequena, caso contrário o quociente acima será
aproximadamente igual a um e a correcção não precisará ser feita.
Assim se a população for finita (e pequena) e a amostragem for realizada sem reposição a
variância deverá ser calculada por:
S2= N−1N
S2
c) P= fn
, onde f é a frequência de elementos na amostra com determinada característica
é uma estimativa da proporção populacional π.
Observação:
Funções não estatísticas: ∑ X i−μ
σ ; ∑ X i
σ por conterem parâmetros desconhecidos
S2=∑i=1
n
( X i−X )2
n−1
(variância amostral corrigida, usa-se para n ≤ 30¿
ou S'2=
∑i=1
n
( X i−X )2
n
(variância amostral não corrigida, usa-se para n>30¿
4
Quais as razões que nos podem levar a preferir uma das estatísticas relativamente à
outra?
Qual o estimador preferido? S2 ou S'2?
Um critério que costuma ser aplicado é o de escolher um “bom” estimador como sendo
aquele que é centrado e que tem uma boa precisão. Escolhido um plano de amostragem,
define-se:
Estimador centrado – Um estimador diz-se centrado quando a média das estimativas
obtidas para todas as amostras possíveis que se podem extrair da População, segundo o
esquema considerado, coincide com o parâmetro a estimar. Quando se tem um estimador
centrado, também se diz que é não enviesado.
Uma das razões que nos levam a preferir o estimador S2 para a variância, relativamente a
S'2, é o facto de não apresentar enviesamento (pelo menos para o plano de amostragem que
iremos utilizar).
Aparece-nos, novamente a palavra enviesamento, mas noutro contexto. Efectivamente,
relacionado com um processo de amostragem e com escolha de um estimador, temos dois
tipos de enviesamento:
O associado com o processo de amostragem, isto é, com a recolha da amostra, em
que uma amostra enviesada é o resultado do processo de amostragem não ser
aleatório;
O associado com o estimador escolhido, para estimar o parâmetro em estudo. Se o
estimador não for centrado, diz-se que é enviesado ou não centrado.
Para se evitar qualquer tipo de “enviesamento”, é necessário estar atento:
Primeiro na escolha do plano de amostragem
E depois na escolha do estimador utilizado para estimar o parâmetro desconhecido. O
facto de utilizarmos um estimador centrado, não nos previne contra a obtenção de
más estimativas, se o plano de amostragem utilizado sistematicamente favorecer uma
parte da População (isto é, fornecer amostras enviesadas).
Por outro lado, temos que ter outra preocupação com o estimador escolhido, que diz respeito
à precisão:
Precisão - Ao utilizar o valor de uma estatística para estimar um parâmetro, temos que cada
amostra fornece um valor para a estatística que se utiliza como estimativa desse parâmetro.
5
Estas estimativas não são iguais devido à variabilidade presente na amostra. Se, no entanto,
os diferentes valores obtidos para a estatística forem próximos, e o estimador for centrado,
podemos ter confiança de que o valor calculado a partir da amostra recolhida (na prática
recolhe-se uma única amostra) está próximo do valor do parâmetro (desconhecido).
A falta de precisão e o problema do enviesamento da amostra são dois tipos de erro com
que nos defrontamos num processo de amostragem (mesmo que tenhamos escolhido um
“bom” estimador).
2.1 Distribuição amostral da média
a) Amostragem com reposição
Seja X uma variável aleatória que assume os seguintes elementos {2 ;3 ;4 ; 5 } .Vamos extrair,
aleatoriamente, com reposição, amostras de dois elementos. Então, 42 = 16 o número de
amostras possíveis, já que N = 4 e n = 2 é o processo com reposição.
(2 ;2 ) (2 ;3 ) (2 ;4 ) (2 ;5 ) (3 ;2 ) (3 ;3 ) (3 ;4 ) (3 ;5 ) (4 ;2 ) ( 4 ;3 ) (4 ;4 ) ( 4 ;5 ) (5;2 ) (5 ;3 ) (5 ;4 ) (5 ;5 )
Se calcularmos para cada amostra sua média obteremos:
( 2+22
=2); (2+32
=2,5); (2+42
=3);( 2+52
=3,5);( 3+22
=2,5);( 3+32
=3);( 3+42
=3,5);( 3+52
=4); ( 4+22
=3); ( 4+32
=3,5);( 4+42
=4);( 4+52
=4,5);( 5+22
=3,5);( 5+32
=4);( 5+42
=4,5);( 5+52
=5)A distribuição de probabilidade X é:
Média 2 2,5 3 3,5 4 4,5 5
Probabilidad
e da Média1
162
163
164
163
162
161
16
Calculamos a E ¿) e Var ¿) da seguinte maneira:
μX=E ¿) = ∑i=1
7
X i P ( X i)=3,5
Var ( X )=(∑i=1
7
X i2 P ( X i ))−¿
6
Como a população é formada pelos elementos {2 ;3 ;4 ;5 }, calculamos a média e variância
populacional:
μx=∑i=1
n
X i
n=2+3+4+5
4=14
4=3,5
Var ( X )=σ2=∑i=1
n ( X ¿¿ i−μx)2
n=1,25¿
Observando os valores acima, verificamos que as médias são iguais e a Var ( X ) é a metade da
variância da população, pois, n=2.
Dai constatamos que μX=μX e Var ( X )=Var ( X)
n=σ2
n
Será que foi coincidência o facto de que a média das médias amostrais ter coincidido com a
média populacional? E a variância de X ser igual à metade de Var ( X )?
Vamos mostrar que isso sempre acontece
Teorema
Seja X uma variável aleatória com média μX e variância σ 2 e seja (X1,X2, ...,X n), uma
amostra aleatória simples, então, se X =∑i=1
n X i
n , temos os E ( X )=μX e Var ( X )=σ 2
n
Teorema 1
Teorema: Consideremos uma amostra aleatória, (X1,X2, ...,X n), de distribuição N ( μ;σ2 ). A
média amostral X =∑i=1
n X i
n segue uma distribuição N (μ;
σ2
n ).Este teorema pode ser generalizado para uma amostra aleatória de uma distribuição qualquer.
Teorema2
Teorema: Consideremos uma amostra aleatória, (X1,X2, ...,X n), de uma distribuição qualquer
tal que E ( X i)=μ e Var ( X i )=σ2. Seja X a média amostral. Então:
1. E ( X )=μ
7
2. Var ( X )=σ 2
n
3. Se n é grande, pelo teorema central do limite, podemos concluir que X−μ
σ√n ∩
°
N ( 0;1 )
Nota: Neste caso, nada é dito a respeito da distribuição de X . Apenas a sua média e variância
são conhecidas, e são funções da média e variância de cada X i. A princípio a distribuição de
Xpoderia ser “uma coisa estranha”, que nada tem a ver com a distribuição original de cada X i
. No entanto, se o tamanho da amostra é grande n>30 podemos concluir que a distribuição de
X , é aproximadamente N (0 ;1 ).
Teorema 3: Consideremos uma amostra aleatória, (X1,X2, ...,X n) , de distribuição N ( μ ;σ2 ).
Seja S2 a variância amostral dada por S2=
∑i=1
n
( X i−X )2
n−1
. Então (n−1 ) S2
σ 2 = ∑i=1
n
( X i−X )2
σ 2
tem
distribuição Qui-quadrado com (n−1) graus de liberdade.
A partir deste teorema podemos deduzir facilmente a média e variância de s2.
Teorema 4: Consideremos uma amostra aleatória, (X1,X2, ...,X n) , de distribuição N ( μ ;σ2 ) .
Seja S2 a variância amostral. Então E ( S2 )=σ2 e Var (S2 )= 2 σ4
n−1
Os mecanismos mais usuais para "inferir" alguma coisa sobre estes parâmetros são:
Estimação pontual - o objectivo é "encontrar" os valores do parâmetro desconhecido.
Estimação por intervalos - o objectivo é encontrar um intervalo que contenha o
parâmetro de interesse com uma probabilidade especificada.
Testes de hipóteses - o objectivo é criar conjecturas sobre os valores possíveis do
parâmetro e verificar se, estas conjecturas, são muito ou pouco prováveis (isto é, testar
as hipóteses).
b) Amostragem sem reposição
8
Considere-se a população P= {1 ;3 ;5 ;6 } e todas as amostras possíveis de tamanho n=2
extraídas sem reposição.
As possíveis amostras com as respectivas médias são:
Amostra
s (1;3) 1;5) (1;6) (3;5) (3;6) (5;6)
Média 2 3 3,5 4 4,5 5,5
Colocando estes resultados em uma tabela (distribuição amostral da média) vem:
X f ( X )=P ( X=X ) X f ( X ) X2 f ( X )
216
26
46
316
36
96
3,516
3,56
12,256
416
46
166
4,516
4,56
20,256
5,516
5,56
30,256
Σ 122,5
691,75
6
Da tabela segue:
E ( X )=∑ X f ( X )→ E ( X )=22,256
=3,75=μ isto é a expectância (média) de todas as médias
amostrais, extraídas sem reposição da população P, também é igual a média populacional
(parâmetro populacional média).
V ( X )=∑ X2 f ( X )−μ2X →V ( X )=91,75
6−3,752→ V ( X )=1,2292 ↔
σ 2
2N−nN−1
=1,84375.( 23 )
isto é, a variância entre as médias amostrais é “n” vezes (neste caso 2 vezes) menor que a
variância populacional multiplicada pelo factor de correcção de população finita. Este factor,
pode ser considerado como o factor de eficiência da amostragem sem reposição sobre a
9
amostragem com reposição, que neste caso ( N=4 e n=2 ) vale 23
. Como na amostragem sem
reposição não é possível retirar o mesmo elemento duas vezes, as médias não podem assumir
valores tão extremos, como por exemplo, o valor “um” ou “seis” que assumiram na
amostragem com reposição. Isto faz com que a erro padrão na amostragem sem reposição
seja menor do que na amostragem com reposição.
O factor de redução da variância na amostragem sem reposição é: N−nN−1
Pode-se perceber facilmente que quanto maior for a diferença entre o tamanho da população e
o tamanho da amostra mais próximo de “um” será este factor. Então, como regra prática,
pode-se admitir como necessária a correcção para a variância das médias amostrais sempre
que o tamanho da amostra exceder a 5% do tamanho da população. Caso isto não ocorra não
é necessário fazer-se a distinção entre os dois procedimentos (com e sem reposição).
Evidentemente as considerações acima valem para populações pequenas. Se a população é
bastante grande ou infinita, não mais será possível pensar em construir tabelas para
representar a distribuição das médias amostrais. Neste caso é necessário procurar por
modelos probabilísticos que descrevam a distribuição da média amostral. Neste caso,
também, como declarado acima a distinção entre amostragem com e sem reposição não será
necessário, pois o factor de correcção será “aproximadamente um” e não necessitará ser
utilizado.
Os modelos probabilísticos são conhecidos a partir dos dois seguintes resultados:
a) Se ( X 1; X2 ;… Xn ) é uma amostra aleatória de uma população com distribuição
normal de média μ e desvio padrão σ , então a média da amostra ( X )terá uma
distribuição também normal com a mesma média da população e com desvio padrão
(erro padrão) raiz de “n” vezes menor que o desvio padrão da população, isto é:
Se Xé N ( μ ;σ ) então, X será N (μ;σ
√n )
b) Teorema Central do Limite
Se ( X 1; X2 ;… Xn ) é uma amostra aleatória extraída de uma população com qualquer
distribuição de média μ e desvio padrão σ , então a média da amostra ( X ) terá uma
distribuição aproximadamente normal com a mesma média da população e com desvio
10
padrão (erro padrão) raiz de “n” vezes menor que o desvio padrão da população à medida que
o tamanho da amostra aumenta.
Observação: Para amostras de 30 ou mais valores, em geral, a aproximação já será suficiente
boa, para se poder utilizar este resultado.
Assim:
Se X tem qualquer distribuição então X terá uma distribuição aproximadamente N (μ;σ
√n ) para ngrande (n≥ 30 ).
Exemplos:
1. Uma população X tem uma distribuição normal de média 100 e desvio padr ã o10 .
a) Qual P (95< X<105 )?
(b) Se X é a média de 16 elementos extraída desta população, qual aP (95< X<105 )?
Solução:
Como Xé uma N (100 ;10 ), vem:
a) P (95< X<105 )=P (−0,5<Z<0,5 ) ↔ ϕ (0,5 )−ϕ (−0,5 )=0,6915−0,3185=38,30 %.
Neste caso, X é uma N (100 ;2,5 ).
b) P (95< X<105 )=P (−2<Z<2 )↔ ϕ (2 )−ϕ (−2 )=0,9772−0,0228=95,44 % .
2. A renda de um conjunto de pessoas de uma certa região tem média 6 s .me desvio padrão
de 2 s .m. Se desta população for extraída uma amostra de n=100pessoas, qual a
probabilidade de a média desta amostra acuse um valor superior a 6,3 s . m?
Solução:
Neste caso, como não foi declarado que a população é normal é necessário aplicar o teorema
central do limite, uma vez que n=100>30, isto é possível. A média da amostra terá uma
distribuição aproximadamente normal com média 6 s .m e desvio padrão de: 2
√100=0,2, uma
vez que o erro padrão da média é raiz de n vezes menor do que o desvio padrão populacional.
Então, a probabilidade pedida será:
11
P ( X>6,3 )=P(Z>( 6,3−60,2 ))→ P (Z>1,5 )=ϕ (−1,5 )=6,68 % Isto é, apenas 6,68% das médias
de amostras de tamanho n=100 apresentarão um valor superior a 6,3 s . m.
2.2 Distribuição amostral da variância
a) Amostragem com reposição
Considere-se a população P={1;3 ;5 ;6 } e todas as amostras possíveis de tamanho n=2
extraídas com reposição. Para cada amostra vai-se calcular a variância. Ter-se-á assim um
conjunto de 16 valores que serão dispostos em uma tabela, com as respectivas probabilidades,
e que constituirá então a distribuição amostral da variância.
As possíveis amostras com as respectivas variâncias são:
Amostra
s (1;1) (1;3) (1;5) (1;6) (3;1) (3;3) (3;5) (3;6)
Médias 1 2 3 3,5 2 3 4 4,5
S2 0 2 8 12,5 2 0 2 4,5
Amostra
s (5;1) (5;3) (5;5) (5;6) (6;1) (6;3) (6;5) (6;6)
Médias 3 4 5 5,5 3,5 4,5 5,5 6
S2 8 2 0 0,5 12,5 4,5 0,5 0
Colocando estes resultados em uma tabela (distribuição amostral da variância) vem:
S2 f ( S2 )=P (S2=S2 ) S2 f ( S2 )
04
160
16
0,52
161
16
24
168
16
12
4,52
169
16
82
161616
12,52
162516
Σ 15916
Pela tabela segue que:
E ( S2 )=∑ S2 f (S2 ) ↔ 5916
=3,6875=σ2, isto é a expectância (média) de todas as variâncias das
amostras de tamanho n=2, extraídas com reposição da população P, é igual a variância
populacional
(parâmetro populacional variância). Em outras palavras, pode-se dizer que quando a
amostragem é com reposição a variância amostral S2é um estimador não tendencioso da
variância populacional σ 2 .
Desta forma, sempre que se desejar estimar a variância de uma população onde as amostras
foram retiradas com reposição, pode-se usar a variância amostral como estimador.
b) Amostragem sem reposição
Considere-se a população P={1;3 ;5 ;6 } e todas as amostras possíveis de tamanho n=2
obtidas sem reposição.
As possíveis amostras com as respectivas variâncias são:
Amostra
s (1;3) (1;5) (1;6) (3;5) (3;6) (5;6)
Médias 2 3 3,5 4 4,5 5,5
S2 2 8 12,5 2 4,5 0,5
Colocando estes resultados em uma tabela (distribuição amostral da variância) vem:
13
S2 f ( S2 )=P (S2=S2 ) S2 f ( S2 )
0,51
160,56
226
46
4,516
4,56
816
86
12,516
12,56
Σ 129,5
6
E=Σ S2 f ( S2 ) → E=29,56
≠ 3,6875=σ2 isto é a expectância (média) de todas as variâncias das
amostras de tamanho n=2, extraídas sem reposição da população finita P, não é igual a
variância populacional (parâmetro populacional variância). Neste caso, para que se obtenha
um estimador não tendencioso da variância populacional é necessário corrigir a variância
amostral através do factor N−1
N . Assim se cada variância acima for multiplicada por este
factor, que neste caso será, N−1N=3
4
=0,75 então, se terá:
S2 f ( S2 )=P (S2= S2 ) S2 f ( S2 )
0,37516
0,3756
1,50026
3,0006
3,37516
3,3756
6,00016
6,0006
9,37516
9,3756
14
Σ 122,125
6
E ( S2 )=∑ S2 f (S2 ) → 22,1256
=3,6875=σ2 isto é a expectância (média) de todas as variâncias
corrigidas é igual ao parâmetro populacional σ2. Assim quando a população é pequena e
amostragem for sem reposição é necessário corrigir a variância da amostra pelo factor N−1
N,
para que ela seja um bom estimador da variância populacional. É claro que esta correcção só
será importante para populações pequenas. Se a população for grande, por exemplo,N=1000
, então o factor N−1
N=9991000
=0,999o que é aproximadamente 1. Neste caso, não é necessário
usar esta correção e a amostragem sem reposição pode ser considerada equivalente a com
reposição para efeitos de estimação da variância populacional.
Evidentemente as considerações acima valem para populações pequenas. Se a população é
bastante grande ou infinita, não mais será possível pensar em construir tabelas para
representar a distribuição das variâncias amostrais. Neste caso é necessário procurar por
modelos probabilísticos (funções) que descrevam a distribuição da variância amostral. Para a
variância este modelo existe e é denominado de distribuição Qui-quadrado ( χ2 ).
2.3 Distribuição amostral da proporção
a) Amostragem com reposição
Considere-se a população P={1;3 ;5 ;6 } e todas as amostras possíveis de tamanho n=2
obtidas com reposição. Para cada amostra vai-se calcular a proporção P de elementos pares
na população.
Ter-se-á assim um conjunto de 16 valores que serão dispostos em uma tabela, com as
respectivas probabilidades, e que formarão então a distribuição amostral da proporção.
As possíveis amostras com as respectivas proporções são:
Amostra
s (1;1) (1;3) (1;5) (1;6) (3;3) (3;5) (3;6) (5;5)
P 0 0 0 0,5 0 0 0,5 0
Amostra
s (5;6) (6;6) (3;1) (5;1) (6;1) (5;3) (6;3) (6;5)
15
P 0,5 1 0 0 0,5 0 0,5 0,5
Colocando estes resultados em uma tabela (distribuição amostral da proporção) vem:
P f ( P )=P (P=p ) Pf (P ) P2 f ( P )
0,09
160
160
16
0,56
163
161,516
11
161
161
16
Σ 14
162,516
Pode-se então calcular a expectância e a variância:
E ( P )=∑ pf ( p ) → 416
=0,25=π, isto é o valor esperado (média) de todas as proporções
amostrais, extraídas com reposição da população P, e é igual a proporção populacional
(parâmetro populacional π). Isto significa, que o estimador P é um estimador não
tendencioso (ou não viciado) da proporção populacional π, quando as amostras são extraídas
com reposição da população.
V ( P )=∑ P2 f ( p )−μ p2→
2,516
−0,252=0,09375=π (1−π )
n isto é, a variância entre as
proporções amostrais é “n” vezes (neste caso 2 vezes) menor que a variância populacional.
Isto porque quando se está trabalhando com proporções, pode-se mostrar que a variância
populacional é igual a π (1−π ).
O valor σ P=√ π (1−π )n
=0,09375 é denominado erro padrão da proporção. Ele mede a
variabilidade entre as proporções amostrais e dá uma ideia do erro que se comete ao se
substituir a proporção da população pela proporção da amostra.
Amostragem sem reposição
Considere-se a população P={1;3 ;5 ;6 } e todas as amostras possíveis de tamanho n=2
extraídas sem reposição.
As possíveis amostras com as respectivas proporções são:
16
Amostra
s (1;3) (1;5) (1;6) (3;5) (3;6) (5;6)
P 0 0 0,5 0 0,5 0,5
Colocando estes resultados em uma tabela (distribuição amostral da proporção) vem:
P f ( P )=P (P=p ) Pf (P ) P2 f ( P )
0 0,502
02
0,5 0,50,52
0,252
Σ 10,52
0,252
E ( P )=pf ( p )→ 0,52
=0,25=π , isto é a expectância (média) de todas as proporções amostrais,
extraídas sem reposição da população P, e é igual a proporção populacional (parâmetro
populacional π). Isto significa, que o estimador P é um estimador não tendencioso (ou não
viciado) da proporção populacional π, quando as amostras são retiradas sem reposição.
V ( P )=∑ P2 f ( p )−μP2 ↔
0,252
−0,252=0,0625 ↔π (1−π )
2∙
N−nN−1
isto é, a variância entre as proporções amostrais é “n” vezes (neste caso 2 vezes) menor que a
variância populacional multiplicada pelo factor de correcção de população finita. Este factor,
pode ser considerado como o factor de eficiência da amostragem sem reposição sobre a
amostragem com reposição que, neste exemplo, (N=4 ;n=2) vale 23
.
Evidentemente as considerações acima valem para populações pequenas. Se a população é
bastante grande ou infinita, não mais será possível pensar em construir tabelas para
representar a distribuição das proporções amostrais. Nesta situação é necessário procurar por
modelos probabilísticos que descrevam a distribuição da proporção amostral. Neste caso,
também, como declarado acima a distinção entre amostragem com e sem reposição não será
necessária, pois o factor de correcção será “aproximadamente um” e não precisará ser
utilizado.
O modelo probabilístico para a proporção amostral é dado pelo seguinte resultado:
17
a) Se ( X 1; X2 ;… Xn ) é uma amostra aleatória retirada de uma população com proporção
π,
então a distribuição da proporção amostral será aproximadamente normal com média μP=π
e desvio padrão σ P=√ π (1−π )n
Observação:
Para amostras de 30 ou mais valores, em geral, a aproximação já será suficiente boa, para se
poder utilizar este resultado. Para amostras pequenas a distribuição da proporção amostral é
Binomial.
Exemplo:
1. A proporção de eleitores do candidato D. M. A. Gogo numa certa região é de 20%.
Extraída uma amostra de 100 eleitores desta região, qual a probabilidade que ela
apresente um número de eleitores do candidato
a) Abaixo de 15%
b) Superior a 30%
Solução:
Como n>30 pode-se usar a distribuição normal com média μ=π=20 % e desvio padrão
σ P=√ π (1−π )n
↔ σ P=√ 0,2 (1−0,2 )100
=0,04=4 %
Então:
a) P ( P<15 % )=P (Z←1,25 )=ϕ (−1,25 )=10,56 %
b) P ( P>30 )=P ( Z>2,5 )=ϕ (−2,5 )=0,62%.
3. Estimação
A inferência estatística tem por objetivo fazer generalizações sobre uma população com base
em valores amostrais. A inferência pode ser feita estimando os parâmetros:
(a) Por ponto
(b) Por intervalo.
A estimação por ponto é feita através de um único valor, enquanto que a estimação por
intervalo
18
fornece um intervalo de valores em torno do valor da estimativa pontual.
Exemplo:
Uma amostra aleatória simples de 400 pessoas de uma cidade é extraída e 300 respondem
que acham a administração municipal boa ou ótima. Então o valor P=300400
=75 % é uma
estimativa por ponto do percentual de pessoas da cidade que acham a administração boa ou
óptima. Esta mesma estimativa poderia ser enunciado como de: 70 % a80 % das pessoas da
cidade acham a administração boa ou ótima. Neste caso, teríamos uma estimativa por
intervalo da proporção. Note-se que o centro do intervalo é o valor “75 %” da estimativa
pontual.
Propriedades dos estimadores
Consideremos uma população com um parâmetro de interesse θe seja (X1,X2, ...,X n) uma
amostra aleatória extraída desta população. Sendo θ um estimador do parâmetroθ, então:
(i) Se E (θ )=θ diz-se que θ é um estimador centrado, não-tendencioso ou não viciado do
parâmetro populacional θ.
(ii) Se θ é um estimador não tendencioso de um parâmetro θ , diz-se que θé consistente se à
medida que o tamanho da amostra aumenta a variabilidade do estimador diminui, isto é, as
observações vão ficando cada vez mais concentradas em torno do parâmetro na medida em
que a amostra vai ficando cada vez maior, ou seja limn → ∞
Var (θ )=0.
(iii) Um estimador θ de um parâmetro θdiz-se suficiente se transporta toda a informação da
amostra.
(iv) Um estimador θ centrado de um parâmetro q diz-se eficiente se a sua variância é
mínima.
Seja X uma variável aleatória de uma população com média μ, desvio padrão s e com uma
proporção p e seja (X1,X2, ...,X n) uma amostra aleatória simples extraída desta população.
Então:
X é um estimador centrado e consistente da média da população μ.
P é um estimador centrado e consistente da proporção populacional p.
S2 é estimador centrado e consistente da variância da população σ 2, a menos que a extracção
seja sem reposição de população finita. Neste caso, o estimador é S'2=n−1
nS2
19
Sendo X i ; i=1 ;…;n Variáveis aleatórias normais independentes então Sn=∑i=0
n
X i e
X n=∑i=0
n
X i
n
são ainda variáveis normais.
3.1 Estimação por ponto
Seja X uma população com média μ, desvio padrão σ e com uma proporção π e seja
(X 1, X1 ,…, X n) uma amostra aleatória simples extraída desta população. Então:
(a) X é um estimador não-tendencioso e consistente da média da população μ.
(b) P é um estimador não-tendencioso e consistente da proporção populacional μ.
(c) S2é estimador não-tendencioso e consistente da variância da população σ 2, a menos que a
extração seja sem reposição de população finita. Neste caso, o estimador é S2= N−1
NS2
.
Métodos para se encontrar estimadores pontuais: métodos dos momentos e método da
máxima verossimilhança
Método dos Momentos
Seja μ'ro r-ésimo momento de X. Em geral, μ'
r será uma função conhecida dos parâmetros
desconhecidos θ1 ;θ2 ;…θk
Seja m'r o r-ésimo momento amostral, isto é:m'
r=1n∑i=1
k
xir
O método dos momentos consiste em se resolver as k equações
m'r=μ'
j , j=1;2 ;3 ;…k
Observação:
O primeiro momento amostral m'1 é representado por x.
Método da Máxima Verossimilhança
Definição : Função de Verossimilhança A função de verossimilhança de n v: a: X1 ; X2 ;… Xn
é definida como sendo a densidade conjunta das n v:a:, f ( x1 ; x2 ;… xn;θ ), que é considerada
como sendo uma função de θ. Em particular, se X1 ; X2 ;… Xn é uma amostra aleatória de
uma
20
densidade f ( x ;θ ), então a função de verossimilhança é
L (θ ; x1 ; x2;… xn )=f ( x1;θ ) f ( x2 ;θ ) … f ( xn ;θ )
Estimador de verossimilhança
Seja L (θ )=L (θ ; x1; x2;… xn ) a função de verossimilhança das v:a:X1 ; X2 ;… Xn .
Se θ é o valor de θ que maximiza L (θ )então θ ( X1 ; X2 ;… Xn ) é o estimador de máxima
verossimilhança de θ e θ ( x1; x2 ;… xn ) é a estimativa de máxima verossimilhança de θpara
amostra x1; x2; …xn.
Os mais importantes que consideraremos são aqueles que X1 ; X2 ;… Xn formam uma amostra
aleatória de uma densidade f ( x ;θ )de tal modo que f ( x1 ;θ ) f ( x2 ;θ ) …f ( xn;θ ) .
Então, o estimador de máxima verossimilhança é a solução da equação dL (θ )
dθ=0
Além disso, L (θ ) e log L (θ ) possuem seus máximos para o mesmo valor de θ, e muitas vezes
é mais fácil encontrar o máximo do logaritmo da função de verossimilhança.
Se a função de verossimilhança contém k parâmetros θ1 ;θ2 ;…θk os estimadores de máxima
verossimilhança serão a solução das k-equações:
∂ L (θ1;θ2 ;…θk )∂θ1
=0∂ L (θ1;θ2 ;…θk )
∂θ2
=0
∂ L (θ1;θ2 ;…θk )∂θk
=0
3.2 Estimação por intervalo
O estimador por ponto não permite ter uma idéia do erro cometido ao se fazer a estimativa do
parâmetro. Para que se possa associar uma confiança (probabilidade) a uma estimativa é
necessário construir um intervalo em torno da estimativa por ponto. Este intervalo é
construído baseado na distribuição amostral do estimador.
4. Da média populacional
a) Desvio padrão populacional (σ ) conhecido
O intervalo de confiança para a média (μ) de uma população é construído em torno da
estimativa pontual X . Para construir este intervalo fixa-se uma probabilidade “1−α“ de que o
intervalo
21
construído contenha o parâmetro populacional. Desta forma, “α“ será a probabilidade de que
o intervalo obtido não contenha o valor do parâmetro, isto é, “α“ será a probabilidade de erro.
Sabe-se que a média da amostra tem distribuição normal de média μ e desvio padrão σ
√n
se a população de onde for extraída a amostra for normal (ou se a amostra for superior a 30 e
retirada de qualquer população ) de média μ e de desvio padrão σ , pode-se então utilizar a
curva normal para estabelecer os limites para o intervalo de confiança.
Lembrando que o que se quer é um intervalo que contenha o parâmetro populacional μ com
probabilidade “1−α “ tem-se então:
P ¿, onde Z α2 é o valor da normal padrão com área à direita é igual a
α2
.
Mas Z=
(X−μ)σ√n
substituindo na expressão acima vem:
P ¿. Trabalhando esta desigualdade, segue que:
P ¿. Que é o intervalo procurado. Assim o intervalo
de confiança (probabilidade) de “1−α “ para a média de uma população é dado por:
[X−Z α2
σ
√n; X+Z α
2
σ
√n ]onde:
X é a estimativa por ponto da média da população.
σ é o desvio padrão da população e
Z α2 é o valor da distribuição normal padrão cuja área à direita é igual a
α2
, isto é, é o valor de
Z tal que: P(Z>Z α2
)=α2 , ou então: Φ (−Z α
2 )=α2
Exemplo:
Uma população tem um desvio padrão igual a 10 e média desconhecida. Uma amostra de
tamanho
n=100 é retirada e fornece uma média X=50. Qual o intervalo de 95% de confiança para a
média desta população?.
Solução:
22
Tem-se 1−α=95 %, então α=5 % eα2=2,5 % . O coeficiente de confiança que deve ser
buscado na normal padrão é valor Z α2 de Z tal que:
P(Z>Z α2 )=2,5 %, ou então: Φ (−Z α
2 )=2,5 %.
Este valor vale 1,96. Então o intervalo de confiança de 95 % para a média desta população
será:
[X−Z α2
σ
√n; X+Z α
2
σ
√n ]=[50−1,96.1010
;50+1,96.1010 ]= [50−1,96 ;50+1,96 ]=[ 48,04 ;51,96 ],
ou seja, pode-se afirmar com uma certeza de 95 % de que este intervalo conterá
a média desta população.
Obs.: O valor ε=Z α2
σ
√n é denominado de erro padrão da estimação. Não confundir com o
valor σ
√n que é o erro padrão da amostragem. O erro padrão da estimação é a semi-amplitude
do intervalo de confiança. A amplitude do intervalo de confiança (IC) será; 2 ε.
b) Desvio padrão populacional (σ ) desconhecido
Quando o desvio padrão da população (σ ) é desconhecido é necessário utilizar sua estimativa
“s”. Só que ao substituir-se o desvio padrão populacional pelo sua estimativa no quociente:
(X−μ)σ√n
não se terá mais uma normal padrão. De fato, conforme demonstrado pelo
estatístico
inglês W. S. Gosset, conhecido por “Student” o comportamento do quociente:
(X−μ)S√n
segue uma distribuição simétrica em torno de zero, porém com uma variabilidade
maior do que a da normal padrão. A distribuição do quociente acima é conhecida como
distribuição “t” de Student.
Na realidade existem infinitas distribuições “t”, uma para cada tamanho de amostra. Estas
distribuições a exemplo da normal padrão encontram-se tabeladas.
A tabela para a distribuição “t” segue uma metodologia um pouco diferente daquela da
normal
23
padrão. De fato, como existem muitas distribuições de Student não seria possível tabelá-las
da mesma
forma que a da normal padrão. Assim cada linha de uma tabela representa uma distribuição
diferente e
cada coluna representa um valor de confiança que poderá ser “α“ ou “α2
”, isto é, a tabela
poderá ser
unilateral ou bilateral. A linha de cada tabela fornece a distribuição “t” com parâmetro “n−1”
denominado de graus de liberdade, isto é, o grau de liberdade = v=n−1=¿ linha da tabela.
Neste caso, o intervalo de confiança com probabilidade “1−α “ para a média será:
[X−t α2
S
√n; X+t α
2
S
√n ]onde:
X é a estimativa por ponto da média da população;
S é o desvio padrão da amostra e uma estimativa do desvio padrão da população σ e t α2 é o
valor da distribuição t cuja área à direita é igual a α2
, isto é, é o valor de t tal que:
P(t >t α2
)=α2 , ou então:P(−t α
2
<t< t α2
)=1−α .
Exemplo:
Uma amostra de tamanho 25 foi retirada de uma população com o objetivo de estimar a sua
média e forneceu os valores X=50 e s=10. Qual o intervalo de 95 % de confiança para a
média desta população?
Solução:
Tem-se 1−α=95 %, entãoα=5% e α2=2,5 %. O coeficiente de confiança que deve ser
buscado na distribuição t com v=n−1=25−1=24. Esta é a linha da tabela. A coluna poderá
ser o
valor α=5% ou então o valor α2=2,5 %, dependendo do tipo de tabela. Em qualquer caso o
que se procura é o valor “t” com grau de liberdade igual a 24, isto é, o valor t 24 tal que:
P(−t α2
< t24<t α2 )=95 %
Este valor vale 2,064. (Note-se que na a normal este mesmo valor valia 1,96). Então o
intervalo
24
de confiança de 95 % para a média desta população será:
[X−t α2
S
√n; X+t α
2
S
√n ]=[50−2,064.105
;50+2,064.105 ]=[ 50−4,13;50+4,13 ]= [ 45,87 ;54,13 ]
, ou seja, pode-se afirmar com uma certeza de 95 % de que este intervalo conterá a média
desta população.
Convém notar que a última linha da tabela da distribuição “t” apresenta valores coincidentes
com aqueles que seriam obtidos se fosse utilizado a distribuição normal padrão. Isto ocorre
porque a distribuição “t” tende a distribuição normal à medida que o tamanho da amostra
aumenta, isto é, a distribuição normal é o limite da distribuição “t” quando o tamanho da
amostra tende ao infinito.
Esta aproximação já será bastante boa para amostras de tamanho n>30. Assim se a amostra
for superior a 30 pode-se utilizar a distribuição normal ao invés da distribuição “t”, isto é,
pode-se ler os valores na normal padrão, ou então na última linha da tabela “t”.
5. Intervalos de confiança
Eis outra maneira de calcularmos uma estimativa de um parâmetro desconhecido. Vamos
construir um intervalo de confiança para o parâmetro desconhecido com uma probabilidade
(1−α ) %(nível de confiança) de que um intervalo contenha o verdadeiro parâmetro.
Observem que (1−α ) % pode ser igual a 99 % ;95 % ;90 % ;80 % ;etc.
Desta maneiraα será o nível de significância, isto é, o erro que estamos cometendo ao
afirmarmos que, por exemplo, 95 % das vezes o intervalo θ1<θ< θ2 contém θ será de 5 % .
Tipos de intervalos de confiança
Intervalo de confiança para a média populacional quando a variância populacional é
conhecida;
Intervalo de confiança para a média populacional quando a variância populacional é
desconhecida;
Intervalo de confiança para proporção populacional;
intervalo de confiança para a variância populacional.
25
5.1 Intervalo de confiança para a média populacional quando a variância populacional
é conhecida
a) Se a variável aleatória tem distribuição normal,isto é, X ~N ( , 2 ), o intervalo de
(1-)% de confiança para a média populacional é da forma
IC[ , (1-)%] = [Li ; Ls]
Em que,
Li = n
zX
, é o limite inferior do intervalo de confiança;
Ls =n
zX
, é o limite superior do intervalo de confiança,
sendo, z obtido através da tabela de distribuição normal padrão com média zero e variância 1.
Com o intuito de auxiliar ao estudante na obtenção do intervalo de confiança,
apresentamos a seguir uma tabela com o valor de z através da tabela normal padrão e seu
respectivo nível de confiança e significância.
Tabela de distribuição Normal Padrão
Nível de confiança Nível de significância Valor (1- )% ( )% z 99,74 0,26 3,00 99,00 1,00 2,58 95,44 4,56 2,00 95,00 5,00 1,96 90,00 10,00 1,65 85,00 15,00 1,44 80,00 20,00 1,28
Exemplo
Seja X a duração de vida de uma peça de equipamento que tem distribuição normal com
desvio padrão σ=5horas. Admita-se que 100 peças foram ensaiadas fornecendo uma
duração média de X=500 horas e que se deseje obter um intervalo de 95 % para a média
populacional μ.
Solução:
26
n=100 ; X=500 ;σ=5 ; (1−α ) %=95 % ; z=1,96
Os intervalos de confiança são:
Li=500−1,965
√100=499,02 ;
Ls=500+1,965
√100=500,98
Logo, o intervalo de 95 % de confiança para a média populacional μ é:
IC [ μ ;95 % ]=[ 499,02 ;500,98 ]
Assim, podemos dizer que 95 % das vezes, o intervalo [ 499,02 ;500,98 ] contém a verdadeira
média μ.
b) Se não conhecemos a distribuição de X , então para n>30, utilizaremos o termo central
do limite, que diz: X → N (μ;σ2
n ) , quando n → ∞.
Assim, o intervalo de (1−α ) % de confiança para a média populacionalμ é de forma
IC [μ ; (1−α ) % ]=[ Li; Ls ]
Em que:
Li=X -Zσ
√n , é o limite inferior do intervalo de confiança média populacional;
Ls=X+Zσ
√n , é o limite superior do intervalo de confiança média populacional.
5.2 Intervalo de confiança para a média populacional quando a variância populacional
é desconhecida
27
a) Se a variável aleatória tem distribuição normal,isto é, X~N( , 2 ), mas não conhecemos
a variância populacional 2 , neste caso, precisamos calcular a estimativa de 2S
(variância amostral) de 2 .
Seja 1
)(1
2
2
n
XXS
n
ii
o estimador não viciado de variância mínima de 2 .
Como X ~ ),(2
nN
e n
XZ
)1,0(~ N ,
vamos considerar a nova variável aleatória nS
Xt
=
n
X
S
=
S
Z .
Pelo teorema de Fisher (Bussab e Morettin, 2003) temos
2
2
)1(S
n ~ 2
)1( n
logo, 2
2
S
~ 1
1
n
2)1( n .
Assim, a estatística t t (n−1 ), isto é, a estatística t tem uma distribuição t−student com n−1
graus de liberdade.
Assim, o intervalo (1−α ) % de confiança par a média populacional μ é de forma
IC [μ ; (1−α ) % ]=[ Li; Ls ] em que:
Li=X −t (n−1)S
√n , é o limite inferior do intervalo de confiança média populacional;
Ls=X +t (n−1 )S
√n , é o limite superior do intervalo de confiança média populacional.
Sendo t (n−1)o valor da tabela t−student com n−1 grau de liberdade e erro α %.
Exemplo:
Suponha que se extraia uma amostra de tamanho 25 de uma população com média μ e desvio
padrão desconhecido. Suponha que a média amostral seja 4,004 e o desvio padrão amostral
seja 0,366. Determinar intervalos com 95% e 99%de confiança para μ.
Solucao:
28
Temos que t 0,025; 24=2,064
L1=4,004−2, o 64.0,366
√25=3,853
L2=4,004+2 , o 64.0,366
√25=4,155
Logo, o intervalo com 95% de confiança para μ é [3; 853; 4; 155].
Analogamente, temos que t 0,005; 24=2,797
L1=4,004−2,797.0,366
√25=3,799
L2=4,004+2,797.0,366
√25=4,209
Logo, o intervalo com 95% de confiança para μ é [3; 799; 4; 209].
29
30
b) Se não conhecemos a distribuição de X ,então, para n>30, utiliza-se o teorema central de
limite e o intervalo de (1−α ) % de confiança para a média populacional μ é da forma
IC [μ ; (1−α ) % ]=[ Li; Ls ]em que:
Li=X −t (n−1)S
√n , é o limite inferior do intervalo de confiança média populacional;
Ls=X +t (n−1 )S
√n , é o limite superior do intervalo de confiança média populacional.
5.3 Intervalo de Confiança para Proporção Populacional
Lembrando que p ))1(
,(n
pppN
quando n for grande ( n > 30).
O intervalo de ( 1-)% de confiança para a proporção populacional p é definido da seguinte
forma
IC[p , (1-)%] = [Li ; Ls ]
Em que,
Li = n
ppzp
)ˆ1(ˆˆ
, é o limite inferior do intervalo de p;
Ls = n
ppzp
)ˆ1(ˆˆ
, é o limite superior do intervalo de p,
Sendo,que z obtido através da tabela de distribuição normal padrão com média zero e
variância 1.
31
5.4 Intervalo de Confiança para a Variância Populacional
Neste caso precisamos calcular a estimativa S (desvio padrão) a partir da amostra.
Lembrando que 2
2)1(
Sn
tem distribuição 21n (qui-quadrado com n-1 graus de liberdade).
O intervalo de (1-)% de confiança para a variância populacional 2 é definido da
seguinte forma
IC[ 2 , (1-)%] = [Li ; Ls ]
Em que,
Li = 2sup
2)1(
Sn
, é o limite inferior do intervalo de 2 ;
Ls = 2inf
2)1(
Sn
, é o limite superior do intervalo de 2 ,
Sendo que, 2sup e 2
inf são os valores da tabela qui-quadrado com n-1 graus de liberdade
associados ao coeficientes /2 e 1- /2 , respectivamente.
Anexo
⇓
32
6. Distribuição amostral da diferença entre duas médias (ou distribuição de
probabilidades da diferença entre duas médias amostrais)
Considere duas amostras aleatórias
(X A 1,X A 2, ...,X A nA)
(X B1,X B2, ...,X BnB)
Com nA e nB elementos, obtidas independentemente de duas populações A e B, normalmente
distribuídas com médias μA e μBe variâncias σ A2 ¿ σ B
2=σ2 respectivamente.
Sejam:
33
X A=∑i=1
nA X A i
nA
e X B=∑i=1
nB X Bi
nB
7. Distribuição da diferença de médias amostrais
Considere duas amostras aleatórias
X A 1;X A 2; ∷: ; X A n
A
X B1;X B2 ;∷: ; X Bn
B
com nA e nB elementos, obtidas independentemente de duas populações A e B,
normalmente distribuídas com médiasμA e μB e variâncias σ A2 ¿ σ B
2=σ2
X A=∑i=1
n A
x Ai
nA
e X A=∑i=1
nB
xB i
nB
as médias respectivas das duas amostras.
Temos então que:
X A−X B N (μA−μB ,√ σ A2
n A
+σ B
2
nB
) Portanto,
( X A−X B )−(μA−μB)
√ σ A2
n A
+σ B
2
nB
N (0,1)
Temos tambem
(n A−1)s A2
σ A2 Xn A−1
2 , e(nB−1)sB
2
σ B2 XnB−1
2
Logo
(n A−1)s A2
σ A2 +
(nB−1)sB2
σB2 Xn A
2+X nA+nB−2
2
Pela definição da distribuição t-student, e considerando σ A2 ¿ σ B
2=σ2 temos que:
( X A−XB )−(μ A−μB)
√ 1nA
+ 1nB
√ (nA−1 ) sA2+(nB−1)sB
2
nA+nB−2
tn A+nB−2
Distribuicao F
Considere duas v:a: independentes Y e Z tais que Y possua uma distribuição X2 com
34
m graus de liberdade, e Z possua uma distribuição X2 com n graus de liberdade.
Suponha que uma v.a. X seja definida por
X=
YMZN
=nYmZ
Então a distribuição de X é denominada distribuição F com m e n graus de liberdade.
Propriedade da distribuição F:
Se uma variável aleatória X possui uma distribuição F com com m e n graus de liberdade,
então 1X
possui uma distribuição F com com n e m graus de liberdade.
8. Distribuição da Razão entre duas Variâncias Amostrais
Suponha que X1 ; X2 ;…; Xn formem uma amostra aleatória de m observações de
uma distribuição normal com média μ1 e variância σ 12 desconhecidos, e suponha que
Y 1 ;Y 2;…;Y nformem uma amostra aleatória de n observações de uma distribuição normal
com média μ2 e variância σ 22 desconhecidos. Sabemos que
∑i=1
m
( X i−X )2
σ 21
=(m−1)s1
2
σ 21
X2m−1
e ∑i=1
n
(Y i−Y )2
σ22
=(n−1)S2
2
σ22
X 2n−1
Logo
s12
σ21
S22
σ22
Fm−1 ,n−1 se σ 21=σ2
2 Então s1
2
S22
Fm−1 , n−1
Exemplo:
Suponha que uma amostra de tamanho 6 seja retirada de uma população normalmente
distribuída com média μ1 e variância 30, e que uma amostra de tamanho 3 seja retirada de
uma outra população normalmente distrbuída com média μ2 e variância 76. Qual é a
probabilidade de s12>s2
2 ?
Solução:
35
P(s21>s2
2¿=P( s21
s22
>1)=P(s2
1
σ 21
s22
σ22
>σ2
2
σ 21 )
Intervalo de Confiança para a Variância Populacional σ 2
Vimos que
(n−1)S2
σ2 X 2n−1
Logo, podemos determinar pela tabela da distribuição X2 com n-1 g.l., os números
X2
(1−α2 ), [n−1 ]
e X2σ2
, [n−1]
P[X2
(1−α2 ), [n−1]
≤(n−1)S2
σ2 ≤ X 2σ2
, [ n−1] ]=1−α ou seja
P[ (n−1)S2
X2σ2
, [n−1 ]
≤ σ2 ≤(n−1)S2
X2
(1−α2 ), [n−1 ] ]=1−σ , portanto o intervalo
[ (n−1)S2
X2σ2
, [n−1 ]
,(n−1)S2
X2
(1−α2 ), [ n−1] ]
é um intervalo de confiança para σ 2 com coeficiente de confiança (1−α ¿.
Exemplo:
Suponha que seja retirada uma amostra de tamanho cinco de uma população normalmente
distribuida, e que se tenha encontrado uma variância amostral de 13,52.
Construa um intervalo com 95% de confiança para a variância populacional.
Solução:
Temos que X20,975 ;4=0,48 e X2
0,025; 4=11,143. Portanto, os limites inferior e
superior do I.C. de 95% para σ 2 são:
L1=(n−1)S2
X 2σ2
, [n−1]
=4 (13,52)11,143
=4,83
L2=(n−1)S2
X2
(1−α2 ), [n−1 ]
=4 (13,52)
0,484=111,74
36
Portanto,P(4,85≤ σ2 ≤111,74 ¿=0,95
9. Intervalo de Confiança para a diferença de médias de duas Populações
Variânciasσ 21 e σ 2
2 Conhecidas
Como
X1−μ1
σ1
√n1
N (0,1) e
X2−μ2
σ2
√n2
N (0,1)
Logo
(X ¿¿1−X 2)−(μ1−μ2)
√ σ21
n1
+σ 2
2
n2
N (0,1)¿¿
Portanto o intervalo de confiança para μ1−μ2 com coeficiente de confiança 1−α é
dado por
¿
2- σ 21 e σ 2
2 Desconhecidas mas σ 21 = σ 2
2
Vimos que
(x¿¿1−x2)−(μ1−μ2)
√ 1n1
+1n2
√(n¿¿1−1)S21+
(n¿¿2−1)S22
n1+n2−2¿¿
¿
Logo, o intervalo de confiança para μ1−μ2, quando σ 21 = σ 2
2, com coeficiente de confiança 1-
α é dado por
¿
Exemplo:
37
Uma amostra de 10 lâmpadas elétricas, da marca A, apresentou a vida média de
1400 horas e desvio padrão de 120 horas. Uma amostra de 20 lâmpadas elétricas,
da marca B, apresentou a vida média de 1200 horas e o desvio padrão de 100 horas.
Supondo que σ A=σB determinar os limites de confiança de a) 95% e b) 99% para
a diferença entre as vidas médias das populações das marcas A e B.
Solução:
a) Para 1=α=0,951 tem-se que t 0,025,28=2,048 . Portanto, o I.C. de 95% para μA−μB
será:
(1400−1200 ±2,048.√ 9 (120)2+19 (100)2
28.√ 1
10+ 1
20 )=(200 ± 67,77)
Ou seja
P(108,57≤ μ A−μB ≤291,43¿=0,99
10. Intervalo de Confiança para Razão das Variânciasσ 21/σ
22
Vimos que
S21
σ22
S21
σ21
Fn2−1 ,n1−1
Logo, podemos determinar pela tabela da distribuição F com n2−1e n1−1 g.l.,
os números F(1−α2 ), [ n2−1] , [ n1−1 ]
e F α2
, [n2−1 ] , [n1−1 ] tal que:
P[F( 1−α
2 ) , [n2−1 ], [n1−1 ]≤
S22
σ21
S21
σ2
2
≤ F α2
, [n2−1 ] , [n1−1 ]] 1−α ou
P[ 1F α
2, [n2−1 ], [n1−1 ]
,S2
1
S22
≤σ 2
1
σ 22
≤ F α2
, [n2−1 ], [n1−1].
S21
S22 ] 1−α
Exemplo:
Duas máquinas A e B produzem parafusos com o mesmo tamanho médio. Duas
amostras de tamanho nA=61 enb=41 = 61 dos parafusos de A e B foram analisadas
38
e os desvios padrões amostrais foramS2A=3,5 mm e S2
B=4,5 mm. Determine um
intervalo de 95% de confiança para σ2
A
σ 2B
.
Solução:
Tem-se que F0,975,40, 60=1
F0,025,60,40
= 11,80
=O , 556 e F0,025,60,40=1,74. Logo
P[0,556.3,54,5
≤σ2
A
σ2B
≤ 1,75.3,54,5 ]=0,95
P[0,432 ≤σ 2
A
σ2B
≤ 1,353]=0,95
11. Intervalo de Confiança para uma Proporção
Admita-se que uma população é infinita e que a probabilidade de ocorrência de um evento
(denominado de sucesso) seja p. Considerem-se todas as amostras possíveis de tamanho n
extraidas da população e, para cada amostra, determinaremos a proporção p de sucessos.
Vimos que
E( p)=p
Var ( p )= p (1−p)n
Vimos tambem que para grandes valores de n, a distribuiçãop de p é uma normal, isto é
p N ( pp(1−p)
n )Portanto, o intervalo de confiança para p, com coeficiente 1−α é dado por:
( p−Z α2 √ p
p (1−p)n
p+Z α2 √ p
p (1−p)n )
Para n grande, em geral substitui-se p por p, resultando em:
P( p−Z α2 √ p(1− p)
n≤ p≤ p+Z α
2 √ p (1− p)n )=1−α
11.1 Intervalo de Confiança para Diferença de Proporções
Sejam duas proporções p1 e p2, e suas respectivas proporções amostrais p1 e p2, baseadas em
amostras de tamanhos n1 en2. Para grandes tamanhos de amostra tem-se que:
39
p1− p2 N ( p1−p2 ,p(1−p1)
n1
+p (1−p2)
n2)
Portanto, o intervalo de confiança para p1−p2 , com coeficiente de confiança 1−α é dado
por:
(( p1− p2 )± Z α2 √ p1 (1− p1 )
n1
+p2 (1− p2)
n2)
12. A distribuição qui-quadrado
A distribuição ou modelo qui-quadrado pode ser obtida de uma soma de variáveis normais
padronizadas, isto é, χ2n=∑
i=1
n
Z2i
A distribuição χ2 é assimétrica positiva (possuí uma cauda à direita) e de depende do
parâmetro
ν. Sabe-se também que:
E ( χ2 )=v e queV ( χ2 )=2 v .
A comportamento, distribuição de probabilidade, apresentado pela variância amostral (S2)
está
relacionado com a distribuição (modelo) χ2 através do seguinte resultado:
χ2n−1=
(n−1)S2
σ2 , isto é, a variância segue uma distribuição χ2 com "n−1" graus de liberdade
a
menos de uma constante. Neste casov=n−1.
Tabelas
A distribuição χ2 está tabelada em função do grau de liberdade n−1=v (linha da tabela) e
área à sua direita, isto é, P ( χ2>c )=α. Na realidade o que está tabelado é a função inversa da
χ2, isto é, entrando com o valor do parâmetro (graus de liberdade) e uma determinada
probabilidade (área), a tabela fornece um valor da variável (abscissa) tal que a probabilidade
à direita (área) deste valor seja igual a área especificada.
O intervalo
40
Suponha que seja fixado um nível de confiança de “1−α “ e que χ21 e χ2
2 sejam dois valores
da distribuição χ2 tais que P ( χ21< χ2< χ2
2 )=1−α .
P ( χ21< χ2< χ2
2 )=1−α
P( χ 21<
(n−1 ) S2
σ2 < χ22)=1−α
P( 1χ2
2
< σ2
(n−1 ) S2 <1
χ21)=1−α
P( (n−1 ) S2
χ22
<σ2<(n−1 ) S2
χ21
)=1−α
Assim o intervalo de confiança (probabilidade) de “1−α “ para a variância da população é
dado por:
[ (n−1 ) S2
χ22
;( n−1 ) S2
χ21
]Do desvio padrão populacional (σ)
Para determinar um intervalo de confiança de "1−α " de probabilidade para o desvio padrão
populacional basta apenas tomar a raiz quadrada positiva dos termos do intervalo para a
variância populacional.
Assim o intervalo será:
[√ (n−1 ) S2
χ22
;√ (n−1 ) S2
χ21
]O significado deste intervalo é:
P(√ (n−1 ) S2
χ 22
<σ<√ (n−1 ) S2
χ 21
)=1−α
Exemplo:
Uma amostra extraída de uma população normal forneceu uma variância de S2=8,38.
Determinar
um intervalo de confiança de 90 % para a variância da população e um intervalo de mesma
confiabilidade para o desvio padrão da população.
41
Solução.
Neste caso é necessário inicialmente determinar os valores da distribuição χ2, de modo, que
χ21tenha uma área (probabilidade) à direita igual a 95 % e χ2
2
tenha uma área (probabilidade) à direita igual a 5 % . Estes valores são:
χ21=3,940 e χ2
2=18,307
O intervalo de confiança, para a variância, será:
[ (n−1 ) S2
χ22
;( n−1 ) S2
χ21
][ (11−1 ) .8,38
18,307;
(11−1 ) .8,383,940 ]
[ 4,58 ;21,27 ]
O intervalo de confiança, para o desvio padrão, será:
[√ (11−1 ) .8,3818,307
;√ (11−1 ) .8,383,940 ]
[√4,58 ;√21,27 ]= [2,14 ; 4,61 ]
13. Amostragem
A inferência estatística consiste em fazer previsões a partir de uma parte para o todo,
ou seja, com base na análise de um conjunto limitado de dados (amostra) recolhidos junto de
um conjunto total de elemento (população), pretende-se caracterizar a população. A aplicação
da amostragem possui relevância pelo facto de facultar a realização de um estudo em menos
tempo em relação ao censo, visto que, somente alguns dos indivíduos são criteriosamente
abrangidos. Aliado a este facto, um estudo feito mediante as técnicas da amostragem acarreta
menos custos.
Definições
1. População - é o conjunto dos indivíduos de entre os quais se poderia escolher a amostra,
ou seja, o conjunto de elementos que possuem as características que queremos observar
(D’Hainaut, 1997).
1.1Finita - quando o número de unidades de observação pode ser contado e é limitado;
42
1.2 Infinita - quando a quantidade de unidades de observação é ilimitada
Amostra – porção ou fracção da população, retirada segundo algumas técnicas específicas,
que mantém as mesmas características da população.
Amostragem - é a operação que consiste em tomar um certo número de elementos (ou seja,
uma amostra) no conjunto dos elementos que queremos observar ou tratar (população).
Parâmetro – é uma medida associada à uma característica populacional. Assim se P é uma
população, os principais parâmetros são:
i. A média de P, anotada por μρ
ii. A variância de P, anotada por σ ρ2
iii. O desvio padrão de P, anotado por σ ρ
iv. A proporção de elementos de P que apresentam determinada característica, anotada
por: π, entre outros.
Exemplo:
Para a população P={1 ,3 ,5 , 6 } os parâmetros acima seriam:
μ=∑i=1
n
x i
N
(i) μρ=(1+3+5+6)
4=15
4=3,75
σ ρ2=
x i2
N−μ2
(ii) σ ρ2=
(1+9+25+36)4
−(3,752)2 → 17,75−14,0625=3,6875 3,69.
σ=√σ2
(iv) σ ρ = √3,69 1,92
(v) π=14
⇔25 %, onde o numerador representa o número de elementos pares na população
43
Estatística ou estimador – é uma medida associada à uma característica da amostra. São
exemplos de estimadores: média amostral, variância amostral, desvio padrão amostral e
proporção amostral. De frisar que, os estimadores são determinados a partir de fórmulas.
Estimativa – é um valor particular (número) que o estimador assume, ou seja, os resultados
de estimadores chamam-se estimativas.
14. Tamanho de uma Amostra
A qualidade e a validade dos resultados de um questionário dependem da dimensão da
amostra, ou por outras palavras, o número de pessoas/itens a interrogar depende da precisão
desejada. Num grande número de casos, mais do que aumentar simplesmente a dimensão da
amostra, o que pode levar a aumentar o número de pessoas/itens pertencentes a categorias já
suficientes, há vantagem em construir uma amostra experimental, concebida de forma exacta
em função das análises previstas, de forma a evitar amostras inutilmente grandes. A
probabilidade de que amostra seja válida, se refere ao grau de precisão das características
retidas, que portanto, determina a dimensão da amostra. Ora, remetemos apenas para as ideias
principais trata – se então, de retirar a uma população determinada fracção na qual os
diferentes caracteres possuam a frequência semelhante à da população inicial.
Um dos principais conceitos é o erro amostral tolerável, que será chamado deE0. Este erro é
o valor máximo que o pesquisador admite ter na estimativa de uma característica da
44
população. É razoável imaginar que, quanto menor o erro amostral tolerável escolhido, maior
será o tamanho da amostra necessário para obtê-lo.
Isso fica mais claro ao ver a fórmula para obtenção da primeira estimativa do tamanho de
amostra:
n0=1
E02
Onde: E0 é o erro amostral tolerável, e n0 é a primeira estimativa do tamanho de amostra. Se
o tamanho da população, N, for conhecido, podemos corrigir a primeira estimativa:
n=N × n0
N+n0
Exemplo: Obtenha o tamanho mínimo de uma amostra aleatória simples, admitindo com alto
grau de confiança um erro amostral máximo de 2%, supondo que a população tenha 200
elementos.
Sendo n0 (a primeira estimativa), e o erro amostral é 2% para ambas, podemos calculá-lo
apenas uma vez. Devemos dividir o 2% por 100 antes de substituir na fórmula:
n0=1
E02
1
(0,02)2=2500 Então, nossa primeira estimativa, para um erro amostral de 2%, é
retirar uma amostra de 2.500 elementos. Obviamente, precisamos corrigir a primeira
estimativa, pois a população conta com apenas 200 elementos. Então:
n=N × n0
N+n0
200× 2500200+2500
=185,185
Precisamos arredondar, sempre para cima, o tamanho mínimo da amostra. Então, a amostra
deverá ter pelo menos 186 elementos para garantir um erro amostral de 2%.
Determinação do tamanho de uma amostra com base na Estimativa da média
populacional
Em muitos casos é possível determinar o tamanho mínimo de uma amostra para estimar um
parâmetro estatístico, como por exemplo, a média populacionalμ A fórmula para cálculo do
tamanho da amostra para uma estimativa confiável da média populacional (μ) é dada por:
n=( Zα /2 × σE0
)2
45
Onde: n – número de indivíduos da amostra
Zα /2 é o valor crítico que corresponde ao grau de confiança desejado
σ−¿Desvio-padrão populacional da variável estudada
E0−¿Margem de erro ou erro máximo de estimativa
Zα /2=1,65→ (1−∝ )=90 %
Zα /2=1,96 → (1−∝)=95 %
Zα /2=2,0→(1−∝)=95.5%
Zα /2=2,57 →(1−∝)=99 %
Exemplo : Um economista deseja estimar a renda média para o primeiro ano de
trabalho de um Licenciado em Matemática. Quantos valores de renda devem ser
tomados, se o economista deseja ter 95% de confiança em que a média amostral esteja
a menos de 1000,00Mt da verdadeira média populacional? Suponha que saibamos,
por um estudo prévio, que para tais rendas, σ=6250,00 Mt .
Solução
Queremos determinar o tamanho n da amostra, dado que ∝ ¿0,05¿ de confiança) eZ∝ /2=1,96
Desejamos que a média amostral seja a menos de 1000,00 Mtda média populacional, de
forma que E0=1000. Supondo σ ¿6250,00 Mt, aplicando a relação acima, obtemos:
n=( Zα /2 × σE0
)2
( 1,96 ×62501000 )
2
=150,0625 ¿150
Determinação do tamanho de uma amostra com base na Estimativa da proporção
populacional
Outro parâmetro estatístico cuja determinação afecta o tamanho da amostra é a proporção
populacional. Tomemos, como exemplo, a necessidade de determinar a proporção de pessoas
atendidas por uma Unidade de Saúde, originárias do município de Quelimane. A fórmula
46
para cálculo do tamanho da amostra para uma estimativa confiável da proporção populacional
(p) é dada por:
n=Z∝/2
2 × p×q
E02
Onde: p – Proporção populacional de indivíduos que pertence a categoria que estamos
interessados em estudar.
q – Proporção populacional de indivíduos que não pertence à categoria que estamos
interessados em estudar(q=1 – p) .
E0 - Margem de erro ou erro máximo de estimativa. Identifica a diferença máxima
entre a proporção amostral e a verdadeira proporção Populacional ( p¿.
E se “p” e “q” não forem conhecidos?
A Equação anterior exige que se substituam os valores populacionais p eq e , por valores
amostrais p e q. Mas se estes também forem desconhecidos, substituímos p eq por 0,25.
(Levine, 2000):
Exemplo: Um assistente social deseja saber o tamanho da amostra n necessário para
determinar a proporção da população atendida por uma Unidade de Saúde, que pertence ao
município de Quelimane. Não foi feito um levantamento prévio da proporção amostral e,
portanto, seu valor é desconhecido. Ela quer ter 90% de confiança que sua o erro máximo de
estimativa seja de ±5% (ou 0,05) . Quantas pessoas necessitam ser entrevistadas?
Solução: Considerando que o valor da proporção amostral de atendimentos para pessoas de
Quelimane não é conhecida. Utilizamos a para determinar o tamanho da amostra. Sabemos
que, para 90% de confiança teremos o valor crítico (Za/2¿=1,65.
n=Z∝/2
2 × p×q
E02
(1,65)2× 0,25
(0,05)2 =270,6=271
Devemos, portanto, obter uma amostra de 271 pessoas para determinar a proporção da
população atendida na Unidade de Saúde, que se origina do município de Quelimane.
47
Determinação do tamanho da amostra para populações Finitas
As fórmulas para determinação do tamanho da amostra que vimos até agora trabalhavam com
a ideia de que a população de onde se retirava a amostra era tão grande, que poderíamos
considerá-la infinita. Entretanto, a maior parte das populações não é tão grande em
comparação com as amostras. Caso a amostra tenha um tamanho n maior ou igual a 5% do
tamanho da população N , considera-se que a população seja finita. Neste caso, aplica-se um
fator de correção às fórmulas vistas anteriormente e teremos as seguintes fórmulas corrigidas:
· Fórmula para determinação do tamanho da amostra n com base na estiva da média
populacional:
n=N ×σ 2×(Z∝ /2)
2
(N−1) E02+σ2 ×(Z∝/2)
2
Fórmula para determinação do tamanho da amostra n com base na estimativa da proporção
populacional:
n=N × p×q× Z∝/2
(N−1) E02+ p×q (Z∝/2)
2
15. Técnicas de Amostragem
A apresentação de uma ilação correspondente ao parâmetro está estritamente
relacionada com a margem de erro que possa ser cometida durante o estudo. Ao quantificar a
margem de erro, se torna óbvio o nível de enviesamento o que determina o índice de rigor nos
resultados. Se por exemplo, um investigador após os seus estudos afirmar que a margem de
erro que o levou a conclusão foi com a probabilidade de 3 % ,5 %ou 10 %, por outro lado, está
a informar que a credibilidade das conclusões assegura uma confiança de 97 % ,95 %ou 90 %
respectivamente. O controlo da probabilidade de erro na generalização está directamente
relacionada com a forma como a amostra foi recolhida, portanto, a primeira e a última
operação da técnica da amostragem estão directamente relacionadas. Só se pode quantificar o
erro se a amostra for recolhida de uma forma aleatória, isto é, se a probabilidade de todos os
elementos da população fazerem parte da amostra for conhecida e diferente de zero.
48
Amostragem probabilística ou aleatória
Uma amostra é dita probabilística ou aleatória se todos os elementos da população
tiverem probabilidades conhecidas e não zero de pertencer a amostra.
Amostragem aleatória simples – é o processo mais elementar aplicado a populações
homogéneas de tamanho conhecido. Todos os elementos da população têm igual
probabilidade de serem escolhidos. Para uma população finita o processo deve ser sem
reposição. Todos os elementos da população devem ser enumerados. Dos métodos existentes,
os mais usados e simples para a obtenção de uma amostragem aleatória simples consistem
em:
Método 1
Extracção de bolas enumeradas
È equivalente a um sorteio lotérico. Pode ser realizada numerando-se a população de 1 a N e
sorteando-se a seguir, por meio de um dispositivo aleatório qualquer, x números dessa
seqüência, os quais corresponderão aos elementos pertencentes à amostra.
Exemplo: Vamos obter uma amostra de 10% representativa para uma pesquisa da estatura de
80 alunos de uma escola qualquer.
1º - numeramos os alunos de 01 a 90
2º - escrevemos os números dos alunos de 01 a 80 em pedaços iguais de papel, colocamos
numa urna e após misturar, retiramos, um a um oito números que irão compor a amostra.
Método 2:
Usar uma roda semelhante à figura 1.1, que se segue
49
Figure 1 Roda
A roda deve ser desenhada numa superfície lisa e deve rodar em torno do centro. A
circunferência deve ser dividida em 10 sectores iguais e numerados: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.
Fixa-se um ponteiro, como o que está representado na figura. De cada vez que a roda girar,
ela parará e o ponteiro indicará um sector, por exemplo o 2. Cada sector (número) tem a
mesma oportunidade de sair e, como a roda não tem memória, o resultado obtido de cada vez
que a roda gira não vai afectar as tentativas seguintes. Podemos construir, assim, uma tabela
de dígitos aleatórios.
Método 3:
Usar uma tabela de números aleatórios (Consta em anexo)
A tabela de números aleatórios apresenta agrupamento de cinco dígitos e tem as linhas
numeradas, com o objectivo de facilitar na sua consulta.
Propriedades
1. Qualquer par de dígitos na tabela tem a mesma oportunidade de ser (qualquer) um dos
100 possíveis pares 00, 01, 02, 03, ..., 97, 98, 99.
2. Qualquer trio de dígitos na tabela tem a mesma oportunidade de ser um dos
1000 possíveis trios 000, 001, 002, 003, ..., 997, 998, 999.
3. E assim por adiante, para grupos de 4 ou mais dígitos da tabela.
Exemplo: Se precisarmos de uma a.a.s. de tamanho 5, de um lote de 100 iogurtes para
verificarmos contaminações bacterianas, devemos
a) Enumerar os 100 iogurtes de 00, 01, 02, ..., 99;
50
b) Escolher aleatoriamente uma linha na tabela de números aleatórios (por exemplo, a
linha 143 temos 88565, 42628, 17797, 49376…)
c) Registar os 5 grupos de dois dígitos que tenham correspondência com os números da
população: 88, 56, 54,26 e 28. Estes são os iogurtes (numerados) seleccionados para a
amostra.
Exemplo: Pretendemos uma amostra de tamanho 5 de um grupo de 300 unidades. Para
numerar as unidades da população usaremos 000, 001, 002,….. , 297, 298, 299. Ao ler na
Tabela na linha 116 (escolhida aleatoriamente), grupos de 3 dígitos, temos 144 592 605 631
424 803 716 510 362 253 504 906 118 138 167 985 ... Somente. o1 °,10 °,13 °, 14 ° e15 °
devem ser usados. Os outros números devem ser ignorados, pois não têm correspondência na
população.
Observação: Se aparecerem grupos (neste caso, de dois dígitos) repetidos, devemos ignorá-
los. Mas se a coincidência for movida pela repetição do elemento da população e não do
número aleatório, então será considerada mera coincidência sendo que o elemento deverá ser
seleccionado. Este procedimento deve ser repetido até atingir n elementos requeridos para a
amostra.
Amostragem aleatória com e sem reposição
A retirada de elementos de uma população para comporem a amostra pode ser com ou
sem reposição. Se a população for infinita então as retiradas com e sem reposição serão
equivalentes, isto é, o facto de recolocar o elemento retirado de volta na população, não vai
afectar em nada a probabilidade de extracção do elemento seguinte.
Se, no entanto, a população for finita será necessário fazer uma distinção entre os dois
procedimentos, pois a extracção com reposição as diversas retiradas serão independentes,
mas no processo sem reposição haverá dependência entre as retiradas, isto é, o facto de não
colocar o elemento retirado afecta a probabilidade do elemento seguinte ser retirado.
A amostragem sem reposição é mais eficiente e reduz a variabilidade uma vez que não é
possível um elemento mais do que uma vez. Assim se N representa o tamanho da população
e n ≤ N o tamanho da amostra, então o número de amostras possíveis e as respectivas
probabilidades de acordo com os critérios com e sem reposição será:
51
Com reposição
k=Nn; onde k representa o número de classe ; P= 1
M n
Sem reposição
k=CnN ⇔
N !n !(N−n)! P= 1
CnM
Exemplo: Considere a população P ¿{1 , 3 ,5 ,6 }. Então o número de amostras possíveis de
tamanhos n=2.
Com reposição
k=Nn, neste caso, temos N=4 e n=3, portanto, vem k=42→ k=16
Estas amostras serão:
(1 , 1);(1 , 3); (1 ,5)(1 ,6);
(3 , 3); (3 ,5);(3 , 6);(5 , 5); (5 ,6);(6 ,6);(3 ,1); (5 ,1);(6 ,1); (5 , 3);(6 ,3)e (6 ,5)
A probabilidade de cada elemento da população ser escolhido é P= 1
42
Sem reposição
Como N=4 e n=2 então o número possível de amostras será:k=C24=6
Estas amostras serão: (1 , 3)(1 , 5)(1 ,6)(3 ,5)(3 , 6)(5 , 6)
Exemplo : Quatro funcionários de uma empresa (Alberto, Marcos, Catarina, Telma, Nelson e
Judite) pretendem tirar férias no mês de Junho, mas apenas dois deles podem ir nesse
período. Determine a probabilidade de cada funcionário fazer parte da amostra e o número de
amostras possíveis.
Neste caso é evidente que se trata de uma amostragem aleatória simples e sem reposição.
Podemos proceder colocando numa caixa papeis com seis letras (cada inicial do nome dos
funcionários), assim vem: A,M,C,T.N e J. em seguida retiramos a amostra de dois daqueles
papeis.
A probabilidade de cada indivíduo pertencer a amostra é determinada pela seginte expressão:
52
P= 1
CnM
1
C26= 1
15
O número de amostras:k=CnN C2
6=15 → k=15
Amostragem aleatória sistemática
Quando os elementos da população já se encontram ordenados, não há necessidade de
construir o sistema de referência. São exemplos , os prontuários de hospitais, os prédios de
uma rua, uma lista telefônica, entre outros.
Seja N o tamanho de uma população e n a dimensão da amostra. Os elementos da população
que comporão a amostra obtêm-se a partir da:
Determinação do intervalo de amostragem (k ): k=Nn
.Quando se trata de medidas expressas
duma forma discreta é aconselhável que k seja inteiro, o que quer dizer que é susceptível de
arredondamento;
Sorteia-se usando a Tabela de Números Aleatórios de um valor compreendido entre 1 e k ;este
será o 1 ° elemento da amostra e adiante designaremos por t
d) Partindo de t , seleccionar respectivamente os elementos das posições
t ,t +k , t+2k , ... ,t +(n−1)k. Posto assim, formamos uma sequência de elementos que
estarão inclusos na amostra.
Para determinar qualquer elemento da amostra podemos usar a fórmula do termo
geral de uma P.A.a) an=a1+(n−1)k
Exemplo – Suponha uma rua com 300 casas, das quais desejamos obter uma amostra
formada por 30 casas para uma pesquisa de opinião
1º - Divide-se o tamanho da população pelo tamanho da amostra, ou seja, 30030
=10
2º - Escolhe-se por sorteio casual, um número entre 01 e10. Supondo que esse número fosse
3, a amostra seria: 3 ªcasa, 13 ª casa,23 ª casa,33 ªcasa, 43 ª casa, e assim por diante, até
completar a amostra de 30 residências.
53
Amostragem aleatória estratificada
É um processo de amostragem usado quando nos depararmos com populações
heterogéneas. Para a recolha de uma amostra estratificada há que previamente proceder à
estratificação da população, ou seja dividi-la em grupos (estratos) de tal modo que dentro de
cada estrato haja a maior uniformidade possível e, em que as diferenças entre os vários
estratos sejam tão grandes quanto possível. Estando a população classificada em estratos, a
amostra é recolhida através de amostragens aleatórias simples dentro de cada estrato.
O tamanho de amostra em cada estrato, proporcional ao tamanho do estrato em relação à
população é determinado pela seguinte relação: q i=ni
N×n;
onde: ni é o tamanho de cada estrato; N representa o tamanho da população; n é a quantidade
de elementos que comporão a amostra desejado.
∑i=1
n
qi=n
Exemplo: Vamos obter uma amostra representativa de 10 % para uma pesquisa da estatura de
80 alunos de uma escola qualquer, com 54 são meninos e 26 meninas. Qual é o número de
meninos e meninas que farão parte da amostra.
São portanto dois estratos (sexo masculino e feminino). Logo, temos:
Sexo População 10% Amostra
Masculino 54 5,4 5
Feminino 26 2,6 3
Total 80 8 8
Exercício 1: uma franquia de fast food com foco em sanduíches, apresenta lojas em todo o
mundo. Para fazer uma pesquisa de satisfação dos clientes, dividiu-se a população de lojas
em três estratos (países desenvolvidos, países em desenvolvimento e países do grupo
54
asiático). Pretende-se trabalhar com uma amostra de tamanho n=200. Com as informações a
seguir, faça o esquema de uma amostragem estratificada.
Estratos
Tamanho do estrato (no
de lojas)
q i=n i
∑i=1
n
ni
× n ;
Países desenvolvidos n1 ¿700q1=
7001390
×200 101
Países em
desenvolvimenton2 ¿420 q2=
4201390
×200 60
Países do grupo Asiático n3 ¿270q3=
2701390
×200 39
N∑i=1
n
ni=1390 n∑i=1
n
q i=200
Amostragem por conglomerado ou Agrupamentos
Quando a população apresenta uma subdivisão natural em grupos menores
(denominados conglomerados), sorteia – se um número suficiente desses grupos
(conglomerados) e todos os elementos destes vão compor a amostra. Agregados típicos são:
quarteirões, famílias, organizações, agências, edifícios, entre outros.
Exemplo: Num levantamento da população de uma cidade, podemos dispor do mapa
indicando cada quarteirão e não dispor de uma relação atualizada dos seus moradores. Pode-
se, então, colher uma amostra dos quarteirões e fazer a contagem completa de todos os que
residem naqueles quarteirões sorteados.
Amostragem por clusters
Quando se torna impraticável ou impossível construir uma lista de todos os elementos
que constituem determinada população sendo, no entanto, muito mais listar em grupos desses
mesmos elementos usa –se a mostragem por clusters. Este tipo de amostragem, consiste
quando a população se encontra dividida num reduzido número de grupos (clusters) onde, as
diferenças entre os elementos dentro de cada cluster devem ser as maiores possíveis (os
grupos deverão tanto quanto possível ser “microcosmos” da população a estudar).
Seleccionam – se aleatoriamente alguns grupos e em seguida incluem –se na amostra todos os
55
indivíduos pertencentes aos grupos seleccionados.
Exemplo: Pretende – se conhecer as atitudes dos trabalhadores da área industrial do Barreiro
sobre as suas condições de trabalho. Neste caso, é mais operacional compilar uma lista de
fábricas daquela área do que uma outra onde constem os trabalhadores nominalmente.
Portanto, a cada fábrica constitui um cluster de trabalhadores. Apenas uma parte destes
clusters (fábricas) participarão na amostra.
Finalmente serão inquiridos todos os trabalhadores que fazem parte dos clusters (fábricas)
considerados na amostra
Amostragem multi – etapas
O primeiro passo deste tipo de amostragem é idêntico ao anterior. A população
encontra – se dividida em vários grupos e seleccionam – se aleatoriamente alguns desses
grupos. No passo seguinte, também os elementos de cada grupo são aleatoriamente
escolhidos. Este processo pode multiplicar – se por mais de duas etapas se os grupos
estiverem divididos em subgrupos.
Exemplo: Num estudo de mercados internacionais foram seleccionados dois países para se
identificarem as tácticas de posicionamento a seguir para as pastas dentífricas. Em cada um
dos países escolhidos foram seleccionados cinco centros urbanos e, destes catorze
estabelecimentos comerciais. Em todas as etapas (países, centros urbanos e estabelecimentos
comerciais) as escolhas resultam de um processo aleatório.
Amostragem por conglomerado
Quando a população apresenta uma subdivisão natural em grupos menores
(denominados conglomerados), sorteia – se um número suficiente desses grupos
(conglomerados) e todos os elementos destes vão compor a amostra. Agregados típicos são:
quarteirões, famílias, organizações, agências, edifícios, etc.
Exemplo:
Amostragens não probabilísticas
56
São amostragens em que há uma escolha deliberada dos elementos amostrais. Não é
possível generalizar os resultados das pesquisas para a população, pois as amostras não-
probabilísticas não garantem a representatividade da população.
Amostragem Acidental
Trata-se de uma amostra formada por aqueles elementos que vão aparecendo e que
são possíveis de se obter até completar o tamanho da amostra. Geralmente este tipo de
amostragem é utilizado em pesquisa de opinião, em que os entrevistados são acidentalmente
escolhidos.
Exemplo: pesquisas de opinião em praças públicas, ruas movimentadas de grandes cidades.
Amostragem Intencional
São amostragens realizadas de acordo com determinado critério. Escolhe-se
intencionalmente um grupo de elementos que irão compor a amostra e intencionalmente o
investigador coleta a opinião desses elementos.
Exemplo: Numa pesquisa sobre a preferência por determinado cosmético, o pesquisador se
dirige a um grande salão de beleza e entrevista as pessoas que ali s encontram.
Amostragem por Quotas
Este é o método de amostragem mais comumente utilizado em pesquisas de
mercado e em prévias eleitorais. Ela abrange três fases:
1ª - Classificação da população em termos de propriedades que se sabe ou presume serem
relevantes para a característica a ser estudada;
2ª - Determinação da proporção da população para cada característica, com base na
constituição conhecida, presumida ou estimada da população;
57
3ª - Fixação de quotas para cada entrevistador, a quem caberá a responsabilidade de
selecionar os entrevistados, de modo que a amostra total observada ou entrevistada contenha
a proporção de cada classe, tal como determinada na 2ª fase.
Exemplo: Numa pesquisa sobre o “trabalho da mulher na actualidade”. Provavelmente se
terá interesse em considerar: a divisão, cidade e campo, a habitação, moradia, idade dos
filhos, renda média, as faixas etárias, etc.
A primeira tarefa é descobrir as proporções dessas características na população. Imagina-se
que haja 47% de homens e 53% de mulheres na população. Logo uma amostra de 50 pessoas
deverá ter 23 homens e 27 mulheres. Então o pesquisador receberá uma quota para entrevistar
27 mulheres. A consideração de várias categorias exigirá uma composição amostral que
atenda ao n determinado e às proporções populacionais estipuladas.
Amostragem Snowball
Consiste em localizar indivíduos com características desejadas ou próximas das
requeridas no estudo que se pretende fazer. A amostra vai aumentando na medida em que um
elemento da amostra da característica desejada encontre mais um com as mesmas
características. Geralmente é usado este tipo de amostragem quando se pretende estudar uma
característica específica, com a certeza de difícil localização dos possíveis constituintes da
amostra.
A maior desvantagem reside no facto de que os amigos podem se indicar, resultando numa
amostra em que todos elementos recolhidos tenham um pensamento ou respostas similares.
Exemplo: Esta amostragem é mais usada pela polícia quando pretende localizar mais
companheiros de uma quadrilha de assaltantes depois de capturar o primeiro.
Amostragem por Conveniência
É uma amostragem de uma pura coincidência, porque os elementos que possam ser
constituintes da amostra se localizam na zona onde o inquérito está a decorrer passando a
fazer parte dela por conveniência. Esta é uma das amostragens que resulta num grande
enviesamento (viciação). É muito importante ser usada quando pretendemos captar ideias
58
gerais ou identificar aspectos críticos. Neste caso deve-se ter o cuidado de não se assumir
qualquer tipo de objectividade científica.
Usualmente é denominada de amostragem de pré teste do questionário.
Amostragem pelo Método Aureolar
É um processo de sondagem que permite evitar os inconvenientes de uma base de
sondagem incompleta ou caduca. Consiste numa determinação de subconjuntos de população
por uma área geográfica. Define-se num mapa um certo número de áreas geográficas, que
podem ser constituídas por Municípios, Bairros, Quarteirões, grupos de casas. Procede-se em
seguida a uma tiragem à sorte e exploram-se por fim sistematicamente as unidades de
sondagem assim apuradas.
Amostragem Random Route
Passos a considerar para obter uma Amostra Random Route
a) Selecção de um ponto de partida através de uma listagem, mapa ou registo de endereço ou
ponto de referência da zona onde irá decorrer o estudo;
b) Definição de regras de orientação para o entrevistador. Assumimos que o inquiridor tem
uma circunscrição ou um itinerário aleatório na escolha de unidades a inquirir.
Imaginemos que queira entrevistar residentes de um certo bairro. Seria mais fácil perguntar
onde fica a igreja X. Daí pode seguir a rua em frente, virando á esquerda ou direita. Se a data
do seu nascimento for 24, a soma de 2 e 4 dá 6; pode-se procurar entrevistar naquela rua
todas casas que tenham a soma dos algarismos de seus números de casa 6, casos de 6, 15, 51,
24, 42, 33. dentro de cada casa interessa em saber que serão os indivíduos a entrevistar,
processo que pode ser fácil usando a tabela de números aleatórios ou usando amostragem
sistemática.
16. Conclusão
Além da Estatística Descritiva há a Estatística Indutiva ou Estatística Inferencial que
consiste, fundamentalmente, das técnicas de análise e interpretação dos dados. A partir de um
conjunto restrito de dados, chamado de amostra, organizado e descrito pela Estatística
59
Descritiva, a Estatística Indutiva procura fazer inferências ou, em outras palavras, tirar
conclusões sobre a natureza desses dados e estender essas conclusões a conjuntos maiores de
dados, chamados de populações.
É evidente que, para que a Estatística Indutiva possa deduzir conclusões válidas, é necessário
que se tomem alguns cuidados para a escolha da amostra a ser utilizada.
Esses cuidados, mais propriamente chamados de critérios, são estabelecidos por uma técnica
chamada de amostragem.
Contudo, para permitir que a Estatística Indutiva proporcione conclusões válidas não basta
utilizar as técnicas de organização e descrição dos dados da Estatística Descritiva e as
técnicas correctas de amostragem. Fica ainda faltando uma última ferramenta que é o cálculo
de probabilidades. O cálculo de probabilidades é um conjunto de técnicas matemáticas que
visa determinar as chances de ocorrência de eventos regidos pelas leis do acaso.
17. Referências bibliográficas
[BUS86] BUSSAB, Wilton O, MORETTIN, Pedro A. Estatística Básica. 3. ed. São Paulo,
Actual, 1986.
60
FERNANDES, Edite Manuela da G.P. Estatística Aplicada
FERREIRA, Eric Batista; OLIVEIRA, Marcelo Silva. Introdução à Estatística Básica com
R 1ª Edição. Lavras : UFLA/FAEPE, 2008,
[HOF80] HOFFMAN, Rodolfo. Estatística para Economistas. São Paulo. Livraria Pioneira
Editora, 1980.
LEVIN, Jack. Estatística Aplicada a Ciências Humanas.2a. Ed. São
LEVIN, Jack. Estatística Aplicada a Ciências Humanas.2a. Ed. São Paulo: Editora Harbra
Ltda, 1987
[MAS90] MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And
Economics. IRWIN, Boston, 1990.
[MEY78] MEYER, Paul L. Probabilidade: aplicações à Estatística. Tradução do Prof. Ruy
C. B.
[NET74] NETO, Pedro Luiz de Oliveira Costa, CYMBALISTA, Melvin. Probabilidades:
resumos teóricos, exercícios resolvidos, exercícios propostos. São Paulo, Edgard Blücher,
1974.
[NET74] NETO, Pedro Luiz de Oliveira Costa. Estatística. São Paulo, Edgard Blücher, 1977.
[STE81] STEVENSON, William J. Estatística Aplicada à Administração. São Paulo. Editora
Harbra, 1981.
[WON85] WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatística.
Rio de Janeiro. Livros Técnicos e Científicos Editora S. A., 1985.
61
ANEXOS
⇊