inferencia estatistica-recente.docx

1

1. Introdução

Até agora o que fizemos foi desenvolver modelos probabilísticos que se adequavam a

situações reais. Em particular, indicámos quando os modelos Binomial e Normal eram

adequados. Todos estes modelos se referem a distribuições, de probabilidade, que envolvem

parâmetros, que até agora foram supostos conhecidos. Para que as probabilidades associadas

a eventos sejam calculadas é necessário conhecer o valor destes parâmetros.

No estudo das probabilidades realizado até agora, o nosso objectivo era calcular a

probabilidade de acontecimentos pré-especificados, mas do ponto de vista prático é

importante poder deduzir informações, relativas a uma população, mediante a utilização de

amostras dela extraídas. Esta é a grande diferença entre Probabilidade e Estatística. No estudo

de Probabilidade estamos interessados em definir modelos que possam ser aplicados a

situações reais. Estes modelos envolvem distribuições de probabilidade totalmente

conhecidas, isto é, não apenas a forma da densidade, mas também os seus parâmetros são

conhecidos. No estudo da Estatística supõe-se que o modelo probabilístico é conhecido, isto

é, sabe-se qual a distribuição de probabilidade que modela a situação real, mas os parâmetros

desta distribuição são desconhecidos, e devem ser estimados a partir dos dados.

O objectivo principal da Inferência estatística, é estimar os parâmetros populacionais (média,

variância etc), deduzidos a partir da estatística amostral correspondente. Os mecanismos mais

usuais para "inferir" alguma coisa sobre estes parâmetros são:

Estimação pontual - o objectivo é "encontrar" os valores do parâmetro desconhecido.

Estimação por intervalos - o objectivo é encontrar um intervalo que contenha o

parâmetro de interesse com uma probabilidade especificada.

Testes de hipóteses: o objectivo é criar conjecturas sobre os valores possíveis do

parâmetro e verificar se, estas conjecturas, são muito ou pouco prováveis (isto é, testar

as hipóteses).

2

2. Distrbuição amostral

É a distribuição de probabilidade de um estimador ( ou estatística) da amostra formada

quando amostras de tamanho nsão colhidas varias vezes de uma população.

Por exemplo, se o estimador da amostra for a sua média, a distribuição será uma distribuição

amostral de médias das amostras.

Um estimador é uma característica da amostra.

Como a amostra é aleatória um estimador é uma variável aleatória. Assim tudo o que foi visto

em probabilidade sobre variáveis aleatórias, aplica-se aos estimadores. A distribuição de

probabilidade de um estimador é denominada de distribuição amostral.

Os principais estimadores são:

(I) A média da amostra, X que é um estimador da média da população: μ

(ii) A variância amostral, S2 que é um estimador da variância populacional: σ 2

(iii) A proporção amostral, P, que é um estimador amostral da proporção populacional π.

Estimativa

Uma estimativa é um valor particular de um estimador

Assim X=2 é uma estimativa. O estimador é a expressão (fórmula) enquanto que a

estimativa é o valor particular que ele assume (número).

Cálculo dos principais estimadores.

Se (X1,X2, ...,X n) é uma amostra aleatória de tamanho “n” extraída de uma população, então:

a) X=∑ X i

n é uma estimativa da média populacional quando a amostra não está

agrupada e X=∑ f i X i

né uma estimativa da média da amostra quando a amostra está

agrupada em uma distribuição de frequências (por ponto ou por valores).

3

b¿ S¿2=∑i=1

n

( X i−X )2

n−1

é uma estimativa da variância populacional quando a amostra não está

agrupada e S2=

∑i=1

n

f i ( X i−X )2

n−1

é uma estimativa da variância populacional quando a amostra

está agrupada em uma distribuição de frequências. Note-se que agora a variância é calculada

Com “n−1” no denominador. Isto se deve ao facto de que a variância for calculada com “n”

no denominador, a média de sua distribuição amostral não será igual a variância populacional

o que caracterizaria um estimador tendencioso.

Embora a variância seja calculada com “n−1” no denominador com o objectivo de que as

estimativas variem em torno do parâmetro, isto não irá ocorrer se a amostragem for sem

reposição de população finita. Neste caso é necessário utilizar, ainda, uma correcção para a

variância que consiste em multiplicá-la pelo valor N−1

N. Evidentemente esta correcção só

será necessária se a população for pequena, caso contrário o quociente acima será

aproximadamente igual a um e a correcção não precisará ser feita.

Assim se a população for finita (e pequena) e a amostragem for realizada sem reposição a

variância deverá ser calculada por:

S2= N−1N

S2

c) P= fn

, onde f é a frequência de elementos na amostra com determinada característica

é uma estimativa da proporção populacional π.

Observação:

Funções não estatísticas: ∑ X i−μ

σ ; ∑ X i

σ por conterem parâmetros desconhecidos

S2=∑i=1

n

( X i−X )2

n−1

(variância amostral corrigida, usa-se para n ≤ 30¿

ou S'2=

∑i=1

n

( X i−X )2

n

(variância amostral não corrigida, usa-se para n>30¿

4

Quais as razões que nos podem levar a preferir uma das estatísticas relativamente à

outra?

Qual o estimador preferido? S2 ou S'2?

Um critério que costuma ser aplicado é o de escolher um “bom” estimador como sendo

aquele que é centrado e que tem uma boa precisão. Escolhido um plano de amostragem,

define-se:

Estimador centrado – Um estimador diz-se centrado quando a média das estimativas

obtidas para todas as amostras possíveis que se podem extrair da População, segundo o

esquema considerado, coincide com o parâmetro a estimar. Quando se tem um estimador

centrado, também se diz que é não enviesado.

Uma das razões que nos levam a preferir o estimador S2 para a variância, relativamente a

S'2, é o facto de não apresentar enviesamento (pelo menos para o plano de amostragem que

iremos utilizar).

Aparece-nos, novamente a palavra enviesamento, mas noutro contexto. Efectivamente,

relacionado com um processo de amostragem e com escolha de um estimador, temos dois

tipos de enviesamento:

O associado com o processo de amostragem, isto é, com a recolha da amostra, em

que uma amostra enviesada é o resultado do processo de amostragem não ser

aleatório;

O associado com o estimador escolhido, para estimar o parâmetro em estudo. Se o

estimador não for centrado, diz-se que é enviesado ou não centrado.

Para se evitar qualquer tipo de “enviesamento”, é necessário estar atento:

Primeiro na escolha do plano de amostragem

E depois na escolha do estimador utilizado para estimar o parâmetro desconhecido. O

facto de utilizarmos um estimador centrado, não nos previne contra a obtenção de

más estimativas, se o plano de amostragem utilizado sistematicamente favorecer uma

parte da População (isto é, fornecer amostras enviesadas).

Por outro lado, temos que ter outra preocupação com o estimador escolhido, que diz respeito

à precisão:

Precisão - Ao utilizar o valor de uma estatística para estimar um parâmetro, temos que cada

amostra fornece um valor para a estatística que se utiliza como estimativa desse parâmetro.

5

Estas estimativas não são iguais devido à variabilidade presente na amostra. Se, no entanto,

os diferentes valores obtidos para a estatística forem próximos, e o estimador for centrado,

podemos ter confiança de que o valor calculado a partir da amostra recolhida (na prática

recolhe-se uma única amostra) está próximo do valor do parâmetro (desconhecido).

A falta de precisão e o problema do enviesamento da amostra são dois tipos de erro com

que nos defrontamos num processo de amostragem (mesmo que tenhamos escolhido um

“bom” estimador).

2.1 Distribuição amostral da média

a) Amostragem com reposição

Seja X uma variável aleatória que assume os seguintes elementos {2 ;3 ;4 ; 5 } .Vamos extrair,

aleatoriamente, com reposição, amostras de dois elementos. Então, 42 = 16 o número de

amostras possíveis, já que N = 4 e n = 2 é o processo com reposição.

(2 ;2 ) (2 ;3 ) (2 ;4 ) (2 ;5 ) (3 ;2 ) (3 ;3 ) (3 ;4 ) (3 ;5 ) (4 ;2 ) ( 4 ;3 ) (4 ;4 ) ( 4 ;5 ) (5;2 ) (5 ;3 ) (5 ;4 ) (5 ;5 )

Se calcularmos para cada amostra sua média obteremos:

( 2+22

=2); (2+32

=2,5); (2+42

=3);( 2+52

=3,5);( 3+22

=2,5);( 3+32

=3);( 3+42

=3,5);( 3+52

=4); ( 4+22

=3); ( 4+32

=3,5);( 4+42

=4);( 4+52

=4,5);( 5+22

=3,5);( 5+32

=4);( 5+42

=4,5);( 5+52

=5)A distribuição de probabilidade X é:

Média 2 2,5 3 3,5 4 4,5 5

Probabilidad

e da Média1

162

163

164

163

162

161

16

Calculamos a E ¿) e Var ¿) da seguinte maneira:

μX=E ¿) = ∑i=1

7

X i P ( X i)=3,5

Var ( X )=(∑i=1

7

X i2 P ( X i ))−¿

6

Como a população é formada pelos elementos {2 ;3 ;4 ;5 }, calculamos a média e variância

populacional:

μx=∑i=1

n

X i

n=2+3+4+5

4=14

4=3,5

Var ( X )=σ2=∑i=1

n ( X ¿¿ i−μx)2

n=1,25¿

Observando os valores acima, verificamos que as médias são iguais e a Var ( X ) é a metade da

variância da população, pois, n=2.

Dai constatamos que μX=μX e Var ( X )=Var ( X)

n=σ2

n

Será que foi coincidência o facto de que a média das médias amostrais ter coincidido com a

média populacional? E a variância de X ser igual à metade de Var ( X )?

Vamos mostrar que isso sempre acontece

Teorema

Seja X uma variável aleatória com média μX e variância σ 2 e seja (X1,X2, ...,X n), uma

amostra aleatória simples, então, se X =∑i=1

n X i

n , temos os E ( X )=μX e Var ( X )=σ 2

n

Teorema 1

Teorema: Consideremos uma amostra aleatória, (X1,X2, ...,X n), de distribuição N ( μ;σ2 ). A

média amostral X =∑i=1

n X i

n segue uma distribuição N (μ;

σ2

n ).Este teorema pode ser generalizado para uma amostra aleatória de uma distribuição qualquer.

Teorema2

Teorema: Consideremos uma amostra aleatória, (X1,X2, ...,X n), de uma distribuição qualquer

tal que E ( X i)=μ e Var ( X i )=σ2. Seja X a média amostral. Então:

1. E ( X )=μ

7

2. Var ( X )=σ 2

n

3. Se n é grande, pelo teorema central do limite, podemos concluir que X−μ

σ√n ∩

°

N ( 0;1 )

Nota: Neste caso, nada é dito a respeito da distribuição de X . Apenas a sua média e variância

são conhecidas, e são funções da média e variância de cada X i. A princípio a distribuição de

Xpoderia ser “uma coisa estranha”, que nada tem a ver com a distribuição original de cada X i

. No entanto, se o tamanho da amostra é grande n>30 podemos concluir que a distribuição de

X , é aproximadamente N (0 ;1 ).

Teorema 3: Consideremos uma amostra aleatória, (X1,X2, ...,X n) , de distribuição N ( μ ;σ2 ).

Seja S2 a variância amostral dada por S2=

∑i=1

n

( X i−X )2

n−1

. Então (n−1 ) S2

σ 2 = ∑i=1

n

( X i−X )2

σ 2

tem

distribuição Qui-quadrado com (n−1) graus de liberdade.

A partir deste teorema podemos deduzir facilmente a média e variância de s2.

Teorema 4: Consideremos uma amostra aleatória, (X1,X2, ...,X n) , de distribuição N ( μ ;σ2 ) .

Seja S2 a variância amostral. Então E ( S2 )=σ2 e Var (S2 )= 2 σ4

n−1

Os mecanismos mais usuais para "inferir" alguma coisa sobre estes parâmetros são:

Estimação pontual - o objectivo é "encontrar" os valores do parâmetro desconhecido.

Estimação por intervalos - o objectivo é encontrar um intervalo que contenha o

parâmetro de interesse com uma probabilidade especificada.

Testes de hipóteses - o objectivo é criar conjecturas sobre os valores possíveis do

parâmetro e verificar se, estas conjecturas, são muito ou pouco prováveis (isto é, testar

as hipóteses).

b) Amostragem sem reposição

8

Considere-se a população P= {1 ;3 ;5 ;6 } e todas as amostras possíveis de tamanho n=2

extraídas sem reposição.

As possíveis amostras com as respectivas médias são:

Amostra

s (1;3) 1;5) (1;6) (3;5) (3;6) (5;6)

Média 2 3 3,5 4 4,5 5,5

Colocando estes resultados em uma tabela (distribuição amostral da média) vem:

X f ( X )=P ( X=X ) X f ( X ) X2 f ( X )

216

26

46

316

36

96

3,516

3,56

12,256

416

46

166

4,516

4,56

20,256

5,516

5,56

30,256

Σ 122,5

691,75

6

Da tabela segue:

E ( X )=∑ X f ( X )→ E ( X )=22,256

=3,75=μ isto é a expectância (média) de todas as médias

amostrais, extraídas sem reposição da população P, também é igual a média populacional

(parâmetro populacional média).

V ( X )=∑ X2 f ( X )−μ2X →V ( X )=91,75

6−3,752→ V ( X )=1,2292 ↔

σ 2

2N−nN−1

=1,84375.( 23 )

isto é, a variância entre as médias amostrais é “n” vezes (neste caso 2 vezes) menor que a

variância populacional multiplicada pelo factor de correcção de população finita. Este factor,

pode ser considerado como o factor de eficiência da amostragem sem reposição sobre a

9

amostragem com reposição, que neste caso ( N=4 e n=2 ) vale 23

. Como na amostragem sem

reposição não é possível retirar o mesmo elemento duas vezes, as médias não podem assumir

valores tão extremos, como por exemplo, o valor “um” ou “seis” que assumiram na

amostragem com reposição. Isto faz com que a erro padrão na amostragem sem reposição

seja menor do que na amostragem com reposição.

O factor de redução da variância na amostragem sem reposição é: N−nN−1

Pode-se perceber facilmente que quanto maior for a diferença entre o tamanho da população e

o tamanho da amostra mais próximo de “um” será este factor. Então, como regra prática,

pode-se admitir como necessária a correcção para a variância das médias amostrais sempre

que o tamanho da amostra exceder a 5% do tamanho da população. Caso isto não ocorra não

é necessário fazer-se a distinção entre os dois procedimentos (com e sem reposição).

Evidentemente as considerações acima valem para populações pequenas. Se a população é

bastante grande ou infinita, não mais será possível pensar em construir tabelas para

representar a distribuição das médias amostrais. Neste caso é necessário procurar por

modelos probabilísticos que descrevam a distribuição da média amostral. Neste caso,

também, como declarado acima a distinção entre amostragem com e sem reposição não será

necessário, pois o factor de correcção será “aproximadamente um” e não necessitará ser

utilizado.

Os modelos probabilísticos são conhecidos a partir dos dois seguintes resultados:

a) Se ( X 1; X2 ;… Xn ) é uma amostra aleatória de uma população com distribuição

normal de média μ e desvio padrão σ , então a média da amostra ( X )terá uma

distribuição também normal com a mesma média da população e com desvio padrão

(erro padrão) raiz de “n” vezes menor que o desvio padrão da população, isto é:

Se Xé N ( μ ;σ ) então, X será N (μ;σ

√n )

b) Teorema Central do Limite

Se ( X 1; X2 ;… Xn ) é uma amostra aleatória extraída de uma população com qualquer

distribuição de média μ e desvio padrão σ , então a média da amostra ( X ) terá uma

distribuição aproximadamente normal com a mesma média da população e com desvio

10

padrão (erro padrão) raiz de “n” vezes menor que o desvio padrão da população à medida que

o tamanho da amostra aumenta.

Observação: Para amostras de 30 ou mais valores, em geral, a aproximação já será suficiente

boa, para se poder utilizar este resultado.

Assim:

Se X tem qualquer distribuição então X terá uma distribuição aproximadamente N (μ;σ

√n ) para ngrande (n≥ 30 ).

Exemplos:

1. Uma população X tem uma distribuição normal de média 100 e desvio padr ã o10 .

a) Qual P (95< X<105 )?

(b) Se X é a média de 16 elementos extraída desta população, qual aP (95< X<105 )?

Solução:

Como Xé uma N (100 ;10 ), vem:

a) P (95< X<105 )=P (−0,5<Z<0,5 ) ↔ ϕ (0,5 )−ϕ (−0,5 )=0,6915−0,3185=38,30 %.

Neste caso, X é uma N (100 ;2,5 ).

b) P (95< X<105 )=P (−2<Z<2 )↔ ϕ (2 )−ϕ (−2 )=0,9772−0,0228=95,44 % .

2. A renda de um conjunto de pessoas de uma certa região tem média 6 s .me desvio padrão

de 2 s .m. Se desta população for extraída uma amostra de n=100pessoas, qual a

probabilidade de a média desta amostra acuse um valor superior a 6,3 s . m?

Solução:

Neste caso, como não foi declarado que a população é normal é necessário aplicar o teorema

central do limite, uma vez que n=100>30, isto é possível. A média da amostra terá uma

distribuição aproximadamente normal com média 6 s .m e desvio padrão de: 2

√100=0,2, uma

vez que o erro padrão da média é raiz de n vezes menor do que o desvio padrão populacional.

Então, a probabilidade pedida será:

11

P ( X>6,3 )=P(Z>( 6,3−60,2 ))→ P (Z>1,5 )=ϕ (−1,5 )=6,68 % Isto é, apenas 6,68% das médias

de amostras de tamanho n=100 apresentarão um valor superior a 6,3 s . m.

2.2 Distribuição amostral da variância


Considere-se a população P={1;3 ;5 ;6 } e todas as amostras possíveis de tamanho n=2

extraídas com reposição. Para cada amostra vai-se calcular a variância. Ter-se-á assim um

conjunto de 16 valores que serão dispostos em uma tabela, com as respectivas probabilidades,

e que constituirá então a distribuição amostral da variância.

As possíveis amostras com as respectivas variâncias são:

Amostra

s (1;1) (1;3) (1;5) (1;6) (3;1) (3;3) (3;5) (3;6)

Médias 1 2 3 3,5 2 3 4 4,5

S2 0 2 8 12,5 2 0 2 4,5

Amostra

s (5;1) (5;3) (5;5) (5;6) (6;1) (6;3) (6;5) (6;6)

Médias 3 4 5 5,5 3,5 4,5 5,5 6

S2 8 2 0 0,5 12,5 4,5 0,5 0

Colocando estes resultados em uma tabela (distribuição amostral da variância) vem:

S2 f ( S2 )=P (S2=S2 ) S2 f ( S2 )

04

160

16

0,52

161

16

24

168

16

12

4,52

169

16

82

161616

12,52

162516

Σ 15916

Pela tabela segue que:

E ( S2 )=∑ S2 f (S2 ) ↔ 5916

=3,6875=σ2, isto é a expectância (média) de todas as variâncias das

amostras de tamanho n=2, extraídas com reposição da população P, é igual a variância

populacional

(parâmetro populacional variância). Em outras palavras, pode-se dizer que quando a

amostragem é com reposição a variância amostral S2é um estimador não tendencioso da

variância populacional σ 2 .

Desta forma, sempre que se desejar estimar a variância de uma população onde as amostras

foram retiradas com reposição, pode-se usar a variância amostral como estimador.

b) Amostragem sem reposição


obtidas sem reposição.

As possíveis amostras com as respectivas variâncias são:

Amostra

s (1;3) (1;5) (1;6) (3;5) (3;6) (5;6)

Médias 2 3 3,5 4 4,5 5,5

S2 2 8 12,5 2 4,5 0,5

Colocando estes resultados em uma tabela (distribuição amostral da variância) vem:

13

S2 f ( S2 )=P (S2=S2 ) S2 f ( S2 )

0,51

160,56

226

46

4,516

4,56

816

86

12,516

12,56

Σ 129,5

6

E=Σ S2 f ( S2 ) → E=29,56

≠ 3,6875=σ2 isto é a expectância (média) de todas as variâncias das

amostras de tamanho n=2, extraídas sem reposição da população finita P, não é igual a

variância populacional (parâmetro populacional variância). Neste caso, para que se obtenha

um estimador não tendencioso da variância populacional é necessário corrigir a variância

amostral através do factor N−1

N . Assim se cada variância acima for multiplicada por este

factor, que neste caso será, N−1N=3

4

=0,75 então, se terá:

S2 f ( S2 )=P (S2= S2 ) S2 f ( S2 )

0,37516

0,3756

1,50026

3,0006

3,37516

3,3756

6,00016

6,0006

9,37516

9,3756

14

Σ 122,125

6

E ( S2 )=∑ S2 f (S2 ) → 22,1256

=3,6875=σ2 isto é a expectância (média) de todas as variâncias

corrigidas é igual ao parâmetro populacional σ2. Assim quando a população é pequena e

amostragem for sem reposição é necessário corrigir a variância da amostra pelo factor N−1

N,

para que ela seja um bom estimador da variância populacional. É claro que esta correcção só

será importante para populações pequenas. Se a população for grande, por exemplo,N=1000

, então o factor N−1

N=9991000

=0,999o que é aproximadamente 1. Neste caso, não é necessário

usar esta correção e a amostragem sem reposição pode ser considerada equivalente a com

reposição para efeitos de estimação da variância populacional.



representar a distribuição das variâncias amostrais. Neste caso é necessário procurar por

modelos probabilísticos (funções) que descrevam a distribuição da variância amostral. Para a

variância este modelo existe e é denominado de distribuição Qui-quadrado ( χ2 ).

2.3 Distribuição amostral da proporção



obtidas com reposição. Para cada amostra vai-se calcular a proporção P de elementos pares

na população.

Ter-se-á assim um conjunto de 16 valores que serão dispostos em uma tabela, com as

respectivas probabilidades, e que formarão então a distribuição amostral da proporção.

As possíveis amostras com as respectivas proporções são:

Amostra

s (1;1) (1;3) (1;5) (1;6) (3;3) (3;5) (3;6) (5;5)

P 0 0 0 0,5 0 0 0,5 0

Amostra

s (5;6) (6;6) (3;1) (5;1) (6;1) (5;3) (6;3) (6;5)

15

P 0,5 1 0 0 0,5 0 0,5 0,5

Colocando estes resultados em uma tabela (distribuição amostral da proporção) vem:

P f ( P )=P (P=p ) Pf (P ) P2 f ( P )

0,09

160

160

16

0,56

163

161,516

11

161

161

16

Σ 14

162,516

Pode-se então calcular a expectância e a variância:

E ( P )=∑ pf ( p ) → 416

=0,25=π, isto é o valor esperado (média) de todas as proporções

amostrais, extraídas com reposição da população P, e é igual a proporção populacional

(parâmetro populacional π). Isto significa, que o estimador P é um estimador não

tendencioso (ou não viciado) da proporção populacional π, quando as amostras são extraídas

com reposição da população.

V ( P )=∑ P2 f ( p )−μ p2→

2,516

−0,252=0,09375=π (1−π )

n isto é, a variância entre as

proporções amostrais é “n” vezes (neste caso 2 vezes) menor que a variância populacional.

Isto porque quando se está trabalhando com proporções, pode-se mostrar que a variância

populacional é igual a π (1−π ).

O valor σ P=√ π (1−π )n

=0,09375 é denominado erro padrão da proporção. Ele mede a

variabilidade entre as proporções amostrais e dá uma ideia do erro que se comete ao se

substituir a proporção da população pela proporção da amostra.

Amostragem sem reposição


extraídas sem reposição.

As possíveis amostras com as respectivas proporções são:

16

Amostra

s (1;3) (1;5) (1;6) (3;5) (3;6) (5;6)

P 0 0 0,5 0 0,5 0,5

Colocando estes resultados em uma tabela (distribuição amostral da proporção) vem:

P f ( P )=P (P=p ) Pf (P ) P2 f ( P )

0 0,502

02

0,5 0,50,52

0,252

Σ 10,52

0,252

E ( P )=pf ( p )→ 0,52

=0,25=π , isto é a expectância (média) de todas as proporções amostrais,

extraídas sem reposição da população P, e é igual a proporção populacional (parâmetro

populacional π). Isto significa, que o estimador P é um estimador não tendencioso (ou não

viciado) da proporção populacional π, quando as amostras são retiradas sem reposição.

V ( P )=∑ P2 f ( p )−μP2 ↔

0,252

−0,252=0,0625 ↔π (1−π )

2∙

N−nN−1

isto é, a variância entre as proporções amostrais é “n” vezes (neste caso 2 vezes) menor que a

variância populacional multiplicada pelo factor de correcção de população finita. Este factor,

pode ser considerado como o factor de eficiência da amostragem sem reposição sobre a

amostragem com reposição que, neste exemplo, (N=4 ;n=2) vale 23

.



representar a distribuição das proporções amostrais. Nesta situação é necessário procurar por

modelos probabilísticos que descrevam a distribuição da proporção amostral. Neste caso,

também, como declarado acima a distinção entre amostragem com e sem reposição não será

necessária, pois o factor de correcção será “aproximadamente um” e não precisará ser

utilizado.

O modelo probabilístico para a proporção amostral é dado pelo seguinte resultado:

17

a) Se ( X 1; X2 ;… Xn ) é uma amostra aleatória retirada de uma população com proporção

π,

então a distribuição da proporção amostral será aproximadamente normal com média μP=π

e desvio padrão σ P=√ π (1−π )n

Observação:

Para amostras de 30 ou mais valores, em geral, a aproximação já será suficiente boa, para se

poder utilizar este resultado. Para amostras pequenas a distribuição da proporção amostral é

Binomial.

Exemplo:

1. A proporção de eleitores do candidato D. M. A. Gogo numa certa região é de 20%.

Extraída uma amostra de 100 eleitores desta região, qual a probabilidade que ela

apresente um número de eleitores do candidato

a) Abaixo de 15%

b) Superior a 30%

Solução:

Como n>30 pode-se usar a distribuição normal com média μ=π=20 % e desvio padrão

σ P=√ π (1−π )n

↔ σ P=√ 0,2 (1−0,2 )100

=0,04=4 %

Então:

a) P ( P<15 % )=P (Z←1,25 )=ϕ (−1,25 )=10,56 %

b) P ( P>30 )=P ( Z>2,5 )=ϕ (−2,5 )=0,62%.

3. Estimação

A inferência estatística tem por objetivo fazer generalizações sobre uma população com base

em valores amostrais. A inferência pode ser feita estimando os parâmetros:

(a) Por ponto

(b) Por intervalo.

A estimação por ponto é feita através de um único valor, enquanto que a estimação por

intervalo

18

fornece um intervalo de valores em torno do valor da estimativa pontual.

Exemplo:

Uma amostra aleatória simples de 400 pessoas de uma cidade é extraída e 300 respondem

que acham a administração municipal boa ou ótima. Então o valor P=300400

=75 % é uma

estimativa por ponto do percentual de pessoas da cidade que acham a administração boa ou

óptima. Esta mesma estimativa poderia ser enunciado como de: 70 % a80 % das pessoas da

cidade acham a administração boa ou ótima. Neste caso, teríamos uma estimativa por

intervalo da proporção. Note-se que o centro do intervalo é o valor “75 %” da estimativa

pontual.

Propriedades dos estimadores

Consideremos uma população com um parâmetro de interesse θe seja (X1,X2, ...,X n) uma

amostra aleatória extraída desta população. Sendo θ um estimador do parâmetroθ, então:

(i) Se E (θ )=θ diz-se que θ é um estimador centrado, não-tendencioso ou não viciado do

parâmetro populacional θ.

(ii) Se θ é um estimador não tendencioso de um parâmetro θ , diz-se que θé consistente se à

medida que o tamanho da amostra aumenta a variabilidade do estimador diminui, isto é, as

observações vão ficando cada vez mais concentradas em torno do parâmetro na medida em

que a amostra vai ficando cada vez maior, ou seja limn → ∞

Var (θ )=0.

(iii) Um estimador θ de um parâmetro θdiz-se suficiente se transporta toda a informação da

amostra.

(iv) Um estimador θ centrado de um parâmetro q diz-se eficiente se a sua variância é

mínima.

Seja X uma variável aleatória de uma população com média μ, desvio padrão s e com uma

proporção p e seja (X1,X2, ...,X n) uma amostra aleatória simples extraída desta população.

Então:

X é um estimador centrado e consistente da média da população μ.

P é um estimador centrado e consistente da proporção populacional p.

S2 é estimador centrado e consistente da variância da população σ 2, a menos que a extracção

seja sem reposição de população finita. Neste caso, o estimador é S'2=n−1

nS2

19

Sendo X i ; i=1 ;…;n Variáveis aleatórias normais independentes então Sn=∑i=0

n

X i e

X n=∑i=0

n

X i

n

são ainda variáveis normais.

3.1 Estimação por ponto

Seja X uma população com média μ, desvio padrão σ e com uma proporção π e seja

(X 1, X1 ,…, X n) uma amostra aleatória simples extraída desta população. Então:

(a) X é um estimador não-tendencioso e consistente da média da população μ.

(b) P é um estimador não-tendencioso e consistente da proporção populacional μ.

(c) S2é estimador não-tendencioso e consistente da variância da população σ 2, a menos que a

extração seja sem reposição de população finita. Neste caso, o estimador é S2= N−1

NS2

.

Métodos para se encontrar estimadores pontuais: métodos dos momentos e método da

máxima verossimilhança

Método dos Momentos

Seja μ'ro r-ésimo momento de X. Em geral, μ'

r será uma função conhecida dos parâmetros

desconhecidos θ1 ;θ2 ;…θk

Seja m'r o r-ésimo momento amostral, isto é:m'

r=1n∑i=1

k

xir

O método dos momentos consiste em se resolver as k equações

m'r=μ'

j , j=1;2 ;3 ;…k

Observação:

O primeiro momento amostral m'1 é representado por x.

Método da Máxima Verossimilhança

Definição : Função de Verossimilhança A função de verossimilhança de n v: a: X1 ; X2 ;… Xn

é definida como sendo a densidade conjunta das n v:a:, f ( x1 ; x2 ;… xn;θ ), que é considerada

como sendo uma função de θ. Em particular, se X1 ; X2 ;… Xn é uma amostra aleatória de

uma

20

densidade f ( x ;θ ), então a função de verossimilhança é

L (θ ; x1 ; x2;… xn )=f ( x1;θ ) f ( x2 ;θ ) … f ( xn ;θ )

Estimador de verossimilhança

Seja L (θ )=L (θ ; x1; x2;… xn ) a função de verossimilhança das v:a:X1 ; X2 ;… Xn .

Se θ é o valor de θ que maximiza L (θ )então θ ( X1 ; X2 ;… Xn ) é o estimador de máxima

verossimilhança de θ e θ ( x1; x2 ;… xn ) é a estimativa de máxima verossimilhança de θpara

amostra x1; x2; …xn.

Os mais importantes que consideraremos são aqueles que X1 ; X2 ;… Xn formam uma amostra

aleatória de uma densidade f ( x ;θ )de tal modo que f ( x1 ;θ ) f ( x2 ;θ ) …f ( xn;θ ) .

Então, o estimador de máxima verossimilhança é a solução da equação dL (θ )

dθ=0

Além disso, L (θ ) e log L (θ ) possuem seus máximos para o mesmo valor de θ, e muitas vezes

é mais fácil encontrar o máximo do logaritmo da função de verossimilhança.

Se a função de verossimilhança contém k parâmetros θ1 ;θ2 ;…θk os estimadores de máxima

verossimilhança serão a solução das k-equações:

∂ L (θ1;θ2 ;…θk )∂θ1

=0∂ L (θ1;θ2 ;…θk )

∂θ2

=0

∂ L (θ1;θ2 ;…θk )∂θk

=0

3.2 Estimação por intervalo

O estimador por ponto não permite ter uma idéia do erro cometido ao se fazer a estimativa do

parâmetro. Para que se possa associar uma confiança (probabilidade) a uma estimativa é

necessário construir um intervalo em torno da estimativa por ponto. Este intervalo é

construído baseado na distribuição amostral do estimador.

4. Da média populacional

a) Desvio padrão populacional (σ ) conhecido

O intervalo de confiança para a média (μ) de uma população é construído em torno da

estimativa pontual X . Para construir este intervalo fixa-se uma probabilidade “1−α“ de que o

intervalo

21

construído contenha o parâmetro populacional. Desta forma, “α“ será a probabilidade de que

o intervalo obtido não contenha o valor do parâmetro, isto é, “α“ será a probabilidade de erro.

Sabe-se que a média da amostra tem distribuição normal de média μ e desvio padrão σ

√n

se a população de onde for extraída a amostra for normal (ou se a amostra for superior a 30 e

retirada de qualquer população ) de média μ e de desvio padrão σ , pode-se então utilizar a

curva normal para estabelecer os limites para o intervalo de confiança.

Lembrando que o que se quer é um intervalo que contenha o parâmetro populacional μ com

probabilidade “1−α “ tem-se então:

P ¿, onde Z α2 é o valor da normal padrão com área à direita é igual a

α2

.

Mas Z=

(X−μ)σ√n

substituindo na expressão acima vem:

P ¿. Trabalhando esta desigualdade, segue que:

P ¿. Que é o intervalo procurado. Assim o intervalo

de confiança (probabilidade) de “1−α “ para a média de uma população é dado por:

[X−Z α2

σ

√n; X+Z α

2

σ

√n ]onde:

X é a estimativa por ponto da média da população.

σ é o desvio padrão da população e

Z α2 é o valor da distribuição normal padrão cuja área à direita é igual a

α2

, isto é, é o valor de

Z tal que: P(Z>Z α2

)=α2 , ou então: Φ (−Z α

2 )=α2

Exemplo:

Uma população tem um desvio padrão igual a 10 e média desconhecida. Uma amostra de

tamanho

n=100 é retirada e fornece uma média X=50. Qual o intervalo de 95% de confiança para a

média desta população?.

Solução:

22

Tem-se 1−α=95 %, então α=5 % eα2=2,5 % . O coeficiente de confiança que deve ser

buscado na normal padrão é valor Z α2 de Z tal que:

P(Z>Z α2 )=2,5 %, ou então: Φ (−Z α

2 )=2,5 %.

Este valor vale 1,96. Então o intervalo de confiança de 95 % para a média desta população

será:

[X−Z α2

σ

√n; X+Z α

2

σ

√n ]=[50−1,96.1010

;50+1,96.1010 ]= [50−1,96 ;50+1,96 ]=[ 48,04 ;51,96 ],

ou seja, pode-se afirmar com uma certeza de 95 % de que este intervalo conterá

a média desta população.

Obs.: O valor ε=Z α2

σ

√n é denominado de erro padrão da estimação. Não confundir com o

valor σ

√n que é o erro padrão da amostragem. O erro padrão da estimação é a semi-amplitude

do intervalo de confiança. A amplitude do intervalo de confiança (IC) será; 2 ε.

b) Desvio padrão populacional (σ ) desconhecido

Quando o desvio padrão da população (σ ) é desconhecido é necessário utilizar sua estimativa

“s”. Só que ao substituir-se o desvio padrão populacional pelo sua estimativa no quociente:

(X−μ)σ√n

não se terá mais uma normal padrão. De fato, conforme demonstrado pelo

estatístico

inglês W. S. Gosset, conhecido por “Student” o comportamento do quociente:

(X−μ)S√n

segue uma distribuição simétrica em torno de zero, porém com uma variabilidade

maior do que a da normal padrão. A distribuição do quociente acima é conhecida como

distribuição “t” de Student.

Na realidade existem infinitas distribuições “t”, uma para cada tamanho de amostra. Estas

distribuições a exemplo da normal padrão encontram-se tabeladas.

A tabela para a distribuição “t” segue uma metodologia um pouco diferente daquela da

normal

23

padrão. De fato, como existem muitas distribuições de Student não seria possível tabelá-las

da mesma

forma que a da normal padrão. Assim cada linha de uma tabela representa uma distribuição

diferente e

cada coluna representa um valor de confiança que poderá ser “α“ ou “α2

”, isto é, a tabela

poderá ser

unilateral ou bilateral. A linha de cada tabela fornece a distribuição “t” com parâmetro “n−1”

denominado de graus de liberdade, isto é, o grau de liberdade = v=n−1=¿ linha da tabela.

Neste caso, o intervalo de confiança com probabilidade “1−α “ para a média será:

[X−t α2

S

√n; X+t α

2

S

√n ]onde:

X é a estimativa por ponto da média da população;

S é o desvio padrão da amostra e uma estimativa do desvio padrão da população σ e t α2 é o

valor da distribuição t cuja área à direita é igual a α2

, isto é, é o valor de t tal que:

P(t >t α2

)=α2 , ou então:P(−t α

2

<t< t α2

)=1−α .

Exemplo:

Uma amostra de tamanho 25 foi retirada de uma população com o objetivo de estimar a sua

média e forneceu os valores X=50 e s=10. Qual o intervalo de 95 % de confiança para a

média desta população?

Solução:

Tem-se 1−α=95 %, entãoα=5% e α2=2,5 %. O coeficiente de confiança que deve ser

buscado na distribuição t com v=n−1=25−1=24. Esta é a linha da tabela. A coluna poderá

ser o

valor α=5% ou então o valor α2=2,5 %, dependendo do tipo de tabela. Em qualquer caso o

que se procura é o valor “t” com grau de liberdade igual a 24, isto é, o valor t 24 tal que:

P(−t α2

< t24<t α2 )=95 %

Este valor vale 2,064. (Note-se que na a normal este mesmo valor valia 1,96). Então o

intervalo

24

de confiança de 95 % para a média desta população será:

[X−t α2

S

√n; X+t α

2

S

√n ]=[50−2,064.105

;50+2,064.105 ]=[ 50−4,13;50+4,13 ]= [ 45,87 ;54,13 ]

, ou seja, pode-se afirmar com uma certeza de 95 % de que este intervalo conterá a média

desta população.

Convém notar que a última linha da tabela da distribuição “t” apresenta valores coincidentes

com aqueles que seriam obtidos se fosse utilizado a distribuição normal padrão. Isto ocorre

porque a distribuição “t” tende a distribuição normal à medida que o tamanho da amostra

aumenta, isto é, a distribuição normal é o limite da distribuição “t” quando o tamanho da

amostra tende ao infinito.

Esta aproximação já será bastante boa para amostras de tamanho n>30. Assim se a amostra

for superior a 30 pode-se utilizar a distribuição normal ao invés da distribuição “t”, isto é,

pode-se ler os valores na normal padrão, ou então na última linha da tabela “t”.

5. Intervalos de confiança

Eis outra maneira de calcularmos uma estimativa de um parâmetro desconhecido. Vamos

construir um intervalo de confiança para o parâmetro desconhecido com uma probabilidade

(1−α ) %(nível de confiança) de que um intervalo contenha o verdadeiro parâmetro.

Observem que (1−α ) % pode ser igual a 99 % ;95 % ;90 % ;80 % ;etc.

Desta maneiraα será o nível de significância, isto é, o erro que estamos cometendo ao

afirmarmos que, por exemplo, 95 % das vezes o intervalo θ1<θ< θ2 contém θ será de 5 % .

Tipos de intervalos de confiança

Intervalo de confiança para a média populacional quando a variância populacional é

conhecida;

Intervalo de confiança para a média populacional quando a variância populacional é

desconhecida;

Intervalo de confiança para proporção populacional;

intervalo de confiança para a variância populacional.

25

5.1 Intervalo de confiança para a média populacional quando a variância populacional

é conhecida

a) Se a variável aleatória tem distribuição normal,isto é, X ~N ( , 2 ), o intervalo de

(1-)% de confiança para a média populacional é da forma

IC[ , (1-)%] = [Li ; Ls]

Em que,

Li = n

zX

, é o limite inferior do intervalo de confiança;

Ls =n

zX

, é o limite superior do intervalo de confiança,

sendo, z obtido através da tabela de distribuição normal padrão com média zero e variância 1.

Com o intuito de auxiliar ao estudante na obtenção do intervalo de confiança,

apresentamos a seguir uma tabela com o valor de z através da tabela normal padrão e seu

respectivo nível de confiança e significância.

Tabela de distribuição Normal Padrão

Nível de confiança Nível de significância Valor (1- )% ( )% z 99,74 0,26 3,00 99,00 1,00 2,58 95,44 4,56 2,00 95,00 5,00 1,96 90,00 10,00 1,65 85,00 15,00 1,44 80,00 20,00 1,28

Exemplo

Seja X a duração de vida de uma peça de equipamento que tem distribuição normal com

desvio padrão σ=5horas. Admita-se que 100 peças foram ensaiadas fornecendo uma

duração média de X=500 horas e que se deseje obter um intervalo de 95 % para a média

populacional μ.

Solução:

26

n=100 ; X=500 ;σ=5 ; (1−α ) %=95 % ; z=1,96

Os intervalos de confiança são:

Li=500−1,965

√100=499,02 ;

Ls=500+1,965

√100=500,98

Logo, o intervalo de 95 % de confiança para a média populacional μ é:

IC [ μ ;95 % ]=[ 499,02 ;500,98 ]

Assim, podemos dizer que 95 % das vezes, o intervalo [ 499,02 ;500,98 ] contém a verdadeira

média μ.

b) Se não conhecemos a distribuição de X , então para n>30, utilizaremos o termo central

do limite, que diz: X → N (μ;σ2

n ) , quando n → ∞.

Assim, o intervalo de (1−α ) % de confiança para a média populacionalμ é de forma

IC [μ ; (1−α ) % ]=[ Li; Ls ]

Em que:

Li=X -Zσ

√n , é o limite inferior do intervalo de confiança média populacional;

Ls=X+Zσ

√n , é o limite superior do intervalo de confiança média populacional.

5.2 Intervalo de confiança para a média populacional quando a variância populacional

é desconhecida

27

a) Se a variável aleatória tem distribuição normal,isto é, X~N( , 2 ), mas não conhecemos

a variância populacional 2 , neste caso, precisamos calcular a estimativa de 2S

(variância amostral) de 2 .

Seja 1

)(1

2

2

n

XXS

n

ii

o estimador não viciado de variância mínima de 2 .

Como X ~ ),(2

nN

e n

XZ

)1,0(~ N ,

vamos considerar a nova variável aleatória nS

Xt

=

n

X

S

=

S

Z .

Pelo teorema de Fisher (Bussab e Morettin, 2003) temos

2

2

)1(S

n ~ 2

)1( n

logo, 2

2

S

~ 1

1

n

2)1( n .

Assim, a estatística t t (n−1 ), isto é, a estatística t tem uma distribuição t−student com n−1

graus de liberdade.

Assim, o intervalo (1−α ) % de confiança par a média populacional μ é de forma

IC [μ ; (1−α ) % ]=[ Li; Ls ] em que:

Li=X −t (n−1)S


Ls=X +t (n−1 )S


Sendo t (n−1)o valor da tabela t−student com n−1 grau de liberdade e erro α %.

Exemplo:

Suponha que se extraia uma amostra de tamanho 25 de uma população com média μ e desvio

padrão desconhecido. Suponha que a média amostral seja 4,004 e o desvio padrão amostral

seja 0,366. Determinar intervalos com 95% e 99%de confiança para μ.

Solucao:

28

Temos que t 0,025; 24=2,064

L1=4,004−2, o 64.0,366

√25=3,853

L2=4,004+2 , o 64.0,366

√25=4,155

Logo, o intervalo com 95% de confiança para μ é [3; 853; 4; 155].

Analogamente, temos que t 0,005; 24=2,797

L1=4,004−2,797.0,366

√25=3,799

L2=4,004+2,797.0,366

√25=4,209

Logo, o intervalo com 95% de confiança para μ é [3; 799; 4; 209].

30

b) Se não conhecemos a distribuição de X ,então, para n>30, utiliza-se o teorema central de

limite e o intervalo de (1−α ) % de confiança para a média populacional μ é da forma

IC [μ ; (1−α ) % ]=[ Li; Ls ]em que:

Li=X −t (n−1)S


Ls=X +t (n−1 )S


5.3 Intervalo de Confiança para Proporção Populacional

Lembrando que p ))1(

,(n

pppN

quando n for grande ( n > 30).

O intervalo de ( 1-)% de confiança para a proporção populacional p é definido da seguinte

forma

IC[p , (1-)%] = [Li ; Ls ]

Em que,

Li = n

ppzp

)ˆ1(ˆˆ

, é o limite inferior do intervalo de p;

Ls = n

ppzp

)ˆ1(ˆˆ

, é o limite superior do intervalo de p,

Sendo,que z obtido através da tabela de distribuição normal padrão com média zero e

variância 1.

31

5.4 Intervalo de Confiança para a Variância Populacional

Neste caso precisamos calcular a estimativa S (desvio padrão) a partir da amostra.

Lembrando que 2

2)1(

Sn

tem distribuição 21n (qui-quadrado com n-1 graus de liberdade).

O intervalo de (1-)% de confiança para a variância populacional 2 é definido da

seguinte forma

IC[ 2 , (1-)%] = [Li ; Ls ]

Em que,

Li = 2sup

2)1(

Sn

, é o limite inferior do intervalo de 2 ;

Ls = 2inf

2)1(

Sn

, é o limite superior do intervalo de 2 ,

Sendo que, 2sup e 2

inf são os valores da tabela qui-quadrado com n-1 graus de liberdade

associados ao coeficientes /2 e 1- /2 , respectivamente.

Anexo

⇓

32

6. Distribuição amostral da diferença entre duas médias (ou distribuição de

probabilidades da diferença entre duas médias amostrais)

Considere duas amostras aleatórias

(X A 1,X A 2, ...,X A nA)

(X B1,X B2, ...,X BnB)

Com nA e nB elementos, obtidas independentemente de duas populações A e B, normalmente

distribuídas com médias μA e μBe variâncias σ A2 ¿ σ B

2=σ2 respectivamente.

Sejam:

33

X A=∑i=1

nA X A i

nA

e X B=∑i=1

nB X Bi

nB

7. Distribuição da diferença de médias amostrais

Considere duas amostras aleatórias

X A 1;X A 2; ∷: ; X A n

A

X B1;X B2 ;∷: ; X Bn

B

com nA e nB elementos, obtidas independentemente de duas populações A e B,

normalmente distribuídas com médiasμA e μB e variâncias σ A2 ¿ σ B

2=σ2

X A=∑i=1

n A

x Ai

nA

e X A=∑i=1

nB

xB i

nB

as médias respectivas das duas amostras.

Temos então que:

X A−X B N (μA−μB ,√ σ A2

n A

+σ B

2

nB

) Portanto,

( X A−X B )−(μA−μB)

√ σ A2

n A

+σ B

2

nB

N (0,1)

Temos tambem

(n A−1)s A2

σ A2 Xn A−1

2 , e(nB−1)sB

2

σ B2 XnB−1

2

Logo

(n A−1)s A2

σ A2 +

(nB−1)sB2

σB2 Xn A

2+X nA+nB−2

2

Pela definição da distribuição t-student, e considerando σ A2 ¿ σ B

2=σ2 temos que:

( X A−XB )−(μ A−μB)

√ 1nA

+ 1nB

√ (nA−1 ) sA2+(nB−1)sB

2

nA+nB−2

tn A+nB−2

Distribuicao F

Considere duas v:a: independentes Y e Z tais que Y possua uma distribuição X2 com

34

m graus de liberdade, e Z possua uma distribuição X2 com n graus de liberdade.

Suponha que uma v.a. X seja definida por

X=

YMZN

=nYmZ

Então a distribuição de X é denominada distribuição F com m e n graus de liberdade.

Propriedade da distribuição F:

Se uma variável aleatória X possui uma distribuição F com com m e n graus de liberdade,

então 1X

possui uma distribuição F com com n e m graus de liberdade.

8. Distribuição da Razão entre duas Variâncias Amostrais

Suponha que X1 ; X2 ;…; Xn formem uma amostra aleatória de m observações de

uma distribuição normal com média μ1 e variância σ 12 desconhecidos, e suponha que

Y 1 ;Y 2;…;Y nformem uma amostra aleatória de n observações de uma distribuição normal

com média μ2 e variância σ 22 desconhecidos. Sabemos que

∑i=1

m

( X i−X )2

σ 21

=(m−1)s1

2

σ 21

X2m−1

e ∑i=1

n

(Y i−Y )2

σ22

=(n−1)S2

2

σ22

X 2n−1

Logo

s12

σ21

S22

σ22

Fm−1 ,n−1 se σ 21=σ2

2 Então s1

2

S22

Fm−1 , n−1

Exemplo:

Suponha que uma amostra de tamanho 6 seja retirada de uma população normalmente

distribuída com média μ1 e variância 30, e que uma amostra de tamanho 3 seja retirada de

uma outra população normalmente distrbuída com média μ2 e variância 76. Qual é a

probabilidade de s12>s2

2 ?

Solução:

35

P(s21>s2

2¿=P( s21

s22

>1)=P(s2

1

σ 21

s22

σ22

>σ2

2

σ 21 )

Intervalo de Confiança para a Variância Populacional σ 2

Vimos que

(n−1)S2

σ2 X 2n−1

Logo, podemos determinar pela tabela da distribuição X2 com n-1 g.l., os números

X2

(1−α2 ), [n−1 ]

e X2σ2

, [n−1]

P[X2

(1−α2 ), [n−1]

≤(n−1)S2

σ2 ≤ X 2σ2

, [ n−1] ]=1−α ou seja

P[ (n−1)S2

X2σ2

, [n−1 ]

≤ σ2 ≤(n−1)S2

X2

(1−α2 ), [n−1 ] ]=1−σ , portanto o intervalo

[ (n−1)S2

X2σ2

, [n−1 ]

,(n−1)S2

X2

(1−α2 ), [ n−1] ]

é um intervalo de confiança para σ 2 com coeficiente de confiança (1−α ¿.

Exemplo:

Suponha que seja retirada uma amostra de tamanho cinco de uma população normalmente

distribuida, e que se tenha encontrado uma variância amostral de 13,52.

Construa um intervalo com 95% de confiança para a variância populacional.

Solução:

Temos que X20,975 ;4=0,48 e X2

0,025; 4=11,143. Portanto, os limites inferior e

superior do I.C. de 95% para σ 2 são:

L1=(n−1)S2

X 2σ2

, [n−1]

=4 (13,52)11,143

=4,83

L2=(n−1)S2

X2

(1−α2 ), [n−1 ]

=4 (13,52)

0,484=111,74

36

Portanto,P(4,85≤ σ2 ≤111,74 ¿=0,95

9. Intervalo de Confiança para a diferença de médias de duas Populações

Variânciasσ 21 e σ 2

2 Conhecidas

Como

X1−μ1

σ1

√n1

N (0,1) e

X2−μ2

σ2

√n2

N (0,1)

Logo

(X ¿¿1−X 2)−(μ1−μ2)

√ σ21

n1

+σ 2

2

n2

N (0,1)¿¿

Portanto o intervalo de confiança para μ1−μ2 com coeficiente de confiança 1−α é

dado por

¿

2- σ 21 e σ 2

2 Desconhecidas mas σ 21 = σ 2

2

Vimos que

(x¿¿1−x2)−(μ1−μ2)

√ 1n1

+1n2

√(n¿¿1−1)S21+

(n¿¿2−1)S22

n1+n2−2¿¿

¿

Logo, o intervalo de confiança para μ1−μ2, quando σ 21 = σ 2

2, com coeficiente de confiança 1-

α é dado por

¿

Exemplo:

37

Uma amostra de 10 lâmpadas elétricas, da marca A, apresentou a vida média de

1400 horas e desvio padrão de 120 horas. Uma amostra de 20 lâmpadas elétricas,

da marca B, apresentou a vida média de 1200 horas e o desvio padrão de 100 horas.

Supondo que σ A=σB determinar os limites de confiança de a) 95% e b) 99% para

a diferença entre as vidas médias das populações das marcas A e B.

Solução:

a) Para 1=α=0,951 tem-se que t 0,025,28=2,048 . Portanto, o I.C. de 95% para μA−μB

será:

(1400−1200 ±2,048.√ 9 (120)2+19 (100)2

28.√ 1

10+ 1

20 )=(200 ± 67,77)

Ou seja

P(108,57≤ μ A−μB ≤291,43¿=0,99

10. Intervalo de Confiança para Razão das Variânciasσ 21/σ

22

Vimos que

S21

σ22

S21

σ21

Fn2−1 ,n1−1

Logo, podemos determinar pela tabela da distribuição F com n2−1e n1−1 g.l.,

os números F(1−α2 ), [ n2−1] , [ n1−1 ]

e F α2

, [n2−1 ] , [n1−1 ] tal que:

P[F( 1−α

2 ) , [n2−1 ], [n1−1 ]≤

S22

σ21

S21

σ2

2

≤ F α2

, [n2−1 ] , [n1−1 ]] 1−α ou

P[ 1F α

2, [n2−1 ], [n1−1 ]

,S2

1

S22

≤σ 2

1

σ 22

≤ F α2

, [n2−1 ], [n1−1].

S21

S22 ] 1−α

Exemplo:

Duas máquinas A e B produzem parafusos com o mesmo tamanho médio. Duas

amostras de tamanho nA=61 enb=41 = 61 dos parafusos de A e B foram analisadas

38

e os desvios padrões amostrais foramS2A=3,5 mm e S2

B=4,5 mm. Determine um

intervalo de 95% de confiança para σ2

A

σ 2B

.

Solução:

Tem-se que F0,975,40, 60=1

F0,025,60,40

= 11,80

=O , 556 e F0,025,60,40=1,74. Logo

P[0,556.3,54,5

≤σ2

A

σ2B

≤ 1,75.3,54,5 ]=0,95

P[0,432 ≤σ 2

A

σ2B

≤ 1,353]=0,95

11. Intervalo de Confiança para uma Proporção

Admita-se que uma população é infinita e que a probabilidade de ocorrência de um evento

(denominado de sucesso) seja p. Considerem-se todas as amostras possíveis de tamanho n

extraidas da população e, para cada amostra, determinaremos a proporção p de sucessos.

Vimos que

E( p)=p

Var ( p )= p (1−p)n

Vimos tambem que para grandes valores de n, a distribuiçãop de p é uma normal, isto é

p N ( pp(1−p)

n )Portanto, o intervalo de confiança para p, com coeficiente 1−α é dado por:

( p−Z α2 √ p

p (1−p)n

p+Z α2 √ p

p (1−p)n )

Para n grande, em geral substitui-se p por p, resultando em:

P( p−Z α2 √ p(1− p)

n≤ p≤ p+Z α

2 √ p (1− p)n )=1−α

11.1 Intervalo de Confiança para Diferença de Proporções

Sejam duas proporções p1 e p2, e suas respectivas proporções amostrais p1 e p2, baseadas em

amostras de tamanhos n1 en2. Para grandes tamanhos de amostra tem-se que:

39

p1− p2 N ( p1−p2 ,p(1−p1)

n1

+p (1−p2)

n2)

Portanto, o intervalo de confiança para p1−p2 , com coeficiente de confiança 1−α é dado

por:

(( p1− p2 )± Z α2 √ p1 (1− p1 )

n1

+p2 (1− p2)

n2)

12. A distribuição qui-quadrado

A distribuição ou modelo qui-quadrado pode ser obtida de uma soma de variáveis normais

padronizadas, isto é, χ2n=∑

i=1

n

Z2i

A distribuição χ2 é assimétrica positiva (possuí uma cauda à direita) e de depende do

parâmetro

ν. Sabe-se também que:

E ( χ2 )=v e queV ( χ2 )=2 v .

A comportamento, distribuição de probabilidade, apresentado pela variância amostral (S2)

está

relacionado com a distribuição (modelo) χ2 através do seguinte resultado:

χ2n−1=

(n−1)S2

σ2 , isto é, a variância segue uma distribuição χ2 com "n−1" graus de liberdade

a

menos de uma constante. Neste casov=n−1.

Tabelas

A distribuição χ2 está tabelada em função do grau de liberdade n−1=v (linha da tabela) e

área à sua direita, isto é, P ( χ2>c )=α. Na realidade o que está tabelado é a função inversa da

χ2, isto é, entrando com o valor do parâmetro (graus de liberdade) e uma determinada

probabilidade (área), a tabela fornece um valor da variável (abscissa) tal que a probabilidade

à direita (área) deste valor seja igual a área especificada.

O intervalo

40

Suponha que seja fixado um nível de confiança de “1−α “ e que χ21 e χ2

2 sejam dois valores

da distribuição χ2 tais que P ( χ21< χ2< χ2

2 )=1−α .

P ( χ21< χ2< χ2

2 )=1−α

P( χ 21<

(n−1 ) S2

σ2 < χ22)=1−α

P( 1χ2

2

< σ2

(n−1 ) S2 <1

χ21)=1−α

P( (n−1 ) S2

χ22

<σ2<(n−1 ) S2

χ21

)=1−α

Assim o intervalo de confiança (probabilidade) de “1−α “ para a variância da população é

dado por:

[ (n−1 ) S2

χ22

;( n−1 ) S2

χ21

]Do desvio padrão populacional (σ)

Para determinar um intervalo de confiança de "1−α " de probabilidade para o desvio padrão

populacional basta apenas tomar a raiz quadrada positiva dos termos do intervalo para a

variância populacional.

Assim o intervalo será:

[√ (n−1 ) S2

χ22

;√ (n−1 ) S2

χ21

]O significado deste intervalo é:

P(√ (n−1 ) S2

χ 22

<σ<√ (n−1 ) S2

χ 21

)=1−α

Exemplo:

Uma amostra extraída de uma população normal forneceu uma variância de S2=8,38.

Determinar

um intervalo de confiança de 90 % para a variância da população e um intervalo de mesma

confiabilidade para o desvio padrão da população.

41

Solução.

Neste caso é necessário inicialmente determinar os valores da distribuição χ2, de modo, que

χ21tenha uma área (probabilidade) à direita igual a 95 % e χ2

2

tenha uma área (probabilidade) à direita igual a 5 % . Estes valores são:

χ21=3,940 e χ2

2=18,307

O intervalo de confiança, para a variância, será:

[ (n−1 ) S2

χ22

;( n−1 ) S2

χ21

][ (11−1 ) .8,38

18,307;

(11−1 ) .8,383,940 ]

[ 4,58 ;21,27 ]

O intervalo de confiança, para o desvio padrão, será:

[√ (11−1 ) .8,3818,307

;√ (11−1 ) .8,383,940 ]

[√4,58 ;√21,27 ]= [2,14 ; 4,61 ]

13. Amostragem

A inferência estatística consiste em fazer previsões a partir de uma parte para o todo,

ou seja, com base na análise de um conjunto limitado de dados (amostra) recolhidos junto de

um conjunto total de elemento (população), pretende-se caracterizar a população. A aplicação

da amostragem possui relevância pelo facto de facultar a realização de um estudo em menos

tempo em relação ao censo, visto que, somente alguns dos indivíduos são criteriosamente

abrangidos. Aliado a este facto, um estudo feito mediante as técnicas da amostragem acarreta

menos custos.

Definições

1. População - é o conjunto dos indivíduos de entre os quais se poderia escolher a amostra,

ou seja, o conjunto de elementos que possuem as características que queremos observar

(D’Hainaut, 1997).

1.1Finita - quando o número de unidades de observação pode ser contado e é limitado;

42

1.2 Infinita - quando a quantidade de unidades de observação é ilimitada

Amostra – porção ou fracção da população, retirada segundo algumas técnicas específicas,

que mantém as mesmas características da população.

Amostragem - é a operação que consiste em tomar um certo número de elementos (ou seja,

uma amostra) no conjunto dos elementos que queremos observar ou tratar (população).

Parâmetro – é uma medida associada à uma característica populacional. Assim se P é uma

população, os principais parâmetros são:

i. A média de P, anotada por μρ

ii. A variância de P, anotada por σ ρ2

iii. O desvio padrão de P, anotado por σ ρ

iv. A proporção de elementos de P que apresentam determinada característica, anotada

por: π, entre outros.

Exemplo:

Para a população P={1 ,3 ,5 , 6 } os parâmetros acima seriam:

μ=∑i=1

n

x i

N

(i) μρ=(1+3+5+6)

4=15

4=3,75

σ ρ2=

x i2

N−μ2

(ii) σ ρ2=

(1+9+25+36)4

−(3,752)2 → 17,75−14,0625=3,6875 3,69.

σ=√σ2

(iv) σ ρ = √3,69 1,92

(v) π=14

⇔25 %, onde o numerador representa o número de elementos pares na população

43

Estatística ou estimador – é uma medida associada à uma característica da amostra. São

exemplos de estimadores: média amostral, variância amostral, desvio padrão amostral e

proporção amostral. De frisar que, os estimadores são determinados a partir de fórmulas.

Estimativa – é um valor particular (número) que o estimador assume, ou seja, os resultados

de estimadores chamam-se estimativas.

14. Tamanho de uma Amostra

A qualidade e a validade dos resultados de um questionário dependem da dimensão da

amostra, ou por outras palavras, o número de pessoas/itens a interrogar depende da precisão

desejada. Num grande número de casos, mais do que aumentar simplesmente a dimensão da

amostra, o que pode levar a aumentar o número de pessoas/itens pertencentes a categorias já

suficientes, há vantagem em construir uma amostra experimental, concebida de forma exacta

em função das análises previstas, de forma a evitar amostras inutilmente grandes. A

probabilidade de que amostra seja válida, se refere ao grau de precisão das características

retidas, que portanto, determina a dimensão da amostra. Ora, remetemos apenas para as ideias

principais trata – se então, de retirar a uma população determinada fracção na qual os

diferentes caracteres possuam a frequência semelhante à da população inicial.

Um dos principais conceitos é o erro amostral tolerável, que será chamado deE0. Este erro é

o valor máximo que o pesquisador admite ter na estimativa de uma característica da

44

população. É razoável imaginar que, quanto menor o erro amostral tolerável escolhido, maior

será o tamanho da amostra necessário para obtê-lo.

Isso fica mais claro ao ver a fórmula para obtenção da primeira estimativa do tamanho de

amostra:

n0=1

E02

Onde: E0 é o erro amostral tolerável, e n0 é a primeira estimativa do tamanho de amostra. Se

o tamanho da população, N, for conhecido, podemos corrigir a primeira estimativa:

n=N × n0

N+n0

Exemplo: Obtenha o tamanho mínimo de uma amostra aleatória simples, admitindo com alto

grau de confiança um erro amostral máximo de 2%, supondo que a população tenha 200

elementos.

Sendo n0 (a primeira estimativa), e o erro amostral é 2% para ambas, podemos calculá-lo

apenas uma vez. Devemos dividir o 2% por 100 antes de substituir na fórmula:

n0=1

E02

1

(0,02)2=2500 Então, nossa primeira estimativa, para um erro amostral de 2%, é

retirar uma amostra de 2.500 elementos. Obviamente, precisamos corrigir a primeira

estimativa, pois a população conta com apenas 200 elementos. Então:

n=N × n0

N+n0

200× 2500200+2500

=185,185

Precisamos arredondar, sempre para cima, o tamanho mínimo da amostra. Então, a amostra

deverá ter pelo menos 186 elementos para garantir um erro amostral de 2%.

Determinação do tamanho de uma amostra com base na Estimativa da média

populacional

Em muitos casos é possível determinar o tamanho mínimo de uma amostra para estimar um

parâmetro estatístico, como por exemplo, a média populacionalμ A fórmula para cálculo do

tamanho da amostra para uma estimativa confiável da média populacional (μ) é dada por:

n=( Zα /2 × σE0

)2

45

Onde: n – número de indivíduos da amostra

Zα /2 é o valor crítico que corresponde ao grau de confiança desejado

σ−¿Desvio-padrão populacional da variável estudada

E0−¿Margem de erro ou erro máximo de estimativa

Zα /2=1,65→ (1−∝ )=90 %

Zα /2=1,96 → (1−∝)=95 %

Zα /2=2,0→(1−∝)=95.5%

Zα /2=2,57 →(1−∝)=99 %

Exemplo : Um economista deseja estimar a renda média para o primeiro ano de

trabalho de um Licenciado em Matemática. Quantos valores de renda devem ser

tomados, se o economista deseja ter 95% de confiança em que a média amostral esteja

a menos de 1000,00Mt da verdadeira média populacional? Suponha que saibamos,

por um estudo prévio, que para tais rendas, σ=6250,00 Mt .

Solução

Queremos determinar o tamanho n da amostra, dado que ∝ ¿0,05¿ de confiança) eZ∝ /2=1,96

Desejamos que a média amostral seja a menos de 1000,00 Mtda média populacional, de

forma que E0=1000. Supondo σ ¿6250,00 Mt, aplicando a relação acima, obtemos:

n=( Zα /2 × σE0

)2

( 1,96 ×62501000 )

2

=150,0625 ¿150

Determinação do tamanho de uma amostra com base na Estimativa da proporção

populacional

Outro parâmetro estatístico cuja determinação afecta o tamanho da amostra é a proporção

populacional. Tomemos, como exemplo, a necessidade de determinar a proporção de pessoas

atendidas por uma Unidade de Saúde, originárias do município de Quelimane. A fórmula

46

para cálculo do tamanho da amostra para uma estimativa confiável da proporção populacional

(p) é dada por:

n=Z∝/2

2 × p×q

E02

Onde: p – Proporção populacional de indivíduos que pertence a categoria que estamos

interessados em estudar.

q – Proporção populacional de indivíduos que não pertence à categoria que estamos

interessados em estudar(q=1 – p) .

E0 - Margem de erro ou erro máximo de estimativa. Identifica a diferença máxima

entre a proporção amostral e a verdadeira proporção Populacional ( p¿.

E se “p” e “q” não forem conhecidos?

A Equação anterior exige que se substituam os valores populacionais p eq e , por valores

amostrais p e q. Mas se estes também forem desconhecidos, substituímos p eq por 0,25.

(Levine, 2000):

Exemplo: Um assistente social deseja saber o tamanho da amostra n necessário para

determinar a proporção da população atendida por uma Unidade de Saúde, que pertence ao

município de Quelimane. Não foi feito um levantamento prévio da proporção amostral e,

portanto, seu valor é desconhecido. Ela quer ter 90% de confiança que sua o erro máximo de

estimativa seja de ±5% (ou 0,05) . Quantas pessoas necessitam ser entrevistadas?

Solução: Considerando que o valor da proporção amostral de atendimentos para pessoas de

Quelimane não é conhecida. Utilizamos a para determinar o tamanho da amostra. Sabemos

que, para 90% de confiança teremos o valor crítico (Za/2¿=1,65.

n=Z∝/2

2 × p×q

E02

(1,65)2× 0,25

(0,05)2 =270,6=271

Devemos, portanto, obter uma amostra de 271 pessoas para determinar a proporção da

população atendida na Unidade de Saúde, que se origina do município de Quelimane.

47

Determinação do tamanho da amostra para populações Finitas

As fórmulas para determinação do tamanho da amostra que vimos até agora trabalhavam com

a ideia de que a população de onde se retirava a amostra era tão grande, que poderíamos

considerá-la infinita. Entretanto, a maior parte das populações não é tão grande em

comparação com as amostras. Caso a amostra tenha um tamanho n maior ou igual a 5% do

tamanho da população N , considera-se que a população seja finita. Neste caso, aplica-se um

fator de correção às fórmulas vistas anteriormente e teremos as seguintes fórmulas corrigidas:

· Fórmula para determinação do tamanho da amostra n com base na estiva da média

populacional:

n=N ×σ 2×(Z∝ /2)

2

(N−1) E02+σ2 ×(Z∝/2)

2

Fórmula para determinação do tamanho da amostra n com base na estimativa da proporção

populacional:

n=N × p×q× Z∝/2

(N−1) E02+ p×q (Z∝/2)

2

15. Técnicas de Amostragem

A apresentação de uma ilação correspondente ao parâmetro está estritamente

relacionada com a margem de erro que possa ser cometida durante o estudo. Ao quantificar a

margem de erro, se torna óbvio o nível de enviesamento o que determina o índice de rigor nos

resultados. Se por exemplo, um investigador após os seus estudos afirmar que a margem de

erro que o levou a conclusão foi com a probabilidade de 3 % ,5 %ou 10 %, por outro lado, está

a informar que a credibilidade das conclusões assegura uma confiança de 97 % ,95 %ou 90 %

respectivamente. O controlo da probabilidade de erro na generalização está directamente

relacionada com a forma como a amostra foi recolhida, portanto, a primeira e a última

operação da técnica da amostragem estão directamente relacionadas. Só se pode quantificar o

erro se a amostra for recolhida de uma forma aleatória, isto é, se a probabilidade de todos os

elementos da população fazerem parte da amostra for conhecida e diferente de zero.

48

Amostragem probabilística ou aleatória

Uma amostra é dita probabilística ou aleatória se todos os elementos da população

tiverem probabilidades conhecidas e não zero de pertencer a amostra.

Amostragem aleatória simples – é o processo mais elementar aplicado a populações

homogéneas de tamanho conhecido. Todos os elementos da população têm igual

probabilidade de serem escolhidos. Para uma população finita o processo deve ser sem

reposição. Todos os elementos da população devem ser enumerados. Dos métodos existentes,

os mais usados e simples para a obtenção de uma amostragem aleatória simples consistem

em:

Método 1

Extracção de bolas enumeradas

È equivalente a um sorteio lotérico. Pode ser realizada numerando-se a população de 1 a N e

sorteando-se a seguir, por meio de um dispositivo aleatório qualquer, x números dessa

seqüência, os quais corresponderão aos elementos pertencentes à amostra.

Exemplo: Vamos obter uma amostra de 10% representativa para uma pesquisa da estatura de

80 alunos de uma escola qualquer.

1º - numeramos os alunos de 01 a 90

2º - escrevemos os números dos alunos de 01 a 80 em pedaços iguais de papel, colocamos

numa urna e após misturar, retiramos, um a um oito números que irão compor a amostra.

Método 2:

Usar uma roda semelhante à figura 1.1, que se segue

49

Figure 1 Roda

A roda deve ser desenhada numa superfície lisa e deve rodar em torno do centro. A

circunferência deve ser dividida em 10 sectores iguais e numerados: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.

Fixa-se um ponteiro, como o que está representado na figura. De cada vez que a roda girar,

ela parará e o ponteiro indicará um sector, por exemplo o 2. Cada sector (número) tem a

mesma oportunidade de sair e, como a roda não tem memória, o resultado obtido de cada vez

que a roda gira não vai afectar as tentativas seguintes. Podemos construir, assim, uma tabela

de dígitos aleatórios.

Método 3:

Usar uma tabela de números aleatórios (Consta em anexo)

A tabela de números aleatórios apresenta agrupamento de cinco dígitos e tem as linhas

numeradas, com o objectivo de facilitar na sua consulta.

Propriedades

1. Qualquer par de dígitos na tabela tem a mesma oportunidade de ser (qualquer) um dos

100 possíveis pares 00, 01, 02, 03, ..., 97, 98, 99.

2. Qualquer trio de dígitos na tabela tem a mesma oportunidade de ser um dos

1000 possíveis trios 000, 001, 002, 003, ..., 997, 998, 999.

3. E assim por adiante, para grupos de 4 ou mais dígitos da tabela.

Exemplo: Se precisarmos de uma a.a.s. de tamanho 5, de um lote de 100 iogurtes para

verificarmos contaminações bacterianas, devemos

a) Enumerar os 100 iogurtes de 00, 01, 02, ..., 99;

50

b) Escolher aleatoriamente uma linha na tabela de números aleatórios (por exemplo, a

linha 143 temos 88565, 42628, 17797, 49376…)

c) Registar os 5 grupos de dois dígitos que tenham correspondência com os números da

população: 88, 56, 54,26 e 28. Estes são os iogurtes (numerados) seleccionados para a

amostra.

Exemplo: Pretendemos uma amostra de tamanho 5 de um grupo de 300 unidades. Para

numerar as unidades da população usaremos 000, 001, 002,….. , 297, 298, 299. Ao ler na

Tabela na linha 116 (escolhida aleatoriamente), grupos de 3 dígitos, temos 144 592 605 631

424 803 716 510 362 253 504 906 118 138 167 985 ... Somente. o1 °,10 °,13 °, 14 ° e15 °

devem ser usados. Os outros números devem ser ignorados, pois não têm correspondência na

população.

Observação: Se aparecerem grupos (neste caso, de dois dígitos) repetidos, devemos ignorá-

los. Mas se a coincidência for movida pela repetição do elemento da população e não do

número aleatório, então será considerada mera coincidência sendo que o elemento deverá ser

seleccionado. Este procedimento deve ser repetido até atingir n elementos requeridos para a

amostra.

Amostragem aleatória com e sem reposição

A retirada de elementos de uma população para comporem a amostra pode ser com ou

sem reposição. Se a população for infinita então as retiradas com e sem reposição serão

equivalentes, isto é, o facto de recolocar o elemento retirado de volta na população, não vai

afectar em nada a probabilidade de extracção do elemento seguinte.

Se, no entanto, a população for finita será necessário fazer uma distinção entre os dois

procedimentos, pois a extracção com reposição as diversas retiradas serão independentes,

mas no processo sem reposição haverá dependência entre as retiradas, isto é, o facto de não

colocar o elemento retirado afecta a probabilidade do elemento seguinte ser retirado.

A amostragem sem reposição é mais eficiente e reduz a variabilidade uma vez que não é

possível um elemento mais do que uma vez. Assim se N representa o tamanho da população

e n ≤ N o tamanho da amostra, então o número de amostras possíveis e as respectivas

probabilidades de acordo com os critérios com e sem reposição será:

51

Com reposição

k=Nn; onde k representa o número de classe ; P= 1

M n

Sem reposição

k=CnN ⇔

N !n !(N−n)! P= 1

CnM

Exemplo: Considere a população P ¿{1 , 3 ,5 ,6 }. Então o número de amostras possíveis de

tamanhos n=2.

Com reposição

k=Nn, neste caso, temos N=4 e n=3, portanto, vem k=42→ k=16

Estas amostras serão:

(1 , 1);(1 , 3); (1 ,5)(1 ,6);

(3 , 3); (3 ,5);(3 , 6);(5 , 5); (5 ,6);(6 ,6);(3 ,1); (5 ,1);(6 ,1); (5 , 3);(6 ,3)e (6 ,5)

A probabilidade de cada elemento da população ser escolhido é P= 1

42

Sem reposição

Como N=4 e n=2 então o número possível de amostras será:k=C24=6

Estas amostras serão: (1 , 3)(1 , 5)(1 ,6)(3 ,5)(3 , 6)(5 , 6)

Exemplo : Quatro funcionários de uma empresa (Alberto, Marcos, Catarina, Telma, Nelson e

Judite) pretendem tirar férias no mês de Junho, mas apenas dois deles podem ir nesse

período. Determine a probabilidade de cada funcionário fazer parte da amostra e o número de

amostras possíveis.

Neste caso é evidente que se trata de uma amostragem aleatória simples e sem reposição.

Podemos proceder colocando numa caixa papeis com seis letras (cada inicial do nome dos

funcionários), assim vem: A,M,C,T.N e J. em seguida retiramos a amostra de dois daqueles

papeis.

A probabilidade de cada indivíduo pertencer a amostra é determinada pela seginte expressão:

52

P= 1

CnM

1

C26= 1

15

O número de amostras:k=CnN C2

6=15 → k=15

Amostragem aleatória sistemática

Quando os elementos da população já se encontram ordenados, não há necessidade de

construir o sistema de referência. São exemplos , os prontuários de hospitais, os prédios de

uma rua, uma lista telefônica, entre outros.

Seja N o tamanho de uma população e n a dimensão da amostra. Os elementos da população

que comporão a amostra obtêm-se a partir da:

Determinação do intervalo de amostragem (k ): k=Nn

.Quando se trata de medidas expressas

duma forma discreta é aconselhável que k seja inteiro, o que quer dizer que é susceptível de

arredondamento;

Sorteia-se usando a Tabela de Números Aleatórios de um valor compreendido entre 1 e k ;este

será o 1 ° elemento da amostra e adiante designaremos por t

d) Partindo de t , seleccionar respectivamente os elementos das posições

t ,t +k , t+2k , ... ,t +(n−1)k. Posto assim, formamos uma sequência de elementos que

estarão inclusos na amostra.

Para determinar qualquer elemento da amostra podemos usar a fórmula do termo

geral de uma P.A.a) an=a1+(n−1)k

Exemplo – Suponha uma rua com 300 casas, das quais desejamos obter uma amostra

formada por 30 casas para uma pesquisa de opinião

1º - Divide-se o tamanho da população pelo tamanho da amostra, ou seja, 30030

=10

2º - Escolhe-se por sorteio casual, um número entre 01 e10. Supondo que esse número fosse

3, a amostra seria: 3 ªcasa, 13 ª casa,23 ª casa,33 ªcasa, 43 ª casa, e assim por diante, até

completar a amostra de 30 residências.

53

Amostragem aleatória estratificada

É um processo de amostragem usado quando nos depararmos com populações

heterogéneas. Para a recolha de uma amostra estratificada há que previamente proceder à

estratificação da população, ou seja dividi-la em grupos (estratos) de tal modo que dentro de

cada estrato haja a maior uniformidade possível e, em que as diferenças entre os vários

estratos sejam tão grandes quanto possível. Estando a população classificada em estratos, a

amostra é recolhida através de amostragens aleatórias simples dentro de cada estrato.

O tamanho de amostra em cada estrato, proporcional ao tamanho do estrato em relação à

população é determinado pela seguinte relação: q i=ni

N×n;

onde: ni é o tamanho de cada estrato; N representa o tamanho da população; n é a quantidade

de elementos que comporão a amostra desejado.

∑i=1

n

qi=n

Exemplo: Vamos obter uma amostra representativa de 10 % para uma pesquisa da estatura de

80 alunos de uma escola qualquer, com 54 são meninos e 26 meninas. Qual é o número de

meninos e meninas que farão parte da amostra.

São portanto dois estratos (sexo masculino e feminino). Logo, temos:

Sexo População 10% Amostra

Masculino 54 5,4 5

Feminino 26 2,6 3

Total 80 8 8

Exercício 1: uma franquia de fast food com foco em sanduíches, apresenta lojas em todo o

mundo. Para fazer uma pesquisa de satisfação dos clientes, dividiu-se a população de lojas

em três estratos (países desenvolvidos, países em desenvolvimento e países do grupo

54

asiático). Pretende-se trabalhar com uma amostra de tamanho n=200. Com as informações a

seguir, faça o esquema de uma amostragem estratificada.

Estratos

Tamanho do estrato (no

de lojas)

q i=n i

∑i=1

n

ni

× n ;

Países desenvolvidos n1 ¿700q1=

7001390

×200 101

Países em

desenvolvimenton2 ¿420 q2=

4201390

×200 60

Países do grupo Asiático n3 ¿270q3=

2701390

×200 39

N∑i=1

n

ni=1390 n∑i=1

n

q i=200

Amostragem por conglomerado ou Agrupamentos

Quando a população apresenta uma subdivisão natural em grupos menores

(denominados conglomerados), sorteia – se um número suficiente desses grupos

(conglomerados) e todos os elementos destes vão compor a amostra. Agregados típicos são:

quarteirões, famílias, organizações, agências, edifícios, entre outros.

Exemplo: Num levantamento da população de uma cidade, podemos dispor do mapa

indicando cada quarteirão e não dispor de uma relação atualizada dos seus moradores. Pode-

se, então, colher uma amostra dos quarteirões e fazer a contagem completa de todos os que

residem naqueles quarteirões sorteados.

Amostragem por clusters

Quando se torna impraticável ou impossível construir uma lista de todos os elementos

que constituem determinada população sendo, no entanto, muito mais listar em grupos desses

mesmos elementos usa –se a mostragem por clusters. Este tipo de amostragem, consiste

quando a população se encontra dividida num reduzido número de grupos (clusters) onde, as

diferenças entre os elementos dentro de cada cluster devem ser as maiores possíveis (os

grupos deverão tanto quanto possível ser “microcosmos” da população a estudar).

Seleccionam – se aleatoriamente alguns grupos e em seguida incluem –se na amostra todos os

55

indivíduos pertencentes aos grupos seleccionados.

Exemplo: Pretende – se conhecer as atitudes dos trabalhadores da área industrial do Barreiro

sobre as suas condições de trabalho. Neste caso, é mais operacional compilar uma lista de

fábricas daquela área do que uma outra onde constem os trabalhadores nominalmente.

Portanto, a cada fábrica constitui um cluster de trabalhadores. Apenas uma parte destes

clusters (fábricas) participarão na amostra.

Finalmente serão inquiridos todos os trabalhadores que fazem parte dos clusters (fábricas)

considerados na amostra

Amostragem multi – etapas

O primeiro passo deste tipo de amostragem é idêntico ao anterior. A população

encontra – se dividida em vários grupos e seleccionam – se aleatoriamente alguns desses

grupos. No passo seguinte, também os elementos de cada grupo são aleatoriamente

escolhidos. Este processo pode multiplicar – se por mais de duas etapas se os grupos

estiverem divididos em subgrupos.

Exemplo: Num estudo de mercados internacionais foram seleccionados dois países para se

identificarem as tácticas de posicionamento a seguir para as pastas dentífricas. Em cada um

dos países escolhidos foram seleccionados cinco centros urbanos e, destes catorze

estabelecimentos comerciais. Em todas as etapas (países, centros urbanos e estabelecimentos

comerciais) as escolhas resultam de um processo aleatório.

Amostragem por conglomerado

Quando a população apresenta uma subdivisão natural em grupos menores

(denominados conglomerados), sorteia – se um número suficiente desses grupos

(conglomerados) e todos os elementos destes vão compor a amostra. Agregados típicos são:

quarteirões, famílias, organizações, agências, edifícios, etc.

Exemplo:

Amostragens não probabilísticas

56

São amostragens em que há uma escolha deliberada dos elementos amostrais. Não é

possível generalizar os resultados das pesquisas para a população, pois as amostras não-

probabilísticas não garantem a representatividade da população.

Amostragem Acidental

Trata-se de uma amostra formada por aqueles elementos que vão aparecendo e que

são possíveis de se obter até completar o tamanho da amostra. Geralmente este tipo de

amostragem é utilizado em pesquisa de opinião, em que os entrevistados são acidentalmente

escolhidos.

Exemplo: pesquisas de opinião em praças públicas, ruas movimentadas de grandes cidades.

Amostragem Intencional

São amostragens realizadas de acordo com determinado critério. Escolhe-se

intencionalmente um grupo de elementos que irão compor a amostra e intencionalmente o

investigador coleta a opinião desses elementos.

Exemplo: Numa pesquisa sobre a preferência por determinado cosmético, o pesquisador se

dirige a um grande salão de beleza e entrevista as pessoas que ali s encontram.

Amostragem por Quotas

Este é o método de amostragem mais comumente utilizado em pesquisas de

mercado e em prévias eleitorais. Ela abrange três fases:

1ª - Classificação da população em termos de propriedades que se sabe ou presume serem

relevantes para a característica a ser estudada;

2ª - Determinação da proporção da população para cada característica, com base na

constituição conhecida, presumida ou estimada da população;

57

3ª - Fixação de quotas para cada entrevistador, a quem caberá a responsabilidade de

selecionar os entrevistados, de modo que a amostra total observada ou entrevistada contenha

a proporção de cada classe, tal como determinada na 2ª fase.

Exemplo: Numa pesquisa sobre o “trabalho da mulher na actualidade”. Provavelmente se

terá interesse em considerar: a divisão, cidade e campo, a habitação, moradia, idade dos

filhos, renda média, as faixas etárias, etc.

A primeira tarefa é descobrir as proporções dessas características na população. Imagina-se

que haja 47% de homens e 53% de mulheres na população. Logo uma amostra de 50 pessoas

deverá ter 23 homens e 27 mulheres. Então o pesquisador receberá uma quota para entrevistar

27 mulheres. A consideração de várias categorias exigirá uma composição amostral que

atenda ao n determinado e às proporções populacionais estipuladas.

Amostragem Snowball

Consiste em localizar indivíduos com características desejadas ou próximas das

requeridas no estudo que se pretende fazer. A amostra vai aumentando na medida em que um

elemento da amostra da característica desejada encontre mais um com as mesmas

características. Geralmente é usado este tipo de amostragem quando se pretende estudar uma

característica específica, com a certeza de difícil localização dos possíveis constituintes da

amostra.

A maior desvantagem reside no facto de que os amigos podem se indicar, resultando numa

amostra em que todos elementos recolhidos tenham um pensamento ou respostas similares.

Exemplo: Esta amostragem é mais usada pela polícia quando pretende localizar mais

companheiros de uma quadrilha de assaltantes depois de capturar o primeiro.

Amostragem por Conveniência

É uma amostragem de uma pura coincidência, porque os elementos que possam ser

constituintes da amostra se localizam na zona onde o inquérito está a decorrer passando a

fazer parte dela por conveniência. Esta é uma das amostragens que resulta num grande

enviesamento (viciação). É muito importante ser usada quando pretendemos captar ideias

58

gerais ou identificar aspectos críticos. Neste caso deve-se ter o cuidado de não se assumir

qualquer tipo de objectividade científica.

Usualmente é denominada de amostragem de pré teste do questionário.

Amostragem pelo Método Aureolar

É um processo de sondagem que permite evitar os inconvenientes de uma base de

sondagem incompleta ou caduca. Consiste numa determinação de subconjuntos de população

por uma área geográfica. Define-se num mapa um certo número de áreas geográficas, que

podem ser constituídas por Municípios, Bairros, Quarteirões, grupos de casas. Procede-se em

seguida a uma tiragem à sorte e exploram-se por fim sistematicamente as unidades de

sondagem assim apuradas.

Amostragem Random Route

Passos a considerar para obter uma Amostra Random Route

a) Selecção de um ponto de partida através de uma listagem, mapa ou registo de endereço ou

ponto de referência da zona onde irá decorrer o estudo;

b) Definição de regras de orientação para o entrevistador. Assumimos que o inquiridor tem

uma circunscrição ou um itinerário aleatório na escolha de unidades a inquirir.

Imaginemos que queira entrevistar residentes de um certo bairro. Seria mais fácil perguntar

onde fica a igreja X. Daí pode seguir a rua em frente, virando á esquerda ou direita. Se a data

do seu nascimento for 24, a soma de 2 e 4 dá 6; pode-se procurar entrevistar naquela rua

todas casas que tenham a soma dos algarismos de seus números de casa 6, casos de 6, 15, 51,

24, 42, 33. dentro de cada casa interessa em saber que serão os indivíduos a entrevistar,

processo que pode ser fácil usando a tabela de números aleatórios ou usando amostragem

sistemática.

16. Conclusão

Além da Estatística Descritiva há a Estatística Indutiva ou Estatística Inferencial que

consiste, fundamentalmente, das técnicas de análise e interpretação dos dados. A partir de um

conjunto restrito de dados, chamado de amostra, organizado e descrito pela Estatística

59

Descritiva, a Estatística Indutiva procura fazer inferências ou, em outras palavras, tirar

conclusões sobre a natureza desses dados e estender essas conclusões a conjuntos maiores de

dados, chamados de populações.

É evidente que, para que a Estatística Indutiva possa deduzir conclusões válidas, é necessário

que se tomem alguns cuidados para a escolha da amostra a ser utilizada.

Esses cuidados, mais propriamente chamados de critérios, são estabelecidos por uma técnica

chamada de amostragem.

Contudo, para permitir que a Estatística Indutiva proporcione conclusões válidas não basta

utilizar as técnicas de organização e descrição dos dados da Estatística Descritiva e as

técnicas correctas de amostragem. Fica ainda faltando uma última ferramenta que é o cálculo

de probabilidades. O cálculo de probabilidades é um conjunto de técnicas matemáticas que

visa determinar as chances de ocorrência de eventos regidos pelas leis do acaso.

17. Referências bibliográficas

[BUS86] BUSSAB, Wilton O, MORETTIN, Pedro A. Estatística Básica. 3. ed. São Paulo,

Actual, 1986.

60

FERNANDES, Edite Manuela da G.P. Estatística Aplicada

FERREIRA, Eric Batista; OLIVEIRA, Marcelo Silva. Introdução à Estatística Básica com

R 1ª Edição. Lavras : UFLA/FAEPE, 2008,

[HOF80] HOFFMAN, Rodolfo. Estatística para Economistas. São Paulo. Livraria Pioneira

Editora, 1980.

LEVIN, Jack. Estatística Aplicada a Ciências Humanas.2a. Ed. São

LEVIN, Jack. Estatística Aplicada a Ciências Humanas.2a. Ed. São Paulo: Editora Harbra

Ltda, 1987

[MAS90] MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And

Economics. IRWIN, Boston, 1990.

[MEY78] MEYER, Paul L. Probabilidade: aplicações à Estatística. Tradução do Prof. Ruy

C. B.

[NET74] NETO, Pedro Luiz de Oliveira Costa, CYMBALISTA, Melvin. Probabilidades:

resumos teóricos, exercícios resolvidos, exercícios propostos. São Paulo, Edgard Blücher,

1974.

[NET74] NETO, Pedro Luiz de Oliveira Costa. Estatística. São Paulo, Edgard Blücher, 1977.

[STE81] STEVENSON, William J. Estatística Aplicada à Administração. São Paulo. Editora

Harbra, 1981.

[WON85] WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatística.

Rio de Janeiro. Livros Técnicos e Científicos Editora S. A., 1985.

61

ANEXOS

⇊

inferencia estatistica-recente.docx

Documents