Escola Politécnica de PernambucoDepartamento de Ensino Básico
Capítulo 08
TESTES DE HIPÓTESES E SIGNIFICÂNCIA
Prof. Sérgio Mário Lins Galdino
http://epoli.pbworks.com/
Agenda
Decisões Estatísticas;
Hipóteses Estatísticas;
Testes de Hipóteses e Significância;
Erros do Tipo I e do Tipo II;
Nível de Significância;
Testes que Envolvem a Distribuição Normal;
Agenda
Testes Unilaterais e Bilaterais;
Diferenças de Médias;
Desvio Padrão;
Erro Padrão;
Testes para Diferença de Médias;
Relação entre a Teoria da Estimação e o Teste de Hipóteses.
Decisões Estatísticas
São decisões tomadas sobre populações com base em amostras das mesmas.
Hipóteses Estatísticas
Para tomar decisões é útil formular hipóteses ou suposições sobre as populações em estudo. Tais hipóteses chamam-se hipóteses estatísticas e, em geral, consistem de afirmações sobre as distribuições de probabilidade das populações. Formulamos uma hipótese com o propósito de aceitá-la ou rejeitá-la.
Testes de Hipóteses e Significância
Quando admitimos que uma determinada hipótese é verdadeira e obtermos um resultado que difere substancialmente do resultado esperado, dizemos que as diferenças observadas são significativas.
Os processos que nos permitem decidir entre aceitar ou rejeitar uma hipótese ou determinar se as amostras observadas diferem significativamente dos resultados esperados, são chamados de testes de hipóteses, testes de significância ou regras de decisão.
Erros do Tipo I e do Tipo II
Se rejeitamos uma hipótese quando ela deveria ser aceita, dizemos que foi cometido um erro do tipo I. Se, por outro lado, aceitamos uma hipótese quando ela deveria ser rejeitada, cometemos um erro do tipo II. Em qualquer dos casos ocorre um erro de julgamento.
Nível de Significância
O nível de significância representa a probabilidade de erro na rejeição de uma hipótese, ou seja, a probabilidade de um erro do tipo I.
Região crítica: aceitação ou rejeição da hipótese
O conjunto de valores dos extremos da estatística S exteriores ao intervalo obtido constitui o que se chama região crítica, região de rejeição da hipótese ou ainda região de significância. E o conjunto de valores extremos da estatística S interiores ao intervalo obtido pode então ser chamado de região de aceitação da hipótese ou região de não-significância.
Testes que Envolvem a Distribuição Normal
Suponha que sob a hipótese dada, a distribuição de amostragem de uma estatística S é uma distribuição normal com médias µS e desvio padrão σS. A distribuição desse padrão variável Z = (S - µS) / σS é a distribuição normal padrão (média 0, variância 1), e os valores extremos de Z determinam à rejeição da hipótese.
Testes que Envolvem a Distribuição Normal
Como indicado na figura, podemos estar 95% confiantes de que, se a hipótese for verdadeira, o escore z de uma amostra estatística S real estará entre - 1,96 a 1,96 (pois a área sob a curva normal entre esses dois valores é 0,95).
Testes Unilaterais e Bilaterais
Os testes são chamados bilaterais quando há interesse nos dois valores extremos da estatística S, ou seja, em seus escores z em ambos os lados da média.
Já os testes unilaterais ocorrem quando há interesse em apenas um dos valores extremos de um ou de outro lado da média.
A tabela abaixo mostra os valores críticos de z tanto para os testes unilaterais como para testes bilaterais, a vários níveis de significância.
Valores críticos de z
Valores críticos de z para os testes unilaterais e para testes bilaterais, a vários níveis de significância.
Nível de Significância 0.10 0.05 0.01 0.005
Valores Críticos de z para testes unilaterais
-1.28ou 1.28
-1.645ou 1.645
-2.33ou 2.33
-2.58ou 2.58
Valores Críticos de z para testes bilaterais
-1.645ou 1.645
-1.96ou 1.96
-2.58ou 2.58
-2.81ou 2.81
Diferenças de Médias
Comparação das médias de populações através da estimação das diferenças de médias e intervalo de confiança para esta diferença.
Sejam:
a média, o desvio padrão e o tamanho amostral da 1ª e 2ª população respectivamente.
A estimativa da diferença entre médias ( ) é dada por ( ), sendo necessário determinar um erro padrão para esta estimativa.
222111 ,,,, nSxenSx
21
21 xx
Desvio Padrão e Erro Padrão
Define-se o desvio padrão combinado como sendo:
E, a partir desse valor, define-se o erro padrão das diferenças nas médias como:
221
222
211
nn
SnSnDP
21
11
nnDPEP
Teste para Diferença de Médias
Um teste de hipótese para a diferença entre médias é
Usa-se a variável:
distribuição t-Student com graus de liberdade (pequenas amostras).
00: 21210 comoassimH
EP
xxt
)( 21
221 nn
Exemplo
Sejam as amostras das alturas de um grupo de estudantes com valores de média, desvio padrão e tamanho da amostra. Os valores com índice 1 referem-se aos homens e os com índice 2, às mulheres. As alturas estão medidas em centímetros.
17,750.9,09.164
20,734.7,85.178
222
111
nSx
nSx
Exemplo (continuação)
Temos que:
956,217
1
20
1.964,8
11
964,821720
)75,9.(17)734,7.(20
2
21
22
21
222
211
EP
EP
nnDPEP
DP
DP
nn
SnSnDP
Exemplo (continuação)
Graus de Liberdade: 20+17-2 = 35
Probabilidade de exceder o valor crítico (unilateral)
0.10 0.05 0.025 0.01 0.005 0.001 1. 3.078 6.314 12.706 31.821 63.657 318.313
35. 1.306 1.690 2.030 2.438 2.724 3.340
Conclui-se que: temos que rejeitar a hipótese = Afirma-se que as médias são diferente no nível 0.05 (t > 2.724)
993,4
956,2
09,16485,178
21
t
t
SE
xxt
Tabela t-Student
Graus de Liberdade
80% 90% 95% 99%
13.078 6.314 12.706 63.657
21.886 2.920 4.303 9.925
31.638 2.353 3.182 5.841
41.533 2.132 2.776 4.604
51.476 2.015 2.571 4.032
61.440 1.943 2.447 3.707
71.415 1.895 2.365 3.500
81.397 1.860 2.306 3.355
91.383 1.833 2.262 3.250
101.372 1.812 2.228 3.169
111.363 1.796 2.201 3.106
121.356 1.782 2.179 3.055
131.350 1.771 2.160 3.012
141.345 1.761 2.145 2.977
151.341 1.753 2.131 2.947
Graus de Liiberdade
80% 90% 95% 99%
161.337 1.746 2.120 2.921
171.333 1.740 2.110 2.898
181.330 1.734 2.101 2.878
191.328 1.729 2.093 2.861
201.325 1.725 2.086 2.845
211.323 1.721 2.080 2.831
221.321 1.717 2.074 2.819
231.319 1.714 2.069 2.807
241.318 1.711 2.064 2.797
251.316 1.708 2.060 2.787
261.315 1.706 2.056 2.779
271.314 1.703 2.052 2.771
281.313 1.701 2.048 2.763
291.311 1.699 2.045 2.756
301.310 1.697 2.042 2.750
df 80% 90% 95% 99%
infinity 1.282 1.645 1.96 2.576
Tabela t-Student
Relação entre a Teoria da Estimação e o Teste de Hipóteses
Relação entre a Teoria da Estimação e o Teste de Hipóteses
Pode-se notar que existe uma relação entre a teoria da estimação envolvendo intervalos de confiança e a teoria dos testes de hipóteses. Por exemplo, para aceitação de ao nível de 0,05 é equivalente ao resultado que conduz ao intervalo de confiança de 95 %
nx
nx
96,196,1