teste de hipóteses - bessegato.com.brbessegato.com.br/puc/iec_transp_10.pdf · 36 figura 7-8...
TRANSCRIPT
1
7Teste de Hipóteses
7-1 Aspectos Gerais7-2 Fundamentos do Teste de Hipóteses7-3 Teste de uma Afirmação sobre a Média:
Grandes Amostras7-4 Teste de uma Afirmação sobre a Média :
Pequenas Amostras7-5 Teste de uma Afirmação sobre uma
Proporção
2
7-1 Aspectos GeraisDefinição
HipóteseEm Estatística, é uma alegação ou afirmação sobre uma propriedade de uma população
3
Regra do Evento Raro para Inferência Estatística
Analisar uma amostra para distinguir entre resultados que podem ocorrer facilmente e os que dificilmente ocorrem.
A ocorrência de resultados altamente improváveis pode ser explicada pela ocorrência efetiva de um evento raro, ou de que nossa suposição não está correta.
4
7-2
Fundamentos do Teste de Hipóteses
5
Figura 7-1 Teorema Central do LimiteDistribuição Esperada de Médias Amostrais
Supondo µ = 98,6
z = - 1,96
x = 98,48ou
z = 1,96
x = 98,72ou
Dados amostrais: z = - 6,64
x = 98,20ou
µx = 98,6
Médias amostrais prováveis
6
Componentes de umTeste de Hipóteses
Formal
7
Hipótese Nula: H0
Afirmação sobre valor de parâmetro populacional
Deve conter a condição de igualdade
=, ≥, ou ≤
Testar a Hipótese Nula diretamente
Rejeitar H0 ou não rejeitar H0
8
Hipótese Alternativa: H1
Deve ser verdadeira se H0 é falsa
≠, <, >
‘oposto’ da Hipótese Nula.
9
Nota sobre a Indicação de suas Próprias Afirmações (Hipóteses)
Se você está fazendo uma pesquisa e deseja usar um teste de hipótese para apoiar sua afirmação, esta afirmação deve ser formulada de maneira que se torne a hipótese alternativa (hipótese de pesquisa).
10
Nota sobre o Teste de Validade de uma Afirmação Alheia
A afirmação original às vezes se torna a hipótese nula (porque contém a igualdade) e por vezes passa a ser a hipótese alternativa (porque não contém a desigualdade).
11
Estatística de Testeum valor baseado nos dados amostras que é
usado para tomar uma decisão sobre a rejeição da hipótese nula.
para grandes amostras, testando afirmações sobre médias populacionais
x - µxz =σ n
12
Região CríticaConjunto de todos os valores da estatística de
teste que levam à rejeição da hipótese nula
RegiãoCrítica
13
Nível de Significânciadenotado por αé a probabilidade de rejeitar a Hipótese Nula quando ela é verdadeira.são comuns as escolhas 0,05; 0,01 e 0,10. (É tipicamente predeterminado)
14
Valores CríticosValor, ou valores, que separa(m) a região crítica
dos valores da estatística de teste que não levam à rejeição da hipótese nula.
Não rejeita H0Rejeita H0
Valor Crítico(escore z )
15
Teste Bilateral, Unilateral Esquerdo, Unilateral Direito
As caudas em uma distribuição são as regiões extremas delimitadas por
valores críticos.
16
Teste BilateralH0: µ = 100H1: µ ≠ 100
α é dividido igualmenteentre as duas caudas
da região crítica
Significa menor ou maior que
Não Rejeita H0Rejeita H0 Rejeita H0
100
Valores que são significativamente distantes de 100
17
Teste Unilateral DireitoH0: µ ≤ 100
H1: µ > 100
Valores que são significativamente
distantes de 100100
Não rejeita H0 Rejeita H0
Pontos à direita
18
Teste Unilateral Esquerdo
H0: µ ≥ 100
H1: µ < 100Pontos à Esquerda
Não rejeita H0Rejeita H0
Valores que sãosignificativamentedistantes de 100
100
19
Conclusões no Teste de Hipóteses
Testar sempre a hipótese nula
1. Rejeitar a hipótese nula H0
2. Não rejeitar a hipótese nula H0
É necessário formular corretamente a conclusão final.
Veja Figura 7-4
20
A afirmaçãooriginal contéma condição de
igualdade?
Rejeitar H0?Sim
(A afirmação original contém a igualdadee se torna H0)
Não(A afirmação originalnão contém aigualdade e se torna H1)
Sim
(Rejeitar H0)
“Há evidência suficientepara garantir a rejeição da afirmação deque. . . (afirmação original).”
“Não há evidênciasuficiente para garantir arejeição da afirmação de que. . . (afirmação original).”
“Os dados amostraisapóiam a afirmação de que. . .(afirmação original).”
“Não há evidência amostralpara apoiar a afirmação deque. . . (afirmação original).”
Rejeitar H0?Sim
(RejeitarH0)Não
(Nãorejeitar H0)
Não(Nãorejeitar H0)
(Único caso em que a afirmação original é rejeitada).
(Único caso em que a afirmação original é apoiada
Início
FIGURA 7-4 Terminologia das Conclusões Finais
21
Aceitar versus Não Rejeitaralguns textos usam “aceitar a hipótese nula”
devemos reconhecer que não estamos provando a hipótese nula
estamos dizendo que a evidência amostral não é forte o suficiente para recomendar a rejeição da hipótese nula (tal como um júri decidir que não há evidência suficiente para condenar um acusado)
22
Erro Tipo IO erro de rejeitar a hipótese nula quando ela é verdadeira.
α (alfa) é usado para representar a probabilidade de um erro tipo I.
Exemplo: Rejeitar a afirmação de que a temperatura do corpo é 37ºC, quando aquela média é, de fato, 37ºC.
23
Erro Tipo II
Erro de não rejeitar a hipótese nula quando ela é falsa.
ß (beta) é usado para representar a probabilidade de um erro tipo II.
Exemplo: Não rejeitar a afirmação de que a temperatura do corpo é 37ºC, quando aquela é, de fato, falsa (a média não é 37ºC).
24
Tabela 7-2 Erros Tipo I e Tipo IIVerdadeiro Estado da Natureza
A hipótesenula éfalsa
A hipótesenula é
verdadeira
Erro tipo I(rejeição de uma
H0 verdadeira)α
Decisãocorreta
Decidimos rejeitara hipótese nula
DecisãoErro tipo II
(não rejeição de uma Ho falsa)
β
Decisãocorreta
Não rejeitamos ahipótese nula
25
Controle dos Erros Tipo I e Tipo II
Para α fixo, um aumento do tamanho n da amostra ocasiona uma redução de β.
Para um tamanho n, fixo, de amostra, uma diminuição de α acarreta um aumento de β. Reciprocamente, um aumento de α acarreta a diminuição de β .
Para reduzir α e β, deve-se aumentar o tamanho da amostra.
26
Definição
Poder de um Teste de Hipótesesé a probabilidade (1 - β ) de rejeitar um hipótese nula falsa, que é calculada através de um particular nível de significância α e um particular valor de média que é uma alternativa para o valor suposto verdadeiro na hipótese nula.
27
7-3
Teste de uma Afirmação sobre uma Média: Grandes Amostras
28
Três Métodos Discutidos
1) Método tradicional
2) Método do valor P
3) Intervalos de confiança
29
Hipótesespara testar afirmações sobre média populacional
1) A amostra é uma amostra aleatória simples.
2) A amostra é grande (n > 30).
a) Aplica-se o Teorema Central do Limite
b) Pode-se usar a distribuição normal
3) Se σ é desconhecido, podemos utilizar o desvio-padrão amostral s como uma estimativa para σ.
30
Estatística de Teste para Afirmações sobre µ quando n > 30
x - µxz = σn
O método tradicional (ou clássico) do teste de hipóteses converte uma
estatística amostral importante, em uma estatística de teste que é comparada com
um valor crítico.
31
Método Tradicional (ou Clássico) de Teste de HipótesesFigura 7-5
1. Identificar a afirmação ou hipótese específica a ser testada e colocá-la em forma simbólica.
2. Dar a forma simbólica que deve ser verdadeira quando a afirmação original é falsa.
3. Das 2 expressões simbólicas obtidas até agora, a hipótese nula H0 é a que contém a condição de igualdade. H1 é a outra afirmação.
4. Escolher o nível de significância α com base na gravidade de um erro tipo I. Tomar α pequeno se as conseqüências da rejeição de uma H0 verdadeira são sérias. São muito comuns os valores de 0,05 e 0,01.
5. Identificar a estatística relevante para este teste e determinar sua distribuição amostral.
6. Determinar a estatística de teste, os valores críticos e a região crítica. Esboçar um gráfico e incluir a estatística de teste, o(s) valor(es) crítico(s) e a região crítica.
7. Rejeitar H0 se a estatística de teste está na região crítica. Não rejeitar H0 se a estatística de teste não está na região crítica.
8. Reformular a decisão precedente em termos simples, não-técnicos. (Ver Figura 7-4)
32
Critério de Decisão (Passo 7)
Rejeitar a hipótese nula se a estatística de teste está na região crítica
Não rejeitar a hipótese nula se a estatística de teste não está na região crítica.
33
Método do Valor P para o Teste de Hipóteses
Similar ao método tradicional
a principal diferença é a maneira pela qual é tomada a decisão para rejeitar a hipótese nula.
o procedimento encontra a probabilidade(Valor P) de obter um resultado e rejeita-se a hipótese nula se esta probabilidade é muito baixa.
34
DefiniçãoValor P (ou valor de probabilidade)
é a probabilidade de obter um valor da estatística amostral de teste no mínimo tão extremo como o que resulta dos dados amostrais, na suposição de a hipótese nula ser verdadeira.
Método do Valor P para o Teste de Hipóteses
35
Resultados amostrais incomuns. Diferença significante da hipótese nula.
Valores P pequenos (tais como 0,05 ou menor)
Valor P Interpretação
Os resultados amostrais não são incomuns. Não é uma diferença significante da hipótese nula.
Valores P grandes (acima de 0,05 )
36
Figura 7-8 Determinação dos Valores P
µ µEstatística de teste
Aestatística de
teste está à direita ou à esquerda do
centro?
Valor P = 2 vezesa área à esquerda
da estatística de teste
Valor P = 2 vezesa área à direitada estatística de teste
Início
Valor P = áreaà direita daestatística de teste
µEstatística de teste Estatística de teste
Valor P é duasvezes esta área
Valor P = áreaà esquerda daestatística de teste
tipo de testeQue
?
Unilateral esquerdo Unilateral direito
Bilateral
À direitaÀ esquerda
Valor P é duasvezes esta área
Valor PValor P
µEstatística de teste
37
Procedimento é o mesmo, exceto para os passos 6 e 7
Passo 6: Achar o valor P (como mostrado na Figura 7-8)
Passo 7: Reportar o valor P.
Rejeitar a hipótese nula se o valor P é no máximo igual ao nível de significância α.
Não rejeitar a hipótese nula se o valor P é maior do que o nível de significância α.
38
Teste de Afirmações com Intervalos de Confiança
Uma estimativa intervalar de um parâmetro populacional contém os valores prováveis daquele parâmetro. Devemos, por conseguinte, rejeitar uma afirmação de que o parâmetro populacional tenha um valor que não está compreendido no intervalo de confiança.
39
Razão Subjacente do Teste de Hipóteses
Se, sob uma dada suposição observada, a probabilidade de obtermos a amostra é excepcionalmente pequena, concluímos que a suposição provavelmente não é correta.
Ao testarmos uma afirmação, fazemos uma suposição (hipótese nula) que contém a igualdade. Comparamos então a suposição com os dados amostrais, e formulamos uma das conclusões seguintes:
40
Razão Subjacente do Teste de Hipóteses
Se os resultados amostrais podem ocorrer facilmente quando a suposição (hipótese nula) é verdadeira, atribuímos ao acaso a discrepância relativamente pequena entre a suposição e os resultados amostrais.
Se os resultados amostrais não são susceptíveis de ocorrer com facilidade quando a suposição (hipótese nula) é verdadeira, explicamos a discrepância relativamente grande entre a suposição e os resultados amostrais concluindo que a suposição não é verdadeira.
41
7-4
Teste de uma Afirmação sobre uma Média:
Pequenas Amostras
42
Hipótesespara testar afirmação sobre média populacional
1) A amostra é uma amostra aleatória simples.
2) A amostra é pequena (n ≤ 30).
3) O valor do desvio-padrão populacional σ é desconhecido.
4) A população original tem distribuição essencialmente normal.
43
Estatística de Teste para uma Distribuição t- Student
x -µxsn
t =
Valores CríticosValores tabelados
Graus de liberdade = n -1
Valores t críticos à esquerda da média são negativos.
44
Propriedades Importantes da Distribuição t de Student
1. A distribuição t de Student é diferente para cada tamanho de amostra.
2. A distribuição t de Student tem a mesma forma geral de sino da distribuição normal. Sua forma mais aberta reflete a maior variabilidade esperada em pequenas amostras.
3. A distribuição t de Student tem média t = 0 (tal como a distribuição normal padronizada que tem média z = 0).
4. O desvio-padrão da distribuição t de Student varia com o tamanho da amostra, e é maior do que 1 (ao contrário da distribuição normalpadronizada, em que σ = 1).
5. À medida que o tamanho n da amostra aumenta, a distribuição t deStudent se aproxima da distribuição normal. Para valores de n > 30, as diferenças são tão pequenas que podemos usar os valores críticos z em lugar de elaborar uma tabela muito maior de valores críticos de t. (Os valores na base da Tabela A-3 são iguais aos valores críticos zcorrespondentes da distribuição normal padronizada.)
45
Figura 7-11 Escolha entre a Distribuição Normal e a Distribuição t ao Testar uma Afirmação sobre a Média Populacional µ
n > 30?
Adistribuição da
população é essencialmentenormal ? (Trace um
histograma.)
Não
Sim
Sim
Não
Não
σ éconhecido
?
Use a distribuição normal com
x - µx
σ/ nZ =
(Se σ é desconhecido, use s.)
Use métodos não-paramétricos, que não exijam uma distribuição normal.
Use a distribuição normal com
x - µx
σ/ nZ =
(Este caso é raro.)
Use a distribuição t de Studentcom x - µx
s/ nt =
Início
46
7-5
Teste de uma Afirmação sobre uma Proporção
47
Hipótesespara testar afirmação sobre proporção populacional
1) A amostra é uma amostra aleatória simples.
2) São verificadas as condições para um experimento binomial.
3) As condições np ≥ 5 e n(1-p) ≥ 5 são ambas satisfeitas, de modo que a distribuição binomial das proporções amostrais pode ser aproximada por uma distribuição normal com µ = np e σ = np(1-p)
48
Notação
n = número de provas
p = proporção populacional (usada na hipótese nula)
q = 1 - p
∧p = x/n (proporção amostral)
49
Estatística para Teste de uma Afirmação sobre uma Proporção
p - ppqn
∧
z =
50
Método do Valor P
Conforme descrito anteriormente
Rejeitar a hipótese nula se o valor P é menor ou igual ao
nível de significância α.
51
p algumas vezes é dado diretamente“10% dos carros esportes observados são
vermelhos”está expresso como
p = 0,10
∧
∧
p algumas vezes deve ser calculado“96 das donas de casa pesquisadas tem
TV à cabo e 54 não”, é calculado usando
p = = = 0,64xn
96(96+54)
∧
∧
52
Estatística para Teste de uma Afirmação sobre uma Proporção
p - ppqn
∧
z =
z = = = = x - µ x - np n n p - px np
σ npq npq pqn n
∧
53
8 Inferências com Base em Duas
Amostras
8-1 Aspectos Gerais
8-2 Inferências sobre Duas Médias: Amostras Independentes e Grandes
8-3 Inferências sobre Duas Médias: Amostras Dependentes
54
8-1 Aspectos Gerais
Há muitas situações importantes em que se faz necessário comparar dois conjuntos
de dados amostrais.
55
8-2
Inferências sobre Duas Médias:Amostras Independentes e Grandes
56
DefiniçõesDuas Amostras: Independentes
Os valores amostrais escolhidos de uma população não tem qualquer relação com os valores amostrais extraídos da outra população. Se os valores de uma amostra estão relacionados com os valores de outra amostra, as amostras são dependentes. Estas amostras são freqüentemente chamadas amostras ligadas ou amostras emparelhadas.
57
Suposições
1. As duas amostras são independentes.
2. Os tamanhos das duas amostras são grandes. Ou seja, n1 > 30 e n2 > 30.
3. Ambas as amostras são amostras aleatórias simples.
58
Teste de HipótesesEstatística de Teste para Duas Médias:
Amostras Independentes e Grandes
(x1 - x2) - (µ1 - µ2)
n1 n2+σ1
. σ222
z =
59
Teste de HipótesesEstatística de Teste para Duas Médias:
Amostras Independentes e Grandesσ1 e σ2 : Se σ1 e σ2 não são conhecidos, utilizar em seu
seu lugar s1 e s2 desde que ambas as amostras sejam grandes.
P-valor: Usar o valor calculado da estatística de teste z, e determinar o P-valor através do mesmo procedimento resumido na Figura 7-8.
Valores críticos: Baseado no nível de significância α, determinar os valores críticos através do processo apresentado na Seção 7-2.
60
Coca versus PepsiConjunto de dados fornece pesos (em libras) de amostras de Coca e Pepsi (regulares). As estatísticas amostrais estão mostradas abaixo. Use o nível de significância de 0,01 para testar a afirmação que o peso médio da Coca regular é diferente do peso médio da Pepsi regular.
Coca Pepsin 36 36x 0,81682 0,82410s 0,007507 0,005701
61
Coca Versus Pepsi
62
Afirmação: µ1 ≠ µ2
Ho : µ1 = µ2
H1 : µ1 ≠ µ2
α = 0,01
Coca Versus Pepsi
Não rejeitar H0Rejeitar H0 Rejeitar H0
Z = - 2,575 Z = 2,575µ1 - µ2 = 0ou Z = 0
63
Coca Versus PepsiEstatística de Teste para Duas Médias:
Amostras Independentes e Grandes
z = (0,81682 – 0,82410) - 0
0,005701 20,0075707 2 +36 36
= - 4,63
64
Afirmação: µ1 ≠ µ2
Ho : µ1 = µ2
H1 : µ1 ≠ µ2
α = 0,01
Coca Versus Pepsi
Há evidência significativa para apoiar a afirmação que há uma diferença entre os pesos médios da Coca e da Pepsi.
Não rejeita H0Rejeita H0 Rejeita H0
Dados amostrais:z = - 4,63
Rejeita-se a Hipótese Nula
Z = - 2,575 Z = 2,575µ1 - µ2 = 0ou Z = 0
65
Intervalos de Confiança
(x1 - x2) - E < (µ1 - µ2) < (x1 - x2) + E
n1 n2+σ1 σ2
22
onde E = zα/2
66
8-3
Inferências sobre Duas Médias:Amostras Dependentes
67
Suposições1. Os dados amostrais consistem de amostras
emparelhadas (amostras dependentes de duas populações).
2. As amostras são amostras aleatórias simples.
3. Se o número de pares de dados amostrais é pequeno (n ≤ 30), então a população de diferenças dos valores pareados deve ser aproximadamente normalmente distribuídas.
68
Notação para Amostras Dependentes
µd = média das diferenças d para a população de dados emparelhados
d = valor médio das diferenças d para os dados amostrais emparelhados (igual à média dos valores de x - y )
sd = desvio-padrão das diferenças d para os dados amostrais emparelhados.
n = número de pares de dados.
69
Estatística de Teste para Dados Amostrais EmparelhadosTest Statistic for Matched Pairs
of Sample Data
d - µdsd
t =n
onde graus de liberdade = n - 1
70
Valores Críticos
Se n ≤ 30, os valores críticos são determinados através da Tabela A-3 (distribuição t de student).
Se n > 30, os valores críticos são determinados através da Tabela A- 2 (distribuição normal).
71
Intervalos de Confiança
d - E < µd < d + E
sdonde E = tα/2 n
graus de liberdade = n -1
72
Quanto Estudantes de Estatística (homens) Exageram sua Altura?
Usando os dados amostrais da Tabela 8-1 (com o outlier excluído), construir uma estimativa de um intervalo de 95% de confiança de µd, que é a média das diferenças entre as alturas relatadas pelos alunos(homens) e suas alturas medidas.
73
Tabela 8-1
Alturas Relatadas e Medidas (em polegadas) de Estudantes de Estatística
Estudante A B C D E F G H I J K L
Altura 68 74 82,25 66,5 69 68 71 70 70 67 68 70 Relatada
Altura 66,8 73,9 74,3 66,1 67,2 67,9 69,4 69,9 68,6 67,9 67,6 68,8Medida
Diferença 1,2 0,1 7,95 0,4 1,8 0,1 1,6 0,1 1,4 -0,9 0,4 1,2
outlier
74
Quanto Estudantes de Estatística (homens) Exageram em sua Altura?
d = 0,672727s = 0,825943n = 11tα/2 = 2,228 (determinado através da Tabela
A-3 com 10 graus de liberdade e 0,05 bilateral)
75
Quanto Estudantes de Estatística (homens) Exageram sua Altura?
sdnE = tα/2
E = (2,228)( )0,82594311
= 0,554841
76
0,12 < µd < 1,23
Quanto Estudantes de Estatística (homens) Exageram sua Altura?
A longo prazo, 95% de tais amostras levarão a limites do intervalo de confiança que contêm efetivamente a verdadeira média populacional das diferenças. Note que os limites do intervalo de confiança não contém 0, o que indica que o verdadeiro valor de µd é significativamente diferente de. Há evidência suficiente para apoiar a afirmação de que há diferença entre as alturas relatadas e as alturas medidas de estudantes do sexo masculino.