estatística: aplicação ao sensoriamento remoto …camilo/estatistica/pdf/07testehip.pdfuma...
TRANSCRIPT
Estatística: Aplicação ao Sensoriamento Remoto
SER 204 - ANO 2018
Teste de Hipótese
Camilo Daleles Rennó [email protected]
http://www.dpi.inpe.br/~camilo/estatistica/
Estimação de Parâmetros
2
Como já foi visto, um parâmetro pode ser estimado através de um único valor (estimador pontual) ou a partir de um intervalo de confiança
Por exemplo:
Isso é particularmente útil quando não se conhece nada a respeito do parâmetro e/ou distribuição estudada.
Mas se já houvesse uma ideia de qual deveria ser o valor deste parâmetro
desconhecido, haveria algum procedimento para comprovar ou refutar esta suposição?
amostra X1, X2, ..., Xn
X
f(x)
0
desconhecido
?
f( )
0
X
X
IC
𝑋
Teste de Hipótese
Uma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10?
X
Hipóteses H0 : = 10
H1: 10
Xz
n
(hipótese nula) (hipótese alternativa)
~ (0,1)N
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
Teste de Hipótese para
3
definição de uma estatística que relaciona o parâmetro ao seu estimador
(válida sob qualquer hipótese)
Pressuposições: a) População tem distribuição Normal ou
Teorema do Limite Central é válido b) Variância populacional 2 é conhecida
Uma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10?
X
Hipóteses H0 : = 10
H1: 10
Xz
n
Se H0 é verdadeira, então
10~ (0,1)
Xz N
n
(hipótese nula) (hipótese alternativa)
~ (0,1)N
z >>> 0
Se H0
falsa
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
z = 0
Se H0
verdadeira
z <<< 0
Se H0
falsa
Teste de Hipótese para
4
Quais os valores desta estatística indicariam que H0 seria verdadeira?
E quais os valores desta estatística indicariam que H0 seria falsa?
(válida somente se H0 for verdadeira)
Uma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10?
X
Hipóteses H0 : = 10
H1: 10
Xz
n
Se H0 é verdadeira, então
10~ (0,1)
Xz N
n
(hipótese nula) (hipótese alternativa)
~ (0,1)N
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
zcrít -zcrít
2
2
1
aceitação de H0
rejeição de H0
rejeição de H0
Região Crítica:
•aceito H0 se –zcrít < z < zcrít P(–zcrít < z < zcrít) = 1 -
•rejeito H0 caso contrário P(|z| > zcrít) =
Conclusão (sempre associada a um nível de significância )
Teste de Hipótese para
5
zcrít -zcrít
Teste de Hipótese para
Hipóteses H0 : = 10
H1: 10
Xz
n
Se H0 é verdadeira, então
10~ (0,1)
Xz N
n
(hipótese nula) (hipótese alternativa)
~ (0,1)N
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- +
(0,1)N
1,96 -1,96
1
aceitação de H0
rejeição de H0
rejeição de H0
Região Crítica:
•aceito H0 se –zcrít < z < zcrít P(–zcrít < z < zcrít) = 1 -
•rejeito H0 caso contrário P(|z| > zcrít) =
Conclusão (sempre associada a um nível de significância)
XUma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10? Por simplificação, consideremos que 2 = 16. Adote = 5%.
0
95% 2
2
2,5% 2,5%
10~ (0,1)
4
5
Xz N
11,3 101,625
4
5
z
•aceito H0 se –1,96 < z < 1,96
•rejeito H0 caso contrário
1,625
Conclusão: não há razões para discordar que a média seja de fato 10, adotando-se 5% de significância 6
Teste de Hipótese para
Em alguns casos, há evidências de que, se o parâmetro não for aquele definido na hipótese nula, ele será maior ou então menor do que o valor testado.
7
Neste caso, pode-se definir a hipótese alternativa como unilateral.
No exemplo anterior, 11,3X
Com esta média amostral, pode-se pensar que o verdadeiro valor de é na realidade maior do que aquele definido na hipótese nula (H0 : = 10).
10~ (0,1)
Xz N
n
Teste de Hipótese para
Hipóteses H0 : = 10
~ (0,1)X
z N
n
Se H0 é verdadeira, então 0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
zcrít
1
aceitação de H0
rejeição de H0
Região Crítica:
•aceito H0 se z < zcrít P(z < zcrít) = 1 -
•rejeito H0 caso contrário P(z > zcrít) =
Conclusão (sempre associada a um nível de significância )
H1: > 10 (teste unilateral)
8
XUma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10? Por simplificação, consideremos que 2 = 16. Adote = 5%.
se H0 for falso, então espera-se valores de z bem maiores que zero.
zcrít 1,645
10~ (0,1)
Xz N
n
Hipóteses H0 : = 10
~ (0,1)X
z N
n
Se H0 é verdadeira, então 0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
Região Crítica:
•aceito H0 se z < zcrít P(z < zcrít) = 1 -
•rejeito H0 caso contrário P(z > zcrít) =
Conclusão (sempre associada a um nível de significância)
H1: > 10 (teste unilateral)
Teste de Hipótese para
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
95%
•aceito H0 se z < 1,645
•rejeito H0 caso contrário
1,625
Conclusão: não há razões para discordar que a média seja de fato 10, adotando-se 5% de significância
aceitação de H0
rejeição de H0
11,3 101,625
4
5
z
9
XUma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10? Por simplificação, consideremos que 2 = 16. Adote = 5%.
5%
Teste de Hipótese para 2
(hipótese nula) (hipótese alternativa)
22
12
( 1)~ n
n sX
Se H0 é verdadeira, então
22
1
( 1)~
4n
n sX
aceitação
de H0 rejeição de H0
rejeição de H0
Região Crítica:
•aceito H0 se xa < X < xb P(xa < X < xb) = 1 -
•rejeito H0 caso contrário
Conclusão (sempre associada a um nível de significância )
2
2
2
1n
0 + ax bx
1
10
Uma v.a. qualquer tem uma distribuição normal com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a variância amostral. Teste a hipótese de que a verdadeira variância 2 seja igual a 4.
Hipóteses H0 :
2 = 4
H1: 2 4
22
12
( 1)~ n
n sX
Teste de Hipótese para 2
?
2,5%2,5%
2
24
0 + ax bx
95%
?
Hipóteses H0 :
2 = 4
H1: 2 4
Se H0 é verdadeira, então
Região Crítica:
22
24
24~
4
sX
24.2,3414,04
4X
11
Uma v.a. qualquer tem uma distribuição normal com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a variância amostral. Teste a hipótese de que a verdadeira variância 2 seja igual a 4. Suponha que s2 = 2,34. Considere = 5%.
g 0,005 0,010 0,025 0,050 0,100 0,900 0,950 0,975 0,990 0,995
1 7,88 6,63 5,02 3,84 2,71 0,016 0,0039 0,0010 0,00016 0,00004
2 10,60 9,21 7,38 5,99 4,61 0,21 0,10 0,051 0,020 0,010
3 12,84 11,34 9,35 7,81 6,25 0,58 0,35 0,22 0,11 0,072
4 14,86 13,28 11,14 9,49 7,78 1,06 0,71 0,48 0,30 0,21
5 16,75 15,09 12,83 11,07 9,24 1,61 1,15 0,83 0,55 0,41
6 18,55 16,81 14,45 12,59 10,64 2,20 1,64 1,24 0,87 0,68
7 20,28 18,48 16,01 14,07 12,02 2,83 2,17 1,69 1,24 0,99
8 21,95 20,09 17,53 15,51 13,36 3,49 2,73 2,18 1,65 1,34
9 23,59 21,67 19,02 16,92 14,68 4,17 3,33 2,70 2,09 1,73
10 25,19 23,21 20,48 18,31 15,99 4,87 3,94 3,25 2,56 2,16
11 26,76 24,72 21,92 19,68 17,28 5,58 4,57 3,82 3,05 2,60
12 28,30 26,22 23,34 21,03 18,55 6,30 5,23 4,40 3,57 3,07
13 29,82 27,69 24,74 22,36 19,81 7,04 5,89 5,01 4,11 3,57
14 31,32 29,14 26,12 23,68 21,06 7,79 6,57 5,63 4,66 4,07
15 32,80 30,58 27,49 25,00 22,31 8,55 7,26 6,26 5,23 4,60
16 34,27 32,00 28,85 26,30 23,54 9,31 7,96 6,91 5,81 5,14
17 35,72 33,41 30,19 27,59 24,77 10,09 8,67 7,56 6,41 5,70
18 37,16 34,81 31,53 28,87 25,99 10,86 9,39 8,23 7,01 6,26
19 38,58 36,19 32,85 30,14 27,20 11,65 10,12 8,91 7,63 6,84
20 40,00 37,57 34,17 31,41 28,41 12,44 10,85 9,59 8,26 7,43
21 41,40 38,93 35,48 32,67 29,62 13,24 11,59 10,28 8,90 8,03
22 42,80 40,29 36,78 33,92 30,81 14,04 12,34 10,98 9,54 8,64
23 44,18 41,64 38,08 35,17 32,01 14,85 13,09 11,69 10,20 9,26
24 45,56 42,98 39,36 36,42 33,20 15,66 13,85 12,40 10,86 9,89
25 46,93 44,31 40,65 37,65 34,38 16,47 14,61 13,12 11,52 10,52
26 48,29 45,64 41,92 38,89 35,56 17,29 15,38 13,84 12,20 11,16
27 49,64 46,96 43,19 40,11 36,74 18,11 16,15 14,57 12,88 11,81
28 50,99 48,28 44,46 41,34 37,92 18,94 16,93 15,31 13,56 12,46
29 52,34 49,59 45,72 42,56 39,09 19,77 17,71 16,05 14,26 13,12
30 53,67 50,89 46,98 43,77 40,26 20,60 18,49 16,79 14,95 13,79
40 66,77 63,69 59,34 55,76 51,81 29,05 26,51 24,43 22,16 20,71
50 79,49 76,15 71,42 67,50 63,17 37,69 34,76 32,36 29,71 27,99
60 91,95 88,38 83,30 79,08 74,40 46,46 43,19 40,48 37,48 35,53
70 104,21 100,43 95,02 90,53 85,53 55,33 51,74 48,76 45,44 43,28
80 116,32 112,33 106,63 101,88 96,58 64,28 60,39 57,15 53,54 51,17
90 128,30 124,12 118,14 113,15 107,57 73,29 69,13 65,65 61,75 59,20
100 140,17 135,81 129,56 124,34 118,50 82,36 77,93 74,22 70,06 67,33
Distribuição 2
0 + 2
t
2 2( )g tP
2
24( ) 0,975aP x
12
2
24( ) 0,025bP x
22
12
( 1)~ n
n sX
Teste de Hipótese para 2
? 12,40
2,5%2,5%
2
24
0 + ax bx
95%
? 39,36
Hipóteses H0 :
2 = 4
H1: 2 4
Se H0 é verdadeira, então
Região Crítica:
•aceito H0 se 12,40 < X < 39,36
•rejeito H0 caso contrário
Conclusão: Aceito H0, ou seja, não há razões para discordar que, a 5%, 2 = 4.
22
24
24~
4
sX
24.2,3414,04
4X
13
Uma v.a. qualquer tem uma distribuição normal com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a variância amostral. Teste a hipótese de que a verdadeira variância 2 seja igual a 4. Suponha que s2 = 2,34. Considere = 5%.
rejeição de H0
Teste de Hipótese para com 2 desconhecida
1~ n
Xt t
s
n
Se H0 é verdadeira, então
1
15~ n
Xt t
s
n
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
1nt
tcrít
Hipóteses
14
H0 : = 15 (hipótese nula) H1: < 15 (hipótese alternativa unilateral)
Região Crítica:
•aceito H0 se t > tcrít P(t > tcrít) = 1 -
•rejeito H0 caso contrário
Conclusão (sempre associada a um nível de significância )
1
aceitação de H0
Uma v.a. qualquer tem uma distribuição normal com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média amostral e a variância amostral. Supondo que e s2 = 4,5, teste a hipótese unilateral de que = 15. 12,7X
rejeição de H0
Teste de Hipótese para com 2 desconhecida
1~ n
Xt t
s
n
Se H0 é verdadeira, então
24
15~
Xt t
s
n
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
24t
?
Hipóteses H0 : = 15
H1: < 15
15
Região Crítica:
1%99%
aceitação de H0
12,7 155,43
2,12
25
t
Uma v.a. qualquer tem uma distribuição normal com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média amostral e a variância amostral. Supondo que e s2 = 4,5, teste a hipótese unilateral de que = 15. Considere = 1%.
12,7X
Distribuição t de Student
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0 t
( )gP T t
g 0,1 0,05 0,025 0,01 0,005
1 3,078 6,314 12,706 31,821 63,656
2 1,886 2,920 4,303 6,965 9,925
3 1,638 2,353 3,182 4,541 5,841
4 1,533 2,132 2,776 3,747 4,604
5 1,476 2,015 2,571 3,365 4,032
6 1,440 1,943 2,447 3,143 3,707
7 1,415 1,895 2,365 2,998 3,499
8 1,397 1,860 2,306 2,896 3,355
9 1,383 1,833 2,262 2,821 3,250
10 1,372 1,812 2,228 2,764 3,169
11 1,363 1,796 2,201 2,718 3,106
12 1,356 1,782 2,179 2,681 3,055
13 1,350 1,771 2,160 2,650 3,012
14 1,345 1,761 2,145 2,624 2,977
15 1,341 1,753 2,131 2,602 2,947
16 1,337 1,746 2,120 2,583 2,921
17 1,333 1,740 2,110 2,567 2,898
18 1,330 1,734 2,101 2,552 2,878
19 1,328 1,729 2,093 2,539 2,861
20 1,325 1,725 2,086 2,528 2,845
21 1,323 1,721 2,080 2,518 2,831
22 1,321 1,717 2,074 2,508 2,819
23 1,319 1,714 2,069 2,500 2,807
24 1,318 1,711 2,064 2,492 2,797
25 1,316 1,708 2,060 2,485 2,787
26 1,315 1,706 2,056 2,479 2,779
27 1,314 1,703 2,052 2,473 2,771
28 1,313 1,701 2,048 2,467 2,763
29 1,311 1,699 2,045 2,462 2,756
30 1,310 1,697 2,042 2,457 2,750
40 1,303 1,684 2,021 2,423 2,704
50 1,299 1,676 2,009 2,403 2,678
60 1,296 1,671 2,000 2,390 2,660
120 1,289 1,658 1,980 2,358 2,617 1,282 1,645 1,960 2,326 2,576
24( ) 0,01P T t
24( 2,492) 0,01P T
16
rejeição de H0
Teste de Hipótese para com 2 desconhecida
Uma v.a. qualquer tem uma distribuição normal com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média amostral e a variância amostral. Supondo que e s2 = 4,5, teste a hipótese unilateral de que = 15. Considere = 1%.
12,7X
1~ n
Xt t
s
n
Se H0 é verdadeira, então
24
15~
Xt t
s
n
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
24t
- 2,492
Hipóteses H0 : = 15
H1: < 15
17
Região Crítica:
•aceito H0 se t > -2,492
•rejeito H0 caso contrário
Conclusão: rejeito H0, ou seja, a média é significativamente (a 1%) menor que 15
1%99%
aceitação de H0
12,7 155,43
2,12
25
t
ˆ~ (0,1)
p pN
pq
n
Teste de Hipótese para p
Hipóteses H0 : p = p0
H1: p p0
Se H0 é verdadeira, então
0
0 0
ˆ~ (0,1)
p pz N
p q
n
Região Crítica:
•aceito H0 se –zcrít < z < zcrít P(–zcrít < z < zcrít) = 1 -
•rejeito H0 caso contrário P(|z| > zcrít) =
Conclusão (sempre associada a um nível de significância )
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
2
2
1
aceitação de H0
zcrít -zcrít
rejeição de H0
rejeição de H0
18
diferença para a abordagem do
IC para p
Teste de Hipótese – Erros I e II
Imagine a seguinte situação: Hipóteses H0 : = 0 H1: > 0 Mesmo sendo H0 verdadeira, existe a possibilidade de se selecionar uma amostra desta
população e obter uma média amostral 𝑋 tão alta que leve a conclusão errada de que H0 é falsa?
0 ~ (0,1)X
z N
n
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
zcrít
1
19
Toda conclusão de um teste de hipótese está associada a um nível de significância e portanto não pode ser considerado 100% confiável.
Se H0 é verdadeira, então
rejeita H0 aceita H0
amostra {X1, X2, X3, X4, X5}
𝑋 >>> 0
z > zcrít
H0 falsa
X
f(x)
0 0
Teste de Hipótese – Erros I e II
Sim. Este erro é chamado de erro do tipo I e equivale ao nível de significância .
20
Este erro é sempre conhecido sendo, em geral, definido previamente pelo tomador de decisão.
Imagine a seguinte situação: Hipóteses H0 : = 0 H1: > 0 Mesmo sendo H0 verdadeira, existe a possibilidade de se selecionar uma amostra desta
população e obter uma média amostral 𝑋 tão alta que leve a conclusão errada de que H0 é falsa?
Toda conclusão de um teste de hipótese está associada a um nível de significância e portanto não pode ser considerado 100% confiável.
Teste de Hipótese – Erros I e II
21
Toda conclusão de um teste de hipótese está associada a um nível de significância e portanto não pode ser considerado 100% confiável.
Imagine a seguinte situação: Hipóteses H0 : = 0 H1: > 0 Agora, sendo H0 falsa, existe a
possibilidade de se selecionar uma amostra desta população cuja média verdadeira é 1 (> 0) e obter uma média amostral 𝑋 tão pequena que leve a conclusão errada de que H0 é verdadeira?
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
~ (0,1)z N
zcrít
1
2 00~ ( , )
n
XX N z
n
Se H0 fosse verdadeira:
rejeita H0 aceita H0
Teste de Hipótese – Erros I e II
22
Toda conclusão de um teste de hipótese está associada a um nível de significância e portanto não pode ser considerado 100% confiável.
Imagine a seguinte situação: Hipóteses H0 : = 0 H1: > 0 Agora, sendo H0 falsa, existe a
possibilidade de se selecionar uma amostra desta população cuja média verdadeira é 1 (> 0) e obter uma média amostral 𝑋 tão pequena que leve a conclusão errada de que H0 é verdadeira?
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
2
0~ ( , )n
X N
1
crítX
0crít crítX zn
rejeita H0 aceita H0
Se H0 for, de fato, falsa: 2
1 1 0~ ( , )n
X N
1
2
1~ ( , )n
X N
Sim. Este erro é chamado de erro do tipo II ou erro .
Teste de Hipótese – Erros I e II
23
Toda conclusão de um teste de hipótese está associada a um nível de significância e portanto não pode ser considerado 100% confiável.
Imagine a seguinte situação: Hipóteses H0 : = 0 H1: > 0 Agora, sendo H0 falsa, existe a
possibilidade de se selecionar uma amostra desta população cuja média verdadeira é 1 (> 0) e obter uma média amostral 𝑋 tão pequena que leve a conclusão errada de que H0 é verdadeira?
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
2
0~ ( , )n
X N
1
crítX
rejeita H0 aceita H0
Se H0 for, de fato, falsa: 2
1 1 0~ ( , )n
X N
1
2
1~ ( , )n
X N
Sim. Este erro é chamado de erro do tipo II ou erro .
Este erro é quase sempre negligenciado sendo influenciado por diversos fatores (ver detalhes adiante).
Teste de Hipótese – Erros I e II
Hipóteses H0 : = 0 H1: > 0
H0 é verd. H0 é falso
Aceita H0
Rejeita H0
1 -
1 -
Alternativas para diminuir :
• distanciar 1 de 0 • aumentar • aumentar n melhor opção!!!
24
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
2
0~ ( , )n
X N
1
crítX
rejeita H0 aceita H0
1
2
1~ ( , )n
X N
P(rejeitar H0 / H0 é verdadeira) = (nível de significância ou erro do tipo I) P(aceitar H0 / H0 é verdadeira) = 1 - (nível de confiança) P(aceitar H0 / H1 é verdadeira) = (erro do tipo II) P(rejeitar H0 / H1 é verdadeira) = 1 - (poder do teste)
Cálculo do erro tipo II (erro )
XExemplo: uma amostra de 25 valores foi selecionada, chegando-se a uma média amostral igual a 11,3. Através de um teste z unilateral, chegou-se a conclusão de que a verdadeira média poderia ser igual a 10, adotando-se um nível de significância de 5% (considerando 2 = 16). Mas qual a probabilidade de chegarmos a esta mesma conclusão, sendo a verdadeira média igual a 12, ou seja, qual o valor de ?
H0 : = 10
H1: > 10
~ (0,1)X
z N
n
Se H0 é verdadeira, então
10~ (0,1)
Xz N
n
11,3 101,625
4
5
z
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
5%
95%
zcrít = ? 1,645
aceito H0 se z < 1,645 rejeito H0 se z > 1,645
Conclusão: Aceito H0 Aceito H0, ou seja, a média é igual a 10
considerando 5% de significância
25
Cálculo do erro tipo II (erro )
Agora, considerando = 12
H0 : = 10
H1: = 12
0(aceitar H ) ( 1,645)P P Z
= P(aceitar H0 / H1 é verdadeiro)
26
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
5%
95%
zcrít = 1,645
H0 verdadeiro
aceitação de H0
0
10(aceitar H ) ( 1,645)
4
5
XP P
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- 10
5%
95%
H0
aceitação de H0
Cálculo do erro tipo II (erro )
0(aceitar H ) ( 11,316)P P X
H1
+ 12
( 11,316 / 12)P X
( 0,855)P Z ( 0,855) 0,1963 19,63%P Z
Agora, considerando = 12
H0 : = 10
H1: = 12
= P(aceitar H0 / H1 é verdadeiro)
27 Mas, e para outras hipóteses alternativas?
11,316crítX
0(aceitar H ) ( 1,645)P P Z
0
10(aceitar H ) ( 1,645)
4
5
XP P
12 11,316 12( )
4 4
5 5
XP
Cálculo do erro tipo II (erro )
Este resultado indica que há uma alta probabilidade de se aceitar erroneamente a hipótese de que a média é igual a 10, mesmo sendo, de fato, a média igual a 11
Mas como diminuir este erro, conservando-se o mesmo nível de significância ()?
<< aumentando-se o tamanho da amostra! >>
H0 : = 10
H1: = 11
= P(aceitar H0 / H1 é verdadeiro)
28
65,36%
Considerando que a verdadeira média seja de fato igual a 11...
5%
25n
50n
100n
1000n
Cálculo do erro tipo II (erro )
H0 : = 10
H1: = 11
= P(aceitar H0 / H1 é verdadeiro)
29
Considerando que a verdadeira média seja de fato igual a 11...
5%
65,36% para n = 25
45,11% para n = 50
19,62% para n = 100
81,91.10 % para n = 1000
Teste de Hipótese – valor-P (p-value) Toda conclusão de um teste de hipótese está associada a um nível de
significância. Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se
concluir que a média é maior que 20 uma vez que a estatística z obtida foi de 2,5 (zcrítico = 1,645)”.
A média continuaria ser significativamente maior do que 20 se fosse adotado um nível de significância de 1%?
Para responder a esta pergunta, é necessário calcular o novo z crítico!
2,5
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
5%
95%
1,645
Aceita H0 Rejeita H0
H0 : = 20
H1: > 20
~ (0,1)
2,5
Xz N
n
z
Se H0 é verdadeira, então
30
Conclusão: Rejeita-se H0 a 5%, ou seja, a média parece ser mesmo maior que 20.
Para = 1%, zcrítico = 2,33. Sendo assim, rejeita-se H0, ou seja, pode ser considerado maior que 20.
Teste de Hipótese – valor-P (p-value)
2,5
H0 : = 20
H1: > 20
~ (0,1)
2,5
Xz N
n
z
Se H0 é verdadeira, então
2,5
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
1%
99%
2,33
Aceita H0 Rejeita H0
Toda conclusão de um teste de hipótese está associada a um nível de significância.
Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se concluir que a média é maior que 20 uma vez que a estatística z obtida foi de 2,5 (zcrítico = 1,645)”.
31
Para que valores de , a média poderia ser considerada igual a 20?
Conclusão: Rejeita-se H0 a 1%
Teste de Hipótese – valor-P (p-value)
2,5
H0 : = 20
H1: > 20
~ (0,1)
2,5
Xz N
n
z
Se H0 é verdadeira, então
2,5
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
Aceita H0 Rejeita H0
? 0,62%
Pode-se aceitar H0 para qualquer nível de significância () menor que 0,62% uma vez que valor-P = P(Z > 2,5) = 0,62%
valor-P = P(Z > z)
Toda conclusão de um teste de hipótese está associada a um nível de significância.
Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se concluir que a média é maior que 20 uma vez que a estatística z obtida foi de 2,5 (zcrítico = 1,645)”.
32
Para = 1%, zcrítico = 2,33. Sendo assim, rejeita-se H0, ou seja, pode ser considerado maior que 20.
Para que valores de , a média poderia ser considerada igual a 20?
Teste de Hipótese – valor-P (p-value) De fato, o valor-P refere-se à probabilidade de se obter uma estatística com um
valor tão extremo (muito grande ou muito pequeno) quanto ao obtido para uma amostra em particular.
Este conceito pode ser aplicado para qualquer distribuição. Mas qual lado da distribuição devo escolher? Sempre o lado que inclui a área de rejeição de H0 ou aquele em que os valores
mais raros estejam “mais próximos” da estatística calculada para a amostra
33
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20
- + 0
(0,1)N
2
1n
0 +
2
1n
0 +
z X X
valor-P = P(Z > z) valor-P = P(2 > X) valor-P = P(2 < X)
Teste de Hipótese – valor-P (p-value)
34
O valor-P quase sempre se refere a uma interpretação de um teste unilateral pois é calculado considerando-se apenas um dos lados da distribuição
2
1n
0 +
X
valor-P = P(2 < X) Nos casos em que se pretende utilizar o valor-P para tirar conclusões a partir de testes bilaterais, basta multiplicar o valor-P por 2.
valor-P bilateral = 2*P(2 < X)
Para se calcular o valor-P, em geral, não é possível utilizar tabelas de probabilidade, necessitando o uso de funções específicas em programas como o R ou o Excel
R: pchisq(x,gl) Excel: DIST.QUIQUA(x;gl;1)
Na prática, H0 será rejeitado toda vez que o valor-P for menor que o nível de
significância () escolhido
ambas funções calculam a área a esquerda do ponto!
Teste de Hipótese – valor-P (p-value) Exemplo: Foram coletadas amostras (50 pontos) em mapas a fim de avaliar sua
exatidão. Procedeu-se o teste z para verificar quais deles possuíam exatidão (p) de 0,90 (ou 90%). A tabela abaixo apresenta a exatidão estimada, o resultado do teste (estatística z) e o valor-P de cada mapa.
z valor-P
Mapa 1 0,87 -0,707 0,2397
Mapa 2 0,62 -6,600 2,07.10-11
Mapa 3 0,82 -1,886 0,0297
Mapa 4 0,84 -1,414 0,0786
p̂
Quais mapas possuem exatidão menor que 0,90, com 5% de significância?
Quais mapas possuem exatidão menor que 0,90, com 1% de significância?
Mapas 2 e 3
Somente Mapa 2
p̂ pz
pq
n
35
Hipóteses H0 : p = 0,90
H1: p < 0,90
Inferência entre parâmetros de duas populações
1 2
1 1( )E X 2 2( )E X
1X
n1
2X
n2
Mesmo não se conhecendo as médias 1 e 2, seria possível verificar se elas são iguais a partir de seus valores amostrais?
Se 1 e 2 são iguais, então 1 - 2 = ?
36
0
1 2X XPara avaliar se essa hipótese é válida, deve-se investigar a distribuição de
Teste de Hipótese para 1 = 2
1 2 1 2
2 2
1 2
1 2
( ) ( )~ (0,1)
X XN
n n
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
zcrít -zcrít
2
2
1
desconhecidas, mas conhecidas i2
i
Se H0 é verdadeira, então
1 2
2 2
1 2
1 2
~ (0,1)X X
z N
n n
Hipóteses H0 : 1 - 2 = 0 (1 = 2)
H1: 1 - 2 0
Região Crítica:
•aceito H0 se –zcrít < z < zcrít P(–zcrít < z < zcrít) = 1 -
•rejeito H0 caso contrário P(|z| > zcrít) =
37
Teste de Hipótese para 1 = 2
1 2
1 2 1 222 2
1 1 2 2
1 2 1 2
( ) ( )~
( 1) ( 1) 1 1
2
n n
X Xt
n s n s
n n n n
e desconhecidas mas i2
i
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
1 2 2n nt
tcrít -tcrít
2
2
1
2 2
1 2 Hipóteses H0 : 1 - 2 = 0 (1 = 2)
H1: 1 - 2 0
Se H0 é verdadeira, então
1 2
1 22
2 2
1 1 2 2
1 2 1 2
~( 1) ( 1) 1 1
2
n n
X Xt t
n s n s
n n n n
(t homocedástico)
Região Crítica:
•aceito H0 se –tcrít < t < tcrít P(–tcrít < t < tcrít) = 1 -
•rejeito H0 caso contrário P(|t| > tcrít) =
38
Teste de Hipótese para 1 = 2
1 2 1 2
2 2
1 2
1 2
( ) ( )~ g
X Xt
s s
n n
e desconhecidas mas i2
i
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
gt
tcrít -tcrít
2
2
1
(t heterocedástico)
2 2
1 2 Hipóteses H0 : 1 - 2 = 0 (1 = 2)
H1: 1 - 2 0
Se H0 é verdadeira, então
1 2
2 2
1 2
1 2
~ g
X Xt t
s s
n n
22 2
1 2
1 2
2 22 2
1 2
1 2
1 21 1
s s
n ng
s s
n n
n n
Região Crítica:
•aceito H0 se –tcrít < t < tcrít P(–tcrít < t < tcrít) = 1 -
•rejeito H0 caso contrário P(|t| > tcrít) =
39
Exemplo: duas v.a. quaisquer têm distribuições normais com médias e variâncias desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Teste a hipótese de que as médias populacionais não diferem significativamente a 5% entre si, considerando que:
Teste de Hipótese para 1 = 2
Usar teste t homocedástico ou heterocedástico?
primeiramente deve-se testar se 2 2
1 2
40
2 2
1 1 1 2 2 226 10,3 2,34 41 15,7 1,91n X s n X s
Exemplo: duas v.a. quaisquer têm distribuições normais com médias e variâncias desconhecidas. Retira-se uma amostra de cada população e calculam-se a média e a variância para cada amostra. Teste a hipótese de que as médias populacionais não diferem significativamente a 5% entre si, considerando que:
2 2
1 1 1 2 2 226 10,3 2,34 41 15,7 1,91n X s n X s
Teste de Hipótese para 2 2
1 2 2 2
1 2
?
2,5%2,5%
25;40F
0 +
?
Se H0 é verdadeira, então
Região Crítica:
1 2
2 2
1 21; 12 2
2 1
~ n n
sF
s
1 2
2
11; 12
2
~ n n
sF F
s
Hipóteses 2 2 2 2
0 1 2 1 2
2 2
1 1 2
H : / 1 ( )
H : / 1
41
af bf
95%
g1
1 2 3 4 5 6 7 8 9 10 11 12 15 20 25 30 40 50 100
1 647,789 799,500 864,163 899,583 921,848 937,111 948,217 956,656 963,285 968,627 973,025 976,708 984,867 993,103 998,081 1001,414 1005,598 1008,117 1013,175
2 38,5063 39,0000 39,1655 39,2484 39,2982 39,3315 39,3552 39,3730 39,3869 39,3980 39,4071 39,4146 39,4313 39,4479 39,4579 39,4646 39,4729 39,4779 39,4879
3 17,4434 16,0441 15,4392 15,1010 14,8848 14,7347 14,6244 14,5399 14,4731 14,4189 14,3742 14,3366 14,2527 14,1674 14,1155 14,0805 14,0365 14,0099 13,9563
4 12,2179 10,6491 9,9792 9,6045 9,3645 9,1973 9,0741 8,9796 8,9047 8,8439 8,7935 8,7512 8,6565 8,5599 8,5010 8,4613 8,4111 8,3808 8,3195
5 10,0070 8,4336 7,7636 7,3879 7,1464 6,9777 6,8531 6,7572 6,6811 6,6192 6,5678 6,5245 6,4277 6,3286 6,2679 6,2269 6,1750 6,1436 6,0800
6 8,8131 7,2599 6,5988 6,2272 5,9876 5,8198 5,6955 5,5996 5,5234 5,4613 5,4098 5,3662 5,2687 5,1684 5,1069 5,0652 5,0125 4,9804 4,9154
7 8,0727 6,5415 5,8898 5,5226 5,2852 5,1186 4,9949 4,8993 4,8232 4,7611 4,7095 4,6658 4,5678 4,4667 4,4045 4,3624 4,3089 4,2763 4,2101
8 7,5709 6,0595 5,4160 5,0526 4,8173 4,6517 4,5286 4,4333 4,3572 4,2951 4,2434 4,1997 4,1012 3,9995 3,9367 3,8940 3,8398 3,8067 3,7393
9 7,2093 5,7147 5,0781 4,7181 4,4844 4,3197 4,1970 4,1020 4,0260 3,9639 3,9121 3,8682 3,7694 3,6669 3,6035 3,5604 3,5055 3,4719 3,4034
10 6,9367 5,4564 4,8256 4,4683 4,2361 4,0721 3,9498 3,8549 3,7790 3,7168 3,6649 3,6209 3,5217 3,4185 3,3546 3,3110 3,2554 3,2214 3,1517
11 6,7241 5,2559 4,6300 4,2751 4,0440 3,8807 3,7586 3,6638 3,5879 3,5257 3,4737 3,4296 3,3299 3,2261 3,1616 3,1176 3,0613 3,0268 2,9561
12 6,5538 5,0959 4,4742 4,1212 3,8911 3,7283 3,6065 3,5118 3,4358 3,3736 3,3215 3,2773 3,1772 3,0728 3,0077 2,9633 2,9063 2,8714 2,7996
13 6,4143 4,9653 4,3472 3,9959 3,7667 3,6043 3,4827 3,3880 3,3120 3,2497 3,1975 3,1532 3,0527 2,9477 2,8821 2,8372 2,7797 2,7443 2,6715
14 6,2979 4,8567 4,2417 3,8919 3,6634 3,5014 3,3799 3,2853 3,2093 3,1469 3,0946 3,0502 2,9493 2,8437 2,7777 2,7324 2,6742 2,6384 2,5646
g2 15 6,1995 4,7650 4,1528 3,8043 3,5764 3,4147 3,2934 3,1987 3,1227 3,0602 3,0078 2,9633 2,8621 2,7559 2,6894 2,6437 2,5850 2,5488 2,4739
16 6,1151 4,6867 4,0768 3,7294 3,5021 3,3406 3,2194 3,1248 3,0488 2,9862 2,9337 2,8890 2,7875 2,6808 2,6138 2,5678 2,5085 2,4719 2,3961
17 6,0420 4,6189 4,0112 3,6648 3,4379 3,2767 3,1556 3,0610 2,9849 2,9222 2,8696 2,8249 2,7230 2,6158 2,5484 2,5020 2,4422 2,4053 2,3285
18 5,9781 4,5597 3,9539 3,6083 3,3820 3,2209 3,0999 3,0053 2,9291 2,8664 2,8137 2,7689 2,6667 2,5590 2,4912 2,4445 2,3842 2,3468 2,2692
19 5,9216 4,5075 3,9034 3,5587 3,3327 3,1718 3,0509 2,9563 2,8801 2,8172 2,7645 2,7196 2,6171 2,5089 2,4408 2,3937 2,3329 2,2952 2,2167
20 5,8715 4,4613 3,8587 3,5147 3,2891 3,1283 3,0074 2,9128 2,8365 2,7737 2,7209 2,6758 2,5731 2,4645 2,3959 2,3486 2,2873 2,2493 2,1699
21 5,8266 4,4199 3,8188 3,4754 3,2501 3,0895 2,9686 2,8740 2,7977 2,7348 2,6819 2,6368 2,5338 2,4247 2,3558 2,3082 2,2465 2,2081 2,1280
22 5,7863 4,3828 3,7829 3,4401 3,2151 3,0546 2,9338 2,8392 2,7628 2,6998 2,6469 2,6017 2,4984 2,3890 2,3198 2,2718 2,2097 2,1710 2,0901
23 5,7498 4,3492 3,7505 3,4083 3,1835 3,0232 2,9023 2,8077 2,7313 2,6682 2,6152 2,5699 2,4665 2,3567 2,2871 2,2389 2,1763 2,1374 2,0557
24 5,7166 4,3187 3,7211 3,3794 3,1548 2,9946 2,8738 2,7791 2,7027 2,6396 2,5865 2,5411 2,4374 2,3273 2,2574 2,2090 2,1460 2,1067 2,0243
25 5,6864 4,2909 3,6943 3,3530 3,1287 2,9685 2,8478 2,7531 2,6766 2,6135 2,5603 2,5149 2,4110 2,3005 2,2303 2,1816 2,1183 2,0787 1,9955
30 5,5675 4,1821 3,5894 3,2499 3,0265 2,8667 2,7460 2,6513 2,5746 2,5112 2,4577 2,4120 2,3072 2,1952 2,1237 2,0739 2,0089 1,9681 1,8816
40 5,4239 4,0510 3,4633 3,1261 2,9037 2,7444 2,6238 2,5289 2,4519 2,3882 2,3343 2,2882 2,1819 2,0677 1,9943 1,9429 1,8752 1,8324 1,7405
50 5,3403 3,9749 3,3902 3,0544 2,8327 2,6736 2,5530 2,4579 2,3808 2,3168 2,2627 2,2162 2,1090 1,9933 1,9186 1,8659 1,7963 1,7520 1,6558
100 5,1786 3,8284 3,2496 2,9166 2,6961 2,5374 2,4168 2,3215 2,2439 2,1793 2,1245 2,0773 1,9679 1,8486 1,7705 1,7148 1,6401 1,5917 1,4833
Distribuição F
0 + F
1 2,( ) 0,025g gP F F
25,40( ) 0,025bP F f
42
25,40( 1,99) 0,025P F
g1
1 2 3 4 5 6 7 8 9 10 11 12 15 20 25 30 40 50 100
1 647,789 799,500 864,163 899,583 921,848 937,111 948,217 956,656 963,285 968,627 973,025 976,708 984,867 993,103 998,081 1001,414 1005,598 1008,117 1013,175
2 38,5063 39,0000 39,1655 39,2484 39,2982 39,3315 39,3552 39,3730 39,3869 39,3980 39,4071 39,4146 39,4313 39,4479 39,4579 39,4646 39,4729 39,4779 39,4879
3 17,4434 16,0441 15,4392 15,1010 14,8848 14,7347 14,6244 14,5399 14,4731 14,4189 14,3742 14,3366 14,2527 14,1674 14,1155 14,0805 14,0365 14,0099 13,9563
4 12,2179 10,6491 9,9792 9,6045 9,3645 9,1973 9,0741 8,9796 8,9047 8,8439 8,7935 8,7512 8,6565 8,5599 8,5010 8,4613 8,4111 8,3808 8,3195
5 10,0070 8,4336 7,7636 7,3879 7,1464 6,9777 6,8531 6,7572 6,6811 6,6192 6,5678 6,5245 6,4277 6,3286 6,2679 6,2269 6,1750 6,1436 6,0800
6 8,8131 7,2599 6,5988 6,2272 5,9876 5,8198 5,6955 5,5996 5,5234 5,4613 5,4098 5,3662 5,2687 5,1684 5,1069 5,0652 5,0125 4,9804 4,9154
7 8,0727 6,5415 5,8898 5,5226 5,2852 5,1186 4,9949 4,8993 4,8232 4,7611 4,7095 4,6658 4,5678 4,4667 4,4045 4,3624 4,3089 4,2763 4,2101
8 7,5709 6,0595 5,4160 5,0526 4,8173 4,6517 4,5286 4,4333 4,3572 4,2951 4,2434 4,1997 4,1012 3,9995 3,9367 3,8940 3,8398 3,8067 3,7393
9 7,2093 5,7147 5,0781 4,7181 4,4844 4,3197 4,1970 4,1020 4,0260 3,9639 3,9121 3,8682 3,7694 3,6669 3,6035 3,5604 3,5055 3,4719 3,4034
10 6,9367 5,4564 4,8256 4,4683 4,2361 4,0721 3,9498 3,8549 3,7790 3,7168 3,6649 3,6209 3,5217 3,4185 3,3546 3,3110 3,2554 3,2214 3,1517
11 6,7241 5,2559 4,6300 4,2751 4,0440 3,8807 3,7586 3,6638 3,5879 3,5257 3,4737 3,4296 3,3299 3,2261 3,1616 3,1176 3,0613 3,0268 2,9561
12 6,5538 5,0959 4,4742 4,1212 3,8911 3,7283 3,6065 3,5118 3,4358 3,3736 3,3215 3,2773 3,1772 3,0728 3,0077 2,9633 2,9063 2,8714 2,7996
13 6,4143 4,9653 4,3472 3,9959 3,7667 3,6043 3,4827 3,3880 3,3120 3,2497 3,1975 3,1532 3,0527 2,9477 2,8821 2,8372 2,7797 2,7443 2,6715
14 6,2979 4,8567 4,2417 3,8919 3,6634 3,5014 3,3799 3,2853 3,2093 3,1469 3,0946 3,0502 2,9493 2,8437 2,7777 2,7324 2,6742 2,6384 2,5646
g2 15 6,1995 4,7650 4,1528 3,8043 3,5764 3,4147 3,2934 3,1987 3,1227 3,0602 3,0078 2,9633 2,8621 2,7559 2,6894 2,6437 2,5850 2,5488 2,4739
16 6,1151 4,6867 4,0768 3,7294 3,5021 3,3406 3,2194 3,1248 3,0488 2,9862 2,9337 2,8890 2,7875 2,6808 2,6138 2,5678 2,5085 2,4719 2,3961
17 6,0420 4,6189 4,0112 3,6648 3,4379 3,2767 3,1556 3,0610 2,9849 2,9222 2,8696 2,8249 2,7230 2,6158 2,5484 2,5020 2,4422 2,4053 2,3285
18 5,9781 4,5597 3,9539 3,6083 3,3820 3,2209 3,0999 3,0053 2,9291 2,8664 2,8137 2,7689 2,6667 2,5590 2,4912 2,4445 2,3842 2,3468 2,2692
19 5,9216 4,5075 3,9034 3,5587 3,3327 3,1718 3,0509 2,9563 2,8801 2,8172 2,7645 2,7196 2,6171 2,5089 2,4408 2,3937 2,3329 2,2952 2,2167
20 5,8715 4,4613 3,8587 3,5147 3,2891 3,1283 3,0074 2,9128 2,8365 2,7737 2,7209 2,6758 2,5731 2,4645 2,3959 2,3486 2,2873 2,2493 2,1699
21 5,8266 4,4199 3,8188 3,4754 3,2501 3,0895 2,9686 2,8740 2,7977 2,7348 2,6819 2,6368 2,5338 2,4247 2,3558 2,3082 2,2465 2,2081 2,1280
22 5,7863 4,3828 3,7829 3,4401 3,2151 3,0546 2,9338 2,8392 2,7628 2,6998 2,6469 2,6017 2,4984 2,3890 2,3198 2,2718 2,2097 2,1710 2,0901
23 5,7498 4,3492 3,7505 3,4083 3,1835 3,0232 2,9023 2,8077 2,7313 2,6682 2,6152 2,5699 2,4665 2,3567 2,2871 2,2389 2,1763 2,1374 2,0557
24 5,7166 4,3187 3,7211 3,3794 3,1548 2,9946 2,8738 2,7791 2,7027 2,6396 2,5865 2,5411 2,4374 2,3273 2,2574 2,2090 2,1460 2,1067 2,0243
25 5,6864 4,2909 3,6943 3,3530 3,1287 2,9685 2,8478 2,7531 2,6766 2,6135 2,5603 2,5149 2,4110 2,3005 2,2303 2,1816 2,1183 2,0787 1,9955
30 5,5675 4,1821 3,5894 3,2499 3,0265 2,8667 2,7460 2,6513 2,5746 2,5112 2,4577 2,4120 2,3072 2,1952 2,1237 2,0739 2,0089 1,9681 1,8816
40 5,4239 4,0510 3,4633 3,1261 2,9037 2,7444 2,6238 2,5289 2,4519 2,3882 2,3343 2,2882 2,1819 2,0677 1,9943 1,9429 1,8752 1,8324 1,7405
50 5,3403 3,9749 3,3902 3,0544 2,8327 2,6736 2,5530 2,4579 2,3808 2,3168 2,2627 2,2162 2,1090 1,9933 1,9186 1,8659 1,7963 1,7520 1,6558
100 5,1786 3,8284 3,2496 2,9166 2,6961 2,5374 2,4168 2,3215 2,2439 2,1793 2,1245 2,0773 1,9679 1,8486 1,7705 1,7148 1,6401 1,5917 1,4833
Distribuição F
0 + F
1 2,( ) 0,025g gP F F
25,40( ) 0,025aP F f
43
40,25( ?) 0,025P F
40,25( 2,12) 0,025P F
25,40
1( ) 0,025
2,12P F
25,40( 0,47) 0,025P F
Exemplo: duas v.a. quaisquer têm distribuições normais com médias e variâncias desconhecidas. Retira-se uma amostra de cada população e calculam-se a média e a variância para cada amostra. Teste a hipótese de que as médias populacionais não diferem significativamente a 5% entre si, considerando que:
2 2
1 1 1 2 2 226 10,3 2,34 41 15,7 1,91n X s n X s
Teste de Hipótese para 2 2
1 2 2 2
1 2
?
2,5%2,5%
25;40F
0 + af bf
95%
?
Se H0 é verdadeira, então
Região Crítica:
•aceito H0 se 0,47 < F < 1,99
•rejeito H0 caso contrário
1 2
2 2
1 21; 12 2
2 1
~ n n
sF
s
1 2
2
11; 12
2
~ n n
sF F
s
2,341,2251
1,91F
Hipóteses 2 2 2 2
0 1 2 1 2
2 2
1 1 2
H : / 1 ( )
H : / 1
1,99
Conclusão: Aceito H0, ou seja, não há razões para discordar que, a 5%, 2 2
1 2 44
0,47
Região Crítica:
•aceito H0 se -1,997 < t < 1,997
•rejeito H0 caso contrário
Exemplo: duas v.a. quaisquer têm distribuições normais com médias e variâncias desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Teste a hipótese de que as médias populacionais não diferem significativamente a 5% entre si, considerando que:
? 1,997
Teste de Hipótese para 1 = 2 (cont.)
2 2
1 1 1 2 2 226 10,3 2,34 41 15,7 1,91n X s n X s
1 2
1 2 1 222 2
1 1 2 2
1 2 1 2
( ) ( )~
( 1) ( 1) 1 1
2
n n
X Xt
n s n s
n n n n
Se H0 é verdadeira, então
1 2
1 22
2 2
1 1 2 2
1 2 1 2
~( 1) ( 1) 1 1
2
n n
X Xt t
n s n s
n n n n
Hipóteses H0 : 1 - 2 = 0 (1 = 2)
H1: 1 - 2 0
t = -14,9515
Conclusão: Rejeito H0, ou seja, as médias são diferentes significativamente a 5% 45
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
65t
(t homocedástico)
0
65t
95%
tcrít -tcrít
2,5% 2,5%
1 2
1 2
ˆ ˆ
1 1ˆ ˆ
p pz
pqn n
Teste de Hipótese para p1 = p2
Hipóteses H0 : p1 – p2 = 0 (p1 = p2)
H1: p1 – p2 0
Se H0 é verdadeira, então
Região Crítica:
•aceito H0 se –zcrít < z < zcrít P(–zcrít < z < zcrít) = 1 -
•rejeito H0 caso contrário P(|z| > zcrít) =
Conclusão (sempre associada a um nível de significância )
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 5 10 15 20- + 0
(0,1)N
2
2
1
zcrít -zcrít
aceitação de H0
rejeição de H0
rejeição de H0
21
2211ˆˆ
ˆnn
pnpnp
1 2 1 2
1 1 2 2
1 2
ˆ ˆ( ) ( )~ (0,1)
p p p pN
p q p q
n n
46
Teste de Hipótese (resumo) X
z
n
Xt
s
n
22
2
( 1)n s
para
(0,1)N
1nt
se 2 é conhecida
se 2 é desconhecida
para 2 2
1n
para 1 - 2
se e são conhecidas
se e são desconhecidas, mas
2
12
2
2
12
22 2
1 2
(0,1)N
1 2 2n nt
gt se e são desconhecidas, mas 2
12
22 2
1 2
1 2 1 2
2 2
1 2
1 2
( ) ( )X Xz
n n
1 2 1 2homo
2 2
1 1 2 2
1 2 1 2
( ) ( )
( 1) ( 1) 1 1
2
X Xt
n s n s
n n n n
1 2 1 2hetero
2 2
1 2
1 2
( ) ( )X Xt
s s
n n
47
Teste de Hipótese (resumo)
2 2
1 2
2 2
2 1
sF
s
p̂ pz
pq
n
para
(0,1)N
1nt
se 2 é conhecida
se 2 é desconhecida
para 2 2
1n
para 1 21, 1n nF
2
1
2
2
para p (0,1)N
para p1 – p2 (0,1)N
para 1 - 2
se e são conhecidas
se e são desconhecidas, mas
2
12
2
2
12
22 2
1 2
(0,1)N
1 2 2n nt
gt se e são desconhecidas, mas 2
12
22 2
1 2
21
2211ˆˆ
ˆnn
pnpnp
1 2 1 2
1 2
ˆ ˆ( ) ( )
1 1ˆ ˆ
p p p pz
pqn n
48
Comparando médias em imagens... 10 pontos são escolhidos em cada imagem
Imagem A Imagem B
Esq
uem
a 1
esc
olha
aleat
ória
E
sque
ma
2
mesm
a po
siçã
o am
ostr
ada
amostra A B 1 12 15
2 34 17
3 16 21
4 28 27
5 15 25
6 17 32
7 23 15
8 13 19
9 29 29
10 31 30
amostra A B 1 12 11
2 34 37
3 16 18
4 28 27
5 15 18
6 17 19
7 23 24
8 13 15
9 29 32
10 31 33
49
Comparando médias em imagens...
Esq
uem
a 1
Esq
uem
a 2
amostra A B 1 12 15
2 34 17
3 16 21
4 28 27
5 15 25
6 17 32
7 23 15
8 13 19
9 29 29
10 31 30
amostra A B 1 12 11
2 34 37
3 16 18
4 28 27
5 15 18
6 17 19
7 23 24
8 13 15
9 29 32
10 31 33
2
2
21,8 66,84
23,0 41,11
A A
B B
X s
X s
2 2
0
2 2
1
H : / 1
H : / 1
A B
A B
0
1
H :
H :
A B
A B
teste F
teste t (homo ou heterocedástico)
50
Comparando médias em imagens...
Esq
uem
a 1
Esq
uem
a 2
amostra A B 1 12 15
2 34 17
3 16 21
4 28 27
5 15 25
6 17 32
7 23 15
8 13 19
9 29 29
10 31 30
amostra A B 1 12 11
2 34 37
3 16 18
4 28 27
5 15 18
6 17 19
7 23 24
8 13 15
9 29 32
10 31 33
2
2
21,8 66,84
23,0 41,11
A A
B B
X s
X s
Aceito H0 a 5% usar teste t homocedástico
Aceito H0 a 5% (as médias são iguais)
1,63calcF (valor-P = 0,24)
0,37calct (valor-P = 0,36)0
1
H :
H :
A B
A B
2
2
21,8 66,84
23,4 74,04
A A
B B
X s
X s
Aceito H0 a 5% (usar teste t homocedástico)
Aceito H0 a 5% (as médias são iguais)
0,90calcF (valor-P = 0,44)
0,43calct (valor-P = 0,34)
2 2
0
2 2
1
H : / 1
H : / 1
A B
A B
0
1
H :
H :
A B
A B
As amostras não são independentes!!! 51
2 2
0
2 2
1
H : / 1
H : / 1
A B
A B
para teste bilateral multiplicar por 2
Teste t pareado
Esq
uem
a 1
Esq
uem
a 2
amostra A B 1 12 15
2 34 17
3 16 21
4 28 27
5 15 25
6 17 32
7 23 15
8 13 19
9 29 29
10 31 30
amostra A B A-B 1 12 11 1
2 34 37 -3
3 16 18 -2
4 28 27 1
5 15 18 -3
6 17 19 -2
7 23 24 -1
8 13 15 -2
9 29 32 -3
10 31 33 -2
2
2
21,8 66,84
23,0 41,11
A A
B B
X s
X s
Teste t pareado 21,6 2,27A B A BX s
H0 : A-B = 0
H1: A-B < 0
1~A Bcalc n
A B
Xt t
s
n
Se H0 verdadeiro
3,36calct
(valor-P = 0,004)
Aceito H0 a 5% usar teste t homocedástico
Aceito H0 a 5% (as médias são iguais)
1,63calcF (valor-P = 0,24)
0,37calct (valor-P = 0,36)0
1
H :
H :
A B
A B
Conclusão: Rejeito H0 a 5%, ou seja, a média da diferença é menor que zero 52
2 2
0
2 2
1
H : / 1
H : / 1
A B
A B
Teste de Hipótese / EXCEL
amostra Alvo 1 Alvo 2 1 128 98
2 134 105
3 110 99
4 112 109
5 125 95
6 107 101
7 111 100
8 115 92
9 130 107
10 120 110
Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?
Comparação de duas médias: teste-t Mas qual? Homo ou heterocedástico?
53
Teste de Hipótese / EXCEL
amostra Alvo 1 Alvo 2 1 128 98
2 134 105
3 110 99
4 112 109
5 125 95
6 107 101
7 111 100
8 115 92
9 130 107
10 120 110
Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?
54
Teste de Hipótese / EXCEL
amostra Alvo 1 Alvo 2 1 128 98
2 134 105
3 110 99
4 112 109
5 125 95
6 107 101
7 111 100
8 115 92
9 130 107
10 120 110
Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?
55
Conclusão: através do teste-F, pode-se concluir que não há razões para discordar que as variâncias sejam iguais para os alvos 1 e 2, adotando-se um nível de significância de 5%, uma vez que valor-P foi maior que 0,05 (valor-P bilateral = 0,185).
Teste-F: duas amostras para variâncias
Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 gl 9 9 F 2,520345 P(F<=f) uni-caudal 0,092349 F crítico uni-caudal 3,178893
Teste de Hipótese / EXCEL
amostra Alvo 1 Alvo 2 1 128 98
2 134 105
3 110 99
4 112 109
5 125 95
6 107 101
7 111 100
8 115 92
9 130 107
10 120 110
Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?
56
Para teste bilateral multiplicar por 2
2 2
0 1 2
2 2
1 1 2
H : / 1
H : / 1
Teste-F: duas amostras para variâncias
Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 gl 9 9 F 2,520345 P(F<=f) uni-caudal 0,092349 F crítico uni-caudal 3,178893
Teste de Hipótese / EXCEL
amostra Alvo 1 Alvo 2 1 128 98
2 134 105
3 110 99
4 112 109
5 125 95
6 107 101
7 111 100
8 115 92
9 130 107
10 120 110
Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?
57
Teste-F: duas amostras para variâncias
Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 gl 9 9 F 2,520345 P(F<=f) uni-caudal 0,092349 F crítico uni-caudal 3,178893
Teste de Hipótese / EXCEL
amostra Alvo 1 Alvo 2 1 128 98
2 134 105
3 110 99
4 112 109
5 125 95
6 107 101
7 111 100
8 115 92
9 130 107
10 120 110
Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?
58
Teste de Hipótese / EXCEL
amostra Alvo 1 Alvo 2 1 128 98
2 134 105
3 110 99
4 112 109
5 125 95
6 107 101
7 111 100
8 115 92
9 130 107
10 120 110
Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?
Teste-F: duas amostras para variâncias
Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 gl 9 9 F 2,520345 P(F<=f) uni-caudal 0,092349 F crítico uni-caudal 3,178893
Teste-t: duas amostras presumindo variâncias equivalentes
Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 Variância agrupada 63,44444 Hipótese da diferença de média 0 gl 18 Stat t 4,940841 P(T<=t) uni-caudal 5,28E-05 t crítico uni-caudal 1,734064 P(T<=t) bi-caudal 0,000106 t crítico bi-caudal 2,100922
H0 : 1 - 2 = 0
H1: 1 - 2 0
Conclusão: através do teste-t homocedástico (bilateral), pode-se concluir que as médias dos alvos 1 e 2 são diferentes, adotando-se um nível de significância de 5%, uma vez que valor-P foi menor que 0,05 (valor-P bilateral = 0,000106).
59
Teste de Hipótese / EXCEL
amostra Alvo 1 Alvo 2 1 128 98
2 134 105
3 110 99
4 112 109
5 125 95
6 107 101
7 111 100
8 115 92
9 130 107
10 120 110
Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?
Teste-F: duas amostras para variâncias
Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 gl 9 9 F 2,520345 P(F<=f) uni-caudal 0,092349 F crítico uni-caudal 3,178893
Teste-t: duas amostras presumindo variâncias equivalentes
Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 Variância agrupada 63,44444 Hipótese da diferença de média 0 gl 18 Stat t 4,940841 P(T<=t) uni-caudal 5,28E-05 t crítico uni-caudal 1,734064 P(T<=t) bi-caudal 0,000106 t crítico bi-caudal 2,100922
H0 : 1 - 2 = 0
H1: 1 - 2 > 0
Conclusão: através do teste-t homocedástico unilateral, pode-se concluir que a média do alvo 1 deve ser maior que a do alvo 2, adotando-se um nível de significância de 5%, uma vez que valor-P foi menor que 0,05 (valor-P = 0,0000528).
60
Teste de Hipótese / R
amostra Alvo 1 Alvo 2 1 128 98
2 134 105
3 110 99
4 112 109
5 125 95
6 107 101
7 111 100
8 115 92
9 130 107
10 120 110
Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?
> a1<-c(128,134,110,112,125,107,111,115,130,120) > a2<-c(98,105,99,109,95,101,100,92,107,110) > var.test(a1,a2)
F test to compare two variances data: a1 and a2 F = 2.5203, num df = 9, denom df = 9, p-value = 0.1847 alternative hypothesis: true ratio of variances is not equal to 1
> mean(a1) [1] 119.2 > mean(a2) [1] 101.6
H0 : 1 - 2 = 0
H1: 1 - 2 > 0
> t.test(a1,a2,var.equal=T,alternative="greater")
Two Sample t-test data: a1 and a2 t = 4.9408, df = 18, p-value = 5.277e-05 alternative hypothesis: true difference in means is greater than 0
H0 : 1 / 2 = 1
H1: 1 / 2 ≠ 1
Conclusão: a média do alvo 1 é significativamente (5%) maior que a média do alvo 2. 61
Pressuposição de Normalidade dos Dados
Como foi visto, algumas distribuições usadas para a construção de Intervalos de Confiança e Testes de Hipótese têm sua origem fundamentada na condição de que as populações sejam normalmente distribuídas.
62
2~ ( , )iX N 1 2, , , nX X X X amostra aleatória
22
12
( 1)~ n
n s
1~ n
Xt
s
n
1 2
1 2 1 222 2
1 1 2 2
1 2 1 2
( ) ( )~
( 1) ( 1) 1 1
2
n n
X Xt
n s n s
n n n n
1 2
2 2
1 21, 12 2
2 1
~ n n
sF
s
Mas como a falta de normalidade dos dados pode afetar os resultados? Para entender o papel da normalidade nos testes de hipóteses, vamos simular
amostragens de diferentes tamanhos em populações com e sem normalidade e avaliar os impactos sobre as conclusões de testes de hipóteses para e 2.
Testes de Hipótese para e 2
Foram realizadas 10000 simulações de amostras com tamanho n = 5, 10 e 50 considerando as distribuições:
X1 ~ Uniforme(100,300) X: {100, 101, ..., 300} = 200 2 = 3366,67
X2 ~ N( = 200, 2 = 3366,67)
Para cada amostra, foram calculadas a média e a variância amostrais e as respectivas
estatísticas t e 2 usadas pata testar as hipóteses considerando = 5%: H0: = 200 H0:
2 = 3366,67
H1: 200 H1: 2 3366,67
A distribuição dos valores simulados foram comparados aos valores da distribuição
teórica esperada Em seguida, contabilizou-se a frequência com que as hipóteses nulas foram rejeitadas
indevidamente, o que deveria corresponder, em teoria, ao valor de significância .
(SimulacaoTesteHip.xlsx) 63
22
2
( 1)n s
Xt
s
n
Testes de Hipótese para e 2
Distribuições Simuladas:
64
X2 ~ N( = 200, 2 = 3366,67)
X1 ~ Uniforme(100,300)
2=
𝑛−
1𝑠 12
𝜎2
𝑡=
𝑋 1−
𝜇𝑠 1 𝑛
n = 5 n = 10 n = 50
Proporção de H0 falsa (𝛼 )
n = 5 n = 10 n = 50
H0: = 200 6,7% 5,6% 5,1%
H0: 2 = 3366,67 1,7% 0,7% 0,2%
Rejeita mais!
= P(rejeitar indevidamente H0) = 5%
Aceita mais!