estatística: aplicação ao sensoriamento remoto …camilo/estatistica/pdf/07testehip.pdfuma...

65
Estatística: Aplicação ao Sensoriamento Remoto SER 204 - ANO 2018 Teste de Hipótese Camilo Daleles Rennó [email protected] http://www.dpi.inpe.br/~camilo/estatistica/

Upload: ngoduong

Post on 15-Dec-2018

227 views

Category:

Documents


0 download

TRANSCRIPT

Estatística: Aplicação ao Sensoriamento Remoto

SER 204 - ANO 2018

Teste de Hipótese

Camilo Daleles Rennó [email protected]

http://www.dpi.inpe.br/~camilo/estatistica/

Estimação de Parâmetros

2

Como já foi visto, um parâmetro pode ser estimado através de um único valor (estimador pontual) ou a partir de um intervalo de confiança

Por exemplo:

Isso é particularmente útil quando não se conhece nada a respeito do parâmetro e/ou distribuição estudada.

Mas se já houvesse uma ideia de qual deveria ser o valor deste parâmetro

desconhecido, haveria algum procedimento para comprovar ou refutar esta suposição?

amostra X1, X2, ..., Xn

X

f(x)

0

desconhecido

?

f( )

0

X

X

IC

𝑋

Teste de Hipótese

Uma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10?

X

Hipóteses H0 : = 10

H1: 10

Xz

n

(hipótese nula) (hipótese alternativa)

~ (0,1)N

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

Teste de Hipótese para

3

definição de uma estatística que relaciona o parâmetro ao seu estimador

(válida sob qualquer hipótese)

Pressuposições: a) População tem distribuição Normal ou

Teorema do Limite Central é válido b) Variância populacional 2 é conhecida

Uma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10?

X

Hipóteses H0 : = 10

H1: 10

Xz

n

Se H0 é verdadeira, então

10~ (0,1)

Xz N

n

(hipótese nula) (hipótese alternativa)

~ (0,1)N

z >>> 0

Se H0

falsa

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

z = 0

Se H0

verdadeira

z <<< 0

Se H0

falsa

Teste de Hipótese para

4

Quais os valores desta estatística indicariam que H0 seria verdadeira?

E quais os valores desta estatística indicariam que H0 seria falsa?

(válida somente se H0 for verdadeira)

Uma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10?

X

Hipóteses H0 : = 10

H1: 10

Xz

n

Se H0 é verdadeira, então

10~ (0,1)

Xz N

n

(hipótese nula) (hipótese alternativa)

~ (0,1)N

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

zcrít -zcrít

2

2

1

aceitação de H0

rejeição de H0

rejeição de H0

Região Crítica:

•aceito H0 se –zcrít < z < zcrít P(–zcrít < z < zcrít) = 1 -

•rejeito H0 caso contrário P(|z| > zcrít) =

Conclusão (sempre associada a um nível de significância )

Teste de Hipótese para

5

zcrít -zcrít

Teste de Hipótese para

Hipóteses H0 : = 10

H1: 10

Xz

n

Se H0 é verdadeira, então

10~ (0,1)

Xz N

n

(hipótese nula) (hipótese alternativa)

~ (0,1)N

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- +

(0,1)N

1,96 -1,96

1

aceitação de H0

rejeição de H0

rejeição de H0

Região Crítica:

•aceito H0 se –zcrít < z < zcrít P(–zcrít < z < zcrít) = 1 -

•rejeito H0 caso contrário P(|z| > zcrít) =

Conclusão (sempre associada a um nível de significância)

XUma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10? Por simplificação, consideremos que 2 = 16. Adote = 5%.

0

95% 2

2

2,5% 2,5%

10~ (0,1)

4

5

Xz N

11,3 101,625

4

5

z

•aceito H0 se –1,96 < z < 1,96

•rejeito H0 caso contrário

1,625

Conclusão: não há razões para discordar que a média seja de fato 10, adotando-se 5% de significância 6

Teste de Hipótese para

Em alguns casos, há evidências de que, se o parâmetro não for aquele definido na hipótese nula, ele será maior ou então menor do que o valor testado.

7

Neste caso, pode-se definir a hipótese alternativa como unilateral.

No exemplo anterior, 11,3X

Com esta média amostral, pode-se pensar que o verdadeiro valor de é na realidade maior do que aquele definido na hipótese nula (H0 : = 10).

10~ (0,1)

Xz N

n

Teste de Hipótese para

Hipóteses H0 : = 10

~ (0,1)X

z N

n

Se H0 é verdadeira, então 0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

zcrít

1

aceitação de H0

rejeição de H0

Região Crítica:

•aceito H0 se z < zcrít P(z < zcrít) = 1 -

•rejeito H0 caso contrário P(z > zcrít) =

Conclusão (sempre associada a um nível de significância )

H1: > 10 (teste unilateral)

8

XUma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10? Por simplificação, consideremos que 2 = 16. Adote = 5%.

se H0 for falso, então espera-se valores de z bem maiores que zero.

zcrít 1,645

10~ (0,1)

Xz N

n

Hipóteses H0 : = 10

~ (0,1)X

z N

n

Se H0 é verdadeira, então 0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

Região Crítica:

•aceito H0 se z < zcrít P(z < zcrít) = 1 -

•rejeito H0 caso contrário P(z > zcrít) =

Conclusão (sempre associada a um nível de significância)

H1: > 10 (teste unilateral)

Teste de Hipótese para

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

95%

•aceito H0 se z < 1,645

•rejeito H0 caso contrário

1,625

Conclusão: não há razões para discordar que a média seja de fato 10, adotando-se 5% de significância

aceitação de H0

rejeição de H0

11,3 101,625

4

5

z

9

XUma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10? Por simplificação, consideremos que 2 = 16. Adote = 5%.

5%

Teste de Hipótese para 2

(hipótese nula) (hipótese alternativa)

22

12

( 1)~ n

n sX

Se H0 é verdadeira, então

22

1

( 1)~

4n

n sX

aceitação

de H0 rejeição de H0

rejeição de H0

Região Crítica:

•aceito H0 se xa < X < xb P(xa < X < xb) = 1 -

•rejeito H0 caso contrário

Conclusão (sempre associada a um nível de significância )

2

2

2

1n

0 + ax bx

1

10

Uma v.a. qualquer tem uma distribuição normal com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a variância amostral. Teste a hipótese de que a verdadeira variância 2 seja igual a 4.

Hipóteses H0 :

2 = 4

H1: 2 4

22

12

( 1)~ n

n sX

Teste de Hipótese para 2

?

2,5%2,5%

2

24

0 + ax bx

95%

?

Hipóteses H0 :

2 = 4

H1: 2 4

Se H0 é verdadeira, então

Região Crítica:

22

24

24~

4

sX

24.2,3414,04

4X

11

Uma v.a. qualquer tem uma distribuição normal com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a variância amostral. Teste a hipótese de que a verdadeira variância 2 seja igual a 4. Suponha que s2 = 2,34. Considere = 5%.

g 0,005 0,010 0,025 0,050 0,100 0,900 0,950 0,975 0,990 0,995

1 7,88 6,63 5,02 3,84 2,71 0,016 0,0039 0,0010 0,00016 0,00004

2 10,60 9,21 7,38 5,99 4,61 0,21 0,10 0,051 0,020 0,010

3 12,84 11,34 9,35 7,81 6,25 0,58 0,35 0,22 0,11 0,072

4 14,86 13,28 11,14 9,49 7,78 1,06 0,71 0,48 0,30 0,21

5 16,75 15,09 12,83 11,07 9,24 1,61 1,15 0,83 0,55 0,41

6 18,55 16,81 14,45 12,59 10,64 2,20 1,64 1,24 0,87 0,68

7 20,28 18,48 16,01 14,07 12,02 2,83 2,17 1,69 1,24 0,99

8 21,95 20,09 17,53 15,51 13,36 3,49 2,73 2,18 1,65 1,34

9 23,59 21,67 19,02 16,92 14,68 4,17 3,33 2,70 2,09 1,73

10 25,19 23,21 20,48 18,31 15,99 4,87 3,94 3,25 2,56 2,16

11 26,76 24,72 21,92 19,68 17,28 5,58 4,57 3,82 3,05 2,60

12 28,30 26,22 23,34 21,03 18,55 6,30 5,23 4,40 3,57 3,07

13 29,82 27,69 24,74 22,36 19,81 7,04 5,89 5,01 4,11 3,57

14 31,32 29,14 26,12 23,68 21,06 7,79 6,57 5,63 4,66 4,07

15 32,80 30,58 27,49 25,00 22,31 8,55 7,26 6,26 5,23 4,60

16 34,27 32,00 28,85 26,30 23,54 9,31 7,96 6,91 5,81 5,14

17 35,72 33,41 30,19 27,59 24,77 10,09 8,67 7,56 6,41 5,70

18 37,16 34,81 31,53 28,87 25,99 10,86 9,39 8,23 7,01 6,26

19 38,58 36,19 32,85 30,14 27,20 11,65 10,12 8,91 7,63 6,84

20 40,00 37,57 34,17 31,41 28,41 12,44 10,85 9,59 8,26 7,43

21 41,40 38,93 35,48 32,67 29,62 13,24 11,59 10,28 8,90 8,03

22 42,80 40,29 36,78 33,92 30,81 14,04 12,34 10,98 9,54 8,64

23 44,18 41,64 38,08 35,17 32,01 14,85 13,09 11,69 10,20 9,26

24 45,56 42,98 39,36 36,42 33,20 15,66 13,85 12,40 10,86 9,89

25 46,93 44,31 40,65 37,65 34,38 16,47 14,61 13,12 11,52 10,52

26 48,29 45,64 41,92 38,89 35,56 17,29 15,38 13,84 12,20 11,16

27 49,64 46,96 43,19 40,11 36,74 18,11 16,15 14,57 12,88 11,81

28 50,99 48,28 44,46 41,34 37,92 18,94 16,93 15,31 13,56 12,46

29 52,34 49,59 45,72 42,56 39,09 19,77 17,71 16,05 14,26 13,12

30 53,67 50,89 46,98 43,77 40,26 20,60 18,49 16,79 14,95 13,79

40 66,77 63,69 59,34 55,76 51,81 29,05 26,51 24,43 22,16 20,71

50 79,49 76,15 71,42 67,50 63,17 37,69 34,76 32,36 29,71 27,99

60 91,95 88,38 83,30 79,08 74,40 46,46 43,19 40,48 37,48 35,53

70 104,21 100,43 95,02 90,53 85,53 55,33 51,74 48,76 45,44 43,28

80 116,32 112,33 106,63 101,88 96,58 64,28 60,39 57,15 53,54 51,17

90 128,30 124,12 118,14 113,15 107,57 73,29 69,13 65,65 61,75 59,20

100 140,17 135,81 129,56 124,34 118,50 82,36 77,93 74,22 70,06 67,33

Distribuição 2

0 + 2

t

2 2( )g tP

2

24( ) 0,975aP x

12

2

24( ) 0,025bP x

22

12

( 1)~ n

n sX

Teste de Hipótese para 2

? 12,40

2,5%2,5%

2

24

0 + ax bx

95%

? 39,36

Hipóteses H0 :

2 = 4

H1: 2 4

Se H0 é verdadeira, então

Região Crítica:

•aceito H0 se 12,40 < X < 39,36

•rejeito H0 caso contrário

Conclusão: Aceito H0, ou seja, não há razões para discordar que, a 5%, 2 = 4.

22

24

24~

4

sX

24.2,3414,04

4X

13

Uma v.a. qualquer tem uma distribuição normal com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a variância amostral. Teste a hipótese de que a verdadeira variância 2 seja igual a 4. Suponha que s2 = 2,34. Considere = 5%.

rejeição de H0

Teste de Hipótese para com 2 desconhecida

1~ n

Xt t

s

n

Se H0 é verdadeira, então

1

15~ n

Xt t

s

n

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

1nt

tcrít

Hipóteses

14

H0 : = 15 (hipótese nula) H1: < 15 (hipótese alternativa unilateral)

Região Crítica:

•aceito H0 se t > tcrít P(t > tcrít) = 1 -

•rejeito H0 caso contrário

Conclusão (sempre associada a um nível de significância )

1

aceitação de H0

Uma v.a. qualquer tem uma distribuição normal com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média amostral e a variância amostral. Supondo que e s2 = 4,5, teste a hipótese unilateral de que = 15. 12,7X

rejeição de H0

Teste de Hipótese para com 2 desconhecida

1~ n

Xt t

s

n

Se H0 é verdadeira, então

24

15~

Xt t

s

n

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

24t

?

Hipóteses H0 : = 15

H1: < 15

15

Região Crítica:

1%99%

aceitação de H0

12,7 155,43

2,12

25

t

Uma v.a. qualquer tem uma distribuição normal com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média amostral e a variância amostral. Supondo que e s2 = 4,5, teste a hipótese unilateral de que = 15. Considere = 1%.

12,7X

Distribuição t de Student

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0 t

( )gP T t

g 0,1 0,05 0,025 0,01 0,005

1 3,078 6,314 12,706 31,821 63,656

2 1,886 2,920 4,303 6,965 9,925

3 1,638 2,353 3,182 4,541 5,841

4 1,533 2,132 2,776 3,747 4,604

5 1,476 2,015 2,571 3,365 4,032

6 1,440 1,943 2,447 3,143 3,707

7 1,415 1,895 2,365 2,998 3,499

8 1,397 1,860 2,306 2,896 3,355

9 1,383 1,833 2,262 2,821 3,250

10 1,372 1,812 2,228 2,764 3,169

11 1,363 1,796 2,201 2,718 3,106

12 1,356 1,782 2,179 2,681 3,055

13 1,350 1,771 2,160 2,650 3,012

14 1,345 1,761 2,145 2,624 2,977

15 1,341 1,753 2,131 2,602 2,947

16 1,337 1,746 2,120 2,583 2,921

17 1,333 1,740 2,110 2,567 2,898

18 1,330 1,734 2,101 2,552 2,878

19 1,328 1,729 2,093 2,539 2,861

20 1,325 1,725 2,086 2,528 2,845

21 1,323 1,721 2,080 2,518 2,831

22 1,321 1,717 2,074 2,508 2,819

23 1,319 1,714 2,069 2,500 2,807

24 1,318 1,711 2,064 2,492 2,797

25 1,316 1,708 2,060 2,485 2,787

26 1,315 1,706 2,056 2,479 2,779

27 1,314 1,703 2,052 2,473 2,771

28 1,313 1,701 2,048 2,467 2,763

29 1,311 1,699 2,045 2,462 2,756

30 1,310 1,697 2,042 2,457 2,750

40 1,303 1,684 2,021 2,423 2,704

50 1,299 1,676 2,009 2,403 2,678

60 1,296 1,671 2,000 2,390 2,660

120 1,289 1,658 1,980 2,358 2,617 1,282 1,645 1,960 2,326 2,576

24( ) 0,01P T t

24( 2,492) 0,01P T

16

rejeição de H0

Teste de Hipótese para com 2 desconhecida

Uma v.a. qualquer tem uma distribuição normal com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média amostral e a variância amostral. Supondo que e s2 = 4,5, teste a hipótese unilateral de que = 15. Considere = 1%.

12,7X

1~ n

Xt t

s

n

Se H0 é verdadeira, então

24

15~

Xt t

s

n

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

24t

- 2,492

Hipóteses H0 : = 15

H1: < 15

17

Região Crítica:

•aceito H0 se t > -2,492

•rejeito H0 caso contrário

Conclusão: rejeito H0, ou seja, a média é significativamente (a 1%) menor que 15

1%99%

aceitação de H0

12,7 155,43

2,12

25

t

ˆ~ (0,1)

p pN

pq

n

Teste de Hipótese para p

Hipóteses H0 : p = p0

H1: p p0

Se H0 é verdadeira, então

0

0 0

ˆ~ (0,1)

p pz N

p q

n

Região Crítica:

•aceito H0 se –zcrít < z < zcrít P(–zcrít < z < zcrít) = 1 -

•rejeito H0 caso contrário P(|z| > zcrít) =

Conclusão (sempre associada a um nível de significância )

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

2

2

1

aceitação de H0

zcrít -zcrít

rejeição de H0

rejeição de H0

18

diferença para a abordagem do

IC para p

Teste de Hipótese – Erros I e II

Imagine a seguinte situação: Hipóteses H0 : = 0 H1: > 0 Mesmo sendo H0 verdadeira, existe a possibilidade de se selecionar uma amostra desta

população e obter uma média amostral 𝑋 tão alta que leve a conclusão errada de que H0 é falsa?

0 ~ (0,1)X

z N

n

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

zcrít

1

19

Toda conclusão de um teste de hipótese está associada a um nível de significância e portanto não pode ser considerado 100% confiável.

Se H0 é verdadeira, então

rejeita H0 aceita H0

amostra {X1, X2, X3, X4, X5}

𝑋 >>> 0

z > zcrít

H0 falsa

X

f(x)

0 0

Teste de Hipótese – Erros I e II

Sim. Este erro é chamado de erro do tipo I e equivale ao nível de significância .

20

Este erro é sempre conhecido sendo, em geral, definido previamente pelo tomador de decisão.

Imagine a seguinte situação: Hipóteses H0 : = 0 H1: > 0 Mesmo sendo H0 verdadeira, existe a possibilidade de se selecionar uma amostra desta

população e obter uma média amostral 𝑋 tão alta que leve a conclusão errada de que H0 é falsa?

Toda conclusão de um teste de hipótese está associada a um nível de significância e portanto não pode ser considerado 100% confiável.

Teste de Hipótese – Erros I e II

21

Toda conclusão de um teste de hipótese está associada a um nível de significância e portanto não pode ser considerado 100% confiável.

Imagine a seguinte situação: Hipóteses H0 : = 0 H1: > 0 Agora, sendo H0 falsa, existe a

possibilidade de se selecionar uma amostra desta população cuja média verdadeira é 1 (> 0) e obter uma média amostral 𝑋 tão pequena que leve a conclusão errada de que H0 é verdadeira?

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

~ (0,1)z N

zcrít

1

2 00~ ( , )

n

XX N z

n

Se H0 fosse verdadeira:

rejeita H0 aceita H0

Teste de Hipótese – Erros I e II

22

Toda conclusão de um teste de hipótese está associada a um nível de significância e portanto não pode ser considerado 100% confiável.

Imagine a seguinte situação: Hipóteses H0 : = 0 H1: > 0 Agora, sendo H0 falsa, existe a

possibilidade de se selecionar uma amostra desta população cuja média verdadeira é 1 (> 0) e obter uma média amostral 𝑋 tão pequena que leve a conclusão errada de que H0 é verdadeira?

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

2

0~ ( , )n

X N

1

crítX

0crít crítX zn

rejeita H0 aceita H0

Se H0 for, de fato, falsa: 2

1 1 0~ ( , )n

X N

1

2

1~ ( , )n

X N

Sim. Este erro é chamado de erro do tipo II ou erro .

Teste de Hipótese – Erros I e II

23

Toda conclusão de um teste de hipótese está associada a um nível de significância e portanto não pode ser considerado 100% confiável.

Imagine a seguinte situação: Hipóteses H0 : = 0 H1: > 0 Agora, sendo H0 falsa, existe a

possibilidade de se selecionar uma amostra desta população cuja média verdadeira é 1 (> 0) e obter uma média amostral 𝑋 tão pequena que leve a conclusão errada de que H0 é verdadeira?

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

2

0~ ( , )n

X N

1

crítX

rejeita H0 aceita H0

Se H0 for, de fato, falsa: 2

1 1 0~ ( , )n

X N

1

2

1~ ( , )n

X N

Sim. Este erro é chamado de erro do tipo II ou erro .

Este erro é quase sempre negligenciado sendo influenciado por diversos fatores (ver detalhes adiante).

Teste de Hipótese – Erros I e II

Hipóteses H0 : = 0 H1: > 0

H0 é verd. H0 é falso

Aceita H0

Rejeita H0

1 -

1 -

Alternativas para diminuir :

• distanciar 1 de 0 • aumentar • aumentar n melhor opção!!!

24

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

2

0~ ( , )n

X N

1

crítX

rejeita H0 aceita H0

1

2

1~ ( , )n

X N

P(rejeitar H0 / H0 é verdadeira) = (nível de significância ou erro do tipo I) P(aceitar H0 / H0 é verdadeira) = 1 - (nível de confiança) P(aceitar H0 / H1 é verdadeira) = (erro do tipo II) P(rejeitar H0 / H1 é verdadeira) = 1 - (poder do teste)

Cálculo do erro tipo II (erro )

XExemplo: uma amostra de 25 valores foi selecionada, chegando-se a uma média amostral igual a 11,3. Através de um teste z unilateral, chegou-se a conclusão de que a verdadeira média poderia ser igual a 10, adotando-se um nível de significância de 5% (considerando 2 = 16). Mas qual a probabilidade de chegarmos a esta mesma conclusão, sendo a verdadeira média igual a 12, ou seja, qual o valor de ?

H0 : = 10

H1: > 10

~ (0,1)X

z N

n

Se H0 é verdadeira, então

10~ (0,1)

Xz N

n

11,3 101,625

4

5

z

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

5%

95%

zcrít = ? 1,645

aceito H0 se z < 1,645 rejeito H0 se z > 1,645

Conclusão: Aceito H0 Aceito H0, ou seja, a média é igual a 10

considerando 5% de significância

25

Cálculo do erro tipo II (erro )

Agora, considerando = 12

H0 : = 10

H1: = 12

0(aceitar H ) ( 1,645)P P Z

= P(aceitar H0 / H1 é verdadeiro)

26

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

5%

95%

zcrít = 1,645

H0 verdadeiro

aceitação de H0

0

10(aceitar H ) ( 1,645)

4

5

XP P

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- 10

5%

95%

H0

aceitação de H0

Cálculo do erro tipo II (erro )

0(aceitar H ) ( 11,316)P P X

H1

+ 12

( 11,316 / 12)P X

( 0,855)P Z ( 0,855) 0,1963 19,63%P Z

Agora, considerando = 12

H0 : = 10

H1: = 12

= P(aceitar H0 / H1 é verdadeiro)

27 Mas, e para outras hipóteses alternativas?

11,316crítX

0(aceitar H ) ( 1,645)P P Z

0

10(aceitar H ) ( 1,645)

4

5

XP P

12 11,316 12( )

4 4

5 5

XP

Cálculo do erro tipo II (erro )

Este resultado indica que há uma alta probabilidade de se aceitar erroneamente a hipótese de que a média é igual a 10, mesmo sendo, de fato, a média igual a 11

Mas como diminuir este erro, conservando-se o mesmo nível de significância ()?

<< aumentando-se o tamanho da amostra! >>

H0 : = 10

H1: = 11

= P(aceitar H0 / H1 é verdadeiro)

28

65,36%

Considerando que a verdadeira média seja de fato igual a 11...

5%

25n

50n

100n

1000n

Cálculo do erro tipo II (erro )

H0 : = 10

H1: = 11

= P(aceitar H0 / H1 é verdadeiro)

29

Considerando que a verdadeira média seja de fato igual a 11...

5%

65,36% para n = 25

45,11% para n = 50

19,62% para n = 100

81,91.10 % para n = 1000

Teste de Hipótese – valor-P (p-value) Toda conclusão de um teste de hipótese está associada a um nível de

significância. Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se

concluir que a média é maior que 20 uma vez que a estatística z obtida foi de 2,5 (zcrítico = 1,645)”.

A média continuaria ser significativamente maior do que 20 se fosse adotado um nível de significância de 1%?

Para responder a esta pergunta, é necessário calcular o novo z crítico!

2,5

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

5%

95%

1,645

Aceita H0 Rejeita H0

H0 : = 20

H1: > 20

~ (0,1)

2,5

Xz N

n

z

Se H0 é verdadeira, então

30

Conclusão: Rejeita-se H0 a 5%, ou seja, a média parece ser mesmo maior que 20.

Para = 1%, zcrítico = 2,33. Sendo assim, rejeita-se H0, ou seja, pode ser considerado maior que 20.

Teste de Hipótese – valor-P (p-value)

2,5

H0 : = 20

H1: > 20

~ (0,1)

2,5

Xz N

n

z

Se H0 é verdadeira, então

2,5

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

1%

99%

2,33

Aceita H0 Rejeita H0

Toda conclusão de um teste de hipótese está associada a um nível de significância.

Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se concluir que a média é maior que 20 uma vez que a estatística z obtida foi de 2,5 (zcrítico = 1,645)”.

31

Para que valores de , a média poderia ser considerada igual a 20?

Conclusão: Rejeita-se H0 a 1%

Teste de Hipótese – valor-P (p-value)

2,5

H0 : = 20

H1: > 20

~ (0,1)

2,5

Xz N

n

z

Se H0 é verdadeira, então

2,5

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

Aceita H0 Rejeita H0

? 0,62%

Pode-se aceitar H0 para qualquer nível de significância () menor que 0,62% uma vez que valor-P = P(Z > 2,5) = 0,62%

valor-P = P(Z > z)

Toda conclusão de um teste de hipótese está associada a um nível de significância.

Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se concluir que a média é maior que 20 uma vez que a estatística z obtida foi de 2,5 (zcrítico = 1,645)”.

32

Para = 1%, zcrítico = 2,33. Sendo assim, rejeita-se H0, ou seja, pode ser considerado maior que 20.

Para que valores de , a média poderia ser considerada igual a 20?

Teste de Hipótese – valor-P (p-value) De fato, o valor-P refere-se à probabilidade de se obter uma estatística com um

valor tão extremo (muito grande ou muito pequeno) quanto ao obtido para uma amostra em particular.

Este conceito pode ser aplicado para qualquer distribuição. Mas qual lado da distribuição devo escolher? Sempre o lado que inclui a área de rejeição de H0 ou aquele em que os valores

mais raros estejam “mais próximos” da estatística calculada para a amostra

33

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20

- + 0

(0,1)N

2

1n

0 +

2

1n

0 +

z X X

valor-P = P(Z > z) valor-P = P(2 > X) valor-P = P(2 < X)

Teste de Hipótese – valor-P (p-value)

34

O valor-P quase sempre se refere a uma interpretação de um teste unilateral pois é calculado considerando-se apenas um dos lados da distribuição

2

1n

0 +

X

valor-P = P(2 < X) Nos casos em que se pretende utilizar o valor-P para tirar conclusões a partir de testes bilaterais, basta multiplicar o valor-P por 2.

valor-P bilateral = 2*P(2 < X)

Para se calcular o valor-P, em geral, não é possível utilizar tabelas de probabilidade, necessitando o uso de funções específicas em programas como o R ou o Excel

R: pchisq(x,gl) Excel: DIST.QUIQUA(x;gl;1)

Na prática, H0 será rejeitado toda vez que o valor-P for menor que o nível de

significância () escolhido

ambas funções calculam a área a esquerda do ponto!

Teste de Hipótese – valor-P (p-value) Exemplo: Foram coletadas amostras (50 pontos) em mapas a fim de avaliar sua

exatidão. Procedeu-se o teste z para verificar quais deles possuíam exatidão (p) de 0,90 (ou 90%). A tabela abaixo apresenta a exatidão estimada, o resultado do teste (estatística z) e o valor-P de cada mapa.

z valor-P

Mapa 1 0,87 -0,707 0,2397

Mapa 2 0,62 -6,600 2,07.10-11

Mapa 3 0,82 -1,886 0,0297

Mapa 4 0,84 -1,414 0,0786

Quais mapas possuem exatidão menor que 0,90, com 5% de significância?

Quais mapas possuem exatidão menor que 0,90, com 1% de significância?

Mapas 2 e 3

Somente Mapa 2

p̂ pz

pq

n

35

Hipóteses H0 : p = 0,90

H1: p < 0,90

Inferência entre parâmetros de duas populações

1 2

1 1( )E X 2 2( )E X

1X

n1

2X

n2

Mesmo não se conhecendo as médias 1 e 2, seria possível verificar se elas são iguais a partir de seus valores amostrais?

Se 1 e 2 são iguais, então 1 - 2 = ?

36

0

1 2X XPara avaliar se essa hipótese é válida, deve-se investigar a distribuição de

Teste de Hipótese para 1 = 2

1 2 1 2

2 2

1 2

1 2

( ) ( )~ (0,1)

X XN

n n

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

zcrít -zcrít

2

2

1

desconhecidas, mas conhecidas i2

i

Se H0 é verdadeira, então

1 2

2 2

1 2

1 2

~ (0,1)X X

z N

n n

Hipóteses H0 : 1 - 2 = 0 (1 = 2)

H1: 1 - 2 0

Região Crítica:

•aceito H0 se –zcrít < z < zcrít P(–zcrít < z < zcrít) = 1 -

•rejeito H0 caso contrário P(|z| > zcrít) =

37

Teste de Hipótese para 1 = 2

1 2

1 2 1 222 2

1 1 2 2

1 2 1 2

( ) ( )~

( 1) ( 1) 1 1

2

n n

X Xt

n s n s

n n n n

e desconhecidas mas i2

i

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

1 2 2n nt

tcrít -tcrít

2

2

1

2 2

1 2 Hipóteses H0 : 1 - 2 = 0 (1 = 2)

H1: 1 - 2 0

Se H0 é verdadeira, então

1 2

1 22

2 2

1 1 2 2

1 2 1 2

~( 1) ( 1) 1 1

2

n n

X Xt t

n s n s

n n n n

(t homocedástico)

Região Crítica:

•aceito H0 se –tcrít < t < tcrít P(–tcrít < t < tcrít) = 1 -

•rejeito H0 caso contrário P(|t| > tcrít) =

38

Teste de Hipótese para 1 = 2

1 2 1 2

2 2

1 2

1 2

( ) ( )~ g

X Xt

s s

n n

e desconhecidas mas i2

i

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

gt

tcrít -tcrít

2

2

1

(t heterocedástico)

2 2

1 2 Hipóteses H0 : 1 - 2 = 0 (1 = 2)

H1: 1 - 2 0

Se H0 é verdadeira, então

1 2

2 2

1 2

1 2

~ g

X Xt t

s s

n n

22 2

1 2

1 2

2 22 2

1 2

1 2

1 21 1

s s

n ng

s s

n n

n n

Região Crítica:

•aceito H0 se –tcrít < t < tcrít P(–tcrít < t < tcrít) = 1 -

•rejeito H0 caso contrário P(|t| > tcrít) =

39

Exemplo: duas v.a. quaisquer têm distribuições normais com médias e variâncias desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Teste a hipótese de que as médias populacionais não diferem significativamente a 5% entre si, considerando que:

Teste de Hipótese para 1 = 2

Usar teste t homocedástico ou heterocedástico?

primeiramente deve-se testar se 2 2

1 2

40

2 2

1 1 1 2 2 226 10,3 2,34 41 15,7 1,91n X s n X s

Exemplo: duas v.a. quaisquer têm distribuições normais com médias e variâncias desconhecidas. Retira-se uma amostra de cada população e calculam-se a média e a variância para cada amostra. Teste a hipótese de que as médias populacionais não diferem significativamente a 5% entre si, considerando que:

2 2

1 1 1 2 2 226 10,3 2,34 41 15,7 1,91n X s n X s

Teste de Hipótese para 2 2

1 2 2 2

1 2

?

2,5%2,5%

25;40F

0 +

?

Se H0 é verdadeira, então

Região Crítica:

1 2

2 2

1 21; 12 2

2 1

~ n n

sF

s

1 2

2

11; 12

2

~ n n

sF F

s

Hipóteses 2 2 2 2

0 1 2 1 2

2 2

1 1 2

H : / 1 ( )

H : / 1

41

af bf

95%

g1

1 2 3 4 5 6 7 8 9 10 11 12 15 20 25 30 40 50 100

1 647,789 799,500 864,163 899,583 921,848 937,111 948,217 956,656 963,285 968,627 973,025 976,708 984,867 993,103 998,081 1001,414 1005,598 1008,117 1013,175

2 38,5063 39,0000 39,1655 39,2484 39,2982 39,3315 39,3552 39,3730 39,3869 39,3980 39,4071 39,4146 39,4313 39,4479 39,4579 39,4646 39,4729 39,4779 39,4879

3 17,4434 16,0441 15,4392 15,1010 14,8848 14,7347 14,6244 14,5399 14,4731 14,4189 14,3742 14,3366 14,2527 14,1674 14,1155 14,0805 14,0365 14,0099 13,9563

4 12,2179 10,6491 9,9792 9,6045 9,3645 9,1973 9,0741 8,9796 8,9047 8,8439 8,7935 8,7512 8,6565 8,5599 8,5010 8,4613 8,4111 8,3808 8,3195

5 10,0070 8,4336 7,7636 7,3879 7,1464 6,9777 6,8531 6,7572 6,6811 6,6192 6,5678 6,5245 6,4277 6,3286 6,2679 6,2269 6,1750 6,1436 6,0800

6 8,8131 7,2599 6,5988 6,2272 5,9876 5,8198 5,6955 5,5996 5,5234 5,4613 5,4098 5,3662 5,2687 5,1684 5,1069 5,0652 5,0125 4,9804 4,9154

7 8,0727 6,5415 5,8898 5,5226 5,2852 5,1186 4,9949 4,8993 4,8232 4,7611 4,7095 4,6658 4,5678 4,4667 4,4045 4,3624 4,3089 4,2763 4,2101

8 7,5709 6,0595 5,4160 5,0526 4,8173 4,6517 4,5286 4,4333 4,3572 4,2951 4,2434 4,1997 4,1012 3,9995 3,9367 3,8940 3,8398 3,8067 3,7393

9 7,2093 5,7147 5,0781 4,7181 4,4844 4,3197 4,1970 4,1020 4,0260 3,9639 3,9121 3,8682 3,7694 3,6669 3,6035 3,5604 3,5055 3,4719 3,4034

10 6,9367 5,4564 4,8256 4,4683 4,2361 4,0721 3,9498 3,8549 3,7790 3,7168 3,6649 3,6209 3,5217 3,4185 3,3546 3,3110 3,2554 3,2214 3,1517

11 6,7241 5,2559 4,6300 4,2751 4,0440 3,8807 3,7586 3,6638 3,5879 3,5257 3,4737 3,4296 3,3299 3,2261 3,1616 3,1176 3,0613 3,0268 2,9561

12 6,5538 5,0959 4,4742 4,1212 3,8911 3,7283 3,6065 3,5118 3,4358 3,3736 3,3215 3,2773 3,1772 3,0728 3,0077 2,9633 2,9063 2,8714 2,7996

13 6,4143 4,9653 4,3472 3,9959 3,7667 3,6043 3,4827 3,3880 3,3120 3,2497 3,1975 3,1532 3,0527 2,9477 2,8821 2,8372 2,7797 2,7443 2,6715

14 6,2979 4,8567 4,2417 3,8919 3,6634 3,5014 3,3799 3,2853 3,2093 3,1469 3,0946 3,0502 2,9493 2,8437 2,7777 2,7324 2,6742 2,6384 2,5646

g2 15 6,1995 4,7650 4,1528 3,8043 3,5764 3,4147 3,2934 3,1987 3,1227 3,0602 3,0078 2,9633 2,8621 2,7559 2,6894 2,6437 2,5850 2,5488 2,4739

16 6,1151 4,6867 4,0768 3,7294 3,5021 3,3406 3,2194 3,1248 3,0488 2,9862 2,9337 2,8890 2,7875 2,6808 2,6138 2,5678 2,5085 2,4719 2,3961

17 6,0420 4,6189 4,0112 3,6648 3,4379 3,2767 3,1556 3,0610 2,9849 2,9222 2,8696 2,8249 2,7230 2,6158 2,5484 2,5020 2,4422 2,4053 2,3285

18 5,9781 4,5597 3,9539 3,6083 3,3820 3,2209 3,0999 3,0053 2,9291 2,8664 2,8137 2,7689 2,6667 2,5590 2,4912 2,4445 2,3842 2,3468 2,2692

19 5,9216 4,5075 3,9034 3,5587 3,3327 3,1718 3,0509 2,9563 2,8801 2,8172 2,7645 2,7196 2,6171 2,5089 2,4408 2,3937 2,3329 2,2952 2,2167

20 5,8715 4,4613 3,8587 3,5147 3,2891 3,1283 3,0074 2,9128 2,8365 2,7737 2,7209 2,6758 2,5731 2,4645 2,3959 2,3486 2,2873 2,2493 2,1699

21 5,8266 4,4199 3,8188 3,4754 3,2501 3,0895 2,9686 2,8740 2,7977 2,7348 2,6819 2,6368 2,5338 2,4247 2,3558 2,3082 2,2465 2,2081 2,1280

22 5,7863 4,3828 3,7829 3,4401 3,2151 3,0546 2,9338 2,8392 2,7628 2,6998 2,6469 2,6017 2,4984 2,3890 2,3198 2,2718 2,2097 2,1710 2,0901

23 5,7498 4,3492 3,7505 3,4083 3,1835 3,0232 2,9023 2,8077 2,7313 2,6682 2,6152 2,5699 2,4665 2,3567 2,2871 2,2389 2,1763 2,1374 2,0557

24 5,7166 4,3187 3,7211 3,3794 3,1548 2,9946 2,8738 2,7791 2,7027 2,6396 2,5865 2,5411 2,4374 2,3273 2,2574 2,2090 2,1460 2,1067 2,0243

25 5,6864 4,2909 3,6943 3,3530 3,1287 2,9685 2,8478 2,7531 2,6766 2,6135 2,5603 2,5149 2,4110 2,3005 2,2303 2,1816 2,1183 2,0787 1,9955

30 5,5675 4,1821 3,5894 3,2499 3,0265 2,8667 2,7460 2,6513 2,5746 2,5112 2,4577 2,4120 2,3072 2,1952 2,1237 2,0739 2,0089 1,9681 1,8816

40 5,4239 4,0510 3,4633 3,1261 2,9037 2,7444 2,6238 2,5289 2,4519 2,3882 2,3343 2,2882 2,1819 2,0677 1,9943 1,9429 1,8752 1,8324 1,7405

50 5,3403 3,9749 3,3902 3,0544 2,8327 2,6736 2,5530 2,4579 2,3808 2,3168 2,2627 2,2162 2,1090 1,9933 1,9186 1,8659 1,7963 1,7520 1,6558

100 5,1786 3,8284 3,2496 2,9166 2,6961 2,5374 2,4168 2,3215 2,2439 2,1793 2,1245 2,0773 1,9679 1,8486 1,7705 1,7148 1,6401 1,5917 1,4833

Distribuição F

0 + F

1 2,( ) 0,025g gP F F

25,40( ) 0,025bP F f

42

25,40( 1,99) 0,025P F

g1

1 2 3 4 5 6 7 8 9 10 11 12 15 20 25 30 40 50 100

1 647,789 799,500 864,163 899,583 921,848 937,111 948,217 956,656 963,285 968,627 973,025 976,708 984,867 993,103 998,081 1001,414 1005,598 1008,117 1013,175

2 38,5063 39,0000 39,1655 39,2484 39,2982 39,3315 39,3552 39,3730 39,3869 39,3980 39,4071 39,4146 39,4313 39,4479 39,4579 39,4646 39,4729 39,4779 39,4879

3 17,4434 16,0441 15,4392 15,1010 14,8848 14,7347 14,6244 14,5399 14,4731 14,4189 14,3742 14,3366 14,2527 14,1674 14,1155 14,0805 14,0365 14,0099 13,9563

4 12,2179 10,6491 9,9792 9,6045 9,3645 9,1973 9,0741 8,9796 8,9047 8,8439 8,7935 8,7512 8,6565 8,5599 8,5010 8,4613 8,4111 8,3808 8,3195

5 10,0070 8,4336 7,7636 7,3879 7,1464 6,9777 6,8531 6,7572 6,6811 6,6192 6,5678 6,5245 6,4277 6,3286 6,2679 6,2269 6,1750 6,1436 6,0800

6 8,8131 7,2599 6,5988 6,2272 5,9876 5,8198 5,6955 5,5996 5,5234 5,4613 5,4098 5,3662 5,2687 5,1684 5,1069 5,0652 5,0125 4,9804 4,9154

7 8,0727 6,5415 5,8898 5,5226 5,2852 5,1186 4,9949 4,8993 4,8232 4,7611 4,7095 4,6658 4,5678 4,4667 4,4045 4,3624 4,3089 4,2763 4,2101

8 7,5709 6,0595 5,4160 5,0526 4,8173 4,6517 4,5286 4,4333 4,3572 4,2951 4,2434 4,1997 4,1012 3,9995 3,9367 3,8940 3,8398 3,8067 3,7393

9 7,2093 5,7147 5,0781 4,7181 4,4844 4,3197 4,1970 4,1020 4,0260 3,9639 3,9121 3,8682 3,7694 3,6669 3,6035 3,5604 3,5055 3,4719 3,4034

10 6,9367 5,4564 4,8256 4,4683 4,2361 4,0721 3,9498 3,8549 3,7790 3,7168 3,6649 3,6209 3,5217 3,4185 3,3546 3,3110 3,2554 3,2214 3,1517

11 6,7241 5,2559 4,6300 4,2751 4,0440 3,8807 3,7586 3,6638 3,5879 3,5257 3,4737 3,4296 3,3299 3,2261 3,1616 3,1176 3,0613 3,0268 2,9561

12 6,5538 5,0959 4,4742 4,1212 3,8911 3,7283 3,6065 3,5118 3,4358 3,3736 3,3215 3,2773 3,1772 3,0728 3,0077 2,9633 2,9063 2,8714 2,7996

13 6,4143 4,9653 4,3472 3,9959 3,7667 3,6043 3,4827 3,3880 3,3120 3,2497 3,1975 3,1532 3,0527 2,9477 2,8821 2,8372 2,7797 2,7443 2,6715

14 6,2979 4,8567 4,2417 3,8919 3,6634 3,5014 3,3799 3,2853 3,2093 3,1469 3,0946 3,0502 2,9493 2,8437 2,7777 2,7324 2,6742 2,6384 2,5646

g2 15 6,1995 4,7650 4,1528 3,8043 3,5764 3,4147 3,2934 3,1987 3,1227 3,0602 3,0078 2,9633 2,8621 2,7559 2,6894 2,6437 2,5850 2,5488 2,4739

16 6,1151 4,6867 4,0768 3,7294 3,5021 3,3406 3,2194 3,1248 3,0488 2,9862 2,9337 2,8890 2,7875 2,6808 2,6138 2,5678 2,5085 2,4719 2,3961

17 6,0420 4,6189 4,0112 3,6648 3,4379 3,2767 3,1556 3,0610 2,9849 2,9222 2,8696 2,8249 2,7230 2,6158 2,5484 2,5020 2,4422 2,4053 2,3285

18 5,9781 4,5597 3,9539 3,6083 3,3820 3,2209 3,0999 3,0053 2,9291 2,8664 2,8137 2,7689 2,6667 2,5590 2,4912 2,4445 2,3842 2,3468 2,2692

19 5,9216 4,5075 3,9034 3,5587 3,3327 3,1718 3,0509 2,9563 2,8801 2,8172 2,7645 2,7196 2,6171 2,5089 2,4408 2,3937 2,3329 2,2952 2,2167

20 5,8715 4,4613 3,8587 3,5147 3,2891 3,1283 3,0074 2,9128 2,8365 2,7737 2,7209 2,6758 2,5731 2,4645 2,3959 2,3486 2,2873 2,2493 2,1699

21 5,8266 4,4199 3,8188 3,4754 3,2501 3,0895 2,9686 2,8740 2,7977 2,7348 2,6819 2,6368 2,5338 2,4247 2,3558 2,3082 2,2465 2,2081 2,1280

22 5,7863 4,3828 3,7829 3,4401 3,2151 3,0546 2,9338 2,8392 2,7628 2,6998 2,6469 2,6017 2,4984 2,3890 2,3198 2,2718 2,2097 2,1710 2,0901

23 5,7498 4,3492 3,7505 3,4083 3,1835 3,0232 2,9023 2,8077 2,7313 2,6682 2,6152 2,5699 2,4665 2,3567 2,2871 2,2389 2,1763 2,1374 2,0557

24 5,7166 4,3187 3,7211 3,3794 3,1548 2,9946 2,8738 2,7791 2,7027 2,6396 2,5865 2,5411 2,4374 2,3273 2,2574 2,2090 2,1460 2,1067 2,0243

25 5,6864 4,2909 3,6943 3,3530 3,1287 2,9685 2,8478 2,7531 2,6766 2,6135 2,5603 2,5149 2,4110 2,3005 2,2303 2,1816 2,1183 2,0787 1,9955

30 5,5675 4,1821 3,5894 3,2499 3,0265 2,8667 2,7460 2,6513 2,5746 2,5112 2,4577 2,4120 2,3072 2,1952 2,1237 2,0739 2,0089 1,9681 1,8816

40 5,4239 4,0510 3,4633 3,1261 2,9037 2,7444 2,6238 2,5289 2,4519 2,3882 2,3343 2,2882 2,1819 2,0677 1,9943 1,9429 1,8752 1,8324 1,7405

50 5,3403 3,9749 3,3902 3,0544 2,8327 2,6736 2,5530 2,4579 2,3808 2,3168 2,2627 2,2162 2,1090 1,9933 1,9186 1,8659 1,7963 1,7520 1,6558

100 5,1786 3,8284 3,2496 2,9166 2,6961 2,5374 2,4168 2,3215 2,2439 2,1793 2,1245 2,0773 1,9679 1,8486 1,7705 1,7148 1,6401 1,5917 1,4833

Distribuição F

0 + F

1 2,( ) 0,025g gP F F

25,40( ) 0,025aP F f

43

40,25( ?) 0,025P F

40,25( 2,12) 0,025P F

25,40

1( ) 0,025

2,12P F

25,40( 0,47) 0,025P F

Exemplo: duas v.a. quaisquer têm distribuições normais com médias e variâncias desconhecidas. Retira-se uma amostra de cada população e calculam-se a média e a variância para cada amostra. Teste a hipótese de que as médias populacionais não diferem significativamente a 5% entre si, considerando que:

2 2

1 1 1 2 2 226 10,3 2,34 41 15,7 1,91n X s n X s

Teste de Hipótese para 2 2

1 2 2 2

1 2

?

2,5%2,5%

25;40F

0 + af bf

95%

?

Se H0 é verdadeira, então

Região Crítica:

•aceito H0 se 0,47 < F < 1,99

•rejeito H0 caso contrário

1 2

2 2

1 21; 12 2

2 1

~ n n

sF

s

1 2

2

11; 12

2

~ n n

sF F

s

2,341,2251

1,91F

Hipóteses 2 2 2 2

0 1 2 1 2

2 2

1 1 2

H : / 1 ( )

H : / 1

1,99

Conclusão: Aceito H0, ou seja, não há razões para discordar que, a 5%, 2 2

1 2 44

0,47

Região Crítica:

•aceito H0 se -1,997 < t < 1,997

•rejeito H0 caso contrário

Exemplo: duas v.a. quaisquer têm distribuições normais com médias e variâncias desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Teste a hipótese de que as médias populacionais não diferem significativamente a 5% entre si, considerando que:

? 1,997

Teste de Hipótese para 1 = 2 (cont.)

2 2

1 1 1 2 2 226 10,3 2,34 41 15,7 1,91n X s n X s

1 2

1 2 1 222 2

1 1 2 2

1 2 1 2

( ) ( )~

( 1) ( 1) 1 1

2

n n

X Xt

n s n s

n n n n

Se H0 é verdadeira, então

1 2

1 22

2 2

1 1 2 2

1 2 1 2

~( 1) ( 1) 1 1

2

n n

X Xt t

n s n s

n n n n

Hipóteses H0 : 1 - 2 = 0 (1 = 2)

H1: 1 - 2 0

t = -14,9515

Conclusão: Rejeito H0, ou seja, as médias são diferentes significativamente a 5% 45

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

65t

(t homocedástico)

0

65t

95%

tcrít -tcrít

2,5% 2,5%

1 2

1 2

ˆ ˆ

1 1ˆ ˆ

p pz

pqn n

Teste de Hipótese para p1 = p2

Hipóteses H0 : p1 – p2 = 0 (p1 = p2)

H1: p1 – p2 0

Se H0 é verdadeira, então

Região Crítica:

•aceito H0 se –zcrít < z < zcrít P(–zcrít < z < zcrít) = 1 -

•rejeito H0 caso contrário P(|z| > zcrít) =

Conclusão (sempre associada a um nível de significância )

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- + 0

(0,1)N

2

2

1

zcrít -zcrít

aceitação de H0

rejeição de H0

rejeição de H0

21

2211ˆˆ

ˆnn

pnpnp

1 2 1 2

1 1 2 2

1 2

ˆ ˆ( ) ( )~ (0,1)

p p p pN

p q p q

n n

46

Teste de Hipótese (resumo) X

z

n

Xt

s

n

22

2

( 1)n s

para

(0,1)N

1nt

se 2 é conhecida

se 2 é desconhecida

para 2 2

1n

para 1 - 2

se e são conhecidas

se e são desconhecidas, mas

2

12

2

2

12

22 2

1 2

(0,1)N

1 2 2n nt

gt se e são desconhecidas, mas 2

12

22 2

1 2

1 2 1 2

2 2

1 2

1 2

( ) ( )X Xz

n n

1 2 1 2homo

2 2

1 1 2 2

1 2 1 2

( ) ( )

( 1) ( 1) 1 1

2

X Xt

n s n s

n n n n

1 2 1 2hetero

2 2

1 2

1 2

( ) ( )X Xt

s s

n n

47

Teste de Hipótese (resumo)

2 2

1 2

2 2

2 1

sF

s

p̂ pz

pq

n

para

(0,1)N

1nt

se 2 é conhecida

se 2 é desconhecida

para 2 2

1n

para 1 21, 1n nF

2

1

2

2

para p (0,1)N

para p1 – p2 (0,1)N

para 1 - 2

se e são conhecidas

se e são desconhecidas, mas

2

12

2

2

12

22 2

1 2

(0,1)N

1 2 2n nt

gt se e são desconhecidas, mas 2

12

22 2

1 2

21

2211ˆˆ

ˆnn

pnpnp

1 2 1 2

1 2

ˆ ˆ( ) ( )

1 1ˆ ˆ

p p p pz

pqn n

48

Comparando médias em imagens... 10 pontos são escolhidos em cada imagem

Imagem A Imagem B

Esq

uem

a 1

esc

olha

aleat

ória

E

sque

ma

2

mesm

a po

siçã

o am

ostr

ada

amostra A B 1 12 15

2 34 17

3 16 21

4 28 27

5 15 25

6 17 32

7 23 15

8 13 19

9 29 29

10 31 30

amostra A B 1 12 11

2 34 37

3 16 18

4 28 27

5 15 18

6 17 19

7 23 24

8 13 15

9 29 32

10 31 33

49

Comparando médias em imagens...

Esq

uem

a 1

Esq

uem

a 2

amostra A B 1 12 15

2 34 17

3 16 21

4 28 27

5 15 25

6 17 32

7 23 15

8 13 19

9 29 29

10 31 30

amostra A B 1 12 11

2 34 37

3 16 18

4 28 27

5 15 18

6 17 19

7 23 24

8 13 15

9 29 32

10 31 33

2

2

21,8 66,84

23,0 41,11

A A

B B

X s

X s

2 2

0

2 2

1

H : / 1

H : / 1

A B

A B

0

1

H :

H :

A B

A B

teste F

teste t (homo ou heterocedástico)

50

Comparando médias em imagens...

Esq

uem

a 1

Esq

uem

a 2

amostra A B 1 12 15

2 34 17

3 16 21

4 28 27

5 15 25

6 17 32

7 23 15

8 13 19

9 29 29

10 31 30

amostra A B 1 12 11

2 34 37

3 16 18

4 28 27

5 15 18

6 17 19

7 23 24

8 13 15

9 29 32

10 31 33

2

2

21,8 66,84

23,0 41,11

A A

B B

X s

X s

Aceito H0 a 5% usar teste t homocedástico

Aceito H0 a 5% (as médias são iguais)

1,63calcF (valor-P = 0,24)

0,37calct (valor-P = 0,36)0

1

H :

H :

A B

A B

2

2

21,8 66,84

23,4 74,04

A A

B B

X s

X s

Aceito H0 a 5% (usar teste t homocedástico)

Aceito H0 a 5% (as médias são iguais)

0,90calcF (valor-P = 0,44)

0,43calct (valor-P = 0,34)

2 2

0

2 2

1

H : / 1

H : / 1

A B

A B

0

1

H :

H :

A B

A B

As amostras não são independentes!!! 51

2 2

0

2 2

1

H : / 1

H : / 1

A B

A B

para teste bilateral multiplicar por 2

Teste t pareado

Esq

uem

a 1

Esq

uem

a 2

amostra A B 1 12 15

2 34 17

3 16 21

4 28 27

5 15 25

6 17 32

7 23 15

8 13 19

9 29 29

10 31 30

amostra A B A-B 1 12 11 1

2 34 37 -3

3 16 18 -2

4 28 27 1

5 15 18 -3

6 17 19 -2

7 23 24 -1

8 13 15 -2

9 29 32 -3

10 31 33 -2

2

2

21,8 66,84

23,0 41,11

A A

B B

X s

X s

Teste t pareado 21,6 2,27A B A BX s

H0 : A-B = 0

H1: A-B < 0

1~A Bcalc n

A B

Xt t

s

n

Se H0 verdadeiro

3,36calct

(valor-P = 0,004)

Aceito H0 a 5% usar teste t homocedástico

Aceito H0 a 5% (as médias são iguais)

1,63calcF (valor-P = 0,24)

0,37calct (valor-P = 0,36)0

1

H :

H :

A B

A B

Conclusão: Rejeito H0 a 5%, ou seja, a média da diferença é menor que zero 52

2 2

0

2 2

1

H : / 1

H : / 1

A B

A B

Teste de Hipótese / EXCEL

amostra Alvo 1 Alvo 2 1 128 98

2 134 105

3 110 99

4 112 109

5 125 95

6 107 101

7 111 100

8 115 92

9 130 107

10 120 110

Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?

Comparação de duas médias: teste-t Mas qual? Homo ou heterocedástico?

53

Teste de Hipótese / EXCEL

amostra Alvo 1 Alvo 2 1 128 98

2 134 105

3 110 99

4 112 109

5 125 95

6 107 101

7 111 100

8 115 92

9 130 107

10 120 110

Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?

54

Teste de Hipótese / EXCEL

amostra Alvo 1 Alvo 2 1 128 98

2 134 105

3 110 99

4 112 109

5 125 95

6 107 101

7 111 100

8 115 92

9 130 107

10 120 110

Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?

55

Conclusão: através do teste-F, pode-se concluir que não há razões para discordar que as variâncias sejam iguais para os alvos 1 e 2, adotando-se um nível de significância de 5%, uma vez que valor-P foi maior que 0,05 (valor-P bilateral = 0,185).

Teste-F: duas amostras para variâncias

Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 gl 9 9 F 2,520345 P(F<=f) uni-caudal 0,092349 F crítico uni-caudal 3,178893

Teste de Hipótese / EXCEL

amostra Alvo 1 Alvo 2 1 128 98

2 134 105

3 110 99

4 112 109

5 125 95

6 107 101

7 111 100

8 115 92

9 130 107

10 120 110

Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?

56

Para teste bilateral multiplicar por 2

2 2

0 1 2

2 2

1 1 2

H : / 1

H : / 1

Teste-F: duas amostras para variâncias

Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 gl 9 9 F 2,520345 P(F<=f) uni-caudal 0,092349 F crítico uni-caudal 3,178893

Teste de Hipótese / EXCEL

amostra Alvo 1 Alvo 2 1 128 98

2 134 105

3 110 99

4 112 109

5 125 95

6 107 101

7 111 100

8 115 92

9 130 107

10 120 110

Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?

57

Teste-F: duas amostras para variâncias

Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 gl 9 9 F 2,520345 P(F<=f) uni-caudal 0,092349 F crítico uni-caudal 3,178893

Teste de Hipótese / EXCEL

amostra Alvo 1 Alvo 2 1 128 98

2 134 105

3 110 99

4 112 109

5 125 95

6 107 101

7 111 100

8 115 92

9 130 107

10 120 110

Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?

58

Teste de Hipótese / EXCEL

amostra Alvo 1 Alvo 2 1 128 98

2 134 105

3 110 99

4 112 109

5 125 95

6 107 101

7 111 100

8 115 92

9 130 107

10 120 110

Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?

Teste-F: duas amostras para variâncias

Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 gl 9 9 F 2,520345 P(F<=f) uni-caudal 0,092349 F crítico uni-caudal 3,178893

Teste-t: duas amostras presumindo variâncias equivalentes

Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 Variância agrupada 63,44444 Hipótese da diferença de média 0 gl 18 Stat t 4,940841 P(T<=t) uni-caudal 5,28E-05 t crítico uni-caudal 1,734064 P(T<=t) bi-caudal 0,000106 t crítico bi-caudal 2,100922

H0 : 1 - 2 = 0

H1: 1 - 2 0

Conclusão: através do teste-t homocedástico (bilateral), pode-se concluir que as médias dos alvos 1 e 2 são diferentes, adotando-se um nível de significância de 5%, uma vez que valor-P foi menor que 0,05 (valor-P bilateral = 0,000106).

59

Teste de Hipótese / EXCEL

amostra Alvo 1 Alvo 2 1 128 98

2 134 105

3 110 99

4 112 109

5 125 95

6 107 101

7 111 100

8 115 92

9 130 107

10 120 110

Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?

Teste-F: duas amostras para variâncias

Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 gl 9 9 F 2,520345 P(F<=f) uni-caudal 0,092349 F crítico uni-caudal 3,178893

Teste-t: duas amostras presumindo variâncias equivalentes

Alvo 1 Alvo 2 Média 119,2 101,6 Variância 90,84444 36,04444 Observações 10 10 Variância agrupada 63,44444 Hipótese da diferença de média 0 gl 18 Stat t 4,940841 P(T<=t) uni-caudal 5,28E-05 t crítico uni-caudal 1,734064 P(T<=t) bi-caudal 0,000106 t crítico bi-caudal 2,100922

H0 : 1 - 2 = 0

H1: 1 - 2 > 0

Conclusão: através do teste-t homocedástico unilateral, pode-se concluir que a média do alvo 1 deve ser maior que a do alvo 2, adotando-se um nível de significância de 5%, uma vez que valor-P foi menor que 0,05 (valor-P = 0,0000528).

60

Teste de Hipótese / R

amostra Alvo 1 Alvo 2 1 128 98

2 134 105

3 110 99

4 112 109

5 125 95

6 107 101

7 111 100

8 115 92

9 130 107

10 120 110

Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta?

> a1<-c(128,134,110,112,125,107,111,115,130,120) > a2<-c(98,105,99,109,95,101,100,92,107,110) > var.test(a1,a2)

F test to compare two variances data: a1 and a2 F = 2.5203, num df = 9, denom df = 9, p-value = 0.1847 alternative hypothesis: true ratio of variances is not equal to 1

> mean(a1) [1] 119.2 > mean(a2) [1] 101.6

H0 : 1 - 2 = 0

H1: 1 - 2 > 0

> t.test(a1,a2,var.equal=T,alternative="greater")

Two Sample t-test data: a1 and a2 t = 4.9408, df = 18, p-value = 5.277e-05 alternative hypothesis: true difference in means is greater than 0

H0 : 1 / 2 = 1

H1: 1 / 2 ≠ 1

Conclusão: a média do alvo 1 é significativamente (5%) maior que a média do alvo 2. 61

Pressuposição de Normalidade dos Dados

Como foi visto, algumas distribuições usadas para a construção de Intervalos de Confiança e Testes de Hipótese têm sua origem fundamentada na condição de que as populações sejam normalmente distribuídas.

62

2~ ( , )iX N 1 2, , , nX X X X amostra aleatória

22

12

( 1)~ n

n s

1~ n

Xt

s

n

1 2

1 2 1 222 2

1 1 2 2

1 2 1 2

( ) ( )~

( 1) ( 1) 1 1

2

n n

X Xt

n s n s

n n n n

1 2

2 2

1 21, 12 2

2 1

~ n n

sF

s

Mas como a falta de normalidade dos dados pode afetar os resultados? Para entender o papel da normalidade nos testes de hipóteses, vamos simular

amostragens de diferentes tamanhos em populações com e sem normalidade e avaliar os impactos sobre as conclusões de testes de hipóteses para e 2.

Testes de Hipótese para e 2

Foram realizadas 10000 simulações de amostras com tamanho n = 5, 10 e 50 considerando as distribuições:

X1 ~ Uniforme(100,300) X: {100, 101, ..., 300} = 200 2 = 3366,67

X2 ~ N( = 200, 2 = 3366,67)

Para cada amostra, foram calculadas a média e a variância amostrais e as respectivas

estatísticas t e 2 usadas pata testar as hipóteses considerando = 5%: H0: = 200 H0:

2 = 3366,67

H1: 200 H1: 2 3366,67

A distribuição dos valores simulados foram comparados aos valores da distribuição

teórica esperada Em seguida, contabilizou-se a frequência com que as hipóteses nulas foram rejeitadas

indevidamente, o que deveria corresponder, em teoria, ao valor de significância .

(SimulacaoTesteHip.xlsx) 63

22

2

( 1)n s

Xt

s

n

Testes de Hipótese para e 2

Distribuições Simuladas:

64

X2 ~ N( = 200, 2 = 3366,67)

X1 ~ Uniforme(100,300)

2=

𝑛−

1𝑠 12

𝜎2

𝑡=

𝑋 1−

𝜇𝑠 1 𝑛

n = 5 n = 10 n = 50

Proporção de H0 falsa (𝛼 )

n = 5 n = 10 n = 50

H0: = 200 6,7% 5,6% 5,1%

H0: 2 = 3366,67 1,7% 0,7% 0,2%

Rejeita mais!

= P(rejeitar indevidamente H0) = 5%

Aceita mais!

Testes de Hipótese para e 2

Distribuições Simuladas:

65

X2 ~ N( = 200, 2 = 3366,67)

X1 ~ Uniforme(100,300)

2=

𝑛−

1𝑠 22

𝜎2

𝑡=

𝑋 2−

𝜇𝑠 2 𝑛

n = 5 n = 10 n = 50

Proporção de H0 falsa (𝛼 )

n = 5 n = 10 n = 50

H0: = 200 4,8% 5,1% 4,9%

H0: 2 = 3366,67 4,7% 5,1% 5,0%

= P(rejeitar indevidamente H0) = 5%