Download - Estat stica e Probabilidade - PROFMAT (UFRJ) Per odo: 2019 ... · Na aula de hoje apresentaremos os m etodos padr~ao para testes de a rmativas tais como as dadas a seguir, baseadas

Estatıstica e Probabilidade - PROFMAT

(UFRJ)

Perıodo: 2019/2

Aula #03 de Inferencia Estatıstica: 01/11/2019

1

Testes de Hipoteses:

Veremos

• a terminologia usada em testes de hipoteses

(hipoteses nula e alternativa, erros tipo I

e tipo II, hipoteses unilaterais e bilaterais,

etc);

• como construir um teste de hipoteses;

• testes de hipoteses sobre a media e a pro-

porcao populacionais.

Referencias Principais:

Bussab e Morettin. Estatıstica Basica. Editora Saraiva.Quinta edicao. (Cap. 12).

Triola. Introducao a Estatıstica. LTC. Nona edicao.(Cap. 7).

2

Exemplo 1: Resultados da pesquisa “fo-

topolicial”: o que eles revelam?

Uma pesquisa em Minnesota foi realizada com

o objetivo de revelar opinioes sobre o “fotopoli-

cial” que usa cameras posicionadas de modo a

flagrarem motoristas que desrespeitam o sinal

vermelho. As cameras fotografam as placas

dos carros que avancam o sinal vermelho. Um

jornal local patrocinou uma pesquisa devido a

legislacao de Minnesota, ainda pendente, que

aprovaria o uso de cameras por violacoes de

transito.

Os pesquisadores entrevistaram 829 adultos

de Minnesota e verificaram que 51% se o-

punham a legislacao sobre o “fotopolicial”.

3

Exemplo 2: A maioria de nos ultrapassa

um sinal vermelho?

Em uma pesquisa, de nıvel nacional, com 880

motoristas selecionados aleatoriamente, 56%

admitiram que avancavam um sinal ver-

melho. Ao escrever um artigo distribuıdo pela

Associated Press, a reporter Sonja Barisic es-

creveu: “Praticamente todos os americanos

admitem que avancar um sinal vermelho e peri-

goso, mas mais da metade admitiu que ja o fez,

em geral porque estavam com muita pressa.”

Essa frase inclui a maioria (mais de 50%) de

todos os motoristas americanos ultrapassa um

sinal vermelho. Os resultados da pesquisa real-

mente confirmam essa alternativa?

4

Na aula de hoje apresentaremos os metodos

padrao para testes de afirmativas tais como

as dadas a seguir, baseadas nos dois exemplos

anteriores.

• Ha evidencia amostral suficiente para apoiar

a afirmativa de que a proporcao de todos

os adultos de Minnesota que se opoem a

legislacao do foto-policial e maior que 0,5?

• Ha evidencia amostral suficiente para apoiar

a afirmacao de que a proporcao dos mo-

toristas americanos que ultrapassa um sinal

vermelho e maior do que 0,5?

5

Conceitos Basicos

Em estatıstica, uma hipotese e uma afirmacao

sobre um parametro, ou seja, sobre uma ca-

racterıstica da populacao.

Um teste de hipotese e um procedimento

para testar uma hipotese baseado numa amos-

tra da populacao.

Regra do Evento Raro.

Se a probabilidade de um evento particular ob-

servado sob uma dada suposicao e excepcional-

mente pequena, concluımos que a suposicao

provavelmente nao e verdadeira.

6

Exemplo 3: Escolha de sexo.

As Industrias ProCare comercializaram um pro-

duto chamado Gender Choice que, de acordo

com a propaganda, permitia aos casais aumen-

tar suas chances de ter um menino em ate

85%, e uma menina, em ate 80%.

Suponha a realizacao do seguinte experimen-

to com 100 casais que desejam ter uma

menina e usam o produto Gender Choice para

aumentar as chances de gerar uma menina.

Com o proposito de testar o produto faremos

a suposicao de que o produto nao apresenta

qualquer efeito, ou seja, de que, a proba-

bilidade de gerar uma menina e 50%, mesmo

usando o produto.

7

Usando o bom senso e nenhum metodo formal

de Estatıstica, o que poderıamos concluir so-

bre a suposicao de nenhum efeito do Gender

Choice, se 100 casais que querem uma menina

e usam o produto tem 100 bebes, sendo

(a) cinquenta e duas (52) meninas?

(b) noventa e sete (97) meninas?

Solucao

(a) Em geral, esperamos cerca de 50 meninas

em 100 nascimentos. O resultado 52 meni-

nas e proximo de 50 de modo que nao pode-

mos concluir que o Gender Choice seja eficaz.

Se os 100 casais nao tivessem usado qualquer

metodo especial de escolha de sexo, o resul-

tado de 52 meninas poderia facilmente ocorrer

ao acaso.

8

A suposicao de nenhum efeito do Gender Choi-

ce parece ser adequada. Com base nesses re-

sultados do experimento, nao ha evidencia su-

ficiente para dizer que o produto seja eficaz.

(b) O resultado 97 meninas em 100 nascimen-

tos e extremamente improvavel de ocorrer por

acaso. Poderıamos explicar a ocorrencia de

97 meninas de uma de duas maneiras: ou um

evento extremamente raro ocorreu por acaso,

ou o Gender Choice e eficaz. A probabilidade

extremamente baixa de 97 meninas em 100

nascimentos e evidencia forte contra a hipotese

de que o Gender Choice nao tenha qualquer

efeito. Logo, com base nesses resultados do

experimento, o produto parece ser eficaz em

aumentar as chances de se gerar uma menina.

9

O ponto-chave nesse exemplo e o de que deve-

mos concluir que o produto e eficaz apenas se

obtivermos significativamente mais meninas

do que em geral esperarıamos. Embora os re-

sultados de 52 meninas e 97 meninas estejam

ambos “acima da media (50)”, o resultado 52

nao e significativo, enquanto que o de 97 e um

resultado significativo.

Esse exemplo ilustra a abordagem basica u-

sada em testes de hipoteses. O metodo formal

envolve uma variedade de termos e condicoes

padroes, incorporados em um procedimento or-

ganizado.

10

Fundamentos do Teste de Hipotese

1. Hipoteses Nula (H0) e Alternativa (H1)

A hipotese nula, denotada por H0, e uma afir-

mativa sobre um parametro. Por exemplo:

µ = 90, p = 0,10, σ ≥ 2, etc.

A hipotese alternativa, denotada por H1, e

uma afirmativa complementar a hipotese nula

tal que nao exista intersecao entre as duas

hipoteses. Por exemplo: µ > 90, p 6= 0,10,

σ < 2, etc.

Temos que decidir por uma das duas hipotesesbaseando-nos numa amostra da populacao. Lo-go, estamos sujeitos a dois erros diferentes.

Decisao H0 e verdadeira H0 nao e verdadeiraRejeitar H0 Erro tipo I sem erroNao rejeitar H0 sem erro Erro tipo II

11

2. Estatıstica de Teste: e uma funcao que

produz um valor real com base nos dados amos-

trais.

Uma regra de decisao ou procedimento de

teste consiste em especificar um conjunto de

valores da estatıstica de teste para os quais

rejeitaremos a hipotese nula (H0). Chama-

mos esse conjunto de valores, para os quais

rejeitaremos H0, de Regiao Crıtica do teste.

Como escolher a estatıstica de teste?

Isso dependera das hipoteses que serao tes-

tadas. Para cada teste, ha uma escolha na-

tural. Por exemplo, num teste sobre a media

populacional usamos a media amostral ou o

seu valor “padronizado” de acordo com a hipo-

tese nula.

12

Como especificar a regiao crıtica do teste?

4. Nıvel de Significancia (α) do teste: e a

probabilidade de se cometer o erro tipo I, ou

seja, e a probabilidade de rejeitar uma hipotese

nula verdadeira.

No procedimento classico de testes de hipote-

ses, fixa-se o valor do nıvel de significancia,

geralmente em 1%, 5% ou 10%, e, usando a

distribuicao amostral da estatıstica de teste, e

possıvel determinar a Regiao Crıtica do teste.

Esse procedimento baseia-se na suposicao de

que o erro tipo I e o mais grave.

13

5. Erro tipo II: usamos a letra grega β para

representar a probabilidade de cometer o erro

tipo II: “nao rejeitar uma hipotese nula falsa”.

Por convencao, a hipotese nula sera sempre

uma hipotese simples, isto e, admitira um unico

valor para o parametro. Desse modo, calcular

a probabilidade de se cometer o erro I, e trivial,

pois se H0 e verdadeira, o valor do parametro

esta determinado.

No entanto, a hipotese alternativa sera com-

posta, ou seja, admitira mais de um valor pos-

sıvel para o parametro. Logo, a suposicao de

que H0 e falsa implicara em mais de uma pos-

sibilidade de valor para o parametro, tal que

a probabilidade de se cometer o erro tipo II

e uma funcao dos valores admitidos sob essa

condicao.

14

Exemplo 4: Especificacao da hipotese nula

sob o procedimento classico.

Nas situacoes a seguir, escolha como hipotese

nula, aquela que para voce leva a um erro tipo

I mais grave. Descreva quais sao os dois erros

em cada caso.

a. O trabalho de um operador de radar e detectar aeronaves inimi-gas. Quando surge alguma coisa estranha na tela, ele deve decidirentre as hipoteses

1. esta comecando um ataque;

2. tudo bem, apenas uma leve interferencia.

b. Num juri, um indivıduo esta sendo julgado por um crime. Ashipoteses sujeitas ao juri sao:

1. o acusado e inocente;

2. o acusado e culpado.

c. Um pesquisador acredita que descobriu uma vacina contra res-friado. Ele ira conduzir uma pesquisa de laboratorio para verificara veracidade da afirmacao. As hipoteses que pode testar sao:

1. a vacina e eficaz;

2. a vacina nao e eficaz.

15

6. Testes Bilaterais e Unilaterais: estao

associados a forma da hipotese alternativa e,

consequentemente, da regiao crıtica.

Suponha um teste sobre a media populacional

e que a media amostral e usada como estatısti-

ca de teste. Suponha tambem que

H0 : µ = µ0.

Se a hipotese alternativa e do tipo µ 6= µ0, rejeitaremosH0 para valores da media amostral significativamenteafastados de µ0, a esquerda ou a direita de µ0. Nessecaso, temos um teste bicaudal/bilateral.

Se a hipotese alternativa e do tipo µ > µ0, rejeitaremosH0 para valores da media amostral significativamenteafastados de µ0, a direita de µ0. Nesse caso, temos umteste unicaudal/unilateral.

Se a hipotese alternativa e do tipo µ < µ0, rejeitaremosH0 para valores da media amostral significativamenteafastados de µ0, a esquerda de µ0. Nesse caso, temosum teste unicaudal/unilateral.

17

7. Procedimento Classico de Testes de

Hipoteses:

Passo 1: Fixe a hpotese nula a ser testada equal e a forma da hipotese alternativa.

Passo 2: Use a teoria estatıstica e as informa-coes disponıveis para decidir qual estatısticasera usada no teste. Obtenha a distribuicaoamostral da estatıstica de teste.

Passo 3: Fixe o nıvel de significancia α doteste, isto e, a probabilidade de rejeitar umahipotese nula verdadeira e determine a regiaocrıtica do teste.

Passo 4: Use a amostra para calcular o valoramostral da estatıstica de teste.

Passo 5: Se o valor amostral cair na regiaocrıtica, rejeite H0, caso contrario, nao rejeiteH0.

18

Vejamos como ficam esses passos no exemplo

dos motoristas que avancam o sinal ver-

melho.

Lembre que n = 880 e p = 0,56, a proporcao

amostral dos motoristas que avancam um sinal

vermelho. Seja p, a proporcao populacional

dos motoristas que avancam um sinal vermelho.

Podemos fixar como hipoteses

{H0 : p = 0,50H1 : p > 0,50

.

H1 representa a afirmacao da reporter de que a

maioria dos motoristas americanos avanca um

sinal vermelho (p > 0,50).

Como estatıstica de teste vamos usar a pro-

porcao amostral p.

19

Do Teorema Central do Limite (TCL) temos,

para n grande

p− p√p(1− p)/n

a∼ N(0,1).

Fixemos o nıvel de significancia do teste, ou

seja, a probabilidade de rejeitar H0, quando

ela e verdadeira em 5%: α = 0,05.

Como o teste e unilateral, a forma da regiao

crıtica sera unicaudal a direita (H1 : p > 0,50).

Dizer que H0 e verdadeira nesse exemplo equi-

vale a ter p = 0,50 tal que

p− 0,5√0,5× (1− 0,5)/880

a∼ N(0,1) sob H0.

20

Como φ(1,64) ' 0,95, conforme a figura a

seguir,

segue que a regiao crıtica sera do tipo

Z0 =p− 0,5√0,25/880

> 1,64

ou, equivalentemente, p > 0,5 + 1,64×√

0,25800' 0,528.

Como o valor amostral e z0 =0,56− 0,5√

0,25/880' 3,56 (p =

0,56), ao nıvel de significancia de 5%, rejeitamos ahipotese nula de que p = 0,50 em favor da hipotesealternativa de que p > 0,50.

21

8. Terminologia: Aceitar/Nao Rejeitar

Alguns textos dizem “aceitar” H0 em vez de

“nao rejeitar” H0. Qualquer que seja a ex-

pressao usada: aceitar ou nao rejeitar, deve-

se reconhecer que nao estamos provando a

hipotese nula; estamos apenas dizendo que a

evidencia amostral nao e forte o bastante para

garantir a sua rejeicao.

E como um juri dizendo que nao ha evidencia

suficiente para condenar um suspeito. O termo

aceitar e, de alguma forma enganoso, pois pa-

rece implicar que a hipotese nula foi compro-

vada. A sentenca “nao rejeitar” H0 diz mais

corretamente que a evidencia nao e forte para

garantir a rejeicao de H0.

22

9. Valor-p, p-valor, Nıvel Descritivo ou Pro-

babilidade de Significancia

O procedimento classico de testes de hipotesesparte da fixacao do valor do nıvel de significan-cia α.

Outra maneira de proceder consiste em apre-sentar o p-valor do teste. De maneira infor-mal, o p-valor caracteriza o grau de adesaodos dados amostrais a hipotese nula. E calcu-lado usando-se uma probabilidade condicional,supondo que H0 e verdadeira. Portanto, o p-

valor esta entre 0 e 1. Na pratica, rejeitaremosH0 para p-valores muito pequenos.

A diferenca e que aqui nao se constroi umaregiao crıtica. Nesse procedimento, calculamoso valor amostral da estatıstica de teste e verifi-camos como esse valor se apresenta com rela-cao a distribuicao amostral sob a suposicao deH0 ser verdadeira.

23

Se o valor amostral da estatıstica de teste es-tiver muito na cauda dessa distribuicao, con-cluiremos que os dados nao estao trazendoevidencia a favor de H0. Caso contrario, naoteremos evidencia contra H0.

O calculo do p-valor dependera se o teste euni ou bilateral.

Vejamos como fica o p-valor no exemplo dosmotoristas que avancam o sinal vermelho.

Sob H0, vimos quep− 0,5√0,25/880

a∼ N(0,1).

O valor amostral da estatıstica de teste e

z0 = 0,56−0,50√0,25/880

' 3,56 tal que

p-valor = P (Z0 ≥ 3,56|H0) ' 0,0002.

Sob H0 a distribuicao de Z0 e N(0,1).

24

Ou seja, se H0 e de fato verdadeira, a probabili-

dade de termos obtido uma proporcao amostral

tao grande ou maior que 0,56 e de apenas um

para cada 5000.

Portanto, concluımos que os dados nao trazem

evidencia a favor de H0 e devemos rejeita-la.

Observe que apesar de usarmos um procedi-

mento diferente, chegamos a mesma conclusao

quando adotamos o procedimento classico com

nıvel de significancia de 5%.

25

De fato, o p-valor corresponde ao maior nıvel

de significancia para o qual aceitaremos H0.

Para qualquer nıvel de significancia α ≤ p-valor,

aceitamos H0.

Fisher (1954) sugeriu uma escala de evidencia

com base no p-valor

p-valor Natureza da evidenciacontra H0

0,10 marginal0,05 moderada

0,025 substancial0,01 forte

0,005 muito forte0,001 fortıssima

26

Se o teste for bilateral, deveremos calcular a

area das duas caudas correspondentes ao valor

amostral padronizado supondo H0 verdadeira.

A maioria dos softwares estatısticos retornam

o p-valor dos testes executados. Por isso e

fundamental saber interpreta-los.

Assim, lembre-se de em todo teste ter clareza

de quem e a hipotese nula e quem e a hipotese

alternativa. Alem disso, lembre que o p-valor

fornece um grau de evidencia amostral contra

H0, no sentido de quanto menor ele e, mais

forte e a evidencia contra a hipotese nula.

Lembre: podemos pensar no p-valor como uma

medida de adesao dos dados amostrais a hipo-

tese nula. Se ele nao e muito pequeno e porque

e razoavel que eles tenham sido gerados pela

distribuicao proposta por H0.

27

Download - Estat stica e Probabilidade - PROFMAT (UFRJ) Per odo: 2019 ... · Na aula de hoje apresentaremos os m etodos padr~ao para testes de a rmativas tais como as dadas a seguir, baseadas

Top Related