Estatıstica e Probabilidade - PROFMAT
(UFRJ)
Perıodo: 2019/2
Aula #03 de Inferencia Estatıstica: 01/11/2019
1
Testes de Hipoteses:
Veremos
• a terminologia usada em testes de hipoteses
(hipoteses nula e alternativa, erros tipo I
e tipo II, hipoteses unilaterais e bilaterais,
etc);
• como construir um teste de hipoteses;
• testes de hipoteses sobre a media e a pro-
porcao populacionais.
Referencias Principais:
Bussab e Morettin. Estatıstica Basica. Editora Saraiva.Quinta edicao. (Cap. 12).
Triola. Introducao a Estatıstica. LTC. Nona edicao.(Cap. 7).
2
Exemplo 1: Resultados da pesquisa “fo-
topolicial”: o que eles revelam?
Uma pesquisa em Minnesota foi realizada com
o objetivo de revelar opinioes sobre o “fotopoli-
cial” que usa cameras posicionadas de modo a
flagrarem motoristas que desrespeitam o sinal
vermelho. As cameras fotografam as placas
dos carros que avancam o sinal vermelho. Um
jornal local patrocinou uma pesquisa devido a
legislacao de Minnesota, ainda pendente, que
aprovaria o uso de cameras por violacoes de
transito.
Os pesquisadores entrevistaram 829 adultos
de Minnesota e verificaram que 51% se o-
punham a legislacao sobre o “fotopolicial”.
3
Exemplo 2: A maioria de nos ultrapassa
um sinal vermelho?
Em uma pesquisa, de nıvel nacional, com 880
motoristas selecionados aleatoriamente, 56%
admitiram que avancavam um sinal ver-
melho. Ao escrever um artigo distribuıdo pela
Associated Press, a reporter Sonja Barisic es-
creveu: “Praticamente todos os americanos
admitem que avancar um sinal vermelho e peri-
goso, mas mais da metade admitiu que ja o fez,
em geral porque estavam com muita pressa.”
Essa frase inclui a maioria (mais de 50%) de
todos os motoristas americanos ultrapassa um
sinal vermelho. Os resultados da pesquisa real-
mente confirmam essa alternativa?
4
Na aula de hoje apresentaremos os metodos
padrao para testes de afirmativas tais como
as dadas a seguir, baseadas nos dois exemplos
anteriores.
• Ha evidencia amostral suficiente para apoiar
a afirmativa de que a proporcao de todos
os adultos de Minnesota que se opoem a
legislacao do foto-policial e maior que 0,5?
• Ha evidencia amostral suficiente para apoiar
a afirmacao de que a proporcao dos mo-
toristas americanos que ultrapassa um sinal
vermelho e maior do que 0,5?
5
Conceitos Basicos
Em estatıstica, uma hipotese e uma afirmacao
sobre um parametro, ou seja, sobre uma ca-
racterıstica da populacao.
Um teste de hipotese e um procedimento
para testar uma hipotese baseado numa amos-
tra da populacao.
Regra do Evento Raro.
Se a probabilidade de um evento particular ob-
servado sob uma dada suposicao e excepcional-
mente pequena, concluımos que a suposicao
provavelmente nao e verdadeira.
6
Exemplo 3: Escolha de sexo.
As Industrias ProCare comercializaram um pro-
duto chamado Gender Choice que, de acordo
com a propaganda, permitia aos casais aumen-
tar suas chances de ter um menino em ate
85%, e uma menina, em ate 80%.
Suponha a realizacao do seguinte experimen-
to com 100 casais que desejam ter uma
menina e usam o produto Gender Choice para
aumentar as chances de gerar uma menina.
Com o proposito de testar o produto faremos
a suposicao de que o produto nao apresenta
qualquer efeito, ou seja, de que, a proba-
bilidade de gerar uma menina e 50%, mesmo
usando o produto.
7
Usando o bom senso e nenhum metodo formal
de Estatıstica, o que poderıamos concluir so-
bre a suposicao de nenhum efeito do Gender
Choice, se 100 casais que querem uma menina
e usam o produto tem 100 bebes, sendo
(a) cinquenta e duas (52) meninas?
(b) noventa e sete (97) meninas?
Solucao
(a) Em geral, esperamos cerca de 50 meninas
em 100 nascimentos. O resultado 52 meni-
nas e proximo de 50 de modo que nao pode-
mos concluir que o Gender Choice seja eficaz.
Se os 100 casais nao tivessem usado qualquer
metodo especial de escolha de sexo, o resul-
tado de 52 meninas poderia facilmente ocorrer
ao acaso.
8
A suposicao de nenhum efeito do Gender Choi-
ce parece ser adequada. Com base nesses re-
sultados do experimento, nao ha evidencia su-
ficiente para dizer que o produto seja eficaz.
(b) O resultado 97 meninas em 100 nascimen-
tos e extremamente improvavel de ocorrer por
acaso. Poderıamos explicar a ocorrencia de
97 meninas de uma de duas maneiras: ou um
evento extremamente raro ocorreu por acaso,
ou o Gender Choice e eficaz. A probabilidade
extremamente baixa de 97 meninas em 100
nascimentos e evidencia forte contra a hipotese
de que o Gender Choice nao tenha qualquer
efeito. Logo, com base nesses resultados do
experimento, o produto parece ser eficaz em
aumentar as chances de se gerar uma menina.
9
O ponto-chave nesse exemplo e o de que deve-
mos concluir que o produto e eficaz apenas se
obtivermos significativamente mais meninas
do que em geral esperarıamos. Embora os re-
sultados de 52 meninas e 97 meninas estejam
ambos “acima da media (50)”, o resultado 52
nao e significativo, enquanto que o de 97 e um
resultado significativo.
Esse exemplo ilustra a abordagem basica u-
sada em testes de hipoteses. O metodo formal
envolve uma variedade de termos e condicoes
padroes, incorporados em um procedimento or-
ganizado.
10
Fundamentos do Teste de Hipotese
1. Hipoteses Nula (H0) e Alternativa (H1)
A hipotese nula, denotada por H0, e uma afir-
mativa sobre um parametro. Por exemplo:
µ = 90, p = 0,10, σ ≥ 2, etc.
A hipotese alternativa, denotada por H1, e
uma afirmativa complementar a hipotese nula
tal que nao exista intersecao entre as duas
hipoteses. Por exemplo: µ > 90, p 6= 0,10,
σ < 2, etc.
Temos que decidir por uma das duas hipotesesbaseando-nos numa amostra da populacao. Lo-go, estamos sujeitos a dois erros diferentes.
Decisao H0 e verdadeira H0 nao e verdadeiraRejeitar H0 Erro tipo I sem erroNao rejeitar H0 sem erro Erro tipo II
11
2. Estatıstica de Teste: e uma funcao que
produz um valor real com base nos dados amos-
trais.
Uma regra de decisao ou procedimento de
teste consiste em especificar um conjunto de
valores da estatıstica de teste para os quais
rejeitaremos a hipotese nula (H0). Chama-
mos esse conjunto de valores, para os quais
rejeitaremos H0, de Regiao Crıtica do teste.
Como escolher a estatıstica de teste?
Isso dependera das hipoteses que serao tes-
tadas. Para cada teste, ha uma escolha na-
tural. Por exemplo, num teste sobre a media
populacional usamos a media amostral ou o
seu valor “padronizado” de acordo com a hipo-
tese nula.
12
Como especificar a regiao crıtica do teste?
4. Nıvel de Significancia (α) do teste: e a
probabilidade de se cometer o erro tipo I, ou
seja, e a probabilidade de rejeitar uma hipotese
nula verdadeira.
No procedimento classico de testes de hipote-
ses, fixa-se o valor do nıvel de significancia,
geralmente em 1%, 5% ou 10%, e, usando a
distribuicao amostral da estatıstica de teste, e
possıvel determinar a Regiao Crıtica do teste.
Esse procedimento baseia-se na suposicao de
que o erro tipo I e o mais grave.
13
5. Erro tipo II: usamos a letra grega β para
representar a probabilidade de cometer o erro
tipo II: “nao rejeitar uma hipotese nula falsa”.
Por convencao, a hipotese nula sera sempre
uma hipotese simples, isto e, admitira um unico
valor para o parametro. Desse modo, calcular
a probabilidade de se cometer o erro I, e trivial,
pois se H0 e verdadeira, o valor do parametro
esta determinado.
No entanto, a hipotese alternativa sera com-
posta, ou seja, admitira mais de um valor pos-
sıvel para o parametro. Logo, a suposicao de
que H0 e falsa implicara em mais de uma pos-
sibilidade de valor para o parametro, tal que
a probabilidade de se cometer o erro tipo II
e uma funcao dos valores admitidos sob essa
condicao.
14
Exemplo 4: Especificacao da hipotese nula
sob o procedimento classico.
Nas situacoes a seguir, escolha como hipotese
nula, aquela que para voce leva a um erro tipo
I mais grave. Descreva quais sao os dois erros
em cada caso.
a. O trabalho de um operador de radar e detectar aeronaves inimi-gas. Quando surge alguma coisa estranha na tela, ele deve decidirentre as hipoteses
1. esta comecando um ataque;
2. tudo bem, apenas uma leve interferencia.
b. Num juri, um indivıduo esta sendo julgado por um crime. Ashipoteses sujeitas ao juri sao:
1. o acusado e inocente;
2. o acusado e culpado.
c. Um pesquisador acredita que descobriu uma vacina contra res-friado. Ele ira conduzir uma pesquisa de laboratorio para verificara veracidade da afirmacao. As hipoteses que pode testar sao:
1. a vacina e eficaz;
2. a vacina nao e eficaz.
15
6. Testes Bilaterais e Unilaterais: estao
associados a forma da hipotese alternativa e,
consequentemente, da regiao crıtica.
Suponha um teste sobre a media populacional
e que a media amostral e usada como estatısti-
ca de teste. Suponha tambem que
H0 : µ = µ0.
Se a hipotese alternativa e do tipo µ 6= µ0, rejeitaremosH0 para valores da media amostral significativamenteafastados de µ0, a esquerda ou a direita de µ0. Nessecaso, temos um teste bicaudal/bilateral.
Se a hipotese alternativa e do tipo µ > µ0, rejeitaremosH0 para valores da media amostral significativamenteafastados de µ0, a direita de µ0. Nesse caso, temos umteste unicaudal/unilateral.
Se a hipotese alternativa e do tipo µ < µ0, rejeitaremosH0 para valores da media amostral significativamenteafastados de µ0, a esquerda de µ0. Nesse caso, temosum teste unicaudal/unilateral.
17
7. Procedimento Classico de Testes de
Hipoteses:
Passo 1: Fixe a hpotese nula a ser testada equal e a forma da hipotese alternativa.
Passo 2: Use a teoria estatıstica e as informa-coes disponıveis para decidir qual estatısticasera usada no teste. Obtenha a distribuicaoamostral da estatıstica de teste.
Passo 3: Fixe o nıvel de significancia α doteste, isto e, a probabilidade de rejeitar umahipotese nula verdadeira e determine a regiaocrıtica do teste.
Passo 4: Use a amostra para calcular o valoramostral da estatıstica de teste.
Passo 5: Se o valor amostral cair na regiaocrıtica, rejeite H0, caso contrario, nao rejeiteH0.
18
Vejamos como ficam esses passos no exemplo
dos motoristas que avancam o sinal ver-
melho.
Lembre que n = 880 e p = 0,56, a proporcao
amostral dos motoristas que avancam um sinal
vermelho. Seja p, a proporcao populacional
dos motoristas que avancam um sinal vermelho.
Podemos fixar como hipoteses
{H0 : p = 0,50H1 : p > 0,50
.
H1 representa a afirmacao da reporter de que a
maioria dos motoristas americanos avanca um
sinal vermelho (p > 0,50).
Como estatıstica de teste vamos usar a pro-
porcao amostral p.
19
Do Teorema Central do Limite (TCL) temos,
para n grande
p− p√p(1− p)/n
a∼ N(0,1).
Fixemos o nıvel de significancia do teste, ou
seja, a probabilidade de rejeitar H0, quando
ela e verdadeira em 5%: α = 0,05.
Como o teste e unilateral, a forma da regiao
crıtica sera unicaudal a direita (H1 : p > 0,50).
Dizer que H0 e verdadeira nesse exemplo equi-
vale a ter p = 0,50 tal que
p− 0,5√0,5× (1− 0,5)/880
a∼ N(0,1) sob H0.
20
Como φ(1,64) ' 0,95, conforme a figura a
seguir,
segue que a regiao crıtica sera do tipo
Z0 =p− 0,5√0,25/880
> 1,64
ou, equivalentemente, p > 0,5 + 1,64×√
0,25800' 0,528.
Como o valor amostral e z0 =0,56− 0,5√
0,25/880' 3,56 (p =
0,56), ao nıvel de significancia de 5%, rejeitamos ahipotese nula de que p = 0,50 em favor da hipotesealternativa de que p > 0,50.
21
8. Terminologia: Aceitar/Nao Rejeitar
Alguns textos dizem “aceitar” H0 em vez de
“nao rejeitar” H0. Qualquer que seja a ex-
pressao usada: aceitar ou nao rejeitar, deve-
se reconhecer que nao estamos provando a
hipotese nula; estamos apenas dizendo que a
evidencia amostral nao e forte o bastante para
garantir a sua rejeicao.
E como um juri dizendo que nao ha evidencia
suficiente para condenar um suspeito. O termo
aceitar e, de alguma forma enganoso, pois pa-
rece implicar que a hipotese nula foi compro-
vada. A sentenca “nao rejeitar” H0 diz mais
corretamente que a evidencia nao e forte para
garantir a rejeicao de H0.
22
9. Valor-p, p-valor, Nıvel Descritivo ou Pro-
babilidade de Significancia
O procedimento classico de testes de hipotesesparte da fixacao do valor do nıvel de significan-cia α.
Outra maneira de proceder consiste em apre-sentar o p-valor do teste. De maneira infor-mal, o p-valor caracteriza o grau de adesaodos dados amostrais a hipotese nula. E calcu-lado usando-se uma probabilidade condicional,supondo que H0 e verdadeira. Portanto, o p-
valor esta entre 0 e 1. Na pratica, rejeitaremosH0 para p-valores muito pequenos.
A diferenca e que aqui nao se constroi umaregiao crıtica. Nesse procedimento, calculamoso valor amostral da estatıstica de teste e verifi-camos como esse valor se apresenta com rela-cao a distribuicao amostral sob a suposicao deH0 ser verdadeira.
23
Se o valor amostral da estatıstica de teste es-tiver muito na cauda dessa distribuicao, con-cluiremos que os dados nao estao trazendoevidencia a favor de H0. Caso contrario, naoteremos evidencia contra H0.
O calculo do p-valor dependera se o teste euni ou bilateral.
Vejamos como fica o p-valor no exemplo dosmotoristas que avancam o sinal vermelho.
Sob H0, vimos quep− 0,5√0,25/880
a∼ N(0,1).
O valor amostral da estatıstica de teste e
z0 = 0,56−0,50√0,25/880
' 3,56 tal que
p-valor = P (Z0 ≥ 3,56|H0) ' 0,0002.
Sob H0 a distribuicao de Z0 e N(0,1).
24
Ou seja, se H0 e de fato verdadeira, a probabili-
dade de termos obtido uma proporcao amostral
tao grande ou maior que 0,56 e de apenas um
para cada 5000.
Portanto, concluımos que os dados nao trazem
evidencia a favor de H0 e devemos rejeita-la.
Observe que apesar de usarmos um procedi-
mento diferente, chegamos a mesma conclusao
quando adotamos o procedimento classico com
nıvel de significancia de 5%.
25
De fato, o p-valor corresponde ao maior nıvel
de significancia para o qual aceitaremos H0.
Para qualquer nıvel de significancia α ≤ p-valor,
aceitamos H0.
Fisher (1954) sugeriu uma escala de evidencia
com base no p-valor
p-valor Natureza da evidenciacontra H0
0,10 marginal0,05 moderada
0,025 substancial0,01 forte
0,005 muito forte0,001 fortıssima
26
Se o teste for bilateral, deveremos calcular a
area das duas caudas correspondentes ao valor
amostral padronizado supondo H0 verdadeira.
A maioria dos softwares estatısticos retornam
o p-valor dos testes executados. Por isso e
fundamental saber interpreta-los.
Assim, lembre-se de em todo teste ter clareza
de quem e a hipotese nula e quem e a hipotese
alternativa. Alem disso, lembre que o p-valor
fornece um grau de evidencia amostral contra
H0, no sentido de quanto menor ele e, mais
forte e a evidencia contra a hipotese nula.
Lembre: podemos pensar no p-valor como uma
medida de adesao dos dados amostrais a hipo-
tese nula. Se ele nao e muito pequeno e porque
e razoavel que eles tenham sido gerados pela
distribuicao proposta por H0.
27