unidade b síntese essencial do capítulo 4 -...

52
Estatística: Revelando o Poder dos Dados Lock 5 Unidade B Síntese Essencial do Capítulo 4

Upload: vuongthu

Post on 11-Feb-2019

213 views

Category:

Documents


0 download

TRANSCRIPT

Estatística: Revelando o Poder dos Dados Lock5

Unidade B Síntese Essencial do

Capítulo 4

Estatística: Revelando o Poder dos Dados Lock5

Seção 4.1

Introdução aosTestes de Hipóteses

Estatística: Revelando o Poder dos Dados Lock5

Teste Estatístico

Um teste estatístico usa dados de uma amostra para avaliar uma afirmativa sobre

uma população

Estatística: Revelando o Poder dos Dados Lock5

Hipóteses Estatísticas

Hipótese Nula (H0): Afirmativa de que não há efeito ou diferença.

Hipótese Alternativa (Ha): Afirmativa para a qual procuramos evidências.

Testes estatísticos são estabelecidos formalmente em termos de duas hipóteses concorrentes:

Estatística: Revelando o Poder dos Dados Lock5

Hipóteses Estatísticas

A hipótese alternativa é estabelecida pela observação de evidências (dados) que contradizem a hipótese nula e apóiam a hipótese alternativa

Hipóteses são sempre sobre parâmetros populacionais

Ho: Hipótese nula

Ha: Hipótese alternativa

Afirmações concorrentes sobre

uma população

Estatística: Revelando o Poder dos Dados

Hipóteses

Tire um minuto para escrever as hipóteses para cada uma das seguintes situações:

A proporção de pessoas que apóia o controle de armas é diferente entre homens e mulheres?

A média de horas de sono por noite para estudantes universitários é inferior a 7?

Estatística: Revelando o Poder dos Dados

Hypotheses

Tire um minuto para escrever as hipóteses para cada uma das seguintes situações:

A proporção de pessoas que apóia o controle de armas é diferente entre homens e mulheres?

A média de horas de sono por noite para estudantes universitários é inferior a 7?

pm: proporção de mulheres que apoiam o controle de armasph: proporção de homens que apóiam o controle de armas

H0: pm = phHa: pm ≠ ph

: horas médias de sono por noite para estudantes universitários H0: =7Ha: < 7

Estatística: Revelando o Poder dos Dados

• Quão incomum seria obter resultados tão extremos (ou mais extremos) do que aqueles observados, se a hipótese nula for verdadeira?

• Se isso for muito incomum, a hipótese nula provavelmente não é verdadeira!

•Se não for muito incomum, então não há evidência contra a hipótese nula

Teste de Hipóteses

Estatística: Revelando o Poder dos Dados

Resumo da Seção 4.1

Testes estatísticos usam dados de uma amostra para avaliar uma afirmação sobre uma população

Testes estatísticos são geralmente formalizados com hipóteses concorrentes:

Hipótese nula(H0): sem efeito ou sem diferençaHipótese alternativa (Ha): que buscamos evidências

Se os dados são estatisticamente significativos, temos evidências convincentes contra a hipótese nula, e em favor da alternativa

Estatística: Revelando o Poder dos Dados

Seção 4.2

Medindo Evidências com valores p

Estatística: Revelando o Poder dos Dados

Paul o Polvo

http://www.youtube.com/watch?v=3ESGpRUMj9E

Estatística: Revelando o Poder dos Dados

Paul o Polvo

• Em 2008, Paul the Octopus previu 8 jogos da Copa do Mundo, e previu todos eles corretamente

• Isso é evidência de que a chance de Paul adivinhar corretamente, p, é realmente maior que 50%?

• Quais são as hipóteses nula e alternativa?

H0: p = 0.5Ha: p > 0.5

Estatística: Revelando o Poder dos Dados

Pergunta chave

Se é muito incomum, temos evidências estatisticamente significativas contra a hipótese nula

Pergunta de hoje: Como medimos quão incomum é uma estatística de amostra, se H0 for verdadeira?

Quão incomum seria ver uma estatística amostral tão extrema quanto a observada, se H0 fosse verdadeira?

Estatística: Revelando o Poder dos Dados

Paul o Polvo

Precisamos saber que tipos de estatísticas poderíamos observar apenas por acaso, se a hipótese nula fosse verdadeira

Como poderíamos descobrir isso???

Simule muitas amostras de tamanho n = 8 com p = 0,5

Estatística: Revelando o Poder dos Dados

Distribuição de Aleatorização

Uma distribuição de aleatorizaçãoé uma coleção de estatísticas de

amostras simuladas supondo que a hipótese nula é verdadeira

A distribuição de aleatorização mostra que tipos de estatísticas seriam observados, apenas pelo acaso, se a hipótese nula fosse verdadeira

Estatística: Revelando o Poder dos Dados

Distribuição de Aleatorização

Estatística: Revelando o Poder dos Dados

Pergunta Chave

Uma distribuição de aleatorização nos diz quais tipos de estatísticas veríamos apenas pelo acaso, se a hipótese nula é verdadeira

Isto torna simples avaliar quão extrema é a estatística observada!

Quão incomum seria ver uma estatística amostral tão extrema quanto a observada, se H0 fosse verdadeira?

Estatística: Revelando o Poder dos Dados

Valor p

O valor p é a chance de obter uma estatística da amostra tão extrema (ou mais extrema) quanto a

estatística amostral observada, se a hipótese nula for verdadeira

O valor p pode ser calculado como a proporção de estatísticas em uma distribuição de aleatorização que são tão extremas (ou mais extremas) do que a estatística amostral observada

Estatística: Revelando o Poder dos Dados

Valor p

Paul o polvo: o valor p é a chance de obter todos os 8 dos 8 palpites corretos, se p = 0,5

What proportion of statistics in the randomization distribution are as extreme as ො𝑝 = 1?

Estatística: Revelando o Poder dos Dados

1000 Simulações

valor p = 0,004

Se Paul está apenas adivinhando, a chance dele ter todos os 8 corretos é 0,004.

valor pProporção tão extrema quanto

a estatística observada

estatística observada

Estatística: Revelando o Poder dos Dados

1. Quais tipos de estatísticas obteríamos, apenas pelo acaso, se a hipótese nula fosse verdadeira?(distribuição de aleatorização)

2. Que proporção dessas estatísticas é tão extrema quanto nossa estatística amostral original?(valor p)

Calculando um Valor p

Estatística: Revelando o Poder dos Dados

Pena de Morte Numa amostra aleatória de pessoas

perguntou-se: "Você é a favor da pena de morte para uma pessoa condenada por assassinato?"

A proporção de americanos que é a favor da pena de morte diminuiu de 1980 para 2010?

Sim Não

1980 663 342

2010 640 360

“Death Penalty,” Gallup, www.gallup.com

Estatística: Revelando o Poder dos Dados

Pena de Morte

Quão extremo é 0,02, se p1980 = p2010?

p1980 , p2010: proporção de americanos que são a favor da pena de morte 1980, 2010

H0: p1980 = p2010

Ha: p1980 > p2010

StatKey

Sim Não

1980 663 342

2010 640 360

Ƹ𝑝1980 = 0,66 Ƹ𝑝2010 = 0,64

Então a estatística amostral é:Ƹ𝑝1980 − Ƹ𝑝2010 = 0,66 − 0,64 = 0,02

Estatística: Revelando o Poder dos Dados

Pena de Morte

Valor p = 0,164

Se a proporção que apoia a pena de morte não tiver mudado de 1980 para 2010, veremos diferenças extremas em cerca de 16% do tempo.

Estatística: Revelando o Poder dos Dados

• Uma alternativa unilateral contains > ou < • Uma alternativa bilateral contains ≠

• O valor p é a proporção na cauda na direção especificada por Ha

• Para uma alternativa de dois lados, o valor p é o dobro da proporção na menor cauda

Hipótese Alternativa

Estatística: Revelando o Poder dos Dados

Valores p e Ha

Cauda superior

(Right Tail)

Cauda inferior

(Left Tail)

Bicaudal

Estatística: Revelando o Poder dos Dados

Valores p e H0

Se o valor p for pequeno, então uma estatística tão extrema quanto a observada seria improvável se a hipótese nula fosse verdadeira, fornecendo evidência significativa contra H0

Quanto menor o valor p, mais forte a evidência contra a hipótese nula e em favor da alternativa

Estatística: Revelando o Poder dos Dados

The smaller the p-value, the

stronger the evidence against Ho.

The smaller the p-value,

the stronger the evidence

against Ho.

Quanto menor o valor

p, mais forte a

evidência contra Ho.

Valor p e H0

Estatística: Revelando o Poder dos Dados

Testando hipóteses

Estatística observada

valor p

Estatística: Revelando o Poder dos Dados

Resumo da Seção 4.2 • A distribuição de aleatorização mostra que tipos

de estatísticas seriam observados, apenas pelo acaso, se a hipótese nula fosse verdadeira

• Um valor p é a chance de obter uma estatística tão extrema quanto a observada, se H0 for verdadeiro

• Um valor p pode ser calculado como a proporção de estatísticas na distribuição de aleatorização tão extremas quanto a estatística amostral observada

• Quanto menor o valor p, maior a evidência contra H0

Estatística: Revelando o Poder dos Dados

Seção 4.3

Determinando a Significância Estatística

Estatística: Revelando o Poder dos Dados

Decisões Formais

Se o valor p é pequeno: REJEITE H0

a amostra seria extrema se H0 fosse verdadeira os resultados são estatisticamente significativos temos evidências a favor de Ha

Se o valor p não for pequeno: NÃO REJEITE H0

a amostra não seria muito extrema se H0 fosse verdadeira os resultados não são estatisticamente significativos o teste é inconclusivo; tanto H0 quanto Ha podem ser

verdadeiros

Estatística: Revelando o Poder dos Dados

Um teste de hipótese formal tem apenas duas conclusões possíveis:

1. O valor p é pequeno: rejeitar a hipótese nula em favor da alternativa

2. O valor p não é pequeno: não rejeite a hipótese nula

Decisões Formais

Quão pequeno?

Estatística: Revelando o Poder dos Dados

Nível de Significância

O nível de significância, , é o limiar abaixo do qual o valor p é considerado pequeno o suficiente para rejeitar a hipótese nula

valor p < Rejeite H0

valor p > Não Rejeite H0

Estatística: Revelando o Poder dos Dados

Nível de Significância

Se o valor p for menor que , os resultadosserão estatisticamente significativos, e rejeitaremos a hipótese nula em favor da alternativa

Se o valor p for menor que , os resultadosserão estatisticamente não significativos, e nosso teste será inconclusivo

Freqüentemente = 0,05 por padrão, a menos que especificado de outra forma

Estatística: Revelando o Poder dos Dados

Conclusões Estatísticas

Força da evidência contra H0:

Decisão formal do teste de hipóteses, baseado em = 0.05 :

estatisticamente significativa estatisticamente não significativa

Estatística: Revelando o Poder dos Dados

Esclerose Múltipla e Luz Solar• Acredita-se que a luz solar oferece alguma proteção contra a

esclerose múltipla (EM), mas a razão é desconhecida

• Pesquisadores atribuíram aleatoriamente ratos a um dos grupos:• Controle (sem intervenção)• Recebendo Suplementos de Vitamina D• Recebendo Luz UV

• Todos os ratos foram injetados com proteínas conhecidas por induzir uma forma de EM, e eles observaram quais ratos desenvolveram EM

Seppa, Nathan. “Sunlight may cut MS risk by itself”, Science News, April 24, 2010 pg 9, reporting on a study appearing March 22, 2010 in the Proceedings of the National Academy of Science.

Estatística: Revelando o Poder dos Dados

Esclerose Múltipla e Luz Solar

Para cada situação abaixo, anote Hipóteses nula e alternativa Descrição informal da força da evidência contra H0

Decisão formal sobre H0, usando α = 0,05 Conclusão no contexto da questão

Ao testar se a luz UV fornece proteção contra EM (luz UV versus grupo controle), o valor p é 0,002.

Ao testar se a vitamina D fornece proteção contra EM (vitamina D versus grupo controle), o valor p é 0,47.

Estatística: Revelando o Poder dos Dados

Esclerose Múltipla e Luz Solar

Ao testar se a luz UV fornece proteção contra EM (luz UV versus grupo controle), com o valor p de 0,002:

• H0: pUV – pC = 0Ha: pUV – pC < 0

• Temos fortes evidências contra H0

• Rejeitamos H0

• Temos fortes evidências de que a luz UV fornece proteção contra a esclerose múltipla, pelo menos em camundongos.

Estatística: Revelando o Poder dos Dados

Esclerose Múltipla e Luz Solar

Ao testar se a vitamina D fornece proteção contra EM (vitamina D versus grupo controle), com o valor p de 0,47.

• H0: pD – pC = 0Ha: pD – pC < 0

• Nós temos poucas evidências contra H0

• Não rejeitamos H0

• Não podemos concluir nada sobre a vitamina D e EM através do experimento.

Estatística: Revelando o Poder dos Dados

Existem quatro possibilidades:

Erros

Rejeitar H0 Não rejeitar H0

H0 verdadeira

H0 falsa ☺

☺ERRO TIPO I

ERRO TIPO IIVer

dad

e

Decisão

• Um Erro Tipo I é rejeitar uma H0 verdadeira

• Um Erro Tipo II é não rejeitar uma H0 falsa

Estatística: Revelando o Poder dos Dados

Uma pessoa é inocente até que se prove culpada.

Evidência deve ser com pouca sombra de dúvida

.

Tipos de erros em um veredicto?

Condenar um inocente

Absolver um culpado

Ho Ha

Erro Tipo I

Erro Tipo II

Analogia com o Direito

valor p através dos

dados

Estatística: Revelando o Poder dos Dados

Escolhendo α

Por padrão, geralmente α = 0.05

Se um erro do Tipo I (rejeitar um verdadeiro nulo) for muito pior do que um erro do Tipo II, podemos escolher um α, tal como α = 0,01

Se um erro do tipo II (não rejeitar um falso nulo) for muito pior que um erro do tipo I, podemos escolher um erro maior α, tal como α= 0,10

Estatística: Revelando o Poder dos Dados

• Os resultados são estatisticamente significativos se o valor p for menor que o nível de significância, α

• Ao tomar decisões formais, rejeite H0 if the se o valor p for menor que α, caso contrário, não rejeite H0

• Não rejeitar H0 NÃO é o mesmo que aceitar H0

• Existem dois tipos de erros: rejeitar um verdadeiro nulo (Tipo I) e não rejeitar um falso nulo (Tipo II)

Resumo da Seção 4.3

Estatística: Revelando o Poder dos Dados

Seção 4.4

CriandoDistribuições de

Aleatorização

Estatística: Revelando o Poder dos Dados

Resumo da Seção 4.4

Amostras de aleatorização devem ser geradas

Consistentes com a hipótese nulaUsando os dados observadosRefletindo a maneira como os dados foram

coletados

O método específico varia de acordo com a situação, mas a ideia geral é sempre a mesma

Estatística: Revelando o Poder dos Dados

Seção 4.5

Intervalos de Confiança e Testes de

Hipóteses

Estatística: Revelando o Poder dos Dados

Distribuições Bootstrap e de Aleatorização

Distribuição Bootstrap Distribuição de Aleatorização

Nosso melhor palpite na distribuição de estatísticas amostrais

Nosso melhor palpite na distribuição das estatísticas amostrais, se H0 fosse verdadeiro

Centrado em torno da estatística amostral observada

Centrado em torno do valor hipotético sob a hipótese nula

Simula amostragem da população por meio de reamostragem da amostra original

Simula amostras assumindo que H0 fosse verdadeiro

Grande diferença: uma distribuição de aleatorização assume que H0 é verdadeiro, enquanto uma distribuição bootstrap não

Estatística: Revelando o Poder dos Dados

Intervalos e Testes

Se um IC de 95% não contém o parâmetroem H0, então um teste bicaudal deve

rejeitar H0 ao nível de significância de 5%.

Se um IC de 95% contém o parâmetro emH0, então um teste bicaudal deve não

rejeitar H0 ao nível de significância de 5%.

Estatística: Revelando o Poder dos Dados

Intervalos e Testes

Os intervalos de confiança são mais úteis quando você deseja estimar parâmetrospopulacionais

Testes de hipótese e valores de p são mais úteis quando você deseja testar hipóteses sobreparâmetros populacionais

Intervalos de confiança fornecem uma faixa de valores plausíveis; Valores p quantificam a força da evidência contra a hipótese nula

Estatística: Revelando o Poder dos Dados

• Com amostras pequenas, mesmo grandes diferenças ou efeitos podem não ser significativos

• Com amostras grandes, até mesmo uma diferença ou efeito muito pequeno pode ser significativo

• Um resultado estatisticamente significativo nem sempre é praticamente significativo, especialmente com amostras grandes

Significância Estatística vs Prática

Estatística: Revelando o Poder dos Dados

Resumo da Seção 4.5 Se um valor hipotético nulo estiver dentro de um IC de

95%, um teste bicaudal usando α = 0,05 não rejeitariaH0

Se um valor hipotético nulo estiver fora de um

IC de 95%, um teste bicaudal usando α = 0.05 rejeitariaH0

Significância estatística nem sempre é o mesmo que significância prática

Usando α = 0,05, 5% de todos os testes de hipóteses levará a rejeição da hipótese nula, mesmo que todas as hipóteses nulas sejam verdadeiras