me623 planejamento e pesquisa. revisão de experimentos comparativos simples revisão de...
TRANSCRIPT
ME623Planejamento e Pesquisa
2
Revisão de Experimentos Comparativos Simples
3
Comparação de Duas MédiasAmostras Independentes
Exemplo: Suplementação alimentar ajuda emagrecimento?
Resposta: quilos perdidos
UEPessoa
j
Supl.
y1j
Placeboy2j
1 1.85 -1.62
2 2.40 -0.75
3 -1.21 1.70
4 0.35 2.12
5 3.52 3.98
6 4.04 -4.87
7 4.96 -2.34
8 0.15 3.02
9 -.59 -0.08
10 2.57 -1.27
4
Análise Descritiva: Boxplot
Existe diferença nas médias dos dois grupos?
Essa diferença é estatisticamente significante?
E a variância, é a mesma?
Figura: Boxplot da dos quilos perdidos em cada grupo
5
Comparar médias de 2 grupos
Qual técnica estatística podemos usar?
6
Teste t (amostras independentes)
Suposições:Hipóteses:
Estatística do Teste:
onde
7
Teste t (amostras independentes)
E se as variâncias forem diferentes?Estatística do Teste:
Sob Ho:
8
Teste t (amostras independentes)
Exemplo do suplemento
Suplemento
Qual é o valor de
Placebo
9
Teste t (amostras independentes)
No R:> y1 <- c(1.85, 2.40,-1.21, 0.35, 3.52, 4.04, 4.96, 0.15, -
0.59, 2.57)> y2 <- c(-1.62, -0.75, 1.70, 2.12, 3.98, -4.87, -2.34, 3.02,
-0.08, -1.27)> t.test(y1, y2, var.equal=FALSE)
data: y1 and y2t = 1.6815, df = 16.816, p-value = 0.1111alternative hypothesis: true difference in means is not equal
to 095 percent confidence interval: -0.46421 4.09421sample estimates:mean of x mean of y 1.804 -0.011
Conclusão?
10
Exemplo
Um pesquisador quer testar se há diferença entre o tempo que homens e mulheres assistem TV.
Na pesquisa com 59 homens e 116 mulheres, o tempo médio dos homens foi de 2.37 horas e o desvio padrão amostral 1.87, o tempo médio das mulheres foi de 1.95 horas com desvio padrão amostral de 1.51.
10
11
p-valor = 0.13
12
Teste para Igualdade das Variâncias
13
Checar suposições do teste t
Quais são as suposições?
14
Checar suposições do teste t
Quais são as suposições?
Normalidade
Independência das populações
Observações são variávies aleatórias independentes
(Variâncias iguais)
15
Checar suposições do teste t
Gráfico de Probabilidade Normal: o que podemos ver?
16
Comparação de Duas MédiasAmostras Pareadas
Exemplo: Suponha que queremos testar se existe diferença no desempenho dos alunos entre a P1 e P2.
Selecionamos 10 alunos ao acaso
Alunoj
Nota P1y1j
Nota P2y2j
1 7.5 6.3
2 3.2 4.5
3 5.4 6.2
4 1.5 2.7
5 6.0 6.9
6 9.2 7.7
7 7.9 8.5
8 3.5 1.2
9 4.7 7.2
10 6.2 6.5
17
Análise Descritiva: Boxplot
Houve uma melhora nas notas?
Essa diferença é estatisticamente significante?
Figura: Boxplot das notas dos alunos na P1 e P2
18
Teste t (amostras pareadas)
Diferença:Hipóteses:
Estatística do Teste:
onde
19
Teste t (amostras pareadas)
Para as notas da P1 e P2, calcula-se as diferenças:
Então
Qual é o valor de ?
20
Teste t (amostras pareadas)
No R:> y1 <- c(7.5, 3.2, 5.4, 1.5, 6, 9.2, 7.9, 3.5, 4.7, 6.2)> y2 <- c(6.3, 4.5, 6.2, 2.7, 6.9, 7.7, 8.5, 1.2, 7.2, 6.5)> prova <- as.factor(rep(1:2, each=10))> t.test(y1, y2, paired=TRUE, equal.var=TRUE)
Paired t-test
data: y1 and y2 t = -0.5574, df = 9, p-value = 0.5909alternative hypothesis: true difference in means is not equal to
0 95 percent confidence interval: -1.3152424 0.7952424 sample estimates:mean of the differences -0.26
Conclusão: ?
21
Determinar o tamanho amostralQual o tamanho da amostra a ser
usada? Esse é um dos aspectos mais importantes de um experimento
Duas formas de calcular o tamanho da amostra:1. Intervalo de Confiança2. Curva OC (Operating Characteristic)
22
Poder de um teste
H0
Decisão sobre H0
Verdadeira Falsa
Rejeitar Erro Tipo I (α) OK
Não Rejeitar OK Erro Tipo II (β)• P(Rejeitar H0|H0 é verdadeira)=α: P(Erro Tipo I)• P(Não Rejeitar H0|H0 é falsa)=β: P(Erro Tipo II)
• Poder do TesteP(Rejeitar H0|H0 é falsa) = 1 - P(Erro Tipo II) = 1-β
23
Poder de um teste
Exemplo: em R
simulacoes = 1000rejeicoes = 0for (i in 1:simulacoes){ amostra1 = rnorm(100) amostra2 = rnorm(100) if (t.test(amostra1,amostra2)$p.value < 0.05) rejeicoes = rejeicoes + 1}alpha = rejeicoes/simulacoes
24
Determinar o tamanho amostral pelo Intervalo de Confiança
Voltemos ao caso em que estamos testando
e a diferença entre as médias é .
Um Intervalo de Confiança (IC) para é:
Qual a probabilidade de que, sob Ho, este intervalo contém a diferença populacional?
25
Determinar o tamanho amostral pelo Intervalo de Confiança
Especificar um limite máximo para a margem de erro
e resolver a equação para o tamanho de amostra:
26
Determinar o tamanho amostral pelo Intervalo de Confiança
Exercício:
Para o exemplo do suplemento, calcule o tamanho da amostra necessário para um intervalo de confiança de no máximo 1.3
27
Tamanho da AmostraExemplo: Se uma população tem variancia
, o número de pessoas que posso entrevistar é n = 80, e queremos um I.C. para a média amostral com margem de erro m = 0.5, qual a será a confiança deste I.C.?
Adriano Zambom
28
Determinar o tamanho amostral pela curva OC
A escolha do tamanho amostral e a P(Erro Tipo II) = βestão diretamente ligadas
Quando é falsa, não queremos erradamente não rejeitar H0.
β depende da verdadeira diferença entre as médias
Curvas OC (Operating Characteristic Curves): gráfico de βversus δpara um tamanho amostral particular
29
Determinar o tamanho amostral pela curva OC
30
Determinar o tamanho amostral pela curva OC
A curva anterior é para as hipóteses de igualdade das médias com mesma variância (desconhecida),α=0.05 e dados balanceados
O tamanho amostral para construir as curvas é na realidade n*=2n-1.
31
Determinar o tamanho amostral pela curva OC
O parâmetro no eixo horizontal é:
Dividir por 2sigma, permite usar o mesmo conjunto de curvas, sem se preocupar com a variância. Assim, a diferença das médias é expressa por unidades de desvio padrão!
32
Determinar o tamanho amostral pela curva OC
Voltando a curva:
33
Determinar o tamanho amostral pela curva OC
Quanto maior a diferença das médias, menor é a probabilidade de erro tipo II, para um tamanho amostral n e um dado alpha.
O teste detecta diferenças maiores com mais facilidade!
34
Determinar o tamanho amostral pela curva OC
Quando o tamanho amostral aumenta, a probabilidade do erro tipo II diminui.
Conclusão: Quando o poder do teste
aumenta?
35
Determinar o tamanho amostral
Exemplo: argamassa de cimentoSuponha que se a diferença é no
mínimo 0.5, gostaríamos de detectá-la com probabilidade 0.80. Assuma que σ=0.25
Poder é 0.80, então β=0.20.Pela figura n*=10. Então 10 = 2n-1 => n = 6
36