estatística - aula 6
TRANSCRIPT
+
Bioestatística - Universidade Católica de BrasíliaTestes
Prof. Dr. Gabriel da Rocha FernandesUniversidade Católica de Brasília
+Introdução
2
nInferência estatístican estimativa de parâmetrosn testes de hipóteses
nLevantamentos a fim de determinar o grau de aceitação de hipóteses baseadas em teorias do comportamento.
nColeta de dados empíricos.
nCom base nestes dados decide-se então sobre a validade ou não da hipótese.
nA decisão sobre a hipótese pode levar a rejeição, revisão ou aceitação da teoria que a originou.
+Metodologia
nConclusão é baseada na informação proporcionada pelos dados.
nEnvolvem apenas parte da população que se pretende atingir.n Definir a hipótese de igualdade (H0).n Escolher a prova estatística (com o modelo estatístico associado) para
tentar rejeitar H0.n Definir o nível de significância (α) e um tamanho de amostra (n).
n Determinar a distribuição amostral da prova estatística sob a hipótese de nulidade.
n Definir a região de rejeição.n Calcular o valor da prova estatística.
3
+Hipóteses
nÉ uma suposição ou afirmação que pode ou não ser verdadeira, relativa a uma ou mais populações.
nA veracidade ou falsidade sobre uma hipótese só pode ser dita com certeza se estudarmos toda a população.
nA decisão de que a amostra é provavelmente verdadeira ou falsa utiliza as distribuições amostrais.
nDuas hipóteses:n Nula (H0)n Alternativa (H1)
4
+Hipóteses
nA hipótese nula é a hipótese de igualdade.
nFormulada com o objetivo de ser rejeitada.
nA rejeição da hipótese nula envolve a aceitação de outra hipótese.
nHipótese alternativa é a definição operacional da hipótese de pesquisa que se deseja comprovar.
nA natureza do estudo define a hipótese alternativa.
nEm um teste paramétrico de parâmetro θn H1 : θ = θ1 (Hipótese alternativa simples)
n H1: θ ≠ θ0 ; θ > θ0 ou θ < θ0. (Hipóteses alternativas compostas)
5
+Escolha do teste
nParamétricos e não paramétricos.
nConjunto valores numéricos.
nTamanho da amostra disponível.
nO teste é válido somente para aquelas condições.
nDefinição do nível de significância.
6
+Distribuição amostral
nTestes de hipótese obedecem modelos específicos.
nDistribuição normal > shapiro.test()
nDistribuição T Student
nDistribuição Qui-quadrado
nDistribuição F
7
+Hipoteses
nH1: θ = θ2 (hipótese simples)
nH1: θ > θ0 (teste unilateral ou unicaudal à direita)
nθ < θ0 (teste unilateral ou unicaudal à esquerda)
nθ ≠ θ0 (teste bilateral ou bicaudal)
8
+Testes paramétricos
nLower Tail Test da média populacional com variância conhecida
nHipótese nula:
n > xbar = 9900 # sample mean n> mu0 = 10000 # hypothesized value n> sigma = 120 # population standard deviation n> n = 30 # sample size n> z = (xbar−mu0)/(sigma/sqrt(n)) n> z # test statistic n> alpha = .05 n> z.alpha = qnorm(1−alpha) n> −z.alpha # critical value
9
+Testes paramétricos
nTwo tailed test com variância conhecida
n> xbar = 14.6 # sample mean n> mu0 = 15.4 # hypothesized value n> sigma = 2.5 # population standard deviation n> n = 35 # sample size n> z = (xbar−mu0)/(sigma/sqrt(n)) n> z # test statistic n> alpha = .05 n> z.half.alpha = qnorm(1−alpha/2) n> c(−z.half.alpha, z.half.alpha) n> pval = 2 ∗ pnorm(z) # lower tail n> pval # two−tailed p−value
10
+Não conheço a variância
n> xbar = 9900 # sample mean n> mu0 = 10000 # hypothesized value n> s = 125 # sample standard deviation n> n = 30 # sample size n> t = (xbar−mu0)/(s/sqrt(n)) n> t # test statistic n> alpha = .05 n> t.alpha = qt(1−alpha, df=n−1) n> −t.alpha # critical value n> pval = pt(t, df=n−1) n> pval # lower tail p−value
11
+Parâmetro: proporção
n> pbar = 85/148 # sample proportion n> p0 = .6 # hypothesized value n> n = 148 # sample size n> z = (pbar−p0)/sqrt(p0∗(1−p0)/n) n> z # test statistic n> alpha = .05 n> z.alpha = qnorm(1−alpha) n> −z.alpha # critical value n> pval = pnorm(z) n> pval # lower tail p−value
n> prop.test(85, 148, p=.6, alt="less", correct=FALSE)
12
+Teste T para amostras independentes
nUtilizamos a distribuição de t quando não temos os parâmetros populacionais (σ e µ).
nPremissas: Normalidade, Homocedasticidade (razão das variâncias = 1 ou variâncias iguais), Independência dos dados
13
Premissas do teste t Alternativa caso haja violação de premissas
Independência Amostras Pareadas
Variâncias Iguais Correção dos Graus de Liberdade
Normalidade Testes não-paramétricos
+Teste T pareado
nUtilizado com duas amostras retiradas do mesmo objeto.
nTratamento em pessoas (antes e depois), ou peso de animais (seca e chuva)
nDesde que sejam os mesmos indivíduos os dados podem ser tratados como pareados.
nTeste não paramétrico do teste t é o Teste de Mann-Whitney.
nPara teste t pareado, o não paramétrico é Wilcoxon
14
+Exemplo
n> raposa = read.table("/var/www/Pseudalopex.txt", head=TRUE)
n>attach (raposa)
n>qt (p,df) # valor critico
n> shapiro.test(raposa$chuva)
n>var.test(chuva,seca)
n> t.test(chuva,seca)
n> t.test(chuva,seca,alternative="greater")
n> wilcox.test(chuva,seca,alternative="greater")
15
+Exemplos
n Utiliza o teste t pareado para testar a hipótese de que a estação do ano influenciou o peso dos mesmos indivíduos (considerando agora que os mesmos indivíduos foram pesados nas duas estações)
n >t.test(chuva, seca, paired=T)
n Testa se a massa na chuva é maior ou igual à massa na seca, considerando que os dados são pareados
n >t.test(chuva, seca, paired=T, alternative=c(“l”))
n Testa se a massa na chuva é menor ou igual à massa na seca, considerando que os dados são pareados
n >t.test(chuva, seca, paired=T, alternative=c(“g”))
n Testa a igualdade das medias da massa nas duas estações, com o método não-paramétrico, considerando que os dados são pareados
n >wilcox.test(chuva,seca,paired=T)
16