estatística - aula 6

+

Bioestatística - Universidade Católica de BrasíliaTestes

Prof. Dr. Gabriel da Rocha FernandesUniversidade Católica de Brasília

[email protected] - [email protected]

mailto:[email protected]




+Introdução

2

nInferência estatístican estimativa de parâmetrosn testes de hipóteses

nLevantamentos a fim de determinar o grau de aceitação de hipóteses baseadas em teorias do comportamento.

nColeta de dados empíricos.

nCom base nestes dados decide-se então sobre a validade ou não da hipótese.

nA decisão sobre a hipótese pode levar a rejeição, revisão ou aceitação da teoria que a originou.

+Metodologia

nConclusão é baseada na informação proporcionada pelos dados.

nEnvolvem apenas parte da população que se pretende atingir.n Definir a hipótese de igualdade (H0).n Escolher a prova estatística (com o modelo estatístico associado) para

tentar rejeitar H0.n Definir o nível de significância (α) e um tamanho de amostra (n).

n Determinar a distribuição amostral da prova estatística sob a hipótese de nulidade.

n Definir a região de rejeição.n Calcular o valor da prova estatística.

3

+Hipóteses

nÉ uma suposição ou afirmação que pode ou não ser verdadeira, relativa a uma ou mais populações.

nA veracidade ou falsidade sobre uma hipótese só pode ser dita com certeza se estudarmos toda a população.

nA decisão de que a amostra é provavelmente verdadeira ou falsa utiliza as distribuições amostrais.

nDuas hipóteses:n Nula (H0)n Alternativa (H1)

4

+Hipóteses

nA hipótese nula é a hipótese de igualdade.

nFormulada com o objetivo de ser rejeitada.

nA rejeição da hipótese nula envolve a aceitação de outra hipótese.

nHipótese alternativa é a definição operacional da hipótese de pesquisa que se deseja comprovar.

nA natureza do estudo define a hipótese alternativa.

nEm um teste paramétrico de parâmetro θn H1 : θ = θ1 (Hipótese alternativa simples)

n H1: θ ≠ θ0 ; θ > θ0 ou θ < θ0. (Hipóteses alternativas compostas)

5

+Escolha do teste

nParamétricos e não paramétricos.

nConjunto valores numéricos.

nTamanho da amostra disponível.

nO teste é válido somente para aquelas condições.

nDefinição do nível de significância.

6

+Distribuição amostral

nTestes de hipótese obedecem modelos específicos.

nDistribuição normal > shapiro.test()

nDistribuição T Student

nDistribuição Qui-quadrado

nDistribuição F

7

+Hipoteses

nH1: θ = θ2 (hipótese simples)

nH1: θ > θ0 (teste unilateral ou unicaudal à direita)

nθ < θ0 (teste unilateral ou unicaudal à esquerda)

nθ ≠ θ0 (teste bilateral ou bicaudal)

8

+Testes paramétricos

nLower Tail Test da média populacional com variância conhecida

nHipótese nula:

n > xbar = 9900 # sample mean n> mu0 = 10000 # hypothesized value n> sigma = 120 # population standard deviation n> n = 30 # sample size n> z = (xbar−mu0)/(sigma/sqrt(n)) n> z # test statistic n> alpha = .05 n> z.alpha = qnorm(1−alpha) n> −z.alpha # critical value

9

+Testes paramétricos

nTwo tailed test com variância conhecida

n> xbar = 14.6 # sample mean n> mu0 = 15.4 # hypothesized value n> sigma = 2.5 # population standard deviation n> n = 35 # sample size n> z = (xbar−mu0)/(sigma/sqrt(n)) n> z # test statistic n> alpha = .05 n> z.half.alpha = qnorm(1−alpha/2) n> c(−z.half.alpha, z.half.alpha) n> pval = 2 ∗ pnorm(z) # lower tail n> pval # two−tailed p−value

10

+Não conheço a variância

n> xbar = 9900 # sample mean n> mu0 = 10000 # hypothesized value n> s = 125 # sample standard deviation n> n = 30 # sample size n> t = (xbar−mu0)/(s/sqrt(n)) n> t # test statistic n> alpha = .05 n> t.alpha = qt(1−alpha, df=n−1) n> −t.alpha # critical value n> pval = pt(t, df=n−1) n> pval # lower tail p−value

11

+Parâmetro: proporção

n> pbar = 85/148 # sample proportion n> p0 = .6 # hypothesized value n> n = 148 # sample size n> z = (pbar−p0)/sqrt(p0∗(1−p0)/n) n> z # test statistic n> alpha = .05 n> z.alpha = qnorm(1−alpha) n> −z.alpha # critical value n> pval = pnorm(z) n> pval # lower tail p−value

n> prop.test(85, 148, p=.6, alt="less", correct=FALSE)

12

+Teste T para amostras independentes

nUtilizamos a distribuição de t quando não temos os parâmetros populacionais (σ e µ).

nPremissas: Normalidade, Homocedasticidade (razão das variâncias = 1 ou variâncias iguais), Independência dos dados

13

Premissas do teste t Alternativa caso haja violação de premissas

Independência Amostras Pareadas

Variâncias Iguais Correção dos Graus de Liberdade

Normalidade Testes não-paramétricos

+Teste T pareado

nUtilizado com duas amostras retiradas do mesmo objeto.

nTratamento em pessoas (antes e depois), ou peso de animais (seca e chuva)

nDesde que sejam os mesmos indivíduos os dados podem ser tratados como pareados.

nTeste não paramétrico do teste t é o Teste de Mann-Whitney.

nPara teste t pareado, o não paramétrico é Wilcoxon

14

+Exemplo

n> raposa = read.table("/var/www/Pseudalopex.txt", head=TRUE)

n>attach (raposa)

n>qt (p,df) # valor critico

n> shapiro.test(raposa$chuva)

n>var.test(chuva,seca)

n> t.test(chuva,seca)

n> t.test(chuva,seca,alternative="greater")

n> wilcox.test(chuva,seca,alternative="greater")

15

+Exemplos

n Utiliza o teste t pareado para testar a hipótese de que a estação do ano influenciou o peso dos mesmos indivíduos (considerando agora que os mesmos indivíduos foram pesados nas duas estações)

n >t.test(chuva, seca, paired=T)

n Testa se a massa na chuva é maior ou igual à massa na seca, considerando que os dados são pareados

n >t.test(chuva, seca, paired=T, alternative=c(“l”))

n Testa se a massa na chuva é menor ou igual à massa na seca, considerando que os dados são pareados

n >t.test(chuva, seca, paired=T, alternative=c(“g”))

n Testa a igualdade das medias da massa nas duas estações, com o método não-paramétrico, considerando que os dados são pareados

n >wilcox.test(chuva,seca,paired=T)

16

estatística - aula 6

Documents