livro estatastica experimental no r.pdf

135
Universidade Estadual de Londrina Centro de Ciências Exatas Departamento de Estatística Estatística Experimental com o uso do software R Prof. Silvano Cesar da Costa LONDRINA Estado do Paraná - Brasil

Upload: david-venacio

Post on 12-Sep-2015

100 views

Category:

Documents


70 download

TRANSCRIPT

  • Universidade Estadual de LondrinaCentro de Cincias Exatas

    Departamento de Estatstica

    Estatstica Experimental

    com o uso do software R

    Prof. Silvano Cesar da Costa

    L O N D R I N A

    Estado do Paran - Brasil

  • Sumrio

    1 Testes de Hipteses 1

    1.1 Tipos de Deciso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

    1.1.1 Teste para a mdia de uma populao com varincia desconhecida . . . . 4

    1.2 Teste para a Diferena entre duas Mdias . . . . . . . . . . . . . . . . . . . . . . . 7

    1.2.1 Teste Para Duas Amostras Independentes . . . . . . . . . . . . . . . . . . . 7

    1.2.2 Teste para duas amostras dependentes (pareados) . . . . . . . . . . . . . . 10

    1.3 Teste de Shapiro-Wilk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

    2 Anlise de Varincia 22

    2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

    2.2 Princpios bsicos da experimentao . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    2.3 Conduo do experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    2.4 Planejamento do experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

    2.5 Classificao dos experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

    3 Delineamento Inteiramente Casualizado 30

    3.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

    3.1.1 Modelos de efeitos fixos e aleatrios . . . . . . . . . . . . . . . . . . . . . . . 34

    3.2 Anlise do modelo de efeitos fixos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    3.2.1 Decomposio das Somas de Quadrados . . . . . . . . . . . . . . . . . . . . 36

    3.3 Testes de Comparaes Mltiplas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

    3.3.1 Contrastes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    3.3.2 Contrastes ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    3.3.3 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

    3.3.4 Teste F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    3.3.5 Teste de Student-Newman-Keuls . . . . . . . . . . . . . . . . . . . . . . . . 46

    3.3.6 Teste de Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

    3.3.7 Teste de Scheff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

    i

  • ii Sumrio

    3.3.8 Teste de Duncan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

    3.3.9 Teste de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    3.3.10Teste de Dunnett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

    4 Delineamento em Blocos Casualizados 60

    4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

    4.2 Modelo estatstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

    5 Delineamento em Quadrado Latino 71

    5.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

    5.1.1 Repetindo o Quadrado Latino . . . . . . . . . . . . . . . . . . . . . . . . . . 78

    6 Experimentos Fatoriais 85

    6.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

    6.2 Anlise e interpretao de um experimento fatorial, com 2 fatores . . . . . . . . . 87

    6.2.1 Desdobramento da interao R E para estudar o comportamento dasespcies dentro de cada recipiente . . . . . . . . . . . . . . . . . . . . . . . . 94

    6.2.2 Desdobramento da interao R E para estudar o comportamento dosrecipientes dentro de cada espcie . . . . . . . . . . . . . . . . . . . . . . . . 95

    6.2.2.1 Recipientes dentro de E1 . . . . . . . . . . . . . . . . . . . . . . . . 96

    6.2.2.2 Recipientes dentro de E2 . . . . . . . . . . . . . . . . . . . . . . . . 97

    7 Experimentos em parcelas subdivididas 99

    7.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

    7.1.1 Experimentos em parcelas subdivididas no tempo . . . . . . . . . . . . . . 107

    8 Transformao de dados 112

    8.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

    8.1.1 Seleo emprica de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

    8.1.2 Mtodo analtico para selecionar uma transformao em Y . . . . . . . . . 113

    9 Polinmios Ortogonais 117

    9.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

    9.2 Teste de aditividade de Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

    9.2.1 Desenvolvimento do teste estatstico . . . . . . . . . . . . . . . . . . . . . . 123

    9.3 Tabela de Hartley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

  • Lista de Tabelas

    1.1 Nveis de hemoglobina no sangue antes e aps a aplicao de niacina em sunos. 11

    1.2 Valores dos coeficientes ani+1 das estatsticas de ordem de uma amostra de

    tamanho n de uma distribuio Normal. . . . . . . . . . . . . . . . . . . . . . . . 16

    1.4 Valores crticos da estatstica W de Shapiro-Wilk. . . . . . . . . . . . . . . . . . . 18

    2.1 Valores de produo de leite (kg), obtidos no experimento. . . . . . . . . . . . . . 26

    2.2 Estatsticas calculadas para cada tratamento. . . . . . . . . . . . . . . . . . . . . 27

    3.1 Quadro da Anlise de Varincia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    3.2 Anlise de varincia para os dados do Exemplo 2. . . . . . . . . . . . . . . . . . . 38

    3.3 Anlise de varincia para os dados do Exemplo 2. . . . . . . . . . . . . . . . . . . 45

    3.4 Peso (kg) das parcelas (10 aves) ao final do experimento. . . . . . . . . . . . . . . 57

    4.1 Quadro da anlise de varincia para delineamento em blocos casualizados. . . . 64

    4.2 Valores de produo de leite (kg). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

    4.3 Anlise de varincia no delineamento em blocos casualizados. . . . . . . . . . . 67

    4.4 Nmero mdio de ovos por ave nos respectivos tratamentos e blocos. . . . . . . 70

    5.1 Ganhos de pesos, em quilos, ao final do experimento (252 dias), nos respectivos

    tratamentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

    5.2 Quadro da Anlise de Varincia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

    5.3 Quadro da Anlise de Varincia para um Quadrado Latino repetido - Caso 1. . . 78

    5.4 Quadro da Anlise de Varincia para um Quadrado Latino repetido - Caso 2. . . 79

    5.5 Quadro da Anlise de Varincia para um Quadrado Latino repetido - Caso 3. . . 79

    5.6 Ganhos de pesos, em quilos, ao final do 2o experimento (252 dias), nos respecti-

    vos tratamentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

    5.7 Anlise de varincia do segundo experimento. . . . . . . . . . . . . . . . . . . . . 80

    5.8 Anlise de varincia conjunta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

    5.9 Respostas observadas no experimento com gatos. . . . . . . . . . . . . . . . . . . 84

    iii

  • iv Lista de Tabelas

    6.1 Experimento fatorial 2 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 856.2 Alturas mdias das mudas, em centmetros, aos 80 dias de idade. . . . . . . . . 87

    6.3 Arranjo geral para um experimento fatorial. . . . . . . . . . . . . . . . . . . . . . 88

    6.4 Anlise de varincia para um experimento fatorial com 2 fatores. . . . . . . . . . 91

    6.5 Alturas mdias das mudas, em centmetros, aos 80 dias de idade. . . . . . . . . 92

    6.6 Anlise de varincia de acordo com o esquema fatorial 3 2. Quero ver como elefazx com linhas compridas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

    6.7 Estudo das Espcies dentro de cada Recipiente. . . . . . . . . . . . . . . . . . . . 95

    6.8 Estudo dos Recipientes dentro de cada Espcie. . . . . . . . . . . . . . . . . . . . 96

    6.9 ndices de converso alimentar (kg de rao / kg de ganho de peso). . . . . . . . 98

    7.1 Quadro da anlise de varincia de um experimento em parcela subdividida com

    a tratamentos primrios, b tratamentos secundrios e c repeties, nos delinea-

    mentos inteiramente casualizado, blocos casualizados e quadrado latino. . . . . 100

    7.2 Ganhos de pesos, em quilos, ao final do experimento. . . . . . . . . . . . . . . . . 101

    7.3 Quadro da Anlise de Varincia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

    7.4 Tabela auxiliar para clculo das somas de quadrados das parcelas. . . . . . . . 104

    7.5 Tabela auxiliar para clculo das somas de quadrados das Subparcelas. . . . . . 105

    7.6 Quadro da anlise de varincia do experimento em parcelas subdivididas no

    delineamento em blocos ao acaso. . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

    7.7 Produo de adubos verdes e milho (kg de matria seca verde por parcela). . . . 107

    7.8 Quadro da anlise de varincia do experimento em parcelas subdivididas no

    delineamento em blocos ao acaso. . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

    7.9 Tabela auxiliar para clculo das somas de quadrados das parcelas. . . . . . . . 108

    7.10Tabela auxiliar para clculo das somas de quadrados das Subparcelas. . . . . . 108

    7.11Efeito dos anos em cada tratamento separadamente. . . . . . . . . . . . . . . . . 109

    7.12Efeito dos tratamentos em cada ano separadamente. . . . . . . . . . . . . . . . . 109

    8.1 Transformaes estabilizadoras da varincia. . . . . . . . . . . . . . . . . . . . . 113

    8.2 Contagem do nmero de pulges encontrados. . . . . . . . . . . . . . . . . . . . . 114

    8.3 Logaritmos das mdias e varincias dos tratamentos. . . . . . . . . . . . . . . . . 115

    9.1 ndices de converso (kg de rao / kg de ganho de peso . . . . . . . . . . . . . . 118

    9.2 Anlise de varincia para ndices de converso. . . . . . . . . . . . . . . . . . . . 118

    9.3 Decomposio dos graus de liberdade de tratamentos. . . . . . . . . . . . . . . . 120

    9.4 Tabela para o Fmax. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

  • Lista de Figuras

    2.1 Produo de leite (kg) levando-se em conta o complemento alimentar. . . . . . . 27

    3.1 Diferenas nas mdias dos tratamentos . . . . . . . . . . . . . . . . . . . . . . . . 49

    4.1 Produo de leite (kg) levando-se em conta o complemento alimentar. . . . . . . 65

    4.2 Comparao das diferenas entre tratamentos pelo Teste de Tukey. . . . . . . . 68

    5.1 Tratamentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

    5.2 Linhas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

    5.3 Colunas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

    5.4 Mdias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

    5.5 QQPlot para verificar se os dados tm distribuio normal. . . . . . . . . . . . . 76

    5.6 Mdias dos tratamentos considerando o experimento conjunto. . . . . . . . . . . 81

    5.7 Comparao das mdias dos tratamentos considerando o experimento conjunto. 83

    6.1 Experimento fatorial sem interao. . . . . . . . . . . . . . . . . . . . . . . . . . . 86

    6.2 Experimento fatorial com interao. . . . . . . . . . . . . . . . . . . . . . . . . . . 86

    6.3 Interao Rec Esp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 936.4 Interao EspRec. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

    7.1 Tipos de Raes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

    7.2 Tipos de Suplementos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

    8.1 Nmero de pulges encontrados considerando-se os tratamentos. . . . . . . . . 115

    8.2 Relao linear dos dados da Tabela 8.3. . . . . . . . . . . . . . . . . . . . . . . . . 116

    9.1 Modelo de regresso linear ajustado aos dados. . . . . . . . . . . . . . . . . . . . 121

    v

  • Prefcio

    Este material foi preparado com a inteno de cobrir o programa do curso de

    mestrado em Cincia Animal, da Universidade Estadual de Londrina. Parte dele tambm

    adotado no curso de graduao em Medicina Veterinria da Universidade Estadual de Lon-

    drina, especificamente no segundo semestre quando ministrado o contedo de estatstica

    experimental.

    Muito embora o emprego de softwares para a realizao de anlises estatsticas

    seja bastante comum, por questes didticas e em sala de aula, se o conjunto de dados

    for relativamente pequeno os clculos podero ser feitos manualmente, com o uso de uma

    calculadora cientfica, tornando-se impraticvel se o volume de dados for muito grande. Neste

    caso, faz-se necessrio o uso de um computador e um software para anlises estatsticas.

    Existem muitos softwares, gratuitos ou no, no mercado. Optei pela utilizao do

    software R por ser gratuito, de cdigo fonte aberto e adotado por pesquisadores do mundo

    todo. Voc pode obt-lo no seguinte endereo: htpp://www.r-project.org. Vrios manuais

    tambm esto disponveis.

    Assim, tentei aliar o contedo terico com o uso prtico dos computadores para

    um melhor entendimento das anlises. Em alguns momentos coloco apenas os comandos

    para realizar determinada tarefa, deixando ao leitor a tarefa de execut-los e interpretar os

    resultados. E, em outras situaes, apresento os comandos e a sada.

    O material no est livre de erros e/ou imperfeies e toda e qualquer contribuio

    ser bem-vinda.

    vi

  • Captulo 1

    Testes de Hipteses

    Anterior a definio de um teste de hiptese necessrio o entendimento de que

    uma hiptese estatstica uma suposio ou afirmao, relativa a uma ou mais populaes,

    sobre um ou mais parmetros populacionais, podendo esta suposio ser verdadeira ou no.

    Logo, o teste de hiptese um procedimento formal, baseado no clculo de probabilidades,

    para tomada de deciso quanto a hiptese estatstica.

    Claro que se poderia pensar em inspecionar todos os elementos da populao e

    comparar com o valor da hiptese feita, mas na prtica, isto praticamente impossvel. Sendo

    assim, examina-se uma amostra aleatria da populao. Caso os dados amostrais no sejam

    consistentes com a hiptese estatstica, a mesma ser rejeitada. H dois tipos de hipteses

    estatsticas:

    Hiptese Nula: denotada por H0, usualmente a hiptese que as observaes amostrais

    resultam puramente do acaso;

    Hiptese Alternativa: denotada por H1 ou Ha, a hiptese que as observaes amostrais

    so influenciadas por causas no-aleatrias.

    Sendo assim, a ideia bsica que a partir de uma amostra da populao seja

    estabelecida uma regra de deciso, segundo a qual a hiptese proposta ser rejeitada ou

    no-rejeitada. Esta regra de deciso chamada de teste estatstico.

    Exemplo: Suponha que um pesquisador esteja desconfiado que o peso mdio (kg) aos 21 dias

    de idade, de leites da raa Large White, seja diferente dos 5 kg esperados para a raa. As

    hipteses estatsticas para estudar o problema podero ser expressas por:

    H0 : = 5; 0 kg vs H1 : 6= 5; 0 kg (1.1)

    Observe que a hiptese nula define o peso histrico de animais aos 21 dias de

    idade para a raa. J a hiptese alternativa o que o pesquisador efetivamente quer verificar.

    1

  • 2 Captulo 1. Testes de Hipteses

    Entenda que dependendo do que o pesquisador estiver observando, sua hiptese

    de pesquisa poder ser outra. Se ele percebe que os animais esto muito magros ou muito

    gordos, as hipteses poderiam ser:

    Animais magros

    8 D H1 : LW < DAssim, o objetivo de um teste estatstico fornecer ferramentas que permitam re-

    jeitar ou no rejeitar uma hiptese estatstica atravs dos resultados obtidos de uma amostra.

    Alguns exemplos de hipteses estatsticas so:

    a) o peso mdio de aves tratadas com rao comercial e acesso a pasto composto por: grama

    batatais, estrela e seda maior que aquelas sem acesso ao pasto;

    b) o tempo mdio de reao de determinado reagente qumico de 60 segundos;

    c) a proporo de animais com a doena A de 40%;

    d) a rao A melhor que a rao B na engorda de sunos;

    muito provvel que o peso mdio de aves com acesso ao pasto no seja igual ao

    peso mdio de aves sem acesso ao pasto. Portanto, o que se busca, na verdade, verificar se

    a diferena de peso mdio existente entre os dois grupos significativa.

    Em estatstica, a palavra significncia implica a ideia de que muito provvel que

    um resultado, similar ao que foi obtido na amostra, teria sido obtido se toda a populao

    tivesse sido estudada.

    1.1 Tipos de Deciso

    Ao se tomar uma deciso, a favor ou contra uma hiptese, existem dois tipos de

    erros que se pode cometer. Pode-se rejeitar uma hiptese nula quando de fato ela verdadeira

    (erro Tipo I) ou pode-se no-rejeitar H0 quando, de fato, ela falsa (erro Tipo II). Frequente-

    mente, denotam-se as probabilidades destes dois tipos de erros como e , respectivamente.

  • Tipos de Deciso 3

    Existe um balano entre esses dois tipos de erros, no sentido de que ao se ten-

    tar minimizar , aumenta-se . Isto , no possvel minimizar estas duas probabilidades

    simultaneamente e, na prtica, costume fixar um valor (pequeno) para .

    Pode-se resumir os tipos de deciso e erros associados a testes de hipteses da

    seguinte maneira:

    Situao realDeciso

    Aceitar H0 Rejeitar H0

    H0 verdadeira Deciso correta (1 ) Erro tipo I (probab. )

    H0 falsa Erro tipo II (probab. ) Deciso correta (1 )

    a) Os erros Tipo I e Tipo II so correlacionados: o aumento da probabilidade de ocorrncia de

    um reduz a probabilidade de ocorrncia do outro;

    b) A probabilidade de cometer um erro Tipo I chamado nvel de significncia e denotado

    por ;

    c) A probabilidade de cometer um erro Tipo II chamado erro beta e denotado por . A

    probabilidade de no cometer o erro Tipo II chamado poder do teste, denotado por 1.O valor de no fixo, diferentemente do erro Tipo I, e depender de trs fatores: o prprio

    valor de , o valor testado na hiptese alternativa (Ha) e o tamanho da amostra (n);

    d) A nica forma de causar uma reduo de e simultaneamente aumentar o tamanho

    da amostra;

    e) Se H0 for falsa, ser maior quanto mais prximo o valor do parmetro estiver do valor

    sob a hiptese H0.

    Normalmente no se calcula o valor de . Ele , em geral, definido como sendo

    5% ou 1%. Mas possvel calcular o seu valor diretamente com as informaes obtidas dos

    dados. Assim, suponha que se decida no-rejeitar a hiptese nula da equao (1.1) se a mdia

    amostral estiver entre 4 e 6 kg. Caso isto no ocorra, a deciso ser rejeitar H0. Sendo 50 o

  • 4 Captulo 1. Testes de Hipteses

    nmero de amostras coletadas e o desvio-padro igual a = 1, o valor de ser:

    = P (Rejeitar H0 j H0verdadeiro)= P (y < 4 j = 5) + P (y > 6 j = 5)= P

    y 41=p50

    6 51=p50

    = P (z1 < 7; 0711) + P (z2 > 7; 0711)

    = 1; 5375 1012

    Portanto, dadas as condies apresentadas, a probabilidade de se rejeitar H0

    praticamente nula. O clculo pode ser feito diretamente no R, com os seguintes comandos:

    mu=5 ; sigma=1 ; n=50 ;

    z1=(4-mu)/(sigma/sqrt(n)) ; z2=(6-mu)/(sigma/sqrt(n))

    (alpha = pnorm(z1) + pnorm(z2, lower.tail=F))

    Existem discusses entre a interpretao do resultado do teste de hipteses. A

    distino entre aceitar e no-rejeitar a hiptese nula. Aceitar implica que a hiptese

    nula verdadeira; No rejeitar implica que os dados no so suficientemente persuasivos

    para se preferir a hiptese alternativa ao invs da hiptese nula.

    Neste livro adotaremos as expresses rejeitar ou no-rejeitar a hiptese nula.

    1.1.1 Teste para a mdia de uma populao com varincia desconhecida

    Este tipo de teste para a mdia muito comum, uma vez que, na prtica, difi-

    cilmente se conhece a varincia populacional. Todas as etapas realizadas anteriormente so

    empregadas nesta situao, sendo que a mudana ocorre na varivel teste utilizada. Como a

    varincia populacional desconhecida, aplica-se a equao:

    T =y 0spn

    ;

    em que T segue uma distribui o t de Student1 , ou seja, T tn1;=2.Ainda,

    s2 =1

    n 1nXi=1

    (yi y)2 = 1n 1

    2666664nXi=1

    y2i

    nXi=1

    yi

    !2n

    3777775 :1pseudnimo de William Sealy Gosset, qumico e matemtico ingls.

  • Tipos de Deciso 5

    Exemplo: Foi retirada uma amostra de 10 bezerros da raa Nelore, aos 210 dias de idade, com

    o objetivo de verificar se o peso mdio desses animais atinge 186 kg nesta idade. Os valores

    obtidos, em kg, foram os seguintes:

    178 199 182 186 188 191 189 185 174 158

    Calcule:

    a) a mdia;

    b) a varincia;

    c) o desvio padro;

    d) o erro padro da mdia;

    e) o coeficiente de variao;

    f) teste as hipteses:

    H0 : = 186 vs H1 : 6= 186

    ao nvel de 5% de significncia.

    Soluo:

    Antes de realizar o teste, sempre interessante explorar o conjunto de dados com medidas

    descritivas e grficas. Usando o R, bastam os seguintes comandos:

  • 6 Captulo 1. Testes de Hipteses

    pesos = c(178, 199, 182, 186, 188, 191, 189, 185, 174, 158)

    (media = mean(pesos))

    (variancia = var(pesos))

    (desvio = sd(pesos) )

    (erro.padro = desvio / sqrt(length(pesos)))

    (cv = desvio/media*100)

    par(mai=c(1,1,.3,.2))

    boxplot(pesos, ylab=Pesos (kg), las=1, col=LightYellow)

    points(media, pch=+, cex=2, col=red)

    hist(pesos)

    plot(pesos)

    plot(density(pesos))

    qqnorm(pesos,las=1); qqline(pesos)

    qqnorm(scale(pesos)); qqline(scale(pesos))

    hist(scale(pesos), las=1, ylim=c(0,.6), freq=FALSE)

    curve(dnorm(x), add=TRUE, col=blue, lwd=2);

    lines(density(scale(pesos)), col=red)

    hist(scale(pesos), las=1, ylim=c(0,.6), freq=FALSE, xaxt=n)

    axis(1, -3:3, pos=0) ; abline(h=0)

    curve(dnorm(x), add=TRUE, col=blue, lwd=2);

    lines(density(scale(pesos)), col=red)

    shapiro.test(pesos)

    t.test(pesos, mu=186)

    Observe que antes da aplicao do teste de hiptese, foi realizada uma anlise

    exploratria dos dados e verificado a suposio de normalidade, usando-se o teste de Shapiro-

    Wilk, (Shapiro and Wilk, 1965). Os procedimentos para realizao do teste de Shapiro-Wilk

    so apresentados no final deste captulo, pg. 13.

  • Teste para a Diferena entre duas Mdias 7

    1.2 Teste para a Diferena entre duas Mdias

    1.2.1 Teste Para Duas Amostras Independentes

    Um dos testes mais frequentes em estatstica consiste na avaliao da diferena

    entre duas amostras independentes, ou seja, naqueles casos em que os dados de uma das

    amostras no esto relacionados com os valores da outra. Na conduo de experimentos dessa

    ordem, procura-se verificar se a diferena observada de tal magnitude que permita concluir

    que as amostras foram retiradas de populaes distintas. As seguintes pressuposies devem

    ser observadas para a realizao deste teste:

    a) as amostras de cada populao investigada devem ser aleatrias e independentes;

    b) admitir que as varincias das duas populaes (21 e 22), embora desconhecidas, sejam

    iguais. Sendo assim, estima-se a varincia conjunta, S2p, dada por

    S2p =(n1 1) S21 + (n2 1) S22

    n1 + n2 2 :

    c) as variveis das populaes de onde as amostras foram selecionadas devem apresentar

    distribuio aproximadamente normal.

    A hiptese nula e as possveis hipteses alternativas so:

    H0 : 1 = 2 vs H1 :

    8>>>>>:1 < 2

    1 6= 21 > 2

    Como so utilizadas estimativas das varincias populacionais, a padronizao da diferena

    das mdias dada por:

    T =(Y1 Y2) (10 20)

    Sp

    r1

    n1+

    1

    n2

    :

    Assume-se que T tn1+n22;.A forma geral para clculo de varincia conjunta dada por:

    S2i =

    nXi=1

    (ni 1) S2inXi=1

    (ni 1)

    Para aplicao deste teste necessrio que as varincias populacionais, embora

    desconhecidas, possam ser consideradas homogneas. Portanto, antes da realizao do teste

  • 8 Captulo 1. Testes de Hipteses

    necessrio verificar se as varincias so homogneas. Nesta situao as hipteses testadas

    so:

    H0 : 21 =

    22 vs H1 :

    8>>>>>:21 <

    22

    21 6= 2221 >

    22

    sendo que mais comum testar H0 : 21 = 22 vs H1 :

    21 >

    22. A varivel teste para a

    homogeneidade de varincias de duas populaes independentes dada por:

    F =maior valor de (s21; s

    22)

    menor valor de (s21; s22)

    =s21s22

    Exemplo: Um pesquisador quer verificar se os pesos ao nascer de animais machos das raas

    Gir e Guzer diferem. Foram pesados 10 animais de cada raa. Testar, ao nvel de 5% de

    significncia, se os pesos diferem. Os pesos (kg) observados so:

    Guzer 30 26 25 23 25 29 34 30 30 31

    Gir 23 21 20 20 23 26 22 27 26 27

    Soluo:

    Guzer:

    n = 10

    y1 = 28; 3 kg

    s = 3; 40098 kg

    Gir:

    n = 10

    y2 = 23; 5 kg

    s = 2; 798809 kg

  • Teste para a Diferena entre duas Mdias 9

    Para resolver o exemplo dado no R, bastam os seguintes comandos:

    Guzer = c(30, 26, 25, 23, 25, 29, 34, 30, 30, 31)

    Gir = c(23, 21, 20, 20, 23, 26, 22, 27, 26, 27)

    mean(Guzer) ; mean(Gir)

    var(Guzer) ; var(Gir)

    sd(Guzer) ; sd(Gir)

    sd(Guzer)/mean(Guzer) * 100 ; sd(Gir)/mean(Gir) * 100

    boxplot(Guzer, Gir, names=c(Guzer, Gir), las=1, xlab=Raas,

    ylab=Pesos ao Nascer (kg))

    points(c(mean(Guzer),mean(Gir)), pch=+, col=red, cex=2)

    par(mfrow=c(1,2))

    qqnorm(Guzer); qqline(Guzer)

    qqnorm(Gir); qqline(Gir)

    qqnorm(scale(Guzer), asp=1); qqline(scale(Guzer))

    qqnorm(scale(Gir), asp=1); qqline(scale(Gir))

    hist(scale(Guzer), freq=FALSE)

    curve(dnorm(x), add=TRUE, col=2); lines(density(scale(Guzer)), col=3)

    hist(scale(Gir), freq=FALSE)

    curve(dnorm(x), add=TRUE, col=2); lines(density(scale(Gir)), col=3)

    layout(1)

    shapiro.test(Guzer) ; shapiro.test(Gir)

    var.test(Guzer, Gir) # ou var.test(Guzer, Gir, alt=greater)

    t.test(Guzer, Gir, var.equal=T)

    Caso as varincias no sejam homogneas aplicada a aproximao de Sat-

    terthwaite (ou Welch) para os graus de liberdade usados e a estatstica de teste fica:

    T =( y1 y2) (1 2)s

    s21n1

    +s22n2

  • 10 Captulo 1. Testes de Hipteses

    em que os graus de liberdade so calculados por:

    =

    s21n1

    +s22n2

    2s21n1

    2n1 1 +

    s22n2

    2n2 1

    :

    Assume-se que T t;

    No R, basta alterar a opo de varincias iguais para var.equal=F ou simples-

    mente no colocar nada a respeito das varincias, uma vez que o default para varincias

    no homogneas.

    t.test(Guzer, Gir)

    1.2.2 Teste para duas amostras dependentes (pareados)

    utilizado quando o mesmo grupo de elementos submetido a algum tipo de

    tratamento em duas situaes distintas (ou dois tempos distintos). O objetivo seria saber se

    um determinado tratamento realizado faz com que o resultado final se altere. As hipteses

    testadas so:

    H0 : 1 2 = 0 vs H1 :

    8>>>>>:1 2 < 01 2 6= 01 2 > 0

    A estatstica de teste dada por:

    T =d 0sdpn

    ;

    em que:

    # d a mdia das diferenas entre os dois grupos, dada por:

    d =1

    n

    nXi=1

    di

    =1

    n

    nXi=1

    (yi1 yi2); i = 1; 2; : : : ; n

    d = y1 y2:

  • Teste para a Diferena entre duas Mdias 11

    # sd o desvio padro das diferenas entre os dois grupos, dado por:

    s2d =1

    n 1

    2666664nXi=1

    d2i

    nXi=1

    di

    !2n

    3777775Portanto, observa-se que a diferena para o teste para igualdade de duas mdias indepen-

    dentes est no clculo da varincia, que feito considerando-se todas as diferenas entre as

    observaes dependentes.

    Exemplo: Andrade and Ogliari (2007) apresentam um experimento conduzido para estudar

    o contedo de hemoglobina no sangue de sunos com deficincia de niacina2. Aplicaram-se

    20mg de niacina em oito sunos. Os nveis de hemoglobina no sangue foram mensurados

    antes e depois da aplicao da niacina. Os resultados obtidos no experimento foram:

    Tabela 1.1: Nveis de hemoglobina no sangue antes e aps a aplicao de niacina em sunos.

    Animal 1 2 3 4 5 6 7 8

    Antes 12,4 13,6 13,6 14,7 12,3 12,2 13,0 11,4

    Depois 10,4 11,4 12,5 14,6 13,0 11,7 10,3 9,8

    Diferenas

    Pode-se afirmar que a aplicao de niacina alterou a hemoglobina no sangue dos sunos?

    Soluo:

    2Tambm conhecida como vitamina B3, vitamina PP ou cido nicotnico, uma vitamina hidrossolvel cujos

    derivados (NAD+, NADH, NADP+ e NADPH) desempenham importante papel no metabolismo energtico celular e

    na reparao do DNA.

  • 12 Captulo 1. Testes de Hipteses

    Para resolver o exemplo dado no R, bastam os seguintes comandos:

    rm(list=ls())

    Fases = factor(rep(LETTERS[c(1,4)], each=8))

    Resp = c(12.4, 13.6, 13.6, 14.7, 12.3, 12.2, 13.0, 11.4,

    10.4, 11.4, 12.5, 14.6, 13.0, 11.7, 10.3, 9.8)

    (niacina = data.frame(Fases, Resp))

    attach(niacina)

    (medias = tapply(Resp, Fases, mean))

    (varincias = tapply(Resp, Fases, var))

    par(mai=c(1,1,.2,.2))

    plot(Resp ~ Fases, xlab=Situao, ylab=Hemoglobina no Sangue,

    names=c(Antes, Depois), col=LightYellow, las=1)

    points(medias, pch=+, col=red, cex=2)

    shapiro.test(Resp[Fases==A])

    shapiro.test(Resp[Fases==D])

    t.test(Resp[Fases==A], Resp[Fases==D], paired=T)

  • Teste de Shapiro-Wilk 13

    1.3 Teste de Shapiro-Wilk

    O teste de Shapiro-Wilk testa a hiptese nula que uma amostra y1; y2; ; yn, reti-rada de uma populao, tem distribuio normal. Para calcular o valor da estatsticaW , dada

    a amostra aleatria, de tamanho n, deve-se proceder da seguinte maneira:

    1) Obter uma amostra ordenada: y1 y2 yn;

    2) Calcular

    S2 =nXi=1

    (yi y)2 =nXi=1

    y2i

    nXi=1

    yi

    !2n

    3) Uma vez que se tem o nmero de amostras (n) coletadas, tem-se que:

    a) se n par, n = 2k, calcule:

    b =kXi=1

    ani+1 (yni+1 yi)

    em que os valores de ai so obtidos da Tabela 1.2;

    b) se n mpar, n = 2k + 1, o clculo exatamente como no item 3a, uma vez que ak+1 = 0

    quando n = 2k + 1. Assim, determina-se:

    b = an (yn y1) + + ak+2 (yk+2 yk)

    em que o valor de yk+1, que a mediana, no entra no clculo de b.

    4) Calcule

    W =b2

    S2:

    5) Para tomada de deciso a respeito da normalidade dos dados, compara-se o valor calculado

    de W com o valor tabelado Wn;, obtido da Tabela 1.4. Se o valor calculado W for menor

    que o tabelado, rejeita-se a hiptese de normalidade ao nvel de significncia.

    Exemplo: Considere os pesos (kg), j ordenados, de 11 homens adultos:

    y(1) y(2) y(3) y(4) y(5) y(6) y(7) y(8) y(9) y(10) y(11)

    67,1 69,9 71,7 72,6 73,0 73,5 75,3 77,1 82,6 88,5 107,0

    Verifique se estes dados provm de uma populao com distribuio normal.

  • 14 Captulo 1. Testes de Hipteses

    Soluo:

    1) As hipteses testadas so:

    H0 : Os dados so normalmente distribudos, e

    H1 : Os dados no so normalmente distribudos

    2) Como a amostra j est ordenada, basta calcular S2:

    S2 =nXi=1

    y2i

    nXi=1

    yi

    !2n

    = 68:235; 67 (858; 1968)2

    11

    S2 = 1:278; 569:

    3) Como n mpar, os valores de ani+1, obtidos da Tabela 1.2, so:

    a11 a10 a9 a8 a7 a6

    0,5601 0,3315 0,2260 0,1429 0,0695 0,0000

    Assim,

    b = an (yn y1) + + ak+2 (yk+2 yk)b = 0; 5601 (107 67; 1) + 0; 3315 (88; 5 69; 9) + 0; 2260 (82; 6 71; 7) +

    0; 1429 (77; 1 72; 6) + 0; 0695 (75; 3 73; 0)b = 31; 78019:

    4) O valor de W dado por:

    W =b2

    S2

    =(31; 78019)2

    1:280; 975

    W = 0; 7899:

    5) Observa-se na tabela 1.4, que o valor calculado W = 0; 7899 menor que o valor tabelado

    Wtab11;0;01 = 0; 792. Neste caso, rejeita-se H0, os dados no so normalmente distribudos.

    Para obter esses resultados utilizando-se do R, basta digitar o comando:

    dados = c(67.1, 69.8, 71.7, 72.6, 73.0, 73.5, 75.3, 77.1, 82.6, 88.4, 107)

    shapiro.test(dados)

  • Teste de Shapiro-Wilk 15

    Alm do teste de Shapiro-Wilk para verificao da normalidade, podem ser citados

    ainda os seguintes testes:

    a) Anderson-Darling;

    b) Cramer-von-Mises;

    c) Lilliefors (Kolmogorov-Smirnov);

    d) Shapiro-Francia;

    Todos estes testes esto implementados no pacote nortest.

  • 16 Captulo 1. Testes de Hipteses

    Tabela 1.2 Valores dos coeficientes ani+1 das estatsticas de ordem de uma amostra de

    tamanho n de uma distribuio Normal.

    i n n 2 3 4 5 6 7 8 9 10 11 12 131 0,7071 0,7071 0,6872 0,6646 0,6431 0,6233 0,6062 0,5888 0,5739 0,5601 0,5475 0,5359

    2 0,1677 0,2413 0,2806 0,3031 0,3164 0,3244 0,3291 0,3315 0,3325 0,3325

    3 0,0875 0,1401 0,1743 0,1976 0,2141 0,2260 0,2347 0,2412

    4 0,0561 0,0947 0,1224 0,1429 0,1586 0,1707

    5 0,0399 0,0695 0,0922 0,1099

    6 0,0803 0,0539

    i n n 14 15 16 17 18 19 20 21 22 23 24 251 0,5251 0,5150 0,5056 0,4968 0,4886 0,4808 0,4734 0,4643 0,4590 0,4542 0,4493 0,4450

    2 0,3318 0,3306 0,3290 0,3273 0,3253 0,3232 0,3211 0,3185 0,3156 0,3126 0,3098 0,3069

    3 0,2460 0,2495 0,2521 0,2540 0,2553 0,2561 0,2565 0,2578 0,2571 0,2563 0,2554 0,2543

    4 0,1802 0,1878 0,1939 0,1988 0,2027 0,2059 0,2085 0,2119 0,2131 0,2139 0,2145 0,2148

    5 0,1240 0,1353 0,1447 0,1524 0,1587 0,1641 0,1686 0,1736 0,1764 0,1787 0,1807 0,1822

    6 0,0727 0,0880 0,1005 0,1109 0,1197 0,1271 0,1334 0,1399 0,1443 0,1480 0,1512 0,1539

    7 0,0240 0,0433 0,0593 0,0725 0,0837 0,0932 0,1013 0,1092 0,1150 0,1201 0,1245 0,1283

    8 0,0196 0,0359 0,0496 0,0612 0,0711 0,0804 0,0878 0,0941 0,0997 0,1046

    9 0,0163 0,0303 0,0422 0,0530 0,0618 0,0696 0,0764 0,0823

    10 0,0140 0,0263 0,0368 0,0459 0,0539 0,0610

    11 0,0122 0,0228 0,0321 0,0403

    12 0,0107 0,0200

    13 0,0000

    i n n 26 27 28 29 30 31 32 33 34 35 36 371 0,4407 0,4366 0,4328 0,4291 0,4254 0,4220 0,4188 0,4156 0,4127 0,4096 0,4068 0,4040

    2 0,3043 0,3018 0,2992 0,2968 0,2944 0,2921 0,2898 0,2876 0,2854 0,2834 0,2813 0,2794

    3 0,2533 0,2522 0,2510 0,2499 0,2487 0,2475 0,2463 0,2451 0,2439 0,2427 0,2415 0,2403

    4 0,2151 0,2152 0,2151 0,2150 0,2148 0,2145 0,2141 0,2137 0,2132 0,1227 0,2121 0,2116

    5 0,1836 0,1848 0,1857 0,1864 0,1870 0,1874 0,1878 0,1880 0,1882 0,1883 0,1883 0,1883

    6 0,1563 0,1584 0,1601 0,1616 0,1630 0,1641 0,1651 0,1660 0,1667 0,1673 0,1678 0,1683

    7 0,1316 0,1346 0,1372 0,1395 0,1415 0,1433 0,1449 0,1463 0,1475 0,1487 0,1496 0,1505

    8 0,1089 0,1128 0,1162 0,1192 0,1219 0,1243 0,1265 0,1284 0,1301 0,1317 0,1331 0,1344

    9 0,0876 0,0923 0,0965 0,1002 0,1036 0,1066 0,1093 0,1118 0,1140 0,1160 0,1179 0,1196

    10 0,0672 0,0728 0,0778 0,0822 0,0862 0,0899 0,0931 0,0961 0,0988 0,1013 0,1036 0,1056

    11 0,0476 0,0540 0,0598 0,0650 0,0697 0,0739 0,0777 0,0812 0,0844 0,0873 0,0900 0,0924

    12 0,0284 0,0358 0,0424 0,0483 0,0537 0,0585 0,0629 0,0669 0,0706 0,0739 0,0770 0,0798

    13 0,0094 0,0178 0,0253 0,0320 0,0381 0,0435 0,0485 0,0530 0,0572 0,0610 0,0645 0,0677

    14 0,0000 0,0084 0,0159 0,0227 0,0289 0,0344 0,0395 0,0441 0,0484 0,0523 0,0559

    15 0,0000 0,0076 0,0144 0,0206 0,0262 0,0314 0,0361 0,0404 0,0444

    16 0,0000 0,0068 0,0131 0,0187 0,0239 0,0287 0,0331

    17 0,0000 0,0062 0,0119 0,0172 0,0220

    18 0,0000 0,0057 0,0110

    19 0,0000

  • Teste de Shapiro-Wilk 17

    i n n 38 39 40 41 42 43 44 45 46 47 48 49 501 0,4015 0,3989 0,3964 0,3940 0,3917 0,3894 0,3872 0,3850 0,3830 0,3808 0,3789 0,3770 0,3751

    2 0,2774 0,2755 0,2737 0,2719 0,2701 0,2684 0,2667 0,2651 0,2635 0,2620 0,2604 0,2589 0,2574

    3 0,2391 0,2380 0,2368 0,2357 0,2345 0,2334 0,2323 0,2313 0,2302 0,2291 0,2281 0,2271 0,2260

    4 0,2110 0,2104 0,2098 0,2091 0,2085 0,2078 0,2072 0,2065 0,2058 0,2052 0,2045 0,2038 0,2032

    5 0,1881 0,1880 0,1878 0,1876 0,1874 0,1871 0,1868 0,1865 0,1862 0,1859 0,1855 0,1851 0,1847

    6 0,1686 0,1689 0,1691 0,1693 0,1694 0,1695 0,1695 0,1695 0,1695 0,1695 0,1693 0,1692 0,1691

    7 0,1513 0,1520 0,1526 0,1531 0,1535 0,1539 0,1542 0,1545 0,1548 0,1550 0,1551 0,1553 0,1554

    8 0,1356 0,1366 0,1376 0,1384 0,1392 0,1398 0,1405 0,1410 0,1415 0,1420 0,1423 0,1427 0,1430

    9 0,1211 0,1225 0,1237 0,1249 0,1259 0,1269 0,1278 0,1286 0,1293 0,1300 0,1306 0,1312 0,1317

    10 0,1075 0,1092 0,1108 0,1123 0,1136 0,1149 0,1160 0,1170 0,1180 0,1189 0,1197 0,1205 0,1212

    11 0,0947 0,0967 0,0986 0,1004 0,1020 0,1035 0,1049 0,1062 0,1073 0,1085 0,1095 0,1105 0,1113

    12 0,0824 0,0848 0,0870 0,0891 0,0909 0,0927 0,0943 0,0959 0,0972 0,0986 0,0998 0,1010 0,1020

    13 0,0706 0,0733 0,0759 0,0782 0,0804 0,0824 0,0842 0,0860 0,0876 0,0892 0,0906 0,0919 0,0932

    14 0,0592 0,0622 0,0651 0,0677 0,0701 0,0724 0,0745 0,0765 0,0783 0,0801 0,0817 0,0832 0,0846

    15 0,0481 0,0515 0,0546 0,0575 0,0602 0,0628 0,0651 0,0673 0,0694 0,0713 0,0731 0,0748 0,0764

    16 0,0372 0,0409 0,0444 0,0476 0,0506 0,0534 0,0560 0,0584 0,0607 0,0628 0,0648 0,0667 0,0685

    17 0,0264 0,0305 0,0343 0,0379 0,0411 0,0442 0,0471 0,0497 0,0522 0,0546 0,0568 0,0588 0,0608

    18 0,0158 0,0203 0,0244 0,0283 0,0318 0,0352 0,0383 0,0412 0,0439 0,0465 0,0489 0,0511 0,0532

    19 0,0053 0,0101 0,0146 0,0188 0,0227 0,0263 0,0296 0,0328 0,0357 0,0385 0,0411 0,0436 0,0459

    20 0,0000 0,0049 0,0094 0,0136 0,0175 0,0211 0,0245 0,0277 0,0307 0,0335 0,0361 0,0386

    21 0,0000 0,0045 0,0087 0,0126 0,0163 0,0197 0,0229 0,0259 0,0288 0,0314

    22 0,0000 0,0042 0,0081 0,0118 0,0153 0,0185 0,0215 0,0244

    23 0,0000 0,0039 0,0076 0,0111 0,0143 0,0174

    24 0,0000 0,0037 0,0071 0,0104

    25 0,0000 0,0350

    http://www.portalaction.com.br/content/64-teste-de-shapiro-wilk, em 08/03/2014.

  • 18 Captulo 1. Testes de Hipteses

    Tabela 1.4 Valores crticos da estatstica W de Shapiro-Wilk.

    NNvel de significncia

    0,01 0,02 0,05 0,1 0,5 0,9 0,95 0,98 0,99

    3 0,753 0,756 0,767 0,789 0,959 0,998 0,999 1,000 1,000

    4 0,687 0,707 0,748 0,792 0,935 0,987 0,992 0,996 0,997

    5 0,686 0,715 0,762 0,806 0,927 0,979 0,986 0,991 0,993

    6 0,713 0,743 0,788 0,826 0,927 0,974 0,981 0,986 0,989

    7 0,730 0,760 0,803 0,838 0,928 0,972 0,979 0,985 0,988

    8 0,749 0,778 0,818 0,851 0,932 0,972 0,978 0,984 0,987

    9 0,764 0,791 0,829 0,859 0,935 0,972 0,978 0,984 0,986

    10 0,781 0,806 0,842 0,869 0,938 0,972 0,978 0,983 0,986

    11 0,792 0,817 0,850 0,876 0,940 0,973 0,979 0,984 0,986

    12 0,805 0,828 0,859 0,883 0,943 0,973 0,979 0,984 0,986

    13 0,814 0,837 0,866 0,889 0,945 0,974 0,979 0,984 0,986

    14 0,825 0,846 0,874 0,895 0,947 0,975 0,980 0,984 0,986

    15 0,835 0,855 0,881 0,901 0,950 0,975 0,980 0,984 0,987

    16 0,844 0,863 0,887 0,906 0,952 0,976 0,981 0,985 0,987

    17 0,851 0,869 0,892 0,910 0,954 0,977 0,981 0,985 0,987

    18 0,858 0,874 0,897 0,914 0,956 0,978 0,982 0,986 0,988

    19 0,863 0,879 0,901 0,917 0,957 0,978 0,982 0,986 0,988

    20 0,868 0,884 0,905 0,920 0,959 0,979 0,983 0,986 0,988

    21 0,873 0,888 0,908 0,923 0,960 0,980 0,983 0,987 0,989

    22 0,878 0,892 0,911 0,926 0,961 0,980 0,984 0,987 0,989

    23 0,881 0,895 0,914 0,928 0,962 0,981 0,984 0,987 0,989

    24 0,884 0,898 0,916 0,930 0,963 0,981 0,984 0,987 0,989

    25 0,888 0,901 0,918 0,931 0,964 0,981 0,985 0,988 0,989

    26 0,891 0,904 0,920 0,933 0,965 0,982 0,985 0,988 0,989

    27 0,894 0,906 0,923 0,935 0,965 0,982 0,985 0,988 0,990

    28 0,896 0,908 0,924 0,936 0,966 0,982 0,985 0,988 0,990

    29 0,898 0,910 0,926 0,937 0,966 0,982 0,985 0,988 0,990

    30 0,900 0,912 0,927 0,939 0,967 0,983 0,985 0,988 0,990

    31 0,902 0,914 0,929 0,940 0,967 0,983 0,986 0,988 0,990

    32 0,904 0,915 0,930 0,941 0,968 0,983 0,986 0,988 0,990

    33 0,906 0,917 0,931 0,942 0,968 0,983 0,986 0,989 0,990

    34 0,908 0,919 0,933 0,943 0,969 0,983 0,986 0,989 0,990

    35 0,910 0,920 0,934 0,944 0,969 0,984 0,986 0,989 0,990

    36 0,912 0,922 0,935 0,945 0,970 0,984 0,986 0,989 0,990

    37 0,914 0,924 0,936 0,946 0,970 0,984 0,987 0,989 0,990

    38 0,916 0,925 0,938 0,947 0,971 0,984 0,987 0,989 0,990

    39 0,917 0,927 0,939 0,948 0,971 0,984 0,987 0,989 0,991

    40 0,919 0,928 0,940 0,949 0,972 0,985 0,987 0,989 0,991

    41 0,920 0,929 0,941 0,950 0,972 0,985 0,987 0,989 0,991

    42 0,922 0,930 0,942 0,951 0,972 0,985 0,987 0,989 0,991

    43 0,923 0,932 0,943 0,951 0,973 0,985 0,987 0,990 0,991

    44 0,924 0,933 0,944 0,952 0,973 0,985 0,987 0,990 0,991

    45 0,926 0,934 0,945 0,953 0,973 0,985 0,988 0,990 0,991

    46 0,927 0,935 0,945 0,953 0,974 0,985 0,988 0,990 0,991

    47 0,928 0,936 0,946 0,954 0,974 0,985 0,988 0,990 0,991

    48 0,929 0,937 0,947 0,954 0,974 0,985 0,988 0,990 0,991

    49 0,929 0,938 0,947 0,955 0,974 0,985 0,988 0,990 0,991

    50 0,930 0,939 0,947 0,955 0,974 0,985 0,988 0,990 0,991

    http://www.portalaction.com.br/content/64-teste-de-shapiro-wilk, em 08/03/2014.

  • Teste de Shapiro-Wilk 19

    Exerccios

    1) O valor mdio de espessura de toucinho, para animais prontos para o abate, obtido com

    pistola eletrnica de 24 mm. Um produtor, no dispondo da pistola eletrnica, fez as

    mensuraes usando regra milimetrada e obteve os seguintes resultados:

    37,8 28,8 36,6 28,6 40,1 28,9 29,4 36,2 32,7 35,6

    41,0 33,4 35,1 33,7 38,5 23,9 23,8 36,6 24,3 36,5

    33,9 36,4 32,4 39,2 26,4 37,7 27,1 27,6 25,7 26,0

    a) Determine a mdia, a varincia, o desvio-padro, o erro-padro da mdia e o coeficiente

    de variao dos dados;

    b) Construa o grfico de caixas. H algum outlier nesses dados?

    c) Verifique se os dados apresentam distribuio normal;

    d) Verifique se a mdia obtida com a rgua milimetrada difere da mdia esperada com a

    pistola eletrnica.

    2) A finalidade de um estudo foi investigar a natureza da destruio do pulmo em fumantes

    antes do desenvolvimento de enfisema. Trs mensuraes foram realizadas nos pulmes

    de fumantes e no-fumantes que morreram repentinamente de causas no-respiratrias.

    Uma maior pontuao indica maior dano ao pulmo, o qual o valor registrado. O dano

    ao pulmo maior aos fumantes que aos no-fumantes?

    No fumantes 18,1 6,0 10,8 11,0 7,7 17,9 8,5 13,0 18,9

    Fumantes16,6 13,9 11,3 26,6 17,4 15,3 15,8 12,3 18,6

    12,0 12,0 24,1 16,5 21,8 16,3 23,4 18,8

    a) Calcule a mdia, a varincia, o desvio-padro, o erro-padro da mdia e o coeficiente de

    variao dos dados para cada grupo;

    b) Construa o grfico de caixas. H evidncias de diferenas entre as mdias? Observa-se

    algum outlier em algum dos grupos?

    c) Teste se as varincias so homogneas. Adote = 5%.

  • 20 Captulo 1. Testes de Hipteses

    d) Pode-se concluir que os fumantes tem um dano maior no pulmo que os no-fumantes?

    Considere = 5%. Vale a pena fumar?

    3) Os dados a seguir (parte deles) so relativos a um experimento com Tilpias do Nilo (Ore-

    ochromis niloticus) e foram obtidos pelos alunos do curso de Medicina Veterinria da UEL

    em 2004.

    Turma Induo (s) Peso (g) Comprimento (cm)

    2021 165 408,50 29,00

    2021 183 400,00 29,50

    2021 161 397,20 29,30

    2021 108 431,60 29,50

    2021 146 336,50 26,20

    2021 147 309,40 25,80

    2021 173 387,70 29,80

    2021 193 348,50 27,50

    2021 160 346,10 26,70

    2021 155 307,80 27,00

    2022 261 477,20 31,00

    2022 203 282,50 25,70

    2022 238 290,00 26,00

    2022 174 429,10 30,50

    2022 155 346,80 27,50

    2022 202 464,60 30,50

    2022 231 429,60 29,00

    2022 207 284,20 26,50

    2022 279 400,50 29,20

    a) Calcule a mdia, varincia, desvio padro, o erro-padro da mdia e o coeficiente de

    variao para cada uma das variveis numricas ;

    b) Construa o grfico de caixas para o peso das tilpias. O que se observa?

    c) Verifique se os dados seguem uma distribuio normal;

  • Teste de Shapiro-Wilk 21

    d) O peso mdio de tilpia do nilo adulta de 340 g. Pode-se afirmar que o peso mdio

    encontrado no experimento segue este padro?

    e) Repita o item 3a, mas calculado para cada Turma;

    f) Faa um grfico de caixas, comparando as Turmas, para cada uma das trs variveis e

    discuta os resultados;

    g) Para cada varivel, verifique se os dados seguem uma distribuio normal;

    h) Para cada varivel, verifique se as varincias entre as Turmas so homogneas;

    i) Para cada varivel, verifique se h diferena entre as mdias das Turmas.

    4) Dez coelhos adultos foram submetidos a suplementao alimentar durante uma semana.

    Os animais foram mantidos em gaiolas individuais e tiveram seus pesos (kg) mensurados

    no incio e no final da suplementao.

    Incio 2,43 2,59 2,50 2,48 2,53 2,52 2,57 2,51 2,47 2,43

    Final 2,62 2,71 2,69 2,65 2,70 2,68 2,67 2,64 2,68 2,66

    a) Qual dos tempos, Incio ou Final, apresentou maior variabilidade?

    b) Construa o grfico de caixas. Discuta o resultado;

    c) Adotando-se = 0; 05, h razo para acreditar que a suplementao fornece um au-

    mento no peso mdio?

  • Captulo 2

    Anlise de Varincia

    2.1 Introduo

    A ideia bsica da anlise de varincia decompor a variabilidade total, em partes

    atribudas a causas conhecidas e independentes e a uma parte residual de origem desconhe-

    cida e de natureza aleatria.

    Banzatto and Kronka (1995), enunciam alguns conceitos bsicos relacionados s

    etapas da experimentao, que so:

    a) Experimento ou ensaio: um trabalho previamente planejado, que segue determinados

    princpios bsicos e no qual se faz a comparao dos efeitos dos tratamentos;

    b) Tratamento: o mtodo, elemento ou material cujo efeito se deseja medir ou comparar em

    um experimento. Os tratamentos podem ser considerados fixos ou aleatrios, dependendo

    da forma como o experimento conduzido.

    Exemplos: Rao, doses de medicamentos, inseticidas, raas, etc.;

    c) Unidade experimental ou parcela: a unidade que vai receber o tratamento e fornecer os

    dados que devero refletir seu efeito.

    Exemplos: Um animal, um grupo de animais, uma planta, uma placa de Petri com um

    meio de cultura, etc.;

    d) Delineamento experimental: o plano utilizado na experimentao e implica na forma

    como os tratamentos sero designados s unidades experimentais. Esta etapa extrema-

    mente importante porque os erros cometidos no delineamento podem invalidar os resulta-

    dos do experimento.

    Exemplos: Delineamentos experimentais: inteiramente casualizado, blocos casualizados,

    quadrado latino, etc.

    22

  • Princpios bsicos da experimentao 23

    2.2 Princpios bsicos da experimentao

    a) Repetio: a ideia, em experimentao, comparar grupos, no apenas unidades. As

    unidades experimentais do mesmo grupo recebem, em estatstica, o nome de repeties

    e sua finalidade obter uma estimativa do erro experimental. O nmero de repeties a

    ser usado em um experimento uma questo difcil de responder. De um modo geral,

    quanto maior for o nmero de repeties mais precisas sero as estimativas das mdias e

    dos desvios-padres. Como regra prtica, aplicvel a uma grande maioria de casos, Gomes

    (1990) destaca que os experimentos devem ter pelo menos vinte parcelas ou dez graus de

    liberdade para o resduo.

    b) Casualizao: consiste em se aplicar os tratamentos s parcelas, atravs do sorteio. Tem

    por finalidade propiciar a todos os tratamentos a mesma probabilidade de serem desig-

    nados a qualquer das unidades experimentais, fazendo com que cada observao (ou erro)

    seja uma varivel aleatria independentemente distribuda. A casualizao foi formalmente

    proposta por Fisher, na dcada de 1920;

    c) Controle Local: uma tcnica usada para melhorar a preciso do experimento, cuja fi-

    nalidade dividir um ambiente heterogneo em sub-ambientes homogneos e tornar o

    delineamento experimental mais eficiente, pela reduo do erro experimental. Esses

    sub-ambientes homogneos so chamados blocos.

    2.3 Conduo do experimento

    No se deve permitir que uma tcnica experimental inadequada ou imperfeita

    seja a responsvel principal pelo tamanho do erro experimental. Um ensaio bem delineado

    e planejado pode perder muito do seu valor se no for conduzido cuidadosamente. Deve-se

    pesar o material, calibrar o equipamento ou tirar as medidas necessrias, com o mximo de

    preciso possvel.

    Uma das primeiras precaues a se tomar com a marcao adequada das uni-

    dades experimentais. Com animais, h mtodos padronizados de marcao de gado ou aves,

    assim, o nico cuidado manter a anotao do cdigo utilizado.

    Uma falha bastante comum a aplicao no uniforme dos tratamentos em todas

    as repeties. Por exemplo, quando no se cuida da limpeza do equipamento utilizado para

    fornecer raes aos animais, podem ocorrer diferenas que no so devidas s raes e sim,

    quantidade de rao que cada animal recebeu. Em experimentos com animais eventualmente

    coprfagos1, como sunos, quando os mesmos tm acesso a uma rea comum e quando os

    1Copro em latim significa fezes; fagia significa ingesto. Pratica ingesto de fezes

  • 24 Captulo 2. Anlise de Varincia

    tratamentos so aditivos de raes (vitaminas, minerais, etc.), que podem ser eliminados

    pelas fezes, se no houver um monitoramente constante, os resultados obtidos podem ser

    influenciados por esse hbito dos animais.

    Finalmente, se mais de uma pessoa est aplicando os tratamentos, deve-se cuidar

    para que as variaes entre elas no sejam confundidas com variaes entre tratamentos.

    Neste caso, possvel aproveitar o delineamento experimental fazendo com que as variaes

    entre as pessoas afetem todos os tratamentos igualmente.

    2.4 Planejamento do experimento

    Para se ter um experimento planejado, necessrio definir:

    a) os tratamentos que sero comparados;

    b) o nmero de repeties a ser utilizado;

    c) a unidade experimental;

    d) a forma como os tratamentos sero designados s unidades experimentais;

    e) a varivel em anlise e a forma como ser medida;

    f) o delineamento experimental.

    Exemplo 1: Suponha que se deseja comparar o efeito de duas raes na engorda de sunos.

    O experimento poderia ser planejado, definindo-se:

    a) os tratamentos que sero comparados:

    ;

    b) a unidade experimental:

    ;

    c) a forma como os tratamentos sero designados s unidades experimentais:

    .

    d) a varivel em anlise e a forma como ser medida:

    ;

    e) o delineamento experimental:

    ;

  • Planejamento do experimento 25

    Exemplo 2: Considere um experimento cujo objetivo verificar se a incluso de razes e

    tubrculos, como suplementao de inverno na alimentao de vacas em lactao, aumenta a

    produo de leite. Para isso, sero considerados 24 animais, trs tipos de suplementos e uma

    testemunha, que so:

    a) Sem Suplemento (S); b) Mandioca (M);

    c) Araruta (A); d) Batata Doce (B);

    e o experimento instalado no delineamento inteiramente casualizado. Para se definir o tipo

    de suplemento que ser dado a cada animal, realiza-se um sorteio enumerando cada um

    dos 24 animais (parcelas) que participaro do estudo (1 a 24) e, em seguida, colocam-se os

    tratamentos em uma sequncia, como a dada a seguir:

    S1 S2 S3 S4 S5 S6 M1M2M3M4M5M6 A1A2A3A4A5A6 B1B2B3B4B5B6

    e, a partir da, utilizando uma tabela de nmeros aleatrios, faz-se a alocao do tipo de

    suplemento a cada animal. Suponha que a sequncia de nmeros aleatrios sorteada, tenha

    sido:

    24 23 22 14 1 13 6 20 8 7 9 4 21 15 17 16 19 2 11 5 10 3 18 12

    Para obter a sequncia de nmeros aleatrios e aloc-las a cada tratamentos

    usando o R, bastam os seguintes comandos:

    Rao = factor(rep(c(S,M,A,B), each=6))

    (Animal = sample(1:24))

    data.frame(Rao, Animal)

    Assim, ter-se-ia, por exemplo, a seguinte configurao do experimento:

    Animais 1 2 3 4 5 6Tratamentos S5 A6 B4 M6 B2 M1

    Animais 7 8 9 10 11 12Tratamentos M4 M3 M5 B3 B1 B6

    Animais 13 14 15 16 17 18Tratamentos S6 S4 A2 A3 A4 B5

    Animais 19 20 21 22 23 24Tratamentos A5 M2 A1 S3 S2 S1

    Considere as seguintes produes mdias dirias (kg) de leite a 4% de gordura das vacas

    submetidas a administrao de razes e tubrculos, como suplementao de inverno na ali-

    mentao de vacas em lactao.

  • 26 Captulo 2. Anlise de Varincia

    Animais - Tratamentos 1 - S5 2 - A6 3 - B4 4 - M6 5 - B2 6 - M1

    Produo (kg) 22,81 35,19 20,37 24,80 24,37 23,40

    Animais - Tratamentos 7 - M4 8 - M3 9 - M5 10 - B3 11 - B1 12 - B6

    Produo (kg) 25,12 24,36 22,94 26,54 22,15 24,06

    Animais - Tratamentos 13 - S6 14 - S4 15 - A2 16 - A3 17 - A4 18 - B5

    Produo (kg) 23,54 25,42 32,47 34,48 35,04 19,54

    Animais - Tratamentos 19 - A5 20 - M2 21 - A1 22 - S3 23 - S2 24 - S1

    Produo (kg) 35,04 22,37 35,42 23,43 21,07 19,58

    Seja yij o valor da produo de leite da j-sima vaca que recebeu o i-simo tratamento. Os

    valores das produes (kg) de leite a 4% de gordura das vacas que participaram do estudo,

    podem ser resumidos na forma da Tabela 2.1.

    Tabela 2.1 Valores de produo de leite (kg), obtidos no experimento.

    Sem suplementao (t1) Mandioca (t2) Araruta (t3) Batata Doce (t4)

    19,58 23,40 35,42 22,15

    21,07 22,37 32,47 24,37

    23,43 24,36 34,48 26,54

    25,42 25,12 33,79 20,37

    22,81 22,94 35,04 19,54

    23,54 21,56 35,19 24,066Xi=1

    yij 135,85 139,75 206,39 137,03

    6Xi=1

    y2ij 3.096,8903 3.263,4781 7.105,6495 3.164,523

    yi 22,6417 23,2917 34,3983 22,8383

    Ao nvel de 5% de significncia, concluir a respeito da suplementao e sobre os tipos de

    suplementao usados.

    sempre interessante examinar os dados graficamente. A Figura 2.1 apresenta

    o grfico de caixas (box plot) para cada nvel da varivel produo de leite. Note que h uma

    forte evidncia de que a produo de leite pode estar relacionada com o suplemento alimentar

    Araruta.

  • Planejamento do experimento 27

    Sem Suplemento Mandioca Araruta Batata Doce

    20

    25

    30

    35

    Tratamentos

    Quilos

    xx

    x

    x

    Figura 2.1 Produo de leite (kg) levando-se em conta o complemento alimentar.

    A mdia geral e o desvio padro de produo diria (kg) so, respectivamente,

    dadas por:

    y = 25; 7925 kg s = 5; 374932 kg

    As mdias e desvios de cada suplementao so dadas a seguir:

    Tabela 2.2 Estatsticas calculadas para cada tratamento.

    Sem Suplementao Mandioca Araruta Batata Doce

    Mdias (kg) 22,64 23,29 34,398 22,84

    Varincias (kg2) 4,203977 1,6935367 1,2354967 6,997257

    Desvios-Padro (kg) 2,0503601 1,3013595 1,111529 2,6452328

    Erros-Padro (kg) 0,837056 0,531278 0,4537798 1,079911768

    Os resultados anteriores so obtidos no R com os seguintes comandos:

    Quilos = c(19.58, 21.07, 23.43, 25.42, 22.81, 23.54,

    23.40, 22.37, 24.36, 25.12, 22.94, 21.56,

    35.42, 32.47, 34.48, 33.79, 35.04, 35.19,

    22.15, 24.37, 26.54, 20.37, 19.54, 24.06)

    (Leite = data.frame(Trat = factor(rep(c(T1,T2,T3,T4), each=6)),

    Quilos))

    attach(Leite)

  • 28 Captulo 2. Anlise de Varincia

    names(Leite)

    (media = tapply(Quilos, Trat, mean))

    (desvio = tapply(Quilos, Trat, sd))

    (varincias = tapply(Quilos, Trat, var))

    par(mai=c(1, 1, .2, .2))

    boxplot(Quilos ~ Trat, las=1, col=LightYellow,

    ylab=Produo leite (kg), xlab=Tipos de Suplementos,

    names=c(Sem Suplementao, Mandioca", Araruta,

    Batata Doce))

    points(media, pch=+", col=red, cex=1.5)

    Poder-se-ia pensar em aplicar o teste t para amostras independentes e analisar-

    mos todos os pares de mdias. Sabe-se que a estatstica de teste para comparao de duas

    amostras dada por:

    tcal =(y1 y2) (1 2)

    sp

    q1n1

    + 1n2

    s2p =

    s(n1 1)s21 + (n2 1)s22

    n1 + n2 2 ;

    e a hiptese nula : H0 : 1 = 2 ou H0 : 1 2 = 0.Os resultados do teste t para todas as amostras, tomadas duas a duas, so dados

    por:

    SS MA AR BD

    Sem Suplemento (SS) ns ** ns

    Mandioca (MA) ** ns

    Araruta (AR) **

    Batata Doce (BD)

    em que:

    ns - no h diferena significativa entre as mdias e,

    - H diferena significativa entre as mdias, ao nvel de 5%.

    Obs.: Para se obter a varincia geral dos dados, calculou-se:

    s2 =1

    n 1aXi=1

    niXj=1

    (yij y)2;8

  • Classificao dos experimentos 29

    Entretanto, esta soluo ser incorreta, pois leva a uma considervel distoro

    no erro Tipo I. Por exemplo, suponha que seja testada a igualdade das quatro mdias usando

    comparaes pareadas. H 6 possveis pares e, se a probabilidade de corretamente aceitar a

    hiptese nula para cada par testado de (1) = 0; 95, ento a probabilidade de corretamenteaceitar a hiptese nula para todos os 6 pares (0; 95)6 = 0; 7359, se os testes forem indepen-

    dentes. O procedimento apropriado para testar a igualdade de vrias mdias a anlise de

    varincia.

    2.5 Classificao dos experimentos

    Os experimentos com animais podem ser classificados em: contnuos e alternati-

    vos. Nos primeiros, os animais colocados sob um determinado tratamento, nele permanecem

    at o fim do experimento. Os delineamentos mais utilizados nesse tipo de estudo so: inteira-

    mente ao acaso, blocos casualizados, quadrados latinos e parcelas subdivididas. Os ensaios

    contnuos so, de forma geral, realizados com aves, coelhos, sunos, ovinos, equdeos, gado

    de corte e, mais raramente, com vacas leiteiras.

    Nos ensaios alternativos (cross-over ou change-over), os animais recebem, em

    sequncia, dois ou mais tratamentos durante o transcorrer do experimento. So, em especial,

    realizados com vacas leiteiras, mas, conforme o tipo do problema, os delineamentos podem

    ser adaptados s outras espcies de animais.

  • Captulo 3

    Delineamento Inteiramente

    Casualizado

    3.1 Introduo

    Suponha que haja a tratamentos ou diferentes nveis de um nico fator que se

    queira comparar. A resposta observada de cada dos a tratamentos uma varivel aleatria.

    Os dados seriam da forma:

    Tratamentos Observaes Totais Mdias

    1 y11 y12 y1n y1 y1

    2 y21 y22 y2n y2 y2...

    ...... ... ... ...

    a yi1 yi2 yin yi yi

    y y

    em que yij representa a j-sima observao do i-simo tratamento;

    yi =nXj=1

    yij yi =nXj=1

    yijn

    e y =yan

    =

    aXi=1

    nXj=1

    yijan

    :

    Por levar em considerao apenas os princpios da repetio e da casualizao, so conside-

    rados os mais simples delineamentos experimentais. So instalados em situao de homoge-

    neidade, por isso, so muito usados em laboratrios, casas de vegetao, etc.

    O modelo estatstico para o delineamento inteiramente casualizado :

    yij = + i + ij ;

    (i = 1; 2; : : : ; a

    j = 1; 2; : : : ; n(3.1)

    30

  • Introduo 31

    em que:

    a) yij o valor observado na parcela j que recebeu o tratamento i;

    b) um parmetro constante, comum a todos os tratamentos, chamado mdia geral (quando os dados

    so balanceados);

    c) i um parmetro nico que representa o i-simo efeito de tratamento;

    d) ij um componente do erro aleatrio, associado j-sima repetio do i-simo tratamento;

    O objetivo testar hipteses apropriadas sobre os efeitos dos tratamentos e estim-

    los. A anlise de varincia para testar essas hipteses s vlida se forem satisfeitas as

    seguintes condies:

    1) aditividade: o modelo deve ser aditivo, ou seja, os efeitos devem se somar (no h intera-

    o). Para verificao da aditividade, pode-se usar o teste de no-aditividade de Tukey;

    2) independncia: os erros (ij), devidos ao efeito de fatores no controlados, devem ser

    independentes, o que , at certo ponto, garantido pelo princpio da casualizao;

    3) normalidade: os erros (ij), devidos ao efeito de fatores no controlados, devem possuir

    uma distribuio normal de probabilidade. Para a verificao da normalidade dos erros,

    em geral, utilizam-se os testes de normalidade, tais como Lilliefors (Kolmogorov-Smirnov),

    o 2 e Shapiro-Wilk, alm da anlise de resduos, construindo o grfico qqplot. O teste mais

    amplamente usado para este fim o teste de Shapiro-Wilk e apresentado em detalhes na

    pgina 13.

    O comando do R, bem como o resultado do teste usando-se os resduos dos dados da Tabela

    2.1,

    shapiro.test(anava.av$res)

    Shapiro-Wilk normality test

    data: anava.av$res

    W = 0.9705, p-value = 0.6787

    require(nortest)

    lillie.test(anava.av$res)

    Lilliefors (Kolmogorov-Smirnov) normality test

    data: anava.av$res

    D = 0.1205, p-value = 0.4896

    mostrando que os erros tm uma distribuio normal. Claro que pode-se, alm do teste,

    utilizar os recursos grficos para verificao da normalidade dos dados. Os comandos para

    gerar os grficos dos resduos e o QQ-Plot discutidos na aula prtica so apresentados na

    seo 3.2.

  • 32 Captulo 3. Delineamento Inteiramente Casualizado

    4) homocedasticidade ou homogeneidade de varincias: os erros (ij), devido ao efeito de

    fatores no controlados, devem possuir uma varincia comum 2. A homogeneidade das

    varincias pode ser verificada atravs de testes ou pela anlise dos resduos. No caso de se

    utilizar testes, tm-se:

    a) F mximo ou teste de Hartley: dado por

    Fmax =s2maxs2min

    :

    Esse valor calculado comparado com o valor tabelado (Tabela 9.4, na pgina 126), em

    que a refere-se ao nmero de tratamentos e = n 1 (graus de liberdade do nmero derepeties em cada tratamento).

    FHart = F (p = 1 ; df = ; k = a)

    Se Fmax < FHart, ento no se rejeita a hiptese de homogeneidade de varincias.

    Para realizar o teste usando o R e obter os valores da tabela de Hartley, usa-se o seguinte

    comando:

    require(SuppDists)

    (F_hart = qmaxFratio(p=.95, df=5 , k=4))

    [1] 13.72395

    (F_max = max(variancia)/ min(variancia))

    [1] 5.663517

    Portanto, como o Fmax < FHart, no se rejeita a hiptese de homogeneidade de varincias.

    b) teste de Bartlett1, que dado por:

    B =M

    C

    em que:

    M =aXi=1

    (ni 1) ln (s2p)aXi=1

    (ni 1) ln s2i

    C = 1 +1

    3(a 1)

    266664aXi=1

    1

    ni 1 1

    aXi=1

    (ni 1)

    377775ainda,

    s2p =

    aXi=1

    (ni 1)s2iaXi=1

    (ni 1)

    1Maurice Stevenson Bartlett, nascido em Chiswick, Londres, em 18 junho de 1910 e falecido em 8 janeiro de 2002

  • Introduo 33

    Muitos pesquisadores preferem trabalhar com logaritmos na base 10, logo, faz-se uma

    mudana de base, dada por:

    ln (s2p) =log10(s

    2p)

    log10(e)= 2; 302585 log10(s2p)

    e a frmula para o teste de Bartlett fica:

    B =M

    C=

    2; 3026

    "aXi=1

    (ni 1) log (s2p)aXi=1

    (ni 1) log s2i#

    1 +1

    3(a 1)

    266664aXi=1

    1

    ni 1 1

    aXi=1

    (ni 1)

    377775em que B 2a1;.

    Obs.: Para experimentos desbalanceados, usar o teste de Bartlett.

    Para realizar o teste de Bartlett no R, usa-se o seguinte comando:

    bartlett.test(Quilos~Trat)

    O resultado do teste para os dados da Tabela 2.1,

    Bartlett test of homogeneity of variances

    data: Quilos by Trat

    Bartletts K-squared = 5.2207, df = 3, p-value = 0.1563

    Como o p-valor 0; 1563, no se rejeita a hiptese de homogeneidade de varincias.

    c) teste de Levene: estudos indicam que o teste de Bartlett muito sensvel falta de

    normalidade e no deve ser aplicado quando houver dvida sobre a suposio de nor-

    malidade. Neste caso, deve-se utilizar o teste de Levene ou Brown-Forsythe que so

    alternativas ao teste de Bartlett por serem menos sensveis a afastamentos da normali-

    dade. Para a realizao do teste de Levene, deve-se:

    ) obter os resduos da anlise de varincia: eij = yij ^ ^i;) realizar uma anlise de varincia dos valores absolutos desses resduos;) observar o p-valor obtido na anlise e comparar com o nvel de significncia adotado

    e concluir.

    Para aplicar o teste de Levene usando o R, basta o comando:

    require(car)

    leveneTest(Quilos, Trat, center=mean)

  • 34 Captulo 3. Delineamento Inteiramente Casualizado

    3.1.1 Modelos de efeitos fixos e aleatrios

    O modelo (3.1) descreve duas situaes diferentes com relao aos efeitos dos

    tratamentos. Primeira, os a tratamentos poderiam ter sido especificamente escolhidos pelo

    pesquisador. Nessa situao, o objetivo testar hipteses sobre as mdias dos tratamentos e

    a concluso se aplica apenas aos nveis do fator considerado na anlise. As concluses no

    podem ser estendidas tratamentos similares que no foram explicitamente considerados.

    Pode-se estimar os parmetros do modelo (; i; 2). Esse tipo de anlise chamada modelo

    de efeitos fixos.

    Alternativamente, os a tratamentos poderiam ser uma amostra aleatria de uma

    populao maior de tratamentos. Nessa situao, o objetivo estender as concluses (que so

    baseadas em uma amostra de tratamentos) para todos os tratamentos da populao, quer eles

    tenham feito parte do experimento ou no. Nesse caso, os i so variveis aleatrias e os testes

    de hipteses recaem sobre a variabilidade de i tentando-se estimar essa variabilidade. Esse

    tipo de anlise chamada modelo de efeitos aleatrios ou modelo de componentes de

    varincia.

    3.2 Anlise do modelo de efeitos fixos

    Quando se instala um experimento no delineamento inteiramente casualizado, o

    objetivo , em geral, verificar se existe diferena significativa entre pelo menos duas mdias

    de tratamentos. As hipteses testadas so:

    H0 : 1 = 2 = = aH1 : i 6= i0 Pelo menos duas mdias de tratamentos diferem entre si

    Uma forma equivalente de escrever as hipteses anteriores em termos dos efeitos

    dos tratamentos i, que :

    H0 : 1 = 2 = = a = 0H1 : i 6= 0 pelo menos um tratamento

    Considere a estimao dos parmetros do modelo (3.1), usando o mtodo de m-

    nimos quadrados. A funo de mnimos quadrados :

    aXi=1

    nXj=1

    2ij| {z }L

    =

    aXi=1

    nXj=1

    [yij i]2 :

  • Anlise do modelo de efeitos fixos 35

    Derivando-se L em relao aos parmetros ( e i) tem-se:

    @L

    @= 2

    aXi=1

    nXj=1

    [yij ^ ^i] (1) = 0

    @L

    @i= 2

    nXj=1

    [yij ^ ^i] (1) = 0

    e igualando-se os resultados a zero e aplicando os somatrios, obtm-se o chamado sistema

    de equaes normais:

    8>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>:

    aXi=1

    nXj=1

    yij = an^+ n^1 + n^2 + + n^anXj=1

    y1j = n^ + n^1

    nXj=1

    y2j = n^ + n^2

    ......

    nXj=1

    yaj = n^ + n^a

    cujo sistema tem (a+ 1) equaes e (a+ 1) incgnitas (; 1; 2; ; a), apresentando infinitassolues. Pode ser resumido como:

    8>>>>>>>:

    aXi=1

    nXj=1

    yij = an^+ n

    aXi=1

    ^i

    nXj=1

    yij = n^+ n^i:

    Para obter uma soluo nica impe-se uma restrio, ou seja,aXi=1

    ^i = 0. que nos permite

    obter a estimativa da mdia independente do efeito de tratamentos.

    Os estimadores de mnimos quadrados para e i, so dados por:

    ^ = y::; (3.2)

    ^i = yi: y:: i = 1; 2; : : : ; a; (3.3)

  • 36 Captulo 3. Delineamento Inteiramente Casualizado

    3.2.1 Decomposio das Somas de Quadrados

    A variabilidade total dos dados pode ser reescrita em funo das mdias de cada

    tratamento, assimaXi=1

    nXj=1

    (yij ^)2 =aXi=1

    nXj=1

    (yij yi + yi ^)2

    =aXi=1

    nXj=1

    h(yij yi)2 + (yi y)2 + 2 (yi y) (yij yi)

    i=

    aXi=1

    nXj=1

    (yij yi)2 +aXi=1

    nXj=1

    (yi y)2 + 2aXi=1

    nXj=1

    (yi y) (yij yi)

    aXi=1

    nXj=1

    (yij ^)2 =aXi=1

    nXj=1

    (yij yi)2 +aXi=1

    nXj=1

    (yi y)2

    observe que,

    aXi=1

    nXj=1

    (yi y) (yij yi) =aXi=1

    24 nXj=1

    (yij yi)35 (yi y)

    =aXi=1

    0 (yi y)aXi=1

    nXj=1

    (yi y) (yij yi) = 0

    pois, a soma dos desvios das variveis em relao mdia respectiva nula. Logo,

    aXi=1

    nXj=1

    (yij y)2| {z }SQTotal

    =

    aXi=1

    nXj=1

    (yij yi)2| {z }SQRes

    +

    aXi=1

    nXj=1

    (yi y)2| {z }SQTrat

    em que, desenvolvendo-se os quadrados, obtm-se

    SQTotal =aXi=1

    nXj=1

    y2ij y2an

    SQTrat =

    aXi=1

    y2i:n y

    2an

    SQRes = SQTotal SQTrat

    o termo C =y2an

    =

    0@ aXi=1

    nXj=1

    yij

    1A2an

    chamado correo.

    Fazendo-se a usual suposio de normalidade, a estatstica apropriada paraH0 : i = 0

  • Anlise do modelo de efeitos fixos 37

    Fcal =SQTrat=(a 1)SQRes=a(n 1) =

    QMTrat

    QMRes:

    sendo que Fcal F(a1); a(n1);. Se Fcal > F;(a1);a(n1), rejeita-se H0.Para verificarmos se a hiptese nula (H0) aceita ou no, completa-se o seguinte

    Quadro da Anlise de Varincia:

    Tabela 3.1 Quadro da Anlise de Varincia.

    Causa de variao Somas de Quadrados g.l. Quadrados Mdios Fcalc Ftab

    Tratamentos SQTrat a - 1 SQTrata1QMTratQMRes F;a1;a(n1)

    Resduo SQRes a(n-1) SQResa(n1)

    Total SQTotal an - 1

    em que as somas de quadrados, obtidas a partir da equao (3.1), so dadas por:

    SQTotal =

    aXi=1

    nXj=1

    y2ij C C =

    0@ aXi=1

    nXj=1

    yij

    1A2an

    SQTrat =1

    n

    aXi=1

    y2i C SQRes = SQTotal SQtrat

    Como no se rejeitou as hipteses de homogeneidade de varincias e de norma-

    lidade dos erros, j verificados anteriormente, pode-se aplicar a metodologia discutida aos

    dados apresentados na Tabela 2.1, cujas somas de quadrados so:

    SQTotal =aXi=1

    nXj=1

    y2ij y2an

    = 19; 582 + 21; 072 + : : :+ 24; 062 (619; 02)2

    4 6SQTotal = 664,4676

    SQTrat =aXi=1

    y2i:n y

    2an

    =1

    6

    135; 852 + 139; 752 + 206; 392 + 137; 032

    (619; 02)24 6

    SQTrat = 593,82

  • 38 Captulo 3. Delineamento Inteiramente Casualizado

    SQRes = SQTotal SQTRat= 664; 4676 593; 82

    SQRes = 70,65

    e substituindo-se esses resultados no quadro da anlise de varincia, dado na Tabela 3.1,

    obtm-se:

    Tabela 3.2 Anlise de varincia para os dados do Exemplo 2.

    Causa de Variao gl S.Q. Q.M. Fcalc Ftab Pr(> F)

    Tratamentos 3 593,8163167 197,9387722 56,03 3,098 6,4953602e-10

    Resduo 20 70,6513333 3,5325667

    Como Fcal > Ftab, rejeita-se H0, ou seja, pelo menos uma mdia de tratamento difere das

    demais.

    Para obter esses resultados da anlise de varincia, utilizando-se do R, basta di-

    gitar o comando:

    anava.av = aov(Quilos~Trat)

    anova(anava.av)

    qf(0.95,3,20) # Valor tabelado

    3.3 Testes de Comparaes Mltiplas

    Na anlise realizada, rejeitou-se a hiptese de que as mdias dos tratamentos (su-

    plementos) fossem iguais. Claro que, nessa situao, seria lgico perguntar quais as mdias

    que diferem entre si. Ser que a mdia de produo sem suplemento diferente da mdia da

    produo usando mandioca como suplemento? Ser que a mdia de produo com araruta

    diferente de batata doce? E assim por diante.

    Para responder a estas perguntas o pesquisador precisa de um mtodo que for-

    nea a diferena mnima significativa entre duas mdias. H diversos testes de comparaes

    mltiplas para calcular a diferena mnima significativa.

    De acordo com (Conagin et al., 2007), a aplicao dos testes, no caso de tratamen-

    tos qualitativos, pode ser realizada da seguinte forma:

    Contrastes ortogonais: teste t, teste F e teste de Scheff;

  • Testes de Comparaes Mltiplas 39

    Mdias duas a duas: teste de Tukey, teste de Duncan, teste de Bonferroni e teste de Newman-

    Keuls;

    Comparao entre o controle e as demais mdias: teste de Dunnett.

    Para os testes de comparaes de mdias duas a duas, pode-se citar, ainda, o

    teste de Scott-Knott.

    J para o estudo de tratamentos quantitativos, deve-se aplicar a anlise de re-

    gresso.

    3.3.1 Contrastes

    Muitos mtodos de comparaes mltiplas usam a ideia de contraste. Uma vez

    que a hiptese nula H0 : i = 0 foi rejeitada, sabe-se que algum tratamento produz uma

    produo de leite diferente dos outros. Mas qual deles causa tal diferena? Poderia-se pensar,

    inicialmente, que os suplementos 3 e 4 produzem a mesma quantidade de leite, implicando

    que poderia-se testar a hiptese:

    H0 : 3 = 4

    H1 : 3 6= 4

    Tal hiptese poderia ser testada utilizando-se uma combinao linear apropriada dos trata-

    mentos, tal como:

    y3 y4 = 0

    Se h suspeitas de que a mdia dos tratamentos 1 e 2 no diferem da mdia dos

    tratamentos 3 e 4, ento a hiptese nula poderia ser

    H0 : 1 + 2 = 3 + 4

    H1 : 1 + 2 6= 3 + 4

    que implica na combinao linear

    y1 + y2 y3 y4 = 0

    Em geral, a comparao das mdias de tratamentos de interesse implicar em

    uma combinao linear dos tratamentos, dada por:

    C =

    aXi=1

    ciyi

    com a restrioaXi=1

    ci = 0. Tais combinaes lineares so chamadas contrastes.

  • 40 Captulo 3. Delineamento Inteiramente Casualizado

    Exemplo: Em um experimento para a cura de mastite em bovinos, foram utilizados dois

    antibiticos em duas dosagens para cada um. A varivel resposta o tempo de cura, em dias.

    Tratamento Dose Droga Descrio

    1 Baixa A Dose baixa da droga A

    2 Alta A Dose alta da droga A

    3 Baixa B Dose baixa da droga B

    4 Alta B Dose alta da droga B

    Pode-se definir, entre outros, os seguintes contrastes:

    Y1 = (1 2) (3 4)

    Y2 = (1 2)

    Y3 = (3 4)

    A soma de quadrados para qualquer contraste :

    SQC =

    aXi=1

    ciyi

    !2

    n

    aXi=1

    c2i

    (3.4)

    e tem um grau de liberdade. Se o delineamento desbalanceado, ento a comparao das

    mdias de tratamento exige queaXi=1

    nici = 0 e a equao 3.4 resultar em:

    SQC =

    aXi=1

    ciyi

    !2aXi=1

    nic2i

    (3.5)

    Um contraste testado comparando-se sua soma de quadrados ao quadrado m-

    dio do resduo. A estatstica resultante ter uma distribuio F com N a graus de liberdade.

    3.3.2 Contrastes ortogonais

    Um caso especial muito importante do procedimento da subseo 3.3.1 aquele

    de contrastes ortogonais. Dois contrastes com coeficientes ci e di so ortogonais se

    aXi=1

    cidi = 0

  • Testes de Comparaes Mltiplas 41

    ou, para um delineamento desbalanceado, se

    aXi=1

    nicidi = 0

    A ortogonalidade indica que a variao de um contraste inteiramente indepen-

    dente da variao de outro qualquer que lhe seja ortogonal.

    Para a tratamentos o conjunto de a 1 contrastes ortogonais particiona a soma dequadrados devido a tratamentos para a 1 componentes independentes com um nico graude liberdade.

    H muitas maneiras de escolher os coeficientes dos contrastes ortogonais para

    um conjunto de tratamentos. Usualmente, algo na natureza do experimento dever sugerir

    quais comparaes sero de interesse.

    Considere o experimento discutido no exemplo 2.1. Os contrastes ortogonais apro-

    priados poderiam ser:

    TratamentosCoeficientes dos contrastes

    C1 C2 C3

    Sem Suplemento 3 0 0

    Mandioca 1 1 1

    Araruta 1 2 0

    Batata Doce 1 1 1

    Note que o contraste C1 compara o efeito mdio dos tratamentos com suplemento

    e sem suplemento. J no contraste C2 so comparados os efeitos mdios da Araruta com a

    Mandioca e Batata Doce. Por ltimo, compara-se o efeito mdio da Mandioca e da Batata

    Doce.

    Os coeficientes dos contrastes devem ser escolhidos antes de executar o experi-

    mento e examinar os dados. A razo para isto que, se comparaes so selecionadas aps

    examinar os dados, muitos pesquisadores construiriam testes que corresponderiam a grandes

    diferenas observadas na mdia.

    3.3.3 Teste t

    talvez o menos usado devido s suas exigncias e porque as mesmas compa-

    raes feitas com ele, podem ser feitas com o teste F , na prpria anlise de varincia, pois

    F = t2, quando se tem apenas 1 grau de liberdade. As exigncias do teste t, so:

  • 42 Captulo 3. Delineamento Inteiramente Casualizado

    a) Os contrastes devem ser estabelecidos antes do conhecimento dos resultados, isto , deve

    ser uma hiptese de pesquisa;

    b) Os contrastes devem ser ortogonais;

    c) o nmero de contrastes ortogonais deve ser, no mximo, igual ao nmero de graus de

    liberdade de tratamentos.

    A equao do teste dada por:

    tcalc =Y^i 0qV^ (Y^i)

    em que:

    Y^i a estimativa de um contraste;

    V^ (Y^i) a estimativa da varincia da estimativa de um contraste.

    Quando se aplica o teste t a um contraste, o interesse, em geral, verificar se a

    sua estimativa (Y^ ) difere significativamente de zero, valor que deveria assumir se a hiptese

    nula fosse verdadeira.

    Para verificar a significncia, ou no, do contraste, consulta-se a tabela t com n0 =

    nmero de graus de liberdade do resduo, a um nvel de probabilidade.

    Se tcalc ttab, rejeita-se H0, ou seja, admite-se que Yi 6= 0.Se tcalc < ttab, aceita-se H0.

    Exemplo: Considere os dados da Tabela 2.1 e que as hipteses de pesquisa foram elaboradas

    antes da realizao do experimento e so:

    Y1 = 31 (2 + 3 + 4)Y2 = 23 (2 + 4)Y3 = 2 4:

    Uma estimativa para qualquer desses contrastes obtida substituindo-se as mdias por suas

    estimativas, dadas por yi.

    Seja

    Y^1 = 3y1 (y2 + y3 + y4)

    a estimativa do contraste Y1, tomada emmdulo. Portanto a varincia do contraste, admitindo-

    se que as mdias dos tratamentos sejam independentes, dada por:

    V (Y^1) = 9V (y1) + V (y2) + V (y3) + V (y4)

  • Testes de Comparaes Mltiplas 43

    mas, V (yi) =2ini

    e, admitindo-se que os dados so balanceados, tem-se:

    V (Y^1) = 921n1

    +22n2

    +23n3

    +24n4

    Se a homogeneidade de varincias aceita, tem-se que 21 = 22 =

    23 =

    24 e, portanto, ^

    21 =

    ^22 = ^23 = ^

    24 = QMRes. Assim, como os dados so balanceados com 6 repeties, a estimativa

    da varincia da estimativa do contraste fica:

    V^ (Y^1) = 12 QMResn

    De forma geral, dado por:

    V^ (Y^i) =Xi

    a2iniQMRes:

    Como o QMRes = 3; 5325667 e h 6 repeties por tratamento, o teste t para o contraste Y1 fica:

    tcalc =Y^i 0qV^ (Y^i)

    =12; 6033333 0r12 3; 5325667

    6

    tcalc = 4; 741604

    o valor tabelado ttab = t20;0;05 = 1; 72. Logo, o contraste Y1 significativo. Fica ao leitor a

    tarefa de realizar os clculos para os demais contrastes.

    Os comandos para realizar os testes para todos os contrastes usando o R :

    > require(gregmisc)

    (C = rbind(" 3t1 vs (t2+t3+t4) " = c(3, -1, -1, -1),

    " 2t3 vs (t2 + t4) " = c(0, -1, 2, -1),

    " t2 vs t4 " = c(0, 1, 0, -1)))

    fit.contrast(anava.av, "Trat", C, conf=0.95 )

    qt(.95, 20)

    cujos resultados so:

    Contrasts Estimate Std. Error t value Pr(>|t|) lower CI upper CI

    Trat 3t1 vs (t2+t3+t4) -12.60 2.66 -4.74 0.00 -18.15 -7.06

    Trat 2t3 vs (t2 + t4) 22.67 1.88 12.06 0.00 18.75 26.59

    Trat t2 vs t4 0.45 1.09 0.42 0.68 -1.81 2.72

    Obs.: O nvel de significncia obtido por contraste. J o nvel de significncia conjunto

    dado por:

    0 = 1 (1 )k (3.6)

  • 44 Captulo 3. Delineamento Inteiramente Casualizado

    em que o nvel de significncia individual, geralmente 5% ou 1% e k o nmero de contrastes

    ortogonais.

    No exemplo apresentado, = 0; 05 e

    0 = 1 (1 0; 05)3 = 0; 1426:

    ou seja, para 3 contrastes ortogonais, tem-se 14; 26% de chance que ocorra uma diferena

    significativa por acaso (portanto, menos rigor nas concluses).

    Uma boa aproximao para 0

    0 = n

    que em nosso caso fica:

    0 = 3 0; 05 = 0; 15:

    3.3.4 Teste F

    Esse mesmo estudo dos contrastes ortogonais feito pelo teste t, pode ser feito de

    forma mais elegante na prpria anlise de varincia. Esse procedimento conhecido como

    desdobramento de graus de liberdade de tratamento ou partio da Soma de Quadrados de

    Tratamentos, sendo que a cada contraste estar associado 1 grau de liberdade. Assim, em

    nosso exemplo, utilizando a equao 3.4 tem-se:

    SQC =

    nXi=1

    ciyi

    !2

    naXi=1

    c2i

    SQY^1 =(3 135; 85 139; 75 206; 39 137; 03)2

    6 [32 + (1)2 + (1)2 + (1)2]SQY^1 = 79; 4220054

  • Testes de Comparaes Mltiplas 45

    SQY^2 =(2 206; 39 139; 75 137; 03)2

    6 [22 + (1)2 + (1)2]SQY^2 = 513; 7777778

    SQY^3 =(139; 75 137; 03)26 [(1)2 + (1)2]

    SQY^3 = 0; 616533

    Assim, o quadro da anlise de varincia, apresentado na Tabela 3.3 pode ser

    escrito da seguinte forma:

    Tabela 3.3 Anlise de varincia para os dados do Exemplo 2.

    Causa de Variao gl S.Q. Q.M. Fcalc Ftab Pr(> F)

    Y^1 1 79,4220054 79,4220054 22,48280419 4,351 0,0001

    Y^2 1 513,7777778 513,7777778 145,4404 4,351 1,245041e-10

    Y^3 1 0,61653333 0,61653333 0,1745 4,351 0,6806

    Tratamentos (3) (593,8163167) 197,9387722 56,03 3,098 6,4953602e-10

    Resduo 20 70,6513333 3,5325667

    Obs.: Note que nesse caso em que F tem 1 grau de liberdade, tem-se que F = t2. As concluses

    so as mesmas.

    Os comandos para realizar os desdobramentos usando o R :

    (contraste = rbind(c(3, -1, -1, -1),

    c(0, -1, 2, -1),

    c(0, 1, 0, -1)))

    contr.ginv = ginv(contraste)

    colnames(contr.ginv) = paste("Contraste", 1:3, sep = " ")

    contrasts(exe0$Trat) = contr.ginv

    mod1 = lm(Quilos ~ Trat, data = exe0)

    anova(mod1)

    summary(mod1)

    exe0co = data.frame(model.matrix(Quilos ~ Trat, exe0)[, -1])

    names(exe0co) = paste("Contraste", 1:3)

  • 46 Captulo 3. Delineamento Inteiramente Casualizado

    exe0co$resp = exe0$resp

    mod2 = lm(Quilos ~ ., data = exe0co)

    (av2 = anova(mod2))

    contrasts(exe0$Trat) = NULL

    3.3.5 Teste de Student-Newman-Keuls

    O teste de Newman foi aperfeioado por Keuls e est sendo apresentado nos livros

    de estatstica, como teste de Student-Newman-Keuls (SNK).

    O SNK derivado do teste de Tukey, sendo menos conservador (encontra mais

    diferenas). O teste de Tukey controla o erro para todas as comparaes, j o SNK controla

    apenas para as comparaes em considerao.

    O teste consiste no seguinte: suponha-se que o experimento investigue a tra-

    tamentos. Deve-se ordenar pela ordem crescente, por exemplo, as mdias obtidas; isto ,

    deve-se colocar y1 < y2 < < ya.Na sequncia, calcula-se a diferena entre as mdias. Se o valor obtido for maior

    que o determinado por snk:

    snk = qi

    rQMRes

    r

    a diferena ser significativa, e assim por diante.

    O valor de qi obtido da tabela de Tukey, para o nvel de significncia, corres-

    pondente a i distncias entre as mdias comparadas e n graus de liberdade do resduo.

    Se as mdias comparadas y1 e y2 apresentarem diferente nmero de repeties, a

    diferena mnima significativa ser dada por:

    snk = qi

    sQMRes

    2

    1

    r1+

    1

    r2

    Os comandos para realizar o teste de Student-Newman-Keuls usando o R :

    require(agricolae)

    teste.snk = SNK.test(anava.av, "Trat", main="")

    SNK.test(anava.av, "Trat", group=FALSE)

    bar.group(teste.snk, ylim=c(0,40), density=4, border="blue", las=1,

    main=Teste SNK, xlab=Tipos de Rao,

    ylab=Peso mdio das aves (kg))

    abline(h=0, col=black)

  • Testes de Comparaes Mltiplas 47

    3.3.6 Teste de Tukey

    Tukey (1953), props um procedimento de comparao mltipla que tambm

    baseado na estatstica da amplitude estudentizada. Para obter o valor da diferena mnima

    significativa (d.m.s.), basta calcular:

    = q

    rQMRes

    r(3.7)

    em que:

    ,! QMRes o quadrado mdio do resduo da anlise de varincia;

    ,! r o nmero de repeties dos tratamentos;

    ,! q a amplitude total estudentizada e seu valor tabelado em funo do nmero detratamento (a) e do nmero de graus de liberdade do resduo.

    Para o exemplo em questo, tem-se que: QMRes = 3; 5325667; q = q4;20 = 3; 958293 e

    r = 6.

    logo, substituindo-se os valores na Equao 3.7, a diferena mnima significativa ser, ao

    nvel de 5%:

    = 3; 96

    r3; 5325667

    6= 3; 04 kg:

    Construindo-se a tabela das mdias ordenadas em ordem decrescente, tem-se:

    Mdias (kg)

    Araruta (AR) 34,398 a

    Mandioca (MA) 23,29 b

    Batata Doce (BD) 22,84 b

    Sem Suplemento (SS) 22,64 b

    em que letras iguais indicam mdias semelhantes.

    Para obter o resultado do teste de Tukey usando o R, basta o seguinte comando:

    anava.tukey = TukeyHSD(anava.av, Trat, ord=T)

    anava.tukey

    plot(anava.tukey, las=1, main=NULL, col=blue)

    ou, usando o pacote agricolae:

  • 48 Captulo 3. Delineamento Inteiramente Casualizado

    teste.HSD = HSD.test(anava.av, Trat, main=Ganhos de Peso)

    bar.group(teste.HSD, ylim=c(0,40), density=10, border="blue",

    las=1, angle=45, col=red, main=Teste de Tukey,

    xlab=Tipos de Rao, ylab=Peso mdio das aves (kg))

    abline(h=0, col=black, lwd=1.9)

    Os valores das diferenas (diff ) entre as mdias de pares de tratamentos, sendo

    t1 = Sem Suplementao, t2 = Mandioca, t3 = Araruta e t4 = Batata Doce, so:

    Tukey multiple comparisons of means

    95% family-wise confidence level

    factor levels have been ordered

    Fit: aov(formula = Quilos ~ Trat)

    $Trat

    diff lwr upr p adj

    t4-t1 0.1966667 -2.786929 3.180262 0.9976951

    t2-t1 1.1900000 -1.793595 4.173595 0.6839503

    t3-t1 11.7566667 8.773071 14.740262 0.0000000

    t2-t4 0.9933333 -1.990262 3.976929 0.7882850

    t3-t4 11.5600000 8.576405 14.543595 0.0000000

    t3-t2 10.5666667 7.583071 13.550262 0.0000000

    Observe que os pares que apresentam diferenas significativas so aqueles cujos

    limites inferiores (lwr) e superiores (upr) tm o mesmo sinal. Portanto, conclu-se que o

    suplemento alimentar Araruta, melhora a produo significativamente, no havendo diferena

    entre as mdias dos demais tratamentos.

    Uma visualizao mais rpida das diferenas entre os pares de mdias obtida

    atravs da Figura 3.1:

  • Testes de Comparaes Mltiplas 49

    0 5 10 15

    t3t2

    t3t4

    t2t4

    t3t1

    t2t1

    t4t1

    95% familywise confidence level

    Differences in mean levels of Trat

    Figura 3.1 Diferenas nas mdias dos tratamentos

    O mtodo de Tukey exato quando todos os tratamentos tm o mesmo nmero

    de repeties. Caso as mdias confrontadas no possuam o mesmo nmero de repeties,

    aplica-se o teste de forma aproximada, da seguinte forma:

    0 = q

    r1

    2V^ (Y^ )

    V^ (Y^ ) =

    1

    ri+

    1

    rk

    QMres

    em que ri e rk indicam o nmero de repeties das mdias que esto sendo comparadas.