introdução à análise de dados...

Post on 27-Dec-2018

215 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Introdução à análise de dados agronômicos

Anderson R Silva

Programa de Pós-Graduação em Estatística e Experimentação AgronômicaESALQ/USP

29 e 30 de julho de 2013

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Dia 1 - Conteúdo

1 Softwares estatísticos

2 ANOVA e testes post-hoc

3 Correlação e Regressão

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Softwares

Alguns softwares recomendados:

• R (Livre) /www.r-project.org/

• SAS (SAS Institute Inc.) /www.sas.com/

• Statistica (StatSoft Inc.) /www.statsoft.com/

• Minitab (Minitab Inc.) /www.minitab.com/

• Action = Excel + R (Livre) /www.portalaction.com.br/

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Software R

Porque usar o R?

• Gratuito

• Linguagem de programação

• Grá�cos1 de alta qualidade em 2 e 3D

• Suporta grandes bancos de dados

• Grande quantidade de pacotes disponíveis (atual: 4689)

• Maior �exibilidade de análise

• Grande aceitação pela comunidade cientí�ca

1Para demonstrações grá�cas, digite os comandos

demo(graphics) e demo(persp)

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Pacotes do R

Alguns pacotes recomendados para análise de dados experimentais:

• ExpDes (Ferreira, et al. 2013)

• agricolae (Mendiburu, 2012)

Use o comando para saber como citar...

• o software R: citation()

• um pacote do R: citation(�nome do pacote�)

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Exemplo 1: fatorial

Descrição do experimento:

• Fator 1: 2 sistemas de irrigação

• Fator 2: 5 cultivares de milho

• 4 repetições

• Delineamento: blocos casualizados

• Respostas: altura das plantas (cm) e rendimento de grãos (kg/ha)

Os fatores 1 e 2 afetam signi�cativamente a altura de plantas? e o rendimento degrãos?Existe interação entre os fatores? Se sim, como ela ocorre?

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Exemplo 2: split plot

Descrição do experimento:

• Fator primário: 2 sistemas de irrigação

• Fator secundário: 3 cultivares de milho

• 4 repetições

• Delineamento: blocos casualizados

• Respostas: altura das plantas (cm) e rendimento de grãos (kg/ha)

Os fatores 1 e 2 afetam signi�cativamente a altura de plantas? e o rendimento degrãos?Existe interação entre os fatores? Se sim, como ela ocorre?

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Correlação

A correlação é uma medida do grau de associação linear entre duas variáveis X e Y .Na análise de correlação não há diferenciação da variáveis, isto é, ambas sãotratadas como dependentes ou resposta.Dados n pares de valores (xi , yi ), o coe�ciente de correlação de Pearson2 é dado por:

r =

∑ni=1 xiyi − nx y∑ni=1 x

2i − nx2

No R, use a função: cor(x, y).

2Esse coe�ciente é indicado para variáveis normais ou, no mínimo, contínuas.

Para variáveis discretas ou categóricas são indicadas as correlações não paramétricas de Spearman

ou de Kendall.

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Correlação

O valor da correlação amostral pode ser testado usando a estatística t-Student:

t =r√n − 2√1− r2

∼ t(n − 2)

cujas hipóteses associadas são:

H0 : ρ = 0

H1 : ρ 6= 0

No R, use a função: cor.test(x, y).

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Exemplo 3

Considere os dados de rotação do motor (em rpm) e consumo de combustível (emL) de um trator acoplado a algum implemento agrícola:

Rotação Consumo

1600 5.581700 7.711900 9.242000 9.732200 10.44

Pode-se a�rmar que a verdadeira correlação (ρ) entre essas variáveis é não nula?

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Correlação de dados experimentais

Ver script �cor_experimental.r�

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Correlação de dados experimentais

Sejam as variáveis resposta altura de plantas (cm) e rendimento de grãos (kg/ha),obtidas do experimento descrito no Exemplo 1.

• Qual é o valor da correlação de Pearson entre essas variáveis resposta?

• Esse valor é signi�cativo com α = 0, 05?

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Regressão linear simples

Aos dados do Exemplo 3, veri�que (via grá�co de dispersão) se é razoável ajustar omodelo de regressão linear simples:

Yi = β0 + β1Xi + εi

Interprete os valores das estimativas β0 e β1.

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Exemplo 4

Descrição do experimento:

• Tratamento: Doses de biofertilizante (0, 8.5, 17, 34, 68, 136 L)

• 4 repetições

• Delineamento: blocos casualizados

• Resposta: produção de feijão (kg/ha)

Ajustar um modelo de regressão para explicar a variação das médias de tratamentoem função da dose.

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Regressão linear múltipla

Modelo estatístico

Yi = β0 + β1X1i + β2X2i + ...+ βkXki + εi

Estimador de mínimos quadrados:

β = (X′X)−1X′Y

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Regressão linear múltipla

Teste t para os parâmetros

t =βj√

Var(βj)∼ tGLres

em que: Var(βj) = (X′X)−1jj QMres

Hipóteses

H0 : βj = 0

H1 : βj 6= 0

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Superfície de resposta

De forma geral, um modelo de superfície de resposta é um modelo de regressãolinear múltiplo.Seja Y a variável resposta e sejam duas variáveis explanatórias X1 e X2. O modelode superfície de resposta de primeira ordem é dado por:

Yi = β0 + β1X1i + β2X2i + εi

O modelo de segunda ordem é:

Yi = β0 + β1X1i + β2X2i + β3X21i + β4X

22i + β5X1iX2i + εi

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Exemplo 5

Descrição do experimento:

• Tratamentos (variáveis explanatórias): Doses de... biofertilizante, N, K, P e Ca.

• 4 repetições

• Delineamento: blocos casualizados

• Resposta: produção de feijão (kg/ha)

Ajustar um modelo de superfície de resposta com aquelas variáveis explanatóriasque afetam signi�cativamente a produção de feijão.

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Exemplo 6: regressão no fatorial do Exemplo 1

Descrição do experimento:

• Fator 1: 2 sistemas de irrigação

• Fator 2: 5 lâminas de irrigação

• 4 repetições

• Delineamento: blocos casualizados

• Respostas: altura das plantas (cm)

Os fatores 1 e 2 afetam signi�cativamente a altura de plantas?Existe interação entre os fatores? Se sim, como ela ocorre?

Introdução àanálise dedados

agronômicos

Anderson RSilva

Softwaresestatísticos

ANOVA etestespost-hoc

Correlação eRegressão

Exemplo 7: Regressão não-linear

Modelo estatísticoY = f (X , β) + ε

Condição de não linearidade

∂f (X , βj)

∂βj= f (βj)

Modelo para a tensão de préconsolidação do solo:

TP = 10β0+β1Umidade + ε

top related