aplicação - sisartorio.webnode.com · e fizermos, manualmente, o plantio de 100 sementes...

27
Por exemplo, se prepararmos uma área experimental com todo cuidado possível e fizermos, manualmente, o plantio de 100 sementes selecionadas de um milho híbrido, cuidando para que as sementes fiquem na mesma posição e profundidade e vamos medir as alturas das plantas, depois de 5 meses, que emergiram desse plantio. Aplicação 1

Upload: tranthuy

Post on 01-Dec-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Por exemplo, se prepararmos uma área experimental com todo cuidado possível

e fizermos, manualmente, o plantio de 100 sementes selecionadas de um milho

híbrido, cuidando para que as sementes fiquem na mesma posição e profundidade e

vamos medir as alturas das plantas, depois de 5 meses, que emergiram desse plantio.

Aplicação

1

Os dados abaixo são referentes à altura de 100 plantas de milho, como descritas

anteriormente.

158 194 215 163 212 219 218 174 178 213

213 210 218 169 214 175 190 232 201 200

201 211 199 187 167 201 182 217 195 154

197 209 219 188 192 158 206 183 213 158

178 202 174 196 198 167 216 214 167 203

159 205 168 202 191 178 157 156 169 233

176 198 192 217 206 187 159 198 218 222

189 186 195 223 216 221 185 189 229 199

259 177 217 195 225 219 231 169 207 183

289 185 203 215 193 201 177 166 204 195

Variação ao acaso

É toda variação devida a fatores não controláveis,

denominadas erro.

Iremos verificar que dificilmente teremos plantas de mesma altura. Essa variação

caracteriza o que chamamos de variação ao acaso, variação aleatória ou erro

2

m = 196,51 s = 23,29455

^

Para melhor entendimento do erro, temos que recorrer à noção de modelo

estatístico.

Para usarmos a informação da variação do acaso, há que se quantificá-la. Ora,

na estatística uma das medidas de dispersão e que portanto, quantifica a

variabilidade é a variância.

OBS: Na estatística experimental trabalhamos com estimativas (valor

que caracteriza a amostra, obtido por meio de algum estimador).

Temos outras estatísticas quantificadoras de variabilidade, mas todas usando a

variância:

Desvio padrão;

Variância da média;

Erro padrão da média;

Coeficiente de variação (CV);

Intervalo de confiança para a média;

além de outras.

3

O modelo matemático

Quando, em nosso experimento de plantio de milho, fizemos a medição das

alturas dos pés de milho essas observações podem ser representadas por um

modelo matemático:

ii emy , com i = 1, 2, ..., n.

onde

yi é a altura da planta i;

m é uma constante inerente a todas as n observações (geralmente é a média geral);

ei é o erro ou desvio da observação i em relação a média geral.

Exemplo:

Sejam os seguintes exemplos sobre altura de pés de milho em cm:

Amostra 1: 203; 208; 198; 200; 202; 192; 197

Amostra 2: 203; 198; 199; 200; 201; 202; 197

Logo, os desvio ei são:

Amostra 1: 3; 8; –2; 0; 2; –8; –3

Amostra 2: 3; –2; –1; 0; 1; 2; –3

A média m será: Amostra 1: 200

Amostra 2: 200

^

4

Assim, podemos calcular a variação do acaso:

22

1 67,25 cms

22

2 67,4 cms

O desvio padrão é a raiz quadrada da variância. Logo, em nossas amostras:

cmcmss 07,567,25 22

11

cmcms 16,267,4 2

2

Como maior variabilidade implica em maior

estimativa de variância, concluímos que a

variabilidade é maior na amostra 1.

A importância da estimativa da variância na estatística experimental é que ela

entra na análise de variância com o nome de Quadrado Médio (QM).

Então, numa análise de variância, o QM do resíduo (QMRes) é a variância (s2)

obtida para a variação de acaso.

5

A variância da média

A variância da média serve para nos informar sobre a precisão com que foi estimada

a média. É calculada pela expressão:

n

smV

2

)ˆ(ˆ

é a estimativa da variância da estimativa da média;

s2 é a estimativa da variância;

n é o número de observações.

)ˆ(ˆ mV

Exemplo:

Em nossas amostras, temos:

22

11 67,3

7

67,25)ˆ(ˆ cm

n

smV

22

22 67,0

7

67,4)ˆ(ˆ cm

n

smV

6

O erro padrão da média

É a raiz quadrada da variância da média:

n

sms )ˆ(

Exemplo:

Em nossas amostras, temos: cmcmms 91,167,37

67,25)ˆ( 2

1

cmcmms 82,067,0)ˆ( 22

Importante:

É usual, na estatística experimental apresentarem-se estimativas de

médias seguidas de seus erro padrão. Então:

na amostra 1, temos 200 1,91 cm,

e

na amostra 2, temos 200 0,82 cm 7

Delineamentos

8

Principais delineamentos:

Delineamento Inteiramente Casualizado (DIC)

Delineamento Casualizado em Blocos (DBC)

Delineamento em Quadrado Latino (DQL)

Os delineamentos podem ser:

Balanceados: mesmo número de parcelas para cada tratamento.

Não balanceados: número diferente de parcelas para cada tratamento.

9

Os Delineamentos Experimentais são as formas de distribuição dos

tratamentos na área experimental, com isso critérios científicos e estatísticos

são definidos, com o objetivo de determinar a influência de diversas variáveis

nos resultados de um dado sistema ou processo.

Delineamento Inteiramente

Casualizado

Prof.a Dr.a Simone Daniela Sartorio de Medeiros

DTAiSeR-Ar

10

Delineamento Inteiramente Casualizado (DIC)

O DIC é o delineamento mais simples.

Os outros delineamentos experimentais, por exemplo: blocos

casualizados e quadrado latino, se originam do DIC pelo uso de restrição na

casualização.

No DIC a distribuição dos tratamentos às unidades experimentais é feita

inteiramente ao acaso.

O DIC utiliza apenas os princípios básicos da repetição e da casualização.

Como não faz restrições na casualização, o uso do DIC pressupõe que as

unidades experimentais estão sob condições homogêneas (tanto a área

como o material experimental).

Exemplo: Estas condições homogêneas geralmente são obtidas em locais

com ambientes controlados tais como laboratórios, estufas e casas de

vegetação. 11

Croqui (DIC)

T4 T3 T1 T4 T1

T1 T2 T4 T2 T2

T2 T3 T1 T3 T4

T3 T4 T2 T1 T3

Parcela 1 Parcela 2 Parcela 3 Parcela 4 Parcela 5

Parcela 6 Parcela 7 Parcela 8 Parcela 9 Parcela 10

Parcela 11 Parcela 12 Parcela 13 Parcela 14 Parcela 15

Parcela 16 Parcela 17 Parcela 18 Parcela 19 Parcela 20

7) Realize o sorteio dos tratamentos:

T4, T3, T1, T4, T1, T1, T2, T4, T2, T2, T2, T3, T1, T3, T4, T3, T4, T2, T1, T3.

1) 1 fator: 4 níveis (T1, T2, T3 e T4)

2) Número de repetições: 5

3) Total de parcelas: 20

5) Área para a aplicação dos tratamentos: totalmente homogênea DIC

6) Numere as parcelas:

8) Croqui do experimento:

Croqui: É um desenho da área

experimental com os tratamentos

já distribuídos.

yij

12

Tratamentos

Repetições 1 2 ... I

1 y11 y21 ... yi1

2 y12 y22 ... yi2

... ... ... ... ...

J y1j y2j ... yij

Totais T1 T2 ... TI

Quadro dos dados (DIC)

Considere um experimento instalado no DIC com I tratamentos e J repetições.

A coleta de dados da pesquisa pode ser resumida, num quadro do tipo a seguir:

n.o de unidades experimentais:

Total geral:

Total para o tratamento i:

Média para o tratamento i:

Média geral do experimento:

JIn

yTyGI

i

i

I

i

J

j

ij

11 1

i

J

j

iji yyT1

J

Tm i

i ˆ

IJ

Gm ˆ

13

em que,

yij é o valor observado para a variável resposta obtido para o

i-ésimo tratamento em sua j-ésima repetição;

m média de todos os valores possíveis da variável resposta;

ti é o efeito do i-ésimo tratamento

eij é o erro experimental associado ao valor observado yij

mmt ii

Modelo estatístico (DIC)

Existe um modelo estatístico específico para cada tipo de delineamento.

O modelo estatístico identifica quais são as fontes de variação dos valores de uma

variável resposta em estudo. Para os dados oriundos de um experimento instalado

segundo o DIC, o seguinte modelo estatístico deve ser utilizado nas análises estatísticas:

ijiij etmy

iijij mye

O erro experimental ocorre

em todos os experimentos,

porque não é possível

controlar o efeito de fontes

de variações que ocorrem

de forma aleatória e

desconhecida.

Este erro é o responsável

pela variação observada

entre as observações obtidas

nas repetições para cada

tratamento.

14

15

Natureza do modelo estatístico

Há três possíveis modelos estatísticos, quanto à natureza dos efeitos:

a) Modelo de efeitos Fixos: todos os efeitos, exceto o erro experimental, são fixos.

b) Modelo de efeitos Aleatórios: todos os efeitos são aleatórios, exceto a média.

c) Modelo de efeitos Mistos: temos efeitos aleatórios e efeitos fixos.

OBS: O erro é sempre aleatório e a média é fixa.

Efeito fixo lida com conjuntos fixos de

elementos (locais, anos, cultivares) que

não constituem amostras aleatórias das

correspondentes populações.

As conclusões são válidas tão somente

para os conjuntos estudados e, portanto,

não podem ser extrapoladas para

populações

Um efeito será aleatório se a

entidade teste constituir uma amostra

(n) aleatória tomada de uma

população (N).

As inferências obtidas com as

amostras são válidas para a população

e podem ser extrapoladas para ela.

As hipóteses a serem testadas - DIC

As hipóteses para o teste F da análise de variância ao nível α de significância para

tratamentos são as seguintes:

H0: m1 = m2 = ... = mI = 0 (o que equivale a dizer que todos os possíveis contrastes entre as médias dos

tratamentos, são estatisticamente nulos).

Ha: ! mu ≠ mk, u ≠ k, u, k = 1, 2, ..., I

(o que equivale a dizer que existe pelo menos um contraste entre as médias dos

tratamentos, estatisticamente diferentes de zero).

16

Análise de Variância (ANalysis Of Variance - ANOVA)

17

18

VAR. TOTAL = VAR. CONTROLADA + VAR (NÃO CONTROLADA + NÃO CONTROLÁVEIS)

A Análise de variância consiste em decompor a variação total das

observações do experimento em partes que podem ser atribuídas a causas

controladas (conhecidas) e em partes a causas não controladas e/ou não

controláveis (desconhecidas), o erro ou resíduo.

Análise de Variância (ANOVA)

O erro ou resíduo pode ocorrer em função do material que se está

trabalhando ou em função do ambiente em que o experimento é

conduzido. Outra fonte de erro pode ser a maneira como o experimento

é conduzido pelo experimentador.

Análise de Variância (ANOVA)

1) Os efeitos do modelo estatístico devem ser aditivos;

2) Os erros experimentais devem ser independentes;

3) Os erros experimentais devem ser normalmente distribuídos;

4) Os erros experimentais tem variâncias iguais.

5) Não exista “outliers” (dados discrepantes).

19

No entanto, para que esta técnica seja empregada é necessário que sejam

satisfeitas as seguintes pressuposições:

Obtendo o quadro da

ANOVA para a análise

O quadro da ANOVA é um algoritmo para a realização de um teste de

hipóteses sobre os efeitos dos tratamentos constantes em um

experimento.

20

Partindo do modelo estatístico, pode-se decompor a variação entre os valores

observados nas diferentes causas de variabilidade.

Demonstração: Considere o modelo estatístico para um experimento instalado segundo o DIC, onde

todos os tratamentos possuem o mesmo número de repetições J:

ijiij etmy mmt ii iijij mye

)()( iijiij mymmmy

)ˆ()ˆˆ(ˆiijiij mymmmy

22 )ˆ()ˆˆ()ˆ( iijiij mymmmy

I

i

J

j

iiji

I

i

J

j

ij mymmmy1 1

2

1 1

2 )ˆ()ˆˆ()ˆ(

I

i

J

j

I

i

J

j

iij

I

i

J

j

i

I

i

J

j

ij produtosduplosmymmmy1 11 1

2

1 1

2

1 1

2 )ˆ()ˆˆ()ˆ(

||

0 SQTotal SQTrat SQRes 21

SQTotal = SQTrat + SQRes

Logo, uma forma mais simplificada a igualdade anterior temos:

Por meio das fórmulas obtidas anteriormente, pode-se obter os valores para as

respectivas somas de quadrados (SQ). No entanto, essas fórmulas demandam muitos

cálculos. Fórmulas de mais fácil aplicação podem ser obtidas, sendo estas:

CymySQTotalI

i

J

j

ij

I

i

J

j

ij 1 1

2

1 1

2)ˆ(

IJ

G

IJ

y

C

I

i

J

j

ij 2

2

1 1

CJ

TmmSQTrat

I

i

iI

i

J

j

i 1

2

1 1

2)ˆˆ(

n

y

r

TSQTrat

I

i

J

j

ijI

i i

i

2

1 1

1

2

A SQRes é obtida por diferença: SQRes = SQTotal – SQTrat

em que,

n é o n.o de unidades experimentais:

ri é n.o de unidades experimentais do tratamento i.

I

i

irn1

Se o número de repetições varia de acordo com o tratamento:

, sendo

22

O quadro da ANOVA - DIC

Fonte de

Variação

(FV)

graus de

liberdade

(gl)

Soma de

Quadrados

(SQ)

Quadrado

Médio

(QM) Fcalc Ftab

Tratamento I – 1 SQTrat

F[(I – 1); I(J – 1)]

Resíduo I(J – 1) SQRes

- -

Total IJ – 1 SQTotal - - -

1

I

SQTratQMTrat

)1(

ReRe

JI

sSQsQM

sQM

QMTrat

Re

O quadro da ANOVA para a análise de um experimento instalado segundo

o DIC, com igual número de repetições para todos os tratamentos é do

seguinte tipo:

23

As hipóteses da ANOVA - DIC

As hipóteses para o teste F da análise de variância ao nível α de significância para

tratamentos são as seguintes:

H0: m1 = m2 = ... = mI (o que equivale a dizer que todos os possíveis contrastes entre as médias dos

tratamentos, são estatisticamente nulos).

Ha: ! mu ≠ mk, u ≠ k, u,k = 1, 2,..., I

(o que equivale a dizer que existe pelo menos um contraste entre as médias dos

tratamentos, estatisticamente diferentes de zero).

A regra de decisão para o teste F será:

Se o valor do Fcalc ≥ Ftab, então rejeita-se H0 e conclui-se que a média dos tratamentos

tem efeito diferenciado ao nível de significância em que foi realizado o teste;

Se o valor de Fcalc < Ftab, então aceita-se H0 e conclui-se que as médias dos

tratamentos têm efeitos iguais ao nível de significância em que foi realizado o teste.

24

Exemplo:

Para comparar a produtividade de quatro variedades de milho (kg/m2), um

agrônomo tomou 20 parcelas similares e distribuiu, inteiramente ao acaso, cada

uma das 4 variedades (A, B, C, D) em 5 parcelas experimentais. A partir dos

dados experimentais fornecidos abaixo, é possível concluir que existe diferença

significativa entre as variedades com relação a produtividade, utilizando o nível

de significância de 5%?

Variedade

Repetições A B C D

1 25 31 22 33

2 26 25 26 29

3 20 28 28 31

4 23 27 25 34

5 21 24 29 28

Totais 115 135 130 155 535

G T4 T3 T2 T1

Variável resposta (Y): produção de milho (kg/m2)

Fator: variedades de milho

Tratamento: A, B, C, D

Repetição: J = 5

Delineamento: DIC

Objetivo: Estudar se há diferença entre as 4

variedades de milho segundo a sua produção.

25

26

TRAT REPET PRODUCAO

A 1 25

A 2 26

A 3 20

A 4 23

A 5 21

B 1 31

B 2 25

B 3 28

B 4 27

B 5 24

C 1 22

C 2 26

C 3 28

C 4 25

C 5 29

D 1 33

D 2 29

D 3 31

D 4 34

D 5 28

Tabulação:

Os dados:

Variedade

Repetições A B C D

1 25 31 22 33

2 26 25 26 29

3 20 28 28 31

4 23 27 25 34

5 21 24 29 28

Vantagens do DIC Desvantagens do DIC

Em relação aos outros:

a) É bastante flexível, pois o número

de tratamentos e de repetições

depende apenas do número de

parcelas disponíveis.

b) A análise estatística é simples,

mesmo quando o número de

repetições por nível de tratamento é

variável.

c) É o delineamento experimental

que apresenta o maior valor para o

número de graus de liberdade

associado ao resíduo.

a) Exige homogeneidade total das

condições experimentais, tanto

do material como do ambiente.

OBS: Não é fácil conseguir e manter

total homogeneidade das condições

durante a toda a realização do

experimento;

b) Todas as variações exceto a devida

a tratamentos, são consideradas

como sendo variações que ocorrem

ao acaso. Isto pode acarretar em uma

estimativa muito alta para o erro

experimental.

27