aplicação - sisartorio.webnode.com · e fizermos, manualmente, o plantio de 100 sementes...
TRANSCRIPT
Por exemplo, se prepararmos uma área experimental com todo cuidado possível
e fizermos, manualmente, o plantio de 100 sementes selecionadas de um milho
híbrido, cuidando para que as sementes fiquem na mesma posição e profundidade e
vamos medir as alturas das plantas, depois de 5 meses, que emergiram desse plantio.
Aplicação
1
Os dados abaixo são referentes à altura de 100 plantas de milho, como descritas
anteriormente.
158 194 215 163 212 219 218 174 178 213
213 210 218 169 214 175 190 232 201 200
201 211 199 187 167 201 182 217 195 154
197 209 219 188 192 158 206 183 213 158
178 202 174 196 198 167 216 214 167 203
159 205 168 202 191 178 157 156 169 233
176 198 192 217 206 187 159 198 218 222
189 186 195 223 216 221 185 189 229 199
259 177 217 195 225 219 231 169 207 183
289 185 203 215 193 201 177 166 204 195
Variação ao acaso
É toda variação devida a fatores não controláveis,
denominadas erro.
Iremos verificar que dificilmente teremos plantas de mesma altura. Essa variação
caracteriza o que chamamos de variação ao acaso, variação aleatória ou erro
2
m = 196,51 s = 23,29455
^
Para melhor entendimento do erro, temos que recorrer à noção de modelo
estatístico.
Para usarmos a informação da variação do acaso, há que se quantificá-la. Ora,
na estatística uma das medidas de dispersão e que portanto, quantifica a
variabilidade é a variância.
OBS: Na estatística experimental trabalhamos com estimativas (valor
que caracteriza a amostra, obtido por meio de algum estimador).
Temos outras estatísticas quantificadoras de variabilidade, mas todas usando a
variância:
Desvio padrão;
Variância da média;
Erro padrão da média;
Coeficiente de variação (CV);
Intervalo de confiança para a média;
além de outras.
3
O modelo matemático
Quando, em nosso experimento de plantio de milho, fizemos a medição das
alturas dos pés de milho essas observações podem ser representadas por um
modelo matemático:
ii emy , com i = 1, 2, ..., n.
onde
yi é a altura da planta i;
m é uma constante inerente a todas as n observações (geralmente é a média geral);
ei é o erro ou desvio da observação i em relação a média geral.
Exemplo:
Sejam os seguintes exemplos sobre altura de pés de milho em cm:
Amostra 1: 203; 208; 198; 200; 202; 192; 197
Amostra 2: 203; 198; 199; 200; 201; 202; 197
Logo, os desvio ei são:
Amostra 1: 3; 8; –2; 0; 2; –8; –3
Amostra 2: 3; –2; –1; 0; 1; 2; –3
A média m será: Amostra 1: 200
Amostra 2: 200
^
4
Assim, podemos calcular a variação do acaso:
22
1 67,25 cms
22
2 67,4 cms
O desvio padrão é a raiz quadrada da variância. Logo, em nossas amostras:
cmcmss 07,567,25 22
11
cmcms 16,267,4 2
2
Como maior variabilidade implica em maior
estimativa de variância, concluímos que a
variabilidade é maior na amostra 1.
A importância da estimativa da variância na estatística experimental é que ela
entra na análise de variância com o nome de Quadrado Médio (QM).
Então, numa análise de variância, o QM do resíduo (QMRes) é a variância (s2)
obtida para a variação de acaso.
5
A variância da média
A variância da média serve para nos informar sobre a precisão com que foi estimada
a média. É calculada pela expressão:
n
smV
2
)ˆ(ˆ
é a estimativa da variância da estimativa da média;
s2 é a estimativa da variância;
n é o número de observações.
)ˆ(ˆ mV
Exemplo:
Em nossas amostras, temos:
22
11 67,3
7
67,25)ˆ(ˆ cm
n
smV
22
22 67,0
7
67,4)ˆ(ˆ cm
n
smV
6
O erro padrão da média
É a raiz quadrada da variância da média:
n
sms )ˆ(
Exemplo:
Em nossas amostras, temos: cmcmms 91,167,37
67,25)ˆ( 2
1
cmcmms 82,067,0)ˆ( 22
Importante:
É usual, na estatística experimental apresentarem-se estimativas de
médias seguidas de seus erro padrão. Então:
na amostra 1, temos 200 1,91 cm,
e
na amostra 2, temos 200 0,82 cm 7
Principais delineamentos:
Delineamento Inteiramente Casualizado (DIC)
Delineamento Casualizado em Blocos (DBC)
Delineamento em Quadrado Latino (DQL)
Os delineamentos podem ser:
Balanceados: mesmo número de parcelas para cada tratamento.
Não balanceados: número diferente de parcelas para cada tratamento.
9
Os Delineamentos Experimentais são as formas de distribuição dos
tratamentos na área experimental, com isso critérios científicos e estatísticos
são definidos, com o objetivo de determinar a influência de diversas variáveis
nos resultados de um dado sistema ou processo.
Delineamento Inteiramente Casualizado (DIC)
O DIC é o delineamento mais simples.
Os outros delineamentos experimentais, por exemplo: blocos
casualizados e quadrado latino, se originam do DIC pelo uso de restrição na
casualização.
No DIC a distribuição dos tratamentos às unidades experimentais é feita
inteiramente ao acaso.
O DIC utiliza apenas os princípios básicos da repetição e da casualização.
Como não faz restrições na casualização, o uso do DIC pressupõe que as
unidades experimentais estão sob condições homogêneas (tanto a área
como o material experimental).
Exemplo: Estas condições homogêneas geralmente são obtidas em locais
com ambientes controlados tais como laboratórios, estufas e casas de
vegetação. 11
Croqui (DIC)
T4 T3 T1 T4 T1
T1 T2 T4 T2 T2
T2 T3 T1 T3 T4
T3 T4 T2 T1 T3
Parcela 1 Parcela 2 Parcela 3 Parcela 4 Parcela 5
Parcela 6 Parcela 7 Parcela 8 Parcela 9 Parcela 10
Parcela 11 Parcela 12 Parcela 13 Parcela 14 Parcela 15
Parcela 16 Parcela 17 Parcela 18 Parcela 19 Parcela 20
7) Realize o sorteio dos tratamentos:
T4, T3, T1, T4, T1, T1, T2, T4, T2, T2, T2, T3, T1, T3, T4, T3, T4, T2, T1, T3.
1) 1 fator: 4 níveis (T1, T2, T3 e T4)
2) Número de repetições: 5
3) Total de parcelas: 20
5) Área para a aplicação dos tratamentos: totalmente homogênea DIC
6) Numere as parcelas:
8) Croqui do experimento:
Croqui: É um desenho da área
experimental com os tratamentos
já distribuídos.
yij
12
Tratamentos
Repetições 1 2 ... I
1 y11 y21 ... yi1
2 y12 y22 ... yi2
... ... ... ... ...
J y1j y2j ... yij
Totais T1 T2 ... TI
Quadro dos dados (DIC)
Considere um experimento instalado no DIC com I tratamentos e J repetições.
A coleta de dados da pesquisa pode ser resumida, num quadro do tipo a seguir:
n.o de unidades experimentais:
Total geral:
Total para o tratamento i:
Média para o tratamento i:
Média geral do experimento:
JIn
yTyGI
i
i
I
i
J
j
ij
11 1
i
J
j
iji yyT1
J
Tm i
i ˆ
IJ
Gm ˆ
13
em que,
yij é o valor observado para a variável resposta obtido para o
i-ésimo tratamento em sua j-ésima repetição;
m média de todos os valores possíveis da variável resposta;
ti é o efeito do i-ésimo tratamento
eij é o erro experimental associado ao valor observado yij
mmt ii
Modelo estatístico (DIC)
Existe um modelo estatístico específico para cada tipo de delineamento.
O modelo estatístico identifica quais são as fontes de variação dos valores de uma
variável resposta em estudo. Para os dados oriundos de um experimento instalado
segundo o DIC, o seguinte modelo estatístico deve ser utilizado nas análises estatísticas:
ijiij etmy
iijij mye
O erro experimental ocorre
em todos os experimentos,
porque não é possível
controlar o efeito de fontes
de variações que ocorrem
de forma aleatória e
desconhecida.
Este erro é o responsável
pela variação observada
entre as observações obtidas
nas repetições para cada
tratamento.
14
15
Natureza do modelo estatístico
Há três possíveis modelos estatísticos, quanto à natureza dos efeitos:
a) Modelo de efeitos Fixos: todos os efeitos, exceto o erro experimental, são fixos.
b) Modelo de efeitos Aleatórios: todos os efeitos são aleatórios, exceto a média.
c) Modelo de efeitos Mistos: temos efeitos aleatórios e efeitos fixos.
OBS: O erro é sempre aleatório e a média é fixa.
Efeito fixo lida com conjuntos fixos de
elementos (locais, anos, cultivares) que
não constituem amostras aleatórias das
correspondentes populações.
As conclusões são válidas tão somente
para os conjuntos estudados e, portanto,
não podem ser extrapoladas para
populações
Um efeito será aleatório se a
entidade teste constituir uma amostra
(n) aleatória tomada de uma
população (N).
As inferências obtidas com as
amostras são válidas para a população
e podem ser extrapoladas para ela.
As hipóteses a serem testadas - DIC
As hipóteses para o teste F da análise de variância ao nível α de significância para
tratamentos são as seguintes:
H0: m1 = m2 = ... = mI = 0 (o que equivale a dizer que todos os possíveis contrastes entre as médias dos
tratamentos, são estatisticamente nulos).
Ha: ! mu ≠ mk, u ≠ k, u, k = 1, 2, ..., I
(o que equivale a dizer que existe pelo menos um contraste entre as médias dos
tratamentos, estatisticamente diferentes de zero).
16
18
VAR. TOTAL = VAR. CONTROLADA + VAR (NÃO CONTROLADA + NÃO CONTROLÁVEIS)
A Análise de variância consiste em decompor a variação total das
observações do experimento em partes que podem ser atribuídas a causas
controladas (conhecidas) e em partes a causas não controladas e/ou não
controláveis (desconhecidas), o erro ou resíduo.
Análise de Variância (ANOVA)
O erro ou resíduo pode ocorrer em função do material que se está
trabalhando ou em função do ambiente em que o experimento é
conduzido. Outra fonte de erro pode ser a maneira como o experimento
é conduzido pelo experimentador.
Análise de Variância (ANOVA)
1) Os efeitos do modelo estatístico devem ser aditivos;
2) Os erros experimentais devem ser independentes;
3) Os erros experimentais devem ser normalmente distribuídos;
4) Os erros experimentais tem variâncias iguais.
5) Não exista “outliers” (dados discrepantes).
19
No entanto, para que esta técnica seja empregada é necessário que sejam
satisfeitas as seguintes pressuposições:
Obtendo o quadro da
ANOVA para a análise
O quadro da ANOVA é um algoritmo para a realização de um teste de
hipóteses sobre os efeitos dos tratamentos constantes em um
experimento.
20
Partindo do modelo estatístico, pode-se decompor a variação entre os valores
observados nas diferentes causas de variabilidade.
Demonstração: Considere o modelo estatístico para um experimento instalado segundo o DIC, onde
todos os tratamentos possuem o mesmo número de repetições J:
ijiij etmy mmt ii iijij mye
)()( iijiij mymmmy
)ˆ()ˆˆ(ˆiijiij mymmmy
22 )ˆ()ˆˆ()ˆ( iijiij mymmmy
I
i
J
j
iiji
I
i
J
j
ij mymmmy1 1
2
1 1
2 )ˆ()ˆˆ()ˆ(
I
i
J
j
I
i
J
j
iij
I
i
J
j
i
I
i
J
j
ij produtosduplosmymmmy1 11 1
2
1 1
2
1 1
2 )ˆ()ˆˆ()ˆ(
||
0 SQTotal SQTrat SQRes 21
SQTotal = SQTrat + SQRes
Logo, uma forma mais simplificada a igualdade anterior temos:
Por meio das fórmulas obtidas anteriormente, pode-se obter os valores para as
respectivas somas de quadrados (SQ). No entanto, essas fórmulas demandam muitos
cálculos. Fórmulas de mais fácil aplicação podem ser obtidas, sendo estas:
CymySQTotalI
i
J
j
ij
I
i
J
j
ij 1 1
2
1 1
2)ˆ(
IJ
G
IJ
y
C
I
i
J
j
ij 2
2
1 1
CJ
TmmSQTrat
I
i
iI
i
J
j
i 1
2
1 1
2)ˆˆ(
n
y
r
TSQTrat
I
i
J
j
ijI
i i
i
2
1 1
1
2
A SQRes é obtida por diferença: SQRes = SQTotal – SQTrat
em que,
n é o n.o de unidades experimentais:
ri é n.o de unidades experimentais do tratamento i.
I
i
irn1
Se o número de repetições varia de acordo com o tratamento:
, sendo
22
O quadro da ANOVA - DIC
Fonte de
Variação
(FV)
graus de
liberdade
(gl)
Soma de
Quadrados
(SQ)
Quadrado
Médio
(QM) Fcalc Ftab
Tratamento I – 1 SQTrat
F[(I – 1); I(J – 1)]
Resíduo I(J – 1) SQRes
- -
Total IJ – 1 SQTotal - - -
1
I
SQTratQMTrat
)1(
ReRe
JI
sSQsQM
sQM
QMTrat
Re
O quadro da ANOVA para a análise de um experimento instalado segundo
o DIC, com igual número de repetições para todos os tratamentos é do
seguinte tipo:
23
As hipóteses da ANOVA - DIC
As hipóteses para o teste F da análise de variância ao nível α de significância para
tratamentos são as seguintes:
H0: m1 = m2 = ... = mI (o que equivale a dizer que todos os possíveis contrastes entre as médias dos
tratamentos, são estatisticamente nulos).
Ha: ! mu ≠ mk, u ≠ k, u,k = 1, 2,..., I
(o que equivale a dizer que existe pelo menos um contraste entre as médias dos
tratamentos, estatisticamente diferentes de zero).
A regra de decisão para o teste F será:
Se o valor do Fcalc ≥ Ftab, então rejeita-se H0 e conclui-se que a média dos tratamentos
tem efeito diferenciado ao nível de significância em que foi realizado o teste;
Se o valor de Fcalc < Ftab, então aceita-se H0 e conclui-se que as médias dos
tratamentos têm efeitos iguais ao nível de significância em que foi realizado o teste.
24
Exemplo:
Para comparar a produtividade de quatro variedades de milho (kg/m2), um
agrônomo tomou 20 parcelas similares e distribuiu, inteiramente ao acaso, cada
uma das 4 variedades (A, B, C, D) em 5 parcelas experimentais. A partir dos
dados experimentais fornecidos abaixo, é possível concluir que existe diferença
significativa entre as variedades com relação a produtividade, utilizando o nível
de significância de 5%?
Variedade
Repetições A B C D
1 25 31 22 33
2 26 25 26 29
3 20 28 28 31
4 23 27 25 34
5 21 24 29 28
Totais 115 135 130 155 535
G T4 T3 T2 T1
Variável resposta (Y): produção de milho (kg/m2)
Fator: variedades de milho
Tratamento: A, B, C, D
Repetição: J = 5
Delineamento: DIC
Objetivo: Estudar se há diferença entre as 4
variedades de milho segundo a sua produção.
25
26
TRAT REPET PRODUCAO
A 1 25
A 2 26
A 3 20
A 4 23
A 5 21
B 1 31
B 2 25
B 3 28
B 4 27
B 5 24
C 1 22
C 2 26
C 3 28
C 4 25
C 5 29
D 1 33
D 2 29
D 3 31
D 4 34
D 5 28
Tabulação:
Os dados:
Variedade
Repetições A B C D
1 25 31 22 33
2 26 25 26 29
3 20 28 28 31
4 23 27 25 34
5 21 24 29 28
Vantagens do DIC Desvantagens do DIC
Em relação aos outros:
a) É bastante flexível, pois o número
de tratamentos e de repetições
depende apenas do número de
parcelas disponíveis.
b) A análise estatística é simples,
mesmo quando o número de
repetições por nível de tratamento é
variável.
c) É o delineamento experimental
que apresenta o maior valor para o
número de graus de liberdade
associado ao resíduo.
a) Exige homogeneidade total das
condições experimentais, tanto
do material como do ambiente.
OBS: Não é fácil conseguir e manter
total homogeneidade das condições
durante a toda a realização do
experimento;
b) Todas as variações exceto a devida
a tratamentos, são consideradas
como sendo variações que ocorrem
ao acaso. Isto pode acarretar em uma
estimativa muito alta para o erro
experimental.
27