mario de andrade lira junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - reservados todos...

29
Mario de Andrade Lira Junior lira.pro.br\wordpress 03/07/22 lira.pro.br\wordpress - Reservados todos os direitos autorais.

Upload: internet

Post on 22-Apr-2015

104 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Mario de Andrade Lira Juniorlira.pro.br\wordpress

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 2: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Diferença◦ Regressão - equação ligando duas ou mais

variáveis◦ Correlação – medida do grau de ligação entre

duas variáveis Usos

◦ Regressão – estimar valores intermediários aos realmente estudados durante o experimento

◦ Correlação – indicar variáveis com comportamento semelhante

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 3: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

É importante diferenciar entre testes de “significância” e “importância”

Em modelos de regressão avaliar a importância científica costuma ser mais importante do que a significância

Em modelos lineares a importância é principalmente definida por:◦ Proporção da variância atribuída ao modelo◦ O tamanho de um ou mais coeficientes de

correlação◦ Intervalos de confiança de interesse

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 4: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Linear

Polinomial

Múltiplo

Modelos não-lineares◦Exponencial◦Logarítimico

ij i iY X

21 2

nij i i n i iY X X X

1 2ij i i iY X Z

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 5: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

A linear raramente representa bem toda uma série de dados◦ No entanto, costuma representar bem faixas de

valores Regressões polinomiais não têm

interpretação biológica válida para os parâmetros◦ Mas são úteis como simplificação de situação real◦ Polinomiais cúbicas ou mais complexas raramente

são boas descritoras de fatos biológicos

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 6: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Y – variável dependente a – y para x =0 b – quanto y varia para cada x r – coeficiente de correlação

◦ Varia de -1 a 1◦ Quanto da variação de y é explicada por x

r2 – coeficiente de determinação◦ Quanto de y é explicado pela regressão◦ Varia de 0 a 1

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 7: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Quadrados

Triângulos

Losangos

Page 8: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Variável independente medida sem erro

O valor esperado de Y é descrito pela função linear de X

Para cada Xi os Y´s têm resíduos◦Independentes◦Normalmente distribuídos com média zero

◦Homocedástico – variância aproximadamente constante

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 9: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Médias - variável independente Acaso

Valores ajustados e resíduos Valor ajustado - obtido pela

equação estimativa da população Resíduo- diferença entre ajustado e

real Comparação entre resíduo e

variável independente é útil para visualizar ajuste do modelo

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 10: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Mede o grau de relação linear entre variáveis

Interpretação Testes de significância

◦Análise de variância da regressão completa

◦No computador, cada componente é testado pelo teste de t

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 11: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Model: MODEL1 - Dependent Variable: _800125888 Analysis of Variance

Sum of MeanSource DF Squares Square F Value Pr > FModel 1 58120 58120 53,45 <,0001Error 18 19572 1087,32861 Corrected Total 19 77692 Root MSE 32,97467 R-Square 0,7481

Dependent Mean 159,31150 Adj R-Sq 0,7341 SínteseCoeff Var 20,69823 Parameter Estimates Parameter Standard StandardizedVariable DF Estimate Error t Value Pr>|t| EstimateIntercept 1 83,07500 12,77103 6,50 <,0001 0N 1 0,76237 0,10428 7,31 <,0001 0,86492Parameter EstimatesVariable DF 95% Confidence LimitsIntercept 1 56,24405 109,90595N 1 0,54329 0,98144

ANAVA/ANOVA

Estimativa e significância

Intervalos de confiança

Page 12: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Em muitos sentidos simplesmente uma extensão da linear simples, com mais variáveis independentes

Neste modelo o a (intercepto) é o valor de y quando todas as variáveis independentes têm valor 0

O teste de hipóteses mais comum para avaliar o mérito da RLM é considerar todos os β iguais a zero, ou seja, nenhuma das variáveis prevê y

R2 corrigido estima a fração da variância de y predita pelas variáveis independentes, após correção para o intercepto, enquanto o não corrigido inclui o intercepto, ficando mais parecido com o R2 da regressão linear simples

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 13: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Como alguns testes parecem avaliar o mesmo ponto e apresentam resultados diferentes é muito importante checar as diferenças nas premissas e modelos por trás dos testes

Quatro tipos básicos de testes◦ Testes gerais – medir a contribuição de todos os

preditores◦ Adição de uma variável – medir a contribuição de um

único preditor◦ Interceptos – indicar o valor de uma coluna de

constantes em prever a resposta◦ Adição de grupos de variáveis - medir a contribuição

de dois ou mais preditores dentro de todos os possíveis

◦ Hipótese linear generalizada – outros testes

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 14: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Para cada teste se comparam os modelos geral (hipótese alternativa) e reduzido (hipótese nula)

Teste geral corrigido◦ H0 y = a; Ha = algum componente da regressão é

significativo Teste para adição de uma variável

◦ para última variável adicionada comparar dois modelos em que a única diferença é a

adição de uma variável H0 é que o efeito desta última variável é não diferente de

0, ou seja não significativo◦ Para variável adicionada na ordem

Semelhante ao tipo anterior, mas em que os modelos são testados sequencialmente

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 15: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Teste do intercepto◦ Adicionado por fim

Define todo o modelo e verifica se a adição do intercepto apresenta efeito significativo

◦ Adicionado na ordem Semelhante ao anterior

Adição de grupo de variáveis◦ Grupo adicionado por fim

Generalização do teste da hipótese adicionado por fim

◦ Grupo adicionado em ordem Semelhante aos demais

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 16: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Técnicas de seleção de modelos podem implicar em grande aumento na chance de erro tipo I.

Recomendam-se os seguintes passos:◦ Especificar o modelo máximo (com todas as

variáveis)◦ Especificar o critério de escolha◦ Especificar a estratégia de escolha◦ Conduzir a análise◦ Avaliar confiabilidade do modelo escolhido

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 17: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Modelo único ◦ redução da Soma de Quadrados do Resíduo ◦ Uma desvantagem é a dependência do tamanho

da amostra Aumento do tamanho aumenta SQR Uso do quadrado médio reduz este problema Depende da escala de y

◦ O valor de F ou de Pr<F diminuem estes problemas Modelos aninhados (diferem apenas pela

adição ou subtração de variáveis)◦ Comparar o valor de F dos modelos

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 18: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Testar todas as regressões possíveis◦ Grande número de combinações◦ 2número de variáveis possíveis

◦ Como exemplo, para 10 variáveis, 1023 possíveis modelos

◦ É o único algoritmo que garante uma solução para qualquer conjunto de variáveis

Eliminação para trás◦ Começa com todas as p variáveis◦ Testa todos os modelos com p-1 variáveis◦ Para cada modelo, testa o efeito da retirada da última

variável◦ Seleciona a variável com menor efeito de retirada◦ Reinicia com o segundo passo

Seleção para frente◦ Igual à para trás, ao contrário

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 19: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Stepwise◦ Mistura de técnicas

Começa com um passo de seleção para frente Para cada passo para frente, pode-se retirar uma das

variáveis já presentes◦ As probabilidades de F raramente são adequadas◦ Como os programas permitem selecionar valores de

probabilidade para uma variável entrar ou sair. recomendação de probabilidades

Para entrar 1 (ou 0,99999 se não puder 1) Para sair 0 (ou 0,0000001 se 0 não for possível)

Aproxima de todos os modelos◦ Melhor mais variáveis do que menos, em termos de

confiabilidade

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 20: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Conduzir a análise◦ Lembrar de checar colinearidade e premissas da

Análise de Variância Avaliar confiabilidade

◦ Desenhar bem a coleta de dados◦ Estudo confirmatório – desvantagem principal

custo◦ Análise em amosta dividida

Parte dos dados usada para construir o modelo, a outra para confirmar

Os dados devem ser separados aleatoriamente antes da análise

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 21: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Usualmente processos interativos Bons descritores de fenômenos biológicos Uso bem mais complexo Freqüentemente derivadas de modelagem

mecanicista Grande parte dos parâmetros têm

significado biológico

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 22: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Curva de crescimento com fases inicial e final lentas

a é a assíntota do crescimento c é a taxa de crescimento b e c são contantes negativas e é a constante neperiana

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

ctbeaety )(

Page 23: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

http://en.wikipedia.org/wiki/Gompertz_curve

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 24: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Também modelo de crescimento Crescimento inicial aproximadamente

exponencial seguido por redução do crescimento pela competição até estabilização

Também pode ajudar no estudo de reações autocatalíticas

Alguns modelos específicos são◦ Verhultz – crescimento populacional◦ Sigmoidal

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

Page 25: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Modelo básico para decomposição de matéria orgânica e liberação de nutrientes

Casos típicos queda exponencial simples ou dupla

◦ a – pool de elementos◦ b – taxa de decomposição◦ e – constante neperiana

◦ c – pool de elementos de decomposição lenta◦ d – taxa de decomposição deste segundo pool

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

bxaey

dxbx ceaey

Page 26: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

90,0

7139,272

0035,0

R

ey

Simplest

98,0

5988,244971,52

0025,00989,0

R

eey

Duplatt

Page 27: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Adequada para casos em que tende a uma constante

As constantes também apresentam interpretação biológica pré-definida

Dividem-se em dois tipos básicos◦ Crescimento

◦ Queda

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

xb

axyy

0

xb

abyy

0

Page 28: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.

x

xy

4444,0

9563,241203,15

xy

4444,0

4444,09563,241203,15

Page 29: Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais

Muller e Fetterman Regression and ANOVA. An integrated approach using SAS software◦ Capítulo 2◦ Capítulo 4◦ Capítulo 5◦ Capítulo 11

Mills, J.L. How to torture your data- Artigo no site

11/04/23

lira.pro.br\wordpress - Reservados todos os direitos

autorais.