tipos de modelos · 2018-11-06 · modelo de regressão não linear os modelos de regressão linear...
TRANSCRIPT
Tipos de modelosTipos de modelos
Temos 3 tipos de modelos:
a) Lineares
b) Não lineares linearizáveis
c) Não lineares
1
a) Modelos Linearesa) Modelos Lineares
2
a) Modelos Linearesa) Modelos Lineares
a) Linearesa) Lineares:
A primeira derivada em relação a cada parâmetro, , não depende de nenhum parâmetro.
,f Xg X
Draper e Smith (1998)
Exemplo:
OO ModeloModelo LinearLinear
É um caso particular demodelagem estatística queengloba um grande número demodelos específicos(Regressão Linear, RegressãoPolinomial, Análise de
5210 xxy
10
f
xf
1 5
2
xf
Polinomial, Análise deVariância, Análise deCovariância)
É o mais completo e bemestudado tipo de modelo servede base para numerosasgeneralizações (Regressão nãolinear, Modelos LinearesGeneralizados, etc.)
3
b) Modelos Não Linearesb) Modelos Não Lineares
4
b) Modelos Não Linearesb) Modelos Não Lineares
Draper e Smith (1998)
)1(),,,( 3
21321
XeXf
Exemplo:
b) Não Linearesb) Não Lineares::
Quando a 1.a derivada da função com relação a algum dos parâmetros, ainda depende de algum dos parâmetros.
11
f
Xef
312
XXef
3
2
3
Ou seja, é o modelo que
mesmo usando uma
transformação, o modelo ainda é
não linear.
5
c) Modelos Não Lineares c) Modelos Não Lineares LinearizáveisLinearizáveis
Alguns exemplos particularmente frequentes de relações não-lineares que são linearizáveis.
6
a) Relação exponenciala) Relação exponencial
b) Relação potência (ob) Relação potência (ou AlométricaAlométrica))
c) Relação hiperbólica (oc) Relação hiperbólica (ou Proporcionalidade inversa)Proporcionalidade inversa)
d) Relação d) Relação MichaelisMichaelis--MentenMenten
e) Relação Logísticae) Relação Logística
c) Linearizáveisc) Linearizáveis::
Por meio de alguma transformação o modelo se torna linear.
Draper e Smith (1998)
Y = X. e
Exemplo:
Transformações Transformações linearizanteslinearizantes
Em alguns casos, arelação original entre X e Y énão-linear, mas pode serlinearizada caso se proceda a
dZX
d
ln(Y ) = X . ln() + ln(e)
Z = X . +
Inconveniente: altera a estrutura e distribuição do erro
linearizada caso se proceda atransformações numa, ou emambas as variáveis.
Tais transformaçõespodem permitir utilizar aRegressão Linear Simples(RLS), para estimar osparâmetros, apesar da relaçãooriginal ser não-linear.
7
a) Relação exponenciala) Relação exponencial
Transformação:: Logaritmizando, obtém-se:
)0;0(
;
y
eY X
XY
XY
**
)ln()ln(
8
XY **
que é uma relação linear entre Y* = ln(Y) e X.
Uma relação exponencial resulta de admitir que y é função de x e que a taxade variação relativa de y é constante:
)(
)('
xy
xy
isto é, a taxa de variação de y é proporcional a y: y’(x) = y(x).
b) Relação potênciab) Relação potênciaOu
AlométricaAlométrica
)0;0,( yxXY
TransformaçãoTransformação::Logaritmizando, obtém-se:
9
que é uma relação linear entre Y* = ln(Y) e X* = ln(X).
***)ln()ln()ln( XYXY
Uma relação potência resulta de admitir que Y e X são funções de t e que a taxa de variação relativa de Y é proporcional à taxa de variação relativa de X:
)(
)('
)(
)('
tx
tx
ty
ty
c) Relação hiperbólicac) Relação hiperbólicaOu
Proporcionalidade inversaProporcionalidade inversa
TransformaçãoTransformação:: Tomando recíprocos, obtém-se uma relação linearentre Y* = 1/Y e X:
XY
1
10
AplicaçãoAplicação: Usado na modelagem de rendimento por planta (Y) vs.
densidade da cultura ou povoamento (X).
entre Y* = 1/Y e X:
XYXY
*1
d) Relação d) Relação MichaelisMichaelis--MentenMenten
TransformaçãoTransformação:: Tomando recíprocos, obtém-se uma relação linearentre Y* = 1/Y e X* = 1/X, com * = d e * = c:
dXc
XY
11
,1 **** XYd
X
c
Y
Aplicações Em modelos de rendimento é conhecido como modelo Shinozaki-Kira, com Y orendimento total e X a densidade de uma cultura ou povoamento.
Nas pescas é conhecido como modelo Beverton-Holt com Y o recrutamento e X adimensão do manancial (sotck) de progenitores.
e) Relação Logísticae) Relação Logística
)(1
1Xe
Y
Transformação: Admitindo que y ]0,1[, tem-se uma relação linear entre a função logit de Y, ln(Y/(1 – Y)), e x:
12
XYXY
Y
*
1ln
)](1[)(
)('xy
xy
xy
Resulta de admitir que y é função de x e que a taxa de variação relativade y diminui com o aumento de x:
Advertência sobre transformações Advertência sobre transformações linearizanteslinearizantes
A Regressão Linear Simples (RLS) não modela diretamente relações não
lineares entre X e Y. A RLS modela a relação linear que se forma após a
transformação linearizante, ou seja, a relação linear entre as variáveis
transformadas.
13
Linearizar, obter os parâmetros a e b da reta e depois desfazer a
relação não linear não produz os mesmos valores dos parâmetros do que
tentar obter diretamente os valores que minimizam a soma de quadrados dos
resíduos na relação não linear.
Modelo de Regressão Não LinearModelo de Regressão Não Linear(MRNL)(MRNL)
Prof.a Dr.a Simone Daniela Sartorio de Medeiros
DTAiSeR-Ar
14
Modelo de regressão não linearModelo de regressão não linear
Os modelos de regressão linear tem aplicações nas diversas áreas doconhecimento. Entretanto, existem muitas situações em que esses tipos demodelos não podem ser apropriados.
Em aplicações mais realistas, especialmente, nos casos de crescimentobiológico, pode ser necessário o ajuste de funções não lineares que explicammelhor: o crescimento animal ou vegetal, bem como em estudos dadescrição da cinética de digestão de animais, como os ruminantes,
15
descrição da cinética de digestão de animais, como os ruminantes,descrição da dinâmica e disponibilização de nutrientes no sistema solo-planta, etc.
O modelo de regressão não linear pode ser escrito da seguinte forma:
Modelo de regressão não linearModelo de regressão não linear
nif iii ,...,2,1,, εθxy
em que:
Tni yyy ,,, 21 y é o vetor (n 1) das respostas obtidas nas ocasiões
Txxx ,,, x
16
Tni xxx ,,, 21 x
Tp ,,, 21 θ
Tni ,,, 21 ε
é o vetor (p 1) de parâmetros desconhecidos.
f é uma função não linear que depende do vetor de parâmetros . A função édiferenciável em relação a cada elemento do vetor .
é o vetor (n 1) de erros aleatórios, NIID.
E fy X, β
Quando se têm n observações da forma
1 2, , , ,u u u kuy x x x , com nu ,,2,1
1 2 1 2, , , ; , , ,u u u ku n uy f x x x β
Forma alternativa:
em que u é o u-ésimo erro, com u = 1, 2, ..., n.
,,, 21 kuuuu xxx xem que
u uy f ux ,β
Modelo abreviadoModelo abreviado
17
As pressuposiçõesAs pressuposições
As pressuposições em relação ao modelo segue similar aos modelos deregressão linear.
Entretanto, algumas pressuposições podem falhar, com por exemplo,os erros não apresentam distribuição normal. Tal distribuição pode pertencera uma outra família (não gaussiana) de distribuição. Nesse caso, emparticular, a variável resposta apresenta outra escala, portanto, deve-se usaros Modelos de Regressão Não Linear Generalizados (MRNLG).
18
os Modelos de Regressão Não Linear Generalizados (MRNLG).
Aqui consideraremos apenas os casos em que a distribuição é normal.
As As vantagensvantagens do MRNLdo MRNL
1) Sua escola está associada ao conhecimento prévio sobre a relação a sermodelada. Por exemplo: Peso Tempo.
2) Os parâmetros do modelo geralmente apresentam interpretaçãobiológica.
Processos como crescimento, decaimento, nascimento, mortalidade, competição e produção raramente são relacionadas linearmente as
19
competição e produção raramente são relacionadas linearmente as variáveis explicativas.
Nesse sentido, pode-se dizer que os MRNL melhor descrevem processosmecanísticos e são úteis por acomodarem as restrições referentes a taisprocessos.
Formulações de modelos são baseadas em considerações teóricas inerentes ao fenômeno que se tem interesse em modelar.
Modelo Modelo Solução de ED Solução de ED Modelo não linearModelo não linear
Modelo não linearModelo não linearAs variáveis respostas geralmente apresentam
um comportamento não linear
• Os parâmetros são biologicamente interpretáveis;
• Conhecimento e características teóricas dos dados (Ex.: assíntotas)
• Necessita-se de menos parâmetros
Interpretação
20
2
1
exp1
tty
Parâmetros são de fácil interpretação e características conhecidas.
O modelo logísticoO modelo logístico
23
3
exp1
em que,
1 : assíntota do modelo (Asym);
2 : o tempo até o indivíduo atingir ½ da resposta assintótica (xmid); e
3 : aproximadamente, ¾ da resposta assintótica (scal) .
tempo
1
t
21
Os parâmetros tem a mesma interpretação?
..\inferencias_do_modelo_logistico_sob_diferentes_parametrizacoes-1.pdf 22
As As desvantagensdesvantagens do MRNLdo MRNL
1) Requerem procedimentos iterativos de estimação baseados nofornecimento de valores iniciais para os parâmetros;
2) Métodos de inferência são aproximados;
3) Exigem conhecimento do pesquisador sobre o fenômeno alvo.
23
Estimação dos parâmetros Estimação dos parâmetros dodoMRNLMRNL
24
MRNLMRNL
Estimação dos parâmetrosEstimação dos parâmetros
a) Método dos Mínimos Quadrados:
a.1) Ordinários: não viola pressuposições;
a.2) Ponderados: viola homogeneidade;a.2) Ponderados: viola homogeneidade;
a.3) Generalizados: viola independência.
b) Método da Máxima Verossimilhança
25
Estimação dos parâmetros Estimação dos parâmetros –– Modelo linearModelo linear
x
n
yx
yx
n
in
n
ii
n
iin
iii
2
11
1ˆ
Os estimadores e de mínimos quadrados para e , respectivamente são:
xy ˆˆˆ
n
x
n
yn
ii
n
ii
11 ˆˆ
n
x
x iin
ii
1
1
2
Assim, a curva estimada é dada por:
Logo, encontrando os valores estimados de α e β obtém então
os valores esperados de Y.26
a) Método a) Método dos Mínimos Quadradosdos Mínimos Quadrados
Não exige pressuposições
Busca-se que minimize:β
2
Re1
,n
s u uu
SQ y f
x β Métodos
Iterativos
O SEN :
βx,f T
Não possui forma
Estimação dos parâmetros Estimação dos parâmetros –– Modelo não linearModelo não linear
Existem vários métodos numéricos iterativos:
Os métodos acima utilizam as derivadas parciais da função esperança f (x , ) com relação a cada parâmetro.
0βx,fyβ
βx,f
_ Método Gauss-Newton (da linearização);
_Método Steepest-Descent (do gradiente);
_Método de Marquardt.
_ Método de Newton;
_ Método Newton-Raphson;
_ Algoritmo EM;
Não possui forma fechada,
27
a.1) Método de Gaussa.1) Método de Gauss--NewtonNewton
y = f (x, ) +
y f (x, 0) + Z0 ( – 0 ) +
y – f (x, 0) = Z0 ( – 0 )+
0
y0 = Z0 0 + ==
y0
Expansão em série de Taylor de 1.a ordemem torno de um determinado 0, em que 0 é
o vetor de valores iniciais dos parâmetros.
Se SQRes(1) < SQRes(0) Repete o processo com 1 no lugar de 0,
isto é, 2 SQRes(2) , ... etc
0 = (Z0’ Z0)-1 Z0’y0^
Atualização do vetor de estimativas dos parâmetros (MQO)
Critério de Critério de ParadaParada
1 = 0 + 0^
Aproximar o modelo de
regressão NL com termos
lineares
28
Algumas vantagensvantagens:
As estimativas de mínimos quadrados podem ser facilmente obtidas;
Os estimadores são aproximadamente não viciados, normalmentedistribuídos com variância mínima, mesmo em pequenas amostras;
Os valores de previsões são mais precisos;
a.1) Método de Gaussa.1) Método de Gauss--NewtonNewton
Os valores de previsões são mais precisos;
Os métodos iterativos convergem mais rapidamente;
Os estimadores têm propriedades similares às propriedades ótimas de modelos lineares.
29
Solução não Método numérico
ValoreValore IniciaisIniciais A solução inicial pode estar demasiadamente distante do valor ótimo;
Má escolha dos valores iniciais resulta num número muito grande deiterações;
Pode convergir num mínimo local, ou, mesmo, não convergir;
Entretanto, bons valores iniciais podem levar a um mínimo global.
Rapidez da convergência
Qualidade dos valores iniciais
Complexidade do modelo
+
analítica iterativo
valores iniciais
30
Os modelos de regressão não linear descrevem relações não lineares entreas variáveis. Essas relações apresentam muitas formas.
São propriedades relevantes de uma função característica como ter pontoscríticos, inflexão, seu comportamento (concavidade, monotonicidade) ouaparentar padrões específicos (sigmoide, parabólico).
Para melhor compreender as relações não lineares entre x e y podemosfacilmente verificar alguns padrões, por meio de gráficos:
Alguns formatos de MRNLAlguns formatos de MRNL
31
Scatterplot
y:=100-50*exp(-2*x)
X
E(X
)
50
60
70
80
90
100
110
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5
Curvas de CrescimentoCurvas de Crescimento
A evolução de uma determinada característica (animal ou vegetal) em relação ao tempo (dias, meses, anos), em condições de crescimento contínuo, segue um
padrão comum nas espécies e sua representação gráfica origina uma curva designada curva de crescimento.
Geralmente, forma sigmoidalGeralmente, forma sigmoidal
32
Curvas de CrescimentoCurvas de Crescimento(não lineares nos parâmetros)
Modelo Fórmula
Brody y(t) = A [1 - B exp(-Kt)]
Von Bertalanffy y(t) = A [1 - B exp(-Kt)]3
Gompertz y(t) = A exp[- B exp(-Kt)]
em que: A é uma assíntota superior; B relacionado ao intercepto da curva; K taxa de crescimento da característica; M (Richards) forma à curva.
Logístico y(t) = A [1 + B exp(-Kt)]-1
Richards y(t) = A [1 - B exp(-Kt)]M
33
Ajuste de um modelo não linearAjuste de um modelo não linear
34
Ajuste de um modelo não linearAjuste de um modelo não linear
hora repet MS1 0 1 17.852 0 2 14.803 0 3 15.074 0 4 17.275 0 5 20.466 0 6 20.077 3 1 17.398 3 2 18.119 3 3 18.5010 3 4 16.0311 3 5 22.8312 3 6 21.7513 6 1 22.3214 6 2 21.0415 6 3 23.4316 6 4 19.5317 6 5 27.9418 6 6 23.9819 12 1 29.2120 12 2 30.2021 12 3 29.7822 12 4 32.52
Exemplo 1Exemplo 1
No R:repet<- rep(1:6, time=7)hora<- rep(c(0, 3, 6, 12, 24, 48, 72), each=6)MS<- c(17.85, 14.80, 15.07, 17.27, 20.46, 20.07, 17.39, 18.11,
18.50, 16.03, 22.83, 21.75, 22.32, 21.04, 23.43, 19.53,
a) Os dados observados:
Dados da porcentagem de degradabilidade ruminal in situ de MS do feno capim Tifton85 em ovinos.
35
22 12 4 32.5223 12 5 36.2724 12 6 31.7825 24 1 40.7326 24 2 40.9627 24 3 41.3628 24 4 43.8829 24 5 46.0030 24 6 39.1331 48 1 47.3432 48 2 51.3433 48 3 51.6134 48 4 53.3535 48 5 57.0736 48 6 49.4937 72 1 50.4138 72 2 54.6239 72 3 55.7240 72 4 56.2141 72 5 59.9342 72 6 55.12
18.50, 16.03, 22.83, 21.75, 22.32, 21.04, 23.43, 19.53,27.94, 23.98, 29.21, 30.20, 29.78, 32.52, 36.27, 31.78,40.73, 40.96, 41.36, 43.88, 46.00, 39.13, 47.34, 51.34, 51.61, 53.35, 57.07, 49.49, 50.41, 54.62, 55.72, 56.21,59.93, 55.12)
dados1<- data.frame(hora, repet, MS)dados1
# oudados<- read.csv2(“não_linear.csv”, head=T, dec=“.”)
attach(dados)names(dados)
No R:plot(hora, MS, , data=dados, pch=19)
Exemplo 1Exemplo 1
b) Conhecendo os dados
50
60
36
0 10 20 30 40 50 60 70
20
30
40
hora
MS
Modelo de Modelo de OrskovOrskov e McDonald (1979) e McDonald (1979) –– degradabilidadedegradabilidade in in situsitu
)1()( ctebatD
37
D(t) é a degradabilidade potencial ou desaparecimento dos componentesbromatológicos do alimento (%), no tempo t;a é a fração do alimento solúvel em água, ou rapidamente degradável;b é a fração insolúvel em água, mas potencialmente degradável em umdeterminado tempo, sob ação de microorganismos;c é a taxa de degradação da fração b; et é o tempo de incubação (h).
Modelo de Modelo de OrskovOrskov e McDonald (1979)e McDonald (1979)
)1()( ctebatD
38
c) Os dados tem a forma do modelo escolhido, nocaso, o modelo de Orskov e McDonald?
Exemplo 1Exemplo 1
No R:# O modelo de Orskov e McDonaldorskov = function(t,a,b,c) (a + b*(1-exp(-c*t)))
# Gráfico: valores observados e as tentativas de curva (valores iniciais)plot(hora, MS, pch=19)curve(orskov(x, 14, 40, 0.02), add=T, col="red")curve(orskov(x, 14, 40, 0.03), add=T, col="blue")curve(orskov(x, 14, 40, 0.01), add=T, col="green")
d) Quais os valores iniciais? Precisamos determinar valores iniciais para osparâmetros do modelo escolhido (no caso: a, b e c) para podermos estimar.
39
curve(orskov(x, 14, 40, 0.01), add=T, col="green")
0 10 20 30 40 50 60 70
20
30
40
50
60
hora
MS
No R:# valores iniciais para a, b e ca0= 14; b0= 40; c0= 0.04
#--- Curva obtida com os valores iniciaisplot(hora, MS, pch=19)curve(orskov(x,a0,b0,c0), add=T, col="red")
Exemplo 1Exemplo 1
60
40
0 10 20 30 40 50 60 70
20
30
40
50
hora
MS
No R:#-- Ajustando o modelo de oskov aos dadosmod <- nls(MS ~ orskov(hora, a, b, c), start=c(a=a0, b=b0, c=c0))
# Resumo do modelo não linear ajustadosummary(mod)
Formula: MS ~ orskov(hora, a, b, c)
Parameters:
Exemplo 1Exemplo 1
e) Ajustando o modelo não linear:
41
Parameters:Estimate Std. Error t value Pr(>|t|)
a 15.851229 0.886467 17.881 < 2e-16 ***b 42.741375 1.701888 25.114 < 2e-16 ***c 0.037428 0.004289 8.727 1.04e-10 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.855 on 39 degrees of freedom
Number of iterations to convergence: 4 Achieved convergence tolerance: 4.518e-06
)1(7414,428512,15)( 0374,0 tetD
No R:#--- Curva obtida com os valores obtidos pelo ajusteplot(hora, MS, pch=19)curve(orskov(x, coef(mod)[1], coef(mod)[2], coef(mod)[3]), add=T)
Exemplo 1Exemplo 1
50
60
42
0 10 20 30 40 50 60 70
20
30
40
50
hora
MS
Exemplo 1Exemplo 1
No R:# Intervalo de confiança dos parâmetrosconfint(mod)Waiting for profiling to be done...
2.5% 97.5%a 14.06255218 17.60966472b 39.54971748 46.53030181c 0.02933595 0.04619664
43
No R:# valores ajustadosMS_chapeu<- predict(mod)
# resíduo ordinário do modelores<- MS - MS_chapeu
# Teste de normalidade dos resíduosshapiro.test(res)
Exemplo 1Exemplo 1
24
6
44
shapiro.test(res)Shapiro-Wilk normality test
data: resW = 0.9714, p-value = 0.3676
# gráfico quantil-quantilrequire(car)qqPlot(res, pch=19)
# Critério de informação de AkaikeAIC(mod)[1] 212.1924
-2 -1 0 1 2
-4-2
0
norm quantiles
res