modelos lineares mistos aplicados em ciências atuariais

4
Modelos Lineares Mistos Aplicados em Ciˆ encias Atuariais Luis Gustavo Bastos Pinho e Juvˆ encio Santos Nobre Departamento de Estat´ ıstica e Matem´atica Aplicada - UFC RESUMO: Muitos modelos utilizados em Estat´ ıstica s˜ao formulados com base na indepˆ endencia entre as observa¸c˜ oes. Por´ em nem sempre essa su- posi¸c˜ ao ´ e razo´avel, especialmente em estudos com medidas repetidas. Mo- delos mistos apresentam uma maneira de modelar a dependˆ encia entre ob- serva¸c˜ oes atrav´ es da inclus˜ao de efeitos aleat´orios. S˜ao denominados mode- los mistos aqueles que cont´ em um ou mais efeitos aleat´orios. Em Atu´ aria esses modelos vˆ em sendo utilizados com crescente sucesso. Nesse trabalho ser˜aoapresentadasalgumasdefini¸c˜ oes, exemplos, resultados e analisado um exemplo de aplica¸c˜ ao em Ciˆ encias Atuariais. Palavras-chave: Modelos lineares mistos, medidas repetidas, estudos lon- gitudinais, Atu´ aria. 1 Introdu¸c˜ ao Estudos com medidas repetidas s˜ao aqueles nos quais uma ou mais va- riav´ eis resposta s˜ao observadas por v´arias vezes para cada unidade amostral. Por unidade amostral entende-se cada elemento que comp˜oe o conjunto ob- servado e sob o qual se deseja investigar algo. As medidas repetidas podem ser obtidas em condi¸c˜ oes diversas ou sob as mesmas condi¸c˜ oes. Quando as medidas s˜ao obtidas ao longo de uma escala ordenada (tempo, dosagem, velocidade, etc) ´ e dado ao estudo o nome de estudo de dados longitudinais. Autiliza¸c˜ ao de poucas unidades amostrais e a possibilidade de modelar o comportamento individual de cada unidade amostral s˜ao, entre outras, vantagens dos estudos com medidas repetidas. Por outro lado, a utiliza¸c˜ ao de medidas repetidas insere novas dificuldades aos processos de modelagem eestima¸c˜ ao. Uma delas ´ e a poss´ ıvelcorrela¸c˜ ao existente entre medidas obtidas de uma mesma unidade amostral. Essa correla¸c˜ ao, em geral, torna o processo de estima¸c˜ ao mais complicado, pois ´ e necess´ario estimar a estrutura de covariˆ ancia do modelo. 1

Upload: antonio-fernando-navarro

Post on 16-Aug-2015

60 views

Category:

Education


4 download

TRANSCRIPT

Page 1: Modelos lineares mistos aplicados em ciências atuariais

Modelos Lineares Mistos Aplicados em Ciencias Atuariais

Luis Gustavo Bastos Pinho e Juvencio Santos NobreDepartamento de Estatıstica e Matematica Aplicada - UFC

RESUMO: Muitos modelos utilizados em Estatıstica sao formulados combase na independencia entre as observacoes. Porem nem sempre essa su-posicao e razoavel, especialmente em estudos com medidas repetidas. Mo-delos mistos apresentam uma maneira de modelar a dependencia entre ob-servacoes atraves da inclusao de efeitos aleatorios. Sao denominados mode-los mistos aqueles que contem um ou mais efeitos aleatorios. Em Atuariaesses modelos vem sendo utilizados com crescente sucesso. Nesse trabalhoserao apresentadas algumas definicoes, exemplos, resultados e analisado umexemplo de aplicacao em Ciencias Atuariais.

Palavras-chave: Modelos lineares mistos, medidas repetidas, estudos lon-gitudinais, Atuaria.

1 Introducao

Estudos com medidas repetidas sao aqueles nos quais uma ou mais va-riaveis resposta sao observadas por varias vezes para cada unidade amostral.Por unidade amostral entende-se cada elemento que compoe o conjunto ob-servado e sob o qual se deseja investigar algo. As medidas repetidas podemser obtidas em condicoes diversas ou sob as mesmas condicoes. Quando asmedidas sao obtidas ao longo de uma escala ordenada (tempo, dosagem,velocidade, etc) e dado ao estudo o nome de estudo de dados longitudinais.

A utilizacao de poucas unidades amostrais e a possibilidade de modelaro comportamento individual de cada unidade amostral sao, entre outras,vantagens dos estudos com medidas repetidas. Por outro lado, a utilizacaode medidas repetidas insere novas dificuldades aos processos de modelageme estimacao. Uma delas e a possıvel correlacao existente entre medidasobtidas de uma mesma unidade amostral. Essa correlacao, em geral, torna oprocesso de estimacao mais complicado, pois e necessario estimar a estruturade covariancia do modelo.

1

Page 2: Modelos lineares mistos aplicados em ciências atuariais

2 Metodologia

Para estimar os parametros dos possıveis modelos a serem utilizados,geralmente sao utilizados metodos de maxima verossimilhanca, e metodositerativos sao usados para maximizar a funcao de verossimilhanca. Entreesses metodos iterativos podemos citar os de Newton-Raphson, algoritmoEM, e Escores de Fisher. No caso de modelos lineares mistos mais simples, epossıvel obter estimadores para os parametros de maneira descomplicada. Amedida que o modelo se torna mais geral o auxılio de pacotes computacionaise mais necessario.

O modelo usado para a matriz de covariancia do modelo deve dependerda natureza dos dados e permitir como fonte de variacao os erros aleatoriose os efeitos aleatorios, pelo menos. Outra possıvel fonte de variacao e a cor-relacao serial. O criterio de informacao de Akaike (AIC) pode ser utilizadopara escolher a estrutura da matriz de covariancia mais adequada quandohouver mais de uma opcao plausıvel.

Apos obter estimativas para os parametros dos modelos e necessario va-lidar as suposicoes feitas. Isso, em geral, e conseguido atraves da analise deresıduos. Para os modelos lineares mistos os resıduos sao observados paraverificar lineariedade, observacoes discrepantes, observacoes com alavanca-gem alta, alem de outros eventos, como por exemplo a homocedasticidadedos erros aleatorios e a independencia condicional das observacoes, caso sejaespecificado no modelo utilizado tais caracterısticas.

3 Modelos Lineares Mistos

A forma funcional do modelo e a seguinte:

Yi = Xiβ + Zibi + εi i = 1, 2, 3 . . . , k

em que Yi e um vetor (ni×1) com as observacoes da i-esima unidade amos-tral. Xi e uma matriz (ni×m), em que m e o total de variaveis explicativas(regressores). β e um vetor m× 1 com os coeficientes de regressao, tambemchamados de efeitos fixos. Zi e uma matriz de planejamento, tem dimensaoni × p e posto completo e e conhecida. bi tem dimensao p× 1 e e chamadovetor de efeitos aleatorios, que serao usados para modelar a covariancia entremedidas obtidas a partir de uma mesma unidade amostral. E finalmente εi

e o vetor ni × 1 de erros aleatorios. E assumido ainda que:

2

Page 3: Modelos lineares mistos aplicados em ciências atuariais

• εi ∼ N(0, σ2Ini) para todo i;

• bi ∼ N(0,Ψ∗) para todo i;

• εi e bj sao independentes para todo i e j;

Existe uma maneira ainda mais concisa de representar modelos linearesmistos:

Y = Xβ + Zb + ε

em que Y = (Y1,Y2, . . . ,Yk)>, X = (X1,X2, . . . ,Xk)>, Z =⊕k

i=1 Zi,b = (b1,b2, . . . ,bk)> e ε = (ε1, ε2, . . . εk)>. E assumido que b e ε possuemestruturas de covariancia respectivamente iguais a Ψ = Ik

⊗Ψ∗ e R =⊕k

i=1 Ri, com Ri = σ2Ini . Entao:

Y ∼ N(Xβ,ZΨZ> + R)

Y|b ∼ N(Xβ + Zb,R)

Conhecidas as matrizes de covariancia, β e b sao estimados por:

β = (X>V−1X)−1X>V−1Y

b = ΨZ>V−1(Y −Xβ)

Em que V = ZΨZ>+R. As matrizes V,R e Ψ podem ser estimadas atravesde metodos de maxima verssimilhanca e maxima verossimilhanca restrita.Esse processo ira envolver metodos iterativos e pode ser conferido em maisdetalhes em Searle(2001) e Demidenko(2004).

4 Discussao e Exemplos de Aplicacao

Foram apresentados na primeira parte do trabalho tres exemplos de da-dos com medidas repetidas e tres modelos foram ajustados aos dois primeirosexemplos. Um exemplo traz dados sobre a taxa de juros para vendas de car-ros novos retirado de Tukey(1991). Para esses dados foi ajustado o modeloyij = µi+εij , em que yij corresponde a j-esima observacao na i-esima cidade,e em seguida foi ajustado o modelo de interceptos aleatorios yij = αi+jβ+εij

para o mesmo conjunto de dados. Para esses dois modelos foram calcula-dos os estimadores dos parametros sem auxılio de metodos iterativos parademonstrar os processos de maxima verossimilhanca e maxima verossimi-lhanca restrita. O segundo exemplo traz dados simulados para quantidade

3

Page 4: Modelos lineares mistos aplicados em ciências atuariais

de vendas (Y) em funcao do preco (X) e para ele foi ajustado o modelolinear de coeficientes aleatorios, yij = αi + xijβi + εij , ja com auxılios com-putacionais para demonstrar a utilizacao dos metodos de estimacao no casomais geral. Em seguida foi feita a analise de resıduos dos modelos ajustadose mais um conjunto de dados atuariais foi examinado.

5 Consideracoes

Modelos lineares mistos sao uma otima alternativa para modelar a de-pendencia entre observacoes e o comportamento individual das unidadesamostrais. Em Atuaria a aplicacao torna-se evidente devido a grande quan-tidade de problemas praticos envolvendo dados agrupados ou com medidasrepetidas. E necessario registrar que dentre os problemas em Atuaria asuposicao de distribuicao normal dos erros nem sempre e atendida. Al-guns trabalhos mostram aplicacoes de modelos lineares mistos e modeloslineares mistos generalizados em Atuaria, como exemplo podemos citar An-tonio(2007) e Jong e Heller(2008).

REFERENCIAS BIBLIOGRAFICAS

Antonio, K. and Beirlant, J. (2007). Actuarial statistics with generalizedlinear mixed models. Insurance: Mathematics and Economics 40(1),58-76.

De Jong, P. and Gillian, G.Z. (2008). Generalized Linear Models for InsureData. Cambridge University Press.

Demidenko, E. (2004). Mixed models: theory and applications. John Wiley& Sons, New York.

Hoaglin, D., Mosteller, F. and Tukey, J. (1991). Fundamentals of Expla-natory Analysis of Variance. John Wiley & Sons, New York.

McCulloch, C.E. and Searle S.R. (2001). Generalized, Linear and MixedModels. John Wiley & Sons, New York.

4