risco relativo espacial em estudos caso … carol sinape.pdf · risco relativo espacial em estudos...

6
RISCO RELATIVO ESPACIAL EM ESTUDOS CASO-CONTROLE COM RESPOSTA MULTINOMIAL L.V.A Silveira 1 , A.C.C.N. Mafra 2 , R. Cordeiro 2 , L.B. Nucci 2 , C. Stephan 2 1 Departamento de Bioestatística (IB), Universidade do Estado de São Paulo UNESP, Botucatu, SP. 2 Laboratório de Análises Espaciais de Dados Epidemiológicos (epiGeo),Universidade Estadual de Campinas UNICAMP, Campinas, SP. Introdução O estudo do risco no espaço tem se tornado cada vez mais comum em pesquisas epidemiológicas 1-5 , pois permite identificar áreas que contém fatores ainda não estudados e que muitas vezes não poderiam ser incluídos em um modelo, por sua complexidade, mas que se sabe ser referente às características específicas daquela região. Outra vantagem, quando não se inclui na análise outros fatores além do espacial, é identificar áreas onde são necessárias ações de intervenção. Para o caso específico de estudos do tipo caso-controle, Bithell 6 definiu o risco relativo espacial como uma razão de densidades de pontos que poderia ser obtido através de estimativas de Kernel. Alguns anos mais tarde, Kelsall e Diggle 7 mostrariam que o mesmo risco relativo poderia ser estimado através do ajuste de Modelos Aditivos Generalizados onde, além da análise não-paramétrica do espaço, poderia ser incluída uma análise paramétrica de covariáveis de interesse. Todo este desenvolvimento foi feito para estudos onde a resposta é binomial (casos e controles). Porém, existem circunstâncias onde se deseja categorizar a resposta de interesse em mais do que dois grupos, exigindo assim uma abordagem multinomial. Nos últimos anos muitos estudos epidemiológicos do tipo caso-controle têm utilizado o formato multinomial em suas análises 8-12 . Quando aplicável, a categorização dos casos em mais níveis de resposta enriquece a análise e traz informações discriminadas para cada tipo específico de caso. Os modelos multinomiais podem ser ajustados de diversas maneiras 13 e pode-se averiguar se a resposta é nominal ou ordinal e enquadrar o estudo no formato mais adequado, porém Mafra et. al 11 ressaltam a importância de conduzir as análises de estudos do tipo caso-controle comparando cada tipo de caso com os controles, para assim poder ter medidas de risco. Neste trabalho, define-se o risco relativo espacial de forma bivariada, permitindo a inclusão de outras covariáveis na análise e mostra-se a maneira de estimar tal risco através de modelos aditivos generalizados e obter áreas de significância por meio de simulações de Monte Carlo. Dados Foi conduzido um estudo caso-controle com base populacional com 779 trabalhadores informais que sofreram acidente do trabalho na cidade de Piracicaba, sudeste do Brasil, em 2007,

Upload: phungtuong

Post on 24-Nov-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

RISCO RELATIVO ESPACIAL EM ESTUDOS CASO-CONTROLE

COM RESPOSTA MULTINOMIAL

L.V.A Silveira1, A.C.C.N. Mafra2, R. Cordeiro2, L.B. Nucci2, C. Stephan2

1 Departamento de Bioestatística (IB), Universidade do Estado de São Paulo UNESP, Botucatu,

SP. 2Laboratório de Análises Espaciais de Dados Epidemiológicos (epiGeo),Universidade Estadual

de Campinas UNICAMP, Campinas, SP.

Introdução

O estudo do risco no espaço tem se tornado cada vez mais comum em pesquisas

epidemiológicas1-5, pois permite identificar áreas que contém fatores ainda não estudados e que

muitas vezes não poderiam ser incluídos em um modelo, por sua complexidade, mas que se sabe

ser referente às características específicas daquela região. Outra vantagem, quando não se inclui

na análise outros fatores além do espacial, é identificar áreas onde são necessárias ações de

intervenção.

Para o caso específico de estudos do tipo caso-controle, Bithell6 definiu o risco relativo

espacial como uma razão de densidades de pontos que poderia ser obtido através de estimativas

de Kernel. Alguns anos mais tarde, Kelsall e Diggle7 mostrariam que o mesmo risco relativo

poderia ser estimado através do ajuste de Modelos Aditivos Generalizados onde, além da análise

não-paramétrica do espaço, poderia ser incluída uma análise paramétrica de covariáveis de

interesse.

Todo este desenvolvimento foi feito para estudos onde a resposta é binomial (casos e

controles). Porém, existem circunstâncias onde se deseja categorizar a resposta de interesse em

mais do que dois grupos, exigindo assim uma abordagem multinomial.

Nos últimos anos muitos estudos epidemiológicos do tipo caso-controle têm utilizado o

formato multinomial em suas análises8-12. Quando aplicável, a categorização dos casos em mais

níveis de resposta enriquece a análise e traz informações discriminadas para cada tipo específico

de caso.

Os modelos multinomiais podem ser ajustados de diversas maneiras13 e pode-se averiguar

se a resposta é nominal ou ordinal e enquadrar o estudo no formato mais adequado, porém Mafra

et. al11 ressaltam a importância de conduzir as análises de estudos do tipo caso-controle

comparando cada tipo de caso com os controles, para assim poder ter medidas de risco.

Neste trabalho, define-se o risco relativo espacial de forma bivariada, permitindo a inclusão

de outras covariáveis na análise e mostra-se a maneira de estimar tal risco através de modelos

aditivos generalizados e obter áreas de significância por meio de simulações de Monte Carlo.

Dados

Foi conduzido um estudo caso-controle com base populacional com 779 trabalhadores

informais que sofreram acidente do trabalho na cidade de Piracicaba, sudeste do Brasil, em 2007,

e que foram atendidos em um dos oito pronto-socorros desta cidade, como controles, foram

estudados 1544 trabalhadores informais que não sofreram acidente de trabalho nos três anos

anteriores e que trabalhassem na região de estudo14. Neste trabalho foram utilizadas as seguintes

variáveis:

- coordenadas geográficas do local de ocorrência dos acidentes, para casos e

- coordenadas geográficas do local de trabalho, para controles;

- idade do trabalhador (anos);

- anos de escolaridade;

- sexo (masculino ou feminino);

- grande grupo de ocupação, sendo estes definidos como: serviço, cientistas, administração,

agropecuária, manutenção, operários, técnicos, indefinidos.

Na Figura 1 tem-se a distribuição espacial de pontos dos casos e controles.

Figura 1: Distribuição espacial dos locais de acidente e trabalho. A) Pontos dos casos leves e dos controles. B) Pontos dos casos graves e controles. Piracicaba (Brazil), 2007.

Risco Relativo Espacial para respostas multinomiais

Considere um conjunto de pontos que consistem na localização de casos e controles

como observações de dois processos de Poisson independentes I e II na região 2ℜ⊂A , com

intensidades λ1(x) e λ2(x), respectivamente. A função log-risco, aparte uma constante aditiva

conhecida, é definida por Kelsall e Diggle15, como:

( ) ( )( )

=

xx

x2

1log λλρ .

À partir daí, o risco seria obtido através do exponencial do log-risco:

( ) ( )( )xx ρθ exp=

E para obter o risco relativo, basta dividir o risco pontual pelo risco médio na região do

estudo16.

Definição do risco espacial

No caso multinomial, o principal pressuposto é de que, no modelo de processos de

Poisson, cada uma das diferentes categorias de resposta são estocasticamente independentes.

Sendo r o número de categorias de resposta, tem-se r processos de Poisson independentes com

funções de intensidade λj(x), j=1,...,r.

Seja qj a proporção amostral de casos do tipo j, ou seja, a proporção de indivíduos na

categoria j contemplados na amostra, em relação a estes indivíduos na população. Para uma

determinada doença e uma delimitada região de interesse, seja x uma matriz de coordenadas

geográficas que mapeia indivíduos com a doença em e u uma matriz de covariáveis de

interesse associadas aos indivíduos estudados. A probabilidade de qualquer indivíduo, observado

no conjunto de dados, pertencer a categoria j é dada por:

( )

( )rj

q

qp

r

m

mm

jj

j ..., ,2 ,1 ,

,

,),(

1

==

∑=

ux

uxux

λ

λ

(1)

sendo ( )xjλ , a função densidade espacial de ocorrência de casos do tipo j da doença em

(número de ocorrências por unidade de área na localização x), ( )∑=

=r

j

jp1

1ux, .

Em estudos onde há informação da distribuição espacial da população fonte, como, por

exemplo, estudos do tipo caso-controle, há a possibilidade de se comparar cada uma das

categorias de casos com a categoria de controles através de uma abordagem nominal. Seja r a

categoria referente aos controles, o log-risco é definido da seguinte maneira:

( )( )( )

1,,2,1,,

,ln, −=

= rj

r

j

j Kux

uxux

λ

λρ (2)

Estimando o log-risco

Kelsall e Diggle7 consideram o uso de regressão com uma proposta semi-paramétrica na

estimação do log-risco espacial, como métodos alternativos para estimar a razão de densidades,

junto ao ajuste de demais covariáveis de interesse. Segundo os autores, estas estimativas são

obtidas a partir do logaritmo da razão de duas densidades que podem ser estimadas através de

funções Kernel. Para tanto, os autores propõe uma regressão Kernel de Nadaraya-Watson para

obter estimativas de p(x,u), considerando um Kernel Gaussiano Ponderado. O Modelo Aditivo

Generalizado (GAM) seria uma opção viável para estimar o logito de p(x,u), para uma

determinada banda h. Como a resposta, neste caso, é binominal, este é o próprio log-risco, a

parte uma constante aditiva conhecida.

Para estender este desenvolvimento para estudos caso-controle em que a resposta é

multinomial, foi proposto o ajuste de GAM para o Polytomous Logistic Model13.

Com base nos GAM apresentados por Hastie e Tibshirani17, Kelsall e Diggle7 propuseram

um algoritmo para estimar o risco espacial através de uma função Kernel Bidimensional de

forma semi-paramétrica com a adição de covariáveis não espaciais, quando a resposta é

binomial. Para um ajuste que incorpore resposta multinomial, tal algoritmo precisou ser

modificado para o caso específico do modelo multinomial escolhido.

O logito estimado para este tipo de análise permite obter o risco estimado, a menos uma

constante multiplicativa.

A significância dos componentes paramétricos estimados são obtidos de modo usual,

como nos modelos lineares generalizados, com base na magnitude da razão entre estimativas e

seus respectivos erros padrão. Para obter a significância da variação do risco relativo espacial

estimado (RREE), não foram ainda descritos métodos analíticos, porém Kelsall e Diggle15

propõem um procedimento de Monte Carlo para dados binomiais, o qual foi adaptado para a

análise multinomial.

Resultados

Para o estudo dos acidentes de trabalho foram estimados os riscos relativos espaciais

através de dois modelos: um puramente espacial (apenas com as coordenadas geográficas) e

outro semiparamétrico que, além do espaço, contém as variáveis: idade, sexo, anos de

escolaridade do trabalhador e o grupo de ocupação do mesmo.

As funções para o ajuste dos GAM e estimação dos RREE foram executadas no software

R 2.7. Os mapas foram construídos no ArcMap 9.2.

As informações da parte paramétrica do ajuste estão na Tabela 1. Uma análise de

deviance que compara os dois modelos ajustados nos dá uma deviance de 117,49 com 20 graus

de liberdade, mostrando que a inclusão das covariáveis à análise espacial é altamente

significativa (p-valor<0,0001 para um teste χ2 ).

Tabela 1: Medidas obtidas através do ajuste do modelo semiparamétrico (covariáveis e espaço). N=2323. Piracicaba (SP), 2007. leves versus controles graves versus controles

OR LI(OR) LS(OR) OR LI(OR) LS(OR)

Idade 0,97 0,96 0,97 0,99 0,98 1,00

Anos de Escolariadade 0,94 0,92 0,96 0,96 0,92 1,00

Sexo Feminino 1,00 - - 1,00 - -

Masculino 1,84 1,49 2,28 2,37 1,60 3,52

Grupos de Ocupação Serviços 1,00 - - 1,00 - -

Cientista 1,20 0,83 1,73 1,02 0,51 2,04

Administração 0,79 0,43 1,46 1,32 0,55 3,18

Agropecuária 1,90 1,09 3,31 2,22 0,87 5,66

Manutenção 1,57 1,15 2,14 1,59 0,90 2,80

Operário 1,44 1,18 1,75 1,60 1,12 2,27

Técnico 1,14 0,89 1,46 1,78 1,20 2,63

Indefinido 2,20 1,61 3,00 1,56 0,76 3,19 OR: Odds Ratio; LI: 95% Limite Inferior; LS: 95% Limite Superior.

Os RREE obtidos através do modelo apenas espacial podem ser visualizados na Figura

2, e os obtidos com a inclusão de covariáveis, na Figura 3.

Figura 2: Distribuição espacial do risco relativo de acidentes de trabalho. Modelo apenas espacial. Piracicaba (Brazil), 2007. A) Risco de casos leves em relação aos controles. B) Risco de casos graves em relação aos controles.

Figura 3: Distribuição espacial do risco relativo de acidentes de trabalho. Modelo com espaço, idade, escolaridade, sexo e grupo de ocupação. Piracicaba (Brazil), 2007. A) Risco de casos leves em relação aos controles. B) Risco de casos graves em relação aos controles.

Discussão

Na análise de acidentes de trabalho foram encontradas áreas de risco e de proteção

significativas ainda que com a inclusão de covariáveis, sendo que estas variaram conforme o tipo

de caso analisado, algo que ressalta a importância das análises multinomiais, quando estas são

adequadas.

Este trabalho apresenta o caminho completo para uma análise espacial de estudos caso-

controle com resposta multnomial e ainda permite a inclusão de covariáveis.

Tal análise permite a identificação de áreas específicas, auxiliando no planejamento de

ações de controle dos agravos, que poderão ter enfoque no tipo específico de caso.

Referências

1. Abreu MNS, Siqueira AL, Cardoso CS, Caiaffa WT. Ordinal logistic regression models:

application in quality of lifes studies. Cadernos de Saúde Pública 2008;24(Sup 4):S581-S591.

2. French JL, Wand MP. Generalized additive models for cancer mapping with incomplete

covariates. Biostatistics 2004, 5(2):177-191.

3. Ozonoff A, Webster T, Vieira V, Weinberg J, Ozonoff D, Aschengrau A. Cluster

detection methods applied to the Upper Cape Cod cancer data. Environ. Health. 2005; 4:19.

4. Shimakura SE, Carvalho MS, Aerts DRGC, Flores R. Distribuição espacial do risco:

modelagem da mortalidade infantil em Porto Alegre, RS, Brasil. Cad. Saúde Pública 2001;

17(5):1251-61.

5. Zangirolanie LT, Cordeiro R, de Medeiros MA, Stephan C. Spatial distribution of risks

for work-related injuries in a city of Southeastern Brazil.Rev. Saúde Pública. 2008; 42(2): 287-

93.

6. Bithell JF. An application of density estimation to geographical epidemiology. Stat Med

1990;9(6):691-701.

7. Kelsall JE, Diggle PJ. Kernel estimation of relative risk. Bernoulli 1995;1(1-2):03-16.

8. Campbell PT, Sloan M, Kreiger N. Utility of proxy versus index respondent information

in a population-based case-control study of rapidly fatal cancers. Ann Epidemiol.

2007;17(4):253-7.

9. Chiu BC, Dave BJ, Blair A, Gapstur SM, Chmiel JS, Fought AJ, Zahm SH,

Weisenburger DD. Cigarette smoking, familial hematopoietic cancer, hair dye use, and risk of

t(14;18)-defined subtypes of non-Hodgkin's lymphoma. Am J Epidemiol. 2007;165(6):652-9.

10. Haelterman E, Marcoux S, Croteau A, Dramaix M. Population-based study on

occupational risk factors for preeclampsia and gestational hypertension. Scand J Work Environ

Health. 2007;33(4):304-17.

11. Mafra ACCN, Nucci LB, Cordeiro R, Stephan C. Case-control studies with multinomial

responses:a proposal for analysis [portuguese]. Cadernos de Saúde Pública [IN PRESS].

12. Song XY, Lee SY, Ng MC, So WY, Chan JC. Bayesian analysis of structural equation

models with multinomial variables and an application to type 2 diabetic nephropathy. Stat Med.

2007;26(11):2348-69.

13. Agresti A. Catergorical data analysis. 2nd Ed. New York: John Wiley & Sons; 2002.

14. Stephan C. Distribuição do risco de acidente do trabalho entre trabalhadores

precarizados de Piracicaba. - Campinas, SP : [Tese de Doutorado], Faculdade de Ciências

Médicas, 2008.

15. Kelsall JE, Diggle PJ. Spatial variation in risk of disease: a nonparametric binary

regression approach. Journal of the Royal Statistical Society (Series C): Applied Statistics

1998;47(4):559-573.

16. Bailey TC, Cordeiro R, Lourenço RW. Semiparametric Modeling of the Spatial

Distribution of Occupational Accident Risk in the Casual Labor Market, Piracicaba, Southeast

Brazil. Risk Analysis 2007;27(2):421-431.

17. Hastie TJ, Tibshirani RJ. Generalized additive models. London: Chapman and Hall;

1990.