estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de voronoi...

54
Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1 , Gladston J. P. Moreira 1,2 , Denise Burgarelli 1 , Ricardo H.C. Takahashi 1 , Flávia C. O. Magalhães 3 , Emerson C. Bodevan 4 1 Universidade Federal de Minas Gerais 2 Universidade Federal de Ouro Preto 3 Prefeitura de Belo Horizonte XI MGEST – 2012 - Universidade Federal de Ouro Preto

Upload: internet

Post on 17-Apr-2015

107 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi

Luiz H. Duczmal 1 , Gladston J. P. Moreira 1,2 , Denise Burgarelli 1 , Ricardo H.C. Takahashi 1 , Flávia C. O. Magalhães 3 , Emerson C. Bodevan 4

1 Universidade Federal de Minas Gerais 2 Universidade Federal de Ouro Preto3 Prefeitura de Belo Horizonte 4 Universidade Federal de Vale do Jequitinhonha e Mucuri

XI MGEST – 2012 - Universidade Federal de Ouro Preto

Page 2: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Voronoi distance based prospective space-time scans for point data sets: a dengue fever cluster

analysis in a southeast Brazilian town

Luiz H. Duczmal, Gladston J. P. Moreira, Denise Burgarelli, Ricardo H. C. Takahashi,

Flávia C. O. Magalhães, Emerson C. Bodevan

International Journal of Health Geographics, 2011, 10:29.

Page 3: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

OBJETIVO

Apresentamos um novo método muito rápido baseado na Estatística Scan Prospectiva Espaço-Temporal para detectar clusters em mapas de dados pontuais.

Nosso objetivo é detectar tão cedo quanto possível o aparecimento de clusters emergentes de indivíduos sindrômicos devido a um surto real de doença em meio a ruído, em um mapa com população de risco heterogênea georeferenciada.

Page 4: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise
Page 5: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi

Um método muito rápido é construído para a detecção e inferência de clusters espaço-temporais de dados pontuais de casos e controles. No diagrama de Voronoi para o conjunto de indivíduos, o número de células interceptadas pelo segmento unindo pares de casos é usado como peso de arestas para produzir uma árvore geradora mínima. As arestas são retiradas em sequência, produzindo um reduzido número de candidatos a cluster, que são a seguir avaliados por uma estatística scan prospectiva modificada. A significância é calculada por Monte Carlo.

Analisamos um estudo de campo de casos e controles geo-referenciados de dengue numa cidade em Minas Gerais, em colaboração com o Programa de Saúde da Família.

Page 6: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

O QUE SE SABE

Estatísticas Scan são altamente bem sucedidas para a avaliação de clusters espaciais (Kulldorff 1997) e clusters espaço-temporais (Kulldorff 2001).

Page 7: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Dentre os N indivíduos, n são casos e N-n são controles.Para cada círculo de raio r>0 centrado em cada indivíduo, seja z o conjunto de indivíduos dentro do círculo (cluster). Seja a coleção de todos os conjuntos assim obtidos. Seja = número observado de casos em z. = número esperado de casos em z.Zc

ZZ cn

Z

Z

c

Z

Z

n

cnczLR

)( ZZc se

e LR(z)=0, caso contrário.

Z

A Estatística Espacial Scan Circular (Kulldorff, 1997)

Pode-se provar que LR(z) é uma razão de verossimilhança.

Defina

A estatística scan é definida como

).(logmax)(max zLRzLLRQQ

Q

Page 8: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Lancashire, UK, 1973-84 . Casos de cancer de laringe/controles. Os clusters candidatos são as coleções de indivíduos contidos nos

círculos de raios arbitrários e centrados nos indivíduos.

Page 9: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Lancashire, UK, 1973-84 . Casos de cancer de laringe/controles. Os clusters candidatos são as coleções de indivíduos contidos nos

círculos de raios arbitrários e centrados nos indivíduos.

Page 10: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Lancashire, UK, 1973-84 . Casos de cancer de laringe/controles. Os clusters candidatos são as coleções de indivíduos contidos nos

círculos de raios arbitrários e centrados nos indivíduos.

Page 11: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Lancashire, UK, 1973-84 . Casos de cancer de laringe/controles. Os clusters candidatos são as coleções de indivíduos contidos nos

círculos de raios arbitrários e centrados nos indivíduos.

Page 12: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Lancashire, UK, 1973-84 . Casos de cancer de laringe/controles. Os clusters candidatos são as coleções de indivíduos contidos nos

círculos de raios arbitrários e centrados nos indivíduos.

Page 13: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Lancashire, UK, 1973-84 . Casos de cancer de laringe/controles. Os clusters candidatos são as coleções de indivíduos contidos nos

círculos de raios arbitrários e centrados nos indivíduos.

Page 14: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

O QUE SE SABE

Recentemente, conceitos de teoria dos grafos foram aplicados na avaliação de clusters de áreas (Duczmal et al. 2006, 2008, Yiannakoulias et al. 2007, Duarte et al. 2009, Cançado et al. 2010, de Lima & Duczmal 2011).

Wieland et al. (2007) introduziu um método baseado em grafos para detectar clusters de formato arbitrário baseado na árvore geradora mínima do cartograma de um mapa de pontos georeferenciados.

Page 15: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Wieland S. C. et al. PNAS 2007;104:9404-9409

Árvore Geradora Mínima Euclideana de Equalização de Densidade

(1) Procedimento para distorcer o mapa, mantendo tamanhos iguais para todas as áreas.

Este é um passo computacionalmente muito caro e complicado, que requer a solução numérica de um sistema de equações diferenciais

parciais não lineares

©2007 by National Academy of Sciences

Page 16: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

(2) Procedimento para determinar os clusters candidatos, ilustrado para um conjunto de 15 casos.

©2007 by National Academy of Sciences

The Density-Equalizing Euclidean Minimum Spanning Tree

Wieland S C et al. PNAS 2007;104:9404-9409

Page 17: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Estatística scan de dados pontuais baseada na distância de Voronoi

Mapa de casos e controles

Page 18: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

(1) Construa o Diagrama de Voronoi para o mapa,incluindo todos os casos e controles

Estatística scan de dados pontuais baseada na distância de Voronoi

Page 19: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Ao invés de distorcer o mapa e usar a métrica Euclideana para construir a árvore geradora mínima, nós definimos uma métrica diferente para medir a distância entre dois casos, baseda no Diagrama de Voronoi.

Estatística scan de dados pontuais baseada na distância de Voronoi

Page 20: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Definimos a distância de Voronoi entre dois casos como sendo o número de cruzamentos de fronteiras de células no

segmento que une os dois casos.

Estatística scan de dados pontuais baseada na distância de Voronoi

Ao invés de distorcer o mapa e usar a métrica Euclideana para construir a árvore geradora mínima, nós definimos uma métrica diferente para medir a distância entre dois casos, baseda no Diagrama de Voronoi.

Page 21: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

(2) Construa o grafo completo realizado por segmentos retos ligando os casos, com pesos nas arestas dados pela distância de Voronoi;

Estatística scan de dados pontuais baseada na distância de Voronoi

Page 22: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

A distância de Voronoi leva em conta a heterogeneidade da população

Estatística scan de dados pontuais baseada na distância de Voronoi

Definimos a distância de Voronoi entre dois casos como sendo o número de cruzamentos de fronteiras de células no

segmento que une os dois casos.

Ao invés de distorcer o mapa e usar a métrica Euclideana para construir a árvore geradora mínima, nós definimos uma métrica diferente para medir a distância entre dois casos, baseda no Diagrama de Voronoi.

Page 23: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

O conceito é uma aproximação da integral de linha da função de densidade da população ao longo da linha que une dois casos.

Estatística scan de dados pontuais baseada na distância de Voronoi

Definimos a distância de Voronoi entre dois casos como sendo o número de cruzamentos de fronteiras de células no

segmento que une os dois casos.

Ao invés de distorcer o mapa e usar a métrica Euclideana para construir a árvore geradora mínima, nós definimos uma métrica diferente para medir a distância entre dois casos, baseda no Diagrama de Voronoi.

A distância de Voronoi leva em conta a heterogeneidade da população

Page 24: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Estatística scan de dados pontuais baseada na distância de Voronoi

(2) Construa o grafo completo realizado por segmentos retos ligando os casos, com pesos nas arestas dados pela distância de Voronoi;

Page 25: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

(3) Construa a árvore geradora mínima do grafo completo;

Estatística scan de dados pontuais baseada na distância de Voronoi

Page 26: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

(4) Remova a aresta mais longa restante, produzindo 2 novos candidatos a cluster (desempate pela distância Euclideana);

Estatística scan de dados pontuais baseada na distância de Voronoi

Page 27: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Estatística scan de dados pontuais baseada na distância de Voronoi

(4) Remova a aresta mais longa restante, produzindo 2 novos candidatos a cluster (desempate pela distância Euclideana);

Page 28: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Estatística scan de dados pontuais baseada na distância de Voronoi

(4) Remova a aresta mais longa restante, produzindo 2 novos candidatos a cluster (desempate pela distância Euclideana);

Page 29: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Estatística scan de dados pontuais baseada na distância de Voronoi

(4) Remova a aresta mais longa restante, produzindo 2 novos candidatos a cluster (desempate pela distância Euclideana);

Page 30: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Com isso evitamos o passo mais caro do método DEEMST !

Estatística scan de dados pontuais baseada na distância de Voronoi

Definimos a distância de Voronoi entre dois casos como sendo o número de cruzamentos de fronteiras de células no

segmento que une os dois casos.

Ao invés de distorcer o mapa e usar a métrica Euclideana para construir a árvore geradora mínima, nós definimos uma métrica diferente para medir a distância entre dois casos, baseda no Diagrama de Voronoi.

A distância de Voronoi leva em conta a heterogeneidade da população

O conceito é uma aproximação da integral de linha da função de densidade da população ao longo da linha que une dois casos.

Page 31: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Além disso, a distância de Voronoi é usada para definir a população (ou equivalentemente, o número de casos

esperados) dentro da “área de influência” de cada caso.

Page 32: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Agora, a estatística espacial scan pode ser usada !

Além disso, a distância de Voronoi é usada para definir a população (ou equivalentemente, o número de casos

esperados) dentro da “área de influência” de cada caso.

Page 33: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

(5) Calcule a estatística espacial scan para os(apenas!) 2N-1 candidatos a cluster e selecione o melhor.

Estatística scan de dados pontuais baseada na distância de Voronoi

Page 34: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise
Page 35: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise
Page 36: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Árvore Geradora Mínima Euclideana Lancashire, UK, cancer de laringe (57 casos) e cancer de

pulmão (974 controles).

Page 37: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Árvore Geradora Mínima de Voronoi Lancashire, UK, cancer de laringe (57 casos) e cancer de

pulmão (974 controles).

Page 38: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Estatística scan prospectiva espaço-temporal (Kulldorff 2001)

• Considera todos os possíveis cilindros z X [s,t] no domínio espaço-temporal.• Período de estudo: [Y1, Y2]• Para os dados observados, o LLR é maximizado sobre todos

os cilindros na janela temporal [s, t], tais que Y1<=s<=t=Y2.• Para os dados simulados, o LLR é maximizado sobre todos

os cilindros na janela temporal [s, t], tais que Y1<=s<=t<=Y2 (ajustando para testes múltiplos).

• A janela espacial z pode ser circular, elíptica ou irregular.

Page 39: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Estatística scan prospectiva espaço-temporal baseada na distância de Voronoi

• Especificamos um parâmetro d para indicar o máximo gap temporal permitido dentro do candidato a cluster.

• Seja P(T) o conjunto de coordenadas geográficas dos N − n controles e os n(T) casos presentes no intervalo de tempo T= [s, t].

• O diagrama de P(T) e a distância de Voronoi são definidos similarmente.

Page 40: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

• Seja t(i) o instante de ocorrência da doença do i-ésimo caso, localizado em (x(i),y(i)), i = 1, ..., n(T).

• Seja D(T) = {c(i): i = 1, ..., n(T)} o conjunto de casos no intervalo T=[s,t], com s ≤ t(i) ≤ t.

• Dois casos c(i) e c(j) distintos em D(T) serão conectados quando |t(i)-t(j)|<=d.

• O subgrafo tem conjunto de vértices V(T)=D(T) e conjunto de arestas

• Os pesos das arestas são definidos similarmente.• O procedimento é repetido para todo intervalo

T=[s,t] com Y1<=s<=t<=Y2.

d}|t(j)-t(i)| j,i D(T),c(j)c(i), :c(j)){(c(i),E(T)

Page 41: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Simulações de Monte Carlo para clusters artificiais espaço-temporais

Três formatos de cluster:

Page 42: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise
Page 43: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

ClusterModel

Power PPV Sensitivity

VBScan Elliptic VBScan Elliptic VBScan Elliptic

Cylinder 0.6072 0.4789 0.6763 0.6415 0.6762 0.5447

Cone 0.4540 0.3863 0.6078 0.5822 0.6025 0.4683

L-shape 0.5115 0.3316 0.5980 0.5323 0.6301 0.4530

Table 1 – Power, PPV and sensitivity for three space time clusters,comparing C5 with the Prospective Elliptic Scan (Kulldorff 2001).

Simulações de Monte Carlo para clusters artificiais espaço-temporais

Page 44: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Dengue em Lassance, MG

No período de seis meses, entre 12 de janeiro a 14 de junho de 2010, um total de 57 casos foram reportados para um total de 3986 indivíduos na população de risco.

Page 45: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise
Page 46: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise
Page 47: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise
Page 48: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise
Page 49: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise
Page 50: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise
Page 51: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise
Page 52: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

CONCLUSIONS

We have proposed a space-time cluster scan for case event data.

For all three shaped clusters our scan has better performance compared with the prospective elliptic scan.

It is much faster than the density-equalizing Euclidean minimum spanning trees algorithm and the elliptic scan.

It also is significantly better than the Euclidean metric MST scan.

Page 53: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise

Obrigado pela atenção !

[email protected]

Page 54: Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi Luiz H. Duczmal 1, Gladston J. P. Moreira 1,2, Denise