estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de voronoi...

Post on 17-Apr-2015

107 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi

Luiz H. Duczmal 1 , Gladston J. P. Moreira 1,2 , Denise Burgarelli 1 , Ricardo H.C. Takahashi 1 , Flávia C. O. Magalhães 3 , Emerson C. Bodevan 4

1 Universidade Federal de Minas Gerais 2 Universidade Federal de Ouro Preto3 Prefeitura de Belo Horizonte 4 Universidade Federal de Vale do Jequitinhonha e Mucuri

XI MGEST – 2012 - Universidade Federal de Ouro Preto

Voronoi distance based prospective space-time scans for point data sets: a dengue fever cluster

analysis in a southeast Brazilian town

Luiz H. Duczmal, Gladston J. P. Moreira, Denise Burgarelli, Ricardo H. C. Takahashi,

Flávia C. O. Magalhães, Emerson C. Bodevan

International Journal of Health Geographics, 2011, 10:29.

OBJETIVO

Apresentamos um novo método muito rápido baseado na Estatística Scan Prospectiva Espaço-Temporal para detectar clusters em mapas de dados pontuais.

Nosso objetivo é detectar tão cedo quanto possível o aparecimento de clusters emergentes de indivíduos sindrômicos devido a um surto real de doença em meio a ruído, em um mapa com população de risco heterogênea georeferenciada.

Estatística scan prospectiva de espaço-tempo para dados pontuais baseada na distância de Voronoi

Um método muito rápido é construído para a detecção e inferência de clusters espaço-temporais de dados pontuais de casos e controles. No diagrama de Voronoi para o conjunto de indivíduos, o número de células interceptadas pelo segmento unindo pares de casos é usado como peso de arestas para produzir uma árvore geradora mínima. As arestas são retiradas em sequência, produzindo um reduzido número de candidatos a cluster, que são a seguir avaliados por uma estatística scan prospectiva modificada. A significância é calculada por Monte Carlo.

Analisamos um estudo de campo de casos e controles geo-referenciados de dengue numa cidade em Minas Gerais, em colaboração com o Programa de Saúde da Família.

O QUE SE SABE

Estatísticas Scan são altamente bem sucedidas para a avaliação de clusters espaciais (Kulldorff 1997) e clusters espaço-temporais (Kulldorff 2001).

Dentre os N indivíduos, n são casos e N-n são controles.Para cada círculo de raio r>0 centrado em cada indivíduo, seja z o conjunto de indivíduos dentro do círculo (cluster). Seja a coleção de todos os conjuntos assim obtidos. Seja = número observado de casos em z. = número esperado de casos em z.Zc

ZZ cn

Z

Z

c

Z

Z

n

cnczLR

)( ZZc se

e LR(z)=0, caso contrário.

Z

A Estatística Espacial Scan Circular (Kulldorff, 1997)

Pode-se provar que LR(z) é uma razão de verossimilhança.

Defina

A estatística scan é definida como

).(logmax)(max zLRzLLRQQ

Q

Lancashire, UK, 1973-84 . Casos de cancer de laringe/controles. Os clusters candidatos são as coleções de indivíduos contidos nos

círculos de raios arbitrários e centrados nos indivíduos.

Lancashire, UK, 1973-84 . Casos de cancer de laringe/controles. Os clusters candidatos são as coleções de indivíduos contidos nos

círculos de raios arbitrários e centrados nos indivíduos.

Lancashire, UK, 1973-84 . Casos de cancer de laringe/controles. Os clusters candidatos são as coleções de indivíduos contidos nos

círculos de raios arbitrários e centrados nos indivíduos.

Lancashire, UK, 1973-84 . Casos de cancer de laringe/controles. Os clusters candidatos são as coleções de indivíduos contidos nos

círculos de raios arbitrários e centrados nos indivíduos.

Lancashire, UK, 1973-84 . Casos de cancer de laringe/controles. Os clusters candidatos são as coleções de indivíduos contidos nos

círculos de raios arbitrários e centrados nos indivíduos.

Lancashire, UK, 1973-84 . Casos de cancer de laringe/controles. Os clusters candidatos são as coleções de indivíduos contidos nos

círculos de raios arbitrários e centrados nos indivíduos.

O QUE SE SABE

Recentemente, conceitos de teoria dos grafos foram aplicados na avaliação de clusters de áreas (Duczmal et al. 2006, 2008, Yiannakoulias et al. 2007, Duarte et al. 2009, Cançado et al. 2010, de Lima & Duczmal 2011).

Wieland et al. (2007) introduziu um método baseado em grafos para detectar clusters de formato arbitrário baseado na árvore geradora mínima do cartograma de um mapa de pontos georeferenciados.

Wieland S. C. et al. PNAS 2007;104:9404-9409

Árvore Geradora Mínima Euclideana de Equalização de Densidade

(1) Procedimento para distorcer o mapa, mantendo tamanhos iguais para todas as áreas.

Este é um passo computacionalmente muito caro e complicado, que requer a solução numérica de um sistema de equações diferenciais

parciais não lineares

©2007 by National Academy of Sciences

(2) Procedimento para determinar os clusters candidatos, ilustrado para um conjunto de 15 casos.

©2007 by National Academy of Sciences

The Density-Equalizing Euclidean Minimum Spanning Tree

Wieland S C et al. PNAS 2007;104:9404-9409

Estatística scan de dados pontuais baseada na distância de Voronoi

Mapa de casos e controles

(1) Construa o Diagrama de Voronoi para o mapa,incluindo todos os casos e controles

Estatística scan de dados pontuais baseada na distância de Voronoi

Ao invés de distorcer o mapa e usar a métrica Euclideana para construir a árvore geradora mínima, nós definimos uma métrica diferente para medir a distância entre dois casos, baseda no Diagrama de Voronoi.

Estatística scan de dados pontuais baseada na distância de Voronoi

Definimos a distância de Voronoi entre dois casos como sendo o número de cruzamentos de fronteiras de células no

segmento que une os dois casos.

Estatística scan de dados pontuais baseada na distância de Voronoi

Ao invés de distorcer o mapa e usar a métrica Euclideana para construir a árvore geradora mínima, nós definimos uma métrica diferente para medir a distância entre dois casos, baseda no Diagrama de Voronoi.

(2) Construa o grafo completo realizado por segmentos retos ligando os casos, com pesos nas arestas dados pela distância de Voronoi;

Estatística scan de dados pontuais baseada na distância de Voronoi

A distância de Voronoi leva em conta a heterogeneidade da população

Estatística scan de dados pontuais baseada na distância de Voronoi

Definimos a distância de Voronoi entre dois casos como sendo o número de cruzamentos de fronteiras de células no

segmento que une os dois casos.

Ao invés de distorcer o mapa e usar a métrica Euclideana para construir a árvore geradora mínima, nós definimos uma métrica diferente para medir a distância entre dois casos, baseda no Diagrama de Voronoi.

O conceito é uma aproximação da integral de linha da função de densidade da população ao longo da linha que une dois casos.

Estatística scan de dados pontuais baseada na distância de Voronoi

Definimos a distância de Voronoi entre dois casos como sendo o número de cruzamentos de fronteiras de células no

segmento que une os dois casos.

Ao invés de distorcer o mapa e usar a métrica Euclideana para construir a árvore geradora mínima, nós definimos uma métrica diferente para medir a distância entre dois casos, baseda no Diagrama de Voronoi.

A distância de Voronoi leva em conta a heterogeneidade da população

Estatística scan de dados pontuais baseada na distância de Voronoi

(2) Construa o grafo completo realizado por segmentos retos ligando os casos, com pesos nas arestas dados pela distância de Voronoi;

(3) Construa a árvore geradora mínima do grafo completo;

Estatística scan de dados pontuais baseada na distância de Voronoi

(4) Remova a aresta mais longa restante, produzindo 2 novos candidatos a cluster (desempate pela distância Euclideana);

Estatística scan de dados pontuais baseada na distância de Voronoi

Estatística scan de dados pontuais baseada na distância de Voronoi

(4) Remova a aresta mais longa restante, produzindo 2 novos candidatos a cluster (desempate pela distância Euclideana);

Estatística scan de dados pontuais baseada na distância de Voronoi

(4) Remova a aresta mais longa restante, produzindo 2 novos candidatos a cluster (desempate pela distância Euclideana);

Estatística scan de dados pontuais baseada na distância de Voronoi

(4) Remova a aresta mais longa restante, produzindo 2 novos candidatos a cluster (desempate pela distância Euclideana);

Com isso evitamos o passo mais caro do método DEEMST !

Estatística scan de dados pontuais baseada na distância de Voronoi

Definimos a distância de Voronoi entre dois casos como sendo o número de cruzamentos de fronteiras de células no

segmento que une os dois casos.

Ao invés de distorcer o mapa e usar a métrica Euclideana para construir a árvore geradora mínima, nós definimos uma métrica diferente para medir a distância entre dois casos, baseda no Diagrama de Voronoi.

A distância de Voronoi leva em conta a heterogeneidade da população

O conceito é uma aproximação da integral de linha da função de densidade da população ao longo da linha que une dois casos.

Além disso, a distância de Voronoi é usada para definir a população (ou equivalentemente, o número de casos

esperados) dentro da “área de influência” de cada caso.

Agora, a estatística espacial scan pode ser usada !

Além disso, a distância de Voronoi é usada para definir a população (ou equivalentemente, o número de casos

esperados) dentro da “área de influência” de cada caso.

(5) Calcule a estatística espacial scan para os(apenas!) 2N-1 candidatos a cluster e selecione o melhor.

Estatística scan de dados pontuais baseada na distância de Voronoi

Árvore Geradora Mínima Euclideana Lancashire, UK, cancer de laringe (57 casos) e cancer de

pulmão (974 controles).

Árvore Geradora Mínima de Voronoi Lancashire, UK, cancer de laringe (57 casos) e cancer de

pulmão (974 controles).

Estatística scan prospectiva espaço-temporal (Kulldorff 2001)

• Considera todos os possíveis cilindros z X [s,t] no domínio espaço-temporal.• Período de estudo: [Y1, Y2]• Para os dados observados, o LLR é maximizado sobre todos

os cilindros na janela temporal [s, t], tais que Y1<=s<=t=Y2.• Para os dados simulados, o LLR é maximizado sobre todos

os cilindros na janela temporal [s, t], tais que Y1<=s<=t<=Y2 (ajustando para testes múltiplos).

• A janela espacial z pode ser circular, elíptica ou irregular.

Estatística scan prospectiva espaço-temporal baseada na distância de Voronoi

• Especificamos um parâmetro d para indicar o máximo gap temporal permitido dentro do candidato a cluster.

• Seja P(T) o conjunto de coordenadas geográficas dos N − n controles e os n(T) casos presentes no intervalo de tempo T= [s, t].

• O diagrama de P(T) e a distância de Voronoi são definidos similarmente.

• Seja t(i) o instante de ocorrência da doença do i-ésimo caso, localizado em (x(i),y(i)), i = 1, ..., n(T).

• Seja D(T) = {c(i): i = 1, ..., n(T)} o conjunto de casos no intervalo T=[s,t], com s ≤ t(i) ≤ t.

• Dois casos c(i) e c(j) distintos em D(T) serão conectados quando |t(i)-t(j)|<=d.

• O subgrafo tem conjunto de vértices V(T)=D(T) e conjunto de arestas

• Os pesos das arestas são definidos similarmente.• O procedimento é repetido para todo intervalo

T=[s,t] com Y1<=s<=t<=Y2.

d}|t(j)-t(i)| j,i D(T),c(j)c(i), :c(j)){(c(i),E(T)

Simulações de Monte Carlo para clusters artificiais espaço-temporais

Três formatos de cluster:

ClusterModel

Power PPV Sensitivity

VBScan Elliptic VBScan Elliptic VBScan Elliptic

Cylinder 0.6072 0.4789 0.6763 0.6415 0.6762 0.5447

Cone 0.4540 0.3863 0.6078 0.5822 0.6025 0.4683

L-shape 0.5115 0.3316 0.5980 0.5323 0.6301 0.4530

Table 1 – Power, PPV and sensitivity for three space time clusters,comparing C5 with the Prospective Elliptic Scan (Kulldorff 2001).

Simulações de Monte Carlo para clusters artificiais espaço-temporais

Dengue em Lassance, MG

No período de seis meses, entre 12 de janeiro a 14 de junho de 2010, um total de 57 casos foram reportados para um total de 3986 indivíduos na população de risco.

CONCLUSIONS

We have proposed a space-time cluster scan for case event data.

For all three shaped clusters our scan has better performance compared with the prospective elliptic scan.

It is much faster than the density-equalizing Euclidean minimum spanning trees algorithm and the elliptic scan.

It also is significantly better than the Euclidean metric MST scan.

Obrigado pela atenção !

duczmal@ufmg.br

top related