capítulo 1 classificação estatística e predição da doença...

26
Capítulo 1 Classificação Estatística e Predição da Doença de Alzheimer por meio de Imagens Médicas do Encéfalo Humano Michel Pereira Fernandes * , João Ricardo Sato, Geraldo Busatto Filho e Carlos Eduardo Thomaz Resumo: O aumento da expectativa de vida populacional ocasio- nou um aumento na prevalˆ encia de demˆ encias degenerativas como a Doen¸ca de Alzheimer (DA). Como n˜ ao h´a cura, o desafio´ e a anteci- pa¸c˜aododiagn´osticoetratamentoatrav´ es dos casos do Transtorno Cognitivo Leve (TCL), que tem alto grau de convers˜ao para DA. Identificar nos casos do TCL quais converter˜ ao para DA ´ e o princi- pal objetivo. ´ E proposto o uso de ferramentas de automa¸c˜ao compu- tacional atrav´ es de modelos estat´ ısticos para avaliar as informa¸c˜ oes extra´ ıdas das imagens m´ edicas. An´alises mostram que a metodolo- gia ´ epromissoracomconfirma¸c˜aocl´ ınica de 80% e antecedˆ encia de at´ e 4 anos. Palavras-chave: Mapeamento Estat´ ıstico; Imagem por Ressonˆ an- cia Magn´ etica; Morfometria Baseado em Voxel. Abstract:The increase in life expectancy has led to a population in- crease in the prevalence of degenerative dementias such as Alzhei- mer’s Disease (AD). Since there is no cure, the challenge nowadays is to anticipate the diagnosis and treatment by analysis of cases of Mild Cognitive Impairment (MCI), which is known to have a high degree of conversion to AD. Thus, identifying which MCI cases will convert to AD has been the main goal. In this work, we propose the use of computational tools based on statistical models to evaluate the information extracted from medical images. Our experimental results show that the methodology is promising with clinical con- firmation of 80% and, in some subjects, with up to four years in advance. Keywords: Statistical Mapping; Magnetic Resonance Imaging; Vo- xel Based Morfometry * Autor para contato: [email protected] Neves et al. (Eds.), Avanços em Visão Computacional (2012) DOI: 10.7436/2012.avc.1 ISBN 978-85-64619-09-8

Upload: doandang

Post on 13-Dec-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Capítulo 1

Classificação Estatística e Prediçãoda Doença de Alzheimer por meio de Imagens Médicas

do Encéfalo Humano

Michel Pereira Fernandes∗, João Ricardo Sato,Geraldo Busatto Filho e Carlos Eduardo Thomaz

Resumo: O aumento da expectativa de vida populacional ocasio-nou um aumento na prevalencia de demencias degenerativas como aDoenca de Alzheimer (DA). Como nao ha cura, o desafio e a anteci-pacao do diagnostico e tratamento atraves dos casos do TranstornoCognitivo Leve (TCL), que tem alto grau de conversao para DA.Identificar nos casos do TCL quais converterao para DA e o princi-pal objetivo. E proposto o uso de ferramentas de automacao compu-tacional atraves de modelos estatısticos para avaliar as informacoesextraıdas das imagens medicas. Analises mostram que a metodolo-gia e promissora com confirmacao clınica de 80% e antecedencia deate 4 anos.

Palavras-chave: Mapeamento Estatıstico; Imagem por Ressonan-cia Magnetica; Morfometria Baseado em Voxel.

Abstract:The increase in life expectancy has led to a population in-crease in the prevalence of degenerative dementias such as Alzhei-mer’s Disease (AD). Since there is no cure, the challenge nowadaysis to anticipate the diagnosis and treatment by analysis of cases ofMild Cognitive Impairment (MCI), which is known to have a highdegree of conversion to AD. Thus, identifying which MCI cases willconvert to AD has been the main goal. In this work, we propose theuse of computational tools based on statistical models to evaluatethe information extracted from medical images. Our experimentalresults show that the methodology is promising with clinical con-firmation of 80% and, in some subjects, with up to four years inadvance.

Keywords: Statistical Mapping; Magnetic Resonance Imaging; Vo-xel Based Morfometry

∗Autor para contato: [email protected]

Neves et al. (Eds.), Avanços em Visão Computacional (2012) DOI: 10.7436/2012.avc.1 ISBN 978-85-64619-09-8

Page 2: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

2 Fernandes et al.

1. Introdução

O avanco da sociedade nas areas de saneamento, medicina, educacao ealimentacao, dentre outras areas, esta ocasionando um crescimento acele-rado da populacao idosa no mundo, aumentando a expectativa de vida daspessoas.

No Brasil, em 1900, segundo dados do IBGE (Instituto Brasileiro deGeografia e Estatıstica), a expectativa de vida ao nascer do brasileiro erade 33,7 anos. Em 2010, passou para 73,4 anos e a projecao para 2041 ede 80,09 anos. Em funcao destes dados apontarem para uma populacaoidosa em grande numero, e cada vez mais claro que a area dos transtornosneuropsiquiatricos associados ao envelhecimento representa um campo degrande importancia para a saude publica nacional, especialmente sobre oscustos envolvidos na assistencia das doencas (Forlenza & Almeida, 2006).Neste contexto, verifica-se que dentre as doencas relacionadas a transtornosneurologicos e a idade avancada, a Doenca de Alzheimer (DA) e a que maisprevalece chegando a responder pela quarta parte de todas as demenciasquando a pessoa acometida tem 85 anos ou mais (Forlenza & Almeida,2006).

A DA e caracterizada pelo comprometimento de funcoes cognitivas, ini-cialmente ligadas a memoria e avancando para outras areas como atencao,linguagem e funcoes executivas. Por essa razao, a medida que a doencaavanca mais severos sao os seus efeitos. Ainda que nao tenham sido de-senvolvidas ate hoje estrategias de tratamento de grande eficacia, variasalternativas terapeuticas que postergam a evolucao dos sintomas estao dis-ponıveis. Assim, e um desafio a antecipacao do diagnostico para que otratamento possa ser iniciado precocemente. Uma estrategia importantee a de identificacao dos casos de Transtorno Cognitivo Leve (TCL), querepresentam um estagio de pre-demencia. Como os casos de TCL apre-sentam alto grau de conversao para a DA, o desenvolvimento de metodosdiagnosticos que permitam prever a conversao de TCL para DA e de granderelevancia.

Este trabalho tem por objetivo a realizacao de um estudo estatısticosobre predicao da DA utilizando as informacoes discriminantes extraıdasde imagens medicas de ressonancia magnetica (RM) do cerebro humano.As informacoes extraıdas das imagens correspondem ao ponto de vistaanatomico e nao atraves de avaliacao clınica. Adicionalmente, objetiva-sevalidar na pratica se o modelo adotado esta correto por meio dos dados deseguimento clınico disponıveis no banco de dados utilizado. A validacao domodelo e importante, pois os casos de classificacao intermediaria poderaoter uma nova analise quando for realizado o sistema de predicao. Alemdisso, e possıvel confirmar os casos de conversao de pacientes com TCLpara DA do modelo utilizado por meio das informacoes clınicas disponıveis.

Page 3: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Classificação estatística e predição da doença de Alzheimer 3

Este capıtulo esta dividido em 4 secoes. A proxima secao apresenta ametodologia que foi utilizada sobretudo nos processos de pre-processamentode imagens e dos modelos estatısticos univariado e multivariado alem deapresentar a base de dados investigada. Na secao 3 sao abordados os ex-perimentos realizados e seus resultados. Por fim, na secao 4 e apresentadaa conclusao do trabalho.

2. Metodologia

Nesta secao sao apresentados os metodos investigados neste trabalho, queincluem os metodos de pre-processamento de imagens, extracao das carac-terısticas relevantes, classificacao e mapeamento estatıstico das informa-coes baseados em tres metodologias, que utilizam o modelo massivamenteunivariado, o modelo multivariado e a projecao de hiperplanos que e res-ponsavel, principalmente, por validar o modelo de classificacao utilizado.Por fim e apresentada a base de dados utilizada.

Figura 1. Imagem de RM estrutural disponibilizada pelo ADNI (sempre-processamento).

2.1 Pré-processamento de imagensAs etapas de pre-processamento de imagens medicas adotadas sao as se-guintes: (i) normalizacao, (ii) segmentacao e (iii) suavizacao. Estas etapasforam executadas dentro de um arcabouco computacional de analise de neu-roimagens, denominado Mapeamento Estatıstico Parametrico (MEP), quetorna possıvel a investigacao de diferencas locais na anatomia do cerebrohumano. Este arcabouco implementa o metodo de morfometria baseadaem voxel (Friston et al., 2007; Good et al., 2001) que, de forma sucinta, es-tima a distribuicao de probabilidade das intensidades dos voxels para gerarmapas estatısticos parametricos que possam determinar diferencas relevan-

Page 4: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

4 Fernandes et al.

tes ou testar hipoteses sobre efeitos regionais especıficos das amostras deinteresse (Friston et al., 1991).

2.1.1 Normalização espacialNa primeira etapa de pre-processamento e realizada a normalizacao espa-cial, que tem o objetivo de corrigir possıveis erros de aquisicao e permitir oregistro de imagens de pessoas diferentes atraves da estimativa de parame-tros de deformacao de um espaco anatomico padronizado, como o atlas deTalairach & Tournoux (1987) e que pode aumentar o numero de graus deliberdade permitido em um modelo estatıstico. O processo de normalizacaoespacial e evidenciado na Figura 2.

A normalizacao espacial padrao determina a transformacao espacialque minimiza a soma da diferenca de quadrados entre uma imagem e umacombinacao linear de um ou mais modelos padronizados (Friston et al.,2007). Inicia com um registro afim para combinar com o tamanho e aposicao da imagem, seguido por uma deformacao global nao-linear paracombinar a forma total do cerebro. Utiliza um modelo Bayesiano parasimultaneamente maximizar a suavizacao das deformacoes.

Figura 2. Processo de normalizacao espacial.

A estimativa de deformacao, na normalizacao espacial, pode usar umavariedade de modelos para o mapeamento, dentre eles: (i) a transformacaoafim de 12 parametros, que constituem uma matriz de transformacao espa-cial (translacao, rotacao, escala e cisalhamento) nas tres direcoes possıveis,(ii) as funcoes espaciais base de baixa frequencia (geralmente um conjuntocosseno ou polinomios) e (iii) um campo vetorial que especifica o mapea-mento para cada ponto de controle (por exemplo, o voxel). A estimativa

Page 5: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Classificação estatística e predição da doença de Alzheimer 5

dos parametros de todos estes modelos pode ser acomodada em um modeloBayesiano simples, em que se esta procurando encontrar os parametros dedeformacao θ que tem a maxima probabilidade a posteriori, definida porp(θ|y). A deformacao e atualizada iterativamente usando o metodo de re-gressao linear Gauss-Newton para maximizar p(θ|y) utilizando o princıpiode verossemelhanca (Friston et al., 2007).

2.1.2 SegmentaçãoA segmentacao da imagem bruta em substancia branca, substancia cin-zenta e lıquor serve para separar a regiao de interesse de acordo com arelevancia clınica de cada uma dessas substancias em um determinado es-tudo. Por exemplo, para o estudo da DA, os efeitos sao mais evidentes e osbiomarcadores mais predominantes na substancia cinzenta do que nas ou-tras regioes. A diferenciacao das substancias cerebrais e realizada atravesda identificacao de nıveis de intensidade de voxel que, posteriormente, saoseparados em classes especıficas para cada regiao, de acordo com a Equacao1 a seguir:

P (yi|ci = k, µk, σk) =1

(2πσ2k)exp

(− (yi − µk)2

2σ2k

), (1)

onde yi e a intensidade do voxel i, e µk e σ2k sao respectivamente a media

e a variancia da classe k. Os parametros µk e σ2k sao estimados a partir de

mapas de probabilidade a priori de tecidos sobrepostos. Esses mapas deprobabilidade de tecido foram construıdos pelo International Consortiumfor Brain Mapping, utilizando-se imagens por RM de cerebros adultos semdesordens cerebrais e representam tanto uma media de intensidades quantode posicionamentos espaciais dos voxels cerebrais.

2.1.3 SuavizaçãoNa ultima etapa, a suavizacao tem o papel de reduzir variacoes devidoa diferencas individuais na anatomia dos tecidos da substancia branca,substancia cinzenta e lıquor, atraves da aplicacao de um filtro gaussianoque faz com que a intensidade de cada voxel da imagem seja dada pelamedia ponderada dos valores dos voxels adjacentes, determinada pelo valorde comprimento do filtro, suavizando as bordas (Good et al., 2001). Alemdisso, esta etapa permite a uniformizacao dos dados estatisticamente paraque os erros associados a cada imagem sejam normalmente distribuıdos,portanto tende a aumentar a eficiencia do teste estatıstico parametrico(Friston et al., 1995).

2.2 Modelo estatístico massivamente univariadoO modelo estatıstico univariado e baseado no Modelo Linear Geral (MLG).O MLG expressa uma variavel de resposta verificada em termos de uma

Page 6: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

6 Fernandes et al.

combinacao linear das variaveis em conjunto com um termo de erro asso-ciado (Friston et al., 2007). O MLG e tambem conhecido como Analise deCovariancia ou Analise de Regressao Multipla dentre outros e inclui vari-antes mais simples como o Teste de Hipoteses (teste t) para as diferencasentre medias.

O MLG pode ser descrito sucintamente pela Equacao 2:

Y = Xβ + ε, (2)

onde Y e a matriz de resultados (dados de observacao), X e a matriz de va-riaveis que representa o desenho experimental ou matriz de delineamento,β e a matriz dos parametros estimados (contribuicao de cada componentena matriz de delineamento) e ε e a representacao do erro ou resıduo (di-ferenca entre os dados de observacao, Y , e o que foi predito pelo modelo,Xβ) associado a amostra utilizada, que se assume que seja independentee normalmente distribuıda (Friston et al., 1995a). A forma matricial daEquacao 3 considera o modelo MLG aplicado para cada n voxel analisado,em um estudo de imagem medica por RM, por exemplo, descrito por:

vetor(Y ) =

y1...yn

=

x1 · · · 0.... . .

...0 · · ·xn

β1...βn

+

ε1...εn

. (3)

2.2.1 Teste de hipótesesPara geracao dos mapas estatısticos univariados, utiliza-se comumente oteste t de Student para identificar diferencas estatisticamente significantesentre os grupos de imagens pre-processadas (Leao et al., 2010). O t valorde cada voxel (tk) e definido como a diferenca aritmetica entre as mediasde cada grupo de amostras ponderada pelo desvio padrao do espalhamentodas amostras, ou seja:

ti =x1,i − x2,i

σi√

1N1

+ 1N2

, (4)

onde x1,i e x2,i sao respectivamente as medias do voxel i para os grupos 1e 2 de amostras, σi e o desvio padrao ponderado de todas as amostras parao voxel i, e N1 e N2 os numeros totais de amostras do grupo 1 e do grupo2. O desvio padrao ponderado do conjunto de amostras e definido como:

σi =

√(N1 − 1)(σ1,i)2 + (N2 − 1)(σ2,i)2

N1 +N2 − 2, (5)

onde σ1,i e σ2,i sao respectivamente o desvio padrao do voxel i para osgrupos 1 e 2.

Page 7: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Classificação estatística e predição da doença de Alzheimer 7

Calculados os t valores dos voxels para os grupos de amostras anali-sados, pode-se utilizar o conceito de hipotese nula para definir as regioesdo cerebro que apresentam diferencas significativas. Para que a diferencaseja significativa, deve-se rejeitar a hipotese nula (H0) em favor da hipotesealternativa (Ha), descritas como:

H0 : µ1 = µ2, (6)

Ha : µ1 6= µ2. (7)

De acordo com a teoria do teste de hipoteses, dois tipos de erro podemexistir nessa analise: Erro do tipo I, isto e, rejeitar H0 quando esta everdadeira, ou seja, afirmar que existe diferenca estatıstica significativaquando ela nao existe; Erro do tipo II, ou seja, nao rejeitar H0 quando estae falsa, ou seja, afirmar que nao existe diferenca estatıstica significativaquando ela existe (Girardi et al., 2009). Normalmente, determina-se umnıvel de significancia α que representa na pratica uma taxa de erro tipoI aceitavel dado o grau de liberdade do estudo. Usualmente, o valor deα e fixado em 5%, 1% ou 0,1%. Assim, determinada arbitrariamente aprobabilidade α de se cometer o erro de tipo I e utilizando a diferencaentre a quantidade total de amostras e a quantidade de grupos como graude liberdade, calcula-se o valor da estatıstica do teste para cada voxel i.Se o valor absoluto da estatıstica calculado com os dados das amostras formaior que um determinado valor crıtico teorico, entao considera-se que adiferenca encontrada no voxel i e estatisticamente relevante.

2.3 Modelo estatístico multivariadoO modelo multivariado tem o objetivo de extrair as informacoes discrimi-nantes relevantes entre diferentes grupos utilizando todas as informacoesdisponıveis em uma mesma analise. O metodo SVM (Support Vector Ma-chines) (Vapnik, 1999) binario para a separacao dos grupos analisados emduas classes tem sido o mais utilizado em classificacao de imagens medi-cas por RM (Cuingnet et al., 2011; Sato et al., 2009; Kloppel et al., 2008;Mourao-Miranda et al., 2006). No contexto deste trabalho, as classes deinteresse sao DA versus controle e TCL versus controle.

2.3.1 Máquinas de vetores suporte para classificação linearAs Maquinas de Vetores Suporte ou Support Vector Machines (SVM) (Vap-nik, 1999, 1998) sao um metodo de classificacao amplamente utilizado embioinformatica alem de outras areas de conhecimento devido a sua altaprecisao, capacidade de lidar com alta-dimensionalidade e quantidade deinformacao e flexibilidade na modelagem de diversas fontes de dados (Schol-kopf et al., 2004).

Page 8: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

8 Fernandes et al.

O classificador SVM tambem e chamado de modelo nao-parametrico,pois ao contrario da inferencia estatıstica classica, os parametros nao saopre-definidos e seu numero de vetores suporte depende dos dados de trei-namento utilizado. Este classificador e baseado na minimizacao do riscoestrutural, que e uma funcao que depende do ajuste de um modelo aosdados. Este ajuste leva em consideracao a complexidade do modelo. Istoe importante para que o classificador tenha boas propriedades de generali-zacao, ou seja, poder de predicao.

Nos casos onde as classes nao podem ser separadas de forma linear,o SVM transforma a entrada original em um espaco caracterıstico dealta dimensionalidade por meio de mapeamentos nao-lineares ou multi-quadraticos com a utilizacao de uma funcao kernel apropriada. Apos estaetapa de transformacao nao-linear e encontrado o hiperplano linear otimode separacao deste espaco em duas classes (Huang et al., 2005).

Para uma classificacao linear binaria, seja o seguinte conjunto de trei-namento formado por N pontos, onde cada entrada −→xi tem n atributos eesta em uma das duas classes, ou seja, yi = −1 ou yi = +1. O hiperplanode separacao pode ser descrito pela seguinte equacao:

f(−→x ) = −→w · −→x + b = 0, (8)

onde −→w e o vetor normal ao hiperplano e b‖−→w‖ e a distancia perpendicular

do hiperplano ate a origem, conforme a Figura 3.

Figura 3. Representacao da separacao linear de hiperplano utilizando oSVM.

Os dados de treinamento podem ser discriminados em:

Page 9: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Classificação estatística e predição da doença de Alzheimer 9

yi = +1: −→xi · −→w + b ≥ +1, (9)

yi = −1: −→xi · −→w + b ≤ −1. (10)

Considerando os pontos mais proximos da separacao do hiperplano,isto e, os vetores suporte, pode-se descrever os planos como:

para H1: −→xi · −→w + b = +1, (11)

para H2: −→xi · −→w + b = −1. (12)

Para obter a separacao otima de hiperplano e necessario maximizara margem do SVM, ou seja, manter os vetores suportes mais distantespossıveis do hiperplano. Minimizando o vetor −→w e aplicando uma funcaode otimizacao quadratica com solucao por Lagrange, primeiro obtem-se ovetor normal ao hiperplano de separacao na Equacao 13, depois os vetoressuporte por meio das Equacoes 14 e 15:

−→w =

N∑i=1

αiyi−→xi , (13)

αsys(−→xs · −→w + b) = 1, (14)

αsys(∑mεS

αmym−→xm · −→xs + b) = 1, (15)

onde os multiplicadores de Lagrange, representados por α, dada a sua ma-ximizacao pelas condicoes de otimizacao de Karush-Kuhn-Tucker (KKT),sao valores positivos que correspondem aos vetores suporte, porque nestacondicao se encontram nos hiperplanos H1 e H2.

Por fim, a funcao de classificacao e definida pela Equacao 16 a seguir:

g(−→x ) = sgn(f(−→x )) = sgn

( ∑−→xiεV etoresSuporte

αiyi−→xi · −→x + b

). (16)

2.3.2 Projeção de hiperplano para predição de modelo classificatórioA projecao de hiperplano pode ser uma maneira versatil de verificar o com-portamento de casos intermediarios de classificacao e apontar a direcao deevolucao para um determinado elemento. Este aspecto pode ser utilizadoespecialmente na area medica para monitorar a evolucao de uma determi-nada enfermidade e antecipar o caminho de deterioracao para comecar oquanto antes a estrategia de medicacao, por exemplo.

Page 10: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

10 Fernandes et al.

Por meio dos hiperplanos gerados pelo classificador baseado em SVMpode-se utilizar a tecnica de projecao em hiperplanos para verificar o com-portamento de determinados elementos que nao fizeram parte do conjuntode treinamento original afim de avaliar seu comportamento devido a se-melhanca ou correlacao com os elementos originais. A Figura 4 mostra arepresentacao da projecao de amostra em hiperplanos previamente treina-dos no modelo de classificacao SVM.

Figura 4. Representacao da projecao de amostra em hiperplanospreviamente treinados no modelo de classificacao SVM. Adaptado de

(Mourao-Miranda et al., 2006).

A projecao de um elemento externo ao treinamento no hiperplano otimoutiliza a funcao da Equacao 17 a seguir:

f(−→x ) = (−→x · −→w ) + b = 0. (17)

Utilizando a tecnica de validacao cruzada (Weston, 1999), e possıvelavaliar a generalizacao dos resultados da classificacao para verificar qualo desempenho do modelo preditivo. Este tipo de validacao se baseia, emum primeiro momento, em gerar os hiperplanos de separacao com amostraspreviamente treinadas, depois projetar uma amostra que nao participou daetapa do treinamento, para, posteriormente, o classificador definir em quallado do hiperplano a mesma sera projetada. Esta caracterıstica e exploradapara a validacao do modelo classificatorio e preditivo dos pacientes comTCL.

Page 11: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Classificação estatística e predição da doença de Alzheimer 11

Figura 5. Fluxo das etapas envolvidas na classificacao multivariada.

2.4 Classificador multivariadoA classificacao multivariada foi realizada com a utilizacao do metodo SVMe e composta das seguintes etapas, ilustradas esquematicamente na Figura5: (i) extracao de caracterısticas relevantes, (ii) treinamento dos gruposque se deseja classificar, (iii) teste e classificacao.

A extracao das caracterısticas relevantes das imagens medicas e rea-lizada pelos processos de pre-processamento. Foi priorizado a substanciacinzenta devido aos efeitos das enfermidades estudadas se concentrarem,principalmente, neste tecido. As demais componentes cerebrais resultan-tes da segmentacao, como a substancia branca e o lıquor sao descartadas.Apos a separacao das imagens, cada uma delas e transformada em umvetor de informacoes cuja dimensao e dada pelo numero de voxels da ima-gem pre-processada. Neste trabalho o tamanho da imagem tridimensionale de 91 x 109 x 91 (x, y, z). A proxima etapa consiste no treinamento eaprendizado das imagens envolvidas. Nesta etapa o classificador realizara amelhor separacao linear possıvel entre duas classes de acordo com os vetoresde informacoes provenientes das imagens medicas, segmentadas e suaviza-das. Por fim, na fase de testes, cada amostra e avaliada de acordo com otreinamento previo realizado e desta forma o classificador determinara sua

Page 12: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

12 Fernandes et al.

acuracia de classificacao. A projecao correspondera a quao distante umaclasse da outra uma certa amostra estara de acordo com suas caracterısti-cas relevantes. Assim pode-se estimar se uma dada amostra se aproximamais de um determinado grupo ou de outro.

2.5 Base de dados internacional ADNIPara a realizacao dos experimentos foi utilizada a base de dados internacio-nal ADNI (Alzheimer’s Disease Neuroimaging Initiative) tanto de imagensquanto de informacoes clınicas a respeito dos seus participantes. A base doADNI e uma importante fonte de dados padronizada e suas imagens e de-mais informacoes sao utilizadas em varios trabalhos relacionados na areaem toda a comunidade cientıfica (Spulber et al., 2010; Yakushev et al.,2009; Cuingnet et al., 2011), principalmente nas pesquisas mais recentes.

O banco de dados ADNI e uma iniciativa publico-privada financiada apartir de varias fontes nos Estados Unidos da America, incluindo agenciasde fomento a pesquisa governamentais e nao governamentais bem como di-versas empresas, em grande parte do setor farmaceutico, que visa coletar omaior numero de imagens por RM estrutural em boas condicoes e de formapadronizada para serem analisadas em pesquisas que poderao auxiliar no-vas descobertas para o tratamento de doencas relacionadas a DA. O acervocontempla imagens estruturais por RM, informacoes adicionais como, porexemplo, sexo, idade, pontuacoes em testes cognitivos, seguimento clınico einformacoes geneticas para tres grupos distintos e conhecidos a priori : DA,TCL e controles (clinicamente sem nenhuma desordem cerebral). O bancode dados e hospedado no acervo de imagens do LONI IDA (Laboratory ofNeuro Imaging Image Data Archive) da Universidade da California1.

Os participantes do banco de dados foram recrutados em 50 localidadesnos Estados Unidos e no Canada, sendo 233 controles cognitivamente sau-daveis em idade avancada seguidos por 4 anos, 408 indivıduos com TCLamnesico seguidos por 3 anos e 200 indivıduos com DA inicial seguidospor 2 anos. Estes numeros refletem a situacao do banco no final de 2010,pois ha atualizacao constante. Os criterios de inclusao no ADNI foram:indivıduos entre 55 e 90 anos de idade, sem historico de depressao ou outracondicao psiquiatrica, ausencia de medicacoes psicoativas, pontuacao 4 oumenor no teste de Hachinski modificado, ter parceiro fixo capaz de proverinformacoes sobre funcionalidade em atividades diarias. Para os contro-les saudaveis foram pre-requisitos: pontuacao entre 24 e 30 no teste MiniMental e pontuacao de 0 no Clinical Dementia Rating (CDR). Para paci-entes com TCL foram pre-requisitos: queixas de problemas de memoria,pontuacao entre 24 e 30 no teste Mini Mental, perda de memoria medidacom o teste Logical Memory II, CDR de 0,5 e sem prejuızos funcionais nasatividades diarias. Para pacientes com a DA foram pre-requisitos: estar

1 http://www.loni.ucla.edu/ADNI

Page 13: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Classificação estatística e predição da doença de Alzheimer 13

de acordo com os criterios de provavel diagnostico do National Instituteof Neurological Disorders and Stroke e Alzheimer’s Disease and RelatedDisorders Association, pontuacao entre 20 e 26 no teste Mini Mental epontuacao de 0,5 ou 1 no CDR.

As imagens por RM foram coletadas em diversos equipamentos de fabri-cantes diferentes, por isso durante a fase de planejamento do ADNI foramdesenvolvidos protocolos especıficos para cada fabricante, com o objetivode maximizar a utilidade cientıfica das imagens coletadas e minimizar pos-sıveis artefatos relacionados a aquisicao das imagens.

3. Experimentos e Resultados

3.1 Mapeamento visual das diferenças univariadas estatisticamenterelevantes

Por meio da aplicacao do SPM (Friston et al., 1995b), foi realizado o mape-amento estatıstico parametrico que consistiu em uma sobreposicao de umaimagem de um cerebro de referencia com o mapa gerado pelo teste de hipo-teses. Esse mapa e traduzido como regioes de atrofia cerebral significantesentre os grupos de estudo.

Para melhor compreensao dos resultados e das regioes cerebrais demar-cadas como coincidentes ou nao, foi sobreposto o mapa de contrastes decada analise em uma imagem de RM estrutural de um cerebro de controle,atraves do software MRIcro (Rorden & Brett, 2000). A Figura 6 mostraesses resultados. As diferencas entre DA e controles sao representadas pelacor vermelha. Para as diferencas entre TCL e controles, utilizou-se a corazul e as caracterısticas comuns entre as duas analises sao representadaspela mistura das cores vermelha e azul, representadas em tons de rosa.Para visualizacao das diferencas estatısticas optou-se utilizar o nıvel deconfianca de 95%.

No mapeamento univariado pode-se verificar as regioes do cerebro comdiferencas estatısticas mais evidenciadas e concentradas em certas estrutu-ras do que outras, como por exemplo, nas estruturas do hipocampo, lobostemporais, corpo caloso, cerebelo e sistema ventricular quando compara-secontroles com DA. Na comparacao entre controles e TCL, as diferencassao mais sutis, coincidindo em muitas regioes como aquelas detalhadas naDA, mas nao tao localizadas. Este resultado evidencia o efeito da atrofiano tecido cerebral em maior escala de acordo com o biomarcador clınicobaseado em neuroimagem utilizado atualmente (Cuingnet et al., 2011).

As informacoes extraıdas com este mapeamento coincidem com as in-formacoes clınicas esperadas para cada tipo de enfermidade (Killiany et al.,2000; Xu et al., 2000; Bobinski et al., 1998). O metodo de mapeamentounivariado, que analisa a imagem por RM voxel-a-voxel, constroi um mapaestatıstico com varias regioes que compreendem as diferencas entre os gru-pos analisados. Essas regioes confirmam as estruturas cerebrais afetadas e

Page 14: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

14 Fernandes et al.

Figura 6. Mapeamento visual das diferencas univariadas estatisticamenterelevantes: DA em vermelho, TCL em azul e regioes mutuas em lilas.

constituem uma ferramenta estatıstica importante em evidenciar as prin-cipais caracterısticas relevantes entre os grupos analisados.

3.2 Mapeamento e classificação do modelo estatístico multivariadoO mapeamento e classificacao estatıstica de imagens no modelo multivari-ado foram realizadas por meio do aplicativo PROBID (Pattern Recognitionof Brain Image Data) (Marquand et al., 2010), utilizando o classificadorSVM binario com validacao cruzada baseada no metodo Leave One Out. Asimagens foram classificadas em DA versus controle e TCL versus controle.Esta analise e baseada na classificacao binaria dos pacientes, que permitenao somente avaliar o desempenho do classificador em separar os grupos de

Page 15: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Classificação estatística e predição da doença de Alzheimer 15

analise, mas tambem como utilizar a informacao para um modelo preditor,especialmente para os casos de TCL que poderao evoluir para a DA.

3.2.1 Classificação estatística multivariadaPara a classificacao dos grupos controle versus DA foi obtido um alto nıvelde desempenho, com acuracia de 86,11%. A classificacao do grupo controleversus TCL obteve um nıvel de desempenho inferior devido ao TCL seencontrar na fronteira entre o envelhecimento natural e a demencia (FlintBeal et al., 2005) e obteve acuracia de 71,79%, conforme Tabela 2. Aexplicacao de cada parametro de desempenho e exemplificada pela Tabela1 e os valores consolidados dos indicadores de avaliacao foram obtidos pormeio das Equacoes 18 (Sensibilidade), 19 (Especificidade) e 20 (Acuracia),descritas a seguir:

Resultado Doenca Presente Doenca Ausente

Positivo VP (Verdadeiro Pos.) FP (Falso Pos.)Negativo FN (Falso Neg.) VN (Verdadeiro Neg.)

Tabela 1. Quadro explicativo para o conceito de avaliacao dos resultadospelo sistema classificador.

S =V P

V P + FN(18)

E =V N

FP + V N(19)

A =V P + V N

V P + V N + FP + FN. (20)

Classificacao Sensibilidade Especificidade Acuracia

DA x Controles 87,22% 85% 86,11%TCL x Controles 73,74% 69,83% 71,79%

Tabela 2. Quadro com os principais indicadores de desempenho doprocesso de classificacao multivariado utilizando o SVM.

O classificador conseguiu separar os grupos DA e controles baseado so-mente na informacao contida na imagem por RM com uma baixa taxa deerro. Apesar da imagem por RM ser um importante biomarcador para au-xiliar no diagnostico da DA, ela nao e o unico criterio adotado (McKhannet al., 1984), e isso pode ajudar a explicar os erros de classificacao encon-trados. Ainda e possıvel verificar que a classificacao nao somente separaas duas classes como tambem pode indicar a severidade dos efeitos da DA

Page 16: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

16 Fernandes et al.

sob o ponto de vista do classificador. Por exemplo, pacientes classificadosno grupo DA com ındice de classificacao mais negativo podem indicar umaprogressao maior da doenca enquanto os pacientes que se encontram naregiao de separacao (ındices proximos de zero) podem estar no inıcio daDA.

Na classificacao entre os grupos TCL e controles, a separacao entre osdois grupos nao e tao evidente quanto nos grupos DA e controles. Isso eexplicado pela natureza da TCL ser caracterizada pela transicao gradualentre o envelhecimento natural e a demencia. Seu diagnostico e conside-rado complexo sob o ponto de vista clınico, mesmo assim o classificadorconseguiu separar os grupos de pacientes com taxa de acerto de aproxima-damente 72%. Da mesma maneira, a severidade dos efeitos do TCL podeestar associada a sua classificacao, logo os pacientes com ındices de classi-ficacao mais negativos podem indicar uma evolucao maior da doenca. Ospacientes que se encontram na regiao de separacao podem indicar a propriatransicao entre o envelhecimento natural e a demencia.

Figura 7. Grafico de projecao dos grupos controle, DA e TCL junto aoresultado do teste de cognicao Mini Mental (classificacao no eixo x e

resultado do Mini Mental no eixo y)

O grafico ilustrado pela Figura 7 fornece a plausibilidade do modelo,pois mostra o cruzamento das informacoes do resultado do teste de cognicaoMini Mental com a informacao obtida pelo classificador para os tres gruposenvolvidos (DA, TCL e controle) na primeira visita de aquisicao. Ficacomprovado que, quanto menor o resultado do teste Mini Mental, maisa classificacao converge para casos de DA, ou seja, ha um agrupamento

Page 17: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Classificação estatística e predição da doença de Alzheimer 17

dos pacientes da DA em zonas de pontuacao baixa. Os pacientes comTCL ficam concentrados na zona intermediaria e, por fim, os casos decontrole, ficam no topo da pontuacao. O Mini Mental e um importanteteste de avaliacao cognitivo utilizado para acompanhamento e subsıdio parao diagnostico de pacientes com TCL e DA.

3.3 Projeção de amostras e predição da classificaçãoA projecao de amostras tem por objetivo validar em que nıvel de severidadeos efeitos no TCL estao e se e possıvel verificar sob o ponto de vista dabase de treinamento dos grupos DA e controles, se o paciente esta no inıciodo TCL ou com aspecto de estabilizacao, podendo ser classificado pelohiperplano como uma amostra de controle. De forma contraria, se estiverem estado de progressao, podera ser classificado como DA ou na regiaode fronteira. Este experimento foi realizado com as 179 amostras de cadagrupo (DA e controle) na primeira aquisicao de imagem. Adicionalmente,o experimento utilizou imagens por RM em varias etapas de aquisicaopara realizar o acompanhamento da progressao da enfermidade e relacionarcom a informacao obtida exclusivamente pelo classificador. Portanto, epossıvel evidenciar casos de conversao em etapas diferentes de aquisicao,de acordo com a progressao da enfermidade. As informacoes obtidas nesteexperimento sao validadas pelos dados clınicos que estao disponıveis nabase do ADNI, assim pode-se tambem constatar se houve confirmacao doscasos de conversao ou nao previstos pelo classificador desde a primeiraaquisicao.

O experimento de acompanhamento utilizou 30 pacientes escolhidosaleatoriamente de cada grupo (DA e TCL) que foram testados em tresetapas diferentes (aquisicao ou screening, seis meses depois e 24 mesesdepois). Foi constatado que nem todos os pacientes possuem o mesmoacompanhamento, ou seja, podem ter a aquisicao inicial e somente apos12 meses realizam outra aquisicao, de modo que tentou-se priorizar nesteexperimento os pacientes que possuem as tres etapas de aquisicao parapermitir uma melhor comparacao entre eles.

Para a validacao da relacao do parametro obtido na classificacao como diagnostico clınico e tambem pelas caracterısticas evidenciadas pela pro-gressao foi projetada a classificacao do grupo de pacientes com DA ao longode 24 meses, com as tres etapas de aquisicao nos hiperplanos de classifica-cao (no hiperplano da DA o valor de classificacao e menor do que zero epara o hiperplano de controle o valor de classificacao e maior do que zero).No grafico da Figura 8 e possıvel constatar que, como a DA e uma do-enca neurodegenerativa progressiva, e mesmo com a medicacao atual, naoe possıvel a sua regressao. As projecoes confirmam o progresso constanteda doenca e nenhum sinal de regressao.

Aplica-se entao o mesmo estudo de validacao para o grupo de pacientescom TCL (Figura 8), onde e apresentado a evolucao da enfermidade para

Page 18: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

18 Fernandes et al.

este grupo de pacientes. Neste grafico fica evidente a caracterıstica da ve-locidade da progressao da enfermidade ser mais lenta quando comparadacom os efeitos da DA. Por esse motivo, verifica-se que as amostras dos paci-entes da primeira, segunda (apos seis meses) e terceira (apos 24 meses) eta-pas de aquisicao ficam proximas umas das outras, diferentemente quandocompara-se a evolucao da DA, onde para cada visita o aprofundamento dosefeitos da enfermidade e maior. Ainda e possıvel verificar pacientes comTCL que possuem uma grande probabilidade de evoluir para a DA cujovalor de classificacao seja menor que zero ou na zona limıtrofe, evidenciado,por exemplo, pelo paciente de numero 2. O oposto tambem e verificado,isto e, pacientes com estabilizacao na zona de transicao ou com valor declassificacao maior do que zero, como por exemplo o paciente de numero27, onde todos os exames se encontraram na mesma regiao, ou seja, naohouve uma evolucao consistente dos efeitos da DA.

Figura 8. Grafico radial de projecao da evolucao do grupo de pacientes(DA e TCL). Valores negativos sinalizam DA e positivos controles. Cada

eixo radial corresponde a um paciente distinto.

Foram confirmados pelo acompanhamento clınico fornecido pela basedo ADNI 87,5% de conversao dos pacientes TCL classificados de maneirapreditiva para conversao para DA, levando em consideracao somente ainformacao da imagem medica por RM. Em termos de acuracia total, ouseja, confirmacao dos pacientes que converteram ou nao clinicamente, odesempenho foi de 76,7%.

Avaliando os dados de classificacao mostrados no quadro da Tabela 5e verificada uma taxa elevada de confirmacao das informacoes de classi-ficacao, que indicam um bom desempenho do modelo preditivo. Para a

Page 19: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Classificação estatística e predição da doença de Alzheimer 19

Indicador Quantidade

Verdadeiro Positivo (VP) 14Verdadeiro Negativo (VN) 9

Falso Positivo (FP) 5Falso Negativo (FN) 2

Tabela 3. Quadro com dados de desempenho do modelo estatısticomultivariado comparando com os resultados dos testes de cognicao clınico.

avaliacao da predicao de conversao ou nao dos pacientes com TCL foramutilizados os mesmos indicadores de desempenho utilizados anteriormente(Tabela 1). Assim, obtem-se para VP o valor de 14 das 16 amostras con-firmadas. Para VN obtem-se o valor de nove das 14 amostras confirmadas.Para FP obtem-se o valor de cinco amostras e para FN tem-se o valor deduas amostras. O resumo destes resultados estao descritos na Tabela 4.

Sensibilidade Especificidade Acuracia

87,5% 64,3% 76,7%

Tabela 4. Quadro com dados de desempenho do modelo estatısticomultivariado de conversao comparando com a confirmacao clınica.

Realizando uma avaliacao mais completa dos resultados e da sua vali-dacao clınica de acordo com o que foi concluıdo com os dados2 da Tabela5, verifica-se que o modelo de predicao (ou seja, se um paciente com TCLconvertera ou nao para DA) e promissor. Das confirmacoes em que o clas-sificador coincidiu com o dado clınico (14 de 16 ou 87,5% de acerto para oscasos de conversao), apenas em um caso o classificador apontou conversaopara DA em menos de um ano de antecedencia (paciente com identificacao2). Nos demais casos o classificador ja apontava conversao para DA comgrande antecedencia, superior ou igual a um ano, confirmada clinicamentenas etapas posteriores. O poder de predicao chegou a ser de 4 anos deantecedencia. Tambem e importante mencionar os casos de nao conversao.O classificador constatou nove nao conversoes das 14 verificadas clinica-mente. Como o objetivo principal e promover o tratamento dos pacientesconvertedores cada vez mais cedo, estes resultados mostram a relevanciade se utilizar tais ferramentas computacionais para avaliacao de pacientescom TCL em complemento com o acompanhamento clınico.

2 As informacoes ND (nao definido) na Tabela 5 sao devido a ausencia de aqui-sicao de imagem de um determinado paciente. A 2a visita e apos 6 meses aprimeira aquisicao e a 4a visita e apos 18 meses da primeira aquisicao. Nemtodos os pacientes possuem exames em todas as visitas.

Page 20: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

20 Fernandes et al.

Paciente Predicao Conv. Clınica Acerto

ID. Idade 1aVisita 2aVisita 4aVisita

1 74,9 -0,79461 -0,8492 -1,6597 Sim (2 anos) X2 76,67 -2,1939 -2,4957 -3,0149 Sim (0,5 ano) X3 73,5 -1,3687 -1,765 -2,4474 Nao %4 75,3 0,63533 0,73644 0,13702 Nao X5 79,89 -0,26161 -0,10006 ND Nao %6 86,29 -1,5859 ND -2,8244 Sim (1,5 anos) X7 82,84 -0,59505 ND -0,30472 Sim (4 anos) X8 81,77 -1,5307 -1,4724 -1,7035 Sim (3 anos) X9 56,81 -1,2188 -0,66401 -1,8249 Sim (1,5 anos) X10 87,78 -1,1763 ND -1,5435 Sim (1,5 anos) X11 82,02 1,6732 1,0088 0,73405 Nao X12 62,19 -1,1742 -0,76552 ND Sim (2 anos) X13 77,07 -1,1143 -1,2034 ND Sim (1,5 anos) X14 61,66 -0,72683 -0,42392 -1,4065 Nao %15 70,52 -1,3511 -1,1541 -2,1038 Sim (1 ano) X16 79,75 0,84755 1,0393 0,76782 Sim (0,5 ano) %17 75,66 0,32715 0,75582 ND Nao X18 65,16 0,33904 0,30631 ND Nao X19 78,51 0,03779 ND -0,52664 Sim (3 anos) X20 75,03 1,2826 1,1003 1,0685 Nao X21 79,94 -0,43008 ND ND Sim (1 ano) X22 64,71 0,38254 0,28761 -0,2342 Sim (1,5 anos) X23 71,02 0,72424 0,65947 ND Nao X24 75,98 0,68095 0,73789 0,42262 Nao X25 71,1 -0,42939 -0,57593 -0,71368 Sim (3 anos) X26 74,16 -0,056789 ND -0,37667 Nao %27 72,47 0,38824 0,22058 0,61694 Nao X28 68,02 -0,67679 -0,6302 ND Nao %

29 76,64 0,22907 0,39083 ND Sim (inicial) %30 81,81 0,19246 0,3651 0,15992 Nao X

Tabela 5. Tabela com a classificacao baseada em projecao dos casos deTCL no hiperplano de DA versus controles, comparando os casos de

conversao clınica para DA confirmados pelo ADNI.

4. Conclusão

Este trabalho utilizou o arcabouco computacional de analise de imagensmedicas por RM que torna possıvel a investigacao de diferencas locaisna anatomia do cerebro humano. Este arcabouco implementa o metodode morfometria baseado em voxel que, de forma sucinta, estima a dis-tribuicao de probabilidade das intensidade dos voxels para gerar mapasestatısticos parametricos que possam determinar diferencas relevantes quepermitem, antes de realizar qualquer tipo de analise, extrair as informa-coes mais importantes. A extracao dessas informacoes constitui a etapa

Page 21: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Classificação estatística e predição da doença de Alzheimer 21

de pre-processamento, que tem por objetivo normalizar as imagens com afinalidade de mante-las em um mesmo espaco anatomico para permitir acomparacao de pessoas diferentes em uma mesma analise. Apos isso, saoextraıdas as regioes de interesse do cerebro por meio da segmentacao deimagens. A ultima etapa do pre-processamento, a suavizacao, tem o ob-jetivo de suavizar as bordas das imagens, processo que auxilia a eficienciados testes estatısticos.

Neste artigo, por meio de mapeamentos estatısticos, foi possıvel revelarquais as diferencas estatisticamente relevantes entre as enfermidades DA eTCL nas estruturas cerebrais humanas. As diferencas encontradas podemcomplementar os estudos atuais relacionados com ambas as doencas e osefeitos que afetam cada uma das enfermidades, sobretudo no TCL, onde apossibilidade de antecipar a evolucao para outros tipos de demencia per-mite um tratamento clınico mais personalizado. Nota-se, especialmente,a relevancia da regiao do hipocampo, comum nas duas enfermidades, queestabelece efeitos semelhantes nos pacientes, porem em diferentes tipos deseveridade.

Com o classificador multivariado foi possıvel, alem de verificar como ometodo classifica os grupos analisados, tambem constatar o efeito preditordo modelo estatıstico na pratica. Na classificacao de grupos, o desempenhode acuracia para separacao dos grupos DA e controles obteve pouco maisde 86% de acuracia, nos grupos TCL e controle o resultado foi um poucoinferior, chegando a mais de 71% de acuracia. Estes resultados comprovamque o SVM conseguiu uma boa margem de classificacao para todos os gru-pos analisados. Outros trabalhos na area obtiveram valores de desempenhosemelhantes por meio desta e de outras tecnicas de classificacao quando secompararam os mesmos grupos envolvidos neste trabalho (Cuingnet et al.,2011).

Ao treinar uma base de dados com um numero significativo de amos-tras de pacientes com DA e controles, a avaliacao de acompanhamento depacientes com TCL durante 24 meses em tres etapas de aquisicao tornou-seum metodo promissor de predicao dos efeitos da DA e posterior possibi-lidade de conversao. O modelo foi devidamente validado por meio dasconfirmacoes clınicas dos pacientes com conversao para DA, por meio doacompanhamento clınico que o banco de dados ADNI proporciona. O altograu de confirmacoes verificadas, superior a 80%, e a grande capacidade depredicao, confirmada pela previsao de conversoes de pelo menos seis mesese ate quatro anos de antecedencia, podem indicar um caminho promissordo estudo da conversao de pacientes com TCL para DA.

Agradecimentos

Os autores deste trabalho gostariam de agradecer o apoio da FAPESP(2010/01394-4). Os dados utilizados na elaboracao deste estudo foram

Page 22: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

22 Fernandes et al.

obtidos do banco de dados ADNI. Como tal, os pesquisadores do ADNIforneceram os dados, mas nao participaram da analise e elaboracao destetrabalho. Para pre-processamento e classificacao das amostras, foram uti-lizados respectivamente os pacotes SPM e PROBID de computacao emimagens medicas e domınio publico.

Referências

Bobinski, M.; de Leon, M.J.; Tarnawski, M.; Wegiel, J.; Reisberg, B.;Miller, D.C. & Wisniewski, H.M., Neuronal and volume loss in CA1of the hippocampal formation uniquely predicts duration and severityof Alzheimer’s disease. Brain Research, 14(1-2):267–269, 1998.

Cuingnet, R.; Gerardin, E.; Tessieras, J.; Auzias, G.; Lehericy, S.; Habert,M.; Chupin, M.; Benali, H. & Colliot, O., Automatic classification ofpatients with Alzheimer’s disease from structural MRI: A comparisonof ten methods using the ADNI database. NeuroImage, 56(2):766–781,2011.

Flint Beal, M.; Lang, A.E. & Ludolph, A.C., Neurodegenerative Diseases:neurobiology, pathogenesis and therapeutics. Cambridge, UK: Cam-brige University Press, 2005.

Forlenza, O.V. & Almeida, J.R., Envelhecimento e transtornos psiquiatri-cos. Sao Paulo, SP: Atheneu, 2006.

Friston, K.J.; Ashburner, J.; Frith, C.D.; Poline, J.B.; Heather, J.D. &Frackowiak, R.S.J., Spatial registration and normalization of images.Human Brain Mapping, 3(3):165–189, 1995.

Friston, K.J.; Ashburner, J.T.; Kiebel, S.J.; Nichols, T.E. & Penny, W.D.(Eds.), Statiscal Parametric Mapping: The Analysis of FunctionalBrain Images. London, UK: Academic Press, 2007.

Friston, K.J.; Frith, C.D.; Liddle, P.F. & Frackowiak, R.S.J., Comparingfunctional (PET) images: the assessment of significant change. Journalof Cerebral Blood Flow & Metabolism, 11(4):690–699, 1991.

Friston, K.J.; Holmes, A.P.; Poline, J.B.; Grasby, P.J.; Williams, S.C.;Frackowiak, R.S.J. & Turner, R., Analysis of fMRI time-series revisi-ted. NeuroImage, 2(1):45–53, 1995b.

Friston, K.J.; Holmes, A.P.; Worsley, K.J.; Poline, J.P.; Frith, C.D. & Frac-kowiak, R.S.J., Statistical parametric maps in functional imaging: Ageneral linear approach. Human Brain Mapping, 2(4):189–210, 1995a.

Girardi, L.H.; Cargnelutti Filho, A. & Storck, L., Erro tipo I e poder decinco testes de comparacao multipla de medias. Revista Brasileira deBiometria, 27(1):23–36, 2009.

Good, C.D.; Johnsrude, I.S.; Ashburner, J.; Henson, R.N.; Friston, K.J. &Frackowiak, R.S., A voxel-based morphometry study of ageing in 465normal adult human brains. NeuroImage, 14(1):21–36, 2001.

Page 23: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Classificação estatística e predição da doença de Alzheimer 23

Huang, T.; Kecman, V. & Kopriva, I., Kernel Based Algorithms for Mi-ning Huge Data Sets. v. 17 de Studies in Computational Intelligence.Heidelberg, Germany: Springer-Verlag, 2005.

Killiany, R.J.; Gomez-Isla, T.; Moss, M.; Kikinis, R.; Sandor, T.; Jolesz, F.;Tanzi, R.; Jones, K.; Hyman, B.T. & Albert, M.S., Use of structuralmagnetic imaging to predict who will get Alzheimer’s disease. Annalsof Neurology, 47(4):430–439, 2000.

Kloppel, S.; Stonnington, C.M.; Chu, C.; Draganski, B.; Scahill, R.I.;Rohrer, J.D.; Fox, N.C.; Jack Jr., C.R.; Ashburner, J. & Frackowiak,R.S.J., Automatic classification of MR scans in Alzheimer’s disease.Brain, 131(3):681–689, 2008.

Leao, R.D.; Sato, J.R. & Thomaz, C.E., Extracao multilinear de informa-coes discriminantes em imagens de ressonancia magnetica do cerebrohumano. Anais do XXX Congresso da SBC – XX Workshop em Infor-matica Medica, :1740–1749, 2010.

Marquand, A.; Rondina, J.; Mourao-Miranda, J.; Rocha-Rego, V. &Giampietro, V., Pattern Recognition of Brain Image Data (PRO-BID). Technical Report, King’s College London, London, UK, 2010.www.brainmap.co.uk/Programs/PROBID_user_guide_v1.03.pdf.

McKhann, G.; Drachman, D.; Folstein, M.; Katzman R., P.D. & Stadlan,E., Clinical diagnosis of alzheimer’s disease: Report of the NINCDS-ADRDA Work Group under the auspices of department of healthand human services task force on Alzheimer’s disease. Neurology,34(7):939–944, 1984.

Mourao-Miranda, J.; Reynaud, E.; McGlone, F.; Calvert, G. & Brammer,M., The impact of temporal compression and space selection on SVManalysis of single-subject and multi-subject fMRI data. NeuroImage,33(4):1055–1065, 2006.

Rorden, C. & Brett, M., Stereotaxic display of brain lesions. BehaviouralNeurology, 12(4):191–200, 2000.

Sato, J.R.; Fujita, A.; Thomaz, C.E.; Morais-Martin, M.G.; Mourao-Miranda, J.; Brammer, M.J. & Junior, E.A., Evaluating SVM andMLDA in the extraction of discriminant regions for mental state pre-diction. NeuroImage, 46(1):105–114, 2009.

Scholkopf, B.; Tsuda, K. & Vert, J.P. (Eds.), Kernel Methods in Compu-tational Biology. Cambridge, USA: MIT Press, 2004.

Spulber, G.; Niskanen, E.; MacDonald, S.; Smilovici, O.; Chen, K.; Rei-man, E.M.; Jauhiainen, A.M.; Hallikainen, M.; Tervo, S.; Wahlund,L.O.; Vanninen, R.; Kivipelto, M. & Soininen, H., Whole brain atrophyrate predicts progression from MCI to Alzheimer’s disease. Neurobio-logy Aging, 31(9):1601–1605, 2010.

Page 24: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

24 Fernandes et al.

Talairach, J. & Tournoux, P., Co-planar stereotactic atlas of the humanbrain. Stuttgart, Germany: Thieme Medical Publishers, 1987.

Vapnik, V.N., Statistical Learning Theory. New York, USA: J. Wiley &Sons, Inc., 1998.

Vapnik, V.N., The nature of statistical learning theory. 2a edicao. NewYork, USA: Springer-Verlag, 1999.

Weston, J., Leave-one-out support vector machines. Proceedings of the Six-teenth International Joint Conference on Artificial Intelligence, :727–731, 1999.

Xu, Y.C.; Jack Jr., C.R.; O’Brien, P.C.; Kokmen, E.; Smith, G.E.; Ivnik,R.J.; Boeve, B.F.; Tangalos, R.G. & Petersen, R.C., Usefulness of MRImeaseures of entorhinal cortex vs. hippocampus in AD. Neurology,(9):1760–1767, 2000.

Yakushev, I.; Hammers, A.; Fellgiebel, A.; Schmidtmann, I.; Scheurich, A.;Buchholz, H.; Peters, J.; Bartenstein, P.; Lieb, K. & Schreckenberger,M., SPM-based count normalization provides excellent discriminationof mild Alzheimer’s disease and amnestic mild cognitive impairmentfrom healthy aging. NeuroImage, 44(1):43–50, 2009.

Page 25: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

Classificação estatística e predição da doença de Alzheimer 25

Notas Biográficas

Michel Pereira Fernandes tem graduacao e mestrado em Engenharia Eletrica(FEI, 2006 e 2011, respectivamente). Atualmente e professor da UniversidadePaulista (UNIP), da Faculdade de Informatica e Administracao Paulista (FIAP) econsultor de projetos de sistemas voltados a inovacao na Telefonica Vivo, atuandoprincipalmente nos seguintes temas: sistemas de classificacao de imagens medicase mineracao de dados, alem de sistemas de acessibilidade a deficientes visuais.

Joao Ricardo Sato tem graduacao em Estatıstica, mestrado e doutorado (Uni-

versidade de Sao Paulo, 2002, 2004 e 2007, respectivamente). E Coordenador eProfessor do Nucleo de Cognicao e Sistemas Complexos na UFABC. Atua prin-cipalmente em projetos de pesquisa multidisciplinares envolvendo os seguintestemas: modelagem estatıstica e computacional em neurociencias, neuroimagem,mapeamento funcional do cerebro humano, analise de series temporais, bioesta-tıstica, estatıstica nao-parametrica e modelos de regressao.

Geraldo Busatto Filho tem graduacao em Medicina (Universidade de SaoPaulo, 1987), residencia medica (Instituto de Psiquiatria do Hospital das Clınicasda USP – HC-FMUSP, 1990), doutorado em Psiquiatria pelo (Institute ofPsychiatry, University of London, 1995), e pos-doutorado (University of London,1996). Atualmente e Professor Associado do departamento de Psiquiatria juntoa FMUSP, sendo o coordenador do Laboratorio de Investigacao Medica 21(LIM21) do HC-FMUSP, cujo tema central de investigacoes sao estudos deneuroimagem aplicados aos transtornos neuro-psiquiatricos. Suas linhas depesquisa principais envolvem o uso de metodos de ressonancia magnetica, PETe SPECT para a investigacao de esquizofrenia e outros transtornos psicoticos,demencias e transtornos do humor, associando os dados de neuroimagem aoutros biomarcadores.

Carlos Eduardo Thomaz tem graduacao em Engenharia Eletronica emestrado em Engenharia Eletrica (Pontifıcia Universidade Catolica do Rio deJaneiro, 1993 e 1999, respectivamente), doutorado e pos-doutorado em Cienciada Computacao (Imperial College London, 2005). Atualmente e professoradjunto do Centro Universitario da FEI. Tem experiencia na area de Ciencia daComputacao, com enfase em reconhecimento de padroes em estatıstica, atuandoprincipalmente nos seguintes temas: Visao Computacional, Computacao emImagens Medicas e Biometria.

Page 26: Capítulo 1 Classificação Estatística e Predição da Doença ...omnipax.com.br/livros/2012/AVC/avc-cap01.pdf · Classificação estatística e predição da doença de Alzheimer

26 Fernandes et al.

.