defini ç ão de vari á veis em redes neurais artificiais por an á lise de componentes principais:...

Post on 17-Apr-2015

104 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Definição de Variáveis em Redes Neurais Artificiais por Análise de

Componentes Principais: Aplicação em Transplante Renal

Antonio Fernando. C. InfantosiRenan Moritz. V. R. Almeida

João Carlos G. D. Costa

Programa de Engenharia Biomédica, COPPE, Universidade Federal do Rio de Janeiro (UFRJ)

Carlos A. L. ÁvilaJosé H. Rocco Suassuna

Faculdade de MedicinaUniversidade Estadual do Rio de Janeiro (UERJ)

Estrutura da Apresentação Introdução Objetivo Redes Neurais Artificiais Análise de Componentes Principais Base de Dados de Transplantados Renais Variáveis de Entrada da RNA Variável de Saída da RNA Características das Variáveis Características da RNA Comparação Entre Estimativas dos Modelos RNA Autovetores e Autovalores mais representativos Simulações para Treinamento da RNA Resultados Discussão Conclusão Referências

Introdução

Redes Neurais Artificiais (RNA) têm sido cada vez mais empregadas na prática médica, porém ainda sem aceitação universal;

Trabalhos têm mostrado a viabilidade das RNA no auxílio ao diagnóstico, até mesmo com vantagens sobre Regressão Logística (RL);

Introdução

Em transplantes renais (TXR), as RNA têm sido usadas em aplicações tais como:

a) Predição de funcionamento do enxerto;

b) Diagnóstico de rejeição;c) Seleção de variáveis para previsão

de rejeição crônica;d) Predição de citomegalovirose;e) Dosagem de imunossupressores;

Introdução

A existência de colinearidade entre variáveis de entrada de uma RNA implica:

• Aumento desnecessário da complexidade;• Pouco acréscimo de informação.

Objetivo

Utilizar a Análise de Componentes Principais na redução da

dimensionalidade do vetor de entrada de uma RNA para predição

de sobrevida de enxerto renal.

Redes Neurais Artificiais

Redes Neurais Artificiais são modelos que simulam o comportamento neuronal humano;

As RNA têm sido apontadas como alternativas às técnicas de predição tradicionais:

a) Detecção de relações complexas entre as variáveis;

b) Robustez quanto à perda de informações;

c) Adaptabilidade;

d) Processamento paralelo (rapidez);

e) Mapeamento caixa-preta;

f) Mapeamento através de funções não lineares

Análise de Componentes Principais

A ACP é uma técnica de análise multivariada linear para diminuição da quantidade de variáveis (usualmente preditoras em um modelo), sem perda considerável de informação;

As novas variáveis de entrada do modelo são compostas da multiplicação matricial entre as variáveis originais e os autovetores da matriz de variáveis;

Base de Dados de Transplantados Renais

a) 109 pacientes com dados completos (doadores vivos);

b) Definição de três conjuntos de dados (Haykin, 2002) :

1. Treinamento da RNA: 60 pacientes;2. Validação da RNA: 17 pacientes;3. Teste da RNA: 32 pacientes;

Variáveis de Entrada da RNA

1) Idade Receptor (co);2) Idade Doador (co)

3) Diferença Idade Doador/Receptor (co);4) Status Diferença Idade (d);5) Sexo Receptor (d);6) Sexo Doador (d);7) Raça Receptor (d);8) Raça Doador (d);9) Transplantes Prévios (co);10)Tempo de Diálise (co);11)Tipo de Diálise (d);12)Ocorrência de Rejeição (d);13)Mismatch HLA (c);14)Esquema Imunossupressor (d);15)Transfusões Sangüíneas (co);

co: contínuac : categóricad : dicotômica

Variável de Saída da RNA

Pacientes com sobrevida maior ou igual a 60 meses foram considerados como tendo escore igual a 1;

1) Sobrevida do enxerto em meses

Características da Variáveis

O status das variáveis dicotômicas e categórica contribuintes para o sucesso do TXR foram definidas com o maior escore, p.ex.:

Todas as variáveis foram escaladas para situarem-se dentro da faixa de operação dos neurônios artificiais [0,1-0,9] (Andrea e Kalayeh, 1991);

• Sexo Doador: masculino = 1;• Mismatch HLA: Doador Idêntico = 3;• Ocorrência de Rejeição = 0

Características da RNA

Duas RNA com  arquiteturas diferentes foram utilizadas: a) com as 15 entradas originais e b) com o número de entradas reduzido após a aplicação de ACP;

Estrutura:• Feedfoward, totalmente conectada;• Apresentação de exemplos em lote;• Neurônios artificiais com função log-

sigmoidal;• Quantidade de neurônios na

camada oculta conforme Andrea e Kalayeh (1991).

Características da RNA

Algoritmo de Aprendizagem:• Algoritmo de retropropagação do

erro;• Técnica de otimização por gradiente

descendente;• Taxa de aprendizagem e constante

de momento segundo Sheppard et al. (1999);

• Função custo ou objetivo: Mean Square Error (mse).

Autovetores (âi) e Autovalores () mais representativos.

Percentual de informação de cada autovetor.

Comparação Entre Estimativas dos Modelos RNA

Foram feitas 15 sessões de treinamento para cada uma das RNA com pesos iniciais aleatórios com FDP uniforme;

O treinamento é interrompido após 5000 épocas ou mse igual a 0,01;

RNA 15x8x1 (sem ACP) RNA 6x3x1 (com ACP)

Sessões de Treinamento

da RNA

Sessão Sem ACP Com ACP

1 0,11 0,102 0,12 0,093 0,12 0,094 0,11 0,105 0,13 0,106 0,14 0,107 0,10 0,108 0,09 0,109 0,13 0,1010 0,11 0,1011 0,13 0,1112 0,14 0,1013 0,11 0,1014 0,11 0,1015 0,12 0,09

MSE mínimo alcançado após 5000 épocas no treinamento da RNA.

Resultados

Média e mediana do conjunto das 15 sessões de treinamento após a aplicação de ACP foram significativamente menores do que no conjunto utilizando as variáveis originais (p=0,001, Teste de Postos com Sinais de Wilcoxon ).

Discussão

Mesmo utilizando os oito maiores autovalores (representando mais do que 90% da informação), a aplicação de ACP ainda resultou em melhor convergência (p=0,002);

As variáveis previamente selecionadas possuem redundância, evidenciada após a aplicação de ACP (diminuição em quase 2/3 das variáveis originais);

Discussão

Como sugerido por Haykin (2002), a descorrelação das variáveis de entrada no conjunto de estimação possibilitou melhoria na convergência, com ganho de simplicidade para o modelo;

Conclusão

A aplicação de ACP nas variáveis de entrada originais resultou em seis novas variáveis que, ao serem aplicadas à entrada da RNA, melhoraram a convergência e o desempenho do treinamento da RNA para o conjunto de dados em estudo.

Referências

[1] Sheppard, D., McPhee, D., Darkr, C., Shrethra, B., Moore, R., Jurewitz, A., Gray, A., (1999), “Predicting Citomegalovirus Disease After Renal Transplantation: An Artificial Network Approach”, Int J Med Inf, v. 54, n. 1, p. 55-76.

[2] Andrea, T.A., Kalayeh, H., (1991), “Applications of Neural Networks in Quantitative Structure-Activity Relationships of Dihydrofolate Reductase Inhibitors”, J Med Chem, v. 34, n. 9, p. 2824-2836.

Referências

[3] Haykin, S., (2002), Redes Neurais – Princípios e Prática, 2ª Edição, Porto Alegre, Bookman.

top related