avaliaÇÃo de sistema para prediÇÃo de prescriÇÃo … · quais os sistemas de prontuário...

Curso de Bacharelado em Ciência da Computação

ÉDSON DAS NEVES OLIVEIRA

AVALIAÇÃO DE SISTEMA PARA PREDIÇÃO DE PRESCRIÇÃO

MÉDICA ELETRÔNICA

CANOAS, 2010

ÉDSON DAS NEVES OLIVEIRA

AVALIAÇÃO DE SISTEMA PARA PREDIÇÃO DE PRESCRIÇÃO

MÉDICA ELETRÔNICA

Trabalho de conclusão apresentado em sessão de apresentação pública do curso de Ciência da Computação do Centro Universitário La Salle, como exigência parcial para a obtenção do grau de Bacharel em Ciência da Computação

Orientação: Profª. Dra. Patrícia Kayser Vargas Mangan

CANOAS, 2010

Dedico esse trabalho a toda minha família e,

em especial a minha avó,

não deu tempo para ela estar de corpo

presente por isso estará de coração.

AGRADECIMENTOS

Agradeço especialmente à Deus que tornou todos meus sonhos realidade e esteve sempre

comigo em momentos de alegria e tristeza, me dando força e motivos para continuar

acreditando na vitória.

Agradeço minha mãe Maria de Lourdes, pelo suporte familiar e financeiro que me forneceu

através de todos esses anos de muitas lutas e vitórias, através de seu trabalho árduo me

forneceu suporte e educação necessários para esse momento.

Agradeço ao meu avô Antônio que desde ainda muito pequeno sempre me aconselhou e

educou pelos melhores caminhos a se seguir na vida. Agradeço ao meu pai Jorge que me

educou de forma que sempre soubesse o real valor da vida. Ambos não estão mais presentes,

mas de uma forma ou de outra acompanham esse momento.

Agradeço pelo apoio de minha esposa Raquel, que compartilha o seus dias comigo sendo

minha eterna companheira, esteve comigo todos esses anos de faculdade apoiando todos os

momentos críticos dessa jornada.

Agradeço meu sogro Verno e minha sogra Romi, que me ajudam e foram fundamentais em

momentos críticos desta jornada.

Agradeço imensamente ao Dr. Antônio Dal Pizzol Jr. que em um momento crítico de minha

vida me aconselhou e recuperou a minha saúde novamente. Também contribui imensamente

para realização desta monografia, através do projeto de pesquisa que resultou na aprovação

para o uso de informações reais.

Agradeço a empresa que trabalho Dixtal Biomédica e aos colegas de trabalho pela amizade e

oportunidades aprendizado, que auxiliaram de forma significativa na evolução de meu

conhecimento para viabilização desse projeto.

Agradeço aos professores do Unilasalle pela amizade e por todos esses anos de convivência.

Em especial a minha orientadora Patrícia Kayser pelas inúmeras horas dedicadas de

orientação para o melhor resultado possível desse trabalho.

Agradeço a todos que de uma forma ou de outra contribuíram para a viabilização do término

de minha graduação.

RESUMO

A Informática na Saúde é uma área emergente na Ciência da Computação, que se utiliza de

técnicas e metodologias de outras áreas como Inteligência Artificial e Banco de Dados. Neste

contexto, alguns trabalhos vêm sendo realizados buscando auxiliar o médico no diagnóstico

e/ou prescrição de tratamentos. Dessa forma, essa monografia tem como objetivo apresentar e

validar um modelo para predição de prescrição eletrônica, automatizando o processo de

construção de prescrição e, consequentemente, padronizando o uso de medicações, dosagens e

frequências. Para o desenvolvimento do modelo, utiliza-se técnicas de Sistemas de Raciocínio

Baseados em Casos (RBC), Sistemas Especialistas (SE) e Data Mining, resultando em um

modelo de solução híbrida. O modelo foi validado utilizando-se uma base de casos reais,

concedidos através da aprovação pelo Comitê de Ética e Pesquisa da instituição estudada.

Como resultado, dependendo do Código Internacional da Doença (CID) obtém-se resultados

na faixa dos 85% de similaridade em relação ao tratamento real construído pelo usuário

especialista e, em outros casos consegue-se apenas similaridades na faixa dos 20%. Dessa

forma, investiga-se o porquê de tanta diferença analisando-se e aperfeiçoando o modelo

proposto para adaptar-se as situações que na qual será exposto.

PALAVRAS-CHAVE: prescrição eletrônica, sistemas especialistas, sistemas baseados em

casos, mineração de dados, sistemas híbridos

6

ABSTRACT

Health Informatics is an emergent area in Computer Science, which uses techniques such as

Artificial Intelligence and Data Bases. In this context, some efforts are being done in order to

help medical staff on diagnosis and treatment prescription. This way, this text has the goal to

present and validate an electronic prescription prediction model, automating the process of

building a prescription and consequently standardizing the use of drugs, doses, and frequency.

The development of this model requires techniques of Case-Based Reasoning (CBR), Expert

Systems (ES) and Data Mining, providing a hybrid solution model. This model was evaluated

with a real cases base, granted by the approval of the Ethics and Research Commission of the

target institution. The results, considering the International Disease Code, indicate around

85% of similarity concerning the system results and the real treatment proposed by an expert.

For some cases, it was obtained similarities around 20%, which motivated further analyses to

allow the model improvement.

KEYWORDS: electronic prescription, expert system, case-based reasoning, data mining,

hybrid systems

LISTA DE ABREVIATURAS E SIGLAS

AIH Autorização para Internação Hospitalar

CEP Comitê de Ética e Pesquisa

CID Código Internacional de Doenças

CTI Centro de Terapia Intensiva

DAO Data Access Object

IA Inteligência Artificial

IMC Índice de Massa Corpórea

ISCMPA Irmandade da Santa Casa de Misericórdia de Porto Alegre

NMIT Número Médio de Itens do Tratamento

PEP Prontuário Eletrônico do Paciente

RBC Raciocínio Baseado em Casos

SE Sistemas Especialistas

SUS Sistema Único de Saúde

UML Unified Modeling Language

VO Value Object

8

LISTA DE FIGURAS

Figura 1 - Processos de um sistema RBC.................................................................................17

Figura 2 – Arquitetura de um SE..............................................................................................23

Figura 3 - Fases do CRISP-DM................................................................................................26

Figura 4 - Resultado da recuperação de casos..........................................................................34

Figura 5 – Estrutura do sistema IAC Virtual............................................................................35

Figura 6 - Estrutura de classes para representação dos casos...................................................41

Figura 7 – Indexação de casos pelo CID ..................................................................................43

Figura 8 – Diagrama do RankingVO........................................................................................50

Figura 9 – Indexação de casos pelo CID ..................................................................................53

Figura 10 – Tela de proposta de prescrição..............................................................................54

Figura 11 – Tela de seleção de casos........................................................................................62

Figura 12- Tela de análise da proposta.....................................................................................63

Figura 13 – Gráfico da similaridade x casos ............................................................................66

Excluído: 66

Excluído: 65

LISTA DE TABELAS

Tabela 1 – CID por altura .........................................................................................................59

Tabela 2 – CID por peso...........................................................................................................59

Tabela 3 – CID por altura .........................................................................................................60

Tabela 4 – Características com maior incidência .....................................................................60

Tabela 5 – Candidatos a avaliação ...........................................................................................61

Tabela 6 – Resultados iniciais CID I50....................................................................................64

Tabela 7 – Resultados iniciais CID J45.9.................................................................................65

Tabela 8 – Resultados parciais CID N18..................................................................................65

Tabela 9 – Resultados parciais CID J18...................................................................................65

Tabela 10 – Resultados sem alguns atributos CID I50.............................................................68

Tabela 11 – Resultados sem alguns atributos CID J45.9 .........................................................68

Tabela 12 – Resultados sem alguns atributos CID N18...........................................................68

Tabela 13 – Resultados sem alguns atributos CID J18............................................................69

Tabela 14 – Resultados finais com dose e freqüência..............................................................69

Tabela 15 – Resultados finais desconsiderando dose e freqüência ..........................................69

Excluído: 69

Excluído: 70

10

LISTA DE QUADROS

Quadro 1 – Principais diferenças entre sistemas convencionais e sistemas RBC....................16

Quadro 2 - Algumas informações para uma internação hospitalar ..........................................29

Quadro 3- Exemplos de códigos de doença do CID.....................................................................

Quadro 4 - Informações preenchidas durante a internação ......................................................30

Quadro 5 - Informações preenchidas durante o processo de alta hospitalar ............................32

Quadro 6 - Peso por atributo, definido de acordo com a informação epidemiológica do

paciente.....................................................................................................................................44

Quadro 7- Intervalo de valores permitido para cada atributo...................................................44

Quadro 8- Exemplo de comparação entre os atributos.............................................................47

Quadro 9 - Classificação IMC..................................................................................................48

Quadro 10- Comparação entre casos destacando o IMC..........................................................48

Quadro 11 – Exemplo de número médio de itens ....................................................................51

Quadro 12- Total de casos........................................................................................................56

Quadro 13 – Casos com filtros .................................................................................................57

Quadro 14 – Períodos utilizados...............................................................................................58

Quadro 15 – Exemplos de dosagens.........................................................................................66

Quadro 16 – Exemplos de freqüências .....................................................................................67

Excluído: 2929

11

SUMÁRIO

1 INTRODUÇÃO ............................................................................................................... 13

2 ESTADO DA ARTE........................................................................................................ 16

2.1 Sistemas de raciocínio baseado em casos (RBC).........................................................16

2.1.1 Estrutura do RBC......................................................................................................... 17

2.1.2 Aquisição e representação do conhecimento............................................................... 18

2.1.3 Casos............................................................................................................................ 19

2.1.4 Indexação...................................................................................................................... 19

2.1.5 Recuperação de Casos................................................................................................. 20

2.1.6 Revisão......................................................................................................................... 20

2.1.7 Retenção....................................................................................................................... 21

2.2 Sistemas Especialistas ................................................................................................... 21

2.2.1 Classificação................................................................................................................ 21

2.2.2 Aquisição de conhecimento.......................................................................................... 22

2.2.3 Estrutura....................................................................................................................... 23

2.2.4 Representação de conhecimento.................................................................................. 24

2.2.5 Exemplos de SE............................................................................................................ 24

2.3 Data Mining ................................................................................................................... 25

2.4 Sistemas Híbridos .......................................................................................................... 26

2.5 Ciclo de Internação Hospitalar .................................................................................... 27

2.6 Admissão Hospitalar ..................................................................................................... 28

2.7 Tratamento..................................................................................................................... 30

2.8 Alta Hospitalar............................................................................................................... 31

2.9 Trabalhos Relacionados................................................................................................ 32

2.10 Sistema DietSysNet........................................................................................................ 33

2.11 Projeto IACVIRTUAL.................................................................................................. 34

2.12 Considerações sobre o capítulo .................................................................................... 35

3 MODELO PROPOSTO.................................................................................................. 37

3.1 Metodologia.................................................................................................................... 37

3.2 Solução Proposta ........................................................................................................... 37

3.3 Aquisição de conhecimento........................................................................................... 38

3.3.1 Informações Utilizadas................................................................................................. 38

12

3.4 Metodologia de extração de informações .................................................................... 39

3.5 Representação do conhecimento .................................................................................. 40

3.6 Base de conhecimento.................................................................................................... 41

3.7 Indexação........................................................................................................................ 42

3.8 Critérios de similaridade............................................................................................... 43

3.9 Recuperação dos casos .................................................................................................. 45

3.9.1 Pesquisa CID................................................................................................................ 45

3.9.2 Similaridade epidemiológica........................................................................................ 46

3.9.3 Similaridade do tratamento.......................................................................................... 49

3.9.4 Construção do ranking e eliminação de itens.............................................................. 51

3.9.5 Popular resultado......................................................................................................... 52

3.9.6 Apresentação da predição de prescrição..................................................................... 52

4 AVALIAÇÃO DOS RESULTADOS ............................................................................. 54

4.1 Montagem da Avaliação................................................................................................ 55

4.1.1 Método de comparação................................................................................................ 55

4.1.2 Critérios para a amostragem utilizada........................................................................ 56

4.1.3 Períodos de amostragem.............................................................................................. 57

4.2 Processo de Avaliação ................................................................................................... 58

4.2.1 Análise e seleção de novos casos para avaliação........................................................ 58

4.2.2 Execução Avaliação..................................................................................................... 62

4.3 Resultados da avaliação ................................................................................................ 64

4.3.1 Dosagens com padrões diferentes................................................................................ 66

4.3.2 Freqüências com padrões diferentes............................................................................. 67

4.4 Considerações sobre o capítulo .................................................................................... 70

5 CONSIDERAÇÕES FINAIS.......................................................................................... 71

REFERÊNCIAS ..................................................................................................................... 73

ANEXOS ................................................................................................................................. 73

1 INTRODUÇÃO

A informática na saúde é considerada uma área emergente em sistemas de informação,

possuindo grande demanda de desenvolvimento de novas soluções tanto em hardware quanto

em software. Assim, desperta o interesse de grandes corporações, que atualmente criam novas

divisões e adquirem empresas da área para integrar em suas soluções globais fortalecendo e

expandindo a informatização na saúde.

Segundo Blois e Shortliffe apud Sociedade Brasileira de Informática na Saúde (2010), a

informática na saúde é um campo de rápido desenvolvimento científico que lida com

armazenamento, recuperação e uso da informação, dados e conhecimentos biomédicos para a

resolução de problemas e tomada de decisão. Ainda segundo a Sociedade Brasileira de

Informática na Saúde (SBIS), a informática na saúde possui diversas subdivisões, dentre as

quais os sistemas de Prontuário Eletrônico do Paciente (PEP). Esses sistemas estão cada vez

mais presentes em hospitais e clínicas, sendo este um dos focos deste trabalho.

O desenvolvimento deste trabalho baseou-se no sistema PEP implantado na Irmandade

da Santa Casa de Misericórdia de Porto Alegre (ISCMPA), no qual está disponível em

diversos pontos da instituição sendo responsável pelo armazenamento eletrônico do

prontuário dos pacientes. Em particular, foi analisado um módulo específico do sistema PEP

conhecido como Prescrição Eletrônica. Esse módulo tem como responsabilidade criar e

manter a lista de ordens médicas - medicamentos, procedimento, dietas - criado pelo médico

responsável pelo paciente durante a internação e passado para a equipe assistencial para sua

posterior execução. Dependendo da gravidade do estado clínico do paciente, prescrições

extensas podem ser geradas que, conseqüentemente, tem sua construção muito trabalhosa,

com chances de erros em dosagens e interações medicamentosas. Segundo Morimoto et al.

(2004), as medicações são causa mais freqüente de geração de eventos adversos, aumentando

o número de internações hospitalares, o tempo de internação, conseqüentemente gerando

custos extras.

Na tentativa de minimizar erros de prescrição de medicamentos, alguns sistemas de

prescrição possibilitam salvar a prescrição criada como um modelo, para ser reutilizada no

futuro, minimizando o trabalho de reconstrução de um tratamento. Outra solução adotada foi

a criação de protocolos, ou seja, padronizar a prescrição para determinadas doenças. Contudo,

as duas soluções apresentam praticamente o mesmo problema: as medicações, dosagens e

freqüências devem considerar características clínicas e epidemiológicas do paciente atual.

Excluído:

14

Para a utilização de qualquer uma das duas soluções, necessita-se a adaptação de alguns

parâmetros dos itens prescritos, tais como dosagens e frequências, para utilização em

pacientes distintos.

Considerando-se os problemas relatados, é possível afirmar que uma prescrição médica

não pode ser baseada em regras simples, com informações padrão a diversos tipos fisiológicos

de pacientes. Assim, o tratamento dos dados de entrada precisa ser dinâmico, moldado de

acordo com o novo caso considerando-se a experiência médica para casos solucionados

anteriormente. Portanto, para utilizar-se a base de experiência médica necessita-se avaliar,

modelar e desenvolver uma metodologia que seja possível extrair as informações necessárias

para a construção de uma proposta de tratamento. Sendo assim, o problema de pesquisa

abordado neste trabalho visa elucidar qual seria a melhor ou melhores técnicas que,

combinadas, poderiam retornar resultados (proposta de tratamento) com um alto índice de

eficácia.

Por conseguinte, o principal objetivo desse trabalho é avaliar a combinação de técnicas

da Inteligência Artificial (IA), com a criação de métricas para comparação e extração de

informações importantes para a construção de um tratamento considerando-se as

características epidemiológicas do paciente. Ainda busca-se nesse estudo um alto grau de

similaridade entre a proposta de tratamento construída pelo sistema, comparada ao tratamento

construído pelo profissional de saúde. Como objetivos específicos (metas) são destacados os

seguintes:

• Definição de medidas de similaridade utilizando-se as características

epidemiológicas dos pacientes e seus respectivos tratamentos;

• Definição de métricas de segurança evitando que resultados inconsistentes sejam

apresentados;

• Construção de um método automatizado de avaliação dos resultados para

comparar o grau de concordância do padrão de prescrição identificada

eletronicamente, com o realmente prescrito em internações subseqüentes a partir

de dados reais.

Esta monografia descreve o desenvolvimento de um modelo visando atingir os objetivos

propostos, sendo que o restante do texto foi divido em mais seis capítulos.

No Capítulo 2 são mostradas as técnicas da IA utilizadas nesse trabalho detalhando suas

principais características e seus conceitos gerais. Apresenta-se no Capítulo 3 um breve resumo

da rotina hospitalar, mais especificamente as principais etapas que ocorrem durante a

internação de um paciente, demonstrando-se o contexto em que o modelo proposto será

15

utilizado. O Capítulo 4 apresenta alguns sistemas similares na área de informática médica que

utilizam técnicas da IA. No Capítulo 5 apresenta-se o modelo proposto dividido nas etapas

modeladas e desenvolvidas. As métricas de avaliação com o respectivo resultado do modelo

proposto são analisadas no Capítulo 6. Finalmente, o Capítulo 7 contém as conclusões

parciais e os possíveis trabalhos futuros.

16

2 ESTADO DA ARTE

Uma das formas de representação do pensamento humano em computação é através

dos sistemas de Raciocínio Baseado em Casos (RBC), que tentam reproduzir através do uso

de técnicas de construção de conhecimento e recuperação, o comportamento humano em

tomada de decisões.

Para a viabilização da proposta, serão apresentados nas próximas seções os principais

conceitos e alguns exemplos de Sistemas de Raciocínio Baseado em Casos (RBC), Sistemas

Especialistas (SE) e Data Mining.

2.1 Sistemas de raciocínio baseado em casos (RBC)

Os sistemas RBC foram criados utilizando-se os princípios da Memória Dinâmica

criado por Schank (1999), que define que o processo de aprendizagem ocorre quando existe

diferença entre o que é esperado acontecer do que realmente acontece em determinada

situação. Para Wangenhein (2003) um sistema RBC pode ser considerado uma metodologia

de construção de sistemas inteligentes ou uma metodologia que visa moldar o pensamento

humano. Como característica principal possui um aprendizado automatizado, pois poderão

utilizar um novo caso para resolver futuros casos (AMODT ; PLAZA, 1994).

Os sistemas que utilizam técnica de RBC consistem em identificar o problema atual,

buscar a experiência mais similar em sua base de conhecimento e aplicar essa experiência

similar para resolver o problema atual (SILVA; COSTA, 2002). Segundo Rezende (2003),

existem quatro principais diferenças entre sistemas RBC e sistemas convencionais, as quais

estão sumarizadas no Quadro 1.

Sistemas Convencionais Sistemas RBC

Estrutura de dados Representação de Conhecimento

Dados e relacionamentos Conceitos, relações entre conceitos e regras

Conhecimento especificado no código do

programa

Conhecimento representado e separado do

programa que apenas o manipula e interpreta

Explicação do raciocínio é difícil Podem e devem explicar seu raciocínio

Quadro 1 – Principais diferenças entre sistemas convencionais e sistemas RBC

Fonte: Rezende, 2003

17

2.1.1 Estrutura do RBC

Os sistemas RBC são moldados para armazenar uma base de conhecimento consistente

e de rápido acesso para a resolução de um problema atual. Para Amodt e Plaza (1994), um

sistema RBC deve apresentar suas etapas dentro dos quatro processos a seguir:

• Recuperação: O caso com maior índice de similaridade com o atual, é recuperado

sendo que nessa etapa é necessário a avaliação da similaridade entre os casos;

• Reutilização: sendo identificado o caso semelhante o mesmo é eleito para a resolução

do problema atual;

• Revisão: o caso anterior é revisado quando necessário para sua utilização na resolução

atual, sendo que as eventuais diferenças podem ser ajustadas para se adequar à

resolução do novo caso;

• Retenção: é responsável pelo armazenamento de todas as informações do novo caso

para que o mesmo sirva de solução para um caso semelhante no futuro. Portanto,

através dessa etapa, se expande a base de conhecimento para resoluções de problemas

futuros.

Figura 1 - Processos de um sistema RBC.

Fonte: Traduzido de Amodt & Plaza,1994. Excluído:

18

A Figura 1 ilustra as etapas que o caso percorre desde sua criação, passando por todos

os processos descritos por Amodt e Plaza (1994), até seu aproveitamento para resolução de

um caso posterior.

2.1.2 Aquisição e representação do conhecimento

Para a representação de conhecimento, é necessário a análise para definir-se o grau de

importância dos atributos que serão integrantes de um caso. Para essa definição, necessita-se

de um profissional que tenha o domínio do contexto e possa se relacionar com o usuários

especialistas denominado como Engenheiro do Conhecimento. Esse profissional deve

entender o domino da aplicação e interagir com as fontes de informação como: entrevistas,

modelagem de dados, etc. (COSTA; SILVA, 2005).

Segundo Buchanan apud Rezende (2003) a aquisição de conhecimento é dividida em

cinco fases:

• Identificação: Análise e busca de informações sobre o contexto que o sistema RBC

será aplicado;

• Conceituação: Através da literatura o Engenheiro de Conhecimento, constrói os

conceitos necessários sobre o domínio do negócio e os relaciona;

• Formalização: Momento que a estrutura da base de conhecimento é desenvolvida;

• Implementação: Escolha das ferramentas e implementação da base de conhecimento;

• Teste: Validação da efetividade e da qualidade dos resultados retornados pelo sistema;

• Manutenção: Possibilita a atualização da base de conhecimento.

Segundo Luger (2004), a aquisição de conhecimento pode ser feita através de registros

históricos ou do monitoramento em tempo real dos dados gerados. Em ambos os casos, esta

aquisição minimiza a demanda por tempo do especialista humano.

De acordo com Rezende (2003), as seguintes técnicas podem ser utilizadas para a

aquisição de conhecimento:

• Técnicas manuais baseadas em acompanhamento ou modelos;

• Técnicas semi-automáticas baseadas em teorias;

• Técnicas de aprendizado de máquina;

• Técnicas de mineração de dados a partir de grandes massas de dados;

• Técnica de mineração de textos de informações não estruturadas.

Excluído:

19

Como resultado da etapa de aquisição de conhecimento, se obtém a base de

conhecimento. A base possui, em sua estrutura, experiências anteriores com seus respectivos

atributos sendo conhecidas como casos.

2.1.3 Casos

Como principal elemento de um sistema RBC possui-se o caso, que segundo

Wangenheim (2003) representa a descrição de um problema possuindo em conjunto as

experiências adquiridas durante sua resolução. Cada caso é classificado como uma peça de

conhecimento contextualizado representando um episódio ou problema que foi resolvido

anteriormente (WANGENHEIM, 2003).

O desempenho do sistema RBC é fortemente influenciado com a estrutura, disposição e

a qualidade dos casos armazenados. Para ser possível uma melhor disposição dos casos, cada

um deve possuir informações suficientes para permitir determinar se ele pode ser eleito como

uma possível solução para o problema atual (TONIDANDEL, 2003).

Segundo Rezende (2003), o conhecimento representado deve possuir as seguintes

características: ser compreensível ao ser humano, abstrair-se dos detalhes, ser robusto e

generalizável, isto é necessita de uma representação com vários pontos de vista.

Com a característica de generalizável, necessita-se que os casos estejam organizados de

forma que facilite a busca por características identificadas como prioritárias. O processo de

organização classificando os casos pelas principais características é conhecido como

indexação.

2.1.4 Indexação

Segundo Schank (1999), para o aproveitamento de experiências anteriores é necessário

possuir-se uma memória com experiências eficazes, possuindo experiências especificas

categorizadas e indexadas. Dessa forma, considera-se que a estrutura de organização de casos

é fundamental para se obter um bom desempenho em sistemas RBC. De acordo com

Tonidandel (2003), os sistemas RBC necessitam de uma estrutura que possibilite a busca de

um caso em apenas um subconjunto de casos indexados, evitando-se a busca em toda a base

de conhecimento.

O processo de indexação possui várias formas de implementação e representação. Uma

das formas utilizadas segundo Tonidandel (2003) pode ser desenvolvida como ponteiros, que

Excluído: .

20

identifica o caso de acordo com algumas características principais. Assim, possibilita uma

amostra de casos menor para a recuperação e comparação do grau de similaridade.

2.1.5 Recuperação de Casos

Para a correta e eficiente recuperação de casos, é proposto um conjunto de heurísticas

para ajudar na recuperação e organização dos casos (KOLODNER apud LUGER, 2004),

sendo estas:

• Preferência orientada à objetivo: Organizar a base de casos pelo objetivo;

• Preferência por características salientes: Preferir casos que se enquadrem no maior

número de características importantes;

• Preferência por maior especificidade: Procurar primeiramente por casos cujas

características sejam o mais semelhante possível. Assim, somente depois considera os

casos mais genéricos;

• Preferência por ocorrências freqüentes: Sempre identificar os casos com uso mais

frequente;

• Preferência por atualidade: Preferir sempre os casos mais utilizados recentemente;

• Preferência por facilidade de adaptação: Sempre dar preferências a utilização de casos

com maior capacidade de adaptação à situação corrente.

Baseando-se nessas heurísticas, para o trabalho apresentado utiliza-se a heurística de

facilidade de adaptação dos casos, no qual casos semelhantes são utilizados na construção da

solução do problema corrente. O processo chamado revisão pode ser usado nesta tarefa, o

qual é analisado na próxima seção.

2.1.6 Revisão

A revisão provê a capacidade de adaptar as possíveis características de um problema a

um caso previamente armazenado. Os sistemas RBC, através dessa etapa, modificam um caso

recuperado para que o mesmo seja aplicado na situação atual, tendo que transformar uma

situação armazenada em operações e características adequadas ao problema corrente

(LUGER, 2004).

Durante o uso do sistema RBC, a base de conhecimento está em constante expansão.

Com essa expansão são armazenados casos eficazes e outros com baixa qualidade. Por isso,

necessita-se de algum mecanismo que monitore a qualidade dos casos armazenados.

21

2.1.7 Retenção

Para a continuidade do uso da base de conhecimento garantindo sua eficiência e

desempenho necessita-se implantar um processo de retenção. De acordo com Tonidandel

(2003), necessita-se controlar a qualidade e a quantidade de casos na base, preservando a

qualidade das amostras e sempre manter o menor número possível de casos.

Segundo Luger (2004), conforme a base de conhecimento aumenta, o tempo para

recuperação de casos também aumenta. Assim, uma das possíveis soluções seria o

armazenamento somente dos "melhores" casos ou "protótipos", excluindo-se os casos

redundantes. Conseguir reter continuamente o conhecimento toda vez que um problema é

resolvido, permite ao sistema incrementar o seu conhecimento tornando-se cada vez mais

eficaz na solução de problemas complexos (WANGENHEIM,2003).

2.2 Sistemas Especialistas

Sistemas que solucionam problemas que poderiam ser solucionados por um especialista

humano são classificados como sistemas especialistas (SE). Segundo Rich e Knight (1994), os

SEs utilizam uma grande base de conhecimentos montada de maneira mais eficiente possível

através de especialistas humanos. Geralmente fazem parte de um sistema maior, sendo muitas

vezes, um módulo específico do sistema principal (RICH; KNIGHT, 1994).

Para a sua completa efetividade durante o seu uso, os sistemas especialistas precisam

prover uma fácil e eficaz interação com os seus usuários. Para facilitar essa interação o SE

deve possui dois recursos: explicar seu raciocínio e adquirir novo conhecimento modificando

o conhecimento antigo (RICH; KNIGHT, 1994).

De acordo com Russel e Norvig (2009), se for dado conhecimento do domínio

apropriado, o sistema especialista é possível igualar ou superar o desempenho de peritos

humanos em tarefas estritamente definidas.

2.2.1 Classificação

Segundo Fernandes (2005), os SE podem ser classificados conforme a sua característica

de funcionamento:

• Interpretação: inferem descrição de fatos através de observação de fatos;

• Diagnóstico: detecção de falhas através da interpretação dos dados;

Excluído:

22

• Monitoramento: observa e interpreta sinais do comportamento monitorado;

• Predição: utiliza uma modelagem de dados do passado e do presente para um previsão

de futuro essa característica a proposta do modelo será apresentada;

• Planejamento: o sistema prepara um grupo de iniciativas para atingir um objetivo;

• Projeto: define especificações para os objetivos serem atingidos;

• Depuração: fornecem soluções para o mau funcionamento devido a distorções nos

dados;

• Reparo: executa planos de reparos na etapa de diagnósticos;

• Instrução: verifica e corrige o comportamento do aprendizado de estudantes;

• Controle: governa o comportamento geral de outros sistemas.

2.2.2 Aquisição de conhecimento

Para a construção da base conhecimento em SE, necessita-se da fase de aquisição de

conhecimento em que o responsável é o engenheiro de conhecimento. Como em Sistemas

RBC, esse profissional deve entender o domínio da aplicação e interagir com as fontes de

informações necessárias. Segundo Fernandes (2005), a etapa de aquisição de conhecimento é

o principal “gargalo” de tempo nos SE.

De acordo com Rezende (2003), um dos principais problemas de SE é a disponibilidade

do especialista para se extrair o conhecimento e construir a base de conhecimento. Por isso,

segundo Costa (2005) é possível obter-se o conhecimento a partir dos seguintes métodos:

• Pesquisas na literatura: obtém-se um conhecimento inicial sobre o processo;

• Entrevistas com usuários especialistas: o engenheiro de conhecimento realiza

entrevistas, para posteriormente ser analisá-las em busca de requisitos necessários;

• Acompanhamento: acompanha o raciocínio do especialista em casos reais. Dessa

forma, são pesquisados a forma como os casos são resolvidos por esse especialista;

• Processos semi-automáticos: utilizam-se ferramentas computacionais para a extração

do conhecimento de alguma base de informações existente.

23

2.2.3 Estrutura

Segundo Fernandes (2005), os sistemas especialistas apresentam três componentes

básicos: base de conhecimento, máquina de inferência, memória de trabalho, conforme

representado na Figura 2.

Figura 2 – Arquitetura de um SE

Fonte: Adaptado de Juliani, 2005, p. 2.

A Figura 2 demonstra o fluxo de troca de informações entre os componentes que

compõe a estrutura de um sistema especialista. Esses componentes são divididos em:

• Memória de trabalho: Responsável pelo de armazenamento de informações

temporárias. Contém todas as respostas fornecidas pelos usuários e também, os passos

executados em uma interação na busca pela solução do novo problema apresentado

(COSTA; SILVA, 2005). Como memória de trabalho o modelo proposto, utiliza os

objetos em memória que são manipulados pelas diversas etapas que compõe a

recuperação dos casos;

• Máquina de Inferência: Esse mecanismo é responsável pelo raciocínio do sistema,

examina as regras existentes na base de dados, acrescentando sempre que possível

novos fatos a partir de suas interpretações e conclusões (JULIANI et al. ,2005).

Segundo Fernandes (2005) é responsável por procurar as respostas na base de

conhecimento através das regras necessárias a serem avaliadas;

• Base de conhecimento: formada por um conjunto de regras definidas previamente

com algum dos processos de aquisição de conhecimento.

Excluído:

24

2.2.4 Representação de conhecimento

A base de conhecimento pode ter diversas formas de representação. Segundo Viana e

Nabuco (2007), os métodos para representação de conhecimento são:

• Lógica: utiliza expressões lógicas na montagem das regras tendo sua interpretação

como proposições ou predicados lógicos;

• Produção: utiliza regras de produção, que são pares de expressão “se” e “então”;

• Redes semânticas: construção de uma rede com inter-relações entre os nodos que

representam objetos, predicados ou classes e são relacionados de forma binária;

• Quadros: conhecidos como frames ou scripts permite a representação das estruturas

internas dos objetos permitindo a herança de propriedades em redes semânticas.

Considera-se esse método como base para a criação de linguagens orientadas a

objetos.

• Objetos: representam entidades físicas ou conceituais, seus atributos representam

características ou propriedades associadas aos objetos. Os respectivos valores dos

atributos representam a natureza particular de um atributo em cada situação

(CAVELLUCI; LYRA, 1992).

Este trabalho utiliza como método de representação de conhecimento: objetos, pois esse

método possibilita armazenar o objeto com sua forma do mundo real facilitando a

conceituação da base de conhecimento.

2.2.5 Exemplos de SE

Os sistemas especialistas exploram diversos mecanismos de raciocínio e representação

de regras (RICH; KNIGHT, 1994). Como exemplo dessa diversidade pode-se citar aos

seguintes sistemas e seus respectivos métodos utilizados:

• DENDRAL: um dos pioneiros SE voltado para resolver problemas em um domínio

específico, desenvolvido na final da década de 60 na universidade de Stanford. Tinha

como objetivo era inferir a estrutura de moléculas orgânicas baseando-se em fórmulas

químicas. Mesmo sendo reconhecido na química computacional, sua utilização na prática

foi limitada (VIANA; NABUCO, 2007).

Excluído: e

25

• MYCIN: foi um dos primeiros sistemas especialistas e tinha como objetivo recomendar

terapias para pacientes que com suspeita de infecções bacteriológicas (RICH; KNIGHT,

1994). Segundo Russel e Norvig (2009) era tanto uma solução da engenharia quanto um

modelo de julgamento humano sob incerteza. Cada regra no sistema MYCIN tem

associado um fator de certeza, que é utilizado para medir o grau de evidência do

antecedente da regra com o valor presente que a regra está sendo submetida. As regras do

sistema MYCIN são fornecidas pelos especialistas tendo como função refletir as

avaliações que os especialistas baseando-se em evidências para sustentar as hipóteses de

diagnóstico. Essas regras eram adquiridas em extensas entrevistas com usuários

especialistas e pesquisas na literatura médica (RICH; KNIGHT, 1994);

O sistema DENTRAL é uma referencia e um dos pioneiros de SE, assim como o

MYCIN que alem de ser um dos primeiros é um sistema era utilizado na área clínica

recomendando terapias. O sistema DENTRAL virou referência na área química mesmo sem

ter grande utilização na prática, já o sistema MYCIN foi um SE pioneiro na área clinica tendo

suas regras criadas por diversos especialistas.

2.3 Data Mining

Devido à crescente quantidade de informações geradas no dia-a–dia, fica cada vez mais

difícil se obter informações relevantes para o apoio a decisão, devido ao grande volume de

dados e a complexidade no processo de cruzar informações para se obter informações

concretas.

Segundo Rezende (2003), o crescimento das bases de informações foi motivado pelos

poderosos mecanismos de coleta e armazenamento existentes. Analisar estas informações de

forma manual a fim de obter conhecimento é difícil e em muitos casos inviável. Um das

formas mais usuais de automatizar os processos de análise de dados é aplicar técnicas de

mineração de dados (Data Mining).

De acordo com Rezende (2003), para a possível Mineração de dados são empregadas

várias técnicas e algoritmos, tais como: Algoritmos genéticos, Clustering, Redes neurais,

Lógica fuzzy, Árvores e Regras de decisão.

Existem alguns modelos de processos para a extração de dados, sendo que o mais

utilizado é conhecido como CRISP-DM (Cross Industry Standard Process for Data Mining).

De acordo com Gurgel (2007), esse modelo é organizado em seis etapas: entendimento do

negócio (Businness Understanding), entendimento dos dados (Data Understanding),

26

preparação dos dados (Data Preparation), modelagem (Modeling), avaliação dos resultados

(Evaluation) e implantação da solução (Deployment). A Figura 3 apresenta o ciclo com esses

processos.

Figura 3 - Fases do CRISP-DM

Fonte: Traduzido de Gurgel, 2007.

A Figura 3 apresenta o fluxo necessário para a extração das informações utilizando-se

Data Mining. O processo inicia-se com o entendimento do negócio, logo após necessita-se do

entendimento dos dados. Com o devido entendimento dos dados e do negócio é possível

preparar os dados para a modelagem necessária para a avaliação dos resultados.

2.4 Sistemas Híbridos

Os sistemas híbridos são cada vez mais utilizados de acordo com o aumento da

complexidade na resolução de um problema, uma vez que permitem combinar dois ou mais

métodos buscando maior eficiência e desempenho. De acordo com Coelho e Mariani (2006),

utiliza-se os sistemas híbridos inteligentes quando possui-se domínios complexos e que

requerem diversos tipos de processamentos.

Segundo Luger (2004), um ou mais paradigmas integrados produzem um efeito

cooperativo, onde as vantagens de um sistema podem compensar as desvantagens de outro

sistema.

27

De acordo com Coelho e Mariani (2006, p 33), “A concepção de que as metodologias

da inteligência computacional são complementares, mais que competitivas, gerou uma ampla

diversidade de configurações de sistemas híbridos inteligentes”. Assim, nesse trabalho utiliza-

se sistemas RBC, Sistemas Especialistas e Data Mining em cooperação, dessa forma

caracterizando-se como um Sistema Híbrido.

A solução híbrida foi adotada devido às características especificas que cada técnica

provê. Para a extração de informações, considerando-se o grande volume de informações do

sistema principal, necessita-se de técnicas de Data Mining para indexar e extrair informações

relevantes sem prejudicar o desempenho do sistema principal. Assim, com o uso de sistemas

RBC cria-se uma base de conhecimento com casos específicos organizados e indexados

atualizada diariamente por inúmeros usuários especialistas. Dessa forma, para a construção do

modelo propostos as três técnicas citadas atendem completamente as necessidades que o

modelo necessita.

As técnicas citadas serão utilizadas no meio clínico, manipulando, indexando e

recuperando informações obtidas durante a internação de um paciente. Por isso, para facilitar

a compreensão do contexto, na próxima seção apresenta-se um breve resumo das informações

e seus respectivos momentos de coleta durante o ciclo de uma internação hospitalar.

2.5 Ciclo de Internação Hospitalar

O estudo proposto depende de informações que são geradas durante a internação

hospitalar dos pacientes. Durante essa internação são geradas informações em diversos

momentos, que aos poucos iram criar e incrementar o prontuário do paciente.

De acordo com Brasil (2010), o prontuário do paciente é um conjunto de documentos

padronizados e organizados, destinados ao registro de todas as informações referentes aos

cuidados médicos e de outros profissionais de saúde. No prontuário deve-se possuir o registro

das seguintes informações (BRASIL, 2010):

• Atendimento ambulatorial;

• Atendimento de urgência;

• Evolução médica;

• Evolução de enfermagem e de outros profissionais assistentes. No caso de internação,

as evoluções devem ser diárias, com data e horário em todas elas;

• Partograma (em obstetrícia);

28

• Prescrição médica;

• Prescrição de enfermagem e de outros profissionais assistentes -No caso de internação,

as prescrições devem ser diárias, com data e horário em todas elas;

• Exames complementares (laboratoriais, radiológicos, ultra-sonografias e outros) e seus

respectivos resultados;

• Descrição cirúrgica;

• Ficha de anestesia;

• Material usado no centro cirúrgico ou obstétrico (gasto de sala);

• Resumo de alta;

• Boletins médicos.

O trabalho proposto utiliza informações da prescrição médica e de outros processos

clínicos e administrativos existentes na instituição de saúde. Por isso, nessa seção apresenta-se

uma breve descrição de cada um dos processos, que compõe o prontuário do paciente,

demonstrando as diversas informações que são geradas em cada momento da internação e, sua

utilidade dentro do estudo proposto.

Este seção foi construída utilizando-se como base, o conhecimento prévio adquirido

através da literatura e entrevistas com usuários especialistas durante a construção do sistema

principal em uso pela instituição de saúde.

2.6 Admissão Hospitalar

A internação hospitalar pode ter seu início de forma programada ou por uma

intercorrência clínica. A instituição utilizada no estudo proposto tem grande parte de seus

atendimentos vinculados ao Sistema Único de Saúde (SUS). Dessa forma, as informações

necessárias durante a admissão de um paciente seguem as regras definidas pelo Ministério da

Saúde.

De acordo com Brasil (2010), no momento da admissão hospitalar o profissional

médico que realizou a consulta e/ou atendimento, solicita a Autorização para Internação

Hospitalar (AIH) através do preenchimento do Laudo de AIH. Esse laudo possui as

informações do paciente como: identificação, ananmese, resultados de exames, exame físico,

ou seja, tudo que justifique a internação do paciente conforme Anexo B (BRASIL, 2010).

Quando é uma internação de urgência, ou seja, não programada o laudo deve ser preenchido

durante a internação e a autorização deve ocorrer até 72 horas da admissão.

29

Com a aprovação do laudo de AIH o paciente pode ser internado na instituição de saúde

que recebeu a autorização. Nesse momento, o formulário de internação é preenchido com

diversas informações administrativas e clínicas. No Quadro 2, apresenta-se algumas

informações preenchidas na admissão do paciente.

Informações do paciente Informações Administrativas

Nome do paciente Número prontuário

Logradouro Identificação AIH

Número Órgão Emissor AIH

Complementação Número Enfermaria

Município Número Leito

UF CPF médico solicitante

CEP Código Procedimento

Data Nascimento Caráter da Internação

Sexo Tipo de Leito (Cirúrgico, Clínica

Médica, etc)

Nome da Mãe ou Responsável Caráter de atendimento (Eletivo,

Urgência, etc)

Número Documento CID Principal

CNPJ empregador CID Secundários

Quadro 2 - Algumas informações para uma internação hospitalar

Fonte: Adaptado de BRASIL, 2010.

Pode-se observar no Quadro 2 que no momento da admissão hospitalar informa-se o

código internacional de doenças (CID), representado como o item “CID principal”. Esse

código classifica as doenças conhecidas por códigos, sendo atribuído um código a cada uma

delas. O Quadro 3 demonstra alguns exemplos de códigos.

Código Descrição

A08.0 Enterite por rotavírus

B00.7 Doença disseminada devido ao vírus da herpes

B16 Hepatite aguda B

R57.1 Choque hipovolêmico

Quadro 3- Exemplos de códigos de doença do CID

Fonte: Autoria Própria, 2010.

30

Nessa proposta, o código de CID de admissão não será utilizado na busca por

similaridade, devido a ser suscetível a alterações durante a internação, com a execução de

exames mais detalhados e acompanhamento da evolução do quadro clínico do paciente. Por

isso, para recuperar um caso da base de conhecimento sempre será considerado o CID da alta

do paciente.

Com o processo de admissão concluído o paciente está oficialmente internado, mas o

início do tratamento já pode começar antes dependendo da gravidade do estado clínico do

paciente.

2.7 Tratamento

O processo de tratamento do paciente inicia-se durante a primeira consulta ou em um

atendimento de emergência. Quando o paciente já está internado são coletadas informações

periodicamente pela equipe assistencial, visando o monitoramento da evolução do estado de

saúde do paciente. Essas coletas podem ocorrer de forma manual ou através de resultados de

exames. Os resultados dessas informações são repassadas para os médicos quando estão na

unidade avaliando o paciente. O Quadro 4 apresenta algumas dessas informações.

Informações Epidemiológicas Informações Assistenciais Informações de Serviços

Peso Planilha de controle Exames Laboratoriais

Altura Passagem de plantão Exames de Imagem

Hábitos Evolução de enfermagem

Alergias

Quadro 4 - Informações preenchidas durante a internação

Fonte: Autoria Própria, 2010.

Conforme o Quadro 4 diversas informações são coletadas durante a internação do

paciente, algumas delas são simples como, por exemplo, peso e altura e, outras informações

complexas como: hábitos, planilha de controle, evolução da enfermagem, passagem de

plantão, alergias e resultados de exames. Essas informações são consideradas complexas,

devido a diversos dados que devem preenchidos para completá-las em momentos e pessoas

diferentes durante a internação do paciente. Assim, muitas delas são preenchidas de forma

manual através de formulários e documentos definidos pela instituição de saúde.

31

Com as informações coletadas tanto em papel ou eletronicamente durante a internação,

é possível a definição de um tratamento que é dividido em várias prescrições, uma por dia. De

acordo com Benet apud Abramovicius (2007), a prescrição médica é uma relação terapêutica

importante entre o médico e o paciente, representando o resultado da capacidade diagnóstica e

terapêutica do médico, sendo o documento onde estão dispostos todos os dados necessários

para a equipe assistencial dar andamento no tratamento do paciente.

Para o modelo proposto, dentre todas as informações epidemiológicas do paciente,

considera-se apenas os campos de sexo, peso e altura. Os campos de sinais vitais e resultados

de exames não são informados ao sistema de forma parametrizada inviabilizando o seu uso,

ou seja, são informações sem um padrão definido. A informação sobre evolução é preenchido

quase que diariamente, sendo um texto livre. O uso destas informações adicionais fica como

sugestão para trabalhos futuros.

Em busca de um cruzamento com o máximo de eficiência, seria necessário obter-se

informações como histórico de doenças na família, alergias e hábitos do paciente (prática de

esportes, fumante, etc). O sistema atual possui suporte para adquirir essas informações, mas

apenas poucos usuários as complementam. Por isso, essas informações não serão

consideradas no momento de verificar o grau de similaridade entre os pacientes.

No momento que o tratamento é concluído, o paciente recebe a alta da unidade, se

estiver em um centro de tratamento intensivo (CTI), ou alta hospitalar. Para o modelo

proposto consideram-se apenas como casos anteriores, os pacientes que obtiveram alta

hospitalar. Assim, consideram-se apenas pacientes com alta, devido ao desfecho de sua

internação estar concluído com o correto CID da doença informado no momento da alta.

2.8 Alta Hospitalar

O processo de alta é um processo administrativo completamente dependente do

processo clínico da instituição, pois necessita de informações fornecidas pelo médico para a

sua completa realização.

No momento que o médico pretende efetuar alta para um determinado paciente, é

necessário que o mesmo preencha uma série de informações no sumário de alta. De acordo

com o Brasil (2010), os motivos de saída do paciente da instituição são diversos de acordo

com o Anexo C. O sistema principal da instituição estudada resumiu as informações a serem

utilizadas no momento da alta, deixando apenas as obrigatórias e mais utilizadas conforme o

Quadro 5.

32

Campo Valores possíveis

Tipo de Alta Óbito – Alta Hospitalar –Transferência Hospitalar

Condição de alta Curado – Melhorado – Inalterado - Óbito

Data Data em formato dia, mês e ano

CID principal De acordo com a codificação CID

CID secundários De acordo com a codificação CID

Resumo clínico Texto em formato livre

Quadro 5 - Informações preenchidas durante o processo de alta hospitalar

Fonte: Autoria própria, 2010.

A informação chave para a aquisição e posterior criação da base de conhecimento será o

CID de alta do paciente. Essa informação foi definida após diversos exames e avaliação de

diversos profissionais, diferentemente do CID da internação, uma vez que, o paciente pode ter

sido internado sem ter feito todos os exames necessários para o correto diagnóstico.

Para a pesquisa consideram-se todos os pacientes que obtiveram alta hospitalar

independente da condição de alta. Dessa forma, até mesmo pacientes com óbito são

considerados. Esses pacientes podem ter um tratamento exemplar, mas por outras

complicações podem ter ido a óbito.

Em pesquisa na literatura buscou-se sistemas que utilizem as mesmas informações ou

que estejam situados no mesmo contexto do trabalho proposto. Assim, na próxima seção

apresentam-se os trabalhos similares ou relacionados.

2.9 Trabalhos Relacionados

Devido à grande necessidade por sistemas de informação na área da saúde, a cada dia

cresce o número e a diversidade de sistemas em todas as áreas das ciências médicas. Entre os

que mais crescem estão os sistemas que utilizam mecanismos e técnicas de IA para prover

resultados e apoio à decisão. Como sistemas similares encontraram-se dois principais

sistemas: DietSysNet (TELES et al., 2006) e o IACVIRTUAL(SILVA et al., 2006).

33

2.10 Sistema DietSysNet

O sistema tem como objetivo apoiar nutricionistas no momento da prescrição de uma

dieta, através da consulta de prescrições nutricionais anteriores. Esse sistema utiliza técnicas

de RBC para comparação de similaridade entre os casos registrados em sua base de

informações.

As principais informações sobre o paciente são coletadas durante uma entrevista

considerando alguns de seus principais indicadores: patologias, alergias, IMC, colesterol,

glicose, etc. Com posse dessas informações de casos anteriores, o sistema testa a similaridade

entre os casos utilizando a fórmula do vizinho mais próximo.

O sistema dispõe em sua base de casos com atributos numéricos, booleanos e texto. Os

numéricos e os booleanos são comparados considerando a distância entre os mesmos. Para

atributos tipo texto é definida a distância considerando como uma escala binária.

Os resultados da recuperação são apresentados em forma de ranking com a

possibilidade de utilização de limiares de similaridade que possibilita a exclusão de

informações com pouca relevância. O processo da recuperação é dividido em dois níveis:

• Pré-seleção: compara somente atributos simples definidos pelo especialista

previamente;

• Ordenação: nessa fase é utilizado o mecanismo de avaliação de similaridade e

construção do ranking.

O sistema possui um módulo especialista, onde novos casos podem ser incluídos

manualmente pelo especialista na forma de modelo de prescrição. Ainda pelo especialista é

possível, configurar o peso que cada atributo tem na comparação do grau de similaridade,

sendo mostrado quando o sistema apresenta os casos similares.

Como resultado, o sistema disponibiliza uma tela apresentando os casos similares com

seu respectivo grau de similaridade obtido para cada atributo em relação ao caso atual. A

Figura 4 apresenta a tela que apresenta os resultados de similaridade de cada atributo.

34

Figura 4 - Resultado da recuperação de casos

Fonte: Teles et al., 2006.

2.11 Projeto IACVIRTUAL

O sistema tem como objetivo simular um consultório virtual que auxilie especialistas

em apoio a decisão em tratamento, diagnóstico médico e para educação apresentando modelos

de decisão (SILVA et al., 2006)

Como proposta de funcionamento, o sistema utiliza o algoritmo do vizinho mais

próximo, sendo que a função de similaridade escolhida depende do tipo do atributo em

análise. No projeto são incluídas as seguintes funções de similaridade: Função Escada,

Função Linear, Função Igual, Função Máxima, Função Intersecção e Função Contraste.

O sistema utiliza princípios básicos de um sistema RBC, com suas respectivas etapas de

aquisição, indexação, armazenamento, recuperação, adaptação e retenção. Sua estrutura é

representada de acordo com a Figura 5:

35

Figura 5 – Estrutura do sistema IAC Virtual

Fonte: Silva et al., 2006.

O presente trabalho tem como diferencial aos trabalhos relacionados, a proposta do

tratamento diretamente, ou seja, muitos sistemas apresentam os casos similares para o usuário

especialista decidir qual dos casos será utilizado para a resolução do caso atual. Dessa forma,

o trabalho proposto busca os casos similares e faz uma união entre os tratamentos dos

respectivos casos, tendo como resultado um tratamento único considerando-se os itens com

maior relevância entre os tratamentos pesquisados.

2.12 Considerações sobre o capítulo

Para o estudo das técnicas citadas nesse capítulo foi considerado os requisitos que a

solução proposta deverá atender. Em particular, a combinação entre os Sistemas RBC e

Sistemas Especialistas atendem os requisitos para a construção da proposta.

No capítulo também foi visto os conceitos de Data Mining, pois esta técnica será

utilizada para extração das informações do sistema principal devido ao grande volume de

informações existentes.

Nesse capitulo também foi revisado alguns conceitos sobre a área clínica na qual o

modelo é aplicado, demonstrando um pouco da rotina médica durante a internação de um

paciente, com suas respectivas informações e o momento correspondente de coleta dessas

informações.

Após apresentar um modelo simplificado de uma internação hospitalar e as técnicas a

serem utilizadas, foram apresentados alguns trabalhos relacionados. Os trabalhos apresentados

36

utilizam algumas das técnicas da solução proposta, porém cada um deles tem sua forma

particular de avaliação da similaridade. Nenhum dos sistemas pesquisados tem o mesmo fim

da solução proposta. O que mais se aproxima é o sistema DietSysNet que propõe uma dieta

considerando algumas informações da ananmnese do paciente construída através de entrevista

prévia.

Após a revisão bibliográfica de técnicas da IA, revisão dos conceitos da área da saúde e

os respectivos trabalhos relacionados, no próximo capítulo será apresentado o modelo

proposto para predição de prescrição eletrônica.

37

3 MODELO PROPOSTO

O objetivo desta monografia é analisar a viabilidade de um modelo para possível

predição de prescrição eletrônica. Esse modelo considera os casos anteriores que ocorreram

na instituição e apresenta uma prescrição como proposta de tratamento para o novo paciente

internado.

Esse modelo foi avaliado verificando-se qual o índice de similaridade entre o tratamento

proposto e o tratamento feito pelo profissional médico para o mesmo caso. Com esse índice, é

possível verificar a viabilidade de utilizar-se o modelo proposto como um sistema de apoio à

prescrição médica.

Para a construção desse modelo, utilizam-se técnicas da IA como sistemas RBC e

Sistemas Especialistas. A utilização de suas técnicas e ferramentas são descritas nas seções

subsequentes.

3.1 Metodologia

Esse modelo foi construído através do conhecimento prévio das etapas que compõe a

internação de um paciente. Esse trabalho está inserido em um contexto real, utilizando-se a

base de informações da Irmandade Santa Casa de Misericórdia de Porto Alegre (ISCMPA).

As informações utilizadas para esse estudo foram previamente autorizadas pelo Comitê

de Ética e Pesquisa (CEP) da ISCMPA conforme documentação apresentada no Anexo A.

Essa aprovação foi possível através da submissão de um projeto de pesquisa.

Seguindo as considerações éticas, a pesquisa não irá apresentar nenhuma informação

que permita a identificação do paciente, sendo que apenas será apresentado o resultado final

do tratamento proposto, ou seja, a lista de itens que compõem o tratamento dos casos

anteriores similares ao novo caso. O resultado final do tratamento proposto é possível através

dos processos apresentados a seguir, utilizando-se as técnicas de IA.

3.2 Solução Proposta

Com o estudo de técnicas e ferramentas de sistemas RBC em conjunto com o

conhecimento adquirido com a literatura e experiência prévia, utiliza-se como estudo de caso

a proposta de uma prescrição médica adequada para o tratamento de um paciente,

38

considerando seu estado clínico e suas características epidemiológicas. Como requisito para o

início da avaliação das técnicas é necessário a aquisição do conhecimento para posterior

construção da base de casos.

Portanto, nesse capítulo serão apresentados os procedimentos e etapas adotadas na

construção da avaliação do sistema proposto.

3.3 Aquisição de conhecimento

Diariamente diversas informações são criadas e/ou atualizadas por vários usuários

especialistas durante os processos que compõe a internação do paciente. Assim, para obter-se

as informações necessárias para avaliar o grau de similaridade entre os casos, foi necessário a

análise de quais informações seriam importantes na comparação.

Essas informações foram classificadas de acordo com a literatura e com o

conhecimento adquirido durante o desenvolvimento do sistema principal em uso pela

instituição. Através dessa pesquisa e do conhecimento prévio foi possível estruturar e

descrever as principais informações que serão utilizadas para a montagem do modelo

proposto.

3.3.1 Informações Utilizadas

Para a aquisição do conhecimento utiliza-se informações das três etapas que compõe a

internação do paciente: admissão, tratamento e alta. Durante a admissão do paciente utiliza-se

as seguintes informações:

• Sexo;

• Data de nascimento;

• Peso;

• Altura.

Com as informações epidemiológicas dos pacientes necessita-se também, das

informações referentes ao tratamento que o paciente foi submetido, ou seja, das informações

geradas durante a criação e/ou alteração da prescrição médica:

• Item prescrito

• Dose: valor numérico correspondente a quantidade de medicação;

• Dose Unidade: unidade de dosagem, por exemplo: miligramas, comprimidos, etc.;

39

• Via: Via de administração da medicação, por exemplo: oral, endovenosa, etc.;

• Frequência: frequência da medicação, por exemplo: 2 vezes ao dia, de 2 em 2 horas,

etc.

Finalizando a fase de aquisição de conhecimento, necessita-se da informação mais

importante para a indexação dos casos, o CID da alta. Essa informação fica disponível após o

médico prescrever a alta do paciente. Para fins de análise de resultados, a data de alta também

será considerada para diferenciar qual o ano que o caso ocorreu. Dessa forma, as seguintes

informações serão utilizadas:

• CID da alta

• Data da alta

Após a análise de quais informações são necessárias para a avaliação da similaridade

entre os casos, inicia-se a fase de extração das informações.

3.4 Metodologia de extração de informações

Nesse modelo utiliza-se a aquisição de conhecimento de forma semi-automática, que

segundo Costa (2005), consiste na utilização de ferramentas computacionais para a construção

da base de conhecimento.

A aquisição semi-automática utiliza os conceitos de Data Mining para buscar a melhor

amostragem e a representação correta dos dados pesquisados. Considerando-se o problema de

disponibilidade do especialista, através de pesquisa na literatura e do conhecimento adquirido

durante o desenvolvimento do sistema principal, se obteve conhecimento suficiente para a

execução da fase de clusterização do Data Mining. Nessa fase classificam-se as informações

que são necessárias para a construção do modelo.

Após a fase clusterização executa-se a fase classificação, que obteve como resultando

um modelo com informações desnormalizadas, ou seja, agrupadas conforme a necessidade do

estudo proposto. Esse modelo utiliza cubos de informações que, por definição, são tabelas

desnormalizadas que possibilitam múltiplas visões de uma mesma estrutura de dados com

independência total da base de dados do sistema principal.

Para a montagem dos cubos utilizam-se classes Java denominadas Data Access Object

(DAO) que segundo Alur et al. (2003), são classes utilizadas para extrair e encapsular todos

os acessos à origem dos dados, é o responsável por gerenciar a conexão com a origem de

dados e seu respectivo armazenamento.

40

Os objetos DAO foram classificados conforme a categoria dos dados, ou seja, criou-se

objetos especialistas em buscar dados administrativos do paciente e outros responsáveis por

buscar informações do tratamento utilizado, como apresentado abaixo:

• PacienteDAO: responsável por extrair informações relacionadas com a internação, alta

e características epidemiológicas;

• TratamentoDAO: responsável por extrair informações relacionadas ao tratamento que

foi efetuado durante a internação do paciente.

Como resultado da execução dessas classes, obtém-se as informações necessárias para a

construção da base do conhecimento. Com a metodologia de extração de informações

definida, necessita-se representar as mesmas de forma correta, para iniciar-se a construção da

base de conhecimento.

3.5 Representação do conhecimento

As informações contidas em diversos processos que compõe uma internação são

utilizadas para a representação do conhecimento. Com isso, considera-se como um caso a

internação de um paciente com tratamento que lhe foi submetido contendo todo o conjunto de

prescrições, com suas respectivas medicações administradas. Procura-se utilizar as

informações que tenham um caráter obrigatório de preenchimento, garantido a integridade e a

segurança no momento de testar a similaridade entre os casos.

Para representar o conhecimento tem-se o cuidado de representá-lo de maneira eficiente

(tempo e/ou espaço) e de fácil acesso. Segundo Tonidandel (2003), o bom desempenho de um

sistema baseado em casos está fortemente ligado a como seus casos foram representados.

Neste trabalho, cada caso é representado por um objeto Java do tipo Value Object (VO)

descrito segundo Alur et al. (2003), como uma classe composta por uma estrutura simples,

somente de atributos, sendo utilizada para encapsular os dados que transitam entre as camadas

de apresentação e de negócios da aplicação.

Para representação do conhecimento criou-se um VO chamado CasoVO. Esse objeto

contém as informações referentes à internação de um paciente, possuindo informações

administrativas da internação, informações do tratamento e da alta. Os atributos que compõe o

objeto estão representados no diagrama de classes da Figura 6:

41

Figura 6 - Estrutura de classes para representação dos casos


Cada objeto CasoVO e seus respectivos atributos serão utilizados na busca de

similaridade entre casos, exceto o atributo itensTratamento. Esse atributo é uma lista,

contendo todos os itens utilizados durante o tratamento, cada item dessa lista é representados

pelo objeto ItemPrescritoVO.

Cada objeto ItemPrescritoVO representa um item que foi prescrito durante o

tratamento do paciente. Esse item prescrito possui o identificador do item do cadastro

utilizado, ou seja, se ele for do tipo medicamento o seu atributo idItem corresponde a um

medicamento do cadastro. O atributo idItemPrescrito representa o identificador

seqüencial e único que cada item ao ser prescrito possui.

Durante a prescrição alguns tipos de itens (procedimentos, dietas), têm atributos do

ItemPrescritoVO que não fazem sentido como por exemplo, a dose. Nesse caso, esses

atributos têm seus respectivos valores igualados a zero, portanto, não interferem no momento

da recuperação dos casos.

Com as ferramentas disponíveis para a extração das informações da base principal e a

representação das mesmas definidas pode-se iniciar o processo de criação da base de

conhecimento que é descrito na próxima seção.

3.6 Base de conhecimento

Para o armazenamento dos casos utiliza-se uma base isolada do sistema principal. Dessa

forma, pode-se afirmar que não influencia no desempenho do sistema principal e garante

portabilidade das informações.

Para obter-se o máximo de independência e a possibilidade de gravar o objeto Java com

o seu estado atual, optou-se por não utilizar banco de dados relacional. Por isso, quando

42

inicia-se o sistema proposto a base de conhecimento é colocada em memória, através de

leitura de arquivos gravados em disco.

Esses arquivos são gerados através de métodos de serialização de objetos Java, onde é

possível gravar em disco uma classe com seu estado e valores de seus atributos atuais. O

problema dessa solução é o desempenho no processo de serialização devido ao grande

overhead que ocorre no processo de serializar e desserializar.

Como alternativa para melhorar o desempenho, ao inicializar o sistema, os arquivos

serializados são lidos e colocados em memória tornando-se disponível para o uso. Com testes

durante o desenvolvimento percebeu-se um elevado consumo de memória ao inicializar o

sistema.

Para minimizar este problema, alterou-se a base de conhecimento para possuir apenas

índices dos itens e das informações do paciente. Dessa forma, a lista de itens do tratamento

por exemplo, não possui o nome do medicamento, essa informação só é utilizada no momento

de mostrar a proposta de tratamento, na etapa de apresentação dos resultados. Com esse

método, houve uma redução de cerca de em média 40% do uso de memória. Esse valor foi

obtido utilizando-se o gerenciador de tarefas do sistema operacional, através de algumas

execuções do sistema proposto.

Assim, dependendo do tamanho da base de conhecimento, essa redução pode significar

a viabilidade ou não do modelo proposto.

Ainda para obter-se um bom desempenho na recuperação dos casos, além de utilizar as

informações em memória necessita-se de uma boa estratégia de indexação, tornando a base de

conhecimento de fácil navegação e com possibilidade de execução de consultas por diversos

atributos do caso.

3.7 Indexação

Para a obtenção de um desempenho favorável em um sistema baseado em casos, é

fundamental a construção de uma estrutura indexada, que atenda com precisão e velocidade as

diversas situações que o sistema será exposto (TONIDANDEL, 2003). Portanto, possuindo-se

um processo de indexação com uma modelagem eficaz, diminui-se consideravelmente a

complexidade dos algoritmos utilizados no cruzamento e recuperação dos casos. Portanto, o

formato e a prioridade das informações devem ser moldados de acordo com os requisitos que

o sistema pretende atender.

43

Nesse trabalho os casos são indexados a partir do código da doença do paciente,

portanto, cada caso tem como índice principal o Código Internacional de Doenças (CID), que

foi atribuído no processo de alta do paciente. Esse código é utilizado para agrupar os casos em

uma estrutura conhecida como HashMap. Essa estrutura é como uma tabela de duas colunas

em que na primeira coluna é um valor chave, ou seja, único e na segunda coluna um valor.

Com isso, a base de conhecimento foi estruturada utilizando-se o CID como chave e os casos

anteriores como o valor, ou seja , uma lista de CasoVO como ilustra a Figura 7.

Figura 7 – Indexação de casos pelo CID


Observa-se que para cada CID pode-se ter vários casos distintos, ou seja, no momento

da recuperação, os casos já estarão sendo filtrados de maneira eficiente, reduzindo

consideravelmente o tempo de recuperação. Logo após recuperarem-se os casos pelo CID

informado, inicia-se o processo que leva em consideração os dados epidemiológicos dos

pacientes utilizando os critérios de similaridade definidos.

3.8 Critérios de similaridade

Em sistemas RBC diversas formas de comparação de grau de similaridade entre os

casos são utilizadas, o método utilizado varia de acordo com os requisitos de segurança e

desempenho que o sistema deve atender.

Para a definição da similaridade entre os casos, inicialmente é necessário definir o grau

de similaridade entre cada atributo que compõe um caso. No modelo proposto utiliza-se a

técnica da IA conhecida como Nearest Neighbour (vizinhos próximos).

Essa técnica necessita atribuir um "peso" para cada atributo, ou seja, existem atributos

mais importantes que outros para definir a similaridade entre dois casos. Essa definição

44

geralmente é feita em conjunto com o usuário especialista. Segundo Koslosky apud

Fernandes (2005), a similaridade entre os casos é definida para cada atributo.

Para a definição do peso dos atributos duas tabelas foram criadas: uma contendo os

pesos dos atributos relacionados com os dados epidemiológicos do paciente e outra com os

dados relacionados ao item prescrito. No Quadro 6 demonstra-se os atributos e seus

respectivos pesos utilizados na comparação de similaridade.

Atributo Peso

sexo 10

idade 5

IMC 8

Peso 5

Altura 5

Quadro 6 - Peso por atributo, definido de acordo com a informação epidemiológica do paciente

Fonte: Autoria própria, 2010

A definição dos pesos foi através de testes e de conversas com alguns usuários

especialistas. Esses valores podem variar e serem alterados a qualquer momento conforme a

necessidade.

Cada atributo possui seu tipo específico como: data, numérico, booleano e texto. Assim,

dependendo do tipo do atributo a sua comparação é diferente. Por isso, os atributos têm sua

similaridade testada através de intervalos previamente definidos de acordo com o se tipo

correspondente. O Quadro 7 demonstra os valores admitidos por intervalo para cada atributo

de um caso.

Atributo Intervalo

Data de nascimento +- 5anos

Sexo Valor exato

IMC classificação Valor exato

Peso +- 5kg

Altura +- 10 cm

Quadro 7- Intervalo de valores permitido para cada atributo


45

A comparação dos atributos como peso e altura são feitos pelo intervalo que foi

definido, mas a comparação do IMC é através da classificação e não do valor absoluto. Essa

classificação será apresentada nas seções subseqüentes.

O intervalo definido para comparação de cada atributo, pode ser alterado para mais ou

para menos. Assim, quanto menor o intervalo definido maior é a precisão dos casos

retornados. Em contrapartida, acaba reduzindo o número de casos similares.

Com a definição dos critérios de similaridade na próxima seção inicia-se a definição da

estratégia de recuperação dos casos.

3.9 Recuperação dos casos

Com a montagem da base de conhecimento indexada e a definição dos critérios de

similaridade é possível a definição da estratégia a ser utilizada para a recuperação de casos.

Esse processo tem seu início com a entrada do novo caso e seu término após a apresentação

de possíveis alternativas de resolução para o novo caso.

Para a construção desse processo, dividiu-se o mesmo em etapas distintas, cada uma

com a necessidade de dados de entrada e seu respectivo retorno que se utiliza na próxima

etapa dependente. A definição de cada etapa foi de acordo com sua respectiva

responsabilidade, sendo divididas nos seguintes itens: pesquisa CID, similaridade

epidemiológica, similaridade itens tratamento, média itens do tratamento, ranking itens,

popular itens e apresentação da proposta de tratamento. Cada um desses itens será analisado

nas próximas seções.

3.9.1 Pesquisa CID

A base de conhecimento foi construída de forma indexada para aperfeiçoar o tempo de

busca de informações e tornar a construção de algoritmos sem grande complexidade. Para a

indexação o Código Internacional de Doenças (CID) é usado como informação principal, por

isso a primeira etapa da recuperação é a pesquisa pelo CID que o paciente foi classificado

durante sua internação.

Nessa etapa recebe-se como informação de entrada o CID que o novo paciente foi

classificado. Após receber o código, o algoritmo de pesquisa acessa a estrutura de casos. Essa

pesquisa é realizada utilizando-se recursos do componente HashMap, que organiza as chaves

46

em uma estrutura hierárquica, otimizando a recuperação de algum valor que compõe a coluna

chave.

Como retorno da pesquisa se obtém a lista de casos correspondentes ao CID pesquisado.

Essa lista retornada está organizada de maneira cronológica. Essa ordem é importante para

que a busca de similaridade epidemiológica tenha seu início com os casos mais atuais. Quanto

mais atualizado é o caso, maiores são as chances de sua eficácia devido ao avanço constante

das medicações e tratamentos utilizados. Logo após, com a lista de casos correspondentes a

pesquisa realizada pode-se avançar para a próxima etapa chamada de similaridade

epidemiológica.

3.9.2 Similaridade epidemiológica

Essa etapa pesquisa e seleciona os casos de paciente com níveis de similaridade

epidemiológica aceitável, ou seja, dentro da definição de intervalo aceitável por cada atributo

dos casos. Para início dessa etapa, necessita-se possuir duas informações: dados

epidemiológicos do novo caso e os casos recuperados com o mesmo CID. Com essas

informações de entrada os casos anteriores são confrontados em busca de alguma similaridade

entre as informações.

Como citado na seção anterior de Critérios de Similaridade, utiliza-se o algoritmo do

vizinho mais próximo, comparando cada atributo do novo caso com o anterior. Nessa etapa a

lista de casos com mesmo CID é percorrida e a cada interação o CasoVO é comparado com o

paciente atual considerando-se os seguintes atributos:

• Sexo

• Idade

• Peso

• Altura

• IMC classificação

Essa comparação é realizada, utilizando-se o peso de cada atributo juntamente com o

seu intervalo de valores de similaridade. Desta forma, considerando-se o intervalo de

comparação previamente definido para cada atributo, garante maior qualidade e segurança na

comparação evitando similaridades inexistentes entre casos. O Quadro 8 apresenta a

comparação de atributos de dois casos. A coluna Caso Atual indica, o caso que deve ser

resolvido utilizando-se a experiência contida na base da conhecimento, e a coluna caso

47

anterior representa o caso que está sendo analisado como possível solução para o problema

atual.

Atributo Caso

Atual

Caso

anterior

Indicador

tolerância

Faixa tolerada Resultado

Idade 40 46 5 anos +- 5 anos Não

aprovado

Peso 80 85 5 kg +-5kg Avaliado

com IMC

Altura 170cm 175cm 10cm +-10cm Avaliado

com IMC

IMC 27,68 27.75 Mesma

classificação

Nenhuma faixa OK

Sexo 1 1 Valor exato Nenhuma faixa OK

Quadro 8- Exemplo de comparação entre os atributos


Nessa tabela, dois casos são confrontados e validados atributo por atributo. Nessa

comparação, utiliza-se o valor de intervalo definido previamente para verificar se o atributo

do caso anterior é compatível com o atual. No caso acima se observa que o atributo idade está

um ano além do permitido pelo intervalo, por isso esse caso não será considerado na próxima

fase da busca da similaridade que utiliza o cálculo da distância entre os atributos.

Ainda no Quadro 8, verifica-se que a comparação entre peso e altura é feita utilizando-

se o cálculo de Índice de Massa Corpórea (IMC). O IMC, também é conhecido como índice

de Quételet, em homenagem ao seu criador Adolphe Quételet é utilizado para a avaliação

nutricional das populações e tem seu resultado obtido através da divisão da massa corporal em

quilogramas pela estatura em metros elevada ao quadrado (CERVI et al., 2005).

IMC = (Peso / Altura²)

Ainda de acordo com Jackson apud Cervi (2005), para um mesmo IMC mulheres

possuíam 10,4% a mais de gordura corpórea que os homens. Por isso, a relação entre gordura

corpórea e IMC deve-se considerar sexo e idade. Sendo assim, o modelo proposto considera

essas duas métricas em seu desenvolvimento. Quando se utiliza o calculo do IMC na busca da

similaridade entre os casos, considera-se a classificação que o novo caso obteve com o

48

cálculo, assim como o caso em comparação na base de conhecimento. O Quadro 9 apresenta

as classificações de acordo com o IMC.

Classificação Principais Faixas Abaixo do peso <18.50 Magreza severa <16.00 Magreza moderada 16.00 - 16.99 Magreza branda 17.00 - 18.49 Peso Normal 18.50 - 24.99

Pré-obesidade 25.00 - 29.99

Obeso ≥30.00 Obesidade Grau I 30.00 - 34-99

Obesidade Grau II 35.00 - 39.99

Obesidade Grau III ou mórbida ≥40.00 Quadro 9 - Classificação IMC Fonte: Traduzido de WHO, 2010.

Durante o processo de similaridade epidemiológia o cálculo de IMC é realizado e

compara-se o resultado do caso atual com o anterior de acordo com a classificação da tabela

acima. O Quadro 10 apresenta um exemplo de comparação utilizando-se o IMC.

Atributos Novo Caso Caso anterior Peso 80 80 Altura 160 170 IMC 31.24Kg/m² 27,68 Kg/m² Classificação IMC Obesidade Grau I Pré-obesidade

Quadro 10- Comparação entre casos destacando o IMC


No exemplo acima ambos os casos são incompatíveis de acordo com a classificação que

obtiveram de seu respectivo IMC. Assim, esse caso anterior foi descartado da comparação de

similaridade epidemiológica.

Todos os casos que passam pela etapa de avaliação do intervalo e da classificação do

IMC tem sua distância entre os atributos calculada, resultando a distância entre os casos. Para

cada atributo se obtêm o valor da distância utilizando-se a Equação 1:

1) d = √(p * | i |)

49

A variável p representa o valor definido para o peso de cada atributo. Esse peso é

multiplicado pela diferença absoluta entre o valor do atributo do caso atual com o anterior

representado pela variável i. Através da iteração por todos os atributos do caso anterior,

obtém-se a distância total conforme a Equação 2:

2) dt = distância idade + distância de peso +distância da altura + distância sexo

Com o resultado da distância total, compara-se o resultado com o chamado indicador de

similaridade. Esse indicador é um valor numérico que é definido de acordo com o grau de

precisão que se necessita dos resultados, ou seja, quanto menor esse valor, menor deve ser a

diferença entre os casos. O indicador é integrante da Equação 3 para o caso anterior ser

considerado similar com o da base atual:

3) r = d – S

Onde d é o total das distâncias dos atributos dos casos em comparação. A variável S

representa o indicador de similaridade. E o resultado esperado para um caso ser similar é um

valor igual ou menor que zero. Após a identificação da similaridade epidemiológica entre os

casos, é possível avançar para a próxima fase responsável pela análise do tratamento

denominada Similaridade do Tratamento.

3.9.3 Similaridade do tratamento

A busca pela similaridade do tratamento é realizada de forma semelhante da

similaridade dos atributos epidemiológicos. Inicia-se tendo como entrada os casos similares

obtidos na etapa anterior. Com isso, é iniciada uma iteração percorrendo a lista de casos

recuperando-se de cada objeto CasoVO a lista de itens prescritos correspondentes. A lista

retornada é composta por objetos ItemPrescritoVO, que possuem todas as informações

de cada item prescrito durante o tratamento. O objeto ItemPrescritoVO assim como o

objeto CasoVO tem seu conjunto de atributos como demonstrado:

• idItemPrescrito: identificador seqüencial que cada item prescrito do sistema principal

possui;

• dose: dose informada pelo profissional de saúde durante a criação da prescrição

eletrônica;

50

• idUnidadeDose: identificador correspondente à unidade de dosagem como, por

exemplo, miligramas, mililitros, comprimidos, etc;

• valorFrequencia: valor numérico informado da frequência como, por exemplo, 2, 4,

etc;

• idFrequencia: identificador do tipo da frequência como, por exemplo, dias, horas,

vezes ao dia;

• idVia: identificador correspondente a via utilizada para administração do medicamento

ou para a execução de procedimentos como, por exemplo, oral, endovenosa.

Diferente da busca da similaridade epidemiológica entre os casos nessa etapa, os casos

selecionados são comparados entre si, em busca de itens similares em seus tratamentos.

Durante a comparação, o caso selecionado anteriormente tem seus itens do tratamento

comparado à lista de itens ranking.

Essa lista é composta pelos itens já comparados, ou seja, cada item prescrito de um

tratamento é comparado a todos os itens que compõe essa lista, sendo que ela é gerada de

maneira incremental sendo adicionado à ela sempre aquele item que foi comparado mas não

foi encontrado na itens ranking.

A lista itens ranking é composta por classes denominadas RankingVO. Esses classes

possuem como atributos: item prescrito e uma pontuação e são representados de acordo com

a Figura 8.

Figura 8 – Diagrama do RankingVO


Cada vez que o item de tratamento de um caso seja similar com um item da lista, o item

da lista (RankingVO) tem seu atributo pontuação incrementado.

Ainda nessa etapa, aproveita-se que todos os casos pré-selecionados têm seus

tratamentos pesquisados e incrementa-se uma variável que representa o total de itens

51

prescritos somando-se todos os casos. Logo após, esse total é divido gerando-se uma média

denominado Número Médio de Itens por Tratamento(NMIT).

Portanto como resultado dessa etapa, obtém-se a lista de itens prescrito e a sua

respectiva pontuação representados pelo objeto RankingVO. Ainda nessa etapa, obtém-se o

número médio de itens prescritos por tratamento. Ambos os resultados são utilizados como

entrada da próxima etapa chamada Construção do Ranking e Eliminação de itens.

3.9.4 Construção do ranking e eliminação de itens

Após a execução das etapas de comparação e busca da similaridade entre pacientes e

tratamentos, possui-se como resultado uma lista de itens prescritos e um indicador de média

de itens prescritos por tratamento, aproximando-se a etapa final de demonstração dos

resultados.

A lista de itens prescritos obtida na etapa anterior contêm todos os itens prescritos de

todos os casos similares, portanto é necessário filtrar para que seja retornado somente os itens

que possuem índice de uso facilitando a apresentação de resultados.

Por isso, essa etapa tem como responsabilidade ordenar os itens mais utilizados de

forma decrescente, ou seja, os itens com menor pontuação ficam ao final da lista. Dessa

forma, após a sua ordenação todos os itens da lista ordenada que tenham sua posição maior

que o NMIT, por exemplo se esse valor fosse iguala três alguns itens seriam descartados

como demonstra o Quadro 11.

Posição Lista Pontuação Pontuação Utilizado

0 Item prescrito 1 16 OK



3 Item prescrito 4 1 Removido

4 Item prescrito 5 1 Removido

Quadro 11 – Exemplo de número médio de itens


52

No exemplo do Quadro 11, o NMIT tem o valor três, portanto todos os itens com índice

igual a três ou maiores são descartados restando apenas os itens que obtiveram maior

pontuação. Com isso, após a execução dessa etapa tem-se como resultado uma lista de itens

ordenada a e otimizada descartando itens com baixa relevância, evitando apresentar itens que

foram usados apenas em casos específicos.

Até essa etapa apenas se trabalhou com objetos contendo apenas os índices das

informações. Por isso, a fim de se obter apenas a lista com os itens que serão apresentados

para o usuário necessita-se popular suas informações como, por exemplo, trocar o id do item

prescrito pela sua descrição. Assim, inicia-se a etapa de popular os resultados.

3.9.5 Popular resultado

Após finalizar a etapa de recuperação de casos, possuiu-se uma lista somente com os

itens que devem ser apresentados como predição da prescrição do paciente. Com essa lista

como entrada, inicia-se o processo de popular as informações de acordo com as informações

dos cadastros.

Essa etapa busca as informações necessárias na base de conhecimento nas chamadas

tabelas auxiliares. Essas tabelas possuem o identificador e a descrição da informação e são

consideradas um espelho do cadastro do sistema principal. Com a lista de itens filtrada e

populada, o resultado já tem condições de ser apresentado para o usuário final por isso, inicia-

se o processo de apresentação de resultados

3.9.6 Apresentação da predição de prescrição

Após as etapas de construção, busca e popular os resultados, enfim chega a etapa de

apresentação dos resultados, que consiste em mostrar o resultado da predição da prescrição

em formato tabular para o usuário selecionar os itens que deseja utilizar na montagem de sua

prescrição.

Os itens são apresentados com sua descrição e sua respectiva pontuação obtida na etapa

de similaridade de itens. Essa pontuação é necessária em decorrência da lista final possuir, por

exemplo, duas medicações com algumas pequenas variações de dosagem. Nesse caso o

sistema apresenta as duas soluções na lista de itens da proposta de tratamento, para que o

53

usuário final decida qual item deve ser utilizado.A Figura 9 apresenta um breve resumo de

todas etapas executadas na execução do modelo proposto.

Figura 9 – Indexação de casos pelo CID


Com a recuperação dos casos, teve-se até o momento a criação, indexação e

recuperação da base de conhecimento. Por isso, necessita-se buscar ainda qual o percentual de

efetividade e eficácia na predição da prescrição. As métricas para a avaliação do resultado

final são subjetivas, considerando-se que a medicina não é uma ciência exata e ainda mais o

tratamento de uma doença na qual, podem ocorrer situações não previstas durante o

tratamento. Por isso, a avaliação do estudo em questão precisa de métricas e amostras

consistentes, como demonstra-se no capítulo avaliação dos resultados.

54

4 AVALIAÇÃO DOS RESULTADOS

Todos os trabalhos relacionados apresentados demonstram como resultado final os

casos similares encontrados. Dessa forma, o usuário especialista precisa selecionar o caso

mais adequado para utilizá-lo. Entretanto, o sistema proposto retorna como resultado, uma

lista com combinação de todos os itens dos tratamentos dos casos retornados como similares.

Assim, para o usuário apresenta-se uma lista com os itens propostos pelo sistema. A Figura

10 apresenta a interface de proposta de prescrição.

Figura 10 – Tela de proposta de prescrição


Como apresentado na Figura 10, os itens do tratamento proposto possuem à sua direita o

indicador de relevância, ou seja, quantas vezes apareceram nos tratamentos considerados

similares pelo sistema. O número de vezes que o item aparece no tratamento é correspondente

ao dia de internação que o paciente está. Assim, a proposta é montada considerando-se o dia

de internação do caso atual, devido as prescrições variarem de acordo com o dia do

tratamento.

Durante a implementação, utilizou-se casos criados manualmente para verificar o

funcionamento básico do sistema e auxiliar na construção do algoritmo de recuperação. Com

esses testes, verificou-se que seria inviável avaliar o real comportamento do sistema. Dessa

forma, verificou-se a necessidade do uso de casos reais para sua avaliação.

Excluído:

Excluído:

55

Como o sistema retorna apenas a lista de itens do tratamento, a avaliação quanto a sua

real efetividade fica mais difícil, devido à combinação dos resultados das diversas etapas que

são executadas desde a busca dos casos pelo CID até a sua apresentação na tela. Por isso, a

sua avaliação deveria ser feita por um usuário especialista no momento de criar uma nova

prescrição para um paciente. Como o problema de falta de disponibilidade do usuário

especialista médico é recorrente na maioria dos Sistemas Especialistas, optou-se por validar

os resultados utilizando-se uma amostragem específica da própria base de conhecimento.

4.1 Montagem da Avaliação

Como o principal objetivo desse trabalho é avaliar a combinação de técnicas da IA para

construção de uma proposta de prescrição, necessita-se avaliar a real efetividade da proposta

de prescrição construída pelo sistema. Para verificar-se o quanto que a proposta do sistema é

efetiva, necessita-se obter o grau de similaridade entre a proposta de prescrição e uma

prescrição real construída pelo usuário especialista. O grau de similaridade é um percentual

que varia de acordo com o CID estudado sendo que, quanto mais itens em comum entre a

prescrição proposta e a real, mais próximo dos 100% de semelhança entre as prescrições.

Portanto, inicialmente, necessita-se escolher o método de comparação para confrontar a

prescrição proposta pelo sistema com criada pelo usuário especialista.

4.1.1 Método de comparação

O modelo proposto foi avaliado utilizando-se uma amostra padrão extraída da base de

conhecimento. Essa amostra pode ser comparada a prescrição proposta pelo sistema de duas

formas:

• Comparação com a prescrição “ideal”: montar um modelo de prescrição utilizando-se

os algoritmos do sistema com os dados da amostra selecionada. Logo após, compara-

se esse modelo “ideal” com a prescrição proposta pelo sistema;

• Comparação direta: compara-se a prescrição proposta pelo sistema com as prescrições

de casos similares.

Utilizou-se como método de avaliação: a comparação direta. Utiliza-se essa

comparação, porque a mesma não utiliza nenhuma ferramenta desenvolvida para o modelo

proposto. Assim, a avaliação dos resultados fica isenta de qualquer inconsistência que pode

ser apresentada pela metodologia proposta.

Excluído:

56

4.1.2 Critérios para a amostragem utilizada

A base de conhecimento foi construída utilizando-se casos com CID mais comuns

atendidos pelo ISCMPA. Os casos considerados para a montagem da base de conhecimento

pertencem ao período de janeiro de 2004 até abril de 2010. Esse período selecionado devido a

cada dia os tratamentos serem aperfeiçoados tornando, dessa forma, obsoleto tratamentos

mais antigos.

Para serem incorporados a base de conhecimento, necessita-se que os mesmos atendam

a três critérios.

Critério 1: todas as informações obrigatórias (peso, altura, sexo e data de nascimento) devem

estar preenchidas;

As informações obrigatórias para o modelo proposto são de vital importância no

processo de comparação da similaridade. Por isso, criaram-se alguns filtros nas consultas

utilizadas durante a extração das informações da base do sistema principal. Através desses

filtros, diversos casos não podem ser considerados para a construção da base de

conhecimento, diminuindo assim o número total como é apresentado no Quadro 12:

CID Total de Casos Casos Completos

N18.- Insuficiência renal crônica 2847 406

I50-Insuficiêcia Cardiaca 1848 276

J45.9-Asma não especificada 2727 263

J18.0 - Broncopneumonia não especificada 4786 93

Quadro 12- Total de casos


Critério 2 : utilização somente de informações consistentes. Durante a etapa de testes

preliminares, encontrou-se algumas inconsistências nas informações, tais como:

Data de nascimento: ano da nascimento superior a data atual;

Sexo: informação como indeterminado;

Peso: com valor igual a zero ou negativo;

Altura: com valor igual a zero ou negativo.

Estas informações são de vital importância no processo de comparação da similaridade.

Dessa forma, também verificou-se a necessidade de criação de filtros para tratar esses tipos de

57

inconsistências. Assim, o número de casos da base de conhecimento sofreu algumas

alterações como apresentado no Quadro 13.

CID Casos antes dos

filtros

Casos após a

filtragem

Percentual de

redução

N18.- Insuficiência renal crônica 406 283 32,01%

I50-Insuficiêcia Cardiaca 276 222 19,56%

J45.9-Asma não especificada 263 160 39,16%

J18.0- Broncopneumonia não

especificada

93 64 31,18%

1038 729 29%

Quadro 13 – Casos com filtros


De acordo com o Quadro 13, verifica-se uma redução significante do número total de

casos para cada CID que conseqüentemente, como em qualquer sistema RBC, terá suas

conseqüências durante o processo de recuperação, diminuindo o número de casos que o

sistema dispõe para montar o seu aprendizado. A maioria das reduções foi por inconsistências

referentes a data de nascimento ser maior que a data atual e informações de peso ter o valor

igual a zero.

Critério 3 : Alguma padronização no tratamento, ou seja, CID referentes a doenças com

tratamento relativamente padronizado.

A avaliação eficaz dos resultados depende de alguma padronização nos tratamentos referentes

aos CID selecionados. Não seria possível avaliar o modelo proposto possuindo-se na base de

conhecimento tratamentos para pacientes similares com quase nenhuma semelhança. Isso

geralmente ocorre com doenças novas ou com pouca ocorrência. A relação de CID com

alguma padronização no tratamento foi obtida através de conhecimento prévio adquirido no

desenvolvimento do sistema em uso pela ISCMPA.

4.1.3 Períodos de amostragem

Para avaliar a solução proposta dividiu-se a base de conhecimento em período de

aprendizagem e período de amostragem de avaliação, como é demonstrado no Quadro 14.

58

CID 2004 2005 2006 2007 2008 2009 2010

I50 Período de aprendizagem Novos Casos

J45.9 Período de aprendizagem Novos Casos

N18 Período de aprendizagem Novos Casos

J18 Período de aprendizagem Novos Casos

Quadro 14 – Períodos utilizados


De acordo com o Quadro 14, o período utilizado para aprendizagem e a montagem da

proposta de prescrição ocorre de 2004 até dezembro de 2008. Assim, o período utilizado pela

a amostra de avaliação é composto pelo ano de 2009 e 2010. Com a definição desses períodos

de amostras é possível iniciar-se o processo de avaliação.

4.2 Processo de Avaliação

O processo de avaliação tem seu inicio utilizando-se os casos classificados por

amostragem de aprendizagem e de análise ou novos casos. Durante a execução desse processo

observou-se algumas situações inconsistentes dos casos utilizados. Dessa forma, foi preciso

uma análise para selecionar os casos com condições de serem analisados. As próximas seções

apresentam em detalhes, os critérios utilizados para seleção dos novos casos para a avaliação

do sistema proposto.

4.2.1 Análise e seleção de novos casos para avaliação

Como visto na seção de critérios para montagem da amostragem, alguns filtros foram

executados durante o processo de construção da base de conhecimento para garantir a

integridade das informações. Dessa forma, obtém como resultado uma base consistente mas

com menor quantidade de casos. Por isso, necessita-se selecionar quais os casos utilizados

para comparação, dando preferência aos que possuem maior quantidade similares na base de

conhecimento.

59

A base de conhecimento possui um total de 729 casos distintos, divididos em quatro

tipos de CID. Para fins de melhor apresentação, dividiu-se em três tabelas, classificando-os de

acordo com suas respectivas características.

Idade I50 J45.9 N18 J18

Masc. Fem. Masc. Fem. Masc. Fem. Masc. Fem.

0 - 9 1 3 68 44 11 15 4 2

10-19 0 1 10 20 32 17 0 1

20-39 1 4 1 0 32 30 1 1

40-59 18 10 0 3 42 27 4 2

60-79 55 35 0 8 25 20 14 9

>= 80 28 43 1 1 6 5 5 9

Total 103 96 80 76 148 114 28 24

Tabela 1 – CID por altura


Peso I50 J45.9 N18 J18


0-19 1 2 66 40 24 21 4 3

20-39 0 0 10 12 20 20 1 2

40-59 10 33 1 15 29 33 7 11

60-79 45 38 3 5 52 32 11 6

80-99 41 17 0 3 20 7 4 1

>= 100 6 6 0 1 3 1 1 1

Total 103 96 80 76 148 114 28 24

Tabela 2 – CID por peso


60

Altura I50 J45.9 N18 J18


<= 99 1 3 50 21 15 14 3 2

100 – 149 0 6 26 34 37 34 1 2

150-169 43 81 4 21 46 63 11 19

170-189 59 6 0 0 50 3 13 1

> 190 0 0 0 0 0 0 0 0

Total 103 96 80 76 148 114 28 24

Tabela 3 – CID por altura


De acordo com as tabelas 1,2 e 3 verifica-se que dependendo do CID ocorre incidência

maior em determinadas faixas de valores dos atributos que compõe o caso. Por exemplo, o

CID I50 ocorre com maior incidência em pacientes do sexo masculino com idade entre 60 e

79 anos com 65 casos (valor entre parênteses). Assim como, o CID J45. 9 ocorre mais em

pacientes com idade de 0 a 9 anos.

Através dessas conclusões, selecionou-se as características com maior incidência de

pacientes, considerando-se o CID correspondente. Dessa forma, consideram-se essas

características para selecionar os casos de 2009-2010 como novos casos para a análise do

sistema. A Tabela 4 demonstra as características com maior incidência.

I50 J45.9 N18 J18


Idade 60-79(55) >80(43) 0-9(68) 0-9(44) 40-

59(40)

20-39(30) 60-79(14) 60-79(9)

Peso 60-79(45) 60-79(38) 0-19(66) 0-19(40) 60-

79(52)

40-59(33) 60-79(11) 40-59(11)

Altura 170-

189(59)

150-

169(81)

<=99(50) <=99(21) 170-

189(50)

150-

169(63)

170-

189(13)

150-

169(19)

Tabela 4 – Características com maior incidência


Assim, analisando-se a Tabela 4, seleciona-se alguns casos de 2009-2010 que possuem

características com maior incidência, de acordo com o respectivo CID. Essa análise resultou

em um grupo de casos que será utilizado como novo caso para o sistema propor uma

61

prescrição. A montagem dessa lista, teve como premissa utilizar para cada CID dois casos, um

do sexo masculino e outro feminino. Dessa forma, avalia-se um total de oito casos, ou seja,

gera-se oito propostas de prescrição.

Com o apoio das informações da Tabela 4, foi possível mapear o perfil epidemiológico

necessário para o caso a ser utilizado de 2009-2010. Após execução de algumas consultas à

base de conhecimento, considerando-se o CID e as faixas de valores dos atributos da Tabela

4, obteve-se uma lista como os possíveis candidatos para utilização na avaliação. Esses

resultados foram dividido pelo seu CID correspondente de acordo com a Tabela 5.

Tabela 5 – Candidatos a avaliação


De acordo com a Tabela 5, utiliza-se os casos listados para executar o sistema e

verificar qual a proposta de prescrição resultante. Como demonstrado na Tabela 5 o CID J18

não apresentou casos para serem testados do sexo feminino, ou seja, na pesquisa prévia

CID Sexo Idade Peso(kg) Altura (cm)

I50

Masc. 66 72 165

Masc. 61 62 166

Fem. 84 70 172

Fem. 82 70 165

J45.9

Masc. 6 15 92

Masc. 5 11 90

Fem. 4 17 98

Fem. 2 10 85

N18

Masc. 42 61 172

Fem 37 57 157

J18

Masc. 71 68 171

62

realizada não foi encontrado um caso compatível com as características requeridas descritas

na Tabela 4.

O processo de executar a avaliação tem seu início com a entrada do novo caso e como

resultado a prescrição proposta pelo sistema. Com a proposta retornada pelo sistema inicia-se

o processo de comparação do grau de similaridade da prescrição proposta, com a prescrição

criada para o caso pelo especialista durante o ano de 200-2010.

4.2.2 Execução Avaliação

A avaliação acontece de forma individualizada, ou seja , caso a caso. O sistema tem

uma tela de portal na qual reúne todos os casos selecionados para a avaliação. A Figura 11

apresenta a tela de seleção de caso.

Figura 11 – Tela de seleção de casos


Os casos selecionados de 2009-2010 foram inseridos no sistema para o início da

avaliação. A cada caso inserido o sistema tem como retorno a respectiva proposta de

63

prescrição. Esse retorno é avaliado item a item com a prescrição criada pelo especialista em

2009-2010.

Para a avaliação da similaridade da prescrição proposta com a construída pelo

especialista, utiliza-se uma tela que compara as duas prescrições (sistema x especialista),

sinalizando os itens em comum entre ambas e o percentual de similaridade. Esse percentual é

calculado com um simples regra de três em que os 100% são todos os itens da prescrição

construída pelo especialista. A Figura 12 apresenta a tela utilizada para avaliação da

similaridade entre as prescrições.

Figura 12- Tela de análise da proposta.


A Figura 12 mostra na parte esquerda a lista com os itens da prescrição proposta. Essa

lista está ordenada em ordem decrescente de utilização do itens, ou seja, o mais utilizado está

no topo até o menos utilizado nos casos pesquisados. Logo à direta se encontra a lista com a

64

prescrição construída pelo usuário especialista. Essa lista não sofreu nenhum tipo de

ordenação ela apresentando os itens na ordem em que o especialista havia criado em 2009-

2010. Logo acima dessa lista, encontra-se as características epidemiológicas do paciente em

análise. Sobre a área das características incluiu-se dois botões: um para considerar a dosagem

e outro para a frequência. Durante a avaliação dos resultados, como será comentado na

próxima seção, necessitou-se mudar algumas métricas de comparação entre as prescrições que

consequentemente, modifica o índice de similaridade entre as mesmas.

4.3 Resultados da avaliação

O processo de avaliação foi realizado de forma manual, como citado anteriormente,

utilizando-se o grupo de casos de 2009-2010 selecionados na etapa de analise e seleção de

novos casos para avaliação. Para cada CID o conjunto de casos foi inserido no sistema e a

proposta correspondente foi confrontada com a proposta feita pelo especialista. A Tabela 6

demonstra os resultados preliminares obtidos.

Tabela 6 – Resultados iniciais CID I50


CID Sexo Idade Peso

(kg)

Altura (cm) Casos Similaridade

(%)

Itens na

prescrição

I50

Masc. 66 72 165 7 33% 30

Masc. 61 62 166 3 17% 17

Fem. 84 70 172 4 35% 20

Fem. 82 70 165 7 45% 11

65

Tabela 7 – Resultados iniciais CID J45.9


Tabela 8 – Resultados parc

iais CID N18


Tabela 9 – Resultados parciais CID J18


De acordo com os resultados apresentados pelas Tabelas 6,7,8 e 9 verificou-se um baixo

índice de similaridade entre ambas. Assim, a maioria dos casos testados apresentou esse

comportamento devido ao baixo número de casos similares na base de conhecimento. O

Figura 13 apresenta essa evolução considerando o CID J45.9.

CID Sexo Idade Peso

(kg)

Altura

(cm)

Casos Similaridade

(%)

Itens na

prescrição

J45.9

Masc. 6 15 92 17 50% 14

Masc. 5 11 90 19 87% 8

Fem. 4 17 98 16 48% 21

Fem. 2 10 85 3 62% 16

CID Sexo Idade Peso

(kg)

Altura

(cm)

Casos Similaridade

(%)

Itens na

prescrição

N18 Masc. 42 61 172 12 21% 14

Fem 37 57 157 8 10% 20

CID Sexo Idade Peso

(kg)

Altura

(cm)

Casos Similaridade

(%)

Itens na

prescrição

J18

Masc. 71 68 171 2 20% 49

Excluído: ¶¶¶¶¶¶

66

Figura 13 – Gráfico da similaridade x casos


Conforme a Figura 13 no eixo X do gráfico possui o número dos casos similares

encontrados e no eixo Y possui os percentuais possíveis. Esse gráfico demonstra que no caso

do CID J45.9 o índice de similaridade aumenta a medida que a proposta foi montada com o

maior numero de casos. Além do baixo número de casos, considerado o principal fator de

baixas taxas de similaridade, outros fatores contribuíram com menor proporção ao baixo

índice, tais como: dosagens com padrões diferentes e frequências com padrões diferentes.

4.3.1 Dosagens com padrões diferentes

A diferença entre dosagens ocorre principalmente com medicamentos. Uma medicação

pode ser prescrita utilizando-se uma unidade de apresentação ou uma unidade de

concentração. A unidade de apresentação é referente ao formato físico da medicação

(comprimidos, ampolas, cápsulas etc.). A unidade de concentração refere-se à concentração

da medicação a ser administrada para o paciente, são consideradas unidades básicas de

medida (miligramas, microgramas, etc.). Dessa forma, ocorrem itens do mesmo tipo com

dosagem similar, mas prescrito de forma diferente como demonstra o Quadro 15.

Medicamento Dosagem exemplo 1 Dosagem exemplo2

Paracetamol (250mg) 2 comprimidos 500 mg

Heparina (5000 ui amp) 5000 ui 1 ampola

Quadro 15 – Exemplos de dosagens


67

Como apresentado no Quadro 15, o medicamento Paracetamol pode ser prescrito de

duas formas diferentes, mas para fins terapêuticos é a mesmo resultado. Ainda existem

medicações que são prescritas em ampola ou comprimido com a mesma dose. Nesse caso

considerando-se o método de absorção pelo organismo ou a impossibilidade do paciente na

administração pela via oral, não se pode afirmar que são similares.

4.3.2 Freqüências com padrões diferentes

Assim como as medicações, as freqüências dos itens de prescrição podem ser

informados de diferentes formas, algumas tem o mesmo resultado final e outros são diferentes

no sentido terapêutico. O Quadro 16 apresenta alguns exemplos.

Freqüência Freqüência exemplo 1 Freqüência exemplo2

Vezes ao dia 2 vezes ao dia De 12 em 12 horas

Vezes ao dia 3 vezes ao dia De 8 em 8 horas

Quadro 16 – Exemplos de freqüências


O Quadro 16 demonstra o exemplo de freqüência vezes ao dia. Dependendo da

medicação o seu efeito é prejudicado se não for administrada em períodos regulares de tempo,

ou seja, nesse caso utiliza-se frequências do tipo “de x em x horas”. E em casos que não

precise um rigor na sua execução são utilizadas freqüências do tipo x vezes ao dia.

Entretanto, o sistema de prontuário eletrônico da ISCMPA possui uma funcionalidade

denominada como aprazamento automático. Essa funcionalidade permite ao usuário médico,

prescrever um item com a freqüência “vezes ao dia” e o sistema gera automaticamente os

horários para o item considerando o horário atual. Dessa forma, pode-se considerar similar um

item prescrito com uma freqüência “vezes ao dia” com uma “de x em x horas”.

Após a breve reflexão sobre alguns possíveis itens que influenciam a similaridade entre

as prescrições, avaliou-se as prescrições com opções de considerar as dosagens e freqüências,

ou simplesmente, descartar comparando apenas o item e sua respectiva via de administração.

Os resultados obtidos são apresentados nas tabelas 10, 11, 12 e 13.

68

Tabela 10 – Resultados sem alguns atributos CID I50


Tabela 11 – Resultados sem alguns atributos CID J45.9


Tabela 12 – Resultados sem alguns atributos CID N18


Caso Sexo Idade Peso

(kg)

Altura

(cm)

Casos Itens Similaridade

(%)

Sem

Dosagem

Sem

Freqüência

Sem

ambos

I50

1 Masc. 66 72 165 7 30 33% 40% 40% 46%

2 Masc. 61 62 166 3 17 17% 23% 35% 41%

3 Fem. 84 70 172 4 20 35% 45% 60% 80%

4 Fem. 82 70 165 7 11 45% 45% 81% 81%

CID Sexo Idade Peso

(kg)

Altura

(cm)


(%)

Sem

Dosagem

Sem

Freqüência

Sem

ambos

J45.9

1 Masc. 6 15 92 17 14 50% 78% 71% 85%

2 Masc. 5 11 90 19 8 87% 87% 100% 100%

3 Fem.. 4 17 98 16 21 48% 61% 76% 80%

4 Fem. 2 10 85 3 16 62% 81% 62% 81%

CID Sexo Idade Peso

(kg)

Altura

(cm)


(%)

Sem

Dosagem

Sem

Freqüência

Sem

ambos

N18

1 Masc. 42 61 172 12 14 21% 35% 28% 50%

2 Fem 37 57 157 8 20 10% 10% 20% 40%

Excluído: ¶¶¶¶¶

69

Tabela 13 – Resultados sem alguns atributos CID J18


Conforme apresentado nas Tabelas 10, 11, 12 e 13, a avaliação apresentou uma

significante melhora do percentual de similaridade ao não considerar a dosagem e/ou

freqüência. Como exemplo, o caso três do CID I50 demonstrado na Tabela 10. O índice de

similaridade inicial entre as prescrições foi somente de 35%, desconsiderando-se a dosagem o

índice foi elevado para 45% e, se destacando como um dos casos com maior índice, quando se

desconsidera também a freqüência, chegando à 80% de similaridade dentre os 11 itens da

prescrição do especialista.

Com a execução da avaliação caso a caso possibilitou-se a apresentação final dos

resultados globais. Essa apresentação organiza-se o índice de similaridade de acordo com o

CID e o sexo correspondente dos casos avaliados. Um comparativo é apresentado através das

tabelas 14 e 15, pois a Tabela 14 apresenta os resultados considerando dose e freqüência

enquanto, a Tabela 15 apresenta sem considerá-los.

I50 J45.9 N18 J18

Masculino 25% 68,5 21% 20%

Feminino 40% 55% 10% Sem casos

Tabela 14 – Resultados finais com dose e freqüência


I50 J45.9 N18 J18

Masculino 43,5% 92,5% 50% 28%

Feminino 80,5% 80,5% 40% Sem casos

Tabela 15 – Resultados finais desconsiderando dose e freqüência


CID Sexo Idade Peso

(kg)

Altura

(cm)


(%)

Sem

Dosagem

Sem

Freqüência

Sem

ambos

J18

1 Masc. 71 68 171 2 49 20% 20% 28% 28%

70

4.4 Considerações sobre o capítulo

Com visto nesse capítulo, o processo de avaliação do sistema proposto retornou como

resultado o índice de similaridade da prescrição proposta como a criada pelo usuário

especialista. Os resultados ficaram abaixo do esperado, devido ao baixo número de casos

disponíveis para análise.

No próximo capítulo apresentam-se as considerações finais e os trabalhos futuros

utilizando-se a metodologia proposta.

71

5 CONSIDERAÇÕES FINAIS

Ao longo desse trabalho, estudaram-se três técnicas da IA que combinadas resultaram

no sistema híbrido apresentado. Esse modelo teve grandes desafios como: manipular uma

grande massa de dados e organizá-las. Hoje a instituição que as informações foram utilizadas

possui mais de 1200 leitos divididos em cinco hospitais. Assim, utilizou-se técnicas de Data

Mining para classificar e filtrar as informação necessárias.

As técnicas de sistemas RBC foram utilizadas na construção e recuperação da base de

casos. Para essa recuperação utilizou-se algoritmo do vizinho mais próximo, sendo de vital

importância considerando-se o número de atributos a serem comparados entre itens de

prescrição.

Em paralelo com o desenvolvimento dessa proposta, avançava o processo de aprovação

do uso das informações clínicas através do CEP da Irmandade da Santa Casa de Misericórdia

de Porto Alegre, obtendo êxito como resultado. Com a aprovação desse comitê, a solução

começou a ser avaliada com informações reais de pacientes que obtiveram alta da instituição.

O modelo na etapa de avaliação apresentou limitações. Como todo sistema RBC, quanto

menor os casos similares pior era o índice de similaridade alcançado entre a prescrição

proposta com a do especialista. Esse problema ocorreu devido a filtragem necessária para

garantir o mínimo de informações obrigatórias para o processo de comparações entre os

casos.

Como contribuição, destaca-se a pesquisa direcionada por CID, sendo eficaz na

proposta de tratamentos já padronizados, sem a necessidade do médico criar novamente uma

prescrição necessitando apenas, alguns ajustes para adaptá-la as necessidades clínicas de outro

paciente.

Ainda destaca-se que não se encontrou proposta similar ao modelo proposto, que tem

como principal diferencial, apresentar a prescrição pronta, sendo apenas necessário o usuário

selecionar os itens que são relevantes para o novo caso.

Através da análise da base de casos, estabeleceu-se algumas informações relevantes

sobre a incidência de doenças de acordo com gênero, idade, peso e altura dos sujeitos. Estas

informações nortearam alguma das decisões do processo de avaliações do SE. Cabe ressaltar,

no entanto, que tais dados não podem ser extrapolados para uso como resultado científico.

Embora sejam indicadores relevantes para a comunidade da área de saúde, não foi resultado

de estudos sistemáticos ou com amostras que permitam dados estatisticamente significativos.

Excluído:

72

Um interessante trabalho futuro seria aplicar parte da metodologia de tratamento de dados

desenvolvidos para auxiliar equipes da área de saúde a obter dados para análise em períodos e

amostras maiores e que permitam extrair conhecimento sobre a influência das características

epidemiológicas do paciente.

Como outro trabalho futuro, o modelo pode ser aprimorado para considerar outras

características do estado clínico do paciente, histórico de doenças familiares, hábitos etc.

Quanto maior o número de atributos em conjunto com maior número de casos, mais preciso

será o resultado. O modelo também pode ser aprimorado para conversão de doses e

freqüências diferentes, aumentando a precisão do modelo.

Ainda como trabalho futuro, o modelo proposto pode ser utilizado para fins

educacionais no treinamento de estudantes de medicina, avaliando as diferentes condutas que

podem ser adotadas de acordo com o estado clínico geral do paciente.

REFERÊNCIAS

ABRAMOVICIUS, A. Estudo dos erros de prescrição relacionados aos medicamentos utilizados no Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto. 107 f. Dissertação de Mestrado – Universidade de São Paulo, Ribeirão Preto, 2007. Disponível em: <http://www.teses.usp.br/teses/disponiveis/17/17139/tde-06032008-153619/publico/ tese.pdf /> Acesso em: 06 jul. 2010. ALUR, D.; CRUPI J.; MALKS D. J2EE Patterns: Best practices and design strategies. 2 ed. Palo Alto,CA – USA, 2003. AMODT, A.; PLAZA, E. Case-Based Reasoning: Foundational Issues, Methodological Variations, and System Approaches. AI Communications, v. 7, n. 1,p. 39-59, mar. 1994. Disponível em: < http://www.idi.ntnu.no/~agnar/publications/aicom-94.pdf > Acesso em: 1 jun. 2010. BRASIL. Ministério da Saúde. Secretaria de Assistência à Saúde. Departamento de Controle e Avaliação de Serviços de Saúde. Manual do Sistema de Informação Hospitalar. 2010 Disponível em <www.saude.gov.br> Acesso em 07 jun. 2010 CAVELLUCI, C.; LYRA, C. Um Sistema Baseado em Conhecimento para o Auxílio de Manobras em Redes de Distribuição de Energia Elétrica. Revista SBA, Campinas, SP v. 3, n. 3, p. 282-290, 1992 Disponível em: < http://www.fee.unicamp.br/revista_sba/volumes/v3n1/v3n1a04.pdf> Acesso em: 10 jun 2010 CERVI, R.; FRANCESCHINI, S.; PRIORE S. Análise Crítica do uso do Índice de Massa Corporal para Idosos. Revista de Nutrição, Campinas, SP v. 18, n. 2, p. 765-775, 2005. Disponível em: <http://www.scielo.br/pdf/rn/v18n6/a07v18n6.pdf> Acesso em: 01 jun 2010 COELHO, L. ; MARIANI, V. Sistema Híbrido Neuro-evolutivo aplicado ao controle de processo multivariável. Revista SBA, Campinas, SP v. 17, n. 1, 2006. Disponível em:< http://www.scielo.br/scielo.php?pid=S0103-17592006000100004&script =sci_arttext&tlng=en> Acesso em: 14 jun 2010 COSTA, W. ; SILVA, S. Aquisição de conhecimento: o grande desafio de sistemas especialistas. Revista HOLOS, Campinas, SP v. 2, n. 4, p. 37-46, 2005. Disponível em:<http://www2.ifrn.edu.br/ojs/index.php/HOLOS/issue/view/11> Acesso em: 01 jun 2010

74

FERNANDES, Ana Maria da Rocha. (2005) Inteligência Artificial : Noções Gerais, Editora VisualBooks, 2ª edição. GIMENES, F. A segurança de pacientes na terapêutica medicamentosa: análise da redação da prescrição médica nos erros de administração de medicamentos em unidades de clínica médica. 2007. 112 f. Dissertação de Mestrado – Universidade de São Paulo, Ribeirão Preto, 2007. Disponível em: < http://www.teses.usp.br/teses/disponiveis/22/22132/tde-13112007-155334/> Acesso em: 11 out. 2009. GURGEL, T. Mineração de Dados Aplicada à Cardiologia Pediátrica. 2007. 129 f. Dissertação de Mestrado – Universidade Federal de Pernambuco, Recife, 2007. Disponível em: <http://biblioteca.universia.net/html_bura/ficha/params/id/26993610.html> Acesso em: 11 out. 2009. JULIANI, R. et al. Um Sistema Especialista Probabilístico de Apoio a Análise dos Planos de Negócios de Empresas de Base Tecnológica. Revista Eletrônica de Sistemas de Informação, Curitiba, PR v. 4, n. 2, 2005. Disponível em: <http://revistas.facecla.com.br/index.php/reinfo/article/viewPDFInterstitial /159/51> Acesso em: 12 jun 2010 LUGER, F. Inteligência Artificial: estruturas e estratégias para a resolução de problemas complexos. 4 ed. Porto Alegre,RS : Bookman, 2004. MORIMOTO, T.; GANDHI, T.K.; SEGER, A.C.; et al. Adverse drug events and medication errors: detection and classification methods. Qual Saf Health Care, v. 13, p. 306-14, 2004. Disponível em: < http://www.pubmedcentral.nih.gov/picrender.fcgi?artid=1743868&blobtype =pdf> Acesso em: 1 nov 2009 REZENDE, S. Sistemas Inteligentes: fundamentos e aplicações. Barueri, SP: Manoela. 2003. RICH, E.; KNIGHT, K. Inteligência artificial . 2. ed. São Paulo, SP: Makron Books. 1994. ROCHA, B.; MARTINS, D. Conceitos Básicos sobre Data Mining. In: CIENTIFICO III , 2003, Salvador. Disponível em: < http://www.frb.br/ciente/Textos%20CienteFico%202003.2 /INFO/Banco%20de%20Dados/Conceitos%20B%E1sicos%20sobre%20Data%20Mining.pdf > Acesso em 20 set. 2009. RUSSELL, S.; NORVIG, P. Artificial Intelligence A modern Approach. 3. ed. Saddle River, NJ: Prendice Hall, 2009.

75

SCHANK, R. Dynamic Memory Revisited. 2. ed. Cambridge University Press ,1999. Disponível em: <http://books.google.com.br> Acesso em: 01 out. 2009 SILVA, D.; COSTA, F. Sistema de Raciocíno Baseado em Casos para o Diagnóstico Médico de Doenças Neurológicas. In: II WORKSHOP DE INFORMÁTICA APLICADA À SAÚDE , 2002, Itajaí. Disponível em: <http://200.169.53.89/download/CD%20congressos/2002/2%20 CBComp/html/artigos/workshop/wsp038.pdf> Acesso em 20 set. 2009 SILVA, R. et al. Proposta de um Modelo RBC para Construção de um Sistema de Apoio ao Diagnóstico Médico. In: IV SBQS – V WORKSHOP DE INFORMÁTICA MÉDICA , 5, 2006, Vila Velha. Disponível em: < http://www.ime.uerj.br/professores/cecas/V%20WIM/ andamento/8348.pdf > Acesso em 20 set. 2009 SBIS - SOCIEDADE BRASILEIRA DE INFORMÁTICA NA SAÚDE. Informática em Saúde. São Paulo, 2008. Disponível em: www.sbis.com.br Acesso em: abr.2010. TELES, D. et al. Sistema Baseado no Raciocínio Baseado em Casos para recomendação de Programa Alimentar. Revista Eletrônica de Sistemas de Informação, Curitiba, PR v. 5, n. 3, 2006. Disponível em: <http://revistas.facecla.com.br/index.php/reinfo/article/view/240> Acesso em: 01 jun 2010. TONIDANDEL, F. Desenvolvimento e Implementação de um Sitema de Planejamento Baseado em Casos. 2003. 205 f. Dissertação de Mestrado – Universidade Federal de São Paulo, São Paulo, 2003. Disponível em: < http://www.teses.usp.br/teses/disponiveis/3/3139/ tde-28042003-164450> Acesso em: 11 out. 2009. VIANA, L.; NABUCO O. Ontologias e tecnologia da informação e comunicação: sistemas especialistas, web semântica e gestão integrada de compras governamentais eletrônicas. Revista Eletrônica de Comunicação, Informação & Inovação em saúde, Rio de Janeiro, RJ v. 1, n. 1, 2007. Disponível em: <http://www.reciis.cict.fiocruz.br/index.php/reciis/issue/view/9/showToc> Acesso em: 01 jun 2010. WANGENHEIN, V. Raciocínio Baseado em Casos: fundamentos, técnicas e desenvolvimento de aplicações. Blumenau, SC: Manole, 2003. WHO - WORLD HEALTH ORGANIZATION. BMI Organization. 2010 Disponível em <http://apps.who.int/bmi/index.jsp?introPage=intro_3.html> Acesso em 08 jun.2010

76

ANEXO A

78

ANEXO B

79

ANEXO C

avaliaÇÃo de sistema para prediÇÃo de prescriÇÃo … · quais os sistemas de prontuário...

Documents