avaliaÇÃo de sistema para prediÇÃo de prescriÇÃo … · quais os sistemas de prontuário...
TRANSCRIPT
Curso de Bacharelado em Ciência da Computação
ÉDSON DAS NEVES OLIVEIRA
AVALIAÇÃO DE SISTEMA PARA PREDIÇÃO DE PRESCRIÇÃO
MÉDICA ELETRÔNICA
CANOAS, 2010
ÉDSON DAS NEVES OLIVEIRA
AVALIAÇÃO DE SISTEMA PARA PREDIÇÃO DE PRESCRIÇÃO
MÉDICA ELETRÔNICA
Trabalho de conclusão apresentado em sessão de apresentação pública do curso de Ciência da Computação do Centro Universitário La Salle, como exigência parcial para a obtenção do grau de Bacharel em Ciência da Computação
Orientação: Profª. Dra. Patrícia Kayser Vargas Mangan
CANOAS, 2010
Dedico esse trabalho a toda minha família e,
em especial a minha avó,
não deu tempo para ela estar de corpo
presente por isso estará de coração.
AGRADECIMENTOS
Agradeço especialmente à Deus que tornou todos meus sonhos realidade e esteve sempre
comigo em momentos de alegria e tristeza, me dando força e motivos para continuar
acreditando na vitória.
Agradeço minha mãe Maria de Lourdes, pelo suporte familiar e financeiro que me forneceu
através de todos esses anos de muitas lutas e vitórias, através de seu trabalho árduo me
forneceu suporte e educação necessários para esse momento.
Agradeço ao meu avô Antônio que desde ainda muito pequeno sempre me aconselhou e
educou pelos melhores caminhos a se seguir na vida. Agradeço ao meu pai Jorge que me
educou de forma que sempre soubesse o real valor da vida. Ambos não estão mais presentes,
mas de uma forma ou de outra acompanham esse momento.
Agradeço pelo apoio de minha esposa Raquel, que compartilha o seus dias comigo sendo
minha eterna companheira, esteve comigo todos esses anos de faculdade apoiando todos os
momentos críticos dessa jornada.
Agradeço meu sogro Verno e minha sogra Romi, que me ajudam e foram fundamentais em
momentos críticos desta jornada.
Agradeço imensamente ao Dr. Antônio Dal Pizzol Jr. que em um momento crítico de minha
vida me aconselhou e recuperou a minha saúde novamente. Também contribui imensamente
para realização desta monografia, através do projeto de pesquisa que resultou na aprovação
para o uso de informações reais.
Agradeço a empresa que trabalho Dixtal Biomédica e aos colegas de trabalho pela amizade e
oportunidades aprendizado, que auxiliaram de forma significativa na evolução de meu
conhecimento para viabilização desse projeto.
Agradeço aos professores do Unilasalle pela amizade e por todos esses anos de convivência.
Em especial a minha orientadora Patrícia Kayser pelas inúmeras horas dedicadas de
orientação para o melhor resultado possível desse trabalho.
Agradeço a todos que de uma forma ou de outra contribuíram para a viabilização do término
de minha graduação.
RESUMO
A Informática na Saúde é uma área emergente na Ciência da Computação, que se utiliza de
técnicas e metodologias de outras áreas como Inteligência Artificial e Banco de Dados. Neste
contexto, alguns trabalhos vêm sendo realizados buscando auxiliar o médico no diagnóstico
e/ou prescrição de tratamentos. Dessa forma, essa monografia tem como objetivo apresentar e
validar um modelo para predição de prescrição eletrônica, automatizando o processo de
construção de prescrição e, consequentemente, padronizando o uso de medicações, dosagens e
frequências. Para o desenvolvimento do modelo, utiliza-se técnicas de Sistemas de Raciocínio
Baseados em Casos (RBC), Sistemas Especialistas (SE) e Data Mining, resultando em um
modelo de solução híbrida. O modelo foi validado utilizando-se uma base de casos reais,
concedidos através da aprovação pelo Comitê de Ética e Pesquisa da instituição estudada.
Como resultado, dependendo do Código Internacional da Doença (CID) obtém-se resultados
na faixa dos 85% de similaridade em relação ao tratamento real construído pelo usuário
especialista e, em outros casos consegue-se apenas similaridades na faixa dos 20%. Dessa
forma, investiga-se o porquê de tanta diferença analisando-se e aperfeiçoando o modelo
proposto para adaptar-se as situações que na qual será exposto.
PALAVRAS-CHAVE: prescrição eletrônica, sistemas especialistas, sistemas baseados em
casos, mineração de dados, sistemas híbridos
6
ABSTRACT
Health Informatics is an emergent area in Computer Science, which uses techniques such as
Artificial Intelligence and Data Bases. In this context, some efforts are being done in order to
help medical staff on diagnosis and treatment prescription. This way, this text has the goal to
present and validate an electronic prescription prediction model, automating the process of
building a prescription and consequently standardizing the use of drugs, doses, and frequency.
The development of this model requires techniques of Case-Based Reasoning (CBR), Expert
Systems (ES) and Data Mining, providing a hybrid solution model. This model was evaluated
with a real cases base, granted by the approval of the Ethics and Research Commission of the
target institution. The results, considering the International Disease Code, indicate around
85% of similarity concerning the system results and the real treatment proposed by an expert.
For some cases, it was obtained similarities around 20%, which motivated further analyses to
allow the model improvement.
KEYWORDS: electronic prescription, expert system, case-based reasoning, data mining,
hybrid systems
LISTA DE ABREVIATURAS E SIGLAS
AIH Autorização para Internação Hospitalar
CEP Comitê de Ética e Pesquisa
CID Código Internacional de Doenças
CTI Centro de Terapia Intensiva
DAO Data Access Object
IA Inteligência Artificial
IMC Índice de Massa Corpórea
ISCMPA Irmandade da Santa Casa de Misericórdia de Porto Alegre
NMIT Número Médio de Itens do Tratamento
PEP Prontuário Eletrônico do Paciente
RBC Raciocínio Baseado em Casos
SE Sistemas Especialistas
SUS Sistema Único de Saúde
UML Unified Modeling Language
VO Value Object
8
LISTA DE FIGURAS
Figura 1 - Processos de um sistema RBC.................................................................................17
Figura 2 – Arquitetura de um SE..............................................................................................23
Figura 3 - Fases do CRISP-DM................................................................................................26
Figura 4 - Resultado da recuperação de casos..........................................................................34
Figura 5 – Estrutura do sistema IAC Virtual............................................................................35
Figura 6 - Estrutura de classes para representação dos casos...................................................41
Figura 7 – Indexação de casos pelo CID ..................................................................................43
Figura 8 – Diagrama do RankingVO........................................................................................50
Figura 9 – Indexação de casos pelo CID ..................................................................................53
Figura 10 – Tela de proposta de prescrição..............................................................................54
Figura 11 – Tela de seleção de casos........................................................................................62
Figura 12- Tela de análise da proposta.....................................................................................63
Figura 13 – Gráfico da similaridade x casos ............................................................................66
Excluído: 66
Excluído: 65
LISTA DE TABELAS
Tabela 1 – CID por altura .........................................................................................................59
Tabela 2 – CID por peso...........................................................................................................59
Tabela 3 – CID por altura .........................................................................................................60
Tabela 4 – Características com maior incidência .....................................................................60
Tabela 5 – Candidatos a avaliação ...........................................................................................61
Tabela 6 – Resultados iniciais CID I50....................................................................................64
Tabela 7 – Resultados iniciais CID J45.9.................................................................................65
Tabela 8 – Resultados parciais CID N18..................................................................................65
Tabela 9 – Resultados parciais CID J18...................................................................................65
Tabela 10 – Resultados sem alguns atributos CID I50.............................................................68
Tabela 11 – Resultados sem alguns atributos CID J45.9 .........................................................68
Tabela 12 – Resultados sem alguns atributos CID N18...........................................................68
Tabela 13 – Resultados sem alguns atributos CID J18............................................................69
Tabela 14 – Resultados finais com dose e freqüência..............................................................69
Tabela 15 – Resultados finais desconsiderando dose e freqüência ..........................................69
Excluído: 69
Excluído: 70
10
LISTA DE QUADROS
Quadro 1 – Principais diferenças entre sistemas convencionais e sistemas RBC....................16
Quadro 2 - Algumas informações para uma internação hospitalar ..........................................29
Quadro 3- Exemplos de códigos de doença do CID.....................................................................
Quadro 4 - Informações preenchidas durante a internação ......................................................30
Quadro 5 - Informações preenchidas durante o processo de alta hospitalar ............................32
Quadro 6 - Peso por atributo, definido de acordo com a informação epidemiológica do
paciente.....................................................................................................................................44
Quadro 7- Intervalo de valores permitido para cada atributo...................................................44
Quadro 8- Exemplo de comparação entre os atributos.............................................................47
Quadro 9 - Classificação IMC..................................................................................................48
Quadro 10- Comparação entre casos destacando o IMC..........................................................48
Quadro 11 – Exemplo de número médio de itens ....................................................................51
Quadro 12- Total de casos........................................................................................................56
Quadro 13 – Casos com filtros .................................................................................................57
Quadro 14 – Períodos utilizados...............................................................................................58
Quadro 15 – Exemplos de dosagens.........................................................................................66
Quadro 16 – Exemplos de freqüências .....................................................................................67
Excluído: 2929
11
SUMÁRIO
1 INTRODUÇÃO ............................................................................................................... 13
2 ESTADO DA ARTE........................................................................................................ 16
2.1 Sistemas de raciocínio baseado em casos (RBC).........................................................16
2.1.1 Estrutura do RBC......................................................................................................... 17
2.1.2 Aquisição e representação do conhecimento............................................................... 18
2.1.3 Casos............................................................................................................................ 19
2.1.4 Indexação...................................................................................................................... 19
2.1.5 Recuperação de Casos................................................................................................. 20
2.1.6 Revisão......................................................................................................................... 20
2.1.7 Retenção....................................................................................................................... 21
2.2 Sistemas Especialistas ................................................................................................... 21
2.2.1 Classificação................................................................................................................ 21
2.2.2 Aquisição de conhecimento.......................................................................................... 22
2.2.3 Estrutura....................................................................................................................... 23
2.2.4 Representação de conhecimento.................................................................................. 24
2.2.5 Exemplos de SE............................................................................................................ 24
2.3 Data Mining ................................................................................................................... 25
2.4 Sistemas Híbridos .......................................................................................................... 26
2.5 Ciclo de Internação Hospitalar .................................................................................... 27
2.6 Admissão Hospitalar ..................................................................................................... 28
2.7 Tratamento..................................................................................................................... 30
2.8 Alta Hospitalar............................................................................................................... 31
2.9 Trabalhos Relacionados................................................................................................ 32
2.10 Sistema DietSysNet........................................................................................................ 33
2.11 Projeto IACVIRTUAL.................................................................................................. 34
2.12 Considerações sobre o capítulo .................................................................................... 35
3 MODELO PROPOSTO.................................................................................................. 37
3.1 Metodologia.................................................................................................................... 37
3.2 Solução Proposta ........................................................................................................... 37
3.3 Aquisição de conhecimento........................................................................................... 38
3.3.1 Informações Utilizadas................................................................................................. 38
12
3.4 Metodologia de extração de informações .................................................................... 39
3.5 Representação do conhecimento .................................................................................. 40
3.6 Base de conhecimento.................................................................................................... 41
3.7 Indexação........................................................................................................................ 42
3.8 Critérios de similaridade............................................................................................... 43
3.9 Recuperação dos casos .................................................................................................. 45
3.9.1 Pesquisa CID................................................................................................................ 45
3.9.2 Similaridade epidemiológica........................................................................................ 46
3.9.3 Similaridade do tratamento.......................................................................................... 49
3.9.4 Construção do ranking e eliminação de itens.............................................................. 51
3.9.5 Popular resultado......................................................................................................... 52
3.9.6 Apresentação da predição de prescrição..................................................................... 52
4 AVALIAÇÃO DOS RESULTADOS ............................................................................. 54
4.1 Montagem da Avaliação................................................................................................ 55
4.1.1 Método de comparação................................................................................................ 55
4.1.2 Critérios para a amostragem utilizada........................................................................ 56
4.1.3 Períodos de amostragem.............................................................................................. 57
4.2 Processo de Avaliação ................................................................................................... 58
4.2.1 Análise e seleção de novos casos para avaliação........................................................ 58
4.2.2 Execução Avaliação..................................................................................................... 62
4.3 Resultados da avaliação ................................................................................................ 64
4.3.1 Dosagens com padrões diferentes................................................................................ 66
4.3.2 Freqüências com padrões diferentes............................................................................. 67
4.4 Considerações sobre o capítulo .................................................................................... 70
5 CONSIDERAÇÕES FINAIS.......................................................................................... 71
REFERÊNCIAS ..................................................................................................................... 73
ANEXOS ................................................................................................................................. 73
1 INTRODUÇÃO
A informática na saúde é considerada uma área emergente em sistemas de informação,
possuindo grande demanda de desenvolvimento de novas soluções tanto em hardware quanto
em software. Assim, desperta o interesse de grandes corporações, que atualmente criam novas
divisões e adquirem empresas da área para integrar em suas soluções globais fortalecendo e
expandindo a informatização na saúde.
Segundo Blois e Shortliffe apud Sociedade Brasileira de Informática na Saúde (2010), a
informática na saúde é um campo de rápido desenvolvimento científico que lida com
armazenamento, recuperação e uso da informação, dados e conhecimentos biomédicos para a
resolução de problemas e tomada de decisão. Ainda segundo a Sociedade Brasileira de
Informática na Saúde (SBIS), a informática na saúde possui diversas subdivisões, dentre as
quais os sistemas de Prontuário Eletrônico do Paciente (PEP). Esses sistemas estão cada vez
mais presentes em hospitais e clínicas, sendo este um dos focos deste trabalho.
O desenvolvimento deste trabalho baseou-se no sistema PEP implantado na Irmandade
da Santa Casa de Misericórdia de Porto Alegre (ISCMPA), no qual está disponível em
diversos pontos da instituição sendo responsável pelo armazenamento eletrônico do
prontuário dos pacientes. Em particular, foi analisado um módulo específico do sistema PEP
conhecido como Prescrição Eletrônica. Esse módulo tem como responsabilidade criar e
manter a lista de ordens médicas - medicamentos, procedimento, dietas - criado pelo médico
responsável pelo paciente durante a internação e passado para a equipe assistencial para sua
posterior execução. Dependendo da gravidade do estado clínico do paciente, prescrições
extensas podem ser geradas que, conseqüentemente, tem sua construção muito trabalhosa,
com chances de erros em dosagens e interações medicamentosas. Segundo Morimoto et al.
(2004), as medicações são causa mais freqüente de geração de eventos adversos, aumentando
o número de internações hospitalares, o tempo de internação, conseqüentemente gerando
custos extras.
Na tentativa de minimizar erros de prescrição de medicamentos, alguns sistemas de
prescrição possibilitam salvar a prescrição criada como um modelo, para ser reutilizada no
futuro, minimizando o trabalho de reconstrução de um tratamento. Outra solução adotada foi
a criação de protocolos, ou seja, padronizar a prescrição para determinadas doenças. Contudo,
as duas soluções apresentam praticamente o mesmo problema: as medicações, dosagens e
freqüências devem considerar características clínicas e epidemiológicas do paciente atual.
Excluído:
14
Para a utilização de qualquer uma das duas soluções, necessita-se a adaptação de alguns
parâmetros dos itens prescritos, tais como dosagens e frequências, para utilização em
pacientes distintos.
Considerando-se os problemas relatados, é possível afirmar que uma prescrição médica
não pode ser baseada em regras simples, com informações padrão a diversos tipos fisiológicos
de pacientes. Assim, o tratamento dos dados de entrada precisa ser dinâmico, moldado de
acordo com o novo caso considerando-se a experiência médica para casos solucionados
anteriormente. Portanto, para utilizar-se a base de experiência médica necessita-se avaliar,
modelar e desenvolver uma metodologia que seja possível extrair as informações necessárias
para a construção de uma proposta de tratamento. Sendo assim, o problema de pesquisa
abordado neste trabalho visa elucidar qual seria a melhor ou melhores técnicas que,
combinadas, poderiam retornar resultados (proposta de tratamento) com um alto índice de
eficácia.
Por conseguinte, o principal objetivo desse trabalho é avaliar a combinação de técnicas
da Inteligência Artificial (IA), com a criação de métricas para comparação e extração de
informações importantes para a construção de um tratamento considerando-se as
características epidemiológicas do paciente. Ainda busca-se nesse estudo um alto grau de
similaridade entre a proposta de tratamento construída pelo sistema, comparada ao tratamento
construído pelo profissional de saúde. Como objetivos específicos (metas) são destacados os
seguintes:
• Definição de medidas de similaridade utilizando-se as características
epidemiológicas dos pacientes e seus respectivos tratamentos;
• Definição de métricas de segurança evitando que resultados inconsistentes sejam
apresentados;
• Construção de um método automatizado de avaliação dos resultados para
comparar o grau de concordância do padrão de prescrição identificada
eletronicamente, com o realmente prescrito em internações subseqüentes a partir
de dados reais.
Esta monografia descreve o desenvolvimento de um modelo visando atingir os objetivos
propostos, sendo que o restante do texto foi divido em mais seis capítulos.
No Capítulo 2 são mostradas as técnicas da IA utilizadas nesse trabalho detalhando suas
principais características e seus conceitos gerais. Apresenta-se no Capítulo 3 um breve resumo
da rotina hospitalar, mais especificamente as principais etapas que ocorrem durante a
internação de um paciente, demonstrando-se o contexto em que o modelo proposto será
15
utilizado. O Capítulo 4 apresenta alguns sistemas similares na área de informática médica que
utilizam técnicas da IA. No Capítulo 5 apresenta-se o modelo proposto dividido nas etapas
modeladas e desenvolvidas. As métricas de avaliação com o respectivo resultado do modelo
proposto são analisadas no Capítulo 6. Finalmente, o Capítulo 7 contém as conclusões
parciais e os possíveis trabalhos futuros.
16
2 ESTADO DA ARTE
Uma das formas de representação do pensamento humano em computação é através
dos sistemas de Raciocínio Baseado em Casos (RBC), que tentam reproduzir através do uso
de técnicas de construção de conhecimento e recuperação, o comportamento humano em
tomada de decisões.
Para a viabilização da proposta, serão apresentados nas próximas seções os principais
conceitos e alguns exemplos de Sistemas de Raciocínio Baseado em Casos (RBC), Sistemas
Especialistas (SE) e Data Mining.
2.1 Sistemas de raciocínio baseado em casos (RBC)
Os sistemas RBC foram criados utilizando-se os princípios da Memória Dinâmica
criado por Schank (1999), que define que o processo de aprendizagem ocorre quando existe
diferença entre o que é esperado acontecer do que realmente acontece em determinada
situação. Para Wangenhein (2003) um sistema RBC pode ser considerado uma metodologia
de construção de sistemas inteligentes ou uma metodologia que visa moldar o pensamento
humano. Como característica principal possui um aprendizado automatizado, pois poderão
utilizar um novo caso para resolver futuros casos (AMODT ; PLAZA, 1994).
Os sistemas que utilizam técnica de RBC consistem em identificar o problema atual,
buscar a experiência mais similar em sua base de conhecimento e aplicar essa experiência
similar para resolver o problema atual (SILVA; COSTA, 2002). Segundo Rezende (2003),
existem quatro principais diferenças entre sistemas RBC e sistemas convencionais, as quais
estão sumarizadas no Quadro 1.
Sistemas Convencionais Sistemas RBC
Estrutura de dados Representação de Conhecimento
Dados e relacionamentos Conceitos, relações entre conceitos e regras
Conhecimento especificado no código do
programa
Conhecimento representado e separado do
programa que apenas o manipula e interpreta
Explicação do raciocínio é difícil Podem e devem explicar seu raciocínio
Quadro 1 – Principais diferenças entre sistemas convencionais e sistemas RBC
Fonte: Rezende, 2003
17
2.1.1 Estrutura do RBC
Os sistemas RBC são moldados para armazenar uma base de conhecimento consistente
e de rápido acesso para a resolução de um problema atual. Para Amodt e Plaza (1994), um
sistema RBC deve apresentar suas etapas dentro dos quatro processos a seguir:
• Recuperação: O caso com maior índice de similaridade com o atual, é recuperado
sendo que nessa etapa é necessário a avaliação da similaridade entre os casos;
• Reutilização: sendo identificado o caso semelhante o mesmo é eleito para a resolução
do problema atual;
• Revisão: o caso anterior é revisado quando necessário para sua utilização na resolução
atual, sendo que as eventuais diferenças podem ser ajustadas para se adequar à
resolução do novo caso;
• Retenção: é responsável pelo armazenamento de todas as informações do novo caso
para que o mesmo sirva de solução para um caso semelhante no futuro. Portanto,
através dessa etapa, se expande a base de conhecimento para resoluções de problemas
futuros.
Figura 1 - Processos de um sistema RBC.
Fonte: Traduzido de Amodt & Plaza,1994. Excluído:
18
A Figura 1 ilustra as etapas que o caso percorre desde sua criação, passando por todos
os processos descritos por Amodt e Plaza (1994), até seu aproveitamento para resolução de
um caso posterior.
2.1.2 Aquisição e representação do conhecimento
Para a representação de conhecimento, é necessário a análise para definir-se o grau de
importância dos atributos que serão integrantes de um caso. Para essa definição, necessita-se
de um profissional que tenha o domínio do contexto e possa se relacionar com o usuários
especialistas denominado como Engenheiro do Conhecimento. Esse profissional deve
entender o domino da aplicação e interagir com as fontes de informação como: entrevistas,
modelagem de dados, etc. (COSTA; SILVA, 2005).
Segundo Buchanan apud Rezende (2003) a aquisição de conhecimento é dividida em
cinco fases:
• Identificação: Análise e busca de informações sobre o contexto que o sistema RBC
será aplicado;
• Conceituação: Através da literatura o Engenheiro de Conhecimento, constrói os
conceitos necessários sobre o domínio do negócio e os relaciona;
• Formalização: Momento que a estrutura da base de conhecimento é desenvolvida;
• Implementação: Escolha das ferramentas e implementação da base de conhecimento;
• Teste: Validação da efetividade e da qualidade dos resultados retornados pelo sistema;
• Manutenção: Possibilita a atualização da base de conhecimento.
Segundo Luger (2004), a aquisição de conhecimento pode ser feita através de registros
históricos ou do monitoramento em tempo real dos dados gerados. Em ambos os casos, esta
aquisição minimiza a demanda por tempo do especialista humano.
De acordo com Rezende (2003), as seguintes técnicas podem ser utilizadas para a
aquisição de conhecimento:
• Técnicas manuais baseadas em acompanhamento ou modelos;
• Técnicas semi-automáticas baseadas em teorias;
• Técnicas de aprendizado de máquina;
• Técnicas de mineração de dados a partir de grandes massas de dados;
• Técnica de mineração de textos de informações não estruturadas.
Excluído:
19
Como resultado da etapa de aquisição de conhecimento, se obtém a base de
conhecimento. A base possui, em sua estrutura, experiências anteriores com seus respectivos
atributos sendo conhecidas como casos.
2.1.3 Casos
Como principal elemento de um sistema RBC possui-se o caso, que segundo
Wangenheim (2003) representa a descrição de um problema possuindo em conjunto as
experiências adquiridas durante sua resolução. Cada caso é classificado como uma peça de
conhecimento contextualizado representando um episódio ou problema que foi resolvido
anteriormente (WANGENHEIM, 2003).
O desempenho do sistema RBC é fortemente influenciado com a estrutura, disposição e
a qualidade dos casos armazenados. Para ser possível uma melhor disposição dos casos, cada
um deve possuir informações suficientes para permitir determinar se ele pode ser eleito como
uma possível solução para o problema atual (TONIDANDEL, 2003).
Segundo Rezende (2003), o conhecimento representado deve possuir as seguintes
características: ser compreensível ao ser humano, abstrair-se dos detalhes, ser robusto e
generalizável, isto é necessita de uma representação com vários pontos de vista.
Com a característica de generalizável, necessita-se que os casos estejam organizados de
forma que facilite a busca por características identificadas como prioritárias. O processo de
organização classificando os casos pelas principais características é conhecido como
indexação.
2.1.4 Indexação
Segundo Schank (1999), para o aproveitamento de experiências anteriores é necessário
possuir-se uma memória com experiências eficazes, possuindo experiências especificas
categorizadas e indexadas. Dessa forma, considera-se que a estrutura de organização de casos
é fundamental para se obter um bom desempenho em sistemas RBC. De acordo com
Tonidandel (2003), os sistemas RBC necessitam de uma estrutura que possibilite a busca de
um caso em apenas um subconjunto de casos indexados, evitando-se a busca em toda a base
de conhecimento.
O processo de indexação possui várias formas de implementação e representação. Uma
das formas utilizadas segundo Tonidandel (2003) pode ser desenvolvida como ponteiros, que
Excluído: .
20
identifica o caso de acordo com algumas características principais. Assim, possibilita uma
amostra de casos menor para a recuperação e comparação do grau de similaridade.
2.1.5 Recuperação de Casos
Para a correta e eficiente recuperação de casos, é proposto um conjunto de heurísticas
para ajudar na recuperação e organização dos casos (KOLODNER apud LUGER, 2004),
sendo estas:
• Preferência orientada à objetivo: Organizar a base de casos pelo objetivo;
• Preferência por características salientes: Preferir casos que se enquadrem no maior
número de características importantes;
• Preferência por maior especificidade: Procurar primeiramente por casos cujas
características sejam o mais semelhante possível. Assim, somente depois considera os
casos mais genéricos;
• Preferência por ocorrências freqüentes: Sempre identificar os casos com uso mais
frequente;
• Preferência por atualidade: Preferir sempre os casos mais utilizados recentemente;
• Preferência por facilidade de adaptação: Sempre dar preferências a utilização de casos
com maior capacidade de adaptação à situação corrente.
Baseando-se nessas heurísticas, para o trabalho apresentado utiliza-se a heurística de
facilidade de adaptação dos casos, no qual casos semelhantes são utilizados na construção da
solução do problema corrente. O processo chamado revisão pode ser usado nesta tarefa, o
qual é analisado na próxima seção.
2.1.6 Revisão
A revisão provê a capacidade de adaptar as possíveis características de um problema a
um caso previamente armazenado. Os sistemas RBC, através dessa etapa, modificam um caso
recuperado para que o mesmo seja aplicado na situação atual, tendo que transformar uma
situação armazenada em operações e características adequadas ao problema corrente
(LUGER, 2004).
Durante o uso do sistema RBC, a base de conhecimento está em constante expansão.
Com essa expansão são armazenados casos eficazes e outros com baixa qualidade. Por isso,
necessita-se de algum mecanismo que monitore a qualidade dos casos armazenados.
21
2.1.7 Retenção
Para a continuidade do uso da base de conhecimento garantindo sua eficiência e
desempenho necessita-se implantar um processo de retenção. De acordo com Tonidandel
(2003), necessita-se controlar a qualidade e a quantidade de casos na base, preservando a
qualidade das amostras e sempre manter o menor número possível de casos.
Segundo Luger (2004), conforme a base de conhecimento aumenta, o tempo para
recuperação de casos também aumenta. Assim, uma das possíveis soluções seria o
armazenamento somente dos "melhores" casos ou "protótipos", excluindo-se os casos
redundantes. Conseguir reter continuamente o conhecimento toda vez que um problema é
resolvido, permite ao sistema incrementar o seu conhecimento tornando-se cada vez mais
eficaz na solução de problemas complexos (WANGENHEIM,2003).
2.2 Sistemas Especialistas
Sistemas que solucionam problemas que poderiam ser solucionados por um especialista
humano são classificados como sistemas especialistas (SE). Segundo Rich e Knight (1994), os
SEs utilizam uma grande base de conhecimentos montada de maneira mais eficiente possível
através de especialistas humanos. Geralmente fazem parte de um sistema maior, sendo muitas
vezes, um módulo específico do sistema principal (RICH; KNIGHT, 1994).
Para a sua completa efetividade durante o seu uso, os sistemas especialistas precisam
prover uma fácil e eficaz interação com os seus usuários. Para facilitar essa interação o SE
deve possui dois recursos: explicar seu raciocínio e adquirir novo conhecimento modificando
o conhecimento antigo (RICH; KNIGHT, 1994).
De acordo com Russel e Norvig (2009), se for dado conhecimento do domínio
apropriado, o sistema especialista é possível igualar ou superar o desempenho de peritos
humanos em tarefas estritamente definidas.
2.2.1 Classificação
Segundo Fernandes (2005), os SE podem ser classificados conforme a sua característica
de funcionamento:
• Interpretação: inferem descrição de fatos através de observação de fatos;
• Diagnóstico: detecção de falhas através da interpretação dos dados;
Excluído:
22
• Monitoramento: observa e interpreta sinais do comportamento monitorado;
• Predição: utiliza uma modelagem de dados do passado e do presente para um previsão
de futuro essa característica a proposta do modelo será apresentada;
• Planejamento: o sistema prepara um grupo de iniciativas para atingir um objetivo;
• Projeto: define especificações para os objetivos serem atingidos;
• Depuração: fornecem soluções para o mau funcionamento devido a distorções nos
dados;
• Reparo: executa planos de reparos na etapa de diagnósticos;
• Instrução: verifica e corrige o comportamento do aprendizado de estudantes;
• Controle: governa o comportamento geral de outros sistemas.
2.2.2 Aquisição de conhecimento
Para a construção da base conhecimento em SE, necessita-se da fase de aquisição de
conhecimento em que o responsável é o engenheiro de conhecimento. Como em Sistemas
RBC, esse profissional deve entender o domínio da aplicação e interagir com as fontes de
informações necessárias. Segundo Fernandes (2005), a etapa de aquisição de conhecimento é
o principal “gargalo” de tempo nos SE.
De acordo com Rezende (2003), um dos principais problemas de SE é a disponibilidade
do especialista para se extrair o conhecimento e construir a base de conhecimento. Por isso,
segundo Costa (2005) é possível obter-se o conhecimento a partir dos seguintes métodos:
• Pesquisas na literatura: obtém-se um conhecimento inicial sobre o processo;
• Entrevistas com usuários especialistas: o engenheiro de conhecimento realiza
entrevistas, para posteriormente ser analisá-las em busca de requisitos necessários;
• Acompanhamento: acompanha o raciocínio do especialista em casos reais. Dessa
forma, são pesquisados a forma como os casos são resolvidos por esse especialista;
• Processos semi-automáticos: utilizam-se ferramentas computacionais para a extração
do conhecimento de alguma base de informações existente.
23
2.2.3 Estrutura
Segundo Fernandes (2005), os sistemas especialistas apresentam três componentes
básicos: base de conhecimento, máquina de inferência, memória de trabalho, conforme
representado na Figura 2.
Figura 2 – Arquitetura de um SE
Fonte: Adaptado de Juliani, 2005, p. 2.
A Figura 2 demonstra o fluxo de troca de informações entre os componentes que
compõe a estrutura de um sistema especialista. Esses componentes são divididos em:
• Memória de trabalho: Responsável pelo de armazenamento de informações
temporárias. Contém todas as respostas fornecidas pelos usuários e também, os passos
executados em uma interação na busca pela solução do novo problema apresentado
(COSTA; SILVA, 2005). Como memória de trabalho o modelo proposto, utiliza os
objetos em memória que são manipulados pelas diversas etapas que compõe a
recuperação dos casos;
• Máquina de Inferência: Esse mecanismo é responsável pelo raciocínio do sistema,
examina as regras existentes na base de dados, acrescentando sempre que possível
novos fatos a partir de suas interpretações e conclusões (JULIANI et al. ,2005).
Segundo Fernandes (2005) é responsável por procurar as respostas na base de
conhecimento através das regras necessárias a serem avaliadas;
• Base de conhecimento: formada por um conjunto de regras definidas previamente
com algum dos processos de aquisição de conhecimento.
Excluído:
24
2.2.4 Representação de conhecimento
A base de conhecimento pode ter diversas formas de representação. Segundo Viana e
Nabuco (2007), os métodos para representação de conhecimento são:
• Lógica: utiliza expressões lógicas na montagem das regras tendo sua interpretação
como proposições ou predicados lógicos;
• Produção: utiliza regras de produção, que são pares de expressão “se” e “então”;
• Redes semânticas: construção de uma rede com inter-relações entre os nodos que
representam objetos, predicados ou classes e são relacionados de forma binária;
• Quadros: conhecidos como frames ou scripts permite a representação das estruturas
internas dos objetos permitindo a herança de propriedades em redes semânticas.
Considera-se esse método como base para a criação de linguagens orientadas a
objetos.
• Objetos: representam entidades físicas ou conceituais, seus atributos representam
características ou propriedades associadas aos objetos. Os respectivos valores dos
atributos representam a natureza particular de um atributo em cada situação
(CAVELLUCI; LYRA, 1992).
Este trabalho utiliza como método de representação de conhecimento: objetos, pois esse
método possibilita armazenar o objeto com sua forma do mundo real facilitando a
conceituação da base de conhecimento.
2.2.5 Exemplos de SE
Os sistemas especialistas exploram diversos mecanismos de raciocínio e representação
de regras (RICH; KNIGHT, 1994). Como exemplo dessa diversidade pode-se citar aos
seguintes sistemas e seus respectivos métodos utilizados:
• DENDRAL: um dos pioneiros SE voltado para resolver problemas em um domínio
específico, desenvolvido na final da década de 60 na universidade de Stanford. Tinha
como objetivo era inferir a estrutura de moléculas orgânicas baseando-se em fórmulas
químicas. Mesmo sendo reconhecido na química computacional, sua utilização na prática
foi limitada (VIANA; NABUCO, 2007).
Excluído: e
25
• MYCIN: foi um dos primeiros sistemas especialistas e tinha como objetivo recomendar
terapias para pacientes que com suspeita de infecções bacteriológicas (RICH; KNIGHT,
1994). Segundo Russel e Norvig (2009) era tanto uma solução da engenharia quanto um
modelo de julgamento humano sob incerteza. Cada regra no sistema MYCIN tem
associado um fator de certeza, que é utilizado para medir o grau de evidência do
antecedente da regra com o valor presente que a regra está sendo submetida. As regras do
sistema MYCIN são fornecidas pelos especialistas tendo como função refletir as
avaliações que os especialistas baseando-se em evidências para sustentar as hipóteses de
diagnóstico. Essas regras eram adquiridas em extensas entrevistas com usuários
especialistas e pesquisas na literatura médica (RICH; KNIGHT, 1994);
O sistema DENTRAL é uma referencia e um dos pioneiros de SE, assim como o
MYCIN que alem de ser um dos primeiros é um sistema era utilizado na área clínica
recomendando terapias. O sistema DENTRAL virou referência na área química mesmo sem
ter grande utilização na prática, já o sistema MYCIN foi um SE pioneiro na área clinica tendo
suas regras criadas por diversos especialistas.
2.3 Data Mining
Devido à crescente quantidade de informações geradas no dia-a–dia, fica cada vez mais
difícil se obter informações relevantes para o apoio a decisão, devido ao grande volume de
dados e a complexidade no processo de cruzar informações para se obter informações
concretas.
Segundo Rezende (2003), o crescimento das bases de informações foi motivado pelos
poderosos mecanismos de coleta e armazenamento existentes. Analisar estas informações de
forma manual a fim de obter conhecimento é difícil e em muitos casos inviável. Um das
formas mais usuais de automatizar os processos de análise de dados é aplicar técnicas de
mineração de dados (Data Mining).
De acordo com Rezende (2003), para a possível Mineração de dados são empregadas
várias técnicas e algoritmos, tais como: Algoritmos genéticos, Clustering, Redes neurais,
Lógica fuzzy, Árvores e Regras de decisão.
Existem alguns modelos de processos para a extração de dados, sendo que o mais
utilizado é conhecido como CRISP-DM (Cross Industry Standard Process for Data Mining).
De acordo com Gurgel (2007), esse modelo é organizado em seis etapas: entendimento do
negócio (Businness Understanding), entendimento dos dados (Data Understanding),
26
preparação dos dados (Data Preparation), modelagem (Modeling), avaliação dos resultados
(Evaluation) e implantação da solução (Deployment). A Figura 3 apresenta o ciclo com esses
processos.
Figura 3 - Fases do CRISP-DM
Fonte: Traduzido de Gurgel, 2007.
A Figura 3 apresenta o fluxo necessário para a extração das informações utilizando-se
Data Mining. O processo inicia-se com o entendimento do negócio, logo após necessita-se do
entendimento dos dados. Com o devido entendimento dos dados e do negócio é possível
preparar os dados para a modelagem necessária para a avaliação dos resultados.
2.4 Sistemas Híbridos
Os sistemas híbridos são cada vez mais utilizados de acordo com o aumento da
complexidade na resolução de um problema, uma vez que permitem combinar dois ou mais
métodos buscando maior eficiência e desempenho. De acordo com Coelho e Mariani (2006),
utiliza-se os sistemas híbridos inteligentes quando possui-se domínios complexos e que
requerem diversos tipos de processamentos.
Segundo Luger (2004), um ou mais paradigmas integrados produzem um efeito
cooperativo, onde as vantagens de um sistema podem compensar as desvantagens de outro
sistema.
27
De acordo com Coelho e Mariani (2006, p 33), “A concepção de que as metodologias
da inteligência computacional são complementares, mais que competitivas, gerou uma ampla
diversidade de configurações de sistemas híbridos inteligentes”. Assim, nesse trabalho utiliza-
se sistemas RBC, Sistemas Especialistas e Data Mining em cooperação, dessa forma
caracterizando-se como um Sistema Híbrido.
A solução híbrida foi adotada devido às características especificas que cada técnica
provê. Para a extração de informações, considerando-se o grande volume de informações do
sistema principal, necessita-se de técnicas de Data Mining para indexar e extrair informações
relevantes sem prejudicar o desempenho do sistema principal. Assim, com o uso de sistemas
RBC cria-se uma base de conhecimento com casos específicos organizados e indexados
atualizada diariamente por inúmeros usuários especialistas. Dessa forma, para a construção do
modelo propostos as três técnicas citadas atendem completamente as necessidades que o
modelo necessita.
As técnicas citadas serão utilizadas no meio clínico, manipulando, indexando e
recuperando informações obtidas durante a internação de um paciente. Por isso, para facilitar
a compreensão do contexto, na próxima seção apresenta-se um breve resumo das informações
e seus respectivos momentos de coleta durante o ciclo de uma internação hospitalar.
2.5 Ciclo de Internação Hospitalar
O estudo proposto depende de informações que são geradas durante a internação
hospitalar dos pacientes. Durante essa internação são geradas informações em diversos
momentos, que aos poucos iram criar e incrementar o prontuário do paciente.
De acordo com Brasil (2010), o prontuário do paciente é um conjunto de documentos
padronizados e organizados, destinados ao registro de todas as informações referentes aos
cuidados médicos e de outros profissionais de saúde. No prontuário deve-se possuir o registro
das seguintes informações (BRASIL, 2010):
• Atendimento ambulatorial;
• Atendimento de urgência;
• Evolução médica;
• Evolução de enfermagem e de outros profissionais assistentes. No caso de internação,
as evoluções devem ser diárias, com data e horário em todas elas;
• Partograma (em obstetrícia);
28
• Prescrição médica;
• Prescrição de enfermagem e de outros profissionais assistentes -No caso de internação,
as prescrições devem ser diárias, com data e horário em todas elas;
• Exames complementares (laboratoriais, radiológicos, ultra-sonografias e outros) e seus
respectivos resultados;
• Descrição cirúrgica;
• Ficha de anestesia;
• Material usado no centro cirúrgico ou obstétrico (gasto de sala);
• Resumo de alta;
• Boletins médicos.
O trabalho proposto utiliza informações da prescrição médica e de outros processos
clínicos e administrativos existentes na instituição de saúde. Por isso, nessa seção apresenta-se
uma breve descrição de cada um dos processos, que compõe o prontuário do paciente,
demonstrando as diversas informações que são geradas em cada momento da internação e, sua
utilidade dentro do estudo proposto.
Este seção foi construída utilizando-se como base, o conhecimento prévio adquirido
através da literatura e entrevistas com usuários especialistas durante a construção do sistema
principal em uso pela instituição de saúde.
2.6 Admissão Hospitalar
A internação hospitalar pode ter seu início de forma programada ou por uma
intercorrência clínica. A instituição utilizada no estudo proposto tem grande parte de seus
atendimentos vinculados ao Sistema Único de Saúde (SUS). Dessa forma, as informações
necessárias durante a admissão de um paciente seguem as regras definidas pelo Ministério da
Saúde.
De acordo com Brasil (2010), no momento da admissão hospitalar o profissional
médico que realizou a consulta e/ou atendimento, solicita a Autorização para Internação
Hospitalar (AIH) através do preenchimento do Laudo de AIH. Esse laudo possui as
informações do paciente como: identificação, ananmese, resultados de exames, exame físico,
ou seja, tudo que justifique a internação do paciente conforme Anexo B (BRASIL, 2010).
Quando é uma internação de urgência, ou seja, não programada o laudo deve ser preenchido
durante a internação e a autorização deve ocorrer até 72 horas da admissão.
29
Com a aprovação do laudo de AIH o paciente pode ser internado na instituição de saúde
que recebeu a autorização. Nesse momento, o formulário de internação é preenchido com
diversas informações administrativas e clínicas. No Quadro 2, apresenta-se algumas
informações preenchidas na admissão do paciente.
Informações do paciente Informações Administrativas
Nome do paciente Número prontuário
Logradouro Identificação AIH
Número Órgão Emissor AIH
Complementação Número Enfermaria
Município Número Leito
UF CPF médico solicitante
CEP Código Procedimento
Data Nascimento Caráter da Internação
Sexo Tipo de Leito (Cirúrgico, Clínica
Médica, etc)
Nome da Mãe ou Responsável Caráter de atendimento (Eletivo,
Urgência, etc)
Número Documento CID Principal
CNPJ empregador CID Secundários
Quadro 2 - Algumas informações para uma internação hospitalar
Fonte: Adaptado de BRASIL, 2010.
Pode-se observar no Quadro 2 que no momento da admissão hospitalar informa-se o
código internacional de doenças (CID), representado como o item “CID principal”. Esse
código classifica as doenças conhecidas por códigos, sendo atribuído um código a cada uma
delas. O Quadro 3 demonstra alguns exemplos de códigos.
Código Descrição
A08.0 Enterite por rotavírus
B00.7 Doença disseminada devido ao vírus da herpes
B16 Hepatite aguda B
R57.1 Choque hipovolêmico
Quadro 3- Exemplos de códigos de doença do CID
Fonte: Autoria Própria, 2010.
30
Nessa proposta, o código de CID de admissão não será utilizado na busca por
similaridade, devido a ser suscetível a alterações durante a internação, com a execução de
exames mais detalhados e acompanhamento da evolução do quadro clínico do paciente. Por
isso, para recuperar um caso da base de conhecimento sempre será considerado o CID da alta
do paciente.
Com o processo de admissão concluído o paciente está oficialmente internado, mas o
início do tratamento já pode começar antes dependendo da gravidade do estado clínico do
paciente.
2.7 Tratamento
O processo de tratamento do paciente inicia-se durante a primeira consulta ou em um
atendimento de emergência. Quando o paciente já está internado são coletadas informações
periodicamente pela equipe assistencial, visando o monitoramento da evolução do estado de
saúde do paciente. Essas coletas podem ocorrer de forma manual ou através de resultados de
exames. Os resultados dessas informações são repassadas para os médicos quando estão na
unidade avaliando o paciente. O Quadro 4 apresenta algumas dessas informações.
Informações Epidemiológicas Informações Assistenciais Informações de Serviços
Peso Planilha de controle Exames Laboratoriais
Altura Passagem de plantão Exames de Imagem
Hábitos Evolução de enfermagem
Alergias
Quadro 4 - Informações preenchidas durante a internação
Fonte: Autoria Própria, 2010.
Conforme o Quadro 4 diversas informações são coletadas durante a internação do
paciente, algumas delas são simples como, por exemplo, peso e altura e, outras informações
complexas como: hábitos, planilha de controle, evolução da enfermagem, passagem de
plantão, alergias e resultados de exames. Essas informações são consideradas complexas,
devido a diversos dados que devem preenchidos para completá-las em momentos e pessoas
diferentes durante a internação do paciente. Assim, muitas delas são preenchidas de forma
manual através de formulários e documentos definidos pela instituição de saúde.
31
Com as informações coletadas tanto em papel ou eletronicamente durante a internação,
é possível a definição de um tratamento que é dividido em várias prescrições, uma por dia. De
acordo com Benet apud Abramovicius (2007), a prescrição médica é uma relação terapêutica
importante entre o médico e o paciente, representando o resultado da capacidade diagnóstica e
terapêutica do médico, sendo o documento onde estão dispostos todos os dados necessários
para a equipe assistencial dar andamento no tratamento do paciente.
Para o modelo proposto, dentre todas as informações epidemiológicas do paciente,
considera-se apenas os campos de sexo, peso e altura. Os campos de sinais vitais e resultados
de exames não são informados ao sistema de forma parametrizada inviabilizando o seu uso,
ou seja, são informações sem um padrão definido. A informação sobre evolução é preenchido
quase que diariamente, sendo um texto livre. O uso destas informações adicionais fica como
sugestão para trabalhos futuros.
Em busca de um cruzamento com o máximo de eficiência, seria necessário obter-se
informações como histórico de doenças na família, alergias e hábitos do paciente (prática de
esportes, fumante, etc). O sistema atual possui suporte para adquirir essas informações, mas
apenas poucos usuários as complementam. Por isso, essas informações não serão
consideradas no momento de verificar o grau de similaridade entre os pacientes.
No momento que o tratamento é concluído, o paciente recebe a alta da unidade, se
estiver em um centro de tratamento intensivo (CTI), ou alta hospitalar. Para o modelo
proposto consideram-se apenas como casos anteriores, os pacientes que obtiveram alta
hospitalar. Assim, consideram-se apenas pacientes com alta, devido ao desfecho de sua
internação estar concluído com o correto CID da doença informado no momento da alta.
2.8 Alta Hospitalar
O processo de alta é um processo administrativo completamente dependente do
processo clínico da instituição, pois necessita de informações fornecidas pelo médico para a
sua completa realização.
No momento que o médico pretende efetuar alta para um determinado paciente, é
necessário que o mesmo preencha uma série de informações no sumário de alta. De acordo
com o Brasil (2010), os motivos de saída do paciente da instituição são diversos de acordo
com o Anexo C. O sistema principal da instituição estudada resumiu as informações a serem
utilizadas no momento da alta, deixando apenas as obrigatórias e mais utilizadas conforme o
Quadro 5.
32
Campo Valores possíveis
Tipo de Alta Óbito – Alta Hospitalar –Transferência Hospitalar
Condição de alta Curado – Melhorado – Inalterado - Óbito
Data Data em formato dia, mês e ano
CID principal De acordo com a codificação CID
CID secundários De acordo com a codificação CID
Resumo clínico Texto em formato livre
Quadro 5 - Informações preenchidas durante o processo de alta hospitalar
Fonte: Autoria própria, 2010.
A informação chave para a aquisição e posterior criação da base de conhecimento será o
CID de alta do paciente. Essa informação foi definida após diversos exames e avaliação de
diversos profissionais, diferentemente do CID da internação, uma vez que, o paciente pode ter
sido internado sem ter feito todos os exames necessários para o correto diagnóstico.
Para a pesquisa consideram-se todos os pacientes que obtiveram alta hospitalar
independente da condição de alta. Dessa forma, até mesmo pacientes com óbito são
considerados. Esses pacientes podem ter um tratamento exemplar, mas por outras
complicações podem ter ido a óbito.
Em pesquisa na literatura buscou-se sistemas que utilizem as mesmas informações ou
que estejam situados no mesmo contexto do trabalho proposto. Assim, na próxima seção
apresentam-se os trabalhos similares ou relacionados.
2.9 Trabalhos Relacionados
Devido à grande necessidade por sistemas de informação na área da saúde, a cada dia
cresce o número e a diversidade de sistemas em todas as áreas das ciências médicas. Entre os
que mais crescem estão os sistemas que utilizam mecanismos e técnicas de IA para prover
resultados e apoio à decisão. Como sistemas similares encontraram-se dois principais
sistemas: DietSysNet (TELES et al., 2006) e o IACVIRTUAL(SILVA et al., 2006).
33
2.10 Sistema DietSysNet
O sistema tem como objetivo apoiar nutricionistas no momento da prescrição de uma
dieta, através da consulta de prescrições nutricionais anteriores. Esse sistema utiliza técnicas
de RBC para comparação de similaridade entre os casos registrados em sua base de
informações.
As principais informações sobre o paciente são coletadas durante uma entrevista
considerando alguns de seus principais indicadores: patologias, alergias, IMC, colesterol,
glicose, etc. Com posse dessas informações de casos anteriores, o sistema testa a similaridade
entre os casos utilizando a fórmula do vizinho mais próximo.
O sistema dispõe em sua base de casos com atributos numéricos, booleanos e texto. Os
numéricos e os booleanos são comparados considerando a distância entre os mesmos. Para
atributos tipo texto é definida a distância considerando como uma escala binária.
Os resultados da recuperação são apresentados em forma de ranking com a
possibilidade de utilização de limiares de similaridade que possibilita a exclusão de
informações com pouca relevância. O processo da recuperação é dividido em dois níveis:
• Pré-seleção: compara somente atributos simples definidos pelo especialista
previamente;
• Ordenação: nessa fase é utilizado o mecanismo de avaliação de similaridade e
construção do ranking.
O sistema possui um módulo especialista, onde novos casos podem ser incluídos
manualmente pelo especialista na forma de modelo de prescrição. Ainda pelo especialista é
possível, configurar o peso que cada atributo tem na comparação do grau de similaridade,
sendo mostrado quando o sistema apresenta os casos similares.
Como resultado, o sistema disponibiliza uma tela apresentando os casos similares com
seu respectivo grau de similaridade obtido para cada atributo em relação ao caso atual. A
Figura 4 apresenta a tela que apresenta os resultados de similaridade de cada atributo.
34
Figura 4 - Resultado da recuperação de casos
Fonte: Teles et al., 2006.
2.11 Projeto IACVIRTUAL
O sistema tem como objetivo simular um consultório virtual que auxilie especialistas
em apoio a decisão em tratamento, diagnóstico médico e para educação apresentando modelos
de decisão (SILVA et al., 2006)
Como proposta de funcionamento, o sistema utiliza o algoritmo do vizinho mais
próximo, sendo que a função de similaridade escolhida depende do tipo do atributo em
análise. No projeto são incluídas as seguintes funções de similaridade: Função Escada,
Função Linear, Função Igual, Função Máxima, Função Intersecção e Função Contraste.
O sistema utiliza princípios básicos de um sistema RBC, com suas respectivas etapas de
aquisição, indexação, armazenamento, recuperação, adaptação e retenção. Sua estrutura é
representada de acordo com a Figura 5:
35
Figura 5 – Estrutura do sistema IAC Virtual
Fonte: Silva et al., 2006.
O presente trabalho tem como diferencial aos trabalhos relacionados, a proposta do
tratamento diretamente, ou seja, muitos sistemas apresentam os casos similares para o usuário
especialista decidir qual dos casos será utilizado para a resolução do caso atual. Dessa forma,
o trabalho proposto busca os casos similares e faz uma união entre os tratamentos dos
respectivos casos, tendo como resultado um tratamento único considerando-se os itens com
maior relevância entre os tratamentos pesquisados.
2.12 Considerações sobre o capítulo
Para o estudo das técnicas citadas nesse capítulo foi considerado os requisitos que a
solução proposta deverá atender. Em particular, a combinação entre os Sistemas RBC e
Sistemas Especialistas atendem os requisitos para a construção da proposta.
No capítulo também foi visto os conceitos de Data Mining, pois esta técnica será
utilizada para extração das informações do sistema principal devido ao grande volume de
informações existentes.
Nesse capitulo também foi revisado alguns conceitos sobre a área clínica na qual o
modelo é aplicado, demonstrando um pouco da rotina médica durante a internação de um
paciente, com suas respectivas informações e o momento correspondente de coleta dessas
informações.
Após apresentar um modelo simplificado de uma internação hospitalar e as técnicas a
serem utilizadas, foram apresentados alguns trabalhos relacionados. Os trabalhos apresentados
36
utilizam algumas das técnicas da solução proposta, porém cada um deles tem sua forma
particular de avaliação da similaridade. Nenhum dos sistemas pesquisados tem o mesmo fim
da solução proposta. O que mais se aproxima é o sistema DietSysNet que propõe uma dieta
considerando algumas informações da ananmnese do paciente construída através de entrevista
prévia.
Após a revisão bibliográfica de técnicas da IA, revisão dos conceitos da área da saúde e
os respectivos trabalhos relacionados, no próximo capítulo será apresentado o modelo
proposto para predição de prescrição eletrônica.
37
3 MODELO PROPOSTO
O objetivo desta monografia é analisar a viabilidade de um modelo para possível
predição de prescrição eletrônica. Esse modelo considera os casos anteriores que ocorreram
na instituição e apresenta uma prescrição como proposta de tratamento para o novo paciente
internado.
Esse modelo foi avaliado verificando-se qual o índice de similaridade entre o tratamento
proposto e o tratamento feito pelo profissional médico para o mesmo caso. Com esse índice, é
possível verificar a viabilidade de utilizar-se o modelo proposto como um sistema de apoio à
prescrição médica.
Para a construção desse modelo, utilizam-se técnicas da IA como sistemas RBC e
Sistemas Especialistas. A utilização de suas técnicas e ferramentas são descritas nas seções
subsequentes.
3.1 Metodologia
Esse modelo foi construído através do conhecimento prévio das etapas que compõe a
internação de um paciente. Esse trabalho está inserido em um contexto real, utilizando-se a
base de informações da Irmandade Santa Casa de Misericórdia de Porto Alegre (ISCMPA).
As informações utilizadas para esse estudo foram previamente autorizadas pelo Comitê
de Ética e Pesquisa (CEP) da ISCMPA conforme documentação apresentada no Anexo A.
Essa aprovação foi possível através da submissão de um projeto de pesquisa.
Seguindo as considerações éticas, a pesquisa não irá apresentar nenhuma informação
que permita a identificação do paciente, sendo que apenas será apresentado o resultado final
do tratamento proposto, ou seja, a lista de itens que compõem o tratamento dos casos
anteriores similares ao novo caso. O resultado final do tratamento proposto é possível através
dos processos apresentados a seguir, utilizando-se as técnicas de IA.
3.2 Solução Proposta
Com o estudo de técnicas e ferramentas de sistemas RBC em conjunto com o
conhecimento adquirido com a literatura e experiência prévia, utiliza-se como estudo de caso
a proposta de uma prescrição médica adequada para o tratamento de um paciente,
38
considerando seu estado clínico e suas características epidemiológicas. Como requisito para o
início da avaliação das técnicas é necessário a aquisição do conhecimento para posterior
construção da base de casos.
Portanto, nesse capítulo serão apresentados os procedimentos e etapas adotadas na
construção da avaliação do sistema proposto.
3.3 Aquisição de conhecimento
Diariamente diversas informações são criadas e/ou atualizadas por vários usuários
especialistas durante os processos que compõe a internação do paciente. Assim, para obter-se
as informações necessárias para avaliar o grau de similaridade entre os casos, foi necessário a
análise de quais informações seriam importantes na comparação.
Essas informações foram classificadas de acordo com a literatura e com o
conhecimento adquirido durante o desenvolvimento do sistema principal em uso pela
instituição. Através dessa pesquisa e do conhecimento prévio foi possível estruturar e
descrever as principais informações que serão utilizadas para a montagem do modelo
proposto.
3.3.1 Informações Utilizadas
Para a aquisição do conhecimento utiliza-se informações das três etapas que compõe a
internação do paciente: admissão, tratamento e alta. Durante a admissão do paciente utiliza-se
as seguintes informações:
• Sexo;
• Data de nascimento;
• Peso;
• Altura.
Com as informações epidemiológicas dos pacientes necessita-se também, das
informações referentes ao tratamento que o paciente foi submetido, ou seja, das informações
geradas durante a criação e/ou alteração da prescrição médica:
• Item prescrito
• Dose: valor numérico correspondente a quantidade de medicação;
• Dose Unidade: unidade de dosagem, por exemplo: miligramas, comprimidos, etc.;
39
• Via: Via de administração da medicação, por exemplo: oral, endovenosa, etc.;
• Frequência: frequência da medicação, por exemplo: 2 vezes ao dia, de 2 em 2 horas,
etc.
Finalizando a fase de aquisição de conhecimento, necessita-se da informação mais
importante para a indexação dos casos, o CID da alta. Essa informação fica disponível após o
médico prescrever a alta do paciente. Para fins de análise de resultados, a data de alta também
será considerada para diferenciar qual o ano que o caso ocorreu. Dessa forma, as seguintes
informações serão utilizadas:
• CID da alta
• Data da alta
Após a análise de quais informações são necessárias para a avaliação da similaridade
entre os casos, inicia-se a fase de extração das informações.
3.4 Metodologia de extração de informações
Nesse modelo utiliza-se a aquisição de conhecimento de forma semi-automática, que
segundo Costa (2005), consiste na utilização de ferramentas computacionais para a construção
da base de conhecimento.
A aquisição semi-automática utiliza os conceitos de Data Mining para buscar a melhor
amostragem e a representação correta dos dados pesquisados. Considerando-se o problema de
disponibilidade do especialista, através de pesquisa na literatura e do conhecimento adquirido
durante o desenvolvimento do sistema principal, se obteve conhecimento suficiente para a
execução da fase de clusterização do Data Mining. Nessa fase classificam-se as informações
que são necessárias para a construção do modelo.
Após a fase clusterização executa-se a fase classificação, que obteve como resultando
um modelo com informações desnormalizadas, ou seja, agrupadas conforme a necessidade do
estudo proposto. Esse modelo utiliza cubos de informações que, por definição, são tabelas
desnormalizadas que possibilitam múltiplas visões de uma mesma estrutura de dados com
independência total da base de dados do sistema principal.
Para a montagem dos cubos utilizam-se classes Java denominadas Data Access Object
(DAO) que segundo Alur et al. (2003), são classes utilizadas para extrair e encapsular todos
os acessos à origem dos dados, é o responsável por gerenciar a conexão com a origem de
dados e seu respectivo armazenamento.
40
Os objetos DAO foram classificados conforme a categoria dos dados, ou seja, criou-se
objetos especialistas em buscar dados administrativos do paciente e outros responsáveis por
buscar informações do tratamento utilizado, como apresentado abaixo:
• PacienteDAO: responsável por extrair informações relacionadas com a internação, alta
e características epidemiológicas;
• TratamentoDAO: responsável por extrair informações relacionadas ao tratamento que
foi efetuado durante a internação do paciente.
Como resultado da execução dessas classes, obtém-se as informações necessárias para a
construção da base do conhecimento. Com a metodologia de extração de informações
definida, necessita-se representar as mesmas de forma correta, para iniciar-se a construção da
base de conhecimento.
3.5 Representação do conhecimento
As informações contidas em diversos processos que compõe uma internação são
utilizadas para a representação do conhecimento. Com isso, considera-se como um caso a
internação de um paciente com tratamento que lhe foi submetido contendo todo o conjunto de
prescrições, com suas respectivas medicações administradas. Procura-se utilizar as
informações que tenham um caráter obrigatório de preenchimento, garantido a integridade e a
segurança no momento de testar a similaridade entre os casos.
Para representar o conhecimento tem-se o cuidado de representá-lo de maneira eficiente
(tempo e/ou espaço) e de fácil acesso. Segundo Tonidandel (2003), o bom desempenho de um
sistema baseado em casos está fortemente ligado a como seus casos foram representados.
Neste trabalho, cada caso é representado por um objeto Java do tipo Value Object (VO)
descrito segundo Alur et al. (2003), como uma classe composta por uma estrutura simples,
somente de atributos, sendo utilizada para encapsular os dados que transitam entre as camadas
de apresentação e de negócios da aplicação.
Para representação do conhecimento criou-se um VO chamado CasoVO. Esse objeto
contém as informações referentes à internação de um paciente, possuindo informações
administrativas da internação, informações do tratamento e da alta. Os atributos que compõe o
objeto estão representados no diagrama de classes da Figura 6:
41
Figura 6 - Estrutura de classes para representação dos casos
Fonte: Autoria própria, 2010.
Cada objeto CasoVO e seus respectivos atributos serão utilizados na busca de
similaridade entre casos, exceto o atributo itensTratamento. Esse atributo é uma lista,
contendo todos os itens utilizados durante o tratamento, cada item dessa lista é representados
pelo objeto ItemPrescritoVO.
Cada objeto ItemPrescritoVO representa um item que foi prescrito durante o
tratamento do paciente. Esse item prescrito possui o identificador do item do cadastro
utilizado, ou seja, se ele for do tipo medicamento o seu atributo idItem corresponde a um
medicamento do cadastro. O atributo idItemPrescrito representa o identificador
seqüencial e único que cada item ao ser prescrito possui.
Durante a prescrição alguns tipos de itens (procedimentos, dietas), têm atributos do
ItemPrescritoVO que não fazem sentido como por exemplo, a dose. Nesse caso, esses
atributos têm seus respectivos valores igualados a zero, portanto, não interferem no momento
da recuperação dos casos.
Com as ferramentas disponíveis para a extração das informações da base principal e a
representação das mesmas definidas pode-se iniciar o processo de criação da base de
conhecimento que é descrito na próxima seção.
3.6 Base de conhecimento
Para o armazenamento dos casos utiliza-se uma base isolada do sistema principal. Dessa
forma, pode-se afirmar que não influencia no desempenho do sistema principal e garante
portabilidade das informações.
Para obter-se o máximo de independência e a possibilidade de gravar o objeto Java com
o seu estado atual, optou-se por não utilizar banco de dados relacional. Por isso, quando
42
inicia-se o sistema proposto a base de conhecimento é colocada em memória, através de
leitura de arquivos gravados em disco.
Esses arquivos são gerados através de métodos de serialização de objetos Java, onde é
possível gravar em disco uma classe com seu estado e valores de seus atributos atuais. O
problema dessa solução é o desempenho no processo de serialização devido ao grande
overhead que ocorre no processo de serializar e desserializar.
Como alternativa para melhorar o desempenho, ao inicializar o sistema, os arquivos
serializados são lidos e colocados em memória tornando-se disponível para o uso. Com testes
durante o desenvolvimento percebeu-se um elevado consumo de memória ao inicializar o
sistema.
Para minimizar este problema, alterou-se a base de conhecimento para possuir apenas
índices dos itens e das informações do paciente. Dessa forma, a lista de itens do tratamento
por exemplo, não possui o nome do medicamento, essa informação só é utilizada no momento
de mostrar a proposta de tratamento, na etapa de apresentação dos resultados. Com esse
método, houve uma redução de cerca de em média 40% do uso de memória. Esse valor foi
obtido utilizando-se o gerenciador de tarefas do sistema operacional, através de algumas
execuções do sistema proposto.
Assim, dependendo do tamanho da base de conhecimento, essa redução pode significar
a viabilidade ou não do modelo proposto.
Ainda para obter-se um bom desempenho na recuperação dos casos, além de utilizar as
informações em memória necessita-se de uma boa estratégia de indexação, tornando a base de
conhecimento de fácil navegação e com possibilidade de execução de consultas por diversos
atributos do caso.
3.7 Indexação
Para a obtenção de um desempenho favorável em um sistema baseado em casos, é
fundamental a construção de uma estrutura indexada, que atenda com precisão e velocidade as
diversas situações que o sistema será exposto (TONIDANDEL, 2003). Portanto, possuindo-se
um processo de indexação com uma modelagem eficaz, diminui-se consideravelmente a
complexidade dos algoritmos utilizados no cruzamento e recuperação dos casos. Portanto, o
formato e a prioridade das informações devem ser moldados de acordo com os requisitos que
o sistema pretende atender.
43
Nesse trabalho os casos são indexados a partir do código da doença do paciente,
portanto, cada caso tem como índice principal o Código Internacional de Doenças (CID), que
foi atribuído no processo de alta do paciente. Esse código é utilizado para agrupar os casos em
uma estrutura conhecida como HashMap. Essa estrutura é como uma tabela de duas colunas
em que na primeira coluna é um valor chave, ou seja, único e na segunda coluna um valor.
Com isso, a base de conhecimento foi estruturada utilizando-se o CID como chave e os casos
anteriores como o valor, ou seja , uma lista de CasoVO como ilustra a Figura 7.
Figura 7 – Indexação de casos pelo CID
Fonte: Autoria própria, 2010.
Observa-se que para cada CID pode-se ter vários casos distintos, ou seja, no momento
da recuperação, os casos já estarão sendo filtrados de maneira eficiente, reduzindo
consideravelmente o tempo de recuperação. Logo após recuperarem-se os casos pelo CID
informado, inicia-se o processo que leva em consideração os dados epidemiológicos dos
pacientes utilizando os critérios de similaridade definidos.
3.8 Critérios de similaridade
Em sistemas RBC diversas formas de comparação de grau de similaridade entre os
casos são utilizadas, o método utilizado varia de acordo com os requisitos de segurança e
desempenho que o sistema deve atender.
Para a definição da similaridade entre os casos, inicialmente é necessário definir o grau
de similaridade entre cada atributo que compõe um caso. No modelo proposto utiliza-se a
técnica da IA conhecida como Nearest Neighbour (vizinhos próximos).
Essa técnica necessita atribuir um "peso" para cada atributo, ou seja, existem atributos
mais importantes que outros para definir a similaridade entre dois casos. Essa definição
44
geralmente é feita em conjunto com o usuário especialista. Segundo Koslosky apud
Fernandes (2005), a similaridade entre os casos é definida para cada atributo.
Para a definição do peso dos atributos duas tabelas foram criadas: uma contendo os
pesos dos atributos relacionados com os dados epidemiológicos do paciente e outra com os
dados relacionados ao item prescrito. No Quadro 6 demonstra-se os atributos e seus
respectivos pesos utilizados na comparação de similaridade.
Atributo Peso
sexo 10
idade 5
IMC 8
Peso 5
Altura 5
Quadro 6 - Peso por atributo, definido de acordo com a informação epidemiológica do paciente
Fonte: Autoria própria, 2010
A definição dos pesos foi através de testes e de conversas com alguns usuários
especialistas. Esses valores podem variar e serem alterados a qualquer momento conforme a
necessidade.
Cada atributo possui seu tipo específico como: data, numérico, booleano e texto. Assim,
dependendo do tipo do atributo a sua comparação é diferente. Por isso, os atributos têm sua
similaridade testada através de intervalos previamente definidos de acordo com o se tipo
correspondente. O Quadro 7 demonstra os valores admitidos por intervalo para cada atributo
de um caso.
Atributo Intervalo
Data de nascimento +- 5anos
Sexo Valor exato
IMC classificação Valor exato
Peso +- 5kg
Altura +- 10 cm
Quadro 7- Intervalo de valores permitido para cada atributo
Fonte: Autoria própria, 2010
45
A comparação dos atributos como peso e altura são feitos pelo intervalo que foi
definido, mas a comparação do IMC é através da classificação e não do valor absoluto. Essa
classificação será apresentada nas seções subseqüentes.
O intervalo definido para comparação de cada atributo, pode ser alterado para mais ou
para menos. Assim, quanto menor o intervalo definido maior é a precisão dos casos
retornados. Em contrapartida, acaba reduzindo o número de casos similares.
Com a definição dos critérios de similaridade na próxima seção inicia-se a definição da
estratégia de recuperação dos casos.
3.9 Recuperação dos casos
Com a montagem da base de conhecimento indexada e a definição dos critérios de
similaridade é possível a definição da estratégia a ser utilizada para a recuperação de casos.
Esse processo tem seu início com a entrada do novo caso e seu término após a apresentação
de possíveis alternativas de resolução para o novo caso.
Para a construção desse processo, dividiu-se o mesmo em etapas distintas, cada uma
com a necessidade de dados de entrada e seu respectivo retorno que se utiliza na próxima
etapa dependente. A definição de cada etapa foi de acordo com sua respectiva
responsabilidade, sendo divididas nos seguintes itens: pesquisa CID, similaridade
epidemiológica, similaridade itens tratamento, média itens do tratamento, ranking itens,
popular itens e apresentação da proposta de tratamento. Cada um desses itens será analisado
nas próximas seções.
3.9.1 Pesquisa CID
A base de conhecimento foi construída de forma indexada para aperfeiçoar o tempo de
busca de informações e tornar a construção de algoritmos sem grande complexidade. Para a
indexação o Código Internacional de Doenças (CID) é usado como informação principal, por
isso a primeira etapa da recuperação é a pesquisa pelo CID que o paciente foi classificado
durante sua internação.
Nessa etapa recebe-se como informação de entrada o CID que o novo paciente foi
classificado. Após receber o código, o algoritmo de pesquisa acessa a estrutura de casos. Essa
pesquisa é realizada utilizando-se recursos do componente HashMap, que organiza as chaves
46
em uma estrutura hierárquica, otimizando a recuperação de algum valor que compõe a coluna
chave.
Como retorno da pesquisa se obtém a lista de casos correspondentes ao CID pesquisado.
Essa lista retornada está organizada de maneira cronológica. Essa ordem é importante para
que a busca de similaridade epidemiológica tenha seu início com os casos mais atuais. Quanto
mais atualizado é o caso, maiores são as chances de sua eficácia devido ao avanço constante
das medicações e tratamentos utilizados. Logo após, com a lista de casos correspondentes a
pesquisa realizada pode-se avançar para a próxima etapa chamada de similaridade
epidemiológica.
3.9.2 Similaridade epidemiológica
Essa etapa pesquisa e seleciona os casos de paciente com níveis de similaridade
epidemiológica aceitável, ou seja, dentro da definição de intervalo aceitável por cada atributo
dos casos. Para início dessa etapa, necessita-se possuir duas informações: dados
epidemiológicos do novo caso e os casos recuperados com o mesmo CID. Com essas
informações de entrada os casos anteriores são confrontados em busca de alguma similaridade
entre as informações.
Como citado na seção anterior de Critérios de Similaridade, utiliza-se o algoritmo do
vizinho mais próximo, comparando cada atributo do novo caso com o anterior. Nessa etapa a
lista de casos com mesmo CID é percorrida e a cada interação o CasoVO é comparado com o
paciente atual considerando-se os seguintes atributos:
• Sexo
• Idade
• Peso
• Altura
• IMC classificação
Essa comparação é realizada, utilizando-se o peso de cada atributo juntamente com o
seu intervalo de valores de similaridade. Desta forma, considerando-se o intervalo de
comparação previamente definido para cada atributo, garante maior qualidade e segurança na
comparação evitando similaridades inexistentes entre casos. O Quadro 8 apresenta a
comparação de atributos de dois casos. A coluna Caso Atual indica, o caso que deve ser
resolvido utilizando-se a experiência contida na base da conhecimento, e a coluna caso
47
anterior representa o caso que está sendo analisado como possível solução para o problema
atual.
Atributo Caso
Atual
Caso
anterior
Indicador
tolerância
Faixa tolerada Resultado
Idade 40 46 5 anos +- 5 anos Não
aprovado
Peso 80 85 5 kg +-5kg Avaliado
com IMC
Altura 170cm 175cm 10cm +-10cm Avaliado
com IMC
IMC 27,68 27.75 Mesma
classificação
Nenhuma faixa OK
Sexo 1 1 Valor exato Nenhuma faixa OK
Quadro 8- Exemplo de comparação entre os atributos
Fonte: Autoria própria, 2010
Nessa tabela, dois casos são confrontados e validados atributo por atributo. Nessa
comparação, utiliza-se o valor de intervalo definido previamente para verificar se o atributo
do caso anterior é compatível com o atual. No caso acima se observa que o atributo idade está
um ano além do permitido pelo intervalo, por isso esse caso não será considerado na próxima
fase da busca da similaridade que utiliza o cálculo da distância entre os atributos.
Ainda no Quadro 8, verifica-se que a comparação entre peso e altura é feita utilizando-
se o cálculo de Índice de Massa Corpórea (IMC). O IMC, também é conhecido como índice
de Quételet, em homenagem ao seu criador Adolphe Quételet é utilizado para a avaliação
nutricional das populações e tem seu resultado obtido através da divisão da massa corporal em
quilogramas pela estatura em metros elevada ao quadrado (CERVI et al., 2005).
IMC = (Peso / Altura²)
Ainda de acordo com Jackson apud Cervi (2005), para um mesmo IMC mulheres
possuíam 10,4% a mais de gordura corpórea que os homens. Por isso, a relação entre gordura
corpórea e IMC deve-se considerar sexo e idade. Sendo assim, o modelo proposto considera
essas duas métricas em seu desenvolvimento. Quando se utiliza o calculo do IMC na busca da
similaridade entre os casos, considera-se a classificação que o novo caso obteve com o
48
cálculo, assim como o caso em comparação na base de conhecimento. O Quadro 9 apresenta
as classificações de acordo com o IMC.
Classificação Principais Faixas Abaixo do peso <18.50 Magreza severa <16.00 Magreza moderada 16.00 - 16.99 Magreza branda 17.00 - 18.49 Peso Normal 18.50 - 24.99
Pré-obesidade 25.00 - 29.99
Obeso ≥30.00 Obesidade Grau I 30.00 - 34-99
Obesidade Grau II 35.00 - 39.99
Obesidade Grau III ou mórbida ≥40.00 Quadro 9 - Classificação IMC Fonte: Traduzido de WHO, 2010.
Durante o processo de similaridade epidemiológia o cálculo de IMC é realizado e
compara-se o resultado do caso atual com o anterior de acordo com a classificação da tabela
acima. O Quadro 10 apresenta um exemplo de comparação utilizando-se o IMC.
Atributos Novo Caso Caso anterior Peso 80 80 Altura 160 170 IMC 31.24Kg/m² 27,68 Kg/m² Classificação IMC Obesidade Grau I Pré-obesidade
Quadro 10- Comparação entre casos destacando o IMC
Fonte: Autoria própria, 2010
No exemplo acima ambos os casos são incompatíveis de acordo com a classificação que
obtiveram de seu respectivo IMC. Assim, esse caso anterior foi descartado da comparação de
similaridade epidemiológica.
Todos os casos que passam pela etapa de avaliação do intervalo e da classificação do
IMC tem sua distância entre os atributos calculada, resultando a distância entre os casos. Para
cada atributo se obtêm o valor da distância utilizando-se a Equação 1:
1) d = √(p * | i |)
49
A variável p representa o valor definido para o peso de cada atributo. Esse peso é
multiplicado pela diferença absoluta entre o valor do atributo do caso atual com o anterior
representado pela variável i. Através da iteração por todos os atributos do caso anterior,
obtém-se a distância total conforme a Equação 2:
2) dt = distância idade + distância de peso +distância da altura + distância sexo
Com o resultado da distância total, compara-se o resultado com o chamado indicador de
similaridade. Esse indicador é um valor numérico que é definido de acordo com o grau de
precisão que se necessita dos resultados, ou seja, quanto menor esse valor, menor deve ser a
diferença entre os casos. O indicador é integrante da Equação 3 para o caso anterior ser
considerado similar com o da base atual:
3) r = d – S
Onde d é o total das distâncias dos atributos dos casos em comparação. A variável S
representa o indicador de similaridade. E o resultado esperado para um caso ser similar é um
valor igual ou menor que zero. Após a identificação da similaridade epidemiológica entre os
casos, é possível avançar para a próxima fase responsável pela análise do tratamento
denominada Similaridade do Tratamento.
3.9.3 Similaridade do tratamento
A busca pela similaridade do tratamento é realizada de forma semelhante da
similaridade dos atributos epidemiológicos. Inicia-se tendo como entrada os casos similares
obtidos na etapa anterior. Com isso, é iniciada uma iteração percorrendo a lista de casos
recuperando-se de cada objeto CasoVO a lista de itens prescritos correspondentes. A lista
retornada é composta por objetos ItemPrescritoVO, que possuem todas as informações
de cada item prescrito durante o tratamento. O objeto ItemPrescritoVO assim como o
objeto CasoVO tem seu conjunto de atributos como demonstrado:
• idItemPrescrito: identificador seqüencial que cada item prescrito do sistema principal
possui;
• dose: dose informada pelo profissional de saúde durante a criação da prescrição
eletrônica;
50
• idUnidadeDose: identificador correspondente à unidade de dosagem como, por
exemplo, miligramas, mililitros, comprimidos, etc;
• valorFrequencia: valor numérico informado da frequência como, por exemplo, 2, 4,
etc;
• idFrequencia: identificador do tipo da frequência como, por exemplo, dias, horas,
vezes ao dia;
• idVia: identificador correspondente a via utilizada para administração do medicamento
ou para a execução de procedimentos como, por exemplo, oral, endovenosa.
Diferente da busca da similaridade epidemiológica entre os casos nessa etapa, os casos
selecionados são comparados entre si, em busca de itens similares em seus tratamentos.
Durante a comparação, o caso selecionado anteriormente tem seus itens do tratamento
comparado à lista de itens ranking.
Essa lista é composta pelos itens já comparados, ou seja, cada item prescrito de um
tratamento é comparado a todos os itens que compõe essa lista, sendo que ela é gerada de
maneira incremental sendo adicionado à ela sempre aquele item que foi comparado mas não
foi encontrado na itens ranking.
A lista itens ranking é composta por classes denominadas RankingVO. Esses classes
possuem como atributos: item prescrito e uma pontuação e são representados de acordo com
a Figura 8.
Figura 8 – Diagrama do RankingVO
Fonte: Autoria própria, 2010
Cada vez que o item de tratamento de um caso seja similar com um item da lista, o item
da lista (RankingVO) tem seu atributo pontuação incrementado.
Ainda nessa etapa, aproveita-se que todos os casos pré-selecionados têm seus
tratamentos pesquisados e incrementa-se uma variável que representa o total de itens
51
prescritos somando-se todos os casos. Logo após, esse total é divido gerando-se uma média
denominado Número Médio de Itens por Tratamento(NMIT).
Portanto como resultado dessa etapa, obtém-se a lista de itens prescrito e a sua
respectiva pontuação representados pelo objeto RankingVO. Ainda nessa etapa, obtém-se o
número médio de itens prescritos por tratamento. Ambos os resultados são utilizados como
entrada da próxima etapa chamada Construção do Ranking e Eliminação de itens.
3.9.4 Construção do ranking e eliminação de itens
Após a execução das etapas de comparação e busca da similaridade entre pacientes e
tratamentos, possui-se como resultado uma lista de itens prescritos e um indicador de média
de itens prescritos por tratamento, aproximando-se a etapa final de demonstração dos
resultados.
A lista de itens prescritos obtida na etapa anterior contêm todos os itens prescritos de
todos os casos similares, portanto é necessário filtrar para que seja retornado somente os itens
que possuem índice de uso facilitando a apresentação de resultados.
Por isso, essa etapa tem como responsabilidade ordenar os itens mais utilizados de
forma decrescente, ou seja, os itens com menor pontuação ficam ao final da lista. Dessa
forma, após a sua ordenação todos os itens da lista ordenada que tenham sua posição maior
que o NMIT, por exemplo se esse valor fosse iguala três alguns itens seriam descartados
como demonstra o Quadro 11.
Posição Lista Pontuação Pontuação Utilizado
0 Item prescrito 1 16 OK
1 Item prescrito 2 10 OK
2 Item prescrito 3 5 OK
3 Item prescrito 4 1 Removido
4 Item prescrito 5 1 Removido
Quadro 11 – Exemplo de número médio de itens
Fonte: Autoria própria, 2010
52
No exemplo do Quadro 11, o NMIT tem o valor três, portanto todos os itens com índice
igual a três ou maiores são descartados restando apenas os itens que obtiveram maior
pontuação. Com isso, após a execução dessa etapa tem-se como resultado uma lista de itens
ordenada a e otimizada descartando itens com baixa relevância, evitando apresentar itens que
foram usados apenas em casos específicos.
Até essa etapa apenas se trabalhou com objetos contendo apenas os índices das
informações. Por isso, a fim de se obter apenas a lista com os itens que serão apresentados
para o usuário necessita-se popular suas informações como, por exemplo, trocar o id do item
prescrito pela sua descrição. Assim, inicia-se a etapa de popular os resultados.
3.9.5 Popular resultado
Após finalizar a etapa de recuperação de casos, possuiu-se uma lista somente com os
itens que devem ser apresentados como predição da prescrição do paciente. Com essa lista
como entrada, inicia-se o processo de popular as informações de acordo com as informações
dos cadastros.
Essa etapa busca as informações necessárias na base de conhecimento nas chamadas
tabelas auxiliares. Essas tabelas possuem o identificador e a descrição da informação e são
consideradas um espelho do cadastro do sistema principal. Com a lista de itens filtrada e
populada, o resultado já tem condições de ser apresentado para o usuário final por isso, inicia-
se o processo de apresentação de resultados
3.9.6 Apresentação da predição de prescrição
Após as etapas de construção, busca e popular os resultados, enfim chega a etapa de
apresentação dos resultados, que consiste em mostrar o resultado da predição da prescrição
em formato tabular para o usuário selecionar os itens que deseja utilizar na montagem de sua
prescrição.
Os itens são apresentados com sua descrição e sua respectiva pontuação obtida na etapa
de similaridade de itens. Essa pontuação é necessária em decorrência da lista final possuir, por
exemplo, duas medicações com algumas pequenas variações de dosagem. Nesse caso o
sistema apresenta as duas soluções na lista de itens da proposta de tratamento, para que o
53
usuário final decida qual item deve ser utilizado.A Figura 9 apresenta um breve resumo de
todas etapas executadas na execução do modelo proposto.
Figura 9 – Indexação de casos pelo CID
Fonte: Autoria própria, 2010.
Com a recuperação dos casos, teve-se até o momento a criação, indexação e
recuperação da base de conhecimento. Por isso, necessita-se buscar ainda qual o percentual de
efetividade e eficácia na predição da prescrição. As métricas para a avaliação do resultado
final são subjetivas, considerando-se que a medicina não é uma ciência exata e ainda mais o
tratamento de uma doença na qual, podem ocorrer situações não previstas durante o
tratamento. Por isso, a avaliação do estudo em questão precisa de métricas e amostras
consistentes, como demonstra-se no capítulo avaliação dos resultados.
54
4 AVALIAÇÃO DOS RESULTADOS
Todos os trabalhos relacionados apresentados demonstram como resultado final os
casos similares encontrados. Dessa forma, o usuário especialista precisa selecionar o caso
mais adequado para utilizá-lo. Entretanto, o sistema proposto retorna como resultado, uma
lista com combinação de todos os itens dos tratamentos dos casos retornados como similares.
Assim, para o usuário apresenta-se uma lista com os itens propostos pelo sistema. A Figura
10 apresenta a interface de proposta de prescrição.
Figura 10 – Tela de proposta de prescrição
Fonte: Autoria própria, 2010.
Como apresentado na Figura 10, os itens do tratamento proposto possuem à sua direita o
indicador de relevância, ou seja, quantas vezes apareceram nos tratamentos considerados
similares pelo sistema. O número de vezes que o item aparece no tratamento é correspondente
ao dia de internação que o paciente está. Assim, a proposta é montada considerando-se o dia
de internação do caso atual, devido as prescrições variarem de acordo com o dia do
tratamento.
Durante a implementação, utilizou-se casos criados manualmente para verificar o
funcionamento básico do sistema e auxiliar na construção do algoritmo de recuperação. Com
esses testes, verificou-se que seria inviável avaliar o real comportamento do sistema. Dessa
forma, verificou-se a necessidade do uso de casos reais para sua avaliação.
Excluído:
Excluído:
55
Como o sistema retorna apenas a lista de itens do tratamento, a avaliação quanto a sua
real efetividade fica mais difícil, devido à combinação dos resultados das diversas etapas que
são executadas desde a busca dos casos pelo CID até a sua apresentação na tela. Por isso, a
sua avaliação deveria ser feita por um usuário especialista no momento de criar uma nova
prescrição para um paciente. Como o problema de falta de disponibilidade do usuário
especialista médico é recorrente na maioria dos Sistemas Especialistas, optou-se por validar
os resultados utilizando-se uma amostragem específica da própria base de conhecimento.
4.1 Montagem da Avaliação
Como o principal objetivo desse trabalho é avaliar a combinação de técnicas da IA para
construção de uma proposta de prescrição, necessita-se avaliar a real efetividade da proposta
de prescrição construída pelo sistema. Para verificar-se o quanto que a proposta do sistema é
efetiva, necessita-se obter o grau de similaridade entre a proposta de prescrição e uma
prescrição real construída pelo usuário especialista. O grau de similaridade é um percentual
que varia de acordo com o CID estudado sendo que, quanto mais itens em comum entre a
prescrição proposta e a real, mais próximo dos 100% de semelhança entre as prescrições.
Portanto, inicialmente, necessita-se escolher o método de comparação para confrontar a
prescrição proposta pelo sistema com criada pelo usuário especialista.
4.1.1 Método de comparação
O modelo proposto foi avaliado utilizando-se uma amostra padrão extraída da base de
conhecimento. Essa amostra pode ser comparada a prescrição proposta pelo sistema de duas
formas:
• Comparação com a prescrição “ideal”: montar um modelo de prescrição utilizando-se
os algoritmos do sistema com os dados da amostra selecionada. Logo após, compara-
se esse modelo “ideal” com a prescrição proposta pelo sistema;
• Comparação direta: compara-se a prescrição proposta pelo sistema com as prescrições
de casos similares.
Utilizou-se como método de avaliação: a comparação direta. Utiliza-se essa
comparação, porque a mesma não utiliza nenhuma ferramenta desenvolvida para o modelo
proposto. Assim, a avaliação dos resultados fica isenta de qualquer inconsistência que pode
ser apresentada pela metodologia proposta.
Excluído:
56
4.1.2 Critérios para a amostragem utilizada
A base de conhecimento foi construída utilizando-se casos com CID mais comuns
atendidos pelo ISCMPA. Os casos considerados para a montagem da base de conhecimento
pertencem ao período de janeiro de 2004 até abril de 2010. Esse período selecionado devido a
cada dia os tratamentos serem aperfeiçoados tornando, dessa forma, obsoleto tratamentos
mais antigos.
Para serem incorporados a base de conhecimento, necessita-se que os mesmos atendam
a três critérios.
Critério 1: todas as informações obrigatórias (peso, altura, sexo e data de nascimento) devem
estar preenchidas;
As informações obrigatórias para o modelo proposto são de vital importância no
processo de comparação da similaridade. Por isso, criaram-se alguns filtros nas consultas
utilizadas durante a extração das informações da base do sistema principal. Através desses
filtros, diversos casos não podem ser considerados para a construção da base de
conhecimento, diminuindo assim o número total como é apresentado no Quadro 12:
CID Total de Casos Casos Completos
N18.- Insuficiência renal crônica 2847 406
I50-Insuficiêcia Cardiaca 1848 276
J45.9-Asma não especificada 2727 263
J18.0 - Broncopneumonia não especificada 4786 93
Quadro 12- Total de casos
Fonte: Autoria própria, 2010
Critério 2 : utilização somente de informações consistentes. Durante a etapa de testes
preliminares, encontrou-se algumas inconsistências nas informações, tais como:
Data de nascimento: ano da nascimento superior a data atual;
Sexo: informação como indeterminado;
Peso: com valor igual a zero ou negativo;
Altura: com valor igual a zero ou negativo.
Estas informações são de vital importância no processo de comparação da similaridade.
Dessa forma, também verificou-se a necessidade de criação de filtros para tratar esses tipos de
57
inconsistências. Assim, o número de casos da base de conhecimento sofreu algumas
alterações como apresentado no Quadro 13.
CID Casos antes dos
filtros
Casos após a
filtragem
Percentual de
redução
N18.- Insuficiência renal crônica 406 283 32,01%
I50-Insuficiêcia Cardiaca 276 222 19,56%
J45.9-Asma não especificada 263 160 39,16%
J18.0- Broncopneumonia não
especificada
93 64 31,18%
1038 729 29%
Quadro 13 – Casos com filtros
Fonte: Autoria própria, 2010
De acordo com o Quadro 13, verifica-se uma redução significante do número total de
casos para cada CID que conseqüentemente, como em qualquer sistema RBC, terá suas
conseqüências durante o processo de recuperação, diminuindo o número de casos que o
sistema dispõe para montar o seu aprendizado. A maioria das reduções foi por inconsistências
referentes a data de nascimento ser maior que a data atual e informações de peso ter o valor
igual a zero.
Critério 3 : Alguma padronização no tratamento, ou seja, CID referentes a doenças com
tratamento relativamente padronizado.
A avaliação eficaz dos resultados depende de alguma padronização nos tratamentos referentes
aos CID selecionados. Não seria possível avaliar o modelo proposto possuindo-se na base de
conhecimento tratamentos para pacientes similares com quase nenhuma semelhança. Isso
geralmente ocorre com doenças novas ou com pouca ocorrência. A relação de CID com
alguma padronização no tratamento foi obtida através de conhecimento prévio adquirido no
desenvolvimento do sistema em uso pela ISCMPA.
4.1.3 Períodos de amostragem
Para avaliar a solução proposta dividiu-se a base de conhecimento em período de
aprendizagem e período de amostragem de avaliação, como é demonstrado no Quadro 14.
58
CID 2004 2005 2006 2007 2008 2009 2010
I50 Período de aprendizagem Novos Casos
J45.9 Período de aprendizagem Novos Casos
N18 Período de aprendizagem Novos Casos
J18 Período de aprendizagem Novos Casos
Quadro 14 – Períodos utilizados
Fonte: Autoria própria, 2010.
De acordo com o Quadro 14, o período utilizado para aprendizagem e a montagem da
proposta de prescrição ocorre de 2004 até dezembro de 2008. Assim, o período utilizado pela
a amostra de avaliação é composto pelo ano de 2009 e 2010. Com a definição desses períodos
de amostras é possível iniciar-se o processo de avaliação.
4.2 Processo de Avaliação
O processo de avaliação tem seu inicio utilizando-se os casos classificados por
amostragem de aprendizagem e de análise ou novos casos. Durante a execução desse processo
observou-se algumas situações inconsistentes dos casos utilizados. Dessa forma, foi preciso
uma análise para selecionar os casos com condições de serem analisados. As próximas seções
apresentam em detalhes, os critérios utilizados para seleção dos novos casos para a avaliação
do sistema proposto.
4.2.1 Análise e seleção de novos casos para avaliação
Como visto na seção de critérios para montagem da amostragem, alguns filtros foram
executados durante o processo de construção da base de conhecimento para garantir a
integridade das informações. Dessa forma, obtém como resultado uma base consistente mas
com menor quantidade de casos. Por isso, necessita-se selecionar quais os casos utilizados
para comparação, dando preferência aos que possuem maior quantidade similares na base de
conhecimento.
59
A base de conhecimento possui um total de 729 casos distintos, divididos em quatro
tipos de CID. Para fins de melhor apresentação, dividiu-se em três tabelas, classificando-os de
acordo com suas respectivas características.
Idade I50 J45.9 N18 J18
Masc. Fem. Masc. Fem. Masc. Fem. Masc. Fem.
0 - 9 1 3 68 44 11 15 4 2
10-19 0 1 10 20 32 17 0 1
20-39 1 4 1 0 32 30 1 1
40-59 18 10 0 3 42 27 4 2
60-79 55 35 0 8 25 20 14 9
>= 80 28 43 1 1 6 5 5 9
Total 103 96 80 76 148 114 28 24
Tabela 1 – CID por altura
Fonte: Autoria própria, 2010.
Peso I50 J45.9 N18 J18
Masc. Fem. Masc. Fem. Masc. Fem. Masc. Fem.
0-19 1 2 66 40 24 21 4 3
20-39 0 0 10 12 20 20 1 2
40-59 10 33 1 15 29 33 7 11
60-79 45 38 3 5 52 32 11 6
80-99 41 17 0 3 20 7 4 1
>= 100 6 6 0 1 3 1 1 1
Total 103 96 80 76 148 114 28 24
Tabela 2 – CID por peso
Fonte: Autoria própria, 2010.
60
Altura I50 J45.9 N18 J18
Masc. Fem. Masc. Fem. Masc. Fem. Masc. Fem.
<= 99 1 3 50 21 15 14 3 2
100 – 149 0 6 26 34 37 34 1 2
150-169 43 81 4 21 46 63 11 19
170-189 59 6 0 0 50 3 13 1
> 190 0 0 0 0 0 0 0 0
Total 103 96 80 76 148 114 28 24
Tabela 3 – CID por altura
Fonte: Autoria própria, 2010.
De acordo com as tabelas 1,2 e 3 verifica-se que dependendo do CID ocorre incidência
maior em determinadas faixas de valores dos atributos que compõe o caso. Por exemplo, o
CID I50 ocorre com maior incidência em pacientes do sexo masculino com idade entre 60 e
79 anos com 65 casos (valor entre parênteses). Assim como, o CID J45. 9 ocorre mais em
pacientes com idade de 0 a 9 anos.
Através dessas conclusões, selecionou-se as características com maior incidência de
pacientes, considerando-se o CID correspondente. Dessa forma, consideram-se essas
características para selecionar os casos de 2009-2010 como novos casos para a análise do
sistema. A Tabela 4 demonstra as características com maior incidência.
I50 J45.9 N18 J18
Masc. Fem. Masc. Fem. Masc. Fem. Masc. Fem.
Idade 60-79(55) >80(43) 0-9(68) 0-9(44) 40-
59(40)
20-39(30) 60-79(14) 60-79(9)
Peso 60-79(45) 60-79(38) 0-19(66) 0-19(40) 60-
79(52)
40-59(33) 60-79(11) 40-59(11)
Altura 170-
189(59)
150-
169(81)
<=99(50) <=99(21) 170-
189(50)
150-
169(63)
170-
189(13)
150-
169(19)
Tabela 4 – Características com maior incidência
Fonte: Autoria própria, 2010.
Assim, analisando-se a Tabela 4, seleciona-se alguns casos de 2009-2010 que possuem
características com maior incidência, de acordo com o respectivo CID. Essa análise resultou
em um grupo de casos que será utilizado como novo caso para o sistema propor uma
61
prescrição. A montagem dessa lista, teve como premissa utilizar para cada CID dois casos, um
do sexo masculino e outro feminino. Dessa forma, avalia-se um total de oito casos, ou seja,
gera-se oito propostas de prescrição.
Com o apoio das informações da Tabela 4, foi possível mapear o perfil epidemiológico
necessário para o caso a ser utilizado de 2009-2010. Após execução de algumas consultas à
base de conhecimento, considerando-se o CID e as faixas de valores dos atributos da Tabela
4, obteve-se uma lista como os possíveis candidatos para utilização na avaliação. Esses
resultados foram dividido pelo seu CID correspondente de acordo com a Tabela 5.
Tabela 5 – Candidatos a avaliação
Fonte: Autoria própria, 2010.
De acordo com a Tabela 5, utiliza-se os casos listados para executar o sistema e
verificar qual a proposta de prescrição resultante. Como demonstrado na Tabela 5 o CID J18
não apresentou casos para serem testados do sexo feminino, ou seja, na pesquisa prévia
CID Sexo Idade Peso(kg) Altura (cm)
I50
Masc. 66 72 165
Masc. 61 62 166
Fem. 84 70 172
Fem. 82 70 165
J45.9
Masc. 6 15 92
Masc. 5 11 90
Fem. 4 17 98
Fem. 2 10 85
N18
Masc. 42 61 172
Fem 37 57 157
J18
Masc. 71 68 171
62
realizada não foi encontrado um caso compatível com as características requeridas descritas
na Tabela 4.
O processo de executar a avaliação tem seu início com a entrada do novo caso e como
resultado a prescrição proposta pelo sistema. Com a proposta retornada pelo sistema inicia-se
o processo de comparação do grau de similaridade da prescrição proposta, com a prescrição
criada para o caso pelo especialista durante o ano de 200-2010.
4.2.2 Execução Avaliação
A avaliação acontece de forma individualizada, ou seja , caso a caso. O sistema tem
uma tela de portal na qual reúne todos os casos selecionados para a avaliação. A Figura 11
apresenta a tela de seleção de caso.
Figura 11 – Tela de seleção de casos
Fonte: Autoria própria, 2010.
Os casos selecionados de 2009-2010 foram inseridos no sistema para o início da
avaliação. A cada caso inserido o sistema tem como retorno a respectiva proposta de
63
prescrição. Esse retorno é avaliado item a item com a prescrição criada pelo especialista em
2009-2010.
Para a avaliação da similaridade da prescrição proposta com a construída pelo
especialista, utiliza-se uma tela que compara as duas prescrições (sistema x especialista),
sinalizando os itens em comum entre ambas e o percentual de similaridade. Esse percentual é
calculado com um simples regra de três em que os 100% são todos os itens da prescrição
construída pelo especialista. A Figura 12 apresenta a tela utilizada para avaliação da
similaridade entre as prescrições.
Figura 12- Tela de análise da proposta.
Fonte: Autoria própria, 2010.
A Figura 12 mostra na parte esquerda a lista com os itens da prescrição proposta. Essa
lista está ordenada em ordem decrescente de utilização do itens, ou seja, o mais utilizado está
no topo até o menos utilizado nos casos pesquisados. Logo à direta se encontra a lista com a
64
prescrição construída pelo usuário especialista. Essa lista não sofreu nenhum tipo de
ordenação ela apresentando os itens na ordem em que o especialista havia criado em 2009-
2010. Logo acima dessa lista, encontra-se as características epidemiológicas do paciente em
análise. Sobre a área das características incluiu-se dois botões: um para considerar a dosagem
e outro para a frequência. Durante a avaliação dos resultados, como será comentado na
próxima seção, necessitou-se mudar algumas métricas de comparação entre as prescrições que
consequentemente, modifica o índice de similaridade entre as mesmas.
4.3 Resultados da avaliação
O processo de avaliação foi realizado de forma manual, como citado anteriormente,
utilizando-se o grupo de casos de 2009-2010 selecionados na etapa de analise e seleção de
novos casos para avaliação. Para cada CID o conjunto de casos foi inserido no sistema e a
proposta correspondente foi confrontada com a proposta feita pelo especialista. A Tabela 6
demonstra os resultados preliminares obtidos.
Tabela 6 – Resultados iniciais CID I50
Fonte: Autoria própria, 2010.
CID Sexo Idade Peso
(kg)
Altura (cm) Casos Similaridade
(%)
Itens na
prescrição
I50
Masc. 66 72 165 7 33% 30
Masc. 61 62 166 3 17% 17
Fem. 84 70 172 4 35% 20
Fem. 82 70 165 7 45% 11
65
Tabela 7 – Resultados iniciais CID J45.9
Fonte: Autoria própria, 2010.
Tabela 8 – Resultados parc
iais CID N18
Fonte: Autoria própria, 2010.
Tabela 9 – Resultados parciais CID J18
Fonte: Autoria própria, 2010.
De acordo com os resultados apresentados pelas Tabelas 6,7,8 e 9 verificou-se um baixo
índice de similaridade entre ambas. Assim, a maioria dos casos testados apresentou esse
comportamento devido ao baixo número de casos similares na base de conhecimento. O
Figura 13 apresenta essa evolução considerando o CID J45.9.
CID Sexo Idade Peso
(kg)
Altura
(cm)
Casos Similaridade
(%)
Itens na
prescrição
J45.9
Masc. 6 15 92 17 50% 14
Masc. 5 11 90 19 87% 8
Fem. 4 17 98 16 48% 21
Fem. 2 10 85 3 62% 16
CID Sexo Idade Peso
(kg)
Altura
(cm)
Casos Similaridade
(%)
Itens na
prescrição
N18 Masc. 42 61 172 12 21% 14
Fem 37 57 157 8 10% 20
CID Sexo Idade Peso
(kg)
Altura
(cm)
Casos Similaridade
(%)
Itens na
prescrição
J18
Masc. 71 68 171 2 20% 49
Excluído: ¶¶¶¶¶¶
66
Figura 13 – Gráfico da similaridade x casos
Fonte: Autoria própria, 2010.
Conforme a Figura 13 no eixo X do gráfico possui o número dos casos similares
encontrados e no eixo Y possui os percentuais possíveis. Esse gráfico demonstra que no caso
do CID J45.9 o índice de similaridade aumenta a medida que a proposta foi montada com o
maior numero de casos. Além do baixo número de casos, considerado o principal fator de
baixas taxas de similaridade, outros fatores contribuíram com menor proporção ao baixo
índice, tais como: dosagens com padrões diferentes e frequências com padrões diferentes.
4.3.1 Dosagens com padrões diferentes
A diferença entre dosagens ocorre principalmente com medicamentos. Uma medicação
pode ser prescrita utilizando-se uma unidade de apresentação ou uma unidade de
concentração. A unidade de apresentação é referente ao formato físico da medicação
(comprimidos, ampolas, cápsulas etc.). A unidade de concentração refere-se à concentração
da medicação a ser administrada para o paciente, são consideradas unidades básicas de
medida (miligramas, microgramas, etc.). Dessa forma, ocorrem itens do mesmo tipo com
dosagem similar, mas prescrito de forma diferente como demonstra o Quadro 15.
Medicamento Dosagem exemplo 1 Dosagem exemplo2
Paracetamol (250mg) 2 comprimidos 500 mg
Heparina (5000 ui amp) 5000 ui 1 ampola
Quadro 15 – Exemplos de dosagens
Fonte: Autoria própria, 2010.
67
Como apresentado no Quadro 15, o medicamento Paracetamol pode ser prescrito de
duas formas diferentes, mas para fins terapêuticos é a mesmo resultado. Ainda existem
medicações que são prescritas em ampola ou comprimido com a mesma dose. Nesse caso
considerando-se o método de absorção pelo organismo ou a impossibilidade do paciente na
administração pela via oral, não se pode afirmar que são similares.
4.3.2 Freqüências com padrões diferentes
Assim como as medicações, as freqüências dos itens de prescrição podem ser
informados de diferentes formas, algumas tem o mesmo resultado final e outros são diferentes
no sentido terapêutico. O Quadro 16 apresenta alguns exemplos.
Freqüência Freqüência exemplo 1 Freqüência exemplo2
Vezes ao dia 2 vezes ao dia De 12 em 12 horas
Vezes ao dia 3 vezes ao dia De 8 em 8 horas
Quadro 16 – Exemplos de freqüências
Fonte: Autoria própria, 2010.
O Quadro 16 demonstra o exemplo de freqüência vezes ao dia. Dependendo da
medicação o seu efeito é prejudicado se não for administrada em períodos regulares de tempo,
ou seja, nesse caso utiliza-se frequências do tipo “de x em x horas”. E em casos que não
precise um rigor na sua execução são utilizadas freqüências do tipo x vezes ao dia.
Entretanto, o sistema de prontuário eletrônico da ISCMPA possui uma funcionalidade
denominada como aprazamento automático. Essa funcionalidade permite ao usuário médico,
prescrever um item com a freqüência “vezes ao dia” e o sistema gera automaticamente os
horários para o item considerando o horário atual. Dessa forma, pode-se considerar similar um
item prescrito com uma freqüência “vezes ao dia” com uma “de x em x horas”.
Após a breve reflexão sobre alguns possíveis itens que influenciam a similaridade entre
as prescrições, avaliou-se as prescrições com opções de considerar as dosagens e freqüências,
ou simplesmente, descartar comparando apenas o item e sua respectiva via de administração.
Os resultados obtidos são apresentados nas tabelas 10, 11, 12 e 13.
68
Tabela 10 – Resultados sem alguns atributos CID I50
Fonte: Autoria própria, 2010.
Tabela 11 – Resultados sem alguns atributos CID J45.9
Fonte: Autoria própria, 2010.
Tabela 12 – Resultados sem alguns atributos CID N18
Fonte: Autoria própria, 2010.
Caso Sexo Idade Peso
(kg)
Altura
(cm)
Casos Itens Similaridade
(%)
Sem
Dosagem
Sem
Freqüência
Sem
ambos
I50
1 Masc. 66 72 165 7 30 33% 40% 40% 46%
2 Masc. 61 62 166 3 17 17% 23% 35% 41%
3 Fem. 84 70 172 4 20 35% 45% 60% 80%
4 Fem. 82 70 165 7 11 45% 45% 81% 81%
CID Sexo Idade Peso
(kg)
Altura
(cm)
Casos Itens Similaridade
(%)
Sem
Dosagem
Sem
Freqüência
Sem
ambos
J45.9
1 Masc. 6 15 92 17 14 50% 78% 71% 85%
2 Masc. 5 11 90 19 8 87% 87% 100% 100%
3 Fem.. 4 17 98 16 21 48% 61% 76% 80%
4 Fem. 2 10 85 3 16 62% 81% 62% 81%
CID Sexo Idade Peso
(kg)
Altura
(cm)
Casos Itens Similaridade
(%)
Sem
Dosagem
Sem
Freqüência
Sem
ambos
N18
1 Masc. 42 61 172 12 14 21% 35% 28% 50%
2 Fem 37 57 157 8 20 10% 10% 20% 40%
Excluído: ¶¶¶¶¶
69
Tabela 13 – Resultados sem alguns atributos CID J18
Fonte: Autoria própria, 2010.
Conforme apresentado nas Tabelas 10, 11, 12 e 13, a avaliação apresentou uma
significante melhora do percentual de similaridade ao não considerar a dosagem e/ou
freqüência. Como exemplo, o caso três do CID I50 demonstrado na Tabela 10. O índice de
similaridade inicial entre as prescrições foi somente de 35%, desconsiderando-se a dosagem o
índice foi elevado para 45% e, se destacando como um dos casos com maior índice, quando se
desconsidera também a freqüência, chegando à 80% de similaridade dentre os 11 itens da
prescrição do especialista.
Com a execução da avaliação caso a caso possibilitou-se a apresentação final dos
resultados globais. Essa apresentação organiza-se o índice de similaridade de acordo com o
CID e o sexo correspondente dos casos avaliados. Um comparativo é apresentado através das
tabelas 14 e 15, pois a Tabela 14 apresenta os resultados considerando dose e freqüência
enquanto, a Tabela 15 apresenta sem considerá-los.
I50 J45.9 N18 J18
Masculino 25% 68,5 21% 20%
Feminino 40% 55% 10% Sem casos
Tabela 14 – Resultados finais com dose e freqüência
Fonte: Autoria própria, 2010.
I50 J45.9 N18 J18
Masculino 43,5% 92,5% 50% 28%
Feminino 80,5% 80,5% 40% Sem casos
Tabela 15 – Resultados finais desconsiderando dose e freqüência
Fonte: Autoria própria, 2010.
CID Sexo Idade Peso
(kg)
Altura
(cm)
Casos Itens Similaridade
(%)
Sem
Dosagem
Sem
Freqüência
Sem
ambos
J18
1 Masc. 71 68 171 2 49 20% 20% 28% 28%
70
4.4 Considerações sobre o capítulo
Com visto nesse capítulo, o processo de avaliação do sistema proposto retornou como
resultado o índice de similaridade da prescrição proposta como a criada pelo usuário
especialista. Os resultados ficaram abaixo do esperado, devido ao baixo número de casos
disponíveis para análise.
No próximo capítulo apresentam-se as considerações finais e os trabalhos futuros
utilizando-se a metodologia proposta.
71
5 CONSIDERAÇÕES FINAIS
Ao longo desse trabalho, estudaram-se três técnicas da IA que combinadas resultaram
no sistema híbrido apresentado. Esse modelo teve grandes desafios como: manipular uma
grande massa de dados e organizá-las. Hoje a instituição que as informações foram utilizadas
possui mais de 1200 leitos divididos em cinco hospitais. Assim, utilizou-se técnicas de Data
Mining para classificar e filtrar as informação necessárias.
As técnicas de sistemas RBC foram utilizadas na construção e recuperação da base de
casos. Para essa recuperação utilizou-se algoritmo do vizinho mais próximo, sendo de vital
importância considerando-se o número de atributos a serem comparados entre itens de
prescrição.
Em paralelo com o desenvolvimento dessa proposta, avançava o processo de aprovação
do uso das informações clínicas através do CEP da Irmandade da Santa Casa de Misericórdia
de Porto Alegre, obtendo êxito como resultado. Com a aprovação desse comitê, a solução
começou a ser avaliada com informações reais de pacientes que obtiveram alta da instituição.
O modelo na etapa de avaliação apresentou limitações. Como todo sistema RBC, quanto
menor os casos similares pior era o índice de similaridade alcançado entre a prescrição
proposta com a do especialista. Esse problema ocorreu devido a filtragem necessária para
garantir o mínimo de informações obrigatórias para o processo de comparações entre os
casos.
Como contribuição, destaca-se a pesquisa direcionada por CID, sendo eficaz na
proposta de tratamentos já padronizados, sem a necessidade do médico criar novamente uma
prescrição necessitando apenas, alguns ajustes para adaptá-la as necessidades clínicas de outro
paciente.
Ainda destaca-se que não se encontrou proposta similar ao modelo proposto, que tem
como principal diferencial, apresentar a prescrição pronta, sendo apenas necessário o usuário
selecionar os itens que são relevantes para o novo caso.
Através da análise da base de casos, estabeleceu-se algumas informações relevantes
sobre a incidência de doenças de acordo com gênero, idade, peso e altura dos sujeitos. Estas
informações nortearam alguma das decisões do processo de avaliações do SE. Cabe ressaltar,
no entanto, que tais dados não podem ser extrapolados para uso como resultado científico.
Embora sejam indicadores relevantes para a comunidade da área de saúde, não foi resultado
de estudos sistemáticos ou com amostras que permitam dados estatisticamente significativos.
Excluído:
72
Um interessante trabalho futuro seria aplicar parte da metodologia de tratamento de dados
desenvolvidos para auxiliar equipes da área de saúde a obter dados para análise em períodos e
amostras maiores e que permitam extrair conhecimento sobre a influência das características
epidemiológicas do paciente.
Como outro trabalho futuro, o modelo pode ser aprimorado para considerar outras
características do estado clínico do paciente, histórico de doenças familiares, hábitos etc.
Quanto maior o número de atributos em conjunto com maior número de casos, mais preciso
será o resultado. O modelo também pode ser aprimorado para conversão de doses e
freqüências diferentes, aumentando a precisão do modelo.
Ainda como trabalho futuro, o modelo proposto pode ser utilizado para fins
educacionais no treinamento de estudantes de medicina, avaliando as diferentes condutas que
podem ser adotadas de acordo com o estado clínico geral do paciente.
REFERÊNCIAS
ABRAMOVICIUS, A. Estudo dos erros de prescrição relacionados aos medicamentos utilizados no Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto. 107 f. Dissertação de Mestrado – Universidade de São Paulo, Ribeirão Preto, 2007. Disponível em: <http://www.teses.usp.br/teses/disponiveis/17/17139/tde-06032008-153619/publico/ tese.pdf /> Acesso em: 06 jul. 2010. ALUR, D.; CRUPI J.; MALKS D. J2EE Patterns: Best practices and design strategies. 2 ed. Palo Alto,CA – USA, 2003. AMODT, A.; PLAZA, E. Case-Based Reasoning: Foundational Issues, Methodological Variations, and System Approaches. AI Communications, v. 7, n. 1,p. 39-59, mar. 1994. Disponível em: < http://www.idi.ntnu.no/~agnar/publications/aicom-94.pdf > Acesso em: 1 jun. 2010. BRASIL. Ministério da Saúde. Secretaria de Assistência à Saúde. Departamento de Controle e Avaliação de Serviços de Saúde. Manual do Sistema de Informação Hospitalar. 2010 Disponível em <www.saude.gov.br> Acesso em 07 jun. 2010 CAVELLUCI, C.; LYRA, C. Um Sistema Baseado em Conhecimento para o Auxílio de Manobras em Redes de Distribuição de Energia Elétrica. Revista SBA, Campinas, SP v. 3, n. 3, p. 282-290, 1992 Disponível em: < http://www.fee.unicamp.br/revista_sba/volumes/v3n1/v3n1a04.pdf> Acesso em: 10 jun 2010 CERVI, R.; FRANCESCHINI, S.; PRIORE S. Análise Crítica do uso do Índice de Massa Corporal para Idosos. Revista de Nutrição, Campinas, SP v. 18, n. 2, p. 765-775, 2005. Disponível em: <http://www.scielo.br/pdf/rn/v18n6/a07v18n6.pdf> Acesso em: 01 jun 2010 COELHO, L. ; MARIANI, V. Sistema Híbrido Neuro-evolutivo aplicado ao controle de processo multivariável. Revista SBA, Campinas, SP v. 17, n. 1, 2006. Disponível em:< http://www.scielo.br/scielo.php?pid=S0103-17592006000100004&script =sci_arttext&tlng=en> Acesso em: 14 jun 2010 COSTA, W. ; SILVA, S. Aquisição de conhecimento: o grande desafio de sistemas especialistas. Revista HOLOS, Campinas, SP v. 2, n. 4, p. 37-46, 2005. Disponível em:<http://www2.ifrn.edu.br/ojs/index.php/HOLOS/issue/view/11> Acesso em: 01 jun 2010
74
FERNANDES, Ana Maria da Rocha. (2005) Inteligência Artificial : Noções Gerais, Editora VisualBooks, 2ª edição. GIMENES, F. A segurança de pacientes na terapêutica medicamentosa: análise da redação da prescrição médica nos erros de administração de medicamentos em unidades de clínica médica. 2007. 112 f. Dissertação de Mestrado – Universidade de São Paulo, Ribeirão Preto, 2007. Disponível em: < http://www.teses.usp.br/teses/disponiveis/22/22132/tde-13112007-155334/> Acesso em: 11 out. 2009. GURGEL, T. Mineração de Dados Aplicada à Cardiologia Pediátrica. 2007. 129 f. Dissertação de Mestrado – Universidade Federal de Pernambuco, Recife, 2007. Disponível em: <http://biblioteca.universia.net/html_bura/ficha/params/id/26993610.html> Acesso em: 11 out. 2009. JULIANI, R. et al. Um Sistema Especialista Probabilístico de Apoio a Análise dos Planos de Negócios de Empresas de Base Tecnológica. Revista Eletrônica de Sistemas de Informação, Curitiba, PR v. 4, n. 2, 2005. Disponível em: <http://revistas.facecla.com.br/index.php/reinfo/article/viewPDFInterstitial /159/51> Acesso em: 12 jun 2010 LUGER, F. Inteligência Artificial: estruturas e estratégias para a resolução de problemas complexos. 4 ed. Porto Alegre,RS : Bookman, 2004. MORIMOTO, T.; GANDHI, T.K.; SEGER, A.C.; et al. Adverse drug events and medication errors: detection and classification methods. Qual Saf Health Care, v. 13, p. 306-14, 2004. Disponível em: < http://www.pubmedcentral.nih.gov/picrender.fcgi?artid=1743868&blobtype =pdf> Acesso em: 1 nov 2009 REZENDE, S. Sistemas Inteligentes: fundamentos e aplicações. Barueri, SP: Manoela. 2003. RICH, E.; KNIGHT, K. Inteligência artificial . 2. ed. São Paulo, SP: Makron Books. 1994. ROCHA, B.; MARTINS, D. Conceitos Básicos sobre Data Mining. In: CIENTIFICO III , 2003, Salvador. Disponível em: < http://www.frb.br/ciente/Textos%20CienteFico%202003.2 /INFO/Banco%20de%20Dados/Conceitos%20B%E1sicos%20sobre%20Data%20Mining.pdf > Acesso em 20 set. 2009. RUSSELL, S.; NORVIG, P. Artificial Intelligence A modern Approach. 3. ed. Saddle River, NJ: Prendice Hall, 2009.
75
SCHANK, R. Dynamic Memory Revisited. 2. ed. Cambridge University Press ,1999. Disponível em: <http://books.google.com.br> Acesso em: 01 out. 2009 SILVA, D.; COSTA, F. Sistema de Raciocíno Baseado em Casos para o Diagnóstico Médico de Doenças Neurológicas. In: II WORKSHOP DE INFORMÁTICA APLICADA À SAÚDE , 2002, Itajaí. Disponível em: <http://200.169.53.89/download/CD%20congressos/2002/2%20 CBComp/html/artigos/workshop/wsp038.pdf> Acesso em 20 set. 2009 SILVA, R. et al. Proposta de um Modelo RBC para Construção de um Sistema de Apoio ao Diagnóstico Médico. In: IV SBQS – V WORKSHOP DE INFORMÁTICA MÉDICA , 5, 2006, Vila Velha. Disponível em: < http://www.ime.uerj.br/professores/cecas/V%20WIM/ andamento/8348.pdf > Acesso em 20 set. 2009 SBIS - SOCIEDADE BRASILEIRA DE INFORMÁTICA NA SAÚDE. Informática em Saúde. São Paulo, 2008. Disponível em: www.sbis.com.br Acesso em: abr.2010. TELES, D. et al. Sistema Baseado no Raciocínio Baseado em Casos para recomendação de Programa Alimentar. Revista Eletrônica de Sistemas de Informação, Curitiba, PR v. 5, n. 3, 2006. Disponível em: <http://revistas.facecla.com.br/index.php/reinfo/article/view/240> Acesso em: 01 jun 2010. TONIDANDEL, F. Desenvolvimento e Implementação de um Sitema de Planejamento Baseado em Casos. 2003. 205 f. Dissertação de Mestrado – Universidade Federal de São Paulo, São Paulo, 2003. Disponível em: < http://www.teses.usp.br/teses/disponiveis/3/3139/ tde-28042003-164450> Acesso em: 11 out. 2009. VIANA, L.; NABUCO O. Ontologias e tecnologia da informação e comunicação: sistemas especialistas, web semântica e gestão integrada de compras governamentais eletrônicas. Revista Eletrônica de Comunicação, Informação & Inovação em saúde, Rio de Janeiro, RJ v. 1, n. 1, 2007. Disponível em: <http://www.reciis.cict.fiocruz.br/index.php/reciis/issue/view/9/showToc> Acesso em: 01 jun 2010. WANGENHEIN, V. Raciocínio Baseado em Casos: fundamentos, técnicas e desenvolvimento de aplicações. Blumenau, SC: Manole, 2003. WHO - WORLD HEALTH ORGANIZATION. BMI Organization. 2010 Disponível em <http://apps.who.int/bmi/index.jsp?introPage=intro_3.html> Acesso em 08 jun.2010
76
ANEXO A
77
78
ANEXO B
79
ANEXO C