identificação e classificação de casos de violência com o ...ceur-ws.org/vol-2519/master1.pdfde...
TRANSCRIPT
Identificação e classificação de casos de violência com o uso
de Data Science
Eduardo R. V. Duarte1, Anilton S. Garcia1, Jair A. L. Silva1, Edleusa G. F.
Cupertino2
1Programa de Pós-Graduação em Engenharia Elétrica
Universidade Federal do Espírito Santo - Vitória - ES, Brasil
2Secretaria de Saúde do Espírito Santo
Vitória - ES, Brasil
{[email protected], [email protected], [email protected],
Abstract. This paper proposes the creation of a database, semantically
structured, where the data of the victims, made available in textual records, are
organized with the purpose of enabling the use of tools to generate intelligence
related to the problem of violence. From the database, the objective is to develop
a set of tools using Data Science techniques in order to identify, after integration
of the information, the possible causes and consequences of these cases of
violence and, based on intelligent reasoning techniques, propose actions and
measures that can prevent the most common cases of violence and / or mitigate
its consequences.
Resumo. Este trabalho propõe a construção de um banco de dados,
semanticamente estruturado, onde os dados dos registros das vítimas,
disponibilizados em fichas textuais sejam organizados com a finalidade de
possibilitar o uso de ferramentas para geração de inteligência em relação ao
problema da violência. A partir da base de dados, o objetivo é desenvolver um
conjunto de ferramentas com o uso de técnicas de Ciência de Dados de modo a
possibilitar a identificação, após a integração das informações, das possíveis
causas e consequências desses casos de violência e, com base em técnicas de
raciocínio inteligente, propor ações e medidas que possam prevenir os casos
mais comuns de violência e/ou amenizar suas consequências.
1. Introdução
No Brasil e no mundo, o impacto da morbimortalidade por causas externas (violências e
acidentes) constitui uma das maiores preocupações para chefes de Estado e dirigentes do
setor Saúde. No Brasil, as violências e os acidentes representam a terceira causa de morte
na população geral e a primeira na população de 1 a 49 anos.
Dados do Ministério da Saúde (MS) registraram, no período de 2000 a 2013, um
total de 1.874.508 óbitos por causas externas. Entre o início e o fim desse período, houve
um aumento de 28,1%, passando de 118.397 óbitos por causas externas, em 2000, para
151.683, em 2013. Em 2013, as causas externas representaram 12,5% do total de óbitos
no País. Segundo o MS, em 2013, nos hospitais que integram o Sistema Único de Saúde
(SUS), ocorreram 1.056.372 internações por causas externas, perfazendo 9,5% do total
Copyright © 2019 for this paper by its authors. Use permitted under Creative Commons License Attribution 4.0 International (CC BY 4.0).
de internações, enquanto em 2014, esse percentual foi de 9,9% [Brasil, da Saúde, M.
2016].
Preocupado com esses dados alarmantes, o Ministério da Saúde lançou em 2001
a Política Nacional de Redução da Morbimortalidade por Acidentes e Violências. Faz
parte dessa política a Ficha de Notificação de Violência Interpessoal e Autoprovocada
(vide Figura 1), que é a ficha de notificação compulsória de todos os casos suspeitos e ou
confirmados de violência atendidos em todos os serviços de saúde do país, de forma a
padronizar a coleta de dados, a partir de um conjunto de variáveis e categorias, que
retratam as violências perpetradas contra grupos populacionais.
Figura 1. Primeira parte da Ficha de Notificação de Violência Interpessoal
Apesar de haver instruções específicas para o preenchimento dessa ficha, muitas
vezes esse preenchimento não é feito de maneira adequada. Existe a possibilidade de a
vítima preencher informações antagônicas em campos que se complementam ou mesmo
inserir informações importantes para o entendimento do tipo de violência em um campo
de ‘Observações Adicionais’, que pode ficar esquecido na hora de analisar os dados.
Com este trabalho busca-se desenvolver uma modelagem conceitual das
informações e estruturar semanticamente a base de dados, a partir das fichas e
documentos de referência, para que seja possível integrar essas informações preenchidas
nas fichas de notificação em meios digitais e alimentar os bancos secundários, de forma
a auxiliar a análise dos gestores e, por consequência, às vítimas de violências.
2. Objetivos
O objetivo geral deste projeto é propor um modelo conceitual baseado em ontologias para
a gestão da informação e do conhecimento na área de vigilância epidemiológica, com
foco inicial nas questões relativas à violência.
Os objetivos específicos do projeto são:
Estruturar semanticamente o banco de dados existente, modelado com base na
ontologia definida para o domínio;
Uma vez estruturado o banco, apontar possíveis incorreções nos registros,
buscando excelência de informação;
Utilizar esse banco de dados semanticamente estruturado para o desenvolvimento
de diversos painéis (dashboards), atualizados à medida em que os novos dados
são introduzidos, de forma a auxiliar na melhor compreensão dos cenários de
violência presentes nas Fichas de Notificação;
Auxiliar no processo de localização e exploração de novos conhecimentos que o
Sistema de Saúde, apesar de possuir, não consegue identificar claramente,
enriquecendo a criatividade e gerando inteligência competitiva e, dessa forma,
embasando o processo de tomada de decisão;
Desenvolver ferramentas de Ciência de Dados com o objetivo de apontar a
possibilidade de novos casos mais graves de violência (ex: tentativa de suicídio
ou feminicídio) baseado em informações já disponíveis nos bancos de dados
referentes às vítimas ou aos agressores;
3. Justificativa
O elevado índice de violência faz com que o Brasil seja considerado um dos países mais
perigosos do mundo. Isso traz inúmeros problemas para o país que incluem altas taxas de
homicídio, evasão escolar, superlotação da população carcerária, baixo aproveitamento
da capacidade turística, além de muitas outras desvantagens.
A Figura 2 mostra uma espécie de ‘Atlas de violência’ do Brasil em 2017,
destrinchando o cenário da violência ao longo do território brasileiro. Um dado que se
destaca neste infográfico é a elevada proporção de mortes violentas não esclarecidas em
relação ao total de mortes violentas. Altas proporções de mortes violentas não
esclarecidas quando comparadas às mortes por causas externas indicam problemas na
qualidade do sistema de informação da saúde [Cerqueira et al. 2016].
Enquanto em países desenvolvidos as mortes violentas indeterminadas
representam um resíduo inferior a 1% do total de mortes violentas, em alguns estados do
Brasil esse número foi superior a 10%. Isto ocorre, pois nesses países se reconhece a
importância de se descobrir as causas que levaram o indivíduo a óbito, como elemento
fundamental para evitar mortes futuras.
Figura 2. Atlas da violência 2017
Esse conjunto de fatores ajudam a reforçar o fato que se deve fazer um estudo
mais aprofundado do cenário da violência, identificando suas possíveis causas de modo a
tentar agir de maneira preventiva para evitar possíveis novos casos.
4. Metodologia
As etapas de desenvolvimento deste trabalho estão divididas da seguinte forma:
1. Pesquisa bibliográfica sobre o tema incluindo-se nessa etapa as bases de divulgação
científica, a documentação existente na Organização Mundial da Saúde (OMS) e no
MS;
2. Modelagem Conceitual baseada em ontologias das informações referentes aos
diversos tipos de notificações;
3. Utilização dos dados do VIVA/SINAN para realizar a estruturação de uma base de
dados semanticamente estruturada com base na ontologia definida para o domínio.
4. Desenvolvimento de painéis (dashboards) que possam ajudar a compreender melhor
o cenário de violência presentes nas Fichas de Notificação;
5. Utilização de técnicas de Data Science/Machine Learning para identificar
correlações entre os dados e tentar traçar perfis de possíveis novos casos de agressão
baseado nas informações já disponíveis das Fichas de Notificação.
5. Resultados Obtidos e Esperados
Neste momento da pesquisa, a modelagem conceitual baseada em ontologia das
informações constantes das fichas de notificações já está desenvolvida. Essa modelagem
foi feita utilizando o software Protégé, baseado nas informações presentes nas fichas de
notificação. Uma parte da ontologia desenvolvida é mostrada na figura 3, onde é possível
ver alguns campos da subclasse de “Identificadores” utilizados.
Figura 3. Parte da ontologia desenvolvida no Protégé
Outra parte do trabalho já bem desenvolvida é a elaboração de uma base de dados
semanticamente estruturada contendo os dados das vítimas de agressão de maneira
estruturada. Utilizando o software Tableau Desktop realizou-se essa formulação da base
de dados. A figura 4 mostra o preview das primeiras linhas de informação da base de
dados com as primeiras colunas de informações presentes na ficha de notificação sendo
exibidas no software Tableau Desktop.
Figura 4. Registros iniciais da fonte de dados desenvolvida no Tableau Desktop
A etapa de confecção de dashboards que mostrem a situação da violência
Interpessoal/Autoprovocada no Brasil já está em andamento.
Figura 5. Exemplo de dashboard desenvolvido no Tableau Desktop
Inicialmente foram elaborados alguns painéis com os dados disponibilizados pela
Secretaria Estadual da Saúde do Espírito Santo, mas a ideia é expandir esse raciocínio
para todo o Brasil, já que a maneira de preencher as fichas é idêntica em todos os estados.
A figura 5 mostra um dos dashboards desenvolvidos com o software Tableau desktop.
Ao fim desta pesquisa, espera-se obter dentro do conteúdo pesquisado e durante a
elaboração da dissertação de mestrado, os seguintes resultados:
Desenvolvimento de ferramentas de correlação e predição baseada em tecnologias
Data Science / Machine Learning;
Indicação de possíveis novos casos de violência e agressão baseados nos dados
dos casos já existentes nas Fichas de Notificação.
Junto a estes resultados espera-se prover:
Apresentação do trabalho aos gestores do SUS locais e de âmbito nacional;
Participação em um workshop nacional;
Participação em um evento em nível nacional;
Submissão de um artigo em um periódico do Sistema Nacional de Saúde;
Submissão de um artigo em um periódico internacionalmente qualificado.
6. Referências
Corassa, R. (2018) “Violência por Parceiro Íntimo e Homicídios de Mulheres no de 2011
a 2016 ”. Dissertação de mestrado, Universidade Federal do Espírito Santo.
Cerqueira, D., Lima, S., Bueno, S., Valencia, L., Hanashiro, O., Machado, P., Lima, A.
(2017) “Atlas da Violência ”. Online, http://www.ipea.gov.br/portal/images/170602
_atlas_da_violencia_2017.pdf.
Chaiken, J., Rhodes, W. (1994) “Predicting Violent Behavior and Classifying Violent
Offenders.” In: NATIONAL RESEARCH COUNCIL. Understanding and Preventing
Violence, Volume 4, cap.
Brasil, da Saúde, M. (2016) “VIVA: Instrutivo – Notificação de Violência Interpessoal e
Autoprovocada”. Online, http://bvsms.saude.gov.br/bvs/publicacoes/viva_instrutivo
_violencia_interpessoal_autoprovocada_2ed.pdf.