higienizacao de base de dados do sus

Upload: emerson-moretto

Post on 13-Oct-2015

17 views

Category:

Documents


0 download

DESCRIPTION

Apresentacao do meu trabalho no CBIS 2013

TRANSCRIPT

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    1/16

    Projeto de Identificao de Pacientesdo Carto SUS do estado de So Paulo

    Secretaria Estadual de Sade de So Paulo - SESSP

    Laboratrio de Sistemas Integrveis e Tecnolgico - LSITEC

    Organizao Pan-!mericana da Sade - OP!S

    Laboratrio de Sistemas Integrveis " LSI EP#$SP

    Emerson Moretto

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    2/16

    O desa%io

    Identi%icar e remover &acientes du&licadosemuma base com

    ~30 milhesde &acientes

    Estat'sticas erradas

    Consultas incertas(egistros )om*nimos ou so a mesma &essoa+Informaes no confieis

    !s "ro#lemas

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    3/16

    Como resolver+

    ,o entanto

    $enhumcam&o . /001 signi%icativo

    Com&arao de nomes no . to sim&les

    Erros de di%itao

    Erros de fon&tica

    Maior "artedos registros no&ossuem documentos

    &reenc)idos

    Com"arando os re%istros entre si'

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    4/16

    Com&arar todos com todos+

    30 micom&arando todoscom todos2

    (()333345000000 com&ara6es7

    Com&utacionalmente %alando82~ * anos

    8 considerando 9ue cada com&arao de &acientes leva / ms

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    5/16

    ! soluo

    Criar conjuntos' +diiso e con,uista-

    ou se:a;

    !gru&ar os "oss.eis&acientes du&licados

    e de&ois;

    Com&arar todoscom todos; &or.m somentedentro do con:unto

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    6/16

    !gru&amento

    Cintia < Souza = C/S1

    Cintia asta criarmos um 2ash si%nificatio&ara cada &acienteusando fon&ticaeconsideraes so#re erros de di%itao

    ?uliano @oraes = 4$M5EAiuliano @oraes = 4$M5EAiuliano @orais = 4$M5E

    C/S14$5E

    Cintia 6erreira Sousa@e2 @aria Sousa

    Primeiro nome %on.tico 7ltimo nome %on.tico7Primeiro nome da me %on.tico 7ltimo nome da me %on.tico

    2ash si%nificatio 8 C/S1M5S1

    EB2

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    7/16

    Com&arando

    Com os gru&os de candidatos %ormados

    (ealizamos as com&ara6es entre os candidatos

    do mesmo %ru"oa&enas

    / B / B D/ B

    B D B D B

    / Cintia < Souza = C/S1

    D Cintia

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    8/16

    ! com&arao

    F %eita uma com"arao estat.stica9ue gera um"ercentual de similaridadeentre &acientes

    Para os nomes; usamos algoritmos de dist9ncia decaracteresconsiderando %onemas e erros de digitao

    !lgoritmo 4eenshteinGbastante modi%icadoH EB2 Cint)a

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    9/16

    ! com&arao

    nome Cint)a *@-nome do &ai Paulo Oliveira Souza B Paulo Oliveira Souza

    ?00; = "eso +0>*0-

    data de nascimento 0#03#/34 B /#03#/34

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    10/16

    ! com&arao

    i% "ercentual de similaridadeK= 41

    Com&arao . considerada candidatae vai &ara

    uma base de dados de com&arao

    O usurio analisa as com&ara6es candidatas

    atrav.s de uma interface9ue acessa esta base

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    11/16

    Memonstrao

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    12/16

    Tela de listagem

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    13/16

    Tela de com&arao

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    14/16

    !r9uitetura>ase de dados

    Carto S$SOracle /0g

    >anco de dadosem rvore

    desenvolvido &elo LSI

    T)read decom&arao T)read de

    com&arao

    T)read decom&arao

    Mistribuidor

    ETL

    Escalvel sobreTCP#IP

    >anco de com&ara6es

    PostgreSNL 4

    Com&araoD8 @

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    15/16

    !lgumas in%orma6es t.cnicas

  • 5/23/2018 Higienizacao de Base de Dados do SUS

    16/16

    Obrigado7

    Emerson @oretto

    emorettolsi>us">#r6inanciamento

    Fesenolimento