febrl
TRANSCRIPT
Ferramenta:FEBRL
Luciano Silva LeitePedro de Vasconcellos
Rachel Gonçalves de Castro
Roteiro
• Introdução– Motivação– Record Linkage Process
• FEBRL• Instalação• Funcionalidades• Demonstração• Pontos positivos• Pontos negativos• Conclusão• Referências
15/04/2023 Universidade Federal do Rio de Janeiro 1
Motivação
• Data Linkage na área de saúde
• Funções limitadas
• “Caixas Pretas”
• Usuários com pouca experiência em programação
05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 2
4
Record Linkage Process
05/11/2014 Universidade Federal do Rio de Janeiro15/04/2023 Universidade Federal do Rio de Janeiro 3
FEBRL
• Freely Extensible Biomedical Record Linkage• Open Source• Desenvolvido pelo Australian National
University Data Mining Group• Versão: 0.4.2 (2011)• Python
05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 4
Instalação
• Dependências:– Python 2.6 ou 2.7– PyGTK– Matplotlib– libsvm
05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 5
Funcionalidades
05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 6
• Padronização• Deduplicação• Linkagem• Geocodificação
Demonstração
05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 7
Pontos positivos
• Grátis• Open source• Multiplataforma• Flexibilidade• Quantidade de técnicas disponíveis• Boa documentação e publicações
05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 8
Pontos negativos
• Dificuldade de escalabilidade (memória necessária e tempo de processamento)
• Tratamento dos dados combinados• Ausência de interface gráfica em algumas
funções• Sem acesso direto a sistemas de bancos de dados• Suporte precário• Comunidade pequena• Complexidade da instalação05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 9
Conclusão
• Boa para projetos pequenos• Alta configurabilidade• Exige conhecimento do usuário sobre os
algoritmos
05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 10
Referências[1] Christen, P. “Febrl - A Freely Available Record Linkage System with a Graphical User Interface”. The Australian National University, Canberra, Australia, 2008.
[2] Christen, P. “Febrl - A Open Source Data Cleaning, Deduplication and Record Linkage System with a Graphical User Interface”. The Australian National University, Canberra, Australia, 2008.
[3] Christen, P. “Development and User Experiences of an Open Source Data Cleaning, Deduplication and Record Linkage System”. The Australian National University, Canberra, Australia, s/a.
[4] Christen, P. “Febrl - Freely extensible biomedical record linkage”. Conferences in Research and Practice in Information Technology (CRPIT), vol. 80, Wollongong, Australia, 2008.
05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 11