febrl

Post on 05-Aug-2015

52 Views

Category:

Engineering

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Ferramenta:FEBRL

Luciano Silva LeitePedro de Vasconcellos

Rachel Gonçalves de Castro

Roteiro

• Introdução– Motivação– Record Linkage Process

• FEBRL• Instalação• Funcionalidades• Demonstração• Pontos positivos• Pontos negativos• Conclusão• Referências

15/04/2023 Universidade Federal do Rio de Janeiro 1

Motivação

• Data Linkage na área de saúde

• Funções limitadas

• “Caixas Pretas”

• Usuários com pouca experiência em programação

05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 2

4

Record Linkage Process

05/11/2014 Universidade Federal do Rio de Janeiro15/04/2023 Universidade Federal do Rio de Janeiro 3

FEBRL

• Freely Extensible Biomedical Record Linkage• Open Source• Desenvolvido pelo Australian National

University Data Mining Group• Versão: 0.4.2 (2011)• Python

05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 4

Instalação

• Dependências:– Python 2.6 ou 2.7– PyGTK– Matplotlib– libsvm

05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 5

Funcionalidades

05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 6

• Padronização• Deduplicação• Linkagem• Geocodificação

Demonstração

05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 7

Pontos positivos

• Grátis• Open source• Multiplataforma• Flexibilidade• Quantidade de técnicas disponíveis• Boa documentação e publicações

05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 8

Pontos negativos

• Dificuldade de escalabilidade (memória necessária e tempo de processamento)

• Tratamento dos dados combinados• Ausência de interface gráfica em algumas

funções• Sem acesso direto a sistemas de bancos de dados• Suporte precário• Comunidade pequena• Complexidade da instalação05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 9

Conclusão

• Boa para projetos pequenos• Alta configurabilidade• Exige conhecimento do usuário sobre os

algoritmos

05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 10

Referências[1] Christen, P. “Febrl - A Freely Available Record Linkage System with a Graphical User Interface”. The Australian National University, Canberra, Australia, 2008.

[2] Christen, P. “Febrl - A Open Source Data Cleaning, Deduplication and Record Linkage System with a Graphical User Interface”. The Australian National University, Canberra, Australia, 2008.

[3] Christen, P. “Development and User Experiences of an Open Source Data Cleaning, Deduplication and Record Linkage System”. The Australian National University, Canberra, Australia, s/a.

[4] Christen, P. “Febrl - Freely extensible biomedical record linkage”. Conferences in Research and Practice in Information Technology (CRPIT), vol. 80, Wollongong, Australia, 2008.

05/11/201415/04/2023 Universidade Federal do Rio de Janeiro 11

top related