Download - Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação
![Page 1: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/1.jpg)
1
Comparação entre diferentes tecnologias em banco de dados para
manipulação rápida e ubíqua de dados biológicos
Kátia de Paiva LopesOrientador: Sandro Renato Dias
Departamento de Sistemas de Informação Faculdade Fabrai-Anhanguera
![Page 2: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/2.jpg)
2
Objetivo
Apresentar uma comparação entre duas diferentes ferramentas para manipulação de dados biológicos, com intuito de facilitar o trabalho dos profissionais de Bioinformática, que por ser uma área multidisciplinar, acolhe profissionais de diferentes formações.
![Page 3: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/3.jpg)
3
IntroduçãoBanco de dados (RANMEZ, SHAMKAT, 2006)
repositório computacionalacesso Recuperação
Bancos de dados biológicos DNA, sequências de aminoácidos, nucleotídeos, proteínas
![Page 4: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/4.jpg)
4
IntroduçãoPDB (Protein Data Bank):
armazena dados biológicos, flat files
Data Mining "o cruzamento de vários bancos de dados e a
descoberta de conexões impossíveis de se descobrir por outro método.” (EIRAS, 2009).
![Page 5: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/5.jpg)
5
IntroduçãoSistemas de Gerenciamento de Banco de
Dados (SGBD’s)
OracleMySQLDB2MS SQLServer
![Page 6: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/6.jpg)
6
Materiais e métodosNesse trabalho, para objeto de comparação,
foram utilizadas duas diferentes ferramentas:
SGBD MySQL (www.mysql.com)gratuito, diferentes sistemas operacionais, amplamente conhecido e utilizado.
Fusion Tables (BATERMAN, 2009).Google (fusiontables.googlelabs.com)Simplificação das operações de acesso aos
dados, Cloud Computing (Computação nas nuvens)
![Page 7: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/7.jpg)
7
Materiais e MétodosO mesmo banco de dados foi criado
utilizando as ferramentas Mysql e Fusion Tables, a partir das tabelas de Dias & Nagem (2009).
Foi criada a mesma estrutura em ambos, e, para geração dos gráficos com o uso do SGBD MySQL foi criada uma aplicação com uso da linguagem PHP.
![Page 8: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/8.jpg)
8Fig. 2 – Tela inicial da aplicação em PHP.
Fig. 1 – Parte do código da aplicação em PHP.
![Page 9: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/9.jpg)
9
Fig. 3 – Tela inicial do Fusion Tables.
![Page 10: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/10.jpg)
10
Em seguida, foram gerados os gráficos a partir da mesma consulta nas duas aplicações:
Fig. 4 – Arquivos PDB por método de resolução da proteína, desconsiderando os métodos: Solution NMR e X-Ray Difraction.
![Page 11: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/11.jpg)
11
Fig. 5 – Número de arquivos PDB por valor de resolução da estrutura. Valores considerados, definidos entre 0.0 e 3.0 (ilegíveis na imagem).
Fig. 6 – Arquivos PDB por identificação do método de resolução da estrutura da proteína.
![Page 12: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/12.jpg)
12
Fig. 7 – Visualização das tabelas
![Page 13: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/13.jpg)
13
Resultados e Discussões
VantagensFacilidade de manipulação dos dados.Depois que o arquivo é copiado para o servidor não há necessidade de estar conectado ao banco para a importação das tabelas.Uso de Cloud Computing.Gráficos gerados automaticamente.Descarta o uso de SQL.Ubiquidade (Acessível via internet).
Fusion Tables
![Page 14: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/14.jpg)
14
Resultados e Discussões
DesvantagensLimitação de 100 MB por planilha e 250 MB por usuário.Não funciona bem no browser Internet Explorer 8.0, mas atende as funcionalidades quando executado em modo de compatibilidade.Limitado quanto à realização de cálculos.Não há interação com outros aplicativos
Fusion Tables
![Page 15: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/15.jpg)
15
Resultados e DiscussãoMySQL
VantagensFunciona em diferentes sistemas operacionais.Robustez para trabalhar com grande quantidade de dados.Realiza cálculos complexos.Interage com outros aplicativos.
![Page 16: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/16.jpg)
16
Resultados e DiscussãoMySQL
DesvantagensNão faz uso de Cloud Computing.Não apresenta uma interface gráfica para manipulação dos dados.Exige conhecimentos em SQL.
![Page 17: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/17.jpg)
17
Resultados e DiscussãoMySQL x Fusion Tables, do ponto de vista da
usabilidade:
Características MySQL Fusion TablesUso de Cloud Computing Não SimAcesso aos dados SQL GráficaCálculos complexos Sim LimitadoGeração de gráficos automaticamente
Sim Não
Interage com aplicativos Sim NãoImportação de dados .txt, .sql .xls, .csv
![Page 18: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/18.jpg)
18
ConclusãoFusion Tables é uma boa opção para armazenamento de
dados biológicos, porque: não exige conhecimentos em alguma linguagem específica, manipulação dos dados é feita através da interface gráfica, faz uso de Cloud Computing, interpreta os dados e gera gráficos automaticamente.
MySQL, embora apresente robustez para trabalhar com grande quantidade de dados, requer o uso de SQL, e para gerar gráficos, por exemplo, é necessário que seja utilizada uma aplicação, exigindo assim: configuração de servidor web, conhecimentos sobre parametrização de gráficos, conhecimentos em Linguagem de Programação caso haja
necessidade de criação de uma aplicação.
![Page 19: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/19.jpg)
19
ReferênciasBATERMAN, A., WOOD,M. Cloud Computing. Oxford Journals.
2009,1.
DIAS, S. R. ; Nagem, R. A. P. Residue-residue interaction database: use in the modification of proteins. In: International Network of Protein Engineering Centers, 2009, Ubatuba/SP. International Network of Protein Engineering Centers Meeting Abstract Book, 2009.
L. Eiras. O amigo do Estado. Revista Fonte - Prodemge, 142, 2009.
RANMEZ, E., SHAMKANT B.N. Introdução a Banco de Dados – Sistemas de Banco de Dados . São Paulo, 2006. 28 slides: color. Acompanha texto.
![Page 20: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação](https://reader035.vdocuments.com.br/reader035/viewer/2022062520/5681649e550346895dd6839f/html5/thumbnails/20.jpg)
20
Agradecimentos
Faculdade Fabrai - Anhanguera