universidade federal de santa catarina programa de pós-graduação em bioquímica apoios aos alunos...

20
Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação Florianópolis, 09 de novembro de 2010. Bioinformática

Upload: tracy

Post on 25-Feb-2016

28 views

Category:

Documents


1 download

DESCRIPTION

Bioinformática. Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação. Florianópolis, 09 de novembro de 2010. Tópicos. Genbank Swiss-prot pdb. GENBANK. GENBANK. GENBANK: É um banco de seqüências de nucleotídeos e proteínas. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

Universidade Federal de Santa CatarinaPrograma de Pós-graduação em Bioquímica

Apoios aos alunos de graduação

Florianópolis, 09 de novembro de 2010.

Bioinformática

Page 2: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

• Genbank

• Swiss-prot

• pdb

Tópicos

Page 3: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

GENBANK

Page 4: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

GENBANK:

• É um banco de seqüências de nucleotídeos e proteínas.

• Acesso irrestrito (grande parte) acessado pelo NCBI: http://www.ncbi.nlm.nih.gov

• Construído pelo National Center of Biothecnology Information (NCBI) em 1982.

COLABORAÇÕES:

• DNA Data Bank do Japão (DDBJ) • European Bioinformatics Institutes (EBI, Hinxtin, UK).

-> Todos estes centros recebem dados separadamente, estas informações são trocadas e integradas, de maneira que estes bancos contém o mesmo banco de dados, sendo grande parte deles disponível on line.

GENBANK

Page 5: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

Bethesda, MD

O National Center for Biotechnology Information (NCBI)

Aceita submissões de seqüências primárias. Desenvolve ferramentas para analisar dados. Criação de bancos específicos baseados na seqüência

primária. Fornece pesquisa livre e links

Page 6: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

Users per day

300,000

200,000

100,000

400,000

1998 1999 2000 2001 2002 2003 2004

500,000

600,000

2005

Christmas and New Year’s Day

U.S.U.S.(.com, .net, (.com, .net, .org,.org,

..govgov, .us), .us)40%40%

Japan 6%Italy 4%

Canada 3%Germany 3%

United Kingdom3%

Netherlands 2%Spain 2%Brazil 2%Sweden 1%Switzerland 1%Belgium1%

OtherOther14%14%

U.S.U.S.(.com, .net, (.com, .net, .org,.org,

..govgov, .us), .us)40%40%

Japan 6%Italy 4%

Canada 3%Germany 3%

United Kingdom3%

Netherlands 2%Spain 2%Brazil 2%Sweden 1%Switzerland 1%Belgium1%

OtherOther14%14%

Tráfego de navegação ao NCBI

65 milhões de pb61 milhões de seqüências

Page 7: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação
Page 8: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação
Page 9: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

01/21/2007

9/19/2006

Page 10: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

Organismo -TradicionalPRI (28) Primate ROD (15) Rodent PLN (20) Plant and FungalBCT (18) Bacterial/ArchealINV (7) InvertebrateVRT (7) Other VertebrateVRL (4) ViralMAM (2) MammalianPHG (1) PhageSYN (1) SyntheticENV (4) Envir. samplesUNA (1) Unannotated

Functional - BulkEST (570) Expressed Sequence Tag GSS (197) Genome Survey SequenceHTG (88) High Throughput GenomicPAT (27) PatentSTS (9) Sequence Tagged SiteCON (1) Contigs, virtual

• Organizado por taxonomia• Submissões diretas (Sequin/Bankit)• Acuracidade (~1 error per 10,000 bp)• Bem caracterizado

• Organizado por tipo de sequencia• Submissões por (ftp/email) • Menos acurado• Pouco caracterizado

Divisões do GENBANK

Page 11: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

GenBankEST

STS

GSS

HTG

• Expressed Sequence Tag– Uma única passagem de leitura do cDNA

• Genome Survey Sequence– Uma única passagem de leitura do gDNA

• High Throughput Genomic– Seqüências incompletas de clones

• Sequence Tagged Site– PCR-based mapping reagents

GENBANK funcional

Page 12: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

Pouco caracterizada

Banco de Seqüências do tipo EST

Page 13: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

shred

Whole BAC insert (or genome)

isolate clonessequence

GSS divisionor trace archive

Draft sequence (HTG division)

assemblywhole genome shotgunassemblies (wgs projects)

GSS, HTG, WGS

Page 14: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

• Sequencias não concluidas de BAC• Gaps e pedaços fora de ordem

LOCUS AC141845 147720 bp DNA linear HTG 19-MAR-2004DEFINITION Apis mellifera clone CH224-4A2, WORKING DRAFT SEQUENCE, 14 unordered pieces.ACCESSION AC141845VERSION AC141845.1 GI:29124029KEYWORDS HTG; HTGS_PHASE1; HTGS_DRAFT.

HTG: Honeybee Draft Sequence

Page 15: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

685 projetos

Bactéria (320) Sequencias ambientais (14) Archaea (8) Eucariotos (140), incluem:

Frango, em ratinhos, ratos, cães (2), chimpanzé, humano Peixe (2) Abelha, Anopheles, moscas das frutas (3) Nematóides (2) As leveduras (8), Aspergillus (2) Arroz (2)

Genomas completos - Projetos Shotgun

Page 16: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

wgs master[properties]

ftp://ftp.ncbi.nih.gov/genbank/wgs/

Projetos Genomas Completos (WGS)

Page 17: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

GENBANK: procurando por seqüências

– Regiões regulatórias.– Regiões não-traduzíveis.– Regiões codificantes para proteínas.– Regiões intergênicas.

Page 18: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

Swiss-prot

Page 19: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

Swiss-prot

• O swiss-prot foi criado durante a tese de Amos Bairoch em 1986 ligado ao Swiss Institute of Bioinformatics (SIB).

• Contém todas as seqüências protéicas de proteínas com funções conhecidas.

• Swiss-prot está disponível no endereço eletrônico www.expasy.ch/sprot/ conectado ao servidor ExPAsy.

• ExPASy: Expert Protein Analysis System contém banco de dados + ferramentas on line úteis.

• Colaboração: European Bioinformatics Institute (EBI).

• Automated TrEMBL (TRanslation of EMBL nucleotide sequences)

Page 20: Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação

Típico swiss-prot entry

• Proteína• Função proteíca• bibliografia• Links com outros bancos:

– Estrutura– Domínio– Função