universidade federal de santa catarina programa de pós-graduação em bioquímica apoios aos alunos...
DESCRIPTION
Bioinformática. Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação. Florianópolis, 09 de novembro de 2010. Tópicos. Genbank Swiss-prot pdb. GENBANK. GENBANK. GENBANK: É um banco de seqüências de nucleotídeos e proteínas. - PowerPoint PPT PresentationTRANSCRIPT
Universidade Federal de Santa CatarinaPrograma de Pós-graduação em Bioquímica
Apoios aos alunos de graduação
Florianópolis, 09 de novembro de 2010.
Bioinformática
• Genbank
• Swiss-prot
• pdb
Tópicos
GENBANK
GENBANK:
• É um banco de seqüências de nucleotídeos e proteínas.
• Acesso irrestrito (grande parte) acessado pelo NCBI: http://www.ncbi.nlm.nih.gov
• Construído pelo National Center of Biothecnology Information (NCBI) em 1982.
COLABORAÇÕES:
• DNA Data Bank do Japão (DDBJ) • European Bioinformatics Institutes (EBI, Hinxtin, UK).
-> Todos estes centros recebem dados separadamente, estas informações são trocadas e integradas, de maneira que estes bancos contém o mesmo banco de dados, sendo grande parte deles disponível on line.
GENBANK
Bethesda, MD
O National Center for Biotechnology Information (NCBI)
Aceita submissões de seqüências primárias. Desenvolve ferramentas para analisar dados. Criação de bancos específicos baseados na seqüência
primária. Fornece pesquisa livre e links
Users per day
300,000
200,000
100,000
400,000
1998 1999 2000 2001 2002 2003 2004
500,000
600,000
2005
Christmas and New Year’s Day
U.S.U.S.(.com, .net, (.com, .net, .org,.org,
..govgov, .us), .us)40%40%
Japan 6%Italy 4%
Canada 3%Germany 3%
United Kingdom3%
Netherlands 2%Spain 2%Brazil 2%Sweden 1%Switzerland 1%Belgium1%
OtherOther14%14%
U.S.U.S.(.com, .net, (.com, .net, .org,.org,
..govgov, .us), .us)40%40%
Japan 6%Italy 4%
Canada 3%Germany 3%
United Kingdom3%
Netherlands 2%Spain 2%Brazil 2%Sweden 1%Switzerland 1%Belgium1%
OtherOther14%14%
Tráfego de navegação ao NCBI
65 milhões de pb61 milhões de seqüências
01/21/2007
9/19/2006
Organismo -TradicionalPRI (28) Primate ROD (15) Rodent PLN (20) Plant and FungalBCT (18) Bacterial/ArchealINV (7) InvertebrateVRT (7) Other VertebrateVRL (4) ViralMAM (2) MammalianPHG (1) PhageSYN (1) SyntheticENV (4) Envir. samplesUNA (1) Unannotated
Functional - BulkEST (570) Expressed Sequence Tag GSS (197) Genome Survey SequenceHTG (88) High Throughput GenomicPAT (27) PatentSTS (9) Sequence Tagged SiteCON (1) Contigs, virtual
• Organizado por taxonomia• Submissões diretas (Sequin/Bankit)• Acuracidade (~1 error per 10,000 bp)• Bem caracterizado
• Organizado por tipo de sequencia• Submissões por (ftp/email) • Menos acurado• Pouco caracterizado
Divisões do GENBANK
GenBankEST
STS
GSS
HTG
• Expressed Sequence Tag– Uma única passagem de leitura do cDNA
• Genome Survey Sequence– Uma única passagem de leitura do gDNA
• High Throughput Genomic– Seqüências incompletas de clones
• Sequence Tagged Site– PCR-based mapping reagents
GENBANK funcional
Pouco caracterizada
Banco de Seqüências do tipo EST
shred
Whole BAC insert (or genome)
isolate clonessequence
GSS divisionor trace archive
Draft sequence (HTG division)
assemblywhole genome shotgunassemblies (wgs projects)
GSS, HTG, WGS
• Sequencias não concluidas de BAC• Gaps e pedaços fora de ordem
LOCUS AC141845 147720 bp DNA linear HTG 19-MAR-2004DEFINITION Apis mellifera clone CH224-4A2, WORKING DRAFT SEQUENCE, 14 unordered pieces.ACCESSION AC141845VERSION AC141845.1 GI:29124029KEYWORDS HTG; HTGS_PHASE1; HTGS_DRAFT.
HTG: Honeybee Draft Sequence
685 projetos
Bactéria (320) Sequencias ambientais (14) Archaea (8) Eucariotos (140), incluem:
Frango, em ratinhos, ratos, cães (2), chimpanzé, humano Peixe (2) Abelha, Anopheles, moscas das frutas (3) Nematóides (2) As leveduras (8), Aspergillus (2) Arroz (2)
Genomas completos - Projetos Shotgun
wgs master[properties]
ftp://ftp.ncbi.nih.gov/genbank/wgs/
Projetos Genomas Completos (WGS)
GENBANK: procurando por seqüências
– Regiões regulatórias.– Regiões não-traduzíveis.– Regiões codificantes para proteínas.– Regiões intergênicas.
Swiss-prot
Swiss-prot
• O swiss-prot foi criado durante a tese de Amos Bairoch em 1986 ligado ao Swiss Institute of Bioinformatics (SIB).
• Contém todas as seqüências protéicas de proteínas com funções conhecidas.
• Swiss-prot está disponível no endereço eletrônico www.expasy.ch/sprot/ conectado ao servidor ExPAsy.
• ExPASy: Expert Protein Analysis System contém banco de dados + ferramentas on line úteis.
• Colaboração: European Bioinformatics Institute (EBI).
• Automated TrEMBL (TRanslation of EMBL nucleotide sequences)
Típico swiss-prot entry
• Proteína• Função proteíca• bibliografia• Links com outros bancos:
– Estrutura– Domínio– Função