anotação de sage tags rodrigo martins brandão. sage a bioinformática têm papel essencial para o...
Post on 17-Apr-2015
103 Views
Preview:
TRANSCRIPT
Anotação de SAGE TagsAnotação de SAGE Tags
Rodrigo Martins Brandão
SAGESAGE
A Bioinformática têm papel essencial para o SAGE em três funções básicas:
extração e gerenciamento dos dados
anotação das tags
análise estatística (distribuição e comparações)
SAGESAGE
Contagem das Tags
Anotação das Tags
Análisedos dados
Experimento de SAGE
Extração das TagsExtração das Tags
Dados estão no formato de cromatogramas
Software de Base Calling (Ex.: Phred) para gerar a sequência do concatâmero no formato texto com seu valor de qualidade
Extração e contagem das tags
Contagem das TagsContagem das Tags
Localizar CATG
Extração dos Ditags (20 – 26 pb)
Descartar ditags duplicadas
Obter as 10 bases extremas, sendo reverso complementar a da direita
Descartar adaptadores (linkers) de sequências
Contagem das tags
Extração das TagsExtração das Tags
----CATGXXXXXXXXXXOOOOOOOOOOCATGXXXXXXXXXXOOOOOOOOOOCATG----
----GTACXXXXXXXXXXOOOOOOOOOOGTACXXXXXXXXXXOOOOOOOOOOGTAC----
ExemploExemplo
>SAGE-WT1-A0001-A01.abd 1047 0 1047 ABI
GGCAGTGAATTGTAATACGACTCACTATAGGGCGAATTGGGCCCTCTAATGCATGTTGACGTGCACTTCCGTAGCCTCATGTTTTATGGAATCACCTATTATGCCATGACTTTTTCAAAACTAGGCTGTGCCATGTTTACACAGTATGCACACATCTTCCATGGATGTGGACAGAAAATCCTCCAACATGATGGCAA
A tag em azul deverá ser a reversa complementar da sequência.
Contagem das TagsContagem das Tags
Softwares que fazem a extração e contagem das tag:
SAGE 300 – Zhang et al. (1997)
SAGE 2000 – Invitrogen, Inc. (I-SAGE)
eSAGE – Margulies & Innis (2000)
USAGE (On-line) – van Kampen el at. (2000)
SAGEnhaft (On-line) – Beissbarth et al. (2004)
SAGESAGE
Contagem das Tags
Anotação das Tags
Análisedos dados
Experimento de SAGE
Anotação de SAGE TagsAnotação de SAGE Tags
A anotação (ou mapeamento) das SAGE tags, nos permite dar sentido biológico aos resultados ao identificar uma tag.
Anotação de SAGE TagsAnotação de SAGE Tags
Tag, etiqueta, marcador, assinatura...
É uma sequência de nucleotídeos de 9-10 pb.
Uma Tag possui informação suficiente para a identificação de um transcrito único.
Anotação de SAGE TagsAnotação de SAGE Tags
Mais de 1 gene pode estar relacionado a mesma tag;
1 gene pode estar relacionado a 1 ou mais tags diferentes;
Principais ProblemasPrincipais Problemas
Erros de amostragens;
Erros de sequênciamento;
Possibilidade de tags não unívocas;
Transcritos que não geram tags utilizando uma dada enzima;
Sequências repetitivas;
Como Resolver?Como Resolver?
aumento do número de tags coletadas.
uso de tags mais longas.
uso de diferentes enzimas de restrição.
Anotação de SAGE TagsAnotação de SAGE Tags
1° Passo:
Preparar a bilioteca de SAGE
Biblioteca de SAGEBiblioteca de SAGE
Short SAGE: ~14 pb
Long SAGE: ~21 pb
Biblioteca de SAGEBiblioteca de SAGE
Short SAGE:
Tag Freq.
GCAGACCATA 1451AACAGTTCCA 931GCCAACTCGG 2CGTGCGGATT 1
Biblioteca de SAGEBiblioteca de SAGE
Número de tags de uma biblioteca:
Soma das frequências de todas as tags
Número de tags únicas de uma biblioteca
quantidade de tags únicas existente
Biblioteca de SAGEBiblioteca de SAGE
Quanto maior o número de bibliotecas de um mesmo organismo melhor.
As bibliotecas devem ser normalizadas.
Biblioteca de SAGEBiblioteca de SAGE
Gerar a lista das CSTs (Confident SAGE Tag):
Remover tags com frequência igual a 1;
Remover linkers de sequências
linkers com variação de 1pbAAAAAAAAAA – AAAAAAAAAT
Anotação de SAGE TagsAnotação de SAGE Tags
2° Passo:
Extrair as Tags Virtuais
Anotação de SAGE TagsAnotação de SAGE Tags
Tag Virtual: é uma “tag” extraída computacionalmente.
Encontrada nos 10 pb posterior ao sítio da enzima NlaIII na região 3' UTR em mRNA.
Extração das Tags VirtuaisExtração das Tags Virtuais
O sítio da enzima NlaIII é identificado pelas bases CATG.
5' 3'CGACGGTCATGAAATCGATACCGAAAAA
Extração das Tags VirtuaisExtração das Tags Virtuais
Cauda de Poli-A:
quantidade de “A” nas ultimas bases.
Sinal de Poli-A:
AATAAA e ATAAAA nas últimas 50 bases.
Anotação de SAGE TagsAnotação de SAGE Tags
3° Passo:
Relacionar as informações
SAGE Tags x Tag VirtualSAGE Tags x Tag Virtual
Relacionar Tag ao Gene
Pode-se encontrar mais de uma tag relacionada a um mesmo gene.
Qual a melhor Tag para o Gene?
Ranking
Tag com alta expressão (Maior pontuação).
Tag virtual interna (Menor pontuação).
RankingRanking
a tag mais próxima a região 3' de mRNAs com cauda poli-A;
a tag mais próxima a região 3' de ESTs com cauda de poli-A (ou cabeça de poli-T);
a tag mais próxima a região 3' de mRNAs com sinal de poli-A;
a tag mais próxima a região 3' de mRNAs sem sinal e sem cauda poli-A;
tags internas (as tags de número 4, 3 e 2) de mRNAs;
Extração das Tags VirtuaisExtração das Tags Virtuais
Onde encontrar os transcritos?
Banco de dados públicos: UniGene, RefSeq.
Caso não tenha, pode-se usar organismo filogeneticamente próximos para obter uma anotação prévia.
LinksLinks
SAGEmaphttp://www.ncbi.nlm.nih.gov/projects/SAGE
SAGEGeniehttp://cgap.nci.nih.gov/SAGE
top related