anotação de sage tags rodrigo martins brandão. sage a bioinformática têm papel essencial para o...

Post on 17-Apr-2015

103 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Anotação de SAGE TagsAnotação de SAGE Tags

Rodrigo Martins Brandão

SAGESAGE

A Bioinformática têm papel essencial para o SAGE em três funções básicas:

extração e gerenciamento dos dados

anotação das tags

análise estatística (distribuição e comparações)

SAGESAGE

Contagem das Tags

Anotação das Tags

Análisedos dados

Experimento de SAGE

Extração das TagsExtração das Tags

Dados estão no formato de cromatogramas

Software de Base Calling (Ex.: Phred) para gerar a sequência do concatâmero no formato texto com seu valor de qualidade

Extração e contagem das tags

Contagem das TagsContagem das Tags

Localizar CATG

Extração dos Ditags (20 – 26 pb)

Descartar ditags duplicadas

Obter as 10 bases extremas, sendo reverso complementar a da direita

Descartar adaptadores (linkers) de sequências

Contagem das tags

Extração das TagsExtração das Tags

----CATGXXXXXXXXXXOOOOOOOOOOCATGXXXXXXXXXXOOOOOOOOOOCATG----

----GTACXXXXXXXXXXOOOOOOOOOOGTACXXXXXXXXXXOOOOOOOOOOGTAC----

ExemploExemplo

>SAGE-WT1-A0001-A01.abd 1047 0 1047 ABI

GGCAGTGAATTGTAATACGACTCACTATAGGGCGAATTGGGCCCTCTAATGCATGTTGACGTGCACTTCCGTAGCCTCATGTTTTATGGAATCACCTATTATGCCATGACTTTTTCAAAACTAGGCTGTGCCATGTTTACACAGTATGCACACATCTTCCATGGATGTGGACAGAAAATCCTCCAACATGATGGCAA

A tag em azul deverá ser a reversa complementar da sequência.

Contagem das TagsContagem das Tags

Softwares que fazem a extração e contagem das tag:

SAGE 300 – Zhang et al. (1997)

SAGE 2000 – Invitrogen, Inc. (I-SAGE)

eSAGE – Margulies & Innis (2000)

USAGE (On-line) – van Kampen el at. (2000)

SAGEnhaft (On-line) – Beissbarth et al. (2004)

SAGESAGE

Contagem das Tags

Anotação das Tags

Análisedos dados

Experimento de SAGE

Anotação de SAGE TagsAnotação de SAGE Tags

A anotação (ou mapeamento) das SAGE tags, nos permite dar sentido biológico aos resultados ao identificar uma tag.

Anotação de SAGE TagsAnotação de SAGE Tags

Tag, etiqueta, marcador, assinatura...

É uma sequência de nucleotídeos de 9-10 pb.

Uma Tag possui informação suficiente para a identificação de um transcrito único.

Anotação de SAGE TagsAnotação de SAGE Tags

Mais de 1 gene pode estar relacionado a mesma tag;

1 gene pode estar relacionado a 1 ou mais tags diferentes;

Principais ProblemasPrincipais Problemas

Erros de amostragens;

Erros de sequênciamento;

Possibilidade de tags não unívocas;

Transcritos que não geram tags utilizando uma dada enzima;

Sequências repetitivas;

Como Resolver?Como Resolver?

aumento do número de tags coletadas.

uso de tags mais longas.

uso de diferentes enzimas de restrição.

Anotação de SAGE TagsAnotação de SAGE Tags

1° Passo:

Preparar a bilioteca de SAGE

Biblioteca de SAGEBiblioteca de SAGE

Short SAGE: ~14 pb

Long SAGE: ~21 pb

Biblioteca de SAGEBiblioteca de SAGE

Short SAGE:

Tag Freq.

GCAGACCATA 1451AACAGTTCCA 931GCCAACTCGG 2CGTGCGGATT 1

Biblioteca de SAGEBiblioteca de SAGE

Número de tags de uma biblioteca:

Soma das frequências de todas as tags

Número de tags únicas de uma biblioteca

quantidade de tags únicas existente

Biblioteca de SAGEBiblioteca de SAGE

Quanto maior o número de bibliotecas de um mesmo organismo melhor.

As bibliotecas devem ser normalizadas.

Biblioteca de SAGEBiblioteca de SAGE

Gerar a lista das CSTs (Confident SAGE Tag):

Remover tags com frequência igual a 1;

Remover linkers de sequências

linkers com variação de 1pbAAAAAAAAAA – AAAAAAAAAT

Anotação de SAGE TagsAnotação de SAGE Tags

2° Passo:

Extrair as Tags Virtuais

Anotação de SAGE TagsAnotação de SAGE Tags

Tag Virtual: é uma “tag” extraída computacionalmente.

Encontrada nos 10 pb posterior ao sítio da enzima NlaIII na região 3' UTR em mRNA.

Extração das Tags VirtuaisExtração das Tags Virtuais

O sítio da enzima NlaIII é identificado pelas bases CATG.

5' 3'CGACGGTCATGAAATCGATACCGAAAAA

Extração das Tags VirtuaisExtração das Tags Virtuais

Cauda de Poli-A:

quantidade de “A” nas ultimas bases.

Sinal de Poli-A:

AATAAA e ATAAAA nas últimas 50 bases.

Anotação de SAGE TagsAnotação de SAGE Tags

3° Passo:

Relacionar as informações

SAGE Tags x Tag VirtualSAGE Tags x Tag Virtual

Relacionar Tag ao Gene

Pode-se encontrar mais de uma tag relacionada a um mesmo gene.

Qual a melhor Tag para o Gene?

Ranking

Tag com alta expressão (Maior pontuação).

Tag virtual interna (Menor pontuação).

RankingRanking

a tag mais próxima a região 3' de mRNAs com cauda poli-A;

a tag mais próxima a região 3' de ESTs com cauda de poli-A (ou cabeça de poli-T);

a tag mais próxima a região 3' de mRNAs com sinal de poli-A;

a tag mais próxima a região 3' de mRNAs sem sinal e sem cauda poli-A;

tags internas (as tags de número 4, 3 e 2) de mRNAs;

Extração das Tags VirtuaisExtração das Tags Virtuais

Onde encontrar os transcritos?

Banco de dados públicos: UniGene, RefSeq.

Caso não tenha, pode-se usar organismo filogeneticamente próximos para obter uma anotação prévia.

LinksLinks

SAGEmaphttp://www.ncbi.nlm.nih.gov/projects/SAGE

SAGEGeniehttp://cgap.nci.nih.gov/SAGE

top related