lgcmurlga 3.1 introdução definições: genoma: conjunto completo de genes de um organismo...
TRANSCRIPT
LGCM URLGA
3.1 Introdução
Definições:
• Genoma: Conjunto completo de genes de um organismo
• Transcriptoma: Conjunto completo de genes expressos sob certas condições
• Proteoma: Conjunto completo de proteínas
LGCM URLGA
Número de genes
Número de ORF’s
(define o potencial do genoma)
Análise do transcriptoma
(genes expressos em determinadas células e tecidos)
LGCM URLGA
3.2 Mapeamento Genômico
Definições:
• Mapa genético: define a distância entre mutações em termos de freqüência de recombinação
• Mapa por restrição: Digestão do DNA com enzimas de restrição e medição da distância entre os sítios de quebra
• Mapa definitivo: conseguido através do seqüenciamento do DNA
URLGA
3.2 Variação genômica
Polimorfismo
Fenotípico: função do gene é afetada
Fragmento de restrição: sítio alvo de enzima é afetado
Seqüência: análise direta do DNA
• RFLP (Restriction Fragment Length Polymorphism): diferença no mapa de restrição entre dois (ou mais) indivíduos
3.4- RFLPs and SNPs can be used for genetic mapping
• RFLPs e SNPs são úteis para a construção de mapas de ligação e testes de paternidade.
• Mapeamento genético:marcadores: RFLPs, SNPsgenótipo e/ou fenótipo de interesse
freqüência de recombinação
3.4- RFLPs and SNPs can be used for genetic mapping
• O conjunto de determinados sítios de restrição, genes ou outros marcadores chama-se haplótipo.
• O alto polimorfismo de RFLPs e SNPs garante que cada indivíduo tenha um componente genético único.
paternidade
3.4- RFLPs and SNPs can be used for genetic mapping
• Polimorfismos de restrição ocorrem aleatoriamente em todo o genoma.
• Existe a possibilidade de 100% de ligação entre o sítio de restrição e o gene de interesse.
diagnóstico, mapeamento e isolamento do gene
3.4- RFLPs and SNPs can be used for genetic mapping
• Polimorfismos de restrição ocorrem aleatoriamente em todo o genoma.
• Existe a possibilidade de 100% de ligação entre o sítio de restrição e o gene de interesse.
diagnóstico, mapeamento e isolamento do gene
3.5- Why are genomes so large?
• Não há relação clara entre o tamanho do genoma e a complexidade genética.
• No entanto, entre os diferentes filos há a necessidade de um aumento mínimo do genoma, o que pode ser refletido em um aumento da complexidade anatômica e fisiológica.
3.5- Why are genomes so large?
• Não é possível concluir a partir do tamanho do genoma o número de genes de um indivíduo.
• A complexidade não pode ser determinada apenas pelo tamanho do código genético.
3.6- Eukaryotic genomes contain both nonrepetitive and repetitive DNA sequences
• Seqüências não repetitivas de DNA.• Seqüências repetitivas de DNA.moderadamente repetitivas: 10 – 1000 cópias
Transposons: podem ocupar mais da metade do genoma de um eucarioto
muito repetitivas: milhares de cópias
3.6- Eukaryotic genomes contain both nonrepetitive and repetitive DNA sequences
• Repetições podem ser um indicativo do potencial codificador do genoma, pois mRNAs originam-se geralmente de seqüências não repetitivas.
O número genes bacterianos varia uma ordem de magnitude
NÚMERO DE GENES EM BACTÉRIAS
Parasitas intracelulares obrigatórios: genoma de até 1,5 Mb
Redução do nº de genes (metabolismo e regulação da expressão)
Mycoplasma genitalium - ~ 470 genes
O tamanho do genoma é proporcional ao número de genes.
Archaea: genoma 1,5 – 3 Mb (1.500 – 2.700 genes)
Bactérias de vida livre: 1,5 < 8 Mb
Aquifex aeolicus – 1,5 Mb – 1512 genes
S. meliloti - ~ 7 Mb - ~ 6000 genes
Existe variação entre linhagens:
E. coli – 4,6 Mb (4249 genes) até 5,5 Mb (5361 genes).
FUNÇÃO GÊNICA
~ 60% dos genes podem ser identificados por homologia com genes conhecidos de outras espécies
Genes relacionados com metabolismo, estrutura celular, transporte e regulação da expressão gênica
~ 25% dos genes não se conhece função
O número total de genes é conhecido para algumas espécies
Em eucariotos parece não existir uma relação entre o tamanho do genoma e o nº de genes dos organismos.
D. melanogaster possui um genoma maior que o de C. elegans entretanto seu nº de genes é menor
Resultado de splicing alternativo
A. taliana possui um genoma maior do que o do C. elegans
Somente 35% dos genes são cópia única
Oryza sativa X Arabidopsis taliana
Genoma 4x maior, porém apenas 50% mais genes
42-45% do genoma constituído por DNA repetitivo
80% dos genes de A. taliana estão presentes em Oryza sativa
Destes, 8000 são encontrados apenas em plantas
FUNÇÃO GÊNICA
Tamanho das proteínas:
Aumenta de procariotos e archaea para eucariotos
PORÉM
Isto representa um aumento muito pequeno no tamanho do genoma destes organismos
Número de genes expressos?
Quantos tipos diferentes de genes existem?
Somente alguns genes são únicos e sua proporção diminui com o aumento do tamanho do genoma
O número de diferentes tipos de genes de um organismo em geral é menor que o número total de genes deste organismo
Grande parte dos genes são agrupados em famílias, de acordo com a sequência de seus exons.
Duplicação gênica
Mesma proteína Proteínas relacionadas
Genes ortólogos – genes que codificam proteínas correspondentes em diferentes organismos.
80% de similaridade
Pseudogenes – cópias de genes que se tornaram não-funcionais (devido a mutações, principalmente).
Em homens e camundongos estima-se que 10% do total de genes são pseudogenes.
LGCM URLGA
3.10 A conservação da organização do genoma ajuda a identificação de genes.
Organização dos genes ativos: - O primeiro exon vem imediatamente após o promotor - Os exons interiores são flanqueados por regiões de corte- O último exon é seguido pela região 3’- A janela de leitura começa com códon de iniciação e finaliza com o códon de terminação.
Dificuldades na identificação dos genes ativos:-Algorítmos utilizados para conectar exons não são muito eficientes quando os genomas são muito grandes e há grandes distâncias entre os exons-Distinguir genes ativos de pseudogenes
-Essas dificuldades podem ser amenizadas comparando as regiões dos genes com genomas de diferentes espécies.
3.11 O genoma humano tem menor número de genes do que o esperado
- Somente 1% do genoma humano consiste em regiões codificadoras- O genoma humano tem entre 30.000- 40.000 genes- Os exons compreendem aproximadamente 5% do gene- Há splicing alternativo em aproximadamente 60% dos genes humanos
3.12 Distribuição dos genes e de outras seqüências no genoma
45% Transposons 1% Exons24% Introns 5% Grandes regiões duplicadas (10-300kb) 3% Pequenas repetições22% Outros DNAs intergénicos
Espécies mais complexas evoluem Espécies mais complexas evoluem pela adição de novos genes pela adição de novos genes
A comparação da seqüência do genoma humano com as seqüências encontradas em outras espécies, revela características do processo evolutivo.
Metabolismo básico, replicação, transcrição e tradução
Organelas, componentes do citoesqueleto
Diferenciação dos tecidos
Poucos codificam para enzimas – origem ancestral
Bactérias Vertebrados
Adição de grupos gênicos, representando as novas funções
necessárias em cada estágio
Espécies mais complexas evoluem Espécies mais complexas evoluem pela adição de novos genes pela adição de novos genes
A comparação da seqüência do genoma humano com as seqüências encontradas em outras espécies, revela características do processo evolutivo.
Cerca de 1300 proteínas são comuns ao proteoma de leveduras, vermes, moscas e humanos.
35%
22%12%
10%
8%
Proteoma humano
Muitas proteínas novas comparado com o de outros eucariotos
Relativamente, poucos domínios proteícos novos
A maioria é comum ao reino animal
Combinações de domínios novas (arquiteturas proteícas diferentes)
Adição de funções requeridas para a interação entre as
células
Quantos genes são essenciais?Quantos genes são essenciais?
Manutenção de um gene ao longo da evolução
Confere uma vantagem seletiva para o organismo
Mas quantos, realmente, são essenciais, ou seja, sua ausência é letal para o organismo ?
Determinar o número de genes essenciaisAnálise mutacional
Mycoplasma genitalium - ~2/3 dos genes são essenciais
E. coli – pouco menos da metade dos genes parece ser essencial
S. cerevisiae – 18,7% dos genes são essenciais para o crescimento em meio rico
Cerca de 50% dos genes envolvidos com a síntese protéica são
essenciais
Análise sistemática dos efeitos da perda de função para 86% dos genes de C. elegans
Genes conservados tendem a preencher funções mais básicas, e essenciais;
proporção de genes essenciais dentre aqueles que se apresentam em apenas uma cópia por genoma haplóide.
Muitos genes letais podem atuar tão precocemente, que nunca vemos seus efeitos.
A maioria dos defeitos genéticos conhecidos são devidos a
mutações de ponto
Mas como explicar a sobrevivência de genes cuja deleção parece não ter efeito?
Redundância
Esses genes, na verdade, têm efeitos significantes sobre o fenótipo no mínimo durante a evolução, não sendo evidentes para nós.
Os genes são expressos em diferentes níveisOs genes são expressos em diferentes níveis
Em qualquer célula, a maioria dos genes são expressos em uma baixo nível.
Apenas um pequeno número de genes, cujos produtos são especializados para o tipo celular, são altamente expressos.
A proporção de DNA representada em uma população de mRNA pode ser determinada pela quantidade de DNA que pode hibridizar com o RNA.
Tecidos somáticos de eucariotos superiores, geralmente, expressam de 10 a 15 mil genes.
Metade da massa representa um único
mRNA
15% da reação, complexidade de 15 Kb, correspondendo a 7-8
espécies de mRNA
35% da reação, complexidade de 26 Mb,
que corresponde a ~13000 espécies de
mRNA
Células eucarióticas expressam aproximadamente de 10.000 a 20.000 genes.
Quantos desses genes são expressos em diferentes tecidos?
Quantos genes são específicos para cada tecido?
Essas questões são geralmente respondidas analisando o transcriptoma.
3.16 Quantos genes são expressos?
Existem diferenças substanciais entre genes expressos em larga escala.
Mas os mRNAs abundantes representam uma pequena proporção dos genes expressos.
Para analisar diferenças entre transcritos de tecidos diferentes, é necessário saber a extensão das interseções no mRNA de pequena escala.
Por exemplo, ~75% dos genes expressos no fígado e no oviduto são iguais.
~12.000 genes são expressos tanto no fígado quanto no oviduto.
~5000 genes adicionais são expressos apenas no fígado.
~3000 genes adicionais são expressos apenas no oviduto.
mRNA expressos em pequena escala sobrepõe-se extensivamente.
90% desse mRNA escasso são idênticos entre rim e fígado de camundongos.
Portanto, apenas 10% do mRNA é único para cada tecido.
Isso sugere que a maior parte dos genes exercem funções necessárias em todos tipos celulares. São constitutivos (housekeeping genes).
3.17 O número de genes expressos pode ser medido em massa
3.18 Organelas possuem DNA
Mitocônndria e cloroplastos possuem genomas que não apresentam herança Mendeliana.
Genomas de organelas realizam segregação somática em plantas
Comparações de DNA mitocondrial sugere que os seres humanos descendem de uma única fêmea que viveu a 200.000 anos na África.
• Formado, geralmente, por moléculas
circulares de DNA
• uma organela apresenta várias cópias de
seu genoma
• Genomas de cloroplastos são
relativamente grandes
3.19 Genomas de organelas são DNAs circulares que codificam as proteínas das organelas
• mitocondrias mostram tamanhos variados de genoma– o número de genes codificadores de proteínas é
pequeno– a maior parte é codificadora de componentes das
subunidades dos complexos da respiração I-IV– genes codificadores de RNA
• Genoma mitocondrial apresenta introns, exceto nos mamíferos
– não há introns e alguns genes se
sobrepõem
– as proteínas estão envolvidas na
respiração
• mtDNA de levedura é 5x maior
do que o animal devido à
presença de longos introns– ocorre maior dispersão de loci
3.20 Organização do DNA mitocondrial é variável• DNA mitocondrial de células animais é compacto e codifica 13 proteínas, 2 rRNAs e 22 tRNAs
3.21 Mitocondria evoluiu por endossimbiose• Células primitivas capturaram bactérias que forneciam as
funções de mitocondrias e cloroplastos• Homologias em seqüências sugerem que mitocondrias e
cloroplastos evoluíram separadamente• organelas devem ter transferido genes essenciais para o
núcleo da célula- transferência ocorreu ao longo de períodos
evolucionários e ainda continua- mudanças na seqüência são necessárias
para o sucesso da expressão
3.22 O Genoma do cloroplasto codifica várias proteínas e RNAs
• Cloroplastos apresentam DNA com tamanho variado: 120-190 kb
• codifica todos os rRNAs e tRNAs necessários para a síntese protéica, e aproximadamente 50 proteínas
• os genes da organela podem ser transcritos e traduzidos pelo aparato da mesma
• a origem endossimbiótica do cloroplasto é enfatizada pelas
relações entre seus genes e seus correspondentes
bacterianos
• muitos genes dos cloroplastos codificam proteínas que
compõem complexos localizados nas membranas dos
tilacóides