seleção genômica: estado da arte e novas...
TRANSCRIPT
Seleção genômica: Estado da
arte e novas ferramentas
Flávio S. Schenkel Professor
Auditório da Farsul – Porto Alegre/RS , 9 de Agosto, 2012
1º Workshop – Seleção genômica para resistência ao
carrapato bovino nas raças Hereford e Braford
Pesquisa e Implementação de
seleção genômica no Canadá
Flávio S. Schenkel
Porto Alegre, 10 de Julho de 2009
Ferramentas Genômicas
3 Anos Atrás
- Nenhum projeto de seleção genômica em
andamento no Brazil
- Porém bastante interesse nesta área
1o projeto no Canada: 2004
5 anos para implementar seleção genômica
em gado leiteiro (Holandês)
Ferramentas Genômicas
3 Anos Atrás
- Vários projeto de seleção genômica em
andamento:
- Zebu leiteiro: Dr. Marcos Vinicius da Silva, EMBRAPA
- Búfalo: Dr. Humberto Tonhati, UNESP-Jaboticabal
- Nelore: Dr. Fernando Garcia, UNESP-Araçatuba
Dra. Lúcia Galvão, UNESP-Jaboticabal
- Hereford/Braford: Dr. Fernando Cardoso, EMBRAPA
Conexão DeltaG
Ferramentas Genômicas
3 Anos Depois
Genômica não é magia.
Há pouco valor em:
– Conhecer a sequência genômica;
– Ter painéis de marcadores de alta densidade;
Se estas informações não forem traduzidas em
ferramentas úteis e práticas.
Ferramentas Genômicas
Preâmbulo
As ferramentas genômicas incluem:
• Ferramentas básicas: SNP chips,
Microarranjos, etc.
• Ferramentas de aplicação básica:
Mapeamento de genes/QTL, imputação de
genótipos e haplótipos, etc.
• Ferramentas de aplicação prática: Testes
genéticos, avaliação genômica, verificação
e descoberta de paternidade, etc.
Ferramentas Genômicas
Preâmbulo
Esta apresentação focará principalmente
na pesquisa e ferramentas desenvolvidas
no CGIL, na Universidade de Guelph,
Canada.
Elas incluirão:
• Ferramentas de aplicação básica
• Ferramentas de aplicação prática
Ferramentas Genômicas
Preâmbulo
T
C
2
C
1
A
G
1
G
2
Conceitos:
Desequilíbrio de ligação (DL) entre um marcador e um gene
A
G
C
1
1
T
C
G
2
2
Crossover Alta recombinação
Baixa recombinação
Baixíssima recombinação
Ferramentas Genômicas
Preâmbulo
Fase de ligação (FL) entre um marcador e um gene
A
G
C
1
1
T
C
G
2
2
1 e G estão em fase de acoplamento
1 e C estão em fase de repulsão
Se não há recombinação, as fases
seriam as mesmas entre famílias
A
C
C
1
1
T
G
G
2
2
Família 1 Família 2
Ferramentas Genômicas
Preâmbulo
Fase de ligação entre um marcador e um gene
A
G
C
1
1
T
C
G
2
2
Note que os genótipos são os
mesmos nos dois casos:
- GC para o marcador
- 12 para o gene
A
C
C
1
1
T
G
G
2
2
Família 1 Família 2
Obs: Apenas o genótipo do
marcador será conhecido
através da genotipagem.
Ferramentas Genômicas
Preâmbulo
Evento Ano
• Sequência completa do genoma bovino 2004
• Painel de 10000 SNP 2006
- Pesquisa genômica básica; Primeiras predições genômicas 2006/07
• Painel de 50000 SNP 2007
- Primeiras avaliações genômicas oficiais (HO, JE) 2009
• Painel de 3000 SNP 2010
- Primeiras avaliações genômicas com genótipos imputados 2010
• Painel de 777k SNP e 6000 SNP 2011
• Primeiros sequenciamentos de ancestrais importantes 2010/11
• Imputação ao nível da sequência 2012
Ferramentas genômicas básicas e práticas através dos anos
Ferramentas Genômicas
Preâmbulo
Padrão de DL no genoma- Exemplo no Holandês
(Bohanova et al. 2010. BMC Genomics, 11:421)
Ferramentas Genômicas
Ferramentas de aplicação básicas
Distância (Mb)
Extensão do DL no genoma- Exemplo no Holandês
(Sargolzaei et al. 2008. JDS 91:2106-2117)
Ferramentas Genômicas
Ferramentas de aplicação básicas
Frequência e média do r2 para distâncias pequenas entre
pares de SNPs sintênicas
Distância (Mb) Pares (n) r2 ± EP Freq. r2>0.30 (%)
0
0,2
0,4
0,6
0,8
1
1,2
Ayrshire-Holstein
Ayrshire-Guernsey
Holstein-Guernsey
r= 0.93 - 0.96
Avaliação multi-raças ? (Larmer, S. 2012. MSc. Thesis)
Distância (cM)
Corr
ela
ção
Consitência da FL - Exemplo entre 3 raças leiteiras
usando um painel de alta densidade (777 k)
Ferramentas Genômicas
Ferramentas de aplicação básicas
Software para avaliação do DL
C++ para plataformas
Windows ou Linux
(Sargolzaei et al. 2008. JDS 91:2106-2117)
Ferramentas Genômicas
Ferramentas de aplicação básicas
Simulator genômico – Um exemplo
(Brito et al. 2011. BMC Genetics, 12:80)
Ferramentas Genômicas
Ferramentas de aplicação básicas
Número de animais no grupo de treinamento
Acu
ráci
a
h2 40 k SNP
Simulador Genômico
(Sargolzaei and Schenkel. 2009.
Bioinformatics, 25: 680-681)
Ferramentas Genômicas
Ferramentas de aplicação básicas
C++ para plataformas
Windows ou Linux
Imputação de um painel de SNPs de baixa densidade
para um painel de alta densidade
- Grande impacto no número de fêmeas genotipadas
- Grande impacto na quantidade de informação genômica
disponível
Imputação
Exemplo: de 3 ou 6 k SNPs para 50k ou 777k SNPs
Ferramentas Genômicas
Ferramentas de aplicação básicas
Imputação baseada na informação da família:
Touro - AD Vaca - AD
Progênie- BD
Ferramentas Genômicas
Ferramentas de aplicação básicas
(Sargolzaei et al., JDS 2008)
Imputação baseada na informação da população:
Método baseado janelas sobrepostas.
Atribuição da fase de ligação e imputação são feitos
simultaneamente.
Haplótipos longos são procurados e atribuídos
primeiro para capturar parentesco próximo e, então,
haplótipos pequenos são procurados para capturar
parentescos distantes.
Método é deterministico e, portanto, muito rápido.
Ferramentas Genômicas
Ferramentas de aplicação básicas
Software para imputação genômica
(Sargolzaei et al. 2012. PAG Meeting)
Ferramentas Genômicas
Ferramentas de aplicação básicas
C++ para plataformas
Windows ou Linux
Família + População
Fimpute – Um estudo de validação
(Sargolzaei et al. 2012. PAG Meeting)
Ferramentas Genômicas
Ferramentas de aplicação básicas
99,2 99,2 99,1
98,1 97,9 97,7 97,6 97,1 97,1
92,2
93,8
92,9
90,0
95,0
100,0
HO JE BS
50-50 50-3 50-U U-U
Validação (animais jóvens): Genótipos 50k de animais nascidos
>2009 para HO e JE e >2008 para PS foram reduzidos para 3k e 6k.
Referência (animais velhos): Animais com genótipos 50k mais velhos
do que os animais de Validação.
PS
Validação
Referência
Fimpute – Um estudo de validação
(Sargolzaei et al. 2012. PAG Meeting)
Ferramentas Genômicas
Ferramentas de aplicação básicas
99,2 99,2 99,1
98,1 97,9 97,7 97,6 97,1 97,1
92,2
93,8
92,9
90,0
95,0
100,0
HO JE BS
50-50 50-3 50-U U-U
Imputação de 3k para 50k SNP
Genótipo do Pai-Mãe
Acu
ráci
a
PS
Fimpute – Um estudo de validação
(Sargolzaei et al. 2012. PAG Meeting)
Ferramentas Genômicas
Ferramentas de aplicação básicas
Imputação de 6k para 50k SNP
Genótipo do Pai-Mãe
Acu
ráci
a
PS
Fimpute – Um estudo de validação
(Sargolzaei et al. 2012. PAG Meeting)
Ferramentas Genômicas
Ferramentas de aplicação básicas
Imputação no Pardo Suiço
Software
Acu
ráci
a
Imputação em gado de corte
Ferramentas Genômicas
Acurácia da imputação em Angus
puros: 4732 ref. (497 AN), 100 imp.
Acurácia da imputação em cruzados:
4732 ref. , 146 imp.
Ferramentas de aplicação básicas
Marcadores em EL Marcadores em DL Marcadores diretos
Famílias
Marcadores esparsos
População
Marcadores densos
População
Esparso/Denso
Mais fáceis usar
M M M
Marcadores
genéticos
Difíceis de usar Fáceis de usar
Seleção genômica
Ferramentas Genômicas
Ferramentas de aplicação práticas
Ferramentas Genômicas
Ferramentas de aplicação práticas
Avaliações genômicas
Predição do potencial
genético dos
animais e parentes
DEP genômica
Seleção
Modelo
infinitesimal
BLUP / Bayes
Marcadores
genéticos
Medidas nos animais
Produção
Tipo
Reprodução
Auxiliares
Pedigree
2 passos 1 passo
O que é?
O uso de painéis densos de marcadores genéticos
distribuídos em todo o genoma para estimar valores
genéticos dos animais baseado no disequilíbrio de
ligação (DL).
Pressuposição: Existem marcadores suficientes para
capturar a maior parte da variação genética.
Limitação: Grande número de efeitos para estimar.
Densidade do painel vs. DL
Métodos estatísticos
Seleção genômica
Ferramentas Genômicas
Ferramentas de aplicação práticas
Software para predição de DEPs genômicas
(Sargolzaei et al. 2009. DCBGC
Meeting, Oct. 7, 2009)
Ferramentas Genômicas
Ferramentas de aplicação práticas
C++ para plataformas
Windows ou Linux
Métodos: Gblup ou
Regressão Cumeeira
em 2 Passos
Ferramentas Descrição Uso adicional
Reconstrução
de haplótipos e
imputação
Imputação:
• de genótipos perdidos
• de 3k/6k para 50k/777k
• de 50k para 777k
- Aumento da informação genômica
- Redução do custo de genotipagem
- Ajuda no mapeamento fino de genes/QTL
- Detecção de haplótipos deletérios
Relações
genômicas
Construção da matriz de
relacinamento genômico
- Endogamia genômica
- Verificação e descoberta de parentesco
De-regressão De-regressão das DEP,
usando todo o pedigree
- Mapeamento fino de genes/QTL
Treinamento
dos efeitos dos
marcadores
Usando DEPs ou
fenótipos
- Mapeamento fino de genes/QTL
- Testes genéticos
Edição dos
dados
• Conflitos pais-progênie
• Conflitos de sexo e raça
- Verificação e descoberta de parentesco
- Confirmação da raça
Muitos etapas e muitas ferramentas genômicas envolvidas
Ferramentas Genômicas
Seleção genômica
Validação – Ganho em confiança da MPG
comparado com a MP em HO no Canadá
Treinamento 4121 ~1100 domésticas
524 Validação
MP MPG Aumento
Prod. (n=3) 0.39 0.64 0.25
Escore de CS 0.37 0.54 0.17
Tipo (n=5) 0.37 0.58 0.21
(Schenkel et al. 2009. Interbull meeting)
Ferramentas Genômicas
Seleção genômica
Accurácia Intervalo entre
gerações
i RT RG LT LG i x RT i x RG
Pai de touros 2.06 0.99 0.75 6.5 1.75 2.04 1.54
Pai de vacas 1.40 0.75 0.75 6.0 1.75 1.05 1.05
Mãe de touros 2.42 0.60 0.75 5.0 2.0 1.45 1.82
Mãe de vacas 0.27 0.50 0.50 4.25 4.25 0.14 0.14
Total 21.75 9.75 4.68 4.55
Tradicional: 4.68/21.75 = 0.215
Genômico: 4.55/ 9.75 = 0.467
Ganho genético anual esperado:
O dobro com 8% do custo
Simulação – Schaeffer (2006). J. Anim. Breed. Genet. 123: 218–223
Ferramentas Genômicas
Seleção genômica
Impacto da avaliação genômica
(Van Doormaal 2012. CDN article, July 2012)
Ferramentas Genômicas
Ferramentas de aplicação práticas
Tendência genética- Tourinhos HO ofertados no Canada (índice GLPI)
Ganho: 445 pontos/ano
Ganho: 210 pontos/ano
Ganho: 109 pontos/ano
Semestre
GLP
I m
éd
io
Voltando ao mapeamento fino
Ferramentas Genômicas
Ferramentas futuras
163 vacas HO: 81 alta RIMA e 82 baixa RIMA
Genotipadas com Illumina Bovine SNP50
BeadChip
Exemplo: Resposta imune mediada por anti-corpos (RIMA)
Estudo de associação: Método Generalizado de Quase-
Verossimilhança (Feng et al., 2011)
(Thompson-Crispi, K. 2012. Ph.D. Thesis)
Voltando ao mapeamento fino
Ferramentas Genômicas
Ferramentas futuras
Diagrama de Manhattan para resposta imune mediada por anti-corpos em gado HO.
Cromossomo
(Thompson-Crispi, K. 2012. Ph.D. Thesis)
Voltando ao mapeamento fino
Ferramentas Genômicas
Ferramentas futuras
Caminho do processamento e apresentação antígena associada com RIMA. Em
vermelho, os genes associados com RIMA.
(Thompson-Crispi, K. 2012. Ph.D. Thesis)
Painéis de alta densidade x Avaliação multi-raças
Ferramentas Genômicas
Ferramentas futuras
Acurácia da predição genômica (r[DEPG,DF]) obtida com GBlup
(Erbe et al. 2012. J. Dairy Sci. 95 :4114–4129)
Validação Referência
Holandês
Combinado
Holandês Jersey Holandês Jersey Holandês Jersey
Jersey
Produção de leite
Modelos alternativos
Ferramentas Genômicas
Ferramentas futuras
(Erbe et al. 2012. J. Dairy Sci. 95 :4114–4129)
Bayes R: Assume uma mistura de 4 distribuições
normais que explicam 0%, 0.01%, 0.1% e 1% da
variação.
Bayes M: Assume uma única distribuição normal,
mas amostra a fase de ligação (sinal do efeito).
(Chen. 2012. Ph.D. thesis - Em preparação)
Modelo tradicional
Ferramentas Genômicas
Ferramentas futuras
Gblup: Assume uma única distribuição normal e
uma única fase de ligação.
- Distribuição simétrica dos efeitos dos marcadores
com uma variância comum
- Não modela a fase de ligação
- Usa todos os marcadores na predição
Ferramentas Genômicas
Ferramentas futuras
Painel
Validação Referência
Holandês
Combinado
Holandês Jersey Holandês Jersey Holandês Jersey
Jersey
Acurácia da predição genômica (r[DEPG,DF]) obtida com Bayes R *
* Media para produção de leite, gordura e proteína
(Erbe et al. 2012. J. Dairy Sci. 95 :4114–4129)
Painéis de alta densidade x Avaliação multi-raças
Modelos alternativos
Ferramentas Genômicas
Ferramentas futuras
Painel
Método
Gblup
Criar e inverter G
ASREML
Bayes R
(Erbe et al. 2012. J. Dairy Sci. 95 :4114–4129)
O que teremos no futuro próximo
Ferramentas Genômicas
Ferramentas futuras
Sequenciamento completo: Projeto 1000 Touros (várias
raças) – Dr. Ben Hayes (Austrália)
Populações referências para imputação de 50k
e 777k para a sequência completa.
Mais informação genômica disponível !!!
O que teremos no futuro próximo
Ferramentas Genômicas
Ferramentas futuras
Mais ênfase em fêmeas: Imputação para AD e
para a sequência completa.
Projeto “genoma imputado de 10000 vacas”
- Australia
- Canada
Possiibilidades:
- Aumentar acurácia das avaliações genômicas
- Minimizar viés devido a tratamento preferencial
O que teremos no futuro próximo
Ferramentas Genômicas
Ferramentas futuras
Mais ênfase em filtragem/seleção de SNPs:
Baseada em Estatística e Biologia
Métodos novos/aprimorados
Possiibilidades:
- Aumentar acurácia das avaliações genômicas
- Avaliações genômicas multi-raciais
O que teremos no futuro próximo
Ferramentas Genômicas
Ferramentas futuras
Testes genéticos:
Para características específicas, tais como resistência a
doenças e reprodução.
Exemplo: Haplótipos influenciando fertilidade em gado
leiteiro
Haplótipo HH1
A mutação causal foi encontrada
CGA -> Arginina
TGA -> Codon de terminação
Gene APAF1 é importante para o desenvolviemnto embrionário normal
(VanRaden et al. 2011. JDS, 94:6153-6161)
O que teremos no futuro próximo
Ferramentas Genômicas
Ferramentas futuras
Exemplo: Haplótipos influenciando fertilidade em gado
leiteiro
Impacto
Freq TC TNR Primeiros ancestrais conhecidos
Holstein
HH1 4.5% -3.1% -1.1% Pawnee Farm Arlinda Chief
HH2 4.6% -3.0% -1.7% Willowholme Mark Anthony
HH3 4.7% -3.2% -3.1% Gray View Skyliner e Glendell A. Chief
Jersey
JH1 23.4% -3.7% -3.7% Observer Chocolate Soldier
Brown Swiss
BH1 14.0% -3.4% -2.5% West Lawn Stretch Improver
(Van Doormaal 2011. CDN article, August 2011)
Ferramentas Genômicas
Conclusões
Não há magia em genômica.
Somente há valor se:
Desenvolvermos informações relevantes através de
ferramentas úteis e práticas.
Colaboração é fundamental para a implementação
com sucesso das ferramentas genômicas
- População de referência/treinamento
- Pesquisa e desenvolvimento
- Treinamento de pessoal qualificado
Ferramentas Genômicas
Conclusões
• Parceiros da indústria:
- L’Alliance Boviteq Inc
- CDN/DairyGen
- Associações de Raça
• Agências de financiamento:
- Ontario Centre for Agricultural Genomics
- NSERC
- Genome Canada/Genome Alberta
• Colaboradores internacionais:
- AIPL-USDA
• Estudantes, Pos-doutorandos, e Pesquisadores associados em Guelph
Acknowledgments Ferramentas Genômicas
Agradecimentos
Imputação baseada na informação da população:
Procura de haplótipos longos a curtos ~ De parentes
próximos a distantes
Ferramentas Genômicas
Ferramentas de aplicação básicas