universidade estadual de campinas instituto de...

102
UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIA CAMILA FORNEZARI RABELLO CARACTERIZAÇÃO GENÉTICO-MOLECULAR EM Panicum maximum: IDENTIFICAÇÃO DE MARCADORES MOLECULARES SNPs E MAPEAMENTO GENÉTICO CAMPINAS 2017

Upload: others

Post on 22-Aug-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

1

UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIA

CAMILA FORNEZARI RABELLO

CARACTERIZAÇÃO GENÉTICO-MOLECULAR EM Panicum maximum: IDENTIFICAÇÃO DE MARCADORES

MOLECULARES SNPs E MAPEAMENTO GENÉTICO

CAMPINAS 2017

Page 2: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

1

CAMILA FORNEZARI RABELLO

CARACTERIZAÇÃO GENÉTICO-MOLECULAR EM Panicum

maximum: IDENTIFICAÇÃO DE MARCADORES MOLECULARES

SNPs E MAPEAMENTO GENÉTICO

Dissertação apresentada ao Instituto de Biologia da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do Título de Mestra em Genética e Biologia Molecular na área de Genética Vegetal e Melhoramento.

ESTE ARQUIVO DIGITAL CORRESPONDE À VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELA ALUNA CAMILA FORNEZARI RABELLO E ORIENTADA PELA DR. ANETE PEREIRA DE SOUZA.

Orientador: ANETE PEREIRA DE SOUZA

CAMPINAS

2017

Page 3: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

1

Page 4: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

1

Campinas, 17 de fevereiro de 2017.

COMISSÃO EXAMINADORA

Prof.a Drª. Anete Pereira de Souza (Orientadora)

Prof. Dr. Geraldo Magela de Almeida Cançado

Prof. Dr. João Ricardo Bachega Feijó Rosa

Os membros da Comissão Examinadora acima assinaram a Ata de Defesa, que se encontra no processo de vida acadêmica do aluno.

Page 5: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

1

Aos meus pais, Lúcia e Donizeti, com todo amor, dedico.

Page 6: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

1

AGRADECIMENTOS

Agradeço sincera e profundamente à professora Anete Pereira de Souza pela

oportunidade de trabalhar em seu laboratório, pela confiança depositada em mim,

pela gentileza e humanidade com que sempre tratou a todos ao seu redor.

Agradeço ao Dr. Guilherme de Toledo e Silva por me permitir dar continuidade ao

seu trabalho e pelo imprescindível suporte ao longo desta caminhada.

Agradeço ao Dr. Antonio Augusto Franco Garcia e ao Rodrigo Rampazo pela

inestimável ajuda na construção dos mapas genéticos.

Agradeço aos colegas do LAGM/CBMEG, sem os quais a conclusão deste trabalho

não teria sido possível. Obrigada por compartilharem seus conhecimentos e me

ajudarem nos momentos de dificuldade.

Agradeço aos meus colegas Luciano, Camila, Aline e Benício pela contribuição

durante o desenvolvimento desta tese.

Agradeço aos meus amigos e à minha família por todo apoio e compreensão nos

momentos de ausência.

Agradeço ao meu marido, Rafael, por ser calmaria em meio à turbulência, meu porto

seguro, meu amor.

Agradeço aos meus pais pelo amor incondicional, por terem sempre primado pela

minha educação e por apoiarem minhas escolhas.

Agradeço à Deus e à Nossa Senhora Aparecida por me darem forças para

prosseguir quando tudo parecia ruir e por abrirem tantas portas em meu caminho.

Page 7: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

1

RESUMO

A espécie Panicum maximum, também conhecida como capim-colonião, é

tida como uma das gramíneas mais importantes e difundidas do Brasil, entretanto,

embora o país possua excelentes programas de melhoramento, nossas pastagens

ainda são cultivadas predominantemente em sistemas de monocultura, o que

vulnerabiliza a cadeia produtiva. Desta forma, estudos que visem a caracterização

molecular da espécie são de suma importância para o sucesso e o aceleramento do

lançamento de novos cultivares. O presente estudo visou a identificação de

marcadores moleculares do tipo polimorfismo de nucleotídeo único (single nucleotide

polymorphism - SNP) relacionados a características de interesse para os programas

de melhoramento (fixação de nitrogênio, metabolismo do carbono, resistência e

produção de lignocelulose) e a construção de um mapa genético-molecular para a

espécie. Para tanto, foram identificados 86.312 SNPs e, a partir desse conjunto, 147

marcadores presentes em genes das vias de interesse foram selecionados e

validados via espectrometria de massas. Estes marcadores, aliados a um conjunto

de marcadores do tipo microssatélites (simple sequence repeat – SSR) previamente

desenvolvidos para a espécie, foram utilizados para a construção de mapas

genéticos utilizando os programas TetraploidMap e OneMap. Utilizando a

metodologia do programa TetraploidMap, foi obtido um mapa genético para cada um

dos parentais da população de mapeamento de Panicum maximum. O mapa do

genitor S10 contou com 113 marcadores posicionados e cobriu uma distância de

808,4 cM, distribuídos em 10 grupos de ligação. O mapa do genitor Mombaça, foi

construído a partir da ligação de 119 marcadores, cobrindo uma distância total de

897,1 cM e contando com 13 grupos de ligação. Com o auxílio do software OneMap,

por sua vez, foi obtido um mapa com 122 marcadores moleculares posicionados,

distribuídos em 32 grupos de ligação e 1.248 cM. Assim, pela primeira vez, foi

possível a construção de um mapa genético para a espécie constituído de

marcadores do tipo SNP e SSR.

Palavras-chave: Panicum maximum, SNPs, mapa genético

Page 8: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

1

ABSTRACT

Panicum maximum, also known as Guineagrass, is one of the most important

and widespread grasses of the country, nevertheless, although Brazil has excellent

breeding programs, our pastures are still cultivated mainly in monoculture systems,

which cause a vulnerability on the productive chain. Thus, studies that aim the

molecular characterization of the species are of great importance to the success and

acceleration of the launching of new cultivars. The present study aimed the

identification of single nucleotide polymorphism (SNP) markers related to interest

traits for the breeding programs (nitrogen fixation, carbon metabolism, resistance and

lignocellulose production) and the construction of a molecular map for the species.

For that, it was identified 86.312 SNPs and, from this, 147 markers present on the

genes of the pathway of interest were selected and validated through mass

spectrometry. These markers, together with a previous developed set of markers

from the microsatellites type (simple sequence repeat – SSR), were used for the

construction of genetic maps using TetraploidMap and OneMap computational

programs. Using the methodology of the TetraploidMap, it was obtained a genetic

map for each parental of the population. The S10 parent map had 113 markers and

covered 808,4 cM, distributed in 10 linkage groups. The parent map for Mombaça,

was built from a connection of 119 markers, covering 897,1 cM and 13 linkage

groups. With the aid of the software OneMap, it was constructed a map with 122

molecular markers, distributed in 32 linkage groups and 1.248 cM. Therefore, for the

first time, it was possible to build a genetic map for the species consisting of markers

of the SNP and SSR types.

Keywords: Panicum maximum, SNPs, genetic mapping

Page 9: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

1

SUMÁRIO

1. INTRODUÇÃO ................................................................................................................. 11

2. REVISÃO BIBLIOGRÁFICA ............................................................................................. 13

2.1 Pastagens no Brasil ................................................................................................... 13

2.2 Panicum maximum Jacq ............................................................................................ 14

2.2.1 A espécie e sua introdução no Brasil ................................................................... 14

2.2.2. Mecanismos de reprodução: reprodução sexual e apomítica ............................. 16

2.2.3 Diversidade e melhoramento genético da espécie ............................................... 18

2.3 Marcadores moleculares ............................................................................................ 20

2.3.1. Histórico ............................................................................................................. 20

2.3.2. Os marcadores SNPs ......................................................................................... 23

2.3.3 Genotipagem de SNPs ........................................................................................ 24

2.4 Mapas de ligação ....................................................................................................... 25

2.5 Mapeamento genético em poliploides ........................................................................ 29

3. OBJETIVOS..................................................................................................................... 31

3.1. Objetivo Geral ........................................................................................................... 31

3.2. Objetivos Específicos ................................................................................................ 31

CAPÍTULO I ......................................................................................................................... 32

Construção de um mapa ligação para Panicum maximum a partir de marcadores moleculares SNP e SSR .................................................................................................. 33

CAPÍTULO II ........................................................................................................................ 51

Construção de um mapa de ligação para Panicum maximum utilizando o software OneMap ........................................................................................................................... 52

4. RESULTADOS COMPLEMENTARES ............................................................................. 60

4.2.1 Seleção e genotipagem de marcadores moleculares SNPs e sua distribuição nas vias metabólicas de interesse .......................................................................................... 60

4.2.2 Análise de ploidia e dosagem alélica nos marcadores SNP .................................... 63

4.2.3 Análise dos locos SNPs com ploidia elevada .......................................................... 66

4.2.4 Informações adicionais aos mapas obtidos ............................................................. 68

4.2.4.1 Informações relacionadas aos mapas obtidos pelo TetraploidMap ................... 68

4.2.4.2 Informações relacionadas ao mapa obtido pelo OneMap ................................. 73

5. RESUMO DOS RESULTADOS ....................................................................................... 75

6. CONCLUSÕES ................................................................................................................ 76

7. PERSPECTIVAS ............................................................................................................. 77

8. REFERÊNCIAS BIBLIOGRÁFICAS ................................................................................. 78

9. ANEXOS .......................................................................................................................... 89

Page 10: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

10

PREFÁCIO

Esta tese inicia-se com uma Introdução geral sobre o assunto que será

abordado no manuscrito e sua importância para a ciência e economia do Brasil,

seguida de uma Revisão Bibliográfica referente aos aspectos teóricos mais

relevantes do presente estudo, tais como a importância das pastagens no contexto

nacional, a história e a biologia da espécie Panicum maximum, a diversidade dos

marcadores moleculares e a relevância dos mapas de ligação no melhoramento

vegetal.

Na sequência, serão apresentados os Objetivos deste trabalho e os

Resultados obtidos, sendo que tais resultados serão divididos em dois capítulos. O

Capítulo I descreve, nos moldes de um artigo científico, a prospecção de SNPs para

a espécie, com base em transcriptoma de folhas da espécie, e a montagem de

mapas de ligação pelo programa TetraploidMap. O Capítulo II, por sua vez, detalha

os resultados de mapeamento obtidos pela utilização de uma segunda metodologia

de mapeamento, o software OneMap.

Adicionalmente, serão apresentados os Resultados Complementares

referentes aos dados obtidos nos Capítulos I e II. Para fechar a linha de raciocínio,

será apresentado um Resumo dos Resultados, as Conclusões e as Perspectivas

referentes ao trabalho desenvolvido. Por fim, será apresentada a Bibliografia

utilizada na construção desta dissertação.

Page 11: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

11

1. INTRODUÇÃO

O setor agropecuário é historicamente um dos setores mais importantes da

economia brasileira, sendo responsável por aproximadamente um terço do produto

interno bruto (PIB) do país. Neste cenário, destacam-se a produção de bioenergia,

cuja riqueza gerada em um ano equivale ao PIB do Uruguai (UNICA, 2008), e a

pecuária, por apresentar o maior rebanho comercial do mundo, com mais de 200

milhões de cabeças de gado (IBGE, 2016).

Estima-se que apenas 3% do rebanho brasileiro seja criado em sistema de

confinamento, o que explicita a importância das pastagens para a sustentação da

atividade. Considerando a intensificação dos sistemas de produção bovina e a forte

tendência ao crescimento do mercado de sementes de forrageiras para pastagem, a

espécie Panicum maximum, pelo seu potencial produtivo, qualidade e palatabilidade,

é uma das gramíneas mais indicadas para suportar essa demanda (Jank et al.,

1997).

Embora a disponibilidade de cultivares melhorados tenha sido responsável

pela ampliação da área de cultivo da espécie nos últimos anos, nossas pastagens

ainda são cultivadas predominantemente em sistemas de monocultura, ou seja, com

predominância de um ou poucos cultivares, o que vulnerabiliza a cadeia produtiva.

Somando-se a este cenário o fato de que cerca de 50% das nossas pastagens se

encontram em estágio de degradação (Dias Filho, 2007), fica evidente a urgente

necessidade do aumento dos programas de melhoramento genético da espécie.

A maior parte dos estudos com P. maximum limitam-se a compreender os

aspectos fisiológicos da planta e características agronômicas de interesse. Raros

são os trabalhos concentrados na caracterização genética da espécie (Jank et al.,

2011). O único mapa de ligação construído para P. maximum data de 2005 e foi

desenvolvido por pesquisadores japoneses (Ebina et al., 2005). Desde então, outro

avanço significativo em termos genéticos para a espécie só foi dado em 2013,

quando um conjunto de transcritos da espécie foi analisado (Toledo-Silva et al.,

2013).

Assim, este trabalho teve como objetivo aumentar o conhecimento genético

da espécie, visando fornecer ferramentas aos programas de melhoramento vigentes

e futuros. Neste contexto, a proposta de identificação de marcadores moleculares do

tipo SNP (single nucleotide polymorfism) foi um trabalho pioneiro para a espécie. A

Page 12: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

12

construção de um novo mapa de ligação, enriquecido, impactará positivamente na

velocidade de geração de dados e lançamento de novos cultivares, o que

certamente contribuirá direta e indiretamente para a intensificação da produção de

carne, leite, couro, lã e bioenergia no país.

Page 13: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

13

2. REVISÃO BIBLIOGRÁFICA

2.1 Pastagens no Brasil

A formação vegetal genericamente denominada pastagem é a mais comum e

a que ocupa a maior área de extensão na Terra, fato que se explica pela sua alta

capacidade de adaptação a condições climáticas e nutricionais que vão da tundra

ártica até os arredores do deserto do Sahara (Valle et al., 2009).

No Brasil, as áreas de pastagem ocupam mais de 160 milhões de hectares, o

que, em conjunto com as áreas de pastos naturais, equivalem a 49% de toda a área

agrícola do país (ABIEC, 2016). Esta vasta extensão é composta basicamente por

espécies de leguminosas e gramíneas forrageiras, dentre as quais destacam-se

Panicum maximum (capim-colonião), Brachiaria spp., Pennisetum purpureum

(capim-elefante), Setaria sphacelata, Cynodon spp. (capim-estrela), Melinis

minutiflora (capim-gordura), Hyparrhenia rufa (capim-jaraguá), Andropogongayanus

spp., Cenchrus ciliaris (capim-buffel) e Paspalum spp. (capim-pensacola) (Jank et

al., 2005).

De modo geral, as forrageiras tem um papel importante na agricultura,

melhorando a qualidade dos solos através da fixação do nitrogênio e do carbono,

contribuindo para a retenção de água e estabilização do terreno, além de auxiliar no

controle de pragas e doenças em sistemas de rotação de culturas e atuar no

processo de fitorremediação (Salton et al., 2009; Severiano et al., 2010; Olatunji et

al., 2014). Entretanto, seus dois usos comerciais de maior destaque são a

alimentação animal e o mercado de produção de sementes.

Atualmente, o Brasil destaca-se como maior produtor, exportador e

consumidor de sementes de forrageiras tropicais (Lazia, 2012), sendo que este

comércio no país está estimado em US$ 240 milhões anuais (Andrade, 2001). Deste

montante, cultivares de P. maximum são responsáveis por aproximadamente 30%

das sementes comercializadas (Abrasem, 2004).

Já no campo da agropecuária, o Brasil se destaca como o maior produtor e

exportador de carne bovina com cerca de 200 milhões de cabeças de gado (IBGE,

2016; Fonseca et al., 2010). Visto que esta produção animal é desenvolvida quase

que exclusivamente em sistema extensivo, no qual 90% dos nutrientes exigidos

Page 14: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

14

pelos animais são oriundos do pasto (Euclides et al., 2010), as forrageiras são

essenciais para a manutenção do país em posição de destaque.

Embora a adaptabilidade das gramíneas aos nossos ecossistemas seja

notável, o centro de origem de grande parte das espécies mais utilizadas

comercialmente é o continente africano, no qual tais plantas evoluíram sob

constante exposição a herbívoros e superpastejo, o que não ocorreu com as

espécies nativas das Américas (Valle et al., 2009).

O fato dessas forrageiras serem originárias da África, resultou em uma

escassez de trabalhos de coletas dirigidos. Para P. maximum, por exemplo, foram

relatadas apenas duas coletas direcionadas: uma por um grupo francês em 1967 e

1969 (Combes & Pernès, 1970), e a segunda por pesquisadores japoneses de 1971

a 1973 (Hojito & Horibata, 1982).

Esta ausência de conhecimento sobre a diversidade genética das espécies

contribui para que as pastagens cultivadas sejam perigosamente compostas por

poucas variedades, o que torna toda a cadeia produtiva susceptível às pressões de

pragas e doenças (Seiffert, 1984).

2.2 Panicum maximum Jacq.

2.2.1 A espécie e sua introdução no Brasil

O gênero Panicum L. é um dos maiores e mais importantes dentro da família

Poaceae, pertencendo à subfamília Panicoideae e tribo Paniceae. Este gênero

compreende cerca de 400 espécies de acordo com a circunscrição atual (Aliscioni et

al., 2003) e no Brasil temos relatada a ocorrência de 114 espécies (Guglieri et al.,

2004).

De forma geral, o gênero Panicum apresenta uma grande variabilidade

genética e morfofisiológica, com espécies de diferentes hábitos de crescimento e

exigências nutricionais e climáticas (Botrel et al., 1998), sendo encontradas em uma

faixa latitudinal bastante ampla, que vai de 40º S até 50º N, e com variação em

altitude que vai do nível do mar até próximo dos 2.000 m (Skerman & Riveros,

1992). A capacidade de utilizar eficientemente altas intensidades luminosas e

apresentar rápido desenvolvimento permite a classificação do gênero Panicum como

plantas pioneiras (Dias Filho, 1995).

Dentre elas, o capim Panicum maximum, também conhecido como capim-

colonião, é tido como uma das gramíneas mais importantes e difundidas no país,

Page 15: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

15

sendo também a forrageira propagada por semente mais produtiva do mercado

nacional (Valle et al., 2009). A espécie pode ser descrita como uma cultura perene,

formadora de touceiras com sistema radicular profundo, altura variável entre 60 a

200 cm e formadora de panículas (Skerman & Riveros, 1992; Molinari, 1952).

Figura 1. Ilustração e fotografias de Panicum maximum. A) Ilustração das estruturas

de P. maximum (extraída de Hitchcock, 1971). B) Parte aérea da planta C) Híbridos de

população utilizada no presente estudo.

Esta espécie é nativa da África Tropical, podendo ser encontradas formas

nativas até nas áreas subtropicais da África do Sul, embora seja na região leste

africana que esteja concentrada a maior diversidade da espécie (Jank, 1995;

Bogdan, 1977; Herling et al., 2000). O capim-colonião foi introduzido nas Américas,

provavelmente no século XVIII (Parsons, 1972). Após a sua introdução, esta

forrageira se espalhou rapidamente pelas Ilhas do Caribe, América do Sul e Central

e no sudeste dos Estados Unidos (Bogdan, 1977; Herling et al., 2000).

Em relação à introdução da planta no Brasil, a versão mais difundida e aceita

é a teoria descrita por Chase (1944), segundo a qual a introdução ocorreu com a

importação de escravos africanos em navios negreiros, nos quais este capim era

utilizado como cama (Parsons, 1972).

Após um primeiro momento, a espécie foi difundida das regiões costeiras do

Sul e Sudeste, para o interior (Centro-Oeste e Norte) do país pela ação combinada

Page 16: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

16

dos ventos, animais e pela ação humana, e se disseminou amplamente devido à sua

capacidade de aclimatação às diversas condições de clima e solo do país, chegando

até mesmo a ser considerada nativa em algumas regiões (Bogdan, 1977; Herling et

al., 2000).

O capim-colonião foi amplamente difundido no país nos anos 50 e 60, por ser

resistente à queimadas e apresentar alta produção de forragem (Vieira, 1994;

Aronovich, 1995). Posteriormente, entre as décadas de 60 a 80, a espécie

desempenhou um papel importante na expansão da fronteira agrícola para as

regiões da Amazônia, além de apresentar bons resultados também na criação de

equinos e ovinos (Jank, 2003). A partir de então, com o advento de novos bancos

ativos de germoplasma (BAG), o uso da espécie se consolidou no mercado

brasileiro como sinônimo de forragem de alta qualidade (Santos, 1997), e seu plantio

foi expandido nos últimos vinte anos em decorrência do seu alto potencial produtivo

(Da Silva, 1995), chegando, em 2008, a ocupar 20% de toda a área de pastagem

cultivada no país (Martuscello et al., 2008).

2.2.2. Mecanismos de reprodução: reprodução sexual e apomítica

Panicum maximum também é um importante modelo de estudo para

mecanismos de reprodução, uma vez que esta espécie apresenta tanto reprodução

sexual quanto reprodução por apomixia (Savidan, 2000; Hanna et al., 1973).

Embora a reprodução sexuada seja o mecanismo reprodutivo mais difundido

entre as plantas superiores, muitas espécies apresentam propagação assexuada ou

vegetativa, de forma facultativa ou obrigatória. Os mecanismos mais comuns de

reprodução assexuada são por meio de rizomas, tubérculos, bulbos ou outros

órgãos vegetativos (Bueno et al., 2002).

Um outro tipo de reprodução assexuada encontrado entre vegetais é a

apomixia, modo pelo qual há formação do embrião sem que haja a união do núcleo

espermático do pólen com a oosfera (Bashaw, 1980), ou seja, formação de semente

sem que haja fecundação (Asker & Jerlin, 1992). Trata-se de um modo de

reprodução encontrado em cerca de 15% das famílias das angiospermas, presente

principalmente nas famílias das Gramineae (Poaceae), Asteraceae e Rosaceae.

A primeira referência sobre o fenômeno da apomixia data de 1841, quando

uma planta feminina de Alchornea (Euphorbiaceae) cultivada isoladamente formou

sementes. Poucas décadas após esta observação, Mendel executou “cruzamentos”

Page 17: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

17

com o gênero Hieracium, com o intuito de angariar mais material de suporte às suas

teorias, sem saber que estava diante de plantas apomíticas. A progênie deste

cruzamento, entretanto, apresentou características de plantas oriundas de

autofecundação, o que o levou a duvidar de seus dados com Pisum (Asker & Jerling,

1992; Nogler, 1994).

Segundo Asker & Jerling (1992), há dois tipos principais de apomixia, a

esporofítica e a gametofítica, sendo que o tipo gametofítico pode ser subdividido em

apospórico ou diplospórico.

Na apomixia gametofítica, cuja ocorrência é frequente, inclusive em gêneros

de interesse econômico como Panicum, Brachiaria e Paspalum, há formação de um

saco embrionário não reduzido (diploide) por diplosporia ou por aposporia. Na

diplosporia, a célula-mãe do megásporo entra em mitose antes de completar a

meiose, formando sacos embrionários com oito núcleos e morfologicamente

semelhantes ao saco meiótico. Já na aposporia, a meiose é completada, mas os

gametas se degeneram, e as células iniciais apospóricas (ou apósporos) entram em

mitose, formando os sacos embrionários não reduzidos.

Já na apomixia esporofítica, relatada em algumas espécies de Citrus, não há

formação de sacos embrionários e os embriões desenvolvem-se a partir das células

dos envoltórios do óvulo (Nogler, 1984).

Em P. maximum, a reprodução apomítica é muito mais comum do que a

reprodução sexual (diploides sexuais 2n = 2x = 16) e as plantas sexuadas foram

primeiramente descritas para a espécie em uma pequena população da Tanzânia

por Combes & Pernès (1970). Assim, a espécie é, em via de regra, uma

autotetraploide (2n = 4x = 32) (Nakajima et al., 1979) embora sejam existentes

exemplares diploides (2n = 16), triploides (2n = 24), pentaploides (2n = 40),

hexaploides (2n = 48), octaploides (2n = 64), nonaploides (2n = 72) e também

plantas com números cromossômicos irregulares (2n = 30, 31, 34, 36, 37, 38)

(Bogdan, 1977).

A descoberta da sexualidade no gênero, porém, foi de grande importância por

gerar inúmeras possibilidades ao melhoramento genético da espécie (Savidan,

1981), visto que variedades assexuadas tendem a ser altamente heterozigotas e

segregam amplamente quando se reproduzem por via sexual (Bueno et al., 2002).

Desta forma, a relação entre sexualidade e apomixia pode ser utilizada por

Page 18: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

18

programas de melhoramento como mecanismo para promoção da fixação do vigor

do híbrido na população (Nogler, 1984).

Para tanto, é necessário a identificação de plantas sexuais como genitores

maternais, que podem ser cruzadas com genótipos apomíticos, doadores de pólen.

Entretanto, é mais comum a ocorrência natural de genótipos sexuais diploides. Para

contornar tal característica, é necessária a duplicação cromossômica antes ou após

o cruzamento (Dall’Agnol & Schifino-Wittmann, 2005). A técnica mais comumente

empregada para realizar esta duplicação é a teraploidização dos genitores via uso

de colchicina, recurso que vem sendo utilizado em P. maximum desde 1971, ainda

na África (Savidan, 1980).

2.2.3 Diversidade e melhoramento genético da espécie

Os primeiros exemplares de Panicum maximum introduzidos no Brasil, de

origem africana, deram origem à primeira cultivar, o chamado Colonião (Jank, 1995),

que foi responsável por grande parte da engorda de bovinos no Brasil até a criação

de BAGs, a partir de acessos coletados no centro de origem da espécie e genótipos

oriundos de programas de melhoramento genético.

O primeiro passo para a introdução de novos cultivares no país foi dado na

década de 70, com a introdução dos ecótipos K 187B, em 1976, e T58, em 1978.

Estes materiais foram provenientes de coletas realizadas por pesquisadores do

ORSTOM (Institut Français de Recherche Scientifique pour le Développment en

Coopération) no Quênia e na Tanzânia no final dos anos 60 (Combes & Pernès,

1970).

A partir de então, foram diversas as entradas de genótipos provenientes de

grupos de pesquisa estrangeiros, como é o caso do cultivar africano Aruana e os

cultivares Gatton e Hamil (Jank, 1995). O grande marco que revolucionaria a

pesquisa de novos cultivares se deu em 1982, quando o ORSTOM, disponibilizou

parte da sua coleção para a EMBRAPA (Empresa Brasileira de Pesquisa

Agropecuária). O material disponibilizado contava com 426 ecótipos apomíticos

assexuados e 417 plantas sexuais, sendo considerada uma coleção com boa

representatividade da diversidade da espécie (Jank et al., 1990; Savidan et al.,

1989).

Dentre os materiais lançados por programas de melhoramento desde então,

estão o Tobiatã (Jank, 1995), o Massai (Brâncio et al., 2002) e o híbrido Atlas,

Page 19: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

19

resultante do cruzamento dos cultivares IAC- Tobiatã e K- 67. Além do Aruana,

Tanzânia-1 (originário do cultivar T58) e Mombaça, lançados, respectivamente, em

1989, 1990 e 1993.

Dentre estes, o Mombaça e o Tobiatã são cultivares de grande porte e folhas

largas, seguidas pelo Colonião e Tanzânia-1 em termos de tamanho da planta. Já o

cv. Massai se distingue do grupo por apresentar porte baixo e folhas mais finas, mas

é uma planta que apresenta grande velocidade de estabelecimento e de rebrota

(Savidan et al., 1990).

Em relação aos outros cultivares de Panicum, o capim Massai apresenta,

além das diferenças morfológicas citadas, maior tolerância à acidez e reduzida

fertilidade dos solos, apresentando, em contrapartida, valor nutritivo inferior

(Valentim et al., 2001; Brâncio et al., 2003). Já a espécie Panicum maximum cv.

Mombaça, lançada pelo Centro Nacional de Pesquisa de Gado de Corte da

EMBRAPA, é altamente produtivo, com elevada capacidade de manutenção foliar

durante o ano e, principalmente, durante a estação de seca, além de apresentar

excelente resposta à adubação (Muller, 2000).

Embora o número de BAGs disponíveis no mercado nacional para o plantio

tenha aumentado nas últimas décadas, as pastagens brasileiras ainda podem ser

caracterizadas como grandes monoculturas clonais, geneticamente pobres e

vulneráveis à patógenos, o que torna necessário o investimento em programas de

melhoramento genético da espécie (Valle et al., 2009; Verzignassi & Fernandes,

2001).

O melhoramento de forrageiras tem como objetivos centrais o aumento da

produtividade, o aumento da resistência aos patógenos, a produção de sementes, e

a maior adaptação aos diferentes estresses. Além disso, como essas plantas são

utilizadas para alimentação animal direta, é interessante que os programas visem

também a palatabilidade e os valores nutricionais indiretos, visando conseguir maior

eficiência na sua transformação em produção animal (Valle et al., 2008; Valle et al.,

2009).

Os poucos programas de melhoramento de forrageiras são, tradicionalmente,

realizados por melhoramento genético clássico, no qual há seleção de genótipos

através de uma série de cruzamentos, o que leva aproximadamente uma década. O

sucesso desse tipo de abordagem depende de vários fatores, dentre os quais a

escolha adequada dos genitores, o desenho de experimentos com bom alcance

Page 20: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

20

estatístico e a escolha correta dos caracteres e épocas de avaliação (Moose &

Mumm, 2008).

Estas limitações impostas pelo processo de melhoramento tradicional podem

ser reduzidas por meio do uso de técnicas avançadas em biotecnologia, através das

quais os genes de interesse podem ser mapeados nos genitores, o que reduz o

tempo envolvido no processo de melhoramento e aumenta a chance de sucesso dos

cruzamentos (Meuwissen et al., 2001; Valle et al., 2009). Dentre tais técnicas, os

programas de melhoramento têm adotado o uso de marcadores moleculares para o

melhoramento de diversas culturas.

2.3 Marcadores moleculares

2.3.1. Histórico

Os marcadores moleculares são regiões existentes no genoma que podem

atuar como sinalizadores na busca por regiões de interesse, representando assim,

uma forma indireta de avaliar e comparar diferentes genótipos (Laborda, 2011). Os

marcadores moleculares utilizados no melhoramento genético são freqüentemente

elementos genéticos que, por co-segregarem com os genes de interesse, permitem

o estudo comparativo de genótipos e de suas progênies (Sakiyama, 1993). Estes

marcadores podem ser baseados em características morfológicas, fisiológicas,

bioquímicas ou moleculares (Sakijama, 1993). Até meados da década de 60, as

análises genéticas eram realizadas com base na utilização de marcadores

morfológicos de fácil identificação visual e, predominantemente, controlados por um

único gene (Ferreira & Grattapaglia, 1998).

A revolução neste campo de estudo se iniciou com o descobrimento de

marcadores isoenzimáticos a partir do ano de 1959 (Market & Moller, 1959), o que

permitiu um rápido aumento do número de marcadores genéticos descritos e

estendeu a aplicação da técnica para praticamente todas as espécies de plantas

(Ferreira & Grattapaglia, 1998). Embora este tipo de marcador tenha propiciado uma

grande expansão do conhecimento, é normalmente encontrado um baixo número de

variantes nas proteínas, limitando o desenvolvimento de mapas genéticos a partir

desta abordagem.

Foi apenas em meados dos anos 80, com a expansão dos métodos de

análise de DNA, que a descoberta e uso de marcadores se tornou recorrente. Então,

em menos de quarenta anos, nossa compreensão sobre os marcadores foi

Page 21: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

21

drasticamente expandida, o que ampliou e modificou nossa visão sobre muitos

fenômenos naturais.

Embora tenham sido descobertos uma grande gama de novos marcadores,

podemos classificá-los em três categorias conceituais: variantes proteicas

(aloenzimas), polimorfismos na sequência do DNA (como RFLP e AFLPs) e

variações em repetições do DNA, como minissatélites e microssatélites (SSR)

(Schlötterer, 2004).

Já Gupta (1999), também classifica os marcadores em três classes, mas

adota como parâmetro o método utilizado para a sua detecção: marcadores

baseados na hibridização do DNA, como os polimorfismos de comprimento de

fragmentos de restrição do DNA (RFLP), os baseados na reação em cadeia da

polimerase (PCR), tais como AFLPs e microssatélites e os baseados na variação

entre sequências e na utilização de chips de DNA, como, por exemplo, os

marcadores SNP (Single Nucleotide Polymorphism).

Maheswaran (2004), por sua vez, sintetiza a história dos marcadores

moleculares na Tabela 1 e a classifica em três etapas: marcadores de primeira

geração, marcadores de segunda e marcadores de nova geração.

Page 22: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

22

Tabela 1. Evolução dos marcadores moleculares (Maheswaran, 2004).

Primeira Geração e Marcadores Moleculares

Ano Acronimo Nomenclatura

1974 RFLP Restriction Fragment Length Polymorphism

1985 NTR variable Number Tandem Repeats

1986 ASO Allele Specific Oligonucleotides

1988 AS - PCR Allele Specific Polimerase Chain Reaction

1988 OP Oligonucleotide Polymorphism

1989 SSCP Single Stranded Conformational Polymorphism

1989 STS Sequence Tagged Site

Segunda Geração e Marcadores Moleculares

Ano Acrônimo Nomenclatura

1990 RAPD Randomly Amplified Polymorphic DNA

1990 AP - PCR Arbitrarily Primed Polymerase Chain Reaction

1990 STMS Sequence Tagged Micro Satellite Sites

1991 RLGS Restriction Landmark Genome Scanning

1992 CAPS Cleaved Amplified Polymorphic Sequence

1992 DOP - PCR Degenerate Oligonucleotide Primer - PCR

1992 SSR Simple Sequence Repeats

1993 MAAP Multiple Arbitrary Amplicon Profiling

1993 SCAR Sequence Characterized Amplified Region

Nova Geração e Marcadores Moleculares

Ano Acronimo Nomenclatura

1994 ISSR Inter Simple Sequence Repeats

1994 SAMPL Selective Amplification Of Micro Satellite Polymorphic Loci

1994 SNP Single Nucleotide Polymorphisms

1995 AFLP (SRFA) Amplified Fragment Length Polymorphism (Selective

Restriction Fragment Amplification)

1995 ASAP Allele Specific Associated Primers

1996 CFLP Cleavase Fragment Length Polymorphism

1996 ISTR Inverse Sequence-tagged Repeats

1997 DAMD-PCR Directed Amplification Of Mini Satellite DNA-PCR

1997 S - SAP Sequence-specific Amplified Polymorphism

1998 RBIP Retrotransposon Based Insertional Polymorphism

1999 IRAP Inter-retrotransposon Amplified Polymorphism

1999 REMAP Retrotransposon-Microsatellite Amplified Polymorphism

1999 MSAP Methylation Sensitive Amplification Polymorphism

2000 MITE Miniature Inverted-repeat Transposable Element

2000 TE - AFLP Three Endonuclease AFLP

2001 IMP Inter-MITE Polymorphisms

2001 SRAP Sequence-related Amplified Polymorphism

Com os avanços na caracterização de novos marcadores e das técnicas em

biologia molecular, que possibilitaram o avanço das pesquisas em larga escala, os

marcadores têm, cada vez mais, sido incorporados em programas de melhoramento

como geradores de informações valiosas aos melhoristas genéticos, tais como a

identificação e discriminação de genótipos, avaliação da variabilidade genética de

Page 23: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

23

uma população, e a aceleração do lançamento de novos genótipos no mercado

(Borém & Caixeta, 2004).

2.3.2. Os marcadores SNPs

Os SNPs são variações em um único nucleotídeo nas sequências de bases

em fragmentos homólogos do DNA, sendo esta a mais freqüentes forma de

polimorfismo encontrada no genoma (Kwok, 1996; Kruglyak, 1997).

Para que tais variações sejam consideradas um SNP, convencionou-se que,

para um dado loco, o alelo menos frequente na população tenha uma abundância

superior a 1%. Essa frequência mínima reduz a chance de que polimorfismos

verdadeiros sejam confundidos com mutações raras e pontuais (Wang et al., 1998).

Teoricamente, os SNPs podem ser polimorfismos bialélicos, trialélicos, ou

tetralélicos, entretanto são encontrados predominantemente na forma bialélica

(Brookes, 1999). Isso é justificado pela predominância da ocorrência de transições

em comparação com as transversões, em função da alta taxa de desaminação

espontânea da 5–metilcitosina para timina em dinucleotídeos C e G (Vignal et al.,

2002; Coulondre et al., 1978).

Os SNPs ocorrem com alta freqüência em todos os organismos, sendo

relatadas taxas em genomas vegetais de 1 SNP a cada 100-300 pares de base

(Gupta et al., 2001). Devido à sua alta disseminação pelo genoma, os SNPs são

uma rica fonte de variabilidade e possivelmente são responsáveis pela maioria das

contribuições do genótipo na variação do fenótipo (Botstein & Risch, 2003).

Esses polimorfismos ocorrem tanto nas regiões gênicas codificadoras (éxons)

quanto nas não codificadoras (íntrons), embora seja muito mais comum a ocorrência

fora das regiões gênicas (Rafalski, 2002). Os SNPs que ocorrem em éxons podem

ser categorizados em duas classes: sinônimos, quando não levam à alteração da

seqüência de aminoácidos, e não-sinônimos, quando o polimorfismo altera o

aminoácido.

Os SNPs podem atuar, de forma direta ou indireta, alterando a conformação

de proteínas (Chamary et al., 2006; Gupta & Lee, 2008), a ligação de fatores de

transcrição às regiões regulatórias, influenciando no processo de splicing alternativo,

alterando o nível de expressão gênica (Kudla, 2009) e a estrutura do RNA e sua

estabilidade, refletindo, portanto, na concentração final da proteína. Além disso,

Page 24: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

24

SNPs nas proximidades de genes codificantes de miRNA podem alterar o

processamento e a função de pequenos RNAs (Sun et al., 2009).

Nas últimas décadas, com o intenso desenvolvimento tecnológico, vem sendo

possível gerar um grande número de sequências de ácidos nucleicos, o que

possibilitou o desenvolvimento de metodologias para identificar SNPs utilizando

ferramentas de bioinformática (Wang et al., 2005). Além disso, várias metodologias

vêm sendo exploradas no melhoramento genético assistido por marcadores SNP,

como análises de PCR (reação em cadeia da polimerase) em tempo real utilizando

TaqMan, microarranjos de DNA, cromatografia líquida de alta pressão desnaturante,

espectrometria de massas e técnicas que empregam sequenciamento de nova

geração (Blondal et al., 2003; Langaee & Ronaghi, 2005; Nielsen et al., 2011).

2.3.3 Genotipagem de SNPs

Os marcadores SNPs são altamente informativos, pois possuem natureza

codominante em espécies poliploides, ou seja, não só determinam a existência do

polimorfismo em um determinado loco como também são capazes de determinar a

abundância das variações alélicas desse loco em diferentes genótipos e dentro do

mesmo genótipo. Assim, a genotipagem de loco SNPs deve envolver não apenas a

identificação do polimorfismo, mas também a estimação do número de cópias

alélicas do mesmo.

A quantificação desta dosagem é possível quando se utiliza genotipagem do

SNP de forma quantitativa, como as tecnologias empregadas pelo Illumina Golden

GateTM (Fan et al., 2003) e pelo Sequenom iPLEX MassARRAY® (Oeth et al.,

2007, 2009), que geram dois sinais para cada locos SNP.

A plataforma MassARRAY (Sequenon Inc.), baseada em espectrometria

MALDI-TOF (matrix-assisted laser desorption/ionization time-of-flight), é amplamente

reconhecida pela sua capacidade de realizar análises apuradas nas genotipagens

por marcadores SNPs (Gabriel et al., 2009).

O ensaio é composto por uma reação inicial de PCR que amplifica o DNA nas

adjacências do local de ocorrência do polimorfismo. A seguir, o produto desta reação

é tratado para a eliminação dos dNTPs livres remanescentes e submetido a uma

nova PCR, conhecida como reação iPLEX, que visa amplificar apenas uma pequena

região imediatamente antecessora ao sítio do SNP. Além disso, na reação iPLEX,

são utilizados iniciadores com massa modificada pela inserção de um nucleotídeo

Page 25: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

25

marcado. O produto desta reação pode ser, então, submetido à espectrometria de

massas baseada no tempo de voo (MALDI-TOF) através da transferência da mesma

para um chip específico com uma matriz especial.

Esta matriz é excitada por um laser, processo conhecido como dessorção, e a

transferência de energia promove a vaporização da amostra com o DNA, que passa

então para o tubo de voo do equipamento e é acelerada até um detector, sendo o

tempo que a partícula de DNA leva para percorrer o caminho é chamado tempo de

voo. Como os iniciadores desenhados para os polimorfismos apresentarão massas

diferentes, e em razão disso, apresentarão um tempo de voo diferente, a distinção

dos alelos é facilmente identificada baseando-se na diferença de peso molecular

(Gabriel et al., 2009).

Desta forma, uma vez que os iniciadores são desenhados para SNPs

bialélicos, o equipamento gerará dois sinais, cada um correspondendo à intensidade

registrada por um dos possíveis alelos. Então, o valor esperado de cada intensidade

do sinal é proporcional à dosagem presente no alelo (Oeth et al., 2009; Akuhunov et

al., 2009). A possibilidade desta diferenciação faz dos SNPs excelentes marcadores

para estudos em espécies poliploides, fazendo com que essa técnica torne possível

observar diversas classes genotípicas, diferentemente dos marcadores SSRs

(Mollinari, 2012).

Entretanto, a função “SNP genotype call” do software TYPER, distribuído

juntamente com a plataforma Sequenom iPLEX MassARRAY, não pode ser aplicada

a poliploides, limitando consideravelmente o uso dos dados gerados na genotipagem

de SNPs destas espécies. Felizmente, tal restrição pode ser contornada aplicando

aos dados uso dos modelos gráficos Bayesianos (Serang et al. 2012).

Serang et al. (2012) converteram estes modelos complexos em uma

plataforma online denominada SuperMASSA, a qual pode ser livremente utilizada

para inferir o genótipo para os locos SNPs dos genitores e de cada indivíduo em

uma população F1 (dentre outras possibilidades). Assim, o modelo possibilita estimar

o nível de ploida e a dosagem alélica de SNPs, fornecendo novas possibilidades de

estudo para organismos autopoliploides complexos (Garcia et al., 2013).

2.4 Mapas de ligação

Os mapas de ligação, também chamados de mapas genéticos, podem ser

definidos como representações lineares da posição de genes e/ou marcadores

Page 26: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

26

moleculares ordenados em grupos de ligação, de modo que, para um mapa

densamente saturado, o número de grupos de ligação seja igual ao número de

cromossomos da espécie.

Os mapas genéticos possibilitam a localização de genes, estudos de

associação de genes a características quantitativas (QTLs - quantitative trait locus),

cobertura e análise completa de genomas, além de informações a respeito da

arquitetura genética, ligações gênicas e auxiliam no entendimento da história

evolutiva das espécies (Garcia et al., 2006).

A pedra fundamental para o conceito de mapa de ligação proveio da

descoberta de Thomas Hunt Morgan e equipe, em 1910, quando observaram, em

Drosophila melanogaster, proporções fenotípicas não coincidentes com as propostas

pela segunda lei de Mendel, a lei da segregação independente dos genes. A partir

dessa observação, Morgan sugeriu que a distorção das proporções poderia indicar o

agrupamento de alguns genes e a ocasional permutação de alguns genes entre os

cromossomos homólogos (Coelho & Silva, 2005).

Poucos anos depois, em 1913, Sturtevant, foi o responsável pela criação do

primeiro mapa de ligação, posicionando e ordenando seis genes de D. melanogaster

e sugerindo o uso da porcentagem de recombinantes como indicador da distância

linear dos genes para a construção de mapas. Tal distância é dada usualmente em

centimorgans (cM), em homenagem a T.H. Morgan.

Devido aos poucos recursos na descoberta de marcadores moleculares da

primeira metade do século XX, os primeiros mapas genéticos, desenvolvidos para

culturas como milho, ervilha e tomate, foram baseados em marcadores morfológicos

e citológicos, o que tornava impossível a obtenção de mapas com uma boa

cobertura do genoma. Entretanto, a partir da década de 80, com a explosão de

novas metodologias baseadas em DNA, os mapas puderam se tornar amplamente

saturados e virtualmente ilimitados (Carneiro & Vieira, 2002; Ferreira & Grattapaglia,

1998).

Atualmente, mapas genéticos estão sendo desenvolvidos para centenas de

espécies com uma resolução cada vez maior, devido à grande disponibilidade de

marcadores altamente polimórficos a baixos custos. A evolução das técnicas de

detecção e genotipagem de marcadores, aliada a procedimentos estatísticos cada

vez mais complexos e específicos, tem permitido a construção de mapas de ligação

Page 27: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

27

para a maioria das espécies vegetais de interesse agronômico (Slate, 2005;

Carneiro & Vieira, 2002).

No contexto do melhoramento de plantas, mapas de ligação detalhados são

extremamente úteis ao possibilitarem a cobertura e análise do genoma, a

decomposição de características genéticas complexas nos seus componentes

mendelianos, o mapeamento comparativo entre espécies, estudos de análises

filogenéticas, a predição de descendências em cruzamentos experimentais, a

identificação de marcas relacionadas com regiões-chave do genoma para a

expressão de características quantitativas (QTL) e a quantificação do efeito destas

regiões na característica estudada e a canalização de toda esta informação para o

uso em programas de melhoramento, além de serem o primeiro passo para a

clonagem posicional de genes responsáveis por características importantes

(Tanksley, 1993; Semagn et al., 2006; Ferreira & Grattapaglia, 1998).

Entretanto, para um mapa genético poder ser utilizado para os fins listados

acima, ele precisa ser robusto e bem construído. Para tanto, deve seguir critérios

como simplicidade, robustez, transferência, e relação custo-eficácia (Lorieux et al.,

2000). Desta forma, a metodologia de construção de um mapa genético integra uma

série de procedimentos e análises, que incluem (Carneiro & Vieira, 2002; Wu et al.,

2007; Mollinari, 2009):

1) Escolha de genitores contrastantes: o delineamento dos cruzamentos deve

ser realizado de modo a maximizar a probabilidade de detectar os polimorfismos.

Para tanto, é necessário avaliar a distância genética que separa os genitores, já que

quanto mais próximos geneticamente, menos frequente será a obtenção de

polimorfismos (Paterson et al., 1991). Deste modo, torna-se essencial a utilização de

populações segregantes com o máximo possível de desequilíbrio de ligação

(provocado, basicamente, pela ligação física entre os locos), o qual é, normalmente,

bastante elevado em populações de cruzamentos controlados (Tanksley, 1993;

Falconer & Mackay, 1996; Lynch & Walsh, 1998). Populações advindas de

diferentes tipos de cruzamentos podem ser utilizadas para a construção de mapas

de ligação, tais como as obtidas por retrocruzamentos, populações F2, linhagens

puras recombinantes, linhagens de duplo-haplóides e, no caso de espécies com

fecundação cruzada, cruzamentos entre indivíduos heterozigotos (Collard et al.,

2005; Ferreira & Grattapaglia 1998; Coelho, 2000);

Page 28: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

28

2) Desenvolvimento de uma população segregante: a escolha da população

mais apropriada ao mapeamento está relacionada com o tipo de marcador a ser

analisado, a finalidade do mapa e as características da espécie (Tanksley, 1993). O

tamanho da população de mapeamento também é um fator relevante, embora não

haja um padrão de ordem numérica estabelecido (Bhering et al., 2008; Yarnes et al.,

2013). Mapas desenvolvidos com um pequeno número de indivíduos fornecem

grupos de ligação fragmentados e incompletos (Ferreira et al., 2006) e populações

muito grandes podem encarecer a análise desnecessariamente. Na prática, são

utilizadas populações com tamanho variando de 50 a 250 indivíduos (Rocha et al.,

2003).

3) Escolha do(s) tipo(s) de marcador(es) a ser(em) utilizados na genotipagem

da população: a escolha do tipo de marcador a ser utilizado deve levar em

consideração as vantagens e desvantagens dos marcadores, a infraestrutura

laboratorial, o tempo necessário para a realização das avaliações na população e as

ferramentas bioinformáticas disponíveis para a avaliação dos marcadores. Além

disso, é importante também considerar o padrão de segregação dos marcadores

(codominante ou dominante) (Liu, 1998). Sempre que possível, a construção dos

chamados mapas genéticos integrados, que utilizam de diferentes tipos de

marcadores moleculares, é a abordagem mais interessante, já que permite aumentar

a saturação do mapa de ligação (Maliepaard et al., 1997).

4) Verificação do padrão de segregação de cada loco marcador: um padrão

mendeliano típico é esperado na segregação dos marcadores, porém a ausência

deste padrão é muito usual e é chamado de desequilíbrio de ligação (Coelho & Silva

2002). Tal distorção é importante e pode, inclusive, aumentar o poder estatístico dos

mapeamentos de QTLs com efeitos aditivos e diminuir o poder em mapeamento de

QTLs com efeitos dominantes (Xu, 2008). O método mais importante e comum de

mapeamento utiliza a freqüência de recombinação para determinar a distância

relativa em centimorgans, entre dois marcadores ligados (Bhering et al., 2009). O

princípio do mapeamento genético é a observação de que a freqüência de quiasmas

entre dois genes ligados é proporcional à distância física entre ambos. Com base

nessa frequência é realizada uma análise para distribuição independente entre os

locos segregantes para identificar pares de características ligadas. (Ritter et

al.,1990).

Page 29: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

29

5) Análise da ligação entre os marcadores para a formação dos grupos de

ligação: uma vez determinada a freqüência de recombinação, os marcadores podem

ser agrupados dentro dos chamados grupos de ligação, que, basicamente, são

grupos cujos locos estão localizados no mesmo cromossomo (Collard et al., 2005).

A ordem linear dos marcadores dentro de cada grupo é deduzida da distância

genética relativa a cada um dos marcadores analisados separadamente.

6) Determinação da ordem e da distância dos marcadores dentro desses

grupos de ligação: para análise da ligação e ordenamento das marcas nos grupos

de ligação são requeridos pacotes computacionais otimizados, que levam em conta

o tipo de marcador utilizado e a ploidia da espécie estudada. Para tanto, diversos

programas computacionais, baseados em diferentes metodologias de análise, foram

desenvolvidos, como “Mapmaker” (Lander et al., 1987), “JoinMap” (Van Ooijein &

Voorrips, 2001), “OneMap” (Margarido et al., 2007) e “TetraploidMap” (Hackett et al.,

2007).

Tendo em vista todas as variáveis inerentes a cada uma das etapas do

processo, cada fator pode afetar a eficiência do processo de mapeamento e, como

consequencia, é comum a obtenção de diferentes mapas gerados para populações

diferentes da mesma espécie (Liu, 1998; Paterson et al., 2000).

2.5 Mapeamento genético em poliploides

A teoria e as metodologias necessárias para obtenção de mapas genéticos

em espécies diploides são bem estabelecidas e otimizadas, o que não ocorre para

as espécies poliploides (Leach et al., 2010; Ripol et al., 1999). Tais espécies, que

correspondem a cerca de 75% dos vegetais, possuem complexos padrões de

segregação e alta diversidade de genótipos (Henry, 2008).

A construção de mapas genéticos para espécies poliploides é mais desafiadora

do que em diploides devido: (1) os modelos estatísticos e os modelos

computacionais necessários são mais complexos, visto que devem levar em

consideração os diferentes níveis de ploidia, (2) uma ampla variedade de genótipos

é esperada na população segregante, (3) há vários modos de formação de gametas

e pareamento randômico dos múltiplos cromossomos homólogos, (4) as diferentes

frequências dos gametas constituem um desafio adicional, devido à segregação dos

alelos com diferentes níveis de dosagem (Wu et al., 1992).

Page 30: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

30

Visto que nenhum modelo foi desenvolvido até o momento afim de atender a

esta realidade, uma abordagem comum é o uso de marcadores em dose única

(MDU), como proposto por Wu et al. (1992). Deste modo, independente de qual seja

a dose de um marcador em um loco, somente se analisa a presença ou a ausência

dos alelos de cada marcador. Portanto, leva-se em conta apenas os marcadores em

dose única segregando na proporção 1:1, o que na progênie de um cruzamento

biparental, no qual o marcador está presente em um genitor e ausente em outro (Wu

et al.,1992).

Como consequência da desconsideração das informações sobre a dosagem

alélica, os marcadores codominantes passam a ter comportamento similar aos

marcadores dominantes, caso em que se aplica os SSRs e aos SNPs, levando a

perda informações (Da Silva et al., 1995).

Vários mapas foram feitos utilizando a estratégia do pseudo-testcross e

marcadores em dose única segregantes na proporção 1:1 (Daugrois et al., 1996;

Ming et al., 2001; AlJanabi et al., 2007). Garcia et al.(2006), baseando-se na

metodologia de Wu et al. (2002) propuseram a utilização dos marcadores

segregantes na proporção 3:1, possibilitando a construção de mapas genéticos

integrados em cana-de-açúcar (Oliveira et al., 2007). Essa forma trouxe vantagem

pois permitiu aumentar a saturação do mapa de ligação e estender a caracterização

da variação polimórfica em todo o genoma (Garcia et al., 2006).

Apesar do avanço implementado pelo emprego da metodologia de MDU na

análise para o mapeamento de cana-de-açúcar, por exemplo, o uso somente de

marcadores com segregações 1:1 e 3:1 torna o conhecimento genético da espécie

muito limitado. É conhecido que o uso de somente essas segregações é menos

informativo que outros tipos, como por exemplo, o uso de marcadores que segregam

nas proporções 1:2:1 ou 1:1:1:1, no caso de espécies diploides (Wu et al., 2002).

Page 31: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

31

3. OBJETIVOS

3.1. Objetivo Geral

Contribuir para o conhecimento molecular da espécie Panicum maximum,

auxiliando assim os programas de melhoramento genético da espécie.

3.2. Objetivos Específicos

A partir do trancriptoma analisado por Toledo-Silva e colaboradores (2013),

identificar genes relacionados as vias do metabolismo no nitrogênio, fixação

de carbono, resistência a infecções e via de formação da lignocelulose;

Identificar e genotipar marcadores moleculares do tipo SNP para os genes

selecionados;

Construir um novo mapa de ligação para a espécie, em conjunto com

informações dos marcadores SSRs já genotipados anteriormente pelo nosso

grupo de pesquisa.

Page 32: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

32

CAPÍTULO I

Page 33: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

33

Construção de um mapa de ligação para Panicum maximum a partir de

marcadores moleculares SNPs e SSRs

Camila Fornezari Rabelloa, Guilherme Toledo-Silvad, Rodrigo Rampazob, Liana Jankc, Augusto Garciab, Anete Pereira Souzaa.

aCentro de Biologia Molecular e Engenharia Genética (CBMEG), Departamento de Genética e Biologia Molecular, Universidade Estadual de Campinas (UNICAMP), Campinas, São Paulo, Brasil bDepartamento de Genética, Escola Superior de Agricultura Luiz de Queiroz (ESALQ), Universidade de São Paulo (USP), Piracicaba, São Paulo, Brasil cEmbrapa Gado de Corte, Campo Grande, Mato Grosso do Sul, Brasil dDepartamento de Bioquímica, Universidade Federal de Santa Catarina (UFSC), Florianópolis, Santa Catarina, Brasil

Resumo

Os programas de melhoramento genético de espécies de importância

comercial têm evoluído muito pelo emprego de marcadores moleculares e mapas de

ligação. A espécie Panicum maximum é uma das mais importantes gramíneas

forrageiras do Brasil, sendo cultivada em uma área superior a 34 milhões de

hectares. Entretanto, dado o escasso número de trabalho voltados para a elucidação

dos seus aspectos genético-moleculares, um único e limitado mapa de ligação está

disponível para a espécie. Assim, o objetivo deste trabalho foi a construção de um

novo mapa de ligação para P. maximum, integrando marcadores do tipo SSR e

SNP, através de um software específico para espécies tetraploides, o TetraploiMap.

Como resultado, foram identificados 86.312 SNPs e foram construídos mapas de

ligação para dois genótipos (S10 e Mombaça). O mapa do genitor Mombaça contou

com 119 marcadores e cobriu 897,1 cM, enquanto o mapa do genitor S10 possui

113 marcadores, distribuídos em 808,4 cM. Estes resultados ampliam o

conhecimento genético da espécie e servirão como base para estudos que visem o

melhoramento genético de P. maximum assistido por marcadores moleculares.

Palavras-chave: mapeamento genético, forrageiras, TetraploidMap, SNP, SSR

Page 34: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

34

Introdução

A espécie Panicum maximum, popularmente conhecida como capim-colonião,

é uma das gramíneas mais importantes e populares do Brasil, ocupando

aproximadamente 20% da área de pastagens cultivadas do país (Martuscello et al.,

2008), o que corresponde a 34 milhões de hectares. A espécie é ainda a

responsável por 30% do mercado nacional de sementes de plantas forrageiras

(Abrasem, 2004).

O sucesso de P. maximum decorre de suas características de adaptabilidade

e performance, tais como elevadas taxas de produtividade, baixa exigência em

relação à fertilidade do solo, resistência à secas e queimadas e alto desempenho

sob sistema intensivo de produção. Adicionalmente, a espécie oferece alta

palatabilidade, boa digestibilidade e elevadas taxas nutricionais ao gado, além de

poder ser oferecida a espécies de equinos e ovinos (Jank et al., 1997; Jank, 2003;

Aronovich, 1995, Martuscello et al., 2006).

Embora sua importância para o agronegócio brasileiro seja notável, a espécie

ainda permanece pouco estudada, possuindo, consequentemente, poucos cultivares

lançados comercialmente. Isso contribui, dentre outros fatores, para que as

pastagens sejam cultivadas em grandes áreas de monocultura clonais,

geneticamente pobres e vulneráveis à patógenos e pragas, o que torna evidente a

necessidade do investimento em programas de melhoramento genético da espécie

(Valle et al., 2009; Verzignassi & Fernandes, 2001).

Atualmente, o único programa de melhoramento de P. maximum do país é

conduzido pela Embrapa Gado de Corte (Campo Grande, Mato Grosso do Sul), que

conta com uma coleção de acessos apomíticos e sexuais introduzida no Brasil na

década de 80, por meio de um acordo com o Institut Français de Recherche

Scientifique pour le Développement en Coopération (ORSTOM). A partir daí,

trabalhou-se na caracterização dos acessos e iniciou-se o melhoramento genético

da espécie, possibilitando o lançamento dos cultivares como o P. maximum cv.

Tanzania-1 (1990), P. maximum cv. Mombaça (1993) e o P. maximum cv. Massai

(2001) (Jank et al., 2005).

Para o avanço da assertividade do programa e aceleração do lançamento de

novos cultivares, faz-se necessário o entendimento de características genéticas e

moleculares da espécie. O único mapa molecular disponível de P. maximum foi

Page 35: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

35

publicado em 2005 por Ebina e colaboradores. Tal mapa, possui apenas marcadores

de caráter dominante e foi baseado em uma única cultivar (único parental de um

cruzamento biparental) lançada pelo programa de melhoramento genético japonês

(Ebina et al., 2005).

No contexto do melhoramento de plantas, mapas de ligação são muito úteis

ao possibilitarem a cobertura e análise do genoma, a decomposição de

características genéticas complexas nos seus componentes mendelianos, o

mapeamento comparativo entre espécies, estudos filogenéticos, a predição de

descendências em cruzamentos e a identificação de marcas relacionadas com

regiões-chave do genoma para a expressão de características quantitativas (QTL –

Quantitavive Trait Locus) (Tanksley, 1993; Semagn et al., 2006; Ferreira &

Grattapaglia 1998).

O mapeamento em espécies poliploides, como é o caso de P. maximum (2n =

4x = 32), é mais complexo e desafiador, uma vez que a dosagem e frequência

alélica dos locos marcadores precisam ser estimadas e há mais possibilidades na

formação dos gametas com, consequentemente, maior variabilidade genética entre

a população de indivíduos. A estes pontos soma-se o fato de existirem um número

limitado de ferramentas de mapeamento e análise de dados para espécies

poliploides (Wu et al., 1992).

Este trabalho teve como objetivo a construção do primeiro mapa molecular da

espécie com informações de marcadores moleculares do tipo SSR e SNP,

utilizando, para tanto, uma metodologia desenvolvida especificamente para espécies

tetraploides, implementado no software TetraploiMap. O mapa gerado nesta

pesquisa poderá ser empregado em estudos genéticos sobre o comportamento

genômico em híbridos, fornecendo informações que auxiliem o programa de

melhoramento genético da espécie, além de poder ser utilizado como base para

estudos futuros.

Materiais e métodos

População de mapeamento e material vegetal

A população de mapeamento utilizada é composta por uma progênie de 137

indivíduos (irmãos completos de F1), gerada a partir do cruzamento entre o genitor

Page 36: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

36

sexual S10 e a cultivar apomítica Mombaça, ambos tetraploides (2n = 4x = 32) e

dotados de características de produção contrastantes. Para a viabilização do

cruzamento, o genótipo sexual foi anteriormente tetraploidizado através do uso de

colchicina. A progênie gerada a partir do cruzamento é bastante heterogênea e

alguns indivíduos foram utilizados como parentais em outros cruzamentos, o que faz

desta população uma importante fonte de variabilidade genética para o programa de

melhoramento genético da espécie.

Para cada indivíduo da população e seus parentais, foram coletadas de 3 a 4

folhas, as quais foram liofilizadas e processadas com auxílio de um moinho

laboratorial (IKA Works Inc., USA). O DNA foi extraído segundo protocolo otimizado

para a espécie (Sousa, 2010) e a integridade deste material foi avaliada através de

gel de agarose 1%. O DNA de cada indivíduo foi quantificado utilizando o aparelho

NanoDrop 8000 UV-Vis Spectrophotometer (Thermo Scientifc, USA), e teve sua

qualidade estimada a partir das razões 260/280 nm e 230/260 nm.

Mapeamento do transcriptoma e prospecção de SNPs

A partir do transcriptoma de folhas publicado para a espécie (Toledo-Silva et

al., 2013), foram selecionadas as leituras (reads) provenientes dos genótipos

Mombaça e S10. Foi então realizado o mapeamento destas leituras nos transcritos

de P. maximum através do programa CLC Genomics Workbench 4.9 (Qiagen, DEU).

Dentre os parâmetros de mapeamento utilizados, destacam-se a Lenght fraction =

0,9 e Similarity = 0,9.

A busca de SNPs foi realizada pelo emprego da ferramenta SNP detection

disponível no mesmo programa, utilizando os parâmetros: Maximum expected

variations = 4, Minimum coverage = 20, Variants = 2 (considerando apenas SNPs

bialélicos) e Minimum variant frequency = 35%.

A re-anotação dos transcritos oriundos do mapeamento do transcriptoma foi

realizada através da ferramenta Blast2GO (Conesa et al., 2005), utilizando o

algoritmo blastx contra o banco de proteínas não reduntantes (nr) do SwissProt, com

filtro de e-value em 10-6 e no mínimo 30% de pct_hit_len_aligned (porcentagem

alinhada do contig frente ao gene homologo encontrado). A partir das informações

obtidas, foram filtrados manualmente os contigs referentes a genes relacionados às

vias do metabolismo no nitrogênio, fixação de carbono, resistência biótica/abiótica e

via de formação da lignocelulose. Foram ainda selecionados um máximo de quatro

Page 37: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

37

contigs pertencentes ao mesmo gene predito e um limite de três SNPs pertencentes

ao mesmo contig.

Uma vez que não há genoma para P. maximum, a filtragem de SNPs em

possíveis regiões intronicas foi realizado via BLAST com dados de Panicum

virgatum no banco Phytozome v9.1 (http://www.phytozome.net). Foram selecionados

os marcadores presentes em regiões com: (I) aproximadamente 150 pares de bases

(pb) em cada flanco, (II) que não apresentassem outro SNP a, pelo menos, 50 pb de

distância, (III) ausência de regiões intrônicas a uma distância mínima de 50 pb do

SNP (IV) ausência de íntrons com tamanho superior a 100 pb nas porções

flanqueadoras de ~300 pb.

Mapeamento genético utilizando o software TetraploidMap

Para a construção do mapa de ligação, foram utilizados os marcadores SNPs

identificados e marcadores do tipo SSR desenvolvidos previamente (Toledo-Silva et

al., 2013; Souza et al., 2011a; Souza et al., 2011b).

A genotipagem dos marcadores SSR foi realizada por coloração por nitrato de

prata (Creste et al., 2001) ou em genotipador Li-Cor 4300 DNA Analyzer (Schuelke,

2000) por Toledo-Silva (2013). A genotipagem dos SNPs foi realizada via

espectrometria de massas na plataforma Sequenom iPLEX MassARRAY®

(Sequenom Inc., San Diego, California, USA).

O mapa de ligação foi construído utilizando-se o programa TetraploidMap

(Hackett et al., 2007), que permite a construção de mapas a partir de marcadores

dominantes e codominantes, em populações de irmãos-completos provenientes de

cruzamento de espécies autotetraploides utilizando marcas SSR e AFLP.

Para os marcadores tipo SSR, a segregação foi verificada através da

ferramenta findgeno, disponível no TetraploidMap. Apenas as marcas com

segregação 1:1, 3:1 e 5:1 foram utilizadas. Já para os marcadores tipo SNP, foi

necessária a conversão das marcas para marcadores dominantes AFLP. A ploidia e

dosagem alélica dos SNPs foi estimada pelo software SuperMASSA (Serang et al.,

2012) e apenas SNPs com segregação 1:1 e 3:1 foram utilizados no mapeamento. O

mapa genético final foi desenhado pelo programa MapChart 2.3 (Voorrips, 2002).

Page 38: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

38

Resultados e discussão

Identificação de marcadores moleculares SNP para Panicum maximum

Através do mapeamento do transcriptoma de folhas dos parentais S10 e

Mombaça, foi possível a identificação de 86.312 SNPs. Este número é superior ao

obtido em outros trabalhos que visaram o mapeamento de marcadores moleculares

do tipo SNP tomando como base dados de transcriptoma, como trigo e grão de bico,

para os quais foram obtidos 36 mil SNPs (Schnable et al., 2009; Jhanwar, et al.,

2012), e eucalipto, pimenta Capsicum annuum e Artemisia tridentata, com números

entre 20 e 25 mil SNPs (Novaes et al., 2008; Ashrafi et al., 2012; Bajgain et al.,

2011).

O número, porém, foi inferior ao obtido para P. maximum por Toledo-Silva e

colaboradores (2013), quando foram mapeados 106.951 SNPs para os genótipos

S10 e Mombaça. A diferença do número de marcadores prospectados, da ordem de

19,30%, reflete o emprego de diferentes programas computacionais e o uso de

parâmetros estringentes no presente estudo. A importância da escolha dos

parâmetros de busca é corroborada por outros dados, como os de Trick e

colaboradores (2009), para os quais houve redução de 45,22% do número de SNPs

mapeados pela alteração de um único parâmetro (Minimum coverage, de 4 para 8

reads).

Dentre os SNPs identificados neste estudo, 64,17% são classificados como

transições e 35,83% são transversões (Tabela 1). Esta porcentagem

significativamente maior de transições é observada para diferentes espécies e com

diferentes metodologias para busca de SNPs (Garg et al., 1999; Picoult-Newberg et

al., 1999; Deutsch et al., 2001; Toledo-Silva et al., 2013) e provavelmente se deve

ao fato deste tipo de fenômeno ocasionar mais frequentemente mutações sinônimas

a nível de proteína, o que torna evolutivamente mais provável sua fixação nas

populações.

A profundidade mínima (mínima cobertura) estabelecida como critério de

busca dos marcadores foi de 20 reads por contig, e esta foi a profundidade com o

maior número de SNPs mapeados, totalizando 2.177 SNPs, o que representa 2,5%

do total de dados. A profundidade máxima alcançada foi de 274.960 reads/ contig.

Page 39: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

39

Para a frequência alélica dos SNPs, o valor mínimo estabelecido foi de 35% e

a frequência mais abundantemente mapeada foi de 63/37%, com incidência em

7,46% dos SNPs mapeados. O estabelecimento de uma frequência mínima de 35%,

bastante superior aos 1% de frequência mínima para uma alteração ser considerada

um SNP verdadeiro, reduz a chance do mapeamento de falsos SNPs, aumentando a

assertividade na genotipagem destes marcadores, embora, em contrapartida,

provoque a exclusão de SNPs raros, potencialmente úteis ao melhoramento

assistido por marcadores.

Tabela 1. Classificação dos SNPs mapeados para P. maximum.

Tipo dos SNPs Número de SNPs Porcentagem

Transições 55.389 64,17

A-G/G-A 27.154 31,46

C-T/T-C 28.235 32,71

Transversões 30.923 35,83

A-C/C-A 7.461 8,64

A-T/T-A 6.817 7,90

T-G/G-T 7.537 8,73

G-C/C-G 9.108 10,55

Total 86.312

Com relação à distribuição destas marcas ao longo do transcriptoma de

folhas, os 86.312 SNPs mapeados estão distribuídos em 16.356 contigs, o que gera

uma média de 5,28 SNPs/contig. Considerando o tamanho médio dos contigs na

ordem de 1.700 pares de bases (pb), há a incidência média de um SNP a cada 322

pb. Este número está muito próximo à taxa de um SNP a cada 100-300 pb descrita

para genomas vegetais por Gupta e colaboradores (2001), e encontra-se entre os

extremos de um SNP a cada 20 pb em batata e aveia até um SNP a cada 7.000 pb

em tomate (Labarte & Baldo, 2005; Nesbitt & Tanksley, 2002; Rickert et al., 2003;

Rafalsky, 2002).

Um total de 3.805 contigs apresentaram apenas um SNP (23,27% dos

dados), enquanto o contig comp411426_c0_seq1 apresentou o maior número deste

tipo de polimorfismo, com 88 SNPs. A anotação deste contig indica se tratar de uma

Heat Shock Protein, proteínas extremamente abundantes e pertencentes à família

das chaperonas, que desempenha importantes papéis celulares, tais como auxílio

no enovelamento das proteínas, reciclagem de proteínas com conformações

Page 40: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

40

anômalas ou agregadas, translocação proteica, entre outros (Mayer & Bakau, 2005).

Os contigs com maior número de polimorfismo podem ser visualizados na Tabela 2.

Tabela 2. Classificação dos 10 contigs que apresentaram maior número de SNPs

mapeados.

Contig Número

de SNPs Anotação

comp411426_c0_seq1 88 Heat shock 70 kDa protein 15

comp411103_c0_seq1 77 Coatomer subunit beta-2

comp411096_c0_seq1 73 Calmodulin-binding transcription activator 3

comp411237_c0_seq1 73 Glutamate receptor 3.4

comp411617_c0_seq1 71 Pre-mRNA-processing-splicing factor 8

comp411585_c0_seq1 66 BAG family molecular chaperone regulator 6

comp411278_c0_seq1 60 Filament-like plant protein 4

comp411595_c0_seq1 59 FAB1B

comp407321_c0_seq1 58 Myosin-15

comp411312_c0_seq1 57 Disease resistance protein At1g58390

Dado o elevado número de contigs nos quais foram identificados os

polimorfismos e a presença de até 80 SNPs por contig, visando reduzir a

redundância dos dados e assegurar o sucesso da genotipagem dos polimorfismos

encontrados, adotou-se a estratégia de selecionar os melhores SNPs de cada contig

cuja anotação indicasse similaridade às vias do metabolismo no nitrogênio, fixação

de carbono, resistência biótica/abiótica e via de formação da lignocelulose.

Ainda, uma vez que os contigs selecionados são oriundos de uma análise de

transcriptoma, foi necessário realizar uma comparação via BLAST com um banco de

dados de Panicum virgatum para averiguar a presença de íntrons nestes contigs,

uma vez que tais regiões poderiam resultar em dificuldades para a genotipagem dos

marcadores.

O estabelecimento destes critérios resultou na seleção de 163 SNPs,

distribuídos em 81 contigs, o que gera média de 2,01 SNP/contig. Esta quantidade

está próxima aos 125 SNPs validados por Trick et al. (2012) em linhagens de trigo

tetraploide e encontra-se entre o número estudado para organismos diploides e

organismos poliploides complexos, visto que Mantello e colaboradores (2014)

trabalharam com a validação de 78 SNPs em seringueira (Hevea brasiliensis) e

Page 41: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

41

Garcia e colaboradores (2013) procederam com a validação via Sequenom para 271

SNPs de cana-de-açúcar.

Mapeamento genético de P. maximum

Como resultado das etapas de genotipagem e estimação de ploidia e

dosagem alélica, foram habilitados para o mapeamento 209 marcadores tipo SSR e

104 marcadores SNP.

O programa TetraploidMap, entretanto, foi desenvolvido para a criação de

mapas a partir de marcas AFLP e SSR, não sendo, portanto, habilitado para

utilização de marcadores tipo SNP. Desta forma, foi necessária a conversão dos

dados dos SNPs, de natureza codominante, para marcas tipo AFLP, de caráter

dominante. Para tanto, foram utilizadas apenas SNPs com dosagem simplex (e.g.

AGGG X GGGG) e duplo-simplex (e.g. AGGG X AGGG), que segregam na progênie

na proporção 1:1 e 3:1, respectivamente. Este tipo de conversão, além de implicar

na perda de marcadores, gera também a perda da profundidade dos dados,

tornando-os menos informativos.

Além disso, o uso da função findgeno, que estima a dosagem de cada loco a

partir da segregação observada na progênie pelo emprego de qui-quadrado, não é

opcional no programa, embora seja desnecessária neste estudo, visto que o

software SuperMASSA aqui empregado faz este papel de forma mais acurada, visto

que foi desenvolvido especificamente para dados oriundos das plataformas

Sequenom e Illumina Golden GateTM. Após estas etapas de filtragem e conversão,

56 SNPs foram descartados (53,85%), permanecendo, portanto, 48 SNPs com

potencial para ligação no mapa genético.

A partir do mapeamento dos marcadores moleculares pelo emprego do

TetraploidMap, foram obtidos dois mapas moleculares parciais para Panicum

maximum, um mapa baseado em cada um dos genitores (Figuras 1 e 2).

Page 42: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

42

Figura 1. Mapa genético de P. maximum desenvolvido a partir de dados do genitor S10.

Marcadores SSR representados em preto e marcadores SNP em vermelho, com distância

calculada em cM (centimorgan).

Page 43: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

43

Figura 2. Mapa genético de P. maximum desenvolvido a partir de dados do genitor

Mombaça. Marcadores SSR representados em preto e marcadores SNP em vermelho, com

distância calculada em cM (centimorgan).

Page 44: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

44

O mapa do genitor S10 conta com 113 marcadores posicionados, sendo 19

marcadores SNPs e 94 marcadores tipo SSR. O mapa cobriu uma distância de

808,4 cM, distribuídos em 10 grupos de ligação (GLs). A distância média entre os

marcadores moleculares é de 7,15 cM, sendo que a menor distâncias entre duas

marcas é da ordem de 0,03 cM, enquanto que o maior gap é de 39,9 cM. Os grupos

de ligação possuem, em média, 11 marcadores cada um e apresentam tamanho

médio de 89,83 cM.

O grupo de ligação com maior número de marcadores moleculares

posicionados é o GL7, que conta com 24 marcas, enquanto que o grupo de ligação

que cobriu a maior distância é o GL3, com 146,69 cM. O menor grupo, tanto em

termos de número de marcas quanto em tamanho, é o GL9, que conta com apenas

dois marcadores do tipo SSR, o que o torna também o único GL sem marcadores do

tipo SNP ligados. As duas marcas que compõem o GL estão intimamente ligadas, de

modo que o GL cobriu a pequena distância de 0,03 cM (Tabela 3).

Tabela 3. Detalhamento dos grupos de ligação formados no mapeamento do genitor S10.

Mapa do genitor S10

Grupo de Número de Número de

Total Tamanho (cM) ligação SNP SSR

GL1 2 11 13 65,74

GL2 2 2 4 16,34

GL3 1 20 21 146,69

GL4 1 7 8 58,91

GL5 3 10 13 96,01

GL6 2 16 18 125,32

GL7 3 21 24 122,95

GL8 1 3 4 69,85

GL9 0 2 2 0,03

GL10 4 2 6 106,62

Somatória 19 94 113 808,43

Média 1,90 9,40 11,30 89,83

O mapa do genitor Mombaça, por sua vez, foi construído a partir da ligação

de 119 marcadores, sendo eles 22 SNPs e 97 SSRs. Tal mapa apresentou uma

distância maior quando comparado ao mapa do genitor S10, cobrindo 897,1 cM. O

número de grupos de ligação também foi maior, contando com 13 GLs. A distância

Page 45: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

45

média entre os marcadores foi de 7,54 cM, com distância mínima e máxima entre

dois marcadores na ordem de 0,07 cM e 41,6 cM, respectivamente.

Em média, os GLs possuem 9 marcadores distribuídos em 69,01 cM. Não

estão presentes marcadores do tipo SNP nos grupos GL3, GL12 e GL13. O grupo

de ligação com menor número de marcas foi o GL13, com 2 marcadores SSR,

enquanto que o GL8 apresentou o maior número de marcas, com 19 marcadores

moleculares posicionados. Com relação ao tamanho dos grupos, o GL11 apresentou

a menor distância mapeada, com 1,30 cM, e o GL11, por sua vez, apresentou o

maior tamanho coberto, com 140,66 cM (Tabela 4).

A distância média, considerando ambos os mapas, de 7,35 cM entre cada

marcador é satisfatória quando comparada aos valores de 8,95 cM relatado para

salgueiro tetraploide e 10,7 cM para cana-de-açúcar (Barcaccia et al., 2003; Costa,

2015). Entretanto, em mapas saturados, estes valores comumente se aproximam da

marca de 1-3 cM por marca, podendo chegar a valores na ordem de 0,3 cM/marca,

indicando, portanto, que mais marcadores moleculares precisam ser agregados aos

mapas obtidos de P. maximum (Trick et al., 2009; Delourme et al., 2013).

Tabela 4. Detalhamento dos grupos de ligação formados no mapeamento do genitor Mombaça.

Mapa do genitor Mombaça

Grupo de

Número de SNP Número de SSR Total Tamanho (cM) ligação

GL1 1 2 3 5,88

GL2 1 13 14 101,17

GL3 0 4 4 48,87

GL4 4 9 13 57,26

GL5 2 4 6 71,03

GL6 2 8 10 98,79

GL7 2 12 14 78,48

GL8 4 15 19 109,97

GL9 4 13 17 140,66

GL10 1 10 11 94,86

GL11 1 2 3 1,30

GL12 0 3 3 47,27

GL13 0 2 2 41,58

Somatória 22 97 119 897,13

Média 1,69 7,46 9,15 69,01

Page 46: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

46

Com relação às taxas de ligação dos marcadores, dos 48 SNPs disponíveis,

19 (39,58%) se ligaram ao mapa do genitor S10 e 22 SNPs (45,83%) se ligaram ao

mapa do genitor Mombaça. Deste modo, considerando ambos os mapas, 31 SNPs

se ligaram (64,58%), sendo que 10 destes polimorfismos (32,26%) se ligaram a

ambos os mapas. A taxa de ligação na ordem de 64,58% está próxima à

porcentagem de 75% de integração de SNPs obtidas para milho por Liu e

colaboradores (2010) e à média de 50% de integração de marcadores tipo AFLP e

SSRs convertidos à marcadores de dose única no mapa de salgueiro (Barcaccia et

al., 2003).

Já com relação aos SSR, 150 marcas das 209 disponíveis se ligaram a algum

dos parentais, o que gera uma taxa de ligação de 71,77%, número superior à taxa

de ligação dos marcadores SNP. Ao mapa do genitor Mombaça, 97 SSR foram

ligados, enquanto que 94 SSRs se ligaram ao mapa do genitor S10. O número de

SSRs que conseguiram se ligar a ambos os mapas foi de 41 SSRs, o que

representa 27,33% (Tabelas 3 e 4).

Em ambos os mapas gerados, o número de grupos de ligação encontrados foi

diferente dos 8 GLs esperados para a espécie (2n=4x=32), uma vez que foram

identificados 10 e 13 GLs (para S10 e Mombaça, respectivamente). Este desvio,

provavelmente, dá-se em decorrência do baixo número de marcadores utilizados, o

que, consequentemente, implica em mapas de ligação pouco saturados. Assim, à

medida que o número de marcadores adicionados ao mapeamento aumenta, há a

tendência de fusão dos GLs originalmente classificados como grupos diferentes,

aproximando o número de grupos de ligação encontrados do número real da

espécie.

Quando comparamos os mapas obtidos com o único mapa de ligação

disponível para Panicum maximum (Ebina et al., 2005), diferenças expressivas são

encontradas, uma vez que o tipo de marcadores moleculares utilizados e a

metodologia de montagem do mapa empregada foram diferentes.

Embora o mapa prévio também tenha sido desenvolvido com base em uma

população segregante de F1, apenas um dos genitores foi utilizado no mapeamento

e os polimorfismos empregados foram dos tipos AFLP e RAPD, o que implica em

dificuldades na reprodução e aplicabilidade do mapa. O mapa gerado por Ebina e

colaboradores cobriu 1706,5 cM e contou com 360 marcadores distribuídos em 39

Page 47: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

47

grupos de ligação (quando eram esperados 32 GL pela metodologia empregada,

que gera um grupo para cada um dos homólogos), gerando, portanto, uma média de

4,74 cM por marca.

Conclusões

No presente estudo, pela primeira vez, marcadores moleculares SSRs e

SNPs foram utilizados para a construção de mapa molecular para a espécie

Panicum maximum. Através do software TetraploidMap, específico para o

mapeamento de espécies tetraploides, foram obtidos dois mapas moleculares, um

para cada um dos genitores da população de mapeamento utilizada. Os mapas

foram produzidos a partir de 181 marcadores moleculares e cobriram distâncias de

808,43 e 897,13 cM. Adicionalmente, foram mapeados mais de 86 mil marcadores

moleculares do tipo SNP, sendo 147 deles validados por espectrometria de massas.

Os mapas obtidos representam um importante avanço para a compreensão

dos aspectos genético-moleculares de P. maximum e poderão ser utilizados para

futuros ensaios de identificação de QTLs e em programas de melhoramento

genético da espécie, além de fornecerem informações valiosas para a montagem do

genoma de P. maximum e estudos de compreensão da evolução da espécie.

Referências

Aronovich, S. O capim colonião e outros cultivares de Panicum maximum

(Jacq.): introdução e evolução do uso no Brasil. In: Simpósio sobre manejo da

pastagem, 12., 1995, Piracicaba. Anais... Piracicaba: Fundação de Estudos Agrários

Luiz de Queiroz, 1995. p.1-20.

Ashrafi H. et al. De novo assembly of the pepper transcriptome (Capsicum

annuum): a benchmark for in silico discovery of SNPs, SSRs and candidate genes.

BMC Genomics, v. 13, p. 571. doi: 10.1186/1471-2164-13-571, 2012.

Associação Brasileira de Sementes - ABRASEM. Disponível em:

http://www.abrasem.br (acessado 21/08/2016).

Bajgain, P. et al. Transcriptome characterization and polymorphism detection

between subspecies of big sagebrush (Artemisia tridentata). BMC Genomics, v. 12,

p. 370, 2011.

Page 48: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

48

Barcaccia, G. et al. Linkage mapping in tetraploid willows: segregation of

molecular markers and estimation of linkage phases support an allotetraploid

structure for Salix alba x Salix fragilis interspecific hybrids. Heredity (Edinb), v. 90(2),

p. 169-180, 2003.

Conesa, A. et al. Blast2GO: a universal tool for annotation, visualization

and analysis in functional genomics research. Bioinformatics, v. 21, p. 3674–3676,

2005.

Creste, S.; Tulmann, A.; Figueira, A. Detection of single sequence repeat

polymorphisms in denaturing polyacrylamide sequencing gels by silver staining.

PlantMolecular Biology Reporter, Athens, v.19, p.299 – 306, 2001.

Delourme, R. et al. High-Density SNP-Based Genetic Map Development and

Linkage Disequilibrium Assessment in Brassica Napus L. BMC Genomics, v. 14, p.

120, 2013.

Deutsch, S. et al. A cSNP map and database for human chromosome

2. Genome Res., v. 11, p. 300–307, 2001.

Ebina M. et al. Co-segregation of AFLP and RAPD markers to apospory in

Guineagrass (Panicum maximum Jacq.). Grassland Science, v. 51, p. 71-78, 2005.

Ferreira, M. E.; Grattapaglia, D. Introducción al Uso de Marcadores

moleculares en el Análisis Genético. EMBRAPA-CENARGEN, p.220, 1998.

Garg, K.; Green, P.; Nickerson, D.A. Identification of candidate coding region

single nucleotide polymorphisms in 165 human genes using assembled expressed

sequence tags. Genome Res., v. 9, p. 1087–1092, 1999.

Gupta, P. K.; Roy, J. K.; Prasad, M. Single nucleotide polymorphisms: A

new paradigm for molecular marker technology and DNA polymorphism detection

with emphasis on their use in plants. Current Science, v. 80, n. 4, p. 4524-535, 2001

Hackett, C. A. et al. Tetraploid Map for Windows: linkage map construction and

QTL mapping in autotetraploid species. The Journal of heredity, v. 98, n. 7, p. 727–

729, 2007.

Jank L. et al. Catalog of the characterization and evaluation of the Panicum

maximum germplasm: morphological description and agronomical performance.

Embrapa Gado de Corte, v. 68, p. 53, 1997.

Jank, L. A História do Panicum maximum no Brasil. Revista Brasileira de

Sementes,v.1, p.14, 2003.

Page 49: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

49

Jank, L.; Resende, R.M.S.; Valle, C.B. Genética em pastagem. Revista USP,

São Paulo, v.64, p.86-93, 2005.

Jhanwar, S. et al. Transcriptome sequencing of wild chickpea as a rich

resource for marker development. Plant Biotechnol J., v. 10(6), p. 690-702. doi:

10.1111/j.1467-7652.2012.00712.x., 2012.

Jhanwar, S. et al., Transcriptome sequencing of wild chickpea as a rich

resource for marker development. Plant Biotechnol J., v. 10, p.690-702. doi:

10.1111/j.1467-7652.2012.00712.x, 2012.

Labate, J.A.; A.M. Baldo. Tomato SNP discovery by EST mining and

resequencing. Mol. Breed., v.16, p. 343-349, 2005.

Mantello C.C. et al. De Novo Assembly and Transcriptome Analysis of the

Rubber Tree (Hevea brasiliensis) and SNP Markers Development for Rubber

Biosynthesis Pathways. PLoS ONE 9(7): e102665.

doi:10.1371/journal.pone.0102665, 2014.

Martuscello, J. A. et al. Características morfogênicas e estruturais de capim-

massai submetido a adubação nitrogenada e desfolhação. Revista Brasileira de

Zootecnia, v. 35, n. 3, p. 665-671, 2006.

Martuscello, J.A. et al. Repetibilidade e seleção em Panicum maximum Jacq.

Tese de doutorado, Universidade Federal de Viçosa, Viçosa, p. 100, 2008

Mayer, M.P.; Bukau, B. Hsp70 chaperones: cellular functions and molecular

mechanism. Cell Mol Life Sci, v. 62, p. 670–684, 2005.

Nesbitt, T.C.; Tanksley, S.D. Comparative sequencing in the genus

Lycopersicon: implications for the evolution of fruit size in the domestication of

cultivated tomatoes. Genetics , v. 162, p. 365-379, 2002.

Novaes, E. et al. High-throughput gene and SNP discovery in Eucalyptus

grandis, an uncharacterized genome. BMC Genomics, v. 9, p. 312, doi:

10.1186/1471-2164-9-312, 2008.

Picoult-Newberg, L. et al. Mining SNPs from EST databases. Genome Res., v.

9, p. 167–174, 1999.

Rafalski, A. Applications of single nucleotide polymorphisms in crop genetics.

Current Opinion in Plant Biology, v. 5 (2), p. 94-100, 2002.

Rickert, A. M. et al. First‐generation SNP/InDel markers tagging loci for

pathogen resistance in the potato genome. Plant Biotechnology Journal, v. 1, n. 6, p.

399–410, 2003

Page 50: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

50

Schnable, P. S. et al. The B73 maize genome: complexity, diversity, and

dynamics. Science, v. 326, p. 1112–1115, 2009.

Schuelke, M. An economic method for the fluorescent labeling of PCR

fragments. Nature biotechnology, v. 18, n. 2, p. 233–4, doi:10.1038/72708, 2000.

Semagn, K.; Bjørnstad, Å.; Ndjiondjop, M.N. An overview of molecularmarker

methods for plant. Afr. J. Biotechnol, v. 25, p. 2540-2569, 2006.

Sousa, A. C. B. et al. Development of microsatellite markers in Guineagrass

(Panicum maximum Jacq.) and their transferability to other tropical forage grass

species. Plant Breeding, v. 130, n. 1, p. 104–108, 2011a.

Sousa, A. C. et al. Molecular Diversity and Genetic Structure of Guineagrass

(Panicum maximum Jacq.), a Tropical Pasture Grass. Tropical Plant Biology, v. 4, n.

3-4, p. 185– 202, 2011b.

Sousa, A.C.B. Estudos genéticos moleculares em forrageiras tropicais. Tese

(Doutorado em Genética e Biologia Molecular) – Instituto de Biologia, Universidade

Estadual de Campinas, Campinas, São Paulo, p. 205, 2010.

Tanksley, S.D. Mapping polygenes. Annual Review Genetics, Palo Alto, v.27,

p.205-33, 1993.

Toledo-Silva, G. Estudos genético-moleculares em Panicum maximum:

mapeamento genético-molecular e análise de transcriptoma via RNA-seq. Tese de

doutorado, Universidade Estadual de Campinas - Campinas/SP, 2013.

Toledo-Silva, G. et al. De novo transcriptome assembly for the tropical grass

Panicum maximum Jacq. PloS one, v. 8, n. 7, p. e70781, 2013.

Trick, M. et al. Single nucleotide polymorphism (SNP) discovery in the

polyploid Brassica napus using Solexa transcriptome sequencing. Plant

Biotechnology Journal, v.7, p. 334–346, doi:10.1111/j.1467-7652.2008.00396, 2009.

Valle, C.B.; Jank, L.; Resende, R.M.S. O melhoramento de forrageiras

tropicais no Brasil. Revista Ceres, v.56, n.4, p.460-472, 2009.

Verzignassi, J. R.; Fernandes, C. D. Doenças em forrageiras. Embrapa Gado

de Corte, Campo Grande, Circular Técnica 50, p.3, 2001

Voorips, R. E. MapChart: Software for the graphical presentation of linkage

maps and QTLs. Journal of Heredity, Washington, v. 63, p. 77-79, 2002.

Wu, K.et al. The detection and estimation of linkage in polyploids using single-

dose restriction fragments. Theoretical and Applied Genetics, v. 83, p. 294-300, 1992.

Page 51: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

51

CAPÍTULO II

Page 52: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

52

Construção de um mapa de ligação para Panicum maximum utilizando o

software OneMap

Introdução

As práticas de melhoramento vegetal têm influenciado de maneira decisiva a

adaptabilidade e produtividade das plantas cultivadas desde os primórdios da

civilização; entretanto, para a eficiente obtenção de ganhos genéticos no

melhoramento é necessário um conhecimento detalhado da constituição genética

das espécies. Com a introdução de técnicas de genética molecular no início da

década de 80, os estudos de identificação, caracterização e mapeamento genético

estão sendo realizados com maior eficiência e rapidez (Borém, 1999).

Estão disponíveis diversas metodologias para obtenção de mapas genéticos

em espécies diploides, entretanto, o mesmo não ocorre para espécies poliploides

(Leach et al., 2010; Ripol et al., 1999). Para autotetraploides, como Panicum

maximum, poucos são os mapas moleculares publicados na literatura científica,

entre eles, destacam-se os estudos com alfalfa (Brouwer & Osborn, 1999), batata

(Hackett et al., 2013; Meyer et al., 1998), rosa (Koning-Boucoiran et al., 2012;

Rajapakse et al., 2001) e, mais recentemente, mirtilo (McCallum, 2016).

O menor número de estudos em poliploides dá-se em decorrência da

complexidade genômica nestas espécies, dentre as quais a existência de dupla-

redução, pareamento randômico dos cromossomos e dificuldades para estimação da

ploidia e dosagem dos alelos nos marcadores.

Felizmente, alguns avanços neste campo têm possibilitado a realização de

novos estudos com poliploides, dentre eles destacam-se o software específico para

mapeamento de tetraploides, TetraploidMap (Hackett et al., 2007) e, mais

recentemente, a disponibilização de ferramentas que permitem estimar a dosagem

alelica dos marcadores moleculares, como o fitTetra (Voorrips et al., 2011) e o

SuperMASSA (Serang et al., 2012), o que tem permitido a construção de mapas de

ligação mais densos e informativos.

Page 53: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

53

Ainda assim, para contornar as dificuldades do mapeamento em poliploides,

tradicionalmente a construção de mapas genéticos em populações F1 de poliploides

tem utilizado a estratégia de duplo pseudo-testcross, a qual consiste na construção

de dois mapas (um para cada parental), pelo emprego de polimorfismos em

marcadores de dosagem única, segregando na proporção 1:1, o que permite a

utilização de programas de mapeamento desenvolvidos para diploides (Grattapaglia

& Sederoff, 1994; Shepherd et al., 2003; Carlier et al., 2004).

A utilização de marcadores em dose única (MDU) para fins de mapeamento

genético em espécies complexas tiveram sua utilização proposta por Wu et al.

(1992) e expandida por Da Silva e Sorrells (1996) e Ripol et al. (1999). Entretanto, a

obtenção de um mapa integrado ainda era necessária para a aplicabilidade dos

estudos em programas de melhoramento genético através da identificação de QTLs.

Para a promoção de tal integração, porém, faz-se necessária a presença de

marcadores em heterozigose em ambos os genitores, os quais são utilizados para

estabelecer relações de ligação entre os marcadores que segregam individualmente

em cada genitor (Wu et al., 2002). Diante disto, Wu et al. (2002) desenvolveram o

algoritmo EM (Expectation Maximization), baseado em máxima verossimilhança, que

permitiu a construção de mapas genéticos integrados, uma vez que as frações de

recombinação e as fases de ligação são estimadas de forma simultânea.

Garcia et al.(2006) baseando na metodologia de Wu et al. (2002) propôs a

utilização dos marcadores segregantes na proporção 3:1 e os algoritmos propostos

por Wu et al. (2002) foram implantados em um software público, denominado

OneMap (Margarido et al., 2007). Este programa permite a construção de mapas de

ligação para populações F1 segregantes (dentre outras), possibilitando a estimação

da fração de recombinação e das fases de ligação entre os marcadores

simultaneamente, com base em máxima verossimilhança.

Assim, com o objetivo de obter um mapa de ligação integrado e com maior

qualidade para P. maximum, os marcadores moleculares SSR e SNP foram

utilizados na elaboração de mapa pelo emprego do software OneMap.

Page 54: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

54

Metodologia

Os marcadores SSRs e SNPs genotipados e validados, como detalhado no

Capítulo I, foram utilizados como fonte de informação para a construção do mapa

genético utilizando o OneMap.

Dentre o conjunto de dados, foram selecionados os marcadores moleculares

em dose única (MDUs). Tais marcadores são identificados pela sua segregação na

proporção 1:1 quando o alelo polimórfico está presente em um genitor e ausente no

outro (ou seja, Aaaa x aaaa – simplex x nuliplex) e, também, pela segregação 3:1,

quando o alelo está presente em ambos os genitores na condição simplex (Aaaa x

Aaaa). Assim, ao analisar um marcador, independente de qual seja a dosagem, será

considerada apenas a presença ou a ausência dos alelos (marcas).

Tais marcas foram, então, categorizadas de acordo com o modelo de

nomenclaturas estabelecido por Wu et al. (2002), como resumido na Figura 3. Foram

selecionados os SNPs das categorias B3.7, D1.10 e D2.15 e os SSRs B3.7, D1.10,

D2.15 e C8.

Figura 3. Categorização dos marcadores moleculares. Adaptado de Wu et al., 2002.

Uma vez realizada esta seleção, a construção do mapa genético foi realizada

usando-se o software OneMap em sua nova versão, ainda em desenvolvimento,

(disponível em https://github.com/augusto-garcia/onemap).

O posicionamento das marcas foi realizado através de quatro passos, após a

determinação da fração de recombinação e fase de ligação entre os marcadores: (I)

Page 55: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

55

Agrupamento das marcas utilizando a função “GROUP”, com parâmetros de LOD

score ≥ 3,0 e máxima fração de recombinação ≤ 0,4; (II) Ordenação das marcas

utilizando as funções “COMPARE” E “ORDER.SEQ”. A função “COMPARE” baseia-

se no modelo HMM e foi aplicada a grupos com até 5 marcas, enquanto que o

“ORDER.SEQ” foi utilizado em grupos maiores do 5 marcas (também com base no

HMM); (III) De posse dos grupos ordenados, foi aplicada a função “MAKE_SEQ”,

que retorna os grupos como uma sequência linear, expressa em centiMorgans (cM)

e estimada usando a função de Kosambi (1944); (IV) As funções “TRY” e “RIPPLE”

foram aplicadas nos grupos originalmente estabelecidos visando satura-los com

marcas que não foram automaticamente ligadas a nenhum grupo e encontrar a

melhor ordem para as marcas, respectivamente. A análise foi realizada marca a

marca para cada um dos grupos.

Paralelamente, as matrizes gráficas das frações de recombinações e do LOD

(Heatmaps) foram utilizadas para se determinar a ordem final das marcas nos

respectivos grupos de ligação. O mapa final foi desenhado pelo programa MapChart

3.1 (Voorrips, 2002).

Resultados e discussão

Os 104 SNPs e os 209 SSRs validados nos experimentos de genotipagem e

estimação de ploidia e dosagem alélica (previamente descritos no Capítulo I) foram

categorizados de acordo com os preceitos estabelecidos por Wu et al. (2002). Como

resultado, 53 SNPs (50,96%) e 189 SSRs (90,43%) foram categorizados como

marcas B3.7, D1.10, D2.15 e C8 (Figura 4).

Destes, 25 SNPs e 97 SSRs foram agregados ao mapa gerado, o que gera

taxas de ligação da ordem de 47,17% e 51,32%, respectivamente. Desta forma,

embora proporcionalmente mais SNPs tenham sido descartados por não

segregarem nas proporções estabelecidas para uso (3:1 e 1:1), as taxas de ligação

dos dois tipos de marcadores moleculares foram próximas. Tal porcentagem de

agregação de marcas também vai de encontro com os dados de Souza (2010) e

Garcia et al. (2006), que obtiveram 62% e 32%, respectivamente.

Page 56: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

56

Figura 4. Número de marcadores moleculares por categoria.

O mapa obtido compreende, portanto, 122 marcas, distribuídas em 32 grupos

de ligação, gerando uma média de 3,81 marcas por GL. Diferentemente dos mapas

obtidos no TetraploidMap, o mapa desenvolvido com o OneMap apresentou o

número de GLs esperados para a espécie (Figura 6).

O mapa cobriu uma distância total de 1.248 cM, e uma distância média de 39

cM por grupo de ligação, com o tamanho do gap médio entre marcadores na ordem

10,2 cM. A menor distância entre duas marcas é de 0,001 cM, sendo 42,7 cM o

maior intervalo apresentado, valores estes similares aos apresentados pelos mapas

do TetraploidMap (Tabela 5).

O número de marcadores moleculares posicionados nos grupos de ligação

variou de 2 a 17. Quatro grupos foram constituídos apenas de marcadores tipo SNP

e 18 GLs contam apenas com marcas SSR. O GL 1 foi o grupo com mais

marcadores agregados e também com maior tamanho, cobrindo 164,50 cM,

enquanto que o GL 32 apresentou apenas 0,05 cM (sendo também um dos grupos a

apresentarem apenas 2 marcadores).

Figura 5. Heatmap obtido para o GL1 do mapa de P. maximum obtido pelo OneMap.

Page 57: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

57

Como ponto positivo adicional ao OneMap, o programa permite uma

avaliação visual da ligação dos marcadores moleculares através de gráficos visuais,

os Heatmaps. Em tais gráficos, quanto mais homogênea a distribuição das cores,

com cores quentes próximas à diagonal, maior a probabilidade de os marcadores

estarem posicionados de forma correta no mapa de ligação. Para GLs pequenos,

como a maioria dos obtidos no mapa de P. maximum em questão, estes gráficos

não oferecem informações tão significativas, infelizmente. Como exemplo, na Figura

5 encontra-se o Heatmap do grupo GL1.

Tabela 5. Detalhamento dos grupos de ligação formados no mapeamento pelo programa

OneMap.

Mapa integrado

Grupo de Número de SNP Número de SSR Total Tamanho (cM)

ligação

GL1 0 17 17 164,50 GL2 0 7 7 41,97 GL3 1 1 2 17,33 GL4 0 3 3 36,31 GL5 1 1 2 13,27 GL6 0 5 5 52,08 GL7 3 1 4 56,28 GL8 3 0 3 22,97 GL9 0 4 4 79,92 GL10 0 7 7 88,73 GL11 2 0 2 5,32 GL12 0 2 2 12,17 GL13 0 2 2 26,46 GL14 1 6 7 126,09 GL15 4 2 6 81,42 GL16 1 3 4 48,39 GL17 2 0 2 19,38 GL18 0 2 2 7,63 GL19 0 2 2 0,17 GL20 0 2 2 24,46 GL21 0 2 2 0,78 GL22 2 0 2 21,80 GL23 0 4 4 17,71 GL24 0 3 3 34,81 GL25 0 2 2 20,24 GL26 1 3 4 31,68 GL27 1 2 3 10,80 GL28 0 2 2 19,12 GL29 1 7 8 110,14 GL30 2 1 3 45,06 GL31 0 2 2 10,95 GL32 0 2 2 0,05

Somatória 25 97 122 1247,99

Média 0,78 3,03 3,81 39,00

Page 58: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

58

Figura 6. Mapa molecular para P. maximum gerado a partir do OneMap. Em preto,

marcadores SSR e em vermelho marcadores tipo SNP. Distância representada em cM.

Page 59: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

59

Embora o número de marcadores moleculares posicionados nos mapas

produzidos pelo TetraploidMap (com 119 e 113 marcas cada) e pelo OneMap (122

marcadores) seja bastante próximos, a tecnologia empregada no modelo deste

último é mais atual e promissora, realizando a ligação das marcas de forma mais

assertiva e automatizada.

Garcia et al. (2006) analisaram o mesmo conjunto de dados utilizando os

softwares JoinMap (amplamente utilizado, desenvolvido para diploides e baseados

em aproximações mínimas por estimativas de multipontos de distâncias) e OneMap,

e, como resultado, observaram que o JoinMap gerou um mapa com menor

quantidade de grupos de ligação, menor densidade e comprimento, constatando,

portanto, que a metodologia proposta por Wu et al. (2002), baseada em máxima

verossimilhança e implementada no software OneMap, foi o método mais eficiente

para gerar um mapa integrado. Os dados positivos obtidos pelo OneMap frente ao

JoinMap foram confirmados também por Souza (2010).

Conclusões

Marcadores moleculares SSR e SNPs foram utilizados para a construção de

um mapa molecular para a espécie Panicum maximum através do software OneMap.

O mapa obtido é constituído de 122 marcas, sendo 25 SNPs e 97 SSRs, distribuídas

em 32 grupos de ligação, conforme esperado para a espécie. O mapa cobriu uma

distância total de 1.248 cM e a distância média entre os marcadores foi de 10,2 cM.

Comparado aos resultados obtidos com o programa TetraploiMap, a principal

vantagem do mapa gerado utilizando o OneMap reside no fato da integração das

marcas, gerando um mapa único, de alta qualidade, muito embora com baixo grau

de saturação. O OneMap mostrou ser uma ferramenta muito promissora para o

mapeamento de espécies poliploides, embora tenha sido desenvolvido para

diploides até o momento, o que o torna a ferramenta mais indicada para estudos

futuros que visem o aumento da saturação do mapa de P. maximum.

Page 60: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

60

4. RESULTADOS COMPLEMENTARES

4.1.1 Seleção e genotipagem de marcadores moleculares SNPs e sua

distribuição nas vias metabólicas de interesse

Como previamente descrito no Capítulo I, foi realizado o mapeamento do

transcriptoma de folhas de P. maximum filtrando-se os dados dos genitores da

população de mapeamento utilizada neste trabalho (genitores S10 e Mombaça). A

partir destes dados, foi realizada a prospecção de marcadores moleculares SNP, o

que gerou um retorno de mais de 86 mil polimorfismos mapeados.

Uma vez que um dos objetivos da pesquisa é pautado na genotipagem de

SNPs via espectrometria de massas, um conjunto da totalidade de marcadores

mapeados precisou ser selecionado. Para tanto, a partir das informações obtidas,

foram filtrados os contigs (contendo os SNPs) referentes a genes relacionados às

vias do metabolismo no nitrogênio, fixação de carbono, resistência biótica/abiótica e

via de formação da lignocelulose. Os genes presentes nestas vias específicas foram

selecionados através de busca na literatura científica e pela análise das rotas

enzimáticas disponíveis na plataforma KEGG pathway

(http:\\www.genome.jp/kegg/pathway.html).

Como resultado, foi possível identificar 72 genes preditos nas vias

metabólicas de interesse. Estes genes estão distribuídos em 478 contigs distintos, o

que gera uma média de 6,64 contigs para cada gene (Tabela 6).

Tabela 6. Detalhamento do número dos genes e de contigs identificados após a seleção dos

dados contidos nas vias metabólicas de interesse.

Via metabólica Número de genes Número de contigs

Fixação de carbono 11 82

Formação de ligocelulose 16 155

Metabolismo do nitrogênio 17 72

Resistência 28 169

TOTAL 72 478

Page 61: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

61

Uma vez realizada esta seleção, os contigs foram novamente filtrados de

modo a selecionar sequências de alta qualidade e minimizar excesso de

redundâncias nos dados. Ainda, para minimizar a chance da escolha de SNPs em

regiões intronicas, foi realizada uma comparação via BLAST com um banco de

dados de Panicum virgatum, a espécie mais próxima à P. maximum a possuir

genoma publicado.

Esta seleção gerou como resultado a identificação dos 163 SNPs mais

promissores, distribuídos em 81 contigs e 48 genes putativos, o que gera média de 2

SNPs por contig e 3,4 SNPs por gene (Tabela 7).

Tabela 7. Detalhamento do número dos genes e de contigs identificados após a seleção dos

SNPs a serem validados por genotipagem.

Via metabólica

A genotipagem dos SNPs na população de mapeamento e nos genitores foi

realizada por espectrometria MALDI-TOF (matrix-assisted laser desorption/ionization

time-of-flight), utilizando-se a plataforma MassARRAY (Sequenom Inc., USA).

Os oligonucleotídeos de captura e oligonucleotídeos de extensão de bases

únicas foram desenhados a partir dos contigs selecionados e com o auxílio do

software MassArray Assay Design (Sequenom Inc., San Diego – EUA), cujos

parâmetros evitam que sejam desenhados iniciadores que anelem entre si ou que

resultem em produtos de massa semelhante. As seguintes recomendações foram

empregadas no desenho dos iniciadores: (1) utilização da metodologia/química High

Multiplex iPLEX, (2) tamanho do amplicon variando de 70 a 300 pares de base e (3)

nível do multiplex acertado em 10 interações (10 SNPs genotipados

simultaneamente em uma reação única).

Número de

genes

Número de

contigs

Número de

SNPs

Fixação de carbono 9 23 47

Formação de lignocelulose 14 24 49

Metabolismo do nitrogênio 8 14 26

Resistência 17 20 41

TOTAL 48 81 163

Page 62: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

62

As condições utilizadas para as reações seguiram estritamente o guia descrito

pelo fabricante (iPLEXGold Application Guide - Sequenom). Ambos os genitores da

população segregante foram genotipados 10 vezes para cada loco SNP visando

aumentar a acurácia dos dados para a comparação com a genotipagem da

progênie.

Dos 163 SNPs selecionados para a genotipagem, 147 atenderam aos

parâmetros do software MassArray Assay Design e tiveram suas sequencias de

primers desenhados com sucesso (Anexo, Tabelas I e II). Destes, 100%

apresentaram amplificação e puderam ser validados via espectrometria de massas

com sucesso.

Tabela 8. Detalhamento dos SNPs validados por espectrometria de massas.

Via metabólica

Os 147 SNPs validados encontram-se dispersos em 77 contigs e 49 genes, o

que gera uma média de 3 SNPs/gene e 1,9 SNPs/contig, com 45,5% dos contigs

possuindo dois SNPs validados (Tabela 8).

O gene putativo que teve mais SNPs validados, com um total de oito

polimorfismos genotipados, foi o 4-coumarate--CoA ligase. Tal gene é relacionado,

primariamente, à via de resistência ao estresse biótico, embora estudos recentes

indiquem sua participação no metabolismo de formação de lignocelulose, o que é

coerente, uma vez que uma das formas de imunidade em plantas é a elevação dos

níveis de lignina nos tecidos para proteção mecânica, agindo como barreira

estrutural (Ascensao & Dubery, 2003).

Número de

genes

Número de

contigs

Número de

SNPs

Fixação de carbono 14 23 46

Formação de lignocelulose 13 18 34

Metabolismo do nitrogênio 8 14 23

Resistência 14 22 44

TOTAL 49 77 147

Page 63: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

63

4.1.2 Análise de ploidia e dosagem alélica nos marcadores SNP

Ao realizar a genotipagem de SNPs na plataforma Sequenom iPLEX

MassARRAY®, obtem-se como resultado um espectro que contem picos produzidos

pelos produtos de extensão da reação. Tais picos, indicativos dos alelos presentes

na amostra, são convertidos em dados apresentados por gráficos de dispersão

bidimensional, os quais representam as intensidades dos alelos de cada indivíduo,

de modo que a dosagem dos alelos pode ser inferida.

Para populações de organismos diploides, as amostras genotipadas formam

três clusters no gráfico de dispersão, correspondendo à presença de um alelo ou

ambos alelos (homozigoto ou heterozigoto para o polimorfismo). Assim, a dosagem

alélica dos SNPs mapeados (também referido como SNP calling) pode ser calculada

diretamente, através da função “SNP genotype call” do software TYPER (software

de análise do Sequenom iPLEX MassARRAY).

Entretanto, para poliploides são necessários cálculos mais acurados, uma vez

que haverá mais genótipos possíveis entre os heterozigotos. Para tetraploides, por

exemplo, haverá cinco genótipos possíveis: aaaa, Aaaa, AAaa, AAAa e AAAA.

Considerando A como o alelo de referência, os indivíduos podem ter entre zero

(nuliplex) e quatro cópias do polimorfismo (tetraplex), de modo que o número de

cópias do alelo A é justamente a dosagem alélica (Voorrips, 2011).

Para contornar as dificuldades do SNP calling em poliploides, Serang, Mollinari

e Garcia (2012) elaboraram um método baseado em modelo gráfico Bayesiano e

implementaram no software público SuperMASSA. Este programa permite fazer a

inferência simultânea da ploidia e dosagem alélica de um loco para cada um dos

indivíduos mapeados em uma população. Como vantagens de tal modelo estão o

fato da classificação dos genótipos de todos indivíduos ser realizada

simultaneamente, o que torna o processo ágil e fácil, bem como a possibilidade de

estimação da dosagem alélica mesmo para populações de ploidia desconhecida.

Os dados da genotipagem da população e dos parentais dos 147 SNPs

genotipados foram submetidos à estimação de dosagem alélica utilizando a função

específica para dados de populações F1 (Model F1 Cross) do SuperMASSA.

Complementarmente, foi realizado um estudo da ploidia dos marcadores

genotipados, pelo qual se estimou a probabilidade a posteriori de cada loco

apresentar um nível de ploidia par variando de quatro a oito (Ploidy range = 4:8).

Page 64: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

64

A ferramenta que possibilita a inferência de ploidia é especialmente útil para

espécies de ploidia variável, como cana-de-açúcar, por exemplo. Para espécie com

ploidia fixa e conhecida, como é o caso do P. maximum, há a possibilidade de fixar o

ploidia no sistema. Entretanto, uma vez que os genes escolhidos pertencem a vias

muito importantes para o metabolismo e sobrevivência da planta, o que torna

provável duplicações genicas, foi estabelecida ploidia variável no programa.

Ainda, após os locos SNPs serem classificados para a ploidia mais provável, a

eles foram atribuídos duas categorias distintas, baseado nas categorias descritas

por Garcia et al.(2013): Categoria A: locos SNPs com probabilidade a posteriori

maior ou igual a 0,8; (2) Categoria B: locos SNPs com probabilidade a posteriori

menor que 0,8.

Como resultado da estimação de ploidia, dentre os 147 SNPs genotipados, 70

SNPs (47,62%) foram classificados pelo programa como tetraploides (4n); 34

marcadores foram categorizados como hexaplóides (6n - 23,13%) e 43 SNPs

(29,25%) foram classificados como como octaplóides (8n).

Já com relação à classificação destes locos, 109 SNPs (74,15%) foram

classificados na categoria A e 38 SNPs (25,85%) na categoria B. Tal número está de

acordo com o encontrado por Costa (2015), no qual 68,5% das marcas pertenciam a

categoria A, bem como o descrito pelo próprio Garcia et al. (2013), onde 77,6% dos

dados era categoria A, ambos trabalhos realizados com cana-de-açúcar.

Quanto a categorização dentro de cada grupo de ploidia, 91,4% dos SNPs

classificados como 4n pertencem a categoria A e 8,6% à categoria B. A

porcentagem de marcas da categoria A cai para 73,5% no grupo dos 6n e para

46,5% no grupo 8n (Figura 7). Essa queda, confirmada por regressão linear, nas

taxas de dados categorizados como A reflete a alta probabilidade dos dados

categorizados como 4n estarem corretos. Consequentemente, as menores taxas de

dados categorizados como A nos grupos 6n e 8n (52,38% dos dados) refletem, entre

outras possibilidades propostas por Costa (2015), a baixa qualidade das

informações, a existência de SNPs trialelicos e/ou a existência de duplicações no

genoma para o loco estudado (Figura 8). Em todas estas situações, o programa

SuperMASSA não está habilitado a compreender e reparar os desvios, gerando,

portanto, estimativas de ploidia aberrantes.

Page 65: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

65

Figura 7. Porcentagem de SNPs com ploidia estimada pelo programa SuperMASSA como

4n, 6n e 8n e a categorização das marcas.

Figura 8. Regressão linear com base nos dados da porcentagem de SNPs das Categorias A

e B distribuídos entre cada grupo de ploidia estimada.

Dada a maior confiabilidade das marcas categorizadas como tetraploides e

hexaplóides, apenas SNPs destas categorias foram utilizados para a construção dos

mapas, totalizando 104 SNPs habilitados à serem utilizadas nos programas de

construção de mapas de ligação.

Outro dado importante é a correlação entre a categorização das marcas e a

taxa de ligação dos SNPs aos mapas construídos. Se considerarmos apenas os 44

SNPs que foram efetivamente capazes de se ligarem a um dos mapas gerados

(TetraploidMap e/ou OneMap), 39 marcas são categoria A (88,64%) e 5 marcas são

Page 66: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

66

classificadas como categoria B (11,36%). Em termos relativos, houve discreta

tendência de maior aderência das marcas categoria A, de modo que das 89 marcas

disponíveis, 43,82% foram capazes de se ligarem a um ou mais mapas, enquanto

que das 15 marcas categoria B disponíveis, 33,33% foram agregadas aos mapas

gerados (Figura 9). Esta ligação diferencial é mais um indicativo que aponta para a

caracterização mais precisa das marcas da categoria A. Em ensaios futuros, tal

caracterização pode ajudar a excluir as marcas menos assertivas, eliminado estes

dados antes que entrem nos programas de mapeamento.

Figura 9. Porcentagem de SNPs categorizados como A e B que efetivamente se ligaram a

algum dos mapas de ligação gerados.

4.1.3 Análise dos locos SNPs com ploidia elevada

Uma vez que 52,38% dos dados tiveram seu nível de ploidia estimado pelo

SuperMASSA como ploidias superiores à esperada de 4n (tetraploide), foi realizada

uma busca visando compreender se tais dados poderiam refletir duplicações gênicas

nos transcritos sobre os quais os locos SNPs foram desenvolvidos.

Esta teoria baseia-se no fato dos SNPs genotipados terem sido prospectados

em genes putativos de vias de grande importância metabólica para as plantas,

tornando provável sua duplicação no genoma, visto que eventos de duplicação

gênica podem evitar a perda da funcionalidade e/ou expressão em caso de mutação,

como evidenciado por Wang et al. (2009) para genes da via do metabolismo C4.

Para realizar esta análise, foi efetuada uma comparação das sequências dos

transcritos contendo SNPs, utilizando o BLASTN na base de dados Phytozome

Page 67: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

67

v.11.0. A sequência dos transcritos foi comparada com o genoma de sorgo

(Sorghum bicolor), arroz (Oryza sativa) e “Switchgrass” (Panicum virgatum), de

modo que P. virtagum foi escolhido por pertencer ao gênero Panicum e o sorgo e o

arroz por pertencerem à mesma família, Poacea, que P. maximum, além de serem

espécies utilizadas frequentemente em busca de similaridades (Dufour et al., 1997;

Costa, 2015). As análises no Phytozome foram realizadas utilizando como

parâmetros um threshold máximo de e-value de 10-6 e, no mínimo, similaridade com

50% do transcrito avaliado.

Tabela 9. Análise de evidências de duplicação gênica nos contigs detentores de SNPs

classificados como 8n, Categoria A pela análise no SuperMASSA.

SNP ID Contig N° cópias

N° cópias N° cópias em em arroz em sorgo P. virgatum

SNP3 comp390273_c0_seq1 4 4 3

SNP7 comp395427_c0_seq1 4 6 7

SNP17 comp400553_c0_seq1 1 2 1

SNP128 comp401467_c0_seq1 - - 1

SNP18 comp401774_c0_seq1 1 3 2

SNP30 comp403411_c0_seq1 2 2 2

SNP136 comp403803_c0_seq1 2 3 4

SNP36 comp404064_c0_seq1 2 4 5

SNP161 comp405771_c1_seq1 - 4 4

SNP162 comp405771_c1_seq1 - 4 4

SNP163 comp405771_c1_seq1 - 4 4

SNP58 comp406822_c0_seq1 2 1 1

SNP62 comp409117_c0_seq1 2 1 1

SNP63 comp409117_c0_seq1 2 1 1

SNP65 comp409416_c0_seq1 1 1 2

SNP145 comp410947_c0_seq1 5 4 3

SNP148 comp410983_c0_seq1 1 1 3

SNP74 comp411001_c0_seq1 4 5 4

SNP75 comp411001_c0_seq1 4 5 4

SNP147 comp411536_c1_seq1 2 2 3

Foram considerados os dados categorizados como elevada ploidia (8n),

pertencentes à categoria A, o que representa 20 SNPs, distribuídos em 16 contigs

(Tabela 9). Para 15 contigs (95%) foram encontradas evidências de duplicação

Page 68: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

68

gênica em, pelo menos, uma das espécies comparadas (o contig remanescente

apresentava ausência de anotação para duas espécies, tornando sua informação

incompleta). A taxa de evidências de duplicação no estudo similar conduzido por

Costa (2015) com cana-de-açúcar foi de 86,84%, o que corrobora os dados obtidos.

Contudo, aplicando o mesmo ensaio aos 64 marcadores SNP com ploidia 4n

e classificados como categoria A, 78,26% apresentaram evidências de duplicação

(Anexo, Tabela III). Ainda, quando a análise é realizada baseando-se apenas na

comparação com Panicum virgatum, a taxa de evidencia de duplicação é de 61,4%

para o grupo de dados 4n e 75% para os dados 8n (ambos apenas considerando

dados categoria A).

Assim, embora os dados de ploidia 8n tenham apresentado maior evidência

de duplicação quando comparado aos dados da categoria 4n, a diferença foi discreta

e a taxa de duplicação para este último grupo foi inesperadamente alta. Desta forma,

não é possível concluir diretamente que as taxas de ploidia elevadas inferidas pelo

SuperMASSA são consequência de duplicações genômicas no presente estudo,

embora esta hipótese não deva ser completamente descartada, uma vez que não há

genoma disponível para a espécie.

4.2 Informações adicionais aos mapas obtidos

4.2.1 Informações relacionadas aos mapas obtidos pelo TetraploidMap

Como descrito no Capítulo I, mapas de ligação foram construídos utilizando o

programa TetraploidMap (Hackett et al., 2007), que permite a construção de mapas

a partir de marcadores dominantes e codominantes (multi-alélicos), em populações

de irmãos-completos provenientes do cruzamento entre espécies autotetraploides,

utilizando marcadores moleculares SSR e AFLP.

Quatro etapas foram empregadas para a construção do mapa genético

utilizando esta metodologia: (I) Inferência dos genótipos e segregações: emprego da

função findgeno, pela qual cada marcador foi analisado em relação à segregação

observada na progênie. Para as marcas SSR anteriormente mapeadas por Toledo-

Silva (2013), nos casos onde não foi possível estimar um genótipo mais provável

para o marcador codominante, os marcadores foram lidos como dominantes. Já as

marcas SNP foram convertidas em marcas AFLP (dominantes), uma vez que o

programa não consegue interpretar dados SNP. A segregação foi avaliada através

de teste de qui-quadrado. Foram selecionados apenas os marcadores dominantes

Page 69: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

69

de segregação 1:1, 3:1 e 5:1 para SSR e 1:1 e 3:1 para os SNPs, adotando a

significância estatística de 0,001 para os marcadores 1:1 e 3:1, e 0,01 para os 5:1.

(II) Estimação da frequência de recombinação: pelo emprego da função initial run e

twopoint, em conjunto com o algoritmo ripple, as frequências de recombinação e

respectivos valores de LOD score (razão de verossimilhança em logaritmo de base

10) foram calculados. Apenas os resultados com valores de LOD >1.0 foram

considerados. (III) Clusterização: os marcadores selecionados foram submetidos à

função cluster, onde foi realizado um teste de qui-quadrado para segregação

independente dos cromossomos. (IV) Ordenação: o algoritmo simulated annealing

foi utilizado para identificar a ordem final de cada grupo de ligação, pressupondo o

menor valor dos mínimos quadrados para calcular a distância entre os marcadores

do mapa e utilizando os parâmetros padrões do sistema (Bradshaw et al., 2008;

Hackett & Luo, 2003; Hackett et al., 2007). Para identificar possíveis erros nesta

etapa de clusterização, foi realizada uma análise combinando análise de dois-pontos

(função twopoint) com função initial-run, seguidos de análise pelo algoritmo ripple.

Considerando ambos os mapas gerados, um para cada genitor, um total de

31 SNPs puderam ser integrados a pelo menos um dos mapas. Estes polimorfismos

estavam distribuídos em 26 contigs e 20 genes putativos de interesse. Desta forma,

foram utilizados, em média 1,19 SNPs por contig e 1,55 SNPs por gene (Tabela 10).

Tabela 10. Detalhamento dos SNPs que se ligaram aos mapas gerados pelo TetraploidMap.

Via metabólica

Os mapas gerados compartilharam 51 marcadores moleculares em comum,

sendo 10 SNPs e 41 SSRs. Tais marcas redundantes oferecem pouca informação

Número de

genes

Número de

contigs

Número de

SNPs

Fixação de carbono 6 7 8

Formação de ligocelulose 5 6 9

Metabolismo do nitrogênio 3 6 7

Resistência 6 7 7

TOTAL 20 26 31

Page 70: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

70

prática para o melhoramento, sendo consideradas marcas pouco informativas. Mas,

em contrapartida, permitem a comparação entre os mapas gerados para os

genitores, estabelecendo “pontes de ligação” úteis para a elaboração de mapas

integrados futuros (Figuras 10, 11 e 12).

Desta forma, se levarmos em conta estas “pontes” para a inferência de

formação dos grupos de ligação, teremos: (I) Para o mapa do genitor S10, os grupos

de ligação 1 e 7 e os GLs 2, 3, 4 e 10 pertenceriam, na verdade, ao mesmo GL.

Assim, o mapa deste genitor passaria a ter não mais 10 GLs, mas 6 grupos de

ligação; (II) Para o genitor Mombaça, os grupos 1, 7,9 ; 6 e 8 ; 2, 3, 4, 10, 13

poderiam ser agrupados nos mesmos grupos de ligação. Tal como para o mapa do

genitor S10, o mapa Mombaça passaria a contar com 6 GLs (não mais os 13 GLs

originais).

Figura 10. Ligação entre os mapas dos genitores S10 e Mombaça através de marcadores

em comum.

Page 71: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

71

Figura 11. Ligação entre os mapas dos genitores S10 e Mombaça através de marcadores

em comum.

Page 72: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

72

Figura 12. Ligação entre os mapas dos genitores S10 e Mombaça através de

marcadores em comum.

Page 73: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

73

Como análise complementar, também foi analisado o padrão de ligação dos

SNPs desenhados a partir do mesmo contig. Em teoria, espera-se que marcas

desenhadas a partir do mesmo contig se liguem ao mesmo grupo de ligação nos

mapas moleculares, atuando, portanto, como parâmetros de qualidade para o

mapeamento.

Quatro contigs (comp401757_c0_seq1, comp404729_c0_seq1,

comp405932_c0_seq1 e comp408070_c2_seq1) apresentaram dois SNPs

integrados a pelo menos um dos mapas de ligação confeccionados. Um destes

contigs, o comp404729_c0_seq1, apresentou dois SNPs (M82 e M58) ligados aos

dois mapas produzidos – S10 e Mombaça, de modo que os SNPs se ligaram ao

mesmo GL no mapa do Mombaça (GL4), mas se ligaram a grupos diferentes (GL4 e

GL10) no mapa do genitor S10. Os grupos de ligação 4 e 10 podem ser

considerados ligados pela inferência acima mencionada (utilizando as pontes

criadas pelas marcas presentes em ambos os mapas), logo o fato destes SNPs

terem sido mapeados como pertencentes ao GL 4 e GL 10 é mais um indicativo de

que estes GLs possivelmente são pertencentes a um mesmo grupo de ligação.

O contig comp401757_c0_seq1 também apresentou dois SNPs, M16 e M84,

ligados a grupos diferentes para o genitor S10 (GLs 8 e GL6). O fato destes

marcadores não estarem próximos pode ser entendido como um indicativo do

posicionamento incorreto de uma destas marcas (resultado da baixa saturação do

mapa), montagem incorreta do contig ou mesmo de duplicação no genoma. Para os

dois contigs remanescente, os SNPs se agregaram ao mesmo grupo de ligação,

como era esperado (Anexo, Tabela III).

4.2.2 Informações relacionadas ao mapa obtido pelo OneMap

Um total de 25 SNPs foram integrados ao mapa molecular gerado pelo

programa OneMap. Estes polimorfismos estão distribuídos em 20 contigs e 19 genes

putativos correlacionados às vias metabólicas previamente selecionadas. Assim,

foram utilizados, em média 1,25 SNPs por contig e 1,32 SNPs por gene (Tabela 11).

Page 74: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

74

Tabela 11. Detalhamento dos SNPs que se ligaram ao mapa gerado pelo OneMap.

Via metabólica

Tal como para os SNPs que se ligaram aos mapas gerados no TetraploidMap,

foi realizada a análise dos padrões de ligação dos SNPs oriundos do mesmo contig

para os polimorfismos integrados ao mapa do OneMap. Cinco contigs apresentaram

mais de um marcador agregado ao mapa (comp404739_c1_seq1,

comp405932_c0_seq1, comp408070_c2_seq1, comp409416_c0_seq1 e

comp404985_c0_seq1) e apenas o contig comp404985_c0_seq1 apresentou

polimorfismos que se integraram em grupos de ligação diferentes, sendo que o M36

se integrou ao GL 8 e o M74 foi ligado ao GL 23. Diferentemente, porém, das

situações similares relatadas para os mapas do TetraploidMap, esta ligação

diferencial é mais facilmente explicada para o OneMap, já que cada grupo de ligação

representa um homólogo. Assim, os GLs 8 e 23 podem estar no mesmo grupo de

homologia.

Outro dado interessante, que demonstra a diferença entre as metodologias

empregadas pelos softwares TetraploidMap e OneMap é referente às diferenças

entre as marcas que foram agregadas aos mapas gerados. Dentre os 25 SNPs que

se ligaram ao mapa do OneMap, 13 não se ligaram aos mapas do TetraploidMap.

Por sua vez, 19 dentre os 31 SNPs que se ligaram aos mapas do TetraploidMap não

se ligaram ao mapa do OneMap. Assim, 52% dos SNPs que se integraram ao

TetraploidMap são exclusivos dos mapas gerados por esta metodologia e o mesmo

raciocínio se aplica aos 61,29% dos SNPs integrados ao mapa gerado pelo

OneMap.

Número de

genes

Número de

contigs

Número de

SNPs

Fixação de carbono 5 6 8

Formação de ligocelulose 5 5 7

Metabolismo do nitrogênio 4 4 4

Resistência 5 5 6

TOTAL 19 20 25

Page 75: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

75

5. RESUMO DOS RESULTADOS

Através do mapeamento do transcriptoma dos parentais S10 e

Mombaça, foi possível a identificação de 86.312 SNPs, distribuídos em 16.356

contigs;

Foram identificados 72 genes putativos correlacionados às vias

metabólicas de interesse (metabolismo no nitrogênio, fixação de carbono,

resistência e via de formação da lignocelulose). Estes genes estão distribuídos

em 478 contigs distintos, o que gera uma média de 6,64 contigs para cada gene;

Foram selecionados e genotipados via espectrometria de massas 147

SNPs. Todos apresentaram amplificação e puderam ser validados. Destes 104

puderam ser utilizados na construção dos mapas genéticos;

Utilizando o programa TetraploidMap, foram obtidos dois mapas

moleculares parciais para Panicum maximum, um mapa baseado em cada um

dos genitores da população estudada. O mapa do genitor S10 contou com 113

marcadores posicionados, sendo 19 marcadores SNPs e 94 marcadores tipo

SSR. O mapa cobriu uma distância de 808,4 cM, distribuídos em 10 grupos de

ligação. Por sua vez, o mapa do genitor Mombaça foi construído a partir da

ligação de 119 marcadores, sendo eles 22 SNPs e 97 SSRs, cobrindo uma

distância total de 897,1 cM e contando com 13 grupos de ligação;

Um terceiro mapa ligação foi gerado com o programa OneMap. Este

mapa é constituído por 122 marcadores moleculares (25 SNPs e 97 SSRs),

distribuídos em 32 grupos de ligação. O mapa cobriu uma distância de 1.248 cM.

Page 76: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

76

6. CONCLUSÕES

O presente estudo promoveu a expansão do conhecimento genético

molecular da espécie Panicum maximum, através da identificação e genotipagem de

marcadores moleculares SNP e a construção do primeiro mapa genético para a

espécie a utilizar marcadores do tipo SNP e SSR.

Conclui-se, portanto, que os objetivos propostos foram alcançados e que os

dados obtidos neste trabalho contribuirão, de forma direta e indireta, para a

aceleração e aumento da assertividade dos programas de melhoramento genético

para a espécie.

Page 77: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

77

7. PERSPECTIVAS

O programa de melhoramento vegetal do P. maximum conduzido pela

Embrapa Gado de Corte (Campo Grande, MS) vem sendo o responsável por

avanços significativos para a espécie, especialmente no que tange o lançamento de

novos cultivares. Entretanto, para que os estudos lá conduzidos sejam mais

eficientes e rápidos, fazem-se necessários estudos que expandam o restrito

universo de compreensão da genética da espécie.

Avanços significativos nesta direção foram dados pelos resultados de Toledo-

Silva et al. (2013) e pelo presente estudo. Entretanto, o mapa molecular construído

ao longo deste trabalho ainda não está saturado, podendo, portanto, ser

aperfeiçoado. Neste sentido, como próximo passo, mais SNPs serão genotipados

pelo uso da técnica de genotipagem-por-sequenciamento (genotyping-by-

sequencing - GBS) e tais marcadores serão integrados ao mapa obtido pelo

software OneMap.

Após o aumento do nível de saturação do mapa, as análises para

identificação de QTLs para características produtivas poderão ser realizadas a partir

de dados fenotípicos coletados pela Dra. Liana Jank, da Embrapa Gado de Corte

(Campo Grande – MS), para a população utilizada no estudo.

Page 78: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

78

8. REFERÊNCIAS BIBLIOGRÁFICAS

Associação brasileira das indústrias exportadoras de carnes. Perfil da

pecuária no Brasil (2016). Disponível em:

http://abiec.siteoficial.ws/images/upload/sumario-pt-010217.pdf (acessado

30/01/2017).

Aacensão, A. R. F. D. C.; Dubery, I. A. Soluble and wall-bound phenolics and

phenolic polymers in Musa acuminata roots exposed to elicitors from Fusarium

oxysporum f.sp. cubense. Phytochemistry, v.63, p. 679–686. 2003.

Akhunov, E.; Nicolet, C.; Dvorak, J. Single nucleotide polymorphism

genotyping in polyploidy wheat with the Illumina GoldenGate assay. Theor Appl

Genet. v. 119, p. 507–1, 2009.

Aliscioni, S.S. et al. A molecular phylogeny of Panicum (Poaceae:Paniceae).

Test of monophyly and phylogenetic placement with the Panicoideae. American

Journal of Botany, v. 90(5), p. 796-821, 2003.

Al-Janabi, S. M. et al. Identification of a major quantitative trait locus (QTL) for

yellow spot (Mycovellosiella koepkei) disease resistance in sugarcane. Molecular

Breeding, Netherlands, v. 19, n. 1, p. 1-14, jan. 2007.

Andrade, R. P. de. “Pasture seed Production Technology in Brasil”.

Proceeding Piracicaba, Fealq, p. 129-32, 2001.

Aronovich, S. O capim colonião e outros cultivares de Panicum maximum

(Jacq.): introdução e evolução do uso no Brasil. In: Simpósio sobre manejo da

pastagem, 12., 1995, Piracicaba. Anais... Piracicaba: Fundação de Estudos Agrários

Luiz de Queiroz, 1995. p.1-20.

Asker, S.E.; Jerling, L. Apomixis in plants. Boca Raton: CRC Press, p. 532,

1992.

ASSOCIAÇÃO BRASILEIRA DE SEMENTES - ABRASEM. Disponível em:

http://www.abrasem.br (acessado 21/08/2016)

Bhering, L. L. et al. Efficiency of the multilocus analysis for the construction of

genetic maps. Crop Breeding and Applied Biotechnology, v. 9, p. 308-312, 2009.

Bhering, L.L.; Cruz, C.D. Tamanho de população ideal para mapeamento

genético em famílias de irmãos completos. Pesquisa agropecuária brasileira, v. 43,

p. 379-385, 2008.

Page 79: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

79

Blondal, T. et al. A novel MALDI-TOF based methodology for

genotyping single nucleotide polymorphism. Nucleic Acids Research, v.3, n.24,

p. 155, 2003.

Bogdan, A. V. Tropical pasture and fodder plants. [S.l.]: Longman, 1977.

Borém, A. Melhoramento de espécies cultivadas. Viçosa: UFV, p. 205-252,

1999.

Borém, A.; Caixeta, E. T. Marcadores moleculares. Viçosa – M.G., 374p.,

2006. Guglieri, A.; Zuloaga, F. O.; Longhi-Wagner, H. M. Sinopse das espécies de

Panicum L. subg. Panicum (Poaceae, Paniceae) ocorrentes no Brasil. Acta bot.

bras., 18(2), p. 359-367, 2004.

Botrel, M.A; Novaes, L.P.; Alvim, M.J. Características forrageiras de algumas

gramíneas tropicais. EMBRAPA-CNPGL, Juiz de Fora, Doc. 66, p.35, 1998.

Botstein, D.; Risch, N. Discovering genotypes underlying human phenotypes:

past successes for mendelian disease, future approaches for complex disease.

Nature Genetics, v. 33, p. 228 – 237, 2003.

Bradshaw, J. E. et al. QTL mapping of yield, agronomic and quality traits in

tetraploid potato (Solanum tuberosum subsp. tuberosum). Theor.Appl. Genet., v.

116, p.193–221, 2008.

Brâncio, P. A. et al. Avaliação de três cultivares de Panicum maximum Jacq.

sob pastejo: comportamento ingestivo de bovinos. Revista Brasileira de Zootecnia,

Viçosa, v. 32, n. 5, p.1045-1053, set./out. 2003.

Brâncio, P.A. et al. Avaliação de três cultivares de Panicum maximum

Jacq. sob pastejo. Composição química e digestibilidade da forragem. Revista

Brasileira de Zootecnia, v.31, n.4, p.1605-1613, 2002.

Brookes, A. J. The essence of SNPs. Gene, v. 243, n. 2, p. 177-186, 1999.

Brouwer, D.; Osborn, T. A molecular marker linkage map of tetraploid alfalfa

(Medicago sativa L.). Theor. Appl. Genet. V. 99, p. 1194–1200. doi:

10.1007/s001220051324, 1999.

Bshaw, E.C. Apomixis and its application in crop improvement. In: FEHR, W.

R.; HADLEY, H. H. (Ed.). Hybridization of crop plants. American Society of Agronomy

and Crop Science Society of America, p.45-63, 1980.

Bueno, L.C.S.; Mendes, A.N.G.; Carvalho, S.P. Melhoramento genético de

plantas. Lavras. Ed. UFLA, p.283, 2002.

Page 80: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

80

Carlier, J.D. et al. Genetic maps of RAPD, AFLP and ISSR markers in Ananas

bracteatus and A. comosus using the pseudotestcross strategy. Plant Breeding, v.

123, p. 186–192, 2004.

Carneiro, M.S.; Vieira, M.L.C. Mapas genéticos em plantas. Bragantia,

Campinas, v.61,n.2, p.89-100, 2002.

Chamary, J.V.; Parmley, J.L.; Hurst, L.D. Hearing silence: non-neutral

evolutionat synonymous sites in mammals. Nat. Rev. Genet., v. 7, p. 98–108, 2006.

Chase, A. Grasses of Brazil and Venezuela. Agricultural American, v.4, p.123-

126, 1944.

Coelho, A.S.G. Considerações gerais sobre a análise de QTL. In: PINHEIRO,

J.B.;CARNEIRO, I.F. (Ed.). Análise de QTL no melhoramento de plantas. FUNAPE,

Goiania, p.1-20, 2000.

Coelho, A.S.G.; Silva, H.D. Construção de mapas genéticos e mapeamento

de QTL´s. Piracicaba, p.65, 2002 (apostila).

Coelho, A.S.G.; Silva, H.D. Métodos biométricos aplicados a análise de QTLs.

Anais do SEAGRO, Universidade Estadual de Londrina, Londrina - PR, 2005.

Collard B.C.Y. et al. An introduction to markers, quantitative trait loci (QTL)

mapping and marker-assisted selection for crop improvement: The basic concepts.

Euphytica, v. 142, p. 169-196, 2005.

Combes, D.; Pérnes, J. Variation ans les nombres chromosomiques du

Panium maximum en relation avec le mode de reproduction. Comptes Rendues

Academie Science, Paris, Sér. D., v.270, p.782-785, 1970

Costa, E.A. Construção de um mapa funcional em cana-de-açúcar e

mapeamento de QTLs de importância econômica. Dissertação de doutorado,

UNICAMP, 2015.

Coulondre, C. et al. Molecular basis of base substitution hot spots in

Escherichia coli. Nature, vol. 274, p.775–780. 1978.

Da Silva, J.A.G.; Sorrells, M.E. Linkage analysis in polyploids using molecular

markers. Boca Raton: CRC Press, cap. 13, p. 211–228, 1996.

Da Silva, S.C. Condições edafo-climáticas para aprodução de Panicum

maximum SP. In: Simpósio de manejo da pastagem, 12., 1995, Piracicaba.

Anais...Piracicaba: FEALQ, 1995. p.129-146.

Dall’Agnol, M.; Schifino-Wittmann, M.T. Apomixia, genética e melhoramento

de plantas. Rev. Bras. Agrosci., v.11, p.127-133, 2005.

Page 81: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

81

Daugrois, J. et al. A putative major gene for rust resistance linked with a RFLP

marker in sugarcane var ‘R570’. Theoretical and Applied Genetics, Berlin, v. 92, n. 8,

p. 1059-1064, jun. 1996.

Dias-Filho M. B. Degradação das pastagens: processos, causas e estratégias

de recuperação. Embrapa Amazônia Oriental, Belém, p.190, 2007.

Dias-Filho, M.B. Colonião como planta pioneira. In: Simpósio de manejo de

pastagens – O capim colonião, 12., 1995, Piracicaba. Anais... Piracicaba:FEALQ,

1995. p.305-314.

Dufour, P. et al. Construction of a composite sorghum genome map and

comparison with sugarcane, a related complex polyploidy. Theoretical Applied

Genetic, Berlin, v. 94, n. 3-4, p. 409-418, 1997.

Ebina M. et al. Co-segregation of AFLP and RAPD markers to apospory in

Guineagrass (Panicum maximum Jacq.). Grassland Science, v. 51, p. 71-78, 2005.

Euclides, V. P. B. et al. A. Brazilian scientific progress in pastureresearch

during the first decade of XXI centure. Revista Brasileira de Zootecnia, v.39, p. 151-

168, 2010.

Falconer, D.S.; Mackay, T.F.C. Introduction to quantitative genetics. 4. ed.

New York: Longman Scientific & Technical, p. 464, 1996.

Fan, J.B. et al. Highly parallel SNP genotyping. Cold Spring Harbor

Symopsium Quantitaive Biology, v. 68, p. 69–78, 2003.

Ferreira, A. et al. Estimating the effects of population size and type on the

accuracy of genetic maps. Genetics Molecular Biology, v. 29, p.182-192, 2006.

Ferreira, M. E.; Grattapaglia, D. Introducción al Uso de Marcadores

moleculares en el Análisis Genético. EMBRAPA-CENARGEN, p.220, 1998.

Fonseca, D. M.; Ssantos, M. E. R.; Martuscello, J. A. Importância das

forrageiras no sistema de produção. In: FONSECA, D. M.; MARTUSCELLO, J. A.

(Ed.). Plantas forrageiras. ed. Viçosa: UFV, 2010. p. 13-29.

Gabriel S.; Ziaugra L.; Tabbaa D. SNP genotyping using the Sequenom

MassARRAY iPLEX platform. Current Protocols in Human Genetics, v. 60, p. 11–12,

2009.

Garcia, A. A. F. et al. Development of an integrated genetic map of a

sugarcane (Saccharum spp.) commercial cross, based on a maximum-likelihood

approach for estimation of linkage and linkage phases. Theoretical and Applied

Genetics, Berlin, v. 112, n. 2, p. 298-314, nov. 2006.

Page 82: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

82

Garcia, A.A.F. et al. SNP genotyping allows an in-depth characterisation of the

genome of sugarcane and other complex autopolyploids. Sci Rep. 3, Article number:

3399, 2013.

Grattapaglia, D.; Sederoff, R. Genetic linkage maps of Eucalyptus grandis and

Eucalyptus urophylla using a pseudotestcross: Mapping strategy and RAPD markers.

Genetics, v. 137, p. 1121–1137, 1994.

Guglieri, A.; Zuloaga, F. O.; Longhi-Wagner, H. M. Synopsis of Panicum

subg. Panicum (Poaceae, Paniceae) in Brazil. Acta Botanica Brasilica, 18(2), p. 359-

367, 2004.

Gupta, P. K.; Roy, J. K.; Prasad, M. Single nucleotide polymorphisms: A

new paradigm for molecular marker technology and DNA polymorphism detection

with emphasis on their use in plants. Current Science, v. 80, n. 4, p. 4524-535, 2001

Gupta, P.; Lee, K.H. Silent mutations result in HlyA hypersecretion by reducing

intracellular HlyA protein aggregates. Biotechnol. Bioeng., v. 101, p. 967–974, 2008.

Gupta, P.K. et al. Molecularmarkers and their application in wheat breeding: a

review. PlantBreed, v. 118, p. 369-390, 1999.

Hackett, C. A. et al. Tetraploid Map for Windows: linkage map construction

and QTL mapping in autotetraploid species. The Journal of heredity, v. 98, n. 7, p.

727–729, 2007.

Hackett, C. A.;McLean K.; Bryan G. J. Linkage analysis and QTL mapping

using SNP dosage data in a tetraploid potato mapping population. PLoS One 8:

e63939, 2013.

Hackett, C. A.; Luo Z. W. TetraploidMap: construction of a linkage map in

autotetraploid species. J Hered, v. 94, p. 358-359, 2003.

Hanna, W.W. et al. Cytologyof obligate sexual plantsin Panicum maximum

Jacq. and their useincontrolled hybrids.CropSci, v. 13, p. 695–697, 1973.

Henry, R. J. Plant genotyping II. SNP technology. [S.l.]: CABI, v. 2, 2008.

Herling, V. R.; Braga, G. J.; Luz, P. H. de C.; Otani, L. Tobiatã, Tanzânia e

Mombaça. In:simpósio sobre manejo da pastagem, 17., 2000, Piracicaba. A planta

forrageira no sistema de produção.Anais... Piracicaba: FEALQ, 2000. p. 21-64.

Hitchcock, A. S. Manual of the grasses of the United States. 2. ed. rev. New

York: Dover, 1971

Page 83: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

83

Hojito, S.; Horibata, T. Plant Exploration, Collection and Introduction from

Africa”, in Nekken Shiryo 58. TropicalAgriculture Research Center, Japan, p. 1-120,

1982.

IBGE.Produção da pecuária municipal (PPM) 2015. Disponível em:

http://www.ibge.gov.br (acessado 15/10/2016)

Jank L. et al. Catalog of the characterization and evaluation of the Panicum

maximum germplasm: morphological description and agronomical performance.

Embrapa Gado de Corte, v. 68, p. 53, 1997.

Jank, J. et al. Parâmetros genéticos de caracteres agronômicos em

híbridos de Panicum maximum Jacq. In: International Symposium on Forage

Breeding, 3., 2011, Bonito-MS. Embrapa Gado de Corte - CNPGC, p. 250-253, 2011.

Jank, L. A História do Panicum maximum no Brasil. Revista Brasileira de

Sementes,v.1, p.14, 2003.

Jank, L. Melhoramento e seleção de variedades de Panicum maximum. In:

Simpósio sobre manejo da pastagem, 12., 1995, Piracicaba. Anais... Piracicaba:

FEALQ, 1995. p.21-58.

Jank, L.; Resende, R.M.S.; Valle, C.B. Genética em pastagem. Revista USP,

São Paulo, v.64, p.86-93, 2005.

Jank, L.; Savidan, Y.H.; Costa, J.C.G. Registro de 25 acessos selecionados

de Panicum maximum. EMBRAPA-CNPGC, Campo Grande,Doc. 44 p.68, 1990

Koning-Boucoiran et al., 2012 The mode of inheritance in tetraploid cut rose.

Theor Appl Genet. 125(3): 591–607, 2012.

Kosambi, D.D. The estimation of map distances from recombination values.

Ann Eugen, v. 12, p. 172–175, 1944.

Kruglyak, L. The use of a genetic map of biallelic markers in linkage studies.

Natural Genetic, v.17; p.21–24. 1997

Kudla, G. et al. Coding-sequence determinants of gene expression in

Escherichia coli. Science, v. 324, p.255–258, 2009.

Kwok, P.Y. et al. Increasing the information content of STS-based

genome maps: identifying polymorphisms in mapped STSs. Genomics, v.31, p.123–

126, 1996.

Laborda, P. Marcadores moleculares microssatélites na investigação do

genoma de Drosophila mediopunctata: desenvolvimento e construção de mapa

genético de ligação. Tese de doutorado, Universidade Estadual de Campinas, 2011.

Page 84: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

84

Lander, E. S. et al. MAPMAKER: an interactive computer package for

constructing primary genetic linkage maps of experimental and natural populations.

Genomics, v. 1, p. 174-181, 1987

Langaee, T.; Ronaghi, M. Genetic variation analyses by Pyrosequencing.

Mutation Research/Fundamental and Molecular Mechanisms of Mutagenesis,

v.573, p. 96-102, 2005.

Lazia, B. Produção de forrageiras, 2012. In: Portal agropecuário. Disponível

em: http://www.portalagropecuario.com.br/bovinos/pastagens-e-

alimentacao/producao-de-forrageiras (acessado 26/12/2016)

Leach, L. J. et al. Multilocus tetrasomic linkage analysis using hidden markov

chain model. Proceedings of the National Academy of Sciences of the United States

of America, v. 107, p. 4270–4274, 2010.

Liu, B.H. Statistical genomics: linkage, mapping, and QTL analysis. Boca

Raton: CRC Press,p.611 1998.

Lorieux, M.; Ndjiondjop, M-N; Ghesquiere, A. A first interspecific Oryza sativa

x Oryza glaberrima microsatellite-based genetic map. Theor. Appl. Genet. V. 100, p.

591-601, 2000.

Lynch, M.; Walsh, B. Genetics and analysis of quantitative traits. Sunderland:

Sinauer, p. 980, 1998.

Maheswaran, C. The evolution of molecular markers – just a matter of

fashion? Nature reviews genetics, v. 5, p. 63-69, 2004.

Maliepaard, C.; Jansen, J.; van Ooijen, J. W. Linkage analysis in a full-sib

family of an outbreeding plant species: Overview and consequences for applications,

Genet. Res., p. 70, 1997.

Margarido, G.R.A.; Grcia, A.A.F.; Souza, A.P. OneMap: software for genetic

mapping in outcrossing species. Hereditas, Lund, v. 144, p. 78-79, 2007.

Market, C.L.; Moller, F. Multiple forms of enzymes tissue, ontogenic and

species specific patterns. Proceeding of the National Academy of Sciences, v.

45, p. 753-762. 1959

Martuscello, J.A. et al. Repetibilidade e seleção em Panicum maximum Jacq.

Tese de doutorado, Universidade Federal de Viçosa, Viçosa, p. 100, 2008

Mayer MP, Bukau B. Hsp70 chaperones: cellular functions and molecular

mechanism. Cell Mol Life Sci 62: 670–684, 2005

Page 85: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

85

McCallum, S. et al. Construction of a SNP and SSR linkage map in

autotetraploid blueberry using genotyping by sequencing. Molecular Breeding , v. 36,

p. 1-24, 2016.

Meyer, R. C. Linkage analysis in tetraploid potato and association of markers

with quantitative resistance to late blight (Phytophthora infestans). Molecular &

general genetics, v. 259, n. 2, p. 150–60, 1998.

Ming, R. et al. Qtl analysis in a complex autopolyploid: genetic control of sugar

content in sugarcane. Genome Research, New York, v. 11, n. 12, p. 2075-2084, dez.

2001.

Molinari, O. G. Grasslands and grasses of Puerto Rico. Rio Piedras:

University of Puerto Rico, p. 167, 1952.

Mollinari, M. Desenvolvimento de um modelo para construção de mapas

genéticos em autopoliploides, com aplicações em cana-de-açucar. Tese de

doutorado, Universidade do Estado de São Paulo, 2012.

MollinariI, M. Comparação de algoritmos usados na construção de mapas

genéticos. Dissertação de mestrado em Genética e Melhoramento de Plantas,

Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo,

Piracicaba, p. 73, 2009.

Moose S. P.; Mumm R. H. Molecular plant breeding as the foundation for 21st

century crop improvement. Plant Physiol., v. 147, p. 969–977, 2008.

Müller, M. S. Desempenho de Panicum maximum (cv. Mombaça) em

pastejo rotacionado, sob sistema de irrigação por pivô central, na região do cerrado.

Dissertação de mestrado em Fitotecnia, Escola Superior de Agricultura “Luiz de

Queiroz”, Universidade de São Paulo, Piracicaba, p. 101, 2000.

Nakajima, K. et al. Isolation of diploid and tetraploid sexual plants in guinea

grass (Panicum maximum Jacq.). Japanese Journal of Breeding, v. 29, 1979.

Nielsen, R. et al. Genotype and SNP calling from next generation sequencing

data. Nat. Ver. Genet., v. 12, p.443–451, 2011.

Nogler, G.A. Gametophytic apomixis. In: Embryology of Angiosperms (ed.

Johri, BM). Springer-Verlag, Berlin,p. 475–518, 1984.

Oeth, P. et al. Qualitative and quantitative genotyping using single base primer

extension coupled with matrix-assisted laser desorption/ionization time-of-flight mass

spectrometry (MassARRAY). Methods Mol. Biol., v. 578, p. 307– 343, 2009.

Page 86: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

86

Oeth, P.et al. iPLEX™ Assay: Increased Plexing Efficiency and Flexibilityand

Flexibility Terminators. Sequenom, San Diego, p. 12 2007.

Oliveira, K. M. et al. Functional integrated genetic linkage map based on EST-

markers for a sugarcane (Saccharum spp.) commercial cross. Molecular Breeding,

Netherlands, v. 20, n. 3, p. 189-208, abr. 2007.

Parsons, J. J. Spread of african pasture grasses to the American Tropics.

Journal of Range Management, Denver, v. 25, n. 1, p. 12-17,1972.

Paterson A.H. et al. Comparativegenomics of plant chromosomes. Plant Cell,

v.12, p. 1523-1539, 2000.

Paterson, A.H.; Tanksley, S.D.; Sorrels, M.E. DNA markers in plant

improvement. Advances in Agronomy, San Diego, v.46, p.39-89, 1991.

Rafalski, A. Applications of single nucleotide polymorphisms in crop genetics.

Current Opinion in Plant Biology, v. 5 (2), p. 94-100, 2002.

Rajapakse, S. et al. Two genetic linkage maps of tetraploid roses. Theor. Appl.

Genet., v. 103, p. 575–583, 2001.

Ripol, M. I. et al. Statistical aspects of genetic mapping in autopolyploids.

Gene, v. 235, p. 31–34, 1999.

Ritter, E.; Gebhardt, C.; Salamani, F. Estimation of recombination frequencies

and constructiono f RFLP linkage maps in plants from crosses between

heterozygous parents. Genetics, v.125, p.645-654, 1990.

Rocha, R.B. et al. O mapeamento genético no melhoramento de plantas.

Revista Biotecnologia Ciência e Desenvolvimento, Brasília, v. 30, p. 27-32, 2003.

Sakiyama, N.S. Marcadores moleculares e as hortaliças. Horticultura

brasileira. v.11, n.2, p.204-206. 1993

Salton, J. C.; Costa, A. R.; Silva, W. M. Uso de forrageiras perenes no período

de entressafra para melhoria da qualidade do solo na Região Centro-Oeste do

Brasil. In: Congresso Latinoamericano de la Ciencia del Suelo, 18, San Jose, Costa

Rica. Suelo... raíz de nuestro futuro. San Jose: Sociedad Latinoamericana de la

Ciencia del Suelo, 2009.

Santos, P.M. Estudos de algumas características agronômicas de Panicum

maximum (Jacq.) cvs. Tanzânia e Mombaça para estabelecer seu manejo.

Dissertação (Mestrado), Piracicaba, 1997, 62p. , ESALQ, 1997.

Page 87: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

87

Savidan Y. Genetics and utilization of apomixis for the improvement of

guinea grass (Panicum maximum Jacq.) In: Proc XIV Intl Grassl Congr, Lexington,

p. 182–184, 1981.

Savidan, Y. Apomix: genetics and breeding. Plant Breeding Review, v. 18, p.

13-86, 2000.

Savidan, Y. Chromosomal and embryological analyses in sexual x apomictic

hybrids of Panicum Maximun jacq. Theoretical and Applied Genetics, v. 57, p. 153-

156, 1980.

Savidan, Y. H. et al. Breeding Panicum maximum in Brazil. Genetic

resources, modes or reproduction and breeding procedures. Euphytica, v. 41, p. 107-

112, 1989.

Savidan, Y. H.; Jank, L.; Costa, J. C. G. Registro de 25 acessos selecionados

de Panicum maximim. Campo Grande: EMBRAPA-CNPGC, Doc. 44, p. 68, 1990.

Schlötterer, C. The evolution of molecular markers--just a matter of fashion?.

Nature reviews Genetics, v. 5, p. 63-69, 2004.

Seiffert N.F. Gramíneas forrageiras do gênero Brachiaria. EMBRAPA-

CNPGC, Campo Grande, Circular Técnica 1, p. 83, 1984.

Semagn, K.; Bjørnstad, Å.; Ndjiondjop, M.N. An overview of molecularmarker

methods for plant. Afr. J. Biotechnol, v. 25, p. 2540-2569, 2006.

Serang, O.; Mollinari, M.; Garcia A.A.F. Efficient Exact Maximum a Posteriori

Computation for Bayesian SNP Genotyping in Polyploids. PLoS ONE 7(2): e30906.

doi:10.1371/journal.pone.0030906, 2012.

Severiano, E.C. et al. Potencial de descompactação de um argissolo

promovido pelo capim-tifton 85. Revista Bras. eng. agric. amb., v. 14, p.39-45, 2010.

Shepherd, M. et al. Genetic maps for Pinus elliottii varhondurensis using AFLP

and microsatellite markers. Theoretical and Applied Genetics, v. 106, p. 1409–1419,

2003.

Skerman, P.J.; Riveros, F. Gramíneas tropicales. Rome: FAO Producción y

Protección Vegetal, v. 23, p. 849, 1992.

Slate, J. Quantitative trait locus mapping in natural populations: progress,

caveats and future directions. Molecular ecology, v. 14, n. 2, p. 363–79, 2005.

Sousa, A.C.B. Estudos genéticos moleculares em forrageiras tropicais. Tese

(Doutorado em Genética e Biologia Molecular) – Instituto de Biologia, Universidade

Estadual de Campinas, Campinas, São Paulo, p. 205, 2010.

Page 88: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

88

Sturtevant, A.H. The linear arrangement of six sex-linked factors in Drosophila,

as shown by their mode of association. J. Exper. Zool., v. 14, p. 43-59, 1913.

Sun, G. et al. SNPs in human miRNA genes affect biogenesis and function.

RNA 15, p.1640–1651, 2009.

Tanksley, S.D. Mapping polygenes. Annual Review Genetics, Palo Alto, v.27,

p.205-33, 1993.

Toledo-Silva, G. et al. De novo transcriptome assembly for the tropical grass

Panicum maximum Jacq. PloS one, v. 8, n. 7, p. e70781, 2013.

UNICA – União da Agroindústria Canavieira de São Paulo. Disponível em:

http://www.portalunica.com.br (acessado 02/11/2016).

Valentim, J. F. et al. Capim-massai (Panicum maximum Jacq): nova

forrageira para a diversificação das pastagens do Acre. Embrapa Acre, Circular

Técnica 41, 2001.

Valle, C.B. et al. Melhoramento genético de Brachiaria. In: Resende, RMS,

ValleCBdo & Jank L (Eds.) Melhoramento de Forrageiras Tropicais,1ª ed., Campo

Grande, Embrapa. p. 13-53, 2008.

Valle, C.B.; Jank, L.; Resende, R.M.S. O melhoramento de forrageiras

tropicais no Brasil. Revista Ceres, v.56, n.4, p.460-472, 2009.

Van Ooijen, J. W.; R. E. Voorrips. Joinmap 3.0, software for the calculation of

genetic linkage maps. Plant Research International, Wageningen, The Netherlands,

2001.

Verzignassi, J. R.; Fernandes, C. D. Doenças em forrageiras. Embrapa Gado

de Corte, Campo Grande, Circular Técnica 50, p.3, 2001

Vieira, A. Gramíneas forrageiras. Revista dos Criadores, São Paulo, n 777,

p.26-37. 1994.

Vignal, A. et al. A review on SNP and other types of molecular markers and

their use in animal genetics. Genetics Selection Evolution, Paris, v.34, p.275-305.

2002.

Voorips, R. E. MapChart: Software for the graphical presentation of linkage

maps and QTLs. Journal of Heredity, Washington, v. 63, p. 77-79, 2002.

Voorrips R,; Gort, G.; Vosman, B. Genotype calling in tetraploid species from

bi-allelic marker data using mixture models. BMC Bioinformatics, v. 12, p. 172, 2011.

Page 89: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

89

Wang, D.G.; et al. Large-scale identification, mapping, and genotyping of

single-nucleotide polymorphisms in the human genome, Science , v. 280, p. 1077–

1082, 1998.

Wang, J. et al. High-throughput SNP genotyping by single-tube PCR with Tm-

shift primers. Biotechniques, v. 39, p. 885-893, 2005

Wang, Z.; Gerstein, M.; Snyder, M. RNA-Seq: a revolutionary tool for

transcriptomics. Nature reviews genetics, v. 10, n. 1, p. 57-63, 2009.

Wu, C. et al. Genetic Analysis of Grain filling rate in different growth stages of

superior and inferior grains in rice. Scientia Agricultura Sinica, v. 40, n. 6, p.1135-

1141, 2007.

Wu, K.et al. The detection and estimation of linkage in polyploids using single-

dose restriction fragments. Theoretical and Applied Genetics, v. 83, p. 294-300,

1992.

Wu, R. L. et al. Simulataneous maximum likelihood estimation of linkage and

linkage phrases in outcrossing species. Theoretical Population Biology, v. 61, p. 349

- 363, 2002a.

Xu, L.M. et al. Identification and mapping of quantitative trait loci for cold

tolerance at the booting stage in a japonica rice near-isogenic line. Plant Science,

v.174, p. 340–347, 2008.

Yarnes, S.C. et al. Identification of QTLs for capsaicinoids, fruit quality, and

plant architecture-related traits in an interspecific Capsicum RIL population. Genome,

v. 56, p. 61–74, 2013.

9. ANEXOS

Page 90: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

90

Tabela I: Sequencias dos primers utilizados na genotipagem dos marcadores SNP.

SNP Contig Forward Primer Reverse Primer Extended Primer

SNP1 comp372439_c0_seq1 ACGTTGGATGTCGATATCTGCACGATCTTC ACGTTGGATGGTTGCTTTTGAGAGTGCGAG GCACGATCTTCTGTTATCA

SNP2 comp390273_c0_seq1 ACGTTGGATGAAACTGCTTGAAAGGCGTGG ACGTTGGATGTGAAAAGGTCATCACGGGTC GAAAGGCGTGGATGTTGTTG

SNP3 comp390273_c0_seq1 ACGTTGGATGCTGGAATCACAATTCTGCCG ACGTTGGATGTTGTCAGCTCCTCAGTTTCC GTGAAGGTGACAGATGG

SNP4 comp393980_c0_seq1 ACGTTGGATGAGCGCCGCGGGCGGCACGA ACGTTGGATGTCTCCACTCTGTTCACCAAG CGCGGGCGGCACGACGAGGC

SNP5 comp394414_c0_seq1 ACGTTGGATGAGTTGCAGGTGATGAAGACG ACGTTGGATGTACACGCAGGTTGTGTGGC CGCGGGCGCATCCGATGGC

SNP7 comp395427_c0_seq1 ACGTTGGATGTTGCTGGACCAGGACTACG ACGTTGGATGGCCAAGCTCCCGAAGCTCA CAGGCCTCGGGATCCGTG

SNP8 comp395427_c0_seq1 ACGTTGGATGTTATTCAGTGGGCCCCACAG ACGTTGGATGTGCTCTCCAGTGTCGAGTTC CCGGGCAGTGGGTGGGTT

SNP9 comp396609_c0_seq1 ACGTTGGATGTTCCACTTTGTCGAGGACTG ACGTTGGATGTCATCGAAGGGAACATAGGG GTCGGTCAGAACCTTCTTCTT

SNP10 comp397475_c0_seq1 ACGTTGGATGCACGCTCGCCTCCCACCTG ACGTTGGATGCAATTGGATCCCCTCAGAAG AGACCTCCTCCATCTGA

SNP11 comp398252_c0_seq1 ACGTTGGATGGTGGAACTACAACTACGGGC ACGTTGGATGGTCTTGAACGCGATCACGG GCCCGTCGAAGCCGATGCTCTG

SNP12 comp398252_c0_seq1 ACGTTGGATGATACTACCAGCAGTACTGCC ACGTTGGATGAAGCATGCATCCATGAACCC GTACTGCCAGCAGCTCGG

SNP13 comp399176_c0_seq1 ACGTTGGATGATCCAGACCTGTACCCAAAG ACGTTGGATGATGCCTCTGACAGAAAACTC CACTGGACGTCCACCTCAT

SNP14 comp399176_c0_seq1 ACGTTGGATGGGCATCTCTAATTTTCTGTC ACGTTGGATGTGGGATCAGTTTGGCTGTAG TAAGGCCATCCATGGCGTCCCT

SNP15 comp399877_c0_seq1 ACGTTGGATGCTGATCACTCTACTGTACTG ACGTTGGATGGACAAAGTCTACAAGTGAGC ATGAACTGTAACTTCTTTTTTG

SNP16 comp400352_c0_seq1 ACGTTGGATGATGGTCATCATCAGCGACAG ACGTTGGATGAACCTGACCTCCAAGCTCCT GCGAGTCCTTGCCGGCGCT

SNP17 comp400553_c0_seq1 ACGTTGGATGACAAGATCGACTTCCGCGAG ACGTTGGATGAACGAAGACGAAGTCGAAGC AGGTCGTCGAGGACGGG

SNP18 comp401774_c0_seq1 ACGTTGGATGGGAGTTGGTAGGACGATTAC ACGTTGGATGCGCCCAATACTTATCAGCAG GTAGGACGATTACCAAACTTCT

SNP19 comp401774_c0_seq1 ACGTTGGATGTGATGTTGTGGAAGATGCGG ACGTTGGATGACTACGACTCGAGCGAGTG GAGTGGGACTGGCTGCG

SNP20 comp401774_c0_seq1 ACGTTGGATGTTGCTGAGACTGAGGAGGAC ACGTTGGATGTCTTCCAGGAGAGGAGAGG AGAGGCGAGGACATCCGACCC

SNP21 comp401816_c0_seq1 ACGTTGGATGTCCAGCTCTCCTTCAACTAC ACGTTGGATGACCAGGTCCGGGTTGTTCAG GCGGGGCGAGCCATCGG

SNP22 comp401816_c0_seq1 ACGTTGGATGTGAACAACCCGGACCTGGTG ACGTTGGATGTTGTTGTCCCTCGCCGTCAT ACAGCGCCGTCTTGAACGA

SNP23 comp402699_c4_seq1 ACGTTGGATGATCACCACCCTGAACGTCTG ACGTTGGATGATGATCTCCTTGGACAGGTG CCAGGCCTACACCCTGAAGCGGAT

SNP24 comp402699_c4_seq1 ACGTTGGATGTGCAGAACACGGGTTAAGAC ACGTTGGATGGATGCAGCTAAAATTCGCAA TACAAAAGGCCTAAAGCAAATGAT

SNP25 comp402881_c1_seq1 ACGTTGGATGGAGCTGAAACTCCTTCGGCA ACGTTGGATGGTAAACATCCTTGAAGCTCC TGAAGCTCCTTCTATGCAC

SNP26 comp402896_c0_seq1 ACGTTGGATGTTGTCACAGGTGCTGAGTTC ACGTTGGATGGTGACTTTCCTTGCTATCCC GGCAAAAGATCTTGGTTTGTTG

Page 91: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

91

SNP27 comp402968_c0_seq1 ACGTTGGATGATGTCCCCTTCCTCCACGAA ACGTTGGATGAGGGTCCCCCCACCGACAA TTGCCGTCGCCGAGGAT

SNP28 comp403104_c0_seq1 ACGTTGGATGGCCTTGTCACCATTTATCCC ACGTTGGATGAGACGATCCGGATTGATGAC TGATGACGCAGACGAGGTGGC

SNP29 comp403104_c0_seq1 ACGTTGGATGTCTGGCAGTTCTTGCAGAAG ACGTTGGATGCGTTGCAACAGCATGGATAC TCTTGCAGAAGTGGCGTGGCTG

SNP30 comp403411_c0_seq1 ACGTTGGATGGCGATAATGCTGCTGGATTC ACGTTGGATGAGTCCAAGGTCGAGAACAAG AAGGGCCAGAAATCAGA

SNP31 comp403411_c0_seq1 ACGTTGGATGAAGCAGAACCAGATTCAGGC ACGTTGGATGCATGTACCCTTGGAGTGTAG TGGAACAATCTCCCTGTGATGG

SNP32 comp403411_c0_seq1 ACGTTGGATGTGGAGACACAAGAGCTTCAG ACGTTGGATGTTACTGATGGCCCCTGATTG GACTTTGATATGTCCACTC

SNP33 comp403445_c0_seq1 ACGTTGGATGGACCGATGTAAGATGGAAGC ACGTTGGATGGAGTACGTCTCATGTTCCTC TAAGATGGAAGCCCTTAAAC

SNP34 comp403445_c0_seq1 ACGTTGGATGAGGGGAAAATGGAGGAAATC ACGTTGGATGTGTCCTAGTGTTGTCTTGCC GTCTTGCCTAATCCTCC

SNP35 comp403445_c0_seq1 ACGTTGGATGAGAGTTTGACGCTACTCCAG ACGTTGGATGTGCTAATGGCAGACCGTTAC CGCTACTCCAGCAAATCTTATT

SNP36 comp404064_c0_seq1 ACGTTGGATGAAGCTCATCGTCACCGAGG ACGTTGGATGAAACTTCCCGTCGACGGTG ACCACCGGAATTCCCCTC

SNP37 comp404064_c0_seq1 ACGTTGGATGAGGTGATCGATGCCGAGGAG ACGTTGGATGTAGTGCCAGACGAGTACGG GTACGGCAGCGCGACGAC

SNP38 comp404064_c0_seq1 ACGTTGGATGCACATCTACTCGCTCAACTC ACGTTGGATGCCAGGTCGAACTTGCGCAT CGAACTTGCGCATGATCAC

SNP41 comp404787_c0_seq1 ACGTTGGATGTCTTTTGAAGGCCTGGATGG ACGTTGGATGAATGTCCAGATGTCCTTGCC CCTGGATGGCGGAGCTGG

SNP42 comp404787_c0_seq1 ACGTTGGATGAAGTACCCGTCTGAGAAGAG ACGTTGGATGTCGACAGACAGAGAACGATG TTTGTCAACAGCCTCCGGTGAG

SNP43 comp404787_c0_seq1 ACGTTGGATGGTTACGTGTCCATCGGTTGC ACGTTGGATGTCCTTGGCCTTGGCGTCCT CCGGCCTTCGCGCTCGTGCTG

SNP44 comp404734_c0_seq1 ACGTTGGATGGAAGGATGGCTTCTACATCG ACGTTGGATGTGTTTGGCAGGCTCATGAAG AGGCTCATGAAGTTCTTGGT

SNP45 comp404734_c0_seq1 ACGTTGGATGGTCGCATGGAGAAGTTCTAC ACGTTGGATGGAAGATACCCTTGCAGACAC AAGTTCTACTGGGCTCC

SNP46 comp404734_c0_seq1 ACGTTGGATGAGCCCAAGATGACCATCGAG ACGTTGGATGTACTTGTCAGCAAGCTGCAC TGACCATCGAGAAGCTC

SNP48 comp404985_c0_seq1 ACGTTGGATGGTTCTGCTCCGATCAACTTG ACGTTGGATGCATGAAGATCTCCACGGAAC AGCGCCCAACGCAGCAC

SNP49 comp404985_c0_seq1 ACGTTGGATGTGGTGGCGCAACGAGCAGTT ACGTTGGATGTTGAGCAGGCCCTGGAACAC CGCAACGAGCAGTTCTGGGT

SNP50 comp405097_c0_seq1 ACGTTGGATGGATTACACCGATGACATCTC ACGTTGGATGAGACGCCTCCACATTTGAAG ACATTTGAAGTAAGTCACCTGGA

SNP51 comp405097_c0_seq1 ACGTTGGATGGCATGTCTGGCTTACACTTC ACGTTGGATGCGGTCAATGAATGGCATCAC TGGTCTGACCTCTGCCG

SNP52 comp405374_c1_seq1 ACGTTGGATGAGATATCCTTCAAGCACCTG ACGTTGGATGTGAGGAGATACTACAACGAC TCCTTCAAGCACCTGATCCATC

SNP53 comp405374_c1_seq1 ACGTTGGATGACCTTGTTGTTGTTGCTGGG ACGTTGGATGGCATCTTCTCTATCTCTGCG GGGTATAATGATGTAAAGAAGTC

SNP54 comp405932_c0_seq1 ACGTTGGATGCATCGGTGATAAGCAACAGC ACGTTGGATGTGCATCTCTGATAGACCCTG TGAATTGTTGGAGTACATATC

SNP55 comp405932_c0_seq1 ACGTTGGATGAATGGGTTACTCTGTCTGCG ACGTTGGATGGCCATTGAGGAAGCAAAGTG TTCCCCACCTTATACTGTGT

SNP56 comp405932_c0_seq1 ACGTTGGATGTAGCCATCAATTTCCCGGTC ACGTTGGATGGAAACTAGACCGACAGAAGC GTCTATGAAGCGCTCTTCCTC

Page 92: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

92

SNP57 comp406822_c0_seq1 ACGTTGGATGACGAAGTGCTGCGCGACGAT ACGTTGGATGAGAAGGTGTTCGTCACCGAC CGGCGCTGTATCTTTCC

SNP58 comp406822_c0_seq1 ACGTTGGATGTGCAGCTGCGGATGAAGCG ACGTTGGATGTGCCCACCATCCACCAGAT TCCTCGGGCTTGGAGGCGTG

SNP59 comp406822_c0_seq1 ACGTTGGATGGGACGCCTTGTCCTCTTCTT ACGTTGGATGTTCTCCTTGCTGGTGTGGG GAGCCGTTGCTGTCGGCTTT

SNP60 comp407770_c0_seq1 ACGTTGGATGGCCGTCAGATCTCACATTTG ACGTTGGATGAGTAGGCCCAAAGTAATCCC AGTAATCCCCATGCTTTGTAAGTC

SNP61 comp407770_c0_seq1 ACGTTGGATGGCCTACTGAGGATGGAAAAC ACGTTGGATGTGTGGATCCCTTCTTTCAGC ACTGAGGATGGAAAACCTTCTC

SNP62 comp409117_c0_seq1 ACGTTGGATGAGGAGAGCAGCTGTGCGAA ACGTTGGATGATCCAGAAATGGTACCTCGG CCCACCACCGTCCGGAG

SNP63 comp409117_c0_seq1 ACGTTGGATGAGGTGATCCTTCACTAGGAC ACGTTGGATGGGACATCGAGATCCACTTCC AGATGCCGATGGCGTTGTACTT

SNP64 comp410102_c0_seq1 ACGTTGGATGAGACTTGTGTTTCCCCCGTC ACGTTGGATGAATCAGTAGTTCCAGCCACC AAGAGCTAATCATCTTCTGGAG

SNP65 comp409416_c0_seq1 ACGTTGGATGAGAAGATCTGGCTGGTGGAC ACGTTGGATGCATGGCTGCTTGAAGTGCTG AAGGGCCTGATCGTGGA

SNP66 comp409416_c0_seq1 ACGTTGGATGTCGCACTCGGAGTGCACAG ACGTTGGATGACTTCGACGGGGTCGAAGG CGGAGTGCACAGCCGAGGA

SNP67 comp409416_c0_seq1 ACGTTGGATGAAGGTTGCCGCCAAGGCCTA ACGTTGGATGTCTGCGCGTACTTGACGAGA GCCTACGAGCTCGGACTCGC

SNP68 comp410518_c1_seq1 ACGTTGGATGAAAAGAATTCCAGCAGCCCG ACGTTGGATGATCAGCTTCTTCTGGATCGC TCCAGTACCTGTTCCTGGG

SNP69 comp410882_c0_seq1 ACGTTGGATGAGTAAAACCCTCAACCTGCG ACGTTGGATGCATAAAACGTGAACATCACTG TAAAACGTGAACATCACTGTTGATA

SNP70 comp410926_c0_seq1 ACGTTGGATGCGAGAGAAATTCTCCTGTTG ACGTTGGATGCCTCCCTAAGATCATACACC TGACCATGAGCACCCAC

SNP71 comp410926_c0_seq1 ACGTTGGATGTATGATCTTAGGGAGGCTGG ACGTTGGATGGGAACCTTGCAACCCATTAG TGAGACTTCGGTAACGGTA

SNP72 comp411092_c0_seq1 ACGTTGGATGAGGGCACATGTGTGGAGGAT ACGTTGGATGGTCAGTTTCCTCTCCCATTG TTCCTCTCCCATTGAATTAATTT

SNP73 comp411092_c0_seq1 ACGTTGGATGCCTCTGGAAGTGTTCTCGTG ACGTTGGATGTAGAAAAAAGAGCCCGGGTG CATTTTCATCATCCGCAA

SNP74 comp411001_c0_seq1 ACGTTGGATGCGAAGACCATCTCGAGCAG ACGTTGGATGCCATGAAGAAGGACATCAAG AAGAAGGGCCACTCGTTGTACAT

SNP75 comp411001_c0_seq1 ACGTTGGATGATCCTCTTCAGCGTGTAGGC ACGTTGGATGAGATCCTTGAAGCTAGTCCC CCTACATCACGACGCTGAA

SNP76 comp410205_c1_seq1 ACGTTGGATGACTTCATCAGCGGCTACACC ACGTTGGATGCGAAGCAGGCCGAGAAGGT GCAGGCCGAGAAGGTGGCCGT

SNP78 comp410899_c0_seq1 ACGTTGGATGTTCTTGTTTGGCTGTGCTCG ACGTTGGATGTTTGTATGTAAAGGGAGACC TATGTAAAGGGAGACCCAAGGG

SNP80 comp410205_c0_seq1 ACGTTGGATGAGTTGAGGAACTGGTCGTTG ACGTTGGATGCCAGTTCGTGATCAACAGGG TGATCAACAGGGAGCGGGC

SNP81 comp410205_c0_seq1 ACGTTGGATGGATGGACTGCAGCTGCTGTT ACGTTGGATGATCAAGGATGGCGCCACCTC TGGCGCCACCTCGGCCTTCGC

SNP82 comp409444_c1_seq1 ACGTTGGATGCCCACTACAGTAACTGGAAG ACGTTGGATGACCCATTATCTTGAAGCCTG CTGGAAGGAACAGCTGA

SNP83 comp409444_c1_seq1 ACGTTGGATGGATAATTCACCAATTCGCCG ACGTTGGATGCCCTGTTGGACTCAAACTAC GAACTATCTGCTGGCCAC

SNP84 comp409137_c0_seq1 ACGTTGGATGCCTCCAGATATTAGCAAAGC ACGTTGGATGTTGAGGCTTCAAGCAATGGG CAATGGGAGATTAAGTGGTT

SNP85 comp408903_c0_seq1 ACGTTGGATGTATTGATCCCACATCTGGAG ACGTTGGATGCATGGTTATAGATCTCTCCG ATCTCTCCGTTCACCGT

Page 93: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

93

SNP86 comp409281_c1_seq1 ACGTTGGATGGAGCCCCGGCAGCTTGAAC ACGTTGGATGTCTACTACCACAACGTCCAC GCTTGAACCGGGCGGTG

SNP87 comp408198_c0_seq1 ACGTTGGATGTAATGAGCCCGGGCATTATC ACGTTGGATGGTTCTCGTTAGGATATCCAG GTTAGGATATCCAGTGATTG

SNP88 comp408198_c0_seq1 ACGTTGGATGGAGCGTCCAACCATTTCAAG ACGTTGGATGTTTCTTCATGCTTGCCGAGG ATCATGGCAAACCTTGGGTTCCG

SNP89 comp408198_c0_seq1 ACGTTGGATGACTATTTCGCTTGCAGGTTC ACGTTGGATGCAAGACCTGCAATCTACGAG CTTGCAGGTTCAACCTCGTC

SNP90 comp408696_c0_seq1 ACGTTGGATGTTACAAACAGCTCGCAAGCC ACGTTGGATGTGCTGAAATAGAACCCCCAG CTGATATTTTCTTCCCCCT

SNP91 comp408696_c0_seq1 ACGTTGGATGACCTTAAGCACAGCCAATCC ACGTTGGATGGATTGCAAGTGTGCTGTCTC ACAGCCAATCCACCAGC

SNP94 comp408091_c0_seq1 ACGTTGGATGTCATGGTGGACCGGATGCTC ACGTTGGATGAATACTTGCCGTCCTTGTCC TCCTTGTCCTCCATCTG

SNP95 comp408070_c2_seq1 ACGTTGGATGCTCGTCCGTGAAACATAGTC ACGTTGGATGTTTCTCTGCAGCTTGGCAAC CTTAACCCCATGACACTTA

SNP96 comp408070_c2_seq1 ACGTTGGATGTTGCCAAGCTGCAGAGAAAC ACGTTGGATGAATCAGTGGCAAGCAGGAAG CAGGAAGTGATGATTGGGTATT

SNP97 comp407698_c0_seq1 ACGTTGGATGAACCTTATGGCGACCCATCC ACGTTGGATGTATGACTCGTCCAAGGACCC CACGCCGACGGTGTTCCTCTG

SNP98 comp407698_c0_seq1 ACGTTGGATGTGATGGGCTTGATGTAGACG ACGTTGGATGTCAACGACGAGCTCTTCTTC TCTTCTTCTCCATCGCC

SNP99 comp407348_c0_seq1 ACGTTGGATGACTGTGTAGTTTGCTCCAAC ACGTTGGATGTGCTCGAATTCTGGTCACTG GGTCACTGACCAGAAGAT

SNP100 comp407348_c0_seq1 ACGTTGGATGAAGTAACGCTCAACATACCC ACGTTGGATGAAATGACTCGGCTGGTGATG ACAACTGCATCTGTTCT

SNP101 comp407348_c0_seq1 ACGTTGGATGGGACCAACCTTGTCAATAGC ACGTTGGATGGTTGCTGCTATATCAGCTGG ACCAACCTTGTCAATAGCTTCGGC

SNP102 comp407273_c0_seq1 ACGTTGGATGTTGCCGTTAACCTTGAGCAG ACGTTGGATGGCCTCGACTACATCATTGAC ACATCATTGACACTGTCTC

SNP103 comp406670_c0_seq1 ACGTTGGATGCGACAATGGAGAGGGATTTG ACGTTGGATGGCGATAGCTCTCTGATTTGC GAGGGATTTGAGAAATTGAA

SNP105 comp406375_c0_seq1 ACGTTGGATGAGCAGTACTGCCTGTTGCTC ACGTTGGATGGTGAACCCAAAATCTTCAGC GCTCCACCAGTATTAGATGA

SNP106 comp406375_c0_seq1 ACGTTGGATGCTAGTTGAGAGTATCGTTGG ACGTTGGATGTGGGATGTGCATCAATGCTG ATCGTTGGACATGCACGAT

SNP107 comp404729_c0_seq1 ACGTTGGATGACCCAGATGACCCGAAGAAC ACGTTGGATGAGATGGCGTCGTAGTCGAG GAAGAACGCGCACCTCA

SNP108 comp404729_c0_seq1 ACGTTGGATGTGAACCCTGTGCTGGTGGTG ACGTTGGATGAGACCCGTCCAGGTACTTGA GTGAACGCCAGCATCGC

SNP109 comp404739_c1_seq1 ACGTTGGATGACTGTTTCTTGAGCAAGGAC ACGTTGGATGAAATGCGAGCATCACTCCAC GCAAGGACCAAGCGTCTTCTCC

SNP110 comp404739_c1_seq1 ACGTTGGATGATCTTTCCATGAAGCGTCCC ACGTTGGATGTGCAGACCCTAACCAACATC ATCACGAGAAGAAATTTGCT

SNP111 comp402928_c0_seq1 ACGTTGGATGGAGCTGATTAAGTACAAAGG ACGTTGGATGCCAGAATTTCCGGATGAGAC TACAAAGGTTTTCAGATTGC

SNP112 comp402928_c0_seq1 ACGTTGGATGCCTAGCTACAAAGGCCTAAC ACGTTGGATGTAGCTGCAGAAGAGCCATTG CCATTGCATGTTCATTTAGT

SNP113 comp402778_c0_seq1 ACGTTGGATGCTTAAGGAGAGGAAACGCAG ACGTTGGATGTGCACATGCTTGACATTCCG GAGAGGAAACGCAGCATCAAC

SNP114 comp402778_c0_seq1 ACGTTGGATGGGAATGTCAAGCATGTGCAG ACGTTGGATGTGCGCTTGTTCCCATGATTG GGGAATTATGCTTGGTGCAGA

SNP115 comp402778_c0_seq1 ACGTTGGATGTCCCCGTTAAGCCATTCATC ACGTTGGATGAACCATGCGACAGTGAAGAC CACGAACAGGCTTCTCTCC

Page 94: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

94

SNP117 comp396219_c0_seq1 ACGTTGGATGATGTACACTCCTGTCTACCG ACGTTGGATGGCAGTACCCTGCATTGATAG GATAGGTTTTTATTACTGCAAAATT

SNP119 comp399509_c0_seq1 ACGTTGGATGCTCAGATCATCGAAGAGTGG ACGTTGGATGGAAAGAGTACACAGCTGTCC TGTTGTGAAAAAGGGCA

SNP120 comp399252_c0_seq1 ACGTTGGATGAGAAGCGAGAGCAAGCGATG ACGTTGGATGAAGTTGTAGGGTGAGAGGAC GATGGAGGAGCAAGGCGG

SNP121 comp399252_c0_seq1 ACGTTGGATGCTACTTCGTCGGGTCCTGC ACGTTGGATGTCGATGCCGTTGGAGGTGAG CAGTAGTTCTCGTTCCCTTT

SNP123 comp402013_c0_seq1 ACGTTGGATGAACGCCTCCTTGAACTTCTC ACGTTGGATGACTGCGTGAAGTACTGGAAG CCTTGAACTTCTCCACGGCG

SNP124 comp400737_c0_seq1 ACGTTGGATGGTCCAAGAGCAACTCTCAAG ACGTTGGATGTCTGATTCTGAGGCCTTCTG CTGAGGCCTTCTGAAGAAGA

SNP125 comp400737_c0_seq1 ACGTTGGATGGTGAAGGTAGGCACCAAAC ACGTTGGATGTCGGTGGTGGACAACAATAC CATTGCTGTGATCCGTAAATTC

SNP126 comp400839_c0_seq1 ACGTTGGATGCCAAGTCAACAGGCAACAAC ACGTTGGATGAATGCTCAGAAGGCTGTTGC CTGTTGCCCACTGAACGCTTCCT

SNP127 comp400839_c0_seq1 ACGTTGGATGATGTTGTCCGGAAGGATCAG ACGTTGGATGTGCTGAGGAAGAAGTATGCG GAAGTATGCGCACAAAGA

SNP128 comp401467_c0_seq1 ACGTTGGATGAGTCAGGTGTGGGTTTTGGC ACGTTGGATGGCAAAGTTATCATGTACCAC GCCGACCTGATCAACCA

SNP129 comp401467_c0_seq1 ACGTTGGATGGAGCTTTGTTTAATTTGGGC ACGTTGGATGAGACCAGCAAGAACAAAGTC AACGAAAAAAGGTTTCCGCA

SNP130 comp401757_c0_seq1 ACGTTGGATGACAGCAGGACCCAACATTTC ACGTTGGATGCAGGGAGTTTTCCATGTTGC ACATTTCTCGCTCTGGATC

SNP131 comp401757_c0_seq1 ACGTTGGATGCTCTCCTTGTTCATGAAGGG ACGTTGGATGTGCGCACCTCATTTCATCAG AGTAAGTCCAGCAGGTC

SNP132 comp401757_c0_seq1 ACGTTGGATGGGAGTGGCAACATGGAAAAC ACGTTGGATGAGCTTTTCAAGGCCGATCTC CATGGCAGCTGCCATCGCGGG

SNP135 comp403803_c0_seq1 ACGTTGGATGCAAAGGTGTACCAATATCTC ACGTTGGATGCGGAGACCGATGTTAACGAG AATATCTCTAGTACTTGCCAGCA

SNP136 comp403803_c0_seq1 ACGTTGGATGGCTCGATGGTGCCGGTGAA ACGTTGGATGCATCACGCTCGTGTTCACC CTCTCCGTGCAGGGCCCGAT

SNP138 comp409769_c0_seq1 ACGTTGGATGACCCACAGAAGCAGGAAGG ACGTTGGATGCCAGCTCGAACATGTCCGC CACGTGCAGGCCCACGTA

SNP139 comp409769_c0_seq1 ACGTTGGATGACGGTCAGGATGCACTGGA ACGTTGGATGTTGGTGAGGCATCCCATGAA TGGTGAGGCATCCCATGAACCCGAT

SNP140 comp410320_c0_seq1 ACGTTGGATGTCACCATCTTCGAGAAGGTC ACGTTGGATGGCGGGTAACCCTTGCCTTT AAGGTCAAATCCATGCC

SNP141 comp410320_c0_seq1 ACGTTGGATGAAAGGCAAGGGTTACCCGC ACGTTGGATGGGACTTGGATTTGAACTGC GCGTCGTCAAGTTCGACCCGAT

SNP142 comp410320_c0_seq1 ACGTTGGATGTACTTCGCCGAGTCCCTGAT ACGTTGGATGATGGCAGCATGTATCGCTAC CGCTACAACTTTGTCGTCG

SNP143 comp410947_c0_seq1 ACGTTGGATGTCGCCATGGGCGTCGGTGAG ACGTTGGATGCCGTTCATCATGCTGTTCAT CACGCGCTCGCGGGCCGACTC

SNP145 comp410947_c0_seq1 ACGTTGGATGTGATGAAGCCGAAGCAGGAC ACGTTGGATGAGCGGATGACTTCGATCTGG CTGCGGCGAGGTGCGGAG

SNP146 comp411536_c1_seq1 ACGTTGGATGCGAGCGCCAGCGTGTCGTC ACGTTGGATGAGGAGGGGTGGAAGTACAG TACAGCGTCGGCTTCGT

SNP147 comp411536_c1_seq1 ACGTTGGATGGAGGTGGGAGAGCACGGAC ACGTTGGATGTCCTCGACACCTACCGGAT TCGGAGTTGTAGCCGGT

SNP148 comp410983_c0_seq1 ACGTTGGATGACAACTGCTTTAGGCCAACG ACGTTGGATGGGTTGGAAGGAGAAGAATAC AAGGAGAAGAATACTTGGCCATT

SNP149 comp410983_c0_seq1 ACGTTGGATGATCTCCCCCTTATCCTTTGC ACGTTGGATGGTCGGCTTGGTCTGTGAAAA GTGGTCTGTTCAGACGA

Page 95: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

95

SNP150 comp410983_c0_seq1 ACGTTGGATGTAGTCCACCGTTTCCAACTC ACGTTGGATGTTGCTGAAGACCTGGCTGAG ACCTGGCTGAGGGGTGCGA

SNP151 comp410620_c1_seq1 ACGTTGGATGTCTAGCATTGGGTGTCAGAG ACGTTGGATGTCCAGCCTGCTCTCTTTCAC CTGCTCTCTTTCACCCAGCTGT

SNP152 comp410620_c1_seq1 ACGTTGGATGAGGTAGAGTGGCGGATTAGC ACGTTGGATGAATGCTGGGAGTACAATGGG ACGAATGCGGCTTTGAC

SNP153 comp409569_c0_seq1 ACGTTGGATGATGCTTCAAGGGTTCTGCTC ACGTTGGATGTTCAACTGAACCAAGAGCCC GCTCCAATTAACCTTTCTGA

SNP154 comp409569_c0_seq1 ACGTTGGATGAAGTACTGGCAGGGATTGAC ACGTTGGATGCAGCAAAATCACCCTCATCG GTCGCCTTTGATGTAAC

SNP155 comp409569_c0_seq1 ACGTTGGATGCTTCTCAATCTGGGTGATCC ACGTTGGATGTTGGTGTGCGGTTCTGTTTC TTCTGTTTCCCCATGAGACCCTT

SNP156 comp408754_c0_seq1 ACGTTGGATGTCACGTTCCGTGGCCCCTC ACGTTGGATGGTCAGCTCCGATGATCACC GACGAGCGAGTCGAGGTG

SNP157 comp408754_c0_seq1 ACGTTGGATGTTCGAGCTCGTGTCGGCGT ACGTTGGATGTTGAGCAAGTGGAACGTGAG GCGTCGCAGACGATCCT

SNP158 comp408754_c0_seq1 ACGTTGGATGGAGCGAAGGTGATCTCTCTG ACGTTGGATGGCAAACAATGGCGAACTGTC GGCGAACTGTCGGATCATAGG

SNP159 comp406804_c0_seq1 ACGTTGGATGCTGTTGTTGTGCCTGTACTC ACGTTGGATGGGGAGATGACGGTTGATCAG CGGTTGATCAGGCCGTG

SNP160 comp406804_c0_seq1 ACGTTGGATGGACCCGACGTACCTGTAGTA ACGTTGGATGTGCAAAGCGGAGAAGGGCGT CGACGTACCTGTAGTACGCGTG

SNP161 comp405771_c1_seq1 ACGTTGGATGGTTCCACTCCTTGAGGCAC ACGTTGGATGAGGAGCTGAACAAGGTGCTA AGGGCAAGCATATAGAC

SNP162 comp405771_c1_seq1 ACGTTGGATGTCTTCATGAGCGGGTAGTTG ACGTTGGATGAAGGACCTGCTCCAGGAGAT GTGTTCGCCTACGCCGACGACCC

SNP163 comp405771_c1_seq1 ACGTTGGATGACAACGCGATCAGGAACGTC ACGTTGGATGTGGGCCTCATCTCCTCCAG TCAGGAACGTCGATGTCAT

Page 96: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

96

Tabela II: vias e genes dos 147 snps genotipados

SNP Contig Via Gene putativo

SNP13 comp399176_c0_seq1 C4 Alanine-glyoxylate aminotransferase 2 homolog 1

SNP14 comp399176_c0_seq1 C4 Alanine-glyoxylate aminotransferase 2 homolog 1

SNP90 comp408696_c0_seq1 C4 Alanine-glyoxylate aminotransferase 2 homolog 1

SNP91 comp408696_c0_seq1 C4 Alanine-glyoxylate aminotransferase 2 homolog 1

SNP159 comp406804_c0_seq1 C4 Bifunctional monodehydroascorbate reductase/carbonic anhydrase

SNP160 comp406804_c0_seq1 C4 Bifunctional monodehydroascorbate reductase/carbonic anhydrase

SNP9 comp396609_c0_seq1 C4 Carbonic anhydrase

SNP30 comp403411_c0_seq1 C4 Cyclic dof factor 2

SNP31 comp403411_c0_seq1 C4 Cyclic dof factor 2

SNP32 comp403411_c0_seq1 C4 Cyclic dof factor 2

SNP128 comp401467_c0_seq1 C4 Dof zinc finger protein MNB1A

SNP129 comp401467_c0_seq1 C4 Dof zinc finger protein MNB1A

SNP126 comp400839_c0_seq1 C4 Gamma carbonic anhydrase 2

SNP127 comp400839_c0_seq1 C4 Gamma carbonic anhydrase 2

SNP10 comp397475_c0_seq1 C4 Malate dehydrogenase

SNP113 comp402778_c0_seq1 C4 Malate dehydrogenase

SNP114 comp402778_c0_seq1 C4 Malate dehydrogenase

SNP115 comp402778_c0_seq1 C4 Malate dehydrogenase

SNP2 comp390273_c0_seq1 C4 Malate dehydrogenase

SNP3 comp390273_c0_seq1 C4 Malate dehydrogenase

SNP1 comp372439_c0_seq1 C4 NAD-dependent malic enzyme 59 kDa isoform

SNP148 comp410983_c0_seq1 C4 NAD-dependent malic enzyme 59 kDa isoform

SNP149 comp410983_c0_seq1 C4 NAD-dependent malic enzyme 59 kDa isoform

SNP150 comp410983_c0_seq1 C4 NAD-dependent malic enzyme 59 kDa isoform

SNP117 comp396219_c0_seq1 C4 NADP-dependent malic enzyme chloroplastic

SNP65 comp409416_c0_seq1 C4 NADP-dependent malic enzyme chloroplastic

SNP66 comp409416_c0_seq1 C4 NADP-dependent malic enzyme chloroplastic

SNP67 comp409416_c0_seq1 C4 NADP-dependent malic enzyme chloroplastic

SNP76 comp410205_c1_seq1 C4 Phosphoenolpyruvate carboxykinase

SNP80 comp410205_c0_seq1 C4 Phosphoenolpyruvate carboxykinase

SNP81 comp410205_c0_seq1 C4 Phosphoenolpyruvate carboxykinase

SNP23 comp402699_c4_seq1 C4 Phosphoenolpyruvate carboxylase

SNP24 comp402699_c4_seq1 C4 Phosphoenolpyruvate carboxylase

SNP74 comp411001_c0_seq1 C4 Phosphoenolpyruvate carboxylase

SNP75 comp411001_c0_seq1 C4 Phosphoenolpyruvate carboxylase

SNP95 comp408070_c2_seq1 C4 Phosphoenolpyruvate carboxylase

SNP96 comp408070_c2_seq1 C4 Phosphoenolpyruvate carboxylase

SNP28 comp403104_c0_seq1 C4 Cyclic dof factor 3

SNP29 comp403104_c0_seq1 C4 Cyclic dof factor 3

SNP44 comp404734_c0_seq1 C4 Ribulose bisphosphate carboxylase/oxygenase activase

Page 97: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

97

SNP45 comp404734_c0_seq1 C4 Ribulose bisphosphate carboxylase/oxygenase activase

SNP46 comp404734_c0_seq1 C4 Ribulose bisphosphate carboxylase/oxygenase activase

SNP100 comp407348_c0_seq1 C4 RuBisCO large subunit-binding protein subunit alpha

SNP101 comp407348_c0_seq1 C4 RuBisCO large subunit-binding protein subunit alpha

SNP26 comp402896_c0_seq1 C4 RuBisCO large subunit-binding protein subunit alpha

SNP99 comp407348_c0_seq1 C4 RuBisCO large subunit-binding protein subunit alpha

SNP102 comp407273_c0_seq1 Lignocelulose Cinnamyl alcohol dehydrogenase

SNP120 comp399252_c0_seq1 Lignocelulose Cinnamyl alcohol dehydrogenase

SNP121 comp399252_c0_seq1 Lignocelulose Cinnamyl alcohol dehydrogenase

SNP94 comp408091_c0_seq1 Lignocelulose Caffeic acid 3-O-methyltransferase

SNP17 comp400553_c0_seq1 Lignocelulose Caffeoyl-CoA O-methyltransferase 1

SNP153 comp409569_c0_seq1 Lignocelulose Cellulose synthase A

SNP154 comp409569_c0_seq1 Lignocelulose Cellulose synthase A

SNP155 comp409569_c0_seq1 Lignocelulose Cellulose synthase A

SNP48 comp404985_c0_seq1 Lignocelulose Cellulose synthase A

SNP49 comp404985_c0_seq1 Lignocelulose Cellulose synthase A

SNP54 comp405932_c0_seq1 Lignocelulose Cellulose synthase-like protein E2

SNP55 comp405932_c0_seq1 Lignocelulose Cellulose synthase-like protein E2

SNP56 comp405932_c0_seq1 Lignocelulose Cellulose synthase-like protein E2

SNP107 comp404729_c0_seq1 Lignocelulose Cinnamoyl-CoA reductase 1

SNP108 comp404729_c0_seq1 Lignocelulose Cinnamoyl-CoA reductase 1

SNP130 comp401757_c0_seq1 Lignocelulose Cinnamoyl-CoA reductase 1

SNP131 comp401757_c0_seq1 Lignocelulose Cinnamoyl-CoA reductase 1

SNP132 comp401757_c0_seq1 Lignocelulose Cinnamoyl-CoA reductase 1

SNP135 comp403803_c0_seq1 Lignocelulose Dirigent protein 11

SNP136 comp403803_c0_seq1 Lignocelulose Dirigent protein 11

SNP52 comp405374_c1_seq1 Lignocelulose Sucrose synthase 4

SNP53 comp405374_c1_seq1 Lignocelulose Sucrose synthase 4

SNP84 comp409137_c0_seq1 Lignocelulose Sucrose synthase 4

SNP50 comp405097_c0_seq1 Lignocelulose Shikimate O-hydroxycinnamoyltransferase

SNP51 comp405097_c0_seq1 Lignocelulose Shikimate O-hydroxycinnamoyltransferase

SNP16 comp400352_c0_seq1 Lignocelulose Dirigent protein 19

SNP97 comp407698_c0_seq1 Lignocelulose Laccase-10

SNP98 comp407698_c0_seq1 Lignocelulose Laccase-10

SNP143 comp410947_c0_seq1 Lignocelulose Phenylalanine ammonia-lyase

SNP145 comp410947_c0_seq1 Lignocelulose Phenylalanine ammonia-lyase

SNP161 comp405771_c1_seq1 Lignocelulose Phenylalanine ammonia-lyase

SNP162 comp405771_c1_seq1 Lignocelulose Phenylalanine ammonia-lyase

SNP163 comp405771_c1_seq1 Lignocelulose Phenylalanine ammonia-lyase

SNP86 comp409281_c1_seq1 Lignocelulose Limonoid UDP-glucosyltransferase

SNP72 comp411092_c0_seq1 Nitrogênio Asparagine synthetase domain-containing protein 1

SNP73 comp411092_c0_seq1 Nitrogênio Asparagine synthetase domain-containing protein 1

SNP85 comp408903_c0_seq1 Nitrogênio Asparagine synthetase domain-containing protein 1

Page 98: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

98

SNP138 comp409769_c0_seq1 Nitrogênio Ferredoxin-nitrite reductase

SNP139 comp409769_c0_seq1 Nitrogênio Ferredoxin-nitrite reductase

SNP103 comp406670_c0_seq1 Nitrogênio Glucose-6-phosphate isomerase 1

SNP124 comp400737_c0_seq1 Nitrogênio Glucose-6-phosphate isomerase 1

SNP125 comp400737_c0_seq1 Nitrogênio Glucose-6-phosphate isomerase 1

SNP78 comp410899_c0_seq1 Nitrogênio Glucose-6-phosphate isomerase 1

SNP82 comp409444_c1_seq1 Nitrogênio Glucose-6-phosphate isomerase 1

SNP83 comp409444_c1_seq1 Nitrogênio Glucose-6-phosphate isomerase 1

SNP119 comp399509_c0_seq1 Nitrogênio 5'-adenylylsulfate reductase

SNP15 comp399877_c0_seq1 Nitrogênio 5'-adenylylsulfate reductase

SNP41 comp404787_c0_seq1 Nitrogênio 5'-adenylylsulfate reductase

SNP42 comp404787_c0_seq1 Nitrogênio 5'-adenylylsulfate reductase

SNP43 comp404787_c0_seq1 Nitrogênio 5'-adenylylsulfate reductase

SNP87 comp408198_c0_seq1 Nitrogênio Glutamate synthase 1

SNP88 comp408198_c0_seq1 Nitrogênio Glutamate synthase 1

SNP89 comp408198_c0_seq1 Nitrogênio Glutamate synthase 1

SNP146 comp411536_c1_seq1 Nitrogênio Nitrate reductase

SNP147 comp411536_c1_seq1 Nitrogênio Nitrate reductase

SNP68 comp410518_c1_seq1 Nitrogênio Nitrate transporter 1.2

SNP4 comp393980_c0_seq1 Nitrogênio Nitrate transporter At1g22540

SNP64 comp410102_c0_seq1 Resistência Putative disease resistance RPP13-like protein 1

SNP69 comp410882_c0_seq1 Resistência Putative disease resistance RPP13-like protein 1

SNP11 comp398252_c0_seq1 Resistência Endochitinase A

SNP12 comp398252_c0_seq1 Resistência Endochitinase A

SNP21 comp401816_c0_seq1 Resistência Chitinase 2

SNP22 comp401816_c0_seq1 Resistência Chitinase 2

SNP7 comp395427_c0_seq1 Resistência DIMBOA UDP-glucosyltransferase

SNP8 comp395427_c0_seq1 Resistência DIMBOA UDP-glucosyltransferase

SNP151 comp410620_c1_seq1 Resistência Acyclic sesquiterpene synthase

SNP152 comp410620_c1_seq1 Resistência Acyclic sesquiterpene synthase

SNP156 comp408754_c0_seq1 Resistência Chalcone synthase 3

SNP157 comp408754_c0_seq1 Resistência Chalcone synthase 3

SNP158 comp408754_c0_seq1 Resistência Chalcone synthase 3

SNP123 comp402013_c0_seq1 Resistência Chalcone-flavonone isomerase

SNP62 comp409117_c0_seq1 Resistência Chalcone-flavonone isomerase

SNP63 comp409117_c0_seq1 Resistência Chalcone-flavonone isomerase

SNP27 comp402968_c0_seq1 Resistência Isoflavone reductase homolog IRL

SNP25 comp402881_c1_seq1 Resistência Mitogen-activated protein kinase 4

SNP105 comp406375_c0_seq1 Resistência Omega-6 fatty acid desaturase

SNP106 comp406375_c0_seq1 Resistência Omega-6 fatty acid desaturase

SNP18 comp401774_c0_seq1 Resistência Omega-6 fatty acid desaturase

SNP19 comp401774_c0_seq1 Resistência Omega-6 fatty acid desaturase

SNP20 comp401774_c0_seq1 Resistência Omega-6 fatty acid desaturase

Page 99: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

99

SNP5 comp394414_c0_seq1 Resistência Pathogenesis-related protein 1

SNP60 comp407770_c0_seq1 Resistência Pathogenesis-related protein 1

SNP61 comp407770_c0_seq1 Resistência Pathogenesis-related protein 1

SNP111 comp402928_c0_seq1 Resistência 4-coumarate-CoA ligase 3

SNP112 comp402928_c0_seq1 Resistência 4-coumarate-CoA ligase 3

SNP36 comp404064_c0_seq1 Resistência 4-coumarate-CoA ligase 3

SNP37 comp404064_c0_seq1 Resistência 4-coumarate-CoA ligase 3

SNP38 comp404064_c0_seq1 Resistência 4-coumarate-CoA ligase 3

SNP57 comp406822_c0_seq1 Resistência 4-coumarate-CoA ligase 3

SNP58 comp406822_c0_seq1 Resistência 4-coumarate-CoA ligase 3

SNP59 comp406822_c0_seq1 Resistência 4-coumarate-CoA ligase 3

SNP140 comp410320_c0_seq1 Resistência 1-deoxy-D-xylulose-5-phosphate synthase 2

SNP141 comp410320_c0_seq1 Resistência 1-deoxy-D-xylulose-5-phosphate synthase 2

SNP142 comp410320_c0_seq1 Resistência 1-deoxy-D-xylulose-5-phosphate synthase 2

SNP109 comp404739_c1_seq1 Resistência Putative disease resistance protein RGA4

SNP110 comp404739_c1_seq1 Resistência Putative disease resistance protein RGA4

SNP33 comp403445_c0_seq1 Resistência Putative disease resistance protein RGA4

SNP34 comp403445_c0_seq1 Resistência Putative disease resistance protein RGA4

SNP35 comp403445_c0_seq1 Resistência Putative disease resistance protein RGA4

SNP70 comp410926_c0_seq1 Resistência Putative disease resistance protein RGA4

SNP71 comp410926_c0_seq1 Resistência Putative disease resistance protein RGA4

Tabela III. SNPs que aderiram a algum dos mapas produzidos, sua ploidia e categorização

inferidas pelo SuperMASSA e análise de número de cópias em espécies relacionadas.

SNP ID

Contig N° de cópias arroz

N° de cópias sorgo

N° de cópias P. virgatum

Ploidia estimada

Categoria

camila19 comp401774_c0_seq1 1 3 2 4 A

camila24 comp402699_c4_seq1 4 5 4 6 A

camila28 comp403104_c0_seq1 1 2 1 4 A

camila31 comp403411_c0_seq1 2 2 2 8 B

camila34 comp403445_c0_seq1 1 1 1 6 A

camila37 comp404064_c0_seq1 2 4 5 4 A

camila41 comp404787_c0_seq1 1 1 1 4 A

camila43 comp404787_c0_seq1 1 1 1 6 A

camila46 comp404734_c0_seq1 - - 2 4 A

camila48 comp404985_c0_seq1 9 7 6 6 A

camila49 comp404985_c0_seq1 9 7 6 4 A

camila52 comp405374_c1_seq1 3 2 2 4 A

camila54 comp405932_c0_seq1 3 2 1 4 A

camila56 comp405932_c0_seq1 3 2 1 4 A

camila59 comp406822_c0_seq1 2 1 1 4 A

camila60 comp407770_c0_seq1 1 1 1 6 A

Page 100: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

100

camila64 comp410102_c0_seq1 1 1 - 4 A

camila66 comp409416_c0_seq1 1 1 2 6 A

camila67 comp409416_c0_seq1 1 1 2 4 A

camila73 comp411092_c0_seq1 1 1 1 4 A

camila76 comp410205_c1_seq1 1 1 1 6 A

camila83 comp409444_c1_seq1 3 2 4 4 A

camila86 comp409281_c1_seq1 2 4 4 6 A

camila95 comp408070_c2_seq1 4 4 3 4 A

camila96 comp408070_c2_seq1 4 4 3 4 A

camila102 comp407273_c0_seq1 - 2 - 4 A

camila103 comp406670_c0_seq1 2 2 4 4 A

camila107 comp404729_c0_seq1 5 8 5 6 B

camila108 comp404729_c0_seq1 5 8 5 4 A

camila109 comp404739_c1_seq1 - 1 2 4 A

camila110 comp404739_c1_seq1 - 1 2 4 B

camila119 comp399509_c0_seq1 1 1 1 4 A

camila125 comp400737_c0_seq1 2 3 3 4 A

camila130 comp401757_c0_seq1 1 1 - 4 B

camila131 comp401757_c0_seq1 1 1 - 6 A

camila139 comp409769_c0_seq1 2 1 1 6 A

camila141 comp410320_c0_seq1 2 1 1 4 A

camila142 comp410320_c0_seq1 2 1 1 6 A

camila143 comp410947_c0_seq1 5 4 3 4 A

camila146 comp411536_c1_seq1 2 2 3 4 A

camila150 comp410983_c0_seq1 1 1 3 4 A

camila156 comp408754_c0_seq1 8 5 5 6 B

camila159 comp406804_c0_seq1 4 3 4 4 A

camila160 comp406804_c0_seq1 4 3 4 4 A

Page 101: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

101

Documento I. Declaração de que a dissertação não infringe os dispositivos da lei nº

9610/98, nem o direito autoral de qualquer editora.

Page 102: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/333607/1... · abordado no manuscrito e sua importância para a ciência e economia

102

Documento II. Declaração de que o trabalho não versou sobre pesquisa envolvendo seres

humanos, animais, patrimônio genético ou temas afetos a biossegurança.