universidade de são paulo (vfrod6xshulrugh$julfxowxud³ … · dade federal de são joão del-rei...

86
Universidade de São Paulo Escola Superior de Agricultura “Luiz de Queiroz” Mapeamento comparativo de QTLs entre sorgo sacarino e cana-de-açúcar para caracteres bioenergéticos Guilherme da Silva Pereira Tese apresentada para obtenção do título de Doutor em Ciências. Área de concentração: Genética e Melhoramento de Plantas Piracicaba 2015

Upload: others

Post on 20-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Universidade de São Paulo

Escola Superior de Agricultura “Luiz de Queiroz”

Mapeamento comparativo de QTLs entre sorgo sacarino e cana-de-açúcar

para caracteres bioenergéticos

Guilherme da Silva Pereira

Tese apresentada para obtenção do título de Doutor em

Ciências. Área de concentração: Genética e

Melhoramento de Plantas

Piracicaba

2015

Guilherme da Silva Pereira

Licenciado e Bacharel em Ciências Biológicas

Mapeamento comparativo de QTLs entre sorgo sacarino e cana-de-açúcar para

caracteres bioenergéticos

Orientador:

Prof. Dr. ANTONIO AUGUSTO FRANCO GARCIA

Tese apresentada para obtenção do título de Doutor em

Ciências. Área de concentração: Genética e

Melhoramento de Plantas

Piracicaba

2015

Dados Internacionais de Catalogação na Publicação

DIVISÃO DE BIBLIOTECA - DIBD/ESALQ/USP

Pereira, Guilherme da Silva Mapeamento comparativo de QTLs entre sorgo sacarino e cana-de-açúcar para

caracteres bioenergéticos / Guilherme da Silva Pereira. - - Piracicaba, 2015. 85 p. : il.

Tese (Doutorado) - - Escola Superior de Agricultura “Luiz de Queiroz”, 2015.

1. Sorghum bicolor 2. Saccharum × officinarum 3. Mapeamento de múltiplos QTLs 4. Análise de ligação 5. Sintenia I. Título

CDD 633.174 P436m

“Permitida a cópia total ou parcial deste documento, desde que citada a fonte – O autor”

3

A Deus,

pelos dons que, por certo, são dEle:

ofereço.

Aos meus pais, Geraldo e Maristela,

por todo empenho na educação e amor na criação dos filhos:

dedico.

4

5

AGRADECIMENTOS

Nesses quatro anos, inúmeras instituições e pessoas fizeram-se indispensáveis para o

desenvolvimento deste trabalho em particular e para o meu próprio crescimento pessoal e

profissional. Na tentativa de citar a todos, concedendo-lhes os devidos méritos, talvez eu

me faça enfadonho. No entanto, considerando os agradecimentos não apenas uma obrigação,

mas, verdadeiramente, um modesto reconhecimento por toda contribuição recebida, penso que

é válido fazê-los apropriadamente.

Inicialmente, gostaria de expressar minha gratidão pela oportunidade de cursar o dou-

torado à Escola Superior de Agricultura “Luiz de Queiroz” (ESALQ) e ao Programa de Pós-

Graduação em Genética e Melhoramento de Plantas da ESALQ, assim como pelas bolsas con-

cedidas pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), pelo

Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) e, finalmente, pela

Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP – processo no 12/25236-4).

A percepção de que este trabalho não é de uma pessoa só, mas, sim, de toda uma equipe,

consolida-se rapidamente no decorrer do texto. Por isso, faltam palavras para agradecer devida-

mente ao Prof. Dr. Antonio Augusto Franco Garcia, que, por ter aceitado me orientar, propiciou

tudo isto. Tendo me confiado este trabalho e me entusiasmado com sua maneira de ver a ciência

e de fazer pesquisa, o Augusto me ensinou mais do que conteúdos de genética e estatística. É

mérito dele, portanto, não só eu ter me capacitado a atuar sobre tópicos diversos da área, como

também ter percebido que com esforço sempre podemos ir além. Sua capacidade de atrair

pessoal competente e altruísta faz do Laboratório o ambiente ideal para nosso desenvolvimento

acadêmico, profissional e pessoal.

Alguns colegas e ex-colegas do Laboratório contribuíram diretamente com este trabalho;

foram eles: Luciano Da Costa E Silva e Maria Marta Pastina nas etapas de mapeamento de

QTLs que envolveram o uso do OneQTL, e Gabriel Margarido e Marcelo Mollinari nos respec-

tivos trabalhos envolvendo o Tassel-GBS e o SuperMASSA e nas enriquecedoras discussões ao

longo deste trabalho. Os demais, indiretamente e cada um ao seu modo, também tiveram suas

contribuições. É o caso das trocas de ideias sobre diversos assuntos em genética e estatística

com Rodrigo Gazaffi, Renato Rodrigues, Edjane Freitas, Adriana Cheavegatti, João Ricardo

Bachega e Carina Anoni, marcadamente, e do sempre animado e estimulante convívio com

Graciela Sobierajski, Rodrigo Amadeu, Maria Izabel Cavassim, Rafael Tassinari, Luís Felipe

Ferrão, Marianella Quezada, Letícia Lara, Amanda Avelar, Danilo Cursi e Fernando Correr.

6

Conhecê-los e ter a amizade de vocês, pessoal, já faria este doutorado valer a pena! Ter con-

vivido com a Adriana, em especial, durante esses quatro anos, me trouxe inúmeros benefícios

pessoais e profissionais, por ser sempre tão centrada e acolhedora.

Este trabalho reuniu dados e informações de dois grupos de pesquisa distintos e, ob-

viamente, sem a existência de tais parcerias, seria impossível realizá-lo. Assim, pela parceria

envolvendo a população de mapeamento de sorgo sacarino, gostaria de agradecer ao Dr. Ju-

randir Vieira de Magalhães, da Embrapa Milho e Sorgo, Sete Lagoas-MG, e aos seus alunos e

demais pesquisadores e técnicos envolvidos. O Jurandir não só me co-orientou, contribuindo

com o inteiro desenvolvimento da pesquisa, como também propiciou diversos avanços. E, pela

parceria envolvendo a população de mapeamento de cana-de-açúcar, meus agradecimentos à

Profa. Dra. Monalisa Sampaio Carneiro, da Universidade Federal de São Carlos (UFSCar),

Araras-SP, e à Profa. Dra. Anete Pereira de Souza, da Universidade Estadual de Campinas

(Unicamp), Campinas-SP, e aos seus respectivos alunos e equipe técnica.

Sendo também parte dos trabalhos de doutorado de Vander Fillipe de Souza, da Universi-

dade Federal de São João del-Rei (UFSJ), Sete Lagoas-MG, e de Thiago Willian Balsalobre, da

Unicamp, gostaria de agradecê-los imensamente por trabalharem na obtenção e disponibilização

dos dados e na discussão dos resultados das respectivas populações de mapeamento de sorgo

sacarino e de cana-de-açúcar. Muito obrigado também pela amizade de vocês e por comparti-

lharem seus conhecimentos sobre as culturas comigo. Este trabalho, claramente, também é de

vocês.

Também registro minha eterna gratidão aos professores dos programas de pós-graduação

da ESALQ em Genética e Melhoramento de Plantas e em Estatística e Experimentação Agronô-

mica pelos conhecimentos compartilhados durante disciplinas e cursos e pela imensa contribui-

ção na minha formação acadêmica. Meu muito obrigado se estende a todos os funcionários

da ESALQ, e, em especial, a Léia, Rogério, Wilma, Fernando, Macedônio, Natálio, Carlinhos,

Valdir, Berdan, do Departamento de Genética; a S. Antonio e Marcos, da portaria do prédio; a

Lucas, do Serviço de Pós-Graduação; a Glória, da Biblioteca; e a Patrícia, do Ponto de Apoio

da FAPESP.

Obrigado aos atuais e antigos moradores da República, Mateus Figueiredo, Endson Nu-

nes, Diego Velasquez, Sanzio Barrios, Rodrigo Marques, Rubén Díaz, Thiago Aragão, Mateus

Vicente, Hugo Rosa, Otávio Carneiro, Rafael Tassinari, Yuri Caires, Lucas Santos, Stevan

Bordignon, Gustavo Martins, Luís Felipe Ferrão e Tomaz Andrade pela parceria e amizade,

7

e à D. Elza e à D. Mônica, por cuidarem de nós. E a todos os amigos que fiz em Piracicaba-SP,

por terem tornado minha permanência na cidade ainda mais agradável; desculpem-me por não

me arriscar a citá-los aqui, sob o prejuízo de esquecer alguém...

Finalmente, agradeço imensamente ao Dr. Paulo Augusto Vianna Barroso e à Dra. Lucia

Vieira Hoffmann, ambos da Embrapa Algodão, Goiânia-GO, e à Profa. Dra. Maria Lucia Car-

neiro Vieira, da ESALQ, pela amizade, conselhos e estímulos à carreira científica. Obrigado

aos meus pais, Geraldo e Maristela, e aos meus irmãos, Gustavo e Júnior, e demais familiares e

amigos de Campina Grande-PB ou espalhados pelo Brasil, pelo apoio e incentivo aos estudos e

pela compreensão devida às ausências.

8

9

SUMÁRIO

RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 MATERIAL E MÉTODOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.1 Materiais Vegetais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.1.1 Sorgo sacarino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.1.2 Cana-de-açúcar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.2 Análise Fenotípica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.2.1 Sorgo sacarino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.2.2 Cana-de-açúcar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.2.3 Correlações genotípicas e herdabilidades . . . . . . . . . . . . . . . . . . . . . . 27

2.3 Análise Genotípica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.3.1 Sorgo sacarino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.3.2 Cana-de-açúcar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.3.2.1 Marcadores baseados em GBS . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.3.2.2 Marcadores baseados em géis . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.3.2.3 Construção de mapa genético . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.4 Mapeamento de QTLs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3 RESULTADOS E DISCUSSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.1 Sorgo Sacarino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.1.1 Análise fenotípica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.1.2 Análise genotípica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.1.3 Mapeamento de QTLs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.2 Cana-de-Açúcar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.2.1 Análise fenotípica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.2.2 Análise genotípica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.2.2.1 Estratégias de descoberta de polimorfismos utilizando GBS . . . . . . . . . . . 48

3.2.2.2 Estimação de ploidia e dosagem alélica . . . . . . . . . . . . . . . . . . . . . 49

3.2.2.3 Marcadores baseados em géis . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3.2.2.4 Mapa genético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.2.3 Mapeamento de QTLs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

10

3.3 Mapeamento Comparativo de QTLs . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4 CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

APÊNDICES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

11

RESUMO

Mapeamento comparativo de QTLs entre sorgo sacarino e cana-de-açúcar paracaracteres bioenergéticos

Sorgo sacarino e cana-de-açúcar são duas importantes gramíneas com fins potencial-mente bioenergéticos. No entanto, apesar do conhecido relacionamento evolutivo, os genomasdessas espécies diferem em complexidade e tamanho. O sorgo, Sorghum bicolor, é diploide,com número básico de cromossomos igual a dez, os quais totalizam ∼726 Mb já sequenciadas.Já a cana cultivada, Saccharum × officinarum, é um autopoliploide com frequente aneuploidia,e apresenta genoma monoploide estimado em ∼1 Gb. Provavelmente, decorre deste fato, e doscruzamentos interespecíficos que originaram as variedades atuais, a relativa dificuldade em serealizar estudos genéticos em cana, e, como consequência, em se incrementar os trabalhos demelhoramento na espécie. Nesse contexto, a possibilidade de integrar estudos de mapeamentoentre sorgo e cana torna-se viável dado o emprego de metodologias apropriadas. O presentetrabalho objetivou mapear e comparar QTLs para caracteres agro-industriais nos genomas deambas as espécies, baseando-se no relacionamento evolutivo existente entre elas. Para tanto,foram utilizadas duas populações de mapeamento. A população de sorgo sacarino foi consti-tuída por 223 RILs genotipadas por mais de cem mil marcadores baseados em GBS fisicamentemapeados contra o genoma da espécie. A população de cana-de-açúcar constituiu-se de umaprogênie F1 segregante com 153 indivíduos genotipados por 500 marcadores baseados em géis(SSR e TRAP) e 7.049 marcadores baseados em GBS, segregando em dose única. Esses mar-cadores possibilitaram a construção de um mapa genético informativo e saturado, com 993marcadores distribuídos ao longo de 223 grupos de ligação, totalizando 3.682,05 cM. Ambas aspopulações foram avaliadas para quatro caracteres de interesse bioenergético: altura de colmos,toneladas de colmos ou de massa verde por hectare, e porcentagens de pol de caldo e de fibra.Modelos mistos foram utilizados para a análise dos dados fenotípicos, evidenciando a existênciade interação genótipo-ambiente a partir da estruturação de matrizes de variâncias-covariânciasgenéticas. As médias ajustadas conjunta e marginalmente foram utilizadas na descoberta deQTLs. Para este fim, modelos de mapeamento de múltiplos intervalos uni- e multivariadosforam utilizados e determinaram a descoberta de 53 e 36 regiões contendo QTLs para as po-pulações de sorgo e cana, respectivamente, para o conjunto dos quatro caracteres. Os genomasforam comparados utilizando os marcadores baseados em GBS de cana com informação posi-cional em relação ao genoma do sorgo. Um total de 16 regiões sintênicas identificadas entreas espécies possibilitaram inferências a respeito do controle evolutivamente conservado doscaracteres relacionados. Mais oito regiões foram adicionadas a estas após análise de marcadoresindividualmente para a população de cana. A descoberta dessas regiões subjacente à variaçãode caracteres bioenergéticos sugere aplicações na clonagem de genes e na seleção assistida pormarcadores, beneficiando os programas de melhoramento de ambas as espécies.

Palavras-chave: Sorghum bicolor; Saccharum × officinarum; Mapeamento de múltiplos QTLs;Análise de ligação; Sintenia

12

13

ABSTRACT

Comparative QTL mapping between sweet sorghum and sugarcane for bioenergy traits

Sweet sorghum and sugarcane are two important grasses for bioenergy purposes. Howe-ver, despite their known evolutionary relationship, the genomes of these species differ in com-plexity and size. Sorghum bicolor is a diploid species, with basic chromosome number of tenand ∼726 Mb completely sequenced, whereas Saccharum × officinarum has a autopolyploidgenome with frequent aneuploidy and monoploid size estimated at ∼1 Gb. Therefore, geneticstudies and breeding in sugarcane is challenging. In this context, the possibility of integratingmapping studies between sorghum and sugarcane becomes feasible given the recent develop-ment of appropriate methodologies. In this work, we aimed to map and compare QTLs forbioenergy traits in both species. To do this, two mapping populations were used. The populationof sorghum consisted of 223 RILs genotyped by more than one hundred thousand GBS-basedmarkers, which were physically mapped against the species genome. The population of sugar-cane is an F1 segregating progeny with 153 individuals genotyped by 500 gel-based (SSR andTRAP) and 7,049 GBS-based single-dose markers. These markers allowed the constructionof an informative and dense genetic map with 993 markers belonging to 223 linkage groupsand spanning 3,682.05 cM. Both populations were evaluated for four bioenergy traits: stalkheight, prodution in tons per hectare, and percentages of pol and fiber. Mixed models were usedto analyze phenotypic data and showed genotype-by-environment interaction on their geneticvariance-covariance structures. Joint and marginal adjusted means were used for QTL disco-very. Toward this end, univariate and multivariate multiple interval mapping models were used,and a total of 53 and 36 QTLs were found for sorghum and sugarcane, respectively. Comparisonof the genomes were based on GBS markers in sugarcane with relative sorghum chromosomeinformation. A total of 16 syntenic regions were identified between the species, allowing in-ferences in relation to evolutionary conserved control of the related traits. In addition, eightregions were also identified by considering single marker analyses. The discovery of QTLsunderlying such bioenergy traits may suggest further applications in gene cloning and markerassisted selection for both sweet sorghum and sugarcane species.

Keywords: Sorghum bicolor; Saccharum × officinarum; Multiple QTL mapping; Linkageanalysis; Synteny

14

15

1 INTRODUÇÃO

Sorgo sacarino e cana-de-açúcar são duas importantes matérias-prima de bioetanol,

energia verde do século XXI. O desenvolvimento de veículos flex (os quais podem utilizar tanto

etanol quanto gasolina como combustível) e as mudanças climáticas causadas pelo efeito estufa,

por exemplo, garantem a expansão da demanda mundial pelo álcool (AMORIM et al., 2011).

Considerando essa crescente demanda, há exigência de aumento na produção por unidade de

área e no teor de sacarose do caldo da cana-de-açúcar, cultura mais bem estabelecida nesse

cenário. Alternativamente, tem-se buscado implementar a expansão de outras culturas bio-

energéticas, como o sorgo sacarino. Ainda, quantidades superiores de fibra nas duas espécies

podem ser potencialmente destinadas à geração de etanol de segunda geração. Nesse contexto, o

melhoramento de plantas tem um importante papel no sentido de aumentar a produção e permitir

a expansão dessas culturas, por realizar seleção de genótipos que apresentem as características

agronômicas e industriais requeridas. O entendimento da genética dos caracteres de herança

poligênica, como são a maioria dos caracteres agro-industriais, é parte fundamental do processo

de melhoramento.

Dentre os cereais mais cultivados no mundo, o sorgo fica atrás apenas de trigo, arroz,

milho e cevada. De acordo com a Food and Agricultural Organization of the United States

(FAO), 42 milhões de hectares foram destinados para a produção de sorgo em todo o mundo,

tendo-se produzido mais de 61 milhões de toneladas em 2013; nesse ano, o Brasil produziu

cerca de dois milhões de toneladas em mais de 770 mil hectares plantados (FAO, 2014). A cana-

de-açúcar, por sua vez, está entre as mais importantes espécies tropicais cultivadas, sendo fonte

de sacarose e de vários subprodutos oriundos do processamento de seu caldo e bagaço, como

etanol e celulose. Em todo o mundo, foram destinados 24 milhões de hectares para o plantio

de cana, tendo-se colhido mais de 1,7 bilhão de toneladas em 2013; o Brasil é o maior produtor

mundial, tendo produzido 739 milhões de toneladas em 9,8 milhões de hectares plantados na

safra 2012/2013 (FAO, 2014).

O sorgo, Sorghum bicolor (L.) Moench, é uma gramínea autógama de genoma pequeno

(∼726 mega bases – Mb) e diploide (x = 10, 2n = 2x = 20). Essa espécie é caracterizada

pela elevada resistência a estresses abióticos (como o hídrico e o salino), e por possuir o me-

tabolismo C4 de fixação de carbono, sendo bastante eficiente no acúmulo de biomassa. Dentre

os sorgos cultivados, variedades foram selecionadas não apenas para produção de grãos (sorgo

granífero), mas também para produção de fibra (sorgo biomassa), forragem (sorgo forrageiro)

16

e açúcar (sorgo sacarino). O último tipo é caracterizado por genótipos que produzem colmos

de estatura elevada que acumulam açúcares (principalmente sacarose). No Brasil, o cultivo

de sorgo sacarino tem sido considerado como interessante complemento à cultura da cana-de-

açúcar no período de renovação do canavial. Em diversos aspectos, sorgo sacarino demonstra-se

vantajoso em termos operacionais quando comparado à cana-de-açúcar. Por exemplo, o cultivo

é realizado a partir de sementes, o ciclo vegetativo é relativamente curto (∼4 meses), há geração

de grãos para alimentação animal, é eficiente no uso do nitrogênio, e apresenta boa resistência

hídrica e boa adaptabilidade a solos com salinidade acima do normal (ZEGADA-LIZARAZU;

MONTI, 2012). Além disso, o processo de obtenção do etanol de primeira e segunda gerações

a partir sorgo sacarino é semelhante ao da cana, e o bagaço também pode ser aproveitado como

fonte de energia para as caldeiras no processo de produção.

Saccharum × officinarum designa cientificamente a cana-de-açúcar autopoliploide cul-

tivada (CHEAVEGATTI-GIANOTTO et al., 2011), com tamanho de genoma monoploide es-

timado em ∼1 Gb (SOUZA et al., 2011). Basicamente, duas espécies do gênero Saccharum

constituem os genomas das cultivares atuais: a “cana-nobre” S. officinarum L. (x = 10,

2n = 8x = 80) de colmos grossos e suculentos, com alto conteúdo de sacarose e boas

características gerais para industrialização, e a cana selvagem S. spontaneum L. (x = 8,

2n = 5-16x = 40-128), com elevada adaptabilidade a diversas condições ambientais (GRIVET;

ARRUDA, 2002). Por serem alógamas e sexualmente compatíveis, os primeiros trabalhos

de melhoramento da cana envolveram cruzamentos entre essas duas espécies, seguidos de

retrocruzamentos com S. officinarum, caracterizando a nobilização (MATSUOKA; GARCIA;

ARIZONO, 2005). Em decorrência desse processo, os materiais atuais apresentam um signi-

ficativo acréscimo de complexidade genômica em relação às espécies originais, resultando em

um genoma caracterizado pelo elevado grau de ploidia com frequente aneuploidia (D’HONT

et al., 1998; GRIVET; ARRUDA, 2002). Essa peculiaridade tem sido apontada como desa-

fiadora, pois dificulta os estudos genéticos e a aplicação de metodologias mais modernas no

melhoramento da espécie.

Sorgo sacarino tem sido geneticamente estudado a partir do uso de marcadores mo-

leculares que visaram, por exemplo, acessar diversidade (ALI et al., 2007; RITTER et al.,

2007), a qual tem se mostrado razoavelmente útil do ponto de vista do melhoramento. Além

disso, marcadores possibilitaram a construção de mapas genéticos e o mapeamento de locos

de caracteres quantitativos (do inglês, quantitative trait loci – QTLs) (RITTER et al., 2008;

17

SHIRINGANI; FRISCH; FRIEDT, 2010; SHIRINGANI; FRIEDT, 2011; GUAN et al., 2011),

assim como a realização de mapeamento associativo (MURRAY et al., 2009). Estudos genéticos

para a cana também têm sido desenvolvidos visando, sobretudo, reduzir o tempo de seleção de

cultivares. Corroborados pelo histórico do melhoramento, estudos citogenéticos revelaram que

a composição do genoma das cultivares comerciais de cana modernas é 70-80% de S. offici-

narum, 10-20% de S. spontaneum e 5-17% de cromossomos recombinantes (D’HONT et al.,

1998; GRIVET; ARRUDA, 2002). Ferramentas moleculares e modelos genético-estatísticos

capazes de acessar tamanha complexidade têm sido buscados. Aqui, pode ser citado o uso de

marcadores moleculares em estudos de diversidade (LIMA et al., 2002), construção de mapas

genéticos (GARCIA et al., 2006), mapeamento de QTLs baseado em mapas de ligação (PINTO

et al., 2009; PASTINA et al., 2012), e mapeamento associativo (RABOIN et al., 2006).

De fato, uma das grandes aplicações dos marcadores moleculares é na construção de

mapas genéticos. Isto porque populações segregantes podem ser genotipadas para inúmeros

locos e ter o genoma mapeado com base no desequilíbrio de ligação exibido entre esses mar-

cadores. De modo geral, a natureza da espécie a ser investigada é que determina os tipos

de população e de marcadores a serem utilizados no estudo. Plantas que formam linhagens

por sucessivas autofecundações, fixando um alelo para cada loco podem constituir populações

convencionais de mapeamento, quais sejam: retrocruzamentos, populações F2 e linhagens en-

dogâmicas recombinantes (do inglês, recombinant inbred lines – RILs); este é o caso do sorgo.

No entanto, para muitas espécies é difícil ou impossível a obtenção de linhagens homozigóti-

cas, e as análises de mapeamento são realizadas em populações F1 segregantes, derivadas do

cruzamento de genitores não-endogâmicos; isto se observa para cana-de-açúcar, por exemplo.

Evidentemente, espécies muito conhecidas do ponto de vista genético, como o sorgo, dispõem

de diversas metodologias para acessar o polimorfismo a nível de DNA e podem, inclusive,

possuir o genoma sequenciado, possibilitando o mapeamento físico dos marcadores. Por outro

lado, a dificuldade na obtenção e na análise dos dados moleculares de espécies de genomas

maiores e mais complexos, como é o caso da cana-de-açúcar, pode caracterizar desafios em

estudos dessa natureza, nos quais a densidade de marcadores é fundamental.

O genoma do sorgo encontra-se completamente sequenciado (PATERSON et al., 2009),

fazendo da espécie um modelo atrativo para genômica funcional de gramíneas C4. Por isso, in-

clusive, o sorgo tem se beneficiado amplamente de plataformas de sequenciamento da próxima

geração (do inglês, next generation sequencing – NGS) visando a descoberta e genotipagem

18

de polimorfismos de base única (do inglês, single nucleotide polymorphisms – SNPs) e de

polimorfismos baseados em inserção-deleção (indels). A metodologia de genotipagem por

sequenciamento (do inglês, genotyping-by-sequencing – GBS) tem colaborado com estudos

na espécie (MURRAY et al., 2009; MORRIS et al., 2013). Já para cana, iniciativas recentes

estão buscando sequenciar o genoma (SOUZA et al., 2011), o qual já dispõe de grande número

de etiquetas de sequências expressas (do inglês, expressed sequence tags – ESTs) do projeto

SUCEST (VETTORE et al., 2003), a partir das quais se derivaram importantes marcadores para

os trabalhos de mapeamento da espécie. Recentemente, a genotipagem de SNPs em espécies

de genoma complexo, como a cana, tem possibilitado estudos genéticos ainda mais avançados

(MOLLINARI, 2012). Porém, em detrimento da genotipagem de SNPs utilizando NGS, o uso

dessa tecnologia tem-se limitado a alguns importantes projetos adicionais de sequenciamento

em cana, como o do seu transcriptoma (CARDOSO-SILVA et al., 2014) e do seu genoma metil-

filtrado (GRATIVOL et al., 2014).

Mapas genéticos prestam-se a diversos tipos de aplicações, com destaques para o em-

prego em estudos evolutivos e de sintenia, no mapeamento de QTLs, dando suporte para clona-

gem posicional de genes e seleção assistida por marcadores, como foi observado em exemplos

anteriores. Ainda, mesmo no contexto dos inúmeros projetos existentes para sequenciamento

de genomas, os mapas têm sido frequentemente requeridos, pois servem como arcabouço para

ancoragem de mapas físicos e montagem e revisão de genomas (HAHN; ZHANG; MOYLE,

2014; BARTHOLOME et al., 2014; DEOKAR et al., 2014). Mapear QTLs, especificamente,

significa caracterizá-los quanto a número, posição e efeitos a partir da inferência em todo o

genoma sobre as relações entre o genótipo e o fenótipo de caracteres quantitativos. No contexto

do melhoramento de plantas, além de possibilitar conhecimento sobre interação entre QTLs

e dos QTLs com o ambiente, o mapeamento de QTLs constitui um importante passo para a

caracterização da arquitetura genética de locos responsáveis por caracteres com padrão contínuo

de variação fenotípica, como são a maioria dos caracteres de importância agronômica.

Para tanto, além de marcadores moleculares, as adequadas experimentação em campo

e análise dos dados fenotípicos são mandatórias. Modelos mistos, que utilizam metodologia

de estimação baseada em máxima verossimilhança restrita (do inglês, restricted maximum like-

lihood – REML), têm sido empregados nesse cenário por proporcionar apropriada representação

das complexas estruturas de variância-covariâncias (VCOV) originadas dos padrões de corre-

lação entre ambientes. Importante no cenário do melhoramento de plantas, essa abordagem

19

proporciona, em última análise, um melhor entendimento do fenômeno da interação genótipo-

ambiente (MALOSETTI; RIBAUT; VAN EEUWIJK, 2013), por exemplo.

Em sorgo sacarino, diversos estudos têm buscado locos responsáveis por caracteres

bioenergéticos, como aqueles relacionados a teor de açúcar (RITTER et al., 2008; SHIRIN-

GANI; FRISCH; FRIEDT, 2010; GUAN et al., 2011) e a qualidade de fibra (SHIRINGANI;

FRIEDT, 2011). Nesses trabalhos, foram utilizadas populações experimentais derivadas de

cruzamentos entre sorgo granífero e sorgo sacarino. Marcadores baseados em microssatélites

ou sequências simples repetidas (do inglês, simple sequence repeats – SSRs), e na identificação

de polimorfismos de tamanho de fragmentos amplificados (do inglês, amplified fragment length

polymorphisms – AFLPs) e de SNPs foram tipicamente utilizados na construção dos mapas.

Essas populações estabeleceram importantes passos para a descoberta de QTLs, dado o emprego

de diversas metodologias genético-estatísticas, como análise de marcas individualmente (do

inglês, single marker analysis – SMA), mapeamento por intervalo (do inglês, interval mapping

– IM), e mapeamento por intervalo composto (do inglês, composite interval mapping – CIM).

Mapeamento associativo para brix e altura também já foi realizado para painel de 125 indivíduos

(maioria sacarino) (MURRAY et al., 2009). Desafortunadamente, modelos de mapeamento de

múltiplos intervalos (do inglês, multiple interval mapping – MIM) ainda não foram relatados

para sorgo sacarino, desprezando o potencial aumento na precisão e no poder de detecção dos

QTLs (SILVA; ZENG, 2010).

Para cana-de-açúcar, apesar dos problemas mencionados anteriormente em relação à sua

genética, tem-se obtido conspícuo progresso em termos de obtenção de marcadores, construção

de mapas genéticos e análise de QTLs. Brevemente, os marcadores comumente utilizados

baseavam-se na identificação de polimorfismos de tamanho de fragmento de restrição (do inglês,

restriction fragment length polymorphisms – RFLPs), AFLPs e SSRs. Os primeiros mapas de

cana foram elaborados segundo metodologia conhecida como duplo pseudocruzamento-teste

(GRATTAPAGLIA; SEDEROFF, 1994), e modelos de SMA e IM também foram empregados

para o mapeamento de caracteres agronômicos e de resistência a doenças nos mapas resultantes

para cada um dos genitores, separadamente, como em diversos exemplos revisados por Pastina

et al. (2010). Atualmente, metodologias para construção de mapas integrados (WU et al.,

2002a, 2002b) e modelos de CIM e de MIM estão disponíveis para populações F1 segregantes

com exemplos de aplicação em cana (GARCIA et al., 2006; PASTINA et al., 2012; GAZAFFI

et al., 2014). Além disso, técnica de genotipagem quantitativa de SNPs para poliploides comple-

20

xos foi estabelecida com ênfase em cana (GARCIA et al., 2013), e mostram-se promissoras na

construção de mapas genéticos integrados (MOLLINARI, 2012), agora, considerando dosagem

alélica dos marcadores (SERANG; MOLLINARI; GARCIA, 2012).

Para este fim, Garcia et al. (2013) analisaram SNPs obtidos utilizando moderna tecnolo-

gia baseada em espectrometria de massa (Sequenom iPLEXTM MassARRAY R©) (OETH et al.,

2006), capaz de informar sobre as proporções relativas entre os alelos. Na ausência de artefatos

técnicos criando vieses para um ou ambos os alelos, a razão entre as quantificações de cada alelo

informa sobre a ploidia do loco e a dose de cada alelo em um indivíduo. A análise consistiu

na estimação da ploidia e classificação dos indivíduos nos clusters esperados dada a ploidia

utilizando um modelo gráfico Bayesiano implementado em um software livre denominado

SuperMASSA (SERANG; MOLLINARI; GARCIA, 2012; MOLLINARI; SERANG, 2015).

Esta metodologia leva em conta as frequências esperadas de classes genotípicas considerando

modelo de Equilíbrio de Hardy-Weinberg para paineis de diversidade ou, alternativamente,

modelo de segregação para progênies de irmãos-completos. Uma avaliação de 987 e 249

marcadores SNP para um painel de diversidade e para uma população de mapeamento de cana-

de-açúcar, respectivamente, revelou que os níveis de ploidia variavam de loco para loco, mais

provavelmente, entre 6 e 14. Adicionalmente, para os marcadores da população biparental,

apenas cerca de 30% do total de marcadores estariam segregando em dose única (GARCIA et

al., 2013).

Estudos genômicos comparativos, por sua vez, só são possíveis devido à existência de re-

giões genômicas (eventualmente genes) que se mantiveram relativamente estáveis em conteúdo

de nucleotídeos ao longo dos tempos evolutivos, proporcionando uma base útil para inferir a cor-

respondência inclusive entre genomas distantemente relacionados, assim como entre genes que

divergiram bastante ou foram realocados (TANG et al., 2008). Por isso, sucesso tem sido obtido

nos estudos de genomas de plantas pertencentes à mesma família. No entanto, o nível em que

os genes nos cromossomos correspondem em conteúdo (sintenia) e em ordem (colinearidade)

difere marcadamente entre os táxons, devido à retenção diferencial de genes ou famílias gênicas,

às duplicações de sequências repetitivas e à mobilidade causada pelos elementos transponíveis

(TANG et al., 2008). Sabidamente, a determinação dos graus de sintenia e colinearidade entre

as espécies relacionadas de plantas modelos e cultivadas é valiosa na aplicação da informação

genômica no melhoramento de culturas (RAHMAN; PATERSON, 2010).

A genômica comparativa tornou-se um campo promissor de pesquisa dados os projetos

21

genomas finalizados ou em desenvolvimento no sentido de proporcionar respostas requeridas

sobre organização e evolução dos genomas de espécies de interesse. Além disso, há grandes

chances de se transferir e integrar informações sobre localização e ação de genes interespecifi-

camente (SORRELS, 2006). Antes da era genômica, essas comparações também eram possíveis

graças a existência de marcadores compartilhados entre os mapas de ligação das espécies estu-

dadas. Hoje em dia, a disponibilidade de ambos (mapas e sequências) torna possível estudos

mais detalhados. A partir daí, inúmeros estudos ajudaram a elucidar o elevado grau de sintenia

entre genomas de gramíneas, por exemplo, e forneceram insights sobre as contribuições de

transposons, duplicação de genes, e de sequências não codificadoras conservadas ao longo da

evolução do genoma de plantas (BENNETZEN; FREELING, 1997).

No caso do sorgo e da cana-de-açúcar, comparação entre mapas genéticos baseados

em RFLPs revelaram um elevado nível de sintenia (GRIVET et al., 1994; DUFOUR et al.,

1997; GUIMARÃES; SILLS; SOBRAL, 1997; MING et al., 1998). Além disso, com base no

nível de sintenia existente entre as gramíneas, já foi possível identificar genes evolutivamente

conservados associados ao controle de conteúdo de açúcar (SINGH et al., 2011) e de resistência

à ferrugem (LE CUNFF et al., 2008) em cana-de-açúcar, por exemplo. Adicionalmente, Ming et

al. (2002) alinhou grupos de ligação de duas diferentes populações de cana com mapa de sorgo

para auxiliar na avaliação de QTLs afetando caracteres relacionados a açúcar mapeados na

espécie. Usando essa abordagem, 62 QTLs de cana para esses caracteres puderam ser inferidos

em nove cromossomos de sorgo.

Como foi visto, o sorgo tornou-se uma espécie modelo para análises genômicas funcio-

nais e estruturais em gramíneas (CALVIÑO; MESSING, 2012), por ser uma espécie diploide de

genoma relativamente pequeno e de elevada endogamia, e por ser geneticamente mais próximo

da cana-de-açúcar e do milho, espécies das quais divergiu recentemente, a cerca de 8–9 milhões

de anos (JANNOO et al., 2007). Por outro lado, as cultivares modernas de cana-de-açúcar

são derivadas de cruzamentos entre duas espécies de Saccharum, seguidos de alguns ciclos de

retrocruzamentos e seleção, e caracterizam-se por serem alógamas com genoma autopoliploide

frequentemente aneuploide (D’HONT et al., 1998). No entanto, apesar da relativa dificuldade

em se trabalhar com a genética da espécie, esforços têm se acumulado no sentido de mapear seu

genoma por meio de marcadores, e utilizar esses mapas na descoberta de locos que controlem

caracteres quantitativos.

O mapeamento comparativo entre sorgo sacarino e cana-de-açúcar tornou-se uma ferra-

22

menta atrativa pois as espécies pertencem à mesma família botânica (Andropogoneae), possuem

similaridade de caracteres fenotípicos avaliados, e dispõem de recursos genômicos suficientes

(genoma ou marcadores moleculares baseados em sequências). Caracteres agronômicos, tais

como altura e produção de biomassa, e industriais, como os caracteres relacionados ao conteúdo

de açúcar e fibra, são de grande interesse dos melhoristas de ambas as espécies. Para tanto,

mapeamento de QTLs nessas espécies com base em marcadores que forneçam ampla cobertura

dos genomas e em metodologias genético-estatísticas adequadas torna-se requerimento indis-

pensável em estudos dessa natureza.

Nesse sentido, o presente trabalho objetivou mapear QTLs em duas populações – uma

de sorgo sacarino e outra de cana-de-açúcar – e compará-los com base nas correlações entre

os genomas dessas espécies. Para tanto, fenótipos de interesse bioenergético foram avaliados

em campo e marcadores moleculares baseados em GBS, principalmente, foram genotipados

em ambas as populações. Aqui, buscou-se também estabelecer estratégias de análise dos dados

fenotípicos e moleculares para as duas espécies a partir da utilização de adequadas ferramentas e

metodologias de genética-estatística e bioinformática da atualidade. Até onde é conhecido, este

é o único estudo desta natureza envolvendo sorgo sacarino. Além disso, procurou-se utilizar

germoplasma adaptado às condições do Brasil, para as duas espécies.

23

2 MATERIAL E MÉTODOS

2.1 Materiais Vegetais

2.1.1 Sorgo sacarino

A população experimental de RILs de sorgo sacarino originou-se do cruzamento entre

as cultivares ‘BR501-Brandes’ (genitor feminino) e ‘BR505-Wray’ (genitor masculino) e é

formada por 272 indivíduos obtidos pelo método descendente de única semente (do inglês,

single seed descent – SSD). Genitores e população fazem parte do programa de melhoramento

da Embrapa Milho e Sorgo, Sete Lagoas, Estado de Minas Gerais. Os genitores são bastante

constrastantes, principalmente para caracteres relativos a conteúdo de açúcar, e se referem a

germoplasma adaptado às condições do Brasil.

2.1.2 Cana-de-açúcar

A população F1 segregante de cana-de-açúcar foi obtida a partir do cruzamento entre as

variedades ‘SP80-3280’ (genitor feminino) e ‘RB835486’ (genitor masculino) e é constituída

por 153 indivíduos. Genitores e população fazem parte do programa de melhoramento de cana-

de-açúcar da Universidade Federal de São Carlos (UFSCar), Araras, Estado de São Paulo, que

participa da Rede Interinstitucional de Desenvolvimento do Setor Sucroalcooleiro (RIDESA).

Os genitores são variedades amplamente cultivadas no país por serem bastante produtivas.

‘SP80-3280’ (‘SP71-1088’ × ‘H57-5028’) foi umas das variedades sequenciadas por projetos

de sequenciamento de transcriptoma da cana (VETTORE et al., 2003; CARDOSO-SILVA et al.,

2014) e tem tido todo o genoma sequenciado pela iniciativa brasileira (SOUZA et al., 2011).

Essa variedade apresenta resistência ao carvão (Ustilago scitaminea) e à ferrugem marrom

(Puccinia melanocephala), enquanto ‘RB835486’ (‘L60-14’ × ?) é suscetível a essas duas

doenças fúngicas.

2.2 Análise Fenotípica

Para ambas as espécies, diversos caracteres fenotípicos foram avaliados conforme Ma-

nual de Instruções do Conselho dos Produtores de Cana-de-Açúcar, Açúcar e Álcool do Estado

de São Paulo (CONSECANA-SP, 2006). Neste trabalho, quatro caracteres foram considerados:

altura média de colmos (ALT, em m), produção de massa verde (PMV, em ton · ha−1) para sorgo

ou toneladas de colmos por hectare (TCH, em ton · ha−1) para cana, quantidade de sacarose ou

24

pol do caldo (POL, em %) e conteúdo de fibra (FIB, em %). A variável PMV difere da variável

TCH por levar em consideração o peso dos colmos e das folhas, enquanto TCH só se refere

ao peso dos colmos. Modelos fenotípicos lineares de efeitos mistos, descritos a seguir, foram

utilizados na obtenção dos componentes de variância e das médias ajustadas, servindo como

base para os cálculos de herdabilidades e de correlações genotípicas e para o mapeamento de

QTLs.

2.2.1 Sorgo sacarino

Os experimentos de campo da população de mapeamento de sorgo sacarino foram con-

duzidos no município de Sete Lagoas, Estado de Minas Gerais, em área pertencente à Embrapa

Milho e Sorgo, por três anos agrícolas consecutivos (2011, 2012 e 2013). O delineamento

experimental foi estabelecido no esquema de látices quadrados 15 × 15, repetidos três vezes,

com cada repetição totalizando 223 indivíduos da população mais os dois genitores. As parcelas

foram compostas por duas linhas de 5 m de comprimento, espaçadas em 0,70 m.

As análises dos caracteres fenotípicos para os múltiplos anos de avaliação foram reali-

zadas no software GenStat (v. 16.1) (VSN INTERNATIONAL, 2014) via REML considerando

o seguinte modelo misto:

yi jkm = µ + am + rk(m) + b j(km) + tim + εi jkm (1)

em que yi jkm é a observação do indivíduo i no bloco j, repetição k e ano m; µ é a média geral

fixa; am é o efeito fixo do m-ésimo ano (m = 1, . . . ,M; M = 3); rk(m) é o efeito fixo da k-

ésima repetição (k = 1, . . . ,K; K = 3) no ano m; b j(km) é o efeito aleatório do j-ésimo bloco

( j = 1, . . . , J; J = 15) na repetição k e ano m; tim é o efeito ora fixo ora aleatório do i-ésimo

tratamento (i = 1, . . . , I; I = 225) no ano m; e εi jkm é o erro aleatório. O termo tim foi separado

em dois grupos, sendo gim o efeito aleatório dos genótipos da população (i = 1, . . . , Ig; Ig =

223), e cim o efeito fixo dos genitores da população (i = Ig + 1, . . . , Ig + Ic; Ic = 2). Para

genótipos da população, foi assumido que o vetor g = (g11, . . . , gIgM)′ tem uma distribuição

normal multivariada com vetor de médias zero e matriz de variâncias-covariâncias (VCOV)

genética G = GM ⊗ IIg , i.e. g ∼ N(0,G), em que GM = GAM×M é a matriz de VCOV para o

fator de agrupamento sobrescrito anos (A) de dimensões M × M, ⊗ representa o produto direto

de Kronecker, e IIg é uma matriz identidade de dimensões Ig × Ig. Para resíduos, foi assumido

25

ε ∼ N(0,R), em que ε = (ε1111, . . . , εIJKM)′ e R = RM ⊗ RK ⊗ II·J é a matriz de VCOV residual,

sendo RM = RAM×M a matriz de VCOV residual para anos (A) e RK = RR

K×K a matriz de VCOV

residual para repetições (R).

As matrizes GM, RM e RK foram examinadas para diferentes estruturas de interesse

biológico e estatístico, e os modelos foram comparados utilizando os critérios de informação

de Akaike (do inglês, Akaike information criterion – AIC) (AKAIKE, 1974) e Bayesiano (do

inglês, Bayesian information criterion – BIC) (SCHWARZ, 1978), conforme realizado por

Pastina et al. (2012). A estratégia adotada para a definição das matrizes foi a de, inicialmente,

selecionar a matriz GM, e, em seguida, selecionar as matrizes RM e RK , nesta ordem. Estruturas

de VCOV genéticas consideraram, para diferentes anos, variâncias genéticas homogêneas e

covariâncias nulas (identidade – ID) ou não-nulas e iguais (uniforme – UNIF), ou variâncias

genéticas heterogêneas com covariâncias nulas (diagonal – DIAG) ou não-nulas e diferentes

(auto-regressiva de 1a ordem – AR1; simétrica composta heterogênea – CSHet; não-estruturada

– UNST). As matrizes AR1, CSHet e UNST diferem em complexidade e estimabilidade, por

conterem certas restrições que exigem a estimação de mais ou menos parâmetros (Tabela 1).

Também, estruturas de VCOV residuais foram selecionadas com o objetivo de permitir even-

tuais heteroscedasticidade e dependência entre as observações para os fatores de agrupamentos

anos e repetições, próprios do delineamento experimental utilizado.

Tabela 1 – Descrição e número de parâmetros (nPAR) dos modelos examinados para as matrizes devariância-covariância genética GM na análise fenotípica de população de mapeamentode sorgo sacarino

Matrizes nPAR Descrição

GM = GAM×M

ID 1 Matriz identidade (ou de variância genética homogênea)UNIF 2 Matriz uniformeDIAG M Matriz diagonal (ou de variância genética heterogênea)AR1 M+1

2 Matriz auto-regressiva de 1a ordemCSHet M + 1 Matriz simétrica composta com variância genética heterogêneaUNST M(M+1)

2 Matriz não-estruturadaNota: GM considerou diferentes estruturas para os efeitos genéticos dentro de M anos (A)

Finalmente, após ajuste dos modelos de VCOV da parte aleatória do modelo para cada

caráter, o efeito fixo de interação entre anos e genitores foi testado utilizando a estatística de

Wald e mantido em cada modelo quando estatisticamente significativo (p < 0,05).

26

2.2.2 Cana-de-açúcar

Para cana-de-açúcar, outro modelo foi utilizado pois, além de a população ter sido

plantada em duas localidades, acrescentado mais um fator à análise, a experimentação para

a espécie considera particularidades adicionais. A primeira delas refere-se à tomada de dados

no tempo (cortes), a partir de um primeiro experimento implantado. A segunda particularidade

reside no próprio delineamento, o qual deve ser próprio para experimentos muito grandes, como

este aqui avaliado, em decorrência da utilização de parcelas de tamanhos superiores.

Os experimentos de campo da população de mapeamento de cana-de-açúcar foram

conduzidos nos municípios de Araras e Ipaussu, Estado de São Paulo, por três anos agrícolas

consecutivos (2010, 2011 e 2012), cada ano representando consecutivos cortes (canas planta,

soca e ressoca). O delineamento experimental foi estabelecido nos dois locais no esquema de

blocos aumentados de Federer (FEDERER; RAGHAVARAO, 1975), repetidos três vezes, sendo

cada repetição composta por nove blocos incompletos com 27 indivíduos mais três tratamentos

comuns (os dois genitores e a variedade ‘RB867515’). As parcelas foram compostas por duas

(em Araras) ou três (em Ipaussu) linhas de 3 m de comprimento, espaçadas em 1,5 m. Dentre

os indivíduos avaliados em cada repetição, 90 não pertenciam à população de mapeamento,

por terem sido identificados como contaminantes em análises moleculares com SSRs (dados

não apresentados). Portanto, para fins de ajuste de modelo, eles não foram considerados como

parte do componente aleatório referente a genótipos da população. Além disso, enquanto ALT

e TCH foram avaliados para as três repetições, POL e FIB foram avaliados apenas para duas

delas. Uma última particularidade referiu-se às ausências de avaliações de ALT e TCH no

segundo corte em Araras e de POL e FIB no segundo corte em ambos os locais por conta de

eventuais problemas durante a condução dos experimentos.

As análises dos caracteres fenotípicos para múltiplos locais e cortes de avaliação foram

realizadas no software GenStat (v. 16.1) (VSN INTERNATIONAL, 2014) via REML conside-

rando o seguinte modelo misto:

yi jkmn = µ + ln + am + rk(mn) + b j(kmn) + timn + εi jkmn (2)

em que yi jkmn é a observação do indivíduo i no bloco j, repetição k, corte m e local n; µ é a média

geral fixa; ln é o efeito fixo do n-ésimo local (n = 1; N = 2); am é o efeito fixo do m-ésimo

ano ou corte (m = 1, . . . ,M; M = 2 ou M = 3 dependendo do local); rk(mn) é o efeito fixo da

27

k-ésima repetição (k = 1, . . . ,K; K = 2 ou K = 3 dependendo do caráter) no corte m e local

n; b j(kmn) é o efeito aleatório do j-ésimo bloco ( j = 1, . . . , J; J = 9) na repetição k, corte m

e local n; timn é o efeito ora fixo ora aleatório do i-ésimo indivíduo (i = 1, . . . , I; I = 156) no

corte m e local n; e εi jkmn é o erro aleatório. O termo timn foi separado em dois, sendo gimn o

efeito aleatório dos tratamentos regulares (genótipos da progênie, i = 1, 2, . . . , Ig; Ig = 153), e

cimn o efeito fixo dos tratamentos comuns (testemunhas, i = Ig + 1, . . . , Ig + Ic; Ic = 3). Para

genótipos da progênie, foi assumido que o vetor g = (g111, . . . , gIgMN)′ tem uma distribuição

normal multivariada com vetor de médias zero e matriz de VCOV genética G = GP ⊗ IIg , i.e. g

∼ N(0,G), em que P = M · N, ⊗ representa o produto direto de Kronecker, e IIg é uma matriz

identidade de dimensões Ig × Ig. Várias estruturas de VCOV para GP (Tabela 2) foram exami-

nadas e comparadas via AIC e BIC, conforme realizado por Pastina et al. (2012). Estruturas de

VCOV genéticas usaram uma combinação fatorial de locais e cortes como diferentes ambientes

(E), i.e. GP = GEP×P, ou, alternativamente, o produto direto de matrizes de VCOV genéticas para

locais (L) e cortes (A), i.e. GP = GLN×N ⊗ GA

M×M. Para resíduos, foi assumido ε ∼ N(0,R), em

que ε = (ε11111, . . . , εIJKMN)′ e R = RP⊗RK⊗II·J a matriz de VCOV residual, sendo as matrizes

RP = REP×P (combinação fatorial) ou RP = RL

N×N⊗RAM×M (produto direto) e RK = RR

K×K também

examinadas para diferentes estruturas.

Dado o ajuste dos modelos de VCOV da parte aleatória do modelo para cada caráter, os

efeitos fixos das interações entre locais, anos e tratamentos comuns foram testados utilizando a

estatística de Wald e mantidos nos modelos quando estatisticamente significativos (p < 0,05).

2.2.3 Correlações genotípicas e herdabilidades

Correlações genotípicas foram calculadas como coeficiente de Pearson entre as médias

ajustadas para cada caráter e testadas assumindo nível global de significância de 0,05 utilizando

o pacote do R (R CORE TEAM, 2014) denominado psych (REVELLE, 2014), que também foi

utilizado para desenhar os gráficos de dispersão entre os pares de caracteres.

Para a população de cana-de-açúcar, herdabilidades em sentido amplo a nível de plantas

(H2plantas) foram computadas utilizando as estimativas dos componentes de variância dos modelos

ID para estruturas de VCOV dos efeitos genéticos e residuais por meio da razão σ̂2G/σ̂

2P, em que

σ̂2G é a variância genética e σ̂2

P é a variância fenotípica total para cada caráter. Calculou-se a

razão σ̂2G/σ̂

2P̄ como uma medida aproximada de herdabilidades no sentido amplo ao nível de

médias (H2médias), em que σ̂2

P̄ é a variância fenotípica entre médias genotípicas para cada caráter

28

Tabela 2 – Descrição e número de parâmetros (nPAR) dos modelos examinados para a matriz de variância-covariância genética GP na análise fenotípica de população de mapeamento de cana-de-açúcar

Matriz GP nPAR Descrição

GP = GEP×P

ID 1 Matriz identidade (ou de variância genéticahomogênea)

UNIF 2 Matriz uniformeDIAG P Matriz diagonal (ou de variância genética

heterogênea)CSHet P + 1 Matriz simétrica composta com variância genética

heterogêneaUNST P(P+1)

2 Matriz não-estruturadaGP = GL

N×N ⊗GAM×M

UNST ⊗ ID N(N+1)2 + 1 Matrizes não-estruturada e identidade para locais e

cortes, respectivamenteUNST ⊗ UNIF N(N+1)

2 + 2 Matrizes não-estruturada e uniforme para locais ecortes, respectivamente

UNST ⊗ DIAG N(N+1)2 + M Matrizes não-estruturada e diagonal para locais e

cortes, respectivamenteUNST ⊗ AR1 N(N+1)+2(M+1)

2 − 1 Matrizes não-estruturada e auto-regressiva de 1a

ordem para locais e cortes, respectivamenteUNST ⊗ CSHet

N(N+1)2 + M + 1 Matrizes não-estruturada e simétrica composta para

locais e cortes, respectivamenteUNST ⊗ UNST N(N+1)+M(M+1)

2 − 1 Matrizes não-estruturadas para locais e cortesNota: GP considerou diferentes estruturas para os efeitos genéticos dentro de P = M ·N combinações de local-corte(ambientes, E), ou N locais (L) e M cortes (A)

obtida utilizando-se a média harmônica do número de ambientes como denominador da estima-

tiva de variância da interação genótipo-ambiente, e a média harmônica do número de repetições

em todos os ambientes como denominador da estimativa de variância residual (HOLLAND;

NYQUIST; CERVANTES-MARTÍNEZ, 2003). Para a população de sorgo sacarino, como a

variância genética é exclusivamente aditiva, i.e. σ2G = σ2

A, as herdabilidades em sentido restrito

foram calculadas de maneira semelhante e denominadas, por convenção, como h2plantas e h2

médias.

As estimativas dos componentes de variância para essa população também foram obtidas a partir

de modelos ID para estruturas de VCOV dos efeitos genéticos e residuais.

29

2.3 Análise Genotípica

2.3.1 Sorgo sacarino

O procedimento de genotipagem por sequenciamento (GBS) foi realizado pelo Institute

for Genomic Diversity (Cornell University, Ithaca, NY, EUA) de acordo com o protocolo des-

crito em detalhes por Elshire et al. (2011) em plataforma HiSeqTM 2000 (Illumina R© Inc., San

Diego, CA, EUA). Três bibliotecas, cada uma com 95 indivíduos mais um controle negativo,

foram construídas a partir da digestão de DNA genômico dos indivíduos com a enzima ApeKI,

que reconhece sítio de cinco bases (sendo uma degenerada) e é sensível à metilação. Além do

par de genitores da população presentes uma vez em cada biblioteca, as duas primeiras bibli-

otecas continham 91 indivíduos da população de mapeamento mais dois controles positivos,

e a terceira biblioteca continha os 90 indivíduos da população restantes mais três controles

positivos.

O pipeline Tassel-GBS (GLAUBITZ et al., 2014) implementado no software Tassel (v.

4.3.8) foi utilizado para descoberta de SNPs e indels. Para tanto, tags de GBS de 64 pb foram

alinhadas contra os dez cromossomos do genoma do sorgo (v. 2.1; ∼658 Mb) (PATERSON et

al., 2009). As tags utilizadas no mapeamento deveriam estar presentes, no mínimo, três vezes no

conjunto das três bibliotecas (argumento -c do MergeMultipleTagCountPlugin) do Tassel-

GBS. Chamadas de genótipos foram armazenadas em arquivos do tipo hapmap. Dados perdidos

(incluindo bases degeneradas) foram imputados utilizando o software Npute (ROBERTS et al.,

2007). Neste programa, foram testados tamanhos de janela variando de 5 a 150 pb dentro de

cada cromossomo; aquelas janelas que forneciam maior acurácia foram, então, selecionadas

para imputação. Finalmente, os dados imputados foram filtrados para uma frequência alélica

mínima (do inglês, minor allele frequency – MAF) de 0,40.

2.3.2 Cana-de-açúcar

Dois tipos de marcadores foram utilizados na análise genotípica da população de mape-

amento de cana-de-açúcar. Primeiramente, serão apresentadas as metodologias de obtenção e

análise de marcadores quantitativos baseados em GBS, ou seja, daqueles capazes de caracterizar

dosagem alélica dos locos genotipados, e, depois, de marcadores qualitativos, baseados em géis,

que informam apenas sobre ausência e presença das marcas, impossibilitando a caracterização

de dosagem alélica.

30

2.3.2.1 Marcadores baseados em GBS

O procedimento de GBS para a população de cana foi realizada seguindo os mesmos

procedimentos utilizado para a população de sorgo (ELSHIRE et al., 2011), com modificações

adicionais. Os genitores da população foram repetidos três vezes e constituíram uma primeira

biblioteca. Cinquenta e seis indivíduos da progênie foram sequenciados a partir de uma segunda

biblioteca, e os 95 indivíduos restantes foram sequenciados a partir de uma terceira biblioteca.

Dois indivíduos da população de mapeamento não foram incluídos. Cada indivíduo pertencente

a uma biblioteca fazia parte de uma reação de plex 96 (incluindo um controle negativo, cada).

Visando obter maior contagens de leituras (profundidade), as bibliotecas foram restringidas

pela enzima PstI, que reconhece sítio de seis bases e é parcialmente sensível à metilação.

Adicionalmente, as bibliotecas foram corridas em duas lanes distintas de HiSeqTM 2000.

Foi utilizado o pipeline Tassel-GBS para a descoberta de SNPs e indels. Como este

pipeline requer um genoma de referência e o sequenciamento do genoma de cana ainda não está

finalizado (SOUZA et al., 2011), foram utilizadas as seguintes pseudo-referências: (i) genoma

metil-filtrado da cana-de-açúcar (∼674 Mb arranjadas em 1.109.444 scaffolds) (GRATIVOL et

al., 2014), (ii) genoma do sorgo (v. 2.1; ∼726 Mb arranjadas em 10 cromossomos e 1.600 scaf-

folds restantes) (PATERSON et al., 2009), (iii) transcriptoma via RNA-Seq da cana-de-açúcar

(∼780 Mb arranjadas em 119.768 scaffolds) (CARDOSO-SILVA et al., 2014), e (iv) sequências

do projeto SUCEST (∼152 Mb arranjadas em 237.954 sequências) (VETTORE et al., 2003);

as respectivas abreviações (“mf”, “sb”, “rna” e “est”) foram utilizadas na nomenclatura dos

marcadores, acrescidas da identificação do cromossomo, scaffold ou contig e da posição do

polimorfismo da referência. O algoritmo Bowtie 2 (v. 2.2.1) (LANGMEAD; SALZBERG,

2013) foi usado para mapear as tags de GBS de 64 pb contra cada referência; as tags utilizadas

no mapeamento deveriam estar presentes, no mínimo, cinco vezes no conjunto das seis lanes

(argumento -c do MergeMultipleTagCountPlugin). Contagens exatas das leituras alelo-

específicas (profundidades) foram armazenadas em arquivos do tipo variant call format (VCF).

Para este fim, o tipo de variável Java do DiscoverySNPCallerPlugin do Tassel-GBS foi

modificado de byte para short visando permitir o armazenamento de um valor máximo de

32.767 contagens. Adaptações para lidar com o tipo de variável short foram necessárias para

os plugins subsequentes do pipeline também. As modificações no pipeline do Tassel-GBS

foram desenvolvidas no Laboratório de Bioinformática Aplicada à Bioenergia, da ESALQ, e

gentilmente cedidas pelo Prof. Gabriel R. A. Margarido.

31

Estimação de ploidias e dosagens

O pipeline Tassel-GBS gerou dados (D) de contagens alelo-específicas na forma D =

{(x1, y1), (x2, y2), . . . , (xn, yn)} para cada loco bialélico para os indivíduos i = 1, 2, . . . , n, os

quais puderam ser visualizados em gráficos de dispersão e foram analisados no software Super-

MASSA (SERANG; MOLLINARI; GARCIA, 2012; MOLLINARI; SERANG, 2015). Como

um primeiro critério de controle de qualidade, locos com mais de 25% de dados perdidos foram

excluídos. Adicionalmente, foram eliminados das análises os locos cujas contagens médias de

leituras para o alelo de referência eram inferior a 50. Finalmente, dados individuais com coor-

denadas radiais ri =

√x2

i + y2i menores que 0,10 ·max(r1, r2, . . . , rn) também foram removidos.

Para cada loco, foram testadas todas as ploidias pares variando de 2 a 20, tendo sido

selecionada aquela que retornou a maior verossimilhança (GARCIA et al., 2013). Dados dos

genitores repetidos foram considerados nas análises por fornecerem restrições adicionais du-

rante a estimação. Seguindo a recomendação de Mollinari e Serang (2015) para encontrar a

solução de máxima posteriori (do inglês, maximum a posteriori – MAP) para as estimativas

dos parâmetros do modelo gráfico (SERANG; MOLLINARI; GARCIA, 2012), o argumento

naive posterior report threshold foi mantido em zero. Em seguida, os valores de

probabilidades individuais a posteriori dada a ploidia selecionada (entre 6 e 14) também foram

calculadas variando o threshold de 0 a 1, a uma razão de progressão aritmética de 0,05. Esse

recurso possibilitou reconhecer o threshold máximo que permitiu alguma atribuição individual

a determinado cluster. Somente as ploidias variando de 6 a 14 foram consideradas porque,

em estudo anterior, elas foram apontadas como mais prováveis no genoma da cana e também

exibiram maiores proporções de marcadores em dose única (do inglês, single-dose markers –

SDMs) (GARCIA et al., 2013).

Como posterior critério de controle de qualidade, foram selecionadas apenas SDMs

cujas medianas de todas as probabilidades individuais a posteriori foram maior que 0,80. As

saídas do SuperMASSA foram recodificadas no software R para propósito de mapeamento

substituindo-se os respectivos alelos de referência e alternativos por a e b. Locos com padrões

de genótipos duplicados dentro e entre referências foram inspecionados sobre as chamadas de

genótipos recodificadas. Aqui, apenas uma chamada foi levada para a análise de ligação, sendo

armazenada a relativa informação de redundância. Um gráfico circular foi usado para sumarizar

os resultados de locos duplicados dentro e entre referências usando o pacote do R circlize (GU

et al., 2014).

32

2.3.2.2 Marcadores baseados em géis

Um total de 120 marcadores SSRs foram genotipados, sendo 98 e 16 derivados das

respectivas bibliotecas gênicas, nomeadas de SCA (PINTO et al., 2004, 2006), SCB (MAR-

CONI et al., 2011), SCC (OLIVEIRA et al., 2009) e IISR (SINGH et al., 2013), e genômicas,

nomeadas de SMC (CORDEIRO; TAYLOR; HENRY, 2000) e CIR (RABOIN et al., 2006), de

cana-de-açúcar. Adicionalmente, seis marcadores SSRs originaram-se a partir de bibliotecas

gênicas de sorgo, nomeadas de SB, Xtxp, CNL e SvPEPCAA (BROWN et al., 1996; KONG;

DONG; HART, 2000; WANG et al., 2005). Ainda, polimorfismos de amplificação de regiões-

alvo (do inglês, target region amplification polymorphism – TRAP) foram avaliados utilizando

a combinação de um de três primers degenerados, nomeados de ARB1, ARB2 e ARB3 (LI;

QUIROS, 2001), com um de três primers fixos, desenhados a partir das sequências dos genes

sucrose phosphate synthase (SuPS) (ALWALA et al., 2006; CRESTE et al., 2010), caffeic acid

3-O-methyltransferase (COMT) e cinnamoyl-CoA reductase (CCR) (ANDRU et al., 2011). Para

ambas as técnicas, amplicons foram obtidos via PCR conforme os desenvolvedores, depois

separados em géis de poliacrilamida desnaturantes e, finalmente, corados por prata. A nomen-

clatura para esses locos envolveu as siglas das bibliotecas ou primers utilizadas na literatura,

acrescidas de um numeral indicando a posição da banda no gel.

2.3.2.3 Construção de mapa genético

Alelos codominantes foram codificados como a e b enquanto alelos nulos foram codifi-

cados como o e tratados como recessivos, conforme notação de Wu et al. (2002a). Marcadores

codominantes baseados em GBS acessaram segregação de três tipos de cruzamentos: ‘B3.7’

(ab × ab), ‘D1.10’ (ab × aa) e ‘D2.15’ (aa × ab). Adicionalmente, marcadores dominantes

baseados em géis acessaram mais três tipos de cruzamentos, que são aqueles usualmente uti-

lizados em mapas integrados de cana-de-açúcar: ‘C.8’ (ao × ao), ‘D1.13’ (ao × oo) e ‘D2.18’

(oo × ao). ‘D1’ e ‘D2’ referem-se a cruzamentos nos quais o loco marcador é heterozigoto (e,

portanto, informativo) somente para ‘SP80-3280’ ou para ‘RB835486’, respectivamente, ambos

segregando na razão de 1:1. ‘B3’ e ‘C’ referem-se a cruzamentos nos quais o loco é heterozigoto

(e simétrico) para ambos os genitores, segregando nas razões de 1:2:1 e 3:1, respectivamente.

Como o SuperMASSA permite predizer o(s) genótipo(s) parental(is) perdido(s) através dos

dados da população, todos os marcadores do tipo ‘B3’ puderam ser recuperados. Por outro

lado, marcadores dos tipos ‘D1’ e ‘D2’ somente foram recuperados quando existiam dados para

33

um genitor, pelo menos; na completa ausência de dados para os genitores, esse marcadores

foram descartados.

Para marcadores baseados em géis, testes de qui-quadrado (χ2) foram realizados de

acordo com as segregações esperadas inferidas por meio dos genótipos parentais. Para um nível

de significância global de 0,05, os p-valores foram corrigidos usando razão de falsa descobertas

(do inglês, false discovery rate – FDR) para testes não-dependentes (BENJAMINI; YEKUTI-

ELI, 2001) como implementado na função p.adjusted nativa do software R; locos distorcidos

foram excluídos das análises de ligação. Já para marcadores baseados em GBS, a segregação

já foi considerada quando da estimação de ploidia e dosagem pelo software SuperMASSA

(SERANG; MOLLINARI; GARCIA, 2012).

A análise de ligação foi realizada sobre os marcadores em dose-única não-duplicados e

filtrados para dados perdidos e distorção de segregação utilizando o pacote do R denominado

OneMap (v. 2.0-4) (MARGARIDO; SOUZA; GARCIA, 2007). Grupos de cosegregação ou de

ligação (GLs) foram obtidos considerando LOD score > 9,0 e fração de recombinação < 0,1

calculados a partir de testes de dois-pontos. Em seguida, ordenação dos marcadores foi obtida

utilizando busca exaustiva de ordem para grupos com até cinco marcadores (função compare),

ou ordenando um subconjunto informativo de cinco marcadores como um framework inicial

sobre o qual novos marcadores eram consecutivamente posicionados (função order.seq). Em

seguida, os marcadores inicialmente não-ligados foram novamente testados sobre os grupos

ordenados usando a função try.seq. Nessa etapa, outros marcadores considerados desligados

também foram testados: (i) marcadores alocados nos extremos dos grupos de ligação então

ordenados que distavam em mais de 20 centiMorgans (cM) do marcador mais próximo, e

(ii) marcadores pertencentes a grupos muito pequenos (com tamanhos inferiores a 1 cM ou

contendo apenas dois locos). A ordem nos grupos com mais de cinco marcadores foi, final-

mente, refinada considerando a saída da função ripple, que aplica algoritmo de mesmo nome

(LANDER; GREEN, 1987) dentro de uma janela deslizante de cinco marcadores (MOLLINARI

et al., 2009). Gráficos do tipo heat maps foram inspecionados visualmente, e correção manual

foi feita quando necessária ao longo da construção do mapa.

Grupos de hom(e)ologia (GHs) foram definidos de acordo com as referências genômicas

de cana-de-açúcar compartilhadas pelos marcadores baseados em GBS. Marcadores SSR basea-

dos em géis também foram utilizados para estabelecer conexões entre os grupos de ligação, uma

vez que poderiam gerar diferentes alelos compartilhando o mesmo par de primers. Finalmente,

34

grupos de sintenia (GSs) com sorgo reuniram os GLs com marcadores GBS originados quando

da utilização do genoma de sorgo como referência nas etapas de descoberta e genotipagem de

marcadores baseados em GBS utilizando o pipeline Tassel-GBS. Os grupos de ligação foram

desenhados no software MapChart (v. 2.2) (VOORRIPS, 2002), considerando as distâncias de

mapa estimadas no OneMap pela função de Kosambi.

2.4 Mapeamento de QTLs

A busca por QTLs em ambas as populações baseou-se em modelos de mapeamento de

múltiplos intervalos (do inglês, multiple interval mapping – MIM) univariado (KAO; ZENG;

TEASDALE, 1999) e multivariado (SILVA; WANG; ZENG, 2012). Esses modelos, atualmente

implementados no pacote do R denominando OneQTL (v. 1.0-1), estão disponíveis para avali-

ação de populações derivadas de genitores endogâmicos (caso das RILs de sorgo sacarino) e de

genitores não-endogâmicos (caso da população F1 segregante de cana-de-açúcar). O OneQTL

foi elaborado no Laboratório de Genética-Estatística, da ESALQ, onde o presente trabalho se

desenvolveu, sendo gentilmente cedido pelo Dr. Luciano Da Costa E Silva. O pacote será

liberado em breve.

Primeiro, as médias ajustadas conjunta e marginalmente para cada ambiente (anos, no

caso do sorgo, e combinações local-corte, no caso da cana) foram utilizadas em modelo MIM

univariado, permitindo a detecção de QTLs nas médias (conjuntas e marginais) de cada ambi-

ente, separadamente. Depois, as médias ajustadas marginalmente foram utilizadas em modelo

MIM multivariado, permitindo a detecção adicional de eventuais QTLs em interação com o

ambiente. A seguir, será descrito brevemente o modelo MIM multivariado para populações F1

segregantes que serve, com alguns detalhes adicionalmente descritos, para as análises univaria-

das e de populações de RILs, inclusive.

O pacote OneQTL tem implementado o seguinte modelo linear de múltiplos QTLs para

múltiplos ambientes (SILVA; WANG; ZENG, 2012; MARGARIDO, 2011):

yei = µe +

R∑r=1

(per xpir + qer xqir + der xdir) + εei (3)

em que yei é o fenótipo do indivíduo i (i = 1, 2, . . . , Ig) no ambiente e (e = 1, . . . , E), µe é

o intercepto para cada ambiente e, per e qer são os efeitos genéticos aditivos do QTL r (r =

1, 2, . . . ,R QTLs) dos genitores P e Q, respectivamente, e der é o efeito genético de dominância

35

do QTL r no ambiente e, e εi ∼ N(0,ΣE) é o resíduo; xpir e xqir são as variáveis indicadoras

dos genótipos do QTL r no indivíduo i, e xdir = xpir xqir, e correspondem às probabilidades

condicionais para os contrastes ortogonais definidos no cruzamento entre dois genitores P e Q,

com os sobrescritos de 1 a 4 indicando até quatro diferentes alelos (GAZAFFI et al., 2014).

Assim:

xpir =

1 se P1Q3

1 se P1Q4

−1 se P2Q3

−1 se P2Q4

xqir =

1 se P1Q3

−1 se P1Q4

1 se P2Q3

−1 se P2Q4

xdir = xpir xqir

Ao se considerar uma população de RILs obtida a partir de duas linhagens P e Q, com

os sobrescritos 1 e 2 indicando seus respectivos alelos, e xpir = 0, o modelo de mapeamento

acima reduz-se a um único efeito aditivo (qer, no caso) com a variável indicadora recebendo os

seguintes valores:

xqir =

1 se P1P1

−1 se Q2Q2

Nas populações aqui estudadas, convencionou-se que P representaria os genitores fe-

mininos (‘BR501-Brandes’ e ‘SP80-3280’ para as respectivas populações de cana e sorgo),

e Q representaria os genitores masculinos (‘BR505-Wray’ e ‘RB835486’ para as respectivas

populações de cana e sorgo).

Finalmente, se e = E = 1, o modelo de mapeamento torna-se univariado.

A construção do modelo de múltiplos QTLs baseou-se em busca forward de QTLs

putativos ao se testar a significância de seus efeitos principais sobre cada posição no genoma.

No caso do sorgo, essas posições corresponderam às próprias marcas, e, no caso da cana, essas

posições foram atribuídas por uma grade de busca de 1 cM, utilizando tamanhos de janelas

(do inglês, window size) de 1 quilo bases (kb) e 10 cM, respectivamente. As posições dos

QTLs no modelo foram refinadas a cada três ciclos de inclusão de QTLs. Finalmente, as

permanências dos efeitos principais foram testadas via eliminação backward. Nos modelos

multivariados, coeficientes de regressão aparentemente não-relacionados (do inglês, seemingly

unrelated regressions) (ZELLNER, 1962) resultantes da eliminação backward tiveram seus

efeitos estimados e foram marcados como não-significativos, ao invés de mantê-los com efeitos

nulos.

Para o mapeamento em sorgo sacarino, foram utilizados os níveis de significância

36

genome-wide baseados em score (ZOU; ZENG, 2008; SILVA; ZENG, 2010) de 0,20 e 0,05

nas respectivas etapas de entrada (busca forward) e saída (eliminação backward) de QTLs

em cada modelo. Já para o mapeamento em cana-de-açúcar, diversos níveis de significância

baseados em score para busca forward foram testados sob uma grade que variou de 0,10 a 0,90,

a uma razão de progressão aritmética de 0,10. Nos casos em que os modelos progressivamente

parametrizados apresentavam indícios de problemas numéricos (não convergência), o processo

de busca forward era abortado e o menor valor de significância permitindo a adição de um maior

número de QTLs era escolhido. O nível de significância utilizado na eliminação backward

foi estabelecido como um quarto do valor utilizado na busca forward. Níveis de significância

superiores a 0,20 foram permitidos no mapeamento desta população por conta da existência de

diversos fatores limitantes quando da descoberta de regiões sugestivas para controle dos carac-

teres quantitativos na espécie. Dentre esses fatores, são enfatizadas a complexidade do genoma

da cana e as abordagens apenas aproximadas a partir de espécies diploides para construção de

mapas de ligação e para mapeamento de QTLs.

A aproximação de Haley-Knott (HALEY; KNOTT, 1992) foi utilizada para o ajuste

do modelo e o método da máxima verossimilhança foi adotado para a estimação dos efeitos

genéticos e do componente de variância residual. Também foram obtidos os valores de LOD

scores associados a todas as posições pesquisadas, assim como os intervalos de confiança LOD−

1,5 em relação às posições mais prováveis dos QTLs. Adicionalmente, p-valores empíricos

para os efeitos de QTLs no modelo foram obtidos via reamostragem baseada em score (SILVA;

WANG; ZENG, 2012).

Adicionalmente, análise de marcadores individualmente (SMA) foi implementada no

software R para os locos marcadores de cana-de-açúcar. Assim, as médias ajustadas conjuntas

e marginais foram utilizadas como variáveis independentes, enquanto os genótipos dos marca-

dores recodificados (0 para a, 1 para ab e 2 para b) foram utilizados como variável dependente

em modelos de regressão simples. Os p-valores dos efeitos dos marcadores individuais sobre

os caracteres foram acessados via teste t e considerados significativos quando p < 0,01.

Locos resultantes dos mapeamentos uni- e multivariados de QTLs para as populações

de sorgo sacarino e cana-de-açúcar foram agrupados, dentro de cada população, com base

na proximidade com que apareceram nos cromossomos ou nos GLs, respectivamente. Nesse

sentido, foram utilizados uma janela de 10 Mb para agrupar os QTLs de sorgo, tamanho médio

pelo qual se estendiam os efeitos das marcas, e os intervalos de confiança para agrupar os

37

QTLs de cana. Evidentemente, no caso do sorgo, dois QTLs distintos para uma mesma análise

mapeados dentro da janela de 10 Mb foram considerados diferentes, e foram eventualmente

agrupados com QTLs mais próximos à esquerda ou à direita, dentro dessa janela.

Finalmente, as posições dos QTLs dos caracteres similares avaliados nas populações de

mapeamento de cada espécie foram comparadas tomando por base os marcadores da cana e as

regiões cromossômicas do sorgo em que os testes para existência de QTLs foram significativos.

Inferências a respeito da conservação de locos que controlam caracteres de herança complexa

foram realizadas com base nessas observações. A comparação entre os QTLs mapeados nas

duas populações foi realizada considerando o alinhamento dos GLs e dos marcadores não

mapeados da cana contra o genoma do sorgo utilizando, exclusivamente, as informações de

SNPs e indels derivados de GBS, os quais já indicavam diretamente sua posição no genoma

do sorgo. O genoma do sorgo utilizado foi o mesmo que serviu de referência para mapear os

polimorfismos na população de sorgo sacarino.

38

39

3 RESULTADOS E DISCUSSÃO

Para ambas as populações de sorgo sacarino e de cana-de-açúcar, foram realizadas aná-

lises de dados fenotípicos e genotípicos. Fazem parte da “análise fenotípica” a análise via

modelos mistos dos dados fenotípicos, a obtenção de componentes de variância e herdabilida-

des, e o cálculo de correlações entre caracteres. Já a “análise genotípica” contém a descrição

dos dados de marcadores obtidos para ambas as populações, assim como as classificações para

ploidias e dosagens dos marcadores quantitativos e a construção do mapa genético para cana,

especificamente. Finalmente, também são apresentados os resultados dos mapeamentos de

QTLs para as populações, separadamente e, então, esses resultados são comparados.

3.1 Sorgo Sacarino

3.1.1 Análise fenotípica

Avaliações fenotípicas em campo foram obtidas e analisadas para três anos agrícolas

(2011, 2012 e 2013) para a população de sorgo sacarino. Os dados foram obtidos para quatro

caracteres de interesse bioenergético: altura de colmos (ALT, em m), produção de massa verde

(PMV, em ton · ha−1), pol de caldo (POL, em %) e conteúdo de fibra (FIB, em %).

Considerando a abordagem de modelos mistos, inicialmente estabeleceu-se a parte ale-

atória do modelo completo a partir da seleção das mais apropriadas matrizes de VCOV. Nesta

seleção, adotou-se os valores de AIC para comparação das matrizes de VCOV genéticas, en-

quanto os valores de BIC foram principalmente considerados na comparação de matrizes de

VCOV residuais. Esta escolha determinou a possibilidade de revelar o máximo de informação

sobre eventual diferença entre as variâncias genéticas ao longo dos anos, assim como sobre a

ocorrência de importantes covariâncias entre os mesmos. Isto se justifica pelo fato de o BIC

penalizar a inclusão de parâmetros em relação ao AIC (PASTINA et al., 2012). Por exemplo,

para os caracteres PMV e FIB, modelos não-estruturados (UNST) foram selecionados para as

matrizes de VCOV genéticas GM, enquanto para ALT, matriz simétrica composta heterogênea

(CSHet) foi preferida (Tabela 3). Essa heteroscedasticidade significa, em linhas gerais, que há

interação genótipo-ambiente (MALOSETTI; RIBAUT; VAN EEUWIJK, 2013), cujo entendi-

mento é importantíssimo no contexto dos programas de melhoramento de espécies vegetais.

Apenas para o caráter POL, matriz com variâncias homogêneas e covariâncias idênticas (uni-

forme – UNIF) foi selecionada. Para a composição das matrizes de VCOV residuais, diversas

40

estruturas foram selecionadas, sendo aquelas menos complexas geralmente preferidas pelo BIC.

Tabela 3 – Modelos examinados para diferentes matrizes de variância-covariância para efeitos genéti-cos dentro de M anos (GA

M×M) na análise fenotípica de população de mapeamento de sorgosacarino

Caráter ALT PMV POL FIBnPAR

Estrutura AIC BIC AIC BIC AIC BIC AIC BIC

GM = GAM×M

ID 51,8 68,6 14435,5 14452,2 8263,6 8280,4 7433,5 7450,2 1UNIF −154,5 −132,1 14375,3 14397,7 8107,8 8130,1 7374,6 7397,0 2DIAG 37,4 65,3 14339,7 14367,7 8264,8 8292,7 7335,2 7363,1 3AR1 −145,9 −123,6 14374,3 14396,7 8116,7 8139,1 7369,6 7391,9 2CSHet −180,6 −147,0 14269,1 14302,6 8107,9 8141,4 7262,6 7296,2 4UNST −179,3 −134,6 14266,5 14311,2 8111,5 8156,2 7258,3 7303,0 6Notas: nPAR é o número de parâmetros para as matrizes identidade (ID), uniforme (UNIF), diagonal (DIAG),auto-regressiva de 1a ordem (AR1), simétrica composta (CSHet) e não-estruturada (UNST); em negrito, osmenores valores para os critérios de informação de Akaike (AIC) e Bayesiano (BIC)

Mantendo-se as estruturas de VCOV selecionadas, foram testadas as significâncias dos

efeitos de interação entre anos e genitores. Para todos os caracteres, essas interações foram

não-significativas (p > 0,05) e, portanto, foram retiradas do modelo final. Esta proposta de

análise prevê que as significâncias de efeitos fixos podem variar dadas as estruturas aleatórias

selecionadas no então modelo de médias completo sob análise (GALECKI; BURZYKOWSKI,

2013).

Foram obtidas importantes informações sobre as correlações existentes entre as variáveis

analisadas (Figura 1). A maioria das correlações foram elevadas e significativas, e pelo menos

a correlação significativa entre ALT e POL também já havia sido verificada (RITTER et al.,

2008). Correlações negativas envolveram o caráter FIB, sendo a relação oposta com POL não-

significativa, como Ming et al. (2002) observaram em uma das populações de mapeamento

de cana-de-açúcar estudadas por eles. Já as significativas correlações negativas de FIB com

caracteres de produção, como ALT e PMV, representa um desafio para o melhoramento de

sorgo voltada para a produção de biomassa, por exemplo. Correlações significativas e positivas

indicam que seleção indireta pode ser praticada; no entanto, essa seleção pode ficar prejudi-

cada quando dois caracteres de interesse apresentam correlação negativa. O entendimento da

arquitetura genética desses caracteres pode auxiliar na tomada de decisões em programas de

melhoramento.

As estimativas de componentes de variância e de herdabilidades são mostradas na Tabela

41

ALT20 30 40

0,71*** ***0,46

11 13 15

2.2

2.8

***−0,36

2030

40 PMV**0,30 **−0,22

POL

46

811

−0,12ns

2.2 2.8

1113

15

4 6 8 11

FIB

Figura 1 – Histogramas das médias ajustadas para cada caráter (na diagonal), gráficos de dispersão(abaixo da diagonal) e valores de correlações genéticas (acima da diagonal) entre pares decaracteres avaliados em população de mapeamento de sorgo sacarino; p-valores foram cor-rigidos para um nível de significância global a 5% (∗∗p < 0,01, ∗∗∗p < 0,001 e ns é não-significativo)

4. Os coeficientes de herdabilidade a nível de média classificam-se de moderados a altos,

variando de 0,592 para FIB a 0,813 para ALT. Esses valores mostram que boa parte da variação

fenotípica observada pode ser atribuída a diferenças ao nível genotípico, e são semelhantes

àqueles citados na literatura (RITTER et al., 2008; SHIRINGANI; FRISCH; FRIEDT, 2010).

Os coeficientes de variação podem ser considerados adequados para o experimento, variando

de 6,3% para ALT a 25,8% para PMV.

Tabela 4 – Estimativas de médias, componentes de variâncias genética (σ2G) e fenotípica

(σ2P), e coeficientes de variação (CV, em porcentagem) e de herdabilidade

(h2) aos níveis de plantas e de médias para caracteres avaliados em populaçãode mapeamento de sorgo sacarino derivada do cruzamento entre as cultivares‘Brandes’ (P1) e ‘Wray’ (P2)

Caráter Médias P1 P2 σ̂2G σ̂2

P CV (%) h2plantas h2

médias

ALT 2,69 2,92 2,46 0,040 0,087 6,3 0,462 0,813PMV 27,47 33,12 21,81 19,050 93,000 25,8 0,205 0,603POL 7,25 10,51 3,99 1,693 4,670 19,8 0,363 0,762FIB 12,78 12,41 13,14 0,538 2,651 9,8 0,203 0,592

42

3.1.2 Análise genotípica

Leituras curtas foram obtidas a partir do sequenciamento de três bibliotecas de plex 96

produzidas a partir da digestão pela enzima ApeKI de DNA genômico de 272 RILs da população

de mapeamento de sorgo e de três replicatas dos genitores. Foram produzidas mais de 520

milhões de leituras no total, ou 173 milhões de leituras por lane, em média. Do total, cerca de

470 milhões (∼90%) de leituras, ou 1,6 milhão de leituras por amostra, em média, continham

uma sequência barcode e o sítio remanescente da ação da enzima. Posteriormente, 3.834.717

tags de 64 pb foram identificadas e, então, alinhadas contra o genoma do sorgo. A razão total

de alinhamento utilizando Bowtie 2 foi de 79,95%, resultante das 1.880.627 (49,04%) tags

alinhadas exatamente uma vez e das 1.185.194 (30,91%) alinhadas mais de uma vez. Um total

de 768.896 (20,05%) de tags não se alinharam, portanto.

O número total de variantes bialélicas detectadas na população de mapeamento de

sorgo sacarino utilizando o pipeline Tassel-GBS foi de 461.241 e, dependendo do cromos-

somo, variou de 31.969 (cromossomo 8) a 71.878 (cromossomo 1). Deste total, SNPs foram

mais frequentes que indels a uma razão de 3,0:1. Em relação aos SNPs, transversões (subs-

tituições purina-pirimidina) foram identificadas 1,3 vezes mais que transições (substituições

purina-purina ou pirimidina-pirimidina), quando o contrário (mais transições) era esperado. No

entanto, essa expectativa deve ser observada mais rigorosamente em genomas completamente

sequenciados. Isto porque esse viés pode estar relacionado à relativa facilidade de desaminação

de resíduos de citosinas metiladas em regiões adjacentes a guaninas (regiões CpG), levando à

transição para timinas (KELLER; BENSASSON; NICHOLS, 2007). Como aqui foi utilizada

enzima sensível à metilação para construção das bibliotecas, acredita-se que, ao se evitar essas

regiões, indiretamente também evitou-se a detecção de um maior número de transições. Infeliz-

mente, estudos envolvendo GBS falham em contabilizar a razão entre transições-transversões

propriamente, apesar de seu potencial uso na conferência da qualidade do sequenciamento, por

exemplo.

Antes de realizar qualquer filtragem dos dados, genótipos ausentes foram imputados

utilizando o software Npute (ROBERTS et al., 2007), e determinou a existências de diferentes

tamanhos de janelas de imputação entre os cromossomos, variando de 12 (cromossomo 7) a 18

(cromossomo 4) bases e fornecendo uma acurácia média de 98,4%. Finalmente, utilizando uma

MAF de 0,40, 360.950 locos foram excluídos, permanecendo 100.291 locos. Em média, cada

cromossomo da população continha 10 mil marcadores, variando de 4.086 (cromossomo 8) a

43

14.326 (cromossomo 2). No cenário de uma população experimental de autógama típica, como

é o sorgo, esses números podem ser considerados excelentes. De fato, blocos de desequilíbrio

relativamente grandes podem ser evidenciados pela cosegregação de inúmeros SNPs, indicando

que alguns deles são redundantes.

3.1.3 Mapeamento de QTLs

Um total de 53 QTLs foram descobertos utilizando as abordagens de MIM uni- e mul-

tivariado para os quatro caracteres avaliados na população de mapeamento de sorgo sacarino.

O resumo dessas análises estão apresentados na Tabela 5. Os resultados detalhados em relação

aos efeitos ao longo dos anos e suas significâncias estatísticas estão presentes nos Apêndices A

e B (Tabelas 12 e 13).

Ambos os caracteres agronômicos ALT e PMV tiveram 12 QTLs detectados cada, os

quais se distribuíram ao longo de oito cromossomos do sorgo (exceto cromossomos 5 e 7 para

ALT, e cromossomos 1 e 5 para PMV). Para ALT, os seis QTLs detectados na análise multivari-

ada foram confirmados nas análises univariadas; já para PMV, a análise univariada acrescentou

mais duas regiões, além das outras quatro também detectadas na análise multivariada. Para

os dois caracteres, a existência de QTLs específicos para determinados anos ou para a média

dos três anos foram adicionalmente evidenciados. Interessantemente, dentre os dois caracteres

industriais, POL contribuiu com a descoberta de 17 QTLs, enquanto FIB, com a descoberta

de 12 QTLs, também distribuídos ao longo de oito cromossomos (exceto cromossomos 2 e 4

para POL, e cromossomos 5 e 7 para FIB). De fato, entre os caracteres avaliados, POL revelou-

se o mais fenotipicamente constrastante entre os genitores, gerando, por consequência, ampla

variação de fenótipos entre as RILs. Ou seja, por construção, a população de mapeamento é

amplamente favorável ao mapeamento para este caráter. Para POL, as análises uni- e multiva-

riadas acrescentaram, exclusiva e respectivamente, seis e duas novas regiões ao total de nove

QTLs evidenciados nas duas análises. Já para FIB, em adição aos oito QTLs compartilhados

por ambas as estratégias, cada qual indicou a existência de controle genético para esse caráter

em mais duas regiões distintas.

O caráter ALT já havia sido investigado em trabalho anterior (RITTER et al., 2008)

utilizando as estratégias de SMA e CIM, por meio das quais evidências para a existência de

efeitos principais nos cromossomos 1, 3 e 6 também foram encontradas. Em adição, os autores

apontam QTL no cromossomo 5. Aqui, também aparecem putativos locos controlando o caráter

44

Tabela 5 – Cromossomos (Cr.) e posições (em mega bases – Mb) dos QTLs detecta-dos em população de mapeamento de sorgo sacarino utilizando modelosmapeamento de múltiplos intervalos (MIM)

Caráter QTL Cr. Posição (Mb) Caráter QTL Cr. Posição (Mb)

ALT 1 1 62,6-67,8 POL 4 3 13,5-15,92 2 26,3 5 3 51,4-57,83 3 61,3 6 3 64,9-68,14 3 68,3 7 5 2,9-4,85 4 54,2 8 5 4,8-5,66 6 18,4 9 6 43,2-46,27 6 42,2-42,6 10 6 52,5-53,58 8 45,1 11 7 48,39 9 2,6-10,1 12 8 14,0

10 9 47,8-50,4 13 8 37,011 10 11,1 14 8 53,412 10 43,3-55,7 15 9 2,9-9,5

PMV 1 2 4,9 16 9 10,12 2 62,7 17 10 5,13 3 21,3 FIB 1 1 59,2-61,04 4 1,3 2 2 1,75 4 57,0-57,3 3 3 60,66 6 17,5 4 3 68,1-69,27 6 40,1-41,8 5 4 1,4-9,68 7 60,0 6 4 65,19 8 5,4 7 6 34,9

10 9 5,4 8 6 46,2-47,611 10 12,9-13,6 9 8 37,0-37,412 10 38,3-52,5 10 9 5,3

POL 1 1 3,9-6,6 11 10 2,52 1 51,4-63,1 12 10 56,4-58,53 3 0,9-1,8

nos cromossomos 2, 4, 8, 9 e 10.

Outro exemplo interessante deste conjunto de resultados é a região terminal do cromos-

somo 3, com efeitos importantes (vide LOD conjunto da análise multivariada, LODc) para os

caracteres relacionados a açúcar, como aqueles das regiões POL-6 (LODc = 19,45) e FIB-2

(LODc = 13,50). Esse controle genético para conteúdo de açúcar em sorgo já foi investigado

em estudos anteriores. Guan et al. (2011), trabalhando com população de RILs derivada do

cruzamento entre ‘Shihong137’ (sorgo granífero) e ‘L-Tian’ (sorgo sacarino) e mapa com 118

marcadores SSRs, encontraram quatro QTLs para sólidos solúveis totais ou brix (nos cromosso-

mos 1, 2, 3 e 7), sendo aquele do cromossomo 3 estável para os dois ambientes avaliados. Além

45

disto, painel de sorgo, majoritariamente sacarino, detectou região genômica que é, potencial-

mente, idêntica àquela aqui detectada (MURRAY et al., 2009). Finalmente, Ritter et al. (2008)

também obtiveram QTLs para POL, com destaque para aqueles existentes nos cromossomos

1, 5, 6 e 10, sendo que o cromossomo 3 também aparece para o caráter conteúdo de açúcar.

Adicionalmente, regiões sugestivas, como aquelas evidenciadas nos cromossomos 8 e 9, até

então não relatadas, devem ser melhor investigadas, visando à adição de mais informações

sobre a arquitetura genética desse caráter.

3.2 Cana-de-Açúcar

3.2.1 Análise fenotípica

Como para a população de sorgo sacarino, foram realizadas avaliações fenotípicas em

campo para a população de cana-de-açúcar para os seguintes caracteres: altura de colmos (ALT,

em m), toneladas de colmos por hectare (TCH, em ton · ha−1), pol de caldo (POL, em %) e

conteúdo de fibra (FIB, em %). Esses experimentos foram realizados em dois locais e durante

três anos consecutivos (2010, 2011 e 2012).

As estruturas mais apropriadas para as matrizes de VCOV genética foram seleciona-

das de acordo com os valores de AIC (Tabelas 6); nesses casos, os valores de BIC foram

completamente concordantes. A matriz de VCOV que considera a estratégia de agrupamento

por combinação local-corte foi preferida para o caráter ALT, enquanto produtos de matrizes

considerando os agrupamentos naturais de locais e cortes foram preferidos pelos demais ca-

racteres (TCH, POL e FIB), situações nas quais menos parâmetros necessitaram ser estimados.

Diversas estruturas para os caracteres não puderam ser ajustadas porque não foi possível estimar

os parâmetros de variância-covariância das matrizes via REML, e aparecem como NAs na

Tabela 6. Possivelmente, o desbalanceamento causado pela ausência de cortes para POL e FIB

também pode ter impedido a seleção de matrizes mais econômicas na parametrização, como

a auto-regressiva de 1a ordem (AR1), quando não-estruturadas (UNST) foram selecionadas.

Para todos os caracteres, foi possível observar a heterogeneidade de efeitos genéticos entre os

níveis dos fatores local e corte, sejam eles agrupados em ambientes ou não. De modo geral,

esse comportamento era esperado. Em Pastina et al. (2012), resultados semelhantes foram

observados para TCH, FIB e POL.

Para o caráter ALT, que melhor ajustou matriz de VCOV genética como combinação

fatorial de local-corte, a matriz de VCOV residual também foi avaliada utilizando ambientes

46

Tabela 6 – Modelos examinados para diferentes matrizes de variância-covariância para efeitos genéticosdentro de P = M · N combinações local-corte (GE

P×P) ou de N locais (GLN×N) e M cortes

(GAM×M) na análise fenotípica de população de mapeamento de cana-de-açúcar

Caráter ALT TCHnPAR

POL FIBnPAR

Estrutura AIC BIC AIC BIC AIC BIC AIC BIC

GP = GEP×P

ID 1507,0 1525,9 41149,3 41168,1 1 7348,4 7365,4 6325,7 6342,7 1UNIF 1339,3 1364,4 40915,5 40940,6 2 NA NA NA NA -DIAG 1430,5 1474,5 41127,6 41171,6 5 7348,0 7382,0 6311,7 6345,6 4CSHet 1285,2 1335,4 40902,1 40952,4 6 NA NA NA NA -UNST NA NA NA NA - 7110,7 7178,7 NA NA 10GP = GL

N×N ⊗GAM×M

UNST ⊗ ID 1361,1 1392,5 36746,6 36778,0 4 7261,8 7290,1 6192,9 6221,2 4UNST ⊗ UNIF 1301,1 1338,8 NA NA 5 NA NA NA NA -UNST ⊗ DIAG 1347,0 1391,0 36749,6 36793,6 6 7263,6 7297,6 6190,3 6224,3 5UNST ⊗ AR1 1298,4 1336,1 36511,5 36549,2 5 7119,3 7153,2 6069,5 6103,5 5UNST ⊗ CSHet NA NA NA NA - NA NA NA NA -UNST ⊗ UNST NA NA NA NA - 7109,1 7148,8 6050,5 6090,1 6Notas: nPAR é o número de parâmetros para as matrizes identidade (ID), uniforme (UNIF), diagonal (DIAG), auto-regressiva de 1a ordem (AR1), simétrica composta (CSHet) e não-estruturada (UNST) ou produto direto delas; emnegrito, os menores valores para os critérios de informação de Akaike (AIC) e Bayesiano (BIC); NA significa quenão foi possível ajustar o modelo especificado, usando o software GenStat

(E) como fator de agrupamento. Nesse caso, a matriz REP×P ajustou uma estrutura uniforme

(UNIF). Já para os caracteres TCH, POL e FIB, que melhor ajustaram matrizes de VCOV

genética como produto direto de matrizes, as matrizes R de VCOV residuais também foram

avaliadas utilizando locais (L) e cortes (A) como fatores de agrupamento, separadamente. Em

relação às matrizes RLN×N para locais, foram selecionadas matrizes identidade (ID) para POL

e FIB, e matriz UNST para TCH. Para as matrizes RAM×M para cortes, matrizes UNIF foram

selecionadas para TCH e POL, enquanto matriz simétrica composta (CSHet) foi selecionada

para FIB. Finalmente, matrizes diagonais (DIAG) foram selecionadas para RRK×K em todos os

casos (dados não apresentados).

Posteriormente, para cada caráter investigado, a seleção da estrutura de média (parte fixa

do modelo) considerando as matrizes selecionadas anteriormente e utilizando a estatística de

Wald determinou que os efeitos de interação entre cortes e testemunhas para TCH, POL e FIB,

e entre locais e testemunhas para FIB foram não-significativas (p > 0,05); já ALT apresentou

todos os efeitos de interação estatisticamente significativos. Os efeitos não-significativos foram

retirados do modelo e, em seguida, as médias ajustadas (conjunta e marginalmente) foram

obtidas.

47

As dispersões das médias ajustadas entre os pares de caracteres avaliados evidenciaram

correlações não-significativas (Figura 2). Essa ausência de correlação contraria em parte a

tendência observada para dados relatados para a cultura (HOARAU et al., 2002; AITKEN et

al., 2008), muito embora mesmo a ausência de correlação entre POL e FIB, por exemplo, já

tenha sido verificada (MING et al., 2002).

ALT70 90 120 11.0 13.0

2.1

2.4

7090

120

TCH

POL

1618

202.1 2.411

.013

.0

16 18 20

FIB

−0,06ns

−0,06ns

0,11ns

0,02ns0,15ns

−0,05ns

Figura 2 – Histogramas das médias ajustadas para cada caráter (na diagonal), gráficos de dispersão(abaixo da diagonal) e valores de correlações genéticas (acima da diagonal) entre pares decaracteres avaliados em população de mapeamento de cana-de-açúcar; p-valores foram corri-gidos para um nível de significância global a 5% (ns é não-significativo)

As estimativas das variâncias genética (σ̂2G) e fenotípica (σ̂2

P) para cada caráter, bem

como os coeficientes de herdabilidade (H2), foram obtidas a partir dos modelos de ID para os

efeitos aleatórios genéticos e residuais (Tabela 7). Os coeficientes de herdabilidade a nível de

médias classificam-se como altos, variando de 0,781 para ALT a 0,844 para FIB. Esses valores

mostram que boa parte da variação fenotípica observada pode ser atribuída a diferenças ao

nível genotípico, e são comparáveis àqueles observados na literatura (HOARAU et al., 2002;

AITKEN et al., 2008). Em comparação à população de sorgo sacarino, as herdabilidades dos

caracteres avaliados na população de cana-de-açúcar foram relativamente maiores. Parte disto

é justificado pelo tipo de delineamento, com vários locais, cortes e repetições para cana, o que

aumenta a qualidade do experimento e diminui a variância residual. A qualidade do experimento

pode ser também verificada pelos valores razoáveis de coeficientes de variação, cujos valores

foram de 6,4% para POL a 23,5% para TCH. Outra possível explicação refere-se ao menor

número de QTLs segregando nesta população, já que os genitores não são muito divergentes.

48

Tabela 7 – Estimativas de médias, componentes de variâncias genética (σ2G) e fenotípica (σ2

P),e coeficientes de variação (CV, em porcentagem) e de herdabilidade (H2) aosníveis de plantas e de médias para caracteres avaliados em população de mapea-mento de cana-de-açúcar derivada do cruzamento entre as variedades ‘SP80-3280’(P1) e ‘RB835486’ (P2)

Caráter Médias P1 P2 σ̂2G σ̂2

P CV (%) H2plantas H2

médias

ALT 2,31 2,36 2,24 0,017 0,090 11,7 0,193 0,781TCH 93,61 95,84 85,48 582,000 2120,000 23,5 0,275 0,836POL 18,44 18,63 18,85 0,889 2,273 6,4 0,391 0,837FIB 12,26 12,04 12,34 0,592 1,465 7,7 0,404 0,844

3.2.2 Análise genotípica

3.2.2.1 Estratégias de descoberta de polimorfismos utilizando GBS

Leituras curtas foram obtidas a partir do sequenciamento de bibliotecas de plex 96 pro-

duzidas a partir da digestão pela enzima PstI de DNA genômico de 151 indivíduos da população

de mapeamento de cana e de três replicatas dos genitores. Mais de 1,6 bilhão de leituras foram

produzidas no total, com 268 milhões leituras por lane, em média. Cerca de 600 milhões de

leituras (∼41% do total), ou 4,2 milhões de leituras por amostra, em média, continham uma

sequência barcode e o sítio de corte remanescente da ação da enzima. Como alguns indivíduos

das primeira e segunda bibliotecas não pertenciam à população de mapeamento, leituras extras

contendo barcodes não foram identificadas. De cada biblioteca duplamente sequenciada, ∼2

milhões, ∼106 milhões e ∼222 milhões de leituras com barcodes foram identificadas, em média.

Do total de leituras com barcodes, mais de 3,1 milhões de tags foram levadas para

alinhamento contra quatro pseudo-referências diferentes. Três das quatro referências foram

originadas de bibliotecas de DNA ou RNA de cana-de-açúcar. O genoma metil-filtrado da cana

(GRATIVOL et al., 2014) resultou na maior taxa de alinhamento, com 87,94% (2.729.457) de

tags alinhadas. Em relação às referências baseadas em RNA, 38,53% (1.195.723) e 23,89%

(741.537) das tags foram alinhadas contra transcriptoma obtido via RNA-Seq (CARDOSO-

SILVA et al., 2014) e sequências do projeto SUCEST (VETTORE et al., 2003), respectivamente.

Entretanto, suas taxas de alinhamento não-único diferiram bastante (Tabela 8), em acordo com

os achados de Vicentini et al. (2012) sobre a redundância existente na base de dados do SU-

CEST. Finalmente, a referência do genoma do sorgo teve um total de 42,29% (1.312.661) de

tags alinhadas (Tabela 8).

49

Tabela 8 – Alinhamento utilizando Bowtie 2 de 3.103.708 tags de GBS em população de mapeamentode cana-de-açúcar em valores absolutos e relativos (entre parênteses). O total de tagsalinhadas é a soma dos alinhamentos único e não-único

Pseudo-referênciasTags

não-alinhadasTags alinhadas

Total Alinhamentoúnico

Alinhamentonão-único

Genoma metil-filtradoda cana

374.251(12,06%)

2.729.457(87,94%)

1.823.623(58,76%)

905.834(29,18%)

Genoma do sorgo 1.791.047(57,71%)

1.312.661(42,29%)

1.060.705(34,17%)

251.956(8,12%)

Transcriptoma viaRNA-Seq da cana

1.907.985(61,47%)

1.195.723(38,53%)

1.099.697(35,43%)

96.026(3,10%)

Sequências do projetoSUCEST

2.362.171(76,11%)

741.537(23,89%)

256.450(8,26%)

485.087(15,63%)

De 39.058 a 151.755 variantes bialélicas foram identificadas dependendo da refe-

rência (Tabela 9) utilizando o pipeline Tassel-GBS. Para todas as referências, SNPs foram

mais frequentes que indels a uma razão de 2,6:1, em média, próxima daquela encontrada

para a população de sorgo. Em relação aos SNPs, transições (substituições purina-purina

ou pirimidina-pirimidina) foram identificadas 1,4 vezes mais que transversões (substituições

purina-pirimidina), concordando, em parte, com a razão esperada para análise de genoma com-

pleto. Como foi relatado, a enzima PstI utilizada é apenas parcialmente sensível à metilação.

Todos esses dados iniciais, entretanto, estavam inflados por dados perdidos. Como não

há metodologia de imputação de dados perdidos no cenário de poliploides complexos como

a cana, cerca de 12% dos marcadores com mais de 25% de dados perdidos foram excluídos

nas chamadas de cada referência (Tabela 9). Além disso, locos com baixa profundidade ou

ambíguos também estavam amplamente presentes. Então, ∼64% de locos sub-representados

também foram excluídos considerando uma contagem média mínima de 50 leituras para o alelo

de referência. Embora um elevado número de locos tenha sido removido, de 8.885 a 38.378

de marcadores polimórficos com profundidades elevadas e filtrados para genótipos perdidos

foram levados para análise no software SuperMASSA. Redundâncias remanescentes foram

investigadas somente após essa análise.

3.2.2.2 Estimação de ploidia e dosagem alélica

Níveis de ploidia variando de 2 a 20 foram avaliadas no software SuperMASSA utili-

50

Tabela 9 – Número de marcadores gerados após análise dos dados de GBS em população de mapeamentode cana-de-açúcar utilizando o pipeline Tassel-GBS

Pseudo-referências SNPs Indels TotalLocos excluídos Locos

selecionadosDadosperdidosa

Baixacoberturab

Genoma metil-filtradoda cana

110.261 41.494 151.755 16.815(11,1%)

96.562(63,6%)

38.378(25,3%)

Genoma do sorgo 84.757 35.447 120.204 13.773(11,5%)

78.914(65,6%)

27.517(22,9%)

Transcriptoma viaRNA-Seq

73.275 26.778 100.053 11.809(11,8%)

63.658(63,6%)

24.586(24,6%)

Sequências do projetoSUCEST

29.238 9.820 39.058 4.878(12,5%)

25.295(64,8%)

8.885(22,7%)

Notas: aLocos com mais de 25% dos indivíduos da população com dados perdidos. bLocos com menos de 50leituras para o alelo de referência na média da população

zando os dados de GBS da população de mapeamento (exemplos na Figura 3). Uma vez que a

ploidia mais verossímel era obtida para cada loco numa primeira rodada, o software fornecia,

numa segunda rodada, as probabilidades individuais a posteriori para cada indivíduo alocado

em um dos clusters de dosagem esperados para uma dada ploidia. O número de locos variou

dentro de cada nível de ploidias consideradas nas análises (Figura 4), sugerindo que o número

de cromossomos dentro de grupos de hom(e)ologia não é constante em cana-de-açúcar, como

citado anteriormente (GRIVET; ARRUDA, 2002; GARCIA et al., 2013). Para os dados de

GBS, 10,7% dos locos, em média, foram classificados como tendo ploidias de 2 ou 4, 60,3%

como ploidias de 6 a 14, e 29,0% como ploidias de 16 a 20.

Como mencionado por Garcia et al. (2013), artefatos de técnicas moleculares produ-

zindo forte viés ou muito ruído devem explicar classificação equivocada dos marcadores, isto

é, locos não incluídos na variação esperada de ploidias (de 6 a 14). De fato, já foi notado que o

modelo gráfico Bayesiano usado nas análises beneficia ploidias menores em função da parsimô-

nia quando clusters enviesados estão confundidos ou, por outro lado, prefere maiores números

de clusters ao tentar explicar um gráfico de dispersão mais difuso (MOLLINARI; SERANG,

2015). Adicionalmente, Garcia et al. (2013) hipotetizaram que dados de baixa qualidade tam-

bém podem ser gerados por eventos biológicos como variações no número de cópias (do inglês,

copy number variations – CNVs) ou regiões parálogas. Variações de presença-ausência (do

inglês, presence-absence variations – PAVs) também podem ser levadas em consideração na

adição de complexidade que eventualmente comprometeu a qualidade dos dados.

51

200 400 600 8000

●●

● ●●

●●

● ●

●●

●● ●

●●

●●

●●

●●

● ●

● ●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

● ●

●●

●●

●●

●●

●●

●●●●● ●● ●● ●● ●● ●● ● ● ●● ●

10b:0a9b:1a

8b:2a7b:3a 6b:4a

5b:5a

4b:6a

3b:7a

2b:8a

1b:9a

0b:10a0

200

400

Alelo de referência (a)

Alel

o al

tern

ativo

(b)

Prob. indiv.

0.250.500.751.00

Genótipo●

aaaaaaaaaaaaaaaaaaabaaaaaaaabbaaaaaaabbbaaaaaabbbb

Genótipo●

aaaaaaaaaaabaaaaaaaaaabbaaaaaaaaabbbaaaaaaaabbbbaaaaaaabbbbbaaaaaabbbbbbaaaaabbbbbbbaaaabbbbbbbb

Prob. indiv.

0.50.60.70.8

●●●●●

●●●●

●●

● ●

●●●

●●

●●

●●

●●

● ●●

●●●

●●

●●

● ● ●●●

●●

● ●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

12b:0a

11b:1a10b:2a

9b:3a8b:4a 7b:5a 6b:6a

5b:7a

4b:8a

3b:9a

2b:10a

1b:11a

0b:12a0

250

500

250 500 750Alelo de referência (a)

Alel

o al

tern

ativo

(b)

0

●●● ●●

●●

● ●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

● ●

●●

●●● ●●

●●

● ●

●● ●

● ●

● ●

● ●●

●●

● ●●

● ●●●●●

●●

●●

●●

● ●

●●●

●●●

●●

●●

●●● ●

●●●

●●

●● ● ●●

●●● ●●

●●

●●

●●

● ●

●●● ● ●

● ●●●

● ●

● ●

●● ●

●●

● ●●●

●● ●

●●

●●

●●

●●

8b:0a

7b:1a6b:2a 5b:3a

4b:4a

3b:5a

2b:6a

1b:7a

0b:8a0

200

400

0 200 400 600Alelo de referência (a)

Alel

o al

tern

ativo

(b)

Prob. indiv.

0.250.500.751.00

Genótipo●

aaaaaaaaaaaaaaabaaaaaabb

●●●

●● ●

●●

●●

● ●

●●●● ●

●●

●●●

● ●● ●

●●

●●

●●●

●●●

●●●●

●●

●●

●● ●●

●● ●

●●

● ●●●

●●

●●

●●

● ●● ●●

●●●

●●●●●

●●

●●

●●● ●● ●●

●●

●●

●●

●●

● ●

● ●

●●●

●●

● ●

●●

●●●

●●

●●●●

●●

●●

● ●●

● ●●

●●

●●

● ●●

●●●●●

● ●

● ●

●●● ●●

6b:0a5b:1a 4b:2a

3b:3a

2b:4a

1b:5a

0b:6a0

2000

0 2000 4000Alelo de referência (a)

Alel

o al

tern

ativo

(b)

Genótipo●

aaaaaaaaaaab

Prob. indiv.

0.250.500.751.00

C) SCBFAD1089H10_156 (Ploidia 10; Prob. = 0,83) D) SCBFLR1060D02_354 (Ploidia 12; Prob. = 0,77)

B) SCACCL6008F10_430 (Ploidia 8; Prob. = 0,99)A) SCACLR2022G02_123 (Ploidia 6; Prob. = 0,99)

Figura 3 – Exemplos de marcadores baseados em GBS em população de mapeamento de cana-de-açúcarclassificados pelo software SuperMASSA. Probabilidades superiores a 0,80 caracterizarambons locos como em A, B e C que foram bem classificados nas ploidias 6, 8 e 10, respectiva-mente; loco D foi classificado na ploidia 12, mas com probabilidade inferior a 0,80

Aqui, foram usados os mesmos critérios ad-hoc de Garcia et al. (2013) para classificar

cada loco em uma categoria de qualidade baseada na probabilidade a posteriori para cada

ploidia: categoria “A” incluiu locos com a probabilidade a posteriori maior que 0,80, categoria

“B” reuniu locos cuja soma das duas maiores probabilidades a posteriori foi maior ou igual a

0,80 e, finalmente, categoria “C” incluiu todos os outros casos. A categoria “A” representou,

em média, 60,4% dos locos para todas as ploidias (Figura 4), o qual foi menor que os 77,6%

dos dados baseados em Sequenom previamente estudados (GARCIA et al., 2013). De fato,

esperava-se que os dados de contagem de leituras de GBS trouxessem alguma piora devido à

ampla cobertura genômica ou aos eventuais artefatos técnicos. Apesar dessa redução, todavia,

grande parte dos locos puderam ser posteriormente explorados para propósitos de mapeamento.

Para fins de construção de mapa genético, foram selecionados os locos classificados

nas categorias “A” e ploidias variando de 6 a 14, representando 40,7% locos, em média, do total

analisado no SuperMASSA ou de 3.433 a 15.906 marcadores dependendo da referência (Tabela

52

20(73.4)

20

18

16

1412

10

8 6

4

20(14.7)

14

12

10(11.7)

86(26.7)

4(14.8)

20(75.9)

1814

12 10 8

20(11.5)

18(9.4)

16

14

12(10.5)

10(17.2)

8(19.6)

6(14.2)

4(5.5)

20(13.2)

18

16

14

12(5.8)

10(13.6)

8(18.7)

6(26.5)

4(16.0)

2

20(74.9)

1620(12.4)

18

16(8.3)

14

12(10.2)

10(16.9)

8(16.8)

6(12.0)

4

20(15.1)

16

14

12(6.7)

10(15.0)

8(18.0)

6(24.7)

4(13.0)

2

20(71.9)

12

20(10.8)

18(8.6)

16(6.5)

14(7.4)

12(11.6)

10(18.0)

8(18.7)

6(14.0)

4

20(12.6)

16

14

12(6.0)10

(15.0)

8(19.6)

6(25.8)

4(13.9)

2

Metil-filtrado Sorgo RNA-Seq SUCEST

A (61.8%) B (25.6%) A (61.7%) A (59.1%)

C (12.6%) B (26.7%) C (11.6%) C (13.7%)B (27.2%)

C (13.7%

)A

(59.1%)

B (27.2%

)

Figura 4 – Níveis de ploidias com maiores probabilidades a posteriori para cada referência utilizada nomapeamento de tags de GBS em população de mapeamento de cana-de-açúcar. Equivalendoàs áres dos retângulos e entre parênteses, a proporção relativa de cada ploidia ou categoriasde qualidade. Categorias “A” e “B” incluíram locos com a maior ou a soma das duas maioresprobabilidades a posteriori superiores ou igual a 0,80, respectivamente, enquanto categoria“C” incluiu todos os outros casos

10). Adicionalmente, esses locos de boa qualidade e ploidia razoável foram caracterizados

quanto à dosagem. Marcadores em doses única (do inglês, single dose markers – SDMs) e múl-

tipla (do inglês, multiple dose markers – MDMs) foram igualmente representados pelos dados

de GBS, com cerca de 50% cada, em média. Garcia et al. (2013) encontraram uma baixa pro-

porção (30,5%) de marcadores segregando em dose única na população experimental de cana-

de-açúcar que estudaram. Ou seja, a maioria dos marcadores segregaram, de fato, em doses

superiores, as quais ocorrem quando as configurações nos genitores diferem dos cruzamentos

aaaaaaab × aaaaaaab (segregação 1:2:1) e aaaaaaaa × aaaaaaab ou aaaaaaab × aaaaaaaa

(segregação 1:1), por exemplo, no caso octaploide. Assim, quaisquer cruzamentos de genó-

tipos com doses superiores e, portanto, diferentes dos casos nuliplex (aaaaaaaa) e simplex

(aaaaaaab), provaram-se ser mais frequentes.

Como um critério de controle final de qualidade dos dados de GBS, foram selecionados

somente SDMs cujas medianas de todas as probabilidades a posteriori individuais foram mai-

ores que 0,80. Esse critério ad-hoc objetivou garantir que os locos usados no mapeamento

genético tivessem, pelo menos, 50% dos indivíduos com elevada probabilidade (superior a

0,80) de estarem em determinados clusters para uma dada ploidia. Dependendo do número

de clusters, SDMs foram classificados como segregando nas razões 1:2:1 (três clusters) ou 1:1

53

(dois clusters). Em média, a percentagem que representaram cada classe de segregação foram

16,4% e 83,6%, respectivamente.

Tabela 10 – Locos selecionados com boa qualidade (categoria “A”) e ploidia razoável (de 6 a 14) classi-ficados como marcadores em doses única (SDMs) e múltiplas (MDMs) a partir de GBS empopulação de mapeamento de cana-de-açúcar. SDMs selecionados foram adicionalmentecaracterizados quanto ao padrão de segregação na população de mapeamento

Referência TotalDosagem SDMsa

selecionadosPadrão de segregação

MDMs SDMs 1:2:1 1:1

Genoma metil-filtradoda cana

15.906 7.014(44,1%)

8.892(55,9%)

5.266 912(17,3%)

4.354(82,7%)

Genoma do sorgo 11.789 5.784(49,1%)

6.005(50,9%)

3.433 605(17,6%)

2.828(82,4%)

Transcriptoma da canavia RNA-Seq

9.808 4.959(50,6%)

4.849(49,4%)

2.869 469(16,4%)

2.400(83,6%)

Sequências do projetoSUCEST

3.433 1.736(50,6%)

1.697(49,4%)

983 141(14,3%)

842(85,7%)

Nota: aSDMs com mediana de todas as probabilidades a posteriori individuais > 0,80

A redundância de SDMs selecionados foi inspecionada após filtragem de ploidia e qua-

lidade e com os genótipos já codificados como a, ab e b. Comparavelmente, todas as referências

mostraram níveis bastante similares de redundância dentro e entre elas (Figura 5). Por exemplo,

basicamente o mesmo nível geral de 22,7% para redundância dentro de referências foi encon-

trado. Somente 84 marcadores foram atribuídos igualmente para todas as quatro referências,

representando 3,8% de cada. Já entre quaisquer três referências, 13,7% dos locos foram dados

como ambíguos. Finalmente, redundância foi amplamente verificada entre referências pareadas,

representando 20,2% de cada referência. Interessantemente, as referências forneceram, em

média, 39,6% de novos locos, cada. Mantendo somente uma única chamada para cada marcador

redundante, um total de 7.049 locos de GBS foram levados ao mapeamento.

Finalmente, é importante mencionar que apesar de este número (7.049) ser apenas ∼7%

do número útil de locos marcadores obtidos via GBS em sorgo (100.291), este tipo de genoti-

pagem já se mostra promissora para cana-de-açúcar, considerando as laboriosas genotipagens

em gel ou em Sequenom, as quais fornecem, geralmente, uma menor quantidade de dados.

Além disto, GBS, até onde é sabido, foi utilizado pela primeira vez em cana neste trabalho e

revelou-se uma opção com melhor custo-benefício quando comparado a outras metodologias

de genotipagem de SNPs em geral.

3.2.2.3 Marcadores baseados em géis

54

Metil-filtrado

Sorgo

RNA-Seq

SUCEST

400

800

1200

1600

2000

2400

280032003600

4000

4400

4800

5200

400800

1200

1600

2000

2400

2800

3200

400 800 1200 16002000

2400

2800

400800

Figura 5 – Gráfico circular mostrando redundância entre marcadores em dose-única obtidos a partir dequatro referências usadas para mapear tags de GBS de população de mapeamento de cana-de-açúcar. Regiões em vermelho representam redundância dentro de cada referência, enquantoregiões em verde, laranja e azul representam, respectivamente, redundância entre quatro, trêse duas referências. Regiões remanescentes em cinza representam locos exclusivos para cadareferência

Um total de 999 fragmentos polimórficos foram gerados pelos marcadores SSRs e

TRAPs, sendo 451 (45,2%) e 548 (54,8%) marcadores testados para as segregações de 3:1 e

1:1, respectivamente. Do total, 499 (49,9%) marcadores desviaram desses tipos esperados de

segregação; assim, os 500 locos não-distorcidos foram levados à análise de ligação. Oliveira et

al. (2007) e Pinto et al. (2009), por exemplo, trabalhando com populações segregantes de cana-

de-açúcar e marcadores de mesma natureza, também relataram proporções semelhantes de mar-

cadores distorcidos. Esse elevado número de marcadores distorcidos no cenário de genotipagem

qualitativa em poliploides é esperado e bem conhecido. De fato, há inúmeras maneiras de locos

com doses superiores segregarem (RIPOL et al., 1999); no entanto, marcadores baseados em

géis apresentam eficácia irrelevante em acessar tal informação. Já SNPs, por serem bialélicos e

codominantes, conseguem distinguir indivíduos heterozigóticos. Em cana-de-açúcar, todavia, a

55

proporção dos alelos e a ploidia variam de loco para loco (GRIVET; ARRUDA, 2002; GARCIA

et al., 2013).

Os SNPs com segregação esperada de 1:2:1, na verdade, contêm indivíduos heterozigó-

ticos com genótipos que variam de abbbbbbb (1 a’s : 7 b’s) até aaaaaaab (7 a’s : 1 b’s), no caso

de um loco octaploide, por exemplo. Para marcadores dominantes, como os SSRs, todas essas

classes de heterozigotos ficam confundidas com aquela do alelo dominante (presença de banda),

dando origem à segregação esperada de 3:1. Isto justificaria, inclusive, a elevada distorção de

segregação de marcadores baseados em géis até então observada, uma vez que genotipagem

qualitativa falha em caracterizar precisamente as doses alélicas. Para o caso dos SNPs, essas

considerações sobre a segregação, por sua vez, já foram incorporadas ao modelo de populações

F1 segregantes de chamada de genótipos do SuperMASSA e, por isso, as segregações dos locos

selecionados não foram testadas.

3.2.2.4 Mapa genético

O mapa genético para a população de cana-de-açúcar foi construído a partir da análise

no software OneMap de 7.549 marcadores no total, sendo 7.049 marcadores baseados em GBS

e 500 marcadores baseados em géis. Para cana-de-açúcar, esse total de marcadores pode ser

considerado bastante satisfatório. Deste total, foram alocados no mapa 993 (13,1%) marcado-

res, dos quais 934 provieram de GBS e os 59 restantes representavam regiões microssatélites

genotipadas; nenhum loco TRAP foi mapeado nesta análise. Quanto às classes de segregação,

foram mapeados 254, 15, 518 e 206 marcadores dos tipos ‘B3’, ‘C’, ‘D1’ e ‘D2’, respectiva-

mente. Os marcadores distribuíram-se ao longo de 223 grupos de ligação (GLs) e cobriram

um total de 3.682,05 cM (Figura 6), determinando uma elevada densidade média de 3,71 cM

quando comparado a outros trabalhos (PASTINA et al., 2010). Os tamanhos dos GLs variaram

de 1,06 cM (GL 70) a 235,67 cM (GL 46), com uma média de 16,51 cM; 56 GLs apresentaram

tamanhos menores que 2 cM, 95 GLs exibiram tamanhos maiores ou iguais a 2 cM e menores

que 10 cM, e os 72 GLs restantes tinham tamanhos maiores ou iguais a 10 cM. Distâncias

superiores a 15 cM entre pares de marcadores consecutivos foram observadas em pouco mais

de 10% dos casos, representando pouquíssimos gaps.

Apesar de o aproveitamento das marcas ter sido relativamente baixo, esses números

demonstram que, para cana-de-açúcar, este mapa pode ser considerado denso e saturado. A

taxa de aproveitamento de 13,1% refere-se, principalmente, ao cuidadoso descarte de marcado-

56

res redundantes e à exclusão de locos distantemente alocados quando da primeira ordenação.

Recentemente, Aitken et al. (2014) desenvolveram um mapa para cana baseado em marcadores

do tipo Diversity Array Technology (DArT), com uma densidade aproximada (4,3 cM), mas

um número superior de marcadores (2.267); neste caso, nenhum tratamento foi realizado para

evitar o mapeamento de marcadores redundantes, bem conhecidos para as plataformas de ge-

notipagem em larga escala. Adicionalmente, o presente trabalho incluiu marcadores do tipo

‘B3’, o que, dentre os mapas de cana existentes na literatura, apenas o esboço apresentado por

Marconi (2011) contaram com o acréscimo desse tipo mais informativo de marcadores, obtidos

a partir da genotipagem quantitativa do Sequenom. Essa classe de segregação em populações

F1 segregantes contribui importantemente com a integração dos grupos de ligação, a qual, em

cana, era limitada aos marcadores do tipo ‘C’, dominantes e, portanto, menos informativos (WU

et al., 2002a).

De modo geral, poucas inversões na ordem dos marcadores em relação ao genoma do

sorgo foram observadas, como, por exemplo, nos GLs 1, 2, 71, 83 e 117; nesta avaliação,

pequenas inversões locais foram desconsideradas porque o tamanho da população limita a cor-

reta estimação de fração de recombinação entre marcadores muito próximos. Considerações

semelhantes a estas foram apresentadas por Guimarães, Sills e Sobral (1997) e Aitken et al.

(2014), por exemplo.

A Figura 6 exibe a distribuição dos GLs agrupados em 18 grupos de hom(e)ologia

(GHs), obtidos a partir das origens genômicas comuns dos locos mapeados em diferentes GLs.

O número de GLs alocados em GHs variou de dois a cinco, sendo o maior GH contendo 44

marcadores (GH 11), e o menor contendo sete marcadores (GH 18). Ainda, os GLs foram reu-

nidos em grupos de sintenia (GSs) com sorgo, baseando-se na distribuição dos locos oriundos

de GBS usando como referência o genoma dessa espécie; aqui, a numeração dos GSs refere-

se ao cromossomo do sorgo do qual os locos se originaram. O número de GLs em cada GS

variou de nove (para o GS 6) a 21 (para o GS 1). De fato, o maior número de locos (53) de cana

originados do alinhamento contra o genoma do sorgo foi obtido para o cromossomo 1, enquanto

o menor número de locos (18) estava disponível para o cromossomo 6. Eventualmente, GSs

apresentavam locos originados de outros cromossomos que não daquele da maioria dos locos.

Por exemplo, locos originários do cromossomo 8 do sorgo também foram encontrados nos GS

2, 3 e 9. O GS 8, por sua vez, também evidenciou locos representantes dos cromossomos 1,

2, 3 e 4 do sorgo. Finalmente, nos GS 3 e 9, locos originários dos cromossomos 1 e 7 e dos

57

cromossomos 5 e 8 foram detectados, respectivamente.

Muito embora as qualidades dos mapas de cana atuais sejam limitadas pelas metodolo-

gias de genotipagem e mapeamento que desconsideram as múltiplas doses, algo já se especulou

sobre a evolução do genoma de Saccharum quando comparado ao de sorgo. Aitken et al. (2014)

observaram que eventos de translocação ou, ainda, fusões entre porções cromossômicas teriam

ocorrido em cana entre regiões equivalentes no sorgo como, por exemplo, entre os pares de cro-

mossomos 2–8 e 5–6, o que teria determinado a redução do número básico de cromossomos de

x = 10 em sorgo para x = 8 em S. officinarum. De fato, as hipóteses envolvendo translocações

seguem alguma tendência nos estudos comparativos sorgo-cana. Por exemplo, além da translo-

cação entre os cromossomos 2–8, já anteriormente relatado por Dufour et al. (1997), Ming et al.

(1998) identificaram outros putativos eventos cromossômicos em cana, como aqueles entre os

pares de cromossomos 2–4, 6–7 e 7–8, correspondentes em sorgo. Essa variação, identificadas

ora em genótipos das espécies, ora em híbridos, parece guardar uma certa especificidade dos

indivíduos avaliados, de tal modo que definir, até o momento, um padrão de evolução geral para

o gênero permanece indeterminado. Estudos dessa natureza (baseados em mapa de ligação) só

apresentarão o devido respaldo genético-estatístico quando da utilização de mapas baseados na

informação de doses múltiplas dos marcadores moleculares.

58

mf169280_4530.00

mf107365_1630:rna66593_107917.25

sb1_7123462833.72

mf6005_4200sb1_6946857053.50

sb1_70966878:SCRUFL3064D01_612mf4471_369769.22

mf139503_870:sb1_73150959:rna93460_274684.90

GL 1sb1_56663420.00

mf167018_570:sb1_4518545:rna76920_38516.92mf187608_48930.91sb1_879499431.01mf163283_68242.91

mf37718_902:sb1_1252358761.48

GL 2SCMCRT2105C02_5630.00rna70357_1480.79rna87007_113913.90

mf88388_535:sb1_17903786:rna73930_68529.51mf19957_1893mf19957_1913mf19957_1917mf19957_1899

48.74

GL 3mf21975_19070.00

sb1_3163177719.43sb1_31631788sb1_3163177820.13

mf157160_75831.98mf60753_201542.62mf60753_201343.33

GL 4 GS 1

mf130222_16:sb1_92051700.00

mf94307_1830:sb1_1028494415.53mf94307_1834:sb1_10284940mf94307_1831:sb1_1028494317.88

mf94307_1842:sb1_1028493223.18mf10516_2074:sb1_11491234:rna85024_402338.36

GL 5

mf134350_155:sb1_9184184:rna84395_10770.00

sb1_918419319.34

mf62649_24629.62

GL 6

sb1_601246650.00sb1_601246819.08sb1_6012468210.25

GL 7mf90402_2018:rna62695_1552sb1_265796360.00

mf90402_20219.97

GL 8sb1_56376790.00sb1_56376763.66mf137319_11235.07

GL 9

rna80099_135sb1_122110260.00

mf111813_19663.13

GL 10SCJLAM1062A07_5090.00SCJLAM1062A07_5060.37sb1_144559813.05

GL 11SCPIRT3023C11_4880.00mf124912_1103:sb1_31631838:rna91673_8600.70SCPIRT3023C11_4872.82

GL 12 sb1_38520340.00sb1_38520221.18mf131701_5751.95mf131701_5692.73

GL 13 mf775_18110.00mf775_18220.38sb1_613565381.94sb1_613565542.33sb1_613565392.71

GL 14

mf4847_1669:sb1_611263030.00mf4847_1648:sb1_611262821.13mf4847_1651:sb1_611262852.27

GL 15

sb1_33002930.00sb1_33002941.45mf97741_20372.17

GL 16mf57100_839:sb1_24294765:rna41137_1110.00sb1_242947831.42mf57100_855:rna41137_942.13

GL 17 sb1_566768910.00sb1_566769090.39sb1_566768760.79sb1_566769181.98

GL 18sb1_571794610.00mf249421_1760.72rna91551_37281.45

GL 19mf3236_150:sb1_536918390.00SCAGFL1090E04_3650.71rna54097_51.43

GL 20rna87586_8570.00mf129219_3930.36sb1_84908961.07

GL 21

mf39868_13700.00

sb4_9379sb4_938019.48

sb4_934230.68sb4_936532.27

GL 60sb4_525223090.00

mf170396_190:rna84921_21517.72mf170396_185:rna84921_21018.44mf257741_115:rna90037_247527.62

GL 61mf65289_17450.00

sb4_6674042913.65

sb4_6001292124.80

GL 62mf103825_20170.00rna93080_1385.40sb4_1732798.26

GL 63mf171030_1810.00mf171030_1800.39sb4_4524455sb4_45244034.93

GL 64sb4_615024050.00sb4_615024110.74sb4_615024131.48sb4_61502406sb4_615024042.21

sb4_61502383sb4_615023973.69

GL 65sb4_608540520.00mf138957_559:SCSGFL1082C12_410.72mf138957_516:SCSGFL1082C12_841.07sb4_608540091.78

GL 66

sb4_525653510.00sb4_52565299sb4_525653160.83

sb4_525653121.67

GL 67mf30676_1567:sb4_620997640.00mf30676_1558:sb4_62099756mf30676_1562:sb4_620997690.77

mf30676_1566:sb4_620997651.54

GL 68sb4_553859400.00sb4_55385923sb4_55385921sb4_55385945

0.70

sb4_553859351.41

GL 69sb4_579499870.00sb4_579499880.71mf131190_981:rna109043_2421.06

GL 70

GS 4

GS 2

GH 1sb2_732509370.00

sb2_6770847415.17sb8_175513728.50sb8_175517728.89mf162663_77633.99

SCEPRZ3085A05_49552.05rna36509_31654.90

GL 26sb2_648505630.00sb2_648506088.50

sb2_6429561827.64mf21649_2398:rna77227_94828.35

GL 27

mf22998_1819:sb2_45124456:rna61362_140.00

sb2_936374419.20sb2_9363737mf25477_208319.57

GL 28sb2_618828380.00sb2_618828533.87sb2_618828699.73rna89739_220111.21

GL 29sb2_3921697:rna23776_2470.00sb2_3921699:rna23776_230rna23776_2515.91

GL 30rna85603_2350.00sb2_657345970.37rna85603_2415.65

GL 31mf156030_349:rna80420_5430.00mf156030_340:sb2_62761717:rna80420_5341.43sb2_627617473.57mf156030_370:rna80420_5644.29

GL 32

sb2_88892160.00sb2_88892030.80sb2_88892101.59sb2_88892152.79

GL 33mf131707_782:rna77205_1590.00sb2_765509920.71sb2_765510172.13

GL 34sb2_595318990.00mf124769_1818:rna70639_4930.70SCJFFL1C04F08_4962.11

GL 35rna64404_3560.00mf26733_297:SCJLRT1020F05_2411.01sb2_25888381.99

GL 36

mf1902_5201:sb2_60552980.00mf1902_52220.75sb2_60553191.50

GL 38mf23383_1362:sb2_712262040.00mf23383_1360:sb2_712262020.72mf23383_1361:sb2_712262031.45

GL 39sb2_24520560.00sb2_2452096sb2_24520841.43

GL 40

mf140205_336:sb2_702998910.00mf140205_338:sb2_702998930.82sb2_702998851.64

GL 37

mf252507_1510.00

mf126424_1540:sb2_72296849:rna28296_10717.02mf297207_259mf297207_27527.20

rna95936_16427.89rna95936_18028.58sb2_66149510mf63081_231:rna59405_74347.46

GL 22

sb2_722968840.00sb2_722968570.72mf126424_1505:rna28296_721.44

GL 23

mf43680_1882:rna87845_18760.00

sb2_7620146113.65

mf135308_198:rna87035_96425.05

rna36483_8136.48

mf28963_593:rna71428_89851.03

GL 24sb2_699012880.00sb2_699012850.69rna36483_9810.69

GL 25

GH 2

sb4_50271830.00

mf152767_34:sb3_4681905915.74

sb3_754682933.91

rna90267_78749.74

mf148614_22:sb2_74689463:rna63124_33967.49

mf22704_278685.30rna75825_47797.54mf116093_1952106.44mf209_8523sb7_31444384120.45

mf48310_1950:rna31514_183136.03rna94083_4829mf298625_214145.60

mf23282_1264151.93mf131549_185155.04mf118315_112157.05mf263837_508161.91sb1_29954416sb1_29954417169.51

mf125302_409179.25rna38643_345186.05rna63025_162189.09sb8_11128174SCQGLV1017E09_203191.96

mf134709_228202.97rna66129_815217.89mf25719_1557235.67

GL 46

SCCCRT3007D12_3980.00

mf14674_2118.27mf14674_2819.00

SCSFAM1074E10_28737.26mf16592_376646.70

mf19574_311158.15SCBGLR1118F03_32969.37sb3_7260737070.96

mf15382_3593:rna114756_6888.91

GL 47

sb3_8202819:rna88371_780:SCQGLB2043C04_1620.00

mf248692_52219.36mf248692_49026.95

SCB63-742.98SCB63-246.91

sb3_545448863.81

GL 48mf254640_4590.00

mf138324_67117.66sb3_6659976918.47

GL 49mf246042_62:rna93296_28140.00sb3_56913329.91sb3_569135610.27sb3_569138010.63

GL 50

rna34626_189sb3_725538200.00

sb3_725538155.98

GL 51

sb3_55933875mf94888_14990.00

mf94888_14950.75mf94888_14961.49mf94888_15032.24sb3_559338722.99sb3_559338763.36sb3_559338603.73sb3_559338534.48sb3_559338665.22

GL 52

sb3_541826sb3_5418040.00

rna79964_14653.66

GL 53mf181373_1970.00sb3_630801281.44sb3_630801363.40

GL 54rna84713_16870.00mf24938_2197:sb3_61684818:rna84713_17370.76rna84713_16863.06

GL 55

rna51833_2240.00sb3_535985122.26mf11846_19623.01

GL 56sb3_13926600sb3_13926569sb3_13926603

0.00

mf59691_1832:rna26746_82mf59691_1822:rna26746_751.55

GL 57sb3_60020720.00sb3_60020940.78sb3_60020901.55

GL 58sb3_31624110.00sb3_31624100.35sb3_31624120.69sb3_31624161.38

GL 59

mf161288_935:sb3_710131600.00

sb1_780073214.56

SCC132-629.06

IISR95-546.31SCA07-154.49

mf23980_653:rna50826_832:SCRLFL8050C11_15371.23

GL 41

mf229549_3010.00mf229549_2820.71

mf24082_241:sb1_7645431:rna71461_58420.22mf95450_36529.65SCB14-436.00

IISR95-647.69

rna8915_6164.09

GL 42

mf161288_908:sb3_71013188mf161289_60.00

mf161288_909:sb3_710131830.71mf161288_912:sb3_710131841.43rna8915_762.17mf25124_261320.89mf25124_2612mf25124_261421.82

GL 43

mf173375_331:sb3_66175806:rna67765_4890.00mf173375_332:rna67765_4880.70sb3_7147926313.54

mf5834_3222:sb3_70642404:rna71341_94326.54mf202254_62034.75

mf122751_58756.27

GL 44

sb3_661758050.00sb3_661757751.41mf173375_299:rna67765_5222.82

GL 45

GS 3

GH 3

GH 4

mf164660_3530.00

mf301119_48419.34

rna8917_35432.01

sb5_6191696645.07mf72170_9054.34

sb5_5738716971.30

GL 75mf13004_11980.00

mf20099_3409:rna26005_15912.55

sb5_149103123.13

GL 76mf187824_657mf187824_6560.00

sb5_540576610.30

GL 77sb5_613223900.00sb5_613223990.78mf19346_6203.99mf19346_6045.54rna81267_16987.89

GL 78sb5_485335760.00sb5_485335840.74mf74936_1372.21

GL 79

rna82296_3800.00rna82296_3820.73sb5_591940871.51

GL 80SCCCFL4094B12_666mf91913_1896:sb5_51126366:rna56836_4680.00

mf91913_1903:sb5_51126359:rna56836_4610.71mf91913_1854:rna56836_5101.43

GL 81sb5_122188000.00sb5_122187960.87sb5_122187941.31

GL 82

CIR12-10.00sb5_410760714.50rna93602_173027.20mf20704_179728.78rna93602_170529.17sb5_410758229.96sb5_2327923235.83mf20704_169447.12

GL 71mf186657_5730.00

mf77182_198914.22

mf186657_54125.81CIR12-331.41

GL 72CIR12-50.00rna67380_196710.10sb5_192241910.53mf68117_47210.97mf68117_49611.40rna67380_194312.26sb5_192244313.13

GL 73

rna87132_16110.00CIR12-62.13SCB258-88.79

GL 74

GS 5GH 5

Figura 6 – Mapa genético de cana-de-açúcar exibindo a distribuição dos grupos de ligação (GLs) aolongo dos grupos de hom(e)ologia (GHs) e de sintenia com o sorgo (GSs). Marcadores cor-respondendo a cada cromossomo do sorgo foram destacados em cores diferentes (continua)

59

SCMCFL5007H09_5300.00mf128725_768:rna87743_4750.75

mf70623_178717.12

mf71727_80530.80

SCB190-247.83SCA53-1256.18

SCA53-1466.68

GL 149

mf53133_20430.00

SCA53-717.25rna90367_97820.09

GL 150

SCA53-40.00IISR88b-83.92SCB190-36.09SCB190-47.85SCRUFL1115F07_51919.71

GL 151

mf21505_16230.00IISR88b-18.60SCB259-214.25

GL 152

mf144619_10920.00rna79698_909:SCEQLR1050H07_1741.44SCEQLR1050H07_162rna79698_896SCEQLR1050H07_161rna79698_897

11.08

rna79698_880SCEQLR1050H07_14511.85

GL 153rna79698_879SCEQLR1050H07_1440.00

SCEQLR1050H07_1631.82

GL 154

rna79698_845SCEQLR1050H07_1120.00

mf173918_2011.68

GL 155

mf162072_2970.00SCA61-59.27CIR14-413.21

SCC22-528.58

GL 156

rna91193_34180.00rna91193_33660.35SCA61-68.68

GL 157

sb6_540729390.00

mf199486_43417.45mf269343_59128.12mf269343_59228.93rna82667_111238.06mf82223_280:rna88090_185:SCEZHR1085D06_6749.38

mf105220_65:sb6_61885140:rna67771_13963.96

GL 85mf25152_18900.00

rna85834_52311.25

mf259257_35:sb6_5989170822.30

sb6_5561058237.85

mf133566_536:sb6_53739371:rna67333_880:SCJFRZ2025B05_49954.43

GL 86

mf169609_363:sb6_56756053:rna91834_30550.00

mf29338_212912.92rna67575_78723.07

GL 87sb6_610334070.00sb6_610333946.60sb6_610333936.95

GL 88sb6_558180570.00mf9329_1462.36mf9329_1423.94mf9329_1434.73

GL 89

sb6_548023660.00sb6_548023670.77rna84162_5043.10

GL 90sb6_528210290.00sb6_52821016:rna91909_23170.74rna91909_23201.47

GL 91

mf101931_19740.00mf101931_19751.52

SCB45-1517.09

mf66100_2040:rna76662_57630.24mf193065_406:rna91599_57738.51

sb6_6084316054.38

mf138081_984:sb6_58911526:rna92992_550574.29

sb6_5342415593.80mf21210_3491105.62rna65009_82109.73SCEQRT1031B01_43110.67mf130399_989:rna91800_3110122.76sb6_61974231124.21

GL 83mf96855_108:rna89108_195:SCJFRT2060G09_1210.00

SCB45-111.18mf52262_851:rna62110_4720.03

GL 84 GS 6

GH 6

rna6636_2450.00rna6636_2340.42mf213219_629.81mf134347_151:rna85085_32418.02mf134347_161:rna85085_33418.71sb8_505875831.85sb8_505870333.22rna89226_22734.59sb8_259626946.77

sb1_49067072:rna84746_22566.84

mf98396_3285.80

sb3_66052657104.70

GL 116

sb8_546925210.00rna19848_58511.33rna19848_58412.69mf89788_1742:rna11183_5723.51

mf129609_497:sb8_45219409:rna53230_47635.54sb8_4846797048.99mf1831_65063.83sb8_5482088263.93sb8_5482090264.03

GL 117

rna83196_1540.00mf298048_1541.58rna66703_4346.96mf259847_4648.57SCC21-613.41mf266703_60:sb8_236517223.04SCSFFL4015F07_61625.28SCSFFL4015F07_599SCSFFL4015F07_57139.50

GL 118mf260672_3170.00mf260672_3190.76sb8_549990124.04

GL 119

rna86526_765sb8_550447790.00

rna86526_7421.53rna86526_7573.82

GL 120

mf225694_1650.00mf225694_1820.38sb8_320496021.92

GL 121

rna104430_1220.00rna104430_1474.94rna104430_1485.39rna104430_1326.30rna104430_146sb2_28015127.64

sb2_28015118.75sb2_28015099.86IISR46b-629.20SCC96-135.06sb8_4906560454.46mf124476_599:rna77118_134455.90mf108148_190371.70mf108148_190172.41rna116131_13184.75rna116131_12185.37sb2_5255003986.02mf22144_274:rna77309_2394102.34mf22144_299:rna77309_2419102.69SCQSAD1059D04_643mf137176_704:rna91243_1488117.91

SCQSAD1059D04_598118.57mf273365_290:rna59310_367130.18SCQGLB2041C03_184141.98

GL 106mf211484_5540.00

sb8_5386734213.00rna94088_7117.67mf17498_330327.68SCC84-437.68SCC84-744.25CIR24-148.84mf59476_3558.98

GL 107

SCC96-20.00

SCB58-0612.33

SCB58-0124.09

CNL170-340.90

GL 108

rna94088_137rna94088_1270.00

SCSBRT3036H07_372.00

SCSBRT3036H07_6518.56

GL 109

SCB65-40.00CIR24-49.32SCC96-511.28SCB374-313.24

GL 110

rna35352_950.00mf148031_160:sb8_458213381.22mf22378_14029.10SCB330-211.13SCB285-415.27mf144424_184:sb4_64604262:rna85911_164629.56

GL 111

SCA09-140.00CIR36-14.09SCB330-88.87

GL 112sb8_45821370mf148031_1920.00

mf148031_1892.21

GL 113

mf298048_1140.00mf298048_1150.87mf298048_1091.74

GL 114mf117247_70:sb8_29496080.00rna90411_5390.39rna90411_5520.78mf117247_83:sb8_29496211.17

GL 115

GS 8

GH 12 GH 13GH 11

SCJLFL1048B12_150.00mf82770_569:rna75593_23215.91sb7_900492814.13mf82770_522:rna75593_236814.85mf82770_536:rna75593_235415.57sb7_900494216.29sb7_900497517.02

GL 92

IISR199-50.00sb7_90049243.69mf82770_518:rna75593_23724.43

GL 93

mf259069_282:rna74147_2570.00mf119068_848.13

sb7_5783777222.26

sb7_5728203937.06

GL 101mf224601_3690.00

sb7_6290503115.74

mf11972_3078:sb7_63328647:rna85308_45328.24

GL 102SCSGLV1011E12_1170.00sb7_551834900.77mf20974_3307:rna90238_16865.33

GL 103sb7_628164020.00sb7_628164520.71sb7_628164542.48

GL 104mf300799_295:sb7_4977200:rna90695_8350.00mf300799_350:sb7_4977145:rna90695_8900.38mf300799_348:sb7_4977147:rna90695_8881.15

GL 105

mf14092_35880.00

SCSGAM2076A12_44420.00rna89943_130526.09sb7_129495033.55

GL 94

rna89943_12890.00rna89943_12711.43sb7_12949842.86sb7_12949664.29

GL 95

rna73797_1790.00

mf189055_558mf189055_54419.84

mf5308_2995:sb7_6283327231.32SCB208-437.70

sb7_6359177350.01

GL 96

SCB208-70.00SCB208-6SCB208-53.71

GL 97

sb5_527789560.00

mf88506_237:rna90068_56415.10

mf228309_36226.63

mf246837_96:rna30410_33236.98mf106282_195048.05mf175158_11459.92mf175158_7160.77mf175158_11561.61mf175158_11664.12mf9343_132:rna89611_8371.97mf17470_1855:rna71385_104189.03

GL 98mf228309_3730.00sb4_103886210.72sb7_2791053mf17470_380015.52

mf17470_379924.41

GL 99

mf9343_910.00rna89611_1255.91sb7_86352246.64

GL 100

GH 9

GS 7

GH 10GH 7

GH 8

mf333_87720.00

rna69406_7313.16

mf268853_60430.17

mf70727_202743.63sb9_208249346.34sb5_1723774658.32

GL 124mf1498_2066:rna54162_4230.00rna47586_452mf271387_6016.34

SCJFFL3C06H03_32718.80mf137131_97421.04sb9_5799071625.16sb9_57990663sb9_57990665sb9_57990667

35.97

mf118637_7751.39

GL 125sb9_572485730.00mf187016_576:rna91581_959:SCJLFL3014H06_277mf187016_564:rna91581_9474.67

GL 126mf36186_1261:sb9_424728750.00mf36186_12503.68mf36186_12494.39

GL 127

mf25869_1318:sb9_49839063:SCEZRZ3051D09_140.00mf25869_13192.82mf25869_13163.52

GL 128

mf185387_660:rna92287_3094:SCJFST1012B01_4320.00mf185387_661:rna92287_3095:SCJFST1012B01_4330.72sb9_471385051.45sb9_471385042.17

GL 129mf282153_297:sb9_474917180.00sb9_474917001.51sb9_474916991.89

GL 130mf64272_3320.00sb9_542113761.09sb9_542113921.45mf64272_3251.82

GL 131mf20169_31140.00sb9_67015711.46sb9_67016131.82

GL 132

mf7015_38190.00

sb9_212971519.74

mf176614_73:sb8_81469731.89mf56267_7540.16

mf2389_10858.00rna86401_59358.73

GL 122

mf2398_1883:rna105287_1670.00mf2398_1865:rna105287_1490.74mf2398_1867:rna105287_1511.48

GL 123

GS 9

GH 14

mf145829_7660.00

SCB243-511.21

mf20333_326sb10_5784961925.40

GL 136SCACLR2022G02_125SCACLR2022G02_1230.00

sb10_554845286.58

GL 137sb10_122515710.00sb10_122515680.38mf148405_789:rna84272_8201.13mf148405_792:rna84272_8231.51SCACCL6008F10_4304.97SCACCL6008F10_4335.34

GL 138sb10_40284330.00sb10_40284180.70sb10_40284391.41mf22094_25314.23

GL 139sb10_547370410.00rna60045_2090.92mf123870_15061.84SCSGST3119G01_623.74

GL 140

mf63079_420:sb10_1569397:rna80668_16280.00mf63079_441:rna80668_16492.84mf63079_440:rna80668_16483.55

GL 141SCSBAD1085B09_5830.00SCSBAD1085B09_545sb10_16176280.35

sb10_16175903.49

GL 142

sb10_52459938rna73201_4310.00

mf39519_15983.03

GL 143SCRLFL1009B10_7000.00sb10_62975060.80mf118126_19892.25

GL 144

mf102591_1349:rna46052_48sb10_518394990.00

sb10_518395022.11

GL 145sb10_12120879mf24759_1581:rna93305_12990.00

sb10_121209090.95sb10_121208841.36sb10_121209031.77

GL 146mf5311_1337:sb10_65599310.00mf5311_1332:sb10_6559936mf5311_1331:sb10_65599330.75

sb10_65599781.51

GL 147rna81133_890.00sb10_5994690mf23869_9021.47

GL 148

mf44188_67:SCQGST3154C02_1020.00

rna89011_230416.51rna103356_4920.04mf27574_227121.56rna74863_16436.40rna78920_239mf242090_501:sb10_3101695:SCVPFL1131C02_48347.15

GL 133

SCJLFL1050E02_4840.00

mf27574_225110.53

rna89011_224420.81

GL 134

mf44188_101:SCQGST3154C02_680.00sb10_18460580.79mf44188_88:SCQGST3154C02_811.59

GL 135

GS 10

GH 15

GH 16

GH 17

GH 18

Figura 6 – Mapa genético de cana-de-açúcar exibindo a distribuição dos grupos de ligação (GLs) aolongo dos grupos de hom(e)ologia (GHs) e de sintenia com o sorgo (GSs). Marcadores corres-pondendo a cada cromossomo do sorgo foram destacados em cores diferentes (continuação)

60

SCQGFL3058A08_1130.00

SCJFRT2059D09_103617.84mf120196_201528.39mf120196_197728.77mf120196_1946:rna12237_319:SCUTSD1028G03_45239.40

rna92600_38656.99mf280385_9358.73

GL 158mf27787_19750.00

SCEZRT2021H09_21316.31mf148018_22317.85mf148333_34127.33

mf64185_203646.45

GL 159SCA68-10.00

SCA26-213.82

SCB52-125.49

SCA26-640.46

GL 160rna77255_2740.00rna77255_3140.78

mf23388_3021:sbsuper_2967_81318.03mf47373_94:rna61315_50818.04mf47373_79:rna61315_53322.88CIR23-435.72

GL 161mf180162_2610.00

rna58431_36215.93

rna57550_27234.81

GL 162SCUTHR1063C12_3230.00SCUTHR1063C12_2922.19mf126486_60411.27mf126486_60112.03rna72383_15425.93

GL 163

mf131849_4070.00mf131849_403:rna78607_588rna78607_6071.45

rna78607_593rna78607_60214.03

rna78607_59015.48

GL 164mf216115_1400.00CIR32-113.03mf1009_73239.32

GL 165rna15183_280.00rna15183_321.58rna15183_35rna15183_43rna15183_33rna15183_48

4.73

rna15183_506.30

GL 166mf173642_1650.00mf173642_185mf173642_1606.19

GL 167mf2160_19190.00mf2160_19383.83mf2160_19396.12

GL 168mf13122_3432mf13122_34570.00

rna8524_234:SCCCCL7C02A06_226rna8524_257:SCCCCL7C02A06_2014.48

rna8524_269:SCCCCL7C02A06_1915.34

GL 169

mf124850_230:rna74092_188:SCJFSB1014H04_5430.00mf124850_234:rna74092_192:SCJFSB1014H04_547mf124850_232:rna74092_190:SCJFSB1014H04_5451.48

mf124850_237:rna74092_195:SCJFSB1014H04_5505.17

GL 170mf86666_1510.00mf86666_1360.73mf86666_1481.46mf86666_1392.92mf86666_1705.11

GL 171mf20652_30600.00rna20961_24.28rna20961_15.06

GL 172rna75417_6440.00rna75417_6434.27rna75417_6454.97

GL 173mf56117_1430.00rna43594_1772.10mf56117_1193.13rna43594_1534.53

GL 174mf159535_4580.00mf159535_4860.74mf159535_4704.42

GL 175mf147639_660mf147639_628mf147639_634

0.00

rna70994_5252.22rna70994_5242.94rna70994_5274.38

GL 176

mf9631_4060.00mf9631_4553.76mf9631_4424.13

GL 177mf106436_19260.00mf106436_19111.49mf106436_19024.00

GL 178mf137130_7590.00mf137130_802mf137130_8012.11

mf137130_8033.95

GL 179mf290774_2000.00mf290774_1910.84mf290774_2423.41mf290774_2443.83

GL 180SCJLRZ3074B03_3080.00rna88469_533:SCJLRZ3074B03_3610.93SCJLRZ3074B03_3103.74

GL 181mf171029_8650.00mf171029_8610.73mf171029_8601.10mf171029_8591.46mf171029_8492.59mf171029_8483.33

GL 182mf88115_1752mf88115_1739mf88115_1763mf88115_1779

0.00

mf88115_17643.45

GL 183

mf133464_13450.00mf133464_13440.83mf133464_13723.31

GL 184rna78819_830.00rna78819_41rna78819_402.42

rna78819_593.22

GL 185mf121346_249:rna49630_7060.00SCJFFL3C03D06_51.52SCJFFL3C03D06_453.03

GL 186rna25641_327rna25641_3260.00

rna25641_3233.00

GL 187mf235706_5820.00rna82715_1220.72SCJLLR1105F05_2852.95

GL 188mf74707_1692mf74707_16900.00

SCUTST3129G07_522.18SCUTST3129G07_532.90

GL 189mf132449_7100.00rna37006_364rna37006_3691.45

rna37006_3842.87

GL 190

mf58011_1340.00mf58011_1350.71mf58011_1461.43mf58011_1402.86

GL 191mf56960_1900.00mf56960_1530.70mf56960_1882.11mf56960_1852.82

GL 192SCSGAD1143C06_7210.00SCSGAD1143C06_7240.90SCSGAD1143C06_7332.04SCSGAD1143C07_22.79

GL 193SCUTFL3075C10_2270.00SCUTFL3075C10_2170.72SCUTFL3075C10_2192.57

GL 194rna6396_1540.00rna6396_1690.82mf65519_19862.50

GL 195rna118191_1620.00mf242733_1161.53mf242733_1262.27

GL 196rna82166_28680.00rna82166_29191.22rna82166_29182.44

GL 197mf138317_3740.00mf138317_382mf138317_3610.75

mf138317_3721.50mf138317_3662.26

GL 198

mf118920_1904:rna76795_440.00mf118920_1885:rna76795_251.10mf118920_1909:rna76795_491.83mf118920_1910:rna76795_502.20

GL 199rna91851_5860.00rna91851_5820.73rna91851_5851.46rna91851_5872.19

GL 200rna76842_13350.00rna76842_12950.72mf127162_7501.45mf127162_7902.17

GL 201rna92142_32520.00rna92142_3250mf50676_101:SCEQRT2090H04_5052.16

GL 202mf145392_6420.00mf145392_6400.72mf145392_6341.44mf145392_6432.15

GL 203rna90832_21780.00rna90832_21711.60rna90832_21701.99

GL 2040.000.390.771.93

mf153107_406mf153107_404mf153107_402mf153107_410

GL 205

rna66308_2150.00rna66308_2251.16rna66308_2241.93

GL 206mf149100_3570.00mf149100_3550.39mf149100_3541.93

GL 207rna107958_330.00rna107957_3950.46mf68587_20191.37mf68587_20201.80

GL 208rna90457_17820.00rna90457_17660.85rna90457_1774rna90457_17650.86

rna90457_17711.79

GL 209mf214894_1460.00mf214894_144mf214894_1070.80

mf214894_1311.61

GL 210mf41970_6630.00mf41970_658mf41970_6521.60

GL 211

mf269642_3010.00mf269642_321mf269642_322mf269642_320

0.79

mf269642_3241.58

GL 212

mf52975_20850.00mf52975_20830.78mf52975_20671.53

GL 213

mf298305_1450.00mf298305_1540.75mf298305_1371.50

GL 214SCEQRT2101H10_920.00SCEQRT2101H10_1490.74SCEQRT2101H10_1481.48

GL 215mf284236_2410.00mf284236_2510.73mf284236_2521.46

GL 216mf238211_1010.00mf238211_1220.73mf238211_1151.45

GL 217

mf160760_127mf160760_114mf160760_113

0.00

rna42720_609rna42720_584rna42720_606

0.36

mf160760_131rna42720_602rna42720_590

0.71

mf160760_1431.44

GL 218

rna17505_124mf123864_17760.00

mf123864_1793rna17505_1411.42

GL 219

mf127973_1301:SCEPCL6021D04_3030.00SCEPCL6021D04_310SCEPCL6021D04_3081.39

GL 220

mf18436_500.00mf18436_680.37SCSFFL3092B07_1880.75SCSFFL3092B07_2051.12

GL 221rna74937_900.00rna74937_760.36rna74937_831.07

GL 222mf166881_980.00mf166881_940.71mf166881_1041.07

GL 223

Figura 6 – Mapa genético de cana-de-açúcar exibindo a distribuição dos grupos de ligação (GLs) aolongo dos grupos de hom(e)ologia (GHs) e de sintenia com o sorgo (GSs). Marcadores corres-pondendo a cada cromossomo do sorgo foram destacados em cores diferentes (conclusão)

3.2.3 Mapeamento de QTLs

Para os quatro caracteres avaliados na população de mapeamento de cana-de-açúcar

(ALT, TCH, POL e FIB), um total de 36 QTLs foram detectados utilizando as abordagens de

MIM uni- e multivariado. Os QTLs estão listados de forma resumida na Tabela 11 e QTLs em

comum nas duas análises já estão agrupados com base nos intervalos de confiança dos mesmos.

Detalhadamente, os Apêndices C e D (Tabelas 14 e 15) trazem os efeitos e suas respectivas

significâncias dos QTLs para as análises, separadamente.

Caracteres agronômicos ALT e TCH resultaram em um maior número de QTLs quando

comparados aos caracteres industriais POL e FIB. As análises para ALT e TCH determinaram

a possível existência de nove e 15 QTLs, respectivamente. Já as análises para POL resultaram

em quatro QTLs, e, para FIB, em oito. Interessantemente e de um modo geral, cada uma das

abordagens uni- e multivariada agregaram informações uma em relação à outra. Assim, por

61

Tabela 11 – Grupos de ligação (GLs) e posições (em centiMorgans – cM) dos QTLsdetectados em população de mapeamento de cana-de-açúcar utilizandomodelos mapeamento de múltiplos intervalos (MIM)

Caráter QTL GL Posição (cM) Caráter QTL GL Posição (cM)

ALT 1 1 53,5 TCH 10 122 2,02 24 1,0-51,0 11 131 0,03 43 21,8 12 133 36,44 46 181,0 13 163 0,05 83 58,0 14 167 4,0-6,06 112 0,0 16 207 0,4-1,07 117 35,5 POL 1 4 43,38 133 20,0 2 6 29,69 222 0,0 3 26 22,0-28,5

TCH 1 1 33,7-75,0 4 97 3,72 5 17,9 FIB 1 6 4,0-5,03 7 0,0 2 9 1,04 42 20,2 3 26 18,05 43 0,0-16,0 4 50 10,66 64 3,0-4,9 5 60 7,0-9,07 71 40,0 6 124 2,0-6,08 72 31,4 7 150 14,0-15,09 88 6,6 8 167 0,0

exemplo, a um único QTL em comum entre as análises (no GL 24) para ALT acrescentaram-se

cinco e três diferentes regiões exclusivas a partir das respectivas análises uni- e multivariada.

Para TCH, os dois QTLs em comum (nos GLs 1 e 167) apareceram entre nove e quatro QTLs

adicionais originados das análises uni- e multivariadas, respectivamente. Para POL, a análise

multivariada não acrescentou informações, pois os dois QTLs (nos GLs 4 e 6) já haviam sido

descobertos nas análises separadas. E, finalmente, para FIB, nenhum dos QTLs coincidiram

entre as análises.

Da análise de marcadores individualmente, foram obtidas um total de 198 associações

significativas (p < 0,01) para as médias conjuntas dos quatro caracteres avaliados, sendo 56 para

ALT, 38 para TCH, 57 para POL e 47 para FIB. Efeitos dos marcadores sobre as médias mar-

ginais para cada ambiente resultaram no mesmo conjunto de marcadores significativos basica-

mente (dados não mostrados), e foram desconsiderados nas avaliações subsequentes. Também,

apenas marcadores com informação genômica adicional relacionada ao genoma do sorgo foram

listados no Apêndice E (Tabela 16). Assim, para cada caráter restaram, respectivamente, 31, 17,

24 e 27 marcadores contendo informação útil na etapa de comparação posterior. Mapeamento

62

de QTLs baseado em análise de marcadores individualmente tem implementação simples e

rápida, e não requer que o locos estejam posicionados no mapa de ligação. No entanto, as

estimativas dos efeitos são demasiadamente enviesadas pela existência pelo desequilíbrio de

ligação não considerado porque a maioria dos marcadores simplesmente falha em agrupar-se

no mapa. Além disso, a análise não permite separar efeitos aditivos e dominantes em população

F1 segregante. Modernamente, essas avaliações prestam-se como uma análise exploratória, mas

tem sido bastante utilizada no contexto dos estudos genéticos em cana-de-açúcar.

Pastina et al. (2010) revisaram inúmeros trabalhos de mapeamento de QTLs e listaram

seus principais achados, sendo os mesmos quase sempre limitados a mapas pouco saturados

e metodologia de mapeamento baseada na análise de marcas individualmente. Além disso,

a utilização de marcadores anônimos (sem informação genômica), dificulta comparação entre

trabalhos. Já em comparação ao mapeamento na população de sorgo sacarino aqui trabalhada,

menos regiões associadas a caracteres quantitativos utilizando MIM foram encontradas na po-

pulação de cana-de-açúcar. Além da limitação dos modelos de construção de mapas genéticos

e de mapeamento de QTLs considerando doses únicas apenas, a análise em cana-de-açúcar

baseou-se em uma população com genitores relativamente pouco constrastantes.

Marcadores segregando em doses únicas são resultados de tipos muito específicos de

cruzamentos e, como observado neste trabalho e na literatura (GARCIA et al., 2013), evidências

recentes afirmam que esse tipo de segregação não corresponde à maioria daquelas passíveis de

detecção em uma população de cana. Portanto, a busca por QTLs fica, em adição, restrita

à probabilidade de os alelos dos QTLs também estarem segregando em dose única ao longo

genoma e de estarem em desequilíbrio de ligação com as regiões então amostradas por esses

marcadores. Futuramente, a construção de mapas genéticos considerando doses superiores e

a utilização modelos de mapeamento de QTLs adequados possibilitará um conhecimento mais

refinado da arquitetura genética dos caracteres quantitativos na espécie.

3.3 Mapeamento Comparativo de QTLs

As origens em comum dos marcadores baseados em GBS e a avaliação de caracteres

similares em ambas as populações possibilitaram a comparação dos QTLs mapeados. Este

alinhamento baseou-se nos marcadores SNPs e indels de cana originados a partir da utilização

do genoma do sorgo como referência quando da descoberta e genotipagem desses polimorfis-

mos utilizando o pipeline Tassel-GBS. Aqui, os GLs de cana com QTLs mapeados utilizandos

63

modelos MIM uni- e multivariados foram alinhados em relação aos cromossomos do sorgo

considerando os GSs a que pertenciam (Figura 7). Em adição, marcadores analisados sepa-

radamente, com efeitos significativos sobre as médias conjuntas dos caracteres também foram

alinhados aos cromossomos do sorgo de acordo com suas posições relativas à referência (Figura

8).

Nas figuras, é possível observar, inicialmente, a distribuição relativa dos marcadores

SNPs e indels ao longo do genoma do sorgo, com algumas regiões em branco, não cobertas por

marcadores. Esses setores sub-representados estariam, possivelmente, relacionadas às regiões

centroméricas e para-centroméricas, dentre outras, evitadas por conta da sensibilidade à meti-

lação da enzima ApeKI utilizada (ELSHIRE et al., 2011). Também, regiões repetitivas, como

são as centroméricas, costumam alinhar-se pobremente às referências, causando-lhes um viés

de representação.

Interessantemente, os conectores entre os cromossomos do sorgo e os GLs de cana

revelaram potenciais locais conservados evolutivamente envolvidos no controle genético dos

caracteres em comum avaliados nas duas populações (Figura 7). Aqui, essas regiões foram

listadas na ordem sorgo/cana com que foram nomeadas anteriormente (Tabelas 5 e 11). Para

ALT, três QTLs em regiões sintênicas puderam ser evidenciados: ALT-1/ALT-1 no GS 1, ALT-

4/ALT-3 no GS 3 e ALT-8/ALT-7 no GS 8. Com evidência indiretas, também é possível destacar

ALT-11/ALT-8 no GS 10 e, ainda, aparecem nos mesmos GSs: ALT-2/ALT-2 (GS 2) e ALT-

7/ALT-5 (GS 6). Entre PMV e TCH, três correspondências genômicas foram encontradas em

relação a PMV-4/TCH-6 no GS 4 e PMV-10/TCH-10 no GS 9; também mais distantemente

mapeados estão PMV-6,PMV-7/TCH-9 no GS 6 e PMV-11/TCH-12 no GS 10. No caso de POL,

próxima relação evolutiva parece existir para POL-1/POL-2 no GS 1, e, no mesmo GS, poderia

ser especulada uma relação entre POL-2/POL-1. Finalmente, para FIB, há evidência de con-

servação para o par de locos FIB-5/FIB5 no GS 4 e FIB-10/FIB-6 no GS 9; além destes, estão

presentes nos mesmos GSs: FIB-1/FIB-1,FIB-2 (GS 1) e FIB-2/FIB-3 (GS 2). Assim, dentre o

total de 89 QTLs mapeados nas populações de sorgo e cana, 34 (38,2%) estão envolvidos em 16

regiões putativas de conservação de controle genético para os quatro caracteres avaliados, sendo

oito regiões fisicamente mais próximas aos marcadores em comum do que as oito restantes.

Estas últimas regiões listadas podem ter apresentado complicações na comparação em função

de rearranjos cromossômicos após divergência entre as espécies.

Já os marcadores com efeitos significativos sobre as médias conjuntas dos caracteres

64

PMV-8 POL-11

Cr. 7

ALT-1 POL-1

POL-2

FIB-1

Cr. 1

mf169280_453

mf107365_1630:rna66593_1079

sb1_71234628

mf6005_4200

sb1_69468570sb1_70966878:S

CRUFL3064D

01_612m

f4471_3697

mf139503_870:sb1_73150959:rna93460_2746

ALT-1

TCH-1

GL

1

mf21975_1907

sb1_31631777sb1_31631788sb1_31631778m

f157160_758m

f60753_2015m

f60753_2013

POL-1

GL

4

mf130222_16:sb1_9205170

mf94307_1830:sb1_10284944

mf94307_1834:sb1_10284940

mf94307_1831:sb1_10284943

mf94307_1842:sb1_10284932

mf10516_2074:sb1_11491234:rna85024_4023

TCH-2

GL

5

mf134350_155:sb1_9184184:rna84395_1077

sb1_9184193

mf62649_246

POL-2 FIB-1

GL

6

sb1_60124665sb1_60124681sb1_60124682

TCH-3

GL

7

sb1_5637679sb1_5637676

mf137319_1123

FIB-2

GL

9

mf43680_1882:rna87845_1876

sb2_76201461

mf135308_198:rna87035_964

rna36483_81

mf28963_593:rna71428_898

ALT-2

GL

24

sb2_73250937

sb2_67708474sb8_1755137sb8_1755177

mf162663_776

SCEPRZ3085A

05_495rna36509_316

POL-3

FIB-3

GL

26

ALT-2 PMV-1PMV-2 FIB-2

Cr. 2

ALT-3ALT-4 PMV-3 POL-3POL-4POL-5

POL-6

FIB-3FIB-4

Cr. 3

mf161288_908:sb3_71013188

mf161289_6

mf161288_909:sb3_71013183

mf161288_912:sb3_71013184

rna8915_76m

f25124_2613m

f25124_2612m

f25124_2614

ALT-3

TCH-5

GL

43

sb4_5027183

mf152767_34:sb3_46819059

sb3_7546829

rna90267_787

mf148614_22:sb2_74689463:rna63124_339

mf22704_2786

rna75825_477m

f116093_1952m

f209_8523sb7_31444384

mf48310_1950:rna31514_183

rna94083_4829m

f298625_214m

f23282_1264m

f131549_185m

f118315_112m

f263837_508sb1_29954416sb1_29954417m

f125302_409rna38643_345rna63025_162sb8_11128174

SCQ

GLV

1017E09_203

mf134709_228

rna66129_815m

f25719_1557

ALT-4

GL

46

mf246042_62:rna93296_2814

sb3_5691332sb3_5691356sb3_5691380

FIB-4

GL

50

ALT-5

PMV-4PMV-5

FIB-5FIB-6

Cr. 4

mf39868_1370

sb4_9379sb4_9380sb4_9342sb4_9365

FIB-5

GL

60

mf171030_181

mf171030_180sb4_4524455sb4_4524403

TCH-6

GL

64

POL-7

POL-8

Cr. 5

CIR

12-1sb5_4107607

rna93602_1730m

f20704_1797rna93602_1705

sb5_4107582sb5_23279232m

f20704_1694TCH-7

GL

71

ALT-6ALT-7

PMV-6PMV-7POL-9

POL-10 FIB-7FIB-8

Cr. 6

mf101931_1974

mf101931_1975

SCB45-15

mf66100_2040:rna76662_576

mf193065_406:rna91599_577

sb6_60843160

mf138081_984:sb6_58911526:rna92992_5505

sb6_53424155m

f21210_3491rna65009_82

SCEQ

RT1031B

01_43m

f130399_989:rna91800_3110sb6_61974231

ALT-5

GL

83

sb6_61033407sb6_61033394sb6_61033393

TCH-9

GL

88

ALT-8 PMV-9POL-12POL-13POL-14

FIB-9

Cr. 8

sb8_54692521rna19848_585rna19848_584

mf89788_1742:rna11183_57

mf129609_497:sb8_45219409:rna53230_476

sb8_48467970m

f1831_650sb8_54820882sb8_54820902

ALT-7

GL

117

ALT-9ALT-10

PMV-10

POL-15

POL-16

FIB-10

Cr. 9

mf7015_3819

sb9_2129715

mf176614_73:sb8_814697

mf56267_75

mf2389_108

rna86401_593

TCH-10

GL

122

mf333_8772

rna69406_73

mf268853_604

mf70727_2027sb9_2082493

sb5_17237746

FIB-6

GL

12

4

mf64272_332

sb9_54211376sb9_54211392m

f64272_325 GL

13

1TCH-11

ALT-11ALT-12

PMV-11PMV-12

POL-17

FIB-11FIB-12 Cr. 10

mf44188_67:S

CQ

GST3154C

02_102

rna89011_2304rna103356_49m

f27574_2271rna74863_164rna78920_239m

f242090_501

:sb10_3101695

:SCVPFL1131

C02_48

3

ALT-8TCH-12

GL

13

3

0246810121416182022242628303234363840424446485052545658606264666870727476

(Mb)

0246810121416182022242628303234363840424446485052545658606264(M

b)

Figura7

–A

linhamento

dosgrupos

deligação

(GL

s)de

cana-de-açúcarem

relaçãoaos

cromossom

os(C

r.)de

sorgo.B

arrasverticais

delimitam

picosde

QT

Ls

detectadosemam

bososmapeam

entosdem

últiplosintervalosuni-em

ultivariados.Marcadoresde

cana-de-açúcarcorrespondendoa

cadacrom

ossomo

dosorgo

foramdestacados

emcores

diferentes.Réguas

lateraisestão

mega

bases(M

b)

65

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 (Mb)

ALT-1POL-1

POL-2

FIB-1Cr.

1sb

1_30

7723

5

TCH

sb1_

6035

7211

TCH

sb1_

7645

431:

mf2

4082

_241

:rna

7146

1_58

4

POL

sb1_

9236

816

POL

sb1_

1641

7625

:mf1

5545

9_26

4

POL

sb1_

1641

7644

:mf1

5545

9_24

5

POL

sb1_

3148

8584

POL

sb1_

3162

4046

:rna

1173

39_1

89

POL

sb1_

1869

6270

FIB

sb1_

50799

049:

mf1

0280

9_26

:rn

a7691

0_20

9:SCM

CSD20

59B

01_30

6

FIB

sb1_

7339

8501

:mf1

6444

2_75

4

FIB

sb1_

5267

1762

ALT

sb1_

1445

5981

ALT

sb1_

1221

9024

ALT

sb1_

4188

246:

mf1

6342

1_39

4:rn

a984

20_1

33

ALT

ALT-2PMV-1 PMV-2FIB-2Cr.

2

sb2_

22609

350:

mf1

1974

5_84

7:rn

a8027

8_84

9

ALT

sb2_

68475

923:

mf2

3247

_584

:rn

a6999

3_35

1

ALT

sb2_

7455

650

TCH

sb2_

5002

6760

TCH

sb2_

6008

2918

POL

sb2_

6054

7042

POL

sb2_

6120

2411

POL

sb2_

6205

7915

:mf4

5156

_460

POL

sb2_

6533

0382

:mf1

0732

5_50

POL

sb2_

6784

9128

POL

sb2_

6817

295

FIB

sb2_

5224

2660

FIB

sb2_

6054

7040

FIB

sb2_

6357

7008

FIB

sb2_

71421

489:

mf1

9659

9_40

6:rn

a8049

7_17

02:

SCQ

GAM

210

8C09

_244

FIB

ALT-3 ALT-4PMV-3POL-3 POL-4 POL-5

POL-6

FIB-3 FIB-4

Cr.

3

sb3_

3902

31:m

f104

21_2

34:rna

7995

7_29

7

ALT

sb3_

5418

65:rna

7996

4_14

21

ALT

sb3_

1928

213

ALT

sb3_

6126

551

ALT

sb3_

7546

835

ALT

sb3_

9286

412

ALT

sb3_

7333

7885

ALT

sb3_

8750

650

TCH

sb3_

5211

7257

TCH

sb3_

7212

8809

TCH

sb3_

2978

336

POL

sb3_

5788

3510

:mf1

9116

_195

5

POL

sb3_

5418

04

FIB

sb3_

5418

26

FIB

sb3_

5691

216

FIB

sb3_

1477

1406

FIB

sb3_

1825

9258

:mf1

4542

9_19

6:rn

a898

60_5

10

FIB

sb3_

5892

4723

FIB

sb3_

6828

7506

FIB

sb3_

7204

6711

:mf1

1840

0_18

10

FIB

sb3_

7204

6712

:mf1

1840

0_18

11

FIB

ALT-5

PMV-4 PMV-5

FIB-5 FIB-6Cr.

4

sb4_

9399

ALT

sb4_

4976

3421

ALT

sb4_

6365

4242

ALT

sb4_

6460

4253

ALT

sb4_

1732

79

TCH

sb4_

7119

89

TCH

sb4_

61731

192:

mf4

575_

1833

:rna7

8723

_91

POL

sb4_

9380

FIB

sb4_

59449

990:

mf3

033_

3849

:rna4

9437

_175

FIB

sb4_

6038

7435

FIB

POL-7

POL-8

Cr.

5

sb5_

1723

7746

ALT

sb5_

4853

3705

ALT

sb5_

4853

3707

ALT

sb5_

61994

091:

mf6

4351

_190

0:rn

a6861

2_53

9

ALT

sb5_

4806

6020

TCH

sb5_

14386

234:

mf1

3178

3_82

2:SCRUFL1

022E

03_4

14

POLsb

5_29

034

328:

mf1

4690

3_96

8:rn

a476

53_

53FIB

sb5_

5014

5700

:mf1

7681

7_63

2

FIB

sb5_

5476

0011

FIB

ALT-6 ALT-7

PMV-6 PMV-7 POL-9

POL-10FIB-7 FIB-8Cr.

6

sb6_

4503

2977

ALT

sb6_

7821

63:m

f600

82_4

3

TCH

sb6_

4503

2977

TCH

sb6_

6056

0180

:rna

9354

4_97

0

POL

sb6_

5730

5087

FIB

PMV-8POL-11Cr.

7

sb7_

5354

4684

:rna

8026

9_11

00

ALT

sb7_

7580

104:

mf3

440_

5522

TCH

sb7_

56993

024:

mf1

3213

0_27

9:rn

a926

58_

443

TCH

sb7_

3717

230:

mf1

0121

5_19

80

FIB

ALT-8PMV-9 POL-12 POL-13 POL-14

FIB-9

Cr.

8

sb8_

3123

434

ALT

sb8_

1112

8174

ALT

sb8_

5298

195:

mf1

2931

7_11

84

TCH

sb8_

5688

896

FIB

sb8_

5386

7342

FIB

ALT-9 ALT-10

PMV-10

POL-15

POL-16

FIB-10

Cr.

9

sb9_

4917

2170

ALT

sb9_

4917

2185

ALT

sb9_

4553

6069

TCH

sb9_

1087

507

POL

sb9_

4492

9840

POL

ALT-11 ALT-12

PMV-11 PMV-12

POL-17

FIB-11 FIB-12

Cr.

10

sb10

_1156

537:

mf1

7153

9_60

1:rn

a7750

0_45

8:SCJF

FL1C

08G

04_21

8

ALT

sb10

_115

6542

ALT

sb10

_326

0857

ALT

sb10

_326

0858

ALT

sb10

_899

9958

TCH

sb10

_5265

0429

:mf1

4695

7_2

46:

rna8

857

5_13

70:S

CJL

FL1

051F

07_6

36

POL

sb10

_562

9589

5

POL

sb10

_5654

0062

:rna

15848

_178

:SCBG

LB20

13E05

_99

POL

sb10

_601

3129

5

POL

sb10

_601

3129

6

POL

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 (Mb)

Figu

ra8

–A

linha

men

todo

sm

arca

dore

sco

mef

eito

ssi

gnifi

cativ

osem

popu

laçã

ode

cana

-de-

açúc

arem

rela

ção

aos

crom

osso

mos

(Cr.)

deso

rgo.

Mar

cado

res

deca

na-d

e-aç

úcar

corr

espo

nden

doa

cada

crom

osso

mo

doso

rgo

fora

mde

stac

ados

emco

res

dife

rent

es.R

égua

sla

tera

ises

tão

meg

aba

ses

(Mb)

66

estiveram presentes em regiões identificadas anteriormente e, em adição, detectaram outros

locais de possível controle genético conservado (Figura 8). O número de marcadores ali-

nhados variou de quatro (no cromossomo 7) a 21 (no cromossomo 3). Do mesmo modo,

combinações de QTLs e marcadores são listadas na ordem sorgo/cana para destacar o rela-

cionamento; um sinal de “+” foi adicionado para o caso de existir mais de um marcador

significativo para o caráter na mesma região. Para ALT, aparece, como possível confirma-

ção, ALT-2/sb2_22609350, ALT-4/sb3_73337885 e ALT-7/sb6_45032977, e, como novidades,

ALT-5/sb4_49763421 e ALT-10/sb9_49172170+. No caso de PMV e TCH, aparecem PMV-

4/sb4_173279+, PMV-7/sb6_45032977 e PMV-11/sb10_8999958 para regiões já identificadas,

e PMV-1/sb2_7455650, PMV-8/sb7_56993024 e PMV-9/sb8_5298195 como novos putativos

locais de sintenia. No que se refere ao controle de POL, apenas um local já havia sido indicado

(POL-1/sb1_7645431+), enquanto ficaram evidentes, pela primeira vez, POL-3/sb3_2978336,

POL-5/sb3_57883510 e POL-15/sb9_1087507. E, finalmente, para FIB, já se conhecia a re-

gião FIB-5/sb4_9380, assim como FIB-2/sb2_6817295, FIB-3/sb3_58924723 e FIB-4/sb3_-

68287506+ já haviam sido citados. Desse modo, marcadores que, separadamente, exibiram

efeitos significativos sobre a variação dos quatro caracteres contribuíram, adicionalmente, com

mais oito regiões que possivelmente compartilham o controle genético desses caracteres nas

duas espécies. Além disso, houve confirmação para 11 regiões citadas na análise anterior.

Surpreendentemente, nenhum QTL para POL-6 foi detectado nos GLs de cana perten-

centes ao GS 3, tampouco marcadores individuais relacionados ao cromossomo 3 do sorgo

apresentaram correspondência. Na população de sorgo sacarino, este QTL é bastante relevante

para explicação da variabilidade fenotípica do caráter POL. Como já foi discutido, a fixação

de alelos desta região na população de cana, já determinando o elevado conteúdo de açúcar

conhecido nas variedades parentais, possivelmente limitou a detecção de QTLs. De todo modo,

foi possível observar a capacidade de interligar os dois conjuntos genômicos por meio de

sequências de marcadores evolutivamente compartilhadas, tornando viável estudos genômicos

posteriores visando à caracterização dessas regiões interespecificamente.

67

4 CONSIDERAÇÕES FINAIS

Neste trabalho, populações de mapeamento de sorgo sacarino e de cana-de-açúcar foram

caracterizadas fenotípica e genotipicamente. Os fenótipos referiram-se aos caracteres agro-

industriais altura de colmos, toneladas de colmos ou de massa verde por hectare, e porcentagens

de pol de caldo e de fibra, importantes em culturas bioenergéticas. Em adição, as populações

também foram caracterizadas por meio de marcadores moleculares, com ênfase em SNPs e

indels, originados a partir de técnica de genotipagem por sequenciamento. Obviamente, ambos

os tipos de dados exigiram ferramentas apropriadas no sentido de explorar ao máximo suas

informações.

A abordagem de modelos mistos via REML foi utilizada para tratar os dados fenotí-

picos por combinar formulação adequeada aos complexos experimentos genéticos, método de

estimação de parâmetros apropriado e estruturação das matrizes de variâncias-covariâncias dos

efeitos aleatórios. Assim sendo, foi possível atribuir aos efeitos genéticos e residuais diferen-

tes estruturas, cada qual mais plausível aos carateres analisados sob determinado contexto de

delineamento e de população estudada. Matrizes exibindo variâncias genéticas heterogêneas,

por exemplo, foram selecionadas de um modo geral, exemplificando claramente a violação de

pressupostos dos modelos de análise de variância comumente utilizados no melhoramento e,

adicionalmente, enfatizando a existência não negligenciável da interação genótipo-ambiente.

Ainda, dados de sequenciamento da próxima geração de bibliotecas de GBS para cada

população foram avaliados quanto à performance na etapa simultânea de descoberta e genoti-

pagem de polimorfismos derivados de substituições de bases e de inserções-deleções. Basica-

mente, a técnica constituiu-se como uma importante estratégia na tentativa de refinar estudos

genéticos em ambas as espécies. Primeiro, porque GBS apareceu ineditamente dentre trabalhos

relacionados ao mapeamento de QTLs em populações de sorgo sacarino e em cana-de-açúcar,

conferindo saturação e informatividade genética aos genomas. Segundo, porque forneceu,

para cana, a possibilidade de investigar, com uma maior abrangência genômica, a questão

relacionada à dosagem alélica de locos em uma população biparental utilizando o software

SuperMASSA e a elaboração de denso e saturado mapa genético com auxílio do pacote do

R OneMap, para o qual metodologia para incoporação de marcadores em doses superiores é

prevista. E, finalmente, porque subsidiou a comparação entre os genomas das duas espécies,

sob o pressuposto de considerável conservação entre suas sequências genômicas.

De fato, detectar QTLs para caracteres relacionados a produção e açúcar em popu-

68

lações de mapeamento de espécies com fins bioenergéticos constitui uma valiosa etapa para

compreensão do controle genético subjacente à variação fenotípica útil ao melhoramento. Nos

casos das populações de sorgo sacarino e cana-de-açúcar aqui utilizadas, ambas se beneficiaram

das estratégias de mapeamento de múltiplos intervalos uni- e multivariadas para a descoberta

de QTLs implementadas no pacote do R OneQTL. Além disso, a tradicional metodologia de

análise de marcas individualmente acrescentou novas descobertas para a população de cana-de-

açúcar. Este trabalho destaca-se, sobretudo, pela utilização de fenótipos comparáveis entre as

espécies, o que é raramente encontrado na literatura. Nesse sentido, cana-de-açúcar beneficiou-

se importantemente do relacionamento evolutivo próximo com sorgo, uma vez que não possui

espécie diploide relativa, como em batata. Ainda, pode-se atribuir a esse relacionamento a

possibilidade de verificar a consistência em mapas de populações diferentes de cana-de-açúcar.

Uma vez que ambas as populações estão ligadas a instituições brasileiras mantenedoras

de importantes programas de melhoramento para as espécies, há plena possibilidade de incorpo-

ração dessas descobertas convenientemente em seus trabalhos de pesquisa e de desenvolvimento

de tecnologias e de cultivares ou variedades. Ou seja, com base na comparação dos genomas, o

reconhecimento de várias regiões de potencial controle evolutivamente conservado demonstrou

evidências de plausível utilização de estratégias visando a clonagem de genes ou de seleção

assistida por marcadores.

69

REFERÊNCIAS

AITKEN, K. S.; HERMANN, S.; KARNO, K.; BONNETT, G. D.; MCINTYRE, L. C.;JACKSON, P. A. Genetic control of yield related stalk traits in sugarcane. Theoretical andApplied Genetics, Berlin, v. 117, n. 7, p. 1191–1203, 2008.

AITKEN, K. S.; MCNEIL, M. D.; HERMANN, S.; BUNDOCK, P. C.; KILIAN, A.;HELLER-USZYNSKA, K.; HENRY, R. J.; LI, J. A comprehensive genetic map of sugarcanethat provides enhanced map coverage and integrates high-throughput Diversity ArrayTechnology (DArT) markers. BMC Genomics, London, v. 15, p. 152, 2014.

AKAIKE, H. A new look at the statistical model identification. Transactions on AutomaticControl, Notre Dame, v. 19, n. 6, p. 716–723, 1974.

ALI, M. L.; RAJEWSKI, J. F.; BAENZIGER, P. S.; GILL, K. S.; ESKRIDGE, K. M.;DWEIKAT, I. Assessment of genetic diversity and relationship among a collection of US sweetsorghum germplasm by SSR markers. Molecular Breeding, Berlin, v. 21, n. 4, p. 497–509,2007.

ALWALA, S.; KIMBENG, C. A.; GRAVOIS, K. A.; BISCHOFF, K. P. TRAP, a new tool forsugarcane breeding: comparison with AFLP and coefficient of parentage. Journal AmericanSociety Sugar Cane Technologists, Belle Glade, v. 26, p. 62–86, 2006.

AMORIM, H. V.; LOPES, M. L.; OLIVEIRA, J. V. C.; BUCKERIDGE, M. S.; GOLDMAN,G. H. Scientific challenges of bioethanol production in Brazil. Applied Microbiology andBiotechnology, Berlin, v. 91, n. 5, p. 1267–1275, 2011.

ANDRU, S.; PAN, Y.-B.; THONGTHAWEE, S.; BURNER, D. M.; KIMBENG, C. A. Geneticanalysis of the sugarcane (Saccharum spp.) cultivar ‘LCP 85-384’. I. Linkage mapping usingAFLP, SSR, and TRAP markers. Theoretical and Applied Genetics, Berlin, v. 123, n. 1, p.77–93, 2011.

BARTHOLOME, J.; MANDROU, E.; MABIALA, A.; JENKINS, J.; NABIHOUDINE, I.;KLOPP, C.; SCHMUTZ, J.; PLOMION, C.; GION, J.-M. High-resolution genetic maps ofEucalyptus improve Eucalyptus grandis genome assembly. The New Phytologist, Cambridge,Early View, p. 1–14, 2014.

BENJAMINI, Y.; YEKUTIELI, D. The control of the false discovery rate in multiple testingunder dependency. The Annals of Statistics, Hayward, v. 29, n. 4, p. 1165–1188, 2001.

BENNETZEN, J. L.; FREELING, M. The unified grass genome: synergy in synteny. GenomeResearch, Cold Spring Harbor, v. 7, p. 301–306, 1997.

BROWN, S. M.; HOPKINS, M. S.; MITCHELL, S. E.; SENIOR, M. L.; WANG, T. Y.;DUNCAN, R. R.; GONZALEZ-CANDELAS, F.; KRESOVICH, S. Multiple methods for theidentification of polymorphic simple sequence repeats (SSRs) in sorghum [Sorghum bicolor(L.) Moench]. Theoretical and Applied Genetics, Berlin, v. 93, p. 190–198, 1996.

CALVIÑO, M.; MESSING, J. Sweet sorghum as a model system for bioenergy crops. CurrentOpinion in Biotechnology, London, v. 23, n. 3, p. 323–329, 2012.

70

CARDOSO-SILVA, C. B.; COSTA, E. A.; MANCINI, M. C.; BALSALOBRE, T. W. A.;CANESIN, L. E. C.; PINTO, L. R.; CARNEIRO, M. S.; GARCIA, A. A. F.; SOUZA, A. P.;VICENTINI, R. De novo assembly and transcriptome analysis of contrasting sugarcanevarieties. PLoS ONE, San Francisco, v. 9, n. 2, p. 1–10, 2014.

CHEAVEGATTI-GIANOTTO, A.; ABREU, H. M. C.; ARRUDA, P.; BESPALHOK-FILHO,J. C.; BURNQUIST, W. L.; CRESTE, S.; DI-CIERO, L.; FERRO, J. A.; FIGUEIRA, A.V. O.; FILGUEIRAS, T. S.; GROSSI-DE-SA, M. F.; GUZZO, E. C.; HOFFMANN, H. P.;LANDELL, M. G. A.; MACEDO, N.; MATSUOKA, S.; REINACH, F. C.; ROMANO, E.;SILVA, W. J.; SILVA-FILHO, M. C.; ULIAN, E. C. Sugarcane (Saccharum × officinarum): areference study for the regulation of genetically modified cultivars in Brazil. Tropical PlantBiology, Berlin, v. 4, n. 1, p. 62–89, 2011.

CONSELHO DOS PRODUTORES DE CANA-DE-AÇÚCAR, AÇÚCAR E ÁLCOOL DOESTADO DE SÃO PAULO – CONSECANA-SP. Manual de Instruções. 5. ed. Piracicaba:CONSECANA-SP, 2006. 112 p.

CORDEIRO, G. M.; TAYLOR, G. O.; HENRY, R. J. Characterisation of microsatellite markersfrom sugarcane (Saccharum sp.), a highly polyploid species. Plant Science, Shannon, v. 155,n. 2, p. 161–168, 2000.

CRESTE, S.; ACCORONI, K. A. G.; PINTO, L. R.; VENCOVSKY, R.; GIMENES, M. A.;XAVIER, M. A.; LANDELL, M. G. A. Genetic variability among sugarcane genotypesbased on polymorphisms in sucrose metabolism and drought tolerance genes. Euphytica,Wageningen, v. 172, n. 3, p. 435–446, 2010.

DEOKAR, A. A.; RAMSAY, L.; SHARPE, A. G.; DIAPARI, M.; SINDHU, A.; BETT, K.;WARKENTIN, T. D.; TAR’AN, B. Genome wide SNP identification in chickpea for use indevelopment of a high density genetic map and improvement of chickpea reference genomeassembly. BMC Genomics, London, v. 15, n. 1, p. 708, 2014.

D’HONT, A.; ISON, D.; ALIX, K.; ROUX, C.; GLASZMANN, J. C. Determination of basicchromosome numbers in the genus Saccharum by physical mapping of ribosomal RNA genes.Genome, Ottawa, v. 41, p. 221–225, 1998.

DUFOUR, P.; DEU, M.; GRIVET, L.; D’HONT, A.; PAULET, F.; BOUET, A.; LANAUD, C.;GLASZMANN, J. C.; HAMON, P. Construction of a composite sorghum genome map andcomparison with sugarcane, a related complex polyploid. Theoretical and Applied Genetics,Berlin, v. 94, n. 3–4, p. 409–418, 1997.

ELSHIRE, R. J.; GLAUBITZ, J. C.; SUN, Q.; POLAND, J. A.; KAWAMOTO, K.; BUCKLER,E. S.; MITCHELL, S. E. A robust, simple genotyping-by-sequencing (GBS) approach for highdiversity species. PLoS ONE, San Francisco, v. 6, n. 5, p. 1–9, 2011.

FOOD AND AGRICULTURE ORGANIZATION OF THE UNITED NATIONS – FAO.FAOSTAT Analysis. 2014. Disponível em: <http://faostat3.fao.org/home/index.html>. Acessoem: 14 nov. 2014.

FEDERER, W. T.; RAGHAVARAO, D. On augmented designs. Biometrics, Washington,v. 31, n. 1, p. 29–35, 1975.

71

GALECKI, A.; BURZYKOWSKI, T. Linear Mixed-Effects Models Using R: a step-by-stepapproach. New York: Springer, 2013. 556 p.

GARCIA, A. A. F.; KIDO, E. A.; MEZA, A. N.; SOUZA, H. M. B.; PINTO, L. R.; PASTINA,M. M.; LEITE, C. S.; SILVA, J. A. G.; ULIAN, E. C.; FIGUEIRA, A. V.; SOUZA, A. P.Development of an integrated genetic map of a sugarcane (Saccharum spp.) commercialcross, based on a maximum-likelihood approach for estimation of linkage and linkage phases.Theoretical and Applied Genetics, Berlin, v. 112, n. 2, p. 298–314, 2006.

GARCIA, A. A. F.; MOLLINARI, M.; MARCONI, T. G.; SERANG, O. R.; SILVA, R. R.;VIEIRA, M. L. C.; VICENTINI, R.; COSTA, E. A.; MANCINI, M. C.; GARCIA, M.O. S.; PASTINA, M. M.; GAZAFFI, R.; MARTINS, E. R. F.; DAHMER, N.; SFORCA,D. A.; SILVA, C. B. C.; BUNDOCK, P.; HENRY, R. J.; SOUZA, G. M.; VAN SLUYS,M.-A.; LANDELL, M. G. A.; CARNEIRO, M. S.; VINCENTZ, M. A. G.; PINTO, L. R.;VENCOVSKY, R.; SOUZA, A. P. SNP genotyping allows an in-depth characterisation of thegenome of sugarcane and other complex autopolyploids. Scientific Reports, London, v. 3,n. 3399, p. 1–10, 2013.

GAZAFFI, R.; MARGARIDO, G. R. A.; PASTINA, M. M.; MOLLINARI, M.; GARCIA,A. A. F. A model for quantitative trait loci mapping, linkage phase, and segregation patternestimation for a full-sib progeny. Tree Genetics & Genomes, Berlin, v. 10, n. 4, p. 791–801,2014.

GLAUBITZ, J. C.; CASSTEVENS, T. M.; LU, F.; HARRIMAN, J.; ELSHIRE, R. J.; SUN, Q.;BUCKLER, E. S. Tassel-GBS: a high capacity genotyping by sequencing analysis pipeline.PLoS ONE, San Francisco, v. 9, n. 2, p. 1–11, 2014.

GRATIVOL, C.; REGULSKI, M.; BERTALAN, M.; MCCOMBIE, W. R.; SILVA,F. R.; ZERLOTINI-NETO, A.; VICENTINI, R.; FARINELLI, L.; HEMERLY, A. S.;MARTIENSSEN, R. A.; FERREIRA, P. C. G. Sugarcane genome sequencing by methylationfiltration provides tools for genomic research in the genus Saccharum. The Plant Journal,Oxford, v. 79, p. 162–172, 2014.

GRATTAPAGLIA, D.; SEDEROFF, R. Genetic linkage maps of Eucalyptus grandis andEucalyptus urophylla using a pseudo-testcross: mapping strategy and RAPD markers.Genetics, Austin, v. 1137, p. 1121–1137, 1994.

GRIVET, L.; ARRUDA, P. Sugarcane genomics: depicting the complex genome of animportant tropical crop. Current Opinion in Plant Biology, London, v. 5, n. 2, p. 122–127,2002.

GRIVET, L.; D’HONT, A.; DUFOUR, P.; HAMON, P.; ROQUEST, D. Comparative genomemapping of sugar cane with other species within the Andropogoneae tribe. Heredity, London,v. 73, p. 500–508, 1994.

GU, Z.; GU, L.; EILS, R.; SCHLESNER, M.; BRORS, B. circlize implements and enhancescircular visualization in R. Bioinformatics, Oxford, v. 30, n. 19, p. 2811–2812, 2014.

GUAN, Y.-A.; WANG, H.-L.; QIN, L.; ZHANG, H.-W.; YANG, Y.-B.; GAO, F.-J.; LI, R.-Y.;WANG, H.-G. QTL mapping of bio-energy related traits in Sorghum. Euphytica, Wageningen,v. 182, n. 3, p. 431–440, 2011.

72

GUIMARÃES, C. T.; SILLS, G. R.; SOBRAL, B. W. S. Comparative mapping ofAndropogoneae: Saccharum L. (sugarcane) and its relation to sorghum and maize.Proceedings of the National Academy of Sciences of the United States of America,Washington, v. 94, p. 14261–14266, 1997.

HAHN, M. W.; ZHANG, S. V.; MOYLE, L. C. Sequencing, assembling, and correcting draftgenomes using recombinant populations. G3, Bethesda, v. 4, n. 4, p. 669–679, 2014.

HALEY, C. S.; KNOTT, S. A. A simple regression method for mapping quantitative trait lociin line crosses using flanking markers. Heredity, London, v. 69, p. 315–324, 1992.

HOARAU, J.-Y.; GRIVET, L.; OFFMANN, B.; RABOIN, L.-M.; DIORFLAR, J.-P.; PAYET,J.; HELLMANN, M.; D’HONT, A.; GLASZMANN, J.-C. Genetic dissection of a modernsugarcane cultivar (Saccharum spp.). II. Detection of QTLs for yield components. Theoreticaland Applied Genetics, Berlin, v. 105, n. 6-7, p. 1027–1037, 2002.

HOLLAND, J. B.; NYQUIST, W. E.; CERVANTES-MARTÍNEZ, C. T. Estimating andinterpreting heritability for plant breeding: an update. In: JANICK, J. (Ed.). Plant BreedingReviews. New Jersey: John Wiley & Sons, 2003. v. 22, cap. 2, p. 9–112.

JANNOO, N.; GRIVET, L.; CHANTRET, N.; GARSMEUR, O.; GLASZMANN, J. C.;ARRUDA, P.; D’HONT, A. Orthologous comparison in a gene-rich region among grassesreveals stability in the sugarcane polyploid genome. The Plant Journal, Oxford, v. 50, n. 4, p.574–585, 2007.

KAO, C.-H.; ZENG, Z.-B.; TEASDALE, R. D. Multiple interval mapping for quantitative traitloci. Genetics, Austin, v. 152, n. 3, p. 1203–1216, 1999.

KELLER, I.; BENSASSON, D.; NICHOLS, R. A. Transition-transversion bias is not universal:a counter example from grasshopper pseudogenes. PLoS Genetics, San Francisco, v. 3, n. 2, p.185–191, 2007.

KONG, L.; DONG, J.; HART, G. E. Characteristics, linkage-map positions, and allelicdifferentiation of Sorghum bicolor (L.) Moench DNA simple-sequence repeats (SSRs).Theoretical and Applied Genetics, Berlin, v. 101, p. 438–448, 2000.

LANDER, E. S.; GREEN, P. Construction of multilocus genetic linkage maps in humans.Proceedings of the National Academy of Sciences of the United States of America,Washington, v. 84, p. 2363–2367, 1987.

LANGMEAD, B.; SALZBERG, S. L. Fast gapped-read alignment with Bowtie 2. NatureMethods, New York, v. 9, n. 4, p. 357–359, 2013.

LE CUNFF, L.; GARSMEUR, O.; RABOIN, L. M.; PAUQUET, J.; TELISMART, H.;SELVI, A.; GRIVET, L.; PHILIPPE, R.; BEGUM, D.; DEU, M.; COSTET, L.; WING,R.; GLASZMANN, J. C.; D’HONT, A. Diploid/polyploid syntenic shuttle mapping andhaplotype-specific chromosome walking toward a rust resistance gene (Bru1) in highlypolyploid sugarcane (2n ≈ 12x ≈ 115). Genetics, Austin, v. 180, n. 1, p. 649–60, 2008.

LI, G.; QUIROS, C. F. Sequence-related amplified polymorphism (SRAP), a new markersystem based on a simple PCR reaction: its application to mapping and gene tagging inBrassica. Theoretical and Applied Genetics, Berlin, v. 103, p. 455–461, 2001.

73

LIMA, M. L. A.; GARCIA, A. A. F.; OLIVEIRA, K. M.; MATSUOKA, S.; ARIZONO,H.; SOUZA JR, C. L.; SOUZA, A. P. Analysis of genetic similarity detected by AFLP andcoefficient of parentage among genotypes of sugar cane (Saccharum spp.). Theoretical andApplied Genetics, Berlin, v. 104, n. 1, p. 30–38, 2002.

MALOSETTI, M.; RIBAUT, J.-M.; VAN EEUWIJK, F. A. The statistical analysis ofmulti-environment data: modeling genotype-by-environment interaction and its genetic basis.Frontiers in Physiology, Lausanne, v. 4, p. 1–17, 2013.

MARCONI, T. G. Mapa funcional em cana-de-açúcar utilizando marcadores molecularesbaseados em SSR e SNP. 2011. 160 p. Tese (Doutorado em Genética e Biologia Molecular)— Universidade de Campinas, 2011.

MARCONI, T. G.; COSTA, E. A.; MIRANDA, H. R. C. A. N.; MANCINI, M. C.;CARDOSO-SILVA, C. B.; OLIVEIRA, K. M.; PINTO, L. R.; MOLLINARI, M.; GARCIA,A. A. F.; SOUZA, A. P. Functional markers for gene mapping and genetic diversity studies insugarcane. BMC Research Notes, London, v. 4, n. 1, p. 264, 2011.

MARGARIDO, G. R. A. Mapeamento de QTLs em múltiplos caracteres e ambientes emum cruzamento comercial de cana-de-açúcar usando modelos mistos. 2011. 107 p. Tese(Doutorado em Genética e Melhoramento de Plantas) — Escola Superior de Agricultura “Luizde Queiroz”, Universidade de São Paulo, Piracicaba, 2011.

MARGARIDO, G. R. A.; SOUZA, A. P.; GARCIA, A. A. F. OneMap: software for geneticmapping in outcrossing species. Hereditas, Lund, v. 144, n. 3, p. 78–79, 2007.

MATSUOKA, S.; GARCIA, A. A. F.; ARIZONO, H. Melhoramento da cana-de-açúcar. In:BORÉM, A. (Ed.). Melhoramento de Espécies Cultivadas. 2. ed. Viçosa: UFV, 2005. p.205–251.

MING, R.; LIU, S.; LIN, Y.; SILVA, J.; WILSON, W.; BRAGA, D.; DEYNZE, A. V.;WENSLAFF, T. F.; WU, K. K.; MOORE, P. H.; BURNQUIST, W.; SORRELLS, M. E.;IRVINE, J. E.; PATERSON, A. H. Detailed alignment of Saccharum and sorghumchromosomes: comparative organization of closely related diploid and polyploid genomes.Genetics, Austin, v. 150, p. 1663–1682, 1998.

MING, R.; WANG, Y.-W.; DRAYE, X.; MOORE, P. H.; IRVINE, J. E.; PATERSON, A. H.Molecular dissection of complex traits in autopolyploids: mapping QTLs affecting sugar yieldand related traits in sugarcane. Theoretical and Applied Genetics, Berlin, v. 105, n. 2-3, p.332–345, 2002.

MOLLINARI, M. Desenvolvimento de um modelo para construção de mapas genéticosem autopoliploides, com aplicações em cana-de-açúcar. 2012. 98 p. Tese (Doutorado emGenética e Melhoramento de Plantas) — Escola Superior de Agricultura “Luiz de Queiroz”,Universidade de São Paulo, Piracicaba, 2012.

MOLLINARI, M.; MARGARIDO, G. R. A.; VENCOVSKY, R.; GARCIA, A. A. F. Evaluationof algorithms used to order markers on genetic maps. Heredity, v. 103, n. 6, p. 494–502, 2009.

MOLLINARI, M.; SERANG, O. Quantitative SNP genotyping of polyploids withMassARRAY and other platforms. In: BATLEY, J. (Ed.). Plant Genotyping: methods inmolecular biology. New York: Springer, 2015. v. 1245, cap. 17, p. 215–241.

74

MORRIS, G. P.; RAMU, P.; DESHPANDE, S. P.; HASH, C. T.; SHAH, T.; UPADHYAYA,H. D.; RIERA-LIZARAZU, O.; BROWN, P. J.; ACHARYA, C. B.; MITCHELL, S. E.;HARRIMAN, J.; GLAUBITZ, J. C.; BUCKLER, E. S.; KRESOVICH, S. Population genomicand genome-wide association studies of agroclimatic traits in sorghum. Proceedings of theNational Academy of Sciences of the United States of America, Washington, v. 110, n. 2, p.453–458, 2013.

MURRAY, S. C.; ROONEY, W. L.; HAMBLIN, M. T.; MITCHELL, S. E.; KRESOVICH,S. Sweet sorghum genetic diversity and association mapping for brix and height. The PlantGenome, Madison, v. 2, n. 1, p. 48, 2009.

OETH, P.; BEAULIEU, M.; PARK, C.; KOSMAN, D.; DEL MISTRO, G.; VAN DENBOOM, D.; JURINKE, C. iPLEXTM Assay: increased plexing efficiency and flexibility forMassARRAY R© system through single base primer extension with mass-modified terminators.Sequenom Application Note, San Diego, v. 8876, n. 006, p. 1–12, 2006. Disponível em:<www.sequenom.com>. Acesso em: 12 dez. 2014.

OLIVEIRA, K. M.; PINTO, L. R.; MARCONI, T. G.; MARGARIDO, G. R. A.; PASTINA,M. M.; TEIXEIRA, L. H. M.; FIGUEIRA, A. V.; ULIAN, E. C.; GARCIA, A. A. F.; SOUZA,A. P. Functional integrated genetic linkage map based on EST-markers for a sugarcane(Saccharum spp.) commercial cross. Molecular Breeding, Berlin, v. 20, n. 3, p. 189–208,2007.

OLIVEIRA, K. M.; PINTO, L. R.; MARCONI, T. G.; MOLLINARI, M.; ULIAN, E. C.;CHABREGAS, S. M.; FALCO, M. C.; BURNQUIST, W.; GARCIA, A. A. F.; SOUZA, A. P.Characterization of new polymorphic functional markers for sugarcane. Genome, Ottawa,v. 52, p. 191–209, 2009.

PASTINA, M. M.; MALOSETTI, M.; GAZAFFI, R.; MOLLINARI, M.; MARGARIDO, G.R. A.; OLIVEIRA, K. M.; PINTO, L. R.; SOUZA, A. P.; VAN-EEUWIJK, F. A.; GARCIA,A. A. F. A mixed model QTL analysis for sugarcane multiple-harvest-location trial data.Theoretical and Applied Genetics, Berlin, v. 124, n. 5, p. 835–849, 2012.

PASTINA, M. M.; PINTO, L. R.; OLIVEIRA, K. M.; SOUZA, A. P.; GARCIA, A. A. F.Molecular mapping of complex traits. In: HENRY, R. J.; KOLE, C. (Ed.). Genetics, Genomicsand Breeding of Sugarcane. Enfield: Science Publishers, 2010. cap. 7, p. 117–148.

PATERSON, A. H.; BOWERS, J. E.; BRUGGMANN, R.; DUBCHAK, I.; GRIMWOOD,J.; GUNDLACH, H.; HABERER, G.; HELLSTEN, U.; MITROS, T.; POLIAKOV, A.;SCHMUTZ, J.; SPANNAGL, M.; TANG, H.; WANG, X.; WICKER, T.; BHARTI, A. K.;CHAPMAN, J.; FELTUS, F. A.; GOWIK, U.; GRIGORIEV, I. V.; LYONS, E.; MAHER,C. A.; MARTIS, M.; NARECHANIA, A.; OTILLAR, R. P.; PENNING, B. W.; SALAMOV,A. A.; WANG, Y.; ZHANG, L.; CARPITA, N. C.; FREELING, M.; GINGLE, A. R.; HASH,C. T.; KELLER, B.; KLEIN, P.; KRESOVICH, S.; MCCANN, M. C.; MING, R.; PETERSON,D. G.; RAHMAN, M.; WARE, D.; WESTHOFF, P.; MAYER, K. F. X.; MESSING, J.;ROKHSAR, D. S. The Sorghum bicolor genome and the diversification of grasses. Nature,London, v. 457, n. 7229, p. 551–556, 2009.

PINTO, L. R.; GARCIA, A. A. F.; PASTINA, M. M.; TEIXEIRA, L. H. M.; BRESSIANI,J. A.; ULIAN, E. C.; BIDOIA, M. A. P.; SOUZA, A. P. Analysis of genomic and functionalRFLP derived markers associated with sucrose content, fiber and yield QTLs in a sugarcane(Saccharum spp.) commercial cross. Euphytica, Wageningen, v. 172, n. 3, p. 313–327, 2009.

75

PINTO, L. R.; OLIVEIRA, K. M.; MARCONI, T.; GARCIA, A. A. F.; ULIAN, E. C.;SOUZA, A. P. Characterization of novel sugarcane expressed sequence tag microsatellites andtheir comparison with genomic SSRs. Plant Breeding, Berlin, v. 125, p. 378–384, 2006.

PINTO, L. R.; OLIVEIRA, K. M.; ULIAN, E. C.; GARCIA, A. A. F.; SOUZA, A. P. Surveyin the sugarcane expressed sequence tag database (SUCEST) for simple sequence repeats.Genome, Ottawa, v. 47, p. 795–804, 2004.

R CORE TEAM. R: a language and environment for statistical computing. Vienna: RFoundation for Statistical Computing, 2014. Disponível em: <http://www.r-project.org>.Acesso em: 14 jan. 2014.

RABOIN, L.-M.; OLIVEIRA, K. M.; LE CUNFF, L.; TELISMART, H.; ROQUES, D.;BUTTERFIELD, M.; HOARAU, J.-Y.; D’HONT, A. Genetic mapping in sugarcane, a highpolyploid, using bi-parental progeny: identification of a gene controlling stalk colour and a newrust resistance gene. Theoretical and Applied Genetics, Berlin, v. 112, n. 7, p. 1382–1391,2006.

RAHMAN, M.-U.; PATERSON, A. H. Comparative genomics in crop plants. In: JAIN, S. M.;BRAR, D. S. (Ed.). Molecular Techniques in Crop Improvement. 2. ed. Dordrecht: SpringerNetherlands, 2010. cap. 2, p. 23–61.

REVELLE, W. psych: procedures for psychological, psychometric, and personality research.Evanston, 2014. Disponível em: <http://cran.r-project.org/package=psych>. Acesso em: 12nov. 2013.

RIPOL, M.; CHURCHILL, G. A.; SILVA, J. A. G.; SORRELLS, M. Statistical aspects ofgenetic mapping in autopolyploids. Gene, Amsterdam, v. 235, n. 1–2, p. 31–41, 1999.

RITTER, K. B.; JORDAN, D. R.; CHAPMAN, S. C.; GODWIN, I. D.; MACE, E. S.;MCINTYRE, C. L. Identification of QTL for sugar-related traits in a sweet × grain sorghum(Sorghum bicolor L. Moench) recombinant inbred population. Molecular Breeding, Berlin,v. 22, n. 3, p. 367–384, 2008.

RITTER, K. B.; MCINTYRE, C. L.; GODWIN, I. D.; JORDAN, D. R.; CHAPMAN, S. C.An assessment of the genetic relationship between sweet and grain sorghums, within Sorghumbicolor ssp. bicolor (L.) Moench, using AFLP markers. Euphytica, Wageningen, v. 157,n. 1-2, p. 161–176, 2007.

ROBERTS, A.; MCMILLAN, L.; WANG, W.; PARKER, J.; RUSYN, I.; THREADGILL, D.Inferring missing genotypes in large SNP panels using fast nearest-neighbor searches oversliding windows. Bioinformatics, Oxford, v. 23, n. 13, p. i401–i407, 2007.

SCHWARZ, G. Estimating the dimension of a model. The Annals of Statistics, Hayward, v. 6,n. 2, p. 461–464, 1978.

SERANG, O.; MOLLINARI, M.; GARCIA, A. A. F. Efficient exact maximum a posterioricomputation for bayesian SNP genotyping in polyploids. PLoS ONE, San Francisco, v. 7, n. 2,p. 1–13, 2012.

SHIRINGANI, A. L.; FRIEDT, W. QTL for fibre-related traits in grain × sweet sorghum as atool for the enhancement of sorghum as a biomass crop. Theoretical and Applied Genetics,Berlin, v. 123, n. 6, p. 999–1011, 2011.

76

SHIRINGANI, A. L.; FRISCH, M.; FRIEDT, W. Genetic mapping of QTLs for sugar-relatedtraits in a RIL population of Sorghum bicolor L. Moench. Theoretical and Applied Genetics,Berlin, v. 121, n. 2, p. 323–336, 2010.

SILVA, L. D. C. E.; WANG, S.; ZENG, Z.-B. Multiple trait multiple interval mapping ofquantitative trait loci from inbred line crosses. BMC Genetics, London, v. 13, n. 67, p. 1–24,2012.

SILVA, L. D. C. E.; ZENG, Z.-B. Current progress on statistical methods for mappingquantitative trait loci from inbred line crosses. Journal of Biopharmaceutical Statistics,Abingdon, v. 20, n. 2, p. 454–481, 2010.

SINGH, R. K.; JENA, S. N.; KHAN, S.; YADAV, S.; BANARJEE, N.; RAGHUVANSHI, S.;BHARDWAJ, V.; DATTAMAJUMDER, S. K.; KAPUR, R.; SOLOMON, S.; SWAPNA, M.;SRIVASTAVA, S.; TYAGI, A. K. Development, cross-species/genera transferability of novelEST-SSR markers and their utility in revealing population structure and genetic diversity insugarcane. Gene, Amsterdam, v. 524, n. 2, p. 309–329, 2013.

SINGH, R. K.; SINGH, R. B.; SINGH, S. P.; SHARMA, M. L. Identification of sugarcanemicrosatellites associated to sugar content in sugarcane and transferability to other cerealgenomes. Euphytica, Wageningen, v. 182, n. 3, p. 335–354, 2011.

SORRELS, M. E. Applications of comparative genomics to crop improvement. In: LAMKEY,K. R.; LEE, M. (Ed.). Plant Breeding: the Arnel R. Hallauer International Symposium. Iowa:Blackwell, 2006. cap. 12, p. 171–181.

SOUZA, G. M.; BERGES, H.; BOCS, S.; CASU, R.; D’HONT, A.; FERREIRA, J. E.;HENRY, R.; MING, R.; POTIER, B.; VAN SLUYS, M.-A.; VINCENTZ, M.; PATERSON,A. H. The sugarcane genome challenge: strategies for sequencing a highly complex genome.Tropical Plant Biology, Berlin, v. 4, p. 145–156, 2011.

TANG, H.; BOWERS, J. E.; WANG, X.; MING, R.; ALAM, M.; PATERSON, A. H. Syntenyand collinearity in plant genomes. Science, New York, v. 320, n. 5875, p. 486–8, 2008.

VETTORE, A. L.; SILVA, F. R.; KEMPER, E. L.; SOUZA, G. M.; SILVA, A. M.; FERRO,M. I. T.; HENRIQUE-SILVA, F.; GIGLIOTI, E. A.; LEMOS, M. V. F.; COUTINHO, L. L.;NOBREGA, M. P.; CARRER, H.; FRANCA, S. C.; BACCI-JUNIOR, M.; GOLDMAN,M. H. S.; GOMES, S. L.; NUNES, L. R.; CAMARGO, L. E. A.; SIQUEIRA, W. J.; VANSLUYS, M.-A.; THIEMANN, O. H.; KURAMAE, E. E.; SANTELLI, R. V.; MARINO,C. L.; TARGON, M. L. P. N.; FERRO, J. A.; SILVEIRA, H. C. S.; MARINI, D. C.; LEMOS,E. G. M.; MONTEIRO-VITORELLO, C. B.; TAMBOR, J. H. M.; CARRARO, D. M.;ROBERTO, P. G.; MARTINS, V. G.; GOLDMAN, G. H.; OLIVEIRA, R. C.; TRUFFI, D.;COLOMBO, C. A.; ROSSI, M.; ARAUJO, P. G.; SCULACCIO, S. A.; ANGELLA, A.;LIMA, M. M. A.; ROSA-JUNIOR, V. E.; SIVIERO, F.; COSCRATO, V. E.; MACHADO,M. A.; GRIVET, L.; DI-MAURO, S. M. Z.; NOBREGA, F. G.; MENCK, C. F. M.; BRAGA,M. D. V.; TELLES, G. P.; CARA, F. A. A.; PEDROSA, G.; MEIDANIS, J.; ARRUDA, P.Analysis and functional annotation of an expressed sequence tag collection for tropical cropsugarcane. Genome Research, Cold Spring Harbor, v. 13, n. 12, p. 2725–2735, 2003.

77

VICENTINI, R.; DEL BEM, L. E. V.; VAN SLUYS, M. A.; NOGUEIRA, F. T. S.;VINCENTZ, M. Gene content analysis of sugarcane public ESTs reveals thousands of missingcoding-genes and an unexpected pool of grasses conserved ncRNAs. Tropical Plant Biology,Berlin, v. 5, n. 2, p. 199–205, 2012.

VOORRIPS, R. E. MapChart: software for the graphical presentation of linkage maps andQTLs. The Journal of Heredity, Washington, v. 93, n. 1, p. 77–78, 2002.

VSN INTERNATIONAL. GenStat for Windows 16th Edition. Hemel Hempstead: VSNInternational, 2014. Disponível em: <genstat.co.uk>. Acesso em: 12 nov. 2014.

WANG, M. L.; BARKLEY, N. A.; YU, J.-K.; DEAN, R. E.; NEWMAN, M. L.; SORRELLS,M. E.; PEDERSON, G. A. Transfer of simple sequence repeat (SSR) markers from majorcereal crops to minor grass species for germplasm characterization and evaluation. PlantGenetic Resources, Cambridge, v. 3, n. 1, p. 45–57, 2005.

WU, R.; MA, C.-X.; PAINTER, I.; ZENG, Z.-B. Simultaneous maximum likelihood estimationof linkage and linkage phases in outcrossing species. Theoretical Population Biology, Berlin,v. 61, n. 3, p. 349–363, 2002.

WU, R.; MA, C.-X.; WU, S. S.; ZENG, Z.-B. Linkage mapping of sex-specific differences.Genetic Research, Oxford, v. 79, p. 85–96, 2002.

ZEGADA-LIZARAZU, W.; MONTI, A. Are we ready to cultivate sweet sorghum as abioenergy feedstock? A review on field management practices. Biomass and Bioenergy,Oxford, v. 40, p. 1–12, 2012.

ZELLNER, A. An efficient method of estimating seemingly unrelated regressions and tests foraggregation bias. Journal of the American Statistical Association, New York, v. 57, n. 298,p. 348–368, 1962.

ZOU, W.; ZENG, Z.-B. Statistical methods for mapping multiple QTL. International Journalof Plant Genomics, Nasr City, v. 2008, p. 1–8, 2008.

78

79

APÊNDICES

80

81

APÊNDICE A – QTLs resultantes do mapeamento de múltiplos intervalos (MIM) univa-

riado em população de sorgo sacarino

Tabela 12 – Estimativas dos efeitos aditivos e os respectivos cromossomos (Cr.) e posições(em mega bases – Mb) dos QTLs mapeados em população de sorgo sacarino paraas médias marginais e conjuntas de três anos de avaliação

Caráter QTL Cr. Posição(Mb) LOD (DP)a Anob

1 2 3 Conjunta

ALT 1 1 62,6-67,8 8,13 (0,59) −0,063∗∗∗ 0,083∗∗∗ 0,055∗∗∗ 0,072∗∗∗2 2 26,3 4,17 −0,040∗∗∗3 3 61,3 4,09 −0,042∗∗∗4 3 68,3 3,46 −0,039∗∗∗5 4 54,2 4,66 −0,045∗∗∗6 6 18,4 7,49 0,081∗∗∗7 6 42,6 7,41 0,054∗∗∗8 8 45,1 5,33 −0,047∗∗∗9 9 10,1 7,93 −0,060∗∗∗

10 9 47,8-50,4 8,71 (2,00) −0,057∗∗∗ −0,078∗∗∗ −0,068∗∗∗ −0,074∗∗∗11 10 11,1 5,72 −0,049∗∗∗12 10 44,4-55,7 7,42 (1,77) −0,059∗∗∗ −0,092∗∗∗ −0,048∗∗∗ −0,062∗∗∗

PMV 1 2 4,9 5,41 −1,302∗∗∗3 3 21,3 9,06 −1,098∗∗∗4 4 1,3 5,41 1,297∗∗∗5 4 57,0-57,3 5,76 (0,55) −2,013∗∗∗ −1,283∗∗∗6 6 17,5 13,44 (1,17) 3,485∗∗∗ 1,934∗∗∗7 6 41,8 13,34 1,346∗∗∗8 7 60,0 6,36 −0,906∗∗∗

10 9 5,4 4,06 −1,003∗∗∗11 10 12,9-13,6 9,06 (1,68) −2,939∗∗∗ −0,952∗∗∗ −1,884∗∗∗12 10 44,6-52,5 5,81 (1,68) −1,575∗∗∗ 2,196∗∗∗ 1,188∗∗∗

POL 1 1 3,9-6,6 11,16 (3,91) −0,496∗∗∗ −0,386∗∗∗ −0,449∗∗∗ −0,401∗∗∗2 1 51,4 4,69 −0,213∗∗∗3 3 0,9-1,8 5,44 (0,04) −0,294∗∗∗ −0,230∗∗∗4 3 13,5-15,9 8,22 (4,04) −0,288∗∗∗ −0,333∗∗∗5 3 51,4 7,24 −0,402∗∗∗6 3 64,9-67,6 18,65 (10,37) −0,804∗∗∗ −0,479∗∗∗ −0,480∗∗∗ −0,550∗∗∗7 5 2,9 6,79 −0,342∗∗∗8 5 4,8-5,6 8,55 (2,42) −0,316∗∗∗ −0,455∗∗∗ −0,332∗∗∗9 6 46,2 8,11 (0,95) 0,423∗∗∗ 0,270∗∗∗

10 6 52,5-52,7 8,80 0,447∗∗∗ 0,310∗∗∗11 7 48,3 7,16 0,278∗∗∗12 8 14,0 5,62 −0,295∗∗∗14 8 53,4 8,51 0,297∗∗∗15 9 3,0-9,5 8,15 (2,81) −0,313∗∗∗ −0,474∗∗∗16 9 10,1 12,26 (2,55) −0,489∗∗∗ −0,384∗∗∗17 10 5,1 5,77 −0,302∗∗∗

FIB 1 1 59,8-61,0 6,65 (0,79) 0,144∗∗∗ 0,223∗∗∗2 2 1,7 7,21 −0,142∗∗∗3 3 60,6 3,91 −0,110∗∗∗4 3 68,2-69,2 11,51 (6,73) 0,333∗∗∗ 0,289∗∗∗ 0,249∗∗∗ 0,242∗∗∗5 4 1,4-8,0 7,88 (3,63) −0,326∗∗∗ −0,187∗∗∗ −0,169∗∗∗6 4 65,1 7,59 (1,87) −0,363∗∗∗ −0,196∗∗∗8 6 47,6 4,86 −0,266∗∗∗9 8 37,0-37,4 11,17 (2,91) 0,372∗∗∗ 0,205∗∗∗ 0,260∗∗∗ 0,290∗∗∗

11 10 2,5 5,62 (0,51) −0,127∗∗∗ −0,206∗∗∗ −0,194∗∗∗12 10 56,5-58,5 8,08 (2,43) 0,326∗∗∗ 0,178∗∗∗ 0,191∗∗∗

Notas: aLOD é a média dos LODs obtidos das análises individuais; para os QTLs co-localizados,desvio-padrão (DP) foi calculado. bEfeitos significativos quando ∗∗∗p < 0,001

82

APÊNDICE B – QTLs resultantes do mapeamento de múltiplos intervalos (MIM) multi-

variado em população de sorgo sacarino

Tabela 13 – Estimativas dos efeitos aditivos e os respectivos cromossomos (Cr.) e po-sições (em mega bases – Mb) dos QTLs mapeados em população de sorgosacarino para as médias marginais de três anos de avaliação

Caráter QTL Cr. Posição(Mb) LODca LODi (DP)b Anoc

1 2 3

ALT 1 1 67,7 9,30 5,52 (2,62) 0,061∗∗∗ 0,078∗∗∗ 0,036∗∗

4 3 68,3 10,68 2,60 (3,14) −0,025∗ −0,020 −0,059∗∗∗

7 6 42,2 18,42 5,91 (5,10) 0,020 0,097∗∗∗ 0,057∗∗∗

9 9 2,6 5,93 3,39 (1,69) −0,047∗∗∗ −0,061∗∗∗ −0,027∗∗

10 9 47,8 9,66 6,76 (1,78) −0,067∗∗∗ −0,061∗∗∗ −0,065∗∗∗

12 10 43,3 11,30 4,28 (3,47) −0,041∗∗∗ −0,085∗∗∗ −0,031∗

PMV 2 2 62,7 5,43 0,69 (0,52) −0,208 0,952∗ 0,2973 3 21,3 7,94 3,17 (3,62) −0,451 −1,172∗∗ −0,961∗∗∗

7 6 40,1 19,98 8,11 (6,60) 0,478 3,109∗∗∗ 1,326∗∗∗

8 7 60,0 6,81 3,26 (1,98) −0,895∗∗∗ −1,302∗∗ −0,826∗∗∗

9 8 5,4 5,62 1,05 (1,73) −0,193 −0,017 0,600∗∗∗

12 10 38,3 7,68 5,55 (1,07) −1,278∗∗∗ −2,179∗∗∗ −0,895∗∗∗

POL 1 1 6,5 10,93 7,65 (1,91) −0,390∗∗∗ −0,340∗∗∗ −0,468∗∗∗

2 1 63,1 6,74 2,16 (2,15) 0,265∗∗∗ 0,204∗∗ 0,0124 3 15,9 7,88 3,79 (3,39) −0,386∗∗∗ −0,220∗∗ −0,189∗

5 3 57,8 6,10 2,38 (2,61) −0,151∗ −0,117 −0,380∗∗∗

6 3 68,1 19,45 10,58 (7,49) −0,614∗∗∗ −0,423∗∗∗ −0,317∗∗∗

8 5 4,8 7,85 4,19 (2,67) −0,330∗∗∗ −0,316∗∗∗ −0,162∗

9 6 43,2 8,36 1,71 (2,66) −0,033 0,308∗∗∗ 0,07610 6 53,5 8,62 5,00 (2,51) 0,325∗∗∗ 0,200∗∗ 0,378∗∗∗

13 8 37,0 5,86 0,91 (0,93) −0,176∗∗ 0,033 0,12615 9 2,9 7,54 3,64 (2,80) −0,237∗∗∗ −0,369∗∗∗ −0,146∗

16 9 10,1 10,31 6,97 (2,31) −0,338∗∗∗ −0,311∗∗∗ −0,467∗∗∗

FIB 1 1 59,2 5,93 2,25 (1,98) 0,028 0,095∗∗∗ 0,157∗∗∗

4 3 68,1 13,50 10,09 (3,22) 0,322∗∗∗ 0,214∗∗∗ 0,272∗∗∗

5 4 9,6 7,29 4,43 (2,22) −0,181∗∗ −0,150∗∗∗ −0,175∗∗∗

6 4 65,1 9,32 5,25 (3,91) −0,380∗∗∗ −0,136∗∗∗ −0,084∗

7 6 34,9 12,29 1,42 (0,83) −0,139∗∗ −0,093∗∗∗ 0,073∗

8 6 46,2 7,92 1,98 (2,29) −0,080 0,056∗ 0,178∗∗∗

9 8 37,0 13,85 10,95 (2,38) 0,414∗∗∗ 0,217∗∗∗ 0,238∗∗∗

10 9 5,3 10,31 3,22 (2,89) 0,007 −0,116∗∗∗ −0,192∗∗∗

11 10 2,5 6,75 3,80 (2,30) −0,175∗∗ −0,103∗∗∗ −0,209∗∗∗

12 10 56,4 6,75 4,78 (2,10) 0,321∗∗∗ 0,136∗∗∗ 0,123∗∗

Notas: aLODc é o valor de LOD conjunto. bLODi é a média dos LODs individuais obtidosnas análises multivariadas, para a qual desvio-padrão (DP) foi calculado. cEfeitos significativosquando ∗p < 0,05, ∗∗p < 0,01 e ∗∗∗p < 0,001

83

APÊNDICE C – QTLs resultantes do mapeamento de múltiplos intervalos (MIM) univa-

riado em população de cana-de-açúcar

Tabela 14 – Estimativas dos efeitos aditivos (p e q) e de dominância (d) e os respectivos grupos de ligação(GLs) e posições (em centiMorgans – cM) dos QTLs mapeados em população de cana-de-açúcar para as médias marginais e conjuntas de cinco combinações de locais e cortes

Caráter QTL GL Posição(cM) LOD (DP)a Ef. Local-Corteb

1-1 1-3 2-1 2-2 2-3 Conjunta

ALT 2 24 1,0 1,82 (0,44) q 0,022∗∗ 0,022∗∗ 0,022∗∗ 0,030∗∗ 0,023∗∗ 0,022∗∗d −0,040∗ −0,033∗

4 46 181,0 5,36 (0,01) p 0,209∗∗∗ 0,240∗∗∗ 0,208∗∗∗ 0,236∗∗∗ 0,240∗∗∗ 0,240∗∗∗5 83 58,0 2,47 (0,05) d 0,034∗∗∗ 0,034∗∗∗ 0,034∗∗∗ 0,034∗∗∗ 0,034∗∗∗ 0,034∗∗∗6 112 0,0 2,85 (0,14) p −0,028∗∗∗ −0,029∗∗∗ −0,028∗∗∗ −0,027∗∗∗ −0,029∗∗∗ −0,029∗∗∗8 133 20,0 2,45 (0,15) p 0,028∗∗ 0,028∗∗ 0,028∗∗ 0,030∗∗∗ 0,028∗∗ 0,028∗∗9 222 0,0 8,99 (0,29) p −0,033∗ −0,033∗ −0,033∗ −0,029∗ −0,033∗ 0,086∗∗∗

d 0,085∗∗∗ 0,086∗∗∗ 0,086∗∗∗ 0,084∗∗∗ 0,086∗∗∗

TCH 1 1 69,2-75,0 3,20 (0,74) p −5,372∗∗∗ −3,947∗∗ −3,828∗∗∗ −3,266∗∗ −4,256∗∗∗q 6,331∗∗ 5,459∗∗ 3,947∗∗ 4,520∗∗ 4,683∗∗d 5,082∗ 4,315∗ 4,822∗

2 5 17,9 3,47 p 2,401∗q −3,437∗∗∗

5 43 0,0-16,0 2,48 (0,29) q 5,048∗∗ 2,505∗ 2,683∗d −4,465∗ −1,957∗ −2,166∗

6 64 3,0-4,9 1,74 (0,15) p −3,692∗∗ −3,340∗∗ −2,951∗∗ −3,179∗∗7 71 40,0 2,27 q −3,219∗∗9 88 6,6 1,91 (0,18) p 2,961∗ 3,260∗∗

d 4,150∗10 122 2,0 2,30 q −4,561∗

d 5,689∗∗11 131 0,0 4,31 (0,50) p 2,958∗ 3,412∗ 2,964∗∗ 3,107∗∗ 3,106∗

d −7,221∗∗∗ −5,231∗ −5,418∗∗ −4,824∗∗ −6,085∗∗13 163 0,0 5,83 (0,66) q 4,091∗∗∗ 4,463∗∗∗ 3,986∗∗∗ 3,547∗∗∗ 4,339∗∗∗

d −7,468∗∗∗ −6,525∗∗∗ −6,393∗∗∗ −6,745∗∗∗ −7,019∗∗∗14 167 6,2 2,08 (0,83) p −2,187∗ −2,808∗ −2,337∗

d 3,007∗∗ 2,072∗ 3,343∗∗ 2,272∗15 207 0,4-1,0 4,39 (1,21) d 8,490∗∗∗ 10,701∗∗∗ 6,550∗∗ 8,408∗∗∗ 9,925∗∗∗ 9,129∗∗∗

POL 1 4 43,3 4,75 (0,44) p −0,308∗∗∗ −0,287∗∗∗ −0,257∗∗∗ −0,239∗∗∗ −0,283∗∗∗2 6 29,6 4,08 (0,33) q −0,264∗∗∗ −0,245∗∗∗ −0,203∗∗∗ −0,189∗∗∗ −0,233∗∗∗

d 0,214∗∗ 0,199∗∗ 0,197∗∗ 0,184∗∗ 0,215∗∗3 26 22,0-28,5 2,62 (0,15) q 0,295∗∗∗ 0,272∗∗∗ 0,239∗∗∗ 0,221∗∗∗ 0,262∗∗∗4 97 3,7 1,25 (0,02) d 0,118∗ 0,110∗ 0,130∗

FIB 1 6 4,0-5,0 3,39 (0,11) p −0,272∗∗∗ −0,228∗∗∗ −0,236∗∗∗d 0,206∗ 0,170∗ 0,169∗

2 9 1,0 2,33 (0,02) p 0,180∗∗∗ 0,149∗∗5 60 7,0-9,0 2,80 (0,15) p −0,281∗∗∗ −0,230∗∗∗ −0,256∗∗∗ −0,208∗∗∗ −0,233∗∗6 124 2,0-6,0 4,45 (1,50) p 0,259∗∗ 0,211∗∗ 0,175∗∗ 0,143∗∗ 0,213∗∗

d 0,441∗∗∗ 0,364∗∗∗ 0,265∗∗ 0,222∗∗ 0,365∗∗∗7 150 14,0-15,0 3,41 (0,13) p 0,201∗∗ 0,165∗∗ 0,170∗∗

q −0,190∗ −0,153∗ −0,162∗8 167 0,0 3,26 (0,01) q 0,129∗ 0,110∗

d −0,267∗∗∗ −0,222∗∗∗

Notas: aLOD é a média dos LODs obtidos nas análises univariadas; para os QTLs co-localizados, desvio-padrão(DP) foi calculado. bEfeitos significativos quando ∗p < 0,05, ∗∗p < 0,01 e ∗∗∗p < 0,001

84

APÊNDICE D – QTLs resultantes do mapeamento de múltiplos intervalos (MIM) multi-

variado em população de cana-de-açúcar

Tabela 15 – Estimativas dos efeitos aditivos (p e q) e de dominância (d) e os respectivos grupos de ligação(GLs) e posições (em centiMorgans – cM) dos QTLs mapeados em população de cana-de-açúcar para as médias marginais de cinco combinações de locais e cortes

Caráter QTL GL Posição(cM) LODca LODi (DP)b Ef. Local-Cortec

1-1 1-3 2-1 2-2 2-3

ALT 1 1 53,5 2,61 0,44 (0,00) p −0,014 −0,014 −0,014 −0,014 −0,0142 24 51,0 1,76 1,20 (0,00) p 0,045 0,045∗ 0,045∗ 0,045∗ 0,0453 43 21,8 3,34 0,44 (0,01) p −0,015 −0,015 −0,015 −0,015 −0,0157 117 35,5 4,46 0,01 (0,00) p −0,002 −0,002 −0,002 −0,001 −0,001

TCH 1 1 33,7 4,50 0,59 (0,16) p −2,093 −1,602 −1,798 −1,761 −1,4233 7 0,0 6,02 0,76 (0,09) q −3,128 −3,474 −2,876 −2,709 −3,182

d 0,201 1,334 0,468 0,731 1,4484 42 20,2 8,66 0,30 (0,14) p −2,622 −2,167 −1,54 −1,495 −1,266

q −0,218 −0,022 −0,028 −0,061 0,1998 72 31,4 7,50 0,80 (0,22) p 2,286∗ 2,474∗ 1,435 1,725 1,671

12 133 36,4 7,08 0,16 (0,11) p −1,787 −0,952 −1,431 −0,856 −0,738q 1,849 1,458 1,564 1,159 1,275d 1,758 1,444 1,716 1,741 1,461

14 167 4,0 12,61 1,24 (0,35) d 3,372∗ 4,05∗∗ 2,212∗∗ 3,018 2,843

POL 1 4 43,3 5,22 4,24 (0,06) p −0,315∗∗∗ −0,294∗∗∗ −0,246∗∗∗ −0,229∗∗∗

2 6 29,6 4,66 2,58 (0,19) q −0,265∗∗∗ −0,246∗∗∗ −0,191∗∗∗ −0,177∗∗∗

d 0,228∗ 0,212∗ 0,185∗∗ 0,173∗∗

FIB 3 26 18,0 4,04 0,09 (0,09) p 0,05 0,037 −0,006 −0,011q −0,017 −0,009 0,037 0,037

4 50 10,6 5,40 3,40 (0,69) p −0,167∗ −0,143∗ −0,126 −0,108d −0,011 −0,008 0,039 0,032

Notas: aLODc é o valor de LOD conjunto. bLODi é a média dos LODs individuais obtidos nas análises multi-variadas, para a qual desvio-padrão (DP) foi calculado. cEfeitos significativos quando ∗p < 0,05, ∗∗p < 0,01 e∗∗∗p < 0,001

85

APÊNDICE E – Marcadores significativos resultantes da análise de marcas individual-

mente em população de cana-de-açúcar

Tabela 16 – Estimativas dos efeitos aditivos individuais dos marcadores de cana-de-açúcar relacionadosao genoma do sorgo sobre as médias conjuntas de quatro caracteres

Caráter Marcador Efeito Caráter Marcador Efeito Caráter Marcador Efeito

ALT sb1_4188246 −0,056∗∗ TCH sb2_7455650 12,238∗∗ POL sb9_44929840 −0,521∗∗

sb1_12219024 −0,059∗∗ sb2_50026760 −12,443∗∗ sb10_52650429 −0,366∗∗

sb1_14455981 −0,068∗∗ sb3_8750650 11,263∗∗ sb10_56295895 −0,401∗∗

sb1_52671762 0,066∗∗ sb3_52117257 11,352∗∗ sb10_56540062 0,480∗∗

sb2_22609350 −0,060∗∗ sb3_72128809 12,069∗∗ sb10_60131295 0,520∗∗∗

sb2_68475923 −0,056∗∗ sb4_173279 16,728∗∗ sb10_60131296 0,527∗∗∗

sb3_390231 0,070∗∗ sb4_711989 11,076∗∗ FIB sb1_18696270 0,333∗∗

sb3_541865 −0,069∗∗ sb5_48066020 11,319∗∗ sb1_50799049 0,331∗∗

sb3_1928213 −0,064∗∗ sb6_782163 −11,525∗∗ sb1_73398501 −0,383∗∗

sb3_6126551 −0,079∗∗ sb6_45032977 −13,507∗∗ sb2_6817295 −0,399∗∗

sb3_7546835 −0,073∗∗ sb7_7580104 13,795∗∗ sb2_52242660 0,468∗∗

sb3_9286412 −0,070∗∗ sb7_56993024 −15,794∗∗ sb2_60547040 0,298∗∗

sb3_73337885 −0,064∗∗ sb8_5298195 −10,093∗∗ sb2_63577008 0,361∗∗

sb4_9399 0,077∗∗ sb9_45536069 −11,525∗∗ sb2_71421489 0,323∗∗

sb4_49763421 0,068∗∗ sb10_8999958 −12,116∗∗ sb3_541804 −0,353∗∗

sb4_63654242 0,086∗∗ POL sb1_7645431 0,407∗∗ sb3_541826 −0,352∗∗

sb4_64604253 −0,057∗∗ sb1_9236816 −0,532∗∗∗ sb3_5691216 −0,306∗∗

sb5_17237746 −0,078∗∗ sb1_16417625 0,395∗∗ sb3_14771406 0,349∗∗

sb5_48533705 0,059∗∗ sb1_16417644 0,391∗∗ sb3_18259258 0,398∗∗

sb5_48533707 0,063∗∗ sb1_31488584 −0,411∗∗ sb3_58924723 0,346∗∗

sb5_61994091 −0,068∗∗ sb1_31624046 0,409∗∗ sb3_68287506 −0,344∗∗

sb6_45032977 −0,084∗∗∗ sb2_60082918 0,467∗∗∗ sb3_72046711 −0,328∗∗

sb7_53544684 −0,063∗∗ sb2_60547042 0,345∗∗ sb3_72046712 −0,357∗∗

sb8_3123434 −0,070∗∗ sb2_61202411 −0,401∗∗ sb4_9380 0,419∗∗

sb8_11128174 −0,247∗∗ sb2_62057915 0,403∗∗ sb4_59449990 0,380∗∗

sb9_49172170 −0,063∗∗ sb2_65330382 −0,403∗∗ sb4_60387435 0,378∗∗

sb9_49172185 −0,062∗∗ sb2_67849128 0,373∗∗ sb5_29034328 0,390∗∗

sb10_1156537 −0,059∗∗ sb3_2978336 −0,378∗∗ sb5_50145700 −0,358∗∗

sb10_1156542 −0,064∗∗ sb3_57883510 0,461∗∗ sb5_54760011 0,378∗∗

sb10_3260857 −0,077∗∗∗ sb4_61731192 −0,362∗∗ sb6_57305087 −0,546∗∗

sb10_3260858 −0,077∗∗∗ sb5_14386234 0,454∗∗ sb7_3717230 −0,358∗∗

TCH sb1_3077235 10,692∗∗ sb6_60560180 −0,388∗∗ sb8_5688896 0,364∗∗

sb1_60357211 13,391∗∗ sb9_1087507 −0,507∗∗ sb8_53867342 −0,327∗∗

Notas: Efeitos significativos quando ∗∗p < 0,01 e ∗∗∗p < 0,001