sobre a aritmética de curasv elípticas: o teorema de ... · neste momento não citarei nomes, ......

103

Upload: hoanglien

Post on 01-Dec-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Universidade Federal da Bahia -UFBA

Instituto de Matemática e Estatística - IME

Programa de Pós-Graduação em Matemática - PGMAT

Dissertação de Mestrado

Sobre a Aritmética de Curvas Elípticas: OTeorema de Mordell-Weil, a Conjectura de Birche Swinnerton-Dyer e o Problema dos Números

Congruentes

Yure Carneiro de Oliveira

Salvador-Bahia

Março de 2018

Sobre a Aritmética de Curvas Elípticas: OTeorema de Mordell-Weil, a Conjectura de Birche Swinnerton-Dyer e o Problema dos Números

Congruentes

Yure Carneiro de Oliveira

Dissertação de Mestrado apresentada ao

Colegiado da Pós-Graduação em Matemática da

Universidade Federal da Bahia como requisito

parcial para obtenção do título de Mestre em

Matemática.

Orientadora: Profa. Dra. Manuela da Silva

Souza.

Salvador-Bahia

Março de 2018

Oliveira, Yure Carneiro de, 1995

Sobre a Aritmética de Curvas Elípticas: O Teorema de Mordell-Weil,

a Conjectura de Birch e Swinnerton-Dyer e o Problema dos Números

Congruentes/ Yure Carneiro de Oliveira. Salvador: UFBA, 2018.

Quantidade de folhas f. 102 : il.

Orientadora: Profa. Dra. Manuela da Silva Souza.

Dissertação (mestrado) Universidade Federal da Bahia, Instituto de

Matemática, Programa de Pós-graduação em Matemática, 2018.

Referências bibliográcas.

1. Curvas Elípticas. 2. Mordell-Weil. 3. Conjectura de Birch e

Swinnerton-Dyer. 4. Números Congruentes. I. Souza, Manuela da Silva.

II. Universidade Federal da Bahia, Instituto de Matemática e Estatística.

III. Título.

CDU : 512.552.7

À Deus, à minha familia e amigos.

"O que é nascido de Deus vence o mundo;

e esta é a vitória que vence o mundo: a

nossa fé. (BÍBLIA, 1 João 5:4)

Agradecimentos

Primeiramente, agradeço à Deus por tudo, pelo apoio que desde sempre tem me

concedido, pela força que tem me dado nos momentos de fraqueza, nos momentos de

desespero, momentos estes que se não fosse pela fé que tenho em Ti, não teria suportado.

Ao Senhor o meu muito obrigado.

Agradeço à minha família, minha mãe, minhas irmãs e irmãos, sempre me dando

apoio nas minhas tomadas de decisões, preocupados em sempre me ajudar. Eu dou

graças pela família abençoada que tenho e em especial à minha mãe, que sempre colocou

os lhos à frente de duas necessidades, e nela pude perceber um amor diferente, que deve

ser valorizado e muitas das vezes não paramos para perceber os detalhes desse cuidado

especial e diferenciado que uma mãe tem pelos lhos. Agradeço também a Paulo e dona

Vera, pessoas super especiais que fazem parte da minha vida, às quais só tenho a agradecer.

Agradeço à minha orientadora, a professora Manuela. Agradeço imensamente

por poder ter estudado e sido orientado pela senhora, por ter me ajudado em vários

momentos, pelas conversas sobre o meu futuro prossional, pelas dicas e conselhos, por

ter me orientado em minha monograa e nesta dissertação e por ter acredidato em mim

com respeito ao conteúdo deste trabalho.

Um muito obrigado aos professores da banca, à professora Cecília Salgado que

mesmo tendo me conhecido à pouco tempo, aceitou me orientar no futuro doutorado

e fazer parte dessa banca, também pela ajuda que me deu sobre a temática para essa

dissertação. Ao professor Marc Hindry, que também mesmo me conhecendo à pouco

tempo, aceitou fazer parte dessa banca. É um imenso prazer contar com a presença de

vocês na avaliação desse trabalho.

Não posso deixar de agradecer ao professor Samuel Gomes, que acreditou em mim

desde a minha entrada na graduação, me ajudou muito e teve grande inuência sobre a

formação do meu raciocínio matemático, em que grande parte aprendi com ele.

Foram muitos os professores do Instituto de Matemática da UFBA que tiveram

participação na minha formação e me ajudaram em vários momentos, aos quais devo

agradecimento, aos professores e professoras, Carlos Bahiano, Oscar, Rita, José Nelson,

Joseph, Paulo Varandas, Vitor, Joilson, Juan Gonzalez, Carmela, Ciro, Thiago, Vanessa,

Mathieu, Jerome, Jaime e Samuel Feitosa. Que Deus abençoe a cada um de vocês.

Sobre os amigos que z dentro e fora da Universidade, essa lista com certeza

contém muitas pessoas, à todos vocês cam um muito obrigado pelos momentos de estudo

e diversão, pelos momentos no R.U., pelas boas conversas que tive com cada um de vocês.

Neste momento não citarei nomes, pois realmente são muitos de vocês, mas creio que cada

um saiba o quanto sou grato.

Agradeço aos meus amigos do Quarteto Fantástico. Aos amigos que conheci e

professores que tive no IFBA, em especial ao professor Paulo Vicente, à professora Juanice

e ao professor Ziul, muito obrigado.

Finalmente, agradeço à CAPES pelo apoio nanceiro concedido a mim durante

todo o meu mestrado.

Resumo

O objetivo deste trabalho é estudar as curvas elípticas, mais precisamente, será

apresentada a demonstração do Teorema de Mordell-Weil (T.M.W), resultado este que

diz que se E/K é uma curva elíptica sobre um corpo de números K, então o grupo E(K)

dos seus pontos K-racionais é nitamente gerado. Assim E(K) ∼= E(K)tor ⊕ Zr, paraalgum r ≥ 0, em que esse invariante r é chamado o posto algébrico de E. Por m,

serão apresentados dois famosos problemas aritméticos, sendo eles a Conjectura de Birch

e Swinnerton-Dyer e o Problema dos Números Congruentes e será discutida a relação

entre esses dois problemas.

Palavras-chave: Curvas Elípticas. Mordell-Weil. Conjectura de Birch e Swinnerton-

Dyer. Números Congruentes.

Abstract

The objective of this work is to study the elliptic curves, more precisely, the

demonstration of the Mordell-Weil Theorem (M.W.T) will be presented, which results

that if E/K is a elliptic curve on a numbers eld K, then the E(K) group of its K-

rational points is nitely generated. Thus E(K) ∼= E(K)tor ⊕ Zr, for some r ≥ 0, where

that invariant r is called the algebraic rank. Finally, two famous arithmetical problems

will be presented, the Birch and Swinnerton-Dyer Conjecture and the Congruent Numbers

Problem, and the relationship between these two problems will be discussed.

Keywords: Elliptic Curves. Mordell-Weil. Birch and Swinnerton-Dyer conjecture. Con-

gruent Numbers.

Sumário

Introdução 1

1 Preliminares 7

1.1 Variedades Ans e Projetivas . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.1.1 Variedades Ans . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.1.2 Variedades Projetivas . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.2 Curvas Algébricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.2.1 Mapas entre Curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.2.2 Divisores de uma curva . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.2.3 Diferenciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

1.2.4 O Teorema de Riemann-Roch . . . . . . . . . . . . . . . . . . . . . 25

2 Curvas Elípticas 30

2.1 Lei de grupo para uma curva elíptica . . . . . . . . . . . . . . . . . . . . . 35

2.2 Redução de uma curva elíptica . . . . . . . . . . . . . . . . . . . . . . . . . 41

3 O Teorema de Mordell-Weil 45

3.1 A versão fraca do Teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.1.1 O emparelhamento de Kummer . . . . . . . . . . . . . . . . . . . . 47

3.1.2 A demonstração da versão fraca . . . . . . . . . . . . . . . . . . . . 49

3.2 O Teorema da Descida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.3 Alturas no Espaço Projetivo . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.4 Alturas em Curvas Elípticas . . . . . . . . . . . . . . . . . . . . . . . . . . 65

4 A Conjectura de Birch e Swinnerton-Dyer (BSD) e o Problema dos

Números Congruentes (PNC) 73

4.1 A Conjectura de Birch e Swinnerton-Dyer . . . . . . . . . . . . . . . . . . 74

4.2 O Problema dos Números Congruentes . . . . . . . . . . . . . . . . . . . . 81

Referências 92

Introdução

O objeto de estudo deste trabalho são as chamadas curvas elípticas. Suas apa-

rições iniciais remontam à Grécia Antiga, no livro Arithmetica de Diophantus. Muitos

matemáticos ao longo do tempo, a exemplo de Poincaré, Birch, Swinnerton-Dyer, Lenstra

dentre outros se depararam com problemas que os levaram a estudar a natureza das curvas

elípticas. Atualmente, sabe-se bastante a seu respeito e de sua utilidade em aplicações

que vão desde a Matemática pura à Física e Criptograa, embora muitos sejam também

os problemas e conjecturas que as envolvem. Alguns destes problemas serão abordados

aqui.

As curvas elípticas são objetos de natureza geométrica, que admitem uma es-

trutura algébrica de grupo denida geometricamente. Este comportamento geômetro-

algébrico faz destes um dos objetos mais fascinantes da matemática, com variadas apli-

cações. Aqui K denotará um corpo de números e K um fecho algébrico.

Uma curva elíptica é uma curva no plano projetivo P2, com um ponto base espe-

cícado, satisfazendo uma equação homogênea da forma

Y 2Z + a1XY Z + a3Y Z2 = X3 + a2X

2Z + a4XZ2 + a6Z

3,

onde O = [0, 1, 0] é o ponto base e a1, . . . , a6 ∈ K. A equação acima é chamada equação

de Weierstrass, e pode ser colocada em coordenadas não homogêneas fazendo x =X

Ze

y =Y

Z, obtendo

E : y2 + a1xy + a3y = x3 + a2x2 + a4x+ a6.

Lembrando que devemos considerar o ponto no innito, denotado por O. Se a1, . . . ,

a6 ∈ K, dizemos que E está denida sobre K, e escrevemos E/K.

Podemos denir também uma curva elíptica como sendo um par (E,O), onde

E é uma curva projetiva de gênero 1, e O um ponto de E. Ambas as denições são

equivalentes, no sentido de que considerando uma curva dada pela primeira denição, ela

satisfaz a segunda denição, e que se considerarmos uma curva pela segunda denição,

existirá um modelo em P2 isomorfo à curva em questão.

O conjunto dos pontos K-racionais de E, denotado por E(K), é denido como o

2

3

conjunto dos pontos sobre a curva com coordenadas em K, isto é,

E(K) = (x, y) ∈ K2 : y2 + a1xy + a3y = x3 + a2x2 + a4x+ a6 ∪ O,

onde a1, . . . , a6 ∈ K.

Estaremos interessados em estudar a geometria dessas curvas para então, buscar

entender a sua aritmética no sentido de buscar informações sobre a estrutura dos seus

pontos K-racionais.

Henry Poincaré conjecturou que o conjunto de pontos racionais seria um grupo

nitamente gerado e Mordell provou esse resultado para curvas elípticas racionais em 1922,

e em 1928, Weil estendeu esse resultado para curvas elípticas sobre corpos de números,

tendo hoje o resultado a seguinte forma: Se E/K é uma curva elíptica sobre um corpo de

números, então E(K) é um grupo nitamente gerado, com

E(K) ∼= E(K)tor ⊕ Zr,

para algum r ≥ 0. Esse r chamaremos de posto algébrico de E, e E(K)tor o grupo de

torção, que é o subgrupo dos pontos K-racionais de ordem nita. O Capítulo 3 será

dedicado à demonstração desse resultado.

Grande parte da pesquisa em geometria aritmética, área que usa de métodos da

geometria algébrica para obter resultados aritméticos, é o estudo de pontos racionais em

variedades. Assim, é de grande importância saber o que acontece com o subgrupo de

torção e o posto de uma curva elíptica. Sobre o subgrupo de torção (pontos de ordem

nita), Mazur provou o seguinte resultado para curvas elípticas racionais, que descreve as

possibilidades para o subgrupo de torção.

Seja E/Q uma curva elíptica. Então E(Q)tor é isomorfo a um dos seguintes

grupos

Z/nZ, com 1 ≤ n ≤ 10 ou n = 12;

Z/2Z⊕ Z/2nZ, com 1 ≤ n ≤ 4.

Calcular o posto de uma curva eliptica em geral é um problema difícil, e sobre

isso, em 1965, B. J. Birch e Sir H. P. F. Swinnerton-Dyer conjecturaram que o posto

algébrico de uma curva elíptica racional seria igual a um outro invariante, agora analítico,

relacionado a L-série da curva, que deniremos logo mais.

Seja E : y2 = x3 + ax + b, uma curva elíptica racional na forma de Weierstrass

reduzida, com a, b ∈ Z e ∆ seu discriminante. Dado p primo, seja Z → Fp, z 7→ z, a

redução módulo p e considere a curva

Ep : y2 = x3 + ax+ b e

4

ap = p+ 1−#Ep(Fp),

onde Ep(Fp) é o conjunto de pontos Fp-racionais da curva Ep, chamada a redução módulo

p de E. Dizemos que p é um primo de boa redução se a curva Ep é não singular, caso

contrário dizemos que p é de má redução. Temos que os primos de boa redução são

exatamente os primos que não dividem o discriminante ∆.

Sendo E/Q uma curva racional com equação E : y2 = x3 + ax+ b, com a, b ∈ Z.Sua L-série é denida pelo produto de Euler

L(E, s) =∏p | ∆

1

1− app−s∏p - ∆

1

1− app−s + p1−2s,

com s ∈ C.Temos que o produto acima dene uma série de Dirichlet

L(E, s) =∞∑n=1

bnns,

e nesse caso, bp = ap, para todo p primo. É possível mostrar que a série acima converge

para todo ponto s do plano com Re(s) >3

2. Graças ao Teorema da Modularidade provado

por Wiles em [Wiles2], é possível mostrar a existência de continuação analítica de L(E, s)

a todo o plano complexo. Assim podemos considerar a expansão de L(E, s) em torno de

s = 1. Temos então a versão fraca da Conjectura de Birch e Swinnerton-Dyer.

A expansão de Taylor de L(E, s) em torno de s = 1 tem a forma

L(E, s) = cr(s− 1)r + cr+1(s− 1)r+1 + termos de graus maiores,

em que cr 6= 0 e r é o posto algébrico de E.

Desde a sua formulação, alguns resultados parciais foram encontrados, mas até

hoje o problema continua em aberto, sendo que em 2000 o Clay Mathematics Institute o

listou como um dos problemas do milênio.

No Capítulo 4, apresentaremos a conjectura, que sendo verdadeira terá como con-

sequência a existência de um algoritmo para determinar se um dado inteiro positivo n é

ou não um número congruente. Por um número congruente, entendemos um racional que

é área de um triângulo retângulo com lados racionais. Até o momento não temos conhe-

cimento de um tal algoritmo, e esse é o chamado Problema dos Números Congruentes, do

qual falaremos nesse trabalho.

A relação do problema dos números congruentes com as curvas elípticas se deve

ao seguinte.

5

Dado n > 1, denimos a curva elíptica

En : y2 = x3 − n2x.

Sobre En temos o seguinte resultado.

n é congruente se, e somente se, En tem innitos pontos racionais.

Pela proposição acima, n é um número congruente se, e somente se, o posto

algébrico de En é positivo.

Sobre o problema de decidir se um dado inteiro positivo n é congruente, Tunnell

em [Tunnell], provou o seguinte resultado.

Seja n um inteiro positivo livre de quadrados. Dena

An = #(x, y, z) ∈ Z3 : n = 2x2 + y2 + 8z2,

Bn = #(x, y, z) ∈ Z3 : n = 2x2 + y2 + 32z2,

Cn = #(x, y, z) ∈ Z3 : n = 8x2 + 2y2 + 16z2,

Dn = #(x, y, z) ∈ Z3 : n = 8x2 + 2y2 + 64z2.

Se n é ímpar e um número congruente, então An = 2Bn. Se n é par e congruente, então

Cn = 2Dn. Por outro lado, se a versão fraca de BSD vale para En, então se n é ímpar e

An = 2Bn ou se n é par e Cn = 2Dn, então n é congruente.

No Capítulo 1, introduziremos alguns conceitos e resultados sobre variedades

algébricas ans e projetivas, conceitos como suavidade e dimensão serão denidos. Ainda

nesse capítulo, daremos atenção às variedadades algébricas de dimensão 1, as chamadas

curvas algébricas. Resultados como o Teorema de Bézout e o Teorema de Riemann-Roch

serão enunciados.

No Capítulo 2, as curvas elípticas serão introduzidas. Mostraremos como é intro-

duzida à estrutura de grupo em uma curva elíptica, e encontraremos expressões algébricas

para essa operação de grupo que será denida geometricamente. Também estaremos in-

teressados em estudar a curva quando vista sobre o completamento do corpo K por uma

valorização discreta, a m de denir a redução da curva com relação a valorização.

No Capítulo 3, será apresentada a demonstração do Teorema de Mordell-Weil.

Começamos demonstrando a versão fraca do Teorema de Mordell-Weil, provamos o Teo-

rema da Descida que diz quando uma função real denida em um grupo abeliano satisfaz

certas propriedades nos permite deduzir que este grupo é nitamente gerado. Depois de

provado o Teorema da descida, estaremos em busca de construir funções em curvas elíp-

ticas que satisfaçam as hipóteses do Teorema da Descida, para enm provar o Teorema

de Mordell-Weil.

6

No Capítulo 4, faremos uma breve apresentação da Conjectura de Birch e Swinner-

ton-Dyer (BSD) e do Problema dos Números Congruentes, como estes problemas aritmé-

ticos estão relacionados com curvas elípticas. Um deles, a Conjectura BSD já nasce como

um problema sobre curvas elípticas, já o Problema dos Números Congruentes é um pro-

blema sobre a determinação dos inteiros que são medidas de áreas de triângulos retângulos

com lados racionais.

Capítulo 1

Preliminares

Este texto tratará das chamadas curvas elípticas, e para isso necessitamos de

alguns conceitos e resultados da Geometria Algébrica. Neste capítulo serão introduzidos

noções básicas da linguagem da Geometria Algébrica que serão o suporte inicial para os

demais capítulos. Para tal abordagem assumiremos que o leitor esteja familiarizado com

algumas ferramentas da Álgebra Comutativa e Teoria de Galois. Indicamos as referências

[Atiyah] e [Morandi]. Usaremos |X| para denotar a cardinalidade do conjunto X.

A principal referência para o desenvolvimento deste capítulo é o livro ([Silver-

man]). Durante o texto K denotará um corpo perfeito, e K o seu fecho algébrico e

G(K/K) o grupo de Galois dessa extensão.

1.1 Variedades Ans e Projetivas

Nesta seção faremos uma breve exposição sobre variedades algébricas, denindo

conceitos como suavidade, dimensão, anel local dentre outros. Alguns resultados serão

provados, e outros estarão acompanhados de referências para sua demonstração.

1.1.1 Variedades Ans

Denição 1.1. O n-espaço am (sobre K) é o conjunto das n-uplas com entradas em

K

An = An(K) = (x1, . . . , xn) : xi ∈ K.

Similarmente, o conjunto dos pontos K-racionais de An é o conjunto

An(K) = (x1, . . . , xn) : xi ∈ K.

É imediato vericar que grupo de Galois G(K/K) age sobre An, da seguinte

7

8

forma: Para τ ∈ G(K/K) e P ∈ An,

P τ = (τ(x1), . . . , τ(xn)).

Assim, An(K) pode ser caracterizado por

An(K) = P ∈ An : P τ = P, ∀τ ∈ G(K/K).

Seja K[X] = K[x1, . . . , xn] o anel de polinômios em n variáveis e seja I ⊆ K[X]

um ideal. Para cada I associamos um subconjunto V (I) de An

V (I) = P ∈ An : f(P ) = 0, ∀f ∈ I.

Disso, segue a denição de conjunto algébrico.

Denição 1.2. Um conjunto algébrico (am) é qualquer conjunto da forma V (I). Se

V é um conjunto algébrico, o ideal de V é denido como

I(V ) = f ∈ K[X] : f(P ) = 0, ∀P ∈ V .

Um conjunto algébrico é denido sobre K se seu ideal I(V ) pode ser gerado por polinô-

mios em K[X], e denotaremos por V/K.

Se V é denido sobre K, então o conjunto dos pontos K-racionais de V é o

conjunto

V (K) = V ∩ An(K).

Na denição de conjunto algébrico, consideramos o conjunto de zeros em comum

de polinômios em um ideal, mas poderíamos ter tomado um conjunto S qualquer de

polinômios e tomado V (S) como na denição de V (I). Temos que V (S) = V (〈S〉), onde〈S〉 é o ideal gerado por S.

Sabemos que pelo Teorema da Base de Hilbert, todos os ideais de K[X] e K[X]

são nitamente gerados, de onde segue que todo conjunto algébrico é a interseção de

uma quantidade nita de conjuntos algébricos gerados por conjuntos unitários de certos

polinômios.

Um outro resultado de extrema importância é o Teorema dos Zeros de Hilbert.

Teorema 1.3 (Nullstellenssatz). Seja K um corpo algebricamente fechado. Se I é um

ideal de K[x1, . . . , xn], então

I(V (I)) =√I,

onde√I denota o radical de I, ou seja,

√I = f ∈ K[x1, . . . , xn] : fm ∈ I, para algumm >

1.

9

Demonstração. Ver (Capítulo 1, Teorema 1.3A, [Hartshorne]).

Denição 1.4. Um conjunto algébrico am V é chamada uma variedade (am) se

I(V ) é um ideal primo em K[X].

Exemplo 1.5.

Na gura temos dois exemplos de conjuntos algébricos, onde mostramos apenas

os pontos de coordenadas reais. Em a) temos um exemplo de variedade, já o conjunto

algébrico em b) não é uma variedade.

Com efeito, como I(V (x2−y)) =√〈x2 − y〉 = 〈x2−y〉 é primo, então V (x2−y) é

uma variedade. Agora, sendo f(x, y) = x−y e g(x, y) = x+y, temos que f(1,−1) = 2 6= 0

e g(1, 1) = 2 6= 0. Mas como (1,−1), (1, 1) ∈ V (x2−y2) então x−y, x+y 6∈ I(V (x2−y2)).

Assim, I(V (x2 − y2)) não é primo, visto que (x− y) · (x+ y) = x2 − y2 ∈ I(V (x2 − y2)).

Seja V/K uma variedade, isto é, V é uma variedade denida sobre K. Então, o

anel de coordenadas ans de V/K é denido por

K[V ] =K[X]

I(V/K).

O anel K[V ] é um domínio de integridade. Seu corpo quociente (corpo de frações) é

denotado por K(V ) e é chamado o corpo de funções de V/K. Similarmente, K[V ] e

K(V ) são denidos substituindo K por K.

Denimos agora uma noção de extrema importância, que é o conceito de dimensão

de uma variedade.

Denição 1.6 (Dimensão de uma variedade). Seja V uma variedade. A dimensão de

V , denotada por dim(V ), é o grau de transcendência de K(V ) sobre K.

Exemplo 1.7.

• dim(An) = n.

10

• Se V = V (f), para algum f ∈ K[X] −K, então dim(V ) = n − 1. Dizemos que V

é uma hipersuperfície.

Quando estudamos objetos geométricos, estamos interessados em saber se parece

razoavelmente suave. A denição que segue, formaliza essa idéia em termos do critério

Jacobiano usual para a existência de espaço tangente.

Denição 1.8. Seja V uma variedade, P ∈ V , e f1, . . . , fm ∈ K[X] um conjunto de

geradores para I(V ). Então V é não singular (ou suave) em P se a matriz m× n(∂f1

∂xj(P )

)16i6m,16j6n

tem posto n − dim(V ). Se V é não singular em todo ponto então dizemos que V é não

singular (ou suave).

Exemplo 1.9. Se V é dada por uma única equação polinomial não constante

f(x1, . . . , xn) = 0.

Então como dim(V ) = n− 1, temos que P ∈ V é ponto singular se, e somente se,

∂f

∂x1

(P ) = · · · = ∂f

∂xn(P ) = 0.

Existe uma outra forma de caracterizarmos a suavidade de um ponto em uma

variedade. Isso se dará em termos das funções na variedade e mostrará que esta denição

é independente da escolha dos geradores do ideal. Para cada ponto P ∈ V , denimos o

seguinte ideal MP de K[V ] por

MP = f ∈ K[V ] : f(P ) = 0.

Claramente, MP está bem denido e além disso, MP é um ideal maximal, visto que existe

um isomorsmo K[V ]/MP → K dado por f 7→ f(P ).

Temos também que o quociente MP/M2P é um K-espaço vetorial de dimensão

nita. Antes de mostramos a caracterização de suavidade em termos das funções denidas

na variedade, provaremos o seguinte resultado.

Proposição 1.10. Seja L corpo e a1, . . . , an ∈ L. Então o ideal AP = (x1− a1, . . . , xn−an) ∈ L[X] = L[x1, . . . , xn] é maximal.

Demonstração. Para vericarmos isso, basta mostrar que a aplicação L[X]/AP → L dada

por f + AP 7→ f(a1, . . . , an) é um isomorsmo de anéis. Assim teremos que L[X]/AP é

um corpo, de onde segue que AP é maximal em L[X].

11

Não é difícil vericar que esta aplicação está bem denida, é um homomorsmo

de anéis e que é sobrejetiva. A maior diculdade vem da sua injetividade.

Seja f ∈ L[X] tal que f(a1, . . . , an) = 0, mostremos que f ∈ AP , de onde

concluiremos que esta aplicação tem núcleo trivial, implicando na sua injetividade.

Temos que f(a1, . . . , an−1, xn) ∈ L[xn] tem an como raíz. Assim, existe fn ∈ L[xn]

tal que

f(a1, . . . , an−1, xn) = fn · (xn − an).

Agora, temos que f(a1, . . . , xn−1, xn) − fn · (xn − an) ∈ (L[xn])[xn−1] tem an−1

como raíz. Assim, existe um polinômio fn−1 ∈ L[xn−1, xn] para o qual temos

f(a1, . . . , xn−1, xn)− fn · (xn − an) = fn−1 · (xn−1 − an−1).

Procedendo de forma recursiva, obteremos que f(x1, . . . , xn) pode ser escrito da

forma

f =n∑i=1

fi · (xi − ai),

para algum f1, . . . , fn ∈ L[X]. De onde segue que f ∈ AP .

Proposição 1.11. Seja V uma variedade. Um ponto P ∈ V é não singular se, e somente

se,

dimK MP/M2P = dim(V ).

Demonstração. Seja P = (a1, . . . , an) ∈ V , e seja AP = (x1 − a1, . . . , xn − an) o corres-

pondente ideal maximal de K[X]. Denimos a aplicação linear

θ : K[X]→ Kn

θ(f) =

(∂f

∂x1

(P ), . . . ,∂f

∂x1

(P )

).

Temos que θ(xi−ai), i = 1, . . . , n, formam uma base para Kn, e que θ[A2

P ] = 0. Assim,

θ induz um isomorsmo linear θ′ : AP/A2P → K

n.

Agora seja I(V ) o ideal de V em K[X], e sejam f1, . . . , ft um conjunto de gera-

dores de I(V ). Então o posto da matriz Jacobiana J =

(∂f1

∂xj(P )

)16i6t,16j6n

é igual a

dimensão de θ[I(V )] como subespaço de Kn. Usando o isomorsmo θ′, essa dimensão é

igual a dimensão do subespaço (I(V ) + A2P )/A2

P de AP/A2P .

Temos também que

MP/M2P∼= AP/(I(V ) + A2

P ).

Além disso, dimK(AP/A2P ) = dimK(AP/(I(V ) + A2

P )) + dimK((I(V ) + A2P )/A2

P ).

12

Assim,

Posto (J) = dimK((I(V ) + A2P )/A2

P )

= dimK(AP/A2P )− dimK(AP/(I(V ) + A2

P ))

= n− dimK(MP/M2P ).

Portanto, P é não singular se, e somente se, dimK MP/M2P = dim(V ).

Agora deniremos o anel local de uma variedade em um ponto.

Denição 1.12. O anel local de V em P , denotado por K[V ]P , é a localização de

K[V ] em MP , ou seja,

K[V ]P = F ∈ K(V ) : F = f/g para algum f, g ∈ K[V ], com g(P ) 6= 0.

Note que se F = f/g ∈ K[V ]P , então F (P ) = f(P )/g(P ) está bem denido. As funções

em K[V ]P são chamadas regulares (ou denidas) em P .

1.1.2 Variedades Projetivas

Os espaços projetivos foram pensados como um processo de adicionar pontos no

innito ao espaço am. Denimos o espaço projetivo como a coleção de retas passando

pela origem no espaço am de dimensão maior que um.

Denição 1.13. O n-espaço projetivo (sobre K), denotado por Pn ou Pn(K), é o

conjunto de todas as (n+ 1)-uplas (x0, x1, . . . , xn) ∈ An+1 tal que, ao menos um xi é não

nulo, módulo a relação de equivalência

(x0, x1, . . . , xn) ∼ (y0, y1, . . . , yn)

se existe um λ ∈ K∗ tal que xi = λyi para todo i. Uma classe de equivalência

(λx0, λx1, . . . , λxn) : λ ∈ K∗

é denotada por [x0, x1, . . . , xn], e os x0, x1, . . . , xn individualmente são chamadas coor-

denadas homogêneas para o correpondente ponto em Pn. O conjunto dos pontos

K-racionais em Pn é o conjunto

Pn(K) = [x0, x1, . . . , xn] ∈ Pn : existem y0, . . . , yn ∈ K, [x0, x1, . . . , xn] = [y0, y1, . . . , yn].

Pode-se notar que o grupo de Galois G(K/K) age sobre Pn por ação sobre as

13

coordenadas homogêneas

[x0, x1, . . . , xn]τ = [xτ0, xτ1, . . . , x

τn].

Esta ação está bem denida, independente da escolha de coordenadas homogêneas, dado

que

[λx0, λx1, . . . , λxn]τ = [λτxτ0, λτxτ1, . . . , λ

τxτn] = [xτ0, xτ1, . . . , x

τn].

A m de denirmos as variedades projetivas, seguindo a idéia de tomar pontos

do espaço projetivo que sejam zeros de polinômios, precisamos que esta denição inde-

penda das coordenadas homogêneas associada ao ponto. Para isso precisamos da seguinte

denição.

Denição 1.14. Um polinômio f ∈ K[X] = K[x0, x1, . . . , xn] é homogêneo de grau d

se

f(λx0, λx1, . . . , λxn) = λd · f(x0, x1, . . . , xn), ∀λ ∈ K.

Um ideal I ⊆ K[X] é homogêneo se é gerado por polinômios homogêneos.

Seja f um polinômio homogêneo e seja P ∈ Pn. Agora faz sentido perguntar se

f(P ) = 0, uma vez que a resposta é independente da escolha das coordenadas homogêneas

para P .

Para cada ideal homogêneo I, associamos um subconjunto de Pn dado por

V (I) = P ∈ Pn : f(P ) = 0, para todo polinômio homogêneo f ∈ I.

Denição 1.15. Um conjunto algébrico (projetivo) é qualquer conjunto da forma

V (I) para algum ideal homogêneo I. Se V é um conjunto algébrico projetivo, o ideal

(homogêneo) de V , denotado por I(V ), é o ideal de K[X] gerado por

f ∈ K[X] : f é homogêneo e f(P ) = 0,∀P ∈ V .

Dizemos que V é denido sobre K, denotado por V/K, se seu ideal I(V ) pode ser

gerado por polinômios homogêneos em K[X]. Se V é denido sobre K, então o conjunto

dos pontos K-racionais de V é o conjunto

V (K) = V ∩ Pn(K).

Como usual, V (K) pode também ser descrito como

V (K) = P ∈ V : P τ = P, ∀τ ∈ Gal(K/K).

Assim como foi feito para os conjuntos algébricos ans, podemos denir a noção

14

de variedade projetiva.

Denição 1.16. Um conjunto algébrico projetivo V é chamado uma variedade (proje-

tiva) se seu ideal homogêneo I(V ) é um ideal primo em K[X].

Agora, de forma natural podemos enxergar o espaço am An como subconjunto

do espaço projetivo Pn, da seguinte forma.

Fixada uma coordenada 0 6 i 6 n consideramos a inclusão

ϕi : An −→ Pn

(x1, . . . , xn) 7−→ [x1, . . . , xi−1, 1, xi, . . . , xn].

Agora denotamos por Hi ao hiperplano em Pn denido pela equação xi = 0, isto

é,

Hi = P = [x0, . . . , xn] ∈ Pn : xi = 0.

Temos que existe uma bijeção natural entre An e o complemento de Hi, denotado

por Ui, ou seja, sendo Ui = [x1, . . . , xn] ∈ Pn : xi 6= 0 temos a correspondência

ϕ−1i : Ui −→ An

[x0, . . . , xn] 7−→(x0

xi, . . . ,

xi−1

xi,xi+1

xi, . . . ,

xnxi

).

Assim, para um i xado, podemos identicar An com Ui em Pn. Se V é uma

variedade projetiva em Pn temos que V ∩ An, que nada mais é do que ϕ−1i (V ∩ Ui) para

algum i xado, é uma variedade am cujo ideal I(V ∩ An) ⊆ K[Y ] é dado por

I(V ∩ An) = f(y0, y1, . . . , yi−1, 1, yi+1, . . . , yn) : f(x0, . . . , xn) ∈ I(V ).

Quando estivermos fazendo referência à indenticação An com Ui, usaremos a

notação Ani .

Como os conjuntos U0, . . . , Un cobrem o espaço projetivo Pn, toda variedade pro-jetiva V é coberta pela coleção de variedades ans V ∩ An

0 , . . . , V ∩ Ann, via as aplicações

ϕi.

Se xarmos i, podemos considerar uma variedade projetiva V como a união de

sua parte am V ∩Ani com o conjunto dos seus pontos no innito V ∩Hi, e denotaremos

Hi por H∞.

Esse processo de considerar o polinômio f(y0, y1, . . . , yi−1, 1, yi+1, . . . , yn) no lugar

de f(x0, . . . , xn) é chamado desomogeneização com respeito a xi. E a inversão deste

processo é denida da seguinte forma, dado f(y1, . . . , yn) ∈ K[y1, . . . , yn], denimos

f ∗(x0, . . . , xn) = xdi · f(x0/xi, . . . , xi−1/xi, xi+1/xi, . . . , xn/xi),

15

onde d = deg(f) é o menor inteiro positivo tal que f ∗ é um polinômio. Chamaremos f ∗

de a homogeneização de f com respeito à xi.

Denição 1.17. Seja V uma variedade projetiva e escolha i tal que V ∩Ani 6= ∅. Denimos

a dimensão de V como a dimensão da variedade am V ∩ Ani .

Temos que esta denição independe da escolha do j para o qual V ∩Anj 6= ∅. Para

isso podemos também denir o corpo de funções de V como sendo o corpo das funções

racionais F (X) =f(X)

g(X)tais que

(i) f e g são homogêneos de mesmo grau.

(ii) g 6∈ I(V ).

(iii) e identicamos duas funçõesf1

g1

ef2

g2

se f1g2 − f2g1 ∈ I(V ).

Existe um isomorsmo entre os corpos dados por essas duas denições. Assim

temos que a denição de dimensão de V independe da escolha do j tal que V ∩ Anj 6= ∅.

1.2 Curvas Algébricas

Como já foi mencionado no início deste capítulo, pretendemos denir os principais

conceitos e resultados que serão necessários nos demais capítulos. Nesta seção, apresen-

tamos as denições de curvas algébricas, mapas entre curvas, divisores e diferenciais, e

enunciamos o Teorema de Riemann-Roch.

Ao adotarmos a linguagem e notação usadas em [Silverman], optamos por não de-

nir conceitos como a Topologia de Zariski, espaços multihomogêneos e variedades quase-

projetivas. Nessa abordagem mais geral, munimos os espaços ans, projetivos e mais

geralmente os multiprojetivos, com uma topologia na qual os fechados são os conjuntos

algébricos, e as variedades serão os fechados irredutíveis, sendo que um subconjunto Y

de um espaço topológico X é dito irredutível, quando não puder ser escrito como a união

de dois subconjuntos fechados relativos e próprios, isto é, se Y = Y1 ∪ Y2 com Y1 e Y2

fechados em Y , então Y = Y1 ou Y = Y2. Assim, denida a topologia por meio dos

fechados, podemos falar de abertos e assim temos uma noção precisa de vizinhança de

um ponto por meio dos abertos que contém este ponto. Todas essas noções podem ser

encontradas em livros como [Hartshorne], [Shafarevich] e [Fulton].

Entramos nesse assunto para justicar que muitos dos conceitos e resultados aqui

enunciados, não serão demonstrados, pois para isso necessitaríamos de um pouco mais de

teoria não vista aqui. Assim, no que segue, veremos resultados que são necessários para

os futuros capítulos, cujas demonstrações serão omitidas, mas que serão acompanhados

com as devidas referências.

16

Denição 1.18. As curvas algébricas são variedades projetivas de dimensão 1.

Exemplo 1.19. Seja V ⊆ P2 a variedade projetiva formada pelos pontos que satisfazem

yz = x2.

Tomando z = 1, obtemos

V ∩ A23 = (x, y) : y = x2.

Assim, K(V ) = K(x + (y − x2), y + (y − x2)), ou seja, K(V ) = K(x, y) onde y

e x são funções satisfazendo y = x2. Temos:

Ktranscendente

→ K(x)algébrica→ K(x, y).

De onde temos que o grau de transcendência da extensão K(V )/K é igual a 1,

de onde segue que V é uma curva. De modo geral, temos que para qualquer f ∈ K[x, y, z]

primo e homogêneo, a variedade V (f) = P ∈ P2 : f(P ) = 0 é uma curva.

Agora mostraremos uma importante propriedade dos anéis locais de uma curva

em um ponto não singular. Esta propriedade é a de que estes são domínios de valorização

discreta.

Denição 1.20. Seja K um corpo. Chamaremos de valorização discreta em K a uma

aplicação sobrejetiva

v : K∗ → Z

satisfazendo:

i) v(xy) = v(x) + v(y), ou seja, v é um homomorsmo.

ii) v(x+ y) > minv(x), v(y).

É conveniente estender v à K colocando v(0) = +∞, onde +∞ é tal que a+∞ =

+∞ e +∞ > a, ∀a ∈ Z ∪ +∞.Temos que o conjunto dos x ∈ K tais que v(x) > 0 é um domínio, chamado o

domínio de valorização de v.

Exemplo 1.21. Seja K = Q. Dado p primo xado, temos que q ∈ Q pode ser escrito de

forma única da forma q = pay, onde a ∈ Z e tanto o numerador quanto o denominador

de y não dividem p. Denimos vp(q) = a. Esta é chamada de valorização p-ádica.

Dizemos que um domínio D é um domínio de valorização discreta se existe

uma valorização discreta v de seu corpo de frações K tal que D é o domínio de valorização

de v.

17

Proposição 1.22. Se D é um domínio de valorização discreta, então D é um anel local,

e seu ideal maximal m é o conjunto dos x ∈ D, tais que v(x) > 0.

Demonstração. Ver (Proposição 5.18, [Atiyah]) para mostrar que D é local. E basta

mostrar que o ideal maximal de D coincide com o ideal m = x ∈ D : v(x) > 0.

Proposição 1.23. Seja D um domínio local Noetheriano que não é um corpo, seja m seu

ideal maximal e k = D/m seu corpo residual. As seguintes armações são equivalentes.

i) D é um domínio de valorização discreta.

ii) m é um ideal principal.

iii) dimk(m/m2) = 1.

Demonstração. Ver (Proposição 9.2, [Atiyah]).

Proposição 1.24. Sejam C uma curva e P ∈ C um ponto não singular. Temos que

K[C]P é um domínio de valorização discreta.

Demonstração. Temos que K[C]P é local, Noetheriano e não é um corpo. Seu ideal

maximal é mP = MP (visto no anel localizado K[C]P ). Assim, como K ∼= K[C]P/mP e

dimKMP/M2P = dim(C) = 1, temos pela proposição anterior, que K[C]P é um domínio

de valorização discreta.

Essa valorização discreta (uniformizada) é dada por

ordP : K[C]P −→ 0, 1, 2, . . . ∪+∞

f 7−→ supd : f ∈ mdP.

E usando ordP (f/g) = ordP (f)− ordP (g), podemos estender ordP à K(C).

Dizemos que um uniformizante para C em P , é um gerador de mP , isto é, um

t ∈ K(C) para o qual ordP (t) = 1.

Denição 1.25. Sejam C curva e P ∈ C não singular. Chamamos de ordem de f em

P à ordP (f). Se ordP (f) > 0, dizemos que f tem um zero em P , e se ordP (f) < 0,

então f tem um pólo em P .

Proposição 1.26. Seja C uma curva suave e f ∈ K(C) com f 6= 0. Então existem

apenas uma quantidade nita de pontos P de C tais que f tem zero ou pólo em P . Mais

do que isso, se f não tem pólos, então f ∈ K.

Demonstração. Para a nitude do conjunto de pólos, ver (Capítulo 1, Lema 1.5, [Hartshorne]).

Assim, para obter a nitude do conjunto de zeros, basta usar a nitude dos pólos para

1/f . Para última parte da proposição, ver (Capítulo 1, Teorema 3.4 a), [Hartshorne]).

18

1.2.1 Mapas entre Curvas

Denição 1.27. Sejam C1 ⊆ Pm e C2 ⊆ Pn curvas algébricas. Um mapa racional de

C1 para C2 é uma aplicação

ϕ : C1 → C2

da forma ϕ = [F0 : F1 : · · · : Fn], onde Fi ∈ K(C1) e [F0(P ) : F1(P ) : · · · : Fn(P )] ∈ C2

para todo P ∈ C1 onde todas as Fi estão denidas. Diremos que ϕ está denida sobre

K, se existe algum λ ∈ K∗, tal que λFi ∈ K(C1), pra todo i = 0, . . . , n.

Diremos que ϕ é um mapa birracional se ϕ possui um mapa racional inverso.

Diremos então que C1 e C2 são birracionais. E diremos que uma curva C é racional,

se é birracional com P1(K).

Denição 1.28. Nas hipóteses da denição anterior. Dado P ∈ C1, diremos que ϕ é

regular em P , se existir g ∈ K(C1) tal que gFi é regular em P , para todo i, e gFi(P ) 6= 0

para algum i. Quando ϕ é regular em todos os pontos de C1, diremos que é um mor-

smo. Caso exista um morsmo de C2 para C1 cujas compostas com ϕ sejam os mapas

identidades, diremos que ϕ é um isomorsmo, que que C1 e C2 são isomorfas.

Proposição 1.29. Sejam C uma curva, V ⊆ Pn uma variedade, P ∈ C um ponto não

singular e ϕ : C → V um mapa racional, então ϕ é regular em P . Em particular, se C é

suave, então ϕ é um morsmo.

Demonstração. Ver (Capítulo 2, Proposição 2.1, [Silverman]).

Teorema 1.30. Seja ϕ : C1 → C2 um morsmo entre curvas. Então ϕ é constante ou é

sobrejetiva.

Demonstração. Ver (Capítulo 1, Proposição 6.8, [Hartshorne]).

Agora dadas duas curvas C1 e C2 denidas sobre K, e um morsmo ϕ : C1 → C2

denido sobre K. Denimos uma aplicação

ϕ∗ : K(C2)→ K(C1)

f 7→ f ϕ

que será não constante se, e somente se, ϕ for não constante, ou seja, quando ϕ for

sobrejetiva, e nesse caso ϕ∗ será um homomorsmo injetor de corpos, que xa K.

Teorema 1.31. Sejam C1/K e C2/K curvas suaves sobre K. Então:

(a) Seja ϕ : C1 → C2 um morsmo não constante denido sobre K. Então

K(C1)/ϕ∗(K(C2)) é uma extensão nita.

19

(b) Seja ι : K(C2)→ K(C1) uma injeção de corpos que xa os elementos de K. Então

existe um único mapa não constante ϕ : C1 → C2 denido sobre K tal que ϕ∗ = ι.

(c) Seja K(C1)/L uma extensão nita contendo K. Então existe uma curva suave

C, denida sobre K, única a menos de K-isomorsmo, e um mapa não constante

ϕ : C1 → C denido sobre K tal que ϕ∗(K(C)) = L.

Demonstração. Ver (Capítulo 2, Teorema 2.4, [Silverman]).

Denição 1.32. Seja ϕ : C1 → C2 um morsmo. Se ϕ for sobrejetor, chamamos o

número [K(C1) : ϕ∗(K(C2))] de grau de ϕ, denotado por deg(ϕ). Convencionamos que

o grau do morsmo nulo é zero. Caso a extensão de corpos seja separável, inseparável

ou puramente inseparável diremos que ϕ é separável, inseparável e puramente in-

separável, respectivamente. E denotamos o grau de separabilidade e inseparabilidade da

extensão por degs(ϕ) e degi(ϕ), respectivamente.

Corolário 1.33. Sejam C1 e C2 duas curvas suaves, e seja ϕ : C1 → C2 um morsmo

de grau 1. Então ϕ é um isomorsmo.

Demonstração. Ver (Capítulo 2, Corolário 2.4.1, [Silverman]).

Sejam C1 e C2 curvas suaves, ϕ : C1 → C2 um mapa não constante e P ∈ C1.

Considerando tϕ(P ) ∈ K(C2) um uniformizante para C2 em ϕ(P ), chamaremos de indíce

de ramicação de ϕ em P , denotado por eϕ(P ), ao número

eϕ(P ) = ordP (ϕ∗tϕ(P )).

Esse número independe da escolha do parâmetro e além disso eϕ(P ) > 1. Diremos que

ϕ é não ramicado em P se eϕ(P ) = 1, e ϕ é dito não ramicado se ele não for

ramicado em todo ponto P ∈ C1.

Teorema 1.34. Seja ϕ : C1 → C2 um morsmo não constante entre curvas suaves.

Então:

(a) Para todo Q ∈ C2, ∑P∈ϕ−1(Q)

eϕ(P ) = deg(ϕ).

(b) Para todos os pontos Q ∈ C2, com excessão de no máximo um conjunto nito,

|ϕ−1(Q)| = degs(ϕ).

20

(c) Seja φ : C2 → C3 um outro mapa não constante. Então para todo P ∈ C1,

eφϕ(P ) = eϕ(P ) · eφ(ϕ(P )).

Demonstração. Ver (Capítulo 2, Proposição 2.6, [Silverman]).

Corolário 1.35. Um morsmo ϕ : C1 → C2 é não ramicado se, e somente se,

|ϕ−1(Q)| = deg(ϕ), ∀Q ∈ C2.

Demonstração. Ver (Capítulo 2, Corolário 2.7, [Silverman]).

1.2.2 Divisores de uma curva

Os divisores de curva a princípio nada mais são do que somas formais sobre os

pontos da curva, que serão importantes para o chamado Teorema de Riemann-Roch no

contexto de curvas projetivas não singulares.

Denição 1.36. Um divisor D de uma curva C, é uma soma formal

D =∑P∈C

nP (P ),

onde nP ∈ Z, e nP = 0 para todo P com excessão de no máximo um número nito de

pontos. Denotaremos por Div(C) ao grupo abeliano livre gerado pelos divisores de C.

O grau de D ∈ Div(C) é denido como

deg(D) =∑P∈C

nP .

Um subgrupo importante de Div(C) é o subgrupo formado pelos divisores de grau

0, denotado por

Div0(C) := D ∈ Div(C) : deg(D) = 0.

Não é difícil a vericação de que de fato Div0(C) é subgrupo de Div(C).

Claramente podemos ver também que G(K/K) age sobre o grupo Div(C) de

forma natural dada por

Dτ =∑P∈C

nP (P τ ), ∀τ ∈ G(K/K),

e diremos que D está denido sobre K se Dτ = D para todo τ ∈ G(K/K).

21

Um divisor será dito positivo se nP > 0, para todo P ∈ C, e denotaremos por

D > 0. Assim, escreveremos D1 > D2 para indicar que D1 −D2 é positivo.

Supondo C uma curva suave, tomemos f ∈ K(C)∗ e consideremos o divisor

associado à f dado por

div(f) =∑P∈C

ordP (f)(P ).

Denição 1.37. Dado D ∈ Div(C), diremos que D é principal se D = div(f) para

algum f ∈ K(C)∗, e que D e D′ são linearmente equivalentes se D −D′ é principal.

Denição 1.38. O grupo de Picard, denotado por Pic(C), é denido como o quociente

entre Div(C) e Princ(C), isto é,

Pic(C) =Div(C)

Princ(C),

onde Princ(C) = div(f) : f ∈ K(C)∗ é o grupo dos dividores principais de C. De

forma análoga denimos

Pic0(C) =Div0(C)

Princ(C).

A denição de Pic0(C) faz sentido graças à seguinte proposição, que arma que Princ(C)

é subgrupo de Div0(C).

Em vista de que ordP é uma valorização discreta, temos que

div : K(C)∗ → Div(C)

f 7→ div(f)

é um homomorsmo de grupos.

Segue a proposição.

Proposição 1.39. Seja C uma curva suave e f ∈ K(C)∗, então:

(a) div(f) = 0⇔ f ∈ K∗.

(b) deg(div(f)) = 0.

Demonstração. Ver (Capítulo 2, Proposição 3.1, [Silverman]).

Denição 1.40. Sejam C1, C2 curvas algébricas projetivas planas, denidas por polinô-

mios homogêneos f, g ∈ K[x1, x2, x3]. Seja também

C1 ∩ C2 = P ∈ P2 : f(P ) = g(P ) = 0.

22

Denimos a multiplicidade de interseção de C1 e C2 em P como

(C1, C2)P = dimK

(K[A2]P

(fD, gD) ·K[A2]P

),

onde fD e gD são os respectivos polinômios desomogeneizados em relação à algum i, ou

seja, V (fD) = C1 ∩ A2i e V (gD) = C2 ∩ A2

i . E o divisor de interseção é denido como

C1 · C2 =∑

P∈C1∩C2

(C1, C2)P (P ).

Agora enunciamos o Teorema de Bézout, que permite contar o número de pontos

de interseção entre duas curvas projetivas planas.

Teorema 1.41 (Bézout). Sejam C1, C2 curvas projetivas planas, denidas por polinômios

irredutíveis distintos f e g, respectivamente. Então o número total de pontos da interseção

de C1 e C2 em P2, contados com multiplicidade, é igual ao produto dos graus de f e g.

Demonstração. Ver (Bézout's Theorem, Pág. 57, [Fulton]).

Exemplo 1.42. Nesse exemplo, consideramos as curvas

C1 : yz = x2, e

C2 : y2z = x3 − 2xz2.

Vemos que os graus dos polinômios que denem as curvas C1 e C2 são, respecti-

vamente, 2 e 3, de onde segue que, pelo Teorema de Bézout, o número total de pontos da

interseção entre C1 e C2 deve ser igual a 6 = 2 · 3.

23

Na gura a), vemos as curvas ans C1∩A21 e C2∩A2

1, para as quais consideramos

x = 1.

Nas guras b) e c), vemos um processo análogo ao feito na gura a), só que

agora considerando y = 1 e z = 1, respectivamente. Em ambas as guras, vemos apenas

os pontos de coordenadas reais.

Vemos também que os pontos P, D e E aparecem nas 3 guras, isto pois, o ponto P

tem coordenadas homogêneas [1, -1, -1] = [-1, 1, 1], já os pontos D e E tem coordenadas

[1, 1+i, 1−i2] = [1−i

2, 1, −i

2] = [1+i, 2i, 1] e [1, 1-i, 1+i

2] = [1+i

2, 1, i

2] = [1-i, -2i, 1].

Os pontos D e E aparecem em destaque e separados das curvas pois não apresentam

coordenadas reais. Além disso, temos os pontos Q = [0, 0, 1] e S = [0, 1, 0]. O ponto S

tem multiplicidade 2.

Em resumo, os pontos da interseção são S (com multiplicidade 2), P, Q, D e E,

totalizando 6 pontos contadas as suas multiplicidades.

24

1.2.3 Diferenciais

Dada C uma curva, denimos o espaço das formas diferenciais de C, ΩC , como

o K(C)-espaço vetorial gerado pelos símbolos da forma dx, para todo x ∈ K(C), satisfa-

zendo as seguintes propriedades diferenciais.

(i) d(x+ y) = dx+ dy, ∀ x, y ∈ K(C).

(ii) d(xy) = xdy + ydx, ∀ x, y ∈ K(C).

(iii) da = 0, ∀ a ∈ K.

Sobre o espaço ΩC temos o seguinte resultado.

Proposição 1.43. Seja C uma curva e P ∈ C. Se t ∈ K(C)∗ é um uniformizante para

C em P , então:

(a) Para todo ω ∈ ΩC existe uma única função g ∈ K(C) que depende de ω e t, tal que

w = gdt.

Denotaremos g por ω/dt.

(b) Seja f ∈ K(C) função regular em P . Então df/dt também é regular em P .

(c) Seja ω ∈ ΩC, ω 6= 0. O número ordP (ω/dt) é independente da escolha do uniformi-

zante t. Chamaremos esse número de ordem de ω em P , denotado por ordP (ω).

(d) Seja ω ∈ ΩC, ω 6= 0. Então ordP (ω) = 0 para todo P ∈ C com excessão de no

máximo um número nito de pontos.

Demonstração. Ver (Capítulo 2, Proposição 4.3, [Silverman]).

Com isso, podemos associar a ω ∈ ΩC um divisor dado por

div(ω) =∑P∈C

ordP (ω)(P ).

Diremos que ω ∈ ΩC é holomorfo se div(ω) é positivo, e que ω não se anula se

div(ω) 6 0.

Note que se ω1, ω2 ∈ ΩC são dois diferenciais não nulos, então pela proposição

anterior, existe uma função f ∈ K(C)∗ tal que

ω1 = fω2,

e portanto div(ω1) = div(f)+div(ω2). Assim, div(ω1)−div(ω2) é um divisor principal, de

onde segue que os divisores dos diferenciais não nulos são todos linearmente equivalentes,

25

determinando portanto apenas uma classe no grupo de Picard de C, e a essa classe damos

o nome de classe canônica e qualquer divisorD nesta classe é dito um divisor canônico

de C.

1.2.4 O Teorema de Riemann-Roch

O Teorema de Riemann-Roch é um teorema de grande importância para a teoria

de curvas algébricas. Nosso objetivo é de apresentá-lo am de podermos denir o gênero

de uma curva e obter alguns de seus corolários que serão importantes futuramente.

Dado D ∈ Div(C) denimos o seguinte conjunto de funções

L(D) = f ∈ K(C)∗ : div(f) > −D ∪ 0.

Esses conjuntos apresentam as seguintes propriedades.

Proposição 1.44. Seja D ∈ Div(C). Então:

(a) L(D) é um K−espaço vetorial.

(b) L(0) = K e L(D) = 0 se deg(D) < 0.

(c) Se D 6 D′ então L(D) ⊆ L(D′) e

dimK(L(D′)/L(D)) 6 deg(D′ −D).

(d) L(D) tem dimensão nita para todo D. Denimos a dimensão de L(D) sobre K

por `(D).

Se deg(D) > 0, então `(D) 6 deg(D) + 1.

(e) Se D e D′ são linearmente equivalentes, então `(D) = `(D′).

Demonstração. (a) Seja λ ∈ K, f ∈ L(D). Se λ = 0, então λf ∈ L(D), visto que

0 ∈ L(D) por denição.

Se λ 6= 0, então div(λf) = div(f) > −D. Portanto, λf ∈ L(D).

Agora, se f, g ∈ L(D) e D =∑

P∈C nP (P ), então temos que ordP (f), ordP (g) >

−nP , para todo P ∈ C. Portanto,

ordP (f + g) > minordP (f), ordP (g) > −nP ,

de onde segue que f + g ∈ L(D).

(b) L(0) = f ∈ K(C)∗ : div(f) > 0 ∪ 0.

26

Dado f ∈ K(C)∗ tal que div(f) > 0, então f ∈ K[C]P para todo P ∈ C. Daí,

se f(P0) = λ0 ∈ K para algum P0 ∈ C, então div(f − λ0) > 0, pois esta função

continua denida em todos os pontos de C. Mas como (f − λ0)(P0) = 0, então

ordP0(f − λ0) > 1, e assim deg(div(f − λ0)) > 0, mas se f − λ0 ∈ K(C)∗, então

deveríamos ter deg(div(f − λ0)) = 0, de onde segue que f − λ0 = 0 e portanto

f = λ0 ∈ K, logo L(0) ⊆ K. Agora se f ∈ K∗, então div(f) = 0 > 0 e f ∈ L(0), de

onde segue que L(0) = K.

Agora seja D divisor tal que deg(D) < 0 e considere f ∈ L(D) − 0. Como

f ∈ K(C)∗, então 0 = deg(div(f)). Como div(f) > −D, então

0 = deg(div(f)) > deg(−D) = −deg(D),

de onde segue que deg(D) > 0, contradição. Assim, se f ∈ L(D) então f = 0.

Portanto, L(D) = 0.

(c) Se D 6 D′ e f ∈ L(D)−0, então div(f) > −D > −D′, logo f ∈ L(D′). Portanto,

L(D) ⊆ L(D′).

Agora, suponha inicialmente que D′ = D+P para P ∈ C. Como deg(D′−D) = 1,

então devemos mostrar que

dimK(L(D′)/L(D)) 6 1.

Seja t ∈ K[C]P um uniformizante para C em P , r = nP o coeciente de P em D e

considere a aplicação

ϕ : L(D + P )→ K,

denida por ϕ(f) = (tr+1f)(P ). Como ordP (f) > −(r + 1), então tr+1f está

denida em P , e assim a aplicação ϕ está bem denida. Mais do que isso, ϕ é linear

e Ker(ϕ) = L(D). Portanto,

dimK(L(D + P )/L(D)) 6 dimKK = 1.

Agora generalizando, se D′ = D + P1 + · · ·+ Ps, então deg(D′ −D) = s e

dimK(L(D + P1 + · · ·+ Pm)/L(D + P1 + · · ·+ Pm−1)) 6 1,

para todo m = 1, . . . , s.

Como L(D) ⊆ L(D + P1) ⊆ · · · ⊆ L(D + P1 + · · ·+ Ps), então

dimK(L(D + P1 + · · ·+ Ps)/L(D)) 6

s︷ ︸︸ ︷1 + · · ·+ 1 = s = deg(D′ −D),

27

como queríamos.

(d) Se deg(D) < 0, então L(D) = 0 tem dimensão nita. Agora, se deg(D) = n > 0,

então escolha P ∈ C, e considere D′ = D − (n+ 1)P . Então deg(D′) = −1 < 0, de

onde segue que L(D′) = 0.

Como D > D′ e deg(D −D′) = n+ 1, então

dimK(L(D)) = dimK(L(D)/L(D′)) 6 deg(D −D′) = n+ 1 = deg(D) + 1.

Portanto L(D) tem dimensão nita e `(D) 6 deg(D) + 1.

(e) Seja h ∈ K(C)∗ tal que D′ −D = div(h), esse h existe pois D′ e D são linearmente

equivalentes. Considere ψ : L(D′) → L(D) dada por ψ(f) = fh, que está bem

denida pelo fato de que se f 6= 0, então div(fh) = div(f)+div(h) > −D′+div(h) =

−D, logo fh ∈ L(D).

Temos que ψ é linear e Ker(ψ) = 0. Agora, se g ∈ L(D)− 0, então

div(g

h) +D′ = div(g)− div(h) +D + div(h) = div(g) +D > 0.

Portantog

h∈ L(D′) e ψ(

g

h) = g, mostrando que ψ também é sobrejetiva, logo um

isomorsmo linear, de onde segue que `(D) = `(D′).

Agora enunciamos o Teorema de Riemann-Roch, o qual nos permitirá denir o

gênero de uma curva.

Teorema 1.45 (Riemann-Roch). Seja C uma curva suave e KC um divisor canônico

em C. Então existe um inteiro g > 0, que só depende de C, tal que para cada divisor

D ∈ Div(C),

`(D)− `(KC −D) = deg(D)− g + 1.

A esse invariante g damos o nome de gênero da curva C.

Demonstração. Ver (Riemann-Roch Theorem, Pág. 108, [Fulton]).

Como consequências do Teorema de Riemann-Roch temos.

Corolário 1.46. (a) `(KC) = g.

(b) deg(KC) = 2g − 2.

(c) Se deg(D) > 2g − 2, então `(D) = deg(D)− g + 1.

28

Demonstração. (a) Basta tomar D = 0 no teorema. Assim,

1− `(KC) = −g + 1,

logo `(KC) = g.

(b) Basta tomar D = KC no teorema. Assim,

`(KC)− 1 = deg(KC)− g + 1,

logo deg(KC) = 2g − 2.

(c) Se deg(D) > 2g − 2, então

`(KC −D)− `(D) = deg(KC −D)− g + 1

−`(KC −D) + `(D) = deg(D)− g + 1

⇒deg(KC −D)− g + 1 = −deg(D) + g − 1

⇒deg(KC −D) = 2g − 2− deg(D) < 0.

Logo, L(KC −D) = 0 e `(KC −D) = 0. Portanto, `(D) = deg(D)− g + 1.

Corolário 1.47. Se duas curvas C1 e C2 são isomorfas, então ambas tem mesmo gênero.

Demonstração. Ver (Corolário 1.5.5, [Conceição]).

A seguir enunciamos uma fórmula que facilita o cálculo do gênero de uma curva

plana suave.

Proposição 1.48 (Fórmula do Grau-Gênero). Seja C uma curva plana e suave denida

por um polinômio homogêneo de grau d > 1. Então seu gênero é dado pela expressão

g(C) =(d− 1)(d− 2)

2.

Demonstração. Ver (Corolário 1.5.7, [Conceição]).

Exemplo 1.49. Para a curva C do Exemplo 1.19, denida pelo polinômio homogêneo de

grau 2, f(x, y, z) = yz − x2 = 0, temos que

g(C) =(2− 1) · (2− 2)

2= 0.

Observem que [1, 1, 1] ∈ C(Q), ou seja, a curva C tem ao menos um ponto racional.

Agora mais do que isso, temos que [t, t2, 1] ∈ C(Q), para todo t ∈ Q, ou seja, C tem

innitos pontos racionais.

29

Esse é um caso particular do que acontece com curvas de gênero 0. Seu conjunto

de pontos racionais ou é vazio ou é innito. No nal do Capítulo 3, será apresentada uma

tabela esquematizando a estrutura dos pontos racionais de uma curva, de acordo com o

seu gênero.

Proposição 1.50. Seja C/K uma curva suave e D um divisor denido sobre K. Então

L(D) possui uma base consistindo de funções em K(C).

Demonstração. Ver (Capítulo 2, Proposição 5.8, [Silverman]).

Capítulo 2

Curvas Elípticas

Neste capítulo serão introduzidos conceitos da Teoria de Curvas Elípticas, com o

objetivo de estudar a aritmética desses objetos. A principal referência para este Capítulo,

é o livro [Silverman]. Alguns conceitos da Teoria Algébrica dos Números serão utilizados,

para uma leitura sobre o assunto recomendamos as referências [Neukirch] e [Lang].

Denição 2.1. Uma curva elíptica é um par (E,O), onde E é uma curva suave de

gênero 1 e O ∈ E. Dizemos que E está denida sobre K e denotaremos por E/K, se E

está denida sobre K como uma variedade e além disso, O ∈ E(K).

Diremos que O é o ponto base de E.

Para efeito de simplicação, na maioria das vezes o ponto base será omitido, usando

apenas E para denotar a curva elíptica.

A seguir, mostraremos que dada uma curva elíptica E, podemos encontrar uma

curva em P2, denida por um polinômio de grau 3, que é isomorfa à E. Mas antes disso

precisaremos do seguinte resultado.

Lema 2.2. Seja C uma curva denida por um polinômio

f(x, y) = y2 + a1xy + a3y − x3 − a2x2 − a4x− a6 ∈ K[x, y].

Se C é singular então existe um mapa racional φ : C → P1 denido sobre K de grau 1.

Demonstração. Fazendo uma mudança do tipo x 7→ x+ a, y 7→ y+ b, podemos supor que

o ponto (0, 0) é singular, para efeito de simplicação. Temos então a4 =∂f

∂x(0, 0) = 0 e

a3 =∂f

∂y(0, 0) = 0. Portanto, obtemos

y2 + a1xy = x3 + a2x2.

30

31

Agora considerando o mapa racional

φ : C → P1

(x, y) 7→ [x, y].

Temos que φ∗(K(P1)) = K(x, y) = K(C), de onde deg(φ) = 1.

Proposição 2.3. Seja E uma curva elíptica denida sobre K. Então existe uma curva

plana C de equação

C : y2 + a1xy + a3y = x3 + a2x2 + a4x+ a6,

com a1, a2, a3, a4, a6 ∈ K, e funções x, y ∈ K(E) tais que o mapa

ϕ : E → P2

P 7→ [x(P ), y(P ), 1]

é um isomorsmo denido sobre K de E sobre C, satisfazendo ϕ(O) = [0, 1, 0].

Reciprocamente, qualquer curva suave C denida por uma equação como a ante-

rior, é uma curva elíptica denida sobre K, com O = [0, 1, 0] ∈ C(K) sendo seu ponto

base.

Demonstração. Começamos considerando os espaços vetoriais L(n(O)), para n = 1, 2, . . ..

Visto que deg(n(O)) = n > 0 = 2g − 2, pelo Teorema de Riemann-Roch, temos

que

`(n(O)) = dimKL(n(O)) = deg(n(O))− g + 1 = n.

Como os dividores n(O) são denidos sobre K, podemos escolher funções x, y ∈K(E) para as quais 1, x é uma base para L(2(O)) e 1, x, y formam uma base para

L(3(O)). Temos que x tem um pólo de ordem 2 em O e y um pólo de ordem 3, isto é,

ordO(x) = −2 e ordO(y) = −3. Com efeito, visto que x ∈ L(2(O)), então ordO(x) > −2.

Agora se ordO(x) > −2, então ordO(x) > −1, o que implicaria que x ∈ L((O)) = K e 1

e x seriam linearmente dependentes. De forma análoga, mostramos que ordO(y) = −3.

Temos também que ordO(x2) = −4, ordO(x3) = −6, ordO(xy) = −5 e ordO(y2) =

−6. Assim, 1, x, y, x2, x3, xy, y2 ∈ L(6(O)).

Como `(n(O)) = 6, o conjunto 1, x, y, x2, x3, xy, y2 é linearmente dependente,

existindo portanto umaK-dependência linear não trivial entre elas, isto é, existem A1, . . . ,

A7 ∈ K não todos nulos satisfazendo

A1 + A2x+ A3y + A4x2 + A5xy + A6y

2 + A7x3 = 0.

32

Se tivéssemos A6 = 0 ou A7 = 0, ocorreria A1+A2x+A3y+A4x2+A5xy+A6y

2 = 0

ou A1 +A2x+A3y +A4x2 +A5xy +A7x

3 = 0. Mas como em ambos os casos as funções

envolvidas tem ordem diferentes em O, elas são linearmente independentes em L(6(O)).

Portanto A6 6= 0 e A7 6= 0, mostrando que na relação acima, o x3 e y2 devem aparecer.

Fazendo as mudanças x 7→ −A6A7x e y 7→ A6A27y obtemos

A1 − A2A6A7x+ A4A26A

27x

2 − A36A

27x

3 + A3A6A27x− A4A

26A

37xy + A3

6A47y

2 = 0.

Dividindo por A36A

47, obtemos uma equação como desejado

y2 + a1xy + a3y = x3 + a2x2 + a4x+ a6, a1, a2, a3, a4, a6 ∈ K.

Essa equação é conhecida como equação de Weierstrass. Agora consideremos o

mapa

ϕ : E → P2

P 7→ [x(P ), y(P ), 1],

cuja imagem está contida na curva C dada pela equação acima. Note que ϕ : E → C é

um mapa racional não constante entre uma curva suave e uma variedade, sendo portanto

um morsmo sobrejetivo.

Agora consideremos t um uniformizante para E em O, assim existem funções

ux, uy ∈ K(E) tais que ux(O) 6= 0 e uy(O) 6= 0 satisfazendo, x = uxt−2 e y = uyt

−3.

Temos que ϕ = [x, y, 1] = [uxt−2, uyt

−3, 1] = [uxt, uy, t3]. Portanto, ϕ(O) =

[ux(O)t(O), uy(O), t(O)3] = [0, 1, 0], visto que t(O) = 0 e uy(O) 6= 0.

Agora mostraremos que ϕ tem grau 1 e que C é suave, pois assim teremos que ϕ

é um isomorsmo (Corolário 1.33).

Para mostrar que ϕ tem grau 1, temos que provar que [K(E) : K(x, y)] = 1, já

que K(C) = K(x, y).

Temos que x não tem mais pólos além de O, visto que como x ∈ L(2(O)) então

dif(x) > 2(O) assim, ordP (x) > 0 para todo P 6= O. Da mesma forma o único pólo de y

é em O. Consideremos então os mapas

ϕ1 : E → P1

O 7→ [1, 0]

P 7→ [x(P ), 1], P 6= O

33

e

ϕ2 : E → P1

O 7→ [1, 0]

P 7→ [y(P ), 1], P 6= O.

Como ϕ−11 ([1, 0]) = O, então

deg(ϕ1) =∑

P∈ϕ−11 ([1,0])

eϕ(P ) = eϕ(O) = 2.

Portanto [K(E) : K(x)] = 2. Demodo análogo, teremos que o mapa ϕ2 tem grau 3, de

forma que

[K(E) : K(x, y)] · [K(x, y) : K(x)] = [K(x, y) : K(x)] = 2

e

[K(E) : K(x, y)] · [K(x, y) : K(y)] = [K(x, y) : K(y)] = 3.

De onde segue que [K(E) : K(x, y)] = 1, e portanto ϕ tem grau 1.

Agora suponha que C não seja suave, pelo lema anterior existiria um mapa ra-

cional φ : C → P1 de grau 1. Assim, φ ϕ : E → P1 é um mapa de grau 1 entre curvas

suaves, sendo portanto um isomorsmo, mas como E tem gênero 1 e P1 tem gênero 0,

teríamos uma contradição. Portanto C é suave e ϕ um isomorsmo.

Reciprocamente, seja C uma curva dada pela equação em questão. Como o

polinômio que dene C é de grau 3, então pela fórmula de grau-gênero temos

g(C) =(3− 1)(3− 2)

2= 1.

Assim, C é uma curva de gênero 1. Mais do que isso, como [0, 1, 0] ∈ C(K), então C é

uma curva elíptica.

De agora em diante iremos considerar curvas elípticas E/K dadas por equações

E : y2 + a1xy + a3y = x3 + a2x2 + a4x+ a6,

com ai ∈ K e [0, 1, 0] como ponto base. Essas equações são chamadas equações de

Weierstrass.

Agora supondo char(K) 6= 2, podemos fazer a seguinte substituição

y 7→ y − a1x− a3

2,

34

obtendo(y − a1x− a3

2

)2

+ a1x

(y − a1x− a3

2

)+ a3

(y − a1x− a3

2

)= x3 + a2x

2 + a4x+ a6.

Fazendo o desenvolvimento dessa expressão obtemos

y2 = 4x3 + b2x2 + 2b4x+ b6,

onde b2 = a21 + 4a2, b4 = 2a4 + a1a3, b6 = a2

3 + 4a6. Agora se char(K) 6= 2, 3, fazendo mais

essas substituições x 7→ x− 3b2

36e y 7→ y

216nessa última equação obtemos uma equação

da forma

y2 = x3 − 27c4x− 54c6,

onde c4 = b22 − 24b4 e c6 = b3

2 + 36b2b4 − 216b6.

Nesses casos, denimos o número ∆, chamado o discriminante da curva, como

∆ = −b22b8 − 8b3

4 − 27b26 + 9b2b4b6,

onde b8 = a21a6 + 4a2a6 − a1a3a4 + a2a

23 − a2

4.

Quando uma equação de Weierstrass se apresenta na forma E : y2 = x3 + ax+ b,

diremos que esta é uma equação de Weierstrass reduzida. E teremos ∆ = −16(4a3 +

27b2). Portanto, quando char(K) 6= 2 e 3 toda curva elíptica se escreve na forma

y2 = x3 + ax+ b.

Exemplo 2.4.

Na gura acima, temos dois exemplos de curvas elípticas, onde são mostrados seus

pontos com coordenadas reais. No exemplo a) temos um exemplo de curva não singular,

já no exemplo b) a curva tem (0, 0) como um ponto singular.

35

O seguinte resultado caracteriza, em termos do discriminante, quando uma curva

elíptica E é não singular.

Proposição 2.5. A curva E é não singular se, e somente se, ∆ 6= 0.

Demonstração. Ver (Capítulo 3, Proposição 1.4, [Silverman]).

2.1 Lei de grupo para uma curva elíptica

Consideremos E uma curva elíptica e L uma reta projetiva. Dado que E é denida

por um polinômio de grau 3, pelo Teorema de Bézout, a interseção entre E e L dá em 3

pontos contadas as multiplicidades, ou seja, os 3 pontos não precisam ser necessariamente

distintos. A partir desse fato, podemos denir geometricamente uma operação em E que

fará de E um grupo abeliano.

Denição 2.6 (Lei de Grupo para E). Sejam P,Q ∈ E e L uma reta que passa por P

e Q (caso P seja igual à Q, L será a reta tangente à E passando por P = Q). Seja R

o terceiro ponto de interseção entre L e E, denotaremos por PQ := R. Agora seja L′ a

reta que passa por PQ e O, denotaremos o terceiro ponto de interseção entre L′ e E por

P ⊕Q, ou seja, P ⊕Q = (PQ)O.

Exemplo 2.7.

Nesse exemplo podemos ver como é denido a soma entre os pontos P e Q em

E. Em b) observamos que a reta L é a reta tangente à E em P = Q.

Mostraremos que essa operação dene em E uma estrutura de grupo abeliano,

com E(K) sendo um subgrupo de E. Antes disso, temos o seguinte resultado.

Lema 2.8. Se C é uma curva de gênero 1 e P,Q ∈ C, então (P ) e (Q) são linearmente

equivalentes se, e somente se, P = Q.

36

Demonstração. Se (P ) e (Q) são linearmente equivalentes, seja f ∈ K(C) tal que (P )−(Q) = div(f). Assim, div(f) + (Q) = (P ) > 0, de onde f ∈ L((Q)). Como deg((Q)) =

1 > 0 = 2g − 2, onde g = 1 é o gênero de C, então pelas consequências do Teorema de

Riemann-Roch, `((Q)) = 1, logo f ∈ L((Q)) = K e assim, (P ) − (Q) = div(f) = 0, ou

seja, P = Q.

Mais um resultado auxiliar.

Lema 2.9. Se C,C1 e C2 são curvas cúbicas suaves (denidas por polinômios de grau 3)

e oito dos pontos de interseção entre C e C1 estão na interseção entre C e C2 então o

nono ponto dessas duas interseções coincidem.

Demonstração. Sejam f1 e f2 pontos que denem C1 e C2, respectivamente, e P1, . . . , P8

os oito primeiros pontos da interseção e P e Q o nono ponto de cada uma das interseções

(seguindo a ordem enunciada no lema). Temos quef1

f2

∈ K(C) e

div(f1

f2

) =8∑i=1

(Pi) + (P )−

(8∑i=1

(Pi) + (Q)

)= (P )− (Q).

Mas pelo lema anterior, temos que P = Q, pois as curvas são cúbicas tendo portanto

gênero 1.

Proposição 2.10. A operação que denimos sobre E é uma operação de grupo, que tem

O como elemento neutro. Mais do que isso, essa operação é comutativa e E(K) é um

subgrupo de E.

Demonstração. A comutatividade desta operação é decorrente da própria construção, pois

ao tomar as retas L e L′ a ordem da escolha de P e Q não importa, ou seja, PQ = QP e

portanto P ⊕Q = (PQ)O = (QP )O = Q⊕ P .

Agora como O = [0, 1, 0], tomando a reta L que une P à O, depois tomando a

reta L′ que une PO à O, vemos que L = L′, assim P ⊕O = P , ou seja, O é o elemento

neutro dessa operação.

Dado P ∈ E, seu elemento inverso é PO. Com efeito, sendo L a reta que une P

e O então PO ∈ L e agora se tomarmos L′ a reta que une PO e O temos que L = L′ e

portanto o terceiro ponto de interseção de L′ com E é P . Assim, a reta que une P e POé L, portanto P (PO) = O e assim, P ⊕ PO = (P (PO))O = OO = O.

Para mostrarmos que a operação é associativa, basta mostrarmos que se P,Q,R ∈E então ((P ⊕Q)R)O = (P (Q⊕R))O, ou seja, que (P ⊕Q)R = P (Q⊕R).

37

Seja L a reta que passa por P , Q e PQ, L′ a reta que passa por P ⊕ Q, R e

(P ⊕Q)R, e L′′ a reta que passa por O, QR e Q⊕R. Então a curva cúbica C1 dada por

L · L′ · L′′ = 0 intercecta E em todos esses pontos O, P,Q,R, PQ,QR, P ⊕ Q,Q ⊕ R e

(P ⊕Q)R.

Fazendo o análogo para o conjunto de pontos P,Q ⊕ R,P (Q ⊕ R); Q,R,QR;

e O, PQ, P ⊕ Q, conseguiremos uma cúbica C2 que intersecta E nesses mesmos pontos.

Vemos que oito dos pontos da interseção entre C2 e E aparecem na interseção entre C1 e

E, de onde concluímos que o nono ponto em ambas as interseções devem ser iguais, sendo

assim P (Q⊕R) = (P ⊕Q)R. E a operação é associativa.

Agora se tomarmos dois pontos K-racionais teremos que a reta L que passa por

P e Q estará denida sobre K, e assim o terceiro ponto de interseção de L com E será

também K-racional, pois a equação que nos permite calcular tal interseção é uma equação

cúbica que tem duas raízes de coordenadas K-racionais correspondentes ao ponto P e Q.

Daí PQ será K−racional, da mesma forma que P ⊕Q = (PQ)O.

A partir de agora usaremos P +Q para denotar a soma entre P e Q. E denimos

para cada m ∈ Z o seguinte homomorsmo de grupos

[m] : E → E

P 7→ [m]P,

denido por: Se m = 0, então [0]P = O para todo P ∈ E, Se m > 0 então [m]P =m︷ ︸︸ ︷

P + · · ·+ P , e se m < 0 então [m]P = [−m](−P ), para todo P ∈ E. Estas aplicações

que preservam a estrutura de grupo como também a estrutura de variedade é chamada

de isogênia.

Agora iremos encontrar coordenadas para P+Q e −P em função das coordenadas

de P e Q para a operação em E. Sejam

E : y2 + a1xy + a3y = x3 + a2x2 + a4x+ a6,

uma curva denida por uma equação de Weierstrass, ou mesmo denida por uma equação

reduzida

E : y2 = x3 + ax+ b.

Inicialmente calcularemos as coordenadas do inverso de P . Sendo P = (x0, y0),

temos que −P é o terceiro ponto de interseção entre E e a reta que une P e O, que é areta dada pela equação x = x0. Sendo assim, se −P = (x0, y1) temos que y1 é a outra

38

solução (além de y0) da equação quadrática

y2 + (a1x0 + a3)y − x30 − a2x

20 − a4x0 − a6 = 0.

Como

y2 − (y0 + y1)y + y0y1 = y2 + (a1x0 + a3)y − x30 − a2x

20 − a4x0 − a6,

então y1 = −y0 − a1x0 − a3. Portanto, se P = (x, y) então

−P = (x,−y − a1x− a3) forma geral

−P = (x,−y) forma reduzida.

Estas são as chamadas fórmulas de inversão.

Para encontrar as coordenadas da soma entre P1 = (x1, y1) e P2 = (x2, y2), se

tivermos x1 = x2 e y2 = −y1 − a1x1 − a3 então teremos que P1 + P2 = O. Caso isso não

ocorra, podemos considerar a reta L de equação

L : y = λx+ v,

que passa por P1 e P2, onde esse λ e v são dados por:

• Se x1 = x2, então:

Nesse caso a reta L é tangente à E em P1, e assim sua equação é dada por

y − y1 =dy

dx(P1)(x− x1).

Agora derivando a equação que dene de Weierstrass em relação à x, obtemos

2ydy

dx+ a1x

dy

dx+ a1y + a3

dy

dx= 3x2 + 2a2x+ a4.

Assim,dy

dx(P1) =

3x21 + 2a2x1 + a4 − a1y1

2y1 + a1x1 + a3

e portanto

λ =dy

dx(P1) =

3x21 + 2a2x1 + a4 − a1y1

2y1 + a1x1 + a3

v = y1 − x1dy

dx(P1) =

−x31 + a4x1 + 2a6 − a3y1

2y1 + a1x1 + a3

.

• Se x1 6= x2, então:

39

Nesse caso a inclinação da reta L é dada por

λ =y2 − y1

x2 − x1

e o termo independente v é

v =y1x2 − y2x1

x2 − x1

.

Agora substituindo y por λx+ v na equação de Weierstrass, obtemos

(λx+ v)3 + a1x(λx+ v) + a3(λx+ v) = x3 + a2x2 + a4x+ a6,

que se igualada à (x− x1)(x− x2)(x− x3) nos dará

x3 = λ2 + a1λ− a2 − x1 − x2,

sendo esta a primeira coordenada do ponto (x3, y3) = P3 que é o terceiro ponto da interse-

ção de L com E. Agora pelo fato de que P3 também pertence à L, obtemos y3 = λx3 + v.

Como P3 é (P1P2) e P1 +P2 = (P1P2)O então P1 +P2 = P3O, de onde segue que−P3 = P3O = P1 + P2. Pelas fórmulas de inversão, obtemos

P1 + P2 = (λ2 + a1λ− a2 − x1 − x2,−(λ+ a1)x3 − v − a3).

Como consequência temos um resumo dessas fórmulas para o caso da equação de

Weierstrass reduzida E : y2 = x3 + ax+ b.

Se P = (x, y), P1 = (x1, y1) e P2 = (x2, y2). Então

(i) −P = (x,−y)

(ii) Fórmula de duplicação

x([2]P ) =x4 − 2ax2 − 8bx+ a2

4(x3 + ax+ b),

y([2]P ) =(3x2 + a)3 + 4(x3 + ax+ b)(7x3 + ax− 2b)

8(x3 + ax+ b)3.

(iii) Se P1 6= ±P2

x(P1 + P2) =

(y2 − y1

x2 − x1

)2

− (x1 + x2)

y(P1 + P2) = −(y2 − y1

x2 − x1

)3

+y2 − y1

x2 − x1

· (x1 + x2)− y1x2 − y2x1

x2 − x1

.

Agora iremos fazer um estudo sobre os subgrupos de torção de E, que são os

elementos do grupo E de ordem nita.

40

Denição 2.11. Seja E uma curva elíptica e m inteiro positivo. Denimos a m-torção

de E como sendo

E[m] = P ∈ E : [m]P = O.

De forma análoga denimos a m-torção racional de E

E[m](K) = E ∈ E(K) : [m]P = O.

O subgrupo de torção de E, denotado por Etor, é o conjunto dos pontos de E

de ordem nita, nesse caso

Etor = ∪m>1E[m].

E de igual forma denimos E(K)tor, caso E seja denida sobre K.

Exemplo 2.12. Considere a curva elíptica E : y2 = (x− e1)(x− e2)(x− e3). Os pontos

de 2-torção são os pontos tais que P + P = O, ou seja, P = −P . Sendo P = (x, y),

temos que −P = (x, y − a1x− a3) em que nesse caso a1 = a3 = 0. Portanto, para que P

seja um ponto de 2-torção devemos ter

(x, y) = P = −P = (x,−y),

de onde segue que y = 0 e x = e1, e2 ou e3. Assim,

E[2] = (e1, 0), (e2, 0), (e3, 0),O.

Claramente temos queKer([m]) = E[m], e sobre esses subgrupos temos o seguinte

resultado.

Proposição 2.13. Seja E uma curva elíptica e m um inteiro positivo. Então

(a) deg([m]) = m2.

(b) Se m 6= 0 em K, isto é, se char(K) = 0 ou char(K) = P > 0 e p não divide m,

então

E[m] ∼=ZmZ× ZmZ

.

(c) Se char(K) = p > 0 e m = pc, então vale uma das seguintes armações

(i) E[pc] = O, ∀c = 1, 2, 3, . . .

(ii) E[pc] ∼=ZpcZ

, ∀c = 1, 2, 3, . . . .

Demonstração. Ver (Capítulo 3, Corolário 6.4, [Silverman]).

41

A partir de agora nos concentraremos em estudar corpos de números, ou seja, K

será uma extensão nita de Q.

2.2 Redução de uma curva elíptica

Nesta seção veremos algumas denições e resultados em relação aos pontos racio-

nais de uma curva vista sobre o completamento do corpo K por uma valorização discreta.

Isso será importante quando provarmos a versão fraca do Teorema de Mordell-Weil no

Capítulo 3.

Denição 2.14. Um valor absoluto de um corpo K é uma aplicação

| · | : K → R

que satisfaz

(i) |x| > 0 e |x| = 0 se, e somente se, x = 0.

(ii) |xy| = |x| · |y|, ∀x, y ∈ K.

(iii) |x+ y| 6 |x|+ |y|, ∀x, y ∈ K (desigualdade triangular).

Dado um valor absoluto, podemos denir uma métrica em K, dada por d(x, y) =

|x − y|, que faz com que K que munido de uma topologia vinda dessa métrica. Assim,

diremos que dois valores absolutos são equivalentes se geram a mesma topologia.

A partir de uma valorização discreta v podemos munir o corpo K com um valor

absoluto proveniente dessa valorização, dada pela expressão

|x|v = e−v(x).

Onde e é a base do logaritmo natural.

Denição 2.15. Uma sequência ann∈N, an ∈ K é uma sequência de Cauchy com

relação à | · | se para todo ε > 0, existe N ∈ N tal que

|an − am| 6 ε, ∀n,m > N.

Diremos que um corpo munido de um valor absoluto (K, | · |) é completo se toda

sequência de Cauchy tem um limite em K.

Dado um corpo K e um valor absoluto | · | em K, é possível obter um completa-

mento de K com respeito à | · |, isto é, existe uma extensão K ′ de K, que tem um valor

absoluto || · || cuja restrição à K coincide com | · |, tal que K ′ é completo com respeito à

42

|| · ||. Assim, podemos falar do completamento de K com respeito a uma valorização dis-

creta v, onde queremos dizer que é o completamento de K com respeito ao valor absoluto

proveniente de v.

Denição 2.16. Um valor absoluto | · | é dito arquimediano se |n · 1K | : n ∈ N é

ilimitado em R, caso contrário dizemos que | · | é não arquimediano.

Proposição 2.17. Um valor absoluto é não arquimediano se, e somente se satisfaz a

desigualdade triangular forte

|x+ y| 6 max|x|, |y|, ∀x, y ∈ K.

Demonstração. Ver (Capítulo 2, Proposição 3.6, [Neukirch]).

Exemplo 2.18. (i) Sobre Q, temos o valor absoluto usual

|q|∞ = maxq,−q,

que é arquimediano e cujo completamento de Q com respeito à esse valor absoluto

é R.

(ii) Considerando p primo e vp a valorização p-ádica, o valor absoluto p-ádico é dado

por

|q|p = p−vp(q).

Esse valor absoluto é não arquimediano. O completamento de Q com respeito à esse

valor absoluto é conhecido como o corpo dos números p-ádicos, denotado por

Qp.

É conhecido que esses dois valores absolutos são os únicos valores absolutos sobre

Q, a menos de equivalência (Capítulo 2, Proposição 3.7, [Neukirch]). Diremos então que

| · |∞ e | · |p são os valores absolutos standard de Q.Para o corpo K munido de uma valorização discreta, denotaremos por Kv ao

completamento de K com respeito a v. Temos que Kv tem como anel de inteiros

Rv = x ∈ Kv : v(x) > 0,

que é um anel local cujo ideal máximal é

mv = x ∈ Kv : v(x) > 0 = πvRv,

onde πv é um uniformizante em Rv. Denotaremos também por kv = Rv/mv o corpo resi-

dual de Rv.

43

Denotaremos por MK o conjunto de valores absolutos de K cuja restrição à Qcoincide com um dos valores absolutos standard de Q, por M∞

K o conjunto dos valores

absolutos arquimedianos e por M0K o conjunto dos valores absolutos não arquimedianos.

Seja E/K uma curva elíptica

E : y2 + a1xy + a3y = x3 + a2x2 + a4x+ a6.

Fazendo as substituições (x, y) 7→ (u−2x, u−3y) obtemos uma nova equação

y2 + (a1u)xy + (a3u3)y = x3 + (a2u

2)x2 + (a4u4)x+ (a6u

6),

em que os antigos coecientes ai são substituidos por uiai. Assim, pela escolha de u de

forma adequada, podemos obter equações de Weierstrass com coecientes em Rv, e assim

o discriminante ∆ estará em Rv e será tal que v(∆) > 0.

Denição 2.19. Seja E/K uma curva elíptica. Diremos que uma equação de Weierstrass

para E é minimal em relação à v se v(∆) atinge o valor mínimo nas condições de que

v(ai) > 0.

Agora estaremos interessados em analisar os pontos de E quando consideramos

as soluções módulo πv, onde v ∈ M0K (estamos considerando a valorização discreta da

qual provém o valor absoluto), ou seja, considerando o homomorsmo de redução módulo

πv

Rv → kv = Rv/mv, t 7→ t,

escolhemos uma equação minimal para E/Kv e olhamos seus coecientes módulo πv. Com

isso obteremos uma curva sobre kv, que será denotada por Ev

Ev : y2 + a1xy + a3y = x3 + a2x2 + a4x+ a6.

Dado um ponto P = [x0, y0, z0] ∈ E(Kv) com coordenadas x0, y0, z0 ∈ Rv, então

o ponto P = [x0, y0, z0] pertence a E(kv). E isso permite denir a aplicação de redução

E(Kv)→ E(kv), P 7→ P .

O conjunto dos pontos não singulares da curva reduzida formam um grupo deno-

tado por Ens(kv). Além disso, podemos denir também os seguintes conjuntos

E0(Kv) = P ∈ E(Kv) : P ∈ Ens(kv),

E1(Kv) = P ∈ E(Kv) : P = O.

Diremos que E0(Kv) é o conjunto dos pontos de redução não singular e que E1(Kv) é o

núcleo da redução.

44

Tomado v ∈ M0K , diremos que E/K tem uma boa redução em v, se Ev/kv é

uma curva suave, caso contrário diremos que tem umamá redução. Agora enunciaremos

um resultado que garante quando a curva E tem uma boa redução com respeito à uma

valorização.

Proposição 2.20. Seja E/K uma curva elíptica dada por uma equação de Weierstrass

minimal

E : y2 + a1xy + a3y = x3 + a2x2 + a4x+ a6,

com discriminante ∆. Então, E tem uma boa redução com respeito a v ∈ M0K se, e

somente se, v(∆) = 0, isto é, ∆ ∈ R×v . E neste caso Ev/kv é uma curva elíptica.

Demonstração. Ver (Capítulo 1, Proposição 5.1, [Silverman]).

Agora enunciamos um resultado que tem sua importância na prova da versão

fraca do Teorema de Mordell-Weil (enunciado e discutido no próximo capítulo).

Proposição 2.21. Seja E/K uma curva elíptica, m um inteiro positivo e v ∈ M0K tal

que v(m) = 0. Se E tem uma boa redução em relação à v, então a aplicação de redução

E(K)[m]→ Ev(kv)

P 7→ P .

é injetiva.

Demonstração. Ver (Capítulo 7, Proposição 3.1, [Silverman]).

Capítulo 3

O Teorema de Mordell-Weil

Este capítulo é dedicado à demonstração do Teorema de Mordell-Weil, resultado

este que diz que o grupo de Mordell-Weil (conjunto dos pontos K-racionais) de qualquer

curva elíptica sobre um corpo de números K, é nitamente gerado. Este Teorema provado

por André Weil em 1928 é uma extensão da versão para o corpo dos racionais, provada

por Louis Mordell em 1922.

Essa prova é dividida em duas grandes etapas, uma delas é o chamado Teorema

Fraco de Mordell-Weil, mas apenas a versão fraca não é suciente. A outra etapa é o

chamado Teorema de Descida, que indicará que tipo de função, que será chamada função

altura, pode ser usada para provar que um grupo abeliano é nitamente gerado.

3.1 A versão fraca do Teorema

Nesta seção serão apresentados alguns resultados técnicos que não serão demons-

trados, mas que terão indicadas as devidas referências para suas demonstrações.

Teorema 3.1 (Mordell-Weil Fraco). Seja K um corpo de números, E/K uma curva

elíptica denida sobre K e m um inteiro maior ou igual à 2. EntãoE(K)

mE(K)é nito.

Antes de apresentar a prova deste resultado, precisamos de mais algumas ferra-

mentas. Provaremos o seguinte lema, que nos permitirá supor que E[m] ⊆ E(K).

Lema 3.2. Seja K um corpo de números e L/K uma extensão de Galois nita. SeE(L)

mE(L)é nito, então

E(K)

mE(K)também é nito.

Demonstração. Consideremos a inclusão E(K) → E(L). Esta induz uma aplicação

E(K)

mE(K)→ E(L)

mE(L),

45

46

cujo núcleo é dado por

Φ = P +mE(K) : P ∈ E(K) ∩mE(L) =E(K) ∩mE(L)

mE(K).

Dado P + mE(K) ∈ Φ, consideremos QP ∈ E(L) satisfazendo [m]QP = P (este

QP não precisa ser único). Agora denimos a seguinte função

λP : G(L/K)→ E[m]

τ 7→ QτP −QP .

Esta aplicação está bem denida, visto que

[m](QτP −QP ) = ([m]QP )τ − [m]QP = P τ − P = O, (P ∈ E(K)),

e assim QτP −QP ∈ E[m].

Agora vejamos o seguinte: Sejam P, P ′ ∈ E(K) ∩ mE(L) tais que λP = λP ′ .

Temos que

(QP −QP ′)τ = QP −QP ′ , ∀τ ∈ G(L/K),

visto que QτP − QP = λP (τ) = λP ′(τ) = Qτ

P ′ − QP ′ . Portanto, QP − QP ′ ∈ E(K). De

onde segue que

P − P ′ = [m]QP − [m]QP ′ ∈ mE(K),

e assim P ≡ P ′(mod mE(K)). Isso prova que a associação

Φ→ F(G(L/K), E[m]), P 7→ λP ,

é injetora. Mas tanto E[m] quanto G(L/K) são nitos, de onde segue que Φ é nito.

Finalmente, temos que a sequência exata

0→ Φ→ E(K)

mE(K)→ E(L)

mE(L),

colocaE(K)

mE(K)entre dois grupos nitos, e assim,

E(K)

mE(K)é nito.

Em consequência desse lema, podemos assumir que E[m] ⊆ E(K), pois se assim

não o fosse, poderíamos construir uma extensão de Galois nita L/K, que contém todas

as coordenadas dos pontos de m-torção, que já sabemos que são nitos (Ver Corolário

5.4, [Butt]).

Daqui em diante iremos supor que E[m] ⊆ E(K). E a partir de agora, mostra-

47

remos que a nitude do grupoE(K)

mE(K)pode ser substituida pela nitude de uma certa

extensão de corpos de K.

3.1.1 O emparelhamento de Kummer

Para mostrarmos a equivalência entre a nitude do grupoE(K)

mE(K)com a nitude

de uma certa extensão de K, precisaremos denir o emparelhamento de Kummer, que é

visto a seguir.

Iremos considerar a seguinte aplicação

κ : E(K)×G(K/K)→ E[m],

denida da seguinte forma. Sendo P ∈ E(K), escolhemos QP ∈ E(K) tal que [m]QP = P ,

e isso é possível visto que a aplicação [m] : E → E é sobrejetiva. Então denimos

κ(P, τ) = QτP −QP .

Esta aplicação é chamada Emparelhamento de Kummer e satisfaz as seguin-

tes propriedades, evidenciadas pela proposição a seguir.

Proposição 3.3. A aplicação κ satisfaz:

(i) Está bem denido, isto é, independe da escolha de QP e κ(P, τ) ∈ E[m] efetivamente.

(ii) É bilinear, isto é, κ(P + Q, τ) = κ(P, τ) + κ(Q, τ) e κ(P, τσ) = κ(P, τ) + κ(P, σ),

para todo P,Q ∈ E(K), τ, σ ∈ G(K/K).

(iii) O núcleo de κ à esquerda é mE(K), isto é, κ(P, τ) = O para todo τ ∈ G(K/K) se,

e somente se, P ∈ mE(K).

(iv) O núcleo de κ à direita é G(K/L), onde L = K([m]−1E(K)) que é a menor extensão

de corpos de K que contém todas as coordenadas dos pontos em [m]−1E(K).

(v) O Emparelhamento de Kummer induz uma forma bilinear perfeita

E(K)/mE(K)×G(L/K)→ E[m],

isto é, uma aplicação bilinear (como visto no item (ii)) e que seus núcleos à esquerda

e direita são triviais.

Demonstração. (i) Mostremos que κ(P, τ) ∈ E[m]. Dado que, sendo P = (x, y) então

P τ = (xτ , yτ ) e que G(K/K) xa os pontos K-racionais, então temos que

[m]κ(P, τ) = [m]QτP − [m]QP = P τ − P = O.

48

E portanto, κ(P, τ) ∈ E[m].

Agora mostremos que não depende da escolha de QP . Se tivermos QP , Q′P distintos

tais que [m]QP = [m]Q′P = P , então Q′P = QP + S para algum S ∈ E[m] ⊆ E(K).

Assim,

(Q′P )τ −Q′P = (QP + S)τ − (QP + S) = QτP −QP + Sτ − S = Qτ

P −QP ,

visto que S ∈ E(K) e portanto Sτ − S = O. Portanto κ está bem denida.

(ii) Para a linearidade em G(K/K) temos. Dados τ, σ ∈ G(K/K),

κ(P, τσ) = QτσP −QP = (Qτ

P −QP )σ + (QσP −QP ) = κ(P, τ)σ + κ(P, σ),

e como κ(P, τ) ∈ E[m] ⊆ E(K), então κ(P, τσ) = κ(P, τ) + κ(P, σ).

Para a linearidade em E(K), já sabemos que a imagem de κ(P, τ) não depende da

escolha do representante QP , sendo assim, para P +R, escolhemos o representante

QP+R = QP +QR de onde teremos

κ(P +R, τ) = QτP+R −QP+R = (Qτ

P −QP ) + (QτR −QR) = κ(P, τ) + κ(R, τ).

(iii) Primeiro, supondo P ∈ mE(K), tomemos QP ∈ E(K) tal que [m]QP = P .

κ(P, τ) = QτP −QP = QP −QP = O, ∀τ ∈ G(K/K),

visto que QP é xado por G(K/K).

Por outro lado, se κ(P, τ) = O, para todo τ ∈ G(K/K), então

QτP = QP , para todo τ ∈ G(K/K).

Daí, QP ∈ E(K) e assim P ∈ mE(K).

(iv) Seja τ ∈ G(K/L), então

κ(P, τ) = QτP −QP = O, ∀P ∈ E(K),

visto que QP ∈ E(L) pela denição de L.

Por outro lado, se τ ∈ G(K/K) é tal que κ(P, τ) = O para todo P ∈ E(K), então

para todo Q ∈ E(K) com [m]Q ∈ E(K) tem-se

O = κ([m]Q, τ) = Qτ −Q.

49

Portanto, τ xa Q, e se Q = (x(Q), y(Q)) então τ xa também o corpo de denição

de Q, K(x(Q), y(Q)). Mas basta observar que L é precisamente a união de todos

esses corpos de denição, de modo que τ também xa L. De onde seque que τ ∈G(K/L).

(v) Considerando a torre de corposK ⊆ L ⊆ K, já sabemos queG(K/L) é um subgrupo

normal de G(K/K), visto que é núcleo do homomorsmo

G(K/K)→ Hom(E(K), E[m])

τ 7→ κ(·, τ).

Portanto, a extensão L/K é de Galois e mais do que isso,

G(L/K) ∼=G(K/K)

G(K/L).

Tomamos a aplicação

E(K)/mE(K)×G(L/K)→ E[m],

que é denida de modo natural a partir de κ passando ao quociente de maneira

natural, de modo que a bilinearidade se preserva e os núcleos à esquerda e à direita

passam a serem triviais.

Agora, poderemos trocar o problema de mostrar a nitude do grupo E(K)/mE(K)

pelo de mostrar a nitude da extensão G(L/K). Com efeito, se E(K)/mE(K) é nito,

então para cada τ ∈ G(L/K) podemos induzir um homomorsmo

κ(·, τ) : E(K)/mE(K)→ E[m].

Como E[m] e E(K)/mE(K) são nitos, então o grupo Hom(E(K)/mE(K), E[m]) tam-

bém é nito. Agora como a forma bilinear induzida é perfeita, temos que κ(·, τ) = κ(·, σ)

se, e somente se, τ = σ, de onde segue que G(L/K) é nito.

Reciprocamente, usando um argumento análogo, mostra-se que a nitude de

G(L/K) garante a nitude de E(K)/mE(K). Assim, daqui em diante nos dedicaremos

a mostrar a nitude da extensão L/K.

3.1.2 A demonstração da versão fraca

Para provar a versão fraca do Teorema de Mordell-Weil, precisamos de mais

algumas denições da Teoria Algébrica dos Números.

50

Denição 3.4. Seja L/K uma extensão nita de corpos completos e v uma valorização

em L. Dizemos que a extensão L/K é não ramicada em v se [L : K] = [lv, kv] onde

lv e kv são os corpos residuais com respeito à v.

Denição 3.5. Chamamos de grupo de inércia ao seguinte subgrupo de G(K/K),

Iv = τ ∈ G(K/K) : |τ(x)− x|v < 1, para todo x ∈ Rv.

Proposição 3.6. Seja L = K([m]−1E(K)) o corpo que denimos anteriormente. Então

(a) A extensão L/K é abeliana e tem expoente m, isto é, o grupo de Galois G(L/K) é

abeliano e e todo elemento de G(L/K) tem ordem que divide m.

(b) Seja S = v ∈M0K : Ev(kv) é singular∪v ∈M0

K : v(m) 6= 0∪M∞K . A extensão

L/K é não ramicada fora de S, ou seja, se v ∈ MK e v 6∈ S, então a extensão

L/K não se ramica em v.

Demonstração. (a) Pelo que vimos anteriormente, o emparelhamento de Kummer dene

um homomorsmo de grupos injetivo

φ : G(L/K)→ Hom(E(K), E[m]), τ 7→ κ(·, τ),

que mostra que G(L/K) é abeliano. Agora, se τ ∈ G(L/K), temos

φ(τm) = κ(·, τm) = [m]κ(·, τ) = O.

De modo que τm = id ∈ G(L/K), o que implica em ord(τ)|m.

(b) Considere v ∈ MK com v 6∈ S. Dado que L é a união de todas as extensões

K ′ = K(Q) para Q ∈ E(K) com [m]Q ∈ E(K), então precisamos mostrar que cada

uma das extensões K(Q)/K é não ramicada em v.

Seja v′ ∈MK′ tal que v′ restrito aK coincide com v. Consideremos a correspondente

extensão k′v′/kv de corpos residuais.

Como v 6∈ S, E tem uma boa redução com relação a v, e portanto também tem

uma boa redução com relação a v′, já que podemos considerar a mesma equação de

Weierstrass onde teremos v(∆) = v′(∆) = 0.

Consideremos também a aplicação de redução

E(K ′)→ Ev′(k′v′).

Pela denição de Iv′ , sua atuação sobre k′v′ é trivial, de modo que também atua

51

trivialmente sobre Ev′(k′v′). Portanto, dado τ ∈ Iv′ , temos

Qτ −Q = Qτ −Q = O.

Por outro lado, como [m]Q ∈ E(K), então

[m](Qτ −Q) = ([m]Q)τ − [m]Q = O.

Assim, Qτ − Q é um ponto de m−torção que pertence ao núcleo da aplicação de

redução. Mas pelo que vimos no nal do Capítulo 2, a aplicação de redução

E(K ′)[m]→ Ev′(k′v′)

é injetiva, portanto Qτ − Q = O. De modo que todo elemento de Iv′ xa Q, e

portanto temos que K ′ = K(Q) não se ramica sobre K em v′. Mostrando que

K ′/K não se ramica fora de S, nalizando a prova.

Agora como último passo para a prova da versão fraca, temos o seguinte resultado.

Teorema 3.7 (Hermite). Seja S ⊆MK nito. Então existe apenas um número nito de

extensões K ′/K não ramicadas fora de S com grau limitado, ou seja,

|K ′ : K| < n

para algum n.

Demonstração. Ver (Capítulo 5, pág. 122, Hermite's Theorem, [Lang]).

Agora usemos esses dois últimos resultados para provar a versão fraca do Teorema

de Mordell-Weil.

Teorema 3.8 (Mordell-Weil Fraco). Seja K um corpo de números, E/K uma curva

elíptica denida sobre K e m um inteiro maior ou igual à 2. EntãoE(K)

mE(K)é nito.

Demonstração. Como já vimos anteriormente, dado m > 2, é suciente provar que a

extensão L/K é nita, onde L = K([m]−1E(K)), já que assim teremos que o grupo

E(K)/mE(K) também será nito. Considerando o conjunto

S = v ∈M0K : Ev(kv) é singular ∪ v ∈M0

K : v(m) 6= 0 ∪M∞K ,

temos que pela Proposição 3.6, que para cada Q ∈ E(K) tal que [m]Q ∈ E(K), a extensão

K ′ = K(Q) é não ramicada fora de S. Mas como cada um dos conjugados de Galois de

52

Q são da forma Q+R para algum R ∈ E[m] ⊆ E(K), então o grau da extensão K ′/K é

no máximo m2 = |E[m]|, ou seja,

[K(Q) : K] 6 m2.

Agora, pelo Teorema de Hermite, fazendo Q variar entre todos os pontos em

[m]−1E(K), existirão apenas um número nito de extensões da forma K ′ = K(Q). Mas

como L é a união de todos os K ′, temos que a extensão L/K é nita. Finalizando a prova

desse teorema.

3.2 O Teorema da Descida

Provaremos agora um resultado que dá garantias de quando um grupo abeliano é

nitamente gerado, através da existência de certas funções que são chamadas de funções

altura. Mais precisamente, o próximo resultado conhecido como Teorema da Descida

garante que um grupo abeliano é nitamente gerado desde que exista uma função com

certas propriedades de limitação. Depois de provado esse resultado, faremos um estudo

sobre funções alturas no espaço projetivo, para enm construirmos funções altura em

curvas elípticas a m de provar o Teorema de Mordell-Weil.

Teorema 3.9 (Teorema da Descida). Seja G um grupo abeliano. Suponha que exista uma

função

h : G→ R

que satisfaz as seguintes propriedades:

(i) Dado Q ∈ G. Existe uma constante c1, dependendo de G e Q, tal que

h(P +Q) 6 2h(P ) + c1, para todo P ∈ G.

(ii) Existe um inteiro m > 2 e uma constante c2, dependendo de G, tal que

h(mP ) > m2h(P )− c2, para todo P ∈ G.

(iii) Para qualquer constante c3, o conjunto

P ∈ G : h(P ) 6 c3

é nito.

Suponha ainda que, para o inteiro m em (ii), o quociente G/mG é nito. Então G

é nitamente gerado.

53

Demonstração. Seja Q1, . . . , Qn um conjunto de representantes dos elementos emG/mG,

e P ∈ G qualquer. Então

P = mP1 +Qi1 , para algum 1 6 i1 6 n,

ou seja, P pertence à classe de Qi1 em G/mG.

De forma recursiva construimos uma sequência P1, P2, . . . de forma que

Pk = mPk+1 +Qik+1.

Do item (ii) temos que

h(mPk) > m2h(Pk)− c2

⇒ h(Pk) 61

m2(h(mPj) + c2) =

1

m2(h(Pj−1 −Qij) + c2).

Considere c1j a constante dada no item (i), relativa à −Qij . Temos então

h(Pj) 61

m2(2h(Pj−1) + c1j + c2).

Considerando c′1 = maxc1j : 1 6 j 6 n e c = c′1 + c2, obtemos

h(Pj) 61

m2(2h(Pj−1) + c).

Aplicando isso de forma recursiva obtemos

h(Pk) 6

(2

m2

)kh(P ) +

(1 +

2

m2+ · · ·+

(2

m2

)k−1)· cm2

=

(2

m2

)kh(P ) +

(2m2

)k − 12m2 − 1

· cm2

61

2kh(P ) +

c

m2 − 2

61

2kh(P ) +

c

2,

pois m > 2 e assim2

m26

1

2.

Para k sucientemente grande obtemos

h(Pk) 6 1 +c

2.

54

Como P é combinação linear de Pk e Q1, . . . , Qn, por indução mostramos que

P = mkPk +k∑j=1

mj−1Qij .

Pela condição (iii), o conjunto Q ∈ G : h(Q) 6 1 +c

2 é nito, suponhamos que

seja Qn+1, . . . , Qr. Daí, todo elemento P ∈ G será combinação linear desses Qi, para

i = 1, . . . , r. Mostrando que G é nitamente gerado.

3.3 Alturas no Espaço Projetivo

Estaremos interessados em usar o Teorema da Descida para provar que o grupo

E(K) é nitamente gerado. Para isso faremos um estudo de funções altura no espaço

projetivo, para entender como podemos restringir tais funções aos pontos de uma curva

elíptica.

Apresentaremos um exemplo de função altura no espaço projetivo sobre os raci-

onais, e nesse processo veremos a importância do seu anel de inteiros, no caso Z, ser umdomínio de ideais principais, o que não necessariamente ocorre para corpos de números

arbitrários.

Exemplo 3.10. Sendo P ∈ Pn(Q) um ponto com coordenadas racionais. Visto que Z é

um domínio de ideais principais, podemos encontrar coordenadas homogêneas para P de

tal forma que ambas estejam em Z e sejam primas entre si, ou seja,

P = [x0, . . . , xn],

com x0, . . . , xn ∈ Z e mdc(x0, . . . , xn) = 1. Deste modo denimos a altura natural de P

como sendo

H(P ) = max|x0|, . . . , |xn|.

Para esta denição, claramente teremos que dado c constante, o conjunto P ∈ Pn(Q) :

H(P ) 6 c é nito, e tem no máximo (2c+ 1)n elementos.

Agora começamos o procedimento para obter funções altura no espaço projetivo

sobre corpos de números arbitrários, para isso relembremos a seguinte denição.

Denição 3.11. Dado K um corpo de números, seu conjunto de valores absolutos

standard, denotado por MK, é o conjunto de seus valores absolutos que quando restrito

à Q coincide com um dos valores absolutos standard de Q, isto é, o valor absoluto real ou

o valor absoluto p-ádico para algum p primo.

55

Denição 3.12. Seja v ∈MK. O grau local em v, denotado por nv é

nv = [Kv : Qv],

onde Kv e Qv são os respectivos completamentos de K e Q com respeito a v.

A seguir enunciamos dois resultados da Teoria Algébrica dos Números com as

devidas referências.

Teorema 3.13 (Fórmula de Extensão). Seja Q ⊆ K ⊆ L uma torre de corpos de núme-

ros, e seja v ∈MK. Então ∑w∈ML, w|v

nw = [L : K] · nv.

Onde w|v denota que a restrição de w a K coincide com v

Demonstração. Ver (Capítulo 2, Corolário 1, [Lang]).

Teorema 3.14 (Fórmula do Produto). Seja x ∈ K∗. Então∏v∈MK

|x|nvv = 1.

Demonstração. Ver (Capítulo 2, Corolário 2, [Lang]).

Denição 3.15. Seja P = [x0, . . . , xn] ∈ Pn(K), a altura de P (em relação à K) é

denida como

HK(P ) =∏v∈MK

max|x0|v, . . . , |xn|vnv .

Proposição 3.16. Seja P ∈ Pn(K).

(a) A altura HK(P ) está bem denida, ou seja, não depende da escolha das coordenadas

homogêneas escolhidas.

(b) A altura satisfaz HK(P ) > 1, para todo P ∈ Pn(K).

(c) Seja L uma extensão nita de K. Então

HL(P ) = HK(P )[L:K].

Demonstração.

(a) Temos que as outras coordenadas homogêneas para o ponto P são da forma

[λx0, . . . , λxn], para algum λ ∈ K∗.

56

Assim, pela fórmula do produto obtemos∏v∈MK

max|λx0|v, . . . , |λxn|vnv =∏v∈MK

|λ|nvv max|x0|v, . . . , |xn|vnv

=∏v∈MK

|λ|nvv∏v∈MK

max|x0|v, . . . , |xn|vnv

=∏v∈MK

max|x0|v, . . . , |xn|vnv .

(b) Dado P no espaço projetivo, sempre podemos encontrar coordenadas homogêneas em

que ao menos uma dessas coordenadas seja 1, sendo essa coordenada xi temos |xi|v = 1

para todo valor absoluto normalizado v ∈ MK . Assim, todos os fatores do produto em

HK(P ) são pelo menos 1, de modo que HK(P ) > 1.

(c) Pela fórmula de extensão temos o seguinte

HL(P ) =∏w∈ML

max|x0|w, . . . , |xn|wnw

=∏v∈MK

∏w∈ML, w|v

max|x0|v, . . . , |xn|vnv visto quexi ∈ K

=∏v∈MK

max|x0|v, . . . , |xn|v[L:K]nv

= HK(P )[L:K].

Observação 3.17. Observe que se K = Q, então HQ coincide com a altura denida no

exemplo anterior. Com efeito, se tivermos P = [x0, . . . , x1] ∈ Pn(Q) com x0, . . . , xn ∈ Ze mdc(x0, . . . , xn) = 1, então para qualquer primo p teremos ordp(xi) > 0 e ao menos um

dos xi terá ordp(xi) = 0 (pois os xi são primos entre si). Assim, |xi|v 6 1 para todo i, e

|xi|v = 1 para algum i, isso para todo valor absoluto não arquimediano. E assim, HQ(P )

só depende do valor absoluto real, que é o que dene a função altura do exemplo anterior.

Em particular, o conjunto P ∈ Pn(Q) : HQ(P ) 6 c é nito, para todo c ∈ R.

O objetivo agora é tentar estender essa propriedade para toda HK .

Denição 3.18. Para P ∈ Pn(Q), a altura absoluta de P , denotada por H(P ), é

denida como segue: Seja K um corpo de números para o qual P ∈ Pn(K), então

H(P ) = HK(P )1/[K:Q],

onde consideramos a raiz real positiva.

57

Podemos ver que pelo item (c) da proposição anterior, essa função está bem de-

nida. Com efeito, se escolhermos outro corpo de números L/K, então HL(P )1

[L:Q] =

(HK(P ))[L:K][L:Q] = HK(P )

1[K:Q] . Agora, pelo item (b) da mesma proposição, temos que

H(P ) > 1, para todo P ∈ Pn(Q).

Denição 3.19. Um morsmo de grau d entre espaços projetivos é uma aplicação

F : Pn → Pm

P 7→ [f0(P ), . . . , fm(P )],

onde f0, . . . , fm ∈ Q[x0, . . . , xn] são polinômios homogêneos de grau d sem nenhum zero

não trivial em comum em Q. Diremos que F está denido sobre K se pudermos encontrar

polinômios que denam F cujos coecientes estejam em K.

Teorema 3.20. Seja F : Pn → Pm um morsmo de grau d. Então existem constantes

positivas c1 e c2 que dependem de F , tais que

c1H(P )d 6 H(F (P )) 6 c2H(P )d, ∀P ∈ Pn(Q).

Demonstração. Seja F = [f0, . . . , fm] morsmo de grau d, em que f0, . . . , fm não tem

zeros não triviais em comum, e seja P = [x0, . . . , xn] ∈ Pn(Q). Escolha K um corpo de

números que contenha as coordenadas x0, . . . , xn e também os coecientes dos polinômios

fi. Para cada valor absoluto v ∈MK dena

|P |v = max|x0|v, . . . , |xn|v e |F (P )|v = max|f0(P )|v, . . . , |fm(P )|v, e

|F |v = max|a|v : a é coeciente de algum fi.

Assim, pela denição de altura teremos

HK(P ) =∏v∈MK

|P |nvv e HK(F (P )) =∏v∈MK

|F (P )|nvv ,

e denimos HK(F ) =∏

v∈MK|F |nvv .

Dena também a função ε(v) que é 1 se v ∈ M∞K e é 0 caso v ∈ M0

K . De modo

que da desigualdade triangular para o valor absoluto | · |v temos

|t1 + · · ·+ tn|v 6 nε(v) max|t1|v, . . . , |tn|v,

para qualquer que seja v ∈MK .

58

Seja v ∈MK , pela desigualdade acima temos

|fi(P )|v 6 cε(v)|F |v · |P |dv,

para alguma constante c positiva (podemos escolher c como o número de termos do po-

linômio fi), visto que os polinômios fi são homogêneos de grau d, podendo ser escritos na

forma

fi = a1

n∏j=0

xdj1j + · · ·+ ac

n∏j=0

xdjcj .

Podemos tomar um c adequado para que valha para todos os i.

Assim, |F (P )|v 6 cε(v)|F |v · |P |dv. Portanto∏v∈MK

|F (P )|nvv 6∏v∈MK

cε(v)nv ·∏v∈MK

|F |nvv ·∏v∈MK

|P |dnvv .

Mas como ε(v) = 0 para todo valor absoluto não arquimediano, então∏v∈MK

cε(v)nv =∏

v∈M∞K

cnv = c[K:Q].

E tomando a raíz [K : Q]-ésima, obtemos

H(F (P )) =

( ∏v∈MK

|F (P )|nvv

) 1[K:Q]

6 c ·

( ∏v∈MK

|F |nvv

) 1[K:Q]

·

( ∏v∈MK

|P |dnvv

) 1[K:Q]

= c ·H(F ) ·H(P )d.

Basta tomar c2 = c ·H(F ).

Agora iremos mostrar a cota inferior.

Temos que Q ∈ An+1(Q) : f0(Q) = · · · = fm(Q) = 0 = (0, . . . , 0). Pelo

Teorema dos Zeros de Hilbert, o ideal

I = (f0, . . . , fm) ⊆ Q[x0, . . . , xn]

contém alguma potência xdii para i = 0, . . . , n, pois

xi ∈√I = I(V (I)).

59

Assim, existem polinômios gij ∈ Q[x0, . . . , xn] e um inteiro e > 1 tais que

xei =m∑j=0

gijfj,

para cada i = 0, . . . , n. E podemos assumir que gij ∈ K[x0, . . . , xn] são todos de grau

e− d, já que xei é homogêneo de grau e e todos os fj são homogêneos de grau d.

Adotando as seguintes notações

|G|v = max|b|v : b é coeciente de algum gij e HK(G) =∏v∈MK

|G|nvv ,

temos que tanto e quanto HK(G) não dependem de P .

Sendo P = [x0, . . . , xn], temos que

|xi|ev = |m∑j=0

gij(P )fj(P )|v 6 Dε(v) max|gij(P )fj(P )|v; 0 6 j 6 m

6 Dε(v) max|gij(P )|v|fj(P )|v; 0 6 j 6 m,

onde D só depende dos polinômios gijfj.

Agora considerando o máximo sobre todos os i, temos

|P |ev 6 Dε(v) maxi,j|gij(P )|v|F (P )|v.

Como cada um dos gij é homogêneo de grau e− d, então como consequência da desigual-

dade triangular

|gij|v 6 Dε(v)1 |G|v|P |e−dv ,

em que a constante D1 também não depende de P . Portanto,

|P |dv 6 (DD1)ε(v)|G|v|F (P )|v.

Novamente tomando o produto sobre todos v ∈ MK e tomando a raíz [K : Q]-ésima,

obtemos

H(P )d 6 D2 ·H(F (P )),

onde D2 = D ·D1 ·H(G). Considere c1 = 1/D2.

Corolário 3.21. Seja A ∈ GLn+1(Q). Então a multiplicação por A induz um automor-

smo A : Pn → Pn. Então existem constantes c1, c2 que dependem das entradas de A tais

que

c1H(P ) 6 H(A(P )) 6 c2H(P ),

60

para todo P ∈ Pn(Q).

Demonstração. Como A é linear, ela induz um morsmo de grau 1, bastando aplicar o

resultado do teorema anterior.

Agora vamos tratar de entender a relação entre os coecientes de um polinômio

e a altura de suas raízes. Sobre isso, temos o seguinte resultado.

Teorema 3.22. Seja f(t) = a0td + · · ·+ ad = a0(t− α1) · · · (t− αd) ∈ Q[t] um polinômio

de grau d. Então

2−dd∏j=1

H(αj) 6 H([a0, . . . , ad]) 6 2d−1

d∏j=1

H(αj).

Demonstração. Inicialmente observemos que a desigualdade não se altera caso multipli-

quemos f por uma constante não nula. Assim, sem perda de generalidade podemos

assumir que a0 = 1, fazendo de f um polinômio mônico.

Seja K = Q(α1, . . . , αd), e para v ∈ MK , denotemos por ε(v) = 2 se v for arqui-

mediano e ε(v) = 1 caso v seja não arquimediano.

Observamos que essa função ε não é a mesma que denimos anteriormente, que

associava 1 a valores absolutos arquimediano e 0 a não arquimedianos.

Com esta notação, temos que

|x+ y|v 6 ε(v) max|x|v, |y|v, para v ∈MK , x, y ∈ K.

Agora observe que se v ∈M0K e |x|v 6= |y|v, então a desigualdade se torna uma igualdade

(isso é consequência da desigualdade triangular forte).

Provaremos a seguinte desigualdade, usando indução no grau do polinômio f

ε(v)−dd∏j=1

max|αj|v, 1 6 max06j6d

|aj|v 6 ε(v)d−1

d∏j=1

max|αj|v, 1.

Para d = 1 temos que f(t) = t− α1, e para esse caso a desigualdade é clara, visto que

2−1 ·max|α1|v, 1 6 1−1 ·max|α1|v, 1

= max|α1|v, 1

= 20 max|α1|v, 1

= 10 max|α1|v, 1.

61

Agora, por hipótese de indução, suponhamos que a desigualdade é válida para polinômios

de grau d− 1, com raízes em K, e seja f nas hipóteses. Seja k indíce tal que

|αk|v > |αi|v, ∀i = 1, . . . , d.

Consideremos também o polinômio

g(t) = (t− α1) · · · (t− αk−1) · (t− αk+1) · · · (t− αd) = b0td−1 + · · ·+ bd−1.

Claramente, temos que f(t) = (t − αk)g(t), e além disso ai = bi − αk · bi−1 (onde b−1 =

bd = 0).

Portanto,

max06j6d

|aj|v = max06j6d

|bj − αkbj−1|v (desigualdade triangular)

6 ε(v) max06j6d

|bj|v, |αkbj−1|v

6 ε(v) max06j6d

|bj|vmax|αk|v, 1

6 ε(v)d−1

d∏j=1

max|αj|v, 1 (pela hipótese de indução).

Agora, para mostrar a limitação inferior vamos separar em dois casos

• Caso 1: Se |αk|v 6 ε(v). Pela escolha do índice k, temos

d∏j=1

max|αj|v, 1 6 max|αk|v, 1d 6 ε(v)d,

de onde segue o resultado, pois como a0 = 1, então

ε(v)−dd∏j=1

max|αj|v, 1 6 1 6 max06j6d

|aj|v.

• Caso 2: Se |αk|v > ε(v). Seja i o índice para o qual |bi−1|v é máximo. Então

max06j6d

|aj|v = max06j6d

|bj − αk · bj−1|v > |bi − αk · bi−1|v.

Se v ∈M0K , então

|bi − αk · bi−1|v = |αk|v|bi−1|v = ε(v)−1|αk|v max06j6d−1

|bj|v.

62

Se v ∈M∞K , então

|bi − αkbi−1|v > |αk|v|bi−1|v − |bi|v> (|αk|v − 1)|bj−1|v= (|αk|v − 1) max

06j6d−1|bj|v

> ε(v)−1|αk|v max06j6d−1

|bj|v,

pois |αk|v > ε(v) = 2 (e assim |αk|v − 1 > |αk|v/ε(v)). Portanto independente se v

é arquimediano ou não, temos

max06j6d

|aj|v > ε(v)−1 max06j6d−1

|bj|vmax|αk|v, 1.

E agora basta aplicar a hipótese de indução para g e obteremos o resultado para f .

Temos provado então as desigualdades

ε(v)−dd∏j=1

max|αj|v, 1 6 max06j6d

|aj|v 6 ε(v)d−1

d∏j=1

max|αj|v, 1.

E para obter o resultado do teorema, basta elevar esses termos a nv, depois tomar o

produto sobre todos os v ∈ MK e por m elevar a 1[K:Q]

, e ver que como ε(v) 6 2 então

2−d 6 ε(v)−d e ε(v)d−1 6 2d−1.

Exibiremos agora um resultado que garante que a função altura é invariante

quanto à ação do grupo de Galois G(Q/Q).

Teorema 3.23. Seja P ∈ Pn(Q) e τ ∈ G(Q/Q). Então

H(P τ ) = H(P ).

Demonstração. Seja K/Q uma extensão tal que P ∈ Pn(K). Temos que τ dene um

isomorsmo

τ : K → Kτ = τ(α) : α ∈ K.

e que induz também um identicação entre os conjuntos de valores absolutos de K e de

τ : MK →MKτ , v 7→ vτ ,

onde |τ(x)|vτ = |x|v. Assim, τ também induz um isomorsmo entre os completamentos

Kv e Kτvτ , de modo que os graus locais nv e nvτ são iguais.

63

Portanto

HKτ (P τ ) =∏

w∈MKτ

max|xτi |wnw

=∏v∈MK

max|xi|vnvτ

=∏v∈MK

max|xi|vnv

= HK(P ).

Como [K : Q] = [Kτ : Q], então pela denição da altura absoluta obtemos

H(P τ ) = H(P ).

Finalmente, antes de prosseguirmos para denir funções alturas sobre curvas elíp-

ticas, provaremos o resultado que garante que a função altura H satisfaz a condição de

nitude do teorema da descida.

Teorema 3.24. Sejam c e d constantes positivas. Então conjunto

P ∈ Pn(Q : H(P ) 6 c e [Q(P ) : Q] 6 d,

é nito. Onde Q(P ) é o corpo de denição minimal de P , isto é, a menor extensão de

Q que contém as coordenadas homogêneas normalizadas de P . Em particular, para todo

corpo de números K, o conjunto

P ∈ Pn(K) : HK(P ) 6 c

é nito.

Demonstração. Seja P ∈ Pn(Q). Escolhamos coordenadas homogêneas para P de forma

que alguma delas seja 1, P = [x0, . . . , xn]. Então Q(P ) = Q(x0, . . . , xn) e temos a seguinte

estimativa para a altura de P ,

HQ(P )(P ) =∏

v∈MQ(P )

max06j6n

|xi|vnv

> max06j6n

∏v∈MQ(P )

max|xi|v, 1nv

= max06j6n

HQ(P )(xi).

64

Portanto, se H(P ) 6 c e [Q(P ) : Q] 6 d, então maxH(x1) 6 c e max[Q(xi) :

Q] 6 d. Assim o problema se reduz a provar que o conjunto

x ∈ Q(x) : H(x) 6 c e [Q(x) : Q] 6 d

é nito.

Seja x no conjunto acima, temos que e = [Q(x) : Q] 6 d. Considere o conjunto

dos conjugados de x, x = x1, . . . , xe. Então o polinômio minimal de x sobre Q é

fx(t) = (t− x1) · · · (t− xe) = te + a1te−1 + · · ·+ ae−1t+ ae ∈ Q[t].

Podemos então obter a seguinte estimativa

H([1, a1, . . . , ae]) 6 2e−1

e∏j=1

H(xj)

= 2e−1H(x)e

6 (2c)d pois H(x) 6 c e e 6 d.

Pelo fato de que a1, . . . , ae ∈ Q, e que existe apenas uma quantidade nita de

pontos Q ∈ Pe(Q) com altura limitada por (2c)d, então existe apenas uma quantidade

nita de polinômios fx(t). Como cada um dos polinômios fx(t) tem no máximo d raízes

em Q, vemos que de fato o conjunto

x ∈ Q(x) : H(x) 6 c e [Q(x) : Q] 6 d

é nito. Portanto

P ∈ Pn(Q : H(P ) 6 c e [Q(P ) : Q] 6 d,

é nito.

Agora, se K é um corpo de números de grau e, então temos a inclusão

P ∈ Pn(K) : HK(P ) 6 c ⊆ P ∈ Pn(Q : H(P ) 6 c1/e e [Q(P ) : Q] 6 e.

Mostrando que P ∈ Pn(K) : HK(P ) 6 c é nito.

65

3.4 Alturas em Curvas Elípticas

Nesta seção demonstraremos o Teorema de Mordell-Weil, mas para isso precisa-

mos entender como as funções alturas denidas no espaço projetivo se comportam em

relação à operação de grupo denida sobre uma curva elíptica.

Começaremos denindo a seguinte notação: Sejam f e g funções reais denidas

em um conjunto S. Escrevemos

f = g +O(1)

para dizer que existem contantes c1, c2 tais que

c1 6 f(P )− g(P ) 6 c2, ∀P ∈ S.

Se apenas a desigualdade inferior é satisfeita, escrevemos f > g + O(1), caso somente a

desigualdade superior for satisfeita, então denotamos por f 6 g +O(1).

Sendo E/K uma curva elíptica e f ∈ K(E) não constante, temos que f dene

um morsmo

f : E → P1

P 7→ [1, 0] se f tem pólo em P

P 7→ [f(P ), 1] caso contrário.

Na denição da função altura H, observamos que ela atua de forma multiplica-

tiva, queremos construir uma função altura sobre uma curva elíptica de modo a ter boas

propriedades aditivas.

Denição 3.25. Denimos a altura (logarítmica absoluta) no espaço projetivo como

sendo a função

h : Pn(Q)→ R

P 7→ logH(P ).

Pelo fato de que H(P ) > 1, temos h(P ) > 0 para todo P .

Denição 3.26. Seja E/K uma curva elíptica, f ∈ K(E) não constante. A altura em

E (relativa a f) é a função

hf : E(K)→ R

P 7→ h(f(P )).

66

Sobre essa função temos garantida a condição de nitude para o Teorema da

Descida, dada pelo resultado abaixo.

Proposição 3.27. Seja E/K uma curva elíptica, f ∈ K(E) uma função não constante

e c uma constante. Então o conjunto

P ∈ E(K) : hf (P ) 6 c

é nito.

Demonstração. Como a função f está denida sobre K, ela leva pontos P ∈ E(K) em

pontos de P1(K). Portanto f dene uma correspondência entre os conjuntos

P ∈ E(K) : hf (P ) 6 c → Q ∈ P1(K) : H(Q) 6 ec

P → Q = f(P ).

Visto que o contradomínio dessa função é nito e a pré-imagem de cada um de seus

elementos é nito, então o conjunto P ∈ E(K) : hf (P ) 6 c é nito.

O próximo teorema nos dá uma relação entre as alturas na curva elíptica e sua

lei de grupo.

Teorema 3.28. Seja E/K uma curva elíptica e f ∈ K(E) uma função par não constante

(isto é, f(P ) = f(−P ) para todo P ∈ E(K)). Então, para todo P,Q ∈ E(K) temos

hf (P +Q) + hf (P −Q) = 2hf (P ) + 2hf (Q) +O(1).

Demonstração. Consideremos a equação de Weiertrass da forma

E : y2 = x3 + ax+ b.

Provaremos o teorema para a função f = x, que é uma função par sobre E(K).

Como hx(O) = 0 e hx(P ) = hx(−P ), o resultado é imediato quando P = O ou

Q = O, pois nesse caso teremos

hx(P +Q) + hx(P −Q) = 2hx(P ) + 2hx(Q).

Assim, assumiremos que P,Q 6= O, e denamos

x(P ) = [x1, 1], x(Q) = [x2, 1]

x(P +Q) = [x3, 1], x(P −Q) = [x4, 1].

em que x3 ou x4 valem ∞ caso P = ±Q.

67

Se tivermos P 6= ±Q, P = [x1, y1, 1] e Q = [x2, y2, 1], então pelas expressões

algébricas que encontramos para denotar a soma entre pontos de E, obtemos

x3 = x(P +Q) =

(y2 − y1

x2 − x1

)2

− (x1 + x2)

=y2

2 − 2y1y2 + y21 − x3

2 + x1x2(x1 + x2)

(x2 − x1)2

=(a+ x1x2)(x1 + x2) + 2b− 2y1y2

(x1 + x2)2 − 4x1x2

.

Na última igualdade substituimos y21 e y2

2 por x31 +ax1 + b e x3

2 +ax2 + b, respectivamente.

Agora usando que −Q = [x2,−y2, 1] obtemos um resultado análogo para x(P −Q),

x4 =(a+ x1x2)(x1 + x2) + 2b+ 2y1y2

(x1 + x2)2 − 4x1x2

.

Portanto,

x3 + x4 =2(x1 + x2)(a+ x1x2) + 4b

(x1 + x2)2 − 4x1x2

e x3x4 =(x1x2 − a)2 − 4b(x1 + x2)

(x1 + x2)2 − 4x1x2

.

Agora, denimos o mapa g : P2 → P2, dado por

g([t, u, v]) = [u2 − 4tv, 2u(at+ v) + 4bt2, (v − at)2 − 4btu].

Construimos o seguinte diagrama

onde G(P, P ) = (P +Q,P −Q) e T é a composição das seguintes aplicações

E × E → P1 × P1

(P,Q) 7→ (x(P ), y(P )) = ([α1, β1], [α2, β2])

68

e

P1 × P1 → P2

([α1, β1], [α2, β2]) 7→ [β1β2, α1β2 + α2β1, α1α2].

E assim obtemos T (P,Q) = [1, x1 + x2, x1x2]. As fórmulas que obtivemos para x3 e x4

mostram que esse diagrama é comutativo, visto que

g(T (P,Q)) = g([1, x1 + x2, x1x2])

= [(x1 + x2)2 − 4x1x2, 2(x1 + x2)(a+ x1x2) + 4b, (x1x2 − a)2 − 4b(x1 + x2)]

= [1, x3 + x4, x3x4]

= T (P +Q,P −Q)

= T (G(P,Q)).

Agora mostraremos que g é um morsmo, e para isso precisamos mostrar que os polinô-

mios que denem g não possuem zeros em comum com excessão de quando t = u = v = 0.

Suponha então que g([t, u, v]) = 0.

Se t = 0 então u2 − 4tv = 0 e (v − at)2 − 4btu = 0 implicam que u = v = 0.

Assim, podemos supor que t 6= 0, e denimos x =u

2t.

A partir da equação u2 − 4tv = 0 e de x = u/2t, obtemos x2 = v/t. Assim, se

2u(at+ v) + 4bt2 = 0 e (v − at)2 − 4btu = 0,

fazendo as devidas substituições e dividindo as equações por t2, obteremos um sistema de

equações em x,

ψ(x) = 4x(a+ x2) + 4b = 4(x3 + ac+ b) = 0

e

φ(x) = (x2 − a)2 − 8bx = x4 − 2ax2 − 8bx+ a2 = 0.

Agora para mostrar que ψ e φ não possuem zeros em comum, basta vericar a seguinte

igualdade

(12x2 + 16a)φ(x)− (3x3 − 5ax− 27b)ψ(x) = 4(4a3 + 27b2) 6= 0.

Essa última desigualdade se verica pelo fato que que um dos membros é um múltiplo não

nulo do discriminante da equação de Weierstrass, que é não nulo pelo fato de que a curva

elíptica é suave. Portanto, as funções que denem g não podem ter zeros em comum não

triviais, mostrando que g é um morsmo.

69

Retornando ao diagrama comutativo, obtemos

h(T (P +Q,P −Q)) = h(T G(P,Q))

= h(g T (P,Q))

= 2h(T (P,Q)) +O(1).

Essa última igualdade se deve pelo seguinte fato: Dado que g é um morsmo de grau 2,

pois está denido por polinômios homogêneos de grau 2, existem constantes c1 e c2 tais

que c1H(P )2 6 H(g(P )) 6 c2H(P )2, e usando a denição de h encontraremos log c1 6

h(g(P ))− 2h(P ) 6 log c2, ou seja, h(g(P )) = 2h(P ) +O(1).

Agora para completar a prova do resultado para f = x basta provar que

h(T (R1, R2)) = hx(R1) + hx(R2) +O(1), ∀R1, R2 ∈ E(K),

já que se essa expressão vale, então

hx(P +Q) + hx(P −Q) +O(1) = h(T (P +Q,P −Q))

= 2h(T (P,Q)) +O(1)

= 2hx(P ) + 2hx(Q) +O(1),

de onde obteremos o resultado desejado para f = x.

Observem que se R1 = O ou R2 = O então o resultado vale, dado que

h(T (R1, R2)) = hx(R1) + hx(R2). Supondo então que ambos são diferentes de O, teremos

x(R1) = [α1, 1], x(R2) = [α2, 1],

de onde segue que

h(T (R1, R2)) = h([1, α1 + α2, α1α2]) e hx(R1) + hx(R2) = h(α1) + h(α2).

Usando o polinômio f(t) = (t− α1)(t− α2) obtem-se

2−2H(α1)H(α2) 6 H([1, α1 + α2, α1α2]) 6 2H(α1)H(α2),

e portanto

h(α1) + h(α2)− log 4 6 h([1, α1 + α2, α1α2]) 6 h(α1) + h(α2) + log 2,

ou seja,

h(T (R1, R2)) = hx(R1) + hx(R2) +O(1).

70

A prova para um f arbitrário é consequência do lema seguinte e desse resultado

que obtivemos para x. Na prova do Teorema de Mordell-Weil iremos considerar uma

função par e sua função altura correspondente, e um resultado anterior a ele garantirá

que esta função altura satisfaz as hipóteses do Teorema de Descida. Assim, precisamos

apenas da função x e sua altura associada para a prova do teorema.

Lema 3.29. Sejam f, g ∈ K(E) funções pares. Então

(def g)hf = (deg f)hg +O(1).

Demonstração. Ver (Capítulo 8, Lema 6.3, [Silverman]).

Usando esse lema, o restante do resultado do teorema anterior sai como corolário,

visto que basta usar a igualdade do lema e o resultado do teorema para a função x, e

assim obter o resultado do teorema para uma f par qualquer.

Agora, esse corolário garante que de fato essas funções altura hf para f par,

satisfazem as hipóteses do Teorema de Descida.

Corolário 3.30. Seja E/K uma curva elíptica, f ∈ K(E) uma função par não constante.

(a) Dado Q ∈ E(K). Então

hf (P +Q) 6 2hf (P ) +O(1), para todo P ∈ E(K).

(b) Dado m inteiro positivo, temos

hf ([m]P ) = m2hf (P ) +O(1), para todo P ∈ E(K),

onde O(1) depende de E, f e m.

Demonstração. (a) Dado que hf (P −Q) > 0, então pelo teorema anterior

hf (P +Q) 6 hf (P +Q) + hf (P −Q) = 2hf (P ) + 2hf (Q) +O(1).

(b) Provemos por indução. Para m = 1 o resultado é claro, dado que nesse caso

hf ([1]P ) = hf (P ). Suponhamos por hipótese de indução, que o resultado seja

válido para m− 1 e m, com m > 1, e vejamos que também vale para m+ 1. Temos

que hf ([m+ 1]P ) + hf ([m− 1]P ) = 2hf ([m]P ) + 2hf (P ) +O(1), assim

hf ([m+ 1]P ) = −hf ([m− 1]P ) + 2hf ([m]P ) + 2hf (P ) +O(1)

= (−(m− 1)2 + 2m2 + 2)hf (P ) +O(1) (por hipótese de indução)

= (m+ 1)2hf (P ) +O(1).

71

Obtendo assim o resultado desejado.

Finalmente, estamos em condições de provar o Teorema de Mordell-Weil.

Teorema 3.31 (Mordell-Weil). Seja K um corpo de números e E/K uma curva elíptica.

Então o grupo E(K) é nitamente gerado.

Demonstração. Escolhemos uma função f ∈ K(E) par não constante, podemos pegar

a função coordenada x na equação de Weierstrass reduzida que dene a curva E. Pela

versão fraca do Teorema, para m > 2 os grupos quocientes E(K)/mE(K) são nitos.

Basta tomar m = 2, e usando o Corolário anterior, para esse m e para f , a função

hf : E(K)→ R

satisfaz

(i) Dado Q ∈ E(K). Existe uma constante c1, que depende de E, f e Q, tal que

hf (P +Q) 6 2hf (P ) + c1, ∀P ∈ E(K).

(ii) Existe uma constante c2, dependendo de E e f para a qual

hf ([2]P ) > 22hf (P )− c2, ∀P ∈ E(K).

(iii) Para qualquer constante c3, o conjunto

P ∈ E(K) : hf (P ) 6 c3

é nito.

Pelos resultados anteriores, vimos que essa função hf satisfaz todas essas con-

dições, mostrando que E(K) é nitamente gerado pelo Teorema da Descida. Provando

assim o Teorema de Mordell-Weil.

Pelo que acabamos de provar, o grupo dos pontos K-racionais de uma curva elíp-

tica E/K é nitamente gerado, onde K é um corpo de números. Sendo assim, podemos

decompor esse grupo em uma soma direta entre o seu subgrupo de torção e um número

nito de cópias de Z. O número de cópias de Z que aparecem nessa decomposição é um

invariante da curva elíptica, o qual é um importante personagem na Conjectura de Birch

e Swinnerton-Dyer, sobre a qual falaremos no próximo capítulo.

72

Geometricamente, o Teorema de Mordell-Weil diz que existe um conjunto nito

de pontos K-racionais com os quais podemos obter todos os demais pontos K-racionais

utilizando do processo de corda-tangente, que é o nome dado ao processo utilizado na

denição da lei de grupo da curva elíptica.

Um outro resultado sobre classicação do conjunto dos pontos K-racionais de

curvas algébricas projetivas e suaves, denidas sobre corpos de números K, é o chamado

Teorema de Faltings. Esse teorema diz que se a curva tiver gênero maior ou igual a 2,

então o conjunto de seus pontos K-racionais é nito. Esse resultado foi conjecturado

por Mordell e provado por Faltings em 1983, o que contribuiu para que fosse agraciado

com uma Medalha Fields em 1986. Esse teorema, junto ao Teorema de Mordell-Weil nos

possibilita fazer um quadro sobre a estrutura do conjunto desses pontos K-racionais.

Gênero de C Estrutura de C(K)

g = 0 C(K) = ∅ ou C(K) é innito.

g = 1 C(K) é abeliano nitamente gerando, podendo ser nito ou innito(Mordell-Weil).

g > 2 C(K) é nito (Faltings).

Capítulo 4

A Conjectura de Birch e

Swinnerton-Dyer (BSD) e o Problema

dos Números Congruentes (PNC)

Como vimos no Capítulo 3, se K é um corpo de números e E/K é uma curva

elíptica, então o conjunto de seus pontos K-racionais, chamado grupo de Mordell-Weil

de E/K, é um grupo abeliano nitamente gerado.

Sendo assim, pelo teorema de classicação dos grupos abelianos nitamente ge-

rados, podemos escrever

E(K) ∼= E(K)tor ⊕ Zr,

em que E(K)tor é o subgrupo de torção, que é o subgrupo dos pontos de ordem nita e r

é um inteiro não negativo, que é um invariante da curva. A este invariante r chamaremos

o posto algébrico da curva elíptica.

Já sabíamos que

E(K)tor =⋃m>1

E[m](K),

e que cada um dos E[m] é nito, mas essa união a princípio poderia ser innita. Mas

depois de provado o Teorema de Mordell-Weil, temos que essa união também é nita,

visto que o subgrupo de torção de um grupo abeliano nitamente gerado é nito. Sobre

o subgrupo de torção de E(K), Barry Mazur provou que se E/Q é uma curva elíptica,

então E(Q)tor é isomorfo a um dos seguintes grupos

Z/nZ, com 1 ≤ n ≤ 10 ou n = 12;

Z/2Z⊕ Z/2nZ, com 1 ≤ n ≤ 4.

Assim, temos uma classicação para os subgrupos de torção de curvas elípticas racionais.

Daqui em diante nos concentraremos em estudar algumas questões sobre curvas

73

74

elípticas racionais. Como o Teorema de Mazur classica a parte de torção do grupo

de Mordell-Weil, podemos também nos perguntar sobre as possibilidades para o posto

algébrico da curva elíptica. Calcular o posto de uma curva eliptica em geral é um problema

difícil, e sobre isso, em 1965, B. J. Birch e Sir H. P. F. Swinnerton-Dyer conjecturaram

que o posto algébrico de uma curva elíptica racional seria igual a um outro invariante,

agora analítico, relacionado a L-série da curva, que deniremos na próxima seção, onde

falaremos a respeito da Conjectura de Birch e Swinnerton-Dyer.

O estudo da aritmética das curvas elípticas tem possibilitado um grande avanço

em várias áreas não apenas da matemática pura assim como suas aplicações, em cripto-

graa por exemplo. É de interesse em Geometria Aritmética, usar das ferramentas da

Geometria Algébrica para obter respostas sobre questões aritméticas. Um bom exemplo

do uso dessa teoria para m de responder questões aritméticas é o famoso Último Te-

orema de Fermat, que foi provado depois de toda uma linguagem e ferramentas terem

sido criadas para provar a Conjectura de Taniyama-Shimura, provada por Andrew Wiles

e Richard Taylor em 1995. A Conjectura de Fermat é corolário do que hoje é conhecido

como Teorema da Modularidade (Ver [Wiles2]).

Neste Capítulo, além de falar da Conjectura de Birch e Swinnerton-Dyer (B.S.D),

estudaremos também o Problema dos Números Congruentes, e como esse problema está

relacionado com curvas elípticas e com a conjectura B.S.D.

4.1 A Conjectura de Birch e Swinnerton-Dyer

A m de enunciar a Conjectura de Birch e Swinnerton-Dyer precisamos de algu-

mas denições e notações.

Denição 4.1 (L-série). Uma L-série é uma série da forma

L(s) =∑n>1

bnns,

onde bn ∈ C.

Agora consideremos uma curva elíptica E/Q com equação de Weiertrass reduzida

E : y2 = x3 + ax+ b,

com a, b ∈ Z e ∆ seu discriminante.

Para cada p primo, consideremos a redução módulo p,

Z→ Fpz 7→ z,

75

onde Fp = Z/pZ é o corpo primo de característica p.

Podemos considerar a redução módulo p da curva E, ou seja,

Ep : y2 = x3 + ax+ b.

Temos que a curva reduzida Ep é suave se, e somente se, p não divide ∆. Pois

assim teremos

vp(∆) = ordp(∆) = 0.

Dado que Fp é nito, o conjunto Ep(Fp) dos pontos Fp-racionais de Ep é nito.

Com isso podemos denir

ap = p+ 1− |Ep(Fp)|.

Agora denimos a L-série de uma curva E/Q via um produto de Euler.

Denição 4.2 (L-série de uma curva elíptica). Seja E/Q curva elíptica. Sua L-série é

denida pelo produto de Euler

L(E, s) =∏p | ∆

1

1− app−s∏p - ∆

1

1− app−s + p1−2s,

com s ∈ C.

Observemos que denimos L(E, s) como um produto innito. Para obtermos

uma série innita considere a função

i(p) = 1, caso p - ∆

i(p) = 0, caso p | ∆,

e a seguinte sequência denida recursivamente.

b1 = 1

bp = ap, p primo

bpm = bp · bpm−1 − i(p)p · bpm−2 , m > 2

brs = br · bs, se mdc(r, s) = 1.

Assim, se tomarmos L(s) =∑

n>1

bnns, temos o seguinte resultado.

Proposição 4.3. L(E, s) = L(s).

Demonstração. Temos que

bpm · p−ms = bp · bpm−1 · p−ms − i(p)p · bpm−2 · p−ms, m > 2

76

∑m>2

bpm · p−ms =∑m>2

bp · bpm−1 · p−ms − i(p)p∑m>2

bpm−2 · p−ms

= bpp−s∑m>1

bpm · p−ms − i(p)p1−2s∑m>0

bpm · p−ms

∑m>2

bpm · p−ms(1− bpp−s + i(p)p1−2s) = b2p · p−2s − i(p)b1 · p1−2s − i(p)bp · p1−3s.

E ∑m>0

bpm · p−ms(1− bpp−s + i(p)p1−2s) = b2p · p−2s − i(p)b1 · p1−2s − i(p)bp · p1−3s

+ bp · p−s − b2p · p−2s + i(p)bp · p1−3s

+ b1 − b1 · bp · p−s + i(p)b1 · p1−2s

= b1 + (1− b1)bp · p−s.

Como b1 = 1, então ∑m>0

bpm · p−ms(1− bpp−s + i(p)p1−2s) = 1.

Assim, ∑m>0

bpm · p−ms =1

(1− bpp−s + i(p)p1−2s).

Portanto

L(E, s) =∏p

1

(1− bpp−s + i(p)p1−2s)(já que bp = ap)

=∏p

(∑m>0

bpm · p−ms)

=∑n>1

bnns

= L(s).

Agora sendo L(E, s) =∑

n>1 bnn−s e s = α + iβ, temos∑

n>1

|bnn−s| =∑n>1

|bn||n−s| =∑n>1

|bn| · |e−α logn| · |e−iβ logn|.

77

Como n é um real positivo, então

|e−iβ logn| = 1,

de modo que a convergência da L-série só depende da parte real de s. Além disso, se

α1 = Re(s1) > Re(s2) = α2,

então

|e−α1 logn| < |e−α2 logn|.

Assim, se a L-série converge para s = s2 então converge para s = s1.

A série L(E, s) converge no semiplano complexo determinado por Re(s) >3

2. Na

prova desse fato, é usado o Teorema de Hasse para dar uma estimativa para os termos do

produto que dene L(E, s). Logo abaixo enunciamos o Teorema de Hasse e provamos a

convergência da série na região em questão.

Teorema 4.4 (Hasse). Dado p primo temos

|ap| 6 2√p.

Demonstração. Ver (Capítulo 5, Teorema 1.1, [Silverman]).

Proposição 4.5. A série L(E, s) converge se Re(s) >3

2.

Demonstração. Para efeito de mostrar a convergência, podemos supor que os fatores

dados por1

1− app−s(que aparecem apenas um número nito de vezes) são da forma

1

1− app−s + p1−2s, de modo que a partir da recorrência

b1 = 1

bp = ap, p primo

bpm = bp · bpm−1 − p · bpm−2 , m > 2

brs = br · bs, se mdc(r, s) = 1.

obtemos a L-serie

L(s) =∑n>1

bnns

=∏p

1

1− app−s + p1−2s.

Mostraremos que L(s) converge para Re(s) >3

2.

78

Seja p primo e consideremos

1− bpz + pz2 = (1− αpz)(1− βpz),

com αp, βp ∈ C. Temos que αp + βp = bp e αpβp = p.

Consideremos então, a série de Taylor dada por

1

1− bpz + pz2=∑n>0

cnzn.

Iremos encontrar os coecientes cn. Nesse momento precisaremos usar que αp 6= βp, mas

provaremos isso mais adiante. Temos

1

1− bpz + pz2=

1

(1− αpz)(1− βpz)

=

(αp

αp − βp

)1− αpz

(βp

αp − βp

)1− βpz

=αp

αp − βp·∑n>0

αnpzn − βp

αp − βp·∑n>0

βnp zn

=∑n>0

αn+1p − βn+1

p

αp − βp· zn.

Portanto,

cn =αn+1p − βn+1

p

αp − βp, ∀ n > 0.

Agora, como cn =αn+1p − βn+1

p

αp − βp, então

cn+1 =αn+2p − βn+2

p

αp − βp

=(αn+1

p − βn+1p ) · (αp + βp)− αn+1

p βp + αpβn+1p

αp − βp

= (αp + βp) ·(αn+1p − βn+1

p

αp − βp

)− αpβp ·

(αnp − βnpαp − βp

)= bp · cn − p · cn−1, ∀ n > 1.

79

Daí,

c0 = 1

c1 = αp + βp = bp

c2 = bp · bp − p · 1 = bp2 .

De modo que pela recorrência acima e pela recorrência que dene os bpk , obtemos

bpn = cn =αn+1p − βn+1

p

αp − βp=

n∑i=0

αipβn−ip .

Agora iremos mostrar que |αp| = |βp| =√p. Com efeito, pelo Teorema de Hasse,

|bp| = |ap| 6 2√p, então |bp| < 2

√p (pois bp é inteiro). Portanto, b2

p − 4p < 0.

Como o discriminante da equação 1 − bpz + pz2 = 0 é b2p − 4p < 0, então as

duas raízes1

αpe

1

βpda equação formam um par de complexos não reais e conjugados, em

particular αp 6= βp. Portanto, |1

αp| = | 1

βp|. Assim, |αp| = |βp|.

Como αp · βp = p, então |αp|2 = |αp · βp| = p e |αp| = |βp| =√p. De modo que

|bpn| 6n∑i=0

|αipβn−1p | =

n∑i=0

pn/2 = (n+ 1)pn/2.

Agora seja n = pk11 · · · pkmm . Temos que bn = bpk11· · · bpkmm , de onde segue que

|bn| = |bpk11 | · · · |bpkmm |

6 (k1 + 1)pk1/21 · · · (km + 1)pkm/2m

=m∏i=1

(ki + 1)pki/2i

= d(n) · n1/2,

onde d(n) é o número de divisores positivos de n.

Para nalizar a demonstração, usaremos o fato de que a função Zeta de Riemann,

ζ(s) =∑

k>1

1

ks, está denida para todo s com Re(s) > 1.

80

Sendo α = Re(s), temos

∑n>1

|bn · n−s| =∑n>1

|bn| · n−α =∑n>1

|bn|nα

6∑n>1

d(n) · n1/2

nα=∑n>1

d(n)

nα−1/2=∑n>1

d(n)

nβ.

Agora, como

∑n>1

d(n)

nβ=∑n>1

1

∑k|n

1

=∑n>1

(∑km=n

1

kβ· 1

)

=∑k>1

∑m>1

1

kβ· 1

=

(∑k>1

1

(∑m>1

1

)= ζ(β)2,

que existe para β > 1. Então∑

n>1

d(n)

nβconverge se β > 1. Portanto,

∑n>1

bnns

converge

se Re(s)− 1

2= α− 1

2= β > 1, isto é, se Re(s) >

3

2.

A conjectura de Birch e Swinnerton-Dyer é um problema que diz respeito à ordem

da L−série em s = 1. Na época em que o problema foi formulado, era conhecido que

certas famílias de curvas elípticas tinham continuação analítica a todo plano complexo.

Atualmente, sabe-se que para todas as curvas racionais, L(E, s) tem continuação analítica

a todo plano complexo. Esse fato é consequência do Teorema da Modularidade, e para

detalhes a esse respeito citamos a referência [Wiles2].

A versão da conjectura que enunciaremos aqui é conhecida por alguns como a

versão fraca da Conjectura de Birch e Swinnerto-Dyer, visto que existe um complemento

à essa conjectura que precisaria de muito mais do que foi exposto até aqui para que fosse

enunciada.

Conjectura 4.6 (B.S.D - versão fraca). Se r é o posto algébrico de E/Q, então L(E, s)

tem um zero de ordem r em s = 1, ou seja, a expansão de Taylor de L(E, s) em torno de

s = 1 tem a forma

L(E, s) = cr(s− 1)r + cr+1(s− 1)r+1 + termos de graus maiores,

81

em que cr 6= 0.

A partir da série de Taylor acima, denimos o posto analítico de E como sendo

a ordem de L(E, s) em s = 1. Portanto, a conjectura diz que os postos algébrico e analí-

tico de E/Q coincidem.

Desde que esse problema foi formulado, alguns resultados parciais foram encon-

trados, mas até hoje o problema em si contínua em aberto, sendo que em 2000 o Clay

Mathematics Institute o listou como um dos Problemas do Milênio.

Com o acúmulo de alguns avanços na direção da prova desta conjectura, chegou-se

atualmente ao seguinte resultado.

Teorema 4.7 (Kolyvagin). A versão fraca da Conjectura B.S.D vale para curvas com

posto analítico 0 ou 1.

Na próxima seção, enunciamos o Problema dos Números Congruentes e mostra-

mos qual a sua relação com as curvas elípticas e com a conjectura B.S.D.

4.2 O Problema dos Números Congruentes

Nesta seção falaremos sobre os números congruentes, sua relação com as curvas

elípticas e com a conjectura B.S.D. Mas anal o que é um número congruente?

Um número congruente é um número racional que é igual à medida da área

de um triângulo retângulo com todos os lados racionais, ou seja, n ∈ Q é congruente se

existem a, b, c ∈ Q positivos, tais que a2 + b2 = c2 eab

2= n. O estudo dos números

congruentes remonta aos gregos e que mais a frente foi sistematizada pelos árabes.

Exemplo 4.8. Como

(20

3

)2

+

(3

2

)2

=

(41

6

)2

, 32 + 42 = 52 e

(24

5

)2

+

(35

12

)2

=(337

60

)2

, e 5, 6 e 7 são as respectivas medidas das áreas dos triângulos retângulos associ-

ados à essas triplas pitagóricas racionais, temos que 5, 6 e 7 são números congruentes.

O fato de que 7 é congruente foi provado por Euler. Fermat provou em 1640, que

o número 1 não é congruente.

Proposição 4.9. 1 não é congruente.

Demonstração. Suponhamos por absurdo que 1 seja congruente, ou seja, que existam ra-

cionais a/d, b/d, c/d tais que a2 + b2 = c2 e ab = 2d2, com todos os inteiros a, b, c e d

positivos. Mostraremos que esse sistema de equações não possui solução inteira.

82

Considere e = mdc(a, b). Como e | a, e | b então e2 | c2 e e2 | 2d2, portanto

e | c e e | d. Para ver isso basta olhar a fatoração de e, c e d em fatores primos. Se

e = pm11 · · · p

mkk , c = pn1

1 · · · pnkk e d = pl11 · · · p

lkk então

2mi 6 2ni, i = 1, . . . , k,

e assim mi 6 ni, mostrando que e | c. Agora se todos os pi forem ímpares, usando o

mesmo argumento teremos que e | d, mas se por exemplo p1 = 2, temos 2m1 6 1 + 2l1,

daí m1 6 l1 já que ambos são inteiros, e portanto e | d. Portanto, podemos supor a exis-

tência da solução inteira, com mdc(a, b) = 1, bastando para isso dividir todos os termos

da solução original por e.

Dado que ab = 2d2 e a e b são primos entre si, então a ou b é par, mas não ao

mesmo tempo. Portanto, a2 + b2 = c2 é ímpar, implicando que c é ímpar. Como ab é

o dobro de um quadrado e ambos não possuem divisores primos em comum, então um

deles é um quadrado e o outro é o dobro de um quadrado. Podemos assumir sem perda

de generalidade que

a = 2k2 e b = l2,

onde k e l são inteiros, sendo l ímpar. Substituindo o valor de a na primeira equação

encontramos

4k2 + b2 = c2,

de ondec+ b

2· c− b

2= k4.

Como b e c são ambos ímpares e relativamente primos, então c+b2

e c−b2

são relativamente

primos. Portanto,c+ b

2= r4 e

c− b2

= s4,

para r e s inteiros positivos relativamente primos. Dessas duas últimas equações tiramos

b = r4 − s4 e c = r4 + s4,

de onde

l2 = b = (r2 + s2)(r2 − s2).

Agora, como l é ímpar, qualquer fator em comum entre r2 + s2 e r2 − s2 teria

que ser primo e teria que dividir a soma 2r2 e a diferença 2s2, sendo portanto um fator

de mdc(r2, s2) = 1. Assim, r2 + s2 e r2 − s2 são relativamente primos. Portanto, como

o produto entre r2 + s2 e r2 − s2 é um quadrado ímpar, cada um deles também é um

83

quadrado ímpar, isto é,

r2 + s2 = t2 e r2 − s2 = u2,

em que t e u são ímpares relativamente primos. Portanto r2− s2 = u2 ≡ 1(mod 4), o que

força r ser ímpar e s ser par, pois caso contrário teríamos a congruência −1 ≡ 1(mod 4)

que não é verdadeira. Temos

r2 =t2 + u2

2=

(t+ u

2

)2

+

(t− u

2

)2

,

onde t+ u, t− u são inteiros, visto que t e u são ímpares.

Finalmente, tomando

a′ =t+ u

2, b′ =

t− u2

e c′ = r,

temos

a′2 + b′2 = c′2.

Do fato de que mdc(t, u) = 1, temos mdc(a′, b′) = 1. Mais do que isso,

a′b′ =t2 − u2

4=

2s2

4= 2

(s2

)2

,

com s/2 inteiro. Mostrando que (a′, b′, c′, d′) também é solução para a nossa primira

equação. Mas como 0 < c′ = r 6 r4 < r4+s4 = c, podemos aplicar o mesmo procedimento

e encontrar uma sequência de soluções inteiras (an, bn, cn, dn) tais que 0 < · · · < cn+1 <

cn < · · · < c, o que é claramente contradição. Portanto, não existe solução inteira para a

primeira equação considerada, mostrando que 1 não é congruente.

Agora observem que se q é congruente, com q =xy

2e x2 + y2 = z2, então

tomando ax, ay, az temos que a2q =ax · ay

2. Portanto, sendo Q2 o conjunto dos racionais

quadrados não nulos, isto é, Q2 = q2 : q ∈ Q− 0, podemos denir a relação

x ∼ y ⇔ ∃ q ∈ Q2, x = qy.

Essa é uma relação de equivalência, em que toda classe de equivalência tem um represen-

tante inteiro e livre de quadrados, de modo que se um elemento da classe é congruente,

então todos o são. Desse modo, podemos nos preocupar apenas com os inteiros livres

de quadrados. Portanto podemos nos perguntar quando um inteiro é ou não um número

congruente, e esse é conhecido como o Problema dos Números Congruentes: Encontrar

um algoritmo para determinar quando um inteiro positivo n é ou não congruente.

84

O nosso principal objetivo é chegar ao seguinte resultado, que relaciona o pro-

blema de determinar se um inteiro n é congruente com uma certa família de curvas

elípticas.

Teorema 4.10. Se n é um inteiro positivo, então n é congruente se, e somente se, a

curva elíptica

En : y2 = x3 − n2x,

tem posto algébrico positivo.

Daqui em diante, iremos supor a < b < c quando nos referirmos à tripla (a, b, c).

Proposição 4.11. Seja n > 1 um inteiro livre de quadrados. Sejam 0 < a < b < c

racionais. Então existe uma bijeção entre os conjuntos

(a, b, c) : a2 + b2 = c2, 2n = ab e d ∈ Q : d, d+ n, d− n ∈ Q2,

dada por

(a, b, c) 7→ d = (c/2)2,

cuja inversa é

d 7→ (√d+ n−

√d− n,

√d+ n+

√d− n, 2

√d).

Demonstração. Se a2 + b2 = c2 e 2n = ab, então

(a± b)2 = c2 ± 2ab = c2 ± 4n.

Logo, (a± b

2

)2

= (c/2)2 ± n.

Tomando d = (c/2)2, obtemos

d, d+ n, d− n ∈ Q2.

Reciprocamente, se tivermos d, d + n, d − n ∈ Q2 então a =√d+ n −

√d− n, b =

√d+ n+

√d− n e c = 2

√d satisfazem

a < b < c e a2 + b2 = c2.

Mais do que isso, de fato uma aplicação é inversa da outra

d 7→ (√d+ n−

√d− n,

√d+ n+

√d− n, 2

√d) 7→ d.

85

Como consequência dessa proposição, temos que n é congruente se, e somente se,

existe um racional d tal que d, d+ n, d− n ∈ Q2.

Proposição 4.12. Seja (a, b) ∈ Q × Q uma solução da equação y2 = x3 − n2x tal que

a ∈ Q2 tenha denominador par. Então, existe um triângulo retângulo de área n e lados

√a+ n−

√a− n,

√a+ n+

√a− n, 2

√a.

Demonstração. Seja u =√a ∈ Q, u > 0 e v =

b

u. Então

v2 =b2

u2=b2

a= a2 − n2,

já que (a, b) é solução da equação y2 = x3 − n2x.

Agora, seja t o denominador de u na sua forma reduzida. Assim,

(t2v)2 + (t2n)2 = t4v2 + t4u2 = (t2a)2,

e portanto (t2v, t2n, t2a) é uma tripla pitagórica com t2n par e mdc(t2v, t2n, t2a) = 1.

Como t2n é par, então t2v e t2a são ímpares. Sejam A,B,C > 0 inteiros tais que

t2n = 2C, t2a+ t2v = 2A, t2a− t2v = 2B.

Obtemos, mdc(A,B) = 1 e AB = C2. Portanto, existem inteiros α, β > 0 tais que

A = α2, B = β2.

De onde temos

t2a = A+B = α2 + β2

t2v = A−B = α2 − β2

(t2n)2 = (t2v)2 − (t2a)2 = (2αβ)2.

Portanto, t2n = 2αβ. De onde tiramos que o triângulo retângulo de lados(2α

t,2β

t, 2u

)

tem área2αβ

t2= n.

86

Pela proposição anterior, essa tripla está associada a

d =

(2u

2

)2

= u2 = a.

Mostrando que existe um triângulo retângulo de lados

√a+ n−

√a− n,

√a+ n+

√a− n, 2

√a

e área n. Visto que√a+ n−

√a− n =

t,

√a+ n+

√a− n =

t, e

2√a = 2u.

Agora mais alguns resultados para então provarmos o Teorema objetivo desta

seção.

Proposição 4.13. Considere a aplicação de redução

P2(Q)→ P2(Fp)

P = [a, b, c] 7→ P = [a, b, c],

onde a, b, c ∈ Z e mdc(a, b, c) = 1. Então P1 = P2 se, e somente se, p divide simultanea-

mente (b1c2 − b2c1), (a1b2 − a2b1) e (a1c2 − a2c1).

Demonstração. Vemos que P1 = P2 se, e somente se, os vetores (a1, b1, c1) e (a2, b2, c2)

são Fp-linearmente dependentes, que é equivalente a p dividir simultaneamente os três

números na proposição.

Proposição 4.14. Se p ≡ 3(mod 4) e p não divide n, então |En(Fp)| = p+ 1.

Demonstração. Primeiramente observamos que os pontos [0, 0, 1], [n, 0, 1], [−n, 0, 1] e Osão pontos distintos de En(Fp). Assim, falta contar a quantidade de pontos (x, y) ∈ En(Fp)tais que x 6= 0,±n. Ao todo temos p − 3 elementos em Fp distintos de 0,±n. Pelo fato

de que p ≡ 3(mod 4) e que f(x) = x3 − n2x é função ímpar, então um e somente um

entre f(x) e f(−x) = −f(x) é quadrado módulo p. Seja qual for o caso, teremos que um

e somente um entre (x,±f(x)1/2) e (−x,±f(−x)1/2) serão pares de pontos em En(Fp).Portanto, |En(Fp)| = p− 3 + 4 = p+ 1.

Temos mais o seguinte resultado sobre as curvas En.

87

Proposição 4.15. |En(Q)tor| = 4.

Demonstração. Temos que os seguintes pontos estão em En(Q)tor: O, [0, 0, 1], [n, 0, 1] e

[−n, 0, 1]. Sendo que esses três últimos tem ordem 2.

Sendo assim, temos que |En(Q)tor| > 4. Suponhamos que não vale a igualdade,

isto é, |En(Q)tor| > 4. Portanto, existe um elemento Q de ordem N > 2. Portanto, N é

ímpar ou existe um ponto P de ordem exatamente 4.

No primeiro caso, considere S o subgrupo gerado por Q. Já no segundo caso,

pelo menos um dos elementos dentre os três de ordem 2 que citamos acima, não estão no

subgrupo gerado por P . Suponha que esse elemento de ordem 2 seja R. Assim, para esse

caso consideramos S o produto dos subgrupos gerados por P e R. Logo S ∼= Z/2Z×Z/4Z.Para ambos os casos, seja S = P1, . . . , Pm com m = N ou m = 8.

Para cada i, j ∈ 1, . . . ,m, seja Pi = [xi, yi, zi] com xi, yi, zi ∈ Z emdc(xi, yi, zi) =

1 e dena

Pi × Pj = (yizj − yjzi, xjzi − xizj, xiyj − xjyi) ∈ R3.

Caso Pi 6= Pj, então Pi × Pj 6= 0. Portanto consideramos mij o mdc das coorde-

nadas de Pi × Pj. Pela Proposição 4.13, para p primo, Pi = Pj se, e somente se, p|mij.

Agora seja p > 2 primo que não divide m e tal que p > mij. Portanto, Pi 6= Pj.

Em particular, S é isomorfo à um subgrupo de En(Fp). De modo que para quase todos

os primos p, m divide |En(Fp)|, ou seja, para todos primos maiores que um certo número

tem-se que m divide |En(Fp)|.

Agora, pela proposição anterior, se p ≡ 3 (mod 4) então |En(Fp)| = p + 1, de

modo que p ≡ −1(mod m) para quase todo p que é côngruo a 3 módulo 4.

Mas pelo Teorema das progressões aritméticas de Dirichlet, dados r, s 6= 0 tais

que mdc(r, s) = 1, exitem innitos primos da forma rd+ s com d > 1. Assim, para o caso

em que m = 8 basta tomarmos r = 8 e s = 3 que teremos a existência de innitos primos

p da forma 8d+ 3, ou seja, innitos primos tais que

p = 8d+ 3 6≡ −1 (mod 8).

Já para o caso em que m é ímpar e 3 não divide m, basta tomarmos r = 4m e

s = 3 onde teremos a existência de innitos primos p a forma 4md + 3, ou seja, innitos

primos tais que

p = 4md+ 3 6≡ −1 (mod m).

88

Por último, se m é ímpar e 3 divide m, tomamos r = 12 e s = 7, de modo que existem

innitos primos da forma 12d+ 7, que nesse caso satisfazem

p = 12d+ 7 6≡ −1 (mod m).

Observem que em todos esses casos, os primos são tais que p ≡ 3 (mod 4). Portanto a

conclusão de que p ≡ −1(mod m) para quase todo p primo com p côngruo a 3 módulo 4

entra em contradição com o Teorema das progressões aritméticas de Dirichlet. De modo

que tais pontos Q ou P não podem existir, mostrando que |En(Q)tor| = 4.

Finalmente iremos provar o seguinte resultado.

Teorema 4.16. Um número inteiro n > 0 é congruente, se e somente se, o posto de

En(Q) é positivo.

Demonstração. Suponhamos que n seja congruente e livre de quadrados, e seja (a, b) ∈En(Q) da forma

a =(z

2

)2

e b =z

2· (x2 − y2)

4,

tais que 0 < x < y < z, x2 + y2 = z2 e 2n = xy.

Neste caso, temos que a ∈ Q2 com denominador par. Se (a, b) tivesse ordem nita,

então pelo teorema anterior, (a, b) precisaria ser um dos elementos de ordem 2. Sendo

assim, sua primeira coordenada deveria ser 0,−n, ou n. Como n é livre de quadrados,

então 0,−n, n 6∈ Q2. De modo que (a, b) precisa ser um elemento de ordem innita, e pelo

Teorema de Mordell-Weil isso signica que o posto algébrico de En(Q) é pelo menos 1.

Reciprocamente, dado P ∈ En(Q) de ordem innita então pela fórmula de dupli-

cação

a = x([2]P ) =x4 − 2nx2 + n2

(2y)2.

E como o número a satisfaz as hipóteses da Proposição 4.12, n é congruente.

Esse resultado nos diz que para decidir se um dado inteiro positivo n é congruente

é suciente saber se o posto da curva En(Q) é positivo, que equivale a saber se este grupo

é innito.

Enunciaremos agora um teorema que dá condições necessárias para determinar

quando um número n livre de quadrados é congruente, e que se Conjectura de Birch e

Swinnerton-Dyer for vericada ao menos para as curvas En, então a condição do teorema

é suciente. Segue o Teorema.

Teorema 4.17 (Teorema de Tunnell). Seja n um inteiro positivo livre de quadrados.

Dena

An = #(x, y, z) ∈ Z3 : n = 2x2 + y2 + 8z2,

89

Bn = #(x, y, z) ∈ Z3 : n = 2x2 + y2 + 32z2,

Cn = #(x, y, z) ∈ Z3 : n = 8x2 + 2y2 + 16z2,

Dn = #(x, y, z) ∈ Z3 : n = 8x2 + 2y2 + 64z2.

Se n é ímpar e um número congruente, então An = 2Bn. Se n é par e congruente, então

Cn = 2Dn. Por outro lado, se a versão fraca de BSD vale para En, então se n é ímpar e

An = 2Bn ou se n é par e Cn = 2Dn, então n é congruente.

Assim, se a versão fraca da Conjectura BSD for vericada, então para decidir se

um inteiro positivo livre de quadrados é congruente, basta vericar as igualdades entre as

cardinalidades dos conjuntos denidos no teorema, cada um dos quais é claramente nito.

Na prova do Teorema de Tunnell, são usados muitos resultados sobre formas

modulares que não serão vistos aqui, mas que podem ser encontrados em [Koblitz]. No

que segue, falaremos de forma resumida sobre a conexão existente entre a Conjectura BSD

e os coecientes An, Bn, Cn e Dn, denidos no Teorema de Tunnell. Começamos falando

a respeito de um resultado de 1977 devido ao A. Wiles e J. Coates, que diz que para uma

certa família de curvas elípticas racionais, tem-se um resultado parcial para a Conjectura

BSD. O resultado garante que para curvas elípticas racionais E/Q com multiplicação

complexa, se E tem innitos pontos racionais então sua L-série avaliada em 1 é igual a 0,

ou seja, se r > 0 então L(E, 1) = 0.

Agora, sendo n um inteiro positivo livre de quadrados, Tunnell provou que se n for

ímpar (respectivamente par) então L(En, 1) = 0 se, e somente se, αn = 0 (respectivamente

α′n/2 = 0), onde En : y2 = x3 − n2x e quando k é ímpar, αk (respectivamente α′k) é o

k-ésimo coeciente da série∑x,y,z∈Z

q2x2+y2+32z2 − 1

2

∑x,y,z∈Z

q2x2+y2+8z2 (respectivamente

∑x,y,z∈Z

q4x2+y2+32z2 − 1

2

∑x,y,z∈Z

q4x2+y2+8z2 ).

Uma outra coisa que se sabe sobre as curvas elípticas En é que estas tem multi-

plicação complexa, e assim sendo, chamando de rn o posto algébrico de En(Q) tem-se o

seguinte

n é congruente ⇐⇒ rn > 0 =⇒ L(En, 1) = 0.

Agora, se n for ímpar e congruente, temos L(En, 1) = 0 e portanto,

90

0 = αn

= #(x, y, z) ∈ Z3 : n = 2x2 + y2 + 32z2 − 1

2·#(x, y, z) ∈ Z3 : n = 2x2 + y2 + 8z2

= Bn −An2

=⇒ An = 2Bn.

Agora, se n for par e congruente, temos que n = 2k onde k é ímpar (já que n é

livre de quadrados), portanto L(En, 1) = 0 e α′k = α′n/2 = 0, daí

0 = α′k

= #(x, y, z) ∈ Z3 : k = 4x2 + y2 + 32z2 − 1

2·#(x, y, z) ∈ Z3 : k = 4x2 + y2 + 8z2

= #(x, y, z) ∈ Z3 : n = 8x2 + 2y2 + 64z2 − 1

2·#(x, y, z) ∈ Z3 : n = 8x2 + 2y2 + 16z2

= Dn −Cn2

=⇒ Cn = 2Dn.

E agora, vejamos a recíproca supondo a validade da Conjectura BSD.

Supondo que BSD vale para as curvas En, temos que

rn > 0⇔ L(En, 1) = 0.

Se n for ímpar e An = 2Bn, então αn = 0 e consequentemente L(En, 1) = 0, de

onde concluimos que n é congruente.

Agora, se n for par e Cn = 2Dn, então α′n/2 = 0 (n/2 é ímpar nesse caso) e

consequentemente L(En, 1) = 0 e portanto n é congruente. Assim, acabamos de mostrar

como os coecientes An, Bn, Cn e Dn aparecem no Teorema de Tunnell, e como estão

relacionados com a Conjectura BSD.

Usando o Teorema de Tunnell e supondo verdadeira a Conjectura BSD tem-se o

seguinte resultado.

Proposição 4.18. Se n ≡ 5, 6 ou 7 (mod 8) e a Conjectura BSD vale para En, então n

é congruente.

Demonstração. Se n ≡ 5 ou 7 (mod 8), então n é ímpar. Dado um inteiro k, temos que

k2 ≡ 0, 1, ou 4 (mod 8), de modo que

2x2 + y2 + 8z2 ≡ 2x2 + y2 + 32z2 ≡ 2x2 + y2 ≡ 0, 1, 2, 3, 4 ou 6 (mod 8).

Portanto, as equações 2x2 + y2 + 8z2 = n e 2x2 + y2 + 32z2 = n não possuem solução

inteira, de modo que An = 0 = 2Bn.

91

Agora, se n ≡ 6 (mod 8), então n é par e

8x2 + 2y2 + 16z2 ≡ 8x2 + 2y2 + 64z2 ≡ 2y2 ≡ 0 ou 2 (mod 8),

mostrando que as equações 8x2 + 2y2 + 16z2 = n e 8x2 + 2y2 + 64z2 = n não possuem

solução inteira, portanto, Cn = 0 = 2Dn.

Supondo a validade da Conjectura BSD para En com n ≡ 5, 6 ou 7 (mod 8), pelo

Teorema de Tunnell, n é congruente.

Cabe observar que, pelo Teorema de Tunnell, não precisamos supor a validade da

Conjectura BSD para determinar quando um inteiro positivo n livre de quadrados NÃO

é congruente, e com isso, nalizaremos usando o critério de Tunnell para vericar que os

números 1, 2, 3 e 10 não são congruentes.

• n = 1, E1 : y2 = x3 − x. Como 1 é ímpar, basta vericarmos que A1 6= 2B1. Com

efeito, sendo A1 = #(x, y, z) ∈ Z3 : 2x2 + y2 + 8z2 = 1 e B1 = #(x, y, z) ∈Z3 : 2x2 + y2 + 32z2 = 1, e como as únicas soluções inteiras para as equações

2x2 + y2 + 8z2 = 1 e 2x2 + y2 + 32z2 = 1 são (0,±1, 0) e (0,±1, 0) respectivamente,

então

A1 = 2 6= 4 = 2B1.

Mostrando novamente que 1 não é congruente.

• n = 2, E2 : y2 = x3 − 4x. Como as únicas soluções inteiras para as equações

8x2+2y2+16z2 = 2 e 8x2+2y2+64z2 = 2 são (0,±1, 0) e (0,±1, 0) respectivamente,

então

C2 = 2 6= 4 = 2D2,

de onde segue que 2 não é congruente.

• n = 3, E3 : y2 = x3 − 9x. Para a equação 2x2 + y2 + 8z2 = 3, as únicas soluções

inteiras são (−1,±1, 0) e (1,±1, 0), assim, A3 = 4. E para a equação 2x2+y2+32z2 =

3 temos as mesmas soluções inteiras, de onde segue que B3 = 4 e portanto, A3 6= 2B3.

• n = 10, E10 : y2 = x3 − 100x. As soluções para as equações 8x2 + 2y2 + 16z2 = 10

e 8x2 + 2y2 + 64z2 = 10 coincidem e são (−1,±1, 0) e (1,±1, 0), de onde segue que

C10 = 4 6= 8 = 2D10.

Com isso, dos inteiros de 1 a 10, temos o seguinte quadro: 1, 2, 3, 4, 8, 9 e 10 não

são congruentes, já 5, 6 e 7 são congruentes (o 4 e o 9 são quadrados racionais, de onde

segue que estão na mesma classe do 1 na relação que associa dois racionais não nulos a e

b se o quociente a/b é um quadrado racional, sendo que estar na mesma classe faz com

92

que ambos ou sejam congruentes ou não sejam congruentes, já o 8 está na mesma classe

que o 2, mostrando que 8 não é congruente).

Referências

[Atiyah] ATIYAH, M. F., MACDONALD, I. G., Introduction to Commutative Algebra,

Addison-Wesley Publishing Company, 1969.

[Butt] BUTT, K., Elliptic Curves and the Mordell-Weil Theorem, 2016.

[Conceição] CONCEIÇÃO, R. P., Aritmética das Curvas de Gênero 0 e 1 sobre os corpos

F e Q, Universidade Federal de Pernambuco, Dissertação, 2003.

[Conrad] CONRAD, K., The Congruent Number Problem, Harvard College Mathematical

Review, 2 (2), pp. 58-73, 2008.

[Fulton] FULTON, W., Algebraic Curves: An Introduction to Algebraic Geometry, 2008.

[Hartshorne] HARTSHORNE, R., Algebraic Geometry, GTM 52, Springer, 1977.

[Koblitz] KOBLITZ, N., Introduction to Elliptic Curves and Modular Forms, GTM 97,

Springer, 1993.

[Lang] LANG, S., Algebraic Number Theory, Second Edition, GTM 110, Springer, 1994.

[Morandi] MORANDI, P., Field and Galois Theory, GTM 167, Springer, 1996.

[Neukirch] NEUKIRCH, J., Algebraic Number Theory, GTM 322, Springer, 1999.

[Pacheco] PACHECO, A., Números congruentes e curvas elíticas. Matemática Universi-

tária, n. 22/23, pp. 18-29, 1997.

[Pérez] PÉREZ, A. Z., Teorema de Mordell-Weil, Universidad Autónoma de Madrid,

Trabajo de n de máster, 2010.

[Silverman] SILVERMAN, J. H., The Arithmetic of Elliptic Curves, 2nd Edition, GTM

106, Springer, 2009.

[Tunnell] TUNNELL, J. B., A classical Diophantine problem and modular forms of weight

3/2. Inventiones Mathematicae. 72 (2), pp. 323-334, 1983.

[Wiles1] WILES, A., The Birch and Swinnerton-Dyer Conjecture. The Millennium prize

problems. American Mathematical Society, pp. 31-44, 2006.93

94

[Wiles2] WILES, A., Modular elliptic curves and Fermat's last theorem, Ann. Math. 142,

pp. 443-551, 1995.