parte a (relatividade)

212
Fsica moderna I - Parte A A TEORIA DA RELATIVIDADE M.C. Baldiotti April 10, 2014 Contents 1 As nuvens negras da fsica 4 2 Noıes de relatividade especial 6 2.1 Velocidade de propagaªo das interaıes .............................. 6 2.2 A mecnica de Newton e Galileu .................................. 6 2.2.1 Distinguindo a fsica da matemÆtica ............................ 9 2.2.2 Um pouco de notaªo .................................... 11 2.2.3 O eletromagnetismo e as TG ................................ 14 2.3 O experimento de Michelson e Morley (1887) ........................... 15 2.4 As transformaıes de Lorentz .................................... 19 2.5 A relatividade de Einstein ...................................... 20 2.5.1 Primeiro postulado ...................................... 22 2.5.2 Segundo postulado ...................................... 23 2.5.3 O segundo postulado e as TL ................................ 25 2.6 Sobre o tempo ............................................ 27 2.7 Simetria das transformaıes ..................................... 31 2.8 Sobre o espao ............................................ 34 2.9 Simultaneidade ............................................ 37 2.10 Sincronizaªo de relgios e observaªo ............................... 43 2.11 Efeito Doppler ............................................ 47 2.12 Aberraªo ............................................... 50 2.13 Adiªo de velocidades ........................................ 52 2.13.1 Diagrama espao-tempo e os tipos de intervalos ...................... 54 2.13.2 O arrasto do Øter ....................................... 59 1

Upload: hoanganh

Post on 10-Jan-2017

226 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Parte A (Relatividade)

Física moderna I - Parte A

A TEORIA DA RELATIVIDADE

M.C. Baldiotti

April 10, 2014

Contents

1 As nuvens negras da física 4

2 Noções de relatividade especial 62.1 Velocidade de propagação das interações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.2 A mecânica de Newton e Galileu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.2.1 Distinguindo a física da matemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.2.2 Um pouco de notação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2.3 O eletromagnetismo e as TG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.3 O experimento de Michelson e Morley (1887) . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.4 As transformações de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.5 A relatividade de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.5.1 Primeiro postulado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.5.2 Segundo postulado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.5.3 O segundo postulado e as TL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.6 Sobre o tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.7 Simetria das transformações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.8 Sobre o espaço . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.9 Simultaneidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

2.10 Sincronização de relógios e observação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.11 Efeito Doppler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

2.12 Aberração . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

2.13 Adição de velocidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

2.13.1 Diagrama espaço-tempo e os tipos de intervalos . . . . . . . . . . . . . . . . . . . . . . 54

2.13.2 O arrasto do éter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

1

Page 2: Parte A (Relatividade)

2.13.3 Rigidez e elasticidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

2.14 Vetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

2.14.1 Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

2.15 Rotações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

2.16 Métrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

2.17 O espaço de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

2.17.1 Notação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

2.17.2 Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

2.17.3 Transformações de Lorentz numa direção arbitrária . . . . . . . . . . . . . . . . . . . . 81

2.18 Minudências matemáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

2.18.1 Grupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

2.18.2 Pseudo-métrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

2.19 Mecânica relativística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

2.19.1 Tempo próprio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

2.19.2 Quadrivetor velocidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

2.19.3 Momento relativístico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

2.19.4 Energia relativística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

2.19.5 Mais do mesmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

2.19.6 Fissão e fusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

2.19.7 Fótons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

2.20 Dinâmica relativística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

2.21 Lei de transformação das forças . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

2.21.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

2.21.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

2.21.3 Espalhamento Compton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

2.22 Mais um pouco sobre notações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

2.23 Gradiente em 4D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

2.23.1 Levantamento e abaixamento de índices . . . . . . . . . . . . . . . . . . . . . . . . . . 125

3 Eletrodinâmica relativística 1263.1 Conservação da carga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

3.1.1 Transformação das densidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

3.2 Transformação dos campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

3.3 Tensor do campo eletromagnético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

3.4 Invariância de gauge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

2

Page 3: Parte A (Relatividade)

4 As equações de Maxwell 1404.1 Outra aproximação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

4.2 Ainda sobre as equações não-homogêneas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

4.3 Invariantes do campo eletromagnético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

4.4 Gauge de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

5 Força de Lorentz 150

6 Noções de relatividade geral 1526.1 Métrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

6.2 Espaço tangente e vetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

6.2.1 Lei de transformação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160

6.3 Conexões e a derivada covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

6.4 Regra de Leibniz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166

6.5 Símbolo de Christo¤el . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

7 A geometria da relatividade 1717.1 Equação da geodésica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

7.2 Tensor de energia e momento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

7.3 Equações de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184

A Noções de cálculo vetorial 190A.1 Campo vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190

A.2 Fluxo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

A.3 Divergente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

A.3.1 Teorema de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194

A.3.2 O divergente em coordenadas cartesianas . . . . . . . . . . . . . . . . . . . . . . . . . 195

A.4 Integrais de linha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196

A.5 O rotacional de uma função . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

A.5.1 Teorema de Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200

A.5.2 Lei de Ampère . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200

A.5.3 Rotacional em coordenadas cartesianas . . . . . . . . . . . . . . . . . . . . . . . . . . 201

A.6 O operador Nabla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

A.7 Teoremas Fundamentais do Cálculo Vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

A.8 Teorema de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

3

Page 4: Parte A (Relatividade)

1 As nuvens negras da física

No inicio do século XX a Física apresentava um cenário, no mínimo, perfeito. O ferramental matemático

desenvolvido desde os trabalhos de Newton e os subseqüentes desenvolvimentos da Mecânica Analítica,parecia su�ciente para descrever o comportamento de todos os corpos na natureza. Em seguida, o de-

senvolvimento da Mecânica Estatística permitiu generalizar estes conceitos para o caso de um número

(praticamente) in�nito de corpos. Dando com isso uma base formal a (praticamente) todo o desenvolvi-

mento fenomenológico da Termodinâmica. Somado a tudo isso temos o ferramental desenvolvido para a

Mecânica dos Fluidos e a brilhante aplicação deste ferramental na descrição de fenômenos eletromagnéticos,

ou seja, temos a teoria de Maxwell do eletromagnetismo. Obviamente cada um destes ramos da Física

se desdobrava numa in�nidade de outros que envolviam seus próprios ferramentais e conceitos. Mas sob

a sombra destas teorias repousava um universo completamente conhecido, cuja determinação de qualquer

evento, passado ou futuro, era apenas uma questão de medidas precisas e poder computacional.

Foi neste cenário que em 1900 Lord Kelvin (Sir William Thomson) apresentou uma palestra1 com o obje-

tivo de dar um panorama geral do estado da Física na época. Nesta palestra ele a�rma que as teorias da física

haviam chegado a um nível tão grande de so�sticação (englobando as mais diversas áreas da matemática),

consistência e sucesso, que, a menos do que ele chamou de duas �nuvens negras�, a Física seria uma teoriaprestes a ser �terminada�2 . Ou seja, assim que estas nuvens se dissipassem, o que ele acreditava que não

tardaria, as teorias físicas existentes seriam capazes de descrever com perfeição (e, conseqüentemente, fazer

todas as previsões) para qualquer fenômeno da natureza (tomando-se em conta, obviamente, a di�culdade

computacional de sistemas complexos). As �nuvens negras�apontadas por Kelvin são:

1. Na termodinâmico: A violação do Teorema da Eqüipartição de Energia para baixas temperaturas ea catástrofe do ultra-violeta para altas temperaturas.

Pelo Teorema da Eqüipartição de Energia, um sistema em equilíbrio termodinâmico com n graus

de liberdade teria a energia média hEi,

hEi = n� 12KT ; n 2 N :

Na descrição do comportamento de um gás, podemos calcular a variação da energia com a temperatura

@ hEi@T

= n� 12K = CV ;

que é o calor especí�co (a volume constante). Classicamente, este seria o comportamento esperado para

baixas temperaturas (próximas ao zero absoluto). Entretanto, experimentalmente observa-se que, para

temperaturas extremamente baixas, o calor especí�co tende a zero. Na verdade, a discrepância1From a 1900, April 27, Royal Institution lecture. Lord Kelvin, Nineteenth Century Clouds over the Dynamical Theory of

Heat and Light, Philosophical Magazine, Sixth Series, 2, 1�40 (1901).2Na verdade Jeans já havia dito algo semelhante sobre o problema do calor especí�co.

4

Page 5: Parte A (Relatividade)

entre a previsão clássica e os experimentos já haviam sido observados por Maxwell em 1859. Alémdisso, para o caso da descrição de fótons em uma cavidade, ou a radiação do corpo negro, o resultadoacima diz que a energia média dos fótons é independente da freqüência. Assim, se � (�) é adensidade de fótons com uma certa freqüência � a densidade de energia da cavidade seria

E (T; �) = hEi � (�) = 1

2KT� (�) :

Usando agora que as ondas na cavidade são estacionárias, é possível mostrar que � (�) _ �2, com o

que a formula acima se torna a fórmula de Rayleigh-Jeans para a radiação do corpo negro. Ocrescimento desenfreado da densidade E (T; v) _ KT�2 de energia com a temperatura, que obviamente

não condiz com as experiências, é chamada de catástrofe do ultra-violeta.

2. No eletromagnetismo: O resultado negativo da detecção do éter pela experiência de Michelson�

Morley (1887).

No �nal do século XIX era praticamente consenso entre a comunidade cientí�ca que a luz era umaonda mecânica. Isso exigia a existência de um meio para a sua propagação. Ou seja, em qualquer

região do espaço onde se �zesse vácuo (e.g., as regiões entre as estrelas) sobraria ainda uma substância

que preenche todo o espaço. Esta substância foi chamada de éter. Preenchendo o éter todo o espaço,

seria obviamente possível detectar o movimento dos corpos celeste (em especial a própria terra) em

relação a este meio.

Como previsto por Kelvin, logo no início do século XX foram encontradas as soluções para estes dois

problemas. A solução do primeiro problemas se deu com a proposta de Planck para a discretização dosníveis de energia do corpo negro e, conseqüentemente, o surgimento da Mecânica Quântica. Já a solução do

segundo problema deu origem a Teoria da Relatividade.

Assim, ao invés de �fecharem�a Física, como previa Lord Kelvin, a solução destes dois problemas sim-

plesmente revolucionou todos os conceitos do homem sobre a natureza e o universo, dando origem a tudo

que hoje se chama �Física Moderna�. Estes novos conceitos reinam nos limites fora das escalas do cotidiano,

ou seja, nos limites de (muito) baixas e altas energias. Estes conceitos exigiram que se repensassem todos

os fenômenos conhecidos e a incorporação (e o desenvolvimento) de novas ferramentas matemáticas. Grosso

modo, o maior problema da Física contemporânea é a elaboração de uma teoria que uni�que a Teoria da

Relatividade Geral e a Mecânica Quântica. Este é um assunto para o curso de Física Moderna II.

A compreensão do primeiro problema e sua solução, i.e., a Mecânica Quântica, é o assunto da segunda

parte do nosso curso.

Vamos iniciar então nosso curso tratando detalhadamente a solução do segundo problema e a Teoria da

Relatividade Restrita (ou Especial) (TRR).

5

Page 6: Parte A (Relatividade)

2 Noções de relatividade especial

"... a complete conspiracy is itself a law of nature!�(H. Poincaré)

2.1 Velocidade de propagação das interações

Antes de darmos uma descrição precisa da diferença entre a mecânica clássica (MC) e a mecânica relativística

(MR), vejamos a principal diferença conceitual entre estas duas teorias. Ambas aceitam o chamado princí-

cipio da relatividade. Que signi�ca que as Leis da Física são as mesmas para um determinado conjunto de

observadores que de�nem os chamados Referenciais Inerciais. Assim, o que se altera de uma teoria para a

outra é o conceito de Referencial Inercial.Na MC espaço,i.e., a localização de um corpo, é relativo, mas o tempo é absoluto. Isso não

signi�ca, é claro, que cada referencial não possa ter seu próprio relógio, mas sim que estes relógio podemser sincronizados e, mais ainda, uma vez de�nida uma escala de tempo (e relógios perfeitos) esta sin-cronização se mantêm para sempre. Assim, existe um único tempo para qualquer referencialinercial e o intervalo de tempo é o mesmo medido por qualquer refencial inercia. Em especial o

conceito de simultaneidade é absoluto.Tudo que foi dito acima se resume no fato de que na MC efeitos podem se propagar instantanea-

mente por todo o sistema. Por exemplo, nesta teoria a ação gravitacional é instantânea. Ou seja, se umcorpo se move, a força que este exerce sobre os demais corpos do sistema se altera no mesmo instante. Com

isso é possível para um observador conhecer o estado de cada corpo em qualquer lugar emqualquer instante.Já na MR todo efeito (ou, de forma mais geral, toda informação) precisa de um tempo para se propagar.

Além disso, existe uma velocidade limite, chama c, para a propagação de qualquer informação. No exemplo

anterior isso implica que, se um corpo é deslocado, um segundo corpo a uma distância D deste, levará (no

mínimo) um tempo D=c para tomar conhecimento deste deslocamento. Assim, um observador não pode

(apenas por observação) saber o estado de todos os corpos do universo. Mais ainda, é impossível qualquertroca de informação com velocidade acima de c.Um ponto importante, e a razão da MC ter prevalecido por tanto tempo, é que a velocidade limite c está

muito acima da velocidade dos fenômenos do cotidiano. Além disso, os resultados da MC são iguais aos da

MR para c in�nito.

2.2 A mecânica de Newton e Galileu

Dada uma lei física, codi�cada matematicamente numa série de equações, faz-se necessário saber onde estasleis são válidas. Por exemplo, se você tentar aplicar a lei da inércia de Newton estando dentro de um trem

acelerado, ela certamente falhará. Além disso, para se descreve matematicamente o comportamento de um

corpo, é importante introduzir no espaço um sistema de coordenadas as quais farão referência às equações da

6

Page 7: Parte A (Relatividade)

teoria em questão. Assim, a questão básica é saber para quais sistemas de coordenadas as equaçõessão válidas. Uma forma de se responder esta questão é encontrar um certo sistema �bom�para as nossas

leis, i.e., onde as leis são válidas (ou seja, onde isso possa ser veri�cadas experimentalmente). Chamamos

este sistema de referencial. Estando o nosso referencial codi�cado por um sistema de coordenadas, podemos

então descrever uma mudança para outro sistema, ou outro referencial, através de uma relação entre ascoordenadas destes sistemas. Chamamos isso de uma transformação de coordenadas. Nossa questão sobrequais os sistemas onde a nossa teoria é válida pode, com isso, ser matematicamente traduzida na questão:

Remark 1 Dado um referencial �bom� quais transformações me permitem achar outros refer-enciais igualmente �bons�?

Em mecânica estes referenciais,i.e., todos os referenciais ligados pela transformação adequada, são chama-

dos de referenciais inerciais.

As equações que descrevem a dinâmica dos corpos massivos, propostas por Newton, fazem referência a um

conjunto de coordenadas espaciais x = (x; y; z) e uma coordenada temporal t. Estas equações são invariantes

por um grupo de transformações conhecidas como transformações de Galileu (TG),

x �! x0 = x� vt ;

y �! y0 = y ;

z �! z0 = z ;

t0 = t ; (1)

com v uma constantes. Estas transformações descrevem a noção intuitiva de soma e subtração de veloci-

dades.

Usando a notação vetorial x = (x; y; z) e v = (v; 0; 0) e as TG, da de�nição de velocidade

d

dt0x0 =

d

dtx0 =

d

dt(x+ vt) = v ;

vemos que o parâmetro v da transformação (1) é a velocidade relativa entre os referenciais.A relação entre t e t0 a�rma que é sempre possível sincronizar os relógios de dois referenciais e estes

permanecerão sempre sincronizados. Assim, as equações (1) descrevem a seguinte situação: existe um

referencial S, com coordenadas (x; y; z; t) e um segundo referencial S0, com coordenadas (x0; y0; z0; t0). O

referencial S0 (S) se move com velocidade v (�v) na direção x (x0) em relação ao referencial S (S0). A

descrição de um referencial que se move numa direção arbitrária pode ser obtida através de uma rotação dos

eixos de forma a alinhar o eixo x com a direção do deslocamento (isso será feito com detalhes na MR mais

adiante).

O conjunto das quatro coordenadas (x; y; z; t) é chamado de um evento no referencial S. Ou seja, usandoas coordenadas de S estas quatro quantidades indicam quando e onde algo ocorreu.

7

Page 8: Parte A (Relatividade)

Dado um evento em S, como este mesmo evento pode ser descrito usando as coordenadas do referencialS0?

Por exemplo, suponha que S está parado (o que signi�ca isso?) e S0 se move para a direita com uma

velocidade de v = 1m=s. No referencial S veri�ca-se que aos 3s um martelo atingiu o ponto x = 0. Igno-

rando as coordenadas y e z este evento tem coordenas (x = 0; t = 3). Suponha ainda que os relógios dosreferenciais estejam sincronizados (isso está descrito pela última equação em (1)) e que as origens dos

referenciais coincidem em t = 0 (isso está descrito três primeiras equações em (1)). Com isso, este mesmo

evento será descrito por alguém que usa o referencial S0 com tendo ocorrido aos 3s, mas na posição x0 = �3,ou seja, com coordenadas (�3; 3).Alguns pontos devem ser notados nas transformações (1):

1. Os relógios dos referencias devem ser sincronizados e, uma vez feito isso, eles permanecerão sempresincronizados.

2. Além de alinhar os seus eixos espaciais, o referencial S0 deve marcar a origem do seu referencial como

sendo a origem do referencial S no instante t = t0 = 0.

A mecânica de Newton admite os postulados:

1. A força num corpo é diretamente proporcional a aceleração e a constante de proporcionalidade é a

massa do corpo.

2. A massa de um corpo não depende do referencial.

O chamado princípio da relatividade de Galileu estabelece que:

Remark 2 Dado um certo referencial onde são válida as leis de Newton (ou as leis da MC), qualquer outroreferencial ligado pelas transformações (1) serão igualmente bons.

Para entender isso note que

d2x

dt2! d2x0

dt02=d2x0

dt2=d2 (x+ vt)

dt2=d2x

dt2: (2)

Ou seja, a aceleração possui os mesmos valores em todos os referenciais.Os postulados acima e a equação (2) implicam que em ambos os referenciais, a equação de movimento

tem a mesma forma algébrica

F (x) = md2x

dt2= m

d2x0

dt2= F0 (x0) ;

onde F0 (x0) tem a mesma forma algébrica de F apenas substituindo x por x0.

8

Page 9: Parte A (Relatividade)

Diz-se, com isso, que as equações de Newton são invariantes, pelas transformações de Galileu. Diz-se,

também, que as equações de Newton são covariantes (tem a mesma forma algébrica) por transformações de

Galileu.

Resumindo:

Remark 3 As transformações de Galileu de�nem os referenciais inerciais da mecânica de New-ton.

Exercise 4 Suponha que você está num container num navio que trafega com velocidade constante. Que tipo

de experimento você pode fazer para determinar que você está em movimento?

A invariância das equações de Newton por transformações de Galileu possui a conseqüência física de ser

impossível determinar movimentos retilíneos uniformes por qualquer experimento mecânicorealizado num referencial. Em outras palavras, se dois referenciais se movem um em relação ao outro

com velocidade v, não faz sentido dizer qual deles está em movimento e qual está em repouso.Assim, quando se está num referencial inercial, todos os experimentos mecânicos podem serrealizados como se o seu referencial estivesse em repouso. Nada disso é válido se o referencialestiver acelerado. Ou seja:

Remark 5 Qualquer relação entre os referenciais diferente das TG poderia ser determinada por experimentosmecânicos dentro do próprio referencial.

2.2.1 Distinguindo a física da matemática

Remark 6 É de fundamental importância notar que: F0 (x0) 6= F (x0). A discussão a seguir tentará torna

clara esta distinção.

Aqui é importante separar um pouco a matemática da física. Suponha que um observador em S0 descreve

o movimento de uma mola. Nesta descrição ele obtem a relação:

md2x0

dt2= �kx0 = F 0 (x0) :

Matematicamente nós sempre podemos efetuar uma transformação de coordenadas, ou seja, podemos mudaras variáveis do problema. Suponha então que efetuamos a mudança de coordenadas (ou de variáveis) (1).

Com isso:

x �! x0 = x� vt =) F 0 (x0) = �kx0 �! F 0 (x) = �k (x� vt) :

Sabendo que

md2x0

dt2= m

d2x

dt2

9

Page 10: Parte A (Relatividade)

então a "equação de Newton" se tornaria

md2x

dt2= �k (x� vt) : (3)

Mas, pela covariância das leis de Newton, sabemos que a equação que descreve o movimento da mola tem a

mesma forma algébrica em todos os referenciais inerciais. Ou seja, sendo S um referencial inercial a equação

da mola deveria ser

md2x

dt2= �kx : (4)

Exercise 7 Qual das duas equações, (3) ou (4), descreve o movimento da mola? O que cada uma destas

equações descreve?

10

Page 11: Parte A (Relatividade)

Retomando ao problema acima, existe uma diferença entre efetuar uma transformação de coordenadas na

equação de movimento e usar a covariância das equações do movimento.

Pela lei de Newton, a equação diferencial que descreve o movimento de uma mola tem a forma

md2x0

dt2= F 0 (x0) = �kx0

realizando uma transformação de Galileu (um artifício matemático válido para qualquer transformação)nesta equação temos

md2 (x+ vt)

dt2= �k (x+ vt) =) m

d2x

dt2= �kx� kvt = F 0 (x) :

A solução desta equação pode ser escrita como:

x = �vt+A cos (!t+ �) ; ! =rk

m; A; � = const:

Fácil ver que esta equação descreve o movimento de uma mola cujo centro das oscilações está em repouso

no sistema que usa coordenadas x0 quando vista do sistema que usa coordenadas x. Ou seja, uma mola que,

além de oscilar, se move com velocidade constante v.

O processo utilizado acima nada mais é que uma mudança de variáveis. Você sempre pode fazer issocom qualquer transformação (não apenas TG). Este procedimento não envolve nenhuma consideraçãosobre a teoria física em questão.

Agora, invocar a covariância das equações (um postulado físico) signi�ca que se num referencial inercialvocê fez experimentos com uma mola e obteve a equação

F 0 (x0) = kx0 =) F (x) = kx ;

em qualquer outro referencial inercial você sabe, sem precisar fazer experimentos de novo, que aequação desta mola terá a mesma forma, mas com as coordenadas deste novo referencial. Isto é, numreferencial qualquer onde o centro das oscilações está em repouso, ela terá a mesma forma,

md2x

dt2= �kx =) m

d2x0

dt2= �kx0 :

O mesmo válido sempre que o movimento for observado de qualquer outro referencial inercial no qual ocentro das oscilações esteja em repouso.

2.2.2 Um pouco de notação

Podemos escrever as equações acima, em especial a TG, usando 4 tipos de notação:

11

Page 12: Parte A (Relatividade)

1. A primeira, usada acima em (1), especi�cada cada uma das transformações;

2. A segunda, também usada acima usa a notação vetorial

x0 = x� vt ;

t0 = t ;

3. Uma notação muito conveniente, mas ainda não usada, é não chamar as coordenadas de x; y; z, mas

sim de x1; x2; x3. Com isso a TG pode ser escrito de uma forma mais compacta

x0i = xi � vit

t0 = t ;

com i = 1; 2; 3, v1 = v e v2;3 = 0. Neste caso a notação deixa explicita cada uma das compo-nentes do vetor.

4. Podemos também usar a notação matricial (i.e., usar uma representação matricial para os vetores)

x0 = Tx ;

t0 = t ;

onde

T =

0BBBB@1 0 0 �v0 1 0 0

0 0 1 0

0 0 0 1

1CCCCA ; x0 =

0BBBB@x01

x02

x03

t

1CCCCA ; x =

0BBBB@x1

x2

x3

t

1CCCCA :

Neste caso podemos também explicitar as componentes do vetor:

x0i =

3Xj=1

Tijxj :

Podemos nos perguntar, por exemplo, se um observador em S0 mede um determinado evento, qual a

coordenada deste evento em S?

12

Page 13: Parte A (Relatividade)

Bem, se S vê S0 se movendo com velocidade v, então, obviamente S0 vê S se movendo com velocidade

�v. Ou seja, a transformação ~T�1 procurada vale

~T�1 =

0BBBB@1 0 0 v

0 1 0 0

0 0 1 0

0 0 0 1

1CCCCA ;

Sem utilizar o argumento físico acima, podemos também inverter diretamente as equações que de�nem a

transformação. Por exemplo, na notação matricial

x0 = Tx =) x =T�1x0 ;

assim, devemos apenas calcular a inversa da matriz T .

13

Page 14: Parte A (Relatividade)

Calculando e T�1 temos

T�1 =

0BBBB@1 0 0 v

0 1 0 0

0 0 1 0

0 0 0 1

1CCCCA = ~T�1 :

Que nada mais é que a transformação ~T�1 determinada com argumentos físicos.

2.2.3 O eletromagnetismo e as TG

O chamado princípio da relatividade de Galileu pode ser enunciado como:

1. As leis da mecânica são as mesmas em qualquer referencial inercial;

2. Um referencial é inercial se existe uma transformação de Galileu que o transforma num outro sabida-

mente inercial.

O ponto aqui é que gostaríamos de encontrar condições de validade não apenas para as leis de Newton,

mas para todas as leis da Física.

Exercise 8 Em que referenciais é válido, por exemplo, o eletromagnetismo?

A discussão acima deixa claro como é importante saber para quem uma certa teoria é válida. Esta questão

é crucial, obviamente, não apenas para a mecânica, mas para qualquer teoria física (ou ainda, qualquer teoria).

Em especial, é mandatório saber para qual tipo de referencial é válido o eletromagnetismo.

Um ponto chave em relação a mecânica é que a força que gera a dinâmica depende da segundaderivada da posição em relação ao tempo (a equação (2) mostrou que isso é essencial). Isso faz com o

termo v� t na TG desapareça do lado direito da lei de Newton e garanta a covariância da teoria. Em outras

paravas:

Remark 9 As fórmulas envolvidas na mecânica Newtoniana não dependem da velocidade, masapenas da aceleração.

Já no eletromagnetismo as fórmulas envolvidas possuem uma dependência explícita da ve-locidade. Por exemplo, vimos que o movimento uniforme é um conceito relativo, contudo a aceleração

não (todos os RI medem a mesma aceleração), mas a força de Lorentz, que governa a dinâmica das cargas

massivas no eletromagnetismo (i.e., fornece o link entre o eletromagnetismo e a mecânica) vale

F = q [E+ v �B] :

Um observado em repouso com a carga imersa num campo magnético B não detecta nenhuma força (conse-

qüentemente nenhuma aceleração) enquanto outro com velocidade v detecta a força qv�B (conseqüentementeuma aceleração). Como �ca então a invariância das leis da mecânica?

14

Page 15: Parte A (Relatividade)

Outro exemplo é a lei de Ampère Z@S

B:dl = �0I + �0"0@� (E)

@t:

A corrente I é dada pela velocidade das cargas. Assim, se tivemos um pedaço de �o com uma certa

distribuição de carga, este �o gera um campo magnético para um observador que vê o �o se mover com

velocidade v, mas não para um observador parado com o �o.

Surge então a questão crucial:

� Qual a velocidade que deve ser usada nas equações de Maxwell e na força de Lorentz, ou ainda, emrelação ao que são medidas as velocidades do eletromagnetismo?

2.3 O experimento de Michelson e Morley (1887)

A necessidade de um referencial para o qual as leis do eletromagnetismo fossem válidas foi percebido desde

os primórdios da teoria. Entretanto isso não foi considerado um grande problema, pois, desde o século 17th

Boyle (e outros) já acreditavam que não existia o vácuo e que todo espaço não preenchido por partículas era

preenchido por uma substância chamada éter, a qual era responsável, inclusive, por qualquer interação entre

corpos que não estivessem em contato 3 . Neste mesmo período Huygens havia criado a hipótese de que a

luz se propagava no éter. Em outras palavras, a luz foi considerada uma onda mecânica que sepropagava no éter. Com o desenvolvimento das equações de Maxwell (EM) no século XIX e a constatação

de que a luz era uma onda eletromagnética, �cou claro para os cientistas da época que as velocidadesenvolvidas na teoria do eletromagnetismo eram todas medidas em relação ao éter.

� Veio então uma necessidade prática de medir a velocidade da terra, ou de alguma região especí�ca, emrelação ao éter. Pois, só assim as EM poderiam ser aplicadas corretamente.

Dentre os vários experimentos desenvolvidos para se medir a velocidade da terra em relação ao éter, o

mais famoso foi o experimento de Michelson e Morley (MM), devido a sua precisão compatível com o valor

da velocidade da luz. O que MM inventaram foi, na verdade, o interferômetro.

Neste aparato um feixe de luz coerente é dividido em dois feixes por uma placa parcialmente prateada.

Os dois feixes são re�etidos por espelhos que distam da mesma distância L e se recombinam. Se imaginarmos

que a luz se propaga no éter e que este está em repouso com relação ao aparato, ambos os feixes percorrerão

a mesma distância e se recombinarão de forma construtiva. Agora, se a luz se propaga no éter (como o

som se propaga no ar) é o éter se move com uma velocidade v com relação ao aparato, os feixes percorrerão

distâncias diferentes e se recombinarão fora de fase. Vejamos isso com mais detalhes. Se o aparelho se move

em relação ao éter como na Figura 1, suponha que o feixe que move na direção da placa C (perpendicular a

3Para Kelvin átomos eram vórtices no éter.

15

Page 16: Parte A (Relatividade)

Figure 1: Interferômetro (�gura retirada do livro do Feynman).

16

Page 17: Parte A (Relatividade)

v) demore um tempo tC para atingir esta placa. Assim, este este feixe percorrerá uma distância

d2C = L2 + (v:tC)2: (5)

Se a velocidade da luz no éter vale c temos também

dC = c:tC ; (6)

com isso,

L2 + (v:tC)2= (c:tC)

2=) tC =

L=cq�1� v2

c2

� = L

c;

=

�1� v2

c2

��1=2> 1 para v < c :

onde L=c seria o tempo gasto se o aparato estivesse em repouso em relação ao éter. Voltando na expressão

(6) temos

dC = c:tC = c: L

c= c:tC = L :

Assim, a distância total L? percorrida pelo o feixe perpendicular a v para ir e retornar à placa B vale:

L? = 2dC = 2 L :

Já para o feixe na direção da placa E (paralelo a v) temos: quando o feixe atinge E a placa se deslocou uma

distância v:tBE . Assim, a distância dBE percorrida pelo feixe vale

dBE = L+ v:tBE = c:tBE =) tBE =L

c� v =) dBE = L

�1 +

v

c� v

�:

Enquanto o tempo tEB e a distância dEB para o feixe voltar valem

dEB = L� v:tEB = c:tEB =) tEB =L

c+ v=) dEB = L

�1� v

c+ v

�:

Assim, a distância total Lk percorrido pelo feixe paralelo a v vale

Lk = dBE + dEB = L

�2 +

v

c

�1

1� vc

� 1

1 + vc

��= L

"2 +

v

c

1 + v

c

1� v2

c2

�1� v

c

1� v2

c2

!#

= 2L

"1 +

1

1� v2

c2

v2

c2

#= 2L

�1 + 2

�� 1

2+ 1

��= 2L 2 = L? > L? ; > 1 :

17

Page 18: Parte A (Relatividade)

Dos resultados acima vemos, que as distâncias Lk e L? percorrido pelo dois feixes são diferentes. Esta

diferença se traduz em franjas de interferência na composição dos feixes defasados. Com isso podemos

detectar variações da ordem de grandeza do comprimento de onda da luz utilizada e, conseqüentemente,

variações na velocidade do éter em relação ao aparato desta mesma ordem de grandeza.

Tecnicamente não é possível construir um aparato onde ambas as distâncias sejam exatamente iguais.

Assim, logo de inicio já temos a presença de franjas de interferências. Com isso, o que realmente se esperava

observar seria uma modi�cação nestas franjas devido ao movimento do aparato em relação ao éter quando

o aparato fosse girado de 90 graus. Ou seja, girando-se este interferômetro pretendia-se observar diferença

nas velocidades dos feixes conforme estes percorriam caminhos paralelos ou perpendiculares ao deslocamento

do éter. Entretanto nenhuma diferença jamais foi observada! Várias tentativas de se explicar o fracasso

(na verdade um sucesso!) deste experimento foram desenvolvidas. Entre elas havia a hipótese do éter ser

arrastado com a terra, mais isso levava a inconsistências com as propriedades de viscosidade deste meio e

com os efeitos observados em fontes luminosas extraterrestres.

18

Page 19: Parte A (Relatividade)

2.4 As transformações de Lorentz

Uma proposta de Lorentz e Fitzgerald (LF) foi a�rmar que o éter comprimia todos os corpos na direção de

seu movimento por um fator �1 (lembre que > 1 para v < c). Pois, com isso, a distância percorrida pela

luz não seria Lk, mas ~Lk = �1Lk e com isso

~Lk =1

Lk =

1

( L?) = L? ;

ou seja, neste caso as distâncias percorrida pelos feixes na experiência de MM seriam as mesmas e nenhuma

mudança das franjas seria observada. Este efeito, conhecido como contração de Lorentz, será retomado na

TR, mas num contexto completamente diferente. Porém Lorentz justi�cava esta contração a�rmando que as

forças moleculares seriam in�uenciadas pela corrente de éter. Ou seja, a interpretação física de LF estava

errada.

Além disso, no desenvolvimento do problema LF tiveram sucesso em encontrar transformações das co-

ordenadas que deixavam invariantes as EM4 (na verdade, estas transformações já haviam sido propostas

por Larmor em 1900, enquanto os trabalhos de LF são de 1903), desde que os campos também semodi�cassem. Estas transformações têm a forma

x0 = � (x� vt) ;

y0 = �y ;

z0 = �z ;

t0 = � �t� vx

c2

�e são hoje conhecidas (para � = 1) como as transformações de Lorentz (a modi�cação dos campos será

vista depois). A interpretação da primeira transformação seria a contração mencionada anteriormente. Pois

suponha que no referencial S0, num instante t0 foi efetuada uma medida entre os pontos x01 e x02. Assim, a

distância entre estes pontos em S0 vale

�0x = x02 � x01 :

Usando as transformações acima (com � = 1) temos

�x0 = x02 � x01 = (x2 � vt)� (x1 � vt) = (x2 � x1) = �x

Assim, a distância entre estes dois pontos, quando registradas por um observador em S, vale

�x =1

�x0 :

4Na verdade, o tratamento de Lorentz está correto apenas no vácuo, pois os termos que contém transformações de cargas ecorrentes não estavam correto.

19

Page 20: Parte A (Relatividade)

Que é a contração de Lorentz mencionada acima.

Já a transformação do tempo era considerada uma aberração na medida do tempo ocasionada também

pela in�uencia do éter nos fenômenos eletromagnéticos (esta transformação já havia sido introduzida, como

um artifício matemático, por Voigt em 1887). Entretanto, uma medida de tempo que não envolvesse efeitos

eletromagnéticos não sofreria esta aberração.

Um ponto importante destes trabalhos, também re-utilizado na TRR, foi a idéia de uma �massa eletro-

magnética�dependente do referencial. Ou seja, para fenômenos eletromagnéticos a massa dos corposnão poderia ser considerada uma constante.A contração de Lorentz, por afetar todos os corpos, não poderia ser medida por nenhum experimento.

Mas estes resultados não fecharam a questão do éter, pois experimentos diferentes foram desenvolvidos para

detectar o movimento do éter e, para cada um deles, tinha de se introduzir uma nova característica para se

explicar o seu fracasso (e.g., o éter é um super�uido etc). Ou seja, nenhum experimento (eletromagnéticos ou

mecânico) permitia �ver�o éter. Todas estas �conspirações�da natureza para esconder o éter levou Poincaré

a�rmar �uma conspiração completa só pode ser uma lei da natureza�. Isso levou Poincaré a generalizar o

princípio da relatividade de Galileu e a�rmar:

� Todas as leis da Física são invariantes por transformações de Lorentz.

Como veremos, o mesmo postulado foi proposto, quase simultaneamente, nos trabalhos de Einstein.

Além disso, estudando as propriedades de grupo das TL Poincaré determinou que � = 1 (o que foi usado nos

trabalhos de Lorentz, mas apenas como uma escolha arbitrária).

Obviamente isso trazia um problema desconcertante, pois as equações de Newton, que até então haviam

previsto com sucesso os movimentos de corpos no céu e na terra, não era invariante por estas transformações

e, conseqüentemente, não seriam uma lei da Física.Como vimos vários trabalhos até 1904 continham os embriões da TRR. Entretanto, num trabalho de 1905

Einstein conseguiu agrupar todas estas idéias e fornecer as, até então inexistentes, interpretações físicas de

todas as conseqüências da teoria.

2.5 A relatividade de Einstein

"...the covariant law should be derivable from the simplest possible basic assumptions. The credit for having

succeeded in doing just this goes to Einstein.", (W. Pauli)

Nos trabalhos de Einstein de 1905 sobre a TRR ele faz menção a um experimento parecido com o seguinte:

imagine uma bobina quadrada de lado l se movendo (e.g., dentro de um carro) e entrando numa região com

campo magnético uniforme B (Figura 2).

Considere este problema sob 2 pontos de vista:

1. Você está parado na região do campo e vê a bobina se mover para dentro do campo.

Neste caso, com o movimento das cargas da bobina, você vê surgir uma força de Lorentz F que, por

20

Page 21: Parte A (Relatividade)

Figure 2: Figura 2.

sua vez, faz surgir uma EMF (trabalho por unidade de carga) dada por:

E =�1

q

� ZF:dl =

�1

q

�q

Z(v �B) :dl = �vBl

(o sinal de � vem da velocidade estar na direção �x);

2. Agora você está dentro do carro, i.e., se movendo com a bobina.

Neste caso não há cargas se movendo e, conseqüentemente, não há forças de Lorentz. Mas vocêconhece as leis do eletromagnetismo e, em especial, a Lei de Faraday. Você sabe que na bobina há um

�uxo magnético �,

� (B) =

ZB:da = Bl:s ;

onde s é a parte da bobina que entrou no campo. A variação temporal deste �uxo induz um campo

elétrico E que, por sua vez, gera a EMF:

E =ZE:dl = �d� (B)

dt= � d

dt(Bl:s) = �Blds

dt= �Blv :

Observe que para aqueles que criam no éter a igualdade destes dois valores de E é uma coincidênciaimpressionante. Pois suponha que no caso 1 a pessoa está num referencial bom, i.e., que não se move em

relação ao éter. Neste caso seus cálculos vão fornecer o resultado correto, mas para qualquer outro referencial,

em especial o do caso 2, as contas estariam erradas. Ou seja, a pessoa do caso 2 não poderia usar as EM.

E o mesmo para o caso contrário, se a pessoa parada no campo está no referencial bom, então a pessoa no

carro não poderia usar a lei de Lorentz. Ou seja, apenas um dos observadores acima poderia obter a resposta

correta, mas como estas são iguais ambos devem estar certos.

21

Page 22: Parte A (Relatividade)

Em sua análise do problema, Einstein tomou o resultado acima não como uma coincidência, mas como

uma conseqüência dos fundamentos da lei da física.

2.5.1 Primeiro postulado

Seu primeiro passo foi abandonar a existência do éter, e de qualquer outro referencial privilegiado,e estender o postulado da relatividade de Galileu:

1. As leis da física são as mesmas em qualquer referencial inercial;

Mas esta extensão levava a um problema sobre o que é um referencial inercial. Como vimos, as leis doeletromagnetismo não são invariantes por uma transformação de Galileu. Por outro lado Lorentz encontrou

leis de transformação que mantinham invariantes as EM. Entretanto, as equações da mecânica de Newton não

são invariantes pelas transformações de Lorentz. Neste sentido, o postulado acima nos diz que uma destas

teorias não está correta.

Alguns tentaram mudar as EM para serem invariantes pelas TG, mas isso gerou efeitos eletromagnéticos

que não foram observados.

Einstein escolheu como corretas as leis do Eletromagnetismo. Com isso, referenciais inerciais sãoaqueles ligados pelas transformações de Lorentz:

x0 = (x� vt) ;

y0 = y ; z0 = z ;

t0 = �t� vx

c2

�: (7)

Assim como no caso das transformações de Galileu, as equações acima descrevem a seguinte situação: ex-

iste um referencial S, com coordenadas (x; y; z; t) e um segundo referencial S0, com coordenadas (x0; y0; z0; t0).

O referencial S0 (S) se move com velocidade v (�v) na direção x (x0) em relação ao referencial S (S0). O

conjunto das quatro coordenadas (x; y; z; t) é chamado de um evento no referencial S. Ou seja, usando ascoordenadas de S estas quatro quantidades indicam quando e onde algo ocorreu. Dado um evento em S,

como este mesmo evento pode ser descrito usando as coordenadas do referencial S0.

Remark 10 A descrição acima, apesar de ser repetitiva e óbvia, deve ser entendida bem. Pois uma das

grandes di�culdades na resolução de problemas em TRR é transcrever um dado evento na linguagem das

coordenas.

Diferente das transformações de Galileu, atente para o seguinte:

1. Para usar as transformações acima os observadores de ambos os referenciais devem sincronizar os seusrelógios em algum instante. Entretanto, relógios sincronizados num instante T qualquerNÃO mais estarão sincronizados para qualquer instante diferente de T .

22

Page 23: Parte A (Relatividade)

2. Se os relógios foram sincronizados de forma que t = t0 = 0, o referencial S0 deve marcar a origem do

seu referencial como sendo a origem do referencial S neste instante t = t0 = 0.

A sincronização e marca da origem dos referenciais é arbitrário, mas as escolhas acima evitam que se

carregue constantes desnecessárias.

Vamos voltar exatamente no mesmo exemplo que tratamos quando estudamos as transformações de

Galileu. Suponha que S está parado e S0 se move para a direita com uma velocidade de v = 1m=s. Aos

3s medidos no referencial S (isso é de fundamental importância) um martelo atingiu o ponto x = 0.

Ignorando as coordenadas y e z este evento tem coordenas (x = 0; t = 3). Se visto do referencial S0 após,

este mesmo evento será descrito como um evento que ocorreu aos

x0 = �3 ; t0 = 3 ;

i.e., no instante t0 = 3 e na posição x0 = � 3, ou seja, a coordenada do evento em S0 será (�3 ; 3 ). Observeque agora, os observadores medem não apenas posições diferentes, mas também tempos diferentes (mesmocom seus relógios sincronizados em t = t0 = 0). Entender este fato, e suas conseqüências, é o objetivo desta

parte do curso. Entretanto, neste exemplo em especí�co, como v << c, os resultados são muito próximos do

caso anterior

=1q1� 1

c2

= 1; 00000000000000000| {z }17 zeros

5 :

Por isso este tipo de discrepância não é observado no cotidiano onde as velocidades envolvidas são pequenas

(em comparação a c).

Remark 11 Uma conseqüência da generalização do princípio da equivalência de Galileu para o de Einsteiné que, se no primeiro é impossível detectarmos um MRU por qualquer experimento mecânico no referencial.Já o segundo a�rma que este movimento não pode ser detectado por nenhum experimento em geral, seja eleeletromagnético ou qualquer outro.

2.5.2 Segundo postulado

Uma conseqüência direta das EM é o valor da velocidade da luz no vácuo. Uma vez que as EM e, conseqüen-

temente, o cálculo desta velocidade independem do referencial, isso levou Einstein ao segundo postulado

da TRR:

2 A velocidade da luz no vácuo é a mesma para qualquer observador num referencial inercial, independente

do movimento da fonte ou do observador.

Por velocidade no postulado acima se deve entender a magnitude apenas e não o vetor velocidade. Como

veremos, a �direção�da luz pode depender da fonte.

23

Page 24: Parte A (Relatividade)

Observe que, a princípio, o comportamento de uma onda mecânica, como o som, também não depende

do movimento da fonte (mas apenas do movimento do meio onde se propaga). Mas o comportamento da luz

é algo bem diferente disso. Imagine um nevoeiro onde seja possível �ver�a luz se propagar. Neste nevoeiro

temos duas pessoas que se movem com velocidade constante uma na direção da outra. No ponto aonde elas

irão se encontrar existe um poste que, quando aceso, emitirá uma frente esférica de luz. Assim, ao passar

uma pela outra o poste se acende. O que cada um dos observadores irá ver. O primeiro verá uma onda

esférica com ele no centro da esfera, enquanto o outro observador certamente está em algum ponto fora deste

centro. Já o segundo verá uma esfera com ele no centro (pois para ambos a luz se afasta com velocidade c em

todas as direções) e a�rmará, com certeza, que o outro observado é que está fora do centro. Mas certamente

existe apenas uma frente de luz.

Exercise 12 Qual deles diz a verdade?

24

Page 25: Parte A (Relatividade)

Como veremos, o segundo postulado nos leva a reconsiderar o que até então chamamos de �verdade�.

O segundo postulado acima, além de completamente anti-intuitivo, representa uma completa revolução

nas noções usuais de distância e, conseqüentemente, da geometria do tempo e do espaço.A importância crucial de uma lei física é fazer previsões (esta característica é imprescindível para que a lei

possa ser testada). Ou seja, a lei deve dizer quando e onde algum fenômeno ocorrerá, a partir do conhecimento

do estado (como e onde) do sistema no passado. Até Einstein pouca importância se dava a uma de�nição

precisa dos termos quando e onde (obviamente os valores sempre foram importantes), uma vez que estes

são intuitivos o su�ciente para que esta questão fosse apenas uma questão �losó�ca. Em especial, observador

de diferentes referenciais (não necessariamente inerciais) poderiam em algum momento e lugar compartilhar

réguas e relógios que posteriormente seriam usados por cada observador no seu respectivo referencial. Assim,

dado, por exemplo, um ponto de referência �visível�por todos os referenciais, este poderia ser usado para

converter as distâncias de um observado para o outro. Por exemplo, dado um ponto qualquer (e.g., um poste)

um observador sempre poderia dizer aos demais, as cinco horas o carro estava a cinco quilômetros dedistância do poste. Cada observador, independente do seu movimento, entenderia esta a�rmação. Alémdisso, um outro fenômeno, por exemplo, quando o carro passar pelo poste, poderia ser usado para sincronizar

o relógio de todos os observadores. Vamos ver como o segundo postulado acima muda drasticamente este

senso-comum.

2.5.3 O segundo postulado e as TL

Vamos ver como este postulado se relaciona com as TL. Imagine que na origem de um referencial S emitimos

um sinal luminoso. Após um tempo t (medido em S) a frente deste sinal terá viajado a distância ct, ou seja,

se (x; y; z) são as coordenadas da frente de onda,

ct =px2 + y2 + z2 =) (ct)

2= x2 + y2 + z2

Para simpli�car vamos imaginar que o sinal foi emitido na direção x, com isso

(ct)2= x2 =) (ct)

2 � x2 = 0

Imagine agora um outro observado num referencial S0 que se move com velocidade vx em relação a S.

Pelo primeiro postulado este observador também verá a luz se deslocar com velocidade c e, conseqüentemente,

após um tempo t0 (medido no relógio de S0) o a frente de onda terá coordenada ct0, assim, se x0 é a coordenada

da frente de onda, temos

(ct0)2 � x02 = 0

.As duas relações acima permitem identi�car as quantidades

(ct)2 � x2 = (ct0)2 � x02 ; (8)

25

Page 26: Parte A (Relatividade)

para qualquer refencial. Queremos agora encontrar uma relação entre x; t e x0; t0 que respeite a condição

acima. Lembrando a relação entre as funções hiperbólicas

cosh2 a� sinh2 a = 1 (9)

é fácil ver que esta relação é satisfeito (de forma geral) se estas coordenadas tiverem a relação

x = x0 cosh a+ ct0 sinh a ;

ct = x0 sinh a+ ct0 cosh a : (10)

Exercise 13 Veri�que que (10) respeita (8).

Suponha agora que um observador em S siga (observe) a origem de S0 (x0 = 0). Em S este ponto terá as

coordenadas:

x = ct0 sinh a ;

ct = ct0 cosh a :

dividindo estas relaçõesx

ct= tanh a

obviamente, pela construção do problema, a origem de S0 se move com velocidade v, i.e.,

x

t= v ;

com isso

tanh a =v

c: (11)

Usando esta igauldade e a relação (10) temos

sinh a =V=cq1� V 2

c2

= v

c;

cosh a =1q1� V 2

c2

= :

Exercise 14 Veri�que que a relação acima respeita (11) e (9).

26

Page 27: Parte A (Relatividade)

Substituído novamente em (10) temos

x = (x0 + vt0) ;

t = �x0v

c2+ t0

�:

Que são as TL entre os referenciais S e S0 (ou seja, (7) trocando v por �v). Vemos assim como o postulado

de Einstein se relaciona com as TL.

Exercise 15 Uma vez que as TL misturam as coordenadas temporais e espaciais, é muito útil que todas as

quantidades tenham a mesma unidade. Assim, ao invés de trabalharmos com t usualmente trabalhamos co ct

e escrevemos as TL como

x0 = (x� vt) ;

y0 = y ; z0 = z ;

ct0 = �ct� v

cx�:

Escreva estas transformações na forma matricial. Calcule a inversa da matriz T�1 e mostre que esta matriz

é a mesma que se obtém invertendo o sinal de v nas TL.

2.6 Sobre o tempo

A última equação em (7) mostra que o tempo para observadores em referenciais diferentes não éo mesmo. Vamos ver melhor o que isso signi�ca. Para tanto, vamos construir um tipo de relógio bastante

simples e especial. Nosso relógio é composto pela fonte de luz e o espelho da Figura 3. Chamamos de uma

unidade de tempo (t) o tempo que a luz demora para sair da fonte e atingir a fotocélula. Admitindo o

primeiro postulado, no nosso referencial esta unidade de tempo vale:

t = 2D

c:

Se você quiser imaginar um relógio imagine que a luz pisca e quando o feixe re�etido atinge a fotocélula

existe um dispositivo que faz a luz piscar novamente. Assim, esta luz piscando é o nosso relógio.

Imagine agora que construímos 2 destes relógio de luz exatamente iguais e os iniciamos simultaneamente.Assim, estes dois relógios estão sincronizados. Pegamos agora um destes relógios e entregamos para um

observador num foguete que se move com a velocidade v indicada na �gura acima. Este observador, pra seu

conforto, utiliza um sistema de coordenadas S0 que viaja junto com o foguete.

Como o mecanismo do relógio de luz não se modi�cou e a velocidade da luz é uma constanteo observador na nave vê o seu relógio piscar com a mesma periodicidade t. Entretanto, quando o observador

da nave olha para o relógio que �cou na terra, ele tem uma surpresa. Como, para ele, a luz do aparato que

27

Page 28: Parte A (Relatividade)

Figure 3: Figura 3 - Retirado do Feymann

está na terra percorrer um caminho diferente, admitindo o primeiro postulado, para este observador temos

(c�)2= D2 + (v�)

2=) � =

1

c

�1� v2

c2

��1=2D =

D

c;

onde � é o tempo que a luz demora pra ir da lâmpada ao espelho. Com isso, o tempo total t0 para a luz ir e

voltar vale:

t0 = 2� = 2 D

c= t : (12)

Lembrando, novamente, que para v < c =) > 1, vemos que t0 > t. Ou seja, para o observador na nave o

relógio na terra demora mais para completar um ciclo do que o relógio que está com ele.

Por exemplo, para v =p3c=2 temos = 2 e t0 = 2t. Ou seja, se o observador em S vê a lâmpada piscara

a cada 1 segundo, o observador em S0 a vê piscarar a cada 2 segundos (lembrando que o observador em S0

vê a lâmpada do seu próprio relógio piscar também a cada 1 segundo). O relógio de S quando visto de S0

anda mais devagar. Chamamos isso de dilatação do tempo.

Remark 16 A equação acima nos diz o seguinte: no nosso referencial S0 temos um relógio que marca um

tempo t0 (i.e., este relógio está parado em relação a nós). Olhamos então um referencial em movimento

S. Este referencial S também possui um relógio que marca um tempo t (se transportado para o nossoreferencial este relógio marcará a mesma unidade de tempo �t = �t0). Se observarmos um evento

que ocorreu em S podemos marcar a duração deste evento usando qualquer um dos dois relógios(nós vemos os dois relógios). Suponha então que você está em S0 com um cronômetro na mão (que marca

um tempo t0) e, olhando para S, você vê ocorrer um evento e também enxerga o relógio de S. Então, olhando

28

Page 29: Parte A (Relatividade)

para o relógio de S você observa que este evento demorou um tempo �t para ocorrer. Assim que o evento

terminou você parou o seu cronômetro. Quando você olhar para o seu cronômetro este marcará um tempo

�t0 = �t > �t.

Mas, obviamente, isso parece uma particularidade do nosso relógio. É aqui que entra o primeiro postu-

lado. Lembre-se que devido a invariância das equações de Newton por uma transformação de Galileu seria

impossível (por experimentos mecânicos) detectar o movimento uniforme de um referencial inercial em re-

lação a outro. Da mesma forma, admitir o primeiro postulado da relatividade de Einstein é equivalente a

a�rmar que é impossível (por qualquer experimento) determinar o movimento uniforme de umreferencial inercial em relação a outro. A única diferença é que, agora, não nos restringimos apenas aexperimentos mecânicos. Assim, admitir o primeiro postulado implica que é impossível detectar a velocidade

v do experimento acima fazendo qualquer experiência em S0 (ou seja, não se pode a�rmar qual referencial está

se movendo e qual está parado.). Suponha então que exista algum outro relógio em S0 (mecânico, atômico

etc) que não sofra exatamente a mesma dilatação do nosso relógio de luz. Um observador em S0 poderia

então medir a diferença de tempo entre estes relógios e, com isso, determinar que o seu referencial está se

movendo. Assim, adotar os dois princípios da relatividade implica que qualquer relógio que se movaanda mais lento. Na verdade, isso é válido para qualquer seqüência de evento, seja ele uma gota caindo,uma planta crescendo, qualquer coisa! Ou seja, para quem está na nave, tudo na terra parece estar emcâmera lenta.

Para ilustrar o signi�cado da expressão (12), imagine que em S0, juntamente com o relógio, existe uma

torneira gotejante. Esta torneira está a uma altura na qual, quando medido em S0 (i.e., no referencial onde

a torneira e o relógio estão em repouso) a gora demora 1 segundo para atingir o piso. Já um observado

do referencial S, que se move com = 2, este tem duas possibilidades para marcar o tempo de queda dagota: ele pode usar o seu relógio (que está em repouso em S) ou pode usar o relógio do referencial S0,supondo que ele possa ver tanto a torneira quanto o relógio. Suponha então que o nosso observador em S

tem em sua mão um cronômetro, assim que a gota começou a cair o relógio de S0 marcava 0h00m00s e o

observador acionou o seu cronômetro. Ele continua observando a gota e o relógio de S0. Quando a gota

atingiu o chão, o relógio de S0 marcava exatamente 1s (t0 = 1s) e nosso observador para o seu cronometro.

Observe que tanto o nosso observador em S, quanto alguém em S0, concordam com o fato de que a gota

atingiu o solo em t0 = 1s. Neste momento ele olha para o seu cronômetro e ele marca um tempo:

t = t0 = 2� 1 = 2s :

Observe que, obviamente, toda a descrição acima não depende de quem você chama de S e S0. Relógiosem movimento andam mais devagar. Ou seja, se existe um observador A com um relógio no pulso (i.e.,

está parado em relação ao relógio) e um outro observador B que vê A se movendo com velocidade v. Para B

este relógio se moverá mais devagar do que para A. Na verdade, tudo que A �zer, ou que se mover com ele,

parecerá estar em câmera lenta.

29

Page 30: Parte A (Relatividade)

Para tirar a mesma conclusão acima usando diretamente as TL (7) imaginamos que A (e o relógio) está

no centro do sistema S, ou seja, a coordenada do relógio no sistema sem linha é x = 0. Então o observador

B no sistema S0, que vê S se mover com velocidade v para a direita usará a transformação

t0 =

�t� v (x = 0)

c2

�= t :

Agora se B estiver no centro do sistema com linha (x0 = 0) e também tiver um relógio, o observador A, no

sistema sem linha, verá o relógio de B se mover com velocidade �v para a esquerda. Com isso, A pode usar

a transformação

t =

�t0 � (�v)x

c2

�=

�t0 +

v (x = 0)

c2

�= t0 :

Ou seja, se os relógios de A e B um dia estiveram sincronizados (foram produzidos e ajustados no mesmo

referencial, que pode ser diferente de S e S0), então A dirá que o relógio de B anda mais devagar e, ao mesmotempo, B dirá que o relógio de A anda mais devagar.

Vejamos uma conseqüência deste fenômeno. Um méson-� (muon) é uma partícula elementar parecida

com o elétron (carga e spin), porém um pouco mais pesada, que se desintegra espontaneamente devido a

interação fraca, decaindo num elétron e num neutrino

�� �! e� + ��e + �� :

Esta partícula pode ser produzida em laboratório e seu tempo médio de decaimento é de 2:2 � 10�6 sec.Estas partículas são produzidas também por raios cósmicos ao atingirem a atmosfera terrestre. Isso ocorre

em altitudes superiores a 10Km. Pelo tempo médio de vida do �, com a energia com que estes raios cósmicos

são produzidos, ele poderia percorrer distâncias da ordem de 600m. Entretanto, alguns destes � produzidos

na alta atmosfera atingem a superfície da terra (i.e., viajam mais de 10Km). A resposta para este enigma

é que alguns destes � criados pela radiação cósmica possuem velocidades próximas a da luz (o que pode

ser medido no momento da detecção). Enquanto no referencial do � sua vida é de apenas 2:2:�s, quando

vistos da terra este tempo se dilata o su�ciente para que ele alcance a terra. Mesmo que o mecanismo de

desintegração dos ��s não seja conhecido, e di�ra completamente dos efeitos eletromagnéticos, sabemos que,

por obedecer ao princípio da relatividade, este mecanismo será mais lento para um � em movimento.

Remark 17 Um ponto a se observar no desenvolvimento acima é que, apesar da velocidade da luz não

depender da fonte a direção do feixe de luz depende do observador. Este efeito é chamado de aberração.

Para evidências experimentais da dilatação do tempo, consulte:

� G. Gwinner, Experimental Tests of Time Dilation in Special Relativity, Mod. Phys. Lett. A, 20, no.11 (2005), pg 791.

30

Page 31: Parte A (Relatividade)

2.7 Simetria das transformações

Um ponto a se notar, o qual a primeira vista parece gerar uma série de paradoxos, é a simetria presente nastransformações de Lorentz. Se invertermos as relações (7) obtemos

x = (x0 + vt0) ;

y = y0 ; z = z0 ;

t =

�t0 +

vx0

c2

�: (13)

O que obviamente representa apenas a troca do sinal da velocidade v, pois, se um referencial vê o outro ir

para a direita, o outro vê o primeiro ir para a esquerda (lembrando sempre que não faz sentido falar em

qual realmente se move). Uma conseqüência das relações acima é que, cada referencial vê um relógio nooutro referencial andar mais devagar.Este fato, a princípio, parece estar em con�ito com o primeiro postulado. Um exemplo famoso é o chamado

�paradoxo dos gêmeos�: dois irmãos gêmeos trabalham no programa espacial, um deles como astronauta

o outro como operador de terra (ground control). A primeira missão acontece no aniversário dos gêmeos,

completando então 30 anos. O controlador se despede do seu irmão que decola na nave. A nave viaja por 10

anos contados na terra, com uma velocidade que, apenas para facilitar as contas, vamos supor o �ctício valor

de v =p3c=2. Assim, o irmão que �cou na terra vê o tempo dentro da nave andar mais devagar, de sorte que

cada 2 anos passados na terra corresponde a apenas 1 ano dentro da nave. Então, quando seu irmão retorna,

após dez anos terrestres, ter-se-ão passados apenas 5 anos para o astronauta. Ou seja, o irmão gêmeo na

terra terá 40 anos enquanto o seu irmão astronauta terá apenas 35! Agora, uma análise ingênua das relações

inversas acima pode levar a seguinte a�rmação: para o astronauta quem se move é a terra (se afastando da

nave), então é o relógio de quem �cou na terra que anda mais devagar. Assim, quando ele voltar para a terra

o seu irmão é que terá 35 e ele 40.

Exercise 18 Mas, quando eles realmente se encontrarem, qual deles terá razão?

Antes de prosseguirmos vamos olhar para outro exemplo completamente equivalente ao problema acima,

mas onde não precisemos comparar idades. Voltando ao exemplo da nossa torneira gotejante, imagine que

tanto na nave S0 quanto na terra S existe ao lado do relógio uma torneira que goteja num balde a uma taxa

de 1G=h (lembre-se que ambos os observadores concordam com esta taxa para a sua torneira). Suponhatambém que a nave viaja com = 2 e depois de 1 hora (medidos na terra) reverte instantaneamente o seu

motor e retorna à terra com a mesma velocidade. Quanto o observador na terra (B) olha a ocorrência dofenômeno da reversão dos foguetes da nave depois de t = 1h o relógio na nave marca t0,

t = t0 =) t0 =1

t =

1

21 =

1

2h :

31

Page 32: Parte A (Relatividade)

Então, enquanto B vê uma gota cair no seu balde, ele constata que em S0 nenhuma gota caiu. Depoisdo retorno da nave B vê seu relógio marcar t = 2h (i.e., outra gota caiu no seu baldo) enquanto o relógio

da nave marcará t = �1t0 = 1h, i.e., a primeira e única gota acaba de cair no balde na nave. Assim B

espera que ao comprar os baldes, o seu balde tenha 2 gotas enquanto o balde na nave terá apenas 1. Da

mesma forma como no paradoxo dos gêmeos, se mudarmos para a descrição de um observador A na nave,

numa primeira análise poderíamos esperar que A a�rmasse que a viagem demorou 2h (e ele teria duas gotas

no seu baldo) enquanto um relógio na terra (para ele em movimento) marcou apenas 1 hora de viagem e,

conseqüentemente, apenas uma gota teria cído no balde da terra. Assim, quando eles se encontrarem, A

esperaria 2 gotas no seu balde e apenas 1 gota no balde da terra. Repetindo a pergunta anterior: quem está

com a razão?

O ponto aqui é que para retornar a terra o astronauta teve de mudar sua velocidade e, conseqüentemente,

sofrer aceleração. Quando isso ocorreu o seu referencial deixou de ser inercial, de sorte que ele não pode mais

usar as suas medidas (seria como aplicar as leis de Newton num vagão acelerado). Desta forma, apenas o

referencial de quem �cou na terra é inercial em todo o processo e apenas este pode usar diretamente a TRR.

Ou seja, a TRR diz que o irmão que �cou na terra está certo e seu irmão astronauta estará mais novo. A

análise do ponto de vista do referencial não inercial pode ser feita se usarmos o conceito de tempo próprio,que será introduzido posteriormente.

Uma outra questão interessante no exemplo das gotas no balde acima é: se B (na terra) a�rma que os

foguetes de A (na nave) foram revertidos em t = 1h. A que horas num relógio de A isto ocorreu? Vamos

simpli�car este exemplo com apenas uma viagem de ida e uma forma mais simples de comparar os relógios.

Imagine que um observado tem um cronômetro e passa por ele (atirado por algém) um outro relógio com

= 2. Quando os dois relógios se encontram eles estão sincronizados com t = t0 = 0 e o cronômetro é

acionado. O observador sabe que a uma distância dep3=2m existe uma parede e o outro relógio irá se chocar

com ela depois de t = 1s. Quando o relógio viajante se choca com a parede ele pára de funcionar. Neste

momento o observador para o seu cronômetro (que marca t = 1s) e caminha até o relógio quebrado.

Exercise 19 Quanto marca o relógio quebrado?

Pelo que foi dito antes, o relógio quebrado sofreu aceleração, mas o nosso observador permaneceu sempre

num referencial inercial, ou seja, o nosso observador sabe a veradede. Assim, usando o ponto de vista do

nosso observador, o relógio terá parado as

t = t0 =) t0 =1

t =) t0 =

1

2s :

Observe que alguém que viajasse com o relógio também veria este parar porque bateu na parede. Assim,

para quem viaja com o relógio o choque aconteceu 1=2s (e não 1s) depois que os dois relógios se encontrarão.

Como um observador B que caminha junto com o relógio, i.e., que bateu na parede e sobreviveu, explicaria

32

Page 33: Parte A (Relatividade)

a marcação dos relógios quando estes se encontrassem5 .

Apesar de podermos calcular todos os ocorridos, a descrição rigorosa deste fenômeno exclusivamentepelo ponto de vista do referencial que sofreu aceleração está fora do escopo da TRR. Mas pela experiência

adquirida com a teoria da relatividade geral sabemos que o oservador B veria o relógio de A andar mais

devagar até o choque com a parede. Assim, no momento do choque o relógio de A visto por B marcaria

(lembrando que para B o choque ocorreu em t0 = 0; 5s)

t0 = t =1

2s =) t =

1

t0 =

1

4s :

Ou seja, o relógio de A estava ainda mais atrasado. Entretanto, durante o processo de desaceleração, B

veria o relógio de A andar mais rápido (tão mais rápido quanto maior a aceleração) de sorte que, durante

a desaceleração o relógio de A passaria o relógio de B e, quando ele �nalmente parasse o relógio de B teria

conseguido atingir os 1s.

Exercise 20 Alice embarca numa nave, deixando seu irmão gêmeo Bob na terra, e viaja por 2; 2�108s (' 7anos) do tempo dela, com uma velocidade de 0; 96c. Após este período ela (instantaneamente) reverte a

direção de seu foguete e retorna a terra (com a mesma velocidade). Quem será o mais velho dos irmãos e

qual a diferença na idade?

Testes realizados com relógios atômicos, inicialmente sincronizados, con�rmam a hipótese discutida acima.

� C. W. Sherwin, Some Recent Experimental Tests of the �Clock Paradox�, Phys. Rev. 129 no.1 , pg 17(1960)

� J. Hafele, R. Keating, Around the world atomic clocks:observed relativistic time gains, Science Vol. 177pg 166 (1972)

5Lembre que o cronômetro foi parado antes do observador A se movesse, de sorte que seu movimento é irrelevante.

33

Page 34: Parte A (Relatividade)

2.8 Sobre o espaço

O efeito da contração do espaço, ou contração de Lorentz, já foi discutido no experimento de MM. O único

ponto é que na TRR este efeito não deve ser interpretado, como fez Lorentz, como uma modi�cação na

estrutura da matéria devido a fenômenos eletromagnéticos (o que poderia não ocorrer para outro tipo de

forças), mas sim como um efeito sobre o próprio espaço.Vamos ver um pouco melhor como este efeito é descrito pelas TL.

A segunda linha de (7) a�rma que não há mudanças nas coordenas, e conseqüentemente nos comprimentos,

perpendiculares ao movimento. Este fato já foi usado na análise da dilatação do tempo do relógiode luz. A invariância das distâncias perpendiculares ao movimento é, na verdade, uma conseqüência diretado primeiro postulado. Usando um exemplo de Taylor e Wheeler (Spacetime Physics): Imagine um trilho

reto, um trem que se move com velocidade v sobre ele e um túnel. Pode um observador na terra (S) (em

repouso com o túnel) observar alguma contração na altura do trem ou, por outro lado, alguém no trem (S0)

observar contrações na altura do túnel? Para veri�car tal coisa bastaria, no sistema em repouso com o túnel,

se construir o trem exatamente da altura do túnel. Se houver uma contração perpendicular ao movimento

para um observador no trem o túnel irá se contrair e o trem não poderá passar por ele, causando assim um

desastre calamitoso. Por outro lado6 , alguém em repouso com túnel veria a altura do trem se contrair e ele

passaria pelo túnel sem dano algum. Entretanto, o fato de passar ou não pelo túnel é uma realidade física que

deve ser compartilhada por todos os observadores. Isso só é possível se não houver nenhuma contraçãona direção perpendicular ao movimento. Vejamos agora os outros dois membros da transformação.Suponha um vagão de trem de comprimento L com um espelho em uma das laterais. Se um sinal de luz

é emitido do lado oposto ao espelho, para um observador A num referencial S para o qual o vagão está em

repouso, o feixe de luz retornará a fonte num tempo:

t = 2L

c:

Agora vamos analisar o mesmo experimento do ponto de vista de um observador B, num referencial S0

para o qual S se move com velocidade v. Para este observador o tempo total de viagem do feixe é a soma do

tempo t01 para ir da fonte ao espelho e t02 para ir do espelho para a fonte. Calculando a distância percorrida

pela luz nestes dois tempos temos

ct01 = L0 + vt01 =)L0

(c� v) = t01

ct02 = L0 � vt02 =)L0

(v + c)= t02

6Lembre-se que, pelo primeiro postulado, devemos esperar uma simetria nos efeitos.

34

Page 35: Parte A (Relatividade)

Figure 4: Observe que esta �gura apresenta quantidades com e sem linha. Você jamais pode comparargeometricamente estas quantidades. Ou seja, a �gura não representa a visão de nenhum dos observadores.

onde L0 é o tamanho do vagão para o observador B. Assim, a distância total percorrida pela luz para B vale

c (t01 + t02) = c

L0

2

�1

(c� v) +1

(v + c)

�= cL0

1

c2�1� v2

c2

� (2c)= 2L0

1�1� v2

c2

� = 2L0 2 = ct0 ;

L0 =c

2 2t0 ;

onde t0 = t01+ t02 é o tempo total do percurso (medido por B) no sistema S

0. Agora, pela dilatação do tempo

sabemos que:

t0 = t = 2L

c=) L0 =

c

2 2 2L

c;

ou

L0 =1

L :

Ou seja, o tamanho do vagão quando visto por B é menor que o valor medido por A. Esta é a contração de

Lorentz. Apesar do valor obtido ser o mesmo da hipótese de Lorentz sobre a contração do experimento de

MM, este resultado é conceitualmente muito diferente.

Vejamos como o resultado acima se relaciona com as TL. Suponhamos agora o observador A marcou um

certo ponto P dentro do vagão que dista de �x do início do vagão. Se ele usar um sistema de coordenada

que tem origem no inicio do vagão, poderá identi�car �x = x. Ou seja, x é a coordenada de um ponto do

sistema S que tem o início do vagão como origem. Se o observador B em S0 quiser identi�car este mesmo

35

Page 36: Parte A (Relatividade)

ponto (uma entidade física, ou geométrica), sabendo que o início do vagão esta a uma distância vt0 + x00,

onde x00 a distância inicio do vagão ao centro do sistema S0 no instante t0 = 0, temos

x0 = vt0 + x00 +�x0 = vt0 + x00 +

1

�x = vt0 + x00 +

1

x :

Agora, se os dois referenciais concordarem em começar a contar o tempo quando as origensdos referenciais se encontrarem, ou seja, quando o inicio do vagão passar pela origem do sistema S0,

então x00 = 0 e lembre que �x = x. Com isso, isolando todos os termos com linha,

x = (x0 � vt0) :

Que é o primeiro termo das TL em (7), com o sinal da velocidade devidamente ajustado7 . Vemos então como

a linguagem de réguas e relógios se traduz na linguagem das transformações de Lorentz.

É interessante agora analisar o problema do decaimento do � novamente. Suponha que você é o �, ou

pelo menos esteja num referencial que se move juntamente com o �, para você não há a dilatação do tempo

descrita anteriormente e o � viverá apenas 2:2�s.

Exercise 21 Problem 22 Como, neste tempo, você conseguirá viajar do topo da atmosfera até a superfícieterrestre?

No referencial do �, o espaço medido por alguém na terra se contrai pelo efeito descrito acima. Assim, se

para alguém na terra o � viajou 10Km (durante mais de 2:2�s), para o � ele viajou apenas 600m (durante

2:2�s).

Até o momento não existe nenhum teste experimental direta da contração da do comprimento dos obje-

tos8 . Uma vez que a medida do comprimento de objetos em movimento, com a precisão necessária para a

comprovação, está aquém das tecnologias atuais. Entretanto, uma série de evidências indiretas deste efeito

pode ser observada. Um exemplo simples é o seguinte:

Um �o que carrega uma corrente estacionária pode ser considerado praticamente neutro, quando observado

de um referencial onde o �o está parado. Uma vez que os elétrons em movimento se deslocam por uma rede

de átomos com carga contrária. Isso pode ser comprovado pelo fato de cargas em repouso (em relação ao �o)

não sofrerem nenhuma in�uencia deste. Agora, se analisarmos o comportamento de uma carga que se move

com velocidade constate, igual a dos elétrons na corrente9 , e paralela ao �o, devemos esperar que o campo

magnético gerado pela corrente in�uencie o movimento da carga pela força de Lorentz. Esta é a descrição de

um observador em repouso com o �o sobre o deslocamento (e conseqüentes forças) da carga.

Entretanto, um observador que se desloque juntamente com a carga, verá uma contração na distância

entre as cargas positivas (paradas na rede em relação ao �o). Conseqüentemente a densidade de cargas

7É crucial que você saiba identi�car as quantidades em cada problema, sem se �bitolar�nas expressões.8O exemplo a seguir e esta a�rmação foram retirados de:http://math.ucr.edu/home/baez/physics/Relativity/SR/experiments.html9Lembrado que a velocidade dos elétrons é de alguns milímetros por segundo.

36

Page 37: Parte A (Relatividade)

positivas será agora maior que as negativas e uma força elétrica agirá na carga. Por outro lado, como a carga

está em repouso para este observador, nenhuma força magnética é esperada. Assim, este observadordescreve as forças que agem sobre a carga, apenas como um efeito da força elétrica. Esta última forçafoi prevista usando a contração de Lorentz e o resultado confere com o experimento. Esta é uma evidência

(indireta) de que a contração ocorre.

(Pode ser medido experimentalmente)Um ponto importante deste experimento é que, devido a enorme intensidade das forças eletromagnéticas

envolvidas, o efeito pode ser veri�cado e medido mesmo para velocidades muito baixas e, conseqüentemente,

este tipo de experimento pode ser facilmente implementado no laboratório. Para uma descrição mais detal-

hada veja: Purcel, Electricity and Magnetism.

2.9 Simultaneidade

Nas seções anteriores vimos como a exigência de que um certo fenômeno tenha uma "realidade física" nos

permite obter vário resultados da TRR. Por exemplo, quando falamos da não contração das componentes

ortogonais ao movimento. Entretanto, a a�rmação de que algo possua uma realidade física precisa ser

analisada com muito cuidado na TRR. Antes de Einstein poucas pessoas duvidariam que a a�rmação �issoaconteceu no mesmo instante daquilo�, ou �aquilo aconteceu no mesmo lugar disto�, possui umarealidade física. Porém, vejamos o seguinte exemplo:

Imagine um celeiro (ou uma garagem) e uma escada. A escada foi construída para caber exatamente no

celeiro. Ou seja, num referencial em que ambos estão parados, ambos têm comprimento L, Figura 3-a. O

celeiro possui duas portas automáticas, uma de cada lado. Estas portas possuem um relógio onde se pode

programar o momento do fechamento e da abertura. Ambas as portas do celeiro estão abertas e a escada é

introduzida com velocidade v. Quando a escada está dentro do celeiro, ambas as portas se fecham e tornam a

abrir rapidamente. Para uma pessoa dentro do celeiro, que vê a escada se mover com velocidade v, a escada

sofre uma contração de Lorentz e passa a ter um comprimento �1L < L (Figura 3-b). Assim, quando

ambas as portas se fecharem a escada cabe (com folga) dentro do celeiro. Ou seja, para a pessoa dentro do

celeiro a escada entrou no celeiro, as portas se fecharam e abriram e a escada saiu. Depois do experimento

todos os componentes saíram ilesos. Agora, para a pessoa que carrega a escada, que vê o celeiro se mover

com velocidade �v, quem sofre a contração de Lorentz é o celeiro. Assim, como a escada tem agora um

comprimento L maior que o celeiro ( �1L), está não caberá no celeiro. Então, quando as portas se fecharem

ou a escada será cortada ou as portas irão se quebrar, de sorte que um dos componentes será destruído.

Exercise 23 Problem 24 Como só pode haver uma realidade física, o que acontece então com a escada e

o celeiro?

Primeiramente é preciso notar que o problema acima está mal colocado, pois a descrição da montagem

do experimento não faz referencia a nenhum observador em especial. Vamos analisar o problema com todos

os detalhes necessários.

37

Page 38: Parte A (Relatividade)

Figure 5: .

Figure 6: .

(É possível para alguém no celeiro preparar o experimento)Para montar o problema, primeiro vamos a um fato: exceto pelo problema técnico de desenvolver dispos-

itivos rápidos o su�ciente, é possível para alguém no celeiro programar as portas para abrirem e fecharem

quando a escada estiver lá dentro (desde que ele saiba a velocidade da escada e sua posição em algum in-

stante). Isso é um fato e signi�ca: se o homem no celeiro preparou tudo corretamente, a escadacoube no celeiro. Assim, se o experimento foi bem preparado por alguém no celeiro, precisamos então

entender como, no referencial da escada, ela também coube. Chamemos o referencial onde o celeiro está

parado de S e o referencial da escada de S0. Ou seja, sabemos o que aconteceu no referencial S e queremossaber o que aconteceu em S0. Ou ainda, queremos saber como uma seqüência de eventos que ocorreuno referencial S é vista no referencial S0.Na preparação do experimento uma pessoa em S sabe (porque ele conhece todos os dados do experimento)

que o �nal da escada (parte mais a esquerda) vai passar pela porta de entrada exatamente às t = 0h.

Então primeiramente ele veri�ca se os relógios estão sincronizados e, em seguida, programa-os para abrir e

fechar exatamente as 0h.

Para facilitar a descrição, vamos chamar a porta de entrada (a porta da esquerda) de porta 1 e a desaída (a direita) de porta 2. Além disso, no referencial S (no celeiro), chamamos de x = 0 a coordenada do

início do celeiro (porta 1), de x1 a posição da porta 1, x2 a posição da porta 2, t1 o instante que a porta 1

38

Page 39: Parte A (Relatividade)

fechou, t2 o instanate que a porta 2 fechou, x0 (t) o �nal da escada e t0 o instante em que o �nal da escada

passou pela porta 1.

Para o observador do referencial S, existe a seguinte seqüência de eventos:

1. A porta 1 em x1 se fecha no instante t1 = 0 , ou seja, o evento a porta da esquerda se fechou tem as

coordenadas (x1 = 0; t1 = 0);

2. Neste mesmo instante a porta 2 (no ponto x = L) se fechou. Ou seja, o evento porta da direita se

fechou tem as coordenadas (x2 = L; t2 = 0).

3. O inicio da escada (parte mais a esquerda) passa pela porta 1 em t0, (x0 = 0; t0 = 0);

Remark 25 Observe que para o observador em S os eventos 1 e 3 possuem as mesmas coordenadas.Mas, mesmo assim, descrevem eventos diferentes.

Como �cam estas coordenadas (que descrevem estes eventos) quando passadas para o sistema linha.Primeiro vamos acertar as medidas do nosso referencial, ou seja, combinar onde �cam as origens espa-ciais e sincronizar os relógios em algum instante especí�co. Lembre-se que isto é sempre necessáriopara que as TL possam ser usadas. A pessoa que carrega a escada, no referencial S0, chamou de x0 = 0 do seu

sistema o início da escada (parte mais a esquerda). Esta pessoa também tem um relógio e, para comprara

sua medida com a do outro observador o sincronizou da seguinte forma:

1. ele foi até o ponto x0 = 0 e

2. quando este ponto (o inicio da escada, ou a parte mais a esquerda) passou pela porta de entrada ele

leu o relógio de S, que está exatamente neste ponto, e ajustou seu relógio com este valor. Observeque ele leu um relógio de outro referencial, mas que estava exatamente no ponto onde eleestava.

39

Page 40: Parte A (Relatividade)

Esta é a sincronização dos referenciais descrita anteriormente. Feito isso temos que ambos os referenciais

concordam com o evento: o �nal da escada x0 = 0 passou pela entrada do celeiro x = 0 no instante t = t0 = 0.

Fazendo isso os zeros dos dois referenciais coincidem.

Assim, no referencial S0, temos o evento:

a) O início da escada passou pela porta 1 em (x00 = 0; t00 = 0).

b) A porta 1, na posição x01 (t0), se fechou no instante t0 = 0, (x01 = 0; t

01 = 0) :

Novamente os eventos acima possuem a mesma coordenada, mas descrevem coisas diferentes. Observe

que o evento (a) acima é o mesmo que o evento 3 no referencial S e que o evento 1 é o mesmo que (b). Ou

seja, ambos os referenciais concordam quanto as coordenadas dos eventos "o início da escada passou pelaporta de entrada", "A porta 1 se fecha".Vamos agora usar a transformação de Lorentz (7) para responder uma série de perguntas do ponto de

vista do referencial S0. Lembrando que as expressões obtidas em (7) descrevem o problema: Um referencial

S0 que se move para a direita com velocidade v em relação ao referencial S (se você mudar quem é S e quemé S0 terá de inverter o sinal de v).

Perguntas:

1. Quando o início da escada chegou na porta de entrada (evento (a) conhecido: (x00 = 0; t00 = 0)) onde

estava a porta 2 (ou o �nal do celeiro10) x02 (t0), i.e, a porta de saída? Ou ainda, onde estava o �nal do

celeiro no instante t0 = 0? Ou qual o evento (x02 =?; t0 = 0)?

Temos a nossa disposição as tranformaçõs

x02 = (x2 � v:t) ; x2 = (x02 + v:t0) ;

e queremos calcular (x02 =?; t0 = 0). Como conhecemos t0 obviamente podemos usar a segunda destas

expressões11

x2 = (x02 + v:0)) x02 = �1x2 = �1L :

Esta primeira equação é o fato que já sabíamos que celeiro se contraiu e a porta de saída não está mais

em L mas sim em �1L.

IMPORTANTE: Um erro comum no cálculo acima é acreditar que, como os relógios dos referenciais

foram sincronizados em t = t0 = 0, então podemos usar t = 0 e, consequentemente, x0 = (x� v:t) (jáque conhecemos t). Mas o ponto aqui é que (x = 0; t = 0) = (x0 = 0; t0 = 0), i.e., os relógios só estãosincronizados na origem dos sistemas de coordenada. Queremos saber onde um observador em

10Como x2 é a posição do �nal do celeiro no referencial S estamos chamando esta coordenada em S0 de x02, mas lembre-seque, como S0 vê o celeiro se mover, está coordenada é diferente em cada instante do tempo. Então, enquanto em Spodemos falar de uma coordenada x2, em S0 temos de falar sempre de x02 (t

0)).11Lembre-se que, diferente do que ocorreu no caso do foguete, onde devíamos usar apenas o referencial da terra, pois só este

era inercial, agora ambos os referências são inerciais e, portanto, podemos usar arbitrariamente qualquer um deles.

40

Page 41: Parte A (Relatividade)

x0 = 0 vê a porta 2 no instante t0 = 0. Todos os relógios em S0, em especial o que se encontra na

posição da porta 2, estão sincronizados para este observador. Porem, quando o observador em S0 olha

para os dois relógios em S (um em cada porta) no instante de interesse, apenas o relógio da porta 1

está marcando t = 0. O relógio em x = L (o ponto de interesse em S visto de S0) marca um tempo

diferente, como veremos a seguir.

2. Quando, num relógio em S0, a porta 2 do celeiro se fechou? Quanto vale t02 sabendo que (x2 = L; t2 = 0)

(evento conhecido 2)?

Novamente temos a nossa disposição duas relações:

t =

�t0 +

vx0

c2

�; t0 =

�t� vx

c2

�Como conhecemos os valores no referencial sem linha usamos:

t02 = �t2 �

vx2c2

�) t02 = �

vL

c26= 0 :

Este é o tempo que um observador no referencial S0 lê no relógio que está na porta 2 do celeiro quando

esta se fecha. Esta segunda equação nos diz que a porta de saída fechou e abriu em t02 = � vL=c2 < t0

0 =

0. Ou seja, enquanto o observado em S viu as duas portas fecharem ao mesmo tempo, um observador

em S0 viu primeiro a porta de saída fechar em t02 = � vL=c2 e, só depois, a porta de entrada fecharem t01 = 0.

Concluindo, o observador que carregava a escada viu: as duas portas do celeiro estavam abertas; a ponta

da escada entrou no celeiro e, antes de chegar na porta de saída, esta se fechou e tornou a abrir (mas a porta

de entrada permaneceu aberta), Figua 6-a; o �nal da escada entrou no celeiro e a porta da entrada se fechou

e tornou a abrir (mas a porta de saída permanecer aberta), Figura 6-b. Desta forma, a escada (mesmo para

quem a empurrava) pode entrar e sair ilesa do celeiro sem destruir as portas.

Na verdade, sabemos que a porta de saída fechou antes da porta de entrada. Entretanto, isso não prova

que a escada não foi dani�cada. Lembre que a escada é maior que o celeiro, então, mesmo que seu inicio

ainda não tenha passado pela porta 1, seu �nal já pode ter atingido a porta 2. Para efetivamente provar

que a escada não se dani�cou, temos que mostrar que, quando a porta de saída se fechou nenhum pedaço da

escada estava nesta posição.

Exercise 26 Mostre que quando a porta de saída do celeiro se fechou em t02 = � vL=c2 o �nal da escadaem x0f = L ainda não tinha chegado na porta de saída.Hint: no referencial S0 o �nal da escada está (sempre) em x0f = L, basta mostrar que em t02 a coordenada

em S0 da porta 2 e maior que a coordenada do �nal da escada, x02 > x0f ).

41

Page 42: Parte A (Relatividade)

Figure 7: .

Enquanto o fato �a escada entrou e saiu (ilesa) do celeiro�, permanece válida para ambos os observadores

(conservando, neste sentido, a sua realidade física), a a�rmação �as portas do celeiro se fecharam aomesmo tempo�só é válida para o observador do celeiro. Um observador que carrega a escada (que tambémmerece a sua credibilidade) vai garantir (com provas) que a porta de saída abriu antes da de entrada.

Assim, o conceito de simultaneidade não possui mais uma realidade compartilhada por todos osobservadores em TRR. Como já vimos (e continuaremos vendo com o desenvolver das idéias), o mesmo

acontece com a a�rmação �isso ocorreu a uma certa distância daquilo�.

42

Page 43: Parte A (Relatividade)

2.10 Sincronização de relógios e observação

O exemplo da seção anterior deixa claro o fato já citado que relógios sincronizados num certo instantenão estarão mais sincronizados em outros instantes. Mas, antes de entrar nos detalhes deste fato,vamos tentar explicar melhor o que signi�ca uma a�rmação do tipo: �o observador em S �vê�um evento�,

ou, �um observador em S �lê�um relógio em S0�.

No sentido usual, para um observador ver um evento, e.g., um relógio, num ponto distante este relógio

precisa ser iluminado e a luz re�etida para o observador. Isso demora um certo tempo. Com isso, da mesma

forma que muitas estrelas que brilham hoje no céu já se apagaram, um observador jamais veria o horário que

relógio distante marca, mas apenas o horário que ele marcava em algum instante anterior. Quando falamos

em �ver�nas seções anteriores, não estamos falando deste tipo de observação.O efeito do atraso descrito acima, apesar de real, insere em nossos observadores uma ignorância sobre as

coordenadas reais (num sentido que discutiremos) de um evento. Esta ignorância pode levar a interpretação

errônea de que os efeitos da TRR (discutidos anteriormente) são meras ilusões. Isso não é verdade, estes

efeitos são reais no sentido de que nenhum experimento poderia desmascará-los. Além disso, o sentido usual

de visão poderia depender do caminho que a luz faz do objeto até o observador. Ou seja, um observador

poderia ver um relógio olhando diretamente para ele, ou olhando para o seu re�exo num espelho. Neste caso

a visão direta e a re�etida marcariam tempos diferentes. Para eliminar estes problemas, gostaríamos de criar

um modelo onde um observador pudesse realmente �ver�o que ocorre num ponto distante.

Quando falamos da sincronização dos relógios no exemplo anterior salientamos que o observador na origem

de S0 olhava para um relógio que, mesmo pertencendo ao referencial S, está exatamente naquele ponto.O problema é que, como vimos, relógio perdem a sincronia com o movimento.Imagine que o referencial S é um vagão de trem que possui uma janela em cada extremidade e está, ou

parado, ou em movimento constante, i.e., é um referencial inercial. Neste vagão temos duas pessoas A e B

que usam as coordenadas deste mesmo sistema S. Usar as mesma coordenada signi�ca que elas concordam

em chamar de origem o inicio do vagão e usam as mesmas réguas para medir distâncias. Alémdisso, num dado momento elas se encontrar num dado ponto, e.g., o inicio do vagão, e sincronizam seus

relógios. Agora elas realmente compartilham o mesmo sistema de coordenadas.As duas pessoas permaneceram no inicio do vagão até que um dia uma delas (A) resolveu olhar pela

janela no �nal do vagão. Ela andou até lá e presenciou o fato curioso de que um pássaro se chocou contra

o vidro da janela. Ela resolve então registrar este fato: o evento ocorreu em (x = L; t = T ). Então ela volta

para o início do vagão e conta isso para a pessoa que �cou lá parada e não teve a chance de presenciar o �m

trágico da ave. Depois de contar o fato e apresentar as coordenadas do evento, eles, por uma razão qualquer,

comparam de novo os seus relógio e observam, abismados, que estes não estão mais em sincronia. O queaconteceu? Bem, quando o observado A se moveu para o �nal do trem, ele passou a estar em movimento

em relação ao observador B. Assim, visto de B, o relógio de A andou mais devagar e, conseqüentemente, se

desincronizou. O resultado disso é que se A tivesse simplesmente entregue para B as coordenadas do evento,

este tiraria uma conclusão completamente errada sobre o momento da morte do pássaro. Ou seja, uma vez

43

Page 44: Parte A (Relatividade)

sincronizado os relógios os observadores não podem se mexer.Como então B pode saber (com precisão) o que acontece em ambas as janelas do vagão? Tudo que ele

precisa fazer é, estando na janela no início do vagão, sincronizar o seu relógio com A que já está no �nal do

vagão. Para isso ele simplesmente instala uma lâmpada no meio do vagão (que tanto A como B concordam

onde é) e programa esta lâmpada para ascender depois de um certo tempo (su�ciente para que ambos se

dirijam a sua janela). Então, sabendo da constância da velocidade da luz, A combina com B: quando

o sinal de luz chegar até você (o que pode ser detectado com um sensor), marque zero no seu relógio que eu

farei o mesmo. Feito isso, sem que nenhum deles se mova, A registra todas as maravilhas que se passam no

�nal do trem e depois leva o relatório, com as respectivas coordenadas, para B. Quando A se moveu para

levar o relatório, eles perderam a sincronia dos relógios, mas, como B nunca se moveu e todos os eventos

foram registrados antes que A se movesse, todas as informações contidas no relatório possuem as coordenadascorretas para B.

Exercise 27 Pense numa forma de sincronizar 3 relógios num referencial.

Então, a idéia aqui é que um observado só pode registrar o que ocorre no ponto onde ele está,no momento em que ele está ali, e só pode se mover quando a experiência acabar. Assim, naTRR, um referencial é uma in�nidade de observadores, cada um num ponto do espaço e com o seu próprio

relógio. Num dado instante todos estes relógios são sincronizados, usando a constância da velocidade da luz.

Feito isso, os observadores registram tudo que ocorre no seu posto e, apenas ao �nal do experimento, eles se

encontram e trocam informações.

Dizer �um observador em x = 0 vê um evento que ocorre em x = 5 num instante t = 0�, signi�ca que o

seu parceiro naquela posição registrou este evento. Isso é o que deve ser entendido por �ver�nos exemplos

anteriores.

Da mesma forma, referenciais diferentes podem trocar informações. Se um evento ocorre num ponto

(físico ou geométrico) do espaço que uma pessoa A em S chamou de x = 1 e registrou em t = 3, uma pessoa

B em S0 que está neste mesmo ponto, que para ela é, por exemplo, x0 = 10 registrou este evento no seurelógio, por exemplo, em t0 = 5. Estas duas pessoas, que estão paradas em seus respectivos referenciais,

mas se movem uma em relação a outra, se encontram neste mesmo ponto físico e, sem abandonarem seuspostos, trocam relatórios. Isso é o que signi�ca �uma pessoa num referencial S vê um evento num referencialS0�. É neste sentido que devem ser entendidas as relações das transformações de Lorentz.

A leitura de distâncias entre referenciais diferentes é bem mais sutil. O problema é que esta medida envolve

eventos em pontos distintos, mas sempre no mesmo instante para o referencial que faz a medida.Alguém no referencial S0 (que se move com velocidade v para a em relação a S) carrega uma barra de 1

metro. Suponha agora que alguém em S quer medir esta barra. Primeiro ela escolhe um instante qualquer t,

neste instante todos os observadores em S olham para a barra. Um (e apenas um) destes observadores em S

vai ver o �nal da barra e outro o início. Quando a medição termina (após t) o observador que mediu o �nal

da barra pergunta para todos os outros quem, em t, viu o inicio da barra. Estes dois observadores, cada um

44

Page 45: Parte A (Relatividade)

conhecendo a sua posição no referencial S no momento da medição, podem então dizer o tamanho da barra

vista de S.

De outra forma, suponha que em S0 a barra tem comprimento L0 e está parada em x0I = 0 e que os

referenciais sincronizaram seus relógios na origem. A medição em S foi realizada num instante t. Neste

instante (que deve ser �xado em S, porque ele está fazendo a medida) temos

x0I = (xI � v:t) = 0

x0F = (xF � v:t) = L0

Subtraindo estas expressões temos:

x0F � x0I = (xF � v:t)� (xI � v:t)

= [xF � xI ]

L0 � 0 = [xF � xI ] =) [xF � xI ] =1

L0 = L :

Então, a razão de termos um fator para o tempo (dilatação temporal) e �1 para o espaço (contração

espacial) vem do fato das medidas de tempo ser feitas diretamente, mas as de comprimento estarem sujeitas

ao vínculo de simultaneidade no referencial que realiza a medida.

Imagine agora que a medida acima foi realizada de outra forma (completamente equivalente). Nosso

referencial S0 pode ser um vagão cujo assoalho é uma grade. O observador em S, sabendo da sua necessidade

futura de medir a barra, preparou o seguinte dispositivo: ele instalou dois explosivos um de cada lado da

barra e programou os detonadores para acionar num mesmo instante t do seu referencial S (como veremos, na

verdade é muito difícil dizer como ele fez isso). Então ele está parado no seu referencial S e vê os explosivos

nas extremidades da barra no vagão explodirem no mesmo instante de tempo t (para facilitar a compreensão,

imagine que quando isso ocorreu ele estava no meio da barra). Como o piso do vagão é perfurado (uma grade)

a explosão chamuscou não apenas o piso do vagão (referencial S0), mas também o chão onde o vagão passava

(referencial S). Como o observador em S sabe que os eventos da explosão ocorreram no mesmo instante t, ele

sabe que as marcas no chão correspondem exatamente ao tamanho da barra. Então ele mede esta distância

e obtém o tamanho L calculado acima. Mas lembre-se que o piso do vagão também foi marcado. Entretanto,

dentro do vagão a distância entre cada explosão é exatamente o comprimento da barra L0 (certamente ele

viu uma explosão em cada extremidade da barra e, para ele, a barra não se moveu). Mas o observador no

trem sabe que o chão foi chamuscado pelas explosões na barra. Como então ele explica que a distância entre

as marcas no chão vale L < L0?

45

Page 46: Parte A (Relatividade)

Para responder a pergunta acima, observe também que no instante t temos

t0I = �t� xIv

c2

�; t0F =

�t� xF v

c2

�;

t0I � t0F = � v

c2[xI � xF ] = �

v

c2

�� 1 L0�=

v

c2L0 ;

�t0 =v

c2L0 :

Isso signi�ca que os explosivos não foram detonados no mesmo instante para um observador em S0.Ou, num processo geral de medida, visto do referencial S0 as duas pessoas em S não registraram o tamanho

da barra no mesmo instante. A pessoa no inicio da barra fez o registro, mas, só depois de um tempo �t0, a

outra pessoa registrou o �nal da barra. Neste tempo o observador em S0 sabe que a barra se moveu para S e

este movimento, juntamente com o atraso do medidor que registrou o �nal da barra, foi a causa da medida

contraída em S (esta é a explicação de um observador em S0, pois para os observadores em S a medida foi

realizada corretamente). Nesta descrição vemos que o observador em S0 não considera as explosões como

uma medida de distância. Ou seja, o evento das explosões é uma medida de distância em S, mas não em S0.

Assim, como mencionamos anteriormente, um processo de medida requer eventos que ocorreram em tempos

iguais.

46

Page 47: Parte A (Relatividade)

2.11 Efeito Doppler

Como mencionado anteriormente, os efeitos relativísticos não são notados no cotidiano. E, apesar de hoje

as energias envolvidas nas experiências terem a ordem de grandeza para que estes efeitos sejam relevantes,

inicialmente a melhor forma de se observar estes efeitos foi através de medidas astronômicas. Ou seja,

observando a luz de astros que se moviam com velocidades comparáveis a da luz. Vejamos que tipos de

efeitos devemos esperar destas observações.

A solução da equação de uma onda plana pode ser escrita como

exp i (k:x� !t) ; ! = 2�f ; !k= V

onde f é a frequência, k o vetor de propagação cujo módulo é igual ao recíproco do comprimento de onda e

V a velocidade de propagação. A quantidade entre parênteses na expressão acima é a fase da onda.

Para um sinal luminoso (V = c) cujo vetor de onda está no plano x� y, fazendo um ângulo � com o eixo

x, temos

k:x� !t = k:x cos�+ k:y sin�� !t ;

=!

c[x cos�+ y sin�� ct] :

Um sinal luminoso que se propaga na direção k, após um tempo t terá percorrido uma distância

r = ct) x cos�+ y sin� = ct) x cos�+ y sin�� ct = 0 :

Ou seja, a frente de onda de um sinal luminoso emitido na origem em t = 0 percorrerá uma distância ct. O

mesmo é válido para qualquer parte da onda. Assim, para um sinal luminoso (no vácuo) a fase da frente de

onda vale

k:x� !t = 0 :

Além disso, se este mesmo sinal for observado de um referencial S0 que se move com velocidade vx em relação

a S, ele terá uma direção de propagação k0 e, após um tempo t0 terá percorrido a distância

r0 = ct0 ) x0 cos�0 + y0 sin�0 = ct0 ) x0 cos�0 + y0 sin�0 � ct0 = 0 :

Assim, da mesma forma que antes, temos neste referencial

k0:x0 � !0t0 = 0 = k:x� !t

47

Page 48: Parte A (Relatividade)

ou ainda

!0

c[x0 cos�0 + y0 sin�0 � ct0] =

!

c[x cos�+ y sin�� ct]

!0 [x0 cos�0 + y0 sin�0 � ct0] = ! [x cos�+ y sin�� ct] (14)

Usando agora as TL temos inversas

x = (x0 + vt0) ;

y = y0 ; z = z0 ;

t =

�t0 +

vx0

c2

�:

temos

!0 [x0 cos�0 + y0 sin�0 � ct0] = !

� (x0 + vt0) cos�+ y0 sin�� c

�t0 +

vx0

c2

��!0

![x0 cos�0 + y0 sin�0 � ct0] = x0 cos�+ vt0 cos�+ y0 sin�� c t0 � c vx

0

c2

!0

![x0 cos�0 + y0 sin�0 � ct0] = x0

� cos�� v

c

�+ y0 sin��

�1� v

ccos�

� ct0

Comparando os termos de cada componente temos

!0

!cos�0 =

�cos�� v

c

�;

!0

!sin�0 = sin� ;

!0

!=

�1� v

ccos�

�: (15)

Especialmente da última expressão temos

f 0 = f � �1� v

ccos�

�(16)

Esta mudança na freqüência do sinal luminoso quando observado de diferentes referenciais é chamado de

efeito Doppler 12 .

Exercise 28 Obtenha o efeito Doppler partindo da equação (14) usando as TL diretas (não as inversas como�zemos acima) e mostre que você obtém a mesma expressão (16).

Vamos analisar um caso especí�co. Suponha que um sinal luminoso é emitido em S na direção x. Se S0 se12Proposto Christian Doppler em 1842.

48

Page 49: Parte A (Relatividade)

move para a direita com velocidade v em relação a S (como supomos para obter as expressões acima), então

S0 vê S se deslocar para a esquerda. Com isso, temos duas situações:

1. Antes de S passar por S0, i.e., quando S se move na direção de S0, apenas o sinal emitido na direção�x, ou seja, com � = � será visto por S0. Com isso

f 0 = f � �1� v

ccos (�)

�= f

�1 +

v

c

�= f

vuut �1 + v

c

�2�1� v

c

� �1 + v

c

� = f

s�1 + v

c

��1� v

c

�como �

1 +v

c

�>�1� v

c

�=) f 0 > f ;

a frequencia aumenta, uma luz branca emitida em S será vista azul em S0, este é o famoso blue shift.

2. Depois de S passar por S0, i.e., quando S se afasta de S0, apenas o sinal emitido na direção x, ou seja,

com � = 0 será visto por S0. Com isso

f 0 = f � �1� v

ccos (0)

�= f

�1� v

c

�= f

vuut �1� v

c

�2�1� v

c

� �1 + v

c

� = f

s�1� v

c

��1 + v

c

�como �

1 +v

c

�>�1� v

c

�=) f 0 < f ;

a frequencia diminui, uma luz branca torna-se mais vermelha, este é o famoso red shift.

Estes efeitos são muito usados para se medir a velocidade de corpos celeste. Em especial, o red shift de

galáxias distantes permitiu Hubble determinar que o universo está em expansão.

Problem 29 Mas como se conhece a freqüência original emitida pelos corpos celestes para saber que estesofreu um red ou blue shift?

O ponto é que, como veremos no nosso curso de quântica, as linhas espectrais, i.e., a freqüência das

ondas emitidas pelos materiais são bem conhecidos. E, acreditando que a mecânica quântica vale em todo o

universo, sabemos a freqüência original da radiação emitida.

(efeito Doppler transversal)Um ponto a se notar na expressão do efeito Doppler é que, mesmo para um feixe que se desloque perpen-

dicular ao movimento dos referencias, � = 900 observamos uma modi�cação na frequencia

f 0 = f ;

49

Page 50: Parte A (Relatividade)

conhecido como efeito Doppler transversal.

Remark 30 Na verdade, como � 6= �0, podemos falar em dois tipos de efeito Doppler transversal. Oprimeiro é o descrito acima, quando a fonte emite o sinal perpendicularmente � = �=2. O outro é quando

o observador vê o sinal emitido perpendicularmente �0 = �=2. Neste caso, usando as fórmulas obtidas no

exercício anterior (quando você usou as TL diretas) temos

! = !0 �1 +

v

ccos�0

�) f 0 =

1

f :

Observe que o efeito é completamente inverso ao descrito anteriormente. Enquanto no primeiro tínhamos

um blue shift, agora temos um red shift. Este red shift possui uma explicação bastante simples. No caso geral

do efeito Doppler tanto as contrações espaciais quanto a dilatação do tempo in�uenciam, respectivamente,

no comprimento de onda e na freqüência. Entretanto quando o observador vê a onda perpendicular ao

movimento, apenas a dilatação do tempo é importante. Assim, se em S o período das oscilações vale T , para

S0 ele vale T 0 = T , com isso

f 0 =1

T 0=

1

T=1

f :

2.12 Aberração

Voltemos agora para as primeiras equações em (15).

Se voltarmos para (15)

!0

!cos�0 =

�cos�� v

c

�;

!0

!sin�0 = sin� ;

e substituirmos a última equação!0

!=

�1� v

ccos�

�nas duas primeiras temos

cos�0 =(cos�� �)(1� � cos�) ; sin�

0 =sin�

(1� � cos�) ; � =v

c

ou ainda

tan

��0

2

�=

r1� cos�01 + cos�0

=

s(� + 1) [1� cos�](1� �) [1 + cos�] =

s(� + 1) sin2 �2(1� �) cos2 �2

tan

��0

2

�=

s1 + �

1� � tan�

2

50

Page 51: Parte A (Relatividade)

A mudança da direção de um sinal luminoso quando observado por um referencial em movimento em relação

à fonte é chamado de aberração. A equação acima para a aberração da luz está presente no primeiro trabalho

de Einstein.

Como a tangente é uma função crescente, para o nosso caso de jvj > 0 temos que o observador em S0 veráo feixe emitido com �=2 < � < � com um ângulo maior, ou seja, o feixe se curva na direção do movimento.

Desta forma uma série de feixes com ângulos diferentes tendem a se concentrar na direção do movimento, ou

seja, haverá uma concentração da intensidade do feixe na direção do movimento. Para o caso limite v ! c

temos

tan

��0

2

�!1 =) �0

2! �

2=) �0 ! � :

Ou seja, todos os feixes se concentram na direção do movimento.Quando uma carga é acelerada num movimento circular ela, como qualquer carga, irradia, esta radiação

é chamada de radiação cyclotron. Entretanto, quando a velocidade da carga acelerada se aproxima davelocidade da luz, pelo fenômeno descrito acima, esta radiação se concentra na direção do movimento. Esta

radiação concentrada é chamada de radiação synchrotron.

Remark 31 Ambos os efeitos apresentando nas duas últimas seções concordam com as expressões clássicas

até primeira ordem em �. Entretanto, no tratamento clássico, os casos em que a fonte se move ou que o

observador se move deve ser tratado separadamente, enquanto aqui na teoria relativística o tratamento é o

mesmo.

51

Page 52: Parte A (Relatividade)

Figure 8: This is a �le from the Wikimedia Commons.

2.13 Adição de velocidades

Uma análise direta das TL mostra, primeiro, que estas expressões não estão de�nidas para v = c e, segundo,

para v > c elas produzem valores imaginários das coordenadas. Com isso, na nossa de�nição de referenciais

inerciais estamos supondo que nada atinge, ou ultrapassa, a velocidade da luz. Vamos tentar concluireste mesmo fato diretamente das transformações.

Observe, primeiramente, que o segundo postulado é incompatível com a noção usual de soma develocidades. Por exemplo, suponha que o referencial S observa um referencial S0 que se move com velocidadev = 0; 6c para a direita. Imagine agora que no referencial S0 alguém disparou um projétil com velocidade

u0x = 0; 7c (que é possível pois ux < c). Pela noção usual de soma de velocidades, a pessoa no referencial S

veria este projétil com a velocidade de lançamento somada a velocidade do próprio referencial,

ux?= u0x + v = 1; 3c > c ?!

O que, obviamente, é impossível na nossa teoria. Então, como se somam as velocidades na TRR?

Voltando ao nosso exemplo, o projétil foi lançado com velocidade u0x no referencial S0. Assim, pela

de�nição de velocidade, temos

u0x =dx0

dt0; ux =

dx

dt;

52

Page 53: Parte A (Relatividade)

usando agora as TL temos

x = (x0 + vt0) =) dx = (dx0 + v dt0) ;

t =

�t0 +

x0v

c2

�=) dt =

�dt0 +

v

c2dx0�;

ux =dx

dt=

(dx0 + v dt0)

�dt0 + v

c2 dx0� = dt0

�dx0

dt0 + v�

dt0�1 + v

c2dx0

dt0

� = u0x + v

1 + vc2u

0x

:

Então, a velocidade ux observada no referencial S não é u0x + v, mas sim

ux =u0x + v

1 + vc2u

0x

6= u0x + v : (17)

Para as transformações inversas, como sempre, basta trocar o sinal de v.

Para os valores especí�cos no nosso problema temos

u0x = 0; 7c

v = 0; 6c

)) ux =

0; 7c+ 0; 6c

1 + 0;6cc2 0; 7c

=1; 3c

1 + 0; 42=

1; 3c

1 + 0; 42= 0; 91c < c :

Da mesma forma, para qualquer valor com v; u0 < c (não importa quão próximos de c) teremos u < c. Esta

é a fórmula de adição de velocidades de Einstein.

Vamos agora estudar o caso de uma direção u0 =�u0x; u

0y; u

0z

�arbitrária, ou seja, v continua da direção

x, mas os corpos em S0 podem ter uma velocidade numa direção qualquer. Neste caso, usando exatamente

o mesmo procedimento acima, temos

uy =dy

dt=1

u0y1 + v

c2u0x

;

uz =dz

dt=1

u0z1 + v

c2u0x

:

Exercise 32 Obtenha as relações acima.

Imagine agora que em S existem dois observadores A e B. A possui uma arma capaz de lançar um certo

tipo de partículas e pode usar estas partículas para enviar um sinal para B. Então eles combinam que,

quando B receber (detectar) esta partícula ele inicia algum processo. Ou seja, A dispara, B recebe e inicia

o processo. Está é uma relação de causa e efeito. Suponha agora que estes projéteis que A lança têm uma

velocidade juxj > 0 (o projétil vai da esquerda para a direita), mas com ux = �c; � > 1, i.e., viajam mais

rápido que a luz. Então, das relações acima sabemos que para um observador em S0 este mesmo projétil será

53

Page 54: Parte A (Relatividade)

observado com a velocidade

u0x =(ux + (� jvj))�1 + (�jvj)

c2 ux

� = c

��� jvj

c

�jvjc

�cjvj � �

� (18)

Como v < c e � > 1 o numerador é positivo. Dentre os referenciais possíveis, i.e., aqueles para os quais v < c,

existem alguns com:c

jvj � � < 0)c

jvj < �) c

�< jvj < c (19)

Para estes referenciais temos

u0x =c2

jvj

��� jvj

c

��cjvj � �

� < 0 :Ou seja, para os referenciais que respeitam (19), que, apesar de não serem todos, são alguns, a direção doprojétil foi invertido. Assim, ou ele foi enviado de B para A, invertendo a relação de causa e efeito, ou ele

nunca tingirá B, de sorte que o efeito observado em S0 não será observado em S. Em ambos os casos temos

uma violação do primeiro postulado. Assim, como conseqüência do primeiro postulado, temos que nenhumsinal pode ser enviado mais rápido que a luz e manter a relação de causa e efeito em todos osreferenciais.

2.13.1 Diagrama espaço-tempo e os tipos de intervalos

Um artifício muito usado para se analisar problema em relatividade é o diagrama de espaço-tempo. Neste

diagrama podemos plotar os eventos como pontos. Obviamente este diagrama não pode ser desenhado para

um espaço tridimensional, mas podemos ver como ele funciona se limitarmos as dimensões espaciais do nosso

problema. Assim, para uma única dimensão, podemos registrar um evento que ocorreu num ponto x no

instante t como a �gura abaixo.

Obviamente o diagrama se refere a uma medida especí�ca de tempo e espaço e conseqüentemente é a

descrição de um referencial especí�co. Para este observador, a descrição de um objeto que permanece parado

com o passar do tempo é uma linha vertical. A visualização do diagrama é melhorada se mudarmos a escala

de tempo e não usarmos t, mas sim ct. Neste caso, uma entidade que se movesse na velocidade da luz

descreveria uma reta com uma inclinação de �=4 (ou ��=4 se a direção for �x) e qualquer objeto que semova com velocidade u < c constante representa uma reta com ângulo maior que �=4. A coleção de pontos

que descreve a história de um evento é chamada de linha de mundo.

Pelo que foi dito antes sabemos que a possibilidade de se estabelecer uma relação causal entre dois

pontos do diagrama está ligado ao fato de ser possível enviar um sinal luminoso entre estes pontos no tempo

disponível. Assim, o ponto mais distante que pode ser in�uenciado num intervalo de tempo dt por outro deve

estar numa distância espacial dr =pdx2 + dy2 + dz2 dada por

(cdt)2= dx2 + dy2 + dz2

54

Page 55: Parte A (Relatividade)

Introduzindo a noção de �distância�, ou intervalo, entre pontos no diagrama

ds2 = dx2 + dy2 + dz2 � (cdt)2

podemos classi�car então três tipos de intervalo

ds2 < 0 =) (ct)2> dr2 (intervalo tipo tempo)

ds2 > 0 =) (ct)2< dr2 (intervalo tipo espaço)

ds2 = 0 =) (ct)2= dr2 (intervalos tipo luz )

1. O primeiro tipo de intervalo descreve pontos onde (ct)2 > dr2, ou seja, pontos (no espaço 3D) cuja

distância (espacial) é menor que a percorrida pela luz num intervalo de tempo dt. Assim, este tipo de

intervalo caracteriza pontos que podem ter relações causais. Intervalos com esta característica são

chamados de intervalo tipo tempo;

2. Da mesma forma, intervalos do segundo tipo descrevem pontos cuja distância espacial é maior que

aquela que pode ser percorrida por um sinal luminoso no intervalo de tempo considerado (dr2 > (ct)2).

Este tipo de intervalo se chama intervalo tipo espaço e caracteriza pontos que não podem ternenhuma relação causal;

3. O último tipo de intervalo caracteriza pontos cuja distância espacial é exatamente aquela percorrida

pela luz ((ct)2 = dr2). Assim, este pontos podem ter relação causal exclusivamente por sinais quetrafeguem a velocidade da luz. Intervalos deste tipo são chamados de intervalos tipo luz ;

Suponha agora um evento que ocorra na origem do diagrama (o que só signi�ca que começamos a contar

o tempo a partir deste evento). Pelo que foi dito anteriormente, nenhum sinal emitido por este evento pode

55

Page 56: Parte A (Relatividade)

ter velocidade maior que a da luz e conseqüentemente, este sinal deve ter um ângulo 3�=4 < � < �=4. Isso

signi�ca dizer que nenhum sinal emitido por este evento pode chegar nos pontos fora da regiãode�nida pelo cone da �gura abaixo (chamamos de cone porque imaginamos que existem outras dimensõesespaciais).

Este é o cone de luz deste evento e apenas pontos dentro deste cone podem ser in�uenciados ou in�uenciar

este evento. De outra forma, dizemos que os pontos fora deste cone não possuem nenhuma relaçãocausal com o evento em questão.Obviamente uma forma semelhante de diagrama pode ser desenhado na MC, tomando em conta as TG.

Mas, neste caso, se considerarmos diagramas de observadores diferente, tudo que podemos fazer é rodar e

deslocar o plano espacial, deixando sempre pararelo o eixo temporal (podemos também deslocar todo o plano

espacial ortogonalmente ao tempo, pois cada observador pode escolher set t0, mas os eixos temporai serão

sempre paralelos). Com isso, um observador em qualquer sistema de coordenada concordará sobreintervalos de tempo e simultaneidade. Além disso como não há limite para a velocidade de um sinal,

todos os pontos do diagrama podem ter uma relação causal.

Como já veri�camos na subseção 2.5.3 (�O segundo postulado e as TL�) as TL são exatamente aquelas

que deixam invariante a quantidade ds2 para qualquer referencial (8)

ds02 = ds2 :

Este resultado e o diagrama espaço-tempo, é uma ferramenta poderosa para se analisar um grande número

de problemas. Em especial, o paradoxo dos gêmeos. Primeiramente, como foi dito, precisamos escolher umreferencial bom, i.e., um referencial inercial. Neste caso, o referencial S da terra. Visto deste referencial, e

56

Page 57: Parte A (Relatividade)

Figure 9: Carrol

colocando o evento do lançamento do foguete na origem do diagrama, temos o seguinte esquema para todo

o processo.

Observe que a distância entre pontos não é um intervalo no sentido usual, pois a coordenada temporal

entra em ds com sinal de menos. Mas deste diagrama podemos ver que o intervalo ds2AB vale

ds2AB = (dxAB = 0)2 � (cdtAB)2 = � (cdtAB)2

ou seja a quantidade

� 1c2ds2AB = (dtAB)

2

é o tempo passado para os eventos registrado pelo gêmeo que �cou na terra. Apenas para acertar a questãodo sinal na expressão acima, vamos de�nir a quantidade

d�2 = � 1c2ds2

com isso

d�AB = dtAB

é o tempo (no sentido usual) medido pelo gêmeo da terra. Obviamente

d�ABC = 2dtAB = �t ;

o tempo total da viagem medido na terra.

57

Page 58: Parte A (Relatividade)

Da mesma forma o intervalo d�2AB0 vale

d�2AB0 =1

c2

h(cdtAB0)

2 � (dxAB0)2i= (dtAB0)

2

"1�

�dxAB0

cdtAB0

�2#= (dtAB0)

2

�1� v2

c2

com isso

d�AB0 = dtAB0

r1� v2

c2=1

dtAB0

Olhando para o diagrama vemos que (obviamente)

dtAB0 = dtAB

Com isso

d�AB0 =1

dtAB0 =

1

dtAB :

Além disso, pelo diagrama, vemos que

d�AB0C = 21

dtAB =

1

�t :

Onde, obviamente, �t é o intervalo de tempo de todo o processo medido pelo observador na terra (que está

fazendo o diagrama).

Observe que estas duas quantidades são medidas pelo observador em S, ou seja, não estamos calculando

d� 0 mas apenas o d� de duas linhas de mundo diferentes descritas pelo mesmo observador.Agora se ds2 é invariante (i.e., o mesmo para todos os observadores), obviamente d�2 também o

é. Isso signi�ca que, o intervalo d� 02 (ou ds02) calculado por alguém na nave (usando o seu sistema de

coordenadas S0) entre os eventos a "nave saiu da terra" e a "nave inverteu os motores" vale

d�0

m = d�AB0 =1

dtAB : (20)

(onde m indica o meio da viagem). Observe que até aqui ambos os observadores são inerciais.

Agora no diagrama construído por alguém que esta na nave (por ser um refencial inercial é desenhado da

forma usual), a sua própria trajetória até a inversão dos motores (como ele está parado no seu referencial)

vale

d� 02m =1

c2

h(cdt0)

2 � (dx0 = 0)2i= (dt0)

2 ) d� 0m = dt0m

ou seja, pra ele o intervalo d� 0m é exatamente o tempo que marca o seu reglógio no meio (m) da viajem. Com

isso, usando (20),

dt0m =1

dtAB

58

Page 59: Parte A (Relatividade)

Além disso, como o tempo da viajem de volta é o mesmo que o de ida (e os dois observadores concordam

com isso), temos que o tempo total da viagem vale

�t0 = 2dt0m = 21

dtAB =

1

dtABC =

1

�t :

Ou seja, no �nal da viagem o relógio dele marcará um tempo

�t0 =1

�t < �t ;

e ele estará mais novo.

Obviamente este resultado dependeu do fato de termos usado o diagrama do observador S e convertido a

descrição de S0 para este diagrama. Se usássemos o de S0 tudo estaria invertido. Mas, como já vimos, apenas

o observador S pode usar as leis da RR em todo o percurso, pois a nave não se mantém no mesmo refencial

inercial sempre. Assim, o que �zemos aqui foi, já que não estamos num (único) referencial inercial usamosa medida de alguém que permanece em um. Da mesma forma podemos tratar em RR referenciais

acelerados, imaginando que numa seqüência de tempo dt, ele passa de um referencial inercial para outro.

Obviamente poderíamos ter usado qualquer diagrama construído por um observador inercial. Esta é a idéia

por trás do tempo próprio, que veremos com mais detalhes no futuro.

2.13.2 O arrasto do éter

Mais um pouco sobre o éter: Antes de 1900 havia, entre outras menos populares, duas hipóteses sobre a

�viscosidade�do éter. A primeira é devido a G. Stokes (1845) que propôs que o éter era completamentearrastado pelos corpos, de sorte que nenhuma velocidade em relação ao éter poderia ser detectada. A

primeira vista este hipótese foi comprovada pelo experimento de Michelson-Morley (mas, como vimos, isso

não é verdade). Entretanto, havia também a hipótese de A-J Fresnel (1818) de que o éter penetraria noscorpos, de sorte que ele seria apenas parcialmente arrastado com os corpos. Nesta hipótese o éter não se

moveria completamente com o corpo (com a mesma velocidade) como na hipótese anterior, mas também não

�caria parado (como um super�uido). Assim, na hipótese de Fresnel ainda seria possível detectar um certo

movimento entre os corpos e o éter.

Conhecia-se bem o comportamento da luz nos meios, i.e., o fato de que num meio com índice de refração

n a luz se move com velocidade c=n. Pela hipótese de Fresnel, se todo o meio se move com uma certa

velocidade v a luz teria uma velocidade c=n+ v0, com v0 < v. Assim, se a densidade do éter no ambiente vale

�e, conforme o éter penetra no meio a densidade do éter dentro do meio aumenta para �f > �e. Além disso,

pela teoria ondulatória da luz, a sua velocidade (e, conseqüentemente, o índice de refração) dependeria da

densidade do éter�e�f=1

n2:

59

Page 60: Parte A (Relatividade)

Pela hipótese de Fresnel

v0 = v

�1� �e

�f

�= v

�1� 1

n2

�:

Assim, a velocidade u da luz no meio que se move com velocidade v (observada por aguém parado) seria

u =c

n+ v

�1� 1

n2

�: (21)

conhecido como arrasto de Fresnel (Fresnel drag). Esta hipótese foi comprovada em 1851, com experimentosestudando a propagação da luz na água, por H. Fizeau!

Temos então mais um dos problemas do éter. Dois experimentos diferentes (MM e Fizeau) compro-

vavam dois comportamentos completamente diferentes desta substância. Já vimos como, pela RR, podemos

abandonar a idéia do éter e, assim, entender o experimento de MM. Vejamos agora como a RR explica o

experimento de Fizeau.

Suponha agora que você observa a luz se propagar num meio com índice de refração n e o meio, e.g., um

aquário, se move com velocidade v. Para alguém em repouso no meio a luz se propaga com velocidade c=n,

enquanto para alguém que vê o aquário se mover com velocidade v (para a esquerda) temos, pelo resultado

(17),

u =

�cn + v

��1 + v

c2cn

� = cn + v�1 + v

nc

� : (22)

Expandindo até primeira ordem em � temos

cn + v�1 + v

nc

� ' c

n+ v

�1� 1

n2

�:

Assim, a expressão relativística (22) concorda com a hipótese de Fresnel (21) até primeira ordemem �. A comprovação desta hipótese pelo experimento de Fizeau se deve apenas a di�culdade em se medir

grandezas desta ordem. O resultado (22) foi comprovado P. Zeeman em 1914.

60

Page 61: Parte A (Relatividade)

2.13.3 Rigidez e elasticidade

Um ponto extremante importante na MC é o conceito de corpo rígido. Este conceito permite simpli�car um

problema envolvendo uma in�nidade de átomos a certas quantidades relacionadas à orientação do corpo no

espaço. Ou seja, para descrever o movimento de um corpo precisamos apenas da localização de qualquer

ponto deste corpo (3 variáveis) e a orientação do corpo segundo um eixo arbitrário (mais 3 variáveis). Assim,

temos 6 variáveis no lugar de 3� 1050. Este conceito tão importante é perdido em RR.

Como já mencionamos antes, a existência de uma barra completamente rígida permitiria enviar um

sinal instantaneamente entre os dois pontos na extremidade desta barra. Em outras palavras, num corpo

perfeitamente rígido o som teria velocidade in�nita (vs >> c). Podemos tomar também o caso de uma

barra que começa a girar com velocidade ângular !. A velocidade tangencial de um ponto qualquer da barra

a uma distãncia r do centro da rotação vale !r. Assim, para qualquer ! existe um r tal que !r > c e

para uma barra su�cientemente longa teríamos pontos se movendo mais rápidos que a luz. Isso implica naimpossibilidade da barra de ter o mesmo ! em todos os pontos, o que implica que a barra securva e, mais uma vez, impossibilita a existência de uma barra rígida.Na verdade, este tópico é extremamente complicado não só em RG, mas também em RR. Uma de�nição

que parece bastante natural seria dizer que um corpo é rígido se seus pontos mantém a mesma distância.

Mas, mesmo esta de�nição óbvia, apresenta problemas em relatividade.

Por exemplo, vamos analisar o paradoxo de Dewan-Beran-Bell. Imagine três espaço naves A, B e C,

pequenas o su�ciente para que a sua dimensão possa ser desprezada. As naves B e C são idênticas e

estão eqüidistantes de A (tudo está sendo medido por A) e combinam para que, quando receber um sinal

luminoso de A, ligam seus foguetes. Assim, quando A emite o sinal ele vê B e C se colocarem em movimento

simultaneamente (pra A) e, conseqüentemente, mantendo a mesma distância. Vamos realizar de novo o

mesmo experimento, só que agora vamos colocar uma linha (bem fraca) ligando os foguetes. Quando as

naves estão paradas a linha tem comprimento L. Então A envia o sinal e as naves B e C começam a se

mover. O ponto é que, quando as naves atingem (simultaneamente visto de A) a velocidade v a linha terá

se contraído de uma quantidade �1L. Mas, como as naves se movem juntas, a distância entre elas continua

sendo L. Assim, como a linha é menor que a distância entre as naves, ela vai se arrebentar. Porém, se

tivermos um terceira nave D eqüidistante de A,B e C, que também tem um foguete (igual ao de B e C)

e também irá se mover ao receber o sinal de A, ela verá as duas naves (B e C) paradas juntamente com a

linha. Assim, para D tanto as naves como a linha têm uma distância L e a linha não irá se arrebentar.

Problem 33 Mas o que acontece com a linha?

O problema, da forma com que foi descrito acima, foi proposto por J.S. Bell em 1976 para um grupo de

cientistas do CERN. Desde aquela época até hoje as idéias divergem. O ponto é que não se pode tirarnenhuma conclusão sem fazer uma suposição sobre a elasticidade do �o, se o �o for completamenterígido ele certamente se quebrará. Neste caso para A é fácil saber porque (pela contração de Lorentz), para

B porque ele começou a se mover antes de C e para D porque houve uma tensão aplicada na corda. Pois,

61

Page 62: Parte A (Relatividade)

quando a nave B começou a puxar a linha e C começou a empurrar toda esta �tensão�teve de se propagar

pelo �o. Agora, basta o �o ter qualquer elasticidade e se a aceleração for pequena o su�ciente, ele nãoquebrará para B e D, mas quebrará para A assim que as naves atingirem uma certa velocidade. Neste caso

a única forma de compatibilizar as realidades físicas é supondo que o �o tem uma elasticidade in�nita.Outro ponto a se notas é que esta não é uma elasticidade no sentido usual. Pois a contração de Lorentz (como

vimos) é um efeito puramente geométrico e, por isso, não devemos esperar que ela gere forças de tensão nos

corpos. Ou seja, o �o se contrair e as naves continuarem na mesma distância leva a crer que o �o sofre uma

tensão e, consequentemente, uma força. Assim, a noção de elasticidade tratada aqui não é a mesmada mecânica clássica.Resumindo, a noção de elasticidade e rigidez é um ponto bastante intrincado na TRR. Por isso, sempre

que possível, devemos evitar fazer uso destas noções para tirarmos qualquer conclusão sobre a realidade física

de um certo sistema físico.

2.14 Vetores

Um conceito crucial no estudo da dinâmica de corpos e campos é o de vetor. Por exemplo, a lei de Newton

F = m�x

não representa apenas uma equação, mas três. Para se especi�car quantidades mensuráveis, devemoslembrar que estas três equações dizem respeito a algum sistema de coordenadas. Entretanto, para escrever a

equação (ou as equações) nenhum sistema especí�co precisa ser especi�cado.

Suponha que você deseje escrever as equações de uma mola, mas não conheça o ferramental dos vetores.

Primeiramente você deve especi�car um sistema de coordenadas e, se neste sistema, a mola oscilar no eixo x

62

Page 63: Parte A (Relatividade)

você escreverá

m�x = �kx

m�y = 0

m�z = 0 :

Entretanto, para cada nova escolha dos eixos você escreveria equações diferentes. Ou seja, sempreque você �zesse referência ao problema da mola, teria de especi�car antes o sistema de coordenadas.

Agora, se você conhece o ferramental dos vetores, basta escrever:

m�x = �kx :

E nesta equação já está implícito que a força é na direção do deslocamento, independente do sistema decoordenadas. Ou seja, em várias áreas da física, e especialmente em Mecânica, quando reconhecemos queuma quantidade é um vetor ganhamos uma série de propriedades que podem ser exploradas na resolução do

problema.

Mas o que signi�ca ser um vetor? Dado um sistema de coordenadas num espaço tridimensional,

podemos representar os vetores por uma tríade ordenada de números. Mas qualquer conjunto de trêsnúmeros ordenados forma um vetor? A resposta desta segunda pergunta é, obviamente, negativa.Para dar um exemplo concreto, vamos tratar um problema em duas dimensões. Suponha que v (x; y) é

um conjunto de dois números que indica a velocidade, num ponto x; y, na superfície de um �uído segundo

algum sistema de eixo x; y. Esta quantidade pode ser representada como

v =

a

b

!:

Suponha agora que o seguinte par ordenado w (x; y) indica a pressão e a temperatura do �uído, num ponto

x; y, segundo o mesmo sistema de eixos. Esta quantidade pode ser representada como

w =

!:

Pergunta: Se estabelecermos um novo sistema de coordenadas x0; y0, que representa um giro do sistema

original no sentido horário de um ângulo �, for especi�cado, qual o valor das quantidades acima com relaçãoa este novo eixo?

Primeiramente devemos lembrar que as quantidades acima dizem respeito a um certo ponto P que,

independente do sistema de coordenadas, representa o mesmo ponto físico do espaço.Geometricamente é fácil ver que, neste novo sistema de coordenadas, a velocidade do ponto P tem as

63

Page 64: Parte A (Relatividade)

componentes:

v (x; y)! v0 (x0; y0) =

cos� � sin�sin� cos�

! a

b

!=

a cos�� b sin�a sin�+ b cos�

!: (23)

Lembre que, em geral, x 6= x0 e y 6= y0, mas ambos se referem ao mesmo ponto P .

Já sobre a segunda quantidade, sabemos que a mudança do nosso sistema de coordenadas não vai alterar

as características físicas do �uido. Assim a pressão e a temperatura em P serão as mesmas

w0 (x0; y0) =

!= w (x; y) :

Ou seja, as duas quantidades possuem leis de transformação diferentes por uma mudança no sistema decoordenadas. Outras quantidades (outros conjuntos ordenados de dois números) poderiam respeitar outras

leis.

É exatamente a lei de transformação (23) que torna a quantidade v tão conveniente. Podemos reescrever

a expressão (23) como:

v0 = R (�)v ; R (�) =

cos� � sin�sin� cos�

!Esta é exatamente a mesma lei de transformação das coordenadas do ponto P . Ou seja, se um pontoP tem coordenadas x; y com relação ao sistema de eixos originais, no sistema girado ele terá as coordenadas

x0

y0

!=

cos� � sin�sin� cos�

! x

y

!x0 = Rx

Podemos de�nir os vetores no plano como todas as quantidades que, por uma rotação do sistema decoordenadas, se transforma como a relação acima para as coordenadas13 .

Na expressão acima para w, cada uma das suas componentes se transforma independentemente por uma

rotação do sistema. Ou seja, não ganhamos nada em agrupar estas quantidades. Além disso, podemos

escrever

�0 (x0; y0) = � (x; y) ; �0 (x0; y0) = � (x; y) :

Quantidades que respeitam a lei de transformação acima (i.e., que não mudam) são chamadas de escalares.

13Veja, por exemplo, o Capítulo 1 de Classical Dynamics of Particles and Systems, Thornton ST, Marion JB.

64

Page 65: Parte A (Relatividade)

2.14.1 Tensores

Ocorre as vezes que a primeira vez que um aluno de graduação ouve falar sobre tensores é no curso de

RR. Entretanto, estas quantidades estão presentes em vários problemas de Física Clássica e, especialmente,

engenharia (para um exemplo em Física Clássica veja o livro do Marion, Cap. 11 Dynamics of Rigid Bodies).

Um tensor é uma composição de vetores. A regra de composição é a seguinte: dado dois vetores a e b

(e.g., num espaço de dimensão 3), podemos formar com estes vetores um tensor T de segunda ordem (que na

nossa representação matricial será uma 3� 3) cujos elementos são dados por

Tij = aibj (24)

Ou seja, o elemento i (linha) e j (coluna) é o elemento i do primeiro vetor e j do segundo. Na notação

matricial

a =

0B@ a1

a2

a3

1CA ; b =

0B@ b1

b2

b3

1CA =) T =

0B@ a1b1 a1b2 a1b3

a2b1 a2b2 a2b3

a3b1 a3b2 a3b3

1CA :

É crucial notar que Tij = aibj 6= biaj , ou seja, na de�nição do tensor a ordem dos elementos é impor-tante.. Na verdade, biaj é a matriz obtida de T quando trocamos as linhas pelas colunas. Esta operação detroca é chamada transposição

(Tij)T= (aibj)

T= bjai = Tji

Usaremos também a notação

(Tij)T � TTij = Tji :

Da de�nição acima se trona óbvia a lei de transformação de um tensor de segunda ordem. Um tensor T é

qualquer quantidade que, por uma rotação R do nosso sistema de coordenadas, se transforma como

T ! T 0 = (Ra) (Rb) ;

ou, em componentes

T 0ij = RimamRjkbk = RimRjkambk = RimRjkTmk :

Existe uma notação para a regra de composição (24). Se não quisermos fazer alusão aos índices, não éconveniente escrever ab, pois isso pode confundir com o produto escalar (matricial) de vetores, então nós

escrevemos:

T = a b :

Onde é chamado de produto tensorial (também usa-se �, mas isso pode confundir com o produto vetorial).Todo o desenvolvimento acima pode ser entendido diretamente para o produto tensorial de mais vetores.

65

Page 66: Parte A (Relatividade)

Assim, o produto tensorial de N vetores a1;a2;a3; :::aN é o tensor de ordem N

T = a1 a2 a3 ::: aN ;

Tilk:::m = aiajak:::am :

Lembrando sempre que a ordem dos vetores é importante. Obviamente, para N > 2, não temos mais uma

representação matricial simples, mas isso não representa nenhuma di�culdade, pois sabemos a álgebra dos

elementos.

As de�nições acima podem ser usadas para especi�car o produto tensorial de dois (ou mais) tensores.Por exemplo, se A é um tensor de ordem N e B um tensor de ordem M , podemos construir o seguinte tensor

T de ordem N +M

T = AB

T ij:::p|{z}N+M

= Aij:::k|{z}N

Bmn:::p| {z }M

Concluindo, um tensor de ordem N é qualquer quantidade que, por uma rotação R do sistema de

coordenadas, se transforma como a seguinte composição de N rotações R:

T 0ij:::k = RimRjn:::RkpTmTn:::Tp :

Remark 34 A ordem dos tensores é o número de índices. Assim, na linguagem dos tensores podemos dizer

que vetores (e.g., ai com um único índice) são tensores de ordem 1 e escalares (e.g., � sem índice) são

tensores de ordem zero.

Remark 35 Uma lei de transformação diferente das acima de�ne certas quantidades como espinores.

2.15 Rotações

As idéias da seção anterior podem ser facilmente estendidas para o espaço tridimensional. Entretanto, agora

para especi�car uma rotação precisamos informar, além do ângulo, o eixo de rotação. Por exemplo, por uma

rotação do sistema de coordenadas de um ângulo � na direção do eixo z, no sentido horário, um vetor m

qualquer se transforma como0B@ m01

m02

m03

1CA =

0B@ cos� � sin� 0

sin� cos� 0

0 0 1

1CA0B@ m1

m2

m3

1CA :

66

Page 67: Parte A (Relatividade)

Numa notação matricial esta relação pode ser escrita como

m0i =

3Xj=1

R(z)ij (�)mj :

Onde R(z)ij (�) são as componentes i (linha) e j (coluna) da matriz

R(z) (�) =

0B@ cos� � sin� 0

sin� cos� 0

0 0 1

1CA :

Rotações em torno do eixo x e y podem ser escritas como:

R(x) (�) =

0B@ 1 0 0

0 cos� � sin�0 sin� cos�

1CA ; R(y) (�) =

0B@ cos� 0 � sin�0 1 0

sin� 0 cos�

1CA :

Uma rotação arbitrária R pode ser especi�cava através da rotação em cada uma das direções14

R (�; �; �) = R(x) (�)R(y) (�)R(z) (�) :

Onde pelo produto acima devemos entender o produto matricial. Ou seja, a notação acima é uma abreviação

para:

Rij =

3Xm=1

3Xn=1

R(x)imR

(y)mnR

(z)nj :

Adotemos aqui mais uma simpli�cação na notação. Para não escrevermos sempre o sinal de somatória,

convencionamos que sempre que um índice aparecer repetido existe uma somatória implícita

3Xm=1

3Xn=1

R(x)imR

(y)mnR

(z)nj � R

(x)imR

(y)mnR

(z)nj :

Esta é a convenção de Einstein.

� Observe que um mesmo índice nunca pode aparecer mais de duas vezes.

Um índice repetido não participa do outro lado da igualdade

Rij = R(x)imR

(y)mnR

(z)nj = R

(x)io R

(y)op R

(z)pj ;

14Para ver como isso é feito na prática estude os Ângulos de Euler.

67

Page 68: Parte A (Relatividade)

assim ele pode ser trocado ao bel-prazer. Por isso um índice repetido é chamado de índice mudo (ele não nos

diz nada sobre o resultado.).

Sobre as matrizes de rotação é importante observar (entre outras) duas coisas:

1. Elas não comutam R1R2 6= R2R1;

2. O produto de duas (ou mais) matrizes de rotação é uma matriz de rotação (conseqüência da propriedade

de grupo).

Posteriormente falaremos mais da importante das características que é formarem um grupo.

Vimos então que um vetor m é uma quantidade que por uma rotação R se transforma como

mi = Rijmj

Como esta operação de�ne o caráter vetorial da nossa quantidade, vemos então a importância de se recon-hecer uma matriz de rotação. Ou seja, dada uma matriz R, esta matriz representa alguma rotação?

68

Page 69: Parte A (Relatividade)

2.16 Métrica

Voltando a pergunta anterior. Antes precisamos saber: o que caracteriza uma rotação?

Uma rotação é uma operação que possui duas propriedades: Uma rotação não altera distâncias nem

ângulos. Mais especi�camente:

1. Uma rotação não altera o tamanho (norma) de um vetor;

2. Uma rotação não altera o ângulo entre vetores.

Vejamos como quanti�car estas propriedades. O produto interno (ou produto escalar) entre dois vetores

pode ser de�nido como

a:b = ab cos � ; a = jaj ; b = jbj ;

onde � é o (menor) ângulo entre os vetores a e b15 .

� Ou seja, conhecendo-se o produto interno sabemos o ângulo entre os vetores.

Numa base ortonormal este produto pode ser de�nido como

a:b = aibi :

Conseqüentemente, se a rotação não altera o ângulo entre vetores ela não altera o produto escalar entre

eles:

a0 = Ra ; b0 = Rb =) a:b =(Ra) (Rb) = a0:b0 ;

ou em componentes

a0ib0i = aibi :

Ou seja, a quantidade

� (x; y; z) � ai (x; y; z) bi (x; y; z) = a0i (x0; y0; z0) bi (x

0; y0; z0) = �0 (x0; y0; z0) ;

(que depende do ponto) não se altera por uma rotação. Então esta quantidade é um escalar.Além disso, temos:

a:a = a2 = aiai =) a =pa:a

� Ou seja, o produto interno nos diz como calcular a norma dos vetores.

Vemos então que todas as características que precisamos para caracterizar as matrizes de rotação estão

relacionadas com o produto interno. Para explorar melhor esta relação vamos escrever o produto interno de

15Outras notações para produto interno são: simplesmente ab, nos livros mais antigos (ab), nos livro de álgebra (a;b) e(motivado pela notação dos livros de álgebra) em física a notação de Dirac haj bi.

69

Page 70: Parte A (Relatividade)

dois vetores da seguinte forma:

a:b = aibi = aiMijbj

M =

0B@ 1 0 0

0 1 0

0 0 1

1CA ; Mij = �ij (25)

A matriz M , que nos diz como fazer o produto interno de dois vetores é chamada a métrica do espaço. Amétrica possui todas as informações de como medir ângulos e distâncias no nosso espaço, ouseja, ela nos diz como fazer geometria no espaço.

Remark 36 O fato da nossa métrica assumir a forma simples (25) é uma conseqüência da escolha do nossosistema de coordenadas ortonormal euclidiano. Para um sistema não-ortogonal temos o aparecimento de

termos fora da diagonal e, para outros sistemas de coordenadas (e.g., esféricas), esta matriz tem uma forma

bem mais complicada.

Com isso podemos colocar as características das nossas rotações da seguinte forma. Uma matriz R é uma

rotação se ela não altera o produto interno entre os vetores. Ou seja

a:b =(Ra) : (Rb) ;

ou em componentes

aibi = (Rijaj) (Rikbk) :

Usando o tensor métrico (25)

(Rijaj) (Rikbk) = (Rijaj)Mim (Rmkbk) = RijajMimRmkbk

= RijMimRmkajbk = aibi =Mijaibj

o que implica

RinMimRmpanbp =Mnpanbp

RinMimRmp =Mnp

ou seja, rotações não alteram a métrica do espaço. Usando a forma explicita de Mij = �ij temos

Rin�imRmp = RmnRmp = RTnmRmp = �np :

Onde usamos a operação de transposição da matriz RTnm = Rmn, lembre-se que a multiplicação é de linha

70

Page 71: Parte A (Relatividade)

por coluna e não pode ser trocada. Se usarmos agora a notação matricial temos:

RTR = I : (26)

Remark 37 Observe que utilizaremos duas notações diferentes, numa delas explicitamos o índice das ma-trizes e na outra não. Ou seja, se M e N são matrizes, podemos indicar o seu produto matricial como

A = MN , com A a matriz que resulta do produto, ou Amk = MmnNnk, onde Amk é a componente linha m

e coluna k da matriz A. A utilização de uma ou outra notação depende apenas da conveniência.

Remark 38 Observe que MmnNnk = NnkMmn, pois cada elemento de uma matriz é apenas um número.

Entretanto, MN 6= NM pois o produto de matrizes não comuta. Então, ao utilizar a notação simpli�cada

(sem os índices) é crucial não trocar a ordem dos elementos.

Temos então a caracterização das nossas matrizes de rotação:

� Uma matriz de rotação é aquela que, quando multiplicada pela sua transposta, nos dá a identidade.

Ou, de forma equivalente, é uma matriz cuja inversa é igual a sua transposta. Matrizes com a propriedade

(26) são chamadas de matrizes ortogonais (rotações são matrizes ortogonais). Numa linguagem mais técnica,

o conjunto de todas estas matrizes formam o chamado grupo ortogonal em 3 dimensões, ou grupo O (3).

Na verdade, o grupo ortogonal não contém apenas rotações, mas também a inversão dos eixos. Por

exemplo, a matriz que troca o sinal (sentido) do eixo x é dada por0B@ �1 0 0

0 1 0

0 0 1

1CA :

Esta matriz é ortogonal, mas não representa nenhuma rotação (uma rotação no eixo z trocaria também o

sinal de y). Mesmo assim esta matriz preserva ângulo e distâncias. Uma característica geral das matrizes de

inversão de eixo é que elas possuem determinante igual a �1. Assim, as matrizes de rotação são as matrizesortogonais de determinante igual a 1. Este é o grupo das rotações em três dimensões, também chamado grupo

ortogonal especial em 3 dimensões, ou SO (3).

71

Page 72: Parte A (Relatividade)

2.17 O espaço de Minkowski

Utilizando diretamente as TL é direto obter a relação:

x21 + y22 + z

23 � (ct)

2= x021 + y

022 + z

023 � (ct0)

2:

Exercise 39 Obtenha a relação acima.

Mais ainda, se (x1; y1; z1; t1) e (x2; y2; z2; t2) são dois eventos quaisquer em num sistema S é fácil ver que,

pelas TL, num sistema S0 temos

(�x)2 � (ct)2 = (�x0)2 � (ct0)2 : (27)

Na mecânica newtoniana, onde os tempos são iguais �t = �t0, a igualdade acima se reduz na invariância

do tamanho de vetores

(�x)2= (�x0)

2

Que é exatamente a propriedade que de�ne o comportamento dos vetores sob rotações.

Para o que segue é bastante conveniente não trabalhar com a notação x; y; z, mas sim com a seguinte

notação:

x1 � x ; x2 � y ; x3 � z :

Lembre-se agora que, quando partimos do plano para o espaço 3D tudo que tivemos de fazer para expressar

a invariância do tamanho dos vetores por uma rotação foi introduzir mais um termo:

x21 + x22 = x021 + x

022 2D ,

x2 + x22 + x23 = x02 + x022 + x

023 3D . (28)

O matemático H. Minkowski16 observou que, se introduzimos uma coordenada imaginária no lugar da

coordenada temporal

x4 � ict

podemos escrever a relação (27) como:

x21 + x22 + x

23 + x

24 = x021 + x

022 + x

023 + x

024 :

O que poderia ser identi�cado como uma versão quadridimensional da relação (28). Ou seja, nesta interpre-

tação as TL preservam a norma dos vetores no espaço 4D, da mesma forma que rotações preservavama norma no espaço 3D. Este espaço 4D é também chamado de espaço-tempo. Assim, adaptando os termos

introduzidos anteriormente, um evento é um ponto no espaço-tempo. Explorando esta interpretação,16Minkowski foi professor de Einstein em Zürich.

72

Page 73: Parte A (Relatividade)

e lembrando que rotações preservam as distâncias, poderíamos tentar escrever: x01

x04

!=

cos � � sin �sin � cos �

! x1

x4

!x01 = x1 cos � � x4 sin �

x04 = x1 sin � + x4 cos � (29)

onde usamos que as TL só misturam as coordenadas x1 e x4, enquanto x2 = x02 e x3 = x03. Lembrando agora

que x1 é real e x4 imaginária, e que o mesmo deve ser válido para x01 e x04, devemos ter

Im (cos �) = Re (sin �) = 0

Esta propriedade pode ser satisfeita se introduzirmos (da mesma forma que a coordenada imaginária) um

ângulo imaginário:

� � i ; 2 R

Pois, com isso

cos � = cos i = cosh 2 R

sin � = sin i = i sinh ; sinh 2 R

Substituindo em (1.14) temos:

x01 = x1 cosh � ix4 sinh

x04 = ix1 sinh + x4 cosh

Usando agora a de�nição de x4 = ict

x01 = x1 cosh + ct sinh

t0 =1

cx1 sinh + t cosh

Comparando agora com as TL

x01 = (x1 � vt) ; t0 = �t� xv

c2

�temos

cosh = = cos � ; sinh = v

c= � = �i sin �

Remark 40 Observe que, como os ângulos são imaginários, cos � > 1.

73

Page 74: Parte A (Relatividade)

Figure 10: Figura retirada do livro do Pauli

Com isso, formalmente as TL podem ser interpretadas geometricamente como uma rotação do sistema de

coordenadas por um ângulo imaginário.

A �gura acima mostra a representação geométrica de uma TL como uma rotação.

Remark 41 Observe que a �gura foi girada por um ângulo �� em relação a nossa descrição acima (sentidohorário).

Neste tipo de �gura representamos o tempo no eixo vertical e o espaço no eixo horizontal. Assim, eventos

que ocorrem no mesmo ponto do espaço são linhas verticais. Enquanto eventos simultâneos são linhas

horizontais.

Da �gura é possível ver diretamente que dois eventos simultâneos em S0 não serão simultâneos em S. Por

exemplo, a projeção em t das extremidades de L0.

Remark 42 Observe que o tamanho da barra medido em S não é a projeção ortogonal (com respeito à x1)

das extremidades da barra, mas sim dois pontos quaisquer onde os eventos �a extremidade L1 e L2 da barra

passaram nesta posição no mesmo instante de tempo�. Isso porque, como vimos, medidas de distância deve

envolver eventos simultâneos para quem efetua a medida. Por isso a medida da barra em S é a distância

entre dois pontos quaisquer onde as retas L1 e L2 (que indicam a evolução das extremidades da barra em S0,

onde ela está parada) cruzam uma reta perpendicular a ct.

74

Page 75: Parte A (Relatividade)

Diretamente da �gura temos

cos � =L0L=) L =

L0cos �

=) L =1

L0

Observe que como cos � = > 1 o comprimento L < L0, resultando assim na contração de Lorentz. Observe,

porém, que esta contração pode ser veri�cada geometricamente, pois uma barra que estivesse em repouso

no sistema S representaria a projeção de L0 e x1 (linha pontilhada na �gura). Ou seja, esta seria uma

barra parada em S que, visto por um observador em S, provocaria os mesmos efeitos (a mesma seqüência de

eventos) em S0.

Da mesma �gura vemos que o tempo t0 = � de S0 visto de S tem o comprimento:

cos � =t

�=) t = � :

Neste caso a dilatação temporal pode ser veri�cada diretamente na �gura através da projeção de � no eixo

ct.

Remark 43 O exemplo acima mostra, mais uma vez, o ponto das transformações temporais serem diretas(projeções diretas do comprimento dt0em t) enquanto as medidas de distâncias envolverem projeções indiretas(não é a projeção do comprimento dx0 em x).

Assim, a linguagem e notação presentes nesta seção são usadas em todos os livros mais antigos de RR.

Uma liguagem mais moderna, presente inclusive na reedição de alguns livros mais antigos (e.g., Teoria de

Campo do Landau) é a que usaremos nas seções seguintes. Além disso, esta linguagem mais moderna (sem

coordenadas imaginárias) permite uma generalização direta para a TRG.

2.17.1 Notação

No que segue é bastante conveniente utilizar a seguinte notação:

x = x1 ; y = x2 ; z = x3 ; x0 = ct ;

(note que todos os eixos tem agora a mesma unidade17) onde os expoentes são índices e não potências.Note que nesta notação introduzimos uma coordenada x0 que, diferente de x4, também é real.

17Neste novo sistema de unidades tempo é uma medida de distância. Ou seja, 1 segundo é a distância percorrida pela luz em1 segundo, i.e., 3� 108 m.

75

Page 76: Parte A (Relatividade)

Utilizando esta notação e a linguagem matricial da seção anterior, podemos escrever as TL (7) na forma:0BBBB@x00

x01

x02

x03

1CCCCA =

0BBBB@ � � 0 0

� � 0 0

0 0 1 0

0 0 0 1

1CCCCA0BBBB@

x0

x1

x2

x3

1CCCCA ;

=1p1� �2

; � =v

c:

ou ainda

x0 = �x ; � =

0BBBB@ � � 0 0

� � 0 0

0 0 1 0

0 0 0 1

1CCCCA ;

ou, explicitando as componentes,

x0� = �� �x� :

Introduzimos aqui outra notação bastante conveniente, ao invés de identi�carmos a linha e a coluna como,

respectivamente, o primeiro e segundo índice estamos identi�cando: Na matriz �� �

� O primeiro índice (�) indica as linhas e o segundo índice (�) indica a coluna.

Além disso, por razões que (com sorte) �carão mais claras no futuro,modi�camos também um pouco a

nossa convenção da soma de índices repetidos:

� Existe uma somatória em dois índices repetidos apenas quando um deles aparece em cima e outro

aparece embaixo.

Com isso temos:

1. O mesmo índice jamais aparecerá mais de duas vezes. E quando aparecer duas vezes ele será umíndice mudo.

2. Dois índices repetidos nunca (ou pelo menos quase nunca) aparecem ambos em cima ou em baixo.

Se no �nal das suas contas alguma destas regras foram quebradas você cometeu algum erro.

Remark 44 Na verdade, esta notação com índices em cima e em baixo não é necessária na Teoria da Rel-

atividade Restrita18 , apesar de ser indispensável na Teoria da Relatividade Geral. Mesmo assim ela possui

aqui três vantagens: 1) A maioria dos livros a utiliza, de sorte que será mais fácil comparar nossas expressõescom as contidas nestes livros; 2) Ele ajuda bastante na detecção de erros nas manipulações algébricas; 3)Permite se acostumar com uma notação indispensável no estudo da TRG.18Veja, por exemplo, o comentário no livro J. J. Sakurai - Modern quantum mechanics.

76

Page 77: Parte A (Relatividade)

Remark 45 Observe que estamos de�nindo os pontos no espaço-tempo com índices em cima, ou seja,

x� = (ct;x) = (ct; xi) :

Isso é importante para identi�carmos as quantidades da MC com as da RR.

Na notação acima você deve ter reparado que os índices estão sendo marcados com letras gregas,enquanto na seção anterior utilizamos letras latinas. Temos aqui também a seguinte convenção:

� Índices latinos indicam quantidades com 3 componentes e, no caso da somatória, variam de 1 a 3 (e.g.,i = 1; 2; 3). Índices gregos indicam quantidades com 4 componentes e, nas somatórias, variam de 0 a

3 (e.g., � = 0; 1; 2; 3).

77

Page 78: Parte A (Relatividade)

2.17.2 Grupo de Lorentz

Recapitulando:

1. Por uma rotação R as coordenadas se transformam como: x0i = Rijxj (onde adaptamos a notação para

índices em cima);

2. Rotações mantêm invariantes o produto interno x:x =P�

xi�2;

3. O produto interno pode ser expresso através da métrica M : x:x =xiMijxj ;

4. Como conseqüência de (2) rotações mantém a métrica invariante: Mij = RikMkmRmj ;

5. Como conseqüência de (4) rotações são matrizes ortogonais: RTR = I;

6. Vetore é qualquer quantidade que, por uma rotação, se transforma como as coordenadas: m0i = Rijmj ;

7. O produto interno de qualquer vetor é invariante por rotações: m0im

0i = mimi;

Nosso objetivo agora é estender estes resultados para o espaço 4D de Minkowski.

Por uma transformação de Lorentz, as coordenadas do nosso espaço-tempo 4D se transformam como:

x0� = �� �x� :

Além disso, as transformações de Lorentz mantêm invariante o produto:

3Xi=1

�x0i�2 � �x00�2 =X�

xi�2 � �x0�2 :

Seguindo o mesmo o esquema desenvolvido para o espaço euclidiano, vamos escrever este produto interno

com: X�xi�2 � �x0�2 = x����x

v

Onde introduzimos a quantidade

�00 = �1 ; �ii = 1 ; ��� = 0 � 6= � :

Observe que, para manter a nossa convenção tivemos de de�nir a métrica com ambos os índices em baixo.

Esta é uma característica peculiar da métrica que se tornará mais clara com o desenvolvimento.

78

Page 79: Parte A (Relatividade)

Assim, se especialmente para a métrica, continuarmos usando a nossa de�nição antiga do primeiro índice

representando linha e o segundo coluna, podemos escrever n como a matriz:

� =

0BBBB@�1 0 0 0

0 1 0 0

0 0 1 0

0 0 0 1

1CCCCA :

Esta matriz é o tensor métrico do nosso espaço 4D. Usando agora que uma TL não altera o produto interno

entre as coordenadas, podemos escrever:

x����xv = x0����x

0v =) x����xv = x��� �����

��x

� : (30)

Novamente, como no caso 3D, sendo a relação acima válida para qualquer ponto, podemos escrever

��� = � �� ��

�� ;

ou seja, TL mantém invariante a métrica �.

Se usarmos agora a notação matricial devemos notar que, assim como no caso das rotações, o primeiro

produto acima multiplica coluna por coluna. Assim, a notação correta para o produto acima seria

� = �T �� : (31)

Assim como no caso das rotações, usamos agora a relação acima para de�nir as transformações de Lorentz:

� Uma transformação de Lorentz é qualquer transformação que obedece a relação (31).

Assim como no caso das rotações, as matrizes que respeitam a relação (31) formam um grupo. Em

especial, o produto de duas matrizes �1 e �2 que respeitam (31) também respeita (31). Este grupo, em

analogia com o grupo das rotações O (3), é chamado de grupo de Lorentz O (3; 1). Onde o 1 indica que uma

das componentes da nossa métrica é negativa.

Exercise 46 Mostre que, se �1;�2 2 O (3; 1) =) � = �1�2 2 O (3; 1).

Mais uma vez este grupo é muito maior do que o grupo das TL que estávamos estudando. Em especial,

observe que para uma rotação pura (no sentido usual) do sistema de coordenadas, i.e., v = 0 ( = 1 ; � = 0)

nas TL, temos

R =

1 0

0 R3

!

79

Page 80: Parte A (Relatividade)

onde R3 é uma rotação qualquer dos eixos espaciais. Com isso

RT �R =

1 0

0 RT3

! �1 0

0 I

! 1 0

0 R3

!

=

�1 0

0 RT3

! 1 0

0 R3

!

=

�1 0

0 RT3 R3

!=

�1 0

0 I

!= �

Ou seja, rotações puras do sistema de coordenadas pertencem ao O (3; 1).Transformações que invertem os eixos também fazem parte do GL. Mas agora temos também a possibili-

dade de inverter a coordenada temporal mudando o sinal de �0 0. Uma TL que não muda o sinal do tempo(�0 0 > 0) é chamada de ortocrônica e uma que não muda a orientação dos eixos espaciais (det�

ij > 0) é

chamada de própria.

As transformações próprias formam o grupo especial SO(3; 1) e as próprias ortocrônicas o grupo SO+(3; 1)19 .

Neste curso trabalharemos apenas com transformações do grupo SO+(3; 1).

Dentro do GL é costume chamar de rotações as rotações apenas dos eixos espaciais, neste caso v = 0em �. Além disso, uma TL pura, i.e., a TL que usamos até agora para de�nir a relação das coordenadas

entre referenciais em movimento é chamada de boost.

Podemos agora utilizar uma de�nição análoga ao caso euclidiano para de�nir vetores no espaço 4D de

Minkowiski. Estas quantidades, para diferenciar da de�nição no espaço euclidiano (futuramente veremos por

que esta diferenciação é necessária), são chamados de quadrivetores (4-vetores).

� Um quadrivetor é qualquer quantidade que, por uma transformação do grupo de Lorentz, se transformacomo as componentes das coordenadas. Ou seja, se m é um 4-vetor e aplicamos uma TL � então

m� = �� �m� :

Da mesma forma que na mecânica usual, a utilização de vetores torna a descrição dos sistemas bem

mais simples. Então, na RR devemos procurar por quantidades que se comportem como 4-vetores. Como

veremos, esta não é uma tarefa tão simples, pois a mistura das coordenadas espaciais e temporais torna a

nossa intuição quase sempre insu�ciente para esta procura.

Uma conseqüência direta dos resultados acima é que, como no caso 3D, o produto escalar de dois4-vetores quaisquer

a����b� = � (x) :

19O nome SO(3; 1) também é usado como SO+(3; 1).

80

Page 81: Parte A (Relatividade)

é um escalar. Ou seja, esta quantidade � (x) (que depende do ponto) possui o mesmo valor para todos osreferenciais inerciais.

Remark 47 Pelos efeitos antes discutidos (contração do espaço e dilatação do tempo) vemos que quantidadescomo distâncias (que antes eram vetores) não são 4-vetores.

2.17.3 Transformações de Lorentz numa direção arbitrária

Antes desta seção trabalhamos apenas com TL onde os referenciais se moviam exclusivamente na direção

x. Usando as propriedades de grupo das matrizes � podemos facilmente obter uma expressão para uma TL

numa direção arbitrária. Suponha que, dado um sistema de coordenadas S desejamos descrever eventos um

referencial S0 que se move com velocidade v = v1x1 + v2x

2 + v3x3 com relação a S. Esta descrição é dada

através da TL � (v)

x0 = �x ; � 2 SO (3; 1) :

Remark 48 Apensar da velocidade ter uma direção arbitrária, ainda estamos considerando (como sempre�zemos) que os eixos de ambos os referenciais são paralelos e que as origens coincidem.

A possibilidade de fazer rotações no nosso sistema de coordenadas, permite que possamos trabalhar num

(novo) sistema ~S que represente uma rotação do sistema S e que leva o eixo x na direção de v, ou seja, neste

sistema ~S temos

~v = rv =

0B@ ~v1

0

0

1CA ; r 2 SO (3) : (32)

Com relação a este sistema de coordenadas ~S as TL tem a forma usual

~� =

0BBBB@ � � 0 0

� � 0 0

0 0 1 0

0 0 0 1

1CCCCA =

1p1� �2

; � =v

c(33)

observe que

j~vj = jvj = v

pois r 2 O (3) é uma rotação.

81

Page 82: Parte A (Relatividade)

Neste novo sistema de coordenadas temos20

~x0 = ~�~x = ~�Rx

onde

R =

1 0

0 r

!2 SO (3; 1) ;

mas

~x0 = Rx0 ;

com isso

Rx0 = ~�Rx =) x0 = R�1~�Rx ;

onde R�1 é a inversa de R (o fato da inversa de R existir é também uma propriedade do grupo).

Assim, encontrando a rotação R (ou r) podemos usar a TL ~� (33) (que é aquela que utilizamos em toda

as seções anteriores) para encontrar a transformação � numa direção qualquer

� = R�1~�R : (34)

Como R 2 S0 (3; 1) e ~� 2 SO (3; 1) então � 2 SO (3; 1) é uma TL.20Lembre que, como S0 estava inicialmente orientado com S a aplicação da mesma rotação em S0 fará com que ~S0 esteja

orientado com ~S.

82

Page 83: Parte A (Relatividade)

O fato do 4-espaço, e não do espaço ordinário, ser isotrópico nos obriga a substituir as rotações usuais

pelas TL.

� Vetores

� Grupo de Lorentz

� Grupo de Lorentz especial ortocrono

� Rotações

� TL

� TL numa direção qualquer.

Por exemplo, suponha que o sistema S0 se move com velocidade v, em relação ao sistema S, na direção

(positiva) do eixo y (ou x2 na notação vetorial cartesiana, ou x2 na notação de 4-vetores). Como seria a

matriz � (vy) da TL correspondentes?

Primeiramente, vamos responder esta pergunta usando diretamente a de�nição das TL. Obviamente, não

existe nada especial com o eixo x no tratamento de problemas reais. Assim, se desde o princípio tivéssemos

escolhido a transformação no eixo y teríamos escrito:

x01 = x1 ;

x02 = (x2 � vt) ;

x03 = x3 ;

t0 = �t� v

c2x2

�;

ou, usando a notação de 4-vetores21 ,

x00 = �x0 � �x2

�x01 = x1

x02 = �x2 � �x0

�x03 = x3

21Até aqui estamos marcando todos os vetores do espaço 3D com índices em baixo e 4-vetores com índices em cima. Infelizmenteesta facilidade não durará pra sempre.

83

Page 84: Parte A (Relatividade)

o que na notação matricial representa0BBBB@x00

x01

x02

x03

1CCCCA =

0BBBB@ 0 � � 0

0 1 0 0

� � 0 0

0 0 0 1

1CCCCA0BBBB@

x0

x1

x2

x3

1CCCCA ;

onde temos explicitamente a matriz � (vy) procurada.

Vamos agora usar o formalismo baseado no grupo de Lorentz desenvolvido anteriormente (34). Se nosso

observador no sistema S0 deseja usar a TL ~� � � (vx) (33) (de�nida na direção x) tudo que ele precisa fazeré:

� girar o seu sistema de coordenadas na direção do eixo z no sentido anti-horário, de um ângulo de 45o.

Ou seja, ele precisa aplicar no seu sistema de coordenadas a rotação

R�� =

2z�=

0BBBB@1 0 0 0

0 cos �2 sin �2 0

0 � sin �2 cos �2 0

0 0 0 1

1CCCCA =

0BBBB@1 0 0 0

0 0 1 0

0 �1 0 0

0 0 0 1

1CCCCA :

Agora, com relação ao seu novo sistema de coordenadas ~x0 = Rx0 a velocidade v está na direção ~x1 (ou ~x1)

e ele pode usar a TL (33) que de�nimos anteriormente

� (vx) = ~� =

0BBBB@ � � 0 0

� � 0 0

0 0 1 0

0 0 0 1

1CCCCA :

Usando agora (34) temos:

� (vy) = R�1�� =

2z�� (vx)R

�� =

2z�

Tudo que precisamos fazer é calcular a inversa de R�1, mas como R 2 O (3)

R�1�� =

2z�= RT =

0BBBB@1 0 0 0

0 0 �1 0

0 1 0 0

0 0 0 1

1CCCCA ;

84

Page 85: Parte A (Relatividade)

e efetuar o produto matricial

� (vy) =

0BBBB@1 0 0 0

0 0 �1 0

0 1 0 0

0 0 0 1

1CCCCA0BBBB@

� � 0 0

� � 0 0

0 0 1 0

0 0 0 1

1CCCCA0BBBB@1 0 0 0

0 0 1 0

0 �1 0 0

0 0 0 1

1CCCCA

=

0BBBB@ �� 0 0

0 0 �1 0

�� 0 0

0 0 0 1

1CCCCA0BBBB@1 0 0 0

0 0 1 0

0 �1 0 0

0 0 0 1

1CCCCA =

0BBBB@ 0 � � 0

0 1 0 0

� � 0 0

0 0 0 1

1CCCCA :

Assim, a matriz

� (xy) =

0BBBB@ 0 � � 0

0 1 0 0

� � 0 0

0 0 0 1

1CCCCAque concorda com a obtida anteriormente, representa uma TL pura (um boost, sem nenhuma rotação) na

direção do eixo y. Da mesma forma, podemos agora obter as TL em qualquer direção.

Remark 49 Neste exemplo a utilização direta da TL é, obviamente, muito mais simples (o mesmo ocorrequando v está na direção de qualquer um dos eixos). Entretanto, para uma transformação numa direção

arbitrária, o uso do formalismo acima se mostra muito mais conveniente.

Exercise 50 Obtenha a transformação correspondente a composição das transformações: uma TL com ve-

locidade vx na direção x, seguida de uma outra TL com velocidade vy na direção y. A TL resultante é a

mesma de uma TL com velocidade vy na direção y seguida de uma com velocidade vx na direção x?

2.18 Minudências matemáticas

Alguns pontos formais sobre o desenvolvimento acima se fazem necessários.

2.18.1 Grupo

Neste ponto você já deve estar convencido de que o fato de uma matriz pertencer a um grupo é importante.

Como vimos, o fato de um conjunto de matrizes pertencer a um grupo nos permite usar várias de suas

propriedades. Por exemplo, se sabemos que se � 2 O (3; 1) podemos a�rmar que ��1 existe.Por de�nição, um grupo é qualquer conjunto G onde de�nimos uma operação � (chamada lei de composição

do grupo) que permite combinar quaisquer dois elementos de G para formar um terceiro elemento, a 2 G; b 2G =) a � b 2 G. Para que este conjunto forme o grupo (G; �), juntamente com esta operação, ele precisa

satisfazer quatro axiomas:

85

Page 86: Parte A (Relatividade)

1. Ser fechado:

para quaisquer elementos a; b 2 G, a composição a � b 2 G

2. A operação deve ser associativa:

para todo a; b; c 2 G =) (a � b) � c = a � (b � c).

3. Existe o elemento identidade:

existe um elemento e 2 G, tal que, para qualquer a 2 G; a � e = e � a = a.

4. Existência do inverso:

Para todo a 2 G existe um elemento b 2 G, tal que a � b = b � a = e (identidade).

A�rmar que SO (3; 1) forma um grupo implica em dizer que seus elementos respeitam todas as pro-

priedades acima. Em especial, o produto de duas TL é também uma TL e toda TL possui uma inversa.

Exercise 51 Mostre que as matrizes ortogonais, i.e., matriz que respeitam

RTR = I ;

formam um grupo.

2.18.2 Pseudo-métrica

Em todas as discussões acima explicitamos as semelhanças entre o espaço de Minkowski e o espaço euclidiano.

Entretanto, uma diferença crucial precisa ser salientada. Para qualquer vetor a a métrica M do espaço

euclidiano obedece:

aiMijaj = a:a = jaj > 0 ; a 6= 0 :

Esta propriedade faz parte da de�nição de um produto interno. Entretanto, quando falamos doespaço de Minkowski com a métrica � podemos ter

m����mv < 0 ;

para alguns 4-vetores. Basta que223Xi=1

�mi�2<�m0�2

:

O fato de um 4-vetor poder ter uma norma negativa faz com que a métrica � que de�nimos não se comportecomo uma métrica (no sentido usual). Por isso � é chamado de uma pseudo-métrica.Todas as características especiais do espaço de Minkowski estão no fato de uma das coordenadas entrar

no �produto interno� com um valor negativo. Por isso, toda quantidade que disser respeito a este tipo de

22Futuramente discutiremos as implicações físicas deste fato.

86

Page 87: Parte A (Relatividade)

espaço explicitam este fato, e.g, o nome do grupo SO(3; 1). Dizemos também que o espaço possui 3 + 1

dimensões. Se estivéssemos trabalhando com TL no plano teríamos o grupo SO(2; 1). Dizemos que estamos

trabalhando em 2 + 1 dimensões.

Observe também que todo o desenvolvimento acima pode ser feito usando:

�"

3Xi=1

�x0i�2 � �x00�2# = �

hX�xi�2 � �x0�2i

3Xi=1

�x00�2 � �x0i�2 =

�x0�2 �X�

xi�2

Ou seja, usando a métrica:

� =

0BBBB@1 0 0 0

0 �1 0 0

0 0 �1 0

0 0 0 �1

1CCCCA :

A escolha do �sinal�da métrica é uma questão de convenção.

Exercise 52 Mostre que, se �x0�2 �X�

xi�2

(35)

então, ���v:xc2

��� � � jtj

O que implica que, para qualquer TL, se t > 0 �! t0 > 0; t < 0 �! t0 < 0. Ou seja, a seqüência de dois

eventos que respeitem (35) é a mesma para qualquer referencial inercial.

2.19 Mecânica relativística

Resta-nos ainda saber como a mecânica de Newton deve ser modi�cada. Ou seja, sabemos que devemos

de�nir os referenciais inerciais pelas TL, e vimos uma série de conseqüências desta substituição, mas como

isso afeta a dinâmica dos corpos?Vejamos o que ocorre na lei clássica da conservação de momento.

As leis devem ser formuladas com forças de contato.

Imagine a colisão de dois corpos de massa ma e mb. A lei de conservação dos momento nos diz:

maua +mbub = mcuc +mdud (36)

onde (a; b) e (c; d) são os indices das quantidades antes e depois da colisão.

Se observarmos esta mesma colisão por um referencial que se move com velocidade v as transformações

87

Page 88: Parte A (Relatividade)

de Galileu (ou a soma de velocidades de Galileu) diz que as velocidades serão:

u0 = u� v

com isso

ma (u0a + v) +mb (u

0b + v) = mc (u

0c + v) +md (u

0d + v)

mau0a +mbu

0b + (ma +mb) v = mcu

0c +mdu

0d + (mc +md) v

Então, se admitirmos que a massa se conserva

ma +mb = mc +md ; (37)

o momento também será conservado no novo sistema de coordenadas:

mau0a +mbu

0b = mcu

0c +mdu

0d :

Entretanto, quando a transformação de velocidade de Galileu é substituída pela respectiva formula de Ein-

stein:

u =u0 + v

1 + u0v=c2

temos

ma

�u0a + v

1 + u0av=c2

�+mb

�u0b + v

1 + u0bv=c2

�= mc

�u0c + v

1 + u0cv=c2

�+md

�u0d + v

1 + u0dv=c2

�:

E, obviamente, a conservação do momento na forma (36) não será mais satisfeita.

Ou seja, se de�nirmos o momento como mv um e postularmos que a massa se conserva, não temos mais

a lei de conservação do momento.

A conservação do momento clássico está relacionada com a simetria de homogeneidade do espaço(simetria translacional e rotacional), que por sua vez se relaciona com as propriedades de transformaçãodos vetores no espaço euclidiano. Ou seja, a conservação do momento clássico é uma conseqüência de(por TG) a massa ser um escalar e a velocidade ser um vetor.Entretanto, no espaço 4D, a velocidade não se transformam como as coordenadas

u0x =dx0

dt0=

ux � v1� vux

c26= (ux � vt) ;

u0y =dy0

dt0=1

�uy

1� vuxc2

�6= uy ;

u0z =dz0

dt0=1

�uz

1� vuxc2

�6= uz ;

88

Page 89: Parte A (Relatividade)

ou seja, as componentes espaciais da velocidade não se transformam como as coordenadas e, certamente, nãosão parte de um 4D.Note, porém que, obviamente, os numeradores das quantidades acima se comportam como as componentes

espaciais de um 4D,

dx0i = �i �dx� (38)

o que nos mostra que o problema está no denominador, ou melhor, na de�nição da nossa medida tempo.

Exercise 53 Veri�que (38).

Assim, o fato da velocidade ser um vetor era muito importante na mecânica newtoniana, mas agora

esta quantidade não se comporta como um 4-vetor. Precisamos então encontrar o 4-vetor correspondente a

velocidade.

89

Page 90: Parte A (Relatividade)

2.19.1 Tempo próprio

Voltando para o problema do paradoxo dos gêmeos, vimos que a TRR poder ser usada (eliminado assim

o paradoxo) desde que o tempo aceito como verdadeiro seja aquele do referencial inercial. Usualmente, ao

estudarmos a dinâmica de um corpo, este sofre acelerações. Assim, mais uma vez é importante usarmos, não

o tempo visto diretamente do corpo, mas como este tempo é visto por um referencial inercial.

Suponha que S0 é um referencial qualquer (não necessariamente inercial) e S é um referencial inercial.

Relembrando o problema do paradoxo, Alice na nave em S0 sabia que havia se passado t0 = 7 anos no

relógio dela. Mas ela não podia usar este tempo porque (ela sabe que) seu referencial não era inercial.Então ela se perguntou: se Bob em S olhar pro meu relógio enquanto ele marca t0 = 7, quanto marcará o

relógio dele? A resposta (visão de Bob olhando um evento na nave):

�t = �t0 = (3; 57)� (7) = 25 anos (39)

então ela passou a usar o tempo de Bob para saber qual o tempo no referencial inercial da terra. Mesmo que

a nave de Alice mudasse de velocidade constantemente (i.e., sofresse várias acelerações), ela poderia calcular

o tempo marcado por Bob usando:

�t =

Z dt0 =

Z t0

0

1q1� [u(t)]2

c2

dt0

onde t0 é o tempo que ela registrou da viagem. Qual dos tempos �t de Bob ou �t0 de Alice é o melhor? A

resposta depende apenas do tipo de problema que se deseja resolver. Apesar de A estar num referencial não

inercial, haverá situações em que o tempo dela é o que "conta".

Obviamente o tempo t0 de Alice também é importante para ela, pois qualquer coisa que aconteça dentro

da nave acontecerá com esta taxa de tempo. Assim, se Alice tiver levado um livro de receita da terra e,

nos entremeios das tarefas especializadas de astronauta, ela quiser assar um bolo, ela usará o seu tempo t0.

Entretanto, se ela quiser marcar um encontro com alguém na sua volta, ela deverá usar o tempo �t calculado

acima.

Mesmo para B o tempo de A pode ser o mais importante. Suponha que, diferente do exemplo anterior,

a nave permanece acelerada durante toda a viagem (o que é mais razoável que uma inversão instantânea na

velocidade), mas de forma que, durante toda a viagem

dt0 =1

dt =) �t0 =

Z �t

0

s1� [u (t)]

2

c2dt = 14 anos .

(este é o inverso do cálculo anterior) onde �t = 50 anos é o tempo da viagem para B e �t0 = 14 anos, o tempo

para A. Imagine que antes da viajem B tenha de abastecer a nave de A. Pelos cálculos precisos (usando a

mecânica relativística) B sabe que durante toda a viagem o motor da nave consumirá 1 T de combustível por

90

Page 91: Parte A (Relatividade)

ano. Entretanto, B sabe que este consumo se refere a um motor parado na bancada de teste. Quando este

motor for colocado na nave ele também estará em movimento e, independente da tecnologia envolvida, todo

o seu mecanismo funcionará mais devagar. Enquanto para A, para quem o motor permanecerá parado, a

taxa de consumo será a mesma medida na terra. Assim, B sabe que o motor consumirá 1 T/ano não durante

os �t = 50 anos da viagem (que é o tempo que ele registrará), mas durante o tempo:

�t0 =1

�t =

1

3; 5750 = 14 anos:

Ou seja, ele terá de abastecer a nave com 14 T de combustível (e não com 50 T). Assim, qual tempo é o mais

importante depende apenas da resposta que procuramos.

Concluindo, o tempo �t0 é importante para eventos que ocorrem exclusivamente dentro da nave. Entre-

tanto, a dinâmica de vários corpos, por exemplo, num problema de choque entre dois corpos (neste caso duas

naves) envolve o tempo de eventos fora do seu referencial. Neste caso, alguém num referencial inercial (onde

as leis da Física são válidas) faz um cálculo e chega à conclusão que o choque das naves acontecerá em t = T .

. E este é o tempo que todos os demais referenciais vão ter de usar.

Ainda nos exemplo das naves, suponha que temos agora 2 nave: a de Alice (A) e a de Charles (C). As

naves viajaram para lugares diferentes com velocidades diferentes, mas Bob realizou todos os cálculos para

que em ambos os casos a viagem dure �t = T anos. Ou seja, o evento �o encontro das naves na terra�

ocorrerá após �t = T anos. Imagine que A e B querem saber o quanto de comida eles devem levar, ou ainda,

eles podem querer colocar seus próprios relógios para despertar na ocasião do encontro. Eles sabem que,

visto da terra, o relógio deles anda mais devagar e quando o relógio da terra marcar um tempo T o relógio

em cada nave (chamemos de Ta o tempo de Alice e Tc o tempo de Charles na outra nave) marcará (observe

que o problema agora é o contrário de (39))

Ta;c =

Z T

0

s1� [ua;c (t)]

2

c2dt :

onde a velocidade ua;c é a velocidade de A;C com relação a terra.

De forma geral, se todos os objetos envolvidos concordarem em usar o tempo de um referencialinercial S, quando se passar um intervalo de tempo dt neste referencial, para qualquer objeto que se mova

com velocidade u (em relação a S) terá se passado um intervalo de tempo:

d� =1

dt =

r1� u2

c2dt :

Este intervalo é chamado de tempo próprio do objeto 23 . Este tempo, que é o tempo que o seu próprio relógio

registra enquanto o relógio do referencial inercial marca um tempo dt, nos diz que, quanto mais rápido nos

23Na expressão acima colocamos u no lugar de v apenas para explicitar que é a velocidade do objeto em observação e não avelocidade entre referenciais. De outra forma, S0 sempre estará em movimento com o objeto em questão.

91

Page 92: Parte A (Relatividade)

movemos, nosso relógio é mais lento em relação a outro relógio que �cou parado.

Para o caso em que v = 0 (um observador no referencial de interesse) temos, obviamente, d� = dt0.Observe que, pela de�nição do tempo próprio, temos

(d�)2=

�1� u2

c2

�(dt)

2=

"1� 1

c2

�dx

dt

�2#(dt)

2

=

�(dt)

2 � 1

c2(dx)

2

�=1

c2

h(cdt)

2 � (dx)2i

=1

c2

h�dx0�2 � (dx)2i = � 1

c2

h(dx)

2 ��dx0�2i

= � 1c2dx����dx

� :

Lembrando da invariância de dx� por uma TL (30) temos

(d� 0)2= � 1

c2dx

0����dx0� = � 1

c2dx����dx

� = (d�)2:

Dizemos, com isso, que o tempo próprio é um invariante (o mesmo valor em qualquer referencial).

Obviamente o tempo próprio depende da velocidade do observador. Por exemplo, se um observador A se

move com velocidade tal que a = 2 e outro C com velocidade tal que c = 3 então:

d�a =1

adt =

1

2dt ;

d� c =1

cdt =

1

3dt :

O que signi�ca então dizer que d� é um invariante relativístico e, conseqüentemente, o mesmo visto por

qualquer observador?

Uma TL informa como um observador vê um dado de um outro observador. Então, se A e C são

relacionados por uma TL � a invariância relativística signi�ca que:

d�a��! d� 0a = d�a

Ou seja, d� 0a não é o tempo próprio de C (d� 0a 6= d� c), mas sim como C vê o tempo próprio de A e esta

quantidade é um invariante.

Remark 54 A razão desta quantidade ser um invariante se deve ao fato de todos os observadores terem

concordado em usar o mesmo relógio de um referencial inercial.

92

Page 93: Parte A (Relatividade)

2.19.2 Quadrivetor velocidade

Voltando agora ao nosso problema da velocidade não ser um 4-vetor, havíamos reparado que o problema

(o fato de não se transformar como as coordenadas) estava na transformação de dt no denominador, pois o

numerador (naturalmente) já se transformava como um 4-vetor. Assim, sendo d� um invariante (não muda

por uma TL), certamente a quantidade:

�� =dx�

d�

é um 4-vetor, i.e., se transforma como

�0� =dx0�

d�=�� �dx

d�= �� �

dx�

d�= �� ��

� (40)

A quantidade � é chamada de 4-vetor velocidade (ou, simplesmente, 4-velocidade). Suas componentes espa-

ciais:

�i =dxi

d�=) � =

dx

d�;

formam uma quantidade híbrida, onde o espaço é medido por um observador num referencial S, enquanto o

tempo é o registrado por um relógio num outro referencial inercial S0 (não necessariamente inercial), masvisto por um observador em S. Estas componentes espaciais são chamadas de velocidade própria. Isso porque,

se usarmos a própria medida de tempo do referencial de interesse S, onde d� = dt, esta quantidade se torna

a velocidade ordinária medida por um observador em S.

2.19.3 Momento relativístico

Nossa tentativa para salvar a lei de conservação dos momentos consiste em tentar usar a 4-velocidade � no

lugar da velocidade ordinária v (que sabemos não formar um 4-vetor). Ou seja, p = m�. Assumindo que o

momento assim de�nido se conserva temos:

ma�1a +mb�

1b = mc�

1c +md�

1d ; (41)

onde supusemos que o choque ocorre com a velocidade no eixo x (�1). Quando vista por um observador num

referencial S0, que se move com velocidade v também na direção x, a lei de transformação (40) nos dá:

�01 = ��1 � ��0

�=) �1 =

1

�01 + ��0 :

=1p1� �2

; � =v

c

93

Page 94: Parte A (Relatividade)

Com isso, a igualdade (41) se torna:

ma

�1

�01a + ��

0a

�+mb

�1

�01b + ��

0b

�= mc

�1

�01c + ��

0c

�+md

�1

�01d + ��

0d

�Para que a conservação do momento ocorra, i.e., para termos:

ma�01a +mb�

01b = mc�

01c +md�

01d ;

primeiro precisamos que os termos com �0 se cancelem:

ma�0a +mb�

0b = mc�

0c +md�

0d :

Esta expressão, que toma o lugar da conservação da massa na teoria clássica (37), possui uma conseqüência

importante. Usando a forma explicita da componente �0

�0 =dx0

d�=

cdtq1� u2

c2 dt=

cq1� u2

c2

temos (onde u é a velocidade de cada objeto)24

maq1� u2a

c2

+mbq1� u2b

c2

=mcq1� u2c

c2

+mdq1� u2d

c2

:

Assim, na RR restrita a massa não é uma quantidade conservada. Em seu lugar, se um corpo tem

massa m num sistema onde ele está em repouso, quando se move com velocidade /u;a quantidade que se

conserva é

mR =mq1� u2

c2

: (42)

Assim no lugar da conservação da massa da teoria clássica m, temos agora a conservação da quantidade

mR acima. A quantidade mR acima foi chamada por Einstein de massa relativística, enquanto m (a massa

medida no referencial onde o corpo está em repouso) foi chamado de massa de repouso.

Concluído o desenvolvimento acima temos:

� Se de�nirmos o momento como p = m� a lei de conservação do momento (i.e., a conservação do

momento total do sistema) é consistente com o princípio da relatividade, desde que a massa relativística(42) também se conserve.

24Observe que temos duas velocidades no problema, a velocidade do corpo (u) e a dos referenciais (v).

94

Page 95: Parte A (Relatividade)

Ou seja, temos a conservação das quantidades:

p ; p0 (43)

onde

p = m� =mq1� u2

c2

dx

dt=

muq1� u2

c2

; p0 = m�0 =mcq1� u2

c2

(44)

Que podem ser agrupadas nas componentes de uma única quantidade:

p� = m�� = mdx�

d�(45)

Esta quantidade, obviamente (como d� é invariante), se transforma por uma TL de como

p0� = �� �p� :

Assim a quantidade (45) é um 4-vetor. Este 4-vetor é chamado de 4-vetor de energia e momento25 (ou

simplesmente, 4-momento).

Sendo a quantidade p (momento) um 4-vetor, temos que o seu produto interno

p����p� =

Xi

�pi�2 � �p0�2 ; (46)

é um escalar (i.e., um invariante), ou seja, possui o mesmo valor quando visto de qualquer referencialinercial. Usando (44) podemos determinar explicitamente o valor deste invariante

Xi

�pi�2 � �p0�2 =

Xi

�mdxi

d�

�2��mdx0

d�

�2

= m2Xi

0@dxidt

1q1� u2

c2

1A2

0@ cdt

dtq1� u2

c2

1A2

= m2

"1

1� u2

c2

Xi

�ui�2 � c2

1� u2

c2

#

=m2

1c2 (c

2 � u2)�u2 � c2

�= �m2c2 : (47)

O que explicita o fato de a massa de repouso ser um invariante, apesar de não ser uma quantidadeconservada.Resumindo, temos aqui duas quantidades que se conservam (43) e um invariante (46).

25A motivação para este nome será apresentada adiante.

95

Page 96: Parte A (Relatividade)

Exercise 55 Qual a diferença entre uma quantidade conservada e um invariante?

Um invariante é uma quantidade que possui o mesmo valor quando vista de qualquer refer-encial inercial. Assim a quantidade (46) tem o mesmo valor numérico quando calculado por qualquerobservador. Já uma quantidade conservada é uma que possui o mesmo valor quando calculada pelomesmo observador antes e depois de um processo (e.g., o choque entre partículas).

Assim a massa relativística mR é uma quantidade conservada: se um observador num dado refer-

encial calcular a massa relativística total do sistema antes e depois de qualquer processo, ele obterá o mesmo

valor. Entretanto, se calculado por um observador num outro referencial este obterá um outro valor m0R (que

também se conservará), de sorte que mR é uma quantidade que se conserva, mas não é um invariante,pois, obviamente, depende da velocidade com que o observador vê a o corpo. Por outro lado, assim como d� ,

a massa de repouso é um invariante, pois qualquer referencial medirá a mesma massa de repouso de umcorpo, mas não é uma quantidade conservada, pois, como veremos, esta massa pode ser convertida emoutras formas de energia26 . Quantidades como a carga elétrica é um invariante (todos medem o mesmo

valor da carga) e uma quantidade conservada (a carga total antes e depois de um processo é a mesma).

Quantidades como o momento clássico mv não é um invariante nem uma quantidade conservada.

É importante salientar que, assim como a equação de Newton, as leis da mecânica relativistica não

podem ser obtidas de argumentos puramente matemáticos. Ou seja, o fato da quantidade acima realmente

se conservar na natureza precisa ser testada experimentalmente. Assim, encontramos um bom candidato

para uma quantidade que pode se conservar, mas a veri�cação desta hipótese está sujeita a comprovações

experimentais. O mesmo acontecerá com outras quantidade que vamos deduzir. O ponto aqui é que a

conservação do momento relativístico, de�nido acima, é uma das leis da física mais bem testada e con�rmada

experimentalmente.

26Na teoria clássica a massa era uma quantidade conservada e um invariante.

96

Page 97: Parte A (Relatividade)

2.19.4 Energia relativística

Recapitulando:

� p����p� é invariante:P

i

�pi�2 � �p0�2 = �m2c2;

� pi e p0 se conservam (pii = pif );

� p0 = m�0 = mcq1�u2

c2

=) mR =mq1�u2

c2

se conserva.

Com o desenvolvimento da TRR a idéia de massa relativística foi sendo abandonada em pró de outra

de�nição. Assim, em trabalhos mais recentes não se faz muito uso desta de�nição. Atualmente se usa apenas

a massa de repouso, chamada novamente simplesmente de massa, e se de�ne a quantidade

E = c:p0 = c:m�0 =mc2q1� u2

c2

= c2mR ; (48)

como a energia relativística do corpo. Obviamente, se m�0 se conserva, c:m�0 também se conserva, uma vez

que c é uma constante. Observe, entretanto, que isso é apenas uma questão de nomenclatura, pois apenasuma quantidade se conserva. O resultado físico é que temos uma quantidade conservada (chame-ade mR; p

0 ou E).

Uma das motivações para o nome de �energia relativística�vem do fato de que, para velocidade muito

inferiores a da luz, podemos fazer uma expansão em v=c e escrever

E =mc2q1� u2

c2

= mc2 +1

2mu2 +

3

8mu4

c2+ :::

onde u é a velocidade usual do corpo. O segundo termo da expressão acima é exatamente a energia cinéticaclássica do corpo. Assim, em relatividade chamamos de E a energia total do corpo, mc2 a sua energia de

repouso (ou seja, a energia de uma partícula em repouso), enquanto o restante�E �mc2

�é a sua energia

cinética (ou seja, a energia atribuída ao movimento).

Outra motivação para a de�nição acima é a possibilidade de se convertes a energia de repouso em energia

cinética, ou seja, extrair outras formas de energia da massa da partícula. Neste caso, obviamente, a massa

(de repouso) não é conservada, mas a energia relativística sim. Por isso toda a atenção é concentrada na

energia. Ao invés de inventarmos uma nova "lei da conservação da massa relativística", continuamos falando

(apenas com uma releitura) da antiguíssima (e sempre triunfante) lei da conservação da energia.

� Em todo sistema fechado a energia (relativística) total e o momento (relativístico) se conservam.

Remark 56 Por isso, no que segue, sempre que falarmos de massa estamos nos referindo a massa derepouso.

97

Page 98: Parte A (Relatividade)

Escrita em termos da energia (48) o 4-vetor momento (45) toma a forma

p0 =mcq1� u2

c2

=E

c;

p =�p0;p

�=

�E

c;p

�;

pi = m�i =E

c2vi ; vi =

dxi

dt: (49)

Onde vemos porque este 4-vetor é também chamado de 4-vetor de energia e momento.

Calculando novamente o invariante (46) em termos da energia temos:Xi

�pi�2 � �p0�2 = �m2c2

Xi

�pi�2 � �E

c

�2= �m2c2

(p)2 � E2

c2= �m2c2

E2 � c2 (p)2 = m2c4 (50)

onde usamos (47). Esta expressão nos permite calcular o momento conhecendo-se a energia e vive-versa. As

componentes do momento podem ser calculas usando (49).

Exemplo:Duas partículas de massa m (sempre estaremos falando da massa de repouso), com velocidade va = 3c=5

e vb = �3c=5 sofrem um choque completamente inelástico27 (ou seja, se fundem). Qual a massa do corpo

resultante?

Os momentos das duas partículas são iguais e de sinais opostos, de sorte que o momento total inicial se

anula. A energia de cada corpo antes da colisão vale:

Ea = Eb =mc2q

1� (3c=5)2

c2

=mc2q1�

�35

�2 = mc2q1625

=5

4mc2

Assim, a energia total Ei antes da colisão vale

Ei = Ea + Eb =5

2mc2

27Como na mecânica clássica, chamamos uma colisão de elástica se a energia cinética é conservada. No caso de uma colisãoelástica a massa se conserva.

98

Page 99: Parte A (Relatividade)

Como o momento �nal é nulo, a energia total depois da colisão vale

Ef =Mc2q1� (0)2

c2

=Mc2

A conservação da energia nos dá

Ei = Ef =)M =5

2m

2 +9

25=59

25

(Observe que estamos falando da massa de repouso.) Que difere bastante do valor 2m esperado classicamente.

Ou seja, a massa prevista pela RR é 25% maior que a massa prevista pela teoria clássica. Resultados

experimentais com a colisão departículas con�rmam o resultado acima.

Remark 57 O resultado acima é provavelmente o mais impressionante e revolucionário resultado da TRR.

Exercise 58 De onde veio os 25% de massa acima? Esta massa foi criada do nada?

Obviamente esta massa veio da energia cinética original do sistema, ou seja, convertemos movimentoem massa.

Exercise 59 Mesmo na análise clássica tínhamos uma lei de conservação da energia. Se, classicamente,a massa depois do processo é igual a soma das massas e a partícula resultante está parada, pra onde foi a

energia cinética inicial?

Classicamente a energia cinética antes da colisão é convertida em energia térmica. Ou seja, a bola

resultante está aquecida. Isso também é verdade em relatividade. O ponto aqui é que, enquanto classicamente

esta energia térmica representa apenas a energia cinética dos constituintes do corpo, na relatividade ela

in�uencia diretamente na massa do corpo. Assim, se você pesar um corpo aquecido ele pesará mais que

o mesmo corpo quando frio. Mais ainda, qualquer forma de energia interna do sistema (cinéticaou potencial) se re�ete na massa deste sistema. Obviamente esta mudança da massa é da ordem da

energia dividida por c2, o que, em casos cotidianos, representa uma quantidade muito pequena.

Remark 60 Ou seja, se você colocar numa balança dois corpos exatamente iguais (e.g., duas batatas) eum deles estiver aquecido, este corpo aquecido terá um peso maior que o não aquecido. Isso é válido para

qualquer tipo de energia que um corpo tenha.

2.19.5 Mais do mesmo

O desenvolvimento acima segue uma linha baseada na invariância de certas quantidades por TL. Para quem

este desenvolvimento pareça muito formal pode ser interessante obter o mesmo resultado através de outro

caminho.

99

Page 100: Parte A (Relatividade)

Por exemplo, imagine que você fez uma série de experimentos num laboratório e constatou que a massa

de um corpo depende diretamente de sua energia e, apenas com base neste resultado você queira saber como

se modi�cam as leis da dinâmica.

Vejamos como o resultado anterior pode ser obtido diretamente da suposição que a massa de um corpo

depende diretamente da energia (e, vice-versa). Ou seja,

m (E) =E

c2� mE ; (51)

(onde a constante de proporcionalidade c2 é necessária para acertar as unidades). O trabalho para se mover

este corpo contra uma força F seria

W =

ZF:dx) dW = F:dx :

A variação da energia de um corpo com o tempo é igual a variação do trabalho com o tempo

dE

dt=dW

dt= F:

dx

dt= F:v :

Reconhecendo agora o momento do corpo como p = mEv (onde v é a velocidade ordinária e não a velocidade

própria �) temos, pela lei de Newton,

F =dp

dt) dE

dt=dp

dt:v =

d (mEv)

dt:v (52)

usando a hipótese (51),d�c2mE

�dt

= c2d (mE)

dt=d (mEv)

dt:v

Multiplicando por 2mE ambos os lados temos

2mEc2 d (mE)

dt= 2mE

d (mEvi)

dt:vi

Se usarmos agora

dh(mE)

2i

dt= 2mE

d (mE)

dt

dh(mEv)

2i

dt=

dh(mEv)

2i

dt= 2mEvi

d (mEvi)

dt

temosdh�c2mE

�2idt

=dh(mEv)

2i

dt

100

Page 101: Parte A (Relatividade)

Integrando esta equação �c2mE

�2= (mEv)

2+ C ; (53)

com C uma constante. Se a expressão acima for válida para qualquer velocidade, incluindo v = 0, temos

C = c2m2 ; m = mE(v=0)

onde m é a massa do corpo em repouso. Com isso, retornando para (53),

c2m2E = (mEv)

2+ c2m2

m2E

�c2 � v2

�= c2m2

m2E =

c2m2

[c2 � v2] ) mE =mq1� v

c22= mR :

Que concorda com a massa relativística mR obtida anteriormente. Com isso,

� a mecânica relativística pode ser obtida a partir da mecânica clássica (com a de�nição usual do momentop = mRv = m� e a lei de Newton), adicionando a suposição de que a massa depende da energia

(substituindo m por mR).

Assim, se na resolução de um problema de mecânica relativística você se esquecer dos invariantes, quanti-

dades relativísticas conservadas etc., basta usa a mecânica Newtoniana substituindo a massa de repouso pela

massa relativística. Esta é a abordagem mais comum, principalmente em livros mais antigos. Entretanto,

como vimos, a idéia de massa relativística caiu em desuso em pro do conceito de energia relativística. Como

veremos, esta reformulação é especialmente útil quando valamos de fótons. Além disso, o desenvolvimento

formal que �zemos permite introduzir a importante idéia de espaço-tempo e de quadrivetores, idéias indispen-

sáveis no tratamento de problemas mais so�sticados (e na compreensão de artigos cientí�cos), especialmente,

em problemas de eletromagnetismo.

2.19.6 Fissão e fusão

Ao discutirmos o exemplo do choque inelástico das partículas acima, chegamos a conclusão que toda a energia

cinética foi convertida em massa e esta massa estava relacionada com a energia cinética interna (ou qualquer

outra energia interna) dos constituintes deste corpo. No caso desta energia ser uma temperatura e se o corpo

entrasse em contato com o ambiente ele poderia esfriar, irradiando assim a sua energia extra para o ambiente

(e perdendo massa!).

No caso de sistemas microscópicos, ou mesmo partículas elementares, o sistema não possui uma estrutura

interna com constituintes su�cientes para comportar toda esta energia extra da colisão (não há o que �car

vibrando lá dentro). Desta forma, esta energia extra é expelida (irradiada) logo após o processo de ligação

na forma de radiação.

101

Page 102: Parte A (Relatividade)

Se no memento da colisão de duas partículas de massa ma e mb o sistema possui uma energia cinética

total K a energia �nal do sistema vale

E = c2 (ma +mb) +K �R

onde R é a energia irradiada. Sendo a massa determinada pela energia, a massa �nal do sistema vale

M = (ma +mb) +(K �R)

c2:

Assim, se a energia cinética total do sistema na colisão vale K e o sistema irradia uma energia R, temos

duas opções:

1. Se R < K ()M > ma +mb

2. Se R > K ()M < ma +mb

Como mencionado acima, se o sistema não possuir uma estrutura interna su�ciente para �armazenar�

a energia cinética da colisão a única opção é irradiar esta energia. . Com isso, o que ocorre nos processos

envolvendo sistemas mais simples (como partículas ou núcleos leves) é que M < ma + mb, i.e., a energia

irradiada é maior que a cinética. Assim, neste processo uma parte da massa das partículas originais é

transformada em energia.

Por exemplo, uma partícula � (um núcleo de hélio) é cerca de 0; 7% mais leve que a soma de dois prótons

e dois nêutrons (que são os seus constituintes). A diferença de energia correspondente a esta diferença de

massa é exatamente a energia necessária para se separar as partículas.

Uma vez que a energia cinética K é a energia que precisamos dar ao sistema para realizar a colisão e

formar o objeto �nal, como R > K a energia irradiada nos processo de fusão de duas partículas é maior que

a introduzida e esta diferença vem da diminuição da massa do sistema. Ou seja, no processo de fusãoconvertemos massa diretamente em energia.Esta conversão também esta presente nos processos convencionais. Por exemplo, se explodirmos 20

kilotons de TNT é possível veri�car que a poeira que sobra da explosão é cerca de 1 grama menor que a

massa original. Imaginado o estrago que 20 Ktons de dinamite podem fazer, você pode imaginar o resultado

da transformação de 1 grama de matéria em energia. Neste exemplo a massa do sistema variou 5� 10�9%,vemos assim como a energia envolvida na produção da partícula � (0; 7%) é muito mais e�ciente.

O processo de produção de energia pela fusão de núcleos atômico é como o sol produz a sua energia.

Para promover a separação da ligação descrita acima, precisamos compensar a massa extra necessária

para a existência das partículas separadamente. Assim, para dissociar a ligação temos de fornecer ao sistema

uma energia igual a diferença de massa. Esta energia é igual a energia de ligação do sistema. Como pode

ser veri�cado com exemplos concretos (exercícios), esta energia é usualmente muito grande de sorte que as

partículas formadas no processo de fusão são bastante estáveis.

102

Page 103: Parte A (Relatividade)

Exercise 61 Sabendo que a massa do próton vale 1; 007276466812 u (unidade de massa atômica), a donêutron 1; 00866491600 u e a da partícula alfa 4; 001506179125 u, qual a energia liberada (em eV) na fusão

desta quatro partículas.

Para partículas maiores (e.g., o urânio com 92 prótons e 143 nêutrons), como núcleos de átomos mais

pesados, ou mesmo moléculas, a estrutura interna do sistema é grande o su�ciente para comportar (reservar)

parte da energia cinética da colisão. Para tais sistemas K > R de sorte que o sistema ligado tem uma

massa maior que a massa dos constituintes separadamente (M > ma+mb, como no exemplo da colisão visto

anteriormente). Assim, quando separadas a diferença de massa é liberada na forma de energia. Diferente das

partículas menores descritas acima, esta energia extra age na intenção de separar o sistema (contra alguma

força de ligação, como nuclear ou eletromagnética). Assim, estes sistemas tendem a se separar espon-taneamente e liberar esta energia extra, i.e., tais sistemas são instáveis (mas este tempo de decaimento égeralmente muito grande, da ordem de milhões de anos). Mas, obviamente, esta separação pode ainda ser

estimulada pelo fornecimento de mais energia ao sistema. Assim, ao fornecer ao sistema uma certa energia E

este se separa liberando, não apenas a energia E fornecida, mas também a energia da diferença das massas

(ma +mb �M). Este é o processo de �ssão.O processo de �ssão é o envolvido nas primeiras gerações (1945) de bombas atômicas (ou bomba-A). Os

materiais radioativos geralmente usados neste tipo de bomba são o urânio-235 e o plutônio-239 (os números

se referem a massa atômica do material). Neste tipo de dispositivo, menos de uma tonelada de materialradioativo é capaz de produzir o mesmo efeito de 500.000 toneladas de TNT.A segunda geração de bombas atômicas (1952), conhecidas como bombas de hidrogênio (ou bomba-H,

ou ainda bomba termonuclear) utilizam o processo de fusão descrito anteriormente. Neste tipo de bombaexiste uma bomba-A auxiliar (chamada de gatilho) que é responsável pela energia necessária para o processo

de fusão. Este tipo de bomba utiliza como material isótopos do hidrogênio: o deutério e o trítio. Este

processo é absurdamente mais e�ciente que o de �ssão. Uma bomba termonuclear moderna pode gerar, a

partir de pouco mais de um quilo de matéria, a energia liberada por 1,2 milhões de toneladas deTNT.O processo de �ssão é o utilizado nas usinas nucleares para a produção de energia. Um dos desa�os atuais,

e uma esperança para o problema da crise de energia, é se produzir, de forma controlada, o processo de fusão.

103

Page 104: Parte A (Relatividade)

2.19.7 Fótons

Acima vimos que atualmente o conceito de energia relativística é preferido ao de massa relativística. Com

o salientamos, esta escolha é apenas uma questão de nome. Entretanto, este é um ótimo exemplo de como

uma simples reinterpretação dos mesmos resultados pode levar a novas conclusões.

Os fótons viajam a velocidade da luz c, assim, sua massa relativística seria:

mR =mp1� 1

=m

0

ou seja, se o fóton tiver qualquer valor de massa diferente de zero, sua massa relativística seria in�nita. Em

outras palavras, qualquer fóton carregaria um momento (e, conseqüentemente, uma energia) in�nita e uma

simples lanterna seria uma arma mortal. Entretanto, se m = 0, temos uma indeterminação na expressão

acima, ou seja, uma partícula que viaje sempre a velocidade da luz pode ter uma massa relativística (ouuma energia relativística) �nita, mesmo tendo uma massa de repouso nula. Obviamente tal idéia não faz

sentido na mecânica clássica, onde qualquer partícula sem massa teria sempre momento e energia iguais a

zero. Como vimos, na TRR a massa não é a única responsável pela inércia dos corpos, mas também qualquer

forma de energia que este corpo carregue.

Vamos então, como feito antes, abandonar a idéia de massa relativística e trabalhar com o conceito

de energia relativística. Neste caso, podemos por um momento esquecer a expressão acima e trabalhar

diretamente com o invariante obtido na expressão (50)

E2 � (cp)2 = m2c4 :

E, para evitar o problema descrito no primeiro parágrafo, vamos assumir que a massa de repouso dofóton é zero e assumir que isso nos dê um valor �nito para a energia relativística28 . Esta última suposição

pode, obviamente, ser comprovada experimentalmente (e.g., no efeito fotoelétrico). Observe que enquanto a

pergunta sobre a massa relativística do fóton pode trazer dúvidas, ninguém duvidaria que o fóton tenha uma

energia �nita. Neste sentido a reinterpretação citada acima permite o desenvolvimento natural das idéias.

Com isso, a expressão acima se torna:

E2 � (cp)2 = 0 =) E = c jpj :

Assim, uma vez determinada a energia do fóton (e.g., através do efeito fotoelétrico), podemos a�rmar que

este possui um momento

p =E

c:

Ou seja:

28Obviamente, poderíamos falar que a massa relativística é �nita, mas este jargão não é usado. Falamos sempre que o fótonnão tem massa, mas tem energia.

104

Page 105: Parte A (Relatividade)

� o fóton não possui massa, mas possui momento.

Observe como é importante o fato da velocidade do fóton ser sempre c. Caso contrário, quando a

velocidade fosse menor que c a sua energia relativística seria (obrigatoriamente) nula e ele não teria nem

massa, nem energia, nem momento, nem nada. Ou seja, os fótons não poderiam interagir com nada e seria

como se eles não existissem.

Neutrinos são partículas que viajam a uma velocidade próxima (mas diferente) da luz. Durante algum

tempo especulou-se que a massa do neutrino também fosse nula, mas experimentos realizados em 1998

mostram que eles carregam uma massa bem pequena.

Classicamente uma partícula de massa nula teria também momento nulo. Mas na relatividade isso não é

verdade. Além disso, pela conservação do momento, obviamente este momento do fóton pode ser transferido

para outro corpo num problema de espalhamento. Este momento ao ser transferido para os objetos massivos

exerce a chamada pressão de radiação. É a pressão da radiação solar que destorce a calda dos cometas

fazendo as aponta na direção contrária ao sol. Existem até propostas da NASA de velas que funcionariam

com a pressão da radiação solar.

Podemos ter processos em que a massa do sistema desaparece completamente e é convertida em energia,

e.g., eletromagnética. Como também processos onde massa é criada apenas de radiações.

Exercise 62 Um pion neutro (isso é importante pela conservação de carga) decai em dois fótons. Sabendo

que a massa de repouso do pion vale 2; 4 � 10�28 kg, qual o momento dos fótons criados. É possível que opion decaia em apenas um fóton? Justi�que sua resposta.

Este tipo de processo onde toda a massa do sistema é transformada em energia eletromagnética é chamado

de aniquilação.

Por outro lado, para campos eletromagnéticos muito intensos é possível termos a criação de partículas

e suas respectivas anti-partículas. Observe que nestes processos uma série de leis de conservação deve ser

satisfeita (e.g., momento, momento angular, carga). A princípio, a relação entre massa e energia implica que

qualquer energia (desde que grande o su�ciente) possa ser convertida em massa de repouso. Desta forma,

mesmo campos gravitacionais muito intensos podem criar pares de partículas. Provavelmente este tido de

efeito ocorre nas vizinhanças de um buraco negro.

Em mecânica os corpos se distinguem por suas características como massa, velocidade carga etc., se todos

os fótons têm a mesma massa (m = 0) e viajam sempre a mesma velocidade, então todos os fótons são iguais?

A resposta para esta pergunta foge ao escopo da relatividade e entra nos domínios da mecânica quântica.

Como veremos, a energia dos fótons está diretamente relacionada com a sua freqüência (�) de acordo com a

chamada fórmula de Planck, E = h�, onde h é a constante de Planck. Assim, um fóton azul é mais energético

que um vermelho, podendo assim transferir um momento maior para um outro sistema.

É importante notar que no eletromagnetismo a razão entre a energia e o momento de uma onda eletro-

magnética também é uma constante. Para uma onda monocromática com intensidade de campo elétrico E0

105

Page 106: Parte A (Relatividade)

temos

hEi = 1

2"0E

20 ; hpi =

1

2c"0E

20

e, portanto

hEi = hpi c :

Este resultado, que concorda com (??), vem do fato do fóton ser a partícula associada com a quantização do

campo eletromagnético.

Além disso, a possibilidade de da criação de pares faz com que qualquer teoria que descreva satisfatori-

amente o comportamento de partículas carregadas em campos eletromagnéticos deve comportar a criação e

aniquilação das cargas. Isso é o que ocorre nas equações de Klein-Gordon e na equação de Dirac.

2.20 Dinâmica relativística

Como vimos com os resultados anteriores, a dinâmica de corpos pode ser descrita usando a lei de Newton,

desde passemos a usar o momento relativístico

F =dp

dt; p = m� =

mq1� u2

c2

u :

Vejamos então o que acontece, por exemplo, quando uma partícula, inicialmente em repouso, é sujeita a uma

força constante, F =constante. Obviamente, neste caso, podemos analisar o problema apenas na direção da

força

F =dp

dt=) p =

Z t

0

F dt+ C = Ft+ C

Como a partícula estava inicialmente em repouso, em t = 0 devemos ter o momento inicial

0 = F0 + C =) C = 0

com o que

p = Ft

usando a forma explícita de p temos

p = Ft =mq1� u2

c2

u

106

Page 107: Parte A (Relatividade)

resolvendo para a velocidade �F

mt

�2=

11u2

�1� u2

c2

� = 1�1u2 �

1c2

� ;1

u2=

1�Fm t�2 + 1

c2;

u2 =

�Fm t�2h

1 +�Fmc t�2i ;

u =Fm tq

1 +�Fmc t�2 :

O numerador é a resposta obtida com a mecânica clássica, que seria o que obteríamos da expressão acima

para o caso(F=m) t << c. O denominador, entretanto, nos diz que, com o passar do tempo a taxa de aumento

develocidade diminui.

_u =F

m

q1 +

�Fmc t�2"1� 1

1 +�Fmc t�2 � F

mct

�2#

=F

m

1h1 +

�Fmc t�2i3=2

ou seja, diferente do resultado clássico a partícula não sofre uma (des)aceleração constante.

A idéia é que a massa (relativística) vai aumentando com a velocidade, de sorte que, para mantermos a

aceleração, devemos aumentar constantemente a força.

Da expressão para u temos também a velocidade limite para a partícula, pois, quando t!1,

u =Fm (t!1)q

1 +�Fmc (t!1)

�2 = Fm (t!1)�Fmc (t!1)

� ! c :

Como sabemos, a velocidade limite para a partícula vale c.

107

Page 108: Parte A (Relatividade)

Para estudar a posição da partícula com o tempo,

u =Fm tq

1 +�Fmc t�2 = dx

dt;

x (t) =F

m

Z t

0

t0q1 +

�Fmc t

0�2 dt

=F

m

24�mcF

�2s1 +

�F

mct0�235t

0

;

x (t) =mc2

F

24s1 + � F

mct

�2� 1

35 :

Reescrevendo esta equação na forma

Ax+ 1 =

q1 + (Ct)

2

A =1�mc2

F

� ; C = F

mc

(Ax+ 1)2 � (Ct)2 = 1

y = Ax+ 1 ; z = Ct

y2 � z2 = 1 ;

ela pode ser reconhecida como a equação de uma hipérbole. Ou seja, no lugar da parábola clássica x / t2,

relativisticamente temos uma hipérbole. Por isso, o movimento relativístico sob uma força constante échamado de movimento hiperbólico. Ele ocorre, por exemplo, quando uma partícula carregada e colocada

num campo elétrico uniforme.

108

Page 109: Parte A (Relatividade)

Figure 11: Figura tirada do Gri¢ th,Introduction to electrodynamics-3ed.

Diferente do que ocorre com as duas primeiras leis de Newton, a terceira lei não pode ser estendidapara os domínios da mecânica relativística. Pois, de acordo com esta lei, objetos separados espacial-

mente que interajam por uma força exercerão, sempre no mesmo instante, forças iguais e opostas. Como

vimos, o fato de um evento ser simultâneo depende do observador. Assim, se um observador vê num instante

t uma força F (t) agindo no corpo A e �F (t) agindo em B (de sorte que a terceira lei se aplica para este

observador), um outro observador em movimento a�rmará que as forças são iguais em tempos diferentes, pois

t0A = �t� uxA

c2

�6= t0B =

�t� uxB

c2

�;

de sorte que, para este observador, a terceira lei não mais valerá. Apenas quando a força de interação é

constante, ou quando é uma força de contato (agindo no mesmo ponto) a terceira lei continuará válida.

109

Page 110: Parte A (Relatividade)

2.21 Lei de transformação das forças

Pelo fato da força por um observador ser medida com relação ao seu tempo (dt), esta quantidade sofre do

mesmo problema da velocidade, ou seja, não é um quadrivetor, mas sofre a transformação29 :

F i =dpi

dt= c

dpi

cdt= c

dpi

dx0! �F i ;

�F i = cd�pi

d�x0= c

d�i�p�

�0�dx�= c

d�i�p�

(�00dx0 + �0idx

i)= c

�i�dp�

cdt��00 +

1c�

0idxi

dt

�=

�i�dp�

dt��00 +

1c�

0idxi

dt

� = �i� F���00 +

1c�

0iui� ;

F 0 =dp0

dt=1

c

dE

dt

A componente F 0, a menos do fator 1=c é proporcional a variação de energia da partícula, o que, como vimos

é igual a variação do trabalho realizado. Ou seja, é a potência entregue à partícula.

Para o caso de v na direção x temos

� =

0BBBB@ � � 0 0

� � 0 0

0 0 1 0

0 0 0 1

1CCCCAe

�Fy = �F 2 = �2�F��

�00 +1c�

0iui� = F 2

�1� �

c u1� = Fy

�1� �

c ux

�Da mesma forma

�Fz =Fz

�1� �

c ux

�Já para a componente x,

�Fx = �F 1 = �1�F��

�00 +1c�

01u1� = �10F

0 + �11F1

�1� �

c u1� =

� �F 0 + F 1

�1� �

c u1�

=���1cdEdt

�+ F 1�

1� �c u

1� ;

�Fx =��cdEdt + Fx�

1� �c u

1�

29Lembre-se que � e � se referem à velocidade v relativa entre os referenciais que, ao contrário de u, é uma constante.

110

Page 111: Parte A (Relatividade)

Usando a relação (52) temos

F =dp

dt) dE

dt=dp

dt:u = F:u ;

temos

�Fx =Fx � �

c (F:u)

1� �c ux

:

Vemos então como em geral a transformação da força é bastante complicada.

Assim como no caso da velocidade, podemos, obviamente, evitar este comportamento indesejado se sub-

stituirmos a derivada em relação ao tempo pela derivada em relação ao tempo próprio. Assim, podemos

de�nir

K =dp

d�=

dp

dtq1� u2

c2

=1q1� u2

c2

dp

dt=

1q1� u2

c2

F

Da mesma forma como �zemos com a velocidade, podemos também de�nir

K0 =dp0

d�=1

c

dE

d�

A quantidade

K� =dp�

d�

assim de�nida se transforma como um 4-vetor. Este 4-vetor recebe o nome de força de Minkowski. Assim

como F 0, K0 é a potência transferida ao sistema em unidades de tempo próprio.A mecânica relativística pode ser formulada em termos da força ordinária (ou usual), ou através da força

de Minkowski. Devido ao seu caráter vetorial, esta ultima é, geralmente, mais conveniente. Entretanto, como

normalmente estamos interessados na dinâmica da partícula vista por um observador (nós), geralmente temos

de passar da força de Minkowski para a usual.

K =

0@1c

1q1� u2

c2

dE

dt;

1q1� u2

c2

F

1A=

0@ 1

cq1� u2

c2

F:u;1q1� u2

c2

F

1A=

0@1cF:�;

1q1� u2

c2

F

1AEsta quantidade será especialmente útil quando estudarmos problemas de eletromagnetismo.

111

Page 112: Parte A (Relatividade)

2.21.1 Exemplo 1

Vamos voltar no movimento hiperbólico (força constante)

F = (F; 0; 0) :

Se traduzirmos este problema em termos da força de Minkowski temos

K =

0@1c

dE

d�;

1q1� u2

c2

F

1A=

0@ 1

cq1� u2

c2

F:u;1q1� u2

c2

F

1A=

0@ Fux

cq1� u2

c2

;Fq1� u2

c2

;0; 0

1A : (54)

Observe que F é constante mas K não.

Vamos primeiro veri�car um fato. Se K é um 4-vetor, a quantidade (K)2 (pra qualquer problema) é um

invariante. Neste caso, usando a segunda expressão em (54) é fácil ver que

K����K� = �

24 Fux

cq1� u2

c2

352 +24 Fq

1� u2

c2

352

=F 2

1� u2

c2

�1� u2x

c2

�= 1 :

Constante, como esperávamos.

Das expreções acima temos também:

dE

d�=

Fuxq1� u2

c2

;dE

dt= Fux

Onde sabemos que ux = ux (t)

Exercise 63 O que signi�ca dizer que a energia se conserva se acima vemos que E varia com o tempo? A

energia relativística não deveria ser uma constante?

O ponto aqui é que não estamos considerando um sistema como um todo. O sistema consiste na nossa

partícula mais a fonte geradora da força constante. Assim, o aumento da energia cinética (e conseqüente

112

Page 113: Parte A (Relatividade)

energia relativística) da nossa partícula, tem por conseqüência uma diminuição na energia da fonte geradora

do campo.

Vamos agora resolver novamente o problema através da força de Minkowski (FM). Usando agora a gen-

eralização lei de Newton com a força de Minkowski temos

K0 =dp0

d�=F

c

uxq1� u2

c2

=F

c�x =

F

c

dx

d�;

onde usamos a forma de K0 na última linha de (54). Com isso

dp0

d�=F

c

dx

d�) dp0 =

F

cdx

Integrando em relação a x

x =c

F

Z p0f

poi

dp0 =c

F

�p0f � p0i

�=1

F[Ef � Ei]

Como a partícula está inicialmente parada, sabemos que sua energia inicial vale

Ei =

q(mc2)

2+ (pc)

2= mc2

Já a sua energia �nal

Ef =

q(mc2)

2+ (pc)

2= mc

pc2 + �2x

Tudo que precisamos agora é achar �x. Usando a componente 1 da FM temos (esta é exatamente a mesma

conta que �zéssemos antes)

K1 =dp1

d�= m

d�xd�

=Fq1� u2

c2

;

md�xq1� u2

c2 df=

Fq1� u2

c2

=) d�xdt

=F

m=) �x =

F

mt+ C ;

�x (t = 0) =) C = 0 =) �x =F

mt :

Com isso temos

Ef = mc2

s1 +

�F

cmt

�2e, �nalmente,

x (t) =1

F

24mc2s1 +

�F

cmt

�2�mc2

35 = mc2

F

24s1 + � F

cmt

�2� 1

35 :

113

Page 114: Parte A (Relatividade)

O que concorda com nosso resultado anterior.

Obviamente um procedimento análogo pode ser usado com a força F usando a relação clássica

dE

dt= F:u

Mas, para isso, lembre-se que você deve usar o momento e a energia relativística, o que já está implícito

no procedimento acima. Observe que, no desenvolvimento acima, as quantidades que se conservam são os

4-vetores.

2.21.2 Exemplo 2

Vamos tratar outro exemplo simples. Imagine uma pedra de massa m que é atirada com velocidade u0na direção horizontal (que chamaremos de x) e, ao mesmo tempo, cai sob a ação de uma força constante

F = F (�y). Tomando em conta apenas o plano x; y temos

F = (0;�F ) = �F y ; u (t = 0) = (u0; 0) = u0x :

Estas quantidades se referem a um observador num certo referencial S. Como de costume, para resolver o

problema o observador utiliza a lei de Newton (com o momento relativístico) e resolve, separadamente,o problema na direção x e y. O problema na direção y

Fy =dpydt

= �F = d

dt

�m�y

�=

d

dt

24 mq1� u2

c2

uy

35=

mq1� u2

c2

"_uy +

uy�1� u2

c2

� (u _u)c2

#

�F =mq1� u2

c2

"_uy +

uy�1� u2

c2

� (ux _ux + uy _uy)c2

#

Enquanto para a componente x temos:

Fx =dpxdt

= md

dt(�x) = 0

d

dt

0@ 1q1� u2

c2

ux

1A =1q1� u2

c2

"_ux +

ux

1� u2

c2

1

c2(u _u)

#= 0

114

Page 115: Parte A (Relatividade)

Ou seja, precisamos resolver o sistema de equações:

� F

m=

�1� u2x + u

2x

c2

��1=2 24 _uy + uy�1� u2x+u

2x

c2

� (ux _ux + uy _uy)c2

35_ux +

ux�1� u2x+u

2x

c2

� 1c2(ux _ux + uy _uy) = 0

O qual, obviamente, é bastante complicado, pois as variáveis estão acopladas.

Vamos agora tratar o mesmo problema usando a força de Minkowski.

K =

0@1c

dE

d�;

1q1� u2

c2

F

1A =

0@1cF:�;

1q1� u2

c2

F

1Acom

F = (0;�F ) = �F y ; u (t = 0) = (u0; 0) = u0x :

temos

K =

0@�1cF�y; 0;

�Fq1� u2

c2

; 0

1APara a componente K0 temos

K0 =dp0

d�= �F

c�y = �

F

c

dy

d�;

dp0 = �Fcdy =) y = � c

F

Zdp0 = � 1

F[Ef � Ei] ;

onde

Ef =

q(mc2)

2+ (pc)

2= mc

qc2 + �2x + �

2y

Mais uma vez, tudo que precisamos é achar �. Para a componente K1 temos

K1 =dp1

d�= 0 =) m

d�1

d�= 0 =) �1 = �x = �10 = const. ,

onde a constante é determinada pela condição inicial

�1 =1rn

1� u(t)2

c2

ou1 (t) =) (t = 0) ; �1 =u0q1� u20

c2

= �10 (55)

115

Page 116: Parte A (Relatividade)

Para a componente K2 temos

K2 =dp2

d�=) m

d�2

d�=

�Fq1� u2

c2

=) d�2

dt=�Fm

=) �2 = �y = �Ft

m:

Onde já usamos o fato de que uy (0) = 0. Com isso, a expressão para a energia toma a forma

E = mc

vuutc2 +u20

1� u20c2

+

�Ft

m

�2= mc3

s1

c2 � u20+

�Ft

c2m

�2:

O que fornece uma energia inicial Ei

Ei = mc3

s1

c2 � u20

Substituindo na nossa expressão para y temos

y = � 1F[Ef � Ei] = �

1

Fmc3

24s 1

c2 � u20+

�Ft

c2m

�2�s

1

c2 � u20

35 ;

uy = _y = � 1Fmc3

d

dt

24vuut( 1

c2 � u20+

�Ft

c2m

�2)35 = � F

cmt

(1

c2 � u20+

�Ft

c2m

�2)3=2:

Para a direção x, voltamos a expressão (55)

�1 = �10 =) ux = �10

s�1� u2

c2

�=)

�ux�10

�2= 1� u2

c2= 1�

u2x + u2y

c2

Isolando ux temos

u2x

"1

(�10)2 +

1

c2

#= 1�

u2yc2= 1� 1

c2

�F

cmt

�2(1

c2 � u20+

�Ft

c2m

�2)3:

Usando1

(�10)2 +

1

c2=1� u20

c2

u20+1

c2=1

u20;

temos

ux = u0

241� 1

c4

�F

mt

�2(1

c2 � u20+

�Ft

c2m

�2)3351=2 :

Ou seja, mesmo na direção x, onde não temos nenhuma força atuando, o movimento não é uniforme.

116

Page 117: Parte A (Relatividade)

Exercise 64 O que aconteceu então com a conservação de momento na direção x?

É exatamente esta conservação de momento que faz a velocidade não ser constante. Conforme a partícula

é acelerada pela força (independente da direção) ela adquire massa relativística. Assim, para conservar o

momento na direção onde não há força, a velocidade tem de diminuir.

Observe também que, como deveríamos esperar, esta correção é da ordem de 1=c2.

117

Page 118: Parte A (Relatividade)

Outra forma de resolver o problema anterior seria através de um referencial S0 que se movesse comvelocidade u0 na direção x. Neste caso, a velocidade inicial na direção x seria u00 = 0. Entretanto, para fazer

isso, precisamos ainda transformar as forças. Pelas expressões obtidas anteriormente, temos:

F 0y =Fy

�1� �

c ux

� = �F = � 1q

1� u20c2

F 0z =Fz

�1� �

c ux

� = 0F 0x =

Fx � �c (F:u)

1� �c ux

= ��c(F:u)

onde

F:u = Fyuy = �Fuy =F 2

m tq1 +

�Fmc t�2

com isso

F 0x = ��c(F:u) = ��

c

F 2

m tq1 +

�Fmc t�2

� =u0c

F 0x = �u0c2

F 2

m tq1 +

�Fmc t�2

Ou seja, neste caso tempos o aparecimento de uma força na direção x que será responsável pela aceleração

da partícula nesta direção.

2.21.3 Espalhamento Compton

Em 1923, analisando o espectro de transmissão de raio X com comprimento �0, Compton descobriu que,

além de um feixe transmitido de comprimento �0, havia também um feixe de comprimento �1, maior que �0,

cuja diferença depende apenas do ângulo de espalhamento, e não do material da folha.Conservação do momento na vertical

p1 sin � = p sin� (56)

Conservação do momento na horizontal

p0 = p1 cos � + p cos�

118

Page 119: Parte A (Relatividade)

Figure 12: Figura tirada do livro Eisberg , Física Moderna

Isolando os ângulos e quadrando esta equações temos

p21 sin2 � = p2 sin2 �

p2 cos2 � = (p0 � p1 cos �)2

Adicionando estas equações

p21 sin2 � + (p0 � p1 cos �)2 = p2 sin2 �+ p2 cos2 �

p21 sin2 � + p20 � 2p0p1 cos � + p21 cos2 � = p2

p21�sin2 � + cos2 �

�+ p20 � 2p0p1 cos � = p2

p21 + p20 � 2p0p1 cos � = p2 (57)

Agora, pela conservação de energia temos:

E0 +mc2 = Ef + Ee

onde Ef é a energia do fóton e Ee a do elétron. Lembrando que

p����p� =) E2 � (cp)2 = m2c4

temos

Ee =

qm2c4 + (cp)

2

Com isso

E0 +mc2 = Ef +

qm2c4 + (cp)

2

119

Page 120: Parte A (Relatividade)

Figure 13: Figura retirada do Gri¤tths.

Usando (57) temos

E0 +mc2 = Ef +

qm2c4 + c2 (p21 + p

20 � 2p0p1 cos �)

Usando agora

p1 =Efc; p0 =

E0c

temos

E0 +mc2 = Ef +

qm2c4 + (Ef )

2+ (E0)

2 � 2E0Ef cos ��E0 +mc

2 � Ef�2

= m2c4 + (Ef )2+ (E0)

2 � 2E0Ef cos ��E0 +mc

2�2 � 2 �E0 +mc2�Ef = m2c4 + (E0)

2 � 2E0Ef cos �

E20 + 2E0mc2 +

�mc2

�2 � 2 �E0 +mc2�Ef = m2c4 + (E0)2 � 2E0Ef cos �

2E0mc2 � 2

�E0 +mc

2�Ef = �2E0Ef cos �

Ef =E0mc

2

E0 +mc2 � E0 cos �

Ef =E0mc

2

E0 (1� cos �) +mc2

Ef =1h

(1� cos �) 1mc2 +

1E0

iUsando agora

� =c

E0 = h�0 = hc

�0; Ef = h

c

�1

120

Page 121: Parte A (Relatividade)

temos

hc

�1=

1�(1� cos �) 1

mc2 +�0ch

�(�1 � �0) = (1� cos �)�C ; �C =

ch

mc2

�C é chamando comprimento de onda Compton e a equação acima a equação de Compton. Vemos diretamente

desta equação que a diferença no comprimento da luz espalhada com a incidente aumenta com o ângulo de

espalhamento. E depende apenas do ângulo. O processo descrito acima é chamado de espalhamento Compton.

Observe que no desenvolvimento acima supusemos que o elétron estava livre (não ligado ao átomo). Esta

suposição é válida quando l0 é muito maior que a energia de ligação do elétron com o átomo. Em especial,

participam do espalhamento apenas os elétrons livres ou os fracamente ligados nas camadas mais externas

dos átomos.

Dos grá�cos acima é possível observar um espalhamento de um cumprimento de onda l0 igual o inci-

dente. Esta componente se deve ao espalhamento pelos elétrons mais internos, que estão fortemente ligados

ao átomo. Neste caso (como veremos no curso de quântica) a energia dos elétrons não se altera e o espal-

hamento corresponde apenas uma alteração na direção do fóton. Este tipo de espalhamento é chamado de

espalhamento Thomson e pode ser descrito, como feito por Thomson em 1900, diretamente com resultados

do eletromagnetismo.

O espalhamento Thomson é predominante quando:

�0 >> �C

ou seja, para raio x com energia mais baixa.

A idéia aqui é que o raio x, ou qualquer radiação eletromagnética, interage preferencialmente com elemen-

tos da mesma ordem de grandeza do seu comprimento de onda. Assim, para comprimentos de onda maiores

a radiação enxerga o átomo como um todo e temos o espalhamento Thomson. Quando o comprimento de

onda diminui a radiação para a interagir com os elétrons.

Exercise 65 Por que o núcleo do átomo tem pouca participação no processo acima?

121

Page 122: Parte A (Relatividade)

2.22 Mais um pouco sobre notações

Se a e b são quadrivetor, sabemos que a seguinte quantidade é um invariante

ab = a����b� :

O uso do produto de vetores é tão comum que introduzimos uma nova notação para indicá-lo

ab = a�b� ; b� = ���b� :

Com isso, temos agora quantidades representadas com índices em baixo. Para diferenciá-las,

chamamos de 4-vetor contra-variante as quantidades representadas com índices em cima e co-variante, as com

índices em baixo. Vemos então que a métrica do espaço permite transformar um vetor contra-variante num

co-variante. Na nossa representação matricial, os vetores contra-variantes são representados como colunas,

enquanto os co-variantes são representados como matrizes linha.

Como vimos, ao caráter das quantidades é especi�cado pela sua lei de transformação. Então, pelo que foi

dito anteriormente, toda quantidade que, por uma transformação de Lorentz �, se transforma por

b� = �� �b�

é um vetor- contra-variante.

De forma semelhante, dizer que uma quantidade é um vetor co-variante, signi�ca que esta quantidade

também respeita uma lei especí�ca de transformação. Obviamente, esta lei deve ser diferente da acima (caso

contrário, não haveria razão para darmos um nome diferente). Como se transformam então, por uma TL �,

os vetores co-variantes? Ou seja

x��! x0 : b0� =M�

�b� ; M�� =?

Qual a forma explícita de M e como esta quantidade se relaciona com �. Para responder esta pergunta,

voltemos à de�nição acima. Desta de�nição sabemos que

a0�b0� =��� �a

�� �M�

�b��

o caráter invariante de ab permite escrever

a0�b0� = ���a

�M��b� = a�b�

�� �M��a

�b� = a�b�

122

Page 123: Parte A (Relatividade)

Para quaisquer vetores a e b. Isso só é possível se

�� �M�� = ���

ou seja

M = ��1 :

Ou seja, um vetor por uma TL L um vetor covariante se transforma pela inversa da matriz que representa a

transformação:

b0� = b����1

���: (58)

Podemos agora de�nir:

� Um vetor co-variante é qualquer quantidade que, por uma TL �� �, se transforma como:b0� = b�

���1

���.

Para compatibilizar o desenvolvimento acima com o feito em aula, use as relações

�� ������� = ���

�� �������

h���1

��

i= ���

h���1

��

i�� ��� = ���

���1

�� �

������ ��� =

��������

���1

��

����� ��� =���1

��

� � =

���1

��

2.23 Gradiente em 4D

Além da de�nição acima, de formar um vetor co-variante através de um contra, existem também quantidade

que naturalmente surgem como vetores co-variantes. Por exemplo,

x �! �x =) @

@x�=@�x�

@x�@

@�x�

�x� = �� �x� =) @�x�

@x�= �� �

@x�

@x�= �� ��

�� = �

��

@

@x�=@�x�

@x�@

@�x�= �� �

@

@�x�

123

Page 124: Parte A (Relatividade)

Ou seja

�� �

@

@�x�=

@

@x�=) �� �

h���1

���

i @

@�x�=���1

���

@

@x�

���@

@�x�=

���1

���

@

@x�=) @

@�x�=���1

���

@

@x�

Assim, a quantidade @=@x� se transforma como um vetor co-variante. Observe que a derivada

@

@xi

é o que chamamos de componente i do gradiente, podemos assim dizer que

@

@x�

é um gradiente quadridimensional.

(Co-gradiente e contra-gradiente)Antigamente (nos livros de geometria diferencial) se usava vetores co-gradientes, para aqueles que se trans-

formavam como o gradiente e contra-gradiente, para aqueles que se transformavam de forma �contrária�ao gradiente. Atualmente esta nomenclatura não é mais usada.

Além disso, é costume escrever o gradiente como

@� �@

@x�:

(Reconhecendo um vetor)Dos resultados acima temos

a0�b0

� =��� �a

����

��1��

�b�

�onde

�� �

���1

���=���1

����� � = ���

com isso,

a0�b0

� = a����b� = a�b� :

O ponto importante neste desenvolvimento é que, se a� é um vetor contra-variante e a�b� é um invariante

(um escalar), então (para manter a invariância), obrigatoriamente, b� tem de se transformar como:

b0� =���1

���b� :

Ou seja:

� se a�b� é um invariante e a� é um vetor contra-variante, isso implica que b� é um vetor co-variante.

124

Page 125: Parte A (Relatividade)

Usaremos a propriedade acima para encontrar vetores a partir dos invariantes.

2.23.1 Levantamento e abaixamento de índices

O processo de criar um vetor co-variante a partir de um contra-variante

b� = ���b� (59)

é comumente chamado de baixar o índice do vetor. A métrica é, obviamente, uma matriz inversível, se

de�nirmos a inversa da métrica como30

��1 � ��� =) ����� = �� ;

ou seja, uma quantidade com índices em cima, podemos de�nir também o procedimento de criar um vetor

contra-variante a partir de um covariante

b� = ���b� ;

chamamos este processo de levantar o índice do vetor. A de�nição acima é, obviamente, compatível com (59)

b� = ���b� =) � �b� = � ����b

� =) � �b� = � �b� =) � �b� = b :

De forma geral, um tensor

T

nz }| {��:::

��:::�| {z }m

Com n índices em cima e m índices em baixo é chamado um tensor n vezes contra-variante e m vezes co-

variante. Para qualquer vetor deste tipo podemos baixar e levantar qualquer um de seus índices mudando o

seu tipo

������T��:::

��:::� = T� :: �� � :::� ;

obviamente neste processo o número n+m continuará sempre o mesmo. Observe que, geralmente

T�� 6= T��

portanto

���T�� = T� � 6= T �� = ���T�� :

Com isso é necessário marcar a posição exata do índice que foi baixado ou levantado.

Remark 66 Para um 4-vetor baixar e levantar os índices signi�ca mudar o sinal da componente zero.

30Observe que, na representação matricial ��1 = �.

125

Page 126: Parte A (Relatividade)

3 Eletrodinâmica relativística

Vamos tentar agora dar um sentido mais preciso para a a�rmação que �as EM são invariantes por TL�.

@iEi =

1

"0�

@iBi = 0

r�E = �@B@t

r�B = �0J+ �0"0@E

@t

3.1 Conservação da carga

Dos resultados acima vimos que se a:b é um invariante e a é um vetor, então b é também um vetor. Vamos ver

como este resultado pode ser usado para �descobrirmos�quando um conjunto ordenado de quatro quantidades

forma (ou não) um vetor.

A conservação da carga elétrica pode ser expressa como:

r:J = �@�@t=) r:J+ @�

@t= 0

Esta equação pode ser escrita como

r:J+ @�

@t=

@J i

@xi+@�

@t= 0

J i = (Jx; Jy; Jz)

Podemos ainda escrever

@J i

@xi+@�

@t=@J i

@xi+ c

@�

@ct=@J i

@xi+ c

@�

@x0=) @J�

@x�= 0

onde

J = (c�;J) :

Tudo que �zemos até aqui foi mudar a notação. Não há ainda nenhuma razão para a�rmarmos que J

é um 4-vetor. Para isso precisaríamos estudar a sua lei de transformação. Entretanto, o fato da carga se

conservar é um efeito físico que não pode depender do observador. Assim, se a equação acima é válida num

certo sistema de coordenadas, pelo postulado da relatividade temos que, num sistema S0:

@J 0i

@x0i+@�0

@t0= 0 =) @J 0�

@x0�= 0

126

Page 127: Parte A (Relatividade)

Ou seja, a quantidade@J�

@x�= @�J

� = @0�J0� (60)

é um invariante. Além disso, pelo que foi dito anteriormente, sabemos que

@0� =���1

� �

�@�

é um vetor co-variante. Isso signi�ca que, a única forma da igualdade (60) ser válida para qualquer refer-encial inercial, i.e., qualquer TL é que J se transforme como:

J� = �� �J�

Ou seja, J se transforma como um vetor cotra-variante e, portanto, J é um vetor contra-variante.Encontramos assim o nosso primeiro 4-vetor do eletromagnetismo.

3.1.1 Transformação das densidades

Suponha que num referencial S0 existe um corpo, com uma densidade de carga estacionária �0 (imagine,por exemplo, um gás carregado que preenche todo o espaço). Ou seja, neste referencial temos uma densidade

de carga �0 e uma densidade de corrente J = 0,

J0 = (c�0; 0) :

Se visto por um referencial que se move com velocidade v = v0x, qual será o valor das novas densidades?

Visto deste referencial o corpo se contrai na direção do movimento por um fator 0. Assim, a sua nova

densidade será

� =Q

V=

Q

V0= =

Q

V0= 0�0 ; 0 =

�1� v20

c2

��1=2Onde usamos o fato de que a carga se conserva. Além disso, neste referencial S, as cargas estão em

movimento, de sorte que será também observada uma densidade de corrente

Jx = � �0v0 = � �0�0c ; �0 =v0c

onde o sinal de � vem do fato das cargas irem na direção �x. Assim, em S temos

J = ( 0c�0;� 0�0c�0; 0; 0) :

Suponha agora que este mesmo sistema é visto de um referencial S0 que se move com uma velocidade

v = vx em relação a S (e não a S0). Qual o valor da densidade �0 de carga em S0? A princípio poderíamos

127

Page 128: Parte A (Relatividade)

esperar que, uma vez que S0 vê as distâncias de S contraídas por um fator 0 a nova densidade seria

�0?= � = ( 0�0) = 0�0 : (61)

Porem isso não é verdade!Vamos rever o problema usando o fato de J ser um 4-vetor. Sabemos com isso que, ao passarmos de S0

para S temos:

S0v0�! S :

J = �(v) J0 =

0BBBB@ 0 � 0�0 0 0

� �0 0 0 0

0 0 1 0

0 0 0 1

1CCCCA0BBBB@

c�0

0

0

0

1CCCCA =

0BBBB@ 0c�0

� 0�0c�00

0

1CCCCA 0 =

�1� �0

c

��1=2; �0 =

v0c

(62)

Ou seja, a densidade de carga em S vale � = 0�0 e a densidade de corrente Jx = � 0�0c�0, o que concordacom o resultado obtido anteriormente.

Se passarmos agora de S para S0 temos

Sv�! S0 :

J 0 = �(v0) J =

0BBBB@ � � 0 0

� � 0 0

0 0 1 0

0 0 0 1

1CCCCA0BBBB@

0c�0

� 0�0c�00

0

1CCCCA =

0BBBB@ 0 (1 + ��0) c�0

� 0 (� + �0) c�00

0

1CCCCA =

�1� �

c

��1=2; � =

v

c

Ou seja, a densidade de carga medida no referencial S0 vale

�0 = 0 (1 + ��0) c�0 6= 0�0 : (63)

O que não concorda com (65). Mais precisamente, a expressão (63) é a formula correta para a densidade

de carga medida em S0. O fato de J ser um 4-vetor nos diz que a transformação desta quantidade (assim comonas coordenadas) envolve a mistura das quantidades �espaciais� e �temporais�, de sorte que a densidadede carga depende também das correntes.

128

Page 129: Parte A (Relatividade)

Em relação à densidade de carga medida em S os valores em S0 assumem a forma

J 0 =

0BBBB@ (1 + ��0) c ( 0�0)

� (� + �0) c ( 0�0)0

0

1CCCCA =

0BBBB@ (1 + ��0) c�

� (� + �0) c�0

0

1CCCCA =

0BBBB@ �1 + vv0

c2

�c�

� (v + v0) �0

0

1CCCCA : (64)

O fato de observadores em referenciais diferentes observarem correntes e densidades diferentes nos diz que

a intensidade dos campos gerados por estas quantidades também irão mudar. No exemplo acima, em S0,

onde as cargas estão paradas, existe apenas um campo elétrico. Enquanto em S existe além de um campo

elétrico um campo magnético. Obviamente esta mudança tem de ocorres de forma que todos os observadores

concordem em descrever o movimento das cargas.

Um ponto importante a se notar é que as expressões acima são válidas para volumes. Se você estiver

trabalhando com densidades super�ciais ou lineares deve tomar cuidado. Por exemplo, se no exemplo acima

temos, no lugar de um corpo, i �o na direção x com densidade linear �0, obviamente este �o irá se contrair

e a densidade vista em S vale

� = 0�0

O que concorda com os resultados anteriores. Agora, se este �o estiver numa direção perpendicular ao

movimento (e.g., z) você não deve esperar nenhuma modi�cação no �o (que possui bitola nula) e,consequentemente, os resultados acima não valerão. O ponto aqui é que um �o, ou uma placa, é uma

abstração, pois, en�m, todos os objetos têm na verdade 3D espaciais. Com isso, no caso do �o na direção z,

passando pela origem, você deve imaginar uma densidade volumétrica

� (x; y; z) = f (x) � (x) � (y)

onde � é a distribuição delta de Dirac. Por TL com velocidades nos eixo x; y; z teremos

�0z (x; y; z) = f 0 (x) � (x) � (y) =) �0z = zf (x) ;

�0x (x; y; z) = f (x) �0 (x) � (y) =) �0x = �0 ;

�0y (x; y; z) = f (x) � (x) �0 (y) =) �0y = �0 :

Pois �0 (x) = x� (x) = � (x). Apesar de um pouco arti�cial, este resultado pode ajudá-lo a aplicar correta-

mente as expressões no caso de densidades com dimensão menor que 3:

3.2 Transformação dos campos

Será que os campos elétricos e magnéticos são também a parte espacial de 4-vetores? Vamos tratar o exemplo

especí�co de duas placas paralelas (no plano x; z). Num certo referencial S as placas estão no plano x; z, se

129

Page 130: Parte A (Relatividade)

movem com velocidade v0 (�x) e tem densidade de carga � e �� (observe que esta não é a densidade medidaas placas estão em repouso). Assim, para este referencial, temos um campo elétrico e outro magnético. Pela

lei de Gauss sabemos que o campo entre as placas vale:

O:E =1

"0� =)

ZE:da =

Q

"0=) 2E+:a =

Q

"0=) E+ =

Q

2"0a=

2"0

E+ =�

2"0y ; E� = �

2"0(�y) =) E =

"0y

Para o campo magnético usamos a lei de Ampère:

r�B = �0J+ �0"0@E

@t= �0J =)

ZB dl = �0I

B: (2l) = �0I =) B =1

2�0I

l=1

2�0Jx =) B+ =

1

2�0�v

onde a corrente densidade de corrente Jx vale (62)

Jx = ��0c 0�0 = ��0c� = �v0cc� = �v0�

com isso

B+ =1

2�0�v0 (�z) ; B� = �

1

2�0�v0 (z)

B = ��0�v0z

resumindo

E = (0; Ey; 0) ; Ey =�

"0B = (0; 0; Bz) ; Bz = ��0�v0 (65)

Como �cam estes campos quando o mesmo sistema é observado por um referencial S0 que se move v emrelação a S? Como vimos anteriormente, as densidades medidas no referencial S0 valem (64):

�0 = �1 +

vv0c2

��

J 0x = � (v + v0)�

=�1� v

c2

��1=2Onde v é a velocidade do referencial S0 em relação a S e v0 a velocidade das cargas vista de S (ou seja, a

130

Page 131: Parte A (Relatividade)

velocidade de S em relação a S0 onde as cargas estão paradas).

Onde estamos usando o fato de que a carga se conserva. Além disso, a velocidade das cargas vistas por

S0 (18). Com isso, pelo mesmo procedimento acima, em S0 temos o campo elétrico:

E0 =�0

"0y =) E0 =

�1 +

vv0c2

� �

"0y =

��

"0+

1

��0(��0�v0)

c2v

"0

�y =

�Ey �

1

�0"0

Bzv

c2

�y

E0 = (0; Ey; 0)

Usando

�0"0 =1

c2

temos

E0y = (Ey �Bzv)

E para o magnético

B0 = �0J0xz

Onde J 0x é a densidade de corrente medida em S0, de (64) temos

J 0x = � (v + v0)�

Com isso

B0z = �0J0x = ��0 (v + v0)� = �

�1

"0"0�0v� � (��0�v0)

�usando (65)

B0z = � (Ey"0�0v �Bz) = � �Eyc2v �Bz

�=

�Bz �

Eyc2v

�:

Ou seja, os nossos campos se transformam como

E0y = (Ey �Bzv)

B0z = �Bz �

v

c2Ey

�Para obter as outras componentes dos campos nós apenas giramos as planas e as colocamos no plano x; y

com isso, repetindo as contas anteriores

E0z = (Ez + vBy)

B0y = �By +

v

c2Ez

�Exercise 67 Obtenha as expressões acima resolvendo o problema com as placas no plano x; y.

131

Page 132: Parte A (Relatividade)

Para a componente x do capo elétrico, basta veri�car que, se você colocar as placas no plano y; z conforme

o sistema se move não ocorre nenhuma alteração na densidade de cargas, de sorte que

E0x = Ex :

Neste caso os campos magnéticos se cancelam e nada podemos falar sobre ele. Assim, para analisar as

componentes do campo magnético nas outras direções precisamos de um outro dispositivo. Imagine um

longo solenóide alinhado com o eixo x, com n espiras por unidade de comprimento, por onde passa uma

corrente I (o solenóide está em repouso em S mas existe uma corrente no �o). No interior do solenóide temos

um campo

Bx = �0nI

Num sistema S0 que se move na direção x com velocidade v temos

n0 = n :

Além disso (como a carga se conserva e Q0 = Q e o tempo se dilata)

I 0 =dQ

dt0=dQ

dt=1

dQ

dt=I

temos

B0x = �0n0I 0 = Bx

Ou seja, o campo magnético na direção perpendicular ao movimento também não muda.

Coletando nossos resultados temos

E0x = Ex ; E0y = (Ey � vBz) ; E0z = (Ez + vBy) ;

B0x = Bx ; B0y =

�By +

v

c2Ez

�; B0z =

�Bz �

v

c2Ey

�: (66)

Dos resultados acima vemos que os campos não se transformam como a parte espacial de um4-vetor, ou seja,

E0i 6= �i �E� ;

E0i 6=���1

� i

�E� :

Independente do que chamamos de E0 e B0.

Exercise 68 Mostrar que: Se B = 0 em S, então

B0 = � 1c2(v �E0) :

132

Page 133: Parte A (Relatividade)

Se E = 0 em S, então

E0 = (v �B0) :

Em especial, Para uma carga que se me com velocidade v???

133

Page 134: Parte A (Relatividade)

3.3 Tensor do campo eletromagnético

Recapitulando o que sabemos até agora sobre o eletromagnetismo é:

1. A densidade de carga e corrente, juntas formam um 4-vetor:

J� = (c�;J) ;

que respeita a lei de conservação de carga

@�J� = 0 :

2. Por uma TL os campos elétricos e magnéticos se transformam como (66):

E0x = Ex ; E0y = (Ey � vBz) ; E0z = (Ez + vBy) ;

B0x = Bx ; B0y =

�By +

v

c2Ez

�; B0z =

�Bz �

v

c2Ey

�:

Como vimos dos resultados da seção anterior, certamente os campos E e B não se comportam como

a parte espacial de um 4-vetor. Mais ainda, suas componentes se misturam por uma TL. É importante

salientar que o que vamos fazer aqui é completamente diferente do que �zemos com a mecânica Newtoniana.

A mecânica Newtoniana (ou a clássica) estava errada e teve de ser corrigida para incorporar os efeitosda TR. Entretanto, o eletromagnetismo já é uma teoria correta, pois foi dele que efetivamente surgiua TRR. Destarte, o que vamos fazer aqui não é corrigir o eletromagnetismo, mas simplesmente reescrevê-locom o ferramental da TRR, ou seja, usando 4-vetores e 4-tensores (que chamaremos apenas de vetores e

tensores). Chamamos a isso obter a forma covariante das equações (no sentido de que ela terá a mesma

forma em qualquer referencial inercial). Na verdade, as EM são válidas em qualquer referencial inercial, mas

não têm a mesma forma, pois os campos e as densidades se misturam. Por exemplo, enquanto num referencial

podemos ter apenas campos elétricos e cargas, de sorte que EM tem a forma:

@iEi =

1

"0� ; @iB

i = 0 ;

r�E = 0 ;@E

@t= 0 :

Num outro referencial S0 o mesmo sistema pode apresentar densidades de cargas e correntes e as EM

teriam a forma:

@iE0i =

1

"0� ; @iB

0i = 0 ;

r0 �E0 = �@B0

@t0; r0 �B0 = �0J

0 + �0"0@E0

@t0:

134

Page 135: Parte A (Relatividade)

Neste sentido, as equações não têm a mesma forma. Já uma equação na forma covariante, como a conservação

de carga, tem a mesma forma em qualquer referencial inercial

@�J� = 0

��! @0�J0� = 0 :

Como vimos antes, a descrição das leis físicas no espaço de Minkowski não se limita a vetores e escalar.

Temos a nossa disposição também os tensores. Lembre-se que por uma TL um tensor T�� se transforma

como:

T 0�� = �� ����T

�� : (67)

Ou seja, as suas componentes se misturam, assim como nossos campos.Além disso, da eletrodinâmica sabemos que toda a informação dos efeitos eletromagnéticos está na carga,

corrente (que sabemos formar um 4-vetor) e nos campos E, B. Estas últimas quantidade possuem 6 com-

ponentes. Desta forma, nas EM já vigoram todas as quantidades necessárias: cargas, correntes e os campos

E e B. Ou seja, não precisamos procurar por novas quantidades como E0 e B0. Mais ainda, aquantidade associada aos campos deve ter 6 componentes apenas.Nossa próxima tentativa é, então, tentar associar E e B com um tensor que tenha 6 componentes.

Exercise 69 Que tensor possui 6 componentes?

Neste ponto vamos tomar um rumo completamente diferente do seguido nos livros, mais que possui a

grande vantagem de produzir expressões que possamos facilmente lembrar e usar.

Os campos elétricos e magnéticos podem ser escritos através dos chamados potenciais escalar � e vetor

A:

B =r�A ; E = �r�� @A

@t;

Vamos reescrever estas expressões na forma

Ei = �@i��@Ai@t

= �@i�� c@Ai@x0

= c [@i (��=c)� @0Ai] = c (@iA0 � @0Ai)

A0 = ��c

e

B1 = @2A3 � @3A2B2 = @3A1 � @1A3B3 = @1A2 � @2A1

135

Page 136: Parte A (Relatividade)

Resumindo

Bi = @jAk � @kAj (1! 2! 3)

Eic= @iA0 � @0Ai ; A0 = �

c

Ou seja, toda as componentes do campo elétrico e magnético dependem das quantidades:

@�A� � @�A� � F��

onde

Eic= @iA0 � @0Ai = Fi0 ;

Bi = @jAk � @kAj = Fjk (1! 2! 3) :

É muito inconveniente temos sempre que lembrar a ordem (1! 2! 3).

Além disso, pela sua de�nição é óbvio que F é anti-simétrico:

F�� = �F�� ; F�� = 0

Ou seja, possui apenas 6 componentes:

F�� =

0BBBB@0 F01 F02 F03

F10 0 F12 F13

F20 F21 0 F23

F30 F31 F32 0

1CCCCA =

0BBBB@0 �E1

c �E2c �E3

cE1c 0 B3 �B2E2c �B3 0 B1E3c B2 �B1 0

1CCCCATudo que �zemos até agora foi inventar símbolos, mas sem nenhuma física nem prova de que as quantidades

são ou não vetores.

Vamos tentar então responder a seguinte pergunta: Se E e B são os campos vistos num referencial S,

como �cam os campos vistos num referencial S0 que se move com velocidade v na direção x em relação a S?

Se F é um tensor ele deve ser transformar pela lei (67). Observe que esta lei tem o tensor com índices contra-

variantes. Claro que nós sabemos como se transformam também os vetores co-variantes, mas é interessante

se pudermos usar (67) (e não (58)), simplesmente porque já sabemos a forma de � e não queremos �car

invertendo as coisas. Entretanto, dado um tensor co-variante, sabemos como a regra de abaixamento e

levantamento de índices pode ser usada para obtermos suas componentes contra-variante. Ou seja, se F�� é

um vetor co-variante podemos formam com ele um tensor contra-variante usando

���

���F�� = F��

136

Page 137: Parte A (Relatividade)

Vale agora salientar o seguinte fato: Pela forma da métrica é fácil ver que quando baixamos um índice

�espacial� (1; 2; 3) nada acontece. Entretanto, toda vez que baixamos um índice �temporal� (0) o sinal da

componente muda:

a� =�a0; a1; a2; a3

�=) a� = ���a

� = (a0; a1; a2; a3) =��a0; a1; a2; a3

�O mesmo, obviamente, é válido para os tensores:

M0i =M i0 ; M0i = �M0

i ; M00 =M00

Onde, no último caso, baixamos dois índices espaciais e ganhamos dois sinais de menos.

Desta forma temos

F�� =

0BBBB@0 �F01 �F02 �F03

�F10 0 F12 F13

�F20 F21 0 F23

�F30 F31 F32 0

1CCCCA =

0BBBB@0 E1

cE2c

E3c

�E1c 0 B3 �B2

�E2c �B3 0 B1

�E3c B2 �B1 0

1CCCCAPodemos agora usar a matriz

� =

0BBBB@ � � 0 0

� � 0 0

0 0 1 0

0 0 0 1

1CCCCApara calcular

F 0�� = �� ����F

��

E01c

= F 001 = �0 ��1�F

�� = �0 �

��1 0F

�0 + �1 1F�1�

= �1 0�01F

10 + �1 1�00F

01

=��1 0�

01 � �1 1�

00

�F 10

=h(� �)2 � 2

iF 10

= 2��2 � 1

�F 10

= �F 10 = F 01

E01c

=E1c=) E01 = E1 =) E0x = Ex

137

Page 138: Parte A (Relatividade)

Para a componente 2 do campo elétrico

E02c

= F 002 = �0 ��2�F

�� = �0 �

��2 2F

�2�

= �2 2

��0 0F

02 + �0 1F12�

=

c(E2 � �cB3)

E02 = (E2 � �cB3) =) E0y = (Ey � vBz)

Da mesma forma, para as outras componentes temos

E0z = (Ez + vBy) ;

B0x = Bx ; B0y =

�By +

v

c2Ey

�; B0z =

�Bz �

v

c2Ey

�:

O que concorda com o resultado obtido anteriormente (66). Ou seja, nós obtemos as transformações dos

campos previstas pelas EM e pelas TL se agruparmos os campos elétricos e magnéticos na quantidade

F�� =

0BBBB@0 E1

cE2c

E3c

�E1c 0 B3 �B2

�E2c �B3 0 B1

�E3c B2 �B1 0

1CCCCAe exigirmos que esta quantidade se transforme como um tensor. Este procedimento é completamenteanálogo a identi�carmos

F�� = @�A� � @�A�

A� =

���c;A

�=) A� =

��

c;A

�onde � e A são os potenciais escalar e vetor. E, além disso, exigirmos que A� se transforme como um vetor

A0� = �� �A� :

Desta forma, podemos facilmente obter o campo sentido pelos mais diversos observadores. Além disso,

o fato do campo de F ser realmente um tensor pode ser veri�cado tanto pela compatibilidade entre a sua

transformação e as transformações previstas pelas EM (como �zemos), quanto experimentalmente (medindo

os campos com sensores parados ou em movimento).

138

Page 139: Parte A (Relatividade)

3.4 Invariância de gauge

Partindo das expressões

B = r�A ; Bi = "ijk@jAk

E = �r�� @A

@t; Ei = � (@i�+ @0Ai)

e fazendo a transformação

~Ai = Ai + @i�) Ai = ~Ai � @i�~� = �� @0�) � = ~�+ @0�

para uma função � qualquer, temos

"ijk@jAk = "ijk@j

�~Ak � @k�

�= "ijk@j ~Ak � "ijk@j@k� = "ijk@j ~Ak

(@i�+ @0Ai) = @i

�~�+ @0�

�+ @0

�~Ai � @i�

�= @i~�+ @0 ~Ai

ou seja, podemos de�nir

Bi = "ijk@j ~Ak

Ei = ��@i~�+ @0 ~Ai

�usando tanto os potenciais originais como os transformados. Esta liberdade na escolha dos potenciais (na

escolha de �) é chamada de liberdade de gauge (ou invariância de gauge). Esta liberdade re�ete o fato de

que (em EM) os potenciais são apenas um artifício matemático e não tem uma realidade física, apenas os

campos têm uma realidade física.

Esta invariância é a motivação principal para �chutar�a forma do tensor de campo. Observando que

c=~�

c+ @0�) A0 = ~A0 � @0�

podemos escrever a nossa transformação de gauge como

A� = ~A� � @�� (68)

139

Page 140: Parte A (Relatividade)

por esta transformação o tensor do campo eletromagnético se transforma como

F�� = @�A� � @�A� = @�

�~A� � @��

�� @�

�~A� � @��

�= @� ~A� � @�@��� @� ~A� + @�@��

= @� ~A� � @� ~A�

Ou seja, esta transformação não altera F e, conseqüentemente, não altera os campos. Pela expressão acima é

trivial ver que a transformação (68) não altera F . Assim, a forma de F , i.e., a relação de F com os potenciais,

pode ser buscada como uma combinação de primeiras derivadas dos potenciais (pois os campos são derivadas

dos potencias) que são invariantes por uma transformação de gauge. A forma acima é a mais simples e a

única.

4 As equações de Maxwell

Temos então a nossa disposição duas quantidades com caráter tensorial:

1. J� = (�c;J), obtido através da lei de conservação de carga;

2. F�� = @�A� � @�A�, obtido através dos campos expresso pelo 4-vetor potencial A� = (��=c;A).

O que nos fornecer todas as 10 quantidades (4+6) presentes nas equações de Maxwell (EM). Nosso objetivo

agora é reescrever as EM usando o tensor do campo eletromagnético. Com isso, as expressões obtidas usarão

apenas tensores e valerão (terão a mesma forma, i.e., serão co-variante) para qualquer referencial inercial

(ligados por TL). Para isso, primeiro vamos dividir as EM em dois pares. As primeiras duas equações:

r�E = �@B@t

=) r�E+ @B

@t= 0 (Lei da indução de Faraday),

r �B = 0 (Não existem monopolos magnéticos),

são chamadas de equações homogêneas. Pois, colocando todos os campos do lado esquerdo, elas são iguais a

zero. Este par de equações não envolve cargas e correntes e apenas dita como os campos se relacionam.Este fato está re�etido na própria estrutura do tensor do campo. Ou seja, tudo que precisamos para descrever

estas equações está no tensor do campo eletromagnético.

Usando diretamente a de�nição do tensor do campo eletromagnético (TCE)

F�� = @�Av � @�A� ;

140

Page 141: Parte A (Relatividade)

vemos facilmente que

@�F�� + @�F�� + @�F�� =

@� (@�Av � @�A�) + @� (@�A� � @�A�) + @� (@�A� � @�A�) =

@�@�Av � @�@�A� + @�@�A� � @�@�A� + @�@�A� � @�@�A� =

@�@�Av � @�@�A� + @�@�A� � @�@�A� + @�@�A� � @�@�A� =

(@�@� � @�@�)A� + (@�@� � @�@�)A� + (@�@� � @�@�)A�

usando

@�@� =@2

@x�@x�=

@2

@x�@x�= @�@�

temos

@�F�� + @�F�� + @�F�� = 0 (69)

Se dois índices são iguais a expressão acima não nos diz nada. Por exemplo, para � = �:

(@�@� � @�@�)A� + (@�@� � @�@�)A� + (@�@� � @�@�)A� = 0

(@�@� � @�@�)A� + (@�@� � @�@�)A� = 0

[(@�@� � @�@�) + (@�@� � @�@�)]A� = 0

Precisamos então apenas analisar os termos com índices diferentes. Analisemos uma componente desta

igualdade, por exemplo, � = 0; � = i; � = j:

@0Fij + @iFj0 + @jF0i = 0

@0Fij +1

c

�@iEjc� @j

Eic

�= 0

@0F12 +1

c

�@1E2c� @2

E1c

�= 0 =) @0B3 +

1

c[r�E]3 = 0

@0F13 +1

c

�@1E3c� @3

E1c

�= 0 =) @0 (�B2) +

1

c(� [r�E]2) = 0

@0F21 +1

c

�@2E1c� @1

E2c

�= 0 =) @0 (�B1) +

1

c[(� [r�E]1)] = 0

Agrupando os resultados acima temos

1

c[r�E] = � @

@ctB =) r�E = �@B

@t

141

Page 142: Parte A (Relatividade)

Fazendo � = 1; � = 2; � = 3

@1F23 + @2F31 + @3F12 = 0

@1B1 + @2B2 + @3B3 = 0

Que pode ser escrita como

r:B = 0

Exercise 70 Veri�que que as outras componentes da expressão (69) dão identidades, ou as mesmas equaçõesque as obtidas acima.

Remark 71 Assim, o par de equações de Maxwell chamado de homogêneo está contido na equação (69), aqual, por sua vez, é uma conseqüência da de�nição do tensor do campo eletromagnético através do potencial.

Partamos agora para as EM não homogêneas, i.e., aquelas que relacionam as cargas, e seu movimento,

com os campos

r �E = �

"0(Lei de Gauss)

r�B = �0J+ �0"0@E

@t(Lei de Ampère + corrente de deslocamento)

Usando a notação introduzida anteriormente, podemos escrever a primeira das equações acima como

r �E = �

"0= c@i

Ei

c=

c�

c"0=) @iF

0i =J0

c2"0

usando

"0�0 =1

c2=) �0 =

1

"0c2

temos

r �E = �

"0=) @iF

0i = �0J0

Se usarmos agora o fato de F 00 = 0 podemos ainda escrever

@0�F 00 = 0

�+ @iF

0i = �0J0

ou seja

@0F00 + @iF

0i = �0J0

@�F0� = �0J

0 (70)

142

Page 143: Parte A (Relatividade)

Já para a segunda equação temos

r�B = �0J+ �0"0@E

@t

(r�B)3 = �0J3 + �0"0@E3@t

@1B2 � @2B1 = �0J3 + �0"0

@E3@t

=) @1�F 31

�� @2

��F 32

�= �0J3 + �0"0

@E3@t

@1F31 + @2F

32 = �0J3 + �0"0c2 @

E3c

@ct

Usando o fato de F 33 = 0 podemos escrever esta última equação como

@1F31 + @2F

32 + @3�F 33 = 0

�= �0J

3 + @0F03

Usando a anti-simetria de F 03

@1F31 + @2F

32 + @3F33 = �0J

3 � @0F 30

@0F30 + @1F

31 + @2F32 + @3F

33 = �0J3

que pode ser escrita como

@�F3� = �0J

3

Da mesma forma

(r�B)2 = �0J2 + �0"0@E2@t

=) @�F2� = �0J

2

(r�B)1 = �0J1 + �0"0@E1@t

=) @�F1� = �0J

1

ou seja

@�Fi� = �0J

i

Usando agora a equação (70) obtida anteriormente, temos o seguinte par de equações

@�F0� = �0J

0 ; @�Fi� = �0J

i

Ou seja, o par de equações não homogêneas de Maxwell pode ser escrito como

@�F�� = �0J

� (71)

Assim, das quatro equações de Maxwell duas são uma conseqüência direta da nossa de�nição do tensor do

campo eletromagnético através do potencial vetor (quadri-vetor) e as outras duas tem a forma obtida acima.

143

Page 144: Parte A (Relatividade)

Em outras palavras ainda, as quatro equações de Maxwell podem ser escritas com o seguinte par de equações

covariante:

F�� = @�A� � @�A� ;

@�F�� = �0J

� ; (72)

onde

A� ����c;A

�:

4.1 Outra aproximação

Alguns livros preferem um rumo um pouco diferente. Vejamos como as nossas idéias podem ser compatibi-

lizadas com as destes livros. Observe que a equação (69)

@�F�� + @�F�� + @�F�� = 0 (73)

também pode ser escrita como1

2"����@�F�� = 0 (74)

onde "���� é o tensor de Levi-Civita em 4-D. Por exemplo, peguemos a (69) para � = 1; � = 2; � = 3

@1F23 + @2F31 + @3F12 = 0

Agora, se tomarmos a (74) para � = 0 temos

"0���@�F�� = "0123@1F23 + "0132@1F32 + "

0312@3F12 + "0321@3F21 + "

0213@2F13 + "0231@2F31

= @1F23 � @1F32 + @3F12 � @3F21 � @2F13 + @2F31= @1F23 + @1F23 + @3F12 + @3F12 + @2F31 + @2F31

= 2 (@1F23 + @3F12 + @2F31) = 0

ou seja1

2"0���@�F�� = @1F23 + @3F12 + @2F31 = 0

o mesmo vale para as demais componentes de � em (74), ou seja, cada componente de � em (74) representa

uma escolha dos índices �; �; � em (73). Ademais, a equação (74) pode ainda ser escrita como

"����@�F�� = 0 =) @�

�1

2"����F��

�= @�G

�� = 0

144

Page 145: Parte A (Relatividade)

onde

G�� =1

2"����F��

é chamado de dual do tensor do campo eletromagnético.

Exercise 72 Obtenha a forma matricial do tensor dual G�� .

Com isto, os textos que seguem esta rota, não partem da de�nição do tensor do campo eletromagnético

através do potencial vetor, mas, ao invés disso, partem da de�nição de F diretamente através dos campos

elétricos e magnéticos (obtido pelas leis de transformação do campo)

F�� =

0BBBB@0 �E1

c �E2c �E3

cE1c 0 B3 �B2E2c �B3 0 B1E3c B2 �B1 0

1CCCCA ;

em seguida de�nem o dual deste tensor.

Nesta aproximação as EM possuem a seguinte forma

@�F�� = �0J

� ; @�G�� = 0 :

Onde a primeira, que corresponde as equações inhomogênea, é igual a do nosso desenvolvimento e a segunda

corresponde ao par de equações homogêneas. Obviamente os dois desenvolvimentos são completamente

equivalentes. Ou seja, pra nós as quatro equações de Maxwell se reduzem ao par

F�� = @�A� � @�A� ; @�F�� = �0J� ;

onde

A� ����c;A

�ou ao par

@�F�� = 0 ; @�G

�� = 0 ;

onde

F�� �

0BBBB@0 �E1

c �E2c �E3

cE1c 0 B3 �B2E2c �B3 0 B1E3c B2 �B1 0

1CCCCAG�� =

1

2"����F�� :

145

Page 146: Parte A (Relatividade)

4.2 Ainda sobre as equações não-homogêneas

Na verdade, o par de equações não-homogêneas pode ser considerado também como uma conseqüência da

anti-simetria do tensor do campo eletromagnético. Pois, devido a esta anti-simetria:

@�@�F�� = 0

ou seja

@� (@�F��) = 0 =) @�C

� = 0; C� = @�F�� (75)

Assim, o vetor C�, como conseqüência da anti-simetria de F , é uma quantidade com quadri-divergêncianula. Estas quantidades são chamadas de correntes conservadas. Obviamente precisamos saber que vetoré este. Pelo desenvolvimento anterior já sabemos quem é C, mas, se começássemos pelo caminho atual,

teríamos a indicação de que C está relacionada a uma quantidade conservada (neste caso a carga).

Para obter explicitamente esta quantidade podemos seguir o caminho inverso ao seguido anteriormente,

ou seja, escrevemos cada uma das componentes de C e comparamos com as EM.

Para a componente � = 0 temos

C0 = @�F0� = @0F

00 + @1F01 + @2F

02 + @3F03

= @1F01 + @2F

02 + @3F03

= @1

�E1c

�+ @2

�E2c

�+ @3

�E3c

�=

1

cr �E

Usando agora a lei de Gauss temos

r �E = �

"0=) C0 =

1

cr �E =1

c

"0=1

c2c�

"0= �0J

0

Para as demais componentes � = 1 temos

C1 = @�F1� = @0F

10 + @1F11 + @2F

12 + @3F13

= @0

��E1c

�+ @2 (B3) + @3 (�B2)

= �1c@0E1 + @2B3 � @3B2

= �1c@0E1 + "1jk@jBk

146

Page 147: Parte A (Relatividade)

No caso geral de uma componente espacial � = i

Ci = �1c@0Ei + "ijk@jBk

= �1c

@Ei@x0

+ "ijk@jBk

= � 1c2@Ei@t

+ "ijk@jBk

= ��0"0@Ei@t

+ "ijk@jBk

Usando agora a lei de Ampere-Maxwell

r�B� �0"0@E

@t= �0J =) �0Ji = ��0"0

@Ei@t

+ "ijk@jBk

temos

Ci = �0Ji = �0Ji :

Coletando nossos resultados

C0 = �0J0 ; Ci = �0J

i =) C� = �0J�

Voltando na equação (75)

C� = @�F�� =) @�F

�� = �0J�

como já havíamos obtido. Observe também a anti-simetria de F tem por consequência a conservação da

carga

@�@�F�� = 0 =) @�C

� = 0 =) @�J� = 0 :

4.3 Invariantes do campo eletromagnético

Sendo F�� e G�� tensores, podemos formar com eles dois invariantes

F��F�� = 2

�jBj2 � 1

c2jEj2

�;

F��G�� =1

2"����F��F�� =

4

c(E �B) :

Exercise 73 Usando a forma explicita do tensor do campo eletromagnético, obtenha as expressões acima.

Ou seja, estas quantidades possuem o mesmo valor em qualquer sistema de coordenadas.

Em especial, se para um certo observador E e B forem ortogonais (E �B = 0) (como no caso das ondas

eletromagnéticas no vácuo) estes campos serão ortogonais para qualquer observador. Além disso, se para

algum observador jEj = c jBj esta igualdade será mantida em todos os referenciais. Através de uma escolha

147

Page 148: Parte A (Relatividade)

dos referenciais podemos encontrar campos E e B que tenham qualquer valor desejado, respeitando apenas

o valor dos invariantes acima.

Exercise 74 Num dado referencial S os campos elétricos e magnéticos possuem os valores E e B. Para um

outro observador, num referencial S0, estes campos são paralelos. Escreva o valor dos campos E0 e B0 doreferencial S0 em relação aos campos E e B do referencial S.

4.4 Gauge de Lorentz

Um resultado do cálculo vetorial conhecido como teorema de Helmholtz (ou teorema fundamental do cálculo

vetorial) a�rma todo campo vetorial (bem comportado), em três dimensões, que vá a zero no in�nito, podeser decomposto num vetor irrotacional e outro solenoidal (divergência nula). Em outras palavras, este campo

pode ser decomposto no rotacional de outro campo e no gradiente de uma função escalar

V =r�M+rf

Este resultado pode ser usado para explorarmos a liberdade de gauge do eletromagnetismo. Lembrando que

esta liberdade a�rma que, dado um potencial escalar � e um vetor A ligados a uma certa con�guração dos

campos elétricos e magnéticos, qualquer outro potencial na forma

~A� = A� + @��

~A0 = A0 + @0�) ~� = �� @t�~Ai = Ai + @i�) ~A = A+r�

descreverá os mesmo campos e, conseqüentemente, a mesma física. Se usarmos agora o teorema de Helmholtz

para escrever

A =r�M+rf

teremos~A =r�M+rf +r�) ~A =r�M+r (f + �)

Calculando o divergente desta quantidade temos

r:~A =r: (r�M) +r:r (f + �) = r2 (f + �)

Assim, escolhendo a função � = �f podemos eliminar completamente a divergência de ~A. Além disso,

escolhendo adequadamente a função � podemos modi�car arbitrariamente o divergente do potencial vetor,

uma vez que este só depende do laplaciano da função (f + �) acima. Com isso, uma conseqüência direta da

invariância de gauge é que podemos escolher arbitrariamente o gradiente do potencial vetor semalterar os campos e, conseqüentemente, sem alterar a física do problema.

148

Page 149: Parte A (Relatividade)

Esta liberdade é usada para simpli�car a forma das equações obtidas quando usamos os potenciais dire-

tamente nas EM. Substituindo as expressões

B =r�A ;E = �r�� @A

@t;

nas EM não-homogêneas temos

r2�+@

@tr:A = � �

"0

r2A��0"0@2A

@t2�r

�r:A+ �0"0

@�

@t

�= ��0J (76)

Podemos assim sair de um conjunto de seis campos indeterminados para um conjunto de quatro. Além disso,

as equações acima podem ser simpli�cadas pela nossa escolha na liberdade de gauge. Por exemplo, se �zemos

r:A = 0

a primeira equação acima se torna

r2� = � �

"0;

conhecida como equação de Poisson. Assim a distribuição de carga de um problema está relacionado com

a solução da equação de Poisson para o potencial do campo eletromagnético. A escolha acima signi�ca

que �zemos uma escolha especí�ca da nossa função � e, conseguintemente, uma escolha de gauge. Esta em

particular é chamada de gauge de Coulomb.

A substituição do potencial vetor nas equações não-homogêneas é também bem mais simples usando a

equação covariante (tente obter as expressões (76) acima). Neste caso usando

F�� = @�A� � @�A� ; @�F �� = �0Jv

temos

@� [@�A� � @�A�] = �0J

v =) @�@�A� � @� (@�A�) = �0J

v

Esta equação pode ser simpli�cada escolhendo

r:A = � 1c2@�

@t=) @iA

i + @0A0 = 0 =) @�A

� = 0

com isso

@�@�A� = 4A� = �0J

v

onde

4 = @�@� = r2 � 1

c2@2

@t2

149

Page 150: Parte A (Relatividade)

é o operador d�Alambertiano.

Exercise 75 Mostre que o gauge de Coulomb não é invariante por transformações de Lorentz.

Para manter a escolha do gauge de Coulomb entre diferentes referenciais precisamos de�nir uma trans-

formação diferente para cada referencial. Desta forma a quantidade A� não se transforma como um 4-vetor.

5 Força de Lorentz

As EM nos dizem como as cargas e seus movimentos, in�uenciam, ou criam, os campos eletromagnéticos.

Para �nalizar a teoria do eletromagnetismo, resta-nos ainda dizer como os campos interagem com as cargas,

ou seja, obter a forma covariante da força de Lorentz.

F = qE+ qu�B

Fi = qEi + q"ijkujBk

Sabemos que a força não é um 4-vetor (nem um invariante). A disso, no lado direito da equação acima

aparece a velocidade da partícula (que obviamente não é um quadrivetor). Podemos inicialmente corrigir o

problema com a velocidade usando o 4-vetor quadrivelocidade:

�� =dx�

d�=

0@ cq1� u2

c2

;1q1� u2

c2

ui

1Acom isso

Fi = qEi + q"ijk

r1� u2

c2�iBk

Para a componente x = 1 temos

Fx = q

"cEx +

r1� u2

c2��2Bz � �3By

�#

usando agora o TCE podemos escrever esta expressão com

F1 = q

"cF10 +

r1� u2

c2��2F12 + �

3F13�#

= q

r1� u2

c2

24 cq1� u2

c2

F10 +��2F12 + �

3F13�35

= q

r1� u2

c2��0F10 +

��2F12 + �

3F13��

150

Page 151: Parte A (Relatividade)

Usando agora que F11 = 0, podemos ainda escrever

F1 = q

r1� u2

c2��0F10 + �

1F11 + �2F12 + �

3F13�

F1 = q

r1� u2

c2��F1�

Para as demais componentes temos

Fi = q

r1� u2

c2��Fi� =)

Fiq1� u2

c2

= q��Fi�

No lado esquerdo da expressão acima podemos reconhecer as componentes espaciais da força de Minkowski

K� =dp�

d�=

0@ 1

cq1� u2

c2

F:u;1q1� u2

c2

F

1AK� =

0@� 1

cq1� u2

c2

F:u;1q1� u2

c2

F

1A (77)

ou seja

Ki = q��Fi�

Além disso, se calcularmos

K0 = q��F0�

= q��0F00 + �

1F01 + �2F02 + �

3F03�

= �q��1E1c+ �2

E2c+ �3

E3c

�= �q

c

1q1� u2

c2

(E � u)

= �1c

1q1� u2

c2

(qE � u)

= �1c

1q1� u2

c2

(F � u)

151

Page 152: Parte A (Relatividade)

Que podemos reconhecer como a componente temporal (zero) da força de Minkowisky em (77). Lembrando

que esta componente se relaciona com a variação do trabalho da carga

K� =

0@1c

1q1� u2

c2

dE

dt;

1q1� u2

c2

F

1AAssim, a força de Lorentz, acrescida da equação para a variação da energia da carga, pode ser escrita de

forma covariante como:

K� = q��F�� :

Assim, na RR, todo o eletromagnetismo se resume nas expressões:

A� ����c;A

�F�� � @�A� � @�A�J� = (c�;J) (conservação da carga)

@�F�� = �0J

� (EM não homogênea)

K� = q��F�� :(força de Lorentz)

Exercise 76 Considere uma carga em repouso num sistema S0 onde existe um campo elétrico E0. Sabendo

que S0 se move com velocidade v = vx com relação ao sistema S, use a lei de transformação de forças e dos

campos para encontrar as forças que agem na carga em S.

6 Noções de relatividade geral

A teoria da Relatividade restrita promoveu uma completa revolução na noção de tempo e espaço, em especial

na concepção geométrica do nosso espaço (uma vez que o tempo ante não fazia parte desta geometria). Uma

nova revolução, talvez ainda mais revolucionária, foi introduzida pela Teoria da Relatividade Geral.

Na mecânica clássica o conceito de massa surge em duas situações independentes. A primeira é a segunda

lei de Newton

F = mia ;

e a segunda a lei da gravitação de Newton

F = GMmg

r2r ;

152

Page 153: Parte A (Relatividade)

onde G é uma constante universal (constante gravitacional). Ou ainda, se chamarmos de

g (r) = GM

r2r

a intensidade do campo gravitacional sentido pela massa mg no ponto r devido a presença da massa (grav-

itacional) M , pode ser escrita como

F = mgg

Problem 77 Uma dúvida a se colocar é se as quantidades mi e mg que surgem nas equações acima são as

mesmas.

Suponha que massa inércia e a gravitacional sejam duas características distintas de um corpo (como carga

e massa)31 . Se este corpo cair livremente sob a ação apenas de um campo gravitacional temos que a sua

aceleração será:

F = mia ; F = mgg ) a =mg

mig

Ou seja, a razão entre a massa gravitacional e a massa inercial será uma constante (universal) apenas setodos os corpos caírem com a mesma aceleração sob a ação da gravidade. O valor explícito destaconstante é irrelevante, pois ela apenas ajusta a unidade de massa ou o valor numérico de G. Assim, para

as unidades adequadas (ou o valor adequado de G) podemos dizer que apenas se

mg = mi � m ;

todos os corpos caem com a mesma aceleração sob a ação do campo gravitacional criado por um outro corpo.

Problem 78 Se você estiver numa nave numa órbita estacionária e jogar uma bolinha de gude, a estátuada liberdade e a lua, todos cairão com a mesma aceleração na terra?

Observe que a a�rmação acima supõeM >> m de sorte queM não sofre nenhum deslocamento durante o

experimento. A a�rmação adequada é que, visto de um ponto �xo de M todos os corpos caem com a mesma

aceleração. Ou ainda, visto do centro de massa do sistema qualquer corpo lançado contra M fará a mesma

trajetória.

Antes de Galileu a idéia predominante (desde Aristóteles) é que corpos mais pesados caem mais depressa.

Outros experimentos, além dos realizados por Galileu com planos inclinados, comprovaram a igualdade da

massa inercial e gravitacional até uma precisão de 10�12 (até 2008). Mas qualquer diferença pequena nesta

igualdade (ou na constância da razão entre elas) possui conseqüências cruciais em física. De sorte que ainda

hoje experimentos são realizados para comprovar esta igualdade.

A equivalência entre a massa inercial e gravitacional leva a seguinte questão:

31Obviamente a experiência do cotidiano indica que mi e mg não podem ser muito diferentes.

153

Page 154: Parte A (Relatividade)

Problem 79 Seria possível para um observador numa nave (sem olhar pra fora) saber se a nave está parada

na superfície da terra (cuja aceleração da gravidade vale g) ou se desloca no universo com aceleração constante

g?

Ou ainda seria possível para este mesmo observador saber, fazendo apenas experimento dentro da nave, se

ele cai sob o efeito do campo gravitacional, ou se vaga livre pelo espaço? Acreditando que a resposta destas

perguntas sejam ambas negativas, Einstein propôs o chamado Princípio da Equivalência:

�we [...] assume the complete physical equivalence of a gravitational �eld and a corresponding acceleration

of the reference system.�(Einstein, 1907)

Em primeiro lugar, este conceito muda (completamente) a noção de um referencial inercial. Pois, se o

observador em queda livre não for capaz de detectar nenhuma força proveniente da sua aceleração (grav-

itacional) qualquer experimento mecânico será compatível com os resultados de um outro observador num

referencial inercial (no sentido anterior) que não esteja sob a ação de nenhum campo gravitacional. Ou seja,

as leis da mecânica valem não só para os referenciais ligados por TL, mas também para referenciais em

queda livre. Assim, um observador que cai livremente num campo gravitacional também estánum referencial inercial. Dentro destas idéias qualquer �força �ctícia� que surja porque estamos numreferencial não inercial (acelerado) é equivalente, ou pode ser produzida, por um campo gravitacional. Da

mesma forma, um observador que sinta uma força gravitacional (e.g., você parado na superfície da terra) é

equivalente a um referencial acelerado e, conseqüentemente, não inercial.

É importante observar que as a�rmações acima são válidas apenas para experiências realizadas num lab-

oratório �bem pequeno�. Por exemplo, se você esta num container caído sob o efeito do campo gravitacional

da terra o chão do container pode estar mais perto da terra que o teto. Isso signi�ca que, se o container é

grande o su�ciente, a força gravitacional no teto será maior que perto do piso e você será capaz de detectar

uma diferença na aceleração de corpos lançados nestas duas posições. Ou ainda se você colocar um elástico

pendurado no teto do container você irá vê-lo se esticar. Na verdade, se o campo for forte o su�ciente, o

chão do container será puxado com muito mais força que a base e este irá se estilhaçar. Este fenômeno,

que permite a detecção da in�uência do campo para um sistema em queda livre é chamado efeito de maré.

Assim, quando dizemos que o laboratório em queda livre não sente a ação do campo estamos nos limitando

a laboratório cuja dimensão é muito menor que uma variação apreciável na intensidade do campo.

Além do exposto acima, adotar o princípio da equivalência nos diz que qualquer resultado obtido veri�cado

num referencial acelerado (não-inercial) deve ser esperado também num campo gravitacional. Por exemplo,

imagine um disco que gira (um carrossel) com velocidade constante ! e um observador no centro. Qualquer

pessoa fora do centro sentirá uma força equivalente a uma força gravitacional (é assim que as estações espaciais

simulam gravidade).

Este observador espalhou relógios idênticos pela superfície do disco. Conforme os relógios estão num raio

maior se movem com maior velocidade e, conseqüentemente, se movem mais devagar (para o observador no

centro) devido à dilatação temporal. Entretanto, um relógio numa certa distância R sofre uma aceleração

constante !R2 = g que é equivalente a um campo gravitacional que produza a mesma aceleração. Uma

154

Page 155: Parte A (Relatividade)

vez que (acreditando no princípio da equivalência) não é possível distinguir entre a ação de um campo

gravitacional e os efeitos de um referencial com uma aceleração constante, devemos esperar que um relógio

num campo gravitacional de intensidade g, quando observado por alguém muito distante (dizemos �fora

da ação do campo�) ande também mais devagar. Voltando para o carrossel, quanto maior a posição R do

relógio, maior a aceleração centrifuga e mais ele irá se atrasar. Voltando para o campo, quanto maior a

intensidade do campo gravitacional maior será também o atraso do relógio. Assim, uma pessoa que esteja

a uma distância R (�nita) de um corpo massivo verá o relógio de outra pessoa que está a uma distância

r < R andar mais devagar. Ou seja, não apenas relógios em movimento, mas também relógios �parados�

(em relação a um observador num referencial inercial fora do alcance do campo) andam mais devagar. Esta

é a in�uência esperada do campo gravitacional sobre o tempo.

Um outro ponto a ser observado no exemplo acima é sobre a medida de distâncias. Obviamente, como nós

acreditamos na relatividade restrita, o movimento de réguas no disco (medida por alguém no centro) sofrerá

as contrações de Lorentz. Da mesma forma a medida de um comprimento de arco qualquer realizada pelo

observador no centro fornecerá um valor dl0 menor que a medida dl realizada por um observador girando junto

com o arco (ou com o disco parado). Além disso, medidas na direção radial (por estarem perpendicular

ao movimento) fornecerão o mesmo valor para os dois observadores r0 = r. Assim, se P 0 é o perímetro a uma

distância r0 medido pelo observador no centro, quando o disco está girando, e P o perímetro no ponto r (que

é o mesmo que r0) medido quando o disco está parado, temos:

P 0

r0=P 0

r<P

r:

Mais especi�camente, como sabemos que P=r = 2�, temos que a razão entre o perímetro e o raio da circunfer-

ência de um disco girante (e, conseqüentemente, de medidas de distância realizadas num campo gravitacional)

não mais respeitam os axiomas de Euclides e suas consequencias. Ou seja, se quisermos trabalharcom campos gravitacionais, devemos mudar (mais uma vez!) drasticamente a nossa noção de geometria.

Pelo exposto acima, temos que os fenômenos envolvidos no tratamento geométrico de campos gravita-

cionais devem ser desenvolvidos numa teoria que relaxe os axiomas de Euclides, ou, mais especi�camente,numa geometria não-euclidiana. As características de uma tal geometria são, por exemplo, que a razão entre

área e perímetro são diferentes de 2� e que a soma dos ângulos internos de u triângulo não são mais 180o.

Observe que o efeito acima pode ser visualizado imaginando um disco côncavo, ou uma tigela. Pois, neste

caso, o perímetro medido não será mais uma rela e, por isso, maior, enquanto a borda do disco continua a

mesma. Assim, uma forma de se visualizar a �não-euclidicidade�do espaço é dizer que este espaço foi curvado.

Mas, obviamente, este conceito só faz sentido se pudermos imaginar um espaço de dimensão maior onde o

nosso prato está inserido. Entretanto, a pessoa no carrossel poder inferir sobre a mudança na geometria sem

fazer qualquer referência a um espaço de dimensão maior. Assim, o que queremos dizer é que os efeitos do

campo gravitacional são equivalentes aos efeitos da curvatura das características geométricas de um plano.

Além disso, como sabemos que tempo e espaço estão ligados, esta curvatura (apesar de equivalente) não

155

Page 156: Parte A (Relatividade)

pode ser levada ao pé da letra. Quando você ver desenhos de um corpo curvando o espaço-tempo e, por isso,

fazendo outro corpo �cair�sobre ele, lembre-se que uma das coordenadas daquele plano curvado é o tempo,

de sorte que a imagem não é equivalente a um plano espacial.É fácil ver que, levanto em conta os efeitos

da contração de Lorentz, estas características ainda se mantêm para quais observadores em RR. Mais ainda,

estas características estão ligadas com a noção de ângulos e distâncias do nosso espaço e, como vimos, estas

últimas estão ligadas com a métrica M do espaço. Num espaço euclidiano

M (x; y; z) =

0B@ 1 0 0

0 1 0

0 0 1

1CAObviamente, por uma transformação nas coordenadas

x = r sin � cos�

y = r sin � sin�

z = r cos �

podemos ter

M 0 (r; �; �) =

0B@ 1 0 0

0 r2 0

0 0 r2 sin2 �

1CA :

Entretanto, a forma feia da métrica acima não signi�ca que a geometria gerara por ela seja não-euclidiana,

pois nosso espaço continua plano. Mas existe uma única transformação (a transformação inversa) que é a

mesma em qualquer ponto do nosso espaço, que lema a métrica M 0 na forma M . Desta forma, podemos

a�rmar que:

Remark 80 Um espaço é plano quando existe uma transformação (a mesma para todos os pontos) que leva

a métrica na forma canônica acima.

Lembrando agora da idéia de Minkowski de descrever as TL como rotações num espaço quadridimensional

com métrica �, podemos a�rmar que nosso espaço 4D é plano, independente do sistema de coordenadas que

escolhemos, se existe uma (única) transformação (ou relação) entre as coordenadas que leve a métrica na

forma �. Uma vez que esta característica é respeitada pelas TL, dizemos que estas transformações não curvam

o espaço.

É importante lembrar que estamos falando do espaço 4D, ou seja, mesmo que tenhamos apenas uma

coordenada espacial, ainda podemos ter um espaço curvo. Além disso, a curvatura não deve ser confundida

(visualmente) com a curvatura usual do espaço 3D, apesar de ambas compartilharem de várias características

matemáticas. Mesmo assim, se apenas a parte espacial da métrica no espaço de Minkowski não mais assumir

156

Page 157: Parte A (Relatividade)

a forma canônica, podemos a�rmar que a geometria de todos o espaço 4D não é mais euclidiana. Por isso

o exemplo acima é legítimo para a�rmar que o tratamento geométrica da gravidade (no mesmo sentido do

tratamento geométrico das TL) envolve uma geometria não-euclidiana.

O tratamento matemático rigoroso para se tratar espaços cujas propriedades violem os axiomas de Euclides

foi desenvolvido muito antes da TRG, principalmente por Riemann e Lobachevsky. O objetivos destes

trabalhos tinha a aplicação extremamente prática de realizar medidas em terrenos irregulares. Imagine

que você vive na superfície de um planeta que não seja plano (como o que você vive!). Seria possível,

fazendo medidas apenas na superfície deste planeta, i.e., sem olhá-lo do espaço nem observando nada fora

da superfície, descobrir que ele não é plano. A resposta a esta pergunta é a�rmativa. Se você possuir

réguas, compassos e transferidores com precisão in�nita, você pode medir, por exemplo, os ângulos internos

dos triângulos desenhado no chão e descobrir que estes não somam 180o. Assim, imagine que você seja uma

criatura bidimensional, que seria o mesmo que só poder realizar medidas através de desenhos riscadosno chão. Para você a terceira dimensão, ou a noção de altitude não faz sentido (é apenas uma abstraçãoinventada pelos teóricos) ainda assim você será capaz de determinar se a geometria do seu espaço é ou não

euclidiana. Como você não tem a noção de profundidade, obviamente a idéia de curvatura não faz muito

sentido. Mas, mesmo assim, simplesmente por seu espaço não ser euclidiano, você dirá que ele é �curvo�.

Este ponto é importante porque a noção geométrica usual de curvatura no nosso espaço quadridimensional

só faz sentido se imaginarmos que ele está imerso num espaço plano de dimensão maior. Mas não precisamos

tentar dar um signi�cado físico para este espaço 5D.

6.1 Métrica

Os trabalhos originais em geometria não-euclidiana, ou geometria riemanniana, possuem exatamente a idéia

acima de podemos descrever as características de uma superfície plana apenas por medidas desenhadas no

chão (sem a possibilidade de usar aviões ou satélites). Para o caso de planos, o conceito é extremamente

simples. Primeiro você imagina que a superfície a ser estudada possa ser imersa numa superfície de dimensão

maior e que esta superfície maior é euclidiana. Ou seja, seu plano é uma superfície curva bidimensionalE imersa num espaço euclidiano tridimensional M . Com isso, temos no nosso espaço duas opções para

marcarmos pontos no plano. O primeiro é usar o espaço M , i.e., as coordenadas (x1; x2; x3) e saber que a

geometria nestas coordenadas é plana. Ou seja, a métrica do nosso espaço 3D vale

e =

0B@ 1 0 0

0 1 0

0 0 1

1CA ; eab = �ab :

Agora, nada impede você, que vive na superfície bidimensional, de fazer desenhos no chão, com retas

paralelas (que não se cruzam) e perpendiculares e a cada ponto do espaço onde as retas se cruzam regis-

trar as coordenadas u1 e u2. Assim, nosso espaço E (o plano) tem um sistema de coordenadas euclidiano

157

Page 158: Parte A (Relatividade)

(xi; i = 1; 2; 3) e outro no plano (u�; � = 1; 2). Obviamente, a cada ponto no plano com coordenadas (u1; u2)

podemos determinar as coordenadas deste ponto no sistema euclidiano

u� = u� (x1; x2; x3) ; � = 1; 2 ;

e, obviamente, para pontos no plano

xi = xi (u1; u2) ; i = 1; 2; 3 :

Além disso, se dois pontos no plano tem sua distância in�nitesimal dxa (de sorte que possamos imaginar

que estes pontos são ligados por uma reta, mesmo em E) na direção a com relação ao sistema euclidiano,

esta distância está relacionada com diferenças nas coordenadas do plano pela regra da cadeia

dxa =@xa

@u1du1 +

@xa

@u2du2 =

@xa

@u�du�

onde os índices latinos marcam as coordenadas no espaço 3D (a = 1; 2; 3) e os gregos das coordenadas no

plano (� = 1; 2). Esta relação nos permite relacionar comprimentos e ângulos medidos por ambos os sistemas

de coordenadas . Mais especi�camente, sabemos que as medidas de ângulos e distâncias são dados pela

métrica do espaço, ou seja

ds2 = eabdxadxb = eab

@xa

@u�@xb

@u�du�du� = eabx

a�x

b�du

�du�

= g��du�du� ; �; � = 1; 2 e a; b = 1; 2; 3 :

158

Page 159: Parte A (Relatividade)

A quantidade

g�� = eabxa�x

b� = �ab

@xa

@u�@xb

@u�;

é a métrica do espaço E, ou seja, esta quantidade de�ne distâncias e ângulos em E usando ascoordenadas u.No nosso caso, como eab = �ab poderíamos simpli�car a expressão acima, mas vamos deixá-la desta forma

para casos mais gerais onde o espaço M possui uma dimensão e uma métrica arbitrária. Ou seja, dado umespaço M de dimensão d + 1 e uma métrica e, esta características induzem uma geometria numa superfície

E, imersa em M , de dimensão d com uma métrica g.

No caso acima a matriz g é uma matriz 2 � 2 que pode assumir qualquer forma dependendo de comomarcamos as coordenadas locais u. Além disso, podemos saber se a nossa superfície E é plana se existir um

sistema de coordenadas que possamos marcar continuamente no chão (i.e., um mesmo sistema para a toda

superfície) e deixe a nossa métrica na forma canônica e. Caso contrário, saberemos com certeza que nosso

espaço é curvo.

Obviamente, pela construção acima, precisamos conhecer e e como as coordenadas do plano dependem

das do espaço euclidiano para construir g. Mas, na prática, esta quantidade pode ser construída diretamente

fazendo medidas no chão e usando instrumentos (réguas, transferidores etc.) com precisão in�nita (ou,

no caso de terrenos, com precisão muito maior que a irregularidade dos terrenos). Uma vez conhecido g

podemos medir distâncias, ângulos e áreas (i.e., podemos fazer geometria) no nosso plano E usando apenas

as coordenadas u, sem nunca mais fazemos referencias as coordenadas (xi).

Todo o desenvolvimento acima pode ser trivialmente modi�cado para o caso em que a nossa superfície E

tem dimensão n e o espaço M tem dimensão n+ 1.

6.2 Espaço tangente e vetores

Acima vimos como toda a geometria pode ser realizada por medidas feitas apenas por um ser bidimensional.

Entretanto, além de geometria, um conceito extremamente importante para o desenvolvimento de problemas

em física é o conceito de vetor. Observe que esta idéia não pode ser diretamente levada para o plano. Pois

a idéia geométrica de um vetor, como uma seta que aponta em alguma direção de M não fará sentido em E

sempre que esta direção não for paralela ao plano E. Assim, uma seta que pode ser um vetor num ponto de E

não mais será num outro ponto. Diferente da noção do espaço euclidiano, onde um vetor pode ser deslocado

por todo o espaço (e.g., na operação de soma ligamos as origens) em espaços curvos a noção de vetor está

intimamente ligada ao ponto onde ele é de�nido. Além disso, não queremos inventar uma nova noção de

vetores como �setinhas curvas�no nosso plano, pois assim teríamos de rede�nir toda a álgebra vetorial.

Remark 81 Precisamos então de uma noção de vetor relacionada com cada ponto de E e que guarde semel-

hança algébricas com a noção de setas em M .

159

Page 160: Parte A (Relatividade)

Voltemos ao sistema de coordenadas do espaço 3D onde introduzimos uma base de vetores ortonormais

(e1; e2; e3). Assim, podemos de�nir um ponto P de E através de um vetor x como (veja �gura 1),

x = xaea 2 E ; xa = xa (u1; u2) ; a = 1; 2; 3;

ou seja, dado um ponto P em E com coordenadas (u1; u2), podemos encontrar no espaço 3D o vetor x com

componentes�x1; x2; x3

�.

Além disso, dado um ponto P em E, podemos encontrar em M um plano tangente a este ponto. Uma

base para este plano pode ser dada por

xa� =@xa

@u�;

observe que x� =�x1�; x

2�; x

3�

�é um conjunto de 2 vetores em M (até agora apenas vetores em M estão

de�nidos)

x� = xa�ea ; xa� =

@xa

@u�:

Vetores de�nidos neste plano tangente envolvem apenas a idéia de direção e de magnitude em E. Ou seja,

para nossa criatura bidimensional localizada num certo ponto P , um vetor no plano tangente aponta na

direção que ele olha e tem uma certa magnitude, sem nenhuma noção de altura relacionada.

Podemos agora de�nir um vetor A num ponto P de E como

A = A1x1 +A2x2 = A�x� = A�

�xa�ea

�(78)

e A� são as componentes de A na base de�nida por xa (u1; u2). Dizemos que A (uma quantidade com 2

componentes) é um vetor de E no espaço tangente em P . Assim, apesar de perder a sua característica

geométrica, os vetores mantêm as suas características algébricas. Em especial, vetores no plano têm apenas

duas componentes. Observe que, para superfícies E curvas, este espaço terá uma orientação diferente em

cada ponto.

6.2.1 Lei de transformação

É importante observar que o sistema de coordenadas global está sujeito a certas transformações. Contudo,

estas transformações não são arbitrárias. Além de inversíveis, a transformação u� ! �u� deve fornecer,

@2�u�

@u�@u�=

@2�u�

@u�@u�:

Ou seja, sendo M�� = @�u�=@u� a matriz de transformação, por ser um campo matricial esta deve satisfazer

@M��

@u��@M�

@u�= 0 : (79)

160

Page 161: Parte A (Relatividade)

Para uma mudança no sistema de coordenadas global u� ! �u� as componentes (78) tornam-se

�A = A�@xa

@�u�@�u�

@u�ea =

@�u�

@u�A� (�xa� ea) =M�

�A� (�xa� ea) ; �xa� =

@xa

@�u�:

Com a nova base para o espaço tangente �xa� de�nido pela nova coordenada �xa (�u1; �u2). A transformação

acima é a conhecida lei de transformação de vetores cotravariantes.

Pelo procedimento acima, descrevemos vetores em um ponto do espaço através de um sistema de coor-

denada local (xA� ) de�nido a partir de um sistema de coordenada global (u�). Na verdade, este sistema de

coordenada local, ou frame, pode ser qualquer conjunto de vetores que, para cada ponto, forme uma base para

o espaço tangente. Para espaços planos (podemos saber se um espaço é plano através de sua métrica), como

os espaços tangentes coincidem, podemos utilizar o mesmo sistema de coordenadas para todos os pontos do

espaço, mas, no caso geral, este sistema será diferente em cada ponto.

O desenvolvimento anterior for realizado para garantir

ds2 = �abdxadxb = g��du

�du� ; �; � = 1; 2 e a; b = 1; 2; 3 :

Ou seja, podemos medir distâncias na superfície usando o sistema de coordenada em M ou em E. Além

disso, esta distância (uma quantidade geométrica) não deve depender do sistema de coordenadas escolhido

(em nenhum dos dois espaços). Assim, se realizamos uma mudança de coordenadas u� ! �u�, devemos ter:

�g��d�u�d�u� = g��du

�du�

= d�u� =@�u�

@u�du�

Uma vez que as quantidade d se transformam como um vetor contravariante, temos:

�g��d�u�d�u� = �g� M

�M

��du

�du� = g��du�du�

O que só será verdade para qualquer distância se

�g� M �M

�� = g�� =) �g� =

�M�1��

�M�1��

g��

Qualquer quantidade que, por uma mudança de coordenadas u� ! �u�, se transforme como as componentes

da métrica�A� =

�M�1��

�A�

é chamado de vetor (ou tensor) covariante.

A exigência de que nossas transformações sejam um difeomor�smo garante que em cada ponto do espaço

161

Page 162: Parte A (Relatividade)

possamos inverter a relação u� ! �u�, ou seja, a matriz g�� possui (em cada ponto) uma inversa

9 g�� jg��g�� = ��� ;

A exigência de que a igualdade acima seja válida para qualquer sistema de coordenadas e o fato da métrica ser

um tensor covariante e garante que g é um tensor contravariante. Além disso, os resultados acima garantem

que, se A� e B� são vetores contravariantes a quantidade

A�g��B�

é um invariante e a quantidade

A� = g��A�

é um vetor covariante. Ou seja, toda a álgebra de levantamento e abaixamento de índices, desenvolvida em

espaços planos continua válida em espaços curvos se usarmos g como tensor métrico.

6.3 Conexões e a derivada covariante

Um dos problemas centrais na análise de espaços curvos, está na introdução de um operador de diferenciação.

Se usarmos a idéia comum de derivada, teremos que a derivada de um vetor A num ponto U vale

@�AjU =@A

@u�

����U

= lim�"�!0

A (U + �"�)�A (U)�"�

:

onde �"� é a componente do vetor, ou seja, um número.Contudo, não sabemos realizar a operaçãoA (U + �"�)�A (U). Se voltarmos a olhar nosso plano através do espaço de dimensão maior da seção anterior, veremos

que estes dois vetores, por estarem relacionados a pontos diferentes do espaço, pertencem a planos tangentes

diferente. Se realizarmos a soma destes vetores de forma usual, o vetor resultante não pertencerá, em geral,

ao plano tangente de nenhum dos dois pontos. Mais ainda, ele pode não pertencer ao plano tangente de

nenhum ponto de E e, consequentemente, não ser um vetor de E.

Já na concepção usual de vetores no espaço euclidiano, a adição de vetores requer o transporte do ��m�

de um dos vetores ao �inicio�do outro. Se desejarmos continuar utilizando as operações de soma de vetores

em espaços planos, devemos encontrar uma forma de transportar o vetor do ponto U para o ponto U+�"u, de

sorte que a quantidade obtida seja também um vetor neste ponto. Feito isto, podemos realizar as operações

no plano tangente em U + �"� de forma usual. Vamos imaginar que sabemos realizar esta operação que

associa (ou conecta) vetores em pontos in�nitamente próximos,

AT (U + �") = T (�"; U) [A (U)] ; (80a)

162

Page 163: Parte A (Relatividade)

onde A, AT e �" são vetores. Com isto, nossa derivada se torna

D�A = lim�!0

A (U + �"�)� T (�"�; U) [A (U)]�"�

: (81)

Uma vez que a operação A (U + �) � T (�"; U) [A (U)] se realiza no mesmo plano tangente, podemos usar a

noção convencional de soma de vetores. Esta noção nos diz que o resultado desta soma e, conseqüentemente,

da operação de diferenciação, deve ser uma vetor.

Vamos agora exigir que nossa operação de transporte seja linear, ou seja, podemos escrever as componentes

do vetor transportado como uma combinação linear do vetor original

A�T (U + �) = T�� (�"; U)A� (U) : (82)

Como T (0; U) = I (identidade), podemos esperar que, para valores pequenos de �, a relação (82) possa

ser escrita como

AT (U + �") = (1� �"��� (U; "))A (U) ;

para alguma transformação �. Substituindo este resultado em (81) temos

D�A = lim�"�!0

A (U + �"�)� (1� �"���)A (U)�"�

= lim�"�!0

A (U + �"�)�A (U)�"�

+�"���A (U)

�"�

lembrando agora que �" possui apenas a componente � (i.e., �"� = ���"; " 2 R) temos

D�A = lim�!0

A (U + �"�)�A (U)�"�

+ ��A (U)

Introduzindo um sistema de coordenada global e realizando a variação apenas em uma direção, ou seja " = "�,

teremos

D�A = lim�!0

A (U + �"�)�A (U)�"�

+ ��A (U)

=@A

@u�+ ��A : (83)

Se A é um vetor contravariante, podemos explicitar os índices na expressão acima escrevendo

D�A� =@A�

@u�+ ����A

onde a posição dos índices da quantidade � apenas segue a nossa convenção de soma (poderíamos, da mesma

forma escrever ����). Toda a construção acima é feita para que a quantidade D�A� se transforme como um

163

Page 164: Parte A (Relatividade)

tensor uma vez covariante e uma vez contravariante. Assim, a derivada covariante calculada no sistema de

coordenadas �u deve se relacional com a calculada no sistema u como:

�D� �A� =�M�1��

�M�

�D�A�;�M�1��

�=@u�

@�u�

Com isso, usando o fato de A ser um vetor

�D�M��A

� =�M�1��

�M�

�D�A�; (84)

onde,

�D�M��A

� = �D� �A� =@

@�u��A� + ����� �A

=�M�1��

@

@u�(M�

�A�) + �����M

��A

=�M�1��

@M��

@u�A� +

�M�1��

�M�

@A�

@u�+ �����M

��A

Somando e subtraindo �M�1��

�M�

���� A

;

podemos escrever a equação acima como

�D�M��A

� =�M�1��

�@M�

@u��M�

����

�A +

�M�1��

�M�

�@A�

@u�+ ��� A

�+ �����M

��A

=�M�1��

�M�

�D�A� +�M�1��

�@M�

@u��M�

����

�A +M�

������A

=�M�1��

�M�

�D�A� +�M�1��

�@M�

@u��M�

�����

�A� +M�

������A

=�M�1��

�M�

�D�A� +�M�1��

�@M�

@u��M�

�����

�A� +M

����� A

usando (84)

�M�1��

�M�

�D�A� +�M�1��

�@M�

@u��M�

�����

�A� +M

����� A

� =�M�1��

�M�

�D�A���M�1��

�@M�

@u��M�

�����

�+M

�����

�A� = 0

164

Page 165: Parte A (Relatividade)

sendo o vetor A arbitrário temos

�M�1��

�M�1��

�@M�

@u��M�

�����

�= �

�M�1��

�M

�����

����� =�M�1��

�M�

�����

�M�1��

�� @M�

@u��M�1��

�: (85)

Temos assim a lei de transformação das conexões �. Esta lei de transformação garante, como era de se

esperar, que a derivada covariante D� se transforme como um vetor covariante.

Os resultados acima podem ser diretamente estendidos para um tensor de segunda ordem

D�A�� =@A��

@u�+ ����A

�� + ����A��

ou qualquer tensor de ordem mais alta.

Um ponto importante a se observar sobre a conexão é o seguinte. Toda quantidade com dois (ou mais)

índices pode ser decomposto numa parte simétrica e outra anti-simétrica:

Mab = S(ab) +A[ab]

onde

Mab +Mba = 2S(ab) ) S(ab) =Mab +Mba

2

Mab �Mba = 2A[ab] ) A[ab] =Mab �Mba

2

Assim, a nossa conexão pode ser escrita como:

���� = ��(��) + �

�[��]

Observe agora que na lei de transformação (85) a parte que faz com que a conexão não se transforme comoum tensor é apenas o último termo desta expressão e, além disso, este termo é simétrico nos índices ��

�M�1��

@M��

@u��M�1��

�=�M�1��

@M��

@u��M�1��

O que signi�ca que este termo não participa da transformação da parte anti-simétrica daconexão. Ou seja, diferente da parte simétrica ��(��), a parte antisimétrica da conexão �

�[��] se transforma

como um tensor.

Exercise 82 Suponha que a conexão é puramente anti-simétrica, substitui em (85) e veri�que que esta se

transforma como um tensor.

165

Page 166: Parte A (Relatividade)

6.4 Regra de Leibniz

Se impusermos agora que nossa derivada covariante respeite a seguinte regra do produto (ouregra de Leibniz)

�D� �A� = �D� (M��A

�) =�~D�M�

�A� +M�

��D�A�

=��D�M�

�A� +M�

�M�1��

�D�A�

onde��D�M�

�é a derivada covariante do tensor M�

�. Lembrando que, até aqui, nós só sabemos derivar

tensores contravariantes, isso signi�ca que esta quantidade (apesar de existir) não é a derivada calculada

antes. Ou seja, é uma quantidade que ainda não sabemos calcular. Mesmo assim, usando o fato de D� serum vetor, temos

�D� (M��A

�) =��D�M�

�A� +

�M�1��

�M�

�D�A� ; (86)

usando a relação (84)�D�M�

�A� =

�M�1��

�M�

�D�A�

temos�D� (M�

�) = 0 ;

Ou seja, a derivada covariante da matriz de transformação é nula. Suponha agora que você efetuou uma

transformação qualquer no seu vetor�A� = R� �A

e exigiu que esta transformação comute com a operação de derivada covariante

D� (R� �A�) = R� �D�A� ; (87)

Repetindo o procedimento acima temos�D� (R� �) = 0 : (88)

Se voltarmos à de�nição da derivada covariante:

D� (R� �A�) = lim

�!0

R� �A� (U + �"�)� T (�"�; U) [R� �A

� (U)]

�"�:

166

Page 167: Parte A (Relatividade)

a comutação (89) fornece

lim�"�!0

R� �A� (U + �"�)� T (�"�; U) [R� �A

� (U)]

�"�

= R� �

�lim�"�!0

A� (U + �"�)� T (�"�; U) [A� (U)]�"�

�=

�lim�"�!0

R� �A� (U + �"�)�R� �T (�"

�; U) [A� (U)]

�"�

�ou seja,

T (�"�; U)R� � = R� �T (�"�; U) (89)

Ou seja, invertendo os passos acima, adotar (??) signi�ca dizer que qualquer transformação (ouquantidade) que comute com o transporte paralelo, no sentido (89), terá derivada covariantenula.Seguindo um caminho análogo ao desenvolvido para estudar a derivada covariante de um vetor contravari-

ante, podemos escrever

D�A� =@A�@u�

+ ~� ��A ;

onde a quantidade ~� é, certamente, diferente da � obtida anteriormente. Ou seja, se seguirmos o desenvolvi-

mento anterior, obteremos uma lei de transformação diferente para esta quantidade. Além disso, através

das suposições feitas até aqui, nada nos permite relacionar esta quantidade com �. Entretanto, podemosestabelecer esta relação se adotarmos (ou exigirmos) que a nossa derivada obedeça a regra deLeibniz.Voltando a expressão para a derivada covariante de um vetor contravariante podemos escrever

D��g��A�

�=

@g��A�@u�

+ ��� g� A�

=@g��

@u�A� + g

�� @A�@u�

+ ��� g� A� ;

Onde usamos que a derivada usual respeita a regra de Leibniz.

Vamos agora adotar, ou impor, que a nossa derivada covariante obedece à regra Leibniz. Com isso

D��g��A�

�=

�D�g��

�A� + g

�� (D�A�)

=

�@g��

@u�+ ��� g

� + ��� g�

�A� + g

��

�@A�@u�

+ ~� ��A

g ���� A� + g��~� ��A = 0

167

Page 168: Parte A (Relatividade)

multiplicando por g�� temos

����A� = �~����A�

Esta expressão será válida para qualquer vetor covariante A� se

~���� = �����

Ou seja, a derivada covariante de um vetor covariante é dada por

D�A� =@A�@u�

� ����A�

o mesmo é válido para tensores somando os termos extras.

Vemos então que para trabalharmos em espaços curvo precisamos conhecer duas quantidades: a métrica

e a conexão. A métrica pode ser de�nida analisando-se a geometria da superfície (desenhado círculos e

triângulos) já a conexão é um ponto mais delicado. Voltaremos a este ponto no futuro.

6.5 Símbolo de Christo¤el

Se acreditarmos que a derivada covariante é realmente a diferença entre dois vetores e que o resultado desta

operação é um tensor, então devemos esperar que este tensor obtido não dependa de estarmos trabalhando

com as componente covariante ou contravariantes do vetor que estamos diferenciando.

D�A� = g��D�A� ; D�A� = g��D�A

� :

Mais especi�camente, derivar as componentes covariante de um vetor A e, em seguida, tomarmos as com-

ponentes contravariantes do resultado, deve ser equivalente a derivarmos diretamente as componentes con-

travariantes deste vetor

D�

�g��A

��= g��D�A

� :

Ou seja, a operação de derivação covariante comuta com a operação de levantamento e abaixamento de índices.

Como vimos na seção anterior, isso implica que esta operação comute com a noção de transporte paralelo.

De outra forma, podemos exigir que a noção de transporte paralelo introduzida (lembrando que até aqui só

sabemos desta quantidade a sua lei de transformação) preserve a característica geométrica da operação de

abaixamento de índices. Assim, as componentes covariante e contravariantes são apenas descrições diferentes

da mesma quantidade geometria que é o vetor (no espaço M). Esta característica, somada a exigência da

regra de Leibniz, nos permite obter novas características da conexão.

Lembrando agora o resultado da seção anterior (88) que garante que qualquer transformação que comute

transporte paralelo tenha derivada covariante nula, a exigência do parágrafo anterior garante que

D�g�� = D�g�� = 0 :

168

Page 169: Parte A (Relatividade)

Um transporte paralelo (ou uma conexão) que respeita esta igualdade é chama de compatível com a métrica.

Apesar de bastante intuitiva existem trabalhos em gravitação que usam conexões que não são compatíveis com

a métrica. Entretanto, grande parte das teorias, incluindo a de Einstein, utiliza apenas conexões compatíveis

com a métrica.

Para uma conexão compatível com a métrica

D�g�� = 0)@g��@u�

� ����g�� � ����g�� = 0

temos@g��@u�

= g������ + g���

��� (90)

Permutando os índices temos:

@g��@u�

= g������ + g���

���

@g��@u�

= g������ + g���

���

Somando as duas expressões acima e subtraindo (90) temos:

@g��@u�

+@g��@u�

� @g��@u�

= g��

����� + �

���

�+ g�� (�

��� � ����) + g��

����� � �

���

�(91)

Lembre agora que qualquer quantidade (tensor ou não) com dois (ou mais) índices, pode ser decomposto

numa parte simétrica e outra antí-simétrica nestes índices, por exemplo,

Mab = S(ab) +A[ab]

onde

Mab +Mba = 2S(ab) ) S(ab) =Mab +Mba

2

Mab �Mba = 2A[ab] ) A[ab] =Mab �Mba

2

Com isso, podemos escrever (91) como

@g��@u�

+@g��@u�

� @g��@u�

= g��

�2��(��)

�+ g��

�2��[��]

�+ g��

�2��[��]

�onde ��(��) é a parte simétrica da conexão e�

�[��] sua parte anti-simétrica. Observe agora que o lado esquerdo

169

Page 170: Parte A (Relatividade)

da expressão acima é simétrica em �; � e em �; �. Ou seja, a expressão acima só pode ser verdadeira se

g��

�2��[��]

�+ g��

�2��[��]

�= 0

com isso

g��

�2��(��)

�=@g��@u�

+@g��@u�

� @g��@u�

Ou multiplicando por g�� ,

��(��) =g��

2

�@g��@u�

+@g��@u�

� @g��@u�

�Ou seja, para conexões compatíveis com a métrica, a parte simétrica da conexão é completamentedeterminada se a métrica for conhecida. A quantidade ��(��) acima é conhecida como símbolo de Christo¤el.

A Teoria da Relatividade Geral, ou a Teoria de Einstein da Gravitação, impõe que a parte anti-simétrica

da conexão seja nula, i.e., � = 0. Uma teoria mais geral, chamada de Einstein-Cartan, relaxa esta condição.

A parte antisimétrica da conexão é também chamada de torção. Além disso, como observado anteriormente,

a parte antisimétrica da conexão se transforma como um tensor, i.e., a torção é um tensor.Observe que este tensor introduz diferenças, não apenas quantitativas, mas conceituais na teoria da

relatividade. Uma característica das nossas transformações serem difeomor�smo é que isso garante que, para

todo ponto X do espaço, existe uma transformação x-x que leva a métrica na forma

g�� (X) = ���

. Além disso, o princípio da equivalência garante que um observador que para um observador caindo livre-

mente no campo gravitacional a métrica é plana. Ou seja, existe um sistema de coordenadas onde, não apenas

a métrica tem a forma acima, mas também ela é constante em toda vizinhança (que pode ser tão pequena

quanto se queira) deste ponto. Assim, existe um sistema de coordenadas (ou um referencial) onde :�@g��@x�

�X

= 0) ��(��) (X) = 0

logo, se consideramos que a torção é nula, neste ponto X

D� = @�

Isso garante que, para o referencial que cai livremente, as leis da relatividade geral sejam iguais as da restrita.

Entretanto, sendo a parte anti-simétrica da conexão um tensor, temos que, se

��[��] = 0

170

Page 171: Parte A (Relatividade)

então ~��[��] = 0 para qualquer outro sistema de coordenada. Da mesma forma, se

��[��] 6= 0

não existe nenhum sistema de coordenadas para o qual ~��[��] = 0 e, desta forma, a derivadacovariante não se reduz a usual e, se alguma equação do nosso sistema depender da derivada covariante,não teremos mais a equivalência entre a relatividade restrita e geral.Alguns resultado de TQC indicam que a torção estaria relacionada com o spin das partículas. Ou seja,

assim como a massa curva o espaço, o spin das partículas o torce. Muitos trabalhos atualmente desenvolvem

teorias com torção. Em especial, estudos de certas características da torção podem fornecer modi�cações da

Teoria de Einstein capazes de explicar certas discrepâncias observacionais (e.g., coisas escuras). O estudo da

conexão é praticamente um ramo da Física.

Remark 83 Usar o símbolo de Christo¤el é exigir que a noção de derivada covariante respeite a regra deLeibniz e que a conexão seja compatível com a métrica.

7 A geometria da relatividade

Pelas discussões anteriores temos que os efeitos dos campos gravitacionais podem ser descritos modi�cando a

geometria do espaço de Minkowski para uma geometria não-euclidiana. Além disso, o ferramental matemático

necessário para se tratar problemas deste tipo é dado pela geometria de Riemann. Neste formalismo, o de-

senvolvimento é feito através da determinação da métrica e da conexão, ou, no caso da Relatividade Geral,

apenas da métrica. Esta, por sua vez, no caso de superfícies imersas (e.g., terrenos) pode ser determinada

através da medida de partes da superfície (e.g., triângulos).Entretanto, observe que para efetuar estas me-

didas estamos supondo que os instrumentos (réguas e transferidores) não sofrem da deformação do terreno.

Entretanto, no caso da relatividade todos os instrumentos de medida (réguas e relógios) se deformam junto

com a geometria. Assim, neste caso, a determinação da métrica requer um pouco mais de cuidado. Mas

vamos ver como isso é feito.

Continuando, os efeitos da relatividade restrita (mais especi�camente os efeitos das transformações de

Lorentz) podem ser descritas geometricamente através de um espaço com uma métrica

��� =

0BBBB@�1 0 0 0

0 1 0 0

0 0 1 0

0 0 0 1

1CCCCAPela semelhança com a métrica euclidiana vamos chamar está de a métrica do espaço plano. Já os efeitos dos

campos gravitacionais (ou acelerações) exigem que, se quisermos manter a descrição geométrica, tenhamos de

171

Page 172: Parte A (Relatividade)

lidar com uma geometria não euclidiana, ou seja, que o espaço que descreverá estes efeitos seja curvo. Assim,

os efeitos dos campos gravitacionais podem ser introduzidos nas características do espaço-tempo se, ao invés

da métrica plana ��� , usarmos a métrica mais geral g�� . Lembre que, na verdade, � é uma pseudo-métrica,

mas isso não introduz nenhuma di�culdade neste processo. Esta modi�cação implica que o produto escalar

e, conseqüentemente, o processo de levantamento e abaixamento de índices seja feito usando g e não mais �.

Não estamos dizendo que � é a métrica de um espaço plano de dimensão maior, mas apenas a métrica

do espaço que queremos analisar. Ou seja, dizer que nosso espaço tem métrica � signi�ca que qualquer

desenho que façamos no nosso espaço será euclidiano. Se isso não for verdade, então devemos usar algum

g no lugar de �, mas g e � descrevem espaços de mesma dimensão, i.e., o nosso espaço quadridimensional.

Mas, como dissemos antes, queremos desenvolver toda a nossa teoria apenas analisando as características do

nosso espaço, mesmo que a noção geométrica de curvatura implique na existência de um espaço de dimensão

maior. Para nós este espaço maior não é físico. Além disso, vamos chamar as coordenadas do nosso espaço

de x e não de u, como �zemos antes. Ou seja, x são as coordenadas do nosso espaço que pode ser curvo.

Sendo a métrica um tensor, por uma mudança no sistema de coordenadas x ! ~x, esta se transforma

como:

x! ~x : ~g�� =�M�1��

�M�1��

�g�� ; M

�� =

@~x�

@x�:

Se invocarmos agora novamente o princípio da correspondência temos que, mesmo na presença de um

campo existe um referencial (acelerado) que não sente a presença deste campo. Assim, se você está num

container que cai sob a ação do campo da terra nenhum experimento dentro do seu container sofrerá a

in�uência deste campo (desprezando efeitos de maré). Assim, seu espaço se comportará como se valessem

as leis da relatividade restrita num referencial inercial. Ou seja, se você marcou nas paredes do container

o sistema de coordenadas�~x1; ~x2; ~x3

�e usa o seu relógio para registrar o tempo ~t, neste ser sistemas de

coordenadas�~x0; ~x1; ~x2; ~x3

�a métrica será

~g�� = ��� =

0BBBB@�1 0 0 0

0 1 0 0

0 0 1 0

0 0 0 1

1CCCCA :

Obviamente as suas coordenadas podem ser relacionadas com as coordenadas de alguém parado na terra

(que sente o campo) através de uma transformação

�x0; x1; x2; x3

�!�~x0; ~x1; ~x2; ~x3

�que envolve acelerações. Assim, os efeitos do campo gravitacional, para a pessoa que está na terra pode

172

Page 173: Parte A (Relatividade)

ser feito usando a métrica

��� =�M�1��

�M�1��

�g�� ; M

�� =

@~x�

@x�

ou, invertendo a relação,

g�� (x) =M��M

����� ; (92)

Ou seja, g�� pode ser determinada estudando as derivadas @~x�=@x�, ou, de forma equivalente, estudando

a queda de corpos nos campos gravitacionais.

Observe que, diferente de antes, agora tanto o observador na terra, quanto o observador no container

podem usar as leis da física, desde que o primeiro use g e o segundo use �. Ou seja, as leis da física não são

válidas mais apenas em referenciais inerciais, mais em qualquer referencial (desde que este seja capaz dedeterminar a métrica do seu referencial). Assim, apesar de mantermos a noção de referenciais inerciais (são

aqueles onde a métrica é plana) a aplicação das leis foi generalizada para qualquer observador. Assim, as

transformações permitidas para o nosso sistema de coordenadas não são mais apenas as transformações de

Lorentz, mas qualquer transformação inversível diferenciáveis cuja inversa seja também diferenciável, ou os

difeomor�smos. Estas transformações também formam um grupo bem maior que o grupo de Lorentz. Todas

estas generalizações permitem chamarmos esta nova teoria de Teoria da Relatividade Geral.

7.1 Equação da geodésica

Entretanto, como mencionado acima, o fato de todos os instrumentos sofrerem a deformação da geometria

torna tudo um pouco mais difícil. Se observamos um relógio que cai podemos certamente determinar a sua

posição e ler diretamente neste relógio o tempo do outro referencial. Mas gostaríamos muito de não estudar

apenas a queda de relógios. Além disso, lembrando a nossa de�nição de �ler o relógio de outro referencial�

em relatividade restrita, esta determinação depende de um conjunto de observadores espalhados por todo o

espaço. Ou seja, no exemplo anterior de um corpo que cai sob a ação do campo, como conhecer o tempo

do corpo, ou melhor, o tempo de um referencial que viaja junto com corpo. Aqui a noção anteriormente

introduzida de tempo próprio é bastante útil. Lembrando que para aplicar esta noção precisamos apenas

medir o tempo a partir de um referencial inercial. Pelo que foi dito anteriormente, o referencial (ou corpo)

que cai livremente no campo gravitacional possui a métrica � do espaço plano e, conseqüentemente, é um

referencial inercial. Podemos então escolher o tempo deste referencial para registrar o tempo dos fenômenos.

Assim, sendo ~t a medida de tempo deste referencial, fazemos

� = ~t :

173

Page 174: Parte A (Relatividade)

Além disso, o intervalo de tempo dt registrado por qualquer observador para quem o corpo em queda livre

se move com velocidade u se relaciona com o invariante d� com

d� = dt

r1� u2

c2:

Uma vez que, num container que cai livremente, nenhuma força gravitacional pode ser detectada, uma

partícula solta dentre deste container obedece a equação:

d2~x�

d�2= 0

onded~x�

d�=@~x�

@x�dx�

d�) d

d�

�@~x�

@x�dx�

d�

�=

�d

d�

@~x�

@x�

�dx�

d�+@~x�

@x�d2x�

d�2;

observando que

@~x�

@x�= f (~x)) df

d�=

@f

@x�dx�

d�=

@2~x�

@x�@x�dx�

d�) d

d�

@~x�

@x�=

@2~x�

@x�@x�dx�

d�;

podemos escrever@2~x�

@x�@x�dx�

d�

dx�

d�+@~x�

@x�d2x�

d�2= 0

multiplicando por @x�=@~x� temos

@x�

@~x�@2~x�

@x�@x�dx�

d�

dx�

d�+d2x�

d�2= 0 (93)

Lembrando da relação (92) entre g e �

g�� (x) =@~x�

@x�@~x�

@x���� ;

podemos calcular (onde estamos usando o fato da métrica ser plana em tida uma vizinhança, i.e., estamos

usando o Princípio da Equivalência)

@g��@x�

= ���

�@2~x�

@x�@x�@~x�

@x�+@~x�

@x�@2~x�

@x�@x�

�Usando a relação inversa

��� =@x�

@~x�@x�

@~x�g�� (x)

174

Page 175: Parte A (Relatividade)

temos

@g��@x�

= g��@x�

@~x�@x�

@~x�

�@2~x�

@x�@x�@~x�

@x�+@~x�

@x�@2~x�

@x�@x�

�= g��

�@x�

@~x�@2~x�

@x�@x�@x�

@~x�@~x�

@x�+@x�

@~x�@x�

@~x�@~x�

@x�@2~x�

@x�@x�

�Usando

@

@x�=@~x�

@x�@

@~x�) @~x�

@x�@x�

@~x�=@x�

@x�= ���

temos

@g��@x�

= g��@x�

@~x�@2~x�

@x�@x���� + g��

@x�

@~x����

@2~x�

@x�@x�

= g��@x�

@~x�@2~x�

@x�@x�+ g��

@x�

@~x�@2~x�

@x�@x�

Permutando os índices podemos calcular

@g��@x�

+@g��@x�

� @g��@x�

= 2g��@x�

@~x�@2~x�

@x�@x�

multiplicando por g��=2 temos

g��

2

�@g��@x�

+@g��@x�

� @g��@x�

�=@x�

@~x�@2~x�

@x�@x�= ��(��)

com isso a equação (93) se torna

��(��)dx�

d�

dx�

d�+d2x�

d�2= 0 :

Esta equação descreve a trajetória que um ponto (uma massa pontual) em queda livre num campo

gravitacional descreve, quando vista por um observador �xo (ou não em queda livre) que usa o sistema de

coordenadas (não inercial) (x). Observe que, pela simetria de dx�dx� a, podemos também escrever

h��(��) + �

�[��]

i dx�d�

dx�

d�+d2x�

d�2= ����

dx�

d�

dx�

d�+d2x�

d�2= 0

ou seja, podemos usar a conexão e não apenas a sua parte simétrica. Vemos então que a parteanti-simétrica da conexão (ou a torção) não in�uencia na equação da trajetória de uma partícula livre (que

está num referencial inercial), ou na equação da geodésica.

A expressão acima é bastante conhecida em geometria diferencial e descreve a trajetória que uma partícula

faz num espaço curvo quando esta segue a menor distância entre dois pontos. Esta é a chamada equação

da geodésica. Ou seja, um corpo que cai livremente num campo gravitacional (ou o deslocamento de um

175

Page 176: Parte A (Relatividade)

referencial inercial qualquer) se dará de forma que este corpo percorra a menor �distância� (ds ou d�) no

espaço-tempo. Ou seja, o campo gravitacional do sol curva o espaço-tempo e a trajetória dos planetas, ou

cometas, é a menor distância possível para se deslocar neste espaço curvo. Obviamente, se nos limitarmos

apenas nas coordenadas espaciais, isso não faz sentido.

Consideremos o caso de uma partícula que se move com uma velocidade não muito grande num campo

gravitacional bem fraco e estacionário. Sendo a velocidade da partícula pequena temos

dxi

d�=

dxi

dtq1� u2

c2

' dxi

dt= ui

dx0

d�= c

dt

dtq1� u2

c2

=cq1� u2

c2

' c ;

e a condição c >> u implica

c >> u) dx0

d�>>

dxi

d�:

Com isso,

��(��)dx�

d�

dx�

d�+d2x�

d�2= ��(00)

dx0

d�

dx0

d�+ ��(ij)

dxi

d�

dxj

d�' ��(00)

�dx0

d�

�2e a equação da geodésica se torna (até ordem de (u=c)2)

d2x�

d�2+ c2��00

�dt

d�

�2= 0

Como o campo é estacionário as componentes de g não variam com o tempo

��(00) =g��

2

�@g��@x0

+@g��@x0

� @g00@x�

�= �g

��

2

@g00@x�

:

Além disso, como o campo é fraco, podemos dizer que a métrica não é muito diferente da métrica do espaço

plano

g�� = ��� + h�� ; jh�� j << 1 ;

assim, em primeira ordem em h temos

��(00) = ����

2

@h00@x�

voltando a equação da geodésicad2x�

d�2� c2 �

��

2

@h00@x�

�dt

d�

�2= 0

176

Page 177: Parte A (Relatividade)

temos

d2xi

d�2= c2

��i

2

@h00@x�

�dt

d�

�2= c2

��0i

2

@h00@x0

+�ji

2

@h00@xj

��dt

d�

�2d2xi

d�2= c2

"�ji

2

@h00@xj

#�dt

d�

�2=) d2xi

d�2= c2

�1

2

@h00@xi

��dt

d�

�2d2x

d�2=

c2

2[rh00]

�dt

d�

�2e

d2x0

d�2= c2

��0

2

@h00@x�

�dt

d�

�2= c2

��00

2

@h00@x0

+�i0

2

@h00@xi

��dt

d�

�2= �c2

�1

2

@h00@x0

��dt

d�

�2= 0 =) c2

d2t

d�2= 0 =) dt

d�= C

Com issod2x

d�2=c2

2[rh00]

�dt

d�

�2=c2

2[rh00]C2 =)

1

C2d2x

d�2= c2

1

2[rh00]

onde

dx

d�=

dx

dt

dt

d�d

d�

dx

d�=

��d

d�

dx

dt

�dt

d�+dx

dt

�d2t

d�2

��=

�d

d�

dx

dt

�dt

d�=

�dt

d�

d

dt

dx

dt

�dt

d�

=

�d2x

dt2

��dt

d�

�2=

�d2x

dt2

�C2

temosd2x

dt2= c2

1

2[rh00] :

Se imaginarmos que para as condições impostas os efeitos relativísticos possam ser desprezados, podemos

usar a equação de Newtond2x

dt2= �r�

onde

� (r) = �GMr

é o potencial gravitacional, para escrever:

h00 = 2�

c) g00 = �

�1 + 2

� (r)

c

177

Page 178: Parte A (Relatividade)

Estas expressões mostram as relações entre as teorias de Einstein e de Newton para o caso de campos fracos.

Mais ainda, mostram como as trajetórias das partículas (e algumas considerações físicas) podem ser usadas

para determinar as componentes da métrica.

Considere um observador (qualquer) com um relógio. Para este observador as coordenadas do relógio

(parado no seu pulso) obedece

d�2 = �g��dx�dx� = ��g00dx

0dx0 + gijdxidxj

�= �

�g00dx

0dx0�

Se, visto pelo observador que usa as coordenadas x este relógio cai com velocidade

dx

dt= u

temos

d�

dt=

s��g00

dx0

dt

dx0

dt

�= cp�g00

dt =1

cp�g00

d�

Lembrando que d� é o tempo (próprio) medido por um observador inercial. Esta é a razão entre o tempo

quando medido por um observador inercial (que cai com o campo, ou fora do alcance dele).

Obviamente a dilatação temporal acima afetará todos os relógios colocados no campo. De sorte que este

efeito não pode ser veri�cado diretamente. Entretanto, para dois relógios em posições x1 e x2 do campo

temos

dt1 =1

cp�g00 (x1)

d�

dt2 =1

cp�g00 (x2)

d�

Em especial, se estes tempos se relacionam com a freqüência de fótons emitidos nos pontos 1 e 2 temos:

�2�1=dt1dt2

=

sg00 (x2)

g00 (x1)

Para a aproximação da seção anterior temos

g00 = ��1 + 2

c

�)

sg00 (x2)

g00 (x1)=

s1 + 2

c� (x2)

1 + 2c� (x1)

178

Page 179: Parte A (Relatividade)

para � << c r1 +

2

c� (x2) = 1 +

� (x2)

c

1q1 + 2

c� (x1)= 1� � (x1)

c

s1 + 2

c� (x2)

1 + 2c� (x1)

' 1 + � (x2)

c� � (x1)

c

Fazendo

�1 = (�1 � �2) + �2 =���

�2+ 1

��2 )

�1�2=

���

�2+ 1

�temos �

��

�2+ 1

�= 1 +

� (x2)

c� � (x1)

c) ��

�=1

c[� (x2)� � (x1)]

onde, pelas condições impostas, estamos fazendo �2 = �. Este é o red shift gravitacional. Por exemplo,

usando dados reais (veja o livro do Weinberg) podemos calcular que o red shift entre fótons emitidos na

superfície do sol, chegam a terra com um red shift de

��

�' 2:12� 10�6 :

Este efeito é bem menor que as variações produzidas pelo efeito Doppler do movimento da terra em relação

ao sol.

7.2 Tensor de energia e momento

Voltemos um instante para a distribuição de cargas e correntes em espaços planos. Dado um conjunto de

cargas, podemos de�nir a densidade de carga e corrente como

J0 = cXn

�n (x; t) = cXn

qn�3 (x� xn (t))

J i =Xn

�n (x; t)ui =

Xn

qn�3 (x� xn (t))

dxndt

179

Page 180: Parte A (Relatividade)

Estas quantidades formam o 4-vetor:

J� =Xn

�n (x; t)u� (t) =

Xn

qn�3 (x� xn (t))

dx�ndt

=Xn

Zdt0 qn�

3 (x� xn (t)) � (t� t0)dx�n (t

0)

dt0

=Xn

Zqn�

3 (x� xn (t)) � (t� t0) dx�n (t0)

=Xn

Zd� qn�

4 (x� xn (t))dx�n (�)

d�

Da mesma forma, dada um conjunto de partículas com 4-momento p�, podemos de�nir a densidade de

partículas e a corrente de partículas como

T�0 = cXn

p�n�3 (x� xn (t))

T�i =Xn

p�n�3 (x� xn (t))

dxindt

T�� =Xn

p�n�3 (x� xn (t))

dx�ndt

=Xn

Zd� p�n�

4 (x� xn (t))dx�nd�

Que, obviamente, se transforma como um tensor simétrico duas vezes contravariânte.

Lembrando agora a expressão (49) para o quadrimomento temos

p0 =E

c; pi =

E

c2dxi

dt

que pode ser escrita como

p� =E

c2dx�

dt) dx�

dt= c2

p�

E

Com isso,

T�� =Xn

p�np�n

En� (x� xn (t)) c2

180

Page 181: Parte A (Relatividade)

Podemos calcular

@T�i

@xi=

@

@xi

Xn

p�n (t) �3 (x� xn (t))

dxin (t)

dt

=Xn

p�ndxindt

@

@xi�3 (x� xn (t))

= �Xn

p�ndxindt

@

@xin�3 (x� xn (t))

= �Xn

p�n@

@t�3 (x� xn (t))

Usando

@

@t

�p�n�

3 (x� xn (t))�=

@p�n@t

�3 (x� xn (t)) + p�n@

@t�3 (x� xn (t))

p�n@

@t�3 (x� xn (t)) =

@

@t

�p�n�

3 (x� xn (t))�� dp�n

dt�3 (x� xn (t))

temos

@T�i

@xi= �

("@

@t

Xn

p�n�3 (x� xn (t))�

Xn

dp�ndt

�3 (x� xn (t))#)

= �"@

@t

T�0

c�Xn

dp�ndt

�3 (x� xn (t))#

@T�i

@xi+@T�0

@x0=

Xn

dp�ndt

�3 (x� xn (t)) = G�

@T��

@x�=

Xn

dp�ndt

�3 (x� xn (t)) = G�

@T��

@x�= G�

onde G� é a densidade de força do sistema. Em particular, para um sistema livre

@T��

@x�= G� = 0

esta quantidade se conserva. Além disso, para o caso do choque entre partículas, onde a interação ocorre

apenas pelo contato das partículas, temos:

@T��

@x�=Xn

dp�ndt

�3 (x� xn (t))

181

Page 182: Parte A (Relatividade)

Se um conjunto m de partículas colide no mesmo ponto c temos �3 (x� xn (t)) = �3 (x� xc (t)) para todasestas partículas. Assim, para estas partículas

@T��

@x�= �3 (x� xc (t))

Xm

dp�mdt

= �3 (x� xc (t))d

dt

Xm

p�m

e se mais partículas colidem em outros pontos

@T��

@x�=Xc

�3 (x� xc (t))d

dt

Xm

p�m

O ponto é que a conservação do momento garante que, neste caso, também tenhamos

d

dt

Xm

p�m = 0)@T��

@x�= 0 :

Vejamos agora o que ocorre quando estas partículas possuem cargas e estão sujeitas a campos eletromag-

néticos. Neste caso

F� = qndx�n (t)

dtF��

dp�ndt

= qndx�n (t)

dtF��

@T��

@x�=

Xn

qndx�n (t)

dtF� ��

3 (x� xn (t))

=Xn

Zd� qn

dx�n (t)

d�F� ��

4 (x� xn (t))

= F� �

Xn

Zd� qn

dx�n (t)

d��4 (x� xn (t))

onde F� � = ���F�� . Usando

J� =Xn

Zd� qn�

4 (x� xn (t))dx�n (�)

d�

@T��

@x�= F� �J

� 6= 0 :

Ou seja, na presença do campo eletromagnético T�� não mais se conserva. Isso está relacionado com o fato do

sistema de partículas não mais conservar energia e momento, pois estas quantidades podem ser alimentadas

pelo campo eletromagnético. Podemos de�nir uma nova quantidade conservada se levarmos em conta o

182

Page 183: Parte A (Relatividade)

momento e a energia do campo. Ou seja, adicionando ao nosso T�� original o tensor

T��em � F� F� � 1

4g��F� F

pois@T��em@x�

= �F� �J� (94)

e, conseqüentemente,@

@x�(T�� + T��em ) = F� �J

� � F� �J� = 0 :

Exercise 84 Obtenha a igualdade (94).

Abrindo os termos de T��em vemos que:

T 00em =1

2

�E2 +B2

�; T i0em = "ijkEjBk

Que são quantidades conhecidas no eletromagnetismo como a densidade de energia e de momento,respectivamente, do campo eletromagnético.

Ou seja, para qualquer processo mecânico ou eletromagnético a quantidade

T�� =Xn

p�np�n

En� (x� xn (t)) c2 + T��em

=Xn

p�np�n

En� (x� xn (t)) c2 + F� F

� � 14���F� F

� (95)

gera uma corrente conservada G�@T��

@x�= G� = 0 :

As componentes deste tensor são as densidades de energia e de momento do sistema. Por isso ele é chamado

tensor de energia e momento.

Todos os resultados acima podem ser diretamente �traduzidos�para a linguagem da relatividade geral.

Para tanto, basta trocar ��� por g�� e todas as derivadas @� (para manterem seu caráter vetorial) por

derivadas covariantes D�

T�� =Xn

p�np�n

En� (x� xn (t)) c2 + g �F��F � �

1

4g��F� F

D�T�� = G� = 0 :

Este procedimento, legítimo em todas as teorias sem torção (como a relatividade Geral de Einstein), é

chamado de acoplamento mínimo.

183

Page 184: Parte A (Relatividade)

Exercise 85 Mostre que, para teorias sem torção,

@�A� � @�A� = D�A� �D�A�

ou seja, podemos de�nir o tensor do campo eletromagnético usando a derivada covariante ou a normal.

7.3 Equações de Einstein

A lei da gravitação não pode ser deduzida de argumentos matemáticos, mas, assim como fez Newton, deve

ser proposta e testada experimentalmente. Assim, o que vamos fazer aqui não é deduzir a lei da gravitação

proposta por Einstein, mas apenas salientar caminhos e chutes que possam conduzir a esta lei.

O princípio da equivalência garante que qualquer referência que caia livremente no campo gravitacional

será um referencial inercial. Mais especi�camente, neste referencial a métrica será �. Uma outra forma de

colocar esta a�rmação é dizer que: para qualquer campo gravitacional, existe um sistema de coordenadas em

que num dado ponto X do espaço-tempo a métrica é plana:

g�� (X) = ����@g��@x�

�X

= 0

Ou seja, para um observador qualquer com sistema de coordenadas �x existe uma transformaçãoM : �x! x

que leva a métrica na forma acima num ponto X.

Observe que esta relação só é válida num ponto (ou, no máximo, numa região próxima de) X. Se fosse

possível encontrar um sistema de coordenadas em que isso fosse válido para todo o espaço, então nossa

métrica seria plana e, conseqüentemente, não haveria campo gravitacional. Observe que, mesmo para um

observado que caia livremente no campo, os efeitos de maré impedem que um único sistema de coordenadas

seja estabelecido em todo espaço. E apenas região muito pequena do espaço (menor quanto mais forte o

campo) se comportará como inercial.

Para um observador neste sistema de coordenadas o campo gravitacional pode ser muito fraco nas vizin-

hanças do ponto X (e nulo neste ponto). Assim, para este observador, podemos usar a aproximação anterior

obtida para campos gravitacionais fracos. Podemos obter o resultado geral lembrando que este sistema de

coordenadas está ligado aos demais por difeomor�smos. Ou seja, basta usarmos a transformação inversa

M�1 e teremos o resultado para um observador arbitrário.

Para um campo gravitacional fraco, gerado por uma densidade não relativística (estática) de massa �

temos

g00 ' ��1 + 2

c

�Onde � é o potencial gravitacional Newtoniano. Da mecânica clássica, sabemos que, dada a distribuída de

184

Page 185: Parte A (Relatividade)

matéria �, este potencial pode ser determinado resolvendo a equação de Poisson

r2� = 4�G�

Como para uma partícula não relativística a energia de repouso é muito maior que a energia cinética, podemos

escrever:

T 00 = cXn

p0n�3 (x� xn (t)) =

Xn

En�3 (x� xn (t))

' c2Xn

mn�3 (x� xn (t)) = c2� (x)

Combinando as duas expressões acima temos

r2� = 4�G�) r2��12c (g00 + 1)

�= r2g00 = �8�G

T00c3

(96)

Esta equação é válida apenas no sistema de coordenadas especí�co e, certamente, não é a equação covariante

que procuramos, pois esta equação deve envolver tensores em ambos os lados. Da expressão acima, podemos

adivinhar que o tensor do lado esquerdo da expressão desejada é T�� . Assim, a expressão procurada tem a

forma

[@i@ig]�� = �8�GT��c3

Onde o lado esquerdo é apenas um símbolo para indicar um tensor que depende de segundas derivadas da

métrica. Um chute imediato seria substituir as derivadas por derivadas covariantes, mas a compatibilidade

com a métrica faria este termo se anular.

No lugar do símbolo acima, vamos chamar este tensor de

G�� = [@i@ig]��

Por uma transformação no sistema de coordenadas G�� se transforma como

~G�� =�M�1��

�M�1��

�G�� ;

onde devemos lembrar que G�� depende das derivadas da métrica e estas derivadas (@i@i) também se trans-

formarão, o que implica que teremos uma combinação linear de derivadas da métrica com termos até segunda

ordem.

Assim, a equação procurada tem a forma

G�� = �8�G

c3T�� ; (97)

185

Page 186: Parte A (Relatividade)

onde G�� envolve apenas termos de termos de ordem 2 da métrica.Além disso, G�� deve ser simétrico (pois T�� é simétrico) e deve obedecer a equação

D�G�� = �8�G

c3D�T

�� = 0

Primeiramente, lembrando do símbolo de Christo¤el

��(��) =g��

2

�@g��@u�

+@g��@u�

� @g��@u�

�;

vemos que a quantidade desejada pode ser construída com produtos de ��(��) e derivadas desta quantidade.

Entretanto, como ��(��) não se transforma como uma tensor, devemos nos perguntar: que combinaçõesdestes produtos e derivadas obedecem a lei de transformação de um tensor?Um resultado da geometria riemannianna 32 mostra que existe apenas uma combinação de ��(��) e suas

derivadas que fornecem uma quantidade que depende apenas da métrica, e suas derivadas primeiras e segun-

das, e é linear nas segundas derivadas. Esta quantidade tem a forma:

@��(��)

@x��@��(��)

@x�+ ��(��)�

�(��) � �

�(��)�

�(��) � R� ��� = g��R����

Ou seja, qualquer outra combinação de ��(��) e suas derivadas que tentemos adicionar a esta quantidade ouincluirá derivadas de ordem mais alta, ou termos não lineares na segunda derivada ou destruiráa lei de transformação tensorial. A prova de que a quantidade acima é realmente um tensor não é uma

tarefa algebricamente simples, mas exige apenas a utilização das leis de transformação de � e que @� se

transforma como um tensor covariante (para isso, basta usar a regra da cadeia). O tensor R� ��� é chamado

de tensor de curvatura. Multiplicando ambos os lados da expressão acima por g�� e usando a forma explicita

do símbolo de Christo¤el temos:

R���� =1

2

�@2g��@x�@x�

� @2g��@x�@x�

� @2g��@x�@x�

+@2g��@x�@x�

�+ g��

h��(��)�

�(��) � �

�(��)�

�(��)

i(98)

Da forma acima é possível veri�car que este tensor é simétrico por uma troca do primeiro e terceiro e do

segundo e quarto índice

R���� = R����

Isso garante que o tensor formado pela contração primeiro com o segundo índice seja simétrico nos índices

restantes:

g��R���� � R�� = R��

Este tensor é chamado tensor de Ricci.32O tensor de curvatura é o único tensor que pode ser construído da métrica e suas derivadas de primeira e segunda ordem e

é linear nas derivadas de segunda ordem (veja Weinberg).

186

Page 187: Parte A (Relatividade)

Além disso, da expressão (98) temos também a seguinte relação de antisimetria

R���� = �R���� = �R���� = R���� ;

que mostra que qualquer outra contração que tentamos fazer com este tensor é nula ou igual ao tensor de

Ricci.

Com isso, uma boa tentativa para a nossa equação da gravitação seria:

R�� = KT��

para alguma constante K. Entretanto, uma vez que, em geral,

D�R�� 6= 0 ;

a equação acima não respeita a lei de conservação de energia e momento, para uma con�guração arbitrária

do campo. Ou seja, precisamos de mais um tensor simétrico formado com a métrica e suas derivadas até

segunda ordem.

Dos resultados acima tempo ainda a possibilidade de contrair os dois índices (simétricos) do tensor de

Ricci e formar um tensor de ordem zero, ou um escalar,

g��R�� � R

este é o chamado escalar de curvatura. Assim, dado o escalar de curvatura (que, como o tensor de Ricci,

depende apenas da métrica e suas derivadas até segunda ordem) podemos também formar o tensor

g��R ;

que, obviamente, é simétrico e não envolve derivadas de ordem mais alta.

Resumindo, existem apenas dois tensores simétricos que podem ser construídos respeitando as condições

acima:

R�� ; g��R

Assim, o tensor G�� procurado deve ser uma combinação destes tensores

G�� = c1R�� + c2g��R

Vamos usar agora a condição de conservação de energia e momento

D�G�� = D� (c1R

�� + c2g��R) = 0 : (99)

187

Page 188: Parte A (Relatividade)

Para isso precisamos derivar o tensor de Ricci. Para calcular a derivada covariante precisamos usar

explicitamente o fato que estamos escolhendo um transporte paralelo sem torção

��� = ��(� )

Mostre que:

D�R���� =1

2

@

@x�

�@2g��@x�@x�

� @2g��@x�@x�

� @2g��@x�@x�

+@2g��@x�@x�

�E, permutando os índices

D�R���� +D�R���� +D�R���� = 0

Conhecida como identidades de Bianchi.

Usando as identidades de Bianchi e o fato da conexão ser compatível com a métrica podemos multiplicar

a expressão acima por g�� temos:

D�R�� �D�R�� + g��D�R���� = 0

multiplicando por g��

D�R� 2g��D�R�� = 0

���D�R� 2g��D�R�� = 0

D� [g��g��R� 2g��R��] = 0

�2g��D�

�R�� �

1

2g��R

�= 0

D�

�R�� �

1

2g��R

�= 0

Comparando com (99)

c1 = 1 ; c2 = �1

2

ou

G�� = R�� �1

2g��R

chamado tensor de Einstein. Voltando em (97)

R�� �1

2g��R = �

8�G

c3T�� ; (100)

Esta é a equação de Einstein para a gravitação.

188

Page 189: Parte A (Relatividade)

Para veri�car isso, primeiro multiplicamos a expressão acima por g��

R� 124R = �8�G

c3T ; T = T� �

R =8�G

c3T

substituindo novamente em (100):

R�� =8�G

c3

�1

2g��T � T��

�que nada mais é que a mesma forma de escrever a equação anterior. Da expressão acima, estamos interessados

no termo

R00 =8�G

c3

�1

2g00T � T00

�Lembrando agora que na nossa aproximação de campo fraco temos

g00 = �00 + h00 = �1 + h00 ; h00 << 1 :

E que, para campos fracos, ou um referencial que se move com o corpo no campo o único termo signi�cativo

é T00 (pois a energia de repouso é muito maior que a cinética), podemos fazer

T = g��T�� ' g00T

00 ' �T 00 = �T00

com isso

R00 =8�G

c3

�1

2g00T � T00

�' 8�G

c3

�1

2(�1) (�T00)� T00

�R00 ' �1

2

8�G

c3T00

Vamos agora avaliar

R00 = g��R�0�0 = R� 0�0

como, pela anti-simetria do tensor de curvatura R0 000 = 0, temos

R00 = Ri 0i0

Usando

Ri 0j0 = @0�ij0 � @j�i00 + �i0���j0 � �ij���00

podemos ver que, para o nosso sistema com campos fracos todos os termos da conexão são pequenos. Assim,

mantendo apenas termos de primeira ordem na conexão, podemos abandonar os últimos dois termos da

189

Page 190: Parte A (Relatividade)

expressão acima. Além disso, sendo nosso campo estático, @0�ij0 = 0,

Ri 0j0 ' �@j�i00 ) Ri 0i0 ' �@i�i00 = �@i�1

2gi� (@0g�0 + @0g0� � @�g00)

�para campos estáticos

Ri 0i0 = R00 ' @i

�1

2gij (@jg00)

�mantendo termos de primeira ordem em h��

R00 ' @i

�1

2�ij (@jg00)

�= @i

�1

2�ij (@jg00)

�=1

2r2g00

com somatória nos i, com isso

R00 ' �8�G

c31

2T00 ) r2g00 ' �

8�G

c3T00

Que concorda com a nossa expressão (96).

A equação de Einstein nos diz exatamente como a distribuição de energia (matéria mais radiação) in-

�uência na curvatura e, conseqüentemente, na geometria do universo. É desta equação que desenvolvemos a

(grande) maioria das teorias cosmológicas.

Esta equação é, obviamente, di�cílima de resolver. Entretanto, fazendo algumas suposições sobre a

simetria da métrica, e.g., homogêneo e isotrópica, é possível encontrar algumas soluções desta equação. Estas

soluções podem ser usadas, por exemplo, para calcular a deformação da geometria em torno de uma estrela

(o sol) e o conseqüente desvio de um sinal luminoso nesta geometria. Ou ainda a deformação na orbita dos

planetas comparada com a gravitação de Newton. Estes cálculos foram feitos e usados para con�rmar a

validade da teoria de Einstein.

Deforma geral, a aplicação desta equação exige considerações sobre a estrutura geral do universo (pressão

nula, distribuição rarefeita de matéria). Entretanto, nenhuma destas considerações parece estar de acordo

com as previsões em larga escala (cosmológicas) do nosso universo. Por isso, novas teorias estão sendo

analisados, com a proposta de novos tipos de matéria, teorias com torção etc. Esta discrepância entre a

teoria de Einstein e as observações cosmologias é, provavelmente, uma das novas �nuvens negras da física�.

A Noções de cálculo vetorial

A.1 Campo vetorial

Um campo vetorial num plano é uma função que a cada ponto deste plano associa um vetor. Tal campo pode

ser usado, por exemplo, para descrever o comportamento de um �uido, um campo eletromagnético etc. Em

190

Page 191: Parte A (Relatividade)

Figure 14: Figura 1

coordenadas cartesianas um campo F pode ser dado por suas componentes

F (x; y; x) = Fx (x; y; x) x+ Fy (x; y; x) y + Fz (x; y; x) z :

Por exemplo, campo

F = (3x� y) i+ (x+ 5y) j

que tem a forma

A.2 Fluxo

Um conceito importante no estudo da dinâmica de um �uido é o conceito de �uxo através de uma área.

Imagine um pequeno quadrado inserido dentro de um �uido. Obviamente o �uxo através deste quadrado

depende da orientação do quadrado. Se ele for colocado com a sua normal paralelo a velocidade o �uxo, i.e.,

a quantidade de �uído por unidade de tempo que atravessa este quadrado vale

� =1

dt(v:dt:a) = v:a

enquanto se ele for colocado perpendicular a velocidade do �uido não haverá �uxo. Este resultado pode ser

resumido como

� = F:a: cos � = F:a

Obsreve que o �uxo através de uma área é um escalar.

Imagine agora que você deseja calcular o �uxo através de uma superfície fechada (um balão). Para fazer

191

Page 192: Parte A (Relatividade)

isso podemos primeiro dividir esta superfície em vários quadradinhos e usar o conceito acima para calcular o

�uxo através de cada um destes quadrados. Como queremos saber se há �uido entrando ou saindo do balão,

damos um valor positivo para a normal de cada área que aponta para fora do balão e negativo para a que

aponta pra dentro. Chamamos isso de orientar as áreas.

Figura retirada do Simmons, Cálculo com Geometria Analítica

O �uxo total pelo balão será

� =Xi

F:�ai

No limite de ai ! 0, temos

� =

ZF:da

esta é uma integral de superfície de um campo vetorial F . Ou seja, a integral de superfície de F sobre uma

superfície S signi�ca apenas dividir S em pequenas partes, cada uma representada por um vetor orientado

para fora de S e tomar o produto escalar desta área com o valor de F no local.

A.3 Divergente

Nosso objetivo aqui é estudar características locais, ou pontuais, do nosso �uido. Em outras palavras,

queremos de�nir quantidades como as densidades dos corpos extensos (densidade de carga, de massa etc).

Para uma superfície qualquer �nita do nosso campo temos um �uxo, nosso objetivo aqui é obter um densidade

de �uxo, ou seja, um�uxo por unidade de volume. A partir desta quantidade, como no caso da densidadede massa, podemos tanto obter o �uxo de superfícies �nitas, quanto conhecer características locais do �uido.

Isso nos permitirá também caracterizar o movimento do �uído.

Imagine uma superfície qualquer S e o �uxo (Figura 3-a)

� =

ZS

F:da

Agora divida esta superfície em duas partes: S1 e S2 (Figura 3-b) teremos então dois �uxos

�i =

ZSi

F:da

192

Page 193: Parte A (Relatividade)

Figure 15: Figura 3 - Figura retirada do Curso de Física Berkeley �Vol.2 �Eletromagnetismo

O ponto importante aqui é que o �uxo pela interface entre as superfícies tem o mesmo valor e sinal contrário

(pois é orientado para fora de cada uma delas) de sorte que

� = �1 +�2

E isso é verdade para qualquer divisão que façamos da superfície. Vamos agora dividir esta superfície em

N superfície bem pequenas Si (Figura 3-c), pelo motivo descrito acima temos

NXi=1

ZSi

F:da =

ZS

F:da = �

Ou seja, a soma do �uxo por cada superfície do balão é igual ao �uxo total pelo balão (Figura 3-d).

Nosso interesse é identi�car alguma característica do �uido relacionado com o limite quando N cresce

enormemente. Observe que a integral

�i =

ZSi

F:da

não pode ser tomada como esta característica porque ela depende das divisões do volume, i.e., se dividirmos

o volume no meio �i também cai pela metade e, além disso, certamente �i ! 0 quando Si ! 0. Podemos

193

Page 194: Parte A (Relatividade)

entretanto obter uma quantidade �nita que não dependa do volume se tomarmosRSiF:da

Vi

onde Vi é o volume dentro da área Si. Uma vez que Vi ! 0 quando Si ! 0 a quantidade acima pode tender

a um valor �nito que, conseqüentemente, caracterizará o comportamento do �uido em torno de um ponto

qualquer. A quantidade acima, no limite de Vi ! 0 se chama o divergente do campo F

divF = limVi!0

1

Vi

ZSi

F:da

onde Si é uma superfície que envolve Vi.

Assim, o divergente de F é o �uxo que sai de Vi, por unidade de volume, para um volume in�nitesimal.´

O divergente é uma grandeza escalar que pode variar de ponto a ponto e seu valor num determinado

ponto (x; y; z) é a integral acima com o ponto no interior de Vi.

O divergente está relacionado com quanto de �uido entra (ou sai) de um volume, seja pela criação (ou

absorção) deste �uido, seja pela sua compressão.

A.3.1 Teorema de Gauss

Uma vez conhecido o divergente de uma função, podemos refazer o processo descrito acima, no sentido

inverso, e calcular o �uxo de F numa superfície �nita S

ZS

F:da =NXi=1

ZSi

F:da =NXi=1

�1

Vi

ZSi

F:da

�Vi

No limite Vi ! 0 temos

limVi!0

NXi=1

�1

Vi

ZSi

F:da

�:Vi =

ZV

divF dV

Com isso temos ZS

F:da =

ZV

divF dV

Este é o teorema da divergência.

Se o TD é válido para qualquer campo vetorial, certamente também é válido para o campo elétrico. Da

lei de Gauss (que é uma conseqüência da lei de Coulomb) temosZS

E:da =Q

"0=

ZV

"0dV

194

Page 195: Parte A (Relatividade)

Figure 16: Figua 4 - Figura retirada do Curso de Física Berkeley �Vol.2 �Eletromagnetismo

usando o TD temos ZS

E:da =

ZV

divE dV =

ZV

"0dV

O resultado acima tem de ser válido para qualquer volume. Isso só é possível se os integrandos forem iguais

em qualquer ponto

divE =�

"0

A.3.2 O divergente em coordenadas cartesianas

A de�nição acima independe de qualquer sistema de coordenadas. Entretanto, para efetivamente efetuamos

alguma conta, precisamos ter uma forma prática para determinar o divergente de algum campo F. Para isso

fazemos F = F (x; y; x) o que signi�ca que introduzimos algum sistema de coordenadas no espaço. Se este

sistema é cartesiano o campo vetorial F pode ser decomposto em 3 funções escalares:

F (x; y; x) = Fx (x; y; x) x+ Fy (x; y; x) y + Fz (x; y; x) z

Vamos calcular o �uxo desta função por um cubinho de ladp �x;�y;�z (Figura 4-a)

Para a face superior e inferior (Figura 4-b) temos os vetores �x�yz e �x�y (�z). Assim, quando �zemoso produto escalar de F com estas áreas, apenas a função Fz sobreviverá. Ou seja, o �uxo é a diferença entre

o valor médio (no ponto médio das superfícies) de Fz nas faces interiores e superiores. Em primeira ordem

de aproximação esta diferença vale@Fz@z

�z :

195

Page 196: Parte A (Relatividade)

O valor médio da função na face inferior vale (Figura 4-b)

Fz (x; y; x) +@Fz@x

�x

2+@Fz@y

�y

2:

Já o valor médio da função na face superior vale (Figura 4-b)

Fz (x; y; x) +@Fz@z

�z +@Fz@x

�x

2+@Fz@y

�y

2:

Assim, o �uxo na direção z vale�Fz (x; y; x) +

@Fz@z

�z +@Fz@x

�x

2+@Fz@y

�y

2

��x�y��

Fz (x; y; x) +@Fz@x

�x

2+@Fz@y

�y

2

��x�y

=@Fz@z

�z�x�y

Da mesma forma, os �uxos nas demais direções valem

@Fx@x

�z�x�y ;@Fy@y

�z�x�y

De sorte que o �uxo total vale

� =

�@Fx@x

+@Fy@y

+@Fz@z

��z�x�y

pela nossa de�nição de divergente temos

divF = limV!0

1

V� =

�@Fx@x

+@Fy@y

+@Fz@z

��z�x�y

V

=@Fx@x

+@Fy@y

+@Fz@z

Assim, em coordenadas cartesianas:

divF =@Fx@x

+@Fy@y

+@Fz@z

(101)

A.4 Integrais de linha

Um dos grandes interesses no estudo de problemas práticos é saber qual o trabalho realizado para se mover

neste campo vetorial. Por exemplo, queremos mover uma carga elétrica por um campo elétrico, ou uma

massa num campo gravitacional, ou ainda um barco por um rio.

196

Page 197: Parte A (Relatividade)

Em todos estes casos, o trabalho realizado será:

W =

ZC

F:dr (102)

onde F (x; y) = U (x; y) { + V (x; y) | é o campo vetorial (neste caso a força) e dr = {dx + |dy um elemento

de deslocamento na trajetória C. Em geral este trabalho depende, não apenas do caminho, mastambém do sentido que este caminho é seguido.Exemplo: Vamos calcular a integral de linha do campo (cujo grá�co é apresentado na Figura 1)

F = (3x� y) i+ (x+ 5y) j

sobre a circunferência unitária. Este caminho pode ser parametrizado como

x = cos!t ; y = sin!t ; t 2�0;2�

!

�onde ! está relacionado com a velocidade que percorremos a curva. Assim

W =

ZC

F:dr =

ZC

(U (x; y) dx+ V (x; y) dy)

x = x (t) ; y = y (t) =) dx =dx

dtdt ; dy =

dy

dtdt ;

W=

Z 2�!

0

�(3x� y) dx

dt+ (x+ 5y)

dy

dt

�dt

dx

dt= �! sin!t ; dy

dt= ! cos!t

W=

Z 2�!

0

((3 cos!t� sin!t) (�! sin!t) + (cos!t+ 5 sin!t) (! cos!t)) dt

= !

Z((�3 + 5) sin!t cos!t+ 1) dt = !

Z 2�!

0

(2 sin!t cos!t+ 1) dt

= !

2

Z 2�!

0

sin!t cos!tdt+2�

!

!= !

2

Z 2�!

0

1

2sin 2!t dt+

2�

!

!

= !

Z 2�!

0

sin 2!t dt+2�

!

!= !

� 1

2!cos 2!t

����2�=!0

+2�

!

!

= !

�2�

!

�= 2�:

Observe como o valor calculado não depende de !, a velocidade com que percorremos a curva.�

197

Page 198: Parte A (Relatividade)

Figure 17: Figura 5 -Figura retirada do Curso de Física Berkeley �Vol.2 �Eletromagnetismo

A.5 O rotacional de uma função

O divergente nos fala sobre o �uxo em torno de um ponto do �uido, o que, obviamente, está relacionado

com pontos onde surge ou desaparece �uido, i.e., fontes ou sorvedouros. Ou ainda pontos onde o �uido possa

ser comprimido. Entretanto, é possível que haja movimento num �uido mesmo que nenhum destes efeitos

ocorra. Por exemplo, você pode fazer circular um �uido num balde. Isso cria rodamoinhos no �uído.

Este tipo de movimento tem a característica de exigir que realizemos trabalho para mover um corpo

através de um circuito fechado do campo (ou do �uído). E pode ser medido através da integral

� =

ZC

F:ds

Esta quantidade é chamada circuitação (ou circulação) do campo.

Precisamos orientar o caminho. Fazemos isso exigindo que a parte interna �que sempre a nossa esquerda

(Figura 5-a).

Dado um circuito qualquer C (Figura 6-a) podemos dividi-lo em 2 partes C1 e C2 (Figura 6 -b). Uma

vez que a interface entre os dois caminhos é percorrida no sentido contrário (Figura 6-b) temos

�1 + �2 = �

O mesmo pode se obtido dividindo o circuito em N partes (Figura 6-c)

� =NXi=1

�i

Mais uma vez, estamos interessados numa quantidade característica do �uido, relacionado com seu compor-

198

Page 199: Parte A (Relatividade)

Figure 18: Figura 6 -Figura retirada do Curso de Física Berkeley �Vol.2 �Eletromagnetismo

Figure 19: Figura retirada do Simmons, Cálculo com Geometria Analítica

tamento em cada ponto. Novamente, esta quantidade não é a circuitação, pois, se ai é a área encerrada pelo

caminho Ci, temos Ci ! 0 quando ai ! 0. Mas, assim como no caso do divergente, podemos esperar uma

quantidade �nita fazendo�iai=

RCiF:ds

ai

Diferente do divergente a circuitação acima depende da orientação da normal da superfície in�nitesimal

Ci. Para uma circuitação in�nitesimal com área ai na direção n temos

(rotF ) n = limai!0

RCiF:ds

ain

Ou seja, se o circuito Ci tem uma área ai na direção x então estamos calculando a componente do rotacional

na direção x. A quantidade acima é chamada rotacional do �uido e mede a circuitação, por unidade de área,

em torno de um ponto do campo. O divergente é um vetor.Fisicamente o rotacional de um �uido poderia ser medido com um dispositivo como o da �gura abaixo:

199

Page 200: Parte A (Relatividade)

A.5.1 Teorema de Stokes

Partindo do rotacional podemos obter a circuitação de um contorno �nito C

� =

ZC

F:ds =NXi

ZCi

F:ds =NXi

�1

ai

ZCi

F:ds

�ai

Usando a de�nição de rotacional

limai!0

�1

ai

ZCi

F:ds

�= (rotF ) n

e, neste limite ZC

F:ds =

ZS

[(rotF) n] da

Ou, como n está na direção de a ZC

F:ds =

ZS

(rotF) da (103)

Este é o teorema de Stokes e relaciona a integral de linha do campo através de um circuito fechado com a

integral de área do rotacional.

Um ponto importante a se notas é que existem várias áreas diferentes que possuem a mesma fronteira

(como quando se esta sobrando uma bola de sabão). Então qual área selecionamos para aplicar o Teorema de

Stokes? Note, entretanto, que o lado esquerdo de (103) não depende de qual área escolhemos. Isso signi�ca

que o lado direito também não irá depender. Ou seja, para aplicar o Teorema de Stokes podemos usarqualquer área que tenha a curva como borda. O que nos permite anunciar o seguinte:

Corollary 86RS(rotF) da depende apenas da fronteira da superfície S e não da superfície em particular.

Do corolário acima, temos que se �zermos a borda da fronteira diminuir, de forma que C ! 0, o lado

esquerdo de (103) vai à zero. Com o que temos

Corollary 87 para qualquer superfície fechadaIS

(rotF) da = 0 : (104)

A.5.2 Lei de Ampère

Uma corrente induz um campo magnético B IC

B:dl = �0I

200

Page 201: Parte A (Relatividade)

Figure 20: Figura retirada do Curso de Física Berkeley �Vol.2 �Eletromagnetismo

onde I é toda a corrente que passa no interior do circuito C. Esta corrente pode ser escrita como

I =

ZS

J da

onde J é a densidade de corrente e S qualquer superfície limitada pela curva fechada C. Com issoIC

B:dl =

ZS

J da

Usando o teorema de Stokes IC

B:dl =

ZS

(rotB) da = �0

ZS

J da

Para qualquer curva C, o que só pode ser verdade se

rotB =�0J

Que é a lei de Ampère.

Um mecanismo para medir o rotacional de um campo eletromagnético poderia ter a seguinte forma:

A.5.3 Rotacional em coordenadas cartesianas

Novamente a de�nição acima, apesar de geral, é pouco prática para o cálculo do rotacional conhecendo-se

o campo. Vamos então obter uma expressão que permita determinar esta quantidade uma vez conhecida as

201

Page 202: Parte A (Relatividade)

Figure 21: Figura 7 - Figura retirada do Curso de Física Berkeley �Vol.2 �Eletromagnetismo

componentes cartesianas do campo.

Seja então F (x; y; z) = Fxx+Fyy+Fz z um campo de�nido num sistema cartesiano de unidades. Vamos

calcular a circuitação do campo F por um elemento quadrado de lado �x e �y.

Para isso, imaginando que os lados são in�nitesimais, podemos aproxima a integral de linha simplesmente

pelo produto (escalar) do valor do campo no meio do percurso pelo comprimento do percurso. Assim, para

os percursos horizontais temos Z�x

F:dl =Fx (xm; ym; zm)�x

Onde Fx (xm; ym; zm) é o valor do campo no meio do intervalo. Na parte inferior

Fax (xm; ym; zm) = Fx (x; y; z) +@Fx@x

�x

2Z�x

F:dl =

�Fx (x; y; z) +

@Fx@x

�x

2

��x

Enquanto na parte superior

Fbx (xm; ym; zm) = Fx (x; y; z) +@Fx@x

�x

2+@Fx@y

�y

2Z�x

F:dl = ��Fx (x; y; z) +

@Fx@x

�x

2+@Fx@y

�y

��x

onde o sinal de menos vem do fato do percurso ser feito na direção de �x (F:dl =Fx (�dx)).Para os ladosverticais temos Z

�y

F:dl =Fy (xm; ym; zm)�y

202

Page 203: Parte A (Relatividade)

Na parte esquerda

Fcy (xm; ym; zm) = Fy (x; y; z) +@Fy@y

�y

2Z�y

F:dl= ��Fy (x; y; z) +

@Fy@y

�y

2

��y

enquanto na direita

Fdy (xm; ym; zm) = Fy (x; y; z) +@Fy@y

�y

2+@Fx@x

�xZ�y

F:dl =

�Fy (x; y; z) +

@Fy@y

�y

2+@Fy@x

�x

2

��y

Com isso a nossa circuitação se tornaZC

F:dl=

�Fx (x; y; z) +

@Fx@x

�x

2

��x

��Fx (x; y; z) +

@Fx@x

�x

2+@Fx@y

�y

��x

��Fy (x; y; z) +

@Fy@y

�y

2

��y

+

�Fy (x; y; z) +

@Fy@y

�y

2+@Fy@x

�x

��y

=

�@Fy@x

� @Fx@y

��x�y

Tomando o limote

lima!0

RCF:ds

a= lim

�x;�y!0

h@Fy@x �

@Fx@y

i�x�y

�x�y=@Fy@x

� @Fx@y

Como obviamente a área �x�y aponta na direção z (Figura 7) esta é a componente z do rotacional

(rotF) z =�@Fy@x

� @Fx@y

�z

Efetuando o mesmo procedimento para os contornos da Figura 8 temos

(rotF) x =�@Fz@y

� @Fy@z

�x

(rotF) y =�@Fx@z

� @Fz@x

�y

203

Page 204: Parte A (Relatividade)

Figure 22: Figura 8 - Figura retirada do Curso de Física Berkeley �Vol.2 �Eletromagnetismo

Ou, juntando todas as componentes

rotF =�@Fz@y

� @Fy@z

�x+

�@Fx@z

� @Fz@x

�y +

�@Fy@x

� @Fx@y

�z (105)

A expressão acima permite calcular o vetor rotacional conhecendo-se as componentes cartesianas do campo.

A.6 O operador Nabla

Existe uma forma bastante conveniente de se expressar a equação (101) e (105). Para isso introduzimos o

operador vetorial

O = x @

@x+ y

@

@y+ z

@

@z(106)

chamado de nabla. A quantidade acima é um operador diferencial, ou seja, ele só fornece um valor quando

aplicado em alguma função. Por exemplo, quando aplicado na função g (x; y; z) temos

Og = x@g@x

+ y@g

@y+ z

@g

@z

onde agora cada uma das componentes do vetor é um número que depende do ponto (x; y; z), ou seja, o

operador nabla permitiu contruir um vetor (Og) a partir de uma função escalar (g). Este vetor se chama ogradiente da função. O gradiente de uma função é um vetor que aponta sempre na direção em que a função

cresce mais rapidamente com a variação dos parâmetros.

O que acontece quando aplicamos o operador nabla num campo vetorial F? Neste caso, como ambos são

vetores, podemos de�nir a palavra �aplicar�como um produto escalar ou um produto vetorial.

204

Page 205: Parte A (Relatividade)

Se usarmos o produto escalar temos

O�F=�x@

@x+ y

@

@y+ z

@

@z

�(Fxx+ Fyy + Fz z)

=@Fx@x

+@Fy@y

+@Fz@z

Que podemos reconhecer como o divergente do campo (101). Se escolhermos de�nir a aplicação pelo produto

vetorial temos

O� F=

�������x y z@@x

@@y

@@z

Fx Fy Fz

�������=

�@Fz@y

� @Fy@z

�x+

�@Fx@z

� @Fz@x

�y +

�@Fy@x

� @Fx@y

�z

Que podemos reconhecer como o rotacional do campo.

É importante notar que apesar de sempre usarmos:

Og � gradiente de gO�F � divergente de F

O� F � rotacional de F

este operador só tem a forma (106) acima em coordenadas cartesianas.

Além disso, em coordenadas cartesianas, podemos ainda de�nir:

x1 � x ; x2 � y ; x3 � z

com o que@

@x=

@

@x1� @1 ;

@

@y=

@

@x2� @2 ;

@

@z=

@

@x3� @3

Usando estas de�nições temos

(Og) xi = @ig

O�F =3Xi=1

@iFi � @iFi

(O� F) xi = @jFk � @kFj com 1! 2! 3

onde no ultimo caso as componentes i; j; k (nesta ordem) devem seguir a ordem cíclica i = 1; j = 2; k = 3!

205

Page 206: Parte A (Relatividade)

i = 2; j = 3; k = 1 ! i = 3; j = 1; k = 2. Uma forma muito prática (e útil) de evitarmos ter de deixar

sempre indicado esta ordem cíclica é usarmos o chamado tensor completamente anti-simétrico de Levi-Civita,

ou símbolo de Levi-Civita

"ijk

que é anti-simétrico nas três componentes

"ijk = �"jik = �"ikj

com

"123 = 1

Como conseqüência esta quantidade vale zero se os índices se repetem (e.g, "112 = 0), muda de sinal para

qualquer permutação de dois índices e mantém o sinal para permutações cíclicas. Estas propriedades podem

ser expressas na igualdade

"ijk =(i� j) (j � k) (k � i)

2; i; j; k = 1; 2; 3 :

Usando esta quantidade, podemos de�nir a componente i do rotacional como

(O� F) xi =3X

j;k=1

"ijk@jFk � "ijk@jFk

Vamos calcular, por exemplo, o rotacional do gradiente de uma função

O� (Og) = "ijk@j (@kg) = "ijk@j@kg

=1

2("ijk + "ijk) @j@kg

=1

4("ijk � "ikj) @j@kg

=1

4("ijk@j@kg � "ikj@j@kg)

Lembrando agora que j e k são índices mudos

O� (Og) = 1

4("imn@m@ng � "imn@n@mg)

=1

4"imn (@m@n � @n@m) g

Usando agora

@n@m = @m@n

206

Page 207: Parte A (Relatividade)

temos33

O� (Og) = 1

4"imn (@m@n � @n@m) g

=1

4"imn (@m@n � @m@n) g

= 0

ou seja, o rotacional do gradiente é sempre igual a zero.O símbolo de Levi-Civita se relaciona com o delta de Kronecker através do determinante34

"ijk"lmn =

��������il �im �in

�jl �jm �jn

�kl �km �kn

������� :Exercise 88 Usando o mesmo procedimento acima, mostre que o divergente do rotacional é sempre nulo.

Exercise 89 Mostre que"ijk"mnk = �im�jn � �in�jm

Exercise 90 Usando a propriedade do exercício acima, mostre que

O� (O� F) = O (O � F )� O2FO2 � O � O = @i@i

A.7 Teoremas Fundamentais do Cálculo Vetorial

Voltando aos nossos teoremas (agora com o operador nabla) temosZV

r�F dV =

IS

F� da (T. da divergência)ZS

r� F da =

IC

F � ds (T. de Stokes)

O primeiro relaciona um volume com a sua fronteita, i.e., uma área. O segundo relaciona uma área com

a sua fronteira, i.e., um caminho. Cada um deles diminui de 1 a dimensão do problema. Sabendo que a

dimensão mínima que podemos chegar é o ponto, será que podemos diminuir ainda mais a dimensão do nosso

problema? Em outras palavras, existe alguma relação entre as extreminades de um camilho (uma linha) e a

sua fronteira (dois pontos)? A resposta é sim.

33O produto escalar de um tensor simétrico com um anti-simétrico é sempre nulo.34Veja o livro de Teoria do Campo do Landau.

207

Page 208: Parte A (Relatividade)

Relação entre as extremidades de uma linha

dT =@T

@xdx+

@T

@ydy +

@T

@zdz

=

�@T

@xx+

@T

@yy +

@T

@zz

�� (dx x+ dy y + dz z)

= (rT ) � ds

�T = T (P 0)� T (P ) =ZC

(rT ) � ds

onde C é um caminho que inicia em P e termina em P 0. AssimZC

(rT ) � ds =T (P 0)� T (P )

É importante notar que existem vários caminhos que permiter ligar estes dois pontos. Entretanto, o lado

direito da expressão assima não depende do caminho. Ou seja

Se F é o gradiente de alguma função (F =rT ) então a integral de caminho de F só depende dois pontosiniciais e �nais. Chamamos um campo com esta característica de conservativo.

Como consequencia do resultado acima temosIC

(rT ) � ds =0 :

Mais ainda, como

r� (rT ) = 0

Vemos que todo campo conservativo tem rotacional nulo. É possivem mostrar que o contrário também é

verdade. IC

(rT ) � ds =ZS

r� (rT ) da = 0

Como isso tem de ser válido para qualquer área

r� (rT ) = 0

Para uma área fechada (sem borda) temos (104)IS

r� F da =

IC

F � ds = 0

208

Page 209: Parte A (Relatividade)

Aplicando o teorema do divergenteIS

(r� F) � da =ZV

r� (r� F) dV = 0

Como isso é válido para qualquer volume

r� (r� F) = 0 :

A.8 Teorema de Green

Vamos calcular a integral

W =

ZC

F:dr

para um campo F arbitrário, mas para um caminho especí�co, por exemplo, um retângulo:

(0; 0)! (a; 0)! (a; b)! (0; b)! (0; 0)

W =

ZC

F:dr =

ZC

(U (x; y) {+ V (x; y) |) : ({dx+ |dy)

=

ZC

(U (x; y) dx+ V (x; y) dy) :

Na primeira parte do caminho (0; 0)! (a; 0) ; dr = {dx =) dy = 0:

W j(a;0)(0;0) =

Z (a;0)

(0;0)

(U (x; y) dx+ V (x; y) dy) =

Z a

0

U (x; 0) dx

Enquanto na segunda parte (a; 0)! (a; b) ; dr = |dy =) dx = 0

W j(a;b)(a;0) =

Z (a;b)

(a;0)

(U (x; y) dx+ V (x; y) dy) =

Z b

0

V (a; y) dy

Da mesma forma

W j(0;b)(a;b) =

Z 0

a

U (x; y) dx = �Z a

0

U (x; b) dx

W j(0;0)(0;b) =

Z 0

b

V (x; y) dy = �Z b

0

V (0; y) dy

209

Page 210: Parte A (Relatividade)

O trabalho total é a soma do trabalho de cada parte:

W = W j(a;0)(0;0) + W j(a;b)(a;0) + W j(0;b)(a;b) + W j(0;0)(0;b)

=

Z a

0

[U (x; 0)� U (x; b)] dx+Z b

0

[V (a; y)� V (0; y)] dy (107)

Um ponto importante é que cada uma das integrais acima é uma integral ordinária em apenas uma

variável. Assim, no cálculo de qualquer das integrais acima a função integrada pode ser tratada como uma

função de uma única variável. Assim, podemos fazer, por exemplo:

U (x; y) = fx (y) =) f0

x (y) =dfx (y)

dy=)

Z b

0

f0

x (y) dy = fx (b)� fx (0)

f0

x (y) =dfxdy

= limdy*0

fx (y + dy)� f (y)dy

= limdy*0

U (x; y + dy)� U (x; y)dy

=@U

@yZ b

0

f0

x (y) dy = fx (b)� fx (0) =)Z b

0

@U

@ydy = U (x; b)� U (x; 0)

Da mesma forma Z a

0

@V

@xdx = V (a; y)� V (0; y)

Substituindo em (107) temos

W = �Z a

0

Z b

0

@U

@ydy dx+

Z b

0

Z a

0

@V

@xdx dy

=

Z a

0

Z b

0

�@V

@x� @U

@y

�dx dy

Assim, para o nosso caminho quadrado

W =

ZC

F:dr =

ZC

(U (x; y) dx+ V (x; y) dy) =

Z ZR

�@V

@x� @U

@y

�dA

Suponha agora que o nosso quadrado tenha sido dividido, por exemplo, por uma linha vertical no ponto

x = h < a e calculamos o trabalho para percorrer cada um dos dois quadrados:

W1 =W(h;0)(0;0) +W

(h;b)(h;0) +W

(0;b)(h;b) +W

(0;0)(0;b)

W2 =W(a;0)(h;0) +W

(a;b)(a;0) +W

(h;b)(a;b) +W

(h;0)(h;b)

210

Page 211: Parte A (Relatividade)

onde

W(h;b)(h;0) =

Z b

0

V (h; y) dy

W(h;0)(h;b) =

Z 0

b

V (h; y) dy = �Z b

0

V (h; y) dy = �W (h;b)(h;0)

Então

W1 +W2 =W(h;0)(0;0) +W

(0;b)(h;b) +W

(0;0)(0;b) +W

(a;0)(h;0) +W

(a;b)(a;0) +W

(h;b)(a;b)

Agora observamos que

W(h;0)(0;0) +W

(a;0)(h;0) =

Z h

0

U (x; 0) dx+

Z a

h

U (x; 0) dx =

Z a

0

U (x; 0) dx =W(a;0)(0;0)

W(h;b)(a;b) +W

(0;b)(h;b) =W

(0;b)(a;b)

Assim

W1 +W2 = W j(a;0)(0;0) + W j(a;b)(a;0) + W j(0;b)(a;b) + W j(0;0)(0;b) =W

Ou seja, não importa que divisão façamos no nosso quadrado todas as contribuições das partes internas irão

se cancelar (porque são percorridas na ordem inversa) e sobrará apenas as bordas.

Assim, para uma superfície fechada qualquer, podemos subdividi-la em quadrados, somar todas as con-

tribuições dos quadrados e o que teremos será a integral de linha nas bordas da região interna do caminho.

É importante notar que qualquer buraco na nossa área, i.e., regiões que não pertencem aodomínio das funções geraram bordas e contribuirão para a integral.Assim, de forma geral, para um caminho fechado que encerre uma superfície simplesmente conexa (sem

buracos) temos: IC

F:dr =

IC

(U (x; y) dx+ V (x; y) dy) =

Z ZR

�@V

@x� @U

@y

�dA (108)

Este é o teorema de Green e permite, através do cálculo de integrais de áreas, que não envolve produtos

vetoriais, calcular uma integral de linha.

Exemplo: Vamos voltar ao nosso exemplo anterior

F = (3x� y) i+ (x+ 5y) j

U = (3x� y) ; V = (x+ 5y)@V

@x= 1;

@U

@y= �1

IC

F:dr =

Z ZR

�@V

@x� @U

@y

�dA =

Z ZR

[1 + 1] dA = 2

Z ZR

dA = 2� :

211

Page 212: Parte A (Relatividade)

�Este teorema também permite ver que, se

@V

@x=@U

@y=)

IC

F:dr =0 ;

para qualquer curva fechada. Ou seja, F é um campo conservativo. Veja que esta expressão concorda com

(??) que obtivemos porque F é um campo gradiente.

Se F é um campo conservativo temos

F = rf = @f

@xx+

@f

@yy =)

ZC

F:dr =

ZC

�@f

@xx+

@f

@yy

�: ({dx+ |dy)Z

C

F:dr=

ZC

�@f

@xdx+

@f

@ydy

�=

ZC

df = f (B)� f (A)

para A e B os limites de C. Assim ZC

rf:dr =f (B)� f (A)

é uma generalização do Teorema Fundamental do Cálculo para funções de várias variáveis.

212