2aparte - colorida - hipertexto (2)

174

Upload: mariane-ferreira

Post on 21-Dec-2015

40 views

Category:

Documents


4 download

DESCRIPTION

CVGA

TRANSCRIPT

Page 1: 2aPARTE - Colorida - Hipertexto (2)

GEOMETRIA ANALÍTICApara

COMPUTAÇÃO GRÁFICAlivro 2: o espaço e outros espaços

Felipe Acker

maio de 2013

Page 2: 2aPARTE - Colorida - Hipertexto (2)

2

copyright c©2013 by Felipe Acker

Page 3: 2aPARTE - Colorida - Hipertexto (2)

Sumário

1 Pontos e vetores 7a Segmentos orientados e vetores . . . . . . . . . . . . . . . . . 7b Vetores e combinações lineares . . . . . . . . . . . . . . . . . . 10c Retas e planos . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 O mistério da Santíssima Trindade 13a De�nição de base . . . . . . . . . . . . . . . . . . . . . . . . . 13b O mistério da Santíssima Trindade . . . . . . . . . . . . . . . 18c Subespaços . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3 O produto escalar 21a De�nição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21b Bases ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . 22c Equação do plano . . . . . . . . . . . . . . . . . . . . . . . . . 23d Construindo bases ortonormais . . . . . . . . . . . . . . . . . 24e Projeções e complemento ortogonais . . . . . . . . . . . . . . . 26

4 O determinante 29a Volumes com sinal . . . . . . . . . . . . . . . . . . . . . . . . 29b A fórmula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30c Orientação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

5 Quatérnions e produto vetorial 41a Os quatérnions . . . . . . . . . . . . . . . . . . . . . . . . . . 41b O produto escalar e o produto vetorial . . . . . . . . . . . . . 42c Interpretação geométrica do produto vetorial . . . . . . . . . . 44d Determinantes e volume, de novo . . . . . . . . . . . . . . . . 47e O módulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3

Page 4: 2aPARTE - Colorida - Hipertexto (2)

4 SUMÁRIO

f Quatérnions e rotações . . . . . . . . . . . . . . . . . . . . . . 50

6 Vista em perspectiva 53a O problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53b O sistema de coordenadas . . . . . . . . . . . . . . . . . . . . 54c A solução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55d Pontos de fuga . . . . . . . . . . . . . . . . . . . . . . . . . . 57

7 Compacti�cações do plano e do espaço 61a A projeção estereográ�ca . . . . . . . . . . . . . . . . . . . . . 64b O plano projetivo . . . . . . . . . . . . . . . . . . . . . . . . . 66

8 Espaços vetoriais 69a O IRn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69b Outros espaços . . . . . . . . . . . . . . . . . . . . . . . . . . 74c Espaços vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . 77d Bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80e Dimensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

9 Produto escalar 87a Distâncias e ângulos . . . . . . . . . . . . . . . . . . . . . . . 90b Bases ortonormais e projeções . . . . . . . . . . . . . . . . . . 95c O processo de Gram-Schmidt . . . . . . . . . . . . . . . . . . 102

10 Transformações lineares 105a Em três dimensões . . . . . . . . . . . . . . . . . . . . . . . . 105b O trepa-trepa catalão . . . . . . . . . . . . . . . . . . . . . . . 109c Transformações lineares . . . . . . . . . . . . . . . . . . . . . 111d Um pouquinho de Álgebra . . . . . . . . . . . . . . . . . . . . 113e Isometrias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

11 A matriz de uma transformação linear 117a No plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118b Matriz de uma transformação linear . . . . . . . . . . . . . . . 120c O caso geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

12 Mudanças de base 127a Um exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127b Outros exemplos em IR3 . . . . . . . . . . . . . . . . . . . . . 130

Page 5: 2aPARTE - Colorida - Hipertexto (2)

SUMÁRIO 5

c Matrizes ortogonais . . . . . . . . . . . . . . . . . . . . . . . . 131d O caso geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

13 O Teorema do Núcleo e da Imagem 135a O Teorema do Núcleo e da Imagem em IR3 . . . . . . . . . . . 135b O caso geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

14 O determinante, de novo 143a Determinante de transformação linear em IR3 . . . . . . . . . 143b Formas trilineares alternadas . . . . . . . . . . . . . . . . . . . 147c Formas de medir volumes . . . . . . . . . . . . . . . . . . . . 148d Permutações . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150e O determinante como forma de volume . . . . . . . . . . . . . 153f O determinante de transformação linear . . . . . . . . . . . . 155g Determinante de matriz . . . . . . . . . . . . . . . . . . . . . 156h Orientação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160i A dimensão do espaço das formas p-lineares alternadas . . . . 162

15 Quando o exemplo vem de cima 165a Um exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165b De onde veio? . . . . . . . . . . . . . . . . . . . . . . . . . . . 166c De cima para baixo . . . . . . . . . . . . . . . . . . . . . . . . 168

Índice remissivo 171

Page 6: 2aPARTE - Colorida - Hipertexto (2)

6 SUMÁRIO

Page 7: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 1

Pontos e vetores

Adotaremos neste texto um ponto de vista algo "leviano", com relação àGeometria Sintética. Isto signi�ca a�rmar várias coisas sem demonstração,tomando-as como óbvias. Acreditamos que é razoável proceder dessa forma:o leitor já deve ter alguma experiência prévia com a Geometria, de formaque, provavelmente, não se sentirá ofendido.1

a Segmentos orientados e vetores

Como no caso do plano, adotaremos a seguinte de�nição informal de vetorno espaço: um vetor é uma �echinha que pode ser transladada para qual-quer ponto de espaço. Para esclarecer um pouco melhor o que isso signi�ca,podemos convencionar:

De�nição:(i) Uma �echinha com pé em A e ponta em B é representada pelo par

ordenado (A,B);(ii) Duas �echinhas (A,B) e (C,D) representam o mesmo vetor se os

segmentos AB e CD são paralelos e têm o mesmo comprimento e, alémdisso, são também paralelos e têm o mesmo comprimento os segmentos ACe BD (segmentos degenerados em um ponto, tipo (A,A), são paralelos aqualquer segmento).

Os exercícios a seguir dão sustentação à de�nição de vetor e às de�nições das

1A verdade, honestamente, é mais dura: demonstrar todos os fatos geométricos queaceitaremos como óbvios exigiria, certamente, um curso inteiro de Geometria Euclidiana

7

Page 8: 2aPARTE - Colorida - Hipertexto (2)

8 CAPÍTULO 1. PONTOS E VETORES

operações com vetores. Vale a pena dar uma olhada e, pelo menos, conferirse acredita na veracidade das a�rmações que contêm.

Exercício: Suponha que os segmentos AB e CD são paralelos e têm o mesmocomprimento e, além disso, são também paralelos e têm o mesmo comprimento ossegmentos AC e BD. Suponha, também, que os segmentos CD e EF são paralelose têm o mesmo comprimento e, além disso, são também paralelos e têm o mesmocomprimento os segmentos CE e DF . Mostre que os segmentos AB e EF sãoparalelos e têm o mesmo comprimento e, além disso, são também paralelos e têmo mesmo comprimento os segmentos AE e BF . Conclua que, no conjunto dospares ordenados de pontos do espaço, representar o mesmo vetor é uma relaçãode equivalência, isto é:

(i) (A,B) e (A,B) sempre representam o mesmo vetor, quaisquer que sejam ospontos A e B;

(ii) se (A,B) e C,D) representam o mesmo vetor, então (C,D) e (A,B) repre-sentam o mesmo vetor;

(iii) se (A,B) e C,D) representam o mesmo vetor e (C,D) e (E,F ) representamo mesmo vetor, então (A,B) e E,F ) representam o mesmo vetor.

Exercício: Conclua, do exercício anterior (mesmo que não o tenha feito), que ospares ordenados de pontos do espaço estão divididos em classes de equivalência,dadas da seguinte forma: a classe de equivalência do par (A,B) é o conjunto detodos os pares (C,D) tais que (A,B) e (C,D) representam o mesmo vetor. Umvetor é, precisamente, uma tal classe de equivalência. A classe de equivalência de

(A,B) é notada por→AB e chamada de vetor

→AB.

Exercício: Sejam→AB um vetor e P um ponto. Mostre que existe um único ponto

Q tal que→PQ=

→AB. Mostre que existe um único ponto Q′ tal que

→Q′P=

→AB.

Exercício: Sejam A e B pontos distintos e t um número real não negativo. Mostreque existe um único ponto C, na semirreta que começa em A e passa por B, talque comprimento do segmento AC é t vezes o comprimento do segmento AB.

Exercício: Mostre que→PP=

→QQ, quaisquer que sejam os pontos P e Q.

Exercício: Mostre que, se→AB=

→CD, então

→BA=

→DC.

De�nição: Sejam→AB e

→CD dois vetores. A soma

→AB +

→CD é o vetor

→AE,

sendo o ponto E tal que→BE=

→CD.

Exercício: Mostre que a de�nição acima faz sentido, isto é, depende apenas dosvetores e não das �echinhas escolhidas para representá-los.

Page 9: 2aPARTE - Colorida - Hipertexto (2)

A. SEGMENTOS ORIENTADOS E VETORES 9

De�nição: Sejam→AB um vetor e t um número real. O produto de t por

→AB é o vetor t

→AB=

→AC, sendo C o ponto de�nido da seguinte forma:

(i) C = A, se A = B;(ii) Se A 6= B e t ≥ 0, então C é o ponto da semirreta começando em

A e passando por B, tal que o comprimento do segmento AC é t vezes ocomprimento do segmento AB.

(iii) Se A 6= B e t < 0, então C é o ponto tal que→CA=

→AC ′, sendo C ′ o

ponto da semirreta começando emA e passando porB, tal que o comprimentodo segmento AC ′ é |t| vezes o comprimento do segmento AB.

Exercício: Mostre que a de�nição acima faz sentido, isto é, depende apenas dosvetores e não das �echinhas escolhidas para representá-los.

Exercício: Mostre que valem, como no plano, as propriedades a seguir, quaisquerque sejam os vetores ~u, ~v e ~w, e quaisquer que sejam os escalares (reais) s e t:2

(1) ~u+ (~v + ~w) = (~u+ ~v) + ~w(2) ~u+ ~v = ~v + ~u

(3) ~u+~0 = ~u

(4) ~u+ (−~u) = ~0(5) t(~u+ ~v) = t~u+ t~v(6) (s+ t)~u = s~u+ t~u(7) s(t~u) = (st)~u(8) 1~u = ~u

Observação: Consideremos o conjunto V dos vetores do espaço e chamemosde E o próprio espaço. Fixemos um ponto O de E, que chamaremos deorigem. Pelo que acabamos de ver, �xar O estabelece uma bijeção entre Ee V , dada por

E : −→ V

P −→→OP

Os físicos costumam chamar→OP de vetor posição de P .

2O vetor ~0 é o de�nido por→PP , qualquer que seja o ponto P ; se ~u é o vetor dado por

→AB, −~u é o vetor dado por

→BA

Page 10: 2aPARTE - Colorida - Hipertexto (2)

10 CAPÍTULO 1. PONTOS E VETORES

b Vetores e combinações lineares

Assim como no plano, os vetores �echinhas do espaço podem ser somados emultiplicados por escalares. Assim como no caso do plano, vamos considerara base canônica do espaço, constituída pelos vetores ~e1, ~e2 e ~e3. Usandotermos pouco precisos, �ca entendido que ~e3 é vertical, com a ponta paracima, e que ~e1 e ~e2 são horizontais. O mais importante é que os três são decomprimento 1 e dois a dois ortogonais. Para cada vetor ~v do espaço, existeum único terno ordenado (x1, x2, x3) de números reais tal que

~v = x1~e1 + x2~e2 + x3~e3.

Figura 1.1:

Exercício: prove esta última a�rmação (ou, pelo menos, pense nela).

Note que, dado um vetor não nulo ~v do espaço, os múltiplos de ~v (vetores ~uda forma ~u = t~v para algum escalar t), se marcados a partir de um mesmoponto de origem O, estarão todos sobre uma mesma reta.

Da mesma forma, se �xarmos dois vetores ~u e ~v tais que nenhum dos dois émúltiplo do outro, os vetores ~w da forma ~w = s~u + t~v, com os escalares s et percorrendo os números reais, estarão, se marcados a partir de um mesmoponto de origem O, todos sobre um mesmo plano.

Page 11: 2aPARTE - Colorida - Hipertexto (2)

C. RETAS E PLANOS 11

Figura 1.2:

De�nição: Dados os vetores ~u e ~v, um vetor ~w é dito uma combinaçãolinear de ~u e ~v se existem escalares s e t tais que ~w = s~u + t~v. De maneiramais geral, dados os vetores ~v1, . . . , ~vn, um vetor ~u é dito combinação linearde ~v1, . . . , ~vn se existem escalares t1, . . . , tn tais que ~u = t1~v1 + . . .+ tn~vn.

c Retas e planos

A exemplo do que �zemos no plano, temos uma operação "bastarda", so-mando vetores ~v a pontos P . Neste caso, P +~v é um novo ponto, Q, de�nido

por: P + ~v = Q se→PQ= ~v. Às vezes dizemos que o ponto Q é obtido

aplicando o vetor ~v ao ponto P .

Observe que essa operação também é associativa: para qualquer ponto P equaisquer vetores ~u e ~v, vale (P + ~u) + ~v = P + (~u+ ~v).

Uma boa vantagem de lidar com retas de forma paramétrica é que não hádiferença entre retas no plano e retas no espaço: dá-se um ponto P (departida), um vetor não nulo ~v (velocidade) e consideram-se os pontos daforma

Q = p+ t~v, t ∈ IR.

No caso do espaço, se P é dado por (x0, y0, z0) e ~v por (a, b, c), teremos trêsequações, ditas equações paramétricas da reta:

Page 12: 2aPARTE - Colorida - Hipertexto (2)

12 CAPÍTULO 1. PONTOS E VETORES

Figura 1.3:

x = x0 + aty = y0 + btz = z0 + ct

Exercício: Note que, ao contrário do que acontece no plano (em que as equaçõesparamétricas são apenas duas), não podemos, eliminando t no sistema, deduziruma única equação cartesiana para a reta.

Para a representação paramétrica dos planos, trabalhamos com um ponto debase P e dois vetores ~u e ~v; para que tenhamos, de fato, um plano, é precisoque ~u e ~v não sejam um múltiplo do outro. As combinações lineares de ~u e ~vnos fornecem um plano passando pela origem. Deslocá-lo para passar por Pé como colocar a origem em P e tomar os pontos da forma

Q = P + s~u+ t~v, s, t ∈ IR.

Page 13: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 2

O mistério da SantíssimaTrindade

a De�nição de base

A base canônica, {~e1, ~e2, ~e3} nos permite estabelecer uma bijeção entre oconjunto dos vetores do espaço e o conjunto IR3 dos ternos ordenados denúmeros reais. Como no caso do plano, essa bijeção preserva as operações:se os vetores ~u e ~v são representados, respectivamente, pelos ternos (x1, x2, x3)e (y1, y2, y3), então o vetor ~u+~v é representado por (x1 + y1, x2 + y2, x3 + y3);se t é um escalar, t~u é representado por (tx1, tx2, tx3).

Cabem, naturalmente, as perguntas: sob que condições outros três vetores,~v1, ~v2 e ~v3, podem desempenhar o mesmo papel? o número 3 é mandatório,ou poderíamos conseguir a mesma coisa com 2, ou quem sabe 4 vetores (oque estabeleceria outras bijeções, entre o conjunto dos vetores do espaço eIR2, ou IR4, preservando as operações)?

Vamos designar o conjunto dos vetores do espaço por V . A ideia é tratar aquestão de forma abstrata, esquecendo o número cabalístico 3 para, depois,voltarmos a ele. Mais precisamente, pensemos V como um conjunto (devetores). Dados dois vetores ~u e ~v de V , está de�nida sua soma, ~u+~v, que éum vetor de V . Da mesma forma, dados um vetor ~v de V e um número realt, está de�nido o produto de t por ~v, t~v, que é um vetor de V . As operaçõesassim de�nidas satisfazem às propriedades:

13

Page 14: 2aPARTE - Colorida - Hipertexto (2)

14 CAPÍTULO 2. O MISTÉRIO DA SANTÍSSIMA TRINDADE

(1) ~u+ (~v + ~w) = (~u+ ~v) + ~w(2) ~u+ ~v = ~v + ~u

(3) ~u+~0 = ~u

(4) ~u+ (−~u) = ~0(5) t(~u+ ~v) = t~u+ t~v(6) (s+ t)~u = s~u+ t~u(7) s(t~u) = (st)~u(8) 1~u = ~u

(isto é: as propriedades (1) a (8) valem para quaisquer vetores ~u, ~v e ~w, eparaquaisquer números s e t).

Exercício: Observe que existem outros possíveis espaços, com as oito propriedades

acima, além do que temos considerado: por exemplo, os elementos de IRn, se soma-dos e multiplicados por escalares da maneira habitual ((x1, . . . , xn)+(y1, . . . , yn) =

(x1 + y1, . . . , xn + yn); t(x1, . . . , xn) = (tx1, . . . , txn)), podem ser pensados comovetores, já que as oito propriedades são satisfeitas, e isso mesmo que n > 3.

De�nição: Um subconjunto ordenado {~v1, . . . , ~vn} do espaço vetorial V édito uma base de V se, e somente se, para todo vetor ~v de V , existe umaúnica n-upla (x1, . . . , xn) de IRn tal que

~v = x1~v1 + . . .+ xn~vn.

Os números x1, . . . , xn são chamados coordenadas do vetor ~v.

Observe que são duas as condições para que {~v1, . . . , ~vn} seja uma base de V .A primeira é que {~v1, . . . , ~vn} deve gerar V (isto é, todo vetor de V deve sercombinação linear de ~v1, . . . , ~vn).1 A segunda é que não podem existir duasn-uplas distintas, (x1, . . . , xn) e (y1, . . . , yn), que correspondam a um mesmovetor.

Exercício: Mostre que nenhum dos vetores de uma base pode ser combinação lineardos demais (perderíamos a unicidade da representação).

De�nição: Os vetores ~v1, . . . , ~vn são ditos linearmente independentesse nenhum deles é combinação linear dos demais (diz-se, também, que oconjunto {~v1, . . . , ~vn} é linearmente independente).

1Neste caso, diz-se também que ~v1, . . . , ~vn geram V

Page 15: 2aPARTE - Colorida - Hipertexto (2)

A. DEFINIÇÃO DE BASE 15

Exercício: Entenda que uma base é uma espécie de chave para identi�carmos cadavetor de V a uma n-upla de IRn. Note que a exigência de ter {~v1, . . . , ~vn} ordenadoé necessária para garantir a unicidade da n-upla (x1, . . . , xn).2

Proposição: Fixada a base {~v1, . . . , ~vn}, a bijeção ~v ↔ (x1, . . . , xn) preservaas operações de adição e de multiplicação por escalar. Isto é, se (x1, . . . , xn) e(y1, . . . , yn) são as n-uplas associadas, respectivamente, aos vetores ~u e ~v, e té um escalar qualquer, então a n-upla (x1+ty1, . . . , xn+tyn) = (x1, . . . , xn)+t(y1, . . . , yn) é a associada ao vetor ~u+ t~v.

Demonstração: Basta usar as propriedades das operações com vetores e com n-uplas. De fato, se ~u = x1~v1+. . .+xn~vn, ~v = y1~v1+. . .+yn~vn e t é um escalar, então,usando muitas vezes as associatividades, as distributividades e a comutatividade,obtemos

~u+t~v = (x1~v1+ . . .+xn~vn)+t(y1~v1+ . . .+yn~vn) = (x1+ty1)~v1+ . . .+(xn+tyn)~vn.

É visível que nosso espaço V tem in�nitas bases (compostas por quaisquertrês vetores não coplanares). Vamos, porém, tentar fazer algo minimamenterigoroso. Admitamos apenas que já temos uma base para V (a base canônica,composta por ~e1, ~e2 e ~e3). Tentemos provar que qualquer outra base para Vdeve ter três elementos. Podemos argumentar em duas partes.

Lema 1: Dois é pouco. Mais precisamente: dois vetores não podem gerar oespaço V .

Demonstração: Suponhamos que V seja gerado por dois elementos, ~ε1 e ~ε2. Escre-vendo ~e1 como combinação linear dos dois, temos

~e1 = t1~ε1 + t2~ε2,

com pelo menos um dentre t1 e t2 não nulo (já que ~e1 6= ~0). Suponhamos quet1 6= 0 (se t1 = 0, então necessariamente t2 6= 0 e o raciocínio é análogo). Entãopodemos escrever ~ε1 como combinação linear de ~e1 e ~ε2:

2Seria mais rigoroso considerar, em vez de conjuntos ordenados de vetores {~v1, . . . , ~vn},n-uplas (~v1, . . . , ~vn) em V n, o que é quase a mesma coisa (n-uplas admitem a possibilidadede ~vi = ~vj , com i 6= j). Estamos evitando fazê-lo por conta do risco de confundir o leitor...oque, paradoxalmente, pode gerar alguma confusão

Page 16: 2aPARTE - Colorida - Hipertexto (2)

16 CAPÍTULO 2. O MISTÉRIO DA SANTÍSSIMA TRINDADE

~ε1 =1

t1~e1 −

t2t1~ε2.

Logo, podemos escrever qualquer elemento de V como combinação linear de ~e1 e ~ε2(primeiro obtemos ~ε1; em seguida, de posse de ~ε1 e ~ε2, obtemos todos os outros).Em particular, podemos escrever

~e2 = s1 ~e1 + s2~ε2.

Agora podemos a�rmar que s2 6= 0, já que ~e2 não é múltiplo de ~e1, o que nos permiteescrever ~ε2 como combinação linear de ~e1 e ~e2. Mas, a partir daí, concluímos quepodemos obter qualquer elemento de V como combinação linear de ~e1 e ~e2: com~e1 e ~e2 obtemos ~ε2; com ~e1 e ~ε2 obtemos ~ε1; com ~ε1 e ~ε2 obtemos todos os outros.Ora, isso signi�ca que podemos obter ~e3 como combinação linear de ~e1 e ~e2, o queé falso.

Lema 2: Quatro é demais. Mais precisamente: quatro vetores de V nãopodem ser linearmente independentes.

Demonstração: Suponhamos que ~ε1, ~ε2, ~ε3 e ~ε4 sejam linearmente independentes.A demonstração é, essencialmente, a mesma. No Lema 1, usamos apenas que ~ε1e ~ε2 geravam V , para concluir que ~e3 teria que ser combinação linear de ~e1 e ~e2.Agora, vamos usar o fato de que todo vetor de V se escreve como combinação linearde ~e1, ~e2 e ~e3 para concluir que pelo menos um dos 4 vetores ~εi é combinação lineardos demais.

Comecemos com ~ε1, que se escreve como combinação linear de ~e1, ~e2 e ~e3:

~ε1 = t1 ~e1 + t2 ~e2 + t3 ~e3,

com algum dos ti não nulo (~ε1 não pode ser nulo: isso implicaria em 1~ε1 = 0~ε2 +

0~ε3+0~ε4, com perda da unicidade da representação). Para não complicar a notação,podemos, sem perda de generalidade, supor que t1 6= 0, o que nos permite expressar~e1 como combinação linear de ~ε1, ~e2 e ~e3. Assim, todo elemento de V se escrevecomo combinação linear de ~ε1, ~e2 e ~e3 (primeiro recuperamos ~e1, etc). Agora,escrevendo ~ε2 = s1~ε1 + s2 ~e2 + s3 ~e3, podemos garantir que ao menos um, dentres2 e s3, é não nulo (pois, caso contrário, teríamos 1~ε2 = ~ε2 = s1~ε1, com perda daunicidade da representação). De novo, vamos tratar apenas o caso s2 6= 0 (o outroé análogo). Isso nos permite garantir que ~e2 se escreve como combinação linearde ~ε1, ~ε2 e ~e3. Assim, todo elemento de V se escreve como combinação linearde ~ε1, ~ε2 e ~e3 (primeiro recuperamos ~e2, depois ~e1, etc). Finalmente, escrevendo

Page 17: 2aPARTE - Colorida - Hipertexto (2)

A. DEFINIÇÃO DE BASE 17

~ε3 = r1~ε1 +r2~ε2 +r3 ~e3 e observando que, necessariamente, r3 6= 0 (de novo a perdada unicidade), concluímos que todo elemento de V se escreve como combinaçãolinear de ~ε1, ~ε2 e ~ε3. Mas, então, teremos 1~ε4 = ~ε4 = q1~ε1 + q2~ε2 + q3~ε3, com perdada unicidade da representação.

Teorema: Toda base de V tem, exatamente, 3 elementos. Além disso, se β ={~v1, ~v2, ~v3} é um subconjunto de V com 3 elementos, então são equivalentes:

(i)~v1, ~v2 e ~v3 formam uma base de V ;(ii)~v1, ~v2 e ~v3 geram V ;(iii)~v1, ~v2 e ~v3 são linearmente independentes.

Demonstração: A primeira a�rmação é o que acabamos de concluir. Além disso, (i)é equivalente a (ii) e (iii) juntos. Basta, pois, provar que (ii) e (iii) são equivalentes.

Comecemos observando que, se fosse possível ter V gerado por β sem que β fosselinearmente independente, então poderíamos descartar pelo menos um elementode β (que seja combinação linear dos outros dois), obtendo um conjunto de doiselementos que ainda geraria V , o que, como acabamos de observar (Lema 1), não épossível. Se, por outro lado, sabemos que β é linearmente independente, sabemos,do Lema 2, que, dado um vetor qualquer ~v de V , os quatro vetores ~v, ~v1, ~v2 e ~v3são linearmente dependentes. Assim, um deles é combinação linear dos demais. Oque queremos é provar que exatamente ~v é combinação linear de ~v1, ~v2 e ~v3. Ora,mesmo que só possamos garantir algo como ~v2 combinação linear de ~v1, ~v e ~v3,teremos

~v2 = t1~v1 + t~v + t3~v3.

Mas, como ~v2 não é combinação linear de ~v1 e ~v3, podemos garantir que t é nãonulo. Isto nos garante

~v = − t1t~v1 +

1

t~v2 −

t3t~v3.

Assim, se β é linearmente independente e tem 3 elementos, então β gera V .

Diante do acima exposto, concluímos que existe um número bem determi-nado, 3, tal que toda base do espaço V tem 3 elementos. Dizemos, pois, quea dimensão de V é 3.

Exercício: Note que o mesmo raciocínio se aplica aos vetores do plano, de formaque podemos dizer que o plano é de dimensão 2.

Page 18: 2aPARTE - Colorida - Hipertexto (2)

18 CAPÍTULO 2. O MISTÉRIO DA SANTÍSSIMA TRINDADE

b O mistério da Santíssima Trindade

Pelo que acabamos de ver, a �xação de uma base para os vetores no espaçoestabelece uma poderosa bijeção entre V e IR3.3. Ao mesmo tempo, como noplano, a �xação de uma origem O estabelece uma bijeção entre o espaço puro

(que chamaremos de E) e o conjunto dos vetores (que estamos notando por

V ), dada por P 7→→OP . Assim, a �xação simultânea de uma base para V e

de uma origem em E (que chamamos de um sistema de coordenadas) nosfornece duas bijeções, que, compostas, produzem uma bijeção entre pontose ternos ordenados. Desta forma, �xadas uma origem em E e uma base emV , passamos a identi�car três conjuntos distintos, E, V e IR3, enxergandoponto, vetor e terno ordenado como se fossem um única entidade, umaespécie de Santíssima Trindade.

V

↗ ↘E ←− IR3

Como trabalharemos sempre com coordenadas, é importante ter claro que,ao terno (0, 0, 0) correspondem a origem O e o vetor nulo, assim como aoterno (x1, x2, x3) correspondem, ao mesmo tempo, um ponto P e o vetor→OP . Compreender essa identidade entre pontos, vetores e ternos ordenadosé crucial, já que, no meio das contas, somente a intuição geométrica podenos guiar, na hora de decidir se o terno (x1, x2, x3) representa um ponto ouum vetor. Mais ainda: daqui para a frente, admitiremos que está �xada umaorigem O em E e, com frequência, pensaremos vetores como se fossem pontos(estando, ao vetor ~v, identi�cado o ponto P = O + ~v).

3Poderosa no seguinte sentido: a bijeção preserva as operações (se ~u e ~v são associadosaos ternos (x1, x2, x3) e (y1, y2, y3) e t é um escalar, então ~u+~v é associado a (x1, x2, x3) +(y1, y2, y3) e t~u é associado a t(x1, x2, x3). O termo erudito para uma bijeção preservandoas operações é isomor�smo

Page 19: 2aPARTE - Colorida - Hipertexto (2)

C. SUBESPAÇOS 19

Exercício: Observe que, dados um ponto P e um vetor ~v, a reta r que passa por Pe tem a direção de ~v é dada pelos pontos Q = P + t~v, com t variando em IR.

Exercício: Suponha �xado um sistema de coordenadas, no qual o ponto P é dadopor (a1, a2, a3) e o vetor ~v por (v1, v2, v3). Traduza a observação do exercícioanterior em coordenadas.

c Subespaços

O espaço V é gerado por 3 vetores linearmente independentes. Podemos,também, considerar subconjuntos de V gerados por apenas 2 vetores line-armente independentes, ou mesmo, por que não, por um único vetor nãonulo. Seria razoável, então, dizer que, assim como a dimensão de V é 3, ade subconjuntos do primeiro tipo é 2 e a de subconjuntos do segundo tipoé 1. Podemos englobar todos em uma só categoria (que inclua também adimensão 0).

De�nição: Um subespaço vetorial de V é um suconjunto W de V , nãovazio, tal que:

(i) ~w ∈ W, t ∈ IR =⇒ t~w ∈ W(ii) ~w1, ~w2 ∈ W =⇒ ~w1 + ~w2 ∈ W

Proposição: Um subconjuntoW de V é um subespaço vetorial se, e somentese, é de um dos seguintes tipos:

(i) W = V(ii) ∃ ~ε1, ~ε2 ∈ W, ~ε1 e ~ε2 linearmente independentes |

W = {t1~ε1 + t2~ε2, t1, t2 ∈ IR}(iii) ∃ ~ε1 6= ~0 | W = {t~ε1, t ∈ IR}(iv) W =

{~0}

Demonstração: Se W é de algum dos 4 tipos acima, é um exercício (fácil) provarque W é um subespaço vetorial. Reciprocamente, se W é um subespaço vetorialnão vazio, podemos tomar um vetor não nulo ~ε1 em W . Se W não for geradopor ~ε1 então podemos tomar um segundo vetor em W , ~ε2, tal que ~ε1 e ~ε2 sejamlinearmente independentes. Se, ainda assim, W não for gerado por ~ε1 e ~ε2, então,como dim V = 3, necessariamente W = V .

Page 20: 2aPARTE - Colorida - Hipertexto (2)

20 CAPÍTULO 2. O MISTÉRIO DA SANTÍSSIMA TRINDADE

De�nição: O menor número de vetores linearmente independentes necessá-rios para gerar o subespaçoW é dito a dimensão deW e notado por dim W(um subconjunto de dim W vetores de W que sejam linearmente indepen-

dentes é uma base para W ). Se W ={~0}, W é dito de dimensão zero (ou

nula).

Page 21: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 3

O produto escalar

a De�nição

A exemplo do que �zemos no plano, vamos de�nir o produto escalar dedois vetores ~u e ~v do espaço por

< ~u,~v >= ~u · ~v = |~u||~v| cos θ,

sendo θ o ângulo entre ~u e ~v. Daí concluímos (geometricamente), que oproduto escalar tem as propriedades:

(i) < ~u,~v >=< ~v, ~u > ∀~u,~v ∈ V(ii) < t~u,~v >= t < ~u,~v > ∀~u,~v ∈ V, ∀t ∈ IR(iii) < ~u,~v1 + ~v2 >=< ~u,~v1 > + < ~u,~v2 > ∀~u,~v1, ~v2 ∈ V(iv) < ei, ej >= 0, i 6= j, < ei, ej >= 1, i = j

Quando < ~u,~v >= 0, os vetores ~u e ~v são ditos ortogonais.

Segue imediatamente das propriedades que, se os vetores ~u e ~v são dados, nabase canônica, por ~u = u1~e1 + u2~e2 + u3~e3 e ~v = v1~e1 + v2~e2 + v3~e3, então

< ~u,~v >= u1v1 + u2v2 + u3v3.

Exercício: Desenvolva < ~u,~v >=< u1 ~e1 +u2 ~e2 +u3 ~e3, v1 ~e1 +v2 ~e2 +v3 ~e3 >, usandoas propriedades (i), (ii), (iii) e (iv), e prove a fórmula acima.

Daí decorrem algumas coisas importantes:

21

Page 22: 2aPARTE - Colorida - Hipertexto (2)

22 CAPÍTULO 3. O PRODUTO ESCALAR

(i) a norma do vetor ~v é dada por |~v| =< ~v,~v >1/2;(ii) o ângulo θ entre os vetores não nulos ~u e ~v é dado por

cos θ =< ~u,~v >

|~u||~v|.

Assim, tanto distâncias como ângulos podem ser medidos por meio do pro-duto escalar. Note que, se no plano ainda é concebível marcar pontos e ve-tores a partir das coordenadas e efetuar as medidas diretamente com réguase transferidores, no espaço a coisa seria quase impossível. As duas fórmulasacima permitem que essas medidas sejam feitas sem instrumentos, apenascom cálculos sobre as coordenadas.

Exercício: Sejam, no espaço, o triângulo ∆ formado pelos pontos A, B e C dados,em coordenadas, por A = (a1, a2, a3), B = (b1, b2, b3) e C = (c1, c2, c3). Use oTeorema de Pitágoras para calcular as medidas dos lados de ∆. Em seguida, usea lei dos cossenos (ou o próprio Teorema de Pitágoras) para calcular o cosseno doângulo A. Faça a mesma coisa usando a fórmula do produto escalar e con�ra.

b Bases ortogonais

Quando representamos um vetor ~v na base canônica, ~v = v1~e1 + v2~e2 + v3~e3,não é difícil ver que

v1 =< ~v, ~e1 >, v2 =< ~v, ~e2 >, v3 =< ~v, ~e3 > .

(podemos enxergar isso, ou simplesmente fazer o produto escalar dos doislados da igualdade ~v = v1~e1 + v2~e2 + v3~e3 por cada um dos vetores ~e1, ~e2 e~e3. Por exemplo:

< ~v, ~e2 > = < v1~e1 + v2~e2 + v3~e3, ~e2 >=

= < v1~e1, ~e2 > + < v2~e2, ~e2 > + < v3~e3, ~e2 >=

= 0 + v2 + 0 = v2.

O mesmo truque não funciona se estivermos trabalhando com uma base cujosvetores não sejam ortogonais. Mas funciona razoavelmente bem, se forem.

Page 23: 2aPARTE - Colorida - Hipertexto (2)

C. EQUAÇÃO DO PLANO 23

Proposição: Suponha que os vetores ~ε1, ~ε2 e ~ε3 são não nulos e dois a doisortogonais. Então:

(i) ~ε1, ~ε2 e ~ε3 formam uma base para V ;(ii) se ~v = v1~ε1 + v2~ε2 + v3~ε3, então, para i = 1, 2, 3, vale a fórmula

vi =< ~v, ~εi >

< ~εi, ~εi >.

Demonstração:(i) Como estamos com 3 vetores, basta provar que são linearmente indepen-

dente. Se não fossem, poderíamos escrever um deles, que chamaremos de ~εi comocombinação linear dos outros dois: ~εi = s~εj + t~εk. Como ~εi é não nulo, sabemosque < ~εi, ~εi >6= 0. Mas, então,

0 6=< ~εi, ~εi >=< s~εj + t~εk, ~εi >= s < ~εj , ~εi > +t < ~εk, ~εi >= 0.

(ii) Se ~v = v1~ε1 + v2~ε2 + v3~ε3, então, para i = 1, 2, 3, temos

< ~v, ~εi > = < v1~ε1 + v2~ε2 + v3~ε3, ~εi >== < v1~ε1, ~εi > + < v2~ε2, ~εi > + < v3~ε3, ~εi >= vi < ~εi, ~εi > .

Como ~εi é não nulo, podemos dividir dos dois lados por < ~εi, ~εi > e o resultadosegue.

De�nição: Uma base composta por vetores dois a dois ortogonais é ditauma base ortogonal. Um vetor de norma igual a 1 é dito unitário. Umabase ortogonal composta por vetores unitários é dita uma base ortonormal.

c Equação do plano

O produto escalar pode ser usado, de forma bastante simples, para se produ-zirem equações de planos. Se buscamos determinar os pontos P = (x, y, z)de um plano α que passa pelo ponto P0 = (x0, y0, z0) e é normal ao vetor~v = (a, b, c), basta observar que P estará no plano se e somente se o vetor−→P0P for normal a ~v, ou seja, <

−→P0P ,~v >= 0. Escrevendo em coordenadas,

P = (x, y, z) estará em α se e só se

0 =< (x− x0, y − y0, z − z0), (a, b, c) >= ax+ by + cz − (ax0 + by0 + cz0).

Page 24: 2aPARTE - Colorida - Hipertexto (2)

24 CAPÍTULO 3. O PRODUTO ESCALAR

Isso signi�ca que, fazendo d = −(ax0 + by0 + cz0), o plano α é dado por

α ={

(x, y, z) ∈ IR3 | ax+ by + cz + d = 0}.

Exercício: Faça, na fórmula que acabamos de obter, ~v = (a, b, c) = (1, 1, 0) eP0 = (x0, y0, z0) = (0, 0, 0). Por que a equação obtida não é a de uma reta passandopela origem?

Exercício: Pense na seguinte forma alternativa de deduzir a equação do plano αpassando por P0 = (x0, y0, z0) e normal ao vetor ~v = (a, b, c): todos os pontos deα se projetam no mesmo ponto da reta que passa pela origem e tem a direção de~v. Consequentemente, (x, y, z) ∈ α⇔ (x, y, z) · (a, b, c) = (x0, y0, z0) · (a, b, c).

d Construindo bases ortonormais

Consideremos a seguinte questão: se α é o plano que passa pela origem e édado pelos vetores ~u e ~v, como construir uma base ortonormal para α? Maisclaramente, sendo

α ={s~u+ t~v, (s, t) ∈ IR2

},

queremos ~ε1 e ~ε2 em α, unitários e ortogonais.

A solução é simples: começamos fazendo

~ε1 =1

|~u|~u;

em seguida, fazemos

~v1 = ~v− < ~v, ~ε1 > ~ε1;

�nalmente, tomamos

~ε2 =1

|~v1|~v1.

Exercício: Mostre que de fato, ~ε1 e ~ε2 formam base ortonormal para α. Faça uma�gura, explicitando ~u, ~v, ~ε1, ~v1, ~v − ~v1 e ~ε2.

Page 25: 2aPARTE - Colorida - Hipertexto (2)

D. CONSTRUINDO BASES ORTONORMAIS 25

Figura 3.1:

Construída uma base ortonormal, é fácil, agora, projetar um ponto P , dado

pelo vetor ~w, em α: se Q é a projeção, dada pelo vetor ~w0, e ~w1 =→QP , então

~w = ~w0 + ~w1 e ~w1 e ~ε são ortogonais, qualquer que seja ~ε em α.Escrevendo ~w0 = t1~ε1 + t2~ε2, com t1 e t2 a determinar, temos:

(i) t1 =< ~w0, ~ε1 >, t1 =< ~w0, ~ε1 >(ii) < ~w, ~ε >=< ~w0 + ~w1, ~ε >=< ~w0, ~ε > + < ~w1, ~ε >=< ~w0, ~ε > ∀~ε ∈ α.

Daí segue ~w0 = t1~ε1 + t2~ε2, com t1 =< ~w, ~ε1 > e t2 =< ~w, ~ε2 >.

Exercício: Note que, se ~w /∈ α, obtemos, fazendo

~ε3 =1

|~w1|~w1,

uma base ortonormal para o espaço V , com dois vetores em α.

Observação: Note que o processo que acabamos de ver (chamado processode ortogonalização de Gram-Schmidt), constrói uma base ortonormalpara V a partir de uma base dada, sem fazer qualquer referência à basecanônica. Pode parecer pouco interessante no momento... Num contexto

Page 26: 2aPARTE - Colorida - Hipertexto (2)

26 CAPÍTULO 3. O PRODUTO ESCALAR

mais geral, porém, esta é uma ideia simples mas fundamental. Observamostambém que, no nosso contexto, o processo de Gram-Schmidt nos produzbases ortonormais, também, para subespaços de V de dimensão menor doque 3.

e Projeções e complemento ortogonais

Seja W um subespaço de V e ~v um vetor de V . A projeção ortogonal de~v em W é o elemento ~v0 de W tal que

|~v − ~v0| ≤ |~v − ~w| ∀ ~w ∈ W.

Proposição: A projeção ortogonal ~v0 de ~v em W existe, é única e satisfaz a

< ~v − ~v0, ~w >= 0 ∀ ~w ∈ W.

Demonstração: Se W ={~0}, é só tomar ~v = ~0; se W = V , tomamos ~v0 = ~v. Se

W é gerado por ~ε1, com |~ε1| = 1, tome ~v0 =< ~v, ~ε1 > ~ε1; se W é gerado por ~ε1e ~ε2, com |~ε1| = |~ε2| = 1 e < ~ε1, ~ε2 >= 0, tome ~v0 =< ~v, ~ε1 > ~ε1+ < ~v, ~ε2 > ~ε2.Con�ra.

Exercício: Seja X um subconjunto de V e seja

X⊥ = {~v ∈ V | < ~v, ~u >= 0 ∀ ~u ∈ X} .

Mostre que X⊥ é um subespaço vetorial.

Suponhamos que W seja um subespaço vetorial de V . Seja

W⊥ = {~v ∈ V | < ~v, ~w >= 0 ∀ ~w ∈ W} .

W⊥ é chamado de complemento ortogonal de W .

Exercício: Mostre que W ∩W⊥ ={~0}.

Proposição: Todo elemento de V se escreve, de maneira única, como somade um elemento deW e um deW⊥. Consequentemente, dim W+dim W⊥ =dimV .

Page 27: 2aPARTE - Colorida - Hipertexto (2)

E. PROJEÇÕES E COMPLEMENTO ORTOGONAIS 27

Demonstração: Seja ~v um elemento de V . Sejam ~v0 a projeção de ~v em W e~v1 = ~v−~v0. Então é fácil ver que ~v1 ∈W⊥ e ~v = ~v0 +~v1. Se pudéssemos escrever,também, ~v = ~w0+ ~w1, com ~w0 ∈W e ~w1 ∈W⊥, teríamos ~0 = (~v0− ~w0)+(~v1− ~w1),o que daria (~v0 − ~w0) = −(~v1 − ~w1), com (~v0 − ~w0) ∈ W e −(~v1 − ~w1) ∈ W⊥, oque implica em ~v0 = ~w0 e ~v1 = ~w1. Provada a primeira parte, basta tomar umabase para W e uma para W⊥. A união das duas é uma base de V , o que prova asegunda parte.

Exercício: Mostre que, para qualauer subespaço W de V , tem-se (W⊥)⊥ = W .

Page 28: 2aPARTE - Colorida - Hipertexto (2)

28 CAPÍTULO 3. O PRODUTO ESCALAR

Page 29: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 4

O determinante

a Volumes com sinal

A exemplo do que �zemos no plano, vamos procurar associar, a cada trio devetores ~u, ~v e ~w, um número que corresponda ao volume do paralelepípedop de�nido a partir de ~u, ~v e ~w.

Exercício: Entenda que o palalelepípedo de que falamos é o subconjunto p de Vde�nido por p = {r~u+ s~v + t~w, (r, s, t) ∈ [0, 1]× [0, 1]× [0, 1]}.

Como no caso do plano, é razoável supor que aceitemos volumes negativos,dependendo da ordem em que tomamos os vetores ~u, ~v e ~w.1 Assim, vamos,na verdade, buscar uma função det que, a cada terno ordenado (~u,~v, ~w) asso-cie um número, det(~u,~v, ~w), que chamaremos de determinante de (~u,~v, ~w),com as propriedades:

(i) det(~u,~v, ~w) = 0, se ~u,~v e ~w sao linearmente dependentes(ii) det(~u1 + t~u2, ~v, ~w) = det(~u1, ~v, ~w) + t det(~u2, ~v, ~w) ∀t, ~u1, ~u2, ~v, ~w

det(~u,~v1 + t~v2, ~w) = det(~u,~v1, ~w) + t det(~u,~v2, ~w) ∀t, ~u,~v1, ~v2, ~wdet(~u,~v, ~w1 + t~w2) = det(~u,~v, ~w1) + t (~u,~v, ~w2) ∀t, ~u,~v, ~w1, ~w2

(iii) det(~e1, ~e2, ~e3) = 1

1razoável, aqui, signi�ca que vale a pena, como vimos no caso do plano, abrir mãoda exigência de que volumes sejam, sempre, positivos, em troca de boas propriedadesalgébricas; desta forma, o verdadeiro volume será dado pelo valor absoluto do número quevamos de�nir

29

Page 30: 2aPARTE - Colorida - Hipertexto (2)

30 CAPÍTULO 4. O DETERMINANTE

Por conta da propriedade (ii), o determinante é uma aplicação trilinear(ou forma trilinear, neste caso). Por conta da propriedade a ser provadano exercício a seguir, o determinante é uma forma trilinear alternada.

Exercício: Dedique o tempo que achar necessário a ver se acredita mesmo que o aspropriedades acima caracterizam o volume (com sinal) do paralelepípedo p.2

Exercício: Mostre que, das propriedades (i) e (ii) acima, decorre que o sinal de detmuda, se trocarmos a ordem de dois dos vetores.Solução: para a troca, por exemplo, de ~u e ~w, começamos observando que 0 = det(~u + ~w,~v, ~u + ~w) = det(~u, ~v, ~u) +

det(~u, ~v, ~w) + det(~w,~v, ~u) + det(~w,~v, ~w) = det(~u, ~v, ~w) + det(~w,~v, ~u). Logo, det(~u, ~v, ~w) = −det(~w,~v, ~u).

De�nição: Uma forma trilinear alternada em V é uma aplicação ω :V ×V ×V→ IR tal que:

(i) ω(~u,~v, ~w) = 0, se ~u,~v e ~w sao linearmente dependentes(ii) ω(~u1 + t~u2, ~v, ~w) = ω(~u1, ~v, ~w) + t ω(~u2, ~v, ~w) ∀t, ~u1, ~u2, ~v, ~w

ω(~u,~v1 + t~v2, ~w) = ω(~u,~v1, ~w) + t ω(~u,~v2, ~w) ∀t, ~u,~v1, ~v2, ~wω(~u,~v, ~w1 + t~w2) = ω(~u,~v, ~w1) + t (~u,~v, ~w2) ∀t, ~u,~v, ~w1, ~w2

b A fórmula

Não é difícil ver que, a exemplo do que ocorre no plano, as propriedades(i), (ii) e (iii) determinam, para cada terno (~u,~v, ~w), um único númerodet(~u,~v, ~w), que pode ser calculado em termos das coordenadas de ~u, ~v e ~wna base canônica.

Proposição: Suponhamos que os vetores ~u, ~v e ~w sejam dados, na basecanônica, por

~u = a11~e1 + a21~e2 + a31~e3,~v = a12~e1 + a22~e2 + a32~e3,~w = a13~e1 + a23~e2 + a33~e3.

Então, das propriedades (i), (ii) e (iii) decorre:

2Historicamente, o determinante surge com Leibniz, no século XVII, associado à soluçãode sistemas de equações lineares. Sua interpretação geométrica, em termos de volumes,vem apenas na primeira metade do século XIX, com Jacobi. Voltaremos à relação entredeterminantes e volumes no �nal do capítulo sobre o produto vetorial

Page 31: 2aPARTE - Colorida - Hipertexto (2)

B. A FÓRMULA 31

det(~u,~v, ~w) = a11a22a33−a11a23a32+a12a23a31−a12a21a33+a13a21a32−a13a22a31.

Demonstração: É um simples exercício. Basta escrever

det(~u,~v, ~w) = det(a11 ~e1 +a21 ~e2 +a31 ~e3, a12 ~e1 +a22 ~e2 +a32 ~e3, a13 ~e1 +a23 ~e2 +a33 ~e3)

e fazer as contas.

Escólio 1: Segue diretamente da demonstração que, se ω é uma outra formatrilinear alternada em V (isto é, ω associa um número a cada terno ordenado(~u,~v, ~w) de vetores de V , satisfazendo às propriedades (i) e (ii), mas nãonecessariamente à propriedade (iii)), então, obrigatoriariamente,

ω(~u,~v, ~w) = ω(a11~e1 + a21~e2 + a31~e3, a12~e1 + a22~e2 + a32~e3, a13~e1 + a23~e2 + a33~e3) =(a11a22a33 − a11a23a32 + a12a23a31 − a12a21a33 + a13a21a32 − a13a22a31)ω(~e1, ~e2, ~e3).

Isto merece ser chamado de Proposição.

Proposição 1: Para cada forma trilinear alternada ω em V existe um nú-mero α (que só depende de ω e é dado por α = ω(~e1, ~e2, ~e3)) tal que

ω(~u,~v, ~w) = α det(~u,~v, ~w), ∀(~u,~v, ~w) ∈ V × V × V.

Escólio 2: Podemos inverter o raciocínio. Suponhamos que ~u, ~v e ~w sejam li-nearmente independentes e, portanto, formem uma base de V . Consideremosuma forma trilinear alternada ω. Como acabamos de ver, ω é determinadapor ω(~e1, ~e2, ~e3). Por outro lado, podemos,visto que ~u, ~v e ~w formam basepara V , escrever ~e1, ~e2 e ~e3 como combinações lineares de ~u, ~v e ~w:

~e1 = b11~u+ b21~v + b31 ~w,~e2 = b12~u+ b22~v + b32w,~e3 = b13~u+ b23~v + b33w.

Desenvolvendo ω(~e1, ~e2, ~e3), obtemos, exatamente como na Proposição,

Page 32: 2aPARTE - Colorida - Hipertexto (2)

32 CAPÍTULO 4. O DETERMINANTE

ω(~e1, ~e2, ~e3) = (b11b22b33−b11b23b32+b12b23b31−b12b21b33+b13b21b32−b13b22b31)ω(~u,~v, ~w).

Assim, se ω(~u,~v, ~w) = 0, ω será identicamente nula. Em particular, fazendoω = det, podemos concluir que

Proposição 2: det(~u,~v, ~w) 6= 0 se, e somente se, ~u, ~v e ~w forem linearmenteindependentes.

O número

a11a22a33 − a11a23a32 + a12a23a31 − a12a21a33 + a13a21a32 − a13a22a31

é, usualmente, notado por ∣∣∣∣∣∣a11 a12 a13a21 a22 a23a31 a32 a33

∣∣∣∣∣∣e chamado de determinante da matriz a11 a12 a13

a21 a22 a23a31 a32 a33

.

O determinante é, assim, uma forma trilinear alternada dos vetores colunada matriz. Mais precisamente, se representarmos por (aij) a matriz, por |aij|seu determinante e por (aj) cada um dos vetores dados, em coordenadas, por(aj) = (a1j, a2j, a3j), então |aij| é uma forma trilinear alternada do terno devetores ((a1), (a2), (a3)).

Exercício: Demonstre essa última a�rmação. Isto é: mostre, a partir da fórmula,que o determinante é uma forma trilinear alternada dos vetores coluna da matriz.Mostre que o determinante da matriz identidade (aquela que tem aij = 1, sei = j, e aij = 0, se i 6= j) é 1.

Exercício: Mostre, também a partir da fórmula, que o determinante é uma formatrilinear alternada dos vetores linha da matriz (os vetores linha são os (ai) dados,em coordenadas, por (ai) = (ai1, ai2, ai3)).

Page 33: 2aPARTE - Colorida - Hipertexto (2)

B. A FÓRMULA 33

Exercício: Conclua que é nulo o determinante de qualquer matriz em que uma dascolunas é combinação linear das outras duas; o mesmo para matrizes em que umadas linhas é combinação linear das outras duas.

Exercício: Observe que uma forma simples de decorar a fórmula é escrever∣∣∣∣∣∣∣∣∣∣a11 a12 a13a21 a22 a23a31 a32 a33a11 a12 a13a21 a22 a23

∣∣∣∣∣∣∣∣∣∣e observar que os produtos com sinal + são obtidos, seguindo setas↘, partindo dea11, a21 e a31; os com sinal - são obtidos, seguindo setas ↙, partindo de a13, a23 ea33.

Exercício: Usando a fórmula do determinante para matrizes 2× 2, observe que

∣∣∣∣∣∣a11 a12 a13a21 a22 a23a31 a32 a33

∣∣∣∣∣∣ = a11

∣∣∣∣ a22 a23a32 a33

∣∣∣∣− a12 ∣∣∣∣ a21 a23a31 a33

∣∣∣∣+ a13

∣∣∣∣ a21 a22a31 a32

∣∣∣∣ .Exercício: De maneira mais geral, mostre que o determinante |aij | é dado, paraqualquer linha i, por

|aij | =3∑j=1

(−1)i+jaij |aij |,

com |aij | de�nido como o determinante da matriz 2×2 obtida de (aij) pela exclusãoda linha i e da coluna j. Chamaremos de cofator de aij o número (−1)i+j |aij |. Essaterminologia não é unânime: como o determinante |aij | já tem nome (é chamadode determinante menor de aij), usa-se também chamar de cofator de aij onúmero (−1)i+j .

Exercício: Mostre que, para qualquer coluna j, vale

|aij | =3∑i=1

(−1)i+jaij |aij |.

Exercício: Suponha que a matriz (aij) tem determinante não nulo. Seja (bij)a matriz de�nida por bij = (det(aij))

−1(−1)i+j |aji| (note que, a menos do fa-tor (det(aij))

−1, trata-se da transposta da matriz dos cofatores). Mostre que

Page 34: 2aPARTE - Colorida - Hipertexto (2)

34 CAPÍTULO 4. O DETERMINANTE

(aij)(bij) = (δij) ((δij) é a matriz identidade, dada por δij = 0, se i 6= j, eδij = 1, se i = j).

Exercício: Suponha que

x1x2x3

seja solução do sistema

a11x1 + a12x2 + a13x3 = y1a21x1 + a22x2 + a23x3 = y2a31x1 + a32x2 + a33x3 = y3,

ou seja,

y1y2y3

=

a11 a12 a13a21 a22 a23a31 a32 a33

x1x2x3

=

= x1

a11a21a31

+ x2

a12a22a32

+ x3

a13a23a33

.

Observe que, se trocarmos a primeira coluna da matriz

a11 a12 a13a21 a22 a23a31 a32 a33

por y1y2y3

, teremos:

Page 35: 2aPARTE - Colorida - Hipertexto (2)

B. A FÓRMULA 35

det

y1 a12 a13y2 a22 a23y3 a32 a33

=

= det

x1

a11a21a31

+ x2

a12a22a32

+ x3

a13a23a33

a12 a13a22 a23a32 a33

=

= x1det

a11 a12 a13a21 a22 a23a31 a32 a33

+

+x2det

a12 a12 a13a22 a22 a23a32 a32 a33

+ x3det

a13 a12 a13a23 a22 a23a33 a32 a33

=

= x1det

a11 a12 a13a21 a22 a23a31 a32 a33

Logo, se o determinante da matriz (aij) (também chamado de determinante do

sistema) for não nulo, temos:

x1 =

det

y1 a12 a13y2 a22 a23y3 a32 a33

det

a11 a12 a13a21 a22 a23a31 a32 a33

.

Esta é a chamada fórmula de Cramer para a solução do sistema.

Exercício: Obtenha a fórmula de Cramer para x2 e para x3.

Observação: Nosso estudo de determinantes foi apresentado de um pontode vista absolutamente geométrico. Por uma questão de honestidade his-tórica, devemos salientar que a origem do conceito é algébrica (Leibniz játrabalha com a ideia (1693), que vai ser detalhadamente desenvolvida por

Page 36: 2aPARTE - Colorida - Hipertexto (2)

36 CAPÍTULO 4. O DETERMINANTE

MacLaurin (1748) e Cramer(1750); a fórmula dita de Cramer foi obtida, deforma independente e um pouco antes, por MacLaurin). A utilização de de-terminantes para o cálculo de áreas e volumes é posterior (Lagrange (1773),Cauchy (1812)).

c Orientação

Tratemos, agora, de uma questão que vem sendo adiada desde o começodo capítulo (aproveitando a oportunidade para agradecer a boa vontade doleitor que, pacientemente, aguarda as devidas explicações): o que signi�ca,geometricamente, termos um determinante negativo? Ou, de um outro pontode vista, o que distingue os ternos ordenados com determinante negativodaqueles para os quais o determinante é positivo.

Como já sabemos, det(~u,~v, ~w) 6= 0 se e somente se ~u, ~v e ~w são linearmenteindependentes (e, portanto, constituem base para V ). Vamos estabelecer oconceito de orientação.

De�nição: Duas bases ordenadas (~u1, ~u2, ~u3) e (~v1, ~v2, ~v3) têm a mesma ori-entação se existem três funções contínuas ~ε1, ~ε2, ~ε3 : [a, b] → V (com a e breais, a < b) tais que:

(i) ~εi(a) = ~ui, i = 1, 2, 3(ii) ~εi(b) = ~vi, i = 1, 2, 3(iii) ~ε1(t), ~ε2(t), ~ε3(t) sao linearmente independentes ∀t ∈ [a, b]

Chamaremos de deformação entre as bases (~u1, ~u2, ~u3) e (~v1, ~v2, ~v3) um ternode funções contínuas ~ε1, ~ε2, ~ε3 : [a, b]→ V com as três propriedades acima.

Observação: Entenda que duas bases ordenadas têm a mesma orientaçãose e somente se podemos deformar uma na outra de maneira que, durante adeformação, os três vetores permaneçam linearmente independentes o tempotodo. De maneira ainda mais visual, as bases (~u1, ~u2, ~u3) e (~v1, ~v2, ~v3) têma mesma orientação se o paralelepípedo formado por (~u1, ~u2, ~u3) pode serdeformado no formado por (~v1, ~v2, ~v3) sem, em qualquer momento, degenerar(entendido que a deformação deve levar cada ~ui no respectivo ~vi).

Page 37: 2aPARTE - Colorida - Hipertexto (2)

C. ORIENTAÇÃO 37

Observação: Note que ter a mesma orientação é uma relação de equiva-lência: uma base, �cando parada, se deforma em si mesma; se uma base(~u1, ~u2, ~u3) se deforma na base (~v1, ~v2, ~v3) por meio de ~ε1, ~ε2, ~ε3 : [a, b] → V ,podemos usar ~δ1, ~δ2, ~δ3 : [−b,−a]→ V , dadas por ~δi(t) = ~εi(−t), para defor-mar (~v1, ~v2, ~v3) em (~u1, ~u2, ~u3); �nalmente, se a base (~u1, ~u2, ~u3) se deformana base (~v1, ~v2, ~v3) e a base (~v1, ~v2, ~v3) se deforma na base (~w1, ~w2, ~w3), entãopodemos deformar (~u1, ~u2, ~u3) em (~w1, ~w2, ~w3) passando por (~v1, ~v2, ~v3).

Exercício: Explique como podemos deformar (~u1, ~u2, ~u3) em (~w1, ~w2, ~w3) passandopor (~v1, ~v2, ~v3). Isto é, construa, a partir das funções que deformam (~u1, ~u2, ~u3)em (~v1, ~v2, ~v3) e das que deformam (~v1, ~v2, ~v3) em (~w1, ~w2, ~w3), novas funções, quedeformem (~u1, ~u2, ~u3) em (~w1, ~w2, ~w3).

Exercício: Suponha que as bases ordenadas (~u1, ~u2, ~u3) e (~v1, ~v2, ~v3) têm a mesmaorientação. Mostre que as bases ordenadas (~u1, ~u2,−~u3) e (~v1, ~v2,−~v3) têm amesma orientação.

Proposição: Se duas bases ordenadas (~u1, ~u2, ~u3) e (~v1, ~v2, ~v3) têm a mesmaorientação, então det(~u1, ~u2, ~u3) e det(~v1, ~v2, ~v3) têm o mesmo sinal.

Demonstração: Escrevendo (~u1, ~u2, ~u3) e (~v1, ~v2, ~v3) em coordenadas, assim comoas funções contínuas ~ε1, ~ε2, ~ε3 : [a, b]→ V tais que:

(i) ~εi(0) = ~ui, i = 1, 2, 3(ii) ~εi(1) = ~vi, i = 1, 2, 3(iii) ~ε1(t), ~ε2(t), ~ε3(t) sao linearmente independentes ∀t ∈ [a, b],

Temos que a continuidade das ~εi se traduz na continuidade das aij(t), que são asentradas da matriz dada pelas coordenadas dos ~εi(t): a11(t) a12(t) a13(t)

a21(t) a22(t) a23(t)a31(t) a32(t) a33(t)

.

Mas, então, a função f : [a, b]→ IR, dada por

f(t) = det(~ε1(t), ~ε2(t), ~ε3(t)) = a11(t)a22(t)a33(t)− a11(t)a23(t)a32(t)++a12(t)a23(t)a31(t)− a12(t)a21(t)a33(t) + a13(t)a21(t)a32(t)− a13(t)a22(t)a31(t),

Page 38: 2aPARTE - Colorida - Hipertexto (2)

38 CAPÍTULO 4. O DETERMINANTE

é contínua e não se anula (se se anulasse em um certo t, ~ε1(t), ~ε2(t), ~ε3(t) deixa-riam de ser linearmente independentes). Logo, f(a) = det(~u1, ~u2, ~u3) e f(b) =

det(~v1, ~v2, ~v3) não podem ter sinais diferentes.

Questão: Será verdadeira a recíproca? Isto é, supondo det(~u1, ~u2, ~u3) edet(~v1, ~v2, ~v3) tenham o mesmo sinal, então será que as bases ordenadas(~u1, ~u2, ~u3) e (~v1, ~v2, ~v3) têm necessariamente a mesma orientação? Nestecaso, como construir a deformação entre (~u1, ~u2, ~u3) e (~v1, ~v2, ~v3)?

A resposta é sim. Vamos esboçar a construção de uma deformação entre duasbases ordenadas com determinante de mesmo sinal. Vamos proceder em duasetapas: primeiro, mostramos que toda base ortonormal com determinantepositivo tem a mesma orientação que a base canônica (e, consequentemente,toda base ortonormal com determinante negativo tem a mesma orientaçãoque a base (~e1, ~e2,−~e3)); em seguida, mostramos que toda base tem a mesmaorientação que uma base ortonormal (esta, construída pelo processo de Gram-Schmidt).

Teorema: Duas bases ordenadas (~u1, ~u2, ~u3) e (~v1, ~v2, ~v3) têm a mesma ori-entação se, e somente se, det(~u1, ~u2, ~u3) e det(~v1, ~v2, ~v3) têm o mesmo sinal.

Demonstração: Já provamos, na proposição acima, que bases que têm a mesmaorientação têm determinantes com o mesmo sinal. Para cuidar da outra parte,procederemos, conforme anunciado, em duas etapas. Vamos, na verdade, abusarum pouco da intuição, para não fazer boa parte do trabalho sujo...

Etapa 1: Suponhamos que (~ε1, ~ε2, ~ε3) seja uma base ortonormal de V , com de-terminante positivo. Vamos mostrar como deformá-la na base canônica. Vamosfazer duas rotações do espaço, dando como intuitivo que, quando rodamos o espaçotodo em torno de um eixo, bases ortonormais continuam, durante todo o tempoda rotação, bases ortonormais (já que rotações preservam a ortogonalidade e asdistâncias). A primeira rotação, supondo que ~ε1 6= ~e1, destina-se a levar ~ε1 até ~e1.Tomamos, como eixo de rotação, a reta que passa pela origem e é perpendicularao plano formado por ~ε1 e ~e1; rodamos até que ~ε1 coincida com ~e1. No �m dessarotação ~ε1 coincide com ~e1; ~ε2 vai parar em algum outro lugar. Se o novo ~ε2 jácoincidir com ~e2, ótimo; caso contrário, temos que o novo ~ε2 e ~e2 formam um planoperpendicular a ~e1 = ~ε1. Fazemos, então uma nova rotação, em torno da reta quepassa pela origem e tem a direção de ~e1, até que o novo ~ε2 coincida com ~e2.

Chegamos, até aqui, à seguinte situação: temos novos ~ε1, ~ε2, ~ε3, com ~ε1 = ~e1 e ~ε2 =~e2; e o novo ~ε3, onde foi parar? Ora, como rotações não alteram ortogonalidade nem

Page 39: 2aPARTE - Colorida - Hipertexto (2)

C. ORIENTAÇÃO 39

distâncias, o novo ~ε3 é unitário e ortogonal a ~ε1 = ~e1 e a ~ε2 = ~e2. Ora, só existemdois vetores nestas condições: ~e3 e −~e3 (provar isto é um bom exercício!). Mastemos uma informação a mais: o sinal do determinante, durante a deformação, nãomudou de sinal (já que (~ε1, ~ε2, ~ε3) se manteve, o tempo todo, uma base ortonormal);logo, o novo ~ε3 não pode ser −~e3.

Para concluir a etapa 1; observamos que, caso (~δ1, ~δ2, ~δ3) seja uma base ortonormalde V , com determinante negativo, então (~δ1, ~δ2−, ~δ3) é base ortonormal de V , comdeterminante positivo. Como acabamos de provar, existe uma deformação, dadapor três funções, ~ε1, ~ε2, ~ε3 : [a, b] → V , começando em (~δ1, ~δ2−, ~δ3) e terminandoem (~e1, ~e2, ~e3). Trocando a função ~ε3(t) por −~ε3(t), teremos uma deformação de(~δ1, ~δ2, ~δ3) em (~e1, ~e2,−~e3).

Etapa 2: Suponhamos, agora, que (~u1, ~u2, ~u3) é uma base ordenada qualquer. Va-mos deformá-la em uma base ortonormal, usando o processo de Gram-Schmidt.Começamos encolhendo, ou esticando ~u1 até virar ~ε1 = |~u|−1~u (se |~u| > 1, porexemplo, por meio de t 7−→ −t~u, t ∈ [−1,−|~u|−1]). Em seguida, movemos ~u2até ~v2 = ~u2− < ~u2, ~ε1 > ~ε1, por meio de t 7−→ ~u2 − t < ~u2, ~ε1 > ~ε1, t ∈ [0, 1].A seguir, encolhemos, ou esticamos, conforme o caso, ~v2 até virar ~ε2 = |~v2|−1~v2.Agora, tomamos a projeção de ~u3 sobre o plano gerado por ~ε1 e ~ε2, dada por~u0 =< ~u3, ~ε1 > ~ε1+ < ~u3, ~ε2 > ~ε2, e movemos ~u3 até ~v3 = ~u3 − ~u0, por meio det 7−→ ~u3 − t~u0, t ∈ [0, 1]. Finalmente, encolhemos, ou esticamos, conforme o caso,~v3 até virar ~ε3 = |~v3|−1~v3.

Assim, provamos que toda base ordenada com determinante positivo tem a mesmaorientação que a base canônica. E toda base ordenada com determinante negativotem a mesma orientação que a base (~e1, ~e2,−~e3). Como já vimos, duas bases quetêm a mesma orientação que uma terceira têm a mesma orientação. O teoremaestá provado.

De�nição: Uma base ordenada (~u,~v, ~w) tem orientação positiva (nega-tiva) se det(~u,~v, ~w) > 0 (< 0). Neste caso, diz-se também que (~u,~v, ~w) épositivamente orientada (negativamente orientada).

Page 40: 2aPARTE - Colorida - Hipertexto (2)

40 CAPÍTULO 4. O DETERMINANTE

Page 41: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 5

Quatérnions e produto vetorial

a Os quatérnions

Os números complexos começam a entrar na Matemática no século XVI, coma manipulação formal de raízes quadradas de números negativos, dentro doprocesso de cálculo de raízes de polinômios do 3o grau. É apenas na virada doséculo XVIII para o XIX, porém, que passam a ser identi�cados com pontosdo plano e interpretados geometricamente. Um dos maiores entusiastas daidenti�cação de IC com IR2 foi o matemático e físico irlandês William RowanHamilton (Hamilton publicou sua versão da identi�cação entre IC e IR2 em1833). Sua obsessão, naturalmente, já que IR se identi�ca à reta e IC aoplano, passou a ser estender os números complexos a um conjunto numéricoque pudesse ser identi�cado ao espaço IR3 (o que, na verdade, é impossível).1

Em 1843, �nalmente, durante uma caminhada com sua senhora, Hamilton,subitamente,teve a ideia de passar diretamente para um espaço de dimensão4.

Hamilton introduziu dois novos números, j e k, réplicas do imaginário i. Osquatérnions surgem, então, como combinações lineares dos números 1, i, j

1Embora o primeiro trabalho com a interpretação geométrica dos números complexos,devido a Caspar Wessel, tenha sido publicado em 1799 e já abordasse a questão de obteralgo semelhante para o espaço, a ideia só pegou depois que Gauss publicou a sua versão,em 1831. Gauss, na verdade, já tinha a versão geométrica de IC desde 1799 e, tambémtentara achar entidades numéricas que correspondessem ao espaço. O mesmo haviam feitoArgand, em 1806, e Mourey, em 1828. Ao que tudo indica, nenhum sabia dos trabalhosdos demais, nem mesmo Hamilton, que só tomou conhecimento do trabalho de Gauss em1852. Mas a ideia estava no ar...

41

Page 42: 2aPARTE - Colorida - Hipertexto (2)

42 CAPÍTULO 5. QUATÉRNIONS E PRODUTO VETORIAL

e k, ou seja, são números da forma

t+ xi+ yj + zk,

com t, x, y e z reais. Hamilton utilizava, originalmente, a letra w no lugar det. Usar t, porém, não trai a memória do irlandês, que já em 1828, publicaraum trabalho em que falava da indissociável conexão entre espaço e tempo.

b O produto escalar e o produto vetorial

A adição de quatérnions se faz da maneira mais natural:

(t1 + x1i+ y1j + z1k) + (t2 + x2i+ y2j + z2k) =

= (t1 + t2) + (x1 + x2)i+ (y1 + y2)j + (z1 + z2)k.

Já a multiplicação, associativa e distributiva em relação à adição, �ca de�nidapela fórmula que, entusiasmado, o próprio Hamilton gravou com o caniveteem uma pedra da Brougham Bridge no instante seguinte à descoberta:2

i2 = j2 = k2 = ijk = −1.

Exercício: Deduza, da fórmula acima, que

ij = k = −ji, jk = i = −kj, ki = j = −ik.

Assim, a multiplicação de quatérnions não é comutativa (propor númeroscom multiplicação não comutativa, para a época, era uma ousadia).

Os quatérnions tiveram, como subproduto, um papel decisivo na consolidaçãoda ideia de vetor: de fato, o próprio Hamilton introduz os termos escalar evetor para designar, respectivamente, a parte real (t) e a parte imaginária(xi + yj + zk) de um quatérnion (observe que, para todos os efeitos, osquatérnions i, j e k correspondem aos vetores ~e1, ~e2 e ~e3, que compõem abase canônica do espaço V ). Isso tem consequências interessantíssimas. Se

2Esta história foi relatada pelo próprio Hamilton, anos depois, em uma carta a seu �lhoArchibald

Page 43: 2aPARTE - Colorida - Hipertexto (2)

B. O PRODUTO ESCALAR E O PRODUTO VETORIAL 43

multiplicarmos quatérnions sem parte escalar, ou seja, dois vetores, x1i +y1j + z1k e x2i+ y2j + z2k, obtemos (faça as contas):

−(x1x2 + y1y2 + z1z2) + (y1z2 − z1y2)i+ (z1x2 − x1z2)j + (y1z2 − z1y2)k.

Ou seja, o produto (como quatérnions) de dois vetores é um quatérnion quetem uma parte escalar:

−(x1x2 + y1y2 + z1z2)

e uma parte vetorial:

(y1z2 − z1y2)i+ (z1x2 − x1z2)j + (x1y2 − y1x2)k.

A primeira resulta ter, como já sabemos, uma importante interpretação ge-ométrica, pois, a menos do sinal, é o nosso já estudado produto escalar.3

Ocupemo-nos da segunda, que recebe, naturalmente, o nome de produtovetorial.

De�nição: Dados os vetores ~u = x1~e1 + y1~e2 + z1~e3 e ~v = x2~e1 + y2~e2 + z2~e3,seu produto vetorial, designado por ~u⊗ ~v ou por ~u× ~v, é de�nido por

~u⊗ ~v = (y1z2 − z1y2)~e1 + (z1x2 − x1z2)~e2 + (x1y2 − y1x2)~e3.

Observação: por conta da evidente identi�cação entre os quatérnions i, j e ke os vetores ~e1, ~e2 e ~e3, ainda hoje é usual designar os vetores da base canônicade V por i, j e k. Também o faremos, ocasionalmente. Neste sentido, éparticularmente útil a apresentação do produto vetorial de ~u = x1i+y1j+z1ke ~v = x2i+ y2j + z2k como um determinante:∣∣∣∣∣∣

i j kx1 y1 z1x2 y2 z2

∣∣∣∣∣∣3Não deixa de ser admirável o fato de que este produto, tão geométrico, tenha nascido

de devaneios puramente algébricos. Mais admirável ainda é o fato de que, em se tratandode história do produto escalar, ainda não contamos, nem vamos contar neste texto, damissa a metade

Page 44: 2aPARTE - Colorida - Hipertexto (2)

44 CAPÍTULO 5. QUATÉRNIONS E PRODUTO VETORIAL

Exercício: Veri�que que o determinante acima é, de fato, igual ao produto vetorial(observe que a fórmula do determinante pode, de fato, ser aplicada não apenas amatrizes cujas entradas sejam números reais, mas também àquelas em que as en-tradas sejam complexos, quatérnions, ou mesmo outras coisas que se multipliquem,se somem e se subtraiam).

Exercício: Prove que o produto vetorial tem as seguintes propriedades:

(i) ~u⊗ (t~v1 + ~v2) = t(~u⊗ ~v1) + (~u⊗ ~v2) ∀ t, ~u,~v1, ~v2(ii) ~u⊗ ~v = −~v ⊗ ~u ∀ ~u,~v

Exercício: Conclua, do exercício acima, que ~u⊗ ~u = ~0 ∀ ~u e que

(t~u1 + ~u2)⊗ ~v = t(~u1 ⊗ ~v) + (~u2 ⊗ ~v) ∀ t, ~u1, ~u2, ~v.

Exercício: Mostre que ~u⊗~v = ~0 se, e somente se, ~u e ~v são linearmente dependentes.

Exercício: Mostre, com um exemplo, que o produto vetorial não é associativo.

Exercício: Calcule, dados ~u,~v e ~w,

(~u⊗ ~v)⊗ ~w + (~v ⊗ ~w)⊗ ~u+ (~w ⊗ ~u)⊗ ~v.

c Interpretação geométrica do produto vetorial

A primeira propriedade geométrica do produto vetorial a ser destacada é:~u⊗ ~v é perpendicular a ~u e a ~v, ou seja,

< ~u, ~u⊗ ~v >= 0 =< ~v, ~u⊗ ~v > .

A demonstração é uma simples conta, mas �ca mais sugestiva se observarmosque, se ~w = xi+ yj + zk, então

< ~w, ~u⊗ ~v >=

∣∣∣∣∣∣x y zx1 y1 z1x2 y2 z2

∣∣∣∣∣∣ .Exercício: Conclua, da identidade acima, que

0 ≤< ~u⊗ ~v, ~u⊗ ~v >= det(~u⊗ ~v, ~u,~v).

Page 45: 2aPARTE - Colorida - Hipertexto (2)

C. INTERPRETAÇÃO GEOMÉTRICA DO PRODUTO VETORIAL 45

Assim, como ~u ⊗ ~v = ~0 se e somente se ~u e ~v são linearmente dependentes,temos que, se ~u e ~v são linearmente independentes, então det(~u⊗~v, ~u,~v) > 0 e,portanto, (~u⊗~v, ~u,~v) é uma base ordenada para V , com a mesma orientaçãoque a base canônica

Cuidemos, agora, de uma propriedade menos evidente: o comprimento(norma) de ~u ⊗ ~v é igual à área do paralelogramo formado por ~u e~v. Ou seja: se θ é o ângulo entre ~u e ~v, então

|~u⊗ ~v| = |~u||~v| sin θ.

A demonstração lançará mão de dois resultados geométricos que enunciamose demonstramos a seguir.

Proposição: Sejam α e β planos que se cortam segundo o ângulo θ. Se F éuma �gura em β e F sua projeção ortogonal sobre α, então

areadeF = cos θ areadeF.

Demonstração: Podemos desconsiderar os casos θ = 0 e θ = π/2, em que o resul-tado é evidente. Chamemos de r a reta interseção entre α e β.

Para obter a área de F , ladrilhemos o plano β com retângulos de lados paralelos ouperpendiculares a r. Projetando-os ortogonalmente a α, obtemos um ladrilhamentode α com retângulos também de lados paralelos ou perpendiculares a r. Mas se Ré um dos ladrilhos de β e R é sua projeção em α, o lado de R paralelo a r tem seucomprimento preservado pela projeção, enquanto que o lado perpendicular a r, aoser projetado, tem seu comprimento multiplicado por cos θ. Logo, a área de R éigual à de R multiplicada por cos θ. Fazendo aproximações por dentro e por forade F com ladrilhos como acima e observando as correspondentes aproximações deF , obtemos o resultado por passagem ao limite.

O segundo resultado é uma interessante generalização do Teorema de Pitá-goras.

Teorema: Considere um sistema de três planos, α1, α2 e α3, dois a doisortogonais. Dados um quarto plano β e uma �gura F em β, sejam F1, F2 eF3 as projeções ortogonais de F sobre, respectivamente, α1, α2 e α3. Entãoas áreas das �guras, dadas por |F |, |F1|, | F2| e |F3|, satisfazem à relação:

Page 46: 2aPARTE - Colorida - Hipertexto (2)

46 CAPÍTULO 5. QUATÉRNIONS E PRODUTO VETORIAL

Figura 5.1:

|F |2 = |F1|2 + | F2|2 + |F3|2.

Demonstração: Podemos supor que os planos αi são normais aos vetores ~ei, deforma que, se chamarmos de θi o ângulo entre αi e β e de ~n um vetor unitário enormal a β, teremos θi igual ao ângulo entre ~ei e ~n (o ângulo entre dois planos éigual ao ângulo entre seus vetores normais4). Assim, se ~n é dado, na base canônica,por ~n = n1 ~e1 + n2 ~e2 + n3 ~e3, temos

cos θi = | < ~n,~ei > | = ni.

Mas, então,

|Fi|2 = (|F | cos θi)2 = |F |2n2i .

Logo,

4há, na realidade "dois" ângulos possíveis entre os normais, mas seus cossenos diferemapenas pelo sinal

Page 47: 2aPARTE - Colorida - Hipertexto (2)

D. DETERMINANTES E VOLUME, DE NOVO 47

|F1|2 + | F2|2 + |F3|2 = |F |2(n21 + n22 + n23) = |F |2,

já que ~n é unitário.

Consideremos agora os vetores ~u e ~v, dados, em coordenadas, por ~u =(x1, y1, z1) e ~v = (x2, y2, z2). Vamos provar que a norma de ~u ⊗ ~v é igualà área do paralelogramo F formado por ~u e ~v, examinando as projeções de Fnos planos coordenados e aplicando o teorema que acabamos de demonstrar.Chamaremos de αi o plano coordenado normal ao vetor ~ei; ~ui e ~vi serão asprojeções respectivas de ~u e ~v sobre αi. Em coordenadas, teremos (faça osdesenhos, se precisar):

~u1 = (y1, z1) ~u2 = (z1, x1) ~u3 = (x1, y1)~v1 = (y2, z2) ~v2 = (z2, x2) ~v3 = (x2, y2)

Chamando de Fi a projeção ortogonal de F sobre αi, temos que Fi é o parale-logramo formado por ~ui e ~vi. Ora, pelo que aprendemos sobre determinantesde matrizes 2× 2, a área de Fi é o módulo do determinante de ~ui e ~vi, e essedeterminante é a i-ésima coordenada de ~u⊗ ~v, ou seja:

~u⊗ ~v = (y1z2 − z1y2)~e1 + (z1x2 − x1z2)~e2 + (x1y2 − y1x2)~e3,

e

|F1| = |y1z2 − z1y2|,|F1| = |z1x2 − x1z2|,|F1| = |x1y2 − y1x2|

Aplicando o teorema, temos imediatamente

|F |2 = |F1|2 + | F2|2 + |F3|2 = |~u⊗ ~v|2,

o que completa a prova

d Determinantes e volume, de novo

No capítulo referente ao determinante, usamos como, ponto de partida abusca de algo que correspondesse ao volume do paralelepídedo p gerado

Page 48: 2aPARTE - Colorida - Hipertexto (2)

48 CAPÍTULO 5. QUATÉRNIONS E PRODUTO VETORIAL

pelos vetores ~u, ~v e ~w. Naquela ocasião, demos como óbvio que o volumecom sinal deveria ser uma forma trilinear alternada em ~u, ~v e ~w.5 O leitor,com razão, pode não ter achado tão óbvio assim. Voltemos, pois, ao assunto,agora fortalecidos por nossos conhecimentos sobre o produto vetorial. Comojá sabemos que a área do paralelogramo formado por ~v e ~w é a norma de~v ⊗ ~w, podemos obter o volume de p multiplicando |~v ⊗ ~w| pela projeção de~u na direção normal ao plano de p.

Figura 5.2:

Ora, como já vimos, ~v ⊗ ~w é normal ao plano de p. Basta, pois, tomar

< ~u,~v ⊗ ~w >,

observando que o sinal será positivo se ~u e ~v ⊗ ~w estiverem do mesmo ladodo plano, negativo se estiverem em lados opostos. Ora, é fácil ver que, noprimeiro caso, a base (~u,~v, ~w) tem orientação positiva e, no segundo, temorientação negativa. Também é claro que o volume de p, dado por ~u · ~v ⊗ ~w(que costuma ser chamado de produto misto de ~u e ~v ⊗ ~w), é dado, se~u = (x1, y1, z1), ~v = (x2, y2, z2) e ~w = (x3, y3, z3), pelo determinante

5óbvio, pelo menos, a partir de nossa experiência com o determinante de dois vetores,no plano

Page 49: 2aPARTE - Colorida - Hipertexto (2)

E. O MÓDULO 49

∣∣∣∣∣∣x1 y1 z1x2 y2 z2x3 y3 z3

∣∣∣∣∣∣ =

∣∣∣∣∣∣x1 x2 x3y1 y2 y3z1 z2 z3

∣∣∣∣∣∣ .Agora sim, podemos acreditar que

volume de p = < ~u,~v ⊗ ~w > = det(~u,~v, ~w).

Exercício: Suponha que ~u e ~v ⊗ ~w estão do mesmo lado em relação ao plano de p.Construa uma deformação entre as bases ordenadas (~u,~v, ~w) e (~v ⊗ ~w,~v, ~w).

e O módulo

Dado um quatérnion q = t + xi + yj + zk, seu módulo é, naturalmente,de�nido por

|q| =√t2 + x2 + y2 + z2.

Um quatérnion de módulo igual a 1 é dito unitário. Chamando xi+ yj + zkde ~v e de�nindo o conjugado de q = t+ ~v por q′ = t− ~v, temos

|q|2 = t2 + |~v|2 = qq′.

Daí decorre que todo quatérnion q não nulo tem por inverso multiplicativo oquatérnion q−1 dado por

q−1 =q′

|q|2.

Menos evidente é a desigualdade triangular, |q1 + q2| ≤ |q1| + |q2|, quedecorre de ser < q1, q2 >= q1q

′2 um produto escalar e da desigualdade de

Cauchy-Schwarz-Buniacóvsqui. Mas a propriedade mais emocionante é dadana Proposição a seguir.

Proposição: Dados dois quatérnions, q1 e q2, vale

|q1q2| = |q1||q2|.

Page 50: 2aPARTE - Colorida - Hipertexto (2)

50 CAPÍTULO 5. QUATÉRNIONS E PRODUTO VETORIAL

Demonstração: Escrevendo q1 = r + ~u e q2 = s+ ~v, temos:

|q1q2|2 = |rs+ r~v + s~u− < ~u,~v > +~u⊗ ~v|2 == |rs− < ~u,~v > |2 + |r~v + s~u|2 + |~u⊗ ~v|2 == (rs)2 − 2rs < ~u,~v > + < r~v + s~u, r~v + s~u > + < ~u,~v >2 +|~u⊗ ~v|2 == r2s2 + r2|~v|2 + s2|~u|2 + |~u|2|~v|2 = |q1|2|q2|2.

Exercício: Mostre que, dados dois quatérnions, q1 e q2, vale (q1q2)′ = q′2q

′1.

f Quatérnions e rotações

Consideremos o problema de rodar os pontos do espaço, de um ângulo θ,em torno do eixo passando pela origem e dado pelo vetor ~u. Vamos supor,para facilitar as contas, que ~u é unitário. Suporemos, também, que, "vistode ~u", o plano α, perpendicular a ~u e passando pela origem, roda no sentidotrigonométrico. Chamaremos de R a transformação que associa, a cada vetor~v, seu rodado.

Seja ~v um vetor qualquer. Comecemos decompondo ~v como soma de um vetor~v0, na direção de ~u, e outro, ~w, perpendicular a ~u, isto é, em α. Usando oproduto escalar, temos:

~v0 =< ~v, ~u > ~u.

Exercício: Veri�que que R~v = ~v0 +R~w.

Agora, vamos usar o produto vetorial de maneira um pouco menos evidente:

~u⊗ ~v = ~u⊗ (~w + ~v0) = ~u⊗ ~w.

Chamando ~u⊗~v de ~w⊥, temos ~w = ~w⊥⊗~u e R~w = cos θ ~w+ sin θ ~w⊥. Assim,

R~v =< ~v, ~u > ~u+ cos θ (~u⊗ ~v)⊗ ~u+ sin θ ~u⊗ ~v.

Exercício: Con�ra.

Vejamos, agora, como o mesmo resultado pode ser obtido com quatérnions.Considere os quatérnions

Page 51: 2aPARTE - Colorida - Hipertexto (2)

F. QUATÉRNIONS E ROTAÇÕES 51

q = cosθ

2+ sin

θ

2~u, q′ = cos

θ

2− sin

θ

2~u.

Exercício: Entenda isso (pense o vetor ~u como ~u = ai + bj + zk). Mostre queqq′ = q′q = 1.

Exercício: Pense o vetor ~v como um quatérnion (~v = xi+ yj + zk). Faça as contas(não é preciso usar coordenadas) e mostre que

R~v = q~vq′.

Assim, rotações são reduzidas a multiplicações por quatérnions unitários.Não chega a ser grande coisa, mas simpli�ca um pouco a vida, quando setrata de compor rotações. De fato, se q1 e q2 correspondem às rotações R1

e R2, dadas, respectivamente, por ângulos θ1 e θ2 e eixos ~u1 e ~u2, então acomposta R = R1R2 é dada por

R~v = R1(R2~v) = q1(q2~vq′2)q′1 = q~vq′,

com q = q1q2. Como o produto de quatérnions unitários é um quatérnionunitário, segue um resultado não tão evidente.

Proposição: A composta de duas rotações em torno de eixos passando porum mesmo ponto O é uma rotação em torno de eixo passando por O.

Demonstração:

Page 52: 2aPARTE - Colorida - Hipertexto (2)

52 CAPÍTULO 5. QUATÉRNIONS E PRODUTO VETORIAL

Page 53: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 6

Vista em perspectiva

a O problema

Consideremos um problema básico de realidade virtual: a visualização deuma cena. À moda dos pintores renascentistas, vamos procurar representarem um plano os pontos do espaço. Fixamos um ponto de vista P0 (quecorresponde ao olho do pintor) e um plano α (que corresponde ao quadro),tal que P0 /∈ α. A ideia é representar em α cada ponto P do espaço (àexceção do plano cego α0, paralelo a α e passando por P0). A representaçãose faz por meio do ponto P de α, obtido pela interseção com α da reta PP0.

Figura 6.1:

53

Page 54: 2aPARTE - Colorida - Hipertexto (2)

54 CAPÍTULO 6. VISTA EM PERSPECTIVA

Embora um olho de verdade não enxergue para trás, não excluiremos ospontos que estão atrás do plano α0. Em problemas concretos, em que sejanecessário olhar apenas para a frente, podemos, �xando um vetor ~u normala α (e apontando de P0 para α), projetar apenas os pontos P que para os

quais seja positivo o produto escalar <→P0P , ~u >.

Exercício: Certi�que-se de que entendeu esse último parágrafo.

Temos, porém, um problema adicional. O ponto P é dado em IR3 por suascoordenadas (x, y, z); o que queremos é não apenas determinar o ponto P :precisamos de um sistema de coordenadas em α e de uma fórmula que nosdê, em função de (x, y, z), as coordenadas (u, v) de P nesse sistema.

Consideremos como dados do problema:

(i) O ponto P0 = (x0, y0, z0);(ii) A distância de P0 a α, dada pelo número positivo d;(iii) O vetor ~n = (a, b, c), normal a α, com a2 + b2 + c2 = 1 e tal que

O = P0 + d~n esteja em α.

Devemos, agora, �xar um sistema de coordenadas em α. É razoável quecoloquemos a origem em O = P0 + d~n. Resta escolher uma base (e é bomque seja ortonormal) (~ε1, ~ε2) para nosso sistema. Os vetores ~ε1 e ~ε2 deverão,claro, ser paralelos ao plano α.

b O sistema de coordenadas

Comecemos pelo caso mais simples, em que a base (~ε1, ~ε2) já vem pronta. Estepode ser o caso, numa situação de videogame, em que uma nave passeia porum cenário virtual. Neste caso, embora a visão da cena pelo piloto varie como tempo (o próprio cenário, em princípio, também varia com o tempo, já quealguns dos objetos podem ser móveis), nosso problema é, �xado um instante,exibir na tela o que seria a janela diante do piloto, naquele instante. Teríamos,pois, o ponto P0, dado pelas coordenadas atuais do olho do piloto1, o vetor~n (obtido pela posição atual do eixo da fuselagem da nave, por exemplo), o

1ele tem dois, o que signi�ca que, para um game tridimensional, devemos determinar,separadamente, a visão de cada um dos olhos

Page 55: 2aPARTE - Colorida - Hipertexto (2)

C. A SOLUÇÃO 55

vetor ~ε1 (perpendicular a ~n e, neste caso, no plano das asas, apontando paraa direita), o vetor ~ε2, perpendicular a ~ε1 e a ~n, apontando para cima. Adistância d é a do olho do piloto à superfície da janela. O plano α é, claro,dado pelo ponto O = P0 + d~n e pelos vetores ~ε1 e ~ε2.

Em uma outra situação, podemos imaginar que o observador P0 sobrevoa acena livremente, e olha em uma direção, dada pelo vetor ~n. O plano α é,então, é normal a ~n, a uma distância d dada. Neste caso, supondo que o vetor~ε1 foi de�nido por algum critério, tomamos ~ε2 = ~ε1 ⊗ ~n. Uma possibilidadeé, arbitrando que ~n nunca será vertical, determinar que ~ε1 seja horizontal.2

Exercício: Note que o conjunto dos vetores unitários ~n = (a, b, c) é a esfera

S2 ={

(a, b, c) ∈ IR3 | a2 + b2 + c2 = 1}.

Se o vetor ~ε1(~n) é normal a ~n, então ~ε1 é tangente a S2. Assim, criar, paracada ~n em S2, um cabelo ~ε1(~n), tangente a S2 e dependendo continuamentede ~n, equivale a pentear uma bola cabeluda.Exercício: Suponha que ~n = (a, b, c) seja não vertical (|c| 6= 1) e que ~ε1 = (a1, b1, c1)seja horizontal, normal a ~n e aponte para a direita. Traduza horizontal por ter aterceira coordenada, c1, nula e apontar para a direita por ser positiva a terceiracoordenada, c2, de ~ε2 = (a2, b2, c2) = ~ε1 ⊗ ~n. Calcule, em função de a, b, e c, osvetores unitários ~ε1 e ~ε2. Resposta:

~ε1 = 1|~n⊗ ~e3|~n⊗ ~e3 , ~ε2 = ~ε1 ⊗ ~n.

Exercício: Suponha que, mantido o plano α, no qual temos um sistema de coorde-nadas (~ε1, ~ε2), queiramos obter um novo sistema, (~δ1, ~δ2), rodando o anterior, nosentido trigonométrico (visto de P0), de um ângulo θ. Calcule ~δ1 e ~δ2. Resposta:

~δ1 = cos θ ~ε1 + sin θ ~ε2,~δ2 = − sin θ ~ε1 + cos θ ~ε2.

c A solução

2Um teorema, conhecido comoTeorema da Bola Cabeluda, garante que é impossívelcriar uma função contínua que nos desse, para cada vetor unitário ~n, um vetor ~ε1(~n),unitário e ortogonal a ~n; assim, nossa decisão de excluir ~n vertical tem sua razão de ser

Page 56: 2aPARTE - Colorida - Hipertexto (2)

56 CAPÍTULO 6. VISTA EM PERSPECTIVA

Compreendida qual é a questão e estabelecida a base (~ε1, ~ε2) para o sistemade coordenadas, a solução é relativamente simples. Está baseada em trêsobservações simples:

(i) O plano α é caracterizado por

Q ∈ α ⇔ < q − P0, ~n >= d.

Exercício: Entenda, geometricamente, isso (faça uma �gura).

(ii) Dado P em IR3 \ α0, o correspondente P em α é caracterizado porP − P0 = t (P − P0)

< P − P0 , ~n >= d,

o que nos dá

P − P0 =d

< P − P0 , ~n >(P − P0).

Exercício: Veri�que se entendeu isso.

(iii) As coordenadas de P em α, (u, v), são dadas por

u =< P −O , ~ε1 > ; v =< P −O , ~ε2 > .

Como

P − P0 = P −O +O − P0 = P −O + d~n

e

< ~n, ~ε1 > = 0 = < ~n, ~ε2 >,

temos

u =< P − P0 , ~ε1 > ; v =< P − P0 , ~ε2 > .

Exercício: Veja se entendeu.

Finalmente, obtemos as fórmulas:

Page 57: 2aPARTE - Colorida - Hipertexto (2)

D. PONTOS DE FUGA 57

u = d< P − P0 , ~ε1 >

< P − P0 , ~n >;

v = d< P − P0 , ~ε2 >

< P − P0 , ~n >.

Em coordenadas, lembrando que

P0 = (x0, y0, z0), ~n = (a, b, c), ~ε1 = (a1, b1, c1), ~ε2 = (a2, b2, c2),

temos: as coordenadas (u, v), no sistema com origem em O = P0 + d~n e base(~ε1, ~ε2), do ponto P de α, são dadas, em função das coordenadas (x, y, z) doponto P , por

u = da1(x− x0) + b1(y − y0) + c1(z − z0)a(x− x0) + b(y − y0) + c(z − z0)

;

v = da2(x− x0) + b2(y − y0) + c2(z − z0)a(x− x0) + b(y − y0) + c(z − z0)

.

Observação: Note que o denominador < P − P0 , ~n >= a(x − x0) + b(y −y0) + c(z − z0) se anula exatamente nos pontos P = (x, y, z) do plano cego

α0, que passa por P0 e é normal a ~n. Observe também que todos os pontosP de qualquer reta passando por P0 serão de fato, pelas fórmulas, projetadosem um único ponto.

Exercício: Observe que a vista em perspectiva não preserva paralelismo. Mostre,também que, mesmo que os pontos A,B,C e D estejam sobre a mesma reta, comas distâncias entre A e B e entre C e D iguais, não necessariamente temos asdistâncias entre A e B e entre C e D iguais.

d Pontos de fuga

Tradicionalmente, no desenho técnico de engenharia e arquitetura, existemmuitas retas paralelas a traçar. Uma observação importante, quando sãoapresentadas em Perspectiva (Cônica), é que retas de mesma direção se en-

contram, no in�nito, em um mesmo ponto. Ocorre, em Perspectiva, que se o

Page 58: 2aPARTE - Colorida - Hipertexto (2)

58 CAPÍTULO 6. VISTA EM PERSPECTIVA

feixe de paralelas considerado não é paralelo ao plano α, então as retas proje-tadas se encontram, efetivamente, em um ponto de α. Tal ponto é chamadode ponto de fuga da direção considerada.

Figura 6.2:

Exercício: Pense no parágrafo acima. Observe que, para determinar o ponto defuga de uma certa reta r (e, portanto, de todas a ela paralelas), basta tomar ainterseção com α da reta r0 que passa por P0 e é paralela a r.

Vejamos o que dizem nossas fórmulas...Consideremos um feixe de retas pa-ralelas, isto é, �xemos um vetor ~w (que não seja paralelo ao plano α, ou seja,tal que < ~w,~n >6= 0). O feixe considerado é composto por todas as retasque têm a direção de ~w.

Seja r uma reta do feixe. Se Q é um ponto �xado de r, os pontos de r são daforma P = Q+ t~w, t ∈ IR. Substitutindo nas fórmulas para u e v, obtemos:

u(t) = d< Q− P0 , ~ε1 > +t < ~w , ~ε1 >

< Q− P0 , ~n > +t < ~w ,~n >;

v(t) = d< Q− P0 , ~ε2 > +t < ~w , ~ε2 >

< Q− P0 , ~n > +t < ~w ,~n >.

Observando que, em ambas as fórmulas, temos quocientes de polinômios doprimeiro grau na variável t, é fácil achar nosso ponto de fuga, passando aolimite quando |t| → ∞. Obtemos, independente de Q, as coordenadas

Page 59: 2aPARTE - Colorida - Hipertexto (2)

D. PONTOS DE FUGA 59

u∞ = d< ~w , ~ε1 >

< ~w ,~n >;

v∞ = d< ~w , ~ε2 >

< ~w ,~n >.

Exercício: Veja se entendeu. Observe que, se tomarmos a reta r0 que passa por P0

e tem a direção de ~w, todos os pontos de r0 se projetam sobre (u∞, v∞).

Exercício: Observe que, se considerarmos todas as retas que são paralelas a umcerto plano β, não paralelo a α, o conjunto de seus pontos de fuga é a interseçãoα ∩ β0, sendo β0 o plano paralelo a β e passando por P0.

Exercício: Observe que, se a reta r não é paralela a α e não passa por P0, então suavista em perspectiva é a união de duas semirretas abertas, situadas sobre a retainterseção de α com o plano de�nido por P0 e r. Note que as duas se encontramno ponto de fuga; uma representa os pontos à frente de P0; a outra representa ospontos que estão atrás de P0.

Exercício: Habitualmente, considera-se o plano do quadro como sendo vertical e sedá particular importância às retas horizontais. Observe que os pontos de fuga des-sas retas estão sobre a reta horizontal se α, situada à altura de P0 (chamada linhado horizonte). Faça as contas neste caso, supondo que o plano α corresponde ay = 0 e que P0 = (0,−d, h). Tome ~ε1 = ~e1 e ~ε2 = ~e3.

Exercício: Ponha um cubo sobre a mesa, escolha um ponto de vista e desenhe-o.

Exercício: Faça, à mão, o caso de um cubo de aresta 1, visto de um ponto situadosobre a reta passando por dois vértices opostos, com o quadro perpendicular àmesma reta.

Exercício: Faça um programa para que o computador desenhe a vista em perspec-tiva do paralelogramo de vértices ~0, ~u, vb, ~w, ~u+~v,~v+ ~w, ~w+ ~u, ~u+~v+ ~w, dados oponto de vista P0 = (x0, y0, z0), ~n = (a, b, c), com a2 +b2 +c2 = 1 e |c| 6= 1 e d > 0,com ~ε1 horizontal. Aplique-o ao caso em que ~u = ~e1, ~v = ~e2, ~w = ~e3, P0 = (3, 3, 3)

e ~n = −(√

3/3,√

3/3,√

3/3).

Page 60: 2aPARTE - Colorida - Hipertexto (2)

60 CAPÍTULO 6. VISTA EM PERSPECTIVA

Page 61: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 7

Compacti�cações do plano e doespaço

O capítulo precedente fez aparecerem os pontos no in�nito: mesmo se,no espaço, ao seguirmos sempre em frente sobre uma reta, não chegamos alugar algum, a vista em perspectiva faz aparecer um ponto que materializaesse lugar algum, sob a forma de ponto de fuga. Na verdade, é claro que apossibilidade de se acrescentarem a uma reta pontos no in�nito não dependeda Perspectiva; vamos abordá-la mais livremente.

A primeira �gura é a que nos permite ver uma bijeção entre uma reta eum segmento de reta (aberto), entortado para virar um semicírculo. A partirdela, é óbvio o que fazer para acrescentar à reta dois pontos no in�nito.

Figura 7.1:

Exercício: Seja x a distância do ponto P , da reta, até a origem O. Suponha que oraio do círculo é 1. Expresse o arco, da origem O até a imagem de P , em funçãode x.

61

Page 62: 2aPARTE - Colorida - Hipertexto (2)

62 CAPÍTULO 7. COMPACTIFICAÇÕES DO PLANO E DO ESPAÇO

Exercício: Considere a aplicação f : IR→]− 1, 1[ dada por

f(x) =x

1 + |x|.

Mostre que f é uma bijeção e que

limx→−∞

f(x) = −1; limx→∞

f(x) = 1.

A segunda �gura nos dá nova bijeção entre reta e segmento aberto, mas, destavez, nos sugere como acrescentar à reta um único ponto no in�nito. Oponto f(P ) é obtido ligando P = (x, 0) a N = (0, 1) e tomando a interseção

entre a semirreta aberta−→NP e o círculo umitário de centro em (0, 0).

Figura 7.2:

Exercício: Trabalhando com coordenadas no plano, calcule, para cada (x, 0) no eixohorizontal, as coordenadas de sua imagem (x, y) no círculo unitário.

As duas ideias acima podem ser, facilmente, estendidas ao plano. A primeira�gura, a seguir, nos dá uma bijeção entre o plano e uma semiesfera (aberta).Podemos, a partir dela, acrescentar dois pontos no in�nito a cada reta.

Exercício: Suponha que o plano é Oxy e que a esfera é dada por x2+y2+(z−1)2 =1, z < 1. Seja P o ponto de Oxy cujas coordenadas são (x, y, 0). Determine, em

Page 63: 2aPARTE - Colorida - Hipertexto (2)

63

Figura 7.3:

função de (x, y), as coordenadas (x, y, z) da imagem de P , obtida pela interseçãoentre a esfera e a semirreta aberta que parte do centro da esfera e passa por P .

Exercício: Mostre que retas paralelas compartilham os mesmos pontos no in�nito.

Exercício: Seja D ={x = (x1, x2) ∈ IR2 | |x|2 = x21 + x22 < 1

}. Seja f : IR2 → D

dada por

f(x) =1

1 + |x|x =

1

1 +√x21 + x22

(x1, x2).

1. Mostre que, se v é um vetor do plano de norma 1 (|v| = 1) e A é um pontoqualquer do plano, então

limt→∞

f(A+ tv) = v; limt→−∞

f(A+ tv) = −v.

2. Conclua que podemos usar f para acrescentar ao plano pontos no in�nito,dois por reta, de forma que retas paralelas se encontrem no in�nito.

A próxima �gura corresponde à seguinte transformação: sendo S2 a esferaunitária de centro na origem, ligamos cada ponto P do plano horizontal Oxy

Page 64: 2aPARTE - Colorida - Hipertexto (2)

64 CAPÍTULO 7. COMPACTIFICAÇÕES DO PLANO E DO ESPAÇO

ao polo norte N = (0, 0, 1), obtendo o ponto P 6= N em que a reta passandopor P e por N corta S2.

Figura 7.4:

Obtemos, assim, uma bijeção entre o plano horizontal e a esfera menos umponto (S2 \ {N}). O ponto N pode, então, ser visto como o ponto noin�nito, para o qual converge tudo que vai para bem longe. Essa bijeção éconhecida como a projeção estereográ�ca.

a A projeção estereográ�ca

Além de nos fornecer um belo modelo de compacti�cação do plano, comum único ponto no in�nito, a projeção estereográ�ca tem uma propriedadenotável: a conservação de ângulos.

Proposição: Sejam r e s retas do plano Oxy que se cortam, no ponto P ,segundo o ângulo θ. Suas imagens pela projeção estereográ�ca, os círculosf(r) e f(s), se cortam em f(P ) segundo o mesmo ângulo θ.

Demonstração: Comecemos observando que f(r) é dado pela interseção entre S2 eo plano que contém r e passa por N . Assim, f(r) é um círculo c que passa por

Page 65: 2aPARTE - Colorida - Hipertexto (2)

A. A PROJEÇÃO ESTEREOGRÁFICA 65

Figura 7.5:

N , do qual excluímos N . Como N é o ponto de c mais distante de r, a tangentea c em N é paralela a r. O mesmo raciocínio vale para f(s). Assim, os círculoscorrespondentes a f(r) e f(s) se cortam, em N segundo o ângulo θ. Ora, os mesmoscírculos se cortam, também, em f(P ). Por simetria (em relação ao plano passandopelo ponto médio entre N e f(P ) e normal à reta Nf(P )), o ângulo entre f(r) ef(s) em f(P ) é, também, θ.

Exercício: Mostre (ou, pelo menos, observe) que a orientação do ângulo será pre-servada se olharmos de dentro da esfera.

Exercício: Para uma demonstração alternativa, mas similar, da proposição, consi-dere os planos α1 e α2, tangentes a S2, respectivamente, em f(P ) e emN ; considere,também, os planos β1, de�nido por r e N , e β2, de�nido por s e N ; a interseçãoentre α1 e β1 nos dá a tangente a f(r) em f(P ); da mesma forma, a interseçãoentre α1 e β2 nos dá a tangente a f(s) em f(P ); como α2 é paralelo ao plano Oxy,a interseção entre α2 e β1 é paralela a r e a interseção entre α2 e β2 é paralela as. Agora olhe para a simetria em relação ao plano normal à reta Nf(P ), passandopelo ponto médio entre N e f(P ), e termine a demonstração.

Page 66: 2aPARTE - Colorida - Hipertexto (2)

66 CAPÍTULO 7. COMPACTIFICAÇÕES DO PLANO E DO ESPAÇO

Exercício: Dado um ponto, P = (x, y, 0), do plano, queremos o ponto f(P ) =(x, y, z) de S2 que corresponda à projeção estereográ�ca de P . Mostre que

(x, y, z) =

(2x

x2 + y2 + 1,

2y

x2 + y2 + 1,x2 + y2 − 1

x2 + y2 + 1

)

Exercício: Conclua, do exercício anterior, que, se P ′ =(

xx2+y2

, yx2+y2

, 0), então

f(P ′) é a re�exão de f(P ) através do plano horizontal Oxy (note que P ′ é obtido,de P , por inversão1 em relação ao círculo x2 + y2 = 1, z = 0).

Exercício: Mostre que, para todo P no plano Oxy, o produto entre as distânciasNP e Nf(P ) é 2.

Exercício: Sejam S uma esfera (de centro O e raio R) e P um ponto do espaço(outro que O). A inversão em relação a S é a aplicação que a cada ponto Pdo espaço (outro que O) associa o ponto P ′, situado na semirreta que parte de Opara P , tal que o produto da distância OP ′ pela distância OP é R2. Mostre queinversões transformam planos que não passam por O em esferas passando por O etransformam esferas que não passam por O em esferas que não passam por O.

Exercício: Mostre que a projeção estereográ�ca transforma círculos em círculos.Sugestão: considere a inversão em relação à esfera de centro N e raio

√2.

b O plano projetivo

Pelo que aprendemos em Perspectiva Cônica, é razoável pensarmos em ummodelo que acrescente a cada reta (na verdade, a cada feixe de retas paralelas)um único ponto no in�nito. Para simpli�car um pouco, vejamos o que issonos dá, no plano.

Como já discutimos acima, podemos completar o plano, acrescentando doispontos no in�nito a cada reta (na verdade, a cada feixe de retas paralelas).Obtemos, desta forma, algo que pode ser visualizado como uma semiesferafechada, ou mesmo um disco fechado. A ideia do plano projetivo é emendaras duas extremidades de cada reta.

Exercício: Comece com a semiesfera fechada (digamos, o conjunto dos (x, y, z) taisque x2 + y2 + z2 = 1 e z ≤ 0) e vá emendando cada ponto do bordo (isto é, cada

1 a inversão em relação ao círculo c (de centro O e raio R) é a transformação do planode c que leva o ponto P 6= O no ponto P ′, situado na semirreta que parte de O para P ,tal que o produto da distância OP ′ pela distância OP é R2

Page 67: 2aPARTE - Colorida - Hipertexto (2)

B. O PLANO PROJETIVO 67

ponto do tipo (x, y, 0)) no seu oposto (isto é, (−x,−y, 0)). É meio complicado,mesmo.

O problema é que, depois de emendar tudo, o que obtemos não é alguma�gura simples, mesmo no espaço. Esta é uma das razões para não nos apro-fundarmos agora no estudo do plano ou do espaço projetivo. A propósito,uma outra versão do plano projetivo surge quando olhamos para os pontosimpróprios do espaço.Exercício: Pense no espaço como uma grande bola aberta (algo assim com o con-junto B dos (x, y, z) tais que x2 + y2 + z2 < R2, R grande). Para simpli�car umpouco, pense R = 1. De�na f : IR3 → B por

f(x1, x2, x3) =1

|x|+ 1x =

1√x21 + x22 + x23 + 1

(x1, x2, x3).

1. Mostre que f é uma bijeção.

2. Mostre que, se v é um vetor do espaço de norma 1 (|v| = 1) e A é um pontoqualquer do espaço, então

limt→∞

f(A+ tv) = v; limt→−∞

f(A+ tv) = −v.

3. Conclua que podemos usar f para acrescentar ao espaço pontos no in�nito,dois por reta, de forma que retas paralelas se encontrem no in�nito.

4. Veja se está claro que nosso modelo do espaço, com os pontos no in�nito, éa bola fechada

B ={x ∈ IR3 | |x| ≤ 1

}e que os pontos no in�nito são os da esfera

S2 ={x ∈ IR3 | |x| = 1

}.

5. O espaço projetivo pode, então, ser visto como o resultado da seguinteoperação: cada ponto x de B com |x| = 1 é colado a −x.

6. Note que os pontos no in�nito, em S2 são exatamente os colados. O resultadoé uma esfera em que cada ponto foi colado a seu antípoda. Esta é uma novaversão do plano projetivo. Veja se faz sentido.

Page 68: 2aPARTE - Colorida - Hipertexto (2)

68 CAPÍTULO 7. COMPACTIFICAÇÕES DO PLANO E DO ESPAÇO

Page 69: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 8

Espaços vetoriais

a O IRn

O advento da Geometria Analítica, que pode ser datado de 1637, ano dapublicação do La Géométrie, de Descartes, teve enorme impacto na Mate-mática. Questões geométricas, a partir daí, passaram a ser tratadas por meiodas poderosas ferramentas algébricas que se desenvolviam então e, principal-mente, com os métodos analíticos aportados pelo Cálculo In�nitesimal, queveio logo em seguida. Assim, pode-se dizer que teve por consequência umacrescente algebrização da Geometria.

PROBLEMA GEOMÉTRICO↓

TRADUÇÃO ALGÉBRICA↓

SOLUÇÃO ALGÉBRICA↓

INTERPRETAÇÃO GEOMÉTRICA↓

SOLUÇÃO GEOMÉTRICA

69

Page 70: 2aPARTE - Colorida - Hipertexto (2)

70 CAPÍTULO 8. ESPAÇOS VETORIAIS

As a�rmações do parágrafo anterior têm, porém, uma contrapartida: a alge-brização da Geometria abre, imediatamente, caminho para a geometrizaçãoda Álgebra (e da Análise). Esquematicamente podemos colocar as coisas nosseguintes termos:

PROBLEMA ALGÉBRICO↓

INTERPRETAÇÃO GEOMÉTRICA↓

INSIGHT GEOMÉTRICO↓

MANIPULAÇÃO ALGÉBRICA↓

SOLUÇÃO ALGÉBRICA

Um exemplo elementar em que essa inversão se dá é a análise de grá�cosde funções de uma variável: ao representarmos os pares ordenados (x, f(x))por pontos no plano, obtemos um objeto geométrico (o grá�co de f , que éuma curva).1 O problema de achar um ponto de máximo de f é interpretadogeometricamente como a busca de um cume, que corresponde a uma tangentehorizontal. Daí para a conclusão de que devemos achar um zero da derivadaé um pulo.

Observação: Este é um bom exemplo para notarmos que a passagem dasituação algébrica para uma contrapartida geométrica pode ir muito alémde uma simples interpretação: o que fazemos, neste caso, é investir umproblema "algébrico" de um signi�cado geométrico que é, na verdade, nãouma interpretação, mas uma verdadeira fantasia geométrica, que, poderíamosdizer, está mais próxima da arte e da poesia do que propriamente da técnica.

1e isto mesmo em situações em que x e f(x) podem não ter qualquer conotação geo-métrica: pense em x representando o tempo e f(x) uma temperatura no instante x

Page 71: 2aPARTE - Colorida - Hipertexto (2)

A. O IRN 71

Um segundo passo é estender a intuição geométrica para dimensões mais

altas. A solução de um problema envolvendo n variáveis pode não ser, essen-cialmente, diferente, se n = 2 ou se n = 10. Do ponto de vista geométrico,porém, no caso n = 2 podemos interpretar o par de variáveis (x1, x2) comoum ponto do plano, e usar a intuição geométrica como ponto de partida parao tratamento do problema. Possivelmente, as mesmas manipulações algébri-cas que funcionam com n = 2, obtidas por um insight geométrico, servirãotambém para o caso n = 10.

Exemplo: Suponhamos que estamos diante de 10 medidas de um mesmoobjeto, todas igualmente con�áveis. Podemos representá-las por um pontox = (x1, . . . , x10) em IR10. No entanto, o resultado esperado, ao se medir 10vezes o mesmo objeto, seria x = (x, . . . , x), com 10 medidas iguais. Nossoproblema é, pois, a partir da n-upla x, obter uma nova n-upla, x, com todasas coordenadas iguais e que, de alguma forma, esteja o mais próxima possívelde x. Ora, se fossem apenas 3 medidas, poderíamos pensar x como um pontodo espaço; x deveria, então, ser o ponto da reta

r = {(t, t, t), t ∈ IR}

mais próximo de x. A solução, geométrica, é projetar x sobre r, obtendo

x =1

3< x, (1, 1, 1) > (1, 1, 1),

o que nos dá

x = (x, x, x), x =x1 + x2 + x3

3.

Exercício: Pense um elemento de IR10 como um vetor, com as operações de adiçãoe multiplicação por escalar de�nidas como em IR3. De�na, em IR10, o produto

escalar < x,y > por

< x,y >= x1y1 + . . .+ x10y10.

Projete o ponto x = (x1, . . . , x10) sobre a reta r, de�nida em IR10 por

r = {(t, . . . , t), t ∈ IR} .

Page 72: 2aPARTE - Colorida - Hipertexto (2)

72 CAPÍTULO 8. ESPAÇOS VETORIAIS

Mostre que a projeção assim obtida é o ponto x de r que minimiza a distância(dada por |x − x| =

√< x− x,x− x >) a x. Se tudo deu certo, você acaba de

legitimar a média aritmética.

No exemplo acima, demos vários passos. Começamos com um problemaenvolvendo 10 variáveis (poderiam ser 15, 1000, ou um inteiro positivo qual-quer). Pensamos no mesmo problema, mas com o número de variáveis re-duzido para 3. Nesse caso, traduzimos nosso problema em um problema degeometria. Resolvemos o problema geometricamente. A solução geométricanos indicou um critério que legitima a escolha de x como a melhor aproxi-mação para a medida do nosso objeto, a partir das medidas x1, x2 e x3. Opróximo passo foi investir IR10 de um caráter geométrico que, algebricamente,é análogo ao que temos em IR3. Isto nos permitiu estabelecer um critério pormeio do qual a escolha de x = (x, . . . , x), com x dado pela média aritméticade x1, . . . , x10, pode ser considerada a mais legítima. Mais ainda, a obten-ção de x se deu por meio dos cálculos sugeridos pelo problema análogo comapenas 3 variáveis!

Exercício: Mostre que é possível chegar ao mesmo resultado sem recorrer a todaa geometria. Pulando a de�nição do produto escalar, de�na, em IR10, a norma

de x por |x| =√x21 + . . .+ x210. Mostre que t = x é o ponto de mínimo de

f(t) = |(x1, . . . , x10)− (t, . . . , t)|.Exercício: Mostre que o produto escalar < x,y >= x1y1 + . . .+x10y10 tem as boaspropriedades do produto escalar:

(i) < u,v >=< v,u > ∀u,v ∈ V(ii) < tu,v >= t < u,v > ∀u,v ∈ V, ∀t ∈ IR(iii) < u,v1 + v2 >=< u,v1 > + < u,v2 > ∀u,v1,v2 ∈ V(iv) < ei, ej >= 0, i 6= j, < ei, ej >= 1, i = j,

sendo ei = (0, . . . , 1, . . . , 0), com o 1 na i-ésima coordenada.

Exercício: Mas qual seria a mente doentia que, sem o suporte da poderosa ana-logia geométrica introduzida pelo produto escalar, defenderia a norma acima emdetrimento de outras tão mais razoáveis, como |x| = |x1|+ . . .+ |x10|?

De�nição: O espaço vetorial IRn consiste no conjunto

IRn = {x = (x1, . . . , xn), x1, . . . , xn ∈ IR} ,

com as operações, de�nidas para x,y ∈ IRn, t ∈ IR:

Page 73: 2aPARTE - Colorida - Hipertexto (2)

A. O IRN 73

(i) x + y = (x1 + y1, . . . , xn + yn);(ii) tx = (tx1, . . . , txn).

Exercício: Mostre que as operações acima de�nidas satisfazem às propriedades:

(1) u + (v + w) = (u + v) + w(2) u + v = v + u(3)∃0 ∈ V | u + 0 = u(4) u + (−u) = 0(5) t(u + v) = tu + tv(6) (s+ t)u = su + tu(7) s(tu) = (st)u(8) 1u = u

(isto é: as propriedades (1) a (8) valem para quaisquer vetores u, v e w em IRn epara quaisquer números s e t).

De�nição: O produto escalar canônico em IRn é de�nido por

< x,y >= x1y1 + . . .+ xnyn.

A base canônica de IRn é dada pelos vetores e1, . . . , en,

e1 = (1, 0, . . . , 0), . . . , en = (0, . . . , 0, 1).

Exercício: Mostre que o produto escalar < x,y >= x1y1 + . . .+ xnyn tem as boaspropriedades do produto escalar:

(i) < u,v >=< v,u > ∀u,v ∈ V(ii) < tu,v >= t < u,v > ∀u,v ∈ V, ∀t ∈ IR(iii) < u,v1 + v2 >=< u,v1 > + < u,v2 > ∀u,v1,v2 ∈ V(iv) < ei, ej >= 0, i 6= j, < ei, ej >= 1, i = j,

Exercício: Suponha que os vetores não nulos v1, . . . ,vk de IRn sejam, dois a dois,ortogonais, isto é: < vi,vj >= 0, se i 6= j e que

v = x1v1 + . . .+ xnvn.

Mostre, sem usar coordenadas, que

xi =< v,vi >

< vi,vi >.

Page 74: 2aPARTE - Colorida - Hipertexto (2)

74 CAPÍTULO 8. ESPAÇOS VETORIAIS

b Outros espaços

Passar de IR2 e IR3 a IRn é um belo salto. Mas há outros espaços , envolvidosem situações bastante relevantes, que, também, merecem um pouco da nossaatenção. Comecemos com alguns exemplos. Em uns o espaço envolvido é umIRn; em outros, algo maior.

Exemplo 1: Suponhamos que n corpos se movem no espaço, sujeitos apenasà atração gravitacional mútua. Podemos tomar cada corpo em separado, masé claro que sua trajetória futura (em IR3) dependerá, não só de suas posiçãoe velocidade atuais, mas também das dos demais n− 1 corpos. Assim, podeser interessante pensar que o que temos é um elemento x(t) de IR3n, que semove em função do tempo t (cada 3 coordenadas de x(t) correspondendo àposição de um dos corpos).

Exemplo 2: Quando vemos uma animação no monitor de um computador,o que varia com o tempo são certos parâmetros que determinam a represen-tação da imagem no monitor. Tipicamente, um monitor pode ser pensadocomo feito de um monte de pontinhos (chamados pixels) arranjados emforma de matriz. Se m é o número de pixels em cada vertical e n o númerona horizontal, temos uma matriz m × n. Para de�nir a imagem, temos que(grosso modo), escolhidas 3 cores primárias (vermelho, verde e azul é umadas escolhas usuais), dizer, para cada pixel, quanto de cada uma vai entrarna de�nição da cor daquele pixel (no caso de imagens em preto e branco,precisaríamos de apenas um número por pixel). Assim, cada imagem é de-�nida por (m × n) × 3 números. Podemos, considerando que os númerosque de�nem o quanto de cada cor entra em cada pixel são reais (na prática,usamos apenas uma gama �nita de cada cor, algo como 28 ou 216), dizer quecada imagem é um vetor x(t) de IR(m×n)×3 (na prática, é claro, o tempo ttambém é picotado em uma quantidade �nita de instantes, algo como 24, 30ou 60 imagens por segundo). Nossa imagem, repetimos, evolui, ao longo dotempo, em IR(m×n)×3.

Exemplo 3: Nada nos impede de pensar no vídeo ideal. No lugar de m× npixels, a tela poderia ser um retângulo, de dimensões a e b, com in�nitos

pixels : um para cada ponto do retângulo. Para simpli�car (ou por razões

Page 75: 2aPARTE - Colorida - Hipertexto (2)

B. OUTROS ESPAÇOS 75

artísticas), pensemos em preto e branco. Representada em coordenadas,nossa tela pode ser o retângulo R = [0, a]× [0, b]. Cada imagem exigirá umnúmero real para cada ponto do retângulo (0, digamos, para preto; 1 parabranco, com valores entre 0 e 1 para os diversos tons de cinza). Assim, nossaimagem será, a cada instante, uma função F : R → IR. O espaço em queevolui nossa imagem não é mais IR(m×n)×3, mas o espaço V das funções doretângulo R em IR.

Exemplo 4: Um exemplo um pouco mais físico talvez ajude. Imagine-mos que o que se quer é descrever a evolução no tempo da distribuição detemperatura em uma barra de ferro (que, para simpli�car, podemos suporunidimensional). Sendo L o comprimento da barra, a distribuição de tem-peratura, em cada instante t, será dada por uma função ft : [0, L] → IR (seum ponto da barra é representado por x, sua temperatura no instante t seráft(x)). Assim, nossa distribuição de temperaturas evolui no espaço V dasfunções de [0, L] em IR. Se, no lugar de uma barra, tivéssemos um sólido,representado por um subconjunto B de IR3, nossos possíveis estados estariamno espaço V das funções de B em IR. Questões como esta aparecem no livroThéorie analytique de la propagation de la chaleur, 1822, de Joseph Fourier.Nesse trabalho Fourier lança mão, num espaço de funções de um intervalo[a, b] em IR, do primeiro produto escalar da história:2 se f e g são funções,de�nidas no intervalo [a, b] e a valores em IR, podemos de�nir < f, g > por

< f, g >=

∫ b

a

f(x)g(x)dx.

Exemplo 5: O problema clássico da braquistócrona foi proposto em 1696por João Bernoulli e chamou a atenção dos maiores matemáticos da época(Newton, Leibniz, Tiago Bernoulli, entre outros). Trata-se do seguinte: da-dos dois pontos, A e B, do espaço, encontrar uma curva γ ligando A a B(supostamente num plano vertical passando por A eB), tal que uma partículaque sobre ela deslize sem atrito e apenas sob a ação da gravidade, percorraγ no menor tempo possível. Supondo que a altura de A é superior à de B,podemos representar, em IR2, A por (0, 0) e B por (a,−b), b > 0. Dando

2Seria um pouco exagerado dizer que Fourier inventou o produto escalar, antes deHamilton; mas é fato que, no trabalho de Fourier está a semente da ideia de ortogonalidade,em um contexto nada geométrico, que vai inspirar a construção do conceito abstrato queé hoje conhecido como produto escalar (ou produto interno)

Page 76: 2aPARTE - Colorida - Hipertexto (2)

76 CAPÍTULO 8. ESPAÇOS VETORIAIS

como óbvio que a curva em questão pode ser representada pelo grá�co deuma função f : [0, a]→ IR, pelo menos com derivada primeira contínua, po-demos dizer que o que buscamos está no espaço V das funções f : [0, a]→ IR,tais que f tem derivada primeira contínua, com f(0) = 0 e f(a) = −b.

Exercício: Mostre que, nos exemplos 3 e 4, a soma de duas funções do espaço Vestá em V ; mas não no exemplo 5. Mesma coisa para funções do tipo cf , com creal �xo e f em V (isto é: se f é uma função em V e c é um número real �xo,então a função cf , de�nida por (cf)(x) = c(f(x)), está em V , nos exemplos 3 e 4,mas não no exemplo 5).

Exercício: Mostre que toda função f de V , no exemplo 5, pode ser escrita comof = f0 + h, com f0 sendo uma função qualquer de V , �xa, e h : [0, a] → IR,com derivada primeira contínua e h(0) = 0 = h(a) (f0 pode ser, por exemplo, osegmento de reta ligando A a B).

Exercício: Seja V0 o espaço das funções h : [0, a] → IR, com derivada primeiracontínua e tais que h(0) = 0 = h(a). Mostre que a soma de duas funções de V0está em V0; o mesmo para ch, se c é um número real �xo e h é uma função de V0

Exercício: Seja X um conjunto qualquer. Seja V o espaço das funções u de X emIR. De�na, em V , as operações de adição e de multiplicação por escalar daseguinte forma: se u e v são duas funções de X em IR, a função u + v, de X emIR é de�nida por (u + v)(x) = u(x) + v(x); se c é um número real �xo e u é umafunção de X em IR, a função cu, de X em IR, é de�nida por (cu)(x) = cu(x).Mostre que valem as seguintes e famosas propriedades:

(1) u + (v + w) = (u + v) + w(2) u + v = v + u(3)∃0 ∈ V | u + 0 = u(4) u + (−u) = 0(5) t(u + v) = tu + tv(6) (s+ t)u = su + tu(7) s(tu) = (st)u(8) 1u = u

(isto é: as propriedades (1) a (8) valem para quaisquer vetores u, v e w, e paraquaisquer números s e t).

Exercício: Note que, fazendo X = IN no exercício anterior, temos o espaço dassequências in�nitas de números reais, que é uma espécie de IRn com n in�nito.

Page 77: 2aPARTE - Colorida - Hipertexto (2)

C. ESPAÇOS VETORIAIS 77

Exemplo 6: Na Mecânica Quântica, o estado de uma partícula é dadopor uma função de onda, que podemos supor de�nida em um subconjuntoX do espaço. A novidade, nesse caso, é que a função de onda, ϕ, tomavalores no conjunto dos números complexos. Mas isto não chega a ser umproblema sério: funções a valores em IC se somam, como as funções a valoresem IR, e se multiplicam por escalares (complexos!). É fácil ver que, com estasoperações, o espaço V das funções de X em IC também goza das oito famosaspropriedades acima.

Exemplo 7: Já que falamos em IC, podemos conceber, pairando em tornode cada IRn, um espaço ICn de n-uplas de números complexos, que se somamda maneira óbvia e se multiplicam, também da maneira óbvia, por escalarescomplexos.

Para quem sabe o que é um corpo, podemos considerar, já que admitimosescalares complexos, situações em que os escalares sejam elementos de umcorpo outro que IR ou IC. Particularmente, na Teoria de Galois, é bastantenatural a introdução de espaços com as mesmas oito propriedades acima,com a diferença que o conjunto dos escalares está (usualmente) em um corposituado entre os racionais (IQ) e os complexos (IC).

Exemplo 8: Dado um corpo K, podemos considerar, exatamente como�zemos para IRn e ICn, o espaço Kn das n-uplas de elementos de K, com asoperações de sempre.

Exemplo 9: Um mesmo espaço pode aparecer disfarçado de várias manei-ras. O conjunto dos polinômios a coe�cientes reais e grau inferior a n é oIRn disfarçado. Seu irmão maior (embora mais novo), o dos polinômios acoe�cientes complexos e grau inferior a n, é o ICn disfarçado.

Exemplo 10: Dentro da mesma linha de raciocínio, o conjunto de todos ospolinômios a coe�cientes reais é, disfarçado, o espaço das sequências (xn)n∈INde números reais tais que xn é não nulo apenas para um número �nito deíndices n (esse número variando de sequência para sequência). O mesmo parao conjunto dos polinômios a coe�cientes complexos e sequências (zn)n∈IN denúmeros complexos tais que zn é não nulo apenas para um número �nito deíndices n.

c Espaços vetoriais

Page 78: 2aPARTE - Colorida - Hipertexto (2)

78 CAPÍTULO 8. ESPAÇOS VETORIAIS

A construção do conceito de espaço vetorial culmina, no século XX, com ade�nição geral que vai englobar o espaço dos vetores �echinhas, os IRn e todosos espaços mencionados na seção anterior. Mais precisamente, pensemos cadaum dos espaços apresentados acima como um conjunto V de vetores. Dadosdois vetores u e v de V, está de�nida sua soma, u + v, que é um vetor deV. Da mesma forma, dados um vetor v de V e um escalar t, está de�nido oproduto de t por v, tv, que é um vetor de V. As operações assim de�nidassatisfazem às oito famosas propriedades.

De�nição: Um espaço vetorial (real) é uma estrutura que compreende umconjunto, V, e duas operações:

+ : V ×V −→ V(u,v) 7−→ u + v

e

: IR×V −→ V,(t,v) 7−→ tv

satisfazendo às oito famosas propriedades abaixo:

(1) u + (v + w) = (u + v) + w(2) u + v = v + u(3) ∃ 0 ∈ V | u + 0 = u(4) ∀u ∈ V ∃ − u ∈ V | u + (−u) = 0(5) t(u + v) = tu + tv(6) (s+ t)u = su + tu(7) s(tu) = (st)u(8) 1u = u

(isto é: as propriedades (1) a (8) valem para quaisquer vetores u, v e w emV, e para quaisquer números s e t).

Observação: O vetor nulo 0 mencionado na propriedade (3) é único. Defato, se � é outro vetor com a mesma propriedade, então

� = � + 0 = 0 + � = 0.

Da mesma forma, o simétrico do vetor u, −u, também é único: se u+v = 0,então

Page 79: 2aPARTE - Colorida - Hipertexto (2)

C. ESPAÇOS VETORIAIS 79

v = v + 0 = v + (u + (−u)) = (v + u) + (−u)) == (u + v) + (−u) = 0 + (−u) = −u + 0 = −u.

Exercício: Tente provar que u + u = 2u sem usar a propriedade (8).

Observação: O leitor que não se assustou com a ideia de escalares com-plexos, pode incluir na de�nição a alternativa de que os escalares estejamnão em IR, mas em IC. O leitor com familiaridade com o conceito de corpopode considerar, na de�nição, que, junto com o conjunto V dos vetores, édado também o corpo K dos escalares, e que a operação de multiplicação porescalares está de�nida não em IR ×V, mas em K ×V (o que inclui, claro,as possibilidades K = IR e K = IC). Salvo menção explícita em contrário,suporemos sempre que nossos espaços vetoriais são reais.

Um espaço vetorial pode conter subespaços. Um subespaço vetorial doespaço vetorial V é um subconjunto de V que, com as operações que "herda"de V, é um espaço vetorial. A de�nição abaixo é mais operacional.

De�nição: Um subespaço vetorial de V é um suconjunto W de V, nãovazio, tal que:

(i) w ∈ W, t ∈ IR =⇒ tw ∈ W(ii) w1,w2 ∈ W =⇒ w1 + w2 ∈ W

De�nição: O vetor v é dito uma combinação linear dos vetores v1, . . . ,vnse existem escalares t1, . . . , tn tais que v = t1v1 + . . .+ tnvn.

De�nição: Dado um subconjunto X do espaço vetorial V, o subespaçogerado por X é o conjunto de todas as combinações lineares de vetores deX (isto é: todos os vetores da forma t1v1+. . .+tnvn, sendo os ti escalares e osvi elementos de X). O espaço gerado pelo conjunto vazio é, por convenção,{0}.

Exercício: Mostre que a de�nição acima é equivalente a: o subespaço gerado porX é a interseção de todos os subespaços de V que contêm X.

Exercício: Se preferir, adote a de�nição seguinte, mais elegante: SejamV um espaçovetorial e X um subconjunto de V. o elemento v de V é combinação linear dos

Page 80: 2aPARTE - Colorida - Hipertexto (2)

80 CAPÍTULO 8. ESPAÇOS VETORIAIS

elementos de X se v pertence ao espaço gerado por X. Observe que, usando ade�nição de espaço gerado do exercício anterior, é natural concluir que 0 é o únicovetor obtido como combinação linear dos elementos do conjunto vazio.

d Bases

De�nição: Um subconjunto ordenado {v1, . . . ,vn} do espaço vetorial V édito uma base de V se, e somente se, para todo vetor v de V , existe umaúnica n-upla (x1, . . . , xn) de IRn tal que

v = x1v1 + . . .+ xnvn.

Os números x1, . . . , xn são chamados coordenadas do vetor v.

Exercício: Entenda que uma base é uma espécie de chave para identi�carmos cadavetor deV a uma n-upla de IRn. Note que a exigência de ter {v1, . . . ,vn} ordenadoé necessária para garantir a unicidade da n-upla (x1, . . . , xn).3

Proposição: Fixada a base {v1, . . . ,vn}, a bijeção v↔ (x1, . . . , xn) preservaas operações de adição e de multiplicação por escalar. Isto é, se (x1, . . . , xn) e(y1, . . . , yn) são as n-uplas associadas, respectivamente, aos vetores u e v, e té um escalar qualquer, então a n-upla (x1+ty1, . . . , xn+tyn) = (x1, . . . , xn)+t(y1, . . . , yn) é a associada ao vetor u + tv.

Demonstração: Basta usar as propriedades das operações com vetores e com n-uplas. De fato, se u = x1v1 + . . . + xnvn, v = y1v1 + . . . + ynvn e t é umescalar, então, usando muitas vezes as associatividades, as distributividades e acomutatividade, obtemos

u+tv = (x1v1+. . .+xnvn)+t(y1v1+. . .+ynvn) = (x1+ty1)v1+. . .+(xn+tyn)vn.

Exercício: Estamos, implicitamente, excluindo a possibilidade de ser vazio o con-junto {v1, . . . ,vn}. Se o leitor tem tempo para a questão, pense nela: podemos

3Seria mais rigoroso considerar, em vez de conjuntos ordenados de vetores {v1, . . . ,vn},n-uplas (v1, . . . ,vn) em Vn, o que é quase a mesma coisa (n-uplas admitem a possibilidadede vi = vj , com i 6= j). Estamos evitando fazê-lo por conta do risco de confundir o leitor...oque, paradoxalmente, pode gerar alguma confusão

Page 81: 2aPARTE - Colorida - Hipertexto (2)

D. BASES 81

conceber em abstrato o conceito de espaço vetorial (um conjunto com operações deadição e de multiplicação por escalar, com as propriedades (1) a (8) apresentadasna seção anterior); neste caso, faz sentido pensar em um espaço reduzido ao vetornulo, que teria como base o conjunto vazio.

Observe que são duas as condições para que {v1, . . . ,vn} seja uma base deV. A primeira é que {v1, . . . ,vn} deve gerar V (isto é, todo vetor de V deveser combinação linear de v1, . . . ,vn).4 A segunda é que não podem existirduas n-uplas distintas, (x1, . . . , xn) e (y1, . . . , yn), que correspondam a ummesmo vetor. Examinemos essa segunda condição.

Proposição: Sejam v1, . . . ,vn vetores de V. São equivalentes:

(i)existem duas n-uplas distintas (x1, . . . , xn) e (y1, . . . , yn) tais que

x1v1 + . . .+ xnvn = y1v1 + . . .+ ynvn;

(ii)algum dos vetores v1, . . . ,vn é combinação linear dos demais;(iii)existe uma n-upla (x1, . . . , xn) 6= (0, . . . , 0) tal que

~0 = x1v1 + . . .+ xnvn.

Demonstração: Provaremos (i)⇒ (ii)⇒ (iii)⇒ (i).

(i)⇒ (ii): Fixemos um i tal que xi 6= yi (certamente existe, já que (x1, . . . , xn) 6=(y1, . . . , yn)). Como

x1v1 + . . .+ xnvn = y1v1 + . . .+ ynvn,

podemos concluir que

(yi−xi)vi = (x1−y1)v1+. . .+(xi−1−yi−1)vi−1+(xi+1−yi+1)vi+1+. . .+(xn−yn)vn

e, portanto, multiplicando dois lados por (yi−xi)−1, obtemos vi como combinaçãolinear dos demais:

vi =(x1 − y1)(yi − xi)

v1+. . .+(xi−1 − yi−1)

(yi − xi)vi−1+

(xi+1 − yi+1)

(yi − xi)vi+1+. . .+

(xn − yn)

(yi − xi)vn.

4Neste caso, diz-se também que v1, . . . ,vn geram V

Page 82: 2aPARTE - Colorida - Hipertexto (2)

82 CAPÍTULO 8. ESPAÇOS VETORIAIS

(ii) ⇒ (iii): Se um certo vi é combinação linear dos demais, podemos escrever,para certos x1, . . . , xi−1, xi+1, . . . , xn,

vi = (x1v1 + . . .+ xi−1vi−1 + xi+1vi+1 + . . .+ xnvn.

Logo,temos a n-upla x1, . . . , xi−1,−1, xi+1, . . . , xn 6= (0, . . . , 0), com

~0 = x1v1 + . . .+ xi−1vi−1 + (−1)vi + xi+1vi+1 + . . .+ xnvn.

(iii)⇒ (i): Basta notar que, valendo (iii), temos (0, . . . , 0) 6= (x1, . . . , xn) e

0v1 + . . .+ 0vn = x1v1 + . . .+ xnvn.

De�nição: Os vetores v1, . . . ,vn são ditos linearmente independentesse nenhum deles é combinação linear dos demais. Neste caso, diz-se tambémque o conjunto {v1, . . . ,vn} é linearmente independente.

Exercício: Mostre que v1, . . . ,vn são linearmente independentes se, e somente se,t1v1, . . . , tnvn = ~0 apenas no caso em que t1 = . . . = tn = 0.

Corolário: Para que um subconjunto ordenado {v1, . . . ,vn} do espaço ve-torial V seja uma base de V, é necessário e su�ciente que as duas condiçõesabaixo sejam simultaneamente satisfeitas:

(i)v1, . . . ,vn geram V;(ii)v1, . . . ,vn são linearmente independentes.5

Observação: A de�nição acima admite, implicitamente, que alguns espaçosnão têm base (o espaço IR[x] dos polinômios a coe�cientes reais, por exemplo,não pode ser gerado por um conjunto �nito de polinômios). Mesmo se nãovamos trabalhar com bases in�nitas, não é difícil dar uma de�nição maisgeral. Diremos que um subconjunto α do espaço V gera V se todo elementode V é combinação linear de um número �nito de elementos de α. Da mesmaforma, diremos que α é linearmente independente (ou que os elementosde α são linearmente independentes - diz- se também que são LI) set1v1 + . . . tnvn = 0, com v1, . . . ,vn em α implicar em t1 = . . . = tn = 0.

5Este corolário pode ser usado como de�nição de base; note que, neste caso, podemos"esquecer" a exigência de ordenação dos v1, . . . ,vn

Page 83: 2aPARTE - Colorida - Hipertexto (2)

E. DIMENSÃO 83

De�nição: Um subconjunto α de um espaço vetorial V é dito uma base deV se satisfaz às duas condições:

(i)α gera V;(ii)α e LI.

Exercício: Encontre uma base para o espaço IR[x] dos polinômios a coe�cientesreais.

Questão: É verdade que todo espaço vetorial tem base?

e Dimensão

É razoavelmente fácil compreender que, se os vetores v1, . . . ,vm geram oespaço V, podemos extrair de {v1, . . . ,vm} um subconjunto {w1, . . . ,wn}(ordenado) que é uma base de V. Com efeito, se {v1, . . . ,vm} não é linear-mente independente, basta ir "jogando fora", passo a passo, os vetores su-pér�uos, até �car com um subconjunto linearmente independente que aindagera V. Uma questão análoga é: e se o conjunto {v1, . . . ,vm} é linearmenteindependente mas não gera V, podemos acrescentar-lhe mais alguns vetores,de forma a obtermos uma base de V?

Lema Fundamental: Suponha que os subconjuntos α = {v1, . . . ,vm} eβ = {u1, . . . ,un} do espaço V são tais que:

(i)α gera V;(ii)β é linearmente independente.

Então:

(i)m ≥ n;(ii)é possível substituir, em α, n dos vi por u1, . . . ,un, de forma que o

novo conjunto assim obtido ainda gere V.

Demonstração: Vamos construir n + 1 subconjuntos de V, que designaremos porα0, . . . , αn, todos com m vetores, de forma que:• α0 = α

• αi+1 é obtido de αi, se i < n, pela substituição de um elemento de α por umelemento de β, de forma que β ⊂ αn

Page 84: 2aPARTE - Colorida - Hipertexto (2)

84 CAPÍTULO 8. ESPAÇOS VETORIAIS

Comecemos por α1. Como α gera V, podemos encontrar escalares x1, . . . , xm taisque

x1v1 + . . .+ xmvm = u1.

Note também que, como β é linearmente independente, u1 não é nulo. Logo,podemos escolher um j tal que xj 6= 0; multiplicando dos dois lados por x−1j eisolando vj do lado esquerdo, obtemos

vj =−x1xj

v1 + . . .+1

xju1 + . . .+

−xmxj

vm.

Concluímos, pois, que vj é combinação linear de v1, . . . ,u1, . . . ,vm. Assim, se α1

é o conjunto obtido pela exclusão de vj de α e sua substitutição por u1, temosque α1 gera V (já que, com os vetores de α1 conseguimos gerar vj e, a partir daí,temos todos os originalmente em α, que gera V).

Note que podemos escrever

α1 = {ε1, . . . , εm} ,

com ε1 = u1 e {ε2, . . . , εm} ⊂ α. Suponhamos agora que, para um certo i menordo que m e n (ainda não provamos que n < m), tenhamos já de�nido o conjuntoαi = {ε1, . . . , εm}, tal que:

• ε1 = u1, . . . , εi = ui

• {εi+1, . . . , εm} ⊂ α

• αi gera V

Podemos então encontrar escalares x1, . . . , xm tais que

x1ε1 + . . .+ xmεm = ui+1,

ou seja,

x1u1 + . . .+ xiui + xi+1εi+1 + . . .+ xmεm = ui+1.

É hora de observar que, como β é linearmente independente, podemos tomar umj > i tal que xj 6= 0 (caso contrário, ui+1 seria combinação linear de u1, . . . ,ui).Isto signi�ca que, procedendo como no caso de α1 e de�nindo αi+1 pela exclusãode εj e sua substitutição por ui+1, αi+1 terá as mesmas propriedades de αi acima

Page 85: 2aPARTE - Colorida - Hipertexto (2)

E. DIMENSÃO 85

listadas (devemos, é claro, renomear os vetores de αi+1 de forma que ui+1 passe ase chamar εi+1).

O que acima �zemos mostra que podemos de�nir os conjuntos αi, com as trêspropriedades acima, para todo i de 1 até o menor entre m e n. Isto prova:

(i)m ≥ n, pois, caso contrário, un seria combinação linear de u1, . . . ,um(ii)αn gera V e αn = {u1, . . . ,un, εn+1, . . . , εm}, com {εn+1, . . . , εm} ⊂ α

Suponhamos agora que nosso espaço, V tenha uma base, α, formada porn elementos. Como α gera V, todo conjunto linearmente independente emV tem, no máximo, n elementos; como α é linearmente independente, todoconjunto que gera V tem, no mínimo, n elementos. Daí segue um teoremacrucial.

Teorema: Se o espaço vetorialV tem uma base com n elementos, então todabase de V tem, exatamente, n elementos. Além disso, se β = {v1, . . . ,vn} éum subconjunto de V com n elementos, então são equivalentes:

(i)v1, . . . ,vn formam uma base de V;(ii)v1, . . . ,vn geram V;(iii)v1, . . . ,vn são linearmente independentes.

Demonstração: A primeira a�rmação é o que acabamos de concluir. Além disso,temos, obviamente, (i)⇔(ii) e (iii) (juntos). Basta, pois, provar que (ii)⇔(iii).

(ii)⇒(iii): Observe que, se fosse possível ter V gerado por β sem que β fosselinearmente independente, então poderíamos descartar pelo menos um elementode β (que seja combinação linear dos demais), obtendo um conjunto de n − 1

elementos que ainda geraria V, o que, como acabamos de observar, não é possível.(ii)⇒(iii): Se, por outro lado, sabemos que β é linearmente independente, podemos,tomando uma base α de V (que, já sabemos, tem n elementos e gera V), concluirdiretamente, do Lema Fundamental, que β gera V.

Diante do acima exposto, concluímos que existe um número bem determi-nado, n, tal que toda base do espaço V tem n elementos. Dizemos, pois, quea dimensão de V é n.

Page 86: 2aPARTE - Colorida - Hipertexto (2)

86 CAPÍTULO 8. ESPAÇOS VETORIAIS

Page 87: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 9

Produto escalar

No capítulo anterior, com o conceito de espaço vetorial, abrimos caminhopara raciocinar geometricamente em situações absolutamente não geométri-cas. Um espaço vetorial é, em muitos aspectos, parecido com o espaço físicoem que nos movemos e com sua versão abstrata, o espaço da Geometriaclássica. No entanto, os axiomas de espaço vetorial não contemplam a pos-sibilidade de se efetuarem medidas de distâncias ou de ângulos. Quandotrabalhamos com vetores �echinhas, no espaço tridimensional herdado daGeometria Euclidiana, essas medidas são feitas via produto escalar.

Como já vimos, o produto escalar de vetores �echinhas é de�nido geometri-camente por

〈~u,~v〉 = |~u||~v| cos θ,

sendo θ o ângulo entre ~u e ~v. A de�nição puramente algébrica,

〈~u,~v〉 = u1v1 + u2v2 + u3v3,

porém, se estende facilmente ao espaço IRn: se x = (x1, . . . , xn) e y =(y1, . . . , yn), então

〈x,y〉 = x1y1 + . . .+ xnyn.

A exemplo do que aconteceu com o conceito de espaço vetorial, que evoluiudas �echinhas para espaços bem menos geométricos, podemos estabelecer

87

Page 88: 2aPARTE - Colorida - Hipertexto (2)

88 CAPÍTULO 9. PRODUTO ESCALAR

uma de�nição geral de produto escalar, baseada apenas em algumas pro-priedades fundamentais.

De�nição: Dado um espaço vetorial real V, um produto escalar (tambémdito produto interno) em V é uma aplicação

〈, 〉 : V ×V −→ IR ,(u,v) 7−→ 〈u,v〉

com as seguites propriedades:

(i) 〈u,v〉 = 〈v,u〉 ∀u,v ∈ V(ii) 〈tu1 + u2,v〉 = t 〈u1,v〉+ 〈u2,v〉 ∀u1,u2,v ∈ V, ∀t ∈ IR(iii) 〈u,u〉 ≥ 0 ∀u ∈ V(iv) 〈u,u〉 = 0 =⇒ u = 0

Exercício: Prove, a partir da de�nição, as seguintes propriedades:

(i) 〈u1 + u2,v〉 = 〈u1,v〉+ 〈u2,v〉 ∀u1,u2,v ∈ V(ii) 〈0,v〉 = 0 ∀v ∈ V(iii) 〈tu,v〉 = t 〈u,v〉 ∀u ∈ V, ∀t ∈ IR

Solução de (ii): 〈0,v〉 = 〈0 + 0,v〉 = 〈0,v〉+ 〈0,v〉, etc.

Os dois exemplos a seguir são básicos.

Exemplo 1: Em IRn, como já vimos, podemos de�nir, se x = (x1, . . . , xn) ey = (y1, . . . , yn),

〈x,y〉 = x1y1 + . . .+ xnyn.

Exemplo 2: Seja E o espaço das funções contínuas, de�nidas no intervalo[a, b], a valores em IR. Se f e g são elementos de E, de�nimos

〈f, g〉 =

∫ b

a

f(x)g(x)dx.

Exercício: Mostre que os produtos escalares dos dois exemplos satisfazem, de fato,às quatro propriedades da de�nição de produto escalar.

Page 89: 2aPARTE - Colorida - Hipertexto (2)

89

Exemplo 3: Nosso próximo exemplo está fortemente relacionado aos doisanteriores (embora a relação com o segundo não seja evidente). O espaçodas sequências de números reais, como já vimos, é uma espécie de IRn, comn in�nito. Seria natural de�nirmos o produto escalar da sequência (xn)n∈INpela sequência (yn)n∈IN , fazendo

〈(xn), (yn)〉 =∞∑n=1

xnyn.

O problema é que a soma in�nita à direita nem sempre converge (exercício:ache um exemplo). Podemos apresentar duas saídas:

a) Façamos V ser o espaço das sequências (xn)n∈IN tais que xn 6= 0 ape-nas para um número �nito de enes (esse número varia de sequência parasequência);

b)Tomemos como V o espaço l2(IR) das sequências (xn)n∈IN tais que

∞∑n=1

x2n <∞.

Exercício: Mostre que o exemplo 3a é, de fato, um espaço com produto interno.

Exercício: Mostre que o exemplo 3b é, de fato, um espaço com produto interno. Agrande di�culdade é provar que l2(IR) é um espaço vetorial, já que não é evidenteque

∞∑n=1

x2n <∞,∞∑n=1

y2n <∞ =⇒∞∑n=1

(xn + yn)2 <∞.

Se, depois de dois dias tentando, não conseguir, a resposta virá nas próximaspáginas...

Exceto em caso de menção explícita em contrário, todos nossos espaços ve-toriais são reais. Mas é importante ressaltar que, no caso em que o corpodos escalares é IC, também podemos falar em produto escalar. A principalobservação preliminar é que, enquanto, para números reais, é verdade que|x| =

√xx, o que vale nos complexos é |z| =

√zz (lembre que, se z = x+ iy,

então z = x− iy). Assim, é natural de�nir, em ICn,

Page 90: 2aPARTE - Colorida - Hipertexto (2)

90 CAPÍTULO 9. PRODUTO ESCALAR

〈(z1, . . . , zn), (w1, . . . , wn)〉 = z1w1 + · · ·+ znwn.

Exercício: Note que, identi�cando, da maneira natural, ICn a IR2n, o produto escalarque acabamos de de�nir é o produto escalar usual de IR2n.

De�nição: Dado um espaço vetorial complexo V, um produto escalar(também dito produto interno) em V é uma aplicação

〈, 〉 : V ×V −→ IC ,(u,v) 7−→ 〈u,v〉

com as seguites propriedades:

(i) 〈u,v〉 = 〈v,u〉 ∀u,v ∈ V(ii) 〈tu1 + u2,v〉 = t 〈u1,v〉+ 〈u2,v〉 ∀u1,u2,v ∈ V, ∀t ∈ IC(iii) 〈u,u〉 ≥ 0 ∀u ∈ V(iv) 〈u,u〉 = 0 =⇒ u = 0

Exercício: Prove, a partir da de�nição, as seguintes propriedades:

(i) 〈u1 + u2,v〉 = 〈u1,v〉+ 〈u2,v〉 ∀u1,u2,v ∈ V(ii) 〈0,v〉 = 0 ∀v ∈ V(iii) 〈tu,v〉 = t 〈u,v〉 ∀u ∈ V, ∀t ∈ IC(iv) 〈u, tv〉 = t 〈u,v〉 ∀u ∈ V, ∀t ∈ IC

Exercício: Note que 〈u + v,u + v〉 = 〈u,u〉+ 〈v,v〉+ 2Re 〈u,v〉.

Já que nossos espaços com produto interno serão sempre supostos reais, é umbom exercício veri�car, nas demonstrações que virão, quais valem tambémno caso complexo.

a Distâncias e ângulos

Seja E um espaço vetorial real com produto interno. De acordo com nossaexperiência no plano e no espaço geométricos, são naturais as de�nições se-guintes.

De�nição: Se u ∈ E, a norma de u é de�nida por

Page 91: 2aPARTE - Colorida - Hipertexto (2)

A. DISTÂNCIAS E ÂNGULOS 91

|u| =√〈u.u〉.

Se |u| = 1, u é dito unitário.

Exercício: Seja v um vetor não nulo. De�na u por u = 1|v|v. Mostre que |u| = 1.

Se u e v são dois pontos de E, sua distância é dada por |u− v|.1

De�nição: Dados os vetores não nulos u e v em E, o ângulo θ entre u e vé (o menor ângulo positivo) de�nido por

cos θ =〈u,v〉|u||v|

.

Nossas de�nições, mesmo que diretamente inspiradas pela Geometria Eucli-diana, têm satisfações a nos dar. Por exemplo: será que o número que aca-bamos de chamar de cosseno está, de fato, no intervalo [−1, 1]? Precisamosde algumas garantias de que as fantasias geométricas com que pretendemosvestir nossos espaços munidos de produto interno, embora fantasias, tenhamalguma verossimilhança.

Curiosamente, se considerarmos que um ângulo reto entre u e v é equivalentea 〈u,v〉 = 0, o Teorema de Pitágoras é um resultado básico.

Exercício: Sejam A, B e C três pontos de E. Considere o triângulo ABC. Façau = B −A e v = C −B. Note que C −A = u + v e que se o ângulo em B é reto,então 〈u,v〉 = 0.

Teorema de Pitágoras: Se u e v são vetores de E tais que 〈u,v〉 = 0,então

|u + v|2 = |u|2 + |v|2.

Demonstração: |u+v|2 = 〈u + v,u + v〉 = 〈u,u〉+ 〈v,v〉+ 2 〈u,v〉 = |u|2 +v|2 +

0.

Page 92: 2aPARTE - Colorida - Hipertexto (2)

92 CAPÍTULO 9. PRODUTO ESCALAR

Figura 9.1:

Figura 9.2:

Nossa de�nição de cosseno inspira a introdução da projeção de um vetor nadireção de outro.Se u e v são dois vetores em E, com |v| = 1, podemos projetar u na direçãode v, obtendo

uo = 〈u,v〉v.

Se v não é unitário, mas é não nulo, ainda podemos projetar u na direçãode v, fazendo

1O leitor deve observar que, a exemplo do que fazemos em situações geométricas, cos-tumamos dizer a norma do vetor fulano de tal, mas, quando se trata de distâncias, ousual é a distância entre os pontos tal e tal

Page 93: 2aPARTE - Colorida - Hipertexto (2)

A. DISTÂNCIAS E ÂNGULOS 93

uo =

⟨u,

1

|v|v

⟩1

|v|v =

1

|v|2〈u,v〉v =

〈u,v〉〈v,v〉

v.

Se nossas fantasias geométricas fazem sentido, o triângulo de vértices 0, uoe u tem um ângulo reto em uo.

Exercício: Mostre que 〈u− uo,uo〉 = 0.

Uma consequência óbvia do Teorema de Pitágoras é o seguinte fato: a hi-potenuza é maior que os catetos. No caso das projeções, isso se traduz por|u| ≥ |uo| e recebe um nome pomposo.

Desigualdade de Cauchy-Schwarz-Buniacóvski:

| 〈u,v〉 | ≤ |u||v| ∀u,v ∈ E.

Demonstração: Se um dos dois vetores é nulo, vale claramente a igualdade. Pode-mos, então, supor que são ambos não nulos e de�nir

uo =〈u,v〉〈v,v〉

v.

Temos, então,

〈u− uo,v〉 = 〈u,v〉 − 〈uo,v〉 = 〈u,v〉 − 〈u,v〉〈v,v〉

〈v,v〉 = 0.

Daí decorre 〈u− uo,uo〉 = 0, o que, por Pitágoras, nos dá |u|2 = |uo|2+|u−uo|2 ≥|uo|2, ou seja, |u| ≥ |uo|. Isso signi�ca

|u| ≥∣∣∣∣〈u,v〉〈v,v〉

v

∣∣∣∣ =| 〈u,v〉 ||v|2

|v| = | 〈u,v〉 ||v|

,

que é nossa desigualdade.

Observação: A desigualdade de Cauchy-Schwarz-Buniacóvski poderia ser,mais simplesmente, chamada de desigualdade do cosseno. De fato, CSBexpressa o fato de que aquilo que chamamos de cosseno do ângulo entre ue v,

〈u,v〉|u||v|

,

Page 94: 2aPARTE - Colorida - Hipertexto (2)

94 CAPÍTULO 9. PRODUTO ESCALAR

é um número entre -1 e 1.

Exercício: Sejam u e v vetores �xados. Use o fato de que, para todo real t, vale|u − tv|2 ≥ 0, expresse |u − tv|2 como um trinômio do segundo grau em t e dêuma outra demonstração, de inspiração puramente algébrica, para a desigualdadede Cauchy-Schwarz-Buniacóvski.

Exercício: Note que a igualdade, em CSB, só pode ocorrer se u = 0, v = 0 ouu− uo = 0, ou seja, se u e v forem linearmente dependentes.

A desigualdade CSB tem como consequência a desigualdade triangular:|u + v| ≤ |u|+ |v|.

Corolário (Desigualdade Triangular): Sejam u e v dois vetores. Então

|u + v| ≤ |u|+ |v|.

Supondo v não nulo, a igualdade |u + v| = |u|+ |v| ocorre se, e somente se,existe um real estritamente positivo, t, tal que u = tv.

Demonstração: A desigualdade decorre imediatamente de CSB. Temos, se vale aigualdade,

|u|2 + |v|2 + 2 〈u,v〉 = |u + v|2 = (|u|+ |v|)2 = |u|2 + |v|2 + 2|u||v|.

Daí decorre, portanto, a igualdade em CSB, o que mostra que u e v são linearmentedependentes. Como v é não nulo, devemos ter u = tv para algum t. Como〈u,v〉 = |u||v| > 0, t deve ser real positivo.

Observação: A desigualdade triangular exprime o fato de que o menor

caminho entre dois pontos é o segmento de reta que os une.

Exercício: Sejam (x1, . . . , xn) e (y1, . . . , yn) em IRn. Mostre que

n∑j=1

|xjyj | ≤

√√√√√ n∑j=1

x2j

n∑j=1

y2j

Exercício: Sejam (xn)n∈IN e (yn)n∈IN tais que

Page 95: 2aPARTE - Colorida - Hipertexto (2)

B. BASES ORTONORMAIS E PROJEÇÕES 95

∞∑n=1

x2n <∞,∞∑n=1

y2n <∞.

Passando ao limite a desigualdade do exercício anterior, mostre que

∞∑j=1

|xjyj | ≤

√√√√√ ∞∑j=1

x2j

∞∑j=1

y2j

.Conclua que l2(IR) é, de fato, um espaço vetorial.

Exercício: Sejam f e g funções contínuas de�nidas no intervalo [a, b] e a valores emIR. Mostre que

∫ b

a|f(x)g(x)|dx ≤

√∫ b

af(x)2dx

∫ b

ag(x)2dx.

b Bases ortonormais e projeções

Tomemos, como ponto de partida das considerações a seguir, a seguintequestão: massas muito grandes de dados podem ser difíceis de armaze-nar, transmitir e manipular. Como exemplo extremo, consideremos umafotogra�a ideal (em preto e branco), vista como uma função do retânguloR = [0, a] × [0, b] em IR. Uma tal fotogra�a vive, em princípio, em um es-paço de dimensão in�nita. Uma versão discreta implicaria, por exemplo, emdividir R em pequenos retângulos, de lados a/n e b/m (uma resolução alta

signi�cando tomar m e n grandes). Podemos, pois, supor que nossas fotogra-�as (discretas) são dadas por arquivos que vivem em um espaço de dimensãoN = m× n grande. Em determinadas situações, porém, seria preferível ter,dessas fotogra�as, versões em baixa resolução (de dimensãoM , digamos, comM < N).

Uma abordagem radicalmente simples da questão acima consistiria em fazerN = 3 e M = 2. Assim, nossos arquivos originais estariam em IR3, massuas versões em baixa resolução estariam em um espaço de dimensão 2 (noteque estamos evitando dizer que estariam em IR2, já veremos por que). Umasolução simples para a compactação seria jogar fora uma das coordenadas (asegunda, por exemplo). Assim, do arquivo (x1, x2, x3), guardaríamos apenas

Page 96: 2aPARTE - Colorida - Hipertexto (2)

96 CAPÍTULO 9. PRODUTO ESCALAR

(x1, x3)). Esta não é, provavelmente, a melhor ideia, a menos que a infor-mação contida em x2 possa, de alguma forma, ser (total ou parcialmente)recuperada a partir de x1 e x3.

Tentemos algo um pouco menos chutado. Examinemos a questão de umponto de vista geométrico. Vamos admitir duas coisas:

1. é razoável medir a diferença entre o arquivo x = (x1, x2, x3) e o arquivoy = (y1, y2, y3) por

√(x1 − y1)2 + (x2 − y2)2 + (x3 − y3)2 (que, como

sabemos, é a distância oriunda do produto escalar canônico de IR3);

2. nossos arquivos (ou, pelo menos, os que nos interessam) não estão to-talmente dispersos pelo espaço, mas apresentam um certo padrão, quenos permite dizer que se situam não muito longe de um certo plano, α(que, para simpli�car, suporemos passar pela origem).

Figura 9.3:

Nas condições acima, podemos adotar o seguinte procedimento:

1. aproximamos cada arquivo (ponto) x = (x1, x2, x3) por um arquivo(ponto) x em α, de forma que x seja a projeção ortogonal de x sobreα (o que, pelo que sabemos, garante que x seja o elemento de α maispróximo de x);

2. escolhendo uma base {ε1, ε2} de α, representamos x por suas coorde-nadas (x1, x2) na base {ε1, ε2}

Page 97: 2aPARTE - Colorida - Hipertexto (2)

B. BASES ORTONORMAIS E PROJEÇÕES 97

3. guardamos (ou utilizamos) o arquivo (x1, x2), que nos permite, a qual-quer momento (estando de posse de {ε1, ε2}), recuperar x = x1ε1+x2ε2.

A partir daí, temos duas di�culdades a enfrentar:

1. como encontrar a projeção x de x sobre α?

2. como representar x como combinação linear de ε1 e ε2?

Exercício: Como você enfrentaria essas questões?

Podemos resumir nosso problema da seguinte forma: dados o vetor x em IR3

e a base {ε1, ε2} de α, queremos encontrar o par ordenado (x1, x2) ∈ IR2 talque

〈x− (x1ε1 + x2ε2), v〉 = 0 ∀ v ∈ α.

Na realidade, como {ε1, ε2} é base de α, é (necessário e) su�ciente que

〈x− (x1ε1 + x2ε2), ε1〉 = 0

e

〈x− (x1ε1 + x2ε2), ε2〉 = 0.

Exercício: Observe que isso signi�ca que devemos resolver um sistema de duasequações e duas incógnitas. Note que, voltando ao caso geral em que estávamosem um espaço de dimensão N e queríamos reduzir o tamanho de nosso arquivo deN para M , poderíamos imitar o caso N = 3, M = 2; chegaríamos, então, a umsistema de M equações e M incógnitas.

Suponhamos agora que os vetores ε1 e ε2 sejam ortogonais. O sistema já vemresolvido! Temos, imediatamente,

x1 =〈x, ε1〉〈ε1, ε1〉

,

x2 =〈x, ε2〉〈ε2, ε2〉

.

Page 98: 2aPARTE - Colorida - Hipertexto (2)

98 CAPÍTULO 9. PRODUTO ESCALAR

Exercício: Suponha que V é um espaço com produto interno e que Vo é um subes-paço de V, com dim V = M . Suponha, ainda, que {ε1, . . . , εM} é base de Vo eque

〈εi, εj〉 = 0 ∀ i, j = 1, . . . ,M, i 6= j.

Mostre que, se v = x1ε1 + · · ·+ xMεM , então

xi =〈v, εi〉〈εi, εi〉

∀i = 1, . . . ,M.

Seja v um vetor em V . Suponha que

v = vo + u,

com vo ∈ Vo e

〈u,w〉 = 0 ∀w ∈ V.

Mostre que, escrevendo vo na base {ε1, . . . , εM}, temos vo = x1ε1 + · · ·+ xMεM ,com

xi =〈v, εi〉〈εi, εi〉

∀i = 1, . . . ,M.

Figura 9.4:

Page 99: 2aPARTE - Colorida - Hipertexto (2)

B. BASES ORTONORMAIS E PROJEÇÕES 99

A proposição a seguir é a versão geral das ideias geométricas que acabamosde discutir.

Proposição: Sejam V um espaço vetorial com produto interno, Vo umsubespaço de V, de dimensão M , e ε1, . . . , εM vetores em Vo tais que

〈εi, εj〉 = 0 ∀ i, j = 1, . . . ,M, i 6= j.

Então:

1. ε1, . . . , εM são linearmente independentes (e, como dim Vo = M , for-mam base de Vo).

2. Para todo v em V, o vetor v = x1ε1 + · · ·+ xMεM , com

xi =〈v, εi〉〈εi, εi〉

∀i = 1, . . . ,M,

é tal que

(a) 〈v − v,w〉 = 0 ∀w ∈ Vo;

(b) |v − v| ≤ |v −w| ∀w ∈ Vo;

(c) se vo pertence a Vo e |v− vo| ≤ |v−w| ∀w ∈ Vo, então vo = v.

Demonstração:

1. Se x1ε1 + · · · + xMεM , então, multiplicando escalarmente por εi dos doislados, temos:

0 = 〈x1ε1 + · · ·+ xMεM , εi〉 = x1 〈ε1, εi〉+ · · ·+ xM 〈εM , εi〉 = xi 〈εi, εi〉 .

Como εi 6= 0, temos 〈εi, εi〉 6= 0, o que nos dá xi = 0 e demonstra a indepen-dência linear de ε1 + · · ·+ εM .

2. Sejam v um elemento de V e v de�nido como acima. seja u = v− v. Então:

(a) Para cada i = 1, . . . ,M , temos

〈u, εi〉 = 〈v, εi〉 − 〈x1ε1 + · · ·+ xMεM , εi〉 = 〈v, εi〉 − xi 〈εi, εi〉 =

= 〈v, εi〉 − 〈v,εi〉〈εi,εi〉 〈εi, εi〉 = 0.

Como ε1 + · · ·+ εM formam base de Vo, isso mostra que 〈v − v,w〉 =0 ∀w ∈ Vo

Page 100: 2aPARTE - Colorida - Hipertexto (2)

100 CAPÍTULO 9. PRODUTO ESCALAR

(b) Se w está em Vo, então w − v está em Vo e é, portanto, ortogonal au. Segue do Teorema de Pitágoras que |v −w|2 = |u|2 + |w − v|2, oque prova que |v −w| ≥ |u|

(c) A demonstração do item anterior prova, também, que se v0 está em Vo

e vo 6= v, então |v − vo| > |u|.

De�nição: SejamV um espaço vetorial com produto interno, v um elementode V e Vo um subespaço vetorial de V. O vetor v de Vo é chamado deprojeção ortogonal de v sobre Vo se

〈v − v,w〉 = 0 ∀ w ∈ Vo.

Proposição: A projeção ortogonal é única.

Demonstração: A ideia geométrica é que, se v1 e v2 são projeções ortogonais de vsobre Vo, então o triângulo v1vv2 tem dois ângulos retos: já que w = v1−v2 estáem Vo, teremos

〈v − v1,w〉 = 0 = 〈v − v2,w〉 ,

Daí vem

0 = 〈(v − v2)− (v − v1),w〉 = 〈w,w〉 ,

o que dá |v1 − v2|2 = 0 e prova que v1 = v2.

Proposição: Sejam V um espaço vetorial com produto interno, v um ele-mento de V e Vo um subespaço vetorial de V. O vetor v de Vo é a projeçãoortogonal de v sobre Vo se, e somente se,

|v − v| ≤ |v −w| ∀ w ∈ Vo.

Demonstração: Se v é a projeção ortogonal de v sobre Vo e w ∈ Vo, temos〈v − v, v −w〉 = 0, o que, pelo Teorema de Pitágoras, nos dá |v−w|2 = |v− v|2+|v −w|2 e mostra que |v − v| ≤ |v −w|.

Reciprocamente, seja v em Vo tal que |v − v| ≤ |v −w| ∀ w ∈ Vo. Imaginemosque, para um certo u em Vo, tivéssemos 〈v − v,u〉 6= 0. Como poderíamos trocar

Page 101: 2aPARTE - Colorida - Hipertexto (2)

B. BASES ORTONORMAIS E PROJEÇÕES 101

u por −u e tomar o unitário de u sem sair de Vo, não haveria mal algum em supor|u| = 1 e 〈v − v,u〉 > 0. Projetando v − v sobre u e fazendo

vo = v + 〈v − v,u〉u,teríamos, pelo Teorema de Pitágoras,

|v − v|2 = |v − vo|2 + | 〈v − v,u〉u|2 = |v − vo|2 + (〈v − v,u〉)2 > |v − vo|2,

o que entraria em choque com nossa hipótese.

De�nição: Uma base {ε1, . . . , εn} do espaço vetorial V com produto internoé dita uma base ortogonal de V se

〈εi, εj〉 = 0 ∀ i, j = 1, . . . , n, i 6= j.

Se, além disso, tivermos 〈εi, εi〉 = 1 ∀ i = 1, . . . , n, então a base é ditaortonormal.

Exercício: Veja se entendeu mesmo. Suponha que {ε1, . . . , εn} é uma base ortonor-mal do espaço V. Seja v um elemento de V. Mostre que v = x1ε1 + · · · + xnεn,com

xi = 〈v, εi〉 ∀ i = 1, . . . , n.

Exercício: Por via das dúvidas, veja se está claro: se {v1, . . . ,vn} é base ortogonalde V, então {ε1, . . . , εn}, com

εi =1

|vi|vi, i = 1, . . . , n,

é base ortonormal de V.

Exercício: Um subconjunto K do espaço vetorial V é dito convexo se, para quais-quer u e v em K, o segmento [u,v] = {tv + (1− t)u, t ∈ [0, 1]} está contido emK (note que todo subespaço vetorial de V é convexo). Se V tem produto interno,a projeção sobre K do vetor v é o elemento pK(~v) de K dado por

|v − pk(v)| ≤ |v −w| ∀w ∈ K.A existência da projeção pK(v), para qualquer v em V, não é garantida, a menosque K seja um subconjunto fechado de V.2 Independente disso, prove:

2K é dito fechado se seu complementar em V é aberto. Um subconjunto A de V é ditoaberto se ∀x ∈ A ∃ε > 0 | |y − x| < ε⇒ y ∈ A

Page 102: 2aPARTE - Colorida - Hipertexto (2)

102 CAPÍTULO 9. PRODUTO ESCALAR

1. pK(v), se existe, é única;

2. O elemento vo de K é a projeção de v sobre K se, e somente se,

〈v − vo,w − vo〉 ≤ 0 ∀ w ∈ K.

3. Se existem pK(u) e pK(v), então |pK(u)− pK(v)| ≤ |u− v|.

Exercício: Seja V o espaço das funções contínuas de�nidas em [0, 2π] e a valoresem IR, com o produto interno

〈f, g〉 =

∫ 2π

0f(x)g(x)dx.

Seja, para cada n = 0, 1, 2, . . ., o elemento εn de V de�nido por

εn =

{cos n2x, n par

sin n+12 x, n impar

Mostre que, se n 6= m, 〈εn, εm〉 = 0.

c O processo de Gram-Schmidt

A seção anterior destacou o papel fundamental das bases ortonormais em es-paços com produto interno. Até agora, porém, não demonstramos a existên-cia de bases ortonormais em um contexto geral. Mais claramente: supondoque V é um espaço vetorial com produto interno, podemos garantir que Vtem uma base ortonormal? Todo o trabalho que já tivemos com as projeçõesdeve ter deixado pistas de que a resposta, se V é de dimensão �nita, é sim eindicar o processo que nos permite construir, a partir de uma base qualquerde V, uma base ortonormal.

Lema de Gram-Schmidt: Todo espaço vetorial de dimensão �nita comproduto interno tem base ortonormal. Se {v1, . . . ,vn} é base de V, então{ε1, . . . , εn}, construída recursivamente por:

1. ε1 = 1|v1|v1,

2. ui+1 = vi+1 −∑i

j=1−〈vi+1, εj〉 εj,

3. εi+1 = 1|ui+1|ui+1,

Page 103: 2aPARTE - Colorida - Hipertexto (2)

C. O PROCESSO DE GRAM-SCHMIDT 103

é base ortonormal de V.

Demonstração: Os εi são unitários por construção. A demonstração de que ui+1

(e, portanto, εi+1) é ortogonal a ε1, . . . , εi é uma simples conta.

Podemos, agora, juntar as ideias que já desenvolvemos sobre projeções e oLema de Gram-Schmidt em um teorema.

Teorema da Projeção: Sejam V um espaço vetorial com produto internoe Vo um subespaço vetorial de V. Suponhamos que Vo é de dimensão �nita.Então existe uma única aplicação P : V→ Vo satisfazendo, para cada v emV, às duas propriedades equivalentes:

1. 〈v − Pv,w〉 = 0 ∀w ∈ Vo

2. |v − Pv| ≤ |v −w| ∀w ∈ Vo

Se {ε1, . . . , εn} é base ortonormal de Vo, então a projeção é dada, para cadav em V, por

Pv =n∑i=1

〈v, εi〉 εi.

Exercício: Mostre que, para quaisquer v1 e v2 em V, vale |Pv1−Pv2| ≤ |v1−v2|,com igualdade se, e somente se, v1 − v2 ∈ Vo.

Page 104: 2aPARTE - Colorida - Hipertexto (2)

104 CAPÍTULO 9. PRODUTO ESCALAR

Page 105: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 10

Transformações lineares

a Em três dimensões

Ocupemo-nos, agora, das transformações, isto é, de processos pelos quaisum objeto se torna outro objeto.

Figura 10.1:

As possibilidades são, porém, amplas demais. Modestamente, cuidemos de

105

Page 106: 2aPARTE - Colorida - Hipertexto (2)

106 CAPÍTULO 10. TRANSFORMAÇÕES LINEARES

um tipo particularmente simples de transformação: aquele em que as com-binações lineares são preservadas. Mais rigorosamente, identi�cando pontose vetores, vejamos o que conseguimos dizer sobre funções

T : V −→ V

tais que

T (s~u+ t~v) = sT~u+ tT~v.

Por enquanto, V é o nosso velho e bom espaço dos vetores �echinhas, que,eventualmente, identi�camos a IR3.

De�nição: Uma aplicação T : V → V tal que, para quaisquer vetores ~ue ~v, e para qualquer escalar t, vale T (~u + t ~v) = T~u + t T~v é dita umatransformação linear.

Exercício: Mostre que T : V → V é uma transformação linear se, e somente se,valem as duas propriedades:

(i) T (t~u) = tT~u ∀ ~u ∈ V, t ∈ IR(ii) T (~u+ ~v) = T~u+ T~v ∀ ~u,~v ∈ V.

Prove primeiro que T (~u + ~v) = T~u + T~v, fazendo t = 1; depois prove que T~0 = ~0 (veja abaixo); em seguida, para T (t~u),

faça T (t~u) = T (~0 + t~u) = T~0 + tT~u

Exercício: Mostre que, se T : V → V é uma transformação linear, então T~0 = ~0 eT (−~v) = −T~v ∀ ~v ∈ V .T~0 = T (~0 + ~0) = T~0 + T~0)

Exercício: Mostre que, se T : V → V é uma transformação linear, ~u e ~v são doisvetores �xos, r é a reta dada por r = {~u+ t~v, t ∈ IR} e T~v 6= ~0, então T (r) é umareta.

Exemplo 1: Considere o sistema lineara11x1 + a12x2 + a13x3 = y1a21x1 + a22x2 + a23x3 = y2a31x1 + a32x2 + a33x3 = y3

No lugar de pensar em resolver o sistema, pense nele como uma transformaçãoque, a cada terno ordenado (x1, x2, x3), associa o terno ordenado (y1, y2, y3),

Page 107: 2aPARTE - Colorida - Hipertexto (2)

A. EM TRÊS DIMENSÕES 107

de�nido por y1 = a11x1 + a12x2 + a13x3, y2 = a21x1 + a22x2 + a23x3, y3 =a31x1+a32x2+a33x3. Fixe, agora, em V , uma base (a canônica, por exemplo).Considere, então que nossa transformação, T , leva o vetor ~v no vetor ~w = T~v,da seguinte forma: se ~v = x1~e1 + x2~e2 + x3~e3, então ~w = y1~e1 + y2~e2 + y3~e3,com (y1, y2, y3) de�nido como acima.

Exercício: Mostre que a transformação que acabamos de de�nir é linear.

Exercício: Mostre que a ideia é boa: se o sistema tiver só duas equações, poderíamosde�nir uma transformação linear que a cada vetor do espaço associasse um vetor doplano. Da mesma forma, se tivéssemos só duas variáveis (x1 e x2) e três equações,poderíamos de�nir uma transformação linear que a cada vetor do plano associasseum do espaço. mais geral mente, podemos considerar que, por trás de cada sistemalinear com m equações e n incógnitas, está uma transformação linear do espaçoIRn no espaço IRm.

Exemplo 2: Como sabemos, cada vetor ~v de V se escreve, de maneira única,como ~v = x~e1 + y~e2 + z ~e3. Escolha, arbitrariamente, três vetores, ~ε1, ~ε2 e ~ε3em V . De�na, então, T : V → V por

x~e1 + y~e2 + z ~e3 = ~v 7−→ t~v = x~ε1 + y~ε2 + z~ε3.

Exercício: Mostre que a transformação T de�nida acima é linear.

Exercício: Mostre que toda transformação linear T : V → V cabe no exemploacima. Solução: considere uma transformação linear T : V → V ; de�na ~ε1, ~ε2 e ~ε3por ~ε1 = T ~e1, ~ε2 = T ~e2, ~ε3 = T ~e3; faça as contas.

Exercício: Pense o exemplo 1 em termos do exemplo 2. Expresse os vetores ~ε1, ~ε2e ~ε3 em termos dos coe�cientes do sistema.

Os exemplo 1 e 2 abarcam tudo, são gerais demais. Sejamos mais especí�cos.

Exemplo 3: Consideremos uma rotação do espaço em torno do eixo vertical.Convença-se de que trata-se de uma transformação linear. Chamando de θo ângulo de rotação (no sentido trigonométrico, olhando de cima), teremos:

T ~e1 = cos θ~e1 + sin θ~e2, T ~e2 = − sin θ~e1 + cos θ~e2, T ~e3 = ~e3.

Assim, se o vetor ~v é dado, em coordenadas canônicas, por (x, y, z), então

Page 108: 2aPARTE - Colorida - Hipertexto (2)

108 CAPÍTULO 10. TRANSFORMAÇÕES LINEARES

T~v = T (x~e1 + y~e2 + z ~e3) = xT ~e1 + yT ~e2 + zT ~e3 == x(cos θ~e1 + sin θ~e2) + y(− sin θ~e1 + cos θ~e2) + z ~e3 == (x cos θ − y sin θ)~e1 + (x sin θ + y cos θ)~e2 + z ~e3.

Exercício: Conclua que a imagem do vetor de coordenadas (na base canônica)(x, y, z) é dada, em coordenadas, por

(x cos θ − y sin θ, x sin θ + y cos θ, z).

Se você sabe multiplicar matrizes, observe que, se (x′, y′, z′) são as coordenadas daimagem, então x′

y′

z′

=

cos θ − sin θ 0sin θ cos θ 0

0 0 1

xyz

.

Exercício: Seja T a transformação linear dada pela rotação do espaço em tornodo eixo que passa pela origem e tem a direção de um vetor ~v qualquer. Os casos~v = ~e2 e ~v = ~e3 são, claro, análogos ao exemplo 3. Suponha que ~v seja dado,em coordenadas canônicas, por ~v = (a, b, c). Como obter as coordenadas, na basecanônica, da imagem por T de um vetor ~u de coordenadas (x, y, z)?

Exemplo 4: Considere a seguinte transformação: um vetor horizontal ~ε é�xado (isto é, ε é combinação linear de ~e1 e ~e2). Cada ponto do espaçoanda um pouco na direção dada por ~ε; o quanto anda é proporcional suaaltura. Mais precisamente, �xamos um número α; cada vetor ~v = x~e1 +y~e2 + z ~e3 é, então, levado em T~v = ~v + αz~ε. Uma tal transformação é ditaum cisalhamento (horizontal, na direção do vetor ~ε).Exercício: Mostre que nossa transformação faz com que os planos horizontais sedesloquem sobre si mesmos. Isto é: para cada z0, os pontos do plano horizontal dealtura z0 sofrem, todos uma mesma translação (qual?).

Exercício: Mostre que cisalhamentos preservam volumes.

Exercício: Se ~ε = a~e1 + b~e2, escreva as coordenadas, na base canônica, de T~v emfunção das de ~v. Mostre que, de fato, cisalhamentos horizontais preservam volumes.

Exercício: É claro que podemos de�nir, de forma análoga, cisalhamentos em que ~εseja combinação linear de dois outros vetores da base canônica. Faça isso.

Exercício: E, se ~ε for um vetor qualquer, como de�nir um cisalhamento na direçãode ε?

Page 109: 2aPARTE - Colorida - Hipertexto (2)

B. O TREPA-TREPA CATALÃO 109

Exemplo 5: Seja T a re�exão através do plano horizontal. Em coordenadas,T é dada por: T (x1, x2, x3) = (x1, x2,−x3). O exemplo é bobo, mas servepara colocar a seguinte questão:

Exercício: Seja α um plano qualquer, passando pela origem (pode ser dado por seuvetor normal, ou por um par de vetores linearmente independentes de α). Comoexpressar a re�exão através de α?

b O trepa-trepa catalão

Vamos agora trabalhar um pouco mais a geometria das transformações line-ares. Tomemos como ponto de partida a seguinte ideia: trata-se de transfor-mações T tais que T (x~e1 +y~e2 +z ~e3) = x~ε1 +y~ε2 +z~ε3, ou seja, mantemos ascoordenadas (x, y, z) de cada ponto, mas, essencialmente, mudamos a basedo sistema de coordenadas.1

Figura 10.2:

1Quando dizemos essencialmente, é por que, na verdade, não é preciso, para que T sejalinear, que ~ε1, ~ε2 e ~ε3 sejam linearmente independentes. O caso das projeções é um bomexemplo

Page 110: 2aPARTE - Colorida - Hipertexto (2)

110 CAPÍTULO 10. TRANSFORMAÇÕES LINEARES

Mais precisamente, consideremos um objeto ϕ, que consiste em um conjuntode pontos do espaço dados, em coordenadas canônicas, por ternos ordenados(digamos que estes ternos ordenados estão guardados em um arquivo quetambém chamaremos de ϕ). Isto signi�ca que a cada terno ordenado (x, y, z)corresponde um ponto P cujo vetor posição é

x~e1 + y~e2 + z ~e3.

Mas o que acontece se resolvermos mudar a base de nosso sistema de coor-denadas, trocando {~e1,~e2,~e3} por {~ε1,~ε2,~ε3}? A resposta é simples: quandoformos ao arquivo e trouxermos o terno ordenado (x, y, z), nosso sistema nosdará não mais o ponto P cujo vetor posição é x~e1 + y~e2 + z ~e3, mas o pontoP ′, cujo vetor posição é

x~ε1 + y~ε2 + z~ε3.

Figura 10.3:

Observação: Estamos, na verdade, fazendo uma opção no que diz respeitoà maneira como vamos representar, em nossas cabeças, uma transformaçãolinear. O efeito visual da transformação T é claro: transportamos o ponto P

Page 111: 2aPARTE - Colorida - Hipertexto (2)

C. TRANSFORMAÇÕES LINEARES 111

do reticulado que tem por base um cubo (de�nido por meio de ~e1, ~e2 e ~e3) parao ponto P ′ (de mesmas coordenadas) do reticulado que tem por base um pa-ralelepípedo (de�nido por ~ε1, ~ε2 e ~ε3). É como se a prefeitura contratasse umarquiteto (provavelmente catalão), para remodelar as pracinhas. O arquiteto,então, altera os brinquedos conhecidos como trepa-trepa, fazendo com quedeixem de ser tão certinhos, assumindo, na nova versão, formas mais oblíquas.

Exercício: Seja T : V → V uma transformação linear, com T ~e1 = ~ε1, T ~e2 =~ε2, T ~e3 = ~ε3. Identi�que, no espaço, pontos a vetores. Considere um sólidoϕ. Dividindo o espaço em cubinhos com lados nas direções dos vetores da basecanônica, obtenha uma aproximação para o volume de ϕ. Considere, agora, aimagem de ϕ por T , T (ϕ). Aproxime o volume de T (ϕ) usando os paralelepípedos(com lados nas direções de ~ε1, ~ε2 e ~ε3) imagens dos que usou para aproximar ovolume de ϕ. Note que a razão entre o volume de cada paralelepipedozinho e ocorrespondente cubinho é igual à que existe entre o volume do paralelepípedo Pε,formado por ~ε1, ~ε2 e ~ε3, e o volume do paralelepípedo formado por ~e1, ~e2 e ~e3.Mostre que essa razão é igual a |det(~ε1, ~ε2, ~ε3)|. Conclua que a razão entre o volumede T (ϕ) e o de ϕ é

volume de T (ϕ)

volume de ϕ= |det(~ε1, ~ε2, ~ε3)|.

c Transformações lineares

Embora tenhamos concentrado nossos exemplos no caso tridimensional, trans-formações lineares são algo bem mais geral.

De�nição: Sejam V e W dois espaços vetoriais. Uma função T : V →Wé dita uma transformação linear se

T (u + tv) = Tu + tTv ∀ u,v ∈ V.

Exercício: Mostre que T : V → W é uma transformação linear se, e somente se,valem as duas propriedades:

(i) T (t~u) = tT~u ∀ ~u ∈ V, t ∈ IR(ii) T (~u+ ~v) = T~u+ T~v ∀ ~u,~v ∈ V.

Page 112: 2aPARTE - Colorida - Hipertexto (2)

112 CAPÍTULO 10. TRANSFORMAÇÕES LINEARES

Exemplo 1: Por trás do sistema lineara11x1 + . . .+ a1nxn = y1

· · ·am1x1 + . . .+ amnxn = ym

está a transformação linear A : IRn −→ IRm, dada por

A(x1, . . . , xn) = (y1, . . . , ym),

com, para cada i = 1, . . . ,m,

yi = ai1x1 + . . .+ ainxn =n∑j=1

aijxj.

Exemplo 2: Se V = C1(IR, IR) e W = Co(IR, IR) (o que signi�ca que Vé o espaço das funções com derivada primeira contínua e W é o espaço dasfunções contínuas), então o operador D : V→W de derivação, de�nido porDf = f ′ (isto é, D leva f em sua derivada) é linear.

Exemplo 3: Se W = Co(IR, IR), o operador de integração de a até b,I : W −→ IR, dado por

If =

∫ b

a

f(x)dx,

é linear.

Exemplo 4: Se V é o espaço das sequências in�nitas de números reais (umelemento de V é uma sequência (xn)n∈IN) então o operador shift , S : V −→V, dado por

S(x1, x2, x3, x4, . . .) = (0, x1, x2, x3, . . .),

é linear.

Exercício: Mostre que a transformação D do exemplo 2 é sobrejetiva mas nãoinjetiva.

Page 113: 2aPARTE - Colorida - Hipertexto (2)

D. UM POUQUINHO DE ÁLGEBRA 113

Exercício: Mostre que a transformação S do exemplo 4 é injetiva mas não sobreje-tiva.

d Um pouquinho de Álgebra

O exercício a seguir é tão importante que poderia até ser convertido emProposição e demonstrado no texto. Se você entendeu a história de dimensão,o que é crucial, deve ser fácil.

Exercício: Sejam V um espaço vetorial de dimensão �nita e T : V→ V linear. Seja{ε1, . . . , εn} uma base deV. Observe que a imagem de T , isto é, o conjunto ImT =

{Tv, v ∈ V} é o conjunto das combinações lineares de Tε1, . . . , T εn. Mostre queT é injetiva se e somente se é sobrejetiva.

Vamos considerar a operação produto de transformações lineares, quenada mais é que a composição de funções: se T : V1 → V2 e S : V2 → V3 sãotransformações lineares, seu produto é a transformação linear ST : V1 → V3,dada por (ST )v = S(Tv).

Exercício: Mostre que ST é, de fato, linear. Observe que, como a composição defunções, o produto de transformações lineares é associativo, isto é: sempre vale(RS)T = R(ST ).

Exercício: Mostre que o produto é distributivo em relação à adição:2 se R,S :

V1 → V2 e T : V2 → V3 são lineares, então T (R + S) = TR + TS; da mesmaforma, se T : V1 → V2 e R,S : V2 → V3 são lineares, então (R+S)T = RT+ST .

De�nição: Seja I : V → V a transformação (linear) identidade, isto é,Iv = v ∀ v ∈ V. Se T : V → V é linear e existe T−1 : V → V talque T−1T = I = TT−1, T é dita invertível (e T−1 é dita inversa de T ).Transformações lineares invertíveis são também chamadas de isomor�smos.

Exercício: Mostre que a inversa, caso exista, é linear e única.

Exercício: Suponha que V seja de dimensão �nita, que T : V → V seja linear eque exista S : V→ V tal que ST = I (não se supõe S linear). Mostre que, então,T tem inversa e que S = T−1.

2Se R,S : V1 → V2 são lineares, sua soma, R + S é de�nida da maneira óbvia:(R+ S)v = Rv + Sv

Page 114: 2aPARTE - Colorida - Hipertexto (2)

114 CAPÍTULO 10. TRANSFORMAÇÕES LINEARES

Exercício: Suponha que R e S sejam transformações lineares invertíveis. Mostreque RS é invertível e que (RS)−1 = S−1R−1.

Exercício: Seja L(V) o conjunto das transformações lineares de V em V. Se A eB pertencem a L(V), de�ne-se o colchete de Lie [A,B] por [A,B] = AB −BA.Mostre que, para quaisquer A, B e C, vale

[A, [B,C]] + [B, [C,A]] + [C, [A,B]] = 0.

e Isometrias

Transformações lineares são os homomor�smos de espaços vetoriais (trans-formações de um espaço em outro que preservam as operações). Se o espaço,além das operações de adição e multiplicação por escalar, é dotado de um pro-duto interno, podemos considerar transformações que preservem não apenasas operações de espaço vetorial, mas também o próprio produto interno. Aocontrário das simples transformações lineares, que não precisam ser injetivas,transformações desse tipo especial não podem deixar de sê-lo.

Proposição: Sejam V1 e V2 espaços vetoriais com produto interno e T :V1 → V2 uma trensformação linear tal que

〈Tu, Tv〉 = 〈u,v〉 ∀ u,v ∈ V1.

Então T é injetiva.

Demonstração: Basta provar que u 6= 0 ⇒ Tu 6= 0, o que equivale a |Tu| 6= 0.Mas isso é claramente verdade, já que u 6= 0 ⇒ 0 6= 〈u,u〉 = 〈Tu, Tu〉 ⇒ |Tu| 6=0.

Observemos que preservar produto interno implica em preservar distâncias eângulos. Na demonstração da proposição anterior, porém, utilizamos apenasa preservação das distâncias.

Proposição: Sejam V1 e V2 espaços vetoriais com produto interno e T :V1 → V2 uma transformação linear tal que |Tu| = |u| para todo u em V1

(ou seja: T preserva a norma). Então T preserva o produto interno, isto é:

〈Tu, Tv〉 = 〈u,v〉 ∀ u,v ∈ V1.

Page 115: 2aPARTE - Colorida - Hipertexto (2)

E. ISOMETRIAS 115

Demonstração: Da hipótese, temos, para quaisquer u e v em V1, |T (u + v)| =|u + v|. Daí vem

|u|2 + |v|2 + 2 〈u,v〉 = |u + v|2 = |Tu + Tv|2 = |Tu|2 + |Tv|2 + 2 〈Tu, Tv〉 .

Como |u|2 = |Tu|2 e |v|2 = |Tv|2, segue 〈u,v〉 = 〈Tu, Tv〉.

Tentemos ir um pouco além: vamos manter a hipótese de preservação dasdistâncias mas retirar a linearidade.

Exercício: Note que, sem a hipótese de linearidade, a preservação das distânciasnão é garantida se supusermos apenas a preservação da norma.

Exercício: Sejam V1 e V2 espaços vetoriais com produto interno e f : V1 → V2

uma transformação preservando distâncias, isto é: |f(u)−f(v)| = |u−v| ∀ u, v ∈V1. Mostre, com um exemplo (tipo f : IR2 → IR2), que não necessariamente temosf linear.

Exercício: Seja f : IR2 → IR2 preservando distâncias e tal que f(~0) = ~0. Useargumentos geométricos para provar que f é linear. Mostre que o mesmo vale paraf : IR2 → IR3.

Exercício: Refaça a demonstração do exercício anterior usando apenas argumentosalgébricos, isto é: IR2 é um espaço vetorial real, com produto interno, de dimensão2, o mesmo valendo para IR3, com dimensão 3).

Os exercícios acima nos dão motivos de sobra para acreditar na veracidadeda proposição a seguir.

Proposição: Sejam V1 e V2 espaços vetoriais reais com produto interno ef : V1 → V2 uma função preservando distâncias (isto é: |f(u) − f(v)| =|u − v| ∀ u, v ∈ V1). Suponhamos que, além disso, f(0) = 0. Então f éuma transformação linear.

Demonstração: Uma primeira demonstração remete aos exercícios precedentes. To-mamos u e v em V1, t em IR. Consideramos f(u), f(v) e f(u + tv) em V2.Consideramos o espaço E gerado por u e v. Do ponto de vista algébrico, não háqualquer diferença entre E e IR2 (�xando, em E, uma base ortonormal, podemosidenti�car E e IR2, inclusive para efeitos de produto interno). Da mesma forma,podemos identi�car o subespaço F de V2, gerado por f(u), f(v) e f(u+ tv), comIR3. Daí para a frente, deve ser possível usar os mesmos argumentos algébricosapresentados na solução do exercício para provar que f(u + tv) = f(u) + tf(v).

Page 116: 2aPARTE - Colorida - Hipertexto (2)

116 CAPÍTULO 10. TRANSFORMAÇÕES LINEARES

Como os exercícios não estão resolvidos no texto, comecemos do começo. Sejamu, v em V1 e t em IR. Provemos que f(u + tv) = f(u) + tf(v).

Comecemos observando que, como f(0) = 0, f preserva norma (já que |f(u)| =|f(u)− f(0)|). Daí vem

|f(u)|2 + |f(v|2 − 2 〈f(u), f(v)〉 = |f(u)− f(v)|2 == |u− v|2 = |u|2 + |v|2 − 2 〈u,v〉 .

Logo, temos 〈f(u), f(v)〉 = 〈u,v〉 (entenda isso como triângulos de lados congru-entes têm ângulos correspondentes também congruentes, o que implica em dizer quea preservação de distâncias nos dá a preservação de ângulos). Daí vem:

|f(u + tv)− (f(u) + tf(v))|2 == 〈f(u + tv)− (f(u) + tf(v)), f(u + tv)− (f(u) + tf(v))〉 =|f(u + tv)− f(u)|2 + t2|f(v)|2 − 2t 〈f(u + tv)− f(u), f(v)〉 =|(u + tv)− u|2 + t2|v|2 − 2t 〈(u + tv)− u,v〉 = 0,

o que prova que f(u + tv) = f(u) + tf(v).

Exercício: Note que a mesma demonstração se aplica a espaços vetoriais complexos(trocando 〈, 〉 por Re 〈, 〉 quando necessário).

Transformações preservando distâncias são ditas isométricas. Bijeções pre-servando distâncias são chamadas de isometrias.

Exercício: Observe que, pelo que acabamos de ver, transformações isométricas entreespaços vetoriais com produto interno são, a menos de translações, lineares (isto é:se |f(u) − f(v)| = |u − v| ∀ u, v ∈ V1), então existem wo ∈ V2 e T : V1 → V2

linear tais que f(u) = wo + tu ∀u ∈ V1).

De�nição: Seja V um espaço vetorial com produto interno. Uma transfor-mação linear bijetiva T : V → V é dita ortogonal se 〈Tu, Tv〉 = 〈u,v〉para quaisquer u e v em V.

Page 117: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 11

A matriz de uma transformaçãolinear

A noção de matriz surge naturalmente a partir de sistemas lineares. O sis-tema

a11x1 + · · ·+ a1nxn = b1· · ·

am1x1 + · · ·+ amnxn = bm

pode ser representado, na forma matricial, por a11 · · · a1n... · · · ...am1 · · · amn

x1

...xn

=

b1...bm

.

É também natural considerar, associada à matriz m× n 1

(aij) =

a11 · · · a1n... · · · ...am1 · · · amn

,

a transformação linear A : IRn → IRm, dada por Ax = y, com

1Embora o conceito de matriz seja bastante simples, não custa dar uma de�ni-ção precisa: uma matriz m × n (aij) com entradas no conjunto X é uma aplicaçãoa : {1, . . . ,m} × {1, . . . , n} → X. É usual notar a(i, j) por aij

117

Page 118: 2aPARTE - Colorida - Hipertexto (2)

118 CAPÍTULO 11. A MATRIZ DE UMA TRANSFORMAÇÃO LINEAR

y1...ym

=

a11 · · · a1n... · · · ...am1 · · · amn

x1

...xn

.

Vamos, porém, inverter a ordem natural das coisas. Partiremos das trans-formações lineares para associar-lhes matrizes.

a No plano

Para simpli�car um pouco, voltemos à tela do computador e ao plano. Recor-demos que a representação dos pontos na tela se faz por meio de um sistemade coordenadas �xo. Assim, ao par ordenado (x, y) corresponderá sempre,na tela, o ponto P cujo vetor posição é x~e1 + y~e2 ({~e1,~e2} é suposta ser abase do sistema de coordenadas da tela). Consideremos agora dois vetores,~ε1 e ~ε2, e a tansformação T que leva x~e1 + y~e2 em x~ε1 + y~ε2. Teoricamenteestá lindo, abstrato, mas nosso problema prático é: dado um ponto P , comovamos saber qual é o ponto P ′ em que T transforma P? Digamos assim:se o ponto P é dado por suas coordenadas (x, y), como vamos calcular ascoordenadas (x′, y′) de seu transformado P ′?

Exercício: Note que o que queremos são as coordenadas de P ′ no sistema de base{~e1, ~e2}}, que é o único que nosso computador conhece.

A primeira coisa a saber é, é claro, quem são os vetores ~ε1 e ~ε2. Ora, se nossocomputador só conhece o sistema de base {~e1,~e2}, ~ε1 e ~ε2 devem ser indicadospor suas coordenadas nesse sistema. Digamos que

~ε1 = (3, 2), ~ε2 = (1, 4).

Exercício: Pegue papel quadriculado e desenhe. Marque os vetores ~ε1 e ~ε2.

Exercício: Marque o ponto P ′ cujo vetor posição é 2~ε1+~ε2.

Consideremos o ponto P dado por suas coordenadas, P = (2, 1). Isto signi�caque o vetor posição de P é 2~e1+~e2. Logo, P será transformado no ponto P ′

cujo vetor posição é 2~ε1+~ε2.

Page 119: 2aPARTE - Colorida - Hipertexto (2)

A. NO PLANO 119

E agora atenção para o pulo do gato: se temos as coordenadas de ~ε1 eas de ~ε2 no sistema de base {~e1,~e2} (~ε1=(3,2), ~ε2=(1,4)), então temos as de2~ε1+~ε2:

2~ε1 + ~ε2 = 2(3, 2) + (1, 4) = (6, 4) + (1, 4) = (7, 8).

Ora, mas as coordenadas do vetor posição de P ′ são as coordenadas do pontoP ′. Logo, P ′ = (7, 8).

Exercício: Certi�que-se de que entendeu tudo.

Figura 11.1:

Exercício: Veja se as coisas �caram claras. Continuemos no plano. Pegue duasfolhas de papel quadriculado e marque a origem O em cada um dos dois. Desenheuma �gura (não muito grande nem muito complicada) em uma das folhas (podeser, por exemplo, um dos quadradinhos). Escolha dois vetores ~ε1 e ~ε2 (~ε1=(2, 1),~ε2=(−1, 3), por exemplo) e marque-os (com pé na origem) na outra folha. Construana segunda folha, por cima do quadriculado original, o reticulado de base {~ε1,~ε2}.Desenhe nesta última folha, com auxílio do reticulado, a imagem de sua �gurapela transformação T que leva x~e1 + y ~e2 em x~ε1 + y~ε2. Um ponto P ′ da nova�gura foi marcado usando o sistema de coordenadas de base {~ε1,~ε2}. Suponha quesuas coordenadas, neste sistema, são (x, y) (note que isto quer dizer que seu vetor

Page 120: 2aPARTE - Colorida - Hipertexto (2)

120 CAPÍTULO 11. A MATRIZ DE UMA TRANSFORMAÇÃO LINEAR

posição é x~ε1 + y~ε2 e que P ′ é imagem do ponto P da �gura original cujo vetorposição é x~e1 + y ~e2). Pois bem, o ponto P ′ tem coordenadas (x′, y′), referentes aopapel quadriculado, que são, é claro, diferentes das coordenadas (x, y) de P (noteque (x, y) são as coordenadas de P ′, só que no sistema de base {~ε1,~ε2}). O queacabamos de mostrar é que

(x′

y′

)=

(a11 a12a21 a22

)(xy

)=: x

(a11a21

)+ y

(a12a22

)=:

=:

(a11xa21x

)+

(a12ya22y

)=:

(a11x+ a12ya21x+ a22y

),

onde

~ε1 =

(a11a21

), ~ε2 =

(a12a22

).

b Matriz de uma transformação linear

Vamos utilizar com frequência, como já �zemos no plano, uma notação al-ternativa: ternos ordenados em pé. Isto é, podemos representar o ternoordenado (x, y, z) pelo vetor coluna x

yz

.

Usando a nova notação, o terno ordenado P ′ correspondente a

−2(3, 2, 1) + (−3)(1, 4, 7)

será indicado por

−2

321

+ (−3)

147

=

−9−16−23

.

Page 121: 2aPARTE - Colorida - Hipertexto (2)

B. MATRIZ DE UMA TRANSFORMAÇÃO LINEAR 121

O terno ordenado P ′ correspondente a

π(3, 2, 1) +√

5(1, 4, 7)

será indicado por

π

321

+√

5

147

=

3π2ππ

+

√5

4√

5

7√

5

=

3π +√

5

2π + 4√

5

π + 7√

5

.

Façamos ~ε1 = (3, 2, 1), ~ε2 = (1, 4, 7), ~ε3 = (1, 1, 0) e consideremos a trans-formação T dada por T (x~e1 + y~e2 + z ~e3) = x~ε1 + y~ε2 + z~ε3. Em termospráticos, interessa-nos conhecer as coordenadas, na base canônica, do pontoP ′ = (x′, y′, z′), imagem por T do ponto P = (x, y, z). Ora, não é difícil verque

x′

y′

z′

= x

321

+ y

147

+ z

110

=

3x+ y + z2x+ 4y + zx+ 7y

.

Assim, para indicar a transformação T correspondente aos vetores ~ε1, ~ε2e ~ε3, usaremos uma matriz tendo ~ε1, ~ε2 e ~ε3 nas colunas, de�nindo suamultiplicação por uma matriz coluna (que representa um vetor) como abaixo:

3 1 12 4 11 7 0

xyz

= x

321

+y

147

+z

110

=

3x+ y + z2x+ 4y + zx+ 7y

.

Exercício: Se o ponto P ′ é a imagem de P (P ′ = T (P )) pela transformação de�nidaacima, quais seriam as coordenadas (x′, y′, z′) de P ′ se P = (−2,−3, 1)? E seP = (π,

√5, e)?

Exercício: Quais seriam as coordenadas (x′, y′, z′) de P ′ se P = (x, y, z) e mudás-semos ~ε1, ~ε2 e ~ε3 para ~ε1=(1,1,0), ~ε2=(-2,3,0), ~ε3=(1,1,3)?

Exercício: Quais seriam as coordenadas (x′, y′, z′) de P ′ se P = (x, y, z) e ~ε1 =

(a11, a21, a31), ~ε2 = (a12, a22, a32), ~ε3 = (a13, a23, a33)?

Page 122: 2aPARTE - Colorida - Hipertexto (2)

122 CAPÍTULO 11. A MATRIZ DE UMA TRANSFORMAÇÃO LINEAR

Já é hora de explicitarmos as de�nições.

De�nição : Dados os vetores ~ε1, ~ε2 e ~ε3, seja T : V → V a transformaçãolinear que associa, a cada vetor (x, yz) = x~e1 +y~e2 + z ~e3, o vetor (x′, y′, z′) =x~ε1 +y~ε2 +z~ε3. Se as coordenadas de ~ε1, ~ε2 e ~ε3 na base (~e1, ~e2, ~e3) são dadaspor

~ε1 =

a11a21a31

, ~ε2 =

a12a22a32

, ~ε3 =

a13a23a33

,

a matriz da transformação T é a11 a12 a13a21 a22 a23a31 a32 a33

.

De�nição : Dados a matriz

a11 a12 a13a21 a22 a23a31 a32 a33

e o vetor coluna

xyz

, o

produto a11 a12 a13a21 a22 a23a31 a32 a33

xyz

é de�nido por

a11 a12 a13a21 a22 a23a31 a32 a33

xyz

= x

a11a21a31

+ y

a12a22a32

+ z

a13a23a33

=

=

a11xa21xa31x

+

a12ya22ya32y

+

a13za23za33z

=

a11x+ a12y + a13za21x+ a22y + a23za31x+ a32y + a33z

.

Page 123: 2aPARTE - Colorida - Hipertexto (2)

B. MATRIZ DE UMA TRANSFORMAÇÃO LINEAR 123

Observação: Nossas de�nições foram feitas sob medida para que, dado oponto P = (x, y, z), as coordenadas (x′, y′, z′) do ponto P ′ = T (P ) sejamdadas por x′

y′

z′

=

a11 a12 a13a21 a22 a23a31 a32 a33

xyz

.

Exercício: Determine a matriz de cada uma das transformações de�nidas nos exem-plos 1 a 5 da primeira seção deste capítulo.

Exercício: Considere as transformações lineares A : V → V e B : V → V , dadas,respectivamente, pelas matrizes (aij) e (bij),

(aij) =

a11 a12 a13a21 a22 a23a31 a32 a33

, (bij) =

b11 b12 b13b21 b22 b23b31 b32 b33

.

Seja C : V → V , C = AB, isto é: C é dada por C~v = A(B~v). Mostre que a matrizde C é o produto das matrizes de A e B, isto é: a matriz de C, (cij), é dada peloproduto de (aij) e (bij), c11 c12 c13

c21 c22 c23c31 c32 a33

=

a11 a12 a13a21 a22 a23a31 a32 a33

b11 b12 b13b21 b22 b23b31 b32 b33

,

com cij = ai1b1j + ai2b2j + ai3b3j .

De�nição: A i-ésima linha da matriz (aij) é o terno ordenado (ai1, ai2, ai3)(por analogia, o vetor representado, na base canônica por uma linha de (aijé chamado de vetor linha de (aij)). Analogamente, a j-ésima coluna damatriz (aij) é o terno ordenado (a1j, a2j, a3j) (e o vetor representado, na basecanônica por uma coluna de (aij) é chamado de vetor coluna de (aij)).

Assim, dizemos que o produto das matrizes A e B é a matriz C = AB,cujas entradas cij são dadas pelo produto escalar da i-ésima linha de A pelaj-ésima coluna de B.

Exercício: Seja I a matriz dada por

Page 124: 2aPARTE - Colorida - Hipertexto (2)

124 CAPÍTULO 11. A MATRIZ DE UMA TRANSFORMAÇÃO LINEAR

1 0 00 1 00 0 1

.

Mostre que IA = A = AI, qualquer que seja a matriz 3× 3 A.

De�nição: A matriz I de�nida acima é chamada matriz identidade. SeA é uma matriz 3× 3 e A−1 é outra matriz 3× 3, tal que A−1A = I = AA−1,A−1 é chamada matriz inversa de A.

Exercício: Mostre que nem toda matriz tem inversa.

Exercício: Mostre que a inversa, se existe, é única.

Exercício: Seja A uma matriz 3×3 e B outra matriz 3×3, tal que BA = I. Mostreque, então, A tem inversa e que A−1 = B.

Exercício: A matrizA = (aij) é dita simétrica se aij = aji para todo par ij. Mostreque o conjunto das matrizes simétricas é um espaço vetorial (de que dimensão?).Analogamente, a matriz A = (aij) é dita antissimétrica se aij = −aji para todopar ij. Mostre que o conjunto das matrizes antissimétricas é um espaço vetorial(de que dimensão?).

Exercício: Mostre que toda matriz se escreve, de maneira única, como soma de umasimétrica com uma antissimétrica.

Exercício: Seja A matriz antissimétrica 3×3. Mostre que existe um vetor a em IR3

tal que Av = a⊗ v para todo v em IR3.

Exercício: Retorne à seção Um pouquinho de Álgebra, do capítulo 7, e refaça tudo,com matrizes no lugar de transformações lineares.

c O caso geral

Sejam V e W espaços vetoriais de dimensão �nita, T : V→W transforma-ção linear. Sejam

α = {e1, . . . , en} , β = {ε1, . . . , εm}

bases deV eW, respectivamente. Suponhamos que v = x1e1+· · ·+xnen sejaum vetor qualquer de V. Queremos obter a representação de Tv na base β.Como Tv = x1Te1+ · · ·+xnTen, �ca claro que basta conhecer as expressões,na base β, de Te1, · · · , Ten. Admitindo que Tej = a1jε1 + · · ·+ amjεm, é sófazer as contas.

Page 125: 2aPARTE - Colorida - Hipertexto (2)

C. O CASO GERAL 125

As coisas podem �car mais simples se convencionarmos que, para qualquern-upla (x1, . . . , xn), o vetor v = x1e1 + · · · + xnen de V será representadopelo vetor coluna (v)α,

(v)α =

x1...xn

,

enquanto, para cada m-upla (y1, . . . , ym), o vetor w = y1ε1 + · · ·+ ymεm deW será representado pelo vetor coluna (w)β,

(w)β =

y1...ym

.

Teremos, então,

(Te1)β =

a11...am1

, . . . , (Tej)β =

a1j...amj

, . . . , (Ten)β =

a1n...

amn

,

o que nos dá, se v = x1e1 + · · ·+ xnen e Tv = y1ε1 + · · ·+ ymεm,

y1...ym

= x1

a11...am1

+ . . .+ xj

a1j...amj

+ . . .+ xn

a1n...

amn

,

ou seja, y1...ym

=

a11x1 + · · ·+ a1jxj + · · ·+ a1nxn...

am1x1 + · · ·+ amjxj + · · ·+ amnxn

.

Dizemos, então, que a matriz de T , referente às bases α para V e β paraW, é (T )βα, dada por

Page 126: 2aPARTE - Colorida - Hipertexto (2)

126 CAPÍTULO 11. A MATRIZ DE UMA TRANSFORMAÇÃO LINEAR

(T )βα =

a11 . . . a1n...

......

am1 . . . amn

,

de modo que as colunas de (T )βα são as representações na base β das imagenspor T dos vetores da base α. Assim, a representação na base β da imagemde v por T é dada por (Tv)β = (T )βα (v)α, sendo o produto de�nido por

a11 . . . a1n...

......

am1 . . . amn

x1

...xn

=

a11x1 + · · ·+ a1jxj + · · ·+ a1nxn...

am1x1 + · · ·+ amjxj + · · ·+ amnxn

=

= x1

a11...am1

+ . . .+ xj

a1j...amj

+ . . .+ xn

a1n...

amn

.

Exercício: Sejam U, V e W espaços vetoriais nos quais �xamos bases (respectivas)α, β e γ. Sejam T : U → V e S : V →W transformações lineares. Suponhamosque (S)γβ = (aij) e (T )βα = (bkl). Mostre que (ST )γα = (aij) (bjl), de�nida por a11 . . . a1m

......

...ap1 . . . apm

b11 . . . b1n

......

...bm1 . . . bmn

=

c11 . . . c1n...

......

cp1 . . . apn

,

com

cil =

m∑j=1

aijbjl.

Exercício: Seja S : ICn → ICn dada por S(z1, z2, . . . , zn) = (zn, z1, z2, . . . , zn−1) Exibaa matriz (S)αα, sendo α a base canônica de ICn.

Exercício: Considere a transformação S do exercício anterior. Encontre todos osnúmeros complexos λ para os quais existe z ∈ ICn, z 6= (0, . . . , 0) tal que Sz = λz.Escolha, para cada um dos tais λs, um ε, unitário, tal que Sε = λε. Mostre queesses εs formam uma base ortonormal de ICn. Encontre a matriz de S nessa base.

Page 127: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 12

Mudanças de base

a Um exemplo

Exemplo 1: Rotação. Suponhamos dados um vetor não nulo, ~ε, e umângulo, θ. Queremos expressar a rotação R, de ângulo θ, em torno da retaque passa pela origem e tem direção ~ε. Supomos que ~ε seja dado por suascoordenadas na base canônica, (a, b, c). Para simpli�car (e não retornar aum caso já tratado), suporemos a2 + b2 + c2 = 1 e ~ε 6= (0, 0, 1).

Nossa primeira observação é: se tivermos dois outros vetores, ~ε1 e ~ε2, uni-tários, ortogonais a ~ε e ortogonais entre si (e, se não for pedir muito, taisque a base (~ε1, ~ε2, ~ε) tenha orientação positiva), então, escolhendo o sentido

trigonométrico para a rotação, teremos:

R~ε1 = cos θ~ε1 + sin θ~ε2, R~ε2 = − sin θ~ε1 + cos θ~ε2, R~ε = ~ε.

Exercício: Entenda isso. Note que nada muda, se trocarmos a exigência ~ε1 e ~ε2unitários para |~ε1| = |~ε2| 6= 0.

Exercício: Encontre ~ε1 e ~ε2, unitários, ortogonais a ~ε e ortogonais entre si (e,abusando um pouco, tais que a base (~ε1, ~ε2, ~ε) tenha orientação positiva). Exibaas coordenadas de ~ε1 e ~ε2 na base canônica. Sugestão: comece com ~ε1 = (a2 +

b2)−1/2(−b, a, 0); faça ~ε2 = ~ε⊗ ~ε1.

Suponhamos, pois, que temos nossos vetores ~ε1 e ~ε2 como acima. Se ~v =y1~ε1 + y2~ε2 + y3~ε, então

127

Page 128: 2aPARTE - Colorida - Hipertexto (2)

128 CAPÍTULO 12. MUDANÇAS DE BASE

R~v = y1R~ε1+y2R~ε2+y3R~ε = y1(cos θ~ε1+sin θ~ε2)+y2(− sin θ~ε1+cos θ~ε2)+y3~ε,

ou seja,

R~v = (y1 cos θ − y2 sin θ)~ε1 + (y1 sin θ + y2 cos θ)~ε2 + y3~ε.

Podemos, então, concluir que, dadas as coordenadas (y1, y2, y3) de ~v na baseα = (~ε1, ~ε2, ~ε), as correspondentes coordenadas (y′1, y

′2, y′3) de R~v, na mesma

base α, serão dadas por y′1y′2y′3

=

cos θ − sin θ 0sin θ cos θ 00 0 1

y1y2y3

Exercício: Observe que as colunas da matriz

cos θ − sin θ 0sin θ cos θ 00 0 1

são as respec-

tivas coordenadas, na base α, de R~ε1, R~ε2 e R~ε.

Vamos chamar a matriz cos θ − sin θ 0sin θ cos θ 00 0 1

de matriz da transformação R na base α; vamos notá-la por (R)α.Chamando de β a base canônica, nosso problema, ainda, é obter a matriz deR em relação a β (que chamaremos de (R)β).

Exercício: Note que o problema estará resolvido se obtivermos dois conversores: oprimeiro, que chamaremos de (I)αβ , converte as coordenadas (x1, x2, x3) (do vetor~v na base β) nas coordenadas (y1, y2, y3) (do vetor ~v na base α); o segundo, quechamaremos de (I)βα, reverte as coordenadas (y′1, y

′2, y′3) (do vetor R~v na base α)

nas coordenadas (x′1, x′2, x′3) (do vetor R~v na base β).

Page 129: 2aPARTE - Colorida - Hipertexto (2)

A. UM EXEMPLO 129

Já temos as coordenadas, (a, b, c), de ~ε na base β. Suponhamos que as de ~ε1e de ~ε2 sejam, respectivamente, (a1, b1, c1) e (a2, b2, c2). É fácil, então, obteras coordenadas de R~v na base canônica, a partir de suas coordenadas na baseα:

x′1x′2x′3

= y′1

a1b1c1

+ y′2

a2b2c2

+ y′3

abc

=

a1 a2 ab1 b2 bc1 c2 c

y′1y′2y′3

.

O que acabamos de obter, na verdade, é bem geral: acabamos de criar um mé-todo geral para converter as coordenadas de um vetor em uma base qualquernas coordenadas do mesmo vetor em outra base qualquer. Vamos patenteá-lo,sob forma de proposição.

Proposição: Sejam α e β são duas bases e ~v um vetor de V . Se (~v)α e(~v)β são, respectivamente, os vetores coluna representando ~v nas bases α eβ, então (~v)β = (I)βα(~v)α, sendo (I)βα a matriz cujos vetores coluna são osvetores da base α representados na base β.

Voltando ao nosso problema, já sabemos converter coordenadas de vetores nabase α para as coordenadas na base canônica. Para converter coordenadasna base canônica para coordenadas na base α, pela Proposição, precisamosdas coordenadas dos vetores da base canônica na base α. Teremos, então, amatriz (I)αβ . Não custa nada observar que, para qualquer vetor ~v, teremos

(~v)α = (I)αβ(~v)β = (I)αβ((I)βα(~v)α) = ((I)αβ((I)βα)(~v)α,

ou seja: (I)αβ é a inversa de (I)βα.

Exercício: Como você faria para inverter nossa matriz

a1 a2 ab1 b2 bc1 c2 c

?

Exercício: Mostre que é possível obter, diretamente, a matriz da rotação na basecanônica.Sugestão: dado um vetor ~v, comece por projetar ~v sobre o eixo de rotação, obtendo ~vε = 〈~v, ~ε〉 ~ε; tome ~v1 = ~v − ~vε e

~v2 = ~ε⊗ ~v1; faça R~v = ~vε + cos θ~v1 + sin θ~v2.

Page 130: 2aPARTE - Colorida - Hipertexto (2)

130 CAPÍTULO 12. MUDANÇAS DE BASE

b Outros exemplos em IR3

Exemplo 2: Consideremos um cisalhamento perpendicular ao vetor ~ε1 (quesuporemos unitário). Ou seja, planos perpendiculares a ~ε1 deslizam, sobresi mesmos, na direção de um certo vetor ~ε2, normal a ~ε1 (para simpli�car,suporemos, também, ~ε2 unitário). O deslizamento é proporcional à alturado plano (medida na direção de ~ε1). Fazendo ~ε3 = ~ε1 ⊗ ~ε2, podemos entãode�nir nosso cisalhamento da seguinte forma:

T (y1~ε1 + y2~ε2 + y3~ε3) = y1~ε1 + y2~ε2 + y3~ε3 +ay1~ε2 = y1~ε1 + (y2 +ay1)~ε2 + y3~ε3

(a é um coe�ciente �xo, que indica a intensidade do deslizamento).Exercício: Con�ra que, na base α = (~ε1, ~ε2, ~ε3), a matriz da nossa transformação é 1 0 0

a 1 00 0 1

.

Exercício: Suponha conhecidas as coordenadas, na base canônica, de ~ε1 e ~ε2. De-termine a matriz de T na base canônica.

Exercício: Observe que poderíamos também ter de�nido T , diretamente, por T~v =

~v + a 〈~v, ~ε1〉 ~ε2.

Exemplo 3: Nossa transformação, agora, é a projeção ortogonal sobreum plano que passa pela origem. O plano, como de hábito, pode ser dadopor um vetor normal ~n, que suporemos unitário. Tomando, no plano, doisvetores unitários e ortogonais, ~ε1 e ~ε2, teremos, fazendo ~ε3 = ~n, uma baseortonormal α = (~ε1, ~ε2, ~ε3). A matriz da projeção, nessa base, será, então, 1 0 0

0 1 00 0 0

.

Exercício: Con�ra.

Exercício: Suponha dado ~ε1 = a~e1 + b~e2 + c~e3, com a2 + b2 + c2 = 1. Encontre, noplano, dois vetores unitários e ortogonais, ~ε1 e ~ε2 (note que as possibilidades sãoin�nitas), e determine a matriz da transformação na base canônica.

Exercício: Note que o problema pode ser resolvido, diretamente, subtraindo de cadavetor sua componente na direção de ~ε1.

Page 131: 2aPARTE - Colorida - Hipertexto (2)

C. MATRIZES ORTOGONAIS 131

Exemplo 4: Numa variante do exemplo anterior, consideremos a re�exãoatravés de um plano passando pela origem.

Exercício: Usando a mesma base construída no exemplo 3, note que a matriz é 1 0 00 1 00 0 −1

.

Exercício: Mostre que, a exemplo do caso anterior, neste, também, podemos daruma solução direta.

Exercício: Resolva os problemas análogos, para projeções sobre e re�exões atravésde retas passando pela origem.

c Matrizes ortogonais

A lição, até agora, é: dependendo do problema, pode ser mais simples traba-lhar com uma base outra que a canônica; isto pode resultar em obtermos, deforma quase imediata, a matriz da transformação linear na base escolhida. Opreço, porém, é que, embora a matriz que converte coordenadas na nova baseem coordenadas na base canônica venha de graça, temos que invertê-la, paraobter a matriz que converte coordenadas na base canônica em coordenadasna nova base. Inverter matrizes é, em geral, trabalhoso. Mas, em algumassituações (é o caso em todos os exemplos que escolhemos), a nova base nãoé qualquer base: é, também, ortonormal!

Exercício: Suponha que os vetores coluna da matriz (bij) sejam unitários e, dois adois, ortogonais. Seja (aij) a matriz transposta de (bij), isto é, aij = bji ∀(i, j).Calcule o produto (aij)(bij).

O leitor pode ter preguiça de fazer o exercício acima, o melhor é incluir notexto a solução... No produto de duas matrizes, a11 a12 a13

a21 a22 a23a31 a32 a33

b11 b12 b13b21 b22 b23b31 b32 b33

,

procedemos como se multiplicássemos escalarmente cada linha da primeirapor cada coluna da segunda. Mas, no nosso caso, as linhas da primeira são

Page 132: 2aPARTE - Colorida - Hipertexto (2)

132 CAPÍTULO 12. MUDANÇAS DE BASE

as colunas da segunda. Como os vetores coluna da segunda são unitários e,dois a dois, ortogonais, o resultado é a matriz identidade.

Exercício: Note que, como sabemos, se as matrizes 3×3 A e B são tais que AB = I,então BA = I. Mostre que, se os vetores coluna de uma matriz são unitários e,dois a dois, ortogonais, então o mesmo vale para seus vetores linha.

De�nição: A transposta da matriz A = (aij) é a matriz AT = (bij), dadapor bij = aji.

De�nição: A matriz 3 × 3 A é dita ortogonal se satisfaz a qualquer umadas propriedades equivalentes abaixo:• Os vetores coluna de A são unitários e, dois a dois, ortogonais

• ATA = I

• A−1 = AT

• AAT = I

• Os vetores linha de A são unitários e, dois a dois, ortogonais

O conjunto das matrizes 3 × 3 ortogonais é chamado de grupo ortogonal(3× 3) e notado por O(3).

Exercício: Mostre que as cinco propriedades acima são, de fato, equivalentes.

Exercício: Mostre que, se A e B são ortogonais, então AB é ortogonal.

Exercício: Seja T : V → V uma transformação linear que preserva o produtointerno, isto é:

〈T~u, T~v〉 = 〈~u,~v〉 ∀ ~u,~v ∈ V.

Mostre que a matriz de T na base canônica é ortogonal. Mostre que a matriz deT em qualquer base ortonormal é ortogonal.

Page 133: 2aPARTE - Colorida - Hipertexto (2)

D. O CASO GERAL 133

d O caso geral

De maneira geral, dados um espaço vetorial V e duas bases, α e β, de V, amatriz de mudança de base de α para β é

(I)βα .

Exercício: Veja se entendeu. I é a transformação identidade de V em V. Ascolunas de (I)βα são dadas pelos vetores de α escritos na base β.

Obviamente, a matriz de mudança de base de β para α, (I)αβ , é a inversa de

(I)βα.

Um caso particularmente interessante é aquele em que o espaço V tem pro-duto interno e as duas bases em consideração, α e β, são ortonormais. Nessecaso, se u e v são dois vetores em V, representados, em β, por (u)β e (v)β,respectivamente, seu produto escalar é dado, no caso real, por

〈u,v〉 = u1v1 + . . .+ unvn.

No caso complexo:〈u,v〉 = u1v1 + . . .+ unvn.

Exercício: Prove isso.

Assim, os vetores coluna de (I)βα são ortogonais (em IRn ou em ICn, conformeo caso). É, então, imediato, a exemplo do que já discutimos em IR3, quea inversa de (I)βα é sua transposta, caso V seja espaço vetorial real (ou atransposta conjugada, se V é complexo).Exercício: Prove.

Exercício: Seja n um número natural, n > 1. Considere u e v em IC, distintos etais que un = vn = 1. Faça u = (u, u2, . . . , un) e v = (v, v2, . . . , vn). Mostre que〈u,v〉 = 0

Notação: A transposta da matriz A é notada por AT . Caso estejamos traba-lhando com escalares complexos, a transposta conjugada (cujas entradassão os conjugados das entradas de AT ) é notada por A∗ (no caso real, as duascoincidem).

De�nição: A matriz n × n A é dita ortogonal se satisfaz a qualquer umadas propriedades equivalentes abaixo:• Os vetores coluna de A são unitários e, dois a dois, ortogonais

Page 134: 2aPARTE - Colorida - Hipertexto (2)

134 CAPÍTULO 12. MUDANÇAS DE BASE

• A∗A = I

• A−1 = A∗

• AA∗ = I

• Os vetores linha de A são unitários e, dois a dois, ortogonais

O conjunto das matrizes n × n ortogonais é chamado de grupo ortogonal(n× n) e notado por O(n).Exercício: Prove que as cinco propriedades da de�nição são, de fato, equivalentes.

Exercício: Seja n um número natural, n > 1. Seja u = cos(2π/n) + i sin(2π/n).Seja A = [aij ] dada por

aij = uij .

Mostre que A é ortogonal.

Page 135: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 13

O Teorema do Núcleo e daImagem

a O Teorema do Núcleo e da Imagem em IR3

Nesta seção, V representa o espaço dos vetores �echinha, que pode ser iden-ti�cado a IR3. Se T : V → V é um isomor�smo, o trepatrepa catalão nosdá uma boa noção de como funciona T . Mas, se o trepatrepa degenera, ascoisas �cam menos claras.

De�nição: Se T : V → V é uma transformação linear, a imagem de T é oconjunto Im(T ) = {T~v, ~v ∈ V }.

Observação: Se (~ε1, ~ε2, ~ε3) é uma base qualquer de V , a imagem de T é oconjunto das combinações lineares de T~ε1, T~ε2 e T~ε3. Note que temos, entãoquatro possibilidades:• T~ε1, T~ε2 e T~ε3 são linearmente independentes. Neste caso, T é umisomor�smo e Im(T ) = V . Diremos que Im(T ) é de dimensão 3(dimIm(T ) = 3).

• Dentre T~ε1, T~ε2 e T~ε3 há dois, mas não três, que são linearmente in-dependentes. Neste caso, Im(T ) é o conjunto das combinações linearesde dois vetores e é, portanto, um plano passando pela origem. Diremosque Im(T ) é de dimensão 2 (dimIm(T ) = 2).

• Os três, T~ε1, T~ε2 e T~ε3, estão alinhados (e pelo menos um é não nulo).Então Im(T ) é o conjunto dos múltiplos de um vetor; é, portanto,

135

Page 136: 2aPARTE - Colorida - Hipertexto (2)

136 CAPÍTULO 13. O TEOREMA DO NÚCLEO E DA IMAGEM

uma reta passando pela origem. Diremos que Im(T ) é de dimensão 1(dimIm(T ) = 1).

• Caso totalmente degenerado: Im(T ) ={~0}. Diremos que Im(T ) é de

dimensão 0 (dimIm(T ) = 0).

Consideremos os casos em que a dimensão de Im(T ) é menor do que 3.Para mandarmos o V , que é de dimensão 3, em algo de dimensão menor,alguma compressão deve ter sido feita. Um primeiro passo é olharmos para aimagem inversa de um ponto de Im(T ), ~w = T~v0. Como sabemos, se T nãoé sobrejetiva, não pode ser injetiva. Uma observação simples é: se T~u = ~0,então T (~v0 + ~u) = T~v0 + T~u = T~v0 = ~w.

Proposição: Se T : V → V é uma transformação linear, seja N(T ) =T−1(~0), isto é:

N(T ) ={~u ∈ V | T~u = ~0

}.

Se ~v0 é um vetor qualquer tal que T~v0 = ~w, então a imagem inversa de ~w,T−1(~w) = {~v ∈ V | T~v = ~w}, é dada por

T−1(~w) = ~v0 +N(T ) = {~v0 + ~u, ~u ∈ N(T )} .

Demonstração: Seja ~v0 um vetor qualquer tal que T~v0 = ~w. Se ~v está em ~v0+N(T ),temos ~v = ~v0 + ~u, para algum ~u em N(T ). mas, então, temos T~v = T (~v0 + ~u) =

T~v0+T~u = T~v0 = ~w, o que mostra que ~v está em T−1(~w) e prova que ~v0+N(T ) ⊂T−1(~w). Reciprocamente, se ~v está em T−1(~w), temos T~v = ~w. Fazendo ~u = ~v−~v0,temos T~u = T~v − T~v0 = ~w − ~w = ~0, o que nos dá ~v = ~v0 + ~u, com ~u ∈ N(T );ou seja, ~v ∈ ~v0 + N(T ). Isso mostra que T−1(~w) ⊂ ~v0 + N(T ), e conclui a prova.

De�nição: O conjunto

N(T ) ={~u ∈ V | T~u = ~0

}é chamado de núcleo da transformação linear T .

Pelo que acabamos de ver, o espaço V , visto como o domínio da transfor-mação T , é decomposto em subespaços a�ns paralelos ao núcleo, cada um

Page 137: 2aPARTE - Colorida - Hipertexto (2)

A. O TEOREMA DO NÚCLEO E DA IMAGEM EM IR3 137

Figura 13.1:

dos quais é levado em um ponto da imagem. Excluindo os casos em que atransformação é sobrejetiva ou totalmente degenerada, teremos, como vere-mos a seguir, seja um feixe de retas paralelas, seja um fatiamento em planosparalelos.

Para melhor entendermos N(T ), consideremos a matriz de T na base canô-

nica. Temos, então, se (T ) = (aij) e ~u =

xyz

, T~u é dado por:

a11 a12 a13a21 a22 a23a31 a32 a33

xyz

= x

a11a21a31

+ y

a12a22a32

+ z

a13a23a33

=

=

a11xa21xa31x

+

a12ya22ya32y

+

a13za23za33z

=

a11x+ a12y + a13za21x+ a22y + a23za31x+ a32y + a33z

.

Assim, para que ~u esteja no núcleo de T , é preciso que suas coordenadas

Page 138: 2aPARTE - Colorida - Hipertexto (2)

138 CAPÍTULO 13. O TEOREMA DO NÚCLEO E DA IMAGEM

satisfaçam às três equações:a11x+ a12y + a13z = 0a21x+ a22y + a23z = 0a31x+ a32y + a33z = 0

Exercício: Mostre que N(T ) é o complemento ortogonal do subespaço gerado pelosvetores linha da matriz de T na base canônica.

Em princípio, cada uma das três equações de�ne um plano passando pelaorigem (a menos que os três coe�cientes sejam nulos, o que daria 0 = 0).Como N(T ) é a interseção, temos as seguintes possibilidades:

• Os planos se interceptam em um ponto (que, necessariamente é ~0, jáque todos passam pela origem). Neste caso, diremos que a dimensãode N(T ) é 0 (dimN(T ) = 0).

• Os planos se interceptam em uma reta passando pela origem: N(T ) éuma reta passando pela origem. Neste caso, diremos que a dimensãode N(T ) é 1 (dimN(T ) = 1).

• Os planos são coincidentes: N(T ) é um plano passando pela origem.Neste caso, diremos que a dimensão de N(T ) é 2 (dimN(T ) = 2).

• Caso totalmente degenerado: todos as entradas da matriz de T sãonulas, as três equações são 0 = 0, N(T ) = V . Neste caso, diremos quea dimensão de N(T ) é 3 (dimN(T ) = 3).

É interessante observar que o primeiro caso corresponde a T ser um iso-mor�smo, já que T ~e1, T ~e2 e T ~e3 terão que ser linearmente independen-tes (caso contrário, teríamos ~0 = xT ~e1 + yT ~e2 + zT ~e3, para algum terno(x, y, z) 6= (0, 0, 0), o que daria um elemento não nulo, x~e1 + y~e2 + z ~e3 emN(T )). Por acaso, isto nos dá, como dim V = 3,

dim N(T ) + dim Im(T ) = dim V.

Exercício: Mostre que, também no caso em que dimN(T ) = 3, temos

dim N(T ) + dim Im(T ) = dim V.

Page 139: 2aPARTE - Colorida - Hipertexto (2)

A. O TEOREMA DO NÚCLEO E DA IMAGEM EM IR3 139

Note que é razoável imaginar que a fórmula acima seja geral: para jo-gar V , que é tridimensional, em um plano, que é bidimensional (ou seja,dim Im(T ) = 2), devemos perder uma dimensão, possivelmente jogando re-tas do domínio em pontos da imagem, o que signi�ca que o núcleo deve serunidimensional; se, por outro lado, a imagem de T for unidimensional, entãodevemos perder duas dimensões, jogando planos em pontos da imagem, e onúcleo deve ser bidimensional.

Teorema do Núcleo e da Imagem:1 Se T : V → V é uma transformaçãolinear, então

dim N(T ) + dim Im(T ) = dim V.

Demonstração: Os casos em que dimN(T ) = 0 ou dimN(T ) = 3 são simples, já�zemos.

Suponhamos, pois, caso 1, que dimN(T ) = 1. Podemos, então, tomar um vetornão nulo, ~u, em N(T ). O Lema Fundamental nos garante que podemos tomar doisvetores, ~v1 e ~v2, tais que (~u,~v1, ~v2) seja base de V (podemos, inclusive, exigir que~v1 e ~v2 sejam uma base do complemento ortogonal de N(T )). A�rmamos que T~v1 eT~v2 são linearmente independentes e geram Im(T ) (isto é Im(T ) é o conjunto dascombinações lineares de T~v1 e T~v2). De fato, como T~u, T~v1 e T~v2 geram Im(T )e T~u = ~0, temos que T~v1 e T~v2 geram Im(T ). Resta provar que T~v1 e T~v2 sãolinearmente independentes. Se não fossem, um deles, digamos T~v2 , seria múltiplodo outro. Mas, então, supondo T~v2 = tT~v1, teríamos T (~v2 − t~v1) = ~0, o que daria~v2 − t~v1 ∈ N(T ). Logo, para algum escalar s, teríamos ~v2 − t~v1 = s~u, e ~u, ~v1 e ~v2não seriam linearmente independentes. Portanto, dim Im(T ) = 2.

Suponhamos agora, caso 2, que dimN(T ) = 2. Podemos, então tomar dois vetoreslinearmente independentes, ~u1 e ~u2, tais que N(T ) seja o plano gerado por ~u1 e ~u2.De novo, usando o Lema Fundamental, podemos completar ~u1 e ~u2 por um vetor~v, que podemos supor um gerador de N(T )⊥, de forma que ~u1 e ~u2 e ~v formembase de V . Como no caso anterior, temos que T~v gera Im(T ). Além disso, T~v não

1O que aqui estamos enunciando é uma versão simpli�cada de um teorema mais geral,que veremos logo à frente. Achamos melhor manter o nome, do Núcleo e da Imagem, e otítulo de nobreza, Teorema

Page 140: 2aPARTE - Colorida - Hipertexto (2)

140 CAPÍTULO 13. O TEOREMA DO NÚCLEO E DA IMAGEM

pode ser nulo, ou ~v estaria em N(T ) e seria combinação linear de ~u1 e ~u2. Logo,dimIm(T ) = 1.

Escólio: Nossa demonstração contém mais do que o prometido no enunciado.Provamos que a imagem de T tem a mesma dimensão que o complementoortogonal do núcleo e que T leva os elementos de N(T )⊥ bijetivamente nosde Im(T ). Suponha que a matriz de T na base canônica seja a11 a12 a13

a21 a22 a23a31 a32 a33

.

Já observamos que Im(T ) é o subespaço de V gerado pelos vetores coluna damatriz. Mas temos também que o núcleo de T é o conjunto dos vetores or-togonais aos vetores linha da matriz. Na verdade, temos que o complementoortogonal de N(T ) é o subespaço gerado pelos vetores linha da matriz. As-sim, a dimensão do subespaço gerado pelas colunas da matriz é igual à dosubespaço gerado por suas linhas.

b O caso geral

De�nição: Sejam V e W espaços vetoriais (reais ou complexos) e T : V→W uma transformação linear. O núcleo de T é o subconjunto N(T ) de V,de�nido por

N(T ) = T−1(0) = {v ∈ V | Tv = 0} .

É imediato que, se, para um certo u ∈ V e um certo w ∈W, se tem Tu = w,então

T−1(w) = u +N(T ) = {u + v | v ∈ N(T )}(é claro que T (u+v) = Tu+Tv = w+0 = w, ∀v ∈ N(T ); reciprocamente,se u1 ∈ T−1(w), então T (u1 − u) = w −w = 0, o que mostra que u1 − u ∈N(T ), e u1 = u + (u1 − u)).

Exercício: Mostre que o núcleo é subespaço vetorial de V.

Consideremos, no caso geral, dois espaços vetoriais (podem ser reais oucomplexos, nada muda), V e W e uma transformação linear, T , de V

Page 141: 2aPARTE - Colorida - Hipertexto (2)

B. O CASO GERAL 141

em W. Vamos supor que V é de dimensão �nita (o que assegura queIm(T ) = {Tv, v ∈ V}, também, é de dimensão �nita).

Teorema do Núcleo e da Imagem: Se T : V → W é linear e V é dedimensão �nita, então

dim N(T ) + dim Im(T ) = dim V.

Demonstração: Como N(T ) é, forçosamente, de dimensão �nita, podemos tomaruma base, α = {ε1, . . . , εk}, de N(T ). Podemos ainda, graças a nosso velhoe bom Lema Fundamental (que vale, sem alterações, para espaços complexos),complementá-la com n − k vetores, εk+1, . . . , εn, de forma que β = {ε1, . . . , εn}seja base de V. Seja, então, V1 o espaço gerado por εk+1, . . . , εn (note quedim V1 = n − k = dim V − dim N(T )).2 Consideremos, agora, os vetoresw1 = Tεk+1, . . . ,wn−k = Tεn em Im(T ) ⊂W. Vamos provar que w1, . . . ,wn−kformam base de Im(T ), o que encerrará a demonstração.

1. Se t1w1 + . . . + tn−kwn−k = 0, então T (t1εk+1 + . . . + tn−kεn) = 0, oque signi�ca que t1εk+1 + . . . + tn−kεn ∈ N(T ). Ora, isto só é possívelse t1 = . . . = tn−k = 0, o que mostra que w1, . . . ,wn−k são linearmenteindependentes.

2. Se w ∈ Im(T ), podemos tomar v em V tal que Tv = w. Fazendo v =t1ε1 + . . .+ tnεn, temos w = T |V b = t1Tε1 + . . .+ tkTεk + tk+1w1 + . . .+tnwn−k = tk+1w1 + . . .+ tnwn−k, o que encerra a demonstração.

Escólio: Nossa demonstração contou com o apoio de um subespaço auxiliarV1 de V , tal que dimV1 + dimN(T ) = dimV e dimV1 = dim Im(T ).Como já observamos, caso V tenha produto interno, podemos escolher V1 =N(T )⊥. Assim, quando V tem produto interno, nosso teorema também dizque dim Im(T ) = dimN(T )⊥.

Suponhamos que V = IRn, que W = IRm e que T seja a transformação lineardada pala matriz m × n [aij]. Ora, neste caso, a imagem de T é o espaçogerado pelos vetores coluna da matriz e o núcleo de T é o espaço dos vetoresque são ortogonais aos vetores linha de [aij].

2Neste caso, V é soma direta de N(T ) com V1, isto é, todo elemento de V seobtém, de forma única, como soma de um de N(T ) com um de V1. Se V for es-paço com produto interno, podemos nos dar ao luxo de escolher V1 = N(T )⊥ ={v ∈ V | 〈v, n〉 = 0 ∀ n ∈ N(T )}, isto é, o complemento ortogonal de N(T ))

Page 142: 2aPARTE - Colorida - Hipertexto (2)

142 CAPÍTULO 13. O TEOREMA DO NÚCLEO E DA IMAGEM

Exercício: Prove as duas últimas a�rmações acima.

Corolário: Seja [aij] matriz m×n a coe�cientes reais. Sejam E o subespaçode IRn gerado pelas linhas de [aij] e F o subespaço de IRm gerado pelascolunas de [aij]. Então dimE = dimF .

Demonstração: Basta notar que F = Im(T ) e que N(T ) = E⊥, ou seja: E =N(T )⊥ e F = Im(T ).

Exercício: Seja [aij ] matriz m × n a coe�cientes complexos. Mostre que o núcleoda transformação linear T : ICn → ICm dada por [aij ] é o espaço ortogonal ao geradopelas linhas de [aij ] (a barra indicando conjugação complexa) Observe que istoequivale a ser N(T ) ortogonal à imagem da transformação linear T ∗ : ICm → ICn

dada pela matriz transposta de [aij ].

Page 143: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 14

O determinante, de novo

a Determinante de transformação linear em IR3

Talvez você tenha pulado a seção "O trepa-trepa catalão"...Volte a ela (pá-gina 109) e ataque o exercício que está no �nal.

Uma das propriedades das transformações lineares é tratar de maneira uni-forme o espaço: a imagem de um quadradinho de centro na origem é con-gruente à do mesmo quadradinho transladado para outro ponto qualquer doespaço. Mais precisamente: seja T : V → V linear e seja X um subconjuntoqualquer de V . Suponhamos que translademos todos os pontos de X, usandoum vetor ~v0, obtendo o conjunto X0:

X0 = {x+ ~v0, x ∈ X} .

Como a translação preserva distâncias e ângulos, X0 é congruente a X. Maso mesmo acontece com T (X) e T (X0):

T (X0) = {Tx0, x0 ∈ X0} = {T (x+ ~v0), x ∈ X} =

= {Tx+ T~v0, x ∈ X} = {y + T~v0, y ∈ T (X)} .

Da mesma forma, se X1 é a imagem de X por uma homotetia de razão r,

X1 = {rx, x ∈ X} ,

143

Page 144: 2aPARTE - Colorida - Hipertexto (2)

144 CAPÍTULO 14. O DETERMINANTE, DE NOVO

então T (X1) é a imagem de T (X) pela mesma homotetia:

T (X1) = {Tx1, x1 ∈ X1} = {T (rx), x ∈ X} =

= {r(Tx), x ∈ X} = {ry, y ∈ T (X)} .

Figura 14.1:

Exercício: Mostre, com um exemplo, que o mesmo não acontece com �gu-ras rodadas: se rodarmos um cubo Q, obtendo o cubo Q0, então Q e Q0

são congruentes, mas um cisalhamento T pode nos dar T (Q) e T (Q0) nãocongruentes.

As observações acima devem ser su�cientes para que o leitor se convença daveracidade do seguinte resultado:

Teorema: Se T : V → V é uma transformação linear, então existe umnúmero α tal que, para todo sólido X ⊂ V , se tem volume de T (X) = αvolume de X.

Demonstração: Entendemos por sólido, sem entrar em demasiados detalhes, qual-quer subconjunto X de V cujo volume possa ser calculado por meio de aproxi-mações, por dentro e por fora: as aproximações por dentro consistem em colocar,

Page 145: 2aPARTE - Colorida - Hipertexto (2)

A. DETERMINANTE DE TRANSFORMAÇÃO LINEAR EM IR3 145

dentro de X, cubinhos cujos interiores não se interceptem; as aproximações porfora consistem em colocar X dentro de uma união de cubinhos cujos interiores nãose inteceptam.1

Pelo que acabamos de ver, se �zermos, para X, aproximações, por dentro e porfora, usando cubinhos de lados paralelos aos vetores da base canônica, teremos,automaticamente, aproximações para T (X), por dentro e por fora, usando os pa-ralelepípedos imagens dos cubinhos usados para X. Mas pelo que aprendemossobre determinantes, a razão entre o volume do paralelepípedo imagem e o volumedo cubinho original é |det(T ~e1, T ~e2, T ~e3)|, qualquer que seja o cubinho (veja seacredita mesmo). Tomando supremos e ín�mos (e roubando um pouquinho, ougastando mais tempo e espaço para cuidar dos detalhes), concluímos que volumede T (X) = α volume de X, com α = |det(T ~e1, T ~e2, T ~e3)|.

Escólio: Pelo que acabamos de ver, a razão α entre os volumes de T (X) e deX é dada por α = |det(T ~e1, T ~e2, T ~e3)|. É um pouco desagradável termos essenúmero atrelado à base canônica. No entanto, é imediato que, se ~u, ~v e ~wsão linearmente independentes, então |det(T~u, T~v, T ~w)| = α|det(~u,~v, ~w)|. Éclaro, também, que o sinal de det(T ~e1, T ~e2, T ~e3) indica se T está preservando

ou invertendo a orientação do espaço.

Lembramos que a transformação linear T é um isomor�smo se é bijetiva, oque equivale a dizer que a imagem por T de qualquer base de V é uma basede V .

Proposição: Suponhamos que a transformação linear T : V → V sejaum isomor�smo e que as bases (~u1, ~v1, ~w1) e (~u2, ~v2, ~w2) tenham a mesmaorientação (isto é, det(~u1, ~v1, ~w1) e det(~u2, ~v2, ~w2) tenham o mesmo sinal).Então (T~u1, T~v1, T ~w1) e (T~u2, T~v2, T ~w2) têm a mesma orientação (ou seja, osinal de det(T~u1, T~v1, T ~w1) e det(T~u2, T~v2, T ~w2) é o mesmo).

Demonstração: Se (~u1, ~v1, ~w1) (~u2, ~v2, ~w2) têm a mesma orientação, podemos fa-zer uma deformação (~ε1(t), ~ε2(t), ~ε3(t)), t ∈ [a, b], começando em (~u1, ~v1, ~w1) eterminando em (~u2, ~v2, ~w2). Mas, então, (T~ε1(t), T~ε2(t), T~ε3(t)), t ∈ [a, b] é uma

1Fica entendido que os cubinhos terão lados paralelos aos vetores da base canônica.Podemos, eventualmente, ter sólidos degenerados, que terão volume nulo; neste caso, asaproximações por dentro são feitas por zero cubinhos. A hipótese é que o ín�mo dosvolumes das aproximações por fora é igual ao supremo dos volumes das aproximações pordentro

Page 146: 2aPARTE - Colorida - Hipertexto (2)

146 CAPÍTULO 14. O DETERMINANTE, DE NOVO

deformação começando em (T~u1, T~v1, T ~w1) e terminando em (T~u2, T~v2, T ~w2) (noteque, como cada ~εi(t) é contínua, as correspondentes T~εi(t) também são contínuas;além disso, como acabamos de observar, o fato de ser T um isomor�smo garanteque (T~ε1(t), T~ε2(t), T~ε3(t)) é um isomor�smo, para todo t em [a, b]).

Agora já estamos su�cientemente motivados para de�nir o determinantede uma transformação linear.

De�nição: Se T : V → V é uma transformação linear e (~u,~v, ~w) é umabase qualquer de V , o determinante de T é a razão entre det(T~u, T~v, T ~w)e det(~u,~v, ~w). Notação: det(T ).

Proposição: Se S e T são transformações lineares de V em V , entãodet(ST ) = det(S)det(T ).

Demonstração: Suponhamos, primeiro, que T seja um isomor�smo.Neste caso, se(~u,~v, ~w) é uma base qualquer de V , (T~u, T~v, T ~w) será, também, base de V . Logo,

det(ST~u, ST~v, ST ~w)

det(~u,~v, ~w)=det(S(T~u), S(T~v), S(T ~w))

det(T~u, T~v, T ~w)

det(T~u, T~v, T ~w)

det(~u,~v, ~w),

e o resultado vale. Caso T não seja isomor�smo, teremos det(T ) = 0 e, como STtambém não será isomor�smo, det(ST ) = 0. Logo, independente de como seja S,teremos det(ST ) = det(S)det(T ).

Deixamos como exercícios um conjunto de propriedades importantes do determi-nante.

Exercício: Mostre que det(T ) = 0 se, e somente se, T não é isomor�smo.

Exercício: Mostre que, se T é isomor�smo, então det(T−1) = (det(T ))−1.

Exercício: Seja (T )β a matriz da transformação T na base canônica. Mostre quedet(T ) = det(T )β .

Exercício: Sejam A e B duas matrizes 3× 3. Mostre que det(AB) = det(A)det(B).

Exercício: Seja (T )α a matriz da transformação T em uma base qualquer, quedesignaremos por α. Seja (I)αβ a matriz cujas colunas são as coordenadas dosvetores da base canônica na base α. Mostre que a matriz de T na base canônica,(T )β , é dada por (T )β = ((I)αβ)−1(T )α(I)αβ .

Page 147: 2aPARTE - Colorida - Hipertexto (2)

B. FORMAS TRILINEARES ALTERNADAS 147

Exercício: Seja (T )α a matriz da transformação T em uma base qualquer, quedesignaremos por α. Mostre que det(T ) = det(T )α

Está tudo muito bom, mas, pensando bem, nossa de�nição repousa sobre um Te-orema que não é trivial e, principalmente, cuja demonstração deixou pontos nebu-losos.2 A próxima seção tem por objetivo apresentar a mesma de�nição em termospuramente algébricos, sem recorrer ao Teorema bonitinho mas suspeito.

b Formas trilineares alternadas

Em nossa primeira discussão (capítulo 4), o determinante foi apresentado comouma função ω que, a cada terno ordenado (~u,~v, ~w), associa um número, ω(~u,~v, ~w),com as propriedades:

(i) ω(~u,~v, ~w) = 0, se ~u,~v e ~w sao linearmente dependentes(ii) ω(~u1 + t~u2, ~v, ~w) = ω(~u1, ~v, ~w) + t ω(~u2, ~v, ~w) ∀t, ~u1, ~u2, ~v, ~w

ω(~u,~v1 + t~v2, ~w) = ω(~u,~v1, ~w) + t ω(~u,~v2, ~w) ∀t, ~u,~v1, ~v2, ~wω(~u,~v, ~w1 + t~w2) = ω(~u,~v, ~w1) + (~u,~v, ~w2t) ∀t, ~u,~v, ~w1, ~w2

Naquela ocasião observamos que, das propriedades (i) e (ii), segue que ω troca desinal, se trocamos de posição dois dos vetores. Assim, chamamos uma função comas propriedades (i) e (ii) de forma trilinear alternada. Em seguida, escrevendoos vetores ~u, ~v e ~w na base canônica,

~u = a11 ~e1 + a21 ~e2 + a31 ~e3,~v = a12 ~e1 + a22 ~e2 + a32 ~e3,~w = a13 ~e1 + a23 ~e2 + a33 ~e3,

e usando as propriedades (i) e (ii), obtivemos

ω(~u,~v, ~w) = ω(a11 ~e1 + a21 ~e2 + a31 ~e3, a12 ~e1 + a22 ~e2 + a32 ~e3, a13 ~e1 + a23 ~e2 + a33 ~e3) =(a11a22a33 − a11a23a32 + a12a23a31 − a12a21a33 + a13a21a32 − a13a22a31)ω(~e1, ~e2, ~e3).

Observação: Assim, o determinante det(~u,~v, ~w) é caracterizado por uma escolhada unidade de volume: escolhemos det(~e1, ~e2, ~e3) = 1. Daí decorre que toda forma

2A de�nição de volume pede cuidados: se está dada em termos de aproximações porcubinhos, então é preciso provar que o volume de um paralelepípedo é a área da base vezesa altura. Aliás... o que é área?

Page 148: 2aPARTE - Colorida - Hipertexto (2)

148 CAPÍTULO 14. O DETERMINANTE, DE NOVO

trilinear alternada é apenas um múltiplo do determinante (é como se trocássemos aunidade de medida: todos os volumes seriam multiplicados por um mesmo fator).Mais precisamente,

Proposição: Seja ω : V × V × V → V uma forma trilinear alternada e sejaα = ω(~e1, ~e2, ~e3). Então

ω(~u,~v, ~w) = αdet(~u,~v, ~w), ∀ ~u,~v, ~w ∈ V.

Corolário: Se T : V → V é uma transformação linear, então, qualquer que seja abase (~u,~v, ~w) de V , vale

det(T~u, T~v, T ~w)

det(~u,~v, ~w)= det(T ~e1, T ~e2, T ~e3).

Demonstração: Seja ω : V × V × V → V a forma trilinear alternada dada porω(~u,~v, ~w) = det(T~u, T~v, T ~w) (exercício: veri�que que ω é, de fato, trilinear ealternada). Pela Proposição, temos

det(T~u, T~v, T ~w) = det(T ~e1, T ~e2, T ~e3) det(~u,~v, ~w), ∀ ~u,~v, ~w ∈ V.

Se (~u,~v, ~w) é base de V , então det(~u,~v, ~w) 6= 0; logo,

det(T~u, T~v, T ~w)

det(~u,~v, ~w)= det(T ~e1, T ~e2, T ~e3).

c Formas de medir volumes

Se queremos levar para dimensões mais altas as mesmas ideias que nos conduziramao determinante em IR3, devemos começar com

De�nição: Seja V um espaço vetorial (real ou complexo), de dimensão n. Umaforma de medir volumes (n-dimensionais) em V é uma aplicação ω : Vn → IRou IC tal que:

(i) ω é n-linear, isto é, é linear em cada coordenada3 e

3ou seja: para todos v1, . . . , vj , uj , . . . , vn e para todo λ, vale

ω(v1, . . . , vj + λuj , . . . , vn) = ω(v1, . . . , vj , . . . , vn) + λω(v1, . . . , uj , . . . , vn)

Page 149: 2aPARTE - Colorida - Hipertexto (2)

C. FORMAS DE MEDIR VOLUMES 149

(ii) ω(v1, v2, . . . , vn) = 0 sempre que v1, v2, . . . , vn forem linearmente dependentes.

Exercício: Mostre que, na presença da condição (i) acima, a condição (ii) é equi-valente a

(iii)ω(v1, v2, . . . , vn) = 0 sempre que existam dois índices distintos, i e j, tais quevi = vj .

Exercício: Seja ω : Vn → IR ou IC uma forma de medir volumes. Mostre que ω éuma forma n-linear alternada, isto é:

(iv)ω(v1, . . . , vi, . . . , vj , . . . , vn) = −ω(v1, . . . , vj , . . . , vi, . . . , vn) para quaisquer ve-tores v1, . . . , vn em V.

Exercício: Suponha que ω : Vn → IR ou IC é linear em cada coordenada. Mostre queas condições (ii) (da de�nição), (iii) e (iv) (dos exercícios acima) são equivalentes.

De maneira geral, se ω : Vp → IR ou IC é linear em cada coordenada e satisfaz aω(v1, . . . , vi, . . . , vj , . . . , vp) = −ω(v1, . . . , vj , . . . , vi, . . . , vp) para quaisquer vetoresv1, . . . , vp em V, ω é dita uma forma p-linear alternada. Usaremos, para formasde medir volumes, o nome forma n-linear alternada, que é mais usual. O espaçodas formas p-lineares alternadas em V, qualquer que seja p em IN , é denotado porAp(V).

Exercício: Mostre que, se ω é forma p-linear alternada e p > n, então ω(v1, . . . , vp) =0, quaiquer que sejam v1, . . . , vp.

Exercício: Parece razoável que, se dimV = n, então o espaço das formas n-linearesalternadas de V tem dimensão 1?

Exercício: Sejam V um espaço vetorial de dimensão n e ω uma forma n-linearalternada em V. Mostre que são equivalentes:

a) ω é identicamente nula;b)existe base v1, . . . , vn de V tal que ω(v1, . . . , vn) = 0;c)para toda base v1, . . . , vn de V se tem ω(v1, . . . , vn) = 0.

O exercício acima nos coloca diante de uma questão aparentemente simples masque merece alguma re�exão: se ω é uma forma n-linear alternada e conhecemosω(v1, . . . , vn), então, para qualquer permutação σ dos índices i, está perfeitamentedeterminado o valor de ω(vσ1 , . . . , vσn) = 0 (dado, é claro por ±ω(v1, . . . , vn) = 0)?A ideia é que podemos, a partir de v1, . . . , vn, ir trocando de posição dois vetoresde cada vez, até chegarmos à con�guração vσ1 , . . . , vσn ; a cada troca, muda o sinalde ω. A questão é: existem in�nitas maneiras de partir da con�guração inicial echegar à �nal; será que todas nos darão o mesmo resultado (isto é, o mesmo sinal)?

É hora de darmos uma arrumada na casa...

Page 150: 2aPARTE - Colorida - Hipertexto (2)

150 CAPÍTULO 14. O DETERMINANTE, DE NOVO

d Permutações

De�nição: Uma permutação do conjunto X é uma bijeção de X em X. Oconjunto das permutações de X é notado S(X). Se X = {1, 2, . . . , n} S(X) étrocado por Sn (se σ pertence a Sn, σ(k) é notado σk). Usamos chamar de produtoa composta de duas permutações.

Entre os elementos de Sn, destacaremos as transposições, que são as que mantêm�xos todos os elementos de {1, 2, . . . , n}, exceto dois (a mesma de�nição, a rigor,vale em qualquer S(X)). A transposição que troca i e j é designada por (ij). Maisgeralmente, dizemos que σ em S(X) é um ciclo de ordem k, ∞ > k ≥ 2, se existeum subconjunto A de X, com exatamente k elementos, tal que:

1. σ(x) = x ∀ x /∈ A;

2. ∃ x ∈ A | ∀ y ∈ A ∃ j | y = σj(x).

Chamaremos A de conjunto dos pontos não �xos de σ.

Exercício: Entenda que, se σ é um ciclo, o conjunto A dos pontos não �xos éobtido assim: excolhe-se um x qualquer tal que σ(x) 6= x. Tomam-se os elementosx, σ(x), σ2(x), σ3(x), . . .. Como A é �nito, depois de um certo número, k, deiterações, volta-se a algum dos elementos anteriores. Mostre que o primeiro quevolta é o próprio x. Assim, A =

{σ(x), σ2(x), σ3(x), . . . , σk(x) = x

}.

Exercício: Sejam σ um ciclo e A o conjunto de seus pontos não �xos. Seja x umelemento qualquer de A. Mostre que ∀ y ∈ A ∃ j | y = σj(x).

Exercício: Mostre que todo elemento de Sn é produto de ciclos disjuntos (doisciclos são ditos disjuntos se todo elemento de {1, 2, . . . , n} �ca �xo por, pelo menos,um dos dois).4

Exercício: Mostre que todo ciclo de ordem k é produto de k − 1 transposições.Mostre que não dá para fazer com menos.

Exercício: Conclua que todo elemento de Sn é produto de transposições.

Proposição 1: Toda permutação em Sn é produto de transposições.

Demonstração: Trata-se de resolver os exercícios acima.

4O produto de k permutações está de�nido, para k > 2, por conta da associatividade;o de uma só permutação, claro, é a própria; o produto de 0 permutações é, por de�nição,a permutação identidade

Page 151: 2aPARTE - Colorida - Hipertexto (2)

D. PERMUTAÇÕES 151

1. Comecemos provando que toda permutação em Sn é produto de ciclos. Va-mos fazer a prova por indução sobre n. O resultado é obviamente válido (naforma de produto de 0 transposições) se n = 1. Suponhamos n ≥ 1 e o resul-tado válido em Sk, k < n. Seja σ um elemento de Sn. Se σ é a identidade,está terminado. Se não, tomemos x ∈ {1, . . . , n} tal que σ(x) 6= x. Seja

A1 ={x = σ0(x), σ(x), σ2(x), . . .

}.

Como A1 é �nito, existe um menor k tal que σk(x) = σl(x) para algum l in-ferior a k. Então, necessariamente, l = 0, pois, caso contrário, σ(σl−1(x)) =σ(σk−1(x)), contrariando a injetividade de σ. Logo,

A1 ={σ(x), σ2(x), . . . , σk(x) = x

}.

Se k = n, terminamos. Se não, excluindo de {1, . . . , n} os elementos deA1, temos um conjunto B com menos do que n elementos. Mas, então, arestrição de σ a B é uma permutação de B e se escreve, pela hipótese deindução, como produto de ciclos. Agora é só juntar.

2. Resta mostrar que todo ciclo é produto de transposições. Considere o cicloσ, dado por σ(x), σ2(x), . . . , σk(x). Então

σ = (σ(x)σk(x)) . . . (σ(x)σ3(x))(σ(x)σ2(x)).

Con�ra.

Nossa ideia é que, se ω é alternada, cada transposição troca o sinal de ω. Diantede uma permutação, queremos saber se esta foi produzida por uma número par ouímpar de transposições. Como esse número não é único, a questão é: se a permu-tação σ de Sn é produto de uma certo número k1, de transposições, mas, também,de um outro número, k2 (de outras transposições), então, necessariamente, k1− k2é par?

Exercício: Mostre que se, para um certo p, existir uma permutação que seja produtotanto de um número par como de um número ímpar de transposições, então todaforma p-linear alternada (em qualquer espaço vetorial, real ou complexo, seja deque dimensão for) será identicamente nula.

Uma observação interessante é a seguinte: um dos efeitos de uma transposição é,sempre, um número ímpar de inversões. O número de inversões é obtido assim:dada σ em Sn, contamos quantos são os pares não ordenados {i, j} tais que o sinal

Page 152: 2aPARTE - Colorida - Hipertexto (2)

152 CAPÍTULO 14. O DETERMINANTE, DE NOVO

de σi − σj é oposto ao de i − j. No caso de uma transposição, esse número é,sempre, ímpar.

Exercício: Prove isso.

A ideia acima vai nos levar ao seguinte resultado: toda permutação σ de {1, . . . , n}tem um sinal, sgnσ, que é 1 ou -1, dado pela paridade do número de trocas entredois elementos para, partindo da identidade, se chegar à permutação desejada (1,se o número for par; -1, se for ímpar).

Proposição 2: Existe uma função sgn : Sn → {1,−1} tal que

1. sgn(στ) = sgnσsgnτ , quaisquer que sejam as permutações σ e τ ;

2. sgnσ = −1 para toda transposição σ.

Demonstração: A ideia é, dada σ, ver quantas inversões tem σ. Seja

sgn : Sn → {1,−1}

dado por

sgn(σ) =

∏1≤i<j≤n(σj − σi)∏1≤i<j≤n(j − i)

=∏

1≤i<j≤n

σj − σij − i

.

Como σ é uma bijeção, os números que aparecem nos numeradores são os mesmosque temos nos denominadores, a menos do sinal, o que garante que sgnσ ∈ {−1, 1}.Além disso, se σ é a transposição que troca i com j, o número de fatores negativosno numerador é 2(j− i)−1, o que prova que sgnσ = −1 se σ é transposição. Restamostrar que, para quaisquer σ e τ em Sn, sgn(στ) = sgn(σ)sgn(τ). Ora,

sgn(στ) =∏

1≤i<j≤n(στ)j−(στ)i

j−i =

=∏

1≤i<j≤nστj−στiτj−τi

∏1≤i<j≤n

τj−τij−i = sgn(σ)sgn(τ),

embora a igualdade

∏1≤i<j≤n

στj − στiτj − τi

=∏

1≤i<j≤n

σj − σij − i

até mereça uma pensada...

Page 153: 2aPARTE - Colorida - Hipertexto (2)

E. O DETERMINANTE COMO FORMA DE VOLUME 153

Exercício: Seja X = {x1, . . . , xn} ⊂ IR, com x1 < x2 < . . . < xn. Mostre quetambém podemos, em S(X) de�nir o sinal da permutação σ, com as mesmaspropriedades, por

sgn(σ) =

∏1≤i<j≤n(σ(xj)− σ(xi))∏

1≤i<j≤n(xj − xi)=

∏1≤i<j≤n

σ(xj)− σ(xi)

xj − xi.

Provado esse resultado algébrico fundamental, podemos seguir em frente.

e O determinante como forma de volume

Além das permutações de n elementos, trabalharemos também, �xado n, com asp-listas, que são elementos de {1, . . . , n}p. Uma p-lista será designada por J , sendoJ = (J1, . . . , Jp). Também trabalharemos com um conjunto especial de p-listas,designado pela letra J , de�nido por:

J = {J ∈ {1, . . . , n}p | J1 < J2 < . . . < Jp} .

Lema 1: Seja V um espaço vetorial de dimensão n, real ou complexo. Fixada umabase de V, cujos elementos designaremos por e1, . . . , en, seja, para cada p-lista J ,eJ ∈ Vp dado por eJ = (eJ1 , . . . , eJp). Então duas formas p-lineares ω e η de Vsão iguais sempre que ω(eJ) = η(eJ) para todo J em {1, . . . , n}p.

Demonstração: Fazemos por indução sobre p. O caso p = 1 é a bijeção entretransformações lineares e matrizes, �xada uma base. Supondo o resultado válidopara p, consideremos duas formas (p+1)-lineares ω e η tais que ω(eJ) = η(eJ) paratodo J em {1, . . . , n}p+1 e p+1 vetores v0, . . . , vp. Escrevendo v0 = a1e1+. . .+anen,temos:

ω(v0, . . . , vp) =

n∑j=1

ajω(ej , v1 . . . , vp) =

n∑j=1

ajη(ej , v1 . . . , vp) = η(v0, . . . , vp)

(note que a igualdade central decorre da hipótese de indução).

Lema 2: Sejam V um espaço vetorial, real ou complexo, e ω uma forma p-linearalternada em V. Para quaisquer (v1, . . . , vp) em Vp e σ em Sp, vale

ω(vσ1 , . . . , vσp

)= sgnσ ω(v1, . . . , vp).

Page 154: 2aPARTE - Colorida - Hipertexto (2)

154 CAPÍTULO 14. O DETERMINANTE, DE NOVO

Demonstração: Usando a Proposição 1 da página 150, podemos escrever σ comoproduto de transposições: σ = τ1 . . . τk. Da Proposição 2 da página 152, seguesgnσ = (−1)k. Como ω é alternada, temos

ω(vσ1 , . . . , vσp

)= (−1)kω(v1, . . . , vp) = sgnσ ω(v1, . . . , vp).

Observação 1: Dos lemas 1 e 2 acima, segue que duas formas p lineares alternadasω e η são iguais se

ω(eJ) = η(eJ) ∀J ∈ J .

Lema 3: Seja V um espaço vetorial, real ou complexo. Se ω é p-linear e ωA éde�nida por

ωA(v1, . . . , vp) =∑σ∈Sp

sgnσ ω(vσ1 , . . . , vσp),

então ω é p-linear e alternada.

Demonstração: Basta notar que trocar a ordem dos vetores vi e vj equivale aplicara transposição τ que troca i com j (note que sgnτ = −1). Ora, dados v1,...,vi,...,vj ,...,vp em V, temos, para cada τ em Sp,

ω(vτ1 , . . . , vτp) =∑σ∈Sp

sgnσ ω(v(τσ)1 , . . . , v(τσ)p) =

= −∑σ∈Sp

sgn(τσ) ω(v(τσ)1 , . . . , v(τσ)p) = ω(vσ1 , . . . , vσp)

(note que, para τ �xo, quando σ percorre Sp, o mesmo ocorre com τσ).

Observação 2: Note que, se ω é p-linear alternada, então, dos lemas 2 e 3, segueque ωA = p! ω.

Passemos, �nalmente, à de�nição do determinante (numa primeira versão, comouma forma n-linear alternada). Fixando uma base deV, cujos elementos designare-mos por e1, . . . , en, podemos identi�carV com Kn (K = IR ou IC, conforme o caso).Cada elemento v de V pode, pois, ser identi�cado com uma n-upla (v1, . . . , vn) deKn. Assim, basta-nos de�nir o determinante em IRn ou ICn. Comecemos de�nindouma forma n-linear

δn : (Kn)n −→ K(v1, . . . , vn) 7−→ v11v22...vnn.

Page 155: 2aPARTE - Colorida - Hipertexto (2)

F. O DETERMINANTE DE TRANSFORMAÇÃO LINEAR 155

Exercício: Note que, tomando a matriz n × n [vij ], a forma δn calcula o produtodos elementos da diagonal principal.

Exercício: Mostre que, se eJ ∈ {1, . . . , n}n, então δn(eJ) = 1, se J = (1, 2, . . . , n) eδn(eJ) = 0, se J 6= (1, 2, . . . , n).

De�nição:A forma n-linear alternada detn, de�nida em IRn ou ICn, seguindo olema 3, por

detn(v1, . . . , vn) =∑σ∈Sn

sgnσδn(v1σ1 , . . . , vnσn),

é chamada de determinante.5

Exercício: Mostre que detn(e1, . . . , en) = 1.

f O determinante de transformação linear

Examinemos agora o espaço das n-formas lineares alternadas num espaço V dedimensão n, que será notado An(V). Se ω ∈ An(V), então ω é determinada porseu valor em (v1, . . . , vn), onde {v1, . . . , vn} é base de V (isto segue da Observação1, página 154). Assim, An(V) tem dimensão 1, isto é, se ω, η ∈ An(V), ω 6= 0,então existe λ ∈ IR tal que η = λω (ou seja, a menos de �xação da unidade demedida, só existe uma forma de medir coisas de dimensão n em V).

Proposição 1: Se o espaço vetorial V, real ou complexo, tem dimensão n, entãoo espaço vetorial An das formas n-lineares alternadas em V tem dimensão 1.

Demonstração: Já demonstramos a existência de um elemento não nulo em An(o determinante, que notamos detn). Seja ω outro elemento de An; faça α =ω(e1, . . . , en). Dos lemas 1 e 2 da seção anterior, segue que, como ω e αdetncoincidem em (e1, . . . , en), então são iguais.

Seja agora T : V→ V linear. Para cada ω ∈ An(V), seja ωT ∈ An(V) dada por

ωT (v1, . . . , vn) = ω(Tv1, . . . , T vn).

A aplicação ω → ωT é claramente uma transformação linear de An(V) em An(V).Sendo An(V) de dimensão 1, existe um único escalar detT tal que

ω(Tv1, . . . , T vn) = detT ω(v1, . . . , vn)∀ω ∈ An(V) .

5Estamos usando a seguinte notação: o vetor vj tem por coordenadas (v1j , . . . , vnj)

Page 156: 2aPARTE - Colorida - Hipertexto (2)

156 CAPÍTULO 14. O DETERMINANTE, DE NOVO

De�nição: O número detT de�nido acima é chamado determinante de T .

Proposição 2: Se T1, T2 : V→ V são lineares, então,

det(T1T2) = detT1.detT2 .

Demonstração: Se T1, T2 : V→ V são lineares, então, para qualquer ω em An(V),temos

det(T1T2)ω(v1, . . . , vn) = ω(T1T2v1, . . . , T1T2vn) == ωT1(T2v1, . . . , T2vn) = detT1ω(T2v1, . . . , T2vn) =

= detT1.detT2.ω(v1, . . . , vn) ∀(v1, . . . , vn) ∈ Vn ,

g Determinante de matriz

Dada a matriz n × n [aij ], temos, pelo menos, três maneiras naturais para de�nirdet [aij ]:

1. usando a de�nição de detn como forma linear, fazemos

det [aij ] = detn(a1, . . . , an),

sendo aj o j-ésimo vetor coluna de [aij ];

2. mesma coisa, usando os vetores linha;

3. consideramos a transformação linear A de�nida por [aij ], na base canônica,e fazemos det [aij ] = detA.

Curiosamente, as três dão o mesmo número. Há, ainda, uma possibilidade (in�ni-tas, na verdade, uma para cada possível base):

4. Fixamos uma base β e consideramos a transformação linear T de�nida por[aij ], na base β, e fazemos det [aij ] = detT .

Lema: As quatro de�nições de determinante de matriz propostas acima são equi-valentes.

Demonstração: Comecemos provando que 1 e 3 dão o mesmo número. Como detn éuma forma n-linear alternada, temos detn(Ae1, . . . , Aen) = detAdetn(e1, . . . , en) =detA. A equivalência entre 3 e 4 segue do fato de que a transformação T de�nida em4 é dada por B−1AB, sendo B a transformação que leva, na ordem, os vetores de βnos da base canônica. Assim, detT = det(B−1AB) = det(B−1)detAdetB = detA

Page 157: 2aPARTE - Colorida - Hipertexto (2)

G. DETERMINANTE DE MATRIZ 157

(já que B−1B = I, e detI = 1). Resta provar que 1 e 2 também fornecem o mesmoresultado. Usaremos a fórmula, correspondente a 1:

det [aij ] =∑σ∈Sn

sgnσ a1σ1a2σ2 . . . anσn .

Observemos que cada parcela consiste em multiplicar o sinal de σ pelo produto dosnúmeros aiσi com i em {1, . . . , n}. Podemos, é claro, alterar a ordem dos fatores,reescrevendo cada parcela como

sgnσ a(σ−1)1σ(σ−1)1a(σ−1)2σ(σ−1)2

. . . a(σ−1n )σ(σ−1)n

.

Como σ(σ−1)j = j para todo j (é pura notação), segue

det [aij ] =∑σ∈Sn

sgnσ a(σ−1)11a(σ−1)22 . . . a(σ−1n )n.

Como sgnσ = sgn(σ−1) para todo σ em Sn e, quando σ percorre Sn, σ−1 faz omesmo, o termo à direita corresponde, exatamente, à expressão que obtemos de 2.

Escolhendo uma das de�nições equivalentes acima, podemos de�nir o determinantede uma matriz e dar por provadas umas tantas coisas.

De�nição: O determinante da matriz n× n [aij ], real ou complexa, é o númerodet [aij ], também notado por |aij |, e de�nido por

det [aij ] =∑σ∈Sn

sgnσ a1σ1a2σ2 . . . anσn .

Teorema: O determinante da matriz n × n [aij ], real ou complexa, é uma forman-linear alternada dos vetores coluna de [aij ] e satisfaz às seguintes propriedades:

1. det [I] = 1, sendo [I] a matriz identidade;

2. det ([A] [B]) = det [A] det [B], para quaisquer matrizes n× n [A] e [B]

3. det [A]T = det [A], para qualquer matriz n× n [A].

Demonstração:

Os resultados a seguir merecem um certo destaque.

Page 158: 2aPARTE - Colorida - Hipertexto (2)

158 CAPÍTULO 14. O DETERMINANTE, DE NOVO

Proposição 1: A matriz n× n [aij ] tem inversa se, e somente se, det [aij ] 6= 0.

Demonstração: Se [aij ] tem inversa, então

det [aij ] det(

[aij ]−1)

= det(

[aij ] [aij ]−1)

= det [I] = 1;

logo, det [aij ] 6= 0. Reciprocamente, dizer que det [aij ] 6= 0 é o mesmo que dizer quedetn(a1, . . . , an) 6= 0, sendo aj o j-ésimo vetor coluna de [aij ]. Mas isso só ocorrese os vetores coluna de [aij ] são linearmente independentes, o que signi�ca que [aij ]tem inversa.

Proposição 2 (Regra de Cramer): Se o vetor coluna [xi] é solução do sisteman× n [aij ] [xi] = [bi], ou seja, a11 · · · a1n

... · · ·...

an1 · · · ann

x1

...xn

=

b1...bn

,

então, para cada i = 1, . . . , n, vale xj det [aij ] = det [aij ], sendo [aij ] a matrizn× n que se obtém substituindo a j-ésima coluna de [aij ] por [bi]. Em particularse det [aij ] 6= 0 então a solução [xi] é única e, se representamos por aj os vetorescoluna de [aij ] e por b o vetor correspondente a [bi], é dada por

xj =detn(a1, . . . , aj=1, b, aj+1, . . . , an)

detn(a1, . . . , an).

Demonstração: Basta escrever b = x1a1 + . . .+ xnan e substituir em

detn(a1, . . . , aj−1, b, aj+1, . . . , an).

Falta uma fórmula de cálculo "efetiva". A fórmula que de�ne o determinante dematriz n× n não é muito alentadora: prevê a soma de n! parcelas, cada uma com(n− 1) multiplicações (sem contar o cálculo do sinal da permutação). Mesmo paran bem pequeno, relativamente às matrizes que aparecem em problemas reais, essenúmero de operações exige, mesmo com os mais modernos processadores, tempoque nenhum ser humano tem para esperar.6 Modestamente, não vamos aqui discu-tir algoritmos mais e�cientes; apenas apresentaremos um método tradicional, que

6Podemos atuar nas três frentes: melhorar o algoritmo, fabricar processadores maisrápidos e aumentar o tempo de vida. Matemáticos podem se engajar em qualquer umadas três

Page 159: 2aPARTE - Colorida - Hipertexto (2)

G. DETERMINANTE DE MATRIZ 159

reduz o cálculo de um determinante (n+ 1)× (n+ 1), essencialmente, ao de n+ 1determinantes n× n.

O ponto de partida é a observação, simples, de que, no cálculo do determinantede [aij ], a entrada aij só multiplica entradas da matriz que se obtém riscando alinha i e a coluna j. Logo vemos que, com um pouco de sorte, aij deve multiplicar,talvez a menos do sinal, o determinante dessa matriz um pouco menor. O resultadopreciso é a chamada fórmula dos cofatores.

Proposição 3: Seja [aij ] matriz n×n (n > 1). Fixada a coluna j, o determinantede [aij ] é dado pela fórmula dos cofatores:

det [aij ] =n∑i=1

(−1)i+jaijMij ,

sendo Mij o determinante da matriz (n− 1)× (n− 1) [aij ] obtida de [aij ] riscandoa linha i e a coluna j.7 Equivalentemente, �xada a linha i, temos

det [aij ] =

n∑j=1

(−1)i+jaijMij .

Demonstração: Vamos provar apenas a primeira fórmula, já que para a segunda,basta tomar a transposta da matriz. Para simpli�car, começamos com j = 1.Chamando, como de hábito, os vetores coluna de a1, . . . , an e recorrendo a nossade�nição de detn, temos

det [aij ] = detn(n∑i=1

ai1ei, a2, . . . , an) =n∑i=1

ai1detn(ei, a2, . . . , an).

Vejamos, agora, o que nos dá, para i �xo, detn(ei, a2, . . . , an). Usando a notaçãode barras para o determinante, trata-se de

∣∣∣∣∣∣∣∣∣∣∣∣

0 a12 . . . a1n...

......

1 ai2 . . . ain...

......

0 an2 . . . ann

∣∣∣∣∣∣∣∣∣∣∣∣=

∣∣∣∣∣∣∣∣∣∣∣∣

0 a12 . . . a1n...

......

1 0 . . . 0...

......

0 an2 . . . ann

∣∣∣∣∣∣∣∣∣∣∣∣= (−1)i−1

∣∣∣∣∣∣∣∣∣∣∣∣∣∣

1 0 . . . 00 a12 . . . a1n...

......

0 ai2 . . . ain...

......

0 an2 . . . ann

∣∣∣∣∣∣∣∣∣∣∣∣∣∣.

7O número (−1)i+jMij é chamado cofator de aij ; Mij é dito determinante menor

associado a aij

Page 160: 2aPARTE - Colorida - Hipertexto (2)

160 CAPÍTULO 14. O DETERMINANTE, DE NOVO

(os chapéus sobre as entradas da i-ésima linha indicam que essa linha foi suprimida).O último determinante faz aparecer, se riscarmos a primeira linha e a primeiracoluna, a matriz [aij ]. Se de�nirmos a aplicação que, a cada matriz (n−1)×(n−1)[bij ], associa o número ∣∣∣∣∣∣∣∣∣∣∣∣

1 0 . . . 00 b11 . . . b1(n−1)...

......

......

...0 b(n−1)2 . . . b(n−1)(n−1)

∣∣∣∣∣∣∣∣∣∣∣∣,

teremos uma forma (n− 1)-linear e alternada nas colunas de [bij ] que, além disso,assumirá o valor 1 quando [bij ] for a matriz identidade. Ora, só há uma funçãocom tais características: o determinante. Logo, se tomarmos [bij ] = [aij ], teremosMij . Isto nos dá

detn(ei, a2, . . . , an) = (−1)i−1Mij = (−1)i+1Mij ,

Nossa fórmula está provada, para j = 1. Para j qualquer, basta notar que, trazendopara a extrema esquerda a coluna j, estaremos efetuando j − 1 transposições, demodo que ∣∣∣∣∣∣∣∣∣∣∣∣

a11 . . . . . . a1n...

......

...ai1 . . . . . . ain...

......

...an1 . . . . . . ann

∣∣∣∣∣∣∣∣∣∣∣∣= (−1)j−1

∣∣∣∣∣∣∣∣∣∣∣∣

a1j a11 . . . a1n...

......

aij ai1 . . . ain...

......

anj an1 . . . ann

∣∣∣∣∣∣∣∣∣∣∣∣Aplicando ao termo da direita a fórmula dos cofatores para a primeira coluna, jádemonstrada, obtemos a fórmula geral.

h Orientação

De�nição: Seja V um espaço vetorial real de dimensão n. Diremos que duas basesordenadas

α = (u1, . . . , un) eβ = (v1, . . . , vn)

Page 161: 2aPARTE - Colorida - Hipertexto (2)

H. ORIENTAÇÃO 161

de V têm a mesma orientação se existem funções f1, . . . , fn : [0, 1] −→ V taisque:

(i)fi é contínua ∀i = 1 . . . n;(ii)fi(0) = ui, fi(1) = vi ∀i = 1 . . . n;(iii)f1(t), . . . , fn(t) são linearmente independentes ∀t ∈ [0, 1].

Exercício: Mostre que "ter a mesma orientação"é uma relação de equivalência noconjunto das bases de V.

Exercício: Sejam2 : IR2×IR2 → IR como de�nida há pouco. Seja ω2 : IR2×IR2 → IRdada por ω2(u, v) = 0 se u e v são linearmente dependentes, ω2(u, v) = m2(u, v)se (u, v) tem a mesma orientação que (e1, e2) e ω2(u, v) = −m2(u, v) se (u, v) nãotem a mesma orientação que (e1, e2). Mostre que

(i) ω2(u, v) = 0 sss u e v sao linearmente dependentes(ii) ω2(u, v) = −ω2(v, u), ∀u, v

(iii) ω2(λu+ w, v) = λω2(u, v) + ω2(w, v) ∀λ, u, w, v

Exercício: Sejam V um espaço real de dimensão n+1 e ω uma forma (n+1)-linearalternada em V. Suponha que ω não é identicamente nula. Mostre que duas basesordenadas

(v1, . . . , vi, u, vi+1, . . . , vn) e (v1, . . . , vi, w, vi+1, . . . , vn)

têm a mesma orientação se e somente se

ω(v1, . . . , vi, u, vi+1, . . . , vn) e ω(v1, . . . , vi, w, vi+1, . . . , vn)

têm o mesmo sinal.

Proposição: Sejam V um espaço vetorial real de dimensão n+ 1 e ω uma forma(n+ 1)-linear alternada em V, não identicamente nula. Então duas bases ordena-das (u1, . . . , un+1) e (v1, . . . , vn+1) de V têm a mesma orientação se e somente seω(u1, . . . , un+1) e ω(v1, . . . , vn+1) têm o mesmo sinal.

Demonstração: Note que é fundamental estarmos trabalhando sobre o corpo dosreais.Supondo que as duas bases tenham a mesma orientação, considere as funções con-tínuas f1, . . . , fn+1 : [0, 1] → V que transformam uma na outra e faça α : [0, 1] →IR, α(t) = ω(f1(t), . . . , fn+1(t)). Como α não pode se anular, o resultado segue doTeorema do Valor Intermediário.

Page 162: 2aPARTE - Colorida - Hipertexto (2)

162 CAPÍTULO 14. O DETERMINANTE, DE NOVO

Para a recíproca, comecemos observando que podemos supor que nosso espaço temproduto interno e que a base (u1, . . . , un+1) é ortonormal. O processo de ortonor-malização de Gram-Schmidt nos fornece uma deformação de (v1, . . . , vn+1) em umabase ortonormal com a mesma orientação, mantendo o sinal de ω. Assim, podemossupor que as duas bases são ortonormais e que ω(u1, . . . , un+1) e ω(v1, . . . , vn+1)têm o mesmo sinal. Vamos agora, passo a passo, deformar cada ui em cada vi.Se u1 = v1 ou u1 = −v1, nada fazemos; caso contrário, tomamos θ tal quecos θ = < u1, v1 >, fazemos e1 = u1, v1 = v1− < v1, u1 > u1, e2 = (1/|v1|)v1e, para t ∈ [0, 1], consideramos a transformação Tt de V em V dada por Tte1 =cos(tθ)e1 + sin(tθ)e2, Tte2 = − sin(tθ)e1 + cos(tθ)e2, mantendo �xos os vetoresortogonais ao espaço gerado por e1 e e2. Assim, como Tt preserva a ortonormali-dade, a antiga base (u1, . . . , un+1) se deforma em uma nova (que continuaremos achamar de (u1, . . . , un+1)), com o novo u1 igual a v1. Fazemos o mesmo com u2até un. Teremos, no �m, uma nova base ortonormal, que continuamos chamando(u1, . . . , un+1), em que ui = vi ou ui = −vi, i = 1, . . . , n. Daí decorre que tam-bém temos un+1 = vn+1 ou un+1 = −vn+1. Durante todo o processo, o sinal deω(u1, . . . , un+1) não se alterou, continuando igual ao de ω(v1, . . . , vn+1). Logo, onúmero de índices i para o s quais ui = −vi é par. Mas, se ui = −vi e uj = −vj ,podemos fazer, no espaço gerado por ui e uj , uma rotação de 1800, transformando�nalmente uma base na outra.

i A dimensão do espaço das formas p-linearesalternadas

Dedicaremos os próximos parágrafos a provar que, se V é espaço vetorial de di-mensão n, real ou complexo, então

dim Ap(V) =(np

).

Seja, para cada p-lista J , πJ a projeção de Kn (ou V) sobre Kp, dada por:

πJ(v) = (vJ1 , . . . , vJp).

Observemos agora que, se v1, . . . , vp são elementos de V, faz sentido calcular δp nosp vetores de Kp obtidos aplicando πJ a v1, . . . , vp. O lema 2 nos permite de�nir asformas elementares dxJ , para as p-listas J . Seja V espaço vetorial de dimensão nsobre um corpo K.

Page 163: 2aPARTE - Colorida - Hipertexto (2)

I. A DIMENSÃODO ESPAÇODAS FORMAS P -LINEARES ALTERNADAS163

De�nição: As formas alternadas elementares dxJ são de�nidas, para cadap-lista J , por

dxJ(v1, . . . , vp) = detp(πJ(v1), . . . , πJ(vp)).

Exercício: Note que dxJ é identicamente nula se J tem índices repetidos (já que,nesse caso, πJ(v1), . . . , πJ(vp) são linearmente dependentes). Note, também, que,se os índices são todos diferentes, dxJ(eJ) = 1. Em particular, se J ∈ J , dxJ(eJ) =1.

Exercício: Suponha que I e J são tais que {I1, . . . , Ip} 6= {J1, . . . , Jp}. Mostre quedxI(eJ) = 0.

Exercício: Suponha que I e J são tais que {I1, . . . , Ip} = {J1, . . . , Jp}. Seja τ ∈ Sptal que (I1, . . . , Ip) = (Jτ1 , . . . , Jτp). Mostre que, para toda forma p-linear alternadaω e para quaisquer v1, . . . , vp em V, vale ω(vI1 , . . . , vIp) = sgnτω(vJ1 , . . . , vJp).

Finalmente podemos demonstrar nosso resultado principal.

Proposição: Seja V = IRn ou V = ICn. Então {dxJ , J ∈ J } é uma base para oespaço das formas p-lineares alternadas em V. Consequentemente, a dimensão deAp(V) é dada por

dim Ap(V) = (nk) .

Demonstração: Comecemos observando que {dxJ , J ∈ J } é um conjunto linear-mente independente. De fato, se ∑

J∈JaJdxJ = 0,

então, para todo I ∈ J ,

aI =∑J∈J

aJdxJ(eI) = 0.

Por outro lado, dada ω em Ap(V), seja ω0 dada por

ω0 =∑J∈J

ω(eJ)dxJ .

É imediato que ω0(eJ) = ω(eJ) para todo J em J . A igualdade desejada está,então, garantida pela Observação 1 da página 154.

Page 164: 2aPARTE - Colorida - Hipertexto (2)

164 CAPÍTULO 14. O DETERMINANTE, DE NOVO

Page 165: 2aPARTE - Colorida - Hipertexto (2)

Capítulo 15

Quando o exemplo vem de cima

a Um exemplo

Até agora temos baseado boa parte do desenvolvimento da teoria em um princípiofundamental: para usarmos a intuição (geométrica) em IRn, devemos fazer de contaque n = 2 ou n = 3. Isso nos permite, como já dissemos anteriormente (capítulo8), investir um problema "algébrico" de um signi�cado geométrico. O propósitodeste capítulo é chamar atenção para situações em que esse procedimento, emboravalioso, deve, em muitas situações, ser substituído (ou complementado) por outro,que vai para o extremo oposto.

Comecemos com um exemplo. Seja A : IRn → IRn a transformação linear de�nidapela matriz

−2 1 0 . . . . . . 0 11 −2 1 . . . . . . 0 00 1 −2 . . . . . . 0 0...

......

......

......

0 0 . . . . . . −2 1 00 0 . . . . . . 1 −2 11 0 . . . . . . 0 1 −2

.

(nossa matriz tem todos os elementos da diagonal principal iguais a -2, os acima eabaixo destes iguais a 1 e dois uns perdidos em a1n e em an1; os demais são nulos).

165

Page 166: 2aPARTE - Colorida - Hipertexto (2)

166 CAPÍTULO 15. QUANDO O EXEMPLO VEM DE CIMA

b De onde veio?

Esta é uma questão crucial, se quisermos recorrer, em algum momento, à intuição.Nossa transformação linear, pode não parecer, é uma versão discreta da segundaderivada em um espaço de funções periódicas. Funções periódicas surgem natural-mente, entre outras possibilidades, quando analisamos funções de�nidas em

S1 ={

(x, y) ∈ IR2 | x2 + y2 = 1}.

Como todo ponto de S1 pode ser posto na forma (cos θ, sin θ), θ ∈ IR, é razoávelpensarmos nossas funções com domínio em IR. Se u : IR → IR é dada, olhamospara u(θ) como se fosse função, não de θ, mas de (cos θ, sin θ). É preciso, claro,que consideremos apenas funções u(θ) que satisfaçam a

u(θ + 2π) = u(θ) ∀ θ ∈ IR.

Convencionaremos, pois, que nossas funções são periódicas, de período 2π, e aelas nos referiremos chamando-as simplesmente de funções periódicas. Suponha-mos, agora, que nos concentremos no intervalo [0, 2π] e façamos uma discretização:partimos [0, 2π] em n intervalos de mesmo comprimento h = 2π/n, por meio dospontos θj = jh, h = 0, 1, . . . , n.

Figura 15.1: �nalmente, podemos VER um vetor em IRn!

Os correspondentes valores uj = u(θj) nos fornecem um vetor u = (u1, . . . , un) emIRn (podemos deixar de fora u0 = u(0), já que, pela periodicidade, u0 = un. Assim,

Page 167: 2aPARTE - Colorida - Hipertexto (2)

B. DE ONDE VEIO? 167

pensaremos um vetor u de IRn como uma função periódica em [0, 2π], decodi�cadosegundo os parâmetros que acabamos de estabelecer.

Como seria, então, a versão discreta da derivada? Calculando no ponto θj , temosduas ecolhas naturais. Olhando para a direita, temos

u(θj + h)− u(θj)

h=

1

h(uj+1 − uj) ;

olhando para a esquerda, temos

u(θj)− u(θj − h)

h=

1

h(uj − uj−1) .

Exercício: Note que, no primeiro caso, teremos, quando j = n, 1h (u1 − un); no

segundo, quando j = 1, 1h (u1 − un).

Não vamos escolher uma das duas; estamos interessados na segunda derivada. De-mocraticamente, derivaremos uma vez olhando para um lado, outra vez olhandopara o outro.

Exercício: Mostre que o resultado, independente de para que lado olhemos primeiro,é, no ponto θj ,

1

h2(uj+1 − 2uj + uj−1) .

Note que, para j = n, uj + 1 = u1 e, para j = 1, uj−1 = un.

Esquecendo as divisões por h ou por h2 (que podemos trazer de volta quandonecessário) e usando a convenção un+1 = u1, u0 = un, de�nimos três operadoresem IRn: D+, D− e A = D+D− = D−D+, dados, respectivamente, por

(D+u)j = uj+1 − uj ,

(D−u)j = uj − uj−1,

(Au)j = uj+1 − 2uj + uj−1.

Exercício: Mostre que, de fato, D+D− = D−D+.

Exercício: Seja S : IRn → IRn dado por (Su)j = uj+1 (usando a convenção un+1 =

u1, u0 = un). Mostre que D+ = S − I e que D− = I − S−1. Mostre que a matrizde S−1 é a transposta da de S.

Page 168: 2aPARTE - Colorida - Hipertexto (2)

168 CAPÍTULO 15. QUANDO O EXEMPLO VEM DE CIMA

Exercício: Mostre que a matriz de A é

−2 1 0 . . . . . . 0 11 −2 1 . . . . . . 0 00 1 −2 . . . . . . 0 0...

......

......

......

0 0 . . . . . . −2 1 00 0 . . . . . . 1 −2 11 0 . . . . . . 0 1 −2

.

Exercício: Mostre que A = S − 2I + S−1.

c De cima para baixo

O fato de que A represente uma versão IRn da segunda derivada nos leva a es-perar desse operador coisas que, olhando para dimensão mais baixa, talvez nãoaparecessem (ou, ao menos, talvez não tivessem apelo geométrico). Na realidade,a partir do trabalho de Fourier sobre a propagação de calor, no início do séculoXIX, o operador de segunda derivada no espaço das funções periódicas tem sidobastante estudado. Comecemos com um primeiro resultado, obtido via integraçãopor partes: ∫ 2π

0u′′u =

(u′u)2∣∣∣2π

0−∫ 2π

0

(u′)2

= −∫ 2π

0

(u′)2.

O resultado acima pode ser lido⟨d2u, u

⟩= −〈du, du〉 ,

sendo d o operador de derivação e

〈f, g〉 =

∫ 2π

0f(θ)g(θ)dθ.

Nossa versão em IRn, então, com o produto escalar usual, seria:

〈Au,u〉 = −〈D+u, D+u〉 ,

ou

〈Au,u〉 = −〈D−u, D−u〉 .

Page 169: 2aPARTE - Colorida - Hipertexto (2)

C. DE CIMA PARA BAIXO 169

Exercício: Mostre que as duas opções são verdadeiras.

Exercício: Note que, em contrapartida, ambos os resultados (∫ 2π0 u′′u = −〈du, du〉

e 〈Au,u〉 = −〈D+u, D+u〉) podem ser interpretados, geometricamente: o vetorAu (ou d2u) aponta para dentro da esfera de centro na origem e raio |u| (ou |u|).

Uma segunda questão, vinda de cima, é motivada pelo seguinte fato. A teoria deséries de Fourier nos leva a expressar cada função periódica u : IR→ IR (sob certascondições adicionais) como uma combinação linear in�nita de soluções (periódicas)da seguinte equação diferencial:

u′′ = λu.

As coisas �cam mais simples se pensamos nossas funções periódicas tomando va-lores em IC (e isso tem, em certos contextos, um signi�cado físico). As soluçõesda equação diferencial, tendo em conta a periodicidade de u, são (a menos demultiplicações por constantes) as funções

ϕk(θ) = eikθ, k ∈ ZZ,

com λ = −j2. Nesse contexto, temos (a justi�cativa, mesmo sob certas condiçõesadicionais sobre u, não é simples o su�ciente para ser posta em uma página):

u(θ) =∞∑

k=−∞cje

ikθ.

Exercício: Mostre que, se k 6= l, então∫ 2π

0ϕk(θ)ϕl(θ)dθ = 0.

Somos, assim, conduzidos às seguintes questões:1. Quais são, em IRn as possíveis soluções (não triviais) de

Au = λu

(o problema é achar λ ∈ IR e u ∈ IRn que satisfaçam a Au = λu)?

2. Encontradas tais soluções, será que constituem uma base ortogonal para IRn?

3. Fazendo n tender a ∞, o que obtemos em IRn tende, de alguma forma, aoque temos no espaço das funções periódicas?

Page 170: 2aPARTE - Colorida - Hipertexto (2)

170 CAPÍTULO 15. QUANDO O EXEMPLO VEM DE CIMA

Exercício: Seja S : IRn → IRn dado por (Su)j = uj+1 (usando a convenção un+1 =u1, u0 = un). Suponha que Su = λu. Mostre que λn = 1. Note que λn = 1 se,e somente se, λ = eikh, para algum k = 1, . . . , n, sendo h = 2π/n. Mostre que omesmo vale para S−1. Mostre que λn = 1⇔ λn = 1.

Exercício: Seja u ∈ IRn tal que Su = λu. Mostre que S−1u = λu. Mostre que, seλ = eikh, então, a menos de multiplicação por escalar, temos uj = λj = eik(jh).

Exercício: Mostre que, se λ = eikh e uj = λj = eik(jh), então

1

h2Au =

λ− 2 + λ

h2u.

Exercício: Mostre que os uk = (eik(h), eik(2h), . . . , eik(n−1)h, 1), k = 1, . . . , n formamuma base ortogonal para ICn. Observe que esses uk são as discretizações de

Exercício: Para dar uma ajeitada, mostre que, se n = 2m + 1, nossos lambdaspodem ser tomados na forma

λk = eikh, k = −m,−(m− 1), . . . , 0, . . . ,m.

Mostre que, se n = 2m, podemos fazer

λk = eikh, k = −(m− 1), . . . , 0, . . . ,m.

Exercício: Mostre que, �xando k e fazendo n tender a in�nito, temos

limn→∞

λk = −k2.

O que queremos destacar, com este exemplo, é o seguinte fato: não é preciso ter co-nhecimentos prévios sobre séries de Fourier (ou mesmo sobre derivadas e integrais)para resolver qualquer dos exercícios referentes ao operador A que apresentamos;no entanto, é pouco provável que, sem esses conhecimentos, fôssemos sequer capa-zes de formulá-los (ou, pelo menos, seria necessária uma dose bastante grande detalento para fazê-lo).

O caso que apresentamos é apenas um pequeno exemplo. Modelos matemáticosem ciência e tecnologia nos conduzem, com muita frequência à busca de soluçõesque vivem em espaços de dimensão in�nita e satisfazem a equações envolvendoderivadas e/ou integrais (a distribuição de temperaturas em um sólido, o campo develocidades na atmosfera, a trajetória de um satélite...). Tais espaços costumamcongregar as funções que podem descrever o fenômeno em questão. A exemplodo que �zemos com as funções periódicas, é possível dar-lhes versões discretas (e,

Page 171: 2aPARTE - Colorida - Hipertexto (2)

C. DE CIMA PARA BAIXO 171

geralmente, há in�nitas possibilidades de escolha). Tais versões discretas nos joga-rão em algum espaço de dimensão �nita, em que nosso problema possa ser tratado.Com alguma sorte (ou arte), nosso problema discretizado envolverá vetores e trans-formações lineares em algum IRn, com n grande. Embora continue valendo a penainvestir nosso IRn de signi�cado geométrico, pensando seus elementos como �echi-nhas ou pontos no espaço euclidiano (olhando para baixo), não devemos perder devista o problema original e as informações e sugestões que a área do conhecimentode que é oriundo nosso modelo podem nos fornecer. Nessas situações, é sempreimportante olhar para cima.

Page 172: 2aPARTE - Colorida - Hipertexto (2)

Índice Remissivo

algebrizaçãoda Geometria, 69

ângulo, 22, 91animação, 74Ap(V), 149Argand, 41

base, 14, 80, 83canônica, 73ortogonal, 23, 101ortonormal, 23, 101

Bernoulli, 75braquistócrona, 75

CálculoIn�nitesimal, 69

ciclos, 150disjuntos, 150

cisalhamento, 108, 130cofatores

fórmula, 159colchete de Lie, 114colunas

de matriz, 126combinação

linear, 79combinação linear, 11, 79

in�nita, 169complemento

ortogonal, 26conjunto

convexo, 101convexo

conjunto, 101coordenadas, 14, 80

sistema de, 18corpo

dos escalares, 79Cramer

fórmula de, 35regra de, 158

deformação, 36Descartes, 69desigualdade

de Cauchy-Schwarz-Buniacóvski, 93triangular, 94

determinante, 48de n vetores, 155de matriz, 32, 157de transformação linear, 156do sistema, 35menor, 33, 159

dimensão, 20, 85

espaço, 9l2(IR), 89, 95projetivo, 67vetorial, 72, 78base de, 80, 83dimensão de, 85exemplos, 74real, 78

estado, 77

�echinha, 7

172

Page 173: 2aPARTE - Colorida - Hipertexto (2)

ÍNDICE REMISSIVO 173

�echinhas, 106forma

alternada, 149elementar, 163

de medir volumes, 148multilinear, 148alternada, 149

trilinear, 30alternada, 30

trilinear alternada, 30fotogra�a, 95Fourier, 75função

periódica, 166

Galois, 77Gauss, 41Geometria

Euclidiana, 91Geometria Euclidiana, 87geometrização

da Álgebra, 70gerar, 14Gram-Schmidt

processo de, 25, 102

Hamilton, 41, 75homomor�smo, 114

identidade, 113inversão, 151

em relação a esfera, 66em relação a círculo, 66

inversade transformação linear, 113

isometria, 116isomor�smo, 18, 113

Jacobi, 30

Leibniz, 30, 35, 75Lema

Fundamental, 83p-listas, 153

média aritmética, 72MacLaurin, 36matriz, 117

antissimétrica, 124coluna de, 123colunas de, 126de mudança de base, 133de transformação linear, 117, 122,

125entradas de, 123identidade, 34, 124inversa, 124linha de, 123ortogonal, 132, 133simétrica, 124transposta, 131, 132conjugada, 133

MecânicaQuântica, 77

Mourey, 41

Newton, 75norma, 22, 90núcleo

de transformação linear, 140números

complexos, 41

operadorde derivação, 112shift, 112

orientação, 36, 161positiva, 39

origem, 9ortogonal

grupo, 132

permutação, 150

Page 174: 2aPARTE - Colorida - Hipertexto (2)

174 ÍNDICE REMISSIVO

poesia, 70polinômios, 77ponto

de fuga, 58de vista, 53no in�nito, 61�64, 66, 67

produtode permutações, 150de transformações lineares, 113escalar, 21, 43, 71, 88, 90canônico, 73canônico de IR3, 96

interno, 88, 90misto, 48por escalar, 9, 78vetorial, 43

projeçãoestereográ�ca, 64ortogonal, 25, 26, 100, 130sobre convexo, 101

quatérnionconjugado de, 49

quatérnions, 41

re�exão, 131resolução, 95reta

equações paramétricas, 11rotação, 127

Santíssima Trindade, 18sinal

de permutação, 152de permutação, 153

somade transformações lineares, 113de vetor a ponto, 11de vetores, 8direta, 141

subconjunto

aberto, 101fechado, 101

subespaçoa�m, 136gerado, 79vetorial, 79

subespaço vetorial, 19

Teoremada bola cabeluda, 55da projeção, 103de Gram-Schmidt, 102de Pitágoras, 91do Núcleo e da Imagem, 139

transformaçãolinearnúcleo de, 140

isométrica, 116linear, 106, 111núcleo de, 136

transformação linear, 111transformas ção

linearimagem de, 135

vetor, 7, 42coluna, 123�echinha, 78linha, 123norma de, 90unitário, 91

vetoresângulo entre, 91do espaço, 9linearmente independentes, 14, 82ortogonais, 21, 73soma de, 8

videogame, 54volume, 29, 47

Wessel, 41