introduÇÃo À Álgebra linear - matemática ufmg a algebra linear.pdf · hamilton prado bueno...

INTRODUÇÃO À ÁLGEBRA LINEAR

Intrd_Algebra linear_2011.indd 1 30/03/2011 07:58:04

CálCulo de VárIaS VarIáVeIS

UNiVErSidadE FEdEraL dE MiNaS GEraiS

Reitor: Clélio Campolina Diniz

Vice-Reitora: Rocksane de Carvalho Norton

Pró-reitoria de Graduação

Pró-Reitora: Antônia Vitória Soares Aranha

Pró-Reitor Adjunto: André Luiz dos Santos Cabral

Diretor do CAED: Fernando Fidalgo

Coordenador da UAB-UFMG: Wagner José Corradi Barbosa

Coordenador Adjunto UAB-UFMG: Hormindo Pereira de Souza Júnior

Editora UFMG

Diretor: Wander Melo Miranda

Vice-Diretor: Roberto Alexandre do Carmo Said

Conselho Editorial

Wander Melo Miranda (presidente)

Flavio de Lemos Carsalade

Heloisa Maria Murgel Starling

Márcio Gomes Soares

Maria das Graças Santa Bárbara

Maria Helena Damasceno e Silva Megale

Paulo Sérgio Lacerda Beirão

Roberto Alexandre do Carmo Said


Hamilton Prado Bueno

INTRODUÇÃO À ÁLGEBRA LINEAR

Belo Horizonte editora uFmG

2009


COORDENAÇÃO DE PRODUÇÃO DE TEXTOS DE MATEMÁTICA Dan AvritzerASSISTÊNCIA EDITORIAL Eliane Sousa e Euclídia Macedo

EDITORAÇÃO DE TEXTOS Maria do Carmo Leite Ribeiro

REVISÃO E NORMALIZAÇÃO Maria do Rosário Alves Pereira

REVISÃO DE PROVAS Maria do Rosário Alves Pereira e Renilde Silveira

PROJETO GRÁFICO Eduardo Ferreira

FORMATAÇÃO E CAPA Sérgio Luz

ILUSTRAÇÕES Cláudio Roberto

PRODUÇÃO GRÁFICA Warren Marilac

IMPRESSÃO Imprensa Universitária da UFMG

Editora UFMGAv. Antônio Carlos, 6.627 - Ala direita da Biblioteca Central - Térreo

Campus Pampulha - 31270-901 - Belo Horizonte - MGTel.: + 55 31 3409-4650 - Fax: + 55 31 3409-4768

www.editora.ufmg.br - [email protected]

© 2009, Hamilton Prado Bueno© 2009, Editora UFMG2011, 1ª reimpressãoEste livro ou parte dele não pode ser reproduzido por qualquer meio sem autorização escrita do Editor.

Bueno, Hamilton Prado. Introdução à álgebra linear / Hamilton Prado Bueno. – Belo Horizonte :

Editora UFMG, 2009.

101 p. : il. (Educação a Distância) Inclui referências. ISBN: 978-85-7041-796-1 1. Álgebra linear. I. Título. II. Série.

CDD: 512 CDU: 512.64

B918i

Elaborada pela DITTI – Setor de Tratamento da Informação Biblioteca Universitária da UFMG

PrÓ-rEitoria dE GradUaÇÃoAv. Antônio Carlos, 6.627 - Reitoria - 6º andarCampus Pampulha - 31270-901 - Belo Horizonte - MGTel.: + 55 31 3409-4054 - Fax: + 55 31 3409-4060 www.ufmg.br - [email protected] - [email protected]

Este livro recebeu o apoio financeiro da Secretaria de Educação a Distância do MEC.


Para

Franciele, Lilian e Paulo Henrique


Os Cursos de Graduação da UFMG, modalidade a distância, foram concebidos tendo em vista dois princípios fundamentais. O primeiro se refere à democratização do acesso à educação superior; o segundo consiste na formação de profissionais de alto nível, comprometidos com o desenvolvimento do país.

A coletânea da qual este volume faz parte visa dar suporte aos estu-dantes desses cursos. Cada volume está relacionado a um tema, eleito como estruturante na matriz curricular. Ele apresenta os conhecimentos mínimos que são considerados essenciais no estudo do tema. Isto não significa que o estudante deva se limitar somente ao estudo do volume. Ao contrário, ele é o ponto de partida na busca de um conhecimento mais amplo e aprofundado sobre o assunto. Nessa direção, cada volume apresenta uma bibliografia, com indi-cação de obras impressas e virtuais que deverão ser consultadas à medida que se fizer necessário.

Cada volume da coletânea está dividido em aulas, que consistem em unidades de estudo do tema tratado. Os objetivos, apresentados em cada início de aula, indicam as competências e habilidades que o estudante deve adquirir ao término de seu estudo. As aulas podem se constituir em apresentação, reflexões e indagações teóricas, em experimentos ou em orientações para atividades a serem realizadas pelos estudantes.

Para cada aula ou conjunto de aulas, foi elaborada uma lista de exer-cícios com o objetivo de levar o estudante a avaliar o seu progresso e a desenvolver estratégias de metacognição ao se conscientizar dos diversos aspectos envolvidos em seus processos cognitivos. Essa lista auxiliará o estudante a tornar-se mais autônomo, responsável, crítico, capaz de desenvolver sua independência intelectual. Caso ela mostre que as competências e habilidades indicadas nos objetivos não foram alcançadas, o aluno deverá estudar com mais afinco e atenção o tema proposto, reorientar seus estudos ou buscar ajuda dos tutores, professores especialistas e colegas.

Agradecemos a todas as instituições que colaboraram na produção desta coletânea. Em particular, agradecemos às pessoas (autores, coordenador da produção gráfica, coordenadores de redação, dese-nhistas, diagramadores, revisores) que dedicaram seu tempo, e esforço na preparação desta obra que, temos certeza, em muito contribuirá para a educação brasileira.

Maria do Carmo VilaCoordenadora do Centro de Apoio à Educação a Distância

UFMG


Sumário

Apresentação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Ao Aluno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Aula 1 - Conceitos Fundamentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.1 Vetores na Física e na Matemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.2 Sistemas lineares e o método de Gauss-Jordan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.3 Cálculo de determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

Aula 2 - O Espaço n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.1 Equação paramétrica do plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.2 Sistemas lineares em três variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.3 O espaço n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.4 Espaços vetoriais abstratos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

Aula 3 - Subespaços do n e Bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.1 Subespaços e combinações lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.2 Bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493.3 Dimensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

Aula 4 - Aplicações Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 574.1 Aplicações lineares e matrizes – Parte I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 574.2 Espaço linha e espaço coluna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 624.3 Multiplicação de matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 674.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

Aula 5 - O Teorema do Núcleo e da Imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 715.1 Teorema (da dimensão) do núcleo e da imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . 715.2 Isomorfismo e inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 725.3 Obtenção da inversa de uma matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 755.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

Aula 6 - Mudanças de Base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 796.1 Representação de um vetor em uma base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 796.2 Aplicações lineares e matrizes – Parte II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 816.3 Aplicação: diagonalização de uma matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 866.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89


Aula 7 - O Teorema de Cayley-Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 917.1 Polinômios de aplicações lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 917.2 Subespaços invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 927.3 O Teorema de Cayley-Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 937.4 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 957.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

Índice remissivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

Sobre o autor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101


Apresentação

Este texto foi redigido para a disciplina Álgebra Linear I, do curso de licenciatura em Matemática da UFMG, na modalidade a distância.

Há alguns anos, escrevi um livro para um curso de Álgebra Linear. Ele destinava-se a alunos mais avançados, que já haviam estudado a parte básica dessa disciplina. Apesar de introduzir todos os conceitos de um primeiro curso de Álgebra Linear, essa parte do texto foi escrita com o propósito de ser sucinta e não detalhava resultados considerados conhecidos.

A oportunidade de escrever este texto tornou possível apresentar, com um enfoque que julgo adequado, tópicos de um primeiro curso de Álgebra Linear. Contudo, a estrutura do curso a distância fez com que meu texto se tornasse mais abstrato do que intencionava: para tornar possível o ensino de assuntos básicos da Álgebra Linear em apenas dois meses, a estrutura euclidiana – quer dizer, produtos internos e normas – foi relegada a um segundo curso, continuação deste. Assim, aspectos geométricos que julgo fundamentais foram postergados para esse futuro curso.

Para sanar essa deficiência, tentei apresentar uma visão geométrica dos assuntos abordados. Uma vez concluída a redação deste livro, julguei o resultado final como bastante aceitável, ainda mais levando em conta o exíguo período em que ele foi redigido. Com a oportuni-dade de ensiná-lo e então ouvir a opinião dos alunos sobre ele, melho-rias podem ser implementadas e suas deficiências minoradas.

O desafio de escrever sobre tópicos básicos me fez procurar por demonstrações particularmente simples de resultados fundamentais. As demonstrações aqui apresentadas contaram com o auxílio do Prof. Helder Candido Rodrigues. Não existem palavras de agradecimento capazes de dar uma ideia do quanto essa colaboração foi decisiva.

Muitos dos exercícios propostos neste texto tem sua origem nos livros de Álgebra Linear do Prof. Reginaldo Santos. Tomei a liberdade de utilizá-los, conhecedor do enorme desprendimento que o caracteriza.

Agradeço à Profa. Maria Cristina Costa Ferreira por sugestões e corre-ções que muito aprimoraram este texto.

Hamilton Prado Bueno


Ao aluno

Os assuntos aqui apresentados dão continuidade ao livro Geometria Analítica e Álgebra Linear: uma visão geométrica, de Dan Avritzer. Assim, muitos resultados daquele texto são supostamente conhecidos. Por outro lado, meu enfoque sobre alguns assuntos difere do apresentado naquele texto. Isso motivou-me a apresentá-los novamente.

Há uma enorme diferença entre um texto de Geometria Analítica (mesmo com uma abordagem utilizando a Álgebra Linear, como no texto de Dan Avritzer) e um texto de Álgebra Linear. A apresentação torna-se muito mais abstrata, o que é uma imposição para se conseguir resultados mais gerais. Assim, ao estudar este texto, você se defrontará com resultados cujo significado terá dificuldades para compreender. Essa situação é normal e só será superada com muitas horas de estudo.

O curso apresenta muitos cálculos importantes. Nosso objetivo prin-cipal não é apenas que você seja capaz de realizá-los, mas que entenda o porquê de seu funcionamento. Quer dizer, você precisa compreender bem o assunto que está sendo exposto; caso contrário, chegará a contas que não terão qualquer significado.

A compreensão da estrutura da Álgebra Linear é o desafio que você terá que enfrentar neste curso. A demonstração dos resultados expostos (teorema, lemas, proposições) esclarece essa estrutura, não sendo apenas uma parte “desagradável e incompreensível” do assunto. Cada resultado deve ser lido e relido até que seu significado aflore. Se isso não for suficiente, tente seguir sua demonstração em um exemplo particular, que você mesmo pode elaborar. Além disso, você dispõe de contato quase direto com os monitores ou professores, contato esse que lhe ajudará na compreensão. Mas você terá que se dedicar bastante ao curso para superar suas dificuldades. Esse desafio é o mesmo enfrentado por alunos de cursos presenciais.

O fato de o curso ser a distância apresenta – o que à primeira vista parece paradoxal – a possibilidade de uma interação mais profunda entre você e seus professores ou tutores. Dúvidas podem ser sanadas rapidamente, graças à comunicação por meio da internet. Se desprezar esse canal de comunicação, o ritmo do curso fará com que você logo se sinta completa-mente desorientado. Assim, a sua participação no curso por meio desses canais de comunicação é decisiva para o seu aprendizado.


�

�“IntAL” — 2009/10/20 — 20:02 — page 1 — #1 �

�

�

�

�

�

Capítulo 1

Conceitos Fundamentais

Objetivos: No final desta Aula o aluno deve saber:

1. distinguir o uso de vetores na Física e na Matemática;

2. resolver sistema lineares pelo método de Gauss-Jordan;

3. calcular determinantes por meio do escalonamento de uma matriz.

1.1 Vetores na Física e na Matemática

Nosso primeiro contato com vetores aconteceu antes de ingressarmos noensino superior; provavelmente em uma aula de Física, vetores nos fo-ram apresentados como “grandezas com módulo, direção e sentido” – taiscomo força, velocidade e aceleração. Aprendemos que vetores eram repre-sentados por setas: a direção sendo a de uma reta contendo aquela seta,o sentido indicado pela seta e o módulo como o tamanho da seta. Sendomais preciso, cada reta do espaço define uma direção, convencionando-seque retas paralelas definem a mesma direção. Escolhido um segmento emuma reta, ao orientarmos esse segmento escolhemos um sentido para o ve-tor. Finalmente, o comprimento do segmento é o módulo desse vetor.

Assim, um vetor �v fica definido ao escolhermos dois pontos no espaço: oponto inicial Pi e o ponto final Pf . Mas segmentos paralelos, com o mesmosentido e o mesmo módulo, representam o mesmo vetor. No caso de termosPi = Pf , temos o vetor�0. Note que ao vetor�0 não define uma direção!

Figura 1.1: 1.1

Figura 1.1: Os segmentos orientados−→

Pi Pf e−→

QiQ f representam o mesmo vetor

1

�

�“IntAL” — 2009/10/20 — 20:02 — page 1 — #1 �

�

�

�

�

�

Capítulo 1









Figura 1.1: 1.1


Pi Pf e−→


1


AULA 1


OBjETIvOSNo final desta aula, o aluno deverá ser capaz de:1. distinguir o uso de vetores na Física e na Matemática;2. resolver sistema lineares pelo método de Gauss-Jordan;3. calcular determinantes por meio do escalonamento de uma matriz.

1 .1 vETORES NA FÍSICA E NA MATEMÁTICA

�

�“IntAL” — 2009/10/20 — 20:02 — page 1 — #1 �

�

�

�

�

�

Capítulo 1









Figura 1.1: 1.1


Pi Pf e−→


1

Pi

Pf

Qi

Q f

�

�“IntAL” — 2009/10/20 — 20:02 — page 1 — #1 �

�

�

�

�

�

Capítulo 1









Figura 1.1: 1.1


Pi Pf e−→


1


16

Introdução à álgebra lInear

�

�“IntAL” — 2009/10/20 — 20:02 — page 2 — #2 �

�

�

�

�

�

2 CAPÍTULO 1. CONCEITOS FUNDAMENTAIS

Aprendemos ainda que vetores podem ser somados e multiplicados porescalares (o nome que passamos a utilizar para nos referir a números reais).A soma dos vetores �u e�v, definidos pelos pontos Pi, Pf e Q′

i, Q′f é obtida ao

transladarmos o vetor �v, de modo que seu ponto inicial seja o ponto Pf eseu ponto final o ponto Q f ; o vetor �u +�v é dado pelo segmento orientadounindo Pi e Q f .

Figura 1.2: 1.2

Figura 1.2: A adição de vetores

Exercício 1.1 Na figura 1.2, os vetores �u e �v pertencem ao “plano” do papel deste livro. Se osvetores pertencem ao espaço, ainda assim a figura está correta?

A multiplicação do vetor �v pelo escalar α é definida como o vetor α�v com amesma direção do vetor �v, com o mesmo sentido, se α > 0, e com sentidocontrário, se α < 0. O módulo do vetor α�v é definido por ‖α�v‖ = |α| ‖�v‖,em que |α| é o valor absoluto do escalar α.

Figura 1.3: 1.3

Figura 1.3: A multiplicação de um vetor por um escalar

Exercício 1.2 Como é definido α�v, se α = 0?

Se a ideia da soma de vetores é clara, a sua obtenção prática no caso devetores definidos pelas coordenadas de seus pontos inicial e final não é tãosimples: dados dois vetores �v =

−−→PiPf e �w =

−−−→QiQ f (isto é, dois segmentos

orientados de retas), o vetor�v+ �w é obtido por meio de uma reta r, paralelaà reta definida por �w, passando pelo ponto Pf . Nessa reta, obtemos doispontos cuja distância ao ponto Pf é a mesma que a distância entre Qi e

Q f . Ao escolhermos a solução R f que define o mesmo sentido de−−−→QiQ f , o

segmento orientado−−→PiR f é o vetor �v + �w. Veja a Figura 1.4.

�

�“IntAL” — 2009/10/20 — 20:02 — page 3 — #3 �

�

�

�

�

�

1.1. VETORES NA FÍSICA E NA MATEMÁTICA 3

Figura 1.4: 1.4

Figura 1.4: A construção geométrica da soma de vetores dados por suas coordenadas, a partirda definição

Observação 1.3 Não podemos descrever a reta r como Pf + t�w, pois(ainda) não sabemos como somar as coordenadas do ponto Pf com ascoordenadas do vetor �w. Assim, ainda não sabemos como obter a soluçãoR f = Pf + 1�w! �

Exercício 1.4 Considere os vetores �v =−−→PiPf e �w =

−−−→QiQ f do plano, definidos pelos pontos

Pi = (0, 0), Pf = (2, 3), Qi = (1, 5) e Q f = (7, 2). Utilizando o método descrito no parágrafoanterior, obtenha os pontos inicial Ri e final R f do vetor �v + �w.

Exercício 1.5 Repita o exercício anterior no caso dos vetores espaciais �v =−−→PiPf e �w =

−−−→QiQ f , se

Pi = (0, 0, 3), Pf = (2, 3, 7), Qi = (1, 5, 2) e Q f = (7, 2, 2).

Os cálculos feitos na solução dos exercícios anteriores nos mostram comoé difícil operar com vetores desse modo.

A solução “matemática” para a resolução daqueles exercícios é bastanteinteressante e corresponde a uma utilização consciente do sistema de coor-denadas cartesianas.

Em primeiro lugar, notamos que a cada vetor−−−→QiQ f corresponde um único

vetor−→0P, cujo ponto inicial é a origem 0 e cujo ponto final é o ponto P. Se

os vetores−−−→QiQ f e

−−→RiR f são iguais, a eles corresponde o mesmo ponto P.

Em outras palavras, cada vetor−−→PiPf da Física é identificado com um único

ponto P. Ou seja, um vetor da Física corresponde a um ponto P do sistemade coordenadas cartesianas.

Na Matemática, um vetor é um ponto do espaço (ou do plano).

Por esse motivo, matemáticos usualmente denotam vetores por u, v, w,ao invés de �u, �v, �w. Em algumas situações, é interessante distinguir entrevetores e pontos. Assim, quando queremos nos referir simplesmente aoponto P (e não ao vetor definido por esse ponto), mantemos a notação depontos: P, Q, R.

Por outro lado, quando nos referirmos a um vetor v no sentido da Física,manteremos a notação �v.

Para continuarmos, verificaremos duas propriedades básicas da adição devetores: ela é comutativa e associativa. Ou seja, �u + �v = �v + �u e�u + (�v + �w) = (�u +�v) + �w. A comutatividade da adição é ilustrada pelaFigura 1.5.

Pi Pf = Q i

Qf

u

v

u + v

v2v

-3v


17

aula 1

�

�“IntAL” — 2009/10/20 — 20:02 — page 2 — #2 �

�

�

�

�

�


Aprendemos ainda que vetores podem ser somados e multiplicados porescalares (o nome que passamos a utilizar para nos referir a números reais).A soma dos vetores �u e�v, definidos pelos pontos Pi, Pf e Q′

i, Q′f é obtida ao

transladarmos o vetor �v, de modo que seu ponto inicial seja o ponto Pf eseu ponto final o ponto Q f ; o vetor �u +�v é dado pelo segmento orientadounindo Pi e Q f .

Figura 1.2: 1.2

Figura 1.2: A adição de vetores

Exercício 1.1 Na figura 1.2, os vetores �u e �v pertencem ao “plano” do papel deste livro. Se osvetores pertencem ao espaço, ainda assim a figura está correta?

A multiplicação do vetor �v pelo escalar α é definida como o vetor α�v com amesma direção do vetor �v, com o mesmo sentido, se α > 0, e com sentidocontrário, se α < 0. O módulo do vetor α�v é definido por ‖α�v‖ = |α| ‖�v‖,em que |α| é o valor absoluto do escalar α.

Figura 1.3: 1.3

Figura 1.3: A multiplicação de um vetor por um escalar

Exercício 1.2 Como é definido α�v, se α = 0?

Se a ideia da soma de vetores é clara, a sua obtenção prática no caso devetores definidos pelas coordenadas de seus pontos inicial e final não é tãosimples: dados dois vetores �v =

−−→PiPf e �w =

−−−→QiQ f (isto é, dois segmentos

orientados de retas), o vetor�v+ �w é obtido por meio de uma reta r, paralelaà reta definida por �w, passando pelo ponto Pf . Nessa reta, obtemos doispontos cuja distância ao ponto Pf é a mesma que a distância entre Qi e

Q f . Ao escolhermos a solução R f que define o mesmo sentido de−−−→QiQ f , o

segmento orientado−−→PiR f é o vetor �v + �w. Veja a Figura 1.4.

�

�“IntAL” — 2009/10/20 — 20:02 — page 3 — #3 �

�

�

�

�

�


Figura 1.4: 1.4

Figura 1.4: A construção geométrica da soma de vetores dados por suas coordenadas, a partirda definição

Observação 1.3 Não podemos descrever a reta r como Pf + t�w, pois(ainda) não sabemos como somar as coordenadas do ponto Pf com ascoordenadas do vetor �w. Assim, ainda não sabemos como obter a soluçãoR f = Pf + 1�w! �

Exercício 1.4 Considere os vetores �v =−−→PiPf e �w =

−−−→QiQ f do plano, definidos pelos pontos

Pi = (0, 0), Pf = (2, 3), Qi = (1, 5) e Q f = (7, 2). Utilizando o método descrito no parágrafoanterior, obtenha os pontos inicial Ri e final R f do vetor �v + �w.

Exercício 1.5 Repita o exercício anterior no caso dos vetores espaciais �v =−−→PiPf e �w =

−−−→QiQ f , se

Pi = (0, 0, 3), Pf = (2, 3, 7), Qi = (1, 5, 2) e Q f = (7, 2, 2).

Os cálculos feitos na solução dos exercícios anteriores nos mostram comoé difícil operar com vetores desse modo.

A solução “matemática” para a resolução daqueles exercícios é bastanteinteressante e corresponde a uma utilização consciente do sistema de coor-denadas cartesianas.

Em primeiro lugar, notamos que a cada vetor−−−→QiQ f corresponde um único

vetor−→0P, cujo ponto inicial é a origem 0 e cujo ponto final é o ponto P. Se

os vetores−−−→QiQ f e

−−→RiR f são iguais, a eles corresponde o mesmo ponto P.

Em outras palavras, cada vetor−−→PiPf da Física é identificado com um único

ponto P. Ou seja, um vetor da Física corresponde a um ponto P do sistemade coordenadas cartesianas.

Na Matemática, um vetor é um ponto do espaço (ou do plano).

Por esse motivo, matemáticos usualmente denotam vetores por u, v, w,ao invés de �u, �v, �w. Em algumas situações, é interessante distinguir entrevetores e pontos. Assim, quando queremos nos referir simplesmente aoponto P (e não ao vetor definido por esse ponto), mantemos a notação depontos: P, Q, R.

Por outro lado, quando nos referirmos a um vetor v no sentido da Física,manteremos a notação �v.

Para continuarmos, verificaremos duas propriedades básicas da adição devetores: ela é comutativa e associativa. Ou seja, �u + �v = �v + �u e�u + (�v + �w) = (�u +�v) + �w. A comutatividade da adição é ilustrada pelaFigura 1.5.

Pi PfvQi

Qf

w

r

Rf


18


�

�“IntAL” — 2009/10/20 — 20:02 — page 4 — #4 �

�

�

�

�

�


Figura 1.5: 1.5

Figura 1.5: A adição de vetores é comutativa, pois vetores são somados de acordo com a“regra do paralelogramo”

Por outro lado, a associatividade é simples: suponhamos que �u =−−→PiPf ,

�v =−−−→QiQ f e �w =

−−→RiR f . Para simplificar a notação, vamos supor que

Pf = Qi e Q f = Ri. Então,

(�u +�v) + �w = (−−→PiPf +

−−−→QiQ f ) +

−−→RiR f =

−−→PiQ f +

−−→RiR f

=−−→PiR f

=−−→PiPf +

−−→QiR f =

−−→PiPf + (

−−−→QiQ f +

−−→RiR f ) = �u + (�v + �w).

Confira esses cálculos na Figura 1.6.

Figura 1.6: 1.6

Figura 1.6: A adição de vetores é associativa

As propriedades comutativa e associativa da adição de vetores nos permi-tem reordenar termos de uma soma da maneira que mais nos convier etorna desnecessária a utilização de parênteses em uma adição de vetores.Isso é decisivo para o raciocínio que passaremos a descrever.

Consideremos os vetores v = (x0, y0, z0) e w = (x1, y1, z1). Denotaremosv1 = (x0, 0, 0), v2 = (0, y0, 0) e v3 = (0, 0, z0). É geometricamente claroque v = �v1 + �v2 + �v3 (veja a Figura 1.7). Usando a notação matemática,v = v1 + v2 + v3.

Procedemos de maneira análoga com o vetor w.

Agora consideremos v1 = (x0, 0, 0) e w1 = (x1, 0, 0). Novamente é claroque v1 + w1 = (x0 + x1, 0, 0). (Veja a Figura 1.8.) Assim, v1 + w1 = (x0 +x1, 0, 0).

�

�“IntAL” — 2009/10/20 — 20:02 — page 5 — #5 �

�

�

�

�

�


Figura 1.7: 1.7

Figura 1.7: Vale a igualdade v = v1 + v2 + v3

Figura 1.8: 1.8

Figura 1.8: A soma de vetores em uma mesma direção é obtida ao somar suas coordenadas

Naturalmente, o mesmo procedimento também se aplica às somas v2 + w2e v3 + w3. Ora, então temos

v + w = (v1 + v2 + v3) + (w1 + w2 + w3)

= (v1 + w1) + (v2 + w2) + (v3 + w3)

= (x0 + x1, 0, 0) + (0, y0 + y1, 0) + (0, 0, z0 + z1)

= (x0 + x1, y0 + y1, z0 + z1).

Em outras palavras, o tratamento anterior nos mostra que podemos encon-trar facilmente a soma de dois vetores, se conhecemos as coordenadas deambos: basta somar as coordenadas correspondentes.

Exercício 1.6 Justifique: se v = (x0, y0, z0), então αv = (αx0, αy0, αz0).Em particular, −v = (−1)v = (−x0,−y0,−z0), de modo que está definida a subtração de doisvetores: v − w = v + (−w).

Uma vez resolvido o exercício anterior, falta apenas um passo para encon-trarmos uma solução prática para os Exercícios 1.4 e 1.5.

Consideremos o vetor−−→PiPf definido pelos pontos inicial Pi = (x0, y0, z0)

e final Pf = (x1, y1, z1). Qual o ponto P que corresponde a esse vetor daFísica? Em outras palavras, qual o vetor v da Matemática correspondentea esse vetor da Física?

Examinando a Figura 1.9, vemos que−→0Pi +

−−→PiPf =

−→0Pf . Assim,

−−→PiPf =

−→0Pf −

−→0Pi. Como os vetores do lado direito da última igualdade

têm seu ponto inicial na origem (correspondendo assim a vetores da Mate-mática), acabamos de verificar que

−−→PiPf corresponde ao vetor

v = (x1 − x0, y1 − y0, z1 − z0) da Matemática.

u

vv

u

Pi Pf = Qi

Q f = Ri

R f


19

aula 1

�

�“IntAL” — 2009/10/20 — 20:02 — page 4 — #4 �

�

�

�

�

�


Figura 1.5: 1.5

Figura 1.5: A adição de vetores é comutativa, pois vetores são somados de acordo com a“regra do paralelogramo”

Por outro lado, a associatividade é simples: suponhamos que �u =−−→PiPf ,

�v =−−−→QiQ f e �w =

−−→RiR f . Para simplificar a notação, vamos supor que

Pf = Qi e Q f = Ri. Então,

(�u +�v) + �w = (−−→PiPf +

−−−→QiQ f ) +

−−→RiR f =

−−→PiQ f +

−−→RiR f

=−−→PiR f

=−−→PiPf +

−−→QiR f =

−−→PiPf + (

−−−→QiQ f +

−−→RiR f ) = �u + (�v + �w).

Confira esses cálculos na Figura 1.6.

Figura 1.6: 1.6

Figura 1.6: A adição de vetores é associativa

As propriedades comutativa e associativa da adição de vetores nos permi-tem reordenar termos de uma soma da maneira que mais nos convier etorna desnecessária a utilização de parênteses em uma adição de vetores.Isso é decisivo para o raciocínio que passaremos a descrever.

Consideremos os vetores v = (x0, y0, z0) e w = (x1, y1, z1). Denotaremosv1 = (x0, 0, 0), v2 = (0, y0, 0) e v3 = (0, 0, z0). É geometricamente claroque v = �v1 + �v2 + �v3 (veja a Figura 1.7). Usando a notação matemática,v = v1 + v2 + v3.

Procedemos de maneira análoga com o vetor w.

Agora consideremos v1 = (x0, 0, 0) e w1 = (x1, 0, 0). Novamente é claroque v1 + w1 = (x0 + x1, 0, 0). (Veja a Figura 1.8.) Assim, v1 + w1 = (x0 +x1, 0, 0).

�

�“IntAL” — 2009/10/20 — 20:02 — page 5 — #5 �

�

�

�

�

�


Figura 1.7: 1.7

Figura 1.7: Vale a igualdade v = v1 + v2 + v3

Figura 1.8: 1.8

Figura 1.8: A soma de vetores em uma mesma direção é obtida ao somar suas coordenadas

Naturalmente, o mesmo procedimento também se aplica às somas v2 + w2e v3 + w3. Ora, então temos

v + w = (v1 + v2 + v3) + (w1 + w2 + w3)

= (v1 + w1) + (v2 + w2) + (v3 + w3)

= (x0 + x1, 0, 0) + (0, y0 + y1, 0) + (0, 0, z0 + z1)

= (x0 + x1, y0 + y1, z0 + z1).

Em outras palavras, o tratamento anterior nos mostra que podemos encon-trar facilmente a soma de dois vetores, se conhecemos as coordenadas deambos: basta somar as coordenadas correspondentes.

Exercício 1.6 Justifique: se v = (x0, y0, z0), então αv = (αx0, αy0, αz0).Em particular, −v = (−1)v = (−x0,−y0,−z0), de modo que está definida a subtração de doisvetores: v − w = v + (−w).

Uma vez resolvido o exercício anterior, falta apenas um passo para encon-trarmos uma solução prática para os Exercícios 1.4 e 1.5.

Consideremos o vetor−−→PiPf definido pelos pontos inicial Pi = (x0, y0, z0)

e final Pf = (x1, y1, z1). Qual o ponto P que corresponde a esse vetor daFísica? Em outras palavras, qual o vetor v da Matemática correspondentea esse vetor da Física?

Examinando a Figura 1.9, vemos que−→0Pi +

−−→PiPf =

−→0Pf . Assim,

−−→PiPf =

−→0Pf −

−→0Pi. Como os vetores do lado direito da última igualdade

têm seu ponto inicial na origem (correspondendo assim a vetores da Mate-mática), acabamos de verificar que

−−→PiPf corresponde ao vetor

v = (x1 − x0, y1 − y0, z1 − z0) da Matemática.

v1 = v1 v2

v3v2

v3

x

y

z

v

x0

v1 w1

v1 w1 x0

v1w1

v1 w1


20


�

�“IntAL” — 2009/10/20 — 20:02 — page 7 — #7 �

�

�

�

�

�

1.2. SISTEMAS LINEARES E O MÉTODO DE GAUSS-JORDAN 7

1.2 Sistemas Lineares e o Método de Gauss-Jordan

Para 1 ≤ i ≤ m e 1 ≤ j ≤ n, suponhamos conhecidos os valores aij eos valores bj. Um sistema linear em m equações e n incógnitas procura asolução x1, . . . , xn que satisfaz

a11x1 + . . . + a1nxn = b1a21x1 + . . . + a2nxn = b2

......

...am1x1 + . . . + amnxn = bm.

Como sabemos, esse sistema pode ser escrito utilizando matrizes

a11 a12 · · · a1na21 a22 · · · a2n...

.... . .

...am1 am2 · · · amn

x1x2...

xn

=

b1b2...

bm

,

ou,Ax = b.

Se b = 0, o sistema é chamado homogêneo; se b �= 0, o sistema é não homogê-neo. Os sistemas Ax = b e Ax = 0 relacionam-se de um modo especial, demodo que informações sobre as soluções de um fornecem dados importan-tes para a solução do outro. Por esse motivo, no estudo do sistema Ax = b,o sistema Ax = 0 é chamado sistema homogêneo associado.

Vamos estudar o sistema Ax = b. Para isso, mais sinteticamente ainda,representaremos esse sistema por uma única matriz, chamada matrizaumentada do sistema:

A = (A | b) =

a11 a12 · · · a1n∣∣ b1

a21 a22 · · · a2n∣∣ b2

......

. . ....

∣∣∣∣...

am1 am2 · · · amn∣∣ bm

.

É fácil verificar que as seguintes operações sobre as linhas da matriz A nãoalteram o conjunto de soluções do sistema Ax = b:

(a) transpor as linhas i e j;

(b) multiplicar a linha i por um escalar não nulo;

(c) substituir a linha j por sua soma com um múltiplo da linha i.1

As operações (a), (b) e (c) são as operações elementares sobre as linhas damatriz A.

Consideremos então uma matriz satisfazendo as seguintes propriedades:

- se existir o primeiro elemento não nulo da linha i (chamado pivô dalinha i) e se esse ocorrer na coluna j, então, se existir o pivô da linhai + �, esse ocorre numa coluna k > j, para todo � ∈ {1, . . . , m − i};

- o pivô de cada linha é igual a 1, se ocorrer na matriz A.

�

�“IntAL” — 2009/10/20 — 20:02 — page 6 — #6 �

�

�

�

�

�


Exercício 1.7 Refaça os Exercícios 1.4 e 1.5.

Figura 1.9: 1.9

Figura 1.9: O vetor v = (x1 − x0, y1 − y0, z1 − z0) da matemática corresponde ao vetor−−→Pi Pf ,

se Pi = (x0, y0, z0) e Pj = (x1, y3, z1)

Exercício 1.8 Verifique que todo procedimento descrito anteriormente permanece válido para ve-tores do plano. Em outras palavras, verifique que a adição dos vetores u = (a, b) e v = (c, d) édada pelo vetor u + v = (a + c, b + d) e que λu = (λa, λb). Se �u = �PiPf for um vetor (da Física)determinado pelos pontos Pi = (x0, y0) e Pf = (x1, y1), verifique que ao vetor �u corresponde ovetor (da Matemática) u = (x1 − x0, y1 − y0).

Essa abordagem de vetores tem inúmeras vantagens. Mas também temdesvantagens: em alguns casos, o fato geométrico a ser descrito fica muitomais claro utilizando o conceito de vetor no sentido físico. Veja a Figura1.10.

Figura 1.10: 1.10

Figura 1.10: O vetor�n = (0, 0, 1) é normal à esfera x2 + y2 + z2 = 1 no ponto (0, 0, 1)

Exercício 1.9 Por que a figura anterior não corresponde ao sentido de vetor utilizado na Matemá-tica?

Quando conveniente, ilustramos figuras utilizando o conceito físico de ve-tor. Essa situação ocorre com frequência no estudo da Geometria Analítica,abordada no livro Geometria Analítica e Álgebra Linear: uma VisãoGeométrica, de Dan Avritzer. Você está convidado a rever as Aulas 1 a 4do tomo II daquele livro.

Pi

Pf

0

n


21

aula 1

�

�“IntAL” — 2009/10/20 — 20:02 — page 7 — #7 �

�

�

�

�

�


1.2 Sistemas Lineares e o Método de Gauss-Jordan

Para 1 ≤ i ≤ m e 1 ≤ j ≤ n, suponhamos conhecidos os valores aij eos valores bj. Um sistema linear em m equações e n incógnitas procura asolução x1, . . . , xn que satisfaz

a11x1 + . . . + a1nxn = b1a21x1 + . . . + a2nxn = b2

......

...am1x1 + . . . + amnxn = bm.

Como sabemos, esse sistema pode ser escrito utilizando matrizes

a11 a12 · · · a1na21 a22 · · · a2n...

.... . .

...am1 am2 · · · amn

x1x2...

xn

=

b1b2...

bm

,

ou,Ax = b.

Se b = 0, o sistema é chamado homogêneo; se b �= 0, o sistema é não homogê-neo. Os sistemas Ax = b e Ax = 0 relacionam-se de um modo especial, demodo que informações sobre as soluções de um fornecem dados importan-tes para a solução do outro. Por esse motivo, no estudo do sistema Ax = b,o sistema Ax = 0 é chamado sistema homogêneo associado.

Vamos estudar o sistema Ax = b. Para isso, mais sinteticamente ainda,representaremos esse sistema por uma única matriz, chamada matrizaumentada do sistema:

A = (A | b) =

a11 a12 · · · a1n∣∣ b1

a21 a22 · · · a2n∣∣ b2

......

. . ....

∣∣∣∣...

am1 am2 · · · amn∣∣ bm

.

É fácil verificar que as seguintes operações sobre as linhas da matriz A nãoalteram o conjunto de soluções do sistema Ax = b:

(a) transpor as linhas i e j;

(b) multiplicar a linha i por um escalar não nulo;

(c) substituir a linha j por sua soma com um múltiplo da linha i.1

As operações (a), (b) e (c) são as operações elementares sobre as linhas damatriz A.

Consideremos então uma matriz satisfazendo as seguintes propriedades:

- se existir o primeiro elemento não nulo da linha i (chamado pivô dalinha i) e se esse ocorrer na coluna j, então, se existir o pivô da linhai + �, esse ocorre numa coluna k > j, para todo � ∈ {1, . . . , m − i};

- o pivô de cada linha é igual a 1, se ocorrer na matriz A.

1 .2 SISTEMAS LINEARES E O MéTODO DE GAUSS-jORDAN

�

�“IntAL” — 2009/10/20 — 20:02 — page 6 — #6 �

�

�

�

�

�


Exercício 1.7 Refaça os Exercícios 1.4 e 1.5.

Figura 1.9: 1.9

Figura 1.9: O vetor v = (x1 − x0, y1 − y0, z1 − z0) da matemática corresponde ao vetor−−→Pi Pf ,

se Pi = (x0, y0, z0) e Pj = (x1, y3, z1)

Exercício 1.8 Verifique que todo procedimento descrito anteriormente permanece válido para ve-tores do plano. Em outras palavras, verifique que a adição dos vetores u = (a, b) e v = (c, d) édada pelo vetor u + v = (a + c, b + d) e que λu = (λa, λb). Se �u = �PiPf for um vetor (da Física)determinado pelos pontos Pi = (x0, y0) e Pf = (x1, y1), verifique que ao vetor �u corresponde ovetor (da Matemática) u = (x1 − x0, y1 − y0).

Essa abordagem de vetores tem inúmeras vantagens. Mas também temdesvantagens: em alguns casos, o fato geométrico a ser descrito fica muitomais claro utilizando o conceito de vetor no sentido físico. Veja a Figura1.10.

Figura 1.10: 1.10

Figura 1.10: O vetor�n = (0, 0, 1) é normal à esfera x2 + y2 + z2 = 1 no ponto (0, 0, 1)

Exercício 1.9 Por que a figura anterior não corresponde ao sentido de vetor utilizado na Matemá-tica?

Quando conveniente, ilustramos figuras utilizando o conceito físico de ve-tor. Essa situação ocorre com frequência no estudo da Geometria Analítica,abordada no livro Geometria Analítica e Álgebra Linear: uma VisãoGeométrica, de Dan Avritzer. Você está convidado a rever as Aulas 1 a 4do tomo II daquele livro.

1 Com relação à operação (c), note que x = (x1, x2 ..., x0) satisfaz

ai1 x1 + ... + ain xn = bi

aj1 x1 + ... + ajn xn = bj

se, e somente se, satisfizer

ai1 x1 + ... + ain xn = bi

(aj1 + αai1) x1 + ... + + (ajn + αain) xn = bj + αbi.


22


�

�“IntAL” — 2009/10/20 — 20:02 — page 8 — #8 �

�

�

�

�

�


Dizemos então que essa matriz (ou o sistema) está na forma escalonada euma sucessão de operações elementares utilizadas para levar uma matrizqualquer C até uma matriz na forma escalonada é um escalonamento damatriz C.

Dada uma matriz arbitrária C = (cij), a sucessiva aplicação de operaçõeselementares (sobre suas linhas) pode levá-la até uma forma escalonada.De fato, se existir algum elemento não nulo na primeira coluna de C, aoaplicarmos as operações elementares (a) e (b), obtemos uma nova matrizC′ = (c′ij), com c′11 = 1. A aplicação da operação elementar (c) torna possí-vel transformar em zero qualquer outro elemento não nulo da primeiracoluna. O resultado então segue-se daí por indução sobre o número delinhas de C.

Contudo, dada uma matriz A, a sucessiva aplicação de operações elemen-tares pode conduzir a diferentes formas escalonadas para essa matriz. É oque veremos no próximo exemplo.

Exemplo 1.10 Considere o sistema

A = (A | b) =(

1 2 3∣∣ 4

2 2 2∣∣ 2

).

Subtraindo da segunda linha duas vezes a primeira e então dividindo por(−2) a (nova) segunda linha, obtemos

(1 2 3

∣∣ 40 1 2

∣∣ 3

),

matriz que está na forma escalonada.

Por outro lado, trocando as duas linhas da matriz original A, dividindo a(nova) primeira linha por 2 e então subtraindo a segunda linha, chegamosa (

1 1 1∣∣ 1

0 1 2∣∣ 3

),

que também está na forma escalonada.

Assim, a uma mesma matriz podem corresponder diferentes formas escalo-nadas! Note, entretanto, que os pivôs são os mesmos nas duas formasobtidas. �

Suponhamos agora que uma matriz C esteja na forma escalonada. Se cadapivô for o único elemento não nulo de sua coluna, dizemos que a ma-triz está em sua forma escalonada reduzida por linhas. Aplicando a operaçãoelementar (c), podemos fazer com que uma matriz na forma escalonadaatinja sua forma reduzida por linhas. De fato, consideremos o pivô daúltima linha não nula de C. A aplicação da operação elementar (c) tornapossível zerar os elementos que estão acima do pivô, mantendo ainda amatriz na forma escalonada. A demonstração agora segue-se daí por in-dução, aplicando o mesmo procedimento ao pivô da penúltima linha nãonula de C e assim sucessivamente.

A forma escalonada reduzida por linhas de uma matriz é única. Mostra-remos esse resultado no Teorema 1.17.

�

�“IntAL” — 2009/10/20 — 20:02 — page 9 — #9 �

�

�

�

�

�


Exemplo 1.11 Consideremos o sistema Ax = b, cuja matriz aumentada édada por

1 0 0 0 0 0∣∣ b1

−1 0 0 0 0 0∣∣ b2

0 1 0 0 0 0∣∣ b3

1 1 1 1 0 0∣∣ b4

0 0 0 0 1 −3∣∣ b5

.

Queremos determinar para quais valores de b1, . . . , b5 o sistema tem solu-ção. Se ele tiver solução, queremos determiná-la.

Levando a matriz aumentada do sistema à forma escalonada reduzida porlinhas, obtemos

1 0 0 0 0 0∣∣ b1

0 1 0 0 0 0∣∣ b3

0 0 1 1 0 0∣∣ b4 − b1 − b3

0 0 0 0 1 −3∣∣ b5

0 0 0 0 0 0∣∣ b1 + b2

.

A última linha nos mostra que esse sistema apenas possui solução se tiver-mos b1 + b2 = 0. Quer dizer, se tivermos b1 + b2 �= 0, o sistema não temsolução.

Se o sistema tiver solução, podemos determiná-las.2 Suponhamos, por-tanto, que b1 + b2 = 0. Escrevemos as variáveis correspondentes aos pivôsem termos das demais variáveis (chamadas variáveis livres):

x1 = b1x2 = b3x3 = (b4 − b1 − b3)− x4x4 = x4x5 = b5 + 3x6x6 = x6

Podemos escrever essa resposta de uma maneira que se mostrará bastanteútil:

x1x2x3x4x5x6

=

b1b3

b4 − b1 − b30b50

+ x4

00

−1100

+ x6

000031

. (1.1)

Quer dizer, para quaisquer valores de b1, b3, b4 e b5, e para quaisquervalores escolhidos para as variáveis livres x4 e x6, a solução do sistemaAx = b (com b1 + b2 = 0) é dada pela expressão anterior. O sistema teminfinitas soluções, resultantes da escolha de valores para x4 e x6. �

Observação 1.12 O exemplo anterior deixa claro que a existência de solu-ções para um sistema Ax = b, sendo A uma matriz m × n, não dependediretamente de m e n. Ele não possuirá solução se, na forma escalonada redu-zida por linhas de (A|b), não tivermos uma linha no formato (0, c), comc �= 0. (Esse é o formato da última linha no sistema anterior, se tivermosb1 + b2 �= 0.) Se esse não for o caso, o sistema sempre possuirá solução: seexistirem variáveis livres (quer dizer, o número de pivôs não for igual a n),


23

aula 1

�

�“IntAL” — 2009/10/20 — 20:02 — page 8 — #8 �

�

�

�

�

�


Dizemos então que essa matriz (ou o sistema) está na forma escalonada euma sucessão de operações elementares utilizadas para levar uma matrizqualquer C até uma matriz na forma escalonada é um escalonamento damatriz C.

Dada uma matriz arbitrária C = (cij), a sucessiva aplicação de operaçõeselementares (sobre suas linhas) pode levá-la até uma forma escalonada.De fato, se existir algum elemento não nulo na primeira coluna de C, aoaplicarmos as operações elementares (a) e (b), obtemos uma nova matrizC′ = (c′ij), com c′11 = 1. A aplicação da operação elementar (c) torna possí-vel transformar em zero qualquer outro elemento não nulo da primeiracoluna. O resultado então segue-se daí por indução sobre o número delinhas de C.

Contudo, dada uma matriz A, a sucessiva aplicação de operações elemen-tares pode conduzir a diferentes formas escalonadas para essa matriz. É oque veremos no próximo exemplo.

Exemplo 1.10 Considere o sistema

A = (A | b) =(

1 2 3∣∣ 4

2 2 2∣∣ 2

).

Subtraindo da segunda linha duas vezes a primeira e então dividindo por(−2) a (nova) segunda linha, obtemos

(1 2 3

∣∣ 40 1 2

∣∣ 3

),

matriz que está na forma escalonada.

Por outro lado, trocando as duas linhas da matriz original A, dividindo a(nova) primeira linha por 2 e então subtraindo a segunda linha, chegamosa (

1 1 1∣∣ 1

0 1 2∣∣ 3

),

que também está na forma escalonada.

Assim, a uma mesma matriz podem corresponder diferentes formas escalo-nadas! Note, entretanto, que os pivôs são os mesmos nas duas formasobtidas. �

Suponhamos agora que uma matriz C esteja na forma escalonada. Se cadapivô for o único elemento não nulo de sua coluna, dizemos que a ma-triz está em sua forma escalonada reduzida por linhas. Aplicando a operaçãoelementar (c), podemos fazer com que uma matriz na forma escalonadaatinja sua forma reduzida por linhas. De fato, consideremos o pivô daúltima linha não nula de C. A aplicação da operação elementar (c) tornapossível zerar os elementos que estão acima do pivô, mantendo ainda amatriz na forma escalonada. A demonstração agora segue-se daí por in-dução, aplicando o mesmo procedimento ao pivô da penúltima linha nãonula de C e assim sucessivamente.

A forma escalonada reduzida por linhas de uma matriz é única. Mostra-remos esse resultado no Teorema 1.17.

�

�“IntAL” — 2009/10/20 — 20:02 — page 9 — #9 �

�

�

�

�

�


Exemplo 1.11 Consideremos o sistema Ax = b, cuja matriz aumentada édada por

1 0 0 0 0 0∣∣ b1

−1 0 0 0 0 0∣∣ b2

0 1 0 0 0 0∣∣ b3

1 1 1 1 0 0∣∣ b4

0 0 0 0 1 −3∣∣ b5

.

Queremos determinar para quais valores de b1, . . . , b5 o sistema tem solu-ção. Se ele tiver solução, queremos determiná-la.

Levando a matriz aumentada do sistema à forma escalonada reduzida porlinhas, obtemos

1 0 0 0 0 0∣∣ b1

0 1 0 0 0 0∣∣ b3

0 0 1 1 0 0∣∣ b4 − b1 − b3

0 0 0 0 1 −3∣∣ b5

0 0 0 0 0 0∣∣ b1 + b2

.

A última linha nos mostra que esse sistema apenas possui solução se tiver-mos b1 + b2 = 0. Quer dizer, se tivermos b1 + b2 �= 0, o sistema não temsolução.

Se o sistema tiver solução, podemos determiná-las.2 Suponhamos, por-tanto, que b1 + b2 = 0. Escrevemos as variáveis correspondentes aos pivôsem termos das demais variáveis (chamadas variáveis livres):

x1 = b1x2 = b3x3 = (b4 − b1 − b3)− x4x4 = x4x5 = b5 + 3x6x6 = x6

Podemos escrever essa resposta de uma maneira que se mostrará bastanteútil:

x1x2x3x4x5x6

=

b1b3

b4 − b1 − b30b50

+ x4

00

−1100

+ x6

000031

. (1.1)

Quer dizer, para quaisquer valores de b1, b3, b4 e b5, e para quaisquervalores escolhidos para as variáveis livres x4 e x6, a solução do sistemaAx = b (com b1 + b2 = 0) é dada pela expressão anterior. O sistema teminfinitas soluções, resultantes da escolha de valores para x4 e x6. �

Observação 1.12 O exemplo anterior deixa claro que a existência de solu-ções para um sistema Ax = b, sendo A uma matriz m × n, não dependediretamente de m e n. Ele não possuirá solução se, na forma escalonada redu-zida por linhas de (A|b), não tivermos uma linha no formato (0, c), comc �= 0. (Esse é o formato da última linha no sistema anterior, se tivermosb1 + b2 �= 0.) Se esse não for o caso, o sistema sempre possuirá solução: seexistirem variáveis livres (quer dizer, o número de pivôs não for igual a n),

2 Sendo mais explícito, estou dizendo que a denominação “sistema indeterminado”, utilizada no ensino médio, é inadequada.


24


�

�“IntAL” — 2009/10/20 — 20:02 — page 10 — #10 �

�

�

�

�

�


então o sistema possuirá infinitas soluções, resultantes das infinitas esco-lhas de valores para as variáveis livres. Se não existirem variáveis livres, osistema possuirá uma única solução. �

Exercício 1.13 Escreva explicitamente o sistema considerado no Exemplo 1.11.

Exercício 1.14 Dê um exemplo de um sistema com uma equação e duas incógnitas que possua asmesmas soluções de um sistema com duas equações e duas incógnitas.

Exercício 1.15 Dê um exemplo de um sistema com duas equações e duas incógnitas que não pos-sua solução.

É claro que, se estivermos tratando de um sistema homogêneo Ax = 0, nãohá necessidade de trabalhar com a matriz aumentada do sistema. É o quefaremos ao tratar esse tipo de sistema.

Exercício 1.16 Justifique a afirmação anterior em termos de operações elementares.

Teorema 1.17 Qualquer que seja a matriz A, ela possui uma única formaescalonada reduzida por linhas.

Demonstração: Faremos indução no número de colunas da matriz A. Se Apossuir uma única coluna, sua forma escalonada reduzida por linhas é

10...0

ou

00...0

,

a primeira possibilidade ocorrendo se A possuir um elemento não nulo e asegunda, caso contrário.

Suponhamos, portanto, o resultado válido para qualquer matriz com n − 1colunas e consideremos uma matriz A com n colunas. Suponhamos queR1 e R2 sejam formas escalonadas reduzidas por linhas da matriz A. Inter-pretando essas matrizes como matrizes aumentadas de um sistema, entãoR1 = (R|a) e R2 = (R|b), já que nossa hipótese de indução aplica-se àscolunas de R. Agora consideramos duas opções para a coluna a: se ela pos-suir um pivô, então o sistema Rx = a não possui solução, pois a linha deR correspondente à posição desse pivô seria identicamente nula, já que R1está na forma escalonada reduzida por linhas. Como as soluções de Rx = ae Rx = b são as mesmas, b também tem um pivô e, portanto, a = b, jáque R1 e R2 estão na forma escalonada reduzida por linhas. Se em a nãoexistir um pivô, então o sistema Rx = a possui uma solução x0. Mas entãoa = Rx0 = b, provando que a = b e que R1 = R2. �

Vamos agora explicitar a relação entre o sistema Ax = b e seu sistemahomogêneo associado, Ax = 0. Partimos de uma observação muito sim-ples: o sistema homogêneo sempre tem solução! De fato, se tomarmos ovalor de todas as incógnitas como sendo igual a zero, obtemos uma solu-ção do sistema, chamada solução trivial.

�

�“IntAL” — 2009/10/20 — 20:02 — page 11 — #11 �

�

�

�

�

�


A solução trivial será única, se não existirem variáveis livres. Isso implica,em particular, que a forma escalonada reduzida por linhas do sistema pos-sui o mesmo número de pivôs e de incógnitas. Assim, desprezadas as pos-síveis linhas identicamente nulas da forma escalonada reduzida por linhas,o que resta é a matriz identidade.

Exercício 1.18 Justifique a afirmação feita no parágrafo anterior.

Se existirem variáveis livres (ou uma variável livre), o sistema Ax = 0possuirá infinitas soluções, obtidas ao se atribuir diferentes valores a cadavariável livre. É o que acontece no próximo resultado:

Teorema 1.19 Considere um sistema homogêneo Ax = 0. Se A for umamatriz m × n, com m < n, então Ax = 0 possui infinitas soluções. Ou seja,qualquer sistema homogêneo com mais incógnitas do que equações possuiinfinitas soluções.

Demonstração: A forma escalonada reduzida por linhas de A possui umnúmero r de pivôs que é, no máximo, igual ao número de equações. Assim,ela possui n − r de variáveis livres e, portanto, infinitas soluções. �

Definição 1.20 Sejam A uma matriz m × n. Definimos o núcleo de A, deno-tado ker A,3 como sendo o conjunto de soluções do sistema Ax = 0.

Teorema 1.21 Suponha que x0 seja uma solução do sistema Ax = b, istoé, Ax0 = b. Se x1 também for uma solução do sistema Ax = b, entãox1 = x0 + z, em que z ∈ ker A. Em particular, se Ax = 0 só possuir asolução trivial, a solução de Ax = b será única.

Demonstração: Suponhamos que z ∈ ker A. Então x0 + z é solução do sis-tema Ax = b, pois A(x0 + z) = Ax0 + Az = b + 0 = b. Quer dizer, x0 + z ésolução de Ax = b, para todo z ∈ ker A.

Suponhamos agora que Ax1 = b, ou seja, que x1 seja também soluçãode Ax = b. Consideremos x1 − x0. Então A(x1 − x0) = Ax1 − Ax0 == b − b = 0, que dizer, (x1 − x0) ∈ ker A. Denotando z = x1 − x0, te-mos x1 = x0 + (x1 − x0) = x0 + z, o que completa a demonstração. �

Voltando ao Exemplo 1.11, podemos agora interpretar a equação (1.1). Oprimeiro termo do lado direito (o termo dependente de b) é uma soluçãoparticular de Ax = b (no caso b1 + b2 = 0). Os termos seguintes (corres-pondentes às variáveis livres x4 e x6) nos fornecem todas as soluções dosistema homogêneo associado. Observe que isso é imediato, pois corres-ponde à escolha b1 = · · · = b6 = 0.

Exercício 1.22 Considere o sistema

3x + 2y + 3z = 8x + y + z = 3

2x + y − z = 2.

Sabendo que (1, 1, 1) é uma de suas soluções, ache todas as soluções do sistema.

�

�“IntAL” — 2009/10/20 — 20:02 — page 11 — #11 �

�

�

�

�

�













3x + 2y + 3z = 8x + y + z = 3

2x + y − z = 2.



25

aula 1

�

�“IntAL” — 2009/10/20 — 20:02 — page 10 — #10 �

�

�

�

�

�


então o sistema possuirá infinitas soluções, resultantes das infinitas esco-lhas de valores para as variáveis livres. Se não existirem variáveis livres, osistema possuirá uma única solução. �

Exercício 1.13 Escreva explicitamente o sistema considerado no Exemplo 1.11.

Exercício 1.14 Dê um exemplo de um sistema com uma equação e duas incógnitas que possua asmesmas soluções de um sistema com duas equações e duas incógnitas.

Exercício 1.15 Dê um exemplo de um sistema com duas equações e duas incógnitas que não pos-sua solução.

É claro que, se estivermos tratando de um sistema homogêneo Ax = 0, nãohá necessidade de trabalhar com a matriz aumentada do sistema. É o quefaremos ao tratar esse tipo de sistema.

Exercício 1.16 Justifique a afirmação anterior em termos de operações elementares.

Teorema 1.17 Qualquer que seja a matriz A, ela possui uma única formaescalonada reduzida por linhas.

Demonstração: Faremos indução no número de colunas da matriz A. Se Apossuir uma única coluna, sua forma escalonada reduzida por linhas é

10...0

ou

00...0

,

a primeira possibilidade ocorrendo se A possuir um elemento não nulo e asegunda, caso contrário.

Suponhamos, portanto, o resultado válido para qualquer matriz com n − 1colunas e consideremos uma matriz A com n colunas. Suponhamos queR1 e R2 sejam formas escalonadas reduzidas por linhas da matriz A. Inter-pretando essas matrizes como matrizes aumentadas de um sistema, entãoR1 = (R|a) e R2 = (R|b), já que nossa hipótese de indução aplica-se àscolunas de R. Agora consideramos duas opções para a coluna a: se ela pos-suir um pivô, então o sistema Rx = a não possui solução, pois a linha deR correspondente à posição desse pivô seria identicamente nula, já que R1está na forma escalonada reduzida por linhas. Como as soluções de Rx = ae Rx = b são as mesmas, b também tem um pivô e, portanto, a = b, jáque R1 e R2 estão na forma escalonada reduzida por linhas. Se em a nãoexistir um pivô, então o sistema Rx = a possui uma solução x0. Mas entãoa = Rx0 = b, provando que a = b e que R1 = R2. �

Vamos agora explicitar a relação entre o sistema Ax = b e seu sistemahomogêneo associado, Ax = 0. Partimos de uma observação muito sim-ples: o sistema homogêneo sempre tem solução! De fato, se tomarmos ovalor de todas as incógnitas como sendo igual a zero, obtemos uma solu-ção do sistema, chamada solução trivial.

�

�“IntAL” — 2009/10/20 — 20:02 — page 11 — #11 �

�

�

�

�

�













3x + 2y + 3z = 8x + y + z = 3

2x + y − z = 2.


3 A notação ker vem do inglês: kernel quer dizer núcleo.

�

�“IntAL” — 2009/10/20 — 20:02 — page 11 — #11 �

�

�

�

�

�













3x + 2y + 3z = 8x + y + z = 3

2x + y − z = 2.



26


�

�“IntAL” — 2009/10/20 — 20:02 — page 12 — #12 �

�

�

�

�

�


1.3 Cálculo de Determinantes

Definição 1.23 Uma matriz quadrada é triangular superior se todas assuas entradas abaixo da diagonal principal são nulas.

Exercício 1.24 Mostre que o determinante de uma matriz triangular superior é o produto de suasentradas na diagonal principal. Defina matriz triangular inferior e mostre o resultado análogo.

Exercício 1.25 Justifique: se uma matriz quadrada estiver na forma escalonada, então ela é trian-gular superior.

O escalonamento de uma matriz (e o fato do determinante de uma ma-triz triangular superior ser o produto das entradas diagonais dessa matriz)nos fornece um método eficiente para o cálculo do determinante de umamatriz.

De fato, sabemos que a aplicação da operação fundamental (a) a uma ma-triz faz com que seu determinante seja multiplicado por −1. A operaçãofundamental (b) faz com que o determinante seja multiplicado pelo valor c,enquanto a operação fundamental (c) não altera o valor do determinante.(As operações fundamentais (a), (b) e (c) foram descritas na seção 1.2.)

Vejamos um exemplo do cálculo do determinante de uma matriz:

Exemplo 1.26 Consideremos a matriz

A =

1 1 1 11 2 2 21 1 3 34 3 2 1

.

Multiplicando a primeira linha por −1 e somando à segunda e à terceirae, então, multiplicando a primeira linha por −4 e somando à quarta linha,não alteramos o valor do determinante:

det A = det

1 1 1 11 2 2 21 1 3 34 3 2 1

= det

1 1 1 10 1 1 10 0 2 20 −1 −2 −3

. (1.2)

Continuando o escalonamento, obtemos (de acordo com as propriedadesdo determinante)

det A = det

1 1 1 10 1 1 10 0 2 20 −1 −2 −3

= (2)det

1 1 1 10 1 1 10 0 1 10 0 −1 −2

.

Então,

det A = (2)det

1 1 1 10 1 1 10 0 1 10 0 −1 −2

= −(2)det

1 1 1 10 1 1 10 0 1 10 0 0 1

.

A última matriz é triangular superior, de modo que seu determinante é oproduto de suas entradas na diagonal principal. Assim,

det A = −2.

�

�“IntAL” — 2009/10/20 — 20:02 — page 13 — #13 �

�

�

�

�

�

1.3. CÁLCULO DE DETERMINANTES 13

Observe, contudo, que também poderíamos obter o determinante da ma-triz A sem utilizar a operação fundamental (b). De (1.2) vem

det A = det

1 1 1 10 1 1 10 0 2 20 0 −1 −2

= det

1 1 1 10 1 1 10 0 2 20 0 0 −1

,

o que implica que det A = −2, pois a última matriz é triangular superior.�

Exercício 1.27 Calcule o determinante da matriz

2 1 3 11 0 1 10 2 1 00 1 2 3

.

Algumas vezes, a divisão de uma matriz quadrada em blocos pode sermuito útil para o cálculo de seu determinante. Por exemplo, a matriz

Q =

0 1 2 1 2 3 3 3 1 01 1 2 2 2 2 3 3 1 11 2 2 1 3 1 3 1 1 10 1 0 0 1 1 0 0 1 10 0 0 0 1 2 3 1 2 10 0 0 0 1 1 1 2 1 10 0 0 0 2 2 2 7 1 10 0 0 0 3 4 3 4 1 40 0 0 0 3 1 4 1 5 60 0 0 0 6 3 4 1 2 1

pode ser escrita na forma

Q =

(A B0 D

),

em que

A =

0 1 2 11 1 2 21 2 2 10 1 0 0

e D =

1 2 3 1 2 11 1 1 2 1 12 2 2 7 1 13 4 3 4 1 43 1 4 1 5 66 3 4 1 2 1

.

Os blocos A e D ajudam no cálculo do determinante da matriz Q. De fato,vale o seguinte resultado:

Teorema 1.28 Seja Q uma matriz n × n com a forma

Q =

(A B0 D

),

em que A é uma matriz m × m e D uma matriz (n − m)× (n − m). Então,

det Q = det A det D.

1 .3 CÁLCULO DE DETERMINANTES


27

aula 1

�

�“IntAL” — 2009/10/20 — 20:02 — page 12 — #12 �

�

�

�

�

�


1.3 Cálculo de Determinantes

Definição 1.23 Uma matriz quadrada é triangular superior se todas assuas entradas abaixo da diagonal principal são nulas.

Exercício 1.24 Mostre que o determinante de uma matriz triangular superior é o produto de suasentradas na diagonal principal. Defina matriz triangular inferior e mostre o resultado análogo.

Exercício 1.25 Justifique: se uma matriz quadrada estiver na forma escalonada, então ela é trian-gular superior.

O escalonamento de uma matriz (e o fato do determinante de uma ma-triz triangular superior ser o produto das entradas diagonais dessa matriz)nos fornece um método eficiente para o cálculo do determinante de umamatriz.

De fato, sabemos que a aplicação da operação fundamental (a) a uma ma-triz faz com que seu determinante seja multiplicado por −1. A operaçãofundamental (b) faz com que o determinante seja multiplicado pelo valor c,enquanto a operação fundamental (c) não altera o valor do determinante.(As operações fundamentais (a), (b) e (c) foram descritas na seção 1.2.)

Vejamos um exemplo do cálculo do determinante de uma matriz:


A =

1 1 1 11 2 2 21 1 3 34 3 2 1

.

Multiplicando a primeira linha por −1 e somando à segunda e à terceirae, então, multiplicando a primeira linha por −4 e somando à quarta linha,não alteramos o valor do determinante:

det A = det

1 1 1 11 2 2 21 1 3 34 3 2 1

= det

1 1 1 10 1 1 10 0 2 20 −1 −2 −3

. (1.2)

Continuando o escalonamento, obtemos (de acordo com as propriedadesdo determinante)

det A = det

1 1 1 10 1 1 10 0 2 20 −1 −2 −3

= (2)det

1 1 1 10 1 1 10 0 1 10 0 −1 −2

.

Então,

det A = (2)det

1 1 1 10 1 1 10 0 1 10 0 −1 −2

= −(2)det

1 1 1 10 1 1 10 0 1 10 0 0 1

.

A última matriz é triangular superior, de modo que seu determinante é oproduto de suas entradas na diagonal principal. Assim,

det A = −2.

�

�“IntAL” — 2009/10/20 — 20:02 — page 13 — #13 �

�

�

�

�

�

1.3. CÁLCULO DE DETERMINANTES 13

Observe, contudo, que também poderíamos obter o determinante da ma-triz A sem utilizar a operação fundamental (b). De (1.2) vem

det A = det

1 1 1 10 1 1 10 0 2 20 0 −1 −2

= det

1 1 1 10 1 1 10 0 2 20 0 0 −1

,

o que implica que det A = −2, pois a última matriz é triangular superior.�

Exercício 1.27 Calcule o determinante da matriz

2 1 3 11 0 1 10 2 1 00 1 2 3

.

Algumas vezes, a divisão de uma matriz quadrada em blocos pode sermuito útil para o cálculo de seu determinante. Por exemplo, a matriz

Q =

0 1 2 1 2 3 3 3 1 01 1 2 2 2 2 3 3 1 11 2 2 1 3 1 3 1 1 10 1 0 0 1 1 0 0 1 10 0 0 0 1 2 3 1 2 10 0 0 0 1 1 1 2 1 10 0 0 0 2 2 2 7 1 10 0 0 0 3 4 3 4 1 40 0 0 0 3 1 4 1 5 60 0 0 0 6 3 4 1 2 1

pode ser escrita na forma

Q =

(A B0 D

),

em que

A =

0 1 2 11 1 2 21 2 2 10 1 0 0

e D =

1 2 3 1 2 11 1 1 2 1 12 2 2 7 1 13 4 3 4 1 43 1 4 1 5 66 3 4 1 2 1

.

Os blocos A e D ajudam no cálculo do determinante da matriz Q. De fato,vale o seguinte resultado:

Teorema 1.28 Seja Q uma matriz n × n com a forma

Q =

(A B0 D

),

em que A é uma matriz m × m e D uma matriz (n − m)× (n − m). Então,

det Q = det A det D.


28


�

�“IntAL” — 2009/10/20 — 20:02 — page 14 — #14 �

�

�

�

�

�


Demonstração: Utilizando as operações elementares (a) e (c), transfor-mamos os blocos A e D em matrizes triangulares superiores. A operaçãoelementar (c) não altera o determinante de Q (nem o de A ou D), mas aoperação (a) inverte o sinal do determinante de Q. Mas, se ela for aplicadaem uma linha da matriz A (ou da matriz Q), ela também altera o sinal dodeterminante de A (e respectivamente, de D). Assim, suponhamos que aotransformar A e D em matrizes triangulares superiores tenhamos feito j ek trocas de linhas, respectivamente. Teremos

(−1)j(−1)k det Q =

(A′ B′

0 D′

),

em que A′ e D′ são matrizes triangulares superiores. Como a matriz Q étriangular superior, seu determinante é o produto de suas entradas diago-nais, de modo que

(−1)j(−1)k det Q = a′11 · · · a′mmd′11 · · · d′(n−m)(n−m)

= det A′ det D′,

em que a′11, . . . , a′mm são as entradas diagonais da matriz A′, enquantod′11, . . . , d′(n−m)(n−m) são as entradas diagonais de D′.

Mas det A = (−1)j det A′ e det D = (−1)k det D′, como vimos anterior-mente. Substituindo na igualdade anterior, obtemos

det Q = det A det D. �

Exercício 1.29 Considere a matriz

1 1 1 11 2 1 13 1 1 13 2 1 2

.

(i) Utilizando operações elementares, leve essa matriz à forma(

A B0 D

),

em que os blocos A e D são 2 × 2.

(ii) Utilizando o item anterior, calcule seu determinante.

�

�“IntAL” — 2009/10/20 — 20:02 — page 15 — #15 �

�

�

�

�

�

1.4. EXERCÍCIOS 15

1.4 Exercícios

1. Considere a matriz

A =

1 −2 12 −5 13 −7 2

.

Considere o sistema Ax = b, sendo b igual a

(a)

b1b2b3

; (b)

1−2−1

; (c)

2−1

2

; (d)

111

.

Encontre, em cada caso, todas as soluções do sistema Ax = b, se existirem. Em (a), imponhacondições sobre b para que a solução exista.

2. Considere o sistema cuja matriz aumentada é

0 0 3 −9∣∣ 6

5 15 −10 40∣∣ − 45

1 3 −1 5∣∣ − 7

.

Determine uma solução particular do sistema não homogêneo, bem como todas as soluçõesdo sistema homogêneo associado. Escreva sua resposta como no Exemplo 1.11.

3. Utilizando o procedimento do Exemplo 1.26, calcule o determinante das matrizes

(a)

1 2 21 1 20 1 2

; (b)

1 1 1 11 3 1 21 2 −1 15 9 1 6

; (c)

1 1 1 11 2 −1 21 −1 2 11 3 3 2

.


29

�

�“IntAL” — 2009/10/20 — 20:02 — page 14 — #14 �

�

�

�

�

�


Demonstração: Utilizando as operações elementares (a) e (c), transfor-mamos os blocos A e D em matrizes triangulares superiores. A operaçãoelementar (c) não altera o determinante de Q (nem o de A ou D), mas aoperação (a) inverte o sinal do determinante de Q. Mas, se ela for aplicadaem uma linha da matriz A (ou da matriz Q), ela também altera o sinal dodeterminante de A (e respectivamente, de D). Assim, suponhamos que aotransformar A e D em matrizes triangulares superiores tenhamos feito j ek trocas de linhas, respectivamente. Teremos

(−1)j(−1)k det Q =

(A′ B′

0 D′

),

em que A′ e D′ são matrizes triangulares superiores. Como a matriz Q étriangular superior, seu determinante é o produto de suas entradas diago-nais, de modo que

(−1)j(−1)k det Q = a′11 · · · a′mmd′11 · · · d′(n−m)(n−m)

= det A′ det D′,

em que a′11, . . . , a′mm são as entradas diagonais da matriz A′, enquantod′11, . . . , d′(n−m)(n−m) são as entradas diagonais de D′.

Mas det A = (−1)j det A′ e det D = (−1)k det D′, como vimos anterior-mente. Substituindo na igualdade anterior, obtemos

det Q = det A det D. �


1 1 1 11 2 1 13 1 1 13 2 1 2

.

(i) Utilizando operações elementares, leve essa matriz à forma(

A B0 D

),

em que os blocos A e D são 2 × 2.

(ii) Utilizando o item anterior, calcule seu determinante.

�

�“IntAL” — 2009/10/20 — 20:02 — page 15 — #15 �

�

�

�

�

�

1.4. EXERCÍCIOS 15

1.4 Exercícios


A =

1 −2 12 −5 13 −7 2

.

Considere o sistema Ax = b, sendo b igual a

(a)

b1b2b3

; (b)

1−2−1

; (c)

2−1

2

; (d)

111

.

Encontre, em cada caso, todas as soluções do sistema Ax = b, se existirem. Em (a), imponhacondições sobre b para que a solução exista.

2. Considere o sistema cuja matriz aumentada é

0 0 3 −9∣∣ 6

5 15 −10 40∣∣ − 45

1 3 −1 5∣∣ − 7

.

Determine uma solução particular do sistema não homogêneo, bem como todas as soluçõesdo sistema homogêneo associado. Escreva sua resposta como no Exemplo 1.11.

3. Utilizando o procedimento do Exemplo 1.26, calcule o determinante das matrizes

(a)

1 2 21 1 20 1 2

; (b)

1 1 1 11 3 1 21 2 −1 15 9 1 6

; (c)

1 1 1 11 2 −1 21 −1 2 11 3 3 2

.

1 .4 ExERCÍCIOS

aula 1


�

�“IntAL” — 2009/10/17 — 8:36 — page 17 — #17 �

�

�

�

�

�

Capítulo 2

O Espaço Rn

Objetivos:No final desta Aula o aluno deve saber:

1. obter a representação paramétrica do plano;

2. reconhecer a importância de “sistemas de coordenadas” em casossimples;

3. efetuar operações básicas no Rn.

2.1 Equação Paramétrica do Plano

Suponhamos que n = (a, b, c) não seja o vetor nulo. Como sabemos, umaequação

ax + by + cz = d

representa um plano com vetor normal n = (a, b, c). Se d �= 0, então oplano não passa pela origem (0, 0, 0) do sistema de coordenadas. Um ponto(x0, y0, z0) do espaço pertence ao plano se, e somente se, ax0 + by0 + cz0 =d.

Existe uma outra maneira de expressar a equação de um plano. Vejamosinicialmente em um exemplo:

Exemplo 2.1 Consideremos o plano π, de equação

x − 2y − 3z = 5.

Vamos proceder como no Exemplo 1.11. Para isso, levamos a forma ma-tricial do sistema (com uma equação!) à forma escalonada reduzida porlinhas e escrevemos as soluções do mesmo:

xyz

=

500

+ λ

210

+ µ

301

. (2.1)

17


AULA 2

O Espaço n

OBjETIvOSNo final desta aula, o aluno deverá ser capaz de:1. obter a representação paramétrica do plano;2. reconhecer a importância de "sistemas de coordenadas" em casos simples;3. efetuar operações básicas no n.

2 .1 EqUAÇÃO PARAMéTRICA DO PLANO

�

�“IntAL” — 2009/10/17 — 8:36 — page 17 — #17 �

�

�

�

�

�

Capítulo 2

O Espaço Rn

Objetivos:No final desta Aula o aluno deve saber:

1. obter a representação paramétrica do plano;

2. reconhecer a importância de “sistemas de coordenadas” em casossimples;

3. efetuar operações básicas no Rn.

2.1 Equação Paramétrica do Plano

Suponhamos que n = (a, b, c) não seja o vetor nulo. Como sabemos, umaequação

ax + by + cz = d

representa um plano com vetor normal n = (a, b, c). Se d �= 0, então oplano não passa pela origem (0, 0, 0) do sistema de coordenadas. Um ponto(x0, y0, z0) do espaço pertence ao plano se, e somente se, ax0 + by0 + cz0 =d.

Existe uma outra maneira de expressar a equação de um plano. Vejamosinicialmente em um exemplo:

Exemplo 2.1 Consideremos o plano π, de equação

x − 2y − 3z = 5.

Vamos proceder como no Exemplo 1.11. Para isso, levamos a forma ma-tricial do sistema (com uma equação!) à forma escalonada reduzida porlinhas e escrevemos as soluções do mesmo:

xyz

=

500

+ λ

210

+ µ

301

. (2.1)

17


32


�

�“IntAL” — 2009/10/17 — 8:36 — page 18 — #18 �

�

�

�

�

�

18 CAPÍTULO 2. O ESPAÇO RN

Interpretando como no Teorema 1.21, o primeiro termo do lado direito daequação é uma solução particular do sistema: verifique que (5, 0, 0) satis-faz a equação do plano. Os dois termos seguintes formam o conjunto desoluções do sistema homogêneo associado: x − 2y − 3z = 0.

Comecemos analisando esses dois termos, associados às variáveis livres λe µ. Denotaremos u = (2, 1, 0) e v = (3, 0, 1). Esses vetores determinam3 pontos: a origem, o ponto P1 = (2, 1, 0) e o ponto P2 = (3, 0, 1). Cla-ramente esses pontos não estão alinhados, de modo que determinam umplano – justamente o plano de equação x − 2y − 3z = 0. Os vetores u e vdeterminam eixos coordenados, de modo que a origem e esses eixos for-mam um sistema de coordenadas nesse plano. (Na figura a seguir, esse planoé representado pelo plano do papel deste livro.) Consideremos um pontoQ = (x, y, z) desse plano. Traçando retas paralelas aos eixos determinadospor u e v e obtendo as interseções dessas retas com os eixos coordenados,obtemos as coordenadas de Q nesse sistema de coordenadas.

Figura 2.1: 2.1

Figura 2.1: Os vetores u e v definem um sistema de coordenadas no plano por eles determi-nado

Acabamos de mostrar que todos os pontos daquele plano são descritospelos parâmetros λ e µ. Um ponto Q(x, y, z) só pertencerá ao plano x +2y + 3z = 0 se for possível encontrar valores para λ e µ de modo queλu + µv nos dê as coordenadas de Q.

Quer dizer, o vetor �q= (x, y, z) é combinação linear dos vetores �u e �v se, esomente se, o ponto Q = (x, y, z) pertencer ao plano x + 2y + 3z = 0.

Note bem: apesar de todos os pontos do plano x + 2y + 3z = 0 serempontos do espaço, conseguimos descrevê-los utilizando duas coordenadas:os valores de λ (que descreve a posição de um ponto do plano com respeitoao eixo gerado pelo vetor u) e µ (que descreve a posição de um ponto doplano com respeito ao eixo gerado pelo vetor v). A origem correspondeaos valores (λ, µ) = (0, 0). O valor (λ, µ) = (1, 0) corresponde ao pontoP1 = (2, 1, 0) do R3. E assim por diante.

Agora consideremos todos os termos do lado direito da igualdade (2.1).Como vimos, os dois últimos criam um plano passando pela origem; o pri-meiro translada esse plano, de modo que ele passe pelo pontoP0 = (5, 0, 0). Veja a Figura 2.2.

A equação (2.1) é chamada equação paramétrica do plano π. �

Você deve se convencer que o exemplo anterior pode ser repetidos paraqualquer plano ax + by + cz = d.

�

�“IntAL” — 2009/10/17 — 8:36 — page 19 — #19 �

�

�

�

�

�

2.2. SISTEMAS LINEARES EM 3 VARIÁVEIS 19

Figura 2.2: 2.2

Figura 2.2: O ponto P translada o plano determinado pelos vetores u e v; note a mudança denotação: aqui, �u e �v

Exercício 2.2 Considere o plano x − y − z = 1 e os vetores u = (1, 1, 0) e v = (1, 0, 1). Esboce osistema de coordenadas no plano x − y − z = 0 determinado pelos vetores u e v. Ache valorespara λ e µ de modo que (2, 1, 1) = λu + µv. Esboce o plano x − y − z = 1.

Exercício 2.3 Considere o plano π de equação ax + by + cz = d. (Isso quer dizer que (a, b, c) �=(0, 0, 0)!) Procedendo como no Exemplo 2.1, encontre vetores u e v e as equações paramétricas doplano π. Verifique que os vetores u e v encontrados são linearmente independentes.

2.2 Sistemas Lineares em 3 variáveis

Comecemos com um exemplo simples:

Exemplo 2.4 Consideremos o sistema

x + 2y + z = 3x + y + 3z = 1 (2.2)

Aplicando o método de Gauss-Jordan, chegamos à forma escalonada redu-zida por linhas

(1 2 1

∣∣ 31 1 3

∣∣ 1

)−→

(1 0 5

∣∣ − 10 1 −2

∣∣ 1

).

Portanto, a solução do sistema é

xyz

=

−110

+ z

−521

. (2.3)

�

�“IntAL” — 2009/10/17 — 8:36 — page 19 — #19 �

�

�

�

�

�


Figura 2.2: 2.2







x + 2y + z = 3x + y + 3z = 1 (2.2)


(1 2 1

∣∣ 31 1 3

∣∣ 1

)−→

(1 0 5

∣∣ − 10 1 −2

∣∣ 1

).


xyz

=

−110

+ z

−521

. (2.3)

0

Q

v

u


33

aula 2

�

�“IntAL” — 2009/10/17 — 8:36 — page 18 — #18 �

�

�

�

�

�


Interpretando como no Teorema 1.21, o primeiro termo do lado direito daequação é uma solução particular do sistema: verifique que (5, 0, 0) satis-faz a equação do plano. Os dois termos seguintes formam o conjunto desoluções do sistema homogêneo associado: x − 2y − 3z = 0.

Comecemos analisando esses dois termos, associados às variáveis livres λe µ. Denotaremos u = (2, 1, 0) e v = (3, 0, 1). Esses vetores determinam3 pontos: a origem, o ponto P1 = (2, 1, 0) e o ponto P2 = (3, 0, 1). Cla-ramente esses pontos não estão alinhados, de modo que determinam umplano – justamente o plano de equação x − 2y − 3z = 0. Os vetores u e vdeterminam eixos coordenados, de modo que a origem e esses eixos for-mam um sistema de coordenadas nesse plano. (Na figura a seguir, esse planoé representado pelo plano do papel deste livro.) Consideremos um pontoQ = (x, y, z) desse plano. Traçando retas paralelas aos eixos determinadospor u e v e obtendo as interseções dessas retas com os eixos coordenados,obtemos as coordenadas de Q nesse sistema de coordenadas.

Figura 2.1: 2.1

Figura 2.1: Os vetores u e v definem um sistema de coordenadas no plano por eles determi-nado

Acabamos de mostrar que todos os pontos daquele plano são descritospelos parâmetros λ e µ. Um ponto Q(x, y, z) só pertencerá ao plano x +2y + 3z = 0 se for possível encontrar valores para λ e µ de modo queλu + µv nos dê as coordenadas de Q.

Quer dizer, o vetor �q= (x, y, z) é combinação linear dos vetores �u e �v se, esomente se, o ponto Q = (x, y, z) pertencer ao plano x + 2y + 3z = 0.

Note bem: apesar de todos os pontos do plano x + 2y + 3z = 0 serempontos do espaço, conseguimos descrevê-los utilizando duas coordenadas:os valores de λ (que descreve a posição de um ponto do plano com respeitoao eixo gerado pelo vetor u) e µ (que descreve a posição de um ponto doplano com respeito ao eixo gerado pelo vetor v). A origem correspondeaos valores (λ, µ) = (0, 0). O valor (λ, µ) = (1, 0) corresponde ao pontoP1 = (2, 1, 0) do R3. E assim por diante.

Agora consideremos todos os termos do lado direito da igualdade (2.1).Como vimos, os dois últimos criam um plano passando pela origem; o pri-meiro translada esse plano, de modo que ele passe pelo pontoP0 = (5, 0, 0). Veja a Figura 2.2.

A equação (2.1) é chamada equação paramétrica do plano π. �

Você deve se convencer que o exemplo anterior pode ser repetidos paraqualquer plano ax + by + cz = d.

�

�“IntAL” — 2009/10/17 — 8:36 — page 19 — #19 �

�

�

�

�

�


Figura 2.2: 2.2







x + 2y + z = 3x + y + 3z = 1 (2.2)


(1 2 1

∣∣ 31 1 3

∣∣ 1

)−→

(1 0 5

∣∣ − 10 1 −2

∣∣ 1

).


xyz

=

−110

+ z

−521

. (2.3)

2 .2 SISTEMAS LINEARES EM TRêS vARIÁvEIS

�

�“IntAL” — 2009/10/17 — 8:36 — page 19 — #19 �

�

�

�

�

�


Figura 2.2: 2.2







x + 2y + z = 3x + y + 3z = 1 (2.2)


(1 2 1

∣∣ 31 1 3

∣∣ 1

)−→

(1 0 5

∣∣ − 10 1 −2

∣∣ 1

).


xyz

=

−110

+ z

−521

. (2.3)

P

Q

v

u

x

0


34


�

�“IntAL” — 2009/10/17 — 8:36 — page 20 — #20 �

�

�

�

�

�


A equação (2.3) nos dá a equação da reta, interseção dos planos dados.

Consideremos, por outro lado, o sistema homogêneo associado a (2.2). Suasolução é dada por

xyz

= z

−521

.

Essa solução estabelece um sistema de coordenadas na reta r(z) = z(−5, 2, 1).Para o valor z = 0, estamos na origem. Para z = 1, estamos no ponto(−5, 2, 1) e assim por diante. Assim, todos os pontos dessa reta são des-critos por apenas um valor do parâmetro z. Quer dizer, se estamos interes-sados apenas em pontos dessa reta, qualquer ponto (x, y, z) dela pode serrepresentado utilizando uma única coordenada: o valor de z. �

Em geral, ao procurarmos soluções de um sistema

a11x + a12y + a13z = b1

a21x + a22y + a23z = b2,

estamos verificando se esses dois planos1 são paralelos ou, caso contrário,determinando a reta formada pela interseção de ambos.

Expressando o sistema anterior em forma matricial, obtemos

(a11 a12 a13a21 a22 a23

)

xyz

=

(b1b2

).

Um ponto (x0, y0, z0) do espaço pertence à interseção dos planos (se essaexistir) se ele satisfizer a equação matricial

(a11 a12 a13a21 a22 a23

)

x0y0z0

=

(b1b2

). (2.4)

A forma matricial (2.4) tem muitos significados e consequências. Nesta se-ção abordaremos um deles, ao notar que em (2.4) o ponto (x0, y0, z0) apa-rece na forma de uma matriz coluna. Ou seja, se A for uma matriz m × 3(em que m é arbitrário), na equação matricial

Ax = b,

x representa um ponto do espaço:

(x0, y0, z0) ←→

x0y0z0

.

Ora, sistemas Ax = b acontecem com matrizes m × n arbitrárias. A inter-pretação

x1x2...

xn

←→ (x1, . . . , xn),

em que (x1, . . . , xn) designa um ponto genérico de um espaço abstrato(que denotaremos por Rn) nos permitirá, como veremos no decorrer deste

�

�“IntAL” — 2009/10/17 — 8:36 — page 21 — #21 �

�

�

�

�

�

2.3. O ESPAÇO RN 21

curso, interpretar geometricamente o sistema Ax = b, de maneira seme-lhante à que fizemos nos Exemplos 2.1 e 2.4.

Essa última frase parece muito pretensiosa: se n > 3, como interpretar geo-metricamente a solução de um sistema m × n, se não podemos vislumbraro espaço Rn? Bom, esse é um dos objetivos deste curso, de modo que nãopodemos justificar nossa pretensão neste momento; mas também não po-demos deixar de destacar a semelhança entre as equações (1.1), (2.1) e (2.3)!

2.3 O Espaço Rn

Definimos o conjunto Rn por

Rn = {x = (x1, x2, . . . , xn) : xi ∈ R} .

O número de coordenadas x1, . . . , xn dependerá do problema considerado.Os casos n = 2 e n = 3 correspondem a pontos do plano e do espaço,respectivamente. Ao mostrarmos que algum resultado é válido para o Rn,esse resultado será verdadeiro para qualquer valor de n = {1, 2, . . .}.

Se x e y são pontos do Rn e λ, um número real, definimos

x + y = (x1 + y1, . . . , xn + yn) (2.5)λx = (λx1, . . . , λxn). (2.6)

(Designamos por (y1, . . . , yn) as coordenadas de y ∈ Rn.)

Observe que essas definições estão de acordo com os resultados mostradosna seção 1.1.

Teorema 2.5 Se x, y, z ∈ Rn e λ, µ ∈ R, as seguintes propriedades sãosatisfeitas:

(i) x + y ∈ Rn (fechamento);

(ii) (x + y) + z = x + (y + z) (associatividade);

(iii) x + y = y + x (comutatividade);

(iv) existe 0 ∈ Rn tal que x + 0 = x (elemento neutro);

(v) existe (−x) ∈ Rn tal que x + (−x) = 0 (inverso aditivo);

(vi) λx ∈ Rn (fechamento);

(vii) µ(λx) = (µλ)x (associatividade);

(viii) λ(x + y) = λx + λy (distributividade);

(ix) (λ + µ)x = λx + µx (distributividade);

(x) 1x = x (regra da unidade).

�

�“IntAL” — 2009/10/17 — 8:36 — page 21 — #21 �

�

�

�

�

�




2.3 O Espaço Rn


Rn = {x = (x1, x2, . . . , xn) : xi ∈ R} .

















1 Estamos supondo que (a11 , a12 , a13) ≠ (0, 0, 0) e (a21 , a22 , a23) ≠ (0, 0, 0).


35

aula 2

�

�“IntAL” — 2009/10/17 — 8:36 — page 20 — #20 �

�

�

�

�

�


A equação (2.3) nos dá a equação da reta, interseção dos planos dados.

Consideremos, por outro lado, o sistema homogêneo associado a (2.2). Suasolução é dada por

xyz

= z

−521

.

Essa solução estabelece um sistema de coordenadas na reta r(z) = z(−5, 2, 1).Para o valor z = 0, estamos na origem. Para z = 1, estamos no ponto(−5, 2, 1) e assim por diante. Assim, todos os pontos dessa reta são des-critos por apenas um valor do parâmetro z. Quer dizer, se estamos interes-sados apenas em pontos dessa reta, qualquer ponto (x, y, z) dela pode serrepresentado utilizando uma única coordenada: o valor de z. �

Em geral, ao procurarmos soluções de um sistema

a11x + a12y + a13z = b1

a21x + a22y + a23z = b2,

estamos verificando se esses dois planos1 são paralelos ou, caso contrário,determinando a reta formada pela interseção de ambos.

Expressando o sistema anterior em forma matricial, obtemos

(a11 a12 a13a21 a22 a23

)

xyz

=

(b1b2

).

Um ponto (x0, y0, z0) do espaço pertence à interseção dos planos (se essaexistir) se ele satisfizer a equação matricial

(a11 a12 a13a21 a22 a23

)

x0y0z0

=

(b1b2

). (2.4)

A forma matricial (2.4) tem muitos significados e consequências. Nesta se-ção abordaremos um deles, ao notar que em (2.4) o ponto (x0, y0, z0) apa-rece na forma de uma matriz coluna. Ou seja, se A for uma matriz m × 3(em que m é arbitrário), na equação matricial

Ax = b,

x representa um ponto do espaço:

(x0, y0, z0) ←→

x0y0z0

.

Ora, sistemas Ax = b acontecem com matrizes m × n arbitrárias. A inter-pretação

x1x2...

xn

←→ (x1, . . . , xn),

em que (x1, . . . , xn) designa um ponto genérico de um espaço abstrato(que denotaremos por Rn) nos permitirá, como veremos no decorrer deste

�

�“IntAL” — 2009/10/17 — 8:36 — page 21 — #21 �

�

�

�

�

�




2.3 O Espaço Rn


Rn = {x = (x1, x2, . . . , xn) : xi ∈ R} .

















2 .3 O ESPAÇO n

�

�“IntAL” — 2009/10/17 — 8:36 — page 21 — #21 �

�

�

�

�

�




2.3 O Espaço Rn


Rn = {x = (x1, x2, . . . , xn) : xi ∈ R} .


















36


�

�“IntAL” — 2009/10/17 — 8:36 — page 22 — #22 �

�

�

�

�

�


Demonstração: Mostraremos apenas algumas dessas propriedades. Veja-mos a propriedade comutativa:

x + y = (x1 + y1, x2 + y2, . . . , xn + yn)

= (y1 + x1, y2 + x2, . . . , yn + yn) = y + x.

Note que a adição no Rn é feita adicionando cada coordenada; como emcada coordenada temos uma adição de números reais, que é comutativa,chegamos ao resultado desejado.

Vejamos a propriedade (viii):

λ(x + y) = λ(x1 + y1, . . . , xn + yn)

=(λ(x1 + y1), . . . , λ(xn + yn)

)

= (λx1 + λy1, . . . , λxn + λyn)

= (λx1, . . . + λxn) + (λy1, . . . , λyn)

= λx + λy.�

Observe que 0 tem, nessa definição, dois significados distintos: descrevetanto o vetor 0 = (0, 0, . . . , 0) ∈ Rn como o escalar 0 ∈ R.

Exercício 2.6 Mostre as demais propriedades do Teorema 2.5.

Exercício 2.7 Considere a igualdade 0x = 0 para todo x ∈ Rn. Interprete e prove essa igualdade.

Definição 2.8 Por satisfazer as propriedades (i) − (x), dizemos que Rn éum espaço vetorial. Os elementos de um espaço vetorial são chamadosvetores. Elementos λ ∈ R são chamados escalares. Se x, y ∈ Rn e λ ∈ R, asoma x + y é a soma dos vetores x e y, enquanto λx é a multiplicação doescalar λ pelo vetor x. Também chamamos um vetor x ∈ Rn de um pontodo Rn.

Sinteticamente, dizemos que Rn possui uma soma (de vetores) e uma mul-tiplicação por escalar. Utilizaremos corriqueiramente a identificação

(x1, . . . , xn) ∈ Rn ↔

x1x2...

xn

,

que permite compreender um ponto do Rn como uma matriz coluna e quefaz corresponder às operações entre matrizes colunas as operações defi-nidas no Rn. Podemos até mesmo levar mais adiante essa interpretação,identificando pontos do Rn com colunas de uma matriz!

Exemplo 2.9 Consideremos o sistema homogêneo representado matricial-mente por

A =

1 −1 0 10 3 −1 00 1 1 00 −1 0 0

.

�

�“IntAL” — 2009/10/17 — 8:36 — page 23 — #23 �

�

�

�

�

�

2.4. ESPAÇOS VETORIAIS ABSTRATOS 23

A cada vetor (x1, x2, x3, x4) ∈ R4 corresponde a matriz coluna

(x1, x2, x3, x4) ←→

x1x2x3x4

e cada coluna de A pode ser vista como um vetor do R4.

Levando a matriz A à forma escalonada reduzida por linhas, obtemos

1 0 0 10 1 0 00 0 1 00 0 0 0

,

de modo que sua solução é

x1x2x3x4

= x4

−1001

.

Quer dizer, as soluções do sistema são os múltiplos do vetor u = (−1, 0, 0, 1)∈ R4. Lembrando que a equação de uma reta passando pela origem no R3

é dada pelos múltiplos de um vetor fixo, não parece natural dizer que asolução desse sistema é uma reta (passando pela origem) no espaço R4?

Note: se estivermos interessados em vetores do R4 que pertencem a essareta, então cada vetor fica caracterizado por uma única coordenada! �

Exercício 2.10 Como feito nos Exemplos 2.1 e 2.4, indique o sistema de coordenadas estabelecidoao se obter a solução do Exemplo 2.9.

Exercício 2.11 Encontre as soluções do sistema

x1 + 2x2 + 3x3 + x4 = 8x1 + 3x2 + 0x3 + x4 = 7x1 + 0x2 + 2x3 + x4 = 3

Interprete geometricamente as soluções desse sistema.

2.4 Espaços Vetoriais Abstratos

Na seção anterior definimos Rn e mostramos que ele satisfaz as proprie-dades descritas no Teorema 2.5. Com base nessas propriedades, podemosdefinir abstratamente um espaço vetorial.

Definição 2.12 Um espaço vetorial real X é um conjunto cujos elementos(chamados vetores) podem ser somados e multiplicados por escalares, istoé, números reais.2 Se x, y, z ∈ X e λ, µ ∈ R, as seguintes propriedadesdevem ser satisfeitas pela adição e multiplicação por escalar:

�

�“IntAL” — 2009/10/17 — 8:36 — page 23 — #23 �

�

�

�

�

�



(x1, x2, x3, x4) ←→

x1x2x3x4



1 0 0 10 1 0 00 0 1 00 0 0 0

,


x1x2x3x4

= x4

−1001

.






x1 + 2x2 + 3x3 + x4 = 8x1 + 3x2 + 0x3 + x4 = 7x1 + 0x2 + 2x3 + x4 = 3






37

aula 2

�

�“IntAL” — 2009/10/17 — 8:36 — page 22 — #22 �

�

�

�

�

�


Demonstração: Mostraremos apenas algumas dessas propriedades. Veja-mos a propriedade comutativa:

x + y = (x1 + y1, x2 + y2, . . . , xn + yn)

= (y1 + x1, y2 + x2, . . . , yn + yn) = y + x.

Note que a adição no Rn é feita adicionando cada coordenada; como emcada coordenada temos uma adição de números reais, que é comutativa,chegamos ao resultado desejado.

Vejamos a propriedade (viii):

λ(x + y) = λ(x1 + y1, . . . , xn + yn)

=(λ(x1 + y1), . . . , λ(xn + yn)

)

= (λx1 + λy1, . . . , λxn + λyn)

= (λx1, . . . + λxn) + (λy1, . . . , λyn)

= λx + λy.�

Observe que 0 tem, nessa definição, dois significados distintos: descrevetanto o vetor 0 = (0, 0, . . . , 0) ∈ Rn como o escalar 0 ∈ R.

Exercício 2.6 Mostre as demais propriedades do Teorema 2.5.

Exercício 2.7 Considere a igualdade 0x = 0 para todo x ∈ Rn. Interprete e prove essa igualdade.

Definição 2.8 Por satisfazer as propriedades (i) − (x), dizemos que Rn éum espaço vetorial. Os elementos de um espaço vetorial são chamadosvetores. Elementos λ ∈ R são chamados escalares. Se x, y ∈ Rn e λ ∈ R, asoma x + y é a soma dos vetores x e y, enquanto λx é a multiplicação doescalar λ pelo vetor x. Também chamamos um vetor x ∈ Rn de um pontodo Rn.

Sinteticamente, dizemos que Rn possui uma soma (de vetores) e uma mul-tiplicação por escalar. Utilizaremos corriqueiramente a identificação

(x1, . . . , xn) ∈ Rn ↔

x1x2...

xn

,

que permite compreender um ponto do Rn como uma matriz coluna e quefaz corresponder às operações entre matrizes colunas as operações defi-nidas no Rn. Podemos até mesmo levar mais adiante essa interpretação,identificando pontos do Rn com colunas de uma matriz!

Exemplo 2.9 Consideremos o sistema homogêneo representado matricial-mente por

A =

1 −1 0 10 3 −1 00 1 1 00 −1 0 0

.

�

�“IntAL” — 2009/10/17 — 8:36 — page 23 — #23 �

�

�

�

�

�



(x1, x2, x3, x4) ←→

x1x2x3x4



1 0 0 10 1 0 00 0 1 00 0 0 0

,


x1x2x3x4

= x4

−1001

.






x1 + 2x2 + 3x3 + x4 = 8x1 + 3x2 + 0x3 + x4 = 7x1 + 0x2 + 2x3 + x4 = 3





2 .4 ESPAÇOS vETORIAIS ABSTRATOS

�

�“IntAL” — 2009/10/17 — 8:36 — page 23 — #23 �

�

�

�

�

�



(x1, x2, x3, x4) ←→

x1x2x3x4



1 0 0 10 1 0 00 0 1 00 0 0 0

,


x1x2x3x4

= x4

−1001

.






x1 + 2x2 + 3x3 + x4 = 8x1 + 3x2 + 0x3 + x4 = 7x1 + 0x2 + 2x3 + x4 = 3





2 Também podemos admitir números complexos, isto é, escalares λ ϵ C. Neste caso, temos um espaço vetorial complexo.


38


�

�“IntAL” — 2009/10/17 — 8:36 — page 24 — #24 �

�

�

�

�

�


(i) x + y ∈ X (fechamento);



(iv) existe 0 ∈ X tal que x + 0 = x (elemento neutro);

(v) existe (−x) ∈ X tal que x + (−x) = 0 (inverso aditivo);

(vi) λx ∈ X (fechamento);





Neste texto não daremos muita ênfase a espaços vetoriais abstratos. Masalguns exemplos são importantes:

Exemplo 2.13 Seja P = {a0 + a1t + . . . + antn} o conjunto de polinômiosem t com coeficientes reais e grau menor que ou igual a n. Com a adiçãousual de polinômios e a multiplicação de polinômio por um número real,P é um espaço vetorial. �

Exemplo 2.14 Seja Mm×n o conjunto de todas as matrizes m × n comentradas reais. Com a adição de matrizes e multiplicação de uma matrizpor um número λ ∈ R, Mm×n é um espaço vetorial. �

Exercício 2.15 Prove as afirmações dos Exemplos 2.13 e 2.14.

Observe que o significado das operações de adição e multiplicação foi dife-rente em cada exemplo. No caso de um espaço vetorial abstrato, nãosabemos como as operações de adição e multiplicação por escalar são reali-zadas; apenas sabemos que elas satisfazem as propriedades (i) − (x) daDefinição 2.12. Muitas vezes, para salientarmos esse fato, denotamos essasoperações como ⊕ e �, respectivamente. Assim, a propriedade (iii) podeser descrita por x ⊕ y = y ⊕ x, enquanto (vii), µ � (λ � x) = (µλ) � x.Note que µλ indica a operação usual de multiplicação de números reais.

O significado abstrato das operações de adição de vetores e multiplicaçãode vetor por escalar torna difícil a verificação de algumas propriedades quesão óbvias no caso do Rn. Temos, por exemplo:

Proposição 2.16 Existe um único elemento neutro em um espaço vetorial. Querdizer, se x + 0 = x = x + 0′ para todo x ∈ X, então 0 = 0′.

Demonstração: Como 0 ∈ X, escolhendo x = 0 na igualdade x + 0′ = x,concluímos que 0 + 0′ = 0. Por outro lado, escolhendo x = 0′ ∈ X naigualdade x + 0 = x, concluímos 0′ + 0 = 0′. Como a adição de vetores écomutativa, temos 0 = 0 + 0′ = 0′, mostrando que 0 = 0′. �

Observe que não podemos falar em coordenadas de um vetor do espaço X!Quer dizer, não existe nenhuma expressão análoga a 0 = (0, . . . , 0) ∈ Rn.

�

�“IntAL” — 2009/10/17 — 8:36 — page 25 — #25 �

�

�

�

�

�


Exercício 2.17 Mostre que, em um espaço vetorial X, vale a lei do cancelamento: se x + a = x + b,então a = b. Conclua, então, que o elemento inverso aditivo (−x) de um elemento x ∈ X é único.

Observação 2.18 Comparando as seções 2.3 e 2.4 com a seção 1.1, não po-demos ignorar uma diferença: na seção 1.1 foi utilizado o conceito de normade um vetor, conceito esse que não foi definido no espaço Rn ou em espaçosvetoriais abstratos. Também não foi definido o produto escalar de dois veto-res. Isso aconteceu por uma razão muito simples: este curso trata apenasdas propriedades algébricas de espaços vetoriais; propriedades topológicas,isto é, propriedades relacionadas com os conceitos de distância e ortogonali-dade serão tratadas no curso de Álgebra Linear II. �


39

aula 2

�

�“IntAL” — 2009/10/17 — 8:36 — page 24 — #24 �

�

�

�

�

�


(i) x + y ∈ X (fechamento);



(iv) existe 0 ∈ X tal que x + 0 = x (elemento neutro);

(v) existe (−x) ∈ X tal que x + (−x) = 0 (inverso aditivo);

(vi) λx ∈ X (fechamento);





Neste texto não daremos muita ênfase a espaços vetoriais abstratos. Masalguns exemplos são importantes:

Exemplo 2.13 Seja P = {a0 + a1t + . . . + antn} o conjunto de polinômiosem t com coeficientes reais e grau menor que ou igual a n. Com a adiçãousual de polinômios e a multiplicação de polinômio por um número real,P é um espaço vetorial. �

Exemplo 2.14 Seja Mm×n o conjunto de todas as matrizes m × n comentradas reais. Com a adição de matrizes e multiplicação de uma matrizpor um número λ ∈ R, Mm×n é um espaço vetorial. �

Exercício 2.15 Prove as afirmações dos Exemplos 2.13 e 2.14.

Observe que o significado das operações de adição e multiplicação foi dife-rente em cada exemplo. No caso de um espaço vetorial abstrato, nãosabemos como as operações de adição e multiplicação por escalar são reali-zadas; apenas sabemos que elas satisfazem as propriedades (i) − (x) daDefinição 2.12. Muitas vezes, para salientarmos esse fato, denotamos essasoperações como ⊕ e �, respectivamente. Assim, a propriedade (iii) podeser descrita por x ⊕ y = y ⊕ x, enquanto (vii), µ � (λ � x) = (µλ) � x.Note que µλ indica a operação usual de multiplicação de números reais.

O significado abstrato das operações de adição de vetores e multiplicaçãode vetor por escalar torna difícil a verificação de algumas propriedades quesão óbvias no caso do Rn. Temos, por exemplo:

Proposição 2.16 Existe um único elemento neutro em um espaço vetorial. Querdizer, se x + 0 = x = x + 0′ para todo x ∈ X, então 0 = 0′.

Demonstração: Como 0 ∈ X, escolhendo x = 0 na igualdade x + 0′ = x,concluímos que 0 + 0′ = 0. Por outro lado, escolhendo x = 0′ ∈ X naigualdade x + 0 = x, concluímos 0′ + 0 = 0′. Como a adição de vetores écomutativa, temos 0 = 0 + 0′ = 0′, mostrando que 0 = 0′. �

Observe que não podemos falar em coordenadas de um vetor do espaço X!Quer dizer, não existe nenhuma expressão análoga a 0 = (0, . . . , 0) ∈ Rn.

�

�“IntAL” — 2009/10/17 — 8:36 — page 25 — #25 �

�

�

�

�

�


Exercício 2.17 Mostre que, em um espaço vetorial X, vale a lei do cancelamento: se x + a = x + b,então a = b. Conclua, então, que o elemento inverso aditivo (−x) de um elemento x ∈ X é único.

Observação 2.18 Comparando as seções 2.3 e 2.4 com a seção 1.1, não po-demos ignorar uma diferença: na seção 1.1 foi utilizado o conceito de normade um vetor, conceito esse que não foi definido no espaço Rn ou em espaçosvetoriais abstratos. Também não foi definido o produto escalar de dois veto-res. Isso aconteceu por uma razão muito simples: este curso trata apenasdas propriedades algébricas de espaços vetoriais; propriedades topológicas,isto é, propriedades relacionadas com os conceitos de distância e ortogonali-dade serão tratadas no curso de Álgebra Linear II. �


40


�

�“IntAL” — 2009/10/17 — 8:36 — page 26 — #26 �

�

�

�

�

�


2.5 Exercícios

1. Em cada caso, encontre a equação paramétrica do plano

(a) x + 2y + z = 3; (b) x − y + 2z = 5; (c) x + y + z = 1.

2. Encontre as soluções do sistema

(a){

x + y + z = 7x − y + 2z = 2; (b)

{x − 5y + 3z = 0

2x + y − z = 1.

3. Resolva o sistema homogêneo Ax = 0, a matriz A sendo dada por

(a)

1 0 0 0 60 1 0 0 30 0 1 1 2

; (b)

1 7 0 0 −8 −30 0 1 0 6 50 0 0 1 3 90 0 0 0 0 0

.

Em cada caso, interprete geometricamente a solução obtida.

4. Seja P o conjunto de todos os polinômios com coeficientes reais (com todos os graus possí-veis). Mostre que P é um espaço vetorial com a adição de polinômios e a multiplicação deum polinômio por um escalar definidos da maneira usual.

2 .5 ExERCÍCIOS

�

�“IntAL” — 2009/10/19 — 21:44 — page 27 — #27 �

�

�

�

�

�

Capítulo 3

Subespaços do Rn e Bases

Objetivos: No final do Capítulo o aluno deve saber:

1. verificar se um subconjunto é um subespaço;

2. verificar se um conjunto é linearmente independente;

3. verificar que um conjunto é uma base de um subespaço;

4. operar com o conceito de dimensão de um subespaço.

3.1 Subespaços e Combinações Lineares

Definição 3.1 Seja S um subconjunto qualquer do Rn. Dizemos que S é umsubespaço do Rn se, para quaisquer x, y ∈ S e, para qualquer λ ∈ R, temos

(i) x + y ∈ S;(ii) λx ∈ S.

Uma vez que 0x = 0 para qualquer x ∈ Rn, vemos que 0 ∈ Rn é umelemento de qualquer subespaço do Rn.

Exemplo 3.2 Considere o subconjunto S = {0} ⊂ Rn. Então, S é um subes-paço de Rn, pois 0 + 0 = 0 ∈ S e λ0 = 0 ∈ S, para todo λ ∈ R. Consideretambém o subconjunto S′ = Rn. Claramente S′ é um subespaço do Rn. Ossubespaços S e S′ são chamados subespaços triviais do Rn. �

Exemplo 3.3 Seja 0 �= v ∈ Rn um vetor fixo e Y = {tv : t ∈ R}. (Nocaso de n = 2 ou n = 3, sabemos que Y descreve uma reta passandopela origem.) Então Y é um subespaço de Rn. De fato, se y1, y2 ∈ Y, entãoy1 = t1v e y2 = t2v, para certos escalares t1, t2. Logo, y1 + y2 = t1v +t2v = (t1 + t2)v é um elemento de Y. Também, se λ ∈ R, então λy1 =λ(t1v) = (λt1)v ∈ Y. Isso mostra o afirmado. Imitando os casos n = 2 en = 3, dizemos que Y descreve uma reta passando pela origem no espaçoRn. Note que o vetor v gera um sistema de coordenadas em que os pontosda reta Y são descritos por um único parâmetro: o valor do número real t.Compare com o Exemplo 2.4. �

27


AULA

�

�“IntAL” — 2009/10/17 — 8:36 — page 26 — #26 �

�

�

�

�

�


2.5 Exercícios

1. Em cada caso, encontre a equação paramétrica do plano

(a) x + 2y + z = 3; (b) x − y + 2z = 5; (c) x + y + z = 1.

2. Encontre as soluções do sistema

(a){

x + y + z = 7x − y + 2z = 2; (b)

{x − 5y + 3z = 0

2x + y − z = 1.

3. Resolva o sistema homogêneo Ax = 0, a matriz A sendo dada por

(a)

1 0 0 0 60 1 0 0 30 0 1 1 2

; (b)

1 7 0 0 −8 −30 0 1 0 6 50 0 0 1 3 90 0 0 0 0 0

.

Em cada caso, interprete geometricamente a solução obtida.

4. Seja P o conjunto de todos os polinômios com coeficientes reais (com todos os graus possí-veis). Mostre que P é um espaço vetorial com a adição de polinômios e a multiplicação deum polinômio por um escalar definidos da maneira usual.

3

Subespaços do n e Bases

OBjETIvOSNo final desta aula, o aluno deverá ser capaz de:1. verificar se um subconjunto é um subespaço;2. verificar se um conjunto é linearmente independente;3. verificar que um conjunto é uma base de um subespaço;4. operar com o conceito de dimensão de um subespaço.

3 .1 SUBESPAÇOS E COMBINAÇõES LINEARES

�

�“IntAL” — 2009/10/19 — 21:44 — page 27 — #27 �

�

�

�

�

�

Capítulo 3

Subespaços do Rn e Bases


1. verificar se um subconjunto é um subespaço;

2. verificar se um conjunto é linearmente independente;

3. verificar que um conjunto é uma base de um subespaço;

4. operar com o conceito de dimensão de um subespaço.

3.1 Subespaços e Combinações Lineares

Definição 3.1 Seja S um subconjunto qualquer do Rn. Dizemos que S é umsubespaço do Rn se, para quaisquer x, y ∈ S e, para qualquer λ ∈ R, temos

(i) x + y ∈ S;(ii) λx ∈ S.

Uma vez que 0x = 0 para qualquer x ∈ Rn, vemos que 0 ∈ Rn é umelemento de qualquer subespaço do Rn.

Exemplo 3.2 Considere o subconjunto S = {0} ⊂ Rn. Então, S é um subes-paço de Rn, pois 0 + 0 = 0 ∈ S e λ0 = 0 ∈ S, para todo λ ∈ R. Consideretambém o subconjunto S′ = Rn. Claramente S′ é um subespaço do Rn. Ossubespaços S e S′ são chamados subespaços triviais do Rn. �

Exemplo 3.3 Seja 0 �= v ∈ Rn um vetor fixo e Y = {tv : t ∈ R}. (Nocaso de n = 2 ou n = 3, sabemos que Y descreve uma reta passandopela origem.) Então Y é um subespaço de Rn. De fato, se y1, y2 ∈ Y, entãoy1 = t1v e y2 = t2v, para certos escalares t1, t2. Logo, y1 + y2 = t1v +t2v = (t1 + t2)v é um elemento de Y. Também, se λ ∈ R, então λy1 =λ(t1v) = (λt1)v ∈ Y. Isso mostra o afirmado. Imitando os casos n = 2 en = 3, dizemos que Y descreve uma reta passando pela origem no espaçoRn. Note que o vetor v gera um sistema de coordenadas em que os pontosda reta Y são descritos por um único parâmetro: o valor do número real t.Compare com o Exemplo 2.4. �

27


42


�

�“IntAL” — 2009/10/19 — 21:44 — page 28 — #28 �

�

�

�

�

�

28 CAPÍTULO 3. SUBESPAÇOS DO RN E BASES

Exercício 3.4 Sejam u, v vetores do Rn e Z = {αu + βv : α, β ∈ R}. Mostre que Z é um subespaçodo Rn. Agora suponha que u e v não sejam colineares, quer dizer, um não é múltiplo do outro.Justifique a denominação: Z é um plano passando pela origem no Rn. Verifique que os vetores u, vgeram um sistema de coordenadas em que os pontos do plano Z são descritos por dois parâmetros:α e β. (Compare com o Exemplo 2.1.)

Observação 3.5 No Exercício 3.4, você pode achar estranha a exigência dosvetores u, v não serem colineares. Ora, caso contrário, teríamos u = µv, porexemplo. Mas então

Z = {αµv + βv} = {(αµ + β)v}

descreve o conjunto dos múltiplos escalares do vetor v. De acordo com oExemplo 3.3, esse conjunto é uma reta no Rn e todos os elementos desseconjunto são múltiplos de v. �

Exercício 3.6 A afirmação “R2 não é um subespaço do R3” é verdadeira. Discuta essa afirmação.

Exercício 3.7 Seja S um subconjunto do Rn. Mostre que S é um subespaço se, e somente se, λx +y ∈ S para quaisquer x, y ∈ S e λ ∈ R.

Exercício 3.8 Seja X um subespaço do Rn. Mostre que X satisfaz todas as propriedades da Defini-ção 2.12 sendo, portanto, um espaço vetorial.

O exercício anterior garante assim que, com as operações de adição e mul-tiplicação por escalar restritas aos elementos de um subespaço S ⊂ Rn,esse conjunto é um espaço vetorial.

No próximo resultado identificamos qualquer solução x de Ax = 0 comum ponto do Rn:

Proposição 3.9 Seja A uma matriz m × n. Então, o núcleo de A,

ker A = {x ∈ Rn : Ax = 0}

é um subespaço do Rn.

Demonstração: Sejam x1, x2 ∈ ker A. Então Ax1 = 0 e Ax2 = 0, de modoque A(x1 + x2) = Ax1 + Ax2 = 0 + 0 = 0. Similarmente, se λ ∈ R, entãoA(λx1) = λAx1 = λ0 = 0. �

Examine novamente os Exemplos 1.11, 2.1 e 2.4, passando sempre ao sis-tema homogêneo associado. Em todos eles encontramos subespaços do Rn

(em que o valor de n depende do exemplo).

Exercício 3.10 Se b �= 0, então as soluções do sistema Ax = b não formam um subespaço do Rn.

Seja S um subespaço do Rn. Nosso objetivo nesta Aula pode ser descritocomo a introdução de um sistema (linear) de coordenadas em S, demaneira semelhante ao que foi feito no Exemplo 3.3 e no Exercício 3.4. Masnosso caminho até alcançar esse objetivo ainda é longo...

�

�“IntAL” — 2009/10/19 — 21:44 — page 29 — #29 �

�

�

�

�

�

3.1. SUBESPAÇOS E COMBINAÇÕES LINEARES 29

Em primeiro lugar, precisamos definir o que é um sistema de coordenadas(linear) ou, como os matemáticos preferem denominar, uma base. Esse con-ceito depende, em certa extensão, do problema considerado: no caso deum plano, um sistema de coordenadas utiliza dois eixos coordenados; noespaço, usa três eixos. Dizer que uma base é um sistema de eixos coorde-nados parece bom, mas preferimos usar, provisoriamente, uma linguagemmais pictórica, por acreditarmos ser ela mais elucidativa. Assim, definimosprovisoriamente uma base como um conjunto B de vetores, satisfazendo:

(i) os elementos de B fazem parte do problema considerado;

(ii) o conjunto B contém todas as informações relevantes para o pro-blema considerado;

(iii) o conjunto B não contém informações supérfluas.

No Exemplo 3.3, uma base seria constituída por um único vetor: o vetorv. Qualquer ponto da reta pode ser descrito utilizando apenas uma coor-denada, de modo a obter-se o múltiplo adequado do vetor v. No Exercício3.4, se fosse u = µv, então o vetor u seria supérfluo: todos os elementos doconjunto seriam múltiplos do vetor v e estaríamos na situação do Exemplo3.3. Se u e v não forem colineares, uma base é constituída pelos vetores ue v. Qualquer ponto do plano é descrito por duas coordenadas (os valoresde α e β) e, para se obter todos os pontos do plano, não podemos usar umnúmero menor de coordenadas.

Existem várias questões que precisam ser tratadas para chegarmos ao con-ceito de base. É claro, precisamos dizer o que significa um conjunto tertodas as informações relevantes (para o problema considerado) e não terinformações supérfluas. Definidos esses conceitos, várias questões práti-cas passam a ser pertinentes: como obter um conjunto que possui todas asinformações relevantes sobre o problema considerado? Como verificar seesse conjunto possui informações supérfluas? Como retirar do conjunto asinformações supérfluas? Essas perguntas serão tratadas nesta Aula.

Começamos generalizando a construção feita no Exemplo 3.3 e no Exercí-cio 3.4, agora utilizando qualquer número de vetores no Rn:

Proposição 3.11 Sejam v1, v2, . . . , vk vetores quaisquer do Rn. Então,

< v1, v2, . . . , vk > = {α1v1 + . . . + αkvk : α1, . . . , αk ∈ R}

é um subespaço do Rn, chamado subespaço gerado pelos vetores v1, . . . , vk.

Demonstração: Sejam x, y ∈ < v1, . . . , vk >. Então, existem escalaresα1, . . . , αk e β1, . . . , βk tais que

x = α1v1 + . . . + αkvk e y = β1v1 + . . . + βkvk.

Consequentemente,

x + y = (α1 + β1)v1 + . . . + (αk + βk)vk

eλx = (λα1)v1 + . . . + (λαk)vk

são elementos de < v1, . . . , vk >, provando o afirmado. �


43

aula 3

�

�“IntAL” — 2009/10/19 — 21:44 — page 28 — #28 �

�

�

�

�

�


Exercício 3.4 Sejam u, v vetores do Rn e Z = {αu + βv : α, β ∈ R}. Mostre que Z é um subespaçodo Rn. Agora suponha que u e v não sejam colineares, quer dizer, um não é múltiplo do outro.Justifique a denominação: Z é um plano passando pela origem no Rn. Verifique que os vetores u, vgeram um sistema de coordenadas em que os pontos do plano Z são descritos por dois parâmetros:α e β. (Compare com o Exemplo 2.1.)

Observação 3.5 No Exercício 3.4, você pode achar estranha a exigência dosvetores u, v não serem colineares. Ora, caso contrário, teríamos u = µv, porexemplo. Mas então

Z = {αµv + βv} = {(αµ + β)v}

descreve o conjunto dos múltiplos escalares do vetor v. De acordo com oExemplo 3.3, esse conjunto é uma reta no Rn e todos os elementos desseconjunto são múltiplos de v. �

Exercício 3.6 A afirmação “R2 não é um subespaço do R3” é verdadeira. Discuta essa afirmação.

Exercício 3.7 Seja S um subconjunto do Rn. Mostre que S é um subespaço se, e somente se, λx +y ∈ S para quaisquer x, y ∈ S e λ ∈ R.

Exercício 3.8 Seja X um subespaço do Rn. Mostre que X satisfaz todas as propriedades da Defini-ção 2.12 sendo, portanto, um espaço vetorial.

O exercício anterior garante assim que, com as operações de adição e mul-tiplicação por escalar restritas aos elementos de um subespaço S ⊂ Rn,esse conjunto é um espaço vetorial.

No próximo resultado identificamos qualquer solução x de Ax = 0 comum ponto do Rn:

Proposição 3.9 Seja A uma matriz m × n. Então, o núcleo de A,

ker A = {x ∈ Rn : Ax = 0}

é um subespaço do Rn.

Demonstração: Sejam x1, x2 ∈ ker A. Então Ax1 = 0 e Ax2 = 0, de modoque A(x1 + x2) = Ax1 + Ax2 = 0 + 0 = 0. Similarmente, se λ ∈ R, entãoA(λx1) = λAx1 = λ0 = 0. �

Examine novamente os Exemplos 1.11, 2.1 e 2.4, passando sempre ao sis-tema homogêneo associado. Em todos eles encontramos subespaços do Rn

(em que o valor de n depende do exemplo).

Exercício 3.10 Se b �= 0, então as soluções do sistema Ax = b não formam um subespaço do Rn.

Seja S um subespaço do Rn. Nosso objetivo nesta Aula pode ser descritocomo a introdução de um sistema (linear) de coordenadas em S, demaneira semelhante ao que foi feito no Exemplo 3.3 e no Exercício 3.4. Masnosso caminho até alcançar esse objetivo ainda é longo...

�

�“IntAL” — 2009/10/19 — 21:44 — page 29 — #29 �

�

�

�

�

�


Em primeiro lugar, precisamos definir o que é um sistema de coordenadas(linear) ou, como os matemáticos preferem denominar, uma base. Esse con-ceito depende, em certa extensão, do problema considerado: no caso deum plano, um sistema de coordenadas utiliza dois eixos coordenados; noespaço, usa três eixos. Dizer que uma base é um sistema de eixos coorde-nados parece bom, mas preferimos usar, provisoriamente, uma linguagemmais pictórica, por acreditarmos ser ela mais elucidativa. Assim, definimosprovisoriamente uma base como um conjunto B de vetores, satisfazendo:

(i) os elementos de B fazem parte do problema considerado;

(ii) o conjunto B contém todas as informações relevantes para o pro-blema considerado;

(iii) o conjunto B não contém informações supérfluas.

No Exemplo 3.3, uma base seria constituída por um único vetor: o vetorv. Qualquer ponto da reta pode ser descrito utilizando apenas uma coor-denada, de modo a obter-se o múltiplo adequado do vetor v. No Exercício3.4, se fosse u = µv, então o vetor u seria supérfluo: todos os elementos doconjunto seriam múltiplos do vetor v e estaríamos na situação do Exemplo3.3. Se u e v não forem colineares, uma base é constituída pelos vetores ue v. Qualquer ponto do plano é descrito por duas coordenadas (os valoresde α e β) e, para se obter todos os pontos do plano, não podemos usar umnúmero menor de coordenadas.

Existem várias questões que precisam ser tratadas para chegarmos ao con-ceito de base. É claro, precisamos dizer o que significa um conjunto tertodas as informações relevantes (para o problema considerado) e não terinformações supérfluas. Definidos esses conceitos, várias questões práti-cas passam a ser pertinentes: como obter um conjunto que possui todas asinformações relevantes sobre o problema considerado? Como verificar seesse conjunto possui informações supérfluas? Como retirar do conjunto asinformações supérfluas? Essas perguntas serão tratadas nesta Aula.

Começamos generalizando a construção feita no Exemplo 3.3 e no Exercí-cio 3.4, agora utilizando qualquer número de vetores no Rn:

Proposição 3.11 Sejam v1, v2, . . . , vk vetores quaisquer do Rn. Então,

< v1, v2, . . . , vk > = {α1v1 + . . . + αkvk : α1, . . . , αk ∈ R}

é um subespaço do Rn, chamado subespaço gerado pelos vetores v1, . . . , vk.

Demonstração: Sejam x, y ∈ < v1, . . . , vk >. Então, existem escalaresα1, . . . , αk e β1, . . . , βk tais que

x = α1v1 + . . . + αkvk e y = β1v1 + . . . + βkvk.

Consequentemente,

x + y = (α1 + β1)v1 + . . . + (αk + βk)vk

eλx = (λα1)v1 + . . . + (λαk)vk

são elementos de < v1, . . . , vk >, provando o afirmado. �


44


�

�“IntAL” — 2009/10/19 — 21:44 — page 30 — #30 �

�

�

�

�

�


Exemplo 3.12 Sejam v1 = (1, 2, 1, 1), v2 = (2, 1, 1, 1), v3 = (1, 1, 1, 1), v4 =(0, 1, 0, 1) e v5 = (0, 0, 1, 0) vetores do espaço R4. Vamos descrever o espaço< v1, . . . , v5 >.

Temos, por definição,

< v1, . . . , v5 > = {αv1 + βv2 + γv3 + δv4 + εv5},

em que α, β, γ, δ e ε são escalares. Assim, 0.5cm - 4cm

< v1, . . . , v5 > = {(α, 2α, α, α) + (2β, β, β, β) + (γ, γ, γ, γ) + (0, δ, 0, δ)

+(0, 0, ε, 0)}= {(α + 2β + γ, 2α + β + γ + δ, α + β + γ + ε, α + β

+γ + δ)}.

Em particular, se α = 1, β = 0, γ = 0, δ = 1 e ε = 2, temos que o vetor(1, 3, 3, 2) pertence a < v1, . . . , v5 >. �

Não podemos denominar o espaço < v1, . . . , vk > de acordo com o númerode elementos k utilizados na definição desse espaço. Por exemplo, se k = 2,< v1, v2 > pode não ser um plano, como vimos na Observação 3.5.

Exercício 3.13 Sejam v1 = (1, 0, 0), v2 = (0, 1, 0) e v3 = (1, 1, 0). Descreva o subespaço < v1, v2, v3 >.

Definição 3.14 Um vetor v é combinação linear dos vetores v1, . . . , vk seexistem escalares α1, . . . , αk tais que

α1v1 + . . . + αkvk = v. (3.1)

Quer dizer, v ∈< v1, . . . , vk > é o mesmo que v ser combinação linear dosvetores v1, . . . , vk.

Figura 3.1: 3.1

Figura 3.1: Se representarmos o subespaço < v1, . . . , vk >⊂ Rn como um plano, então v ∈ <

v1, . . . , vk >, enquanto w �∈ < v1, . . . , vk >

A equação vetorial (3.1) dá origem a um sistema não homogêneo, se v �= 0.É o que veremos no próximo exemplo.

Exemplo 3.15 O vetor (5, 2, 3,−1) é combinação linear dos vetores v1, . . . , v5do Exemplo 3.12? Essa pergunta terá uma resposta afirmativa se existiremescalares α, β, γ, δ e ε tais que

�

�“IntAL” — 2009/10/19 — 21:44 — page 31 — #31 �

�

�

�

�

�


α(1, 2, 1, 1)+ β(2, 1, 1, 1)+γ(1, 1, 1, 1)+ δ(0, 1, 0, 1)+ ε(0, 0, 1, 0) = (5, 2, 3,−1)

ou seja, se

(α + 2β + γ, 2α + β + γ + δ, α + β + γ + ε, α + β + γ + δ) = (5, 2, 3,−1).

A última igualdade dá origem ao sistema não homogêneo

1 2 1 0 02 1 1 1 01 1 1 0 11 1 1 1 0

αβγδε

=

523

−1

.

Note que a matriz é formada tendo justamente os vetores v1, . . . , v5 comocolunas. Escalonando a matriz aumentada do sistema, obtemos

1 2 1 0 0∣∣ 5

2 1 1 1 0∣∣ 2

1 1 1 0 1∣∣ 3

1 1 1 1 0∣∣ − 1

−→

1 0 0 0 0∣∣ 11

0 1 0 0 −1∣∣ 2

0 0 1 0 2∣∣ − 10

0 0 0 1 −1∣∣ − 4

.

Assim, sua solução é dada por

αβγδε

=

112 + ε

−10 − 2ε−4 + ε

ε

=

112

−10−4

0

+ ε

01

−211

.

Como o sistema tem solução, vemos que o vetor v = (5, 2, 3,−1) pertenceao espaço < v1, v2, v3, v4, v5 >. �

Exercício 3.16 Sejam

v1 = (2, 3, 1, 1), v2 = (−2,−2, 2, 1), e v3 = (1, 0,−2,−1).

O vetor v = (1, 1, 1, 1) pertence a < v1, v2, v3 >?

Agora estamos em condições de dizer quando um conjunto B contém todasas informações relevantes sobre o subespaço S.

Definição 3.17 Um conjunto B = {v1, . . . , vk} ⊂ S é um conjunto geradordo subespaço S ⊂ Rn se todo elemento de S for combinação linear doselementos de B. Também dizemos que B gera S.

Assim, se o problema que estivermos considerando tratar do subespaço S,estamos garantindo que B tem todas as informações relevantes sobre S.Note que B possui um número finito de elementos; se S �= {0}, então Spossui infinitos elementos.

w

v

v1, , vk


45

aula 3

�

�“IntAL” — 2009/10/19 — 21:44 — page 30 — #30 �

�

�

�

�

�


Exemplo 3.12 Sejam v1 = (1, 2, 1, 1), v2 = (2, 1, 1, 1), v3 = (1, 1, 1, 1), v4 =(0, 1, 0, 1) e v5 = (0, 0, 1, 0) vetores do espaço R4. Vamos descrever o espaço< v1, . . . , v5 >.

Temos, por definição,

< v1, . . . , v5 > = {αv1 + βv2 + γv3 + δv4 + εv5},

em que α, β, γ, δ e ε são escalares. Assim, 0.5cm - 4cm

< v1, . . . , v5 > = {(α, 2α, α, α) + (2β, β, β, β) + (γ, γ, γ, γ) + (0, δ, 0, δ)

+(0, 0, ε, 0)}= {(α + 2β + γ, 2α + β + γ + δ, α + β + γ + ε, α + β

+γ + δ)}.

Em particular, se α = 1, β = 0, γ = 0, δ = 1 e ε = 2, temos que o vetor(1, 3, 3, 2) pertence a < v1, . . . , v5 >. �

Não podemos denominar o espaço < v1, . . . , vk > de acordo com o númerode elementos k utilizados na definição desse espaço. Por exemplo, se k = 2,< v1, v2 > pode não ser um plano, como vimos na Observação 3.5.

Exercício 3.13 Sejam v1 = (1, 0, 0), v2 = (0, 1, 0) e v3 = (1, 1, 0). Descreva o subespaço < v1, v2, v3 >.

Definição 3.14 Um vetor v é combinação linear dos vetores v1, . . . , vk seexistem escalares α1, . . . , αk tais que

α1v1 + . . . + αkvk = v. (3.1)

Quer dizer, v ∈< v1, . . . , vk > é o mesmo que v ser combinação linear dosvetores v1, . . . , vk.

Figura 3.1: 3.1

Figura 3.1: Se representarmos o subespaço < v1, . . . , vk >⊂ Rn como um plano, então v ∈ <

v1, . . . , vk >, enquanto w �∈ < v1, . . . , vk >

A equação vetorial (3.1) dá origem a um sistema não homogêneo, se v �= 0.É o que veremos no próximo exemplo.

Exemplo 3.15 O vetor (5, 2, 3,−1) é combinação linear dos vetores v1, . . . , v5do Exemplo 3.12? Essa pergunta terá uma resposta afirmativa se existiremescalares α, β, γ, δ e ε tais que

�

�“IntAL” — 2009/10/19 — 21:44 — page 31 — #31 �

�

�

�

�

�


α(1, 2, 1, 1)+ β(2, 1, 1, 1)+γ(1, 1, 1, 1)+ δ(0, 1, 0, 1)+ ε(0, 0, 1, 0) = (5, 2, 3,−1)

ou seja, se

(α + 2β + γ, 2α + β + γ + δ, α + β + γ + ε, α + β + γ + δ) = (5, 2, 3,−1).

A última igualdade dá origem ao sistema não homogêneo

1 2 1 0 02 1 1 1 01 1 1 0 11 1 1 1 0

αβγδε

=

523

−1

.

Note que a matriz é formada tendo justamente os vetores v1, . . . , v5 comocolunas. Escalonando a matriz aumentada do sistema, obtemos

1 2 1 0 0∣∣ 5

2 1 1 1 0∣∣ 2

1 1 1 0 1∣∣ 3

1 1 1 1 0∣∣ − 1

−→

1 0 0 0 0∣∣ 11

0 1 0 0 −1∣∣ 2

0 0 1 0 2∣∣ − 10

0 0 0 1 −1∣∣ − 4

.

Assim, sua solução é dada por

αβγδε

=

112 + ε

−10 − 2ε−4 + ε

ε

=

112

−10−4

0

+ ε

01

−211

.

Como o sistema tem solução, vemos que o vetor v = (5, 2, 3,−1) pertenceao espaço < v1, v2, v3, v4, v5 >. �

Exercício 3.16 Sejam

v1 = (2, 3, 1, 1), v2 = (−2,−2, 2, 1), e v3 = (1, 0,−2,−1).

O vetor v = (1, 1, 1, 1) pertence a < v1, v2, v3 >?

Agora estamos em condições de dizer quando um conjunto B contém todasas informações relevantes sobre o subespaço S.

Definição 3.17 Um conjunto B = {v1, . . . , vk} ⊂ S é um conjunto geradordo subespaço S ⊂ Rn se todo elemento de S for combinação linear doselementos de B. Também dizemos que B gera S.

Assim, se o problema que estivermos considerando tratar do subespaço S,estamos garantindo que B tem todas as informações relevantes sobre S.Note que B possui um número finito de elementos; se S �= {0}, então Spossui infinitos elementos.


46


�

�“IntAL” — 2009/10/19 — 21:44 — page 32 — #32 �

�

�

�

�

�


Exercício 3.18 Mostre que {v1, . . . , vj} ⊂ Rn gera o subespaço < v1, . . . , vj >

Como vimos no Exemplo 3.15, a equação (3.1) dá origem a um sistemanão homogêneo, se v �= 0. Como sabemos, o estudo de um sistema nãohomogêneo está intrinsecamente relacionado com o sistema homogêneoque lhe é associado. Esse é o objeto da próxima definição.

Definição 3.19 Dizemos que os vetores v1, . . . , vk do Rn são linearmenteindependentes se

α1v1 + . . . + αkvk = 0 (3.2)

só tem a solução trivial α1 = . . . = αk = 0. Caso contrário, dizemos que osvetores v1, . . . , vk são linearmente dependentes.

Um conjunto B = {v1, . . . , vk} é linearmente independente, se os veto-res v1, . . . , vk forem linearmente independentes; caso contrário, B é linear-mente dependente.

A equação (3.2) dá origem ao sistema homogêneo associado a (3.1).Assim, para verificar se o conjunto {v1, . . . , vk} é linearmente indepen-dente, formamos a matriz A = (v1 . . . vk), que tem os vetores v1, . . . , vkcomo colunas, e consideramos o sistema Ax = 0. Se esse sistema tiver ape-nas a solução trivial x = 0, então {v1, . . . , vk} é linearmente independente;caso contrário, é linearmente dependente.

Consideraremos esse sistema em uma situação particularmente simples,que melhor nos fará entender a Definição 3.19:

Exemplo 3.20 Consideremos os vetores e1 = (1, 0, 0), e2 = (0, 1, 0) ev = (1, 1, 0). Queremos verificar se esses vetores são linearmente indepen-dentes ou linearmente dependentes. Para isso, consideramos a igualdadevetorial

α1e1 + α2e2 + α3v = 0. (3.3)

Como já vimos, essa igualdade é o mesmo que o sistema homogêneo

1 0 10 1 10 0 0

α1α2α3

=

000

.

(Repetimos: os vetores e1, e2 e v constituem as colunas da matriz 3 × 3, quedenotaremos por A.)

A solução do sistema homogêneo é dada por

α1α2α3

= α3

−1−1

1

.

Como o sistema homogêneo possui solução não trivial, concluímos que osvetores e1, e2 e v são linearmente dependentes.

Substituindo a solução (α1, α2, α3) = (−1,−1, 1) em (3.3), obtemos

−e1 − e2 + v = 0,

ou, o que é o mesmo,v = e1 + e2. (3.4)

�

�“IntAL” — 2009/10/19 — 21:44 — page 33 — #33 �

�

�

�

�

�


Essa equação garante que v é combinação linear dos vetores e1 e e2.Geometricamente, isso significa que v pertence ao plano π gerado pelos ve-tores e1 e e2. Quer dizer, se tivermos os vetores e1 e e2, então duascoordenadas bastarão para descrever todos os pontos do plano gerado poresses vetores, e o vetor v não é necessário. O vetor v é uma informaçãosupérflua.

Compare esse exemplo com o Exercício 3.13. �

Figura 3.2: 3.2

Figura 3.2: O vetor v é combinação linear dos vetores e1 e e2, pois pertence ao plano geradopor estes vetores

Exercício 3.21 Verifique se os vetores

v1 = (1, 1, 1), v2 = (1, 1, 0) e v3 = (1, 0, 0)

são linearmente dependentes.

É claro que, no Exemplo 3.20, também podemos escrever e1 (ou e2) comocombinação linear dos vetores restantes. Nesse caso, e1 (ou, respectiva-mente, e2) seria a informação supérflua.

Podemos formular abstratamente o que aconteceu no exemplo anterior.Veja que a equação (3.2) é tratada sem considerar as coordenadas dos ve-tores envolvidos!

Proposição 3.22 O conjunto {v1, . . . , vk} é linearmente dependente se,e somente se, algum desses vetores é combinação linear dos vetoresrestantes.

Demonstração: Suponhamos que {v1, . . . , vk} seja linearmente dependente.Então existem escalares α1, . . . , αk, nem todos nulos, tais que

α1v1 + . . . + αkvk = 0.

Para simplificar a notação, vamos supor que α1 �= 0. Nesse caso, temos

α1v1 = −α2v2 − . . . − αkvk, (3.5)

ou seja,v1 = β2v2 + . . . + βkvk,

em que βi = αi/α1 para i = 2, . . . , k. Assim, v1 é combinação linear dosvetores {v2, . . . , vk}.


47

aula 3

�

�“IntAL” — 2009/10/19 — 21:44 — page 32 — #32 �

�

�

�

�

�


Exercício 3.18 Mostre que {v1, . . . , vj} ⊂ Rn gera o subespaço < v1, . . . , vj >

Como vimos no Exemplo 3.15, a equação (3.1) dá origem a um sistemanão homogêneo, se v �= 0. Como sabemos, o estudo de um sistema nãohomogêneo está intrinsecamente relacionado com o sistema homogêneoque lhe é associado. Esse é o objeto da próxima definição.

Definição 3.19 Dizemos que os vetores v1, . . . , vk do Rn são linearmenteindependentes se

α1v1 + . . . + αkvk = 0 (3.2)

só tem a solução trivial α1 = . . . = αk = 0. Caso contrário, dizemos que osvetores v1, . . . , vk são linearmente dependentes.

Um conjunto B = {v1, . . . , vk} é linearmente independente, se os veto-res v1, . . . , vk forem linearmente independentes; caso contrário, B é linear-mente dependente.

A equação (3.2) dá origem ao sistema homogêneo associado a (3.1).Assim, para verificar se o conjunto {v1, . . . , vk} é linearmente indepen-dente, formamos a matriz A = (v1 . . . vk), que tem os vetores v1, . . . , vkcomo colunas, e consideramos o sistema Ax = 0. Se esse sistema tiver ape-nas a solução trivial x = 0, então {v1, . . . , vk} é linearmente independente;caso contrário, é linearmente dependente.

Consideraremos esse sistema em uma situação particularmente simples,que melhor nos fará entender a Definição 3.19:

Exemplo 3.20 Consideremos os vetores e1 = (1, 0, 0), e2 = (0, 1, 0) ev = (1, 1, 0). Queremos verificar se esses vetores são linearmente indepen-dentes ou linearmente dependentes. Para isso, consideramos a igualdadevetorial

α1e1 + α2e2 + α3v = 0. (3.3)

Como já vimos, essa igualdade é o mesmo que o sistema homogêneo

1 0 10 1 10 0 0

α1α2α3

=

000

.

(Repetimos: os vetores e1, e2 e v constituem as colunas da matriz 3 × 3, quedenotaremos por A.)

A solução do sistema homogêneo é dada por

α1α2α3

= α3

−1−1

1

.

Como o sistema homogêneo possui solução não trivial, concluímos que osvetores e1, e2 e v são linearmente dependentes.

Substituindo a solução (α1, α2, α3) = (−1,−1, 1) em (3.3), obtemos

−e1 − e2 + v = 0,

ou, o que é o mesmo,v = e1 + e2. (3.4)

�

�“IntAL” — 2009/10/19 — 21:44 — page 33 — #33 �

�

�

�

�

�


Essa equação garante que v é combinação linear dos vetores e1 e e2.Geometricamente, isso significa que v pertence ao plano π gerado pelos ve-tores e1 e e2. Quer dizer, se tivermos os vetores e1 e e2, então duascoordenadas bastarão para descrever todos os pontos do plano gerado poresses vetores, e o vetor v não é necessário. O vetor v é uma informaçãosupérflua.

Compare esse exemplo com o Exercício 3.13. �

Figura 3.2: 3.2

Figura 3.2: O vetor v é combinação linear dos vetores e1 e e2, pois pertence ao plano geradopor estes vetores

Exercício 3.21 Verifique se os vetores

v1 = (1, 1, 1), v2 = (1, 1, 0) e v3 = (1, 0, 0)

são linearmente dependentes.

É claro que, no Exemplo 3.20, também podemos escrever e1 (ou e2) comocombinação linear dos vetores restantes. Nesse caso, e1 (ou, respectiva-mente, e2) seria a informação supérflua.

Podemos formular abstratamente o que aconteceu no exemplo anterior.Veja que a equação (3.2) é tratada sem considerar as coordenadas dos ve-tores envolvidos!

Proposição 3.22 O conjunto {v1, . . . , vk} é linearmente dependente se,e somente se, algum desses vetores é combinação linear dos vetoresrestantes.

Demonstração: Suponhamos que {v1, . . . , vk} seja linearmente dependente.Então existem escalares α1, . . . , αk, nem todos nulos, tais que

α1v1 + . . . + αkvk = 0.

Para simplificar a notação, vamos supor que α1 �= 0. Nesse caso, temos

α1v1 = −α2v2 − . . . − αkvk, (3.5)

ou seja,v1 = β2v2 + . . . + βkvk,

em que βi = αi/α1 para i = 2, . . . , k. Assim, v1 é combinação linear dosvetores {v2, . . . , vk}.

e1

e2v

0


48


�

�“IntAL” — 2009/10/19 — 21:44 — page 34 — #34 �

�

�

�

�

�


Reciprocamente, se (por exemplo) v1 = α2v2 + . . . + αkvk, então

1v1 − α2v2 − . . . − αkvk = 0,

e ao menos um dos escalares (qual seja, o coeficiente de v1) é não nulo,mostrando que esse conjunto é linearmente dependente. �

Note que, se tivermos α1v1 + . . . + αkvk = 0, podemos escrever qualquervetor relacionado a um coeficiente αi �= 0 como combinação linear dosvetores restantes: na demonstração anterior, esse fato é usado ao dividir-mos a equação (3.5) pelo escalar α1 �= 0.

Observação 3.23 Retirado um vetor “supérfluo” de um conjunto linear-mente dependente, não podemos garantir que o conjunto restante seja for-mado apenas por vetores essenciais. Isto é, pode ser que o conjunto restanteainda seja linearmente dependente. Veremos, posteriormente, um métodopara retirar de uma vez todos os vetores supérfluos de um conjunto linear-mente dependente. Veja a Observação 4.23. �

Exercício 3.24 Verifique se o conjunto {(1, 1, 2, 1), (1, 1, 1, 1), (2, 1, 1, 1), (2, 1, 2, 1)} é linearmentedependente ou linearmente independente. Se for linearmente dependente, escreva um dos vetorescomo combinação linear dos vetores restantes.

Exercício 3.25 Suponha que o vetor v pertença ao espaço < v1, . . . , vk >. Mostre que o conjunto{v, v1, . . . , vk} é linearmente dependente.

Exemplo 3.26 Sejam v2, . . . , vk vetores quaisquer do Rn. Então o conjunto{0, v2, . . . , vk} é linearmente dependente. (Aqui, 0 denota o vetor nulo.)Assim, qualquer conjunto que contenha o vetor nulo é linearmente depen-dente.

De fato, temos queα10 + α2v2 + . . . + αkvk = 0

possui a solução não trivial α1 = 1, α2 = . . . = αn = 0. Você é capaz deexibir outras soluções? �

Exercício 3.27 Suponha que o conjunto {v1, . . . , vk} ⊂ Rn seja linearmente dependente. Mostreque {v1, . . . , vk, v} ⊂ Rn é linearmente dependente, qualquer que seja o vetor v ∈ Rn.

Observação 3.28 Pela Proposição 3.22, se v ∈ Rn não for combinaçãolinear dos vetores v1, . . . , vk, então v �∈ 〈v1, . . . , vk〉. Com a linguagempictórica introduzida anteriormente, isso quer dizer que o vetor v traz umainformação que não está contida no subespaço < v1, . . . , vk >.

Mas não podemos garantir que o conjunto {v, v1, . . . , vk} ⊂ Rn seja linear-mente independente, pois não sabemos se seu subconjunto {v1, . . . , vk} élinearmente independente, conforme o Exercício 3.27.

Se {v1, . . . , vk} for linearmente independente e se v não pertencer a essesubespaço, então {v1, . . . , vk, v} é linearmente independente. Esse resul-tado é uma consequência imediata da Proposição 3.22, mas vamos dar umademonstração direta dele: suponhamos que

α1v1 + . . . + αkvk + βv = 0. (3.6)

�

�“IntAL” — 2009/10/19 — 21:44 — page 35 — #35 �

�

�

�

�

�

3.2. BASES 35

Então β = 0 pois, caso contrário, v seria combinação linear dos vetoresv1, . . . , vk. Mas então temos

α1v1 + . . . + αkvk = 0

e, como esses vetores são linearmente independentes, αi = 0 para i ∈{1, . . . , k}. Assim, todos os escalares em (3.6) são nulos, mostrando nossaafirmação. �

Exercício 3.29 Seja v �= 0 um vetor do Rn. Mostre que o conjunto {v} é linearmente independente.

3.2 Bases

Definição 3.30 Uma base B = {v1, . . . , vk} de um subespaço S do Rn é umconjunto ordenado de vetores de S que gera esse subespaço e é linearmenteindependente.

Por conjunto ordenado queremos dizer que a ordem dos elementos éimportante. Em outras palavras, os conjuntos ordenados {u, v, w}, {u, w, v}e {w, u, v} são distintos! Posteriormente explicaremos a razão de definir-mos uma base como um conjunto ordenado. (Veja a Observação 6.3)

Assim, para verificar que um conjunto B é uma base do subespaço S, pre-cisamos verificar três afirmações independentes:

(i) os elementos de B pertencem a S;

(ii) todo elemento de S é combinação linear dos elementos de B;

(iii) o conjunto B é linearmente independente.

Essas três exigências são a expressão, em termos matemáticos, das condi-ções (i), (ii) e (iii) apresentadas na página 43.

Exemplo 3.31 Os vetores e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . . , en == (0, 0, . . . , 0, 1) formam uma base do espaçoRn. De fato, se x = (x1, . . . , xn) ∈Rn, temos

x = (x1, . . . , xn) = x1(1, 0, . . . , 0) + x2(0, 1, 0, . . . , 0)+ . . . + xn(0, . . . , 0, 1)

= x1e1 + x2e2 + . . . + xnen,

mostrando que {e1, . . . , en} gera o Rn. Além disso,

0 = α1e1 + . . . + αnen

= (α1, 0, . . . , 0) + (0, α2, 0, . . . , 0) + . . . + (0, . . . , 0, αn)

= (α1, . . . , αn),

o que implica que α1 = . . . = αn = 0.

A base B = {e1, . . . , en} é chamada base canônica do Rn. �

Exercício 3.32 Verifique se {v1, v2, v3} ⊂ Rn é uma base do R3, sendo

v1 = (1, 3, 3), v2 = (2, 1, 1) e v3 = (1, 1, 1).

�

�“IntAL” — 2009/10/19 — 21:44 — page 35 — #35 �

�

�

�

�

�

3.2. BASES 35


α1v1 + . . . + αkvk = 0



3.2 Bases









x = (x1, . . . , xn) = x1(1, 0, . . . , 0) + x2(0, 1, 0, . . . , 0)+ . . . + xn(0, . . . , 0, 1)

= x1e1 + x2e2 + . . . + xnen,


0 = α1e1 + . . . + αnen

= (α1, 0, . . . , 0) + (0, α2, 0, . . . , 0) + . . . + (0, . . . , 0, αn)

= (α1, . . . , αn),




v1 = (1, 3, 3), v2 = (2, 1, 1) e v3 = (1, 1, 1).


49

aula 3

�

�“IntAL” — 2009/10/19 — 21:44 — page 34 — #34 �

�

�

�

�

�


Reciprocamente, se (por exemplo) v1 = α2v2 + . . . + αkvk, então

1v1 − α2v2 − . . . − αkvk = 0,

e ao menos um dos escalares (qual seja, o coeficiente de v1) é não nulo,mostrando que esse conjunto é linearmente dependente. �

Note que, se tivermos α1v1 + . . . + αkvk = 0, podemos escrever qualquervetor relacionado a um coeficiente αi �= 0 como combinação linear dosvetores restantes: na demonstração anterior, esse fato é usado ao dividir-mos a equação (3.5) pelo escalar α1 �= 0.

Observação 3.23 Retirado um vetor “supérfluo” de um conjunto linear-mente dependente, não podemos garantir que o conjunto restante seja for-mado apenas por vetores essenciais. Isto é, pode ser que o conjunto restanteainda seja linearmente dependente. Veremos, posteriormente, um métodopara retirar de uma vez todos os vetores supérfluos de um conjunto linear-mente dependente. Veja a Observação 4.23. �

Exercício 3.24 Verifique se o conjunto {(1, 1, 2, 1), (1, 1, 1, 1), (2, 1, 1, 1), (2, 1, 2, 1)} é linearmentedependente ou linearmente independente. Se for linearmente dependente, escreva um dos vetorescomo combinação linear dos vetores restantes.

Exercício 3.25 Suponha que o vetor v pertença ao espaço < v1, . . . , vk >. Mostre que o conjunto{v, v1, . . . , vk} é linearmente dependente.

Exemplo 3.26 Sejam v2, . . . , vk vetores quaisquer do Rn. Então o conjunto{0, v2, . . . , vk} é linearmente dependente. (Aqui, 0 denota o vetor nulo.)Assim, qualquer conjunto que contenha o vetor nulo é linearmente depen-dente.

De fato, temos queα10 + α2v2 + . . . + αkvk = 0

possui a solução não trivial α1 = 1, α2 = . . . = αn = 0. Você é capaz deexibir outras soluções? �

Exercício 3.27 Suponha que o conjunto {v1, . . . , vk} ⊂ Rn seja linearmente dependente. Mostreque {v1, . . . , vk, v} ⊂ Rn é linearmente dependente, qualquer que seja o vetor v ∈ Rn.

Observação 3.28 Pela Proposição 3.22, se v ∈ Rn não for combinaçãolinear dos vetores v1, . . . , vk, então v �∈ 〈v1, . . . , vk〉. Com a linguagempictórica introduzida anteriormente, isso quer dizer que o vetor v traz umainformação que não está contida no subespaço < v1, . . . , vk >.

Mas não podemos garantir que o conjunto {v, v1, . . . , vk} ⊂ Rn seja linear-mente independente, pois não sabemos se seu subconjunto {v1, . . . , vk} élinearmente independente, conforme o Exercício 3.27.

Se {v1, . . . , vk} for linearmente independente e se v não pertencer a essesubespaço, então {v1, . . . , vk, v} é linearmente independente. Esse resul-tado é uma consequência imediata da Proposição 3.22, mas vamos dar umademonstração direta dele: suponhamos que

α1v1 + . . . + αkvk + βv = 0. (3.6)

�

�“IntAL” — 2009/10/19 — 21:44 — page 35 — #35 �

�

�

�

�

�

3.2. BASES 35


α1v1 + . . . + αkvk = 0



3.2 Bases









x = (x1, . . . , xn) = x1(1, 0, . . . , 0) + x2(0, 1, 0, . . . , 0)+ . . . + xn(0, . . . , 0, 1)

= x1e1 + x2e2 + . . . + xnen,


0 = α1e1 + . . . + αnen

= (α1, 0, . . . , 0) + (0, α2, 0, . . . , 0) + . . . + (0, . . . , 0, αn)

= (α1, . . . , αn),




v1 = (1, 3, 3), v2 = (2, 1, 1) e v3 = (1, 1, 1).

3 .2 BASES

�

�“IntAL” — 2009/10/19 — 21:44 — page 35 — #35 �

�

�

�

�

�

3.2. BASES 35


α1v1 + . . . + αkvk = 0



3.2 Bases









x = (x1, . . . , xn) = x1(1, 0, . . . , 0) + x2(0, 1, 0, . . . , 0)+ . . . + xn(0, . . . , 0, 1)

= x1e1 + x2e2 + . . . + xnen,


0 = α1e1 + . . . + αnen

= (α1, 0, . . . , 0) + (0, α2, 0, . . . , 0) + . . . + (0, . . . , 0, αn)

= (α1, . . . , αn),




v1 = (1, 3, 3), v2 = (2, 1, 1) e v3 = (1, 1, 1).

.)


50


�

�“IntAL” — 2009/10/19 — 21:44 — page 36 — #36 �

�

�

�

�

�


A base canônica introduz no Rn um sistema de coordenadas semelhanteao sistema com eixos x, y e z do R3. Assim, a base canônica produz umsistema de coordenadas completamente natural. Para que estudar outrasbases no Rn? A resposta é simples: a base canônica produz um sistema decoordenadas que pode não ser o mais adequado ao problema que estamostratando. Com um sistema de eixos mais adequado, a obtenção da respostapara o nosso problema pode ser bem mais simples.

Além disso, muitas vezes estamos interessados em um subespaço particu-lar do Rn, subespaço esse que pode funcionar como um plano ou uma reta,por exemplo. Pode acontecer que nenhum (!) dos vetores da base canô-nica pertença a esse subespaço. Além disso, os pontos desse subespaço po-dem ser caracterizados por um número menor de coordenadas do que as ncoordenadas utilizadas para caracterizar um ponto do Rn: x = (x1, . . . , xn).Essa situação ocorreu quando consideramos sistemas de coordenadas emretas e planos do Rn, como no Exemplo 3.3 e Exercício 3.4.

Exemplo 3.33 O conjunto {v} é uma base do subespaço

Y = {tv : t ∈ R}

do Exemplo 3.3. De fato, esse conjunto é linearmente independente, deacordo com o Exercício 3.29. Além disso, qualquer elemento de Y é múlti-plo de v, o que mostra que {v} gera o subespaço Y. �

Exemplo 3.34 Seja B = {v1, . . . , vj} um conjunto linearmente indepen-dente de vetores do Rn. Então o subespaço < v1, . . . , vj >⊂ Rn tem Bcomo base. De fato, todo elemento de < v1, . . . , vj > é uma combinaçãolinear de elementos de B; como esse conjunto é linearmente independentee está contido em < v1, . . . , vj >, nossa afirmação está provada. �

Exercício 3.35 Se u e v não forem colineares, mostre que {u, v} é uma base do subespaço Z doExercício 3.4.

Exercício 3.36 Mostre que o conjunto {(1, 1, 1, 1), (1, 1, 1, 0), (1, 1, 0, 0), (1, 0, 0, 0)} é uma base doespaço R4.

Proposição 3.37 Se B = {v1, . . . , vk} for a base de um subespaço V ⊂ Rn,então cada vetor v ∈ V é escrito de maneira única como combinação lineardos elementos de B.

Demonstração: Suponhamos a existência de v ∈ V tal que

α1v1 + α2v2 + . . . + αkvk = v = β1v1 + β2v2 + . . . + βkvk.

Queremos mostrar que αi = βi para i ∈ {1, . . . , k}. Ora, da igualdade ante-rior deduzimos que

(α1 − β1)v1 + (α2 − β2)v2 + . . . + (αk − βk)vk = 0.

Como B é linearmente independente, necessariamente temos αi − βi = 0para todo i ∈ {1, . . . , k}, o que prova nosso resultado. �

�

�“IntAL” — 2009/10/19 — 21:44 — page 37 — #37 �

�

�

�

�

�

3.3. DIMENSÃO 37

3.3 Dimensão

Agora passamos a considerar o conceito de dimensão de um subespaço;esse conceito pode ser utilizado para caracterizar todos os subespaços doRn.

Exemplo 3.38 Consideremos novamente o Exercício 3.4 no caso em queu = (1, 0, 0) e v = (0, 1, 0) são vetores do R3. De acordo com o Exercício3.35, {u, v} é uma base do subespaço

Z = {αu + βv : α, β ∈ R}.

Afirmamos que {u, u + v} é outra base de Z. Seja w = u + v = (1, 1, 0).Queremos mostrar que {u, w} também é base de Z.

Temos que w ∈ Z, pois w = 1u + 1v. Assim, {u, w} ⊂ Z. Se x ∈ Z, então,

x = αu + βv = α(1, 0, 0) + β(0, 1, 0) = (α, β, 0).

Então x é combinação linear de u e w. De fato,

(α, β, 0) = λ1u + λ2w ⇔ (α, β, 0) = (λ1 + λ2, λ2, 0).

É claro então que λ2 = β e λ1 + λ2 = α, o que implica λ1 = α − λ2 == α − β. Mostramos assim que qualquer elemento de Z é combinaçãolinear dos elementos u e w.

Mas esses elementos também são linearmente independentes, pois

(0, 0, 0) = λ1u + λ2w ⇔ (0, 0, 0) = (λ1 + λ2, λ2, 0).

Assim, λ1 = λ2 = 0 é a única solução de 0 = λ1u + λ2w. �

O Exemplo mostra que o mesmo subespaço do Rn tem diferentes bases.Todas essas bases possuem algo em comum: o número de elementos.Utilizaremos, para mostrar esse fato, o seguinte resultado:

Teorema 3.39 Seja B = {v1, . . . , vk} uma base do subespaço S ⊂ Rn. Entãoqualquer conjunto C ⊂ S com mais que k elementos é linearmente dependente.

Demonstração: Mostraremos esse resultado em uma situação particular,com uma notação mais simples. Para isso, suponhamos que B = {v1, v2}seja uma base de um subespaço Y ⊂ Rn. Consideremos um conjuntoC = {u1, u2, u3} ⊂ Y. Vamos mostrar que C é linearmente dependente.

Para isso, consideremos a equação

λ1u1 + λ2u2 + λ3u3 = 0. (3.7)

Como B é uma base de Y, cada elemento de C é combinação linear doselementos em B. Assim,

u1 = α11v1 + α21v2

u2 = α12v1 + α22v2

u3 = α13v1 + α23v2

para determinados escalares αij, com i ∈ {1, 2} e j ∈ {1, 2, 3}. Note bem: seconhecêssemos as coordenadas dos vetores envolvidos, poderíamos


51

aula 3

�

�“IntAL” — 2009/10/19 — 21:44 — page 36 — #36 �

�

�

�

�

�


A base canônica introduz no Rn um sistema de coordenadas semelhanteao sistema com eixos x, y e z do R3. Assim, a base canônica produz umsistema de coordenadas completamente natural. Para que estudar outrasbases no Rn? A resposta é simples: a base canônica produz um sistema decoordenadas que pode não ser o mais adequado ao problema que estamostratando. Com um sistema de eixos mais adequado, a obtenção da respostapara o nosso problema pode ser bem mais simples.

Além disso, muitas vezes estamos interessados em um subespaço particu-lar do Rn, subespaço esse que pode funcionar como um plano ou uma reta,por exemplo. Pode acontecer que nenhum (!) dos vetores da base canô-nica pertença a esse subespaço. Além disso, os pontos desse subespaço po-dem ser caracterizados por um número menor de coordenadas do que as ncoordenadas utilizadas para caracterizar um ponto do Rn: x = (x1, . . . , xn).Essa situação ocorreu quando consideramos sistemas de coordenadas emretas e planos do Rn, como no Exemplo 3.3 e Exercício 3.4.

Exemplo 3.33 O conjunto {v} é uma base do subespaço

Y = {tv : t ∈ R}

do Exemplo 3.3. De fato, esse conjunto é linearmente independente, deacordo com o Exercício 3.29. Além disso, qualquer elemento de Y é múlti-plo de v, o que mostra que {v} gera o subespaço Y. �

Exemplo 3.34 Seja B = {v1, . . . , vj} um conjunto linearmente indepen-dente de vetores do Rn. Então o subespaço < v1, . . . , vj >⊂ Rn tem Bcomo base. De fato, todo elemento de < v1, . . . , vj > é uma combinaçãolinear de elementos de B; como esse conjunto é linearmente independentee está contido em < v1, . . . , vj >, nossa afirmação está provada. �

Exercício 3.35 Se u e v não forem colineares, mostre que {u, v} é uma base do subespaço Z doExercício 3.4.

Exercício 3.36 Mostre que o conjunto {(1, 1, 1, 1), (1, 1, 1, 0), (1, 1, 0, 0), (1, 0, 0, 0)} é uma base doespaço R4.

Proposição 3.37 Se B = {v1, . . . , vk} for a base de um subespaço V ⊂ Rn,então cada vetor v ∈ V é escrito de maneira única como combinação lineardos elementos de B.

Demonstração: Suponhamos a existência de v ∈ V tal que

α1v1 + α2v2 + . . . + αkvk = v = β1v1 + β2v2 + . . . + βkvk.

Queremos mostrar que αi = βi para i ∈ {1, . . . , k}. Ora, da igualdade ante-rior deduzimos que

(α1 − β1)v1 + (α2 − β2)v2 + . . . + (αk − βk)vk = 0.

Como B é linearmente independente, necessariamente temos αi − βi = 0para todo i ∈ {1, . . . , k}, o que prova nosso resultado. �

�

�“IntAL” — 2009/10/19 — 21:44 — page 37 — #37 �

�

�

�

�

�

3.3. DIMENSÃO 37

3.3 Dimensão

Agora passamos a considerar o conceito de dimensão de um subespaço;esse conceito pode ser utilizado para caracterizar todos os subespaços doRn.

Exemplo 3.38 Consideremos novamente o Exercício 3.4 no caso em queu = (1, 0, 0) e v = (0, 1, 0) são vetores do R3. De acordo com o Exercício3.35, {u, v} é uma base do subespaço

Z = {αu + βv : α, β ∈ R}.

Afirmamos que {u, u + v} é outra base de Z. Seja w = u + v = (1, 1, 0).Queremos mostrar que {u, w} também é base de Z.

Temos que w ∈ Z, pois w = 1u + 1v. Assim, {u, w} ⊂ Z. Se x ∈ Z, então,

x = αu + βv = α(1, 0, 0) + β(0, 1, 0) = (α, β, 0).

Então x é combinação linear de u e w. De fato,

(α, β, 0) = λ1u + λ2w ⇔ (α, β, 0) = (λ1 + λ2, λ2, 0).

É claro então que λ2 = β e λ1 + λ2 = α, o que implica λ1 = α − λ2 == α − β. Mostramos assim que qualquer elemento de Z é combinaçãolinear dos elementos u e w.

Mas esses elementos também são linearmente independentes, pois

(0, 0, 0) = λ1u + λ2w ⇔ (0, 0, 0) = (λ1 + λ2, λ2, 0).

Assim, λ1 = λ2 = 0 é a única solução de 0 = λ1u + λ2w. �

O Exemplo mostra que o mesmo subespaço do Rn tem diferentes bases.Todas essas bases possuem algo em comum: o número de elementos.Utilizaremos, para mostrar esse fato, o seguinte resultado:

Teorema 3.39 Seja B = {v1, . . . , vk} uma base do subespaço S ⊂ Rn. Entãoqualquer conjunto C ⊂ S com mais que k elementos é linearmente dependente.

Demonstração: Mostraremos esse resultado em uma situação particular,com uma notação mais simples. Para isso, suponhamos que B = {v1, v2}seja uma base de um subespaço Y ⊂ Rn. Consideremos um conjuntoC = {u1, u2, u3} ⊂ Y. Vamos mostrar que C é linearmente dependente.

Para isso, consideremos a equação

λ1u1 + λ2u2 + λ3u3 = 0. (3.7)

Como B é uma base de Y, cada elemento de C é combinação linear doselementos em B. Assim,

u1 = α11v1 + α21v2

u2 = α12v1 + α22v2

u3 = α13v1 + α23v2

para determinados escalares αij, com i ∈ {1, 2} e j ∈ {1, 2, 3}. Note bem: seconhecêssemos as coordenadas dos vetores envolvidos, poderíamos

3 .3 DIMENSÃO


52


�

�“IntAL” — 2009/10/19 — 21:44 — page 38 — #38 �

�

�

�

�

�


determinar esses escalares. Mas, como os vetores v1 e v2 são arbitrários,só sabemos que esses escalares existem!

Substituindo essas expressões de u1, u2 e u3 em (3.7), obtemos

λ1(α11v1 + α21v2) + λ2(α12v1 + α22v2) + λ3(α13v1 + α23v2) = 0,

ou seja,

(λ1α11 + λ2α12 + λ3α13)v1 + (λ1α21 + λ2α22 + λ3α23)v2 = 0.

Como B é um conjunto linearmente independente, devemos ter

λ1α11 + λ2α12 + λ3α13 = 0λ1α21 + λ2α22 + λ3α23 = 0,

isto é,(

α11 α12 α13α21 α22 α23

)

λ1λ2λ3

=

000

.

Como o número de equações nesse sistema homogêneo é menor do que onúmero de incógnitas, o Teorema 1.19 garante que existe solução não trivialpara o sistema, o que prova que C é linearmente dependente. �

Exercício 3.40 Diga se os conjuntos são linearmente dependentes ou linearmente independentes:

(a) S = {(1, 1), (2, 1), (1, 0)} ⊂ R2;

(b) R = {(1, 1, 1, 1), (0, 0, 0, 0), (1, 2, 1, 1)} ⊂ R4;

(c) P = {(1, 1, 2), (1, 0, 1), (1, 2, 1), (0, 0, 1)} ⊂ R3.

Exercício 3.41 SeB = {v1, . . . , vk} e C = {u1, . . . , uk, uk+1},

demonstre o Teorema 3.39. Deduza daí então o caso C = {u1, . . . , uk, uk+1, . . . , uk+r}, em que r ≥ 1.

Corolário 3.42 Todas as bases de um subespaço S ⊂ Rn possuem o mesmonúmero de elementos.

Demonstração: Suponhamos que existam bases B e B′, com B tendo me-nos elementos do que B′. De acordo com o Teorema 3.39, o conjunto B′

seria linearmente dependente. Mas isso é impossível, pois B′ é uma basede S e, consequentemente, um conjunto linearmente independente. Chega-mos a uma contradição que mostra que todas as bases devem ter o mesmonúmero de elementos. �

Mas qualquer subespaço S do Rn possui uma base? Note que já provamosque Rn possui uma base. Assim, todos os elementos do Rn (e, em parti-cular, os elementos de S) podem ser escritos como combinação linear doselementos da base do Rn. Além disso, essa base é um conjunto linearmenteindependente. Isso não prova que S possui uma base?

Não! Há uma exigência que precisa ser cumprida: os elementos da basedevem pertencer todos ao subespaço S.

�

�“IntAL” — 2009/10/19 — 21:44 — page 39 — #39 �

�

�

�

�

�

3.3. DIMENSÃO 39

Teorema 3.43 Seja C = {u1, . . . , uj} ⊂ S um conjunto linearmente inde-pendente. Então existem vetores uj+1, . . . , uj+k em S de modo que{u1, . . . , uj, uj+1, . . . , uj+k} seja uma base de S.

Demonstração: Como S é um subespaço e C ⊂ S, toda combinação linearde elementos de C pertence a S. Assim,

< u1, . . . , uj > ⊂ S.

Se < u1, . . . , uj >= S, então C é uma base de S, de acordo com oExemplo 3.34. Caso contrário, existiria um vetor uj+1 ∈ S tal queuj+1 �∈ < u1, . . . , uj >. De acordo com a Observação 3.28, o conjunto{u1, . . . , uj+1} é linearmente independente.

Agora repetimos o raciocínio. Se < u1, . . . , uj, uj+1 >= S, então o conjunto{u1, . . . , uj+1} é uma base de S. Caso contrário, existiria uj+2 ∈ S tal queuj+2 �∈< u1, . . . , uj, uj+1 > e, então, o conjunto{u1, . . . , uj, uj+1, uj+2} serialinearmente independente.

Esse processo tem fim, pois qualquer conjunto com n + 1 elementos no Rn

é linearmente dependente, de acordo com o Teorema 3.39. Ou seja, temos

< u1, . . . , uj, . . . , uj+k >= S

para algum k ∈ {0, 1, . . . , n − j}. �

Corolário 3.44 Todo subespaço S �= {0} do Rn possui uma base.

Demonstração: De fato, basta tomar um vetor 0 �= v1 ∈ S e aplicar o Teo-rema 3.43 ao conjunto C = {v1}. �

Note que o subespaço {0} ⊂ Rn não possui base. De fato, se B fosse umabase do subespaço {0}, então 0 seria um elemento de B. De acordo com oExemplo 3.26, esse conjunto seria linearmente dependente!

Por outro lado, a demonstração do Corolário 3.44 garante que a existênciade uma infinidade de bases para qualquer subespaço S do Rn.

Definição 3.45 Seja S um subespaço do Rn. Definimos a dimensão de Scomo o número de elementos de uma de suas bases. Escrevemosdim S = k, se {v1, . . . , vk} for uma base de S. Se S = {0}, dizemos queS tem dimensão 0.

Como todas as bases de um subespaço tem o mesmo número de elementos,está bem definida a dimensão do subespaço S.

Exemplo 3.46 Já vimos que o Rn tem dois subespaços triviais: o {0} e opróprio Rn. Agora podemos caracterizar todos os subespaços do Rn. Alémdesses, existem todas as retas passando pela origem (que são os subes-paços de dimensão 1), todos os planos passando pela origem (que são ossubespaços de dimensão 2), todos os subespaços de dimensão 3 e assimpor diante, até chegarmos a todos os subespaços de dimensão n − 1. Opróprio Rn é seu único subespaço com dimensão n. (Note que, por faltade nomes adequados, mudamos a maneira de nos referir aos subespaçosdo Rn: começamos com retas e planos e passamos a falar de subespaços dedimensão 3 etc.) �


53

aula 3

�

�“IntAL” — 2009/10/19 — 21:44 — page 38 — #38 �

�

�

�

�

�


determinar esses escalares. Mas, como os vetores v1 e v2 são arbitrários,só sabemos que esses escalares existem!

Substituindo essas expressões de u1, u2 e u3 em (3.7), obtemos

λ1(α11v1 + α21v2) + λ2(α12v1 + α22v2) + λ3(α13v1 + α23v2) = 0,

ou seja,

(λ1α11 + λ2α12 + λ3α13)v1 + (λ1α21 + λ2α22 + λ3α23)v2 = 0.

Como B é um conjunto linearmente independente, devemos ter

λ1α11 + λ2α12 + λ3α13 = 0λ1α21 + λ2α22 + λ3α23 = 0,

isto é,(

α11 α12 α13α21 α22 α23

)

λ1λ2λ3

=

000

.

Como o número de equações nesse sistema homogêneo é menor do que onúmero de incógnitas, o Teorema 1.19 garante que existe solução não trivialpara o sistema, o que prova que C é linearmente dependente. �

Exercício 3.40 Diga se os conjuntos são linearmente dependentes ou linearmente independentes:

(a) S = {(1, 1), (2, 1), (1, 0)} ⊂ R2;

(b) R = {(1, 1, 1, 1), (0, 0, 0, 0), (1, 2, 1, 1)} ⊂ R4;

(c) P = {(1, 1, 2), (1, 0, 1), (1, 2, 1), (0, 0, 1)} ⊂ R3.

Exercício 3.41 SeB = {v1, . . . , vk} e C = {u1, . . . , uk, uk+1},

demonstre o Teorema 3.39. Deduza daí então o caso C = {u1, . . . , uk, uk+1, . . . , uk+r}, em que r ≥ 1.

Corolário 3.42 Todas as bases de um subespaço S ⊂ Rn possuem o mesmonúmero de elementos.

Demonstração: Suponhamos que existam bases B e B′, com B tendo me-nos elementos do que B′. De acordo com o Teorema 3.39, o conjunto B′

seria linearmente dependente. Mas isso é impossível, pois B′ é uma basede S e, consequentemente, um conjunto linearmente independente. Chega-mos a uma contradição que mostra que todas as bases devem ter o mesmonúmero de elementos. �

Mas qualquer subespaço S do Rn possui uma base? Note que já provamosque Rn possui uma base. Assim, todos os elementos do Rn (e, em parti-cular, os elementos de S) podem ser escritos como combinação linear doselementos da base do Rn. Além disso, essa base é um conjunto linearmenteindependente. Isso não prova que S possui uma base?

Não! Há uma exigência que precisa ser cumprida: os elementos da basedevem pertencer todos ao subespaço S.

�

�“IntAL” — 2009/10/19 — 21:44 — page 39 — #39 �

�

�

�

�

�

3.3. DIMENSÃO 39

Teorema 3.43 Seja C = {u1, . . . , uj} ⊂ S um conjunto linearmente inde-pendente. Então existem vetores uj+1, . . . , uj+k em S de modo que{u1, . . . , uj, uj+1, . . . , uj+k} seja uma base de S.

Demonstração: Como S é um subespaço e C ⊂ S, toda combinação linearde elementos de C pertence a S. Assim,

< u1, . . . , uj > ⊂ S.

Se < u1, . . . , uj >= S, então C é uma base de S, de acordo com oExemplo 3.34. Caso contrário, existiria um vetor uj+1 ∈ S tal queuj+1 �∈ < u1, . . . , uj >. De acordo com a Observação 3.28, o conjunto{u1, . . . , uj+1} é linearmente independente.

Agora repetimos o raciocínio. Se < u1, . . . , uj, uj+1 >= S, então o conjunto{u1, . . . , uj+1} é uma base de S. Caso contrário, existiria uj+2 ∈ S tal queuj+2 �∈< u1, . . . , uj, uj+1 > e, então, o conjunto{u1, . . . , uj, uj+1, uj+2} serialinearmente independente.

Esse processo tem fim, pois qualquer conjunto com n + 1 elementos no Rn

é linearmente dependente, de acordo com o Teorema 3.39. Ou seja, temos

< u1, . . . , uj, . . . , uj+k >= S

para algum k ∈ {0, 1, . . . , n − j}. �

Corolário 3.44 Todo subespaço S �= {0} do Rn possui uma base.

Demonstração: De fato, basta tomar um vetor 0 �= v1 ∈ S e aplicar o Teo-rema 3.43 ao conjunto C = {v1}. �

Note que o subespaço {0} ⊂ Rn não possui base. De fato, se B fosse umabase do subespaço {0}, então 0 seria um elemento de B. De acordo com oExemplo 3.26, esse conjunto seria linearmente dependente!

Por outro lado, a demonstração do Corolário 3.44 garante que a existênciade uma infinidade de bases para qualquer subespaço S do Rn.

Definição 3.45 Seja S um subespaço do Rn. Definimos a dimensão de Scomo o número de elementos de uma de suas bases. Escrevemosdim S = k, se {v1, . . . , vk} for uma base de S. Se S = {0}, dizemos queS tem dimensão 0.

Como todas as bases de um subespaço tem o mesmo número de elementos,está bem definida a dimensão do subespaço S.

Exemplo 3.46 Já vimos que o Rn tem dois subespaços triviais: o {0} e opróprio Rn. Agora podemos caracterizar todos os subespaços do Rn. Alémdesses, existem todas as retas passando pela origem (que são os subes-paços de dimensão 1), todos os planos passando pela origem (que são ossubespaços de dimensão 2), todos os subespaços de dimensão 3 e assimpor diante, até chegarmos a todos os subespaços de dimensão n − 1. Opróprio Rn é seu único subespaço com dimensão n. (Note que, por faltade nomes adequados, mudamos a maneira de nos referir aos subespaçosdo Rn: começamos com retas e planos e passamos a falar de subespaços dedimensão 3 etc.) �


54


�

�“IntAL” — 2009/10/19 — 21:44 — page 40 — #40 �

�

�

�

�

�


De acordo com o Teorema 3.43, podemos obter uma base a partir de qual-quer conjunto linearmente independente. Mas também podemos obter umabase a partir de qualquer conjunto que gera um subespaço:

Proposição 3.47 Suponha que o conjunto {v1, . . . , vk} ⊂ S gere o subes-paço S �= {0}. Então um subconjunto de {v1, . . . , vk} é uma base de S.

Demonstração: Se {v1, . . . , vk} for linearmente dependente, um dos veto-res desse conjunto é combinação linear dos vetores restantes. Retirandoesse vetor, o conjunto restante continua gerando S. Continuamos retirandovetores que são combinação linear dos elementos restantes até obter umconjunto linearmente independente que continua gerando S. �

A demonstração da Proposição 3.47 mostra como obter uma base a partirde um conjunto que gera um subespaço. Contudo, esse processo é muitotrabalhoso: em cada etapa, precisamos verificar se o conjunto de vetoresé linearmente independente; caso contrário, deve-se obter então um ve-tor como combinação linear dos vetores restantes, retirar esse vetor doconjunto e novamente verificar se o conjunto restante é linearmente in-dependente, repetindo o processo, se necessário. Em cada etapa, retira-mos apenas um vetor supérfluo. Gostaríamos, entretanto, de retirar deuma única vez todos os vetores supérfluos. Mostraremos como fazê-lo naObservação 4.23.

Se já sabemos qual a dimensão do subespaço S ⊂ Rn, então a verificaçãode que um conjunto é uma base de S pode ser simplificada.

Teorema 3.48 Sejam Y ⊂ Rn um subespaço de dimensão k e

B = {v1, . . . , vk} ⊂ Y.

Então, se uma das condições seguintes for satisfeita, B é uma base de S:

(i) o conjunto B gera Y;

(ii) o conjunto B é linearmente independente.

Demonstração: Suponhamos inicialmente que B gere Y. Se esse conjuntofosse linearmente dependente, aplicando a Proposição 3.47 obteríamos en-tão um subconjunto de B, com menos que k elementos, que seria uma basede Y. Mas isso contradiz Y ter dimensão k.

Por outro lado, se B fosse linearmente independente e não gerasse Y, exis-tiria vk+1 ∈ Y, que não é combinação linear dos vetores de B. De acordocom a Proposição 3.22 (ou a Observação 3.28), o conjunto {v1, . . . , vk, vk+1}seria linearmente independente. Mas isso contradiz o Teorema 3.39, poisexistiria um conjunto linearmente independente com mais vetores do quea dimensão do espaço. �

�

�“IntAL” — 2009/10/19 — 21:44 — page 41 — #41 �

�

�

�

�

�

3.4. EXERCÍCIOS 41

3.4 Exercícios

1. Determine os valores de a, b e c para que o vetor v = (a, b, c) seja combinação linear dosvetores u1 = (1, 1, 1), u2 = (1, 2, 3) e u3 = (2,−1, 1).

2. Sem utilizar determinantes, verifique se os vetores (−1, 2, 3), (−2,−3, 1) e (3, 2, 1) são linear-mente dependentes ou linearmente independentes.

3. Seja

A =

(1 34 −3

).

Determine x �= 0 tal que Ax = 3x.

4. Encontre um conjunto de geradores para o núcleo da matriz A, dada por

(a)

1 0 1 11 2 1 22 4 2 40 1 1 2

; (b)

−1 2 2 0−1 2 1 0−1 1 2 0

0 0 0 1

.

5. Encontre uma base para o núcleo de A, se

(a)

2 2 3 40 2 3 20 0 1 10 0 0 1

; (b)

1 1 −2−1 2 1

0 1 −1

.

6. Considere os vetores v1 = (4, 2,−3), v2 = (2, 1,−2) e v3 = (−2,−1, 0) e definaU =< v1, v2, v3 >.

(a) Mostre que {v1, v2, v3} é linearmente dependente;(b) calcule a dimensão de U;(c) descreva geometricamente U;(d) ache uma base para U.

7. Sejam v1 = (1, 1, 1) e v2 = (1, 2, 1).

(a) Determine < v1, v2 >. Qual a dimensão desse subespaço do R3?(b) Determine um vetor v3 ∈ R3 de modo que o conjunto {v1, v2, v3} seja uma base do R3.

8. Seja V = {(3a + 4b − 4c, 2a − 4b − 6c,−2a − 4b + 2c) : a, b, c ∈ R}.

(a) Mostre que V é um subespaço do R3;(b) ache uma base para V.

9. Seja A uma matriz m × n e b um ponto do Rm. Com a identificação usual de pontos commatrizes coluna, mostre que o conjunto

im A = {b ∈ Rm : ∃ x ∈ Rn com Ax = b}

é um subespaço do Rm.

10. Seja B = {v1, . . . , vk} um subconjunto de vetores do subespaço V ⊂ Rn. Suponha que cadavetor v ∈ V se escreva, de maneira única, como combinação linear dos vetores de B. Mostreque B é uma base de V. (Compare com a Proposição 3.37.)


55

�

�“IntAL” — 2009/10/19 — 21:44 — page 40 — #40 �

�

�

�

�

�


De acordo com o Teorema 3.43, podemos obter uma base a partir de qual-quer conjunto linearmente independente. Mas também podemos obter umabase a partir de qualquer conjunto que gera um subespaço:

Proposição 3.47 Suponha que o conjunto {v1, . . . , vk} ⊂ S gere o subes-paço S �= {0}. Então um subconjunto de {v1, . . . , vk} é uma base de S.

Demonstração: Se {v1, . . . , vk} for linearmente dependente, um dos veto-res desse conjunto é combinação linear dos vetores restantes. Retirandoesse vetor, o conjunto restante continua gerando S. Continuamos retirandovetores que são combinação linear dos elementos restantes até obter umconjunto linearmente independente que continua gerando S. �

A demonstração da Proposição 3.47 mostra como obter uma base a partirde um conjunto que gera um subespaço. Contudo, esse processo é muitotrabalhoso: em cada etapa, precisamos verificar se o conjunto de vetoresé linearmente independente; caso contrário, deve-se obter então um ve-tor como combinação linear dos vetores restantes, retirar esse vetor doconjunto e novamente verificar se o conjunto restante é linearmente in-dependente, repetindo o processo, se necessário. Em cada etapa, retira-mos apenas um vetor supérfluo. Gostaríamos, entretanto, de retirar deuma única vez todos os vetores supérfluos. Mostraremos como fazê-lo naObservação 4.23.

Se já sabemos qual a dimensão do subespaço S ⊂ Rn, então a verificaçãode que um conjunto é uma base de S pode ser simplificada.

Teorema 3.48 Sejam Y ⊂ Rn um subespaço de dimensão k e

B = {v1, . . . , vk} ⊂ Y.

Então, se uma das condições seguintes for satisfeita, B é uma base de S:

(i) o conjunto B gera Y;

(ii) o conjunto B é linearmente independente.

Demonstração: Suponhamos inicialmente que B gere Y. Se esse conjuntofosse linearmente dependente, aplicando a Proposição 3.47 obteríamos en-tão um subconjunto de B, com menos que k elementos, que seria uma basede Y. Mas isso contradiz Y ter dimensão k.

Por outro lado, se B fosse linearmente independente e não gerasse Y, exis-tiria vk+1 ∈ Y, que não é combinação linear dos vetores de B. De acordocom a Proposição 3.22 (ou a Observação 3.28), o conjunto {v1, . . . , vk, vk+1}seria linearmente independente. Mas isso contradiz o Teorema 3.39, poisexistiria um conjunto linearmente independente com mais vetores do quea dimensão do espaço. �

�

�“IntAL” — 2009/10/19 — 21:44 — page 41 — #41 �

�

�

�

�

�

3.4. EXERCÍCIOS 41

3.4 Exercícios

1. Determine os valores de a, b e c para que o vetor v = (a, b, c) seja combinação linear dosvetores u1 = (1, 1, 1), u2 = (1, 2, 3) e u3 = (2,−1, 1).

2. Sem utilizar determinantes, verifique se os vetores (−1, 2, 3), (−2,−3, 1) e (3, 2, 1) são linear-mente dependentes ou linearmente independentes.

3. Seja

A =

(1 34 −3

).

Determine x �= 0 tal que Ax = 3x.

4. Encontre um conjunto de geradores para o núcleo da matriz A, dada por

(a)

1 0 1 11 2 1 22 4 2 40 1 1 2

; (b)

−1 2 2 0−1 2 1 0−1 1 2 0

0 0 0 1

.

5. Encontre uma base para o núcleo de A, se

(a)

2 2 3 40 2 3 20 0 1 10 0 0 1

; (b)

1 1 −2−1 2 1

0 1 −1

.

6. Considere os vetores v1 = (4, 2,−3), v2 = (2, 1,−2) e v3 = (−2,−1, 0) e definaU =< v1, v2, v3 >.

(a) Mostre que {v1, v2, v3} é linearmente dependente;(b) calcule a dimensão de U;(c) descreva geometricamente U;(d) ache uma base para U.

7. Sejam v1 = (1, 1, 1) e v2 = (1, 2, 1).

(a) Determine < v1, v2 >. Qual a dimensão desse subespaço do R3?(b) Determine um vetor v3 ∈ R3 de modo que o conjunto {v1, v2, v3} seja uma base do R3.

8. Seja V = {(3a + 4b − 4c, 2a − 4b − 6c,−2a − 4b + 2c) : a, b, c ∈ R}.

(a) Mostre que V é um subespaço do R3;(b) ache uma base para V.

9. Seja A uma matriz m × n e b um ponto do Rm. Com a identificação usual de pontos commatrizes coluna, mostre que o conjunto

im A = {b ∈ Rm : ∃ x ∈ Rn com Ax = b}

é um subespaço do Rm.

10. Seja B = {v1, . . . , vk} um subconjunto de vetores do subespaço V ⊂ Rn. Suponha que cadavetor v ∈ V se escreva, de maneira única, como combinação linear dos vetores de B. Mostreque B é uma base de V. (Compare com a Proposição 3.37.)

3 .4 ExERCÍCIOS

aula 3


�

�“IntAL” — 2009/10/19 — 21:51 — page 43 — #43 �

�

�

�

�

�

Capítulo 4

Aplicações Lineares


1. reconhecer uma aplicação linear;

2. obter sua representação matricial;

3. obter bases para o núcleo e imagem de uma aplicação linear.

4.1 Aplicações Lineares e Matrizes – Parte I

Já vimos o tipo de conjunto que estudaremos neste curso: os (sub)espaçosvetoriais. Agora veremos o tipo especial de funções entre esses conjuntos:as aplicações lineares.

Definição 4.1 Uma aplicação linear é uma função T : Rn → Rm tal que

T(x + λy) = Tx + λTy. (4.1)

Essa definição merece vários comentários. Em primeiro lugar, notamos queestamos representando a imagem do ponto x ∈ Rn por Tx ao invés deT(x). Essa será nossa prática: parênteses só serão utilizados para escla-recer o significado de uma expressão. Em segundo lugar, notamos que asoma de vetores e a multiplicação por escalar presentes em (4.1) possuemsignificados diferentes: no lado esquerdo da igualdade, a soma de veto-res e a multiplicação por escalar ocorrem no espaço Rn, enquanto no ladodireito da igualdade acontecem no espaço Rm. Finalmente, também é usualchamar uma aplicação linear de transformação linear.

Exemplo 4.2 Seja I : Rn → Rn, dada por Ix = x. Então I é uma aplicaçãolinear pois, para x, y ∈ Rn e α ∈ R, temos I(x + αy) = x + αy = Ix + αIy. Aaplicação linear I é chamada aplicação identidade (no espaço Rn). �

Exemplo 4.3 Seja N : Rn → Rm a aplicação definida por Nx = 0 paratodo x ∈ Rn. A aplicação N é chamada aplicação nula, qualquer que sejam, dimensão do espaço Rm. Também se denota por 0 a aplicação nula:0x = 0 para todo x ∈ Rn. (Note que esse é o terceiro emprego distinto dosímbolo 0.) �

43


AULA 4


OBjETIvOSNo final desta aula, o aluno deverá ser capaz de:1. reconhecer uma aplicação linear;2. obter sua representação matricial;3. obter bases para o núcleo e imagem de uma aplicação linear.

4 .1 APLICAÇõES LINEARES E MATRIzES – PARTE I

�

�“IntAL” — 2009/10/19 — 21:51 — page 43 — #43 �

�

�

�

�

�

Capítulo 4



1. reconhecer uma aplicação linear;

2. obter sua representação matricial;

3. obter bases para o núcleo e imagem de uma aplicação linear.

4.1 Aplicações Lineares e Matrizes – Parte I

Já vimos o tipo de conjunto que estudaremos neste curso: os (sub)espaçosvetoriais. Agora veremos o tipo especial de funções entre esses conjuntos:as aplicações lineares.

Definição 4.1 Uma aplicação linear é uma função T : Rn → Rm tal que

T(x + λy) = Tx + λTy. (4.1)

Essa definição merece vários comentários. Em primeiro lugar, notamos queestamos representando a imagem do ponto x ∈ Rn por Tx ao invés deT(x). Essa será nossa prática: parênteses só serão utilizados para escla-recer o significado de uma expressão. Em segundo lugar, notamos que asoma de vetores e a multiplicação por escalar presentes em (4.1) possuemsignificados diferentes: no lado esquerdo da igualdade, a soma de veto-res e a multiplicação por escalar ocorrem no espaço Rn, enquanto no ladodireito da igualdade acontecem no espaço Rm. Finalmente, também é usualchamar uma aplicação linear de transformação linear.

Exemplo 4.2 Seja I : Rn → Rn, dada por Ix = x. Então I é uma aplicaçãolinear pois, para x, y ∈ Rn e α ∈ R, temos I(x + αy) = x + αy = Ix + αIy. Aaplicação linear I é chamada aplicação identidade (no espaço Rn). �

Exemplo 4.3 Seja N : Rn → Rm a aplicação definida por Nx = 0 paratodo x ∈ Rn. A aplicação N é chamada aplicação nula, qualquer que sejam, dimensão do espaço Rm. Também se denota por 0 a aplicação nula:0x = 0 para todo x ∈ Rn. (Note que esse é o terceiro emprego distinto dosímbolo 0.) �

43


58


�

�“IntAL” — 2009/10/19 — 21:51 — page 44 — #44 �

�

�

�

�

�

44 CAPÍTULO 4. APLICAÇÕES LINEARES

Exemplo 4.4 Na seção 2.2 vimos que a identificação de pontos (no caso,do R3) com matrizes coluna nos permitiu interpretar geometricamente umsistema linear em 3 incógnitas. Mas essa mesma identificação, no caso ge-ral do Rn, nos permite mais: ela nos permite interpretar uma matriz m ×n com uma aplicação linear A : Rn → Rm. De fato, dado o ponto x =(x1, . . . , xn) ∈ Rn, escrevendo esse ponto como uma matriz coluna temosque

a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

=

a11x1 + a12x2 + . . . + a1nxna21x1 + a22x2 + . . . + a2nxn

...am1x1 + am2x2 + . . . + amnxn

= Ax ∈ Rm.

Assim, a matriz A = (aij) associa a cada ponto x ∈ Rn, um ponto Ax ∈ Rm.Para mostrar que essa função é linear (e, portanto, uma aplicação linear)basta relembrar propriedades básicas de matrizes:

A(x + λy) = Ax + λAy. �


A =

(2 1 7 51 1 1 1

).

Quais são o domínio e o contra domínio da aplicação linear definida por A? Calcule Ax, sex = (1, 1, 1, 1).

Exemplo 4.6 Seja f : R → R definida por f (x) = x2. A função f é umaaplicação linear? (Lembre-se: R = R1 é um espaço vetorial!)

Uma vez que f (x + y) = (x + y)2 = x2 + 2xy + y2 = f (x) + f (y) + 2xy,vemos que f não é linear. �

Exemplo 4.7 Consideremos T : Rn → Rm definida por

T(x1, . . . , xn) = (a11x1 + . . .+ a1nxn, a21x1 + . . .+ a2nxn, . . . , am1x1 + . . .+ amnxn),

em que os escalares aij, i ∈ {1, . . . , m} e j ∈ {1, . . . , n} são arbitrários. Umcaso particular seria T : R3 → R2 dada por

T(x1, x2, x3) = (3x1 + 2x2, x1 + x2 + 2x3).

Afirmamos que, no caso geral, T é uma aplicação linear. De fato, basta notarque, em cada uma das coordenadas de T, temos

ai1(x1 + λy1) + . . . + ain(xn + λyn) = (ai1x1 + . . . + ainxn) + . . .+λ(ai1y1 + . . . + ainyn).

Dessa igualdade, válida para todo i ∈ {1, . . . , m}, deduzimos que T élinear.

�

�“IntAL” — 2009/10/19 — 21:51 — page 45 — #45 �

�

�

�

�

�

4.1. APLICAÇÕES LINEARES E MATRIZES – PARTE I 45

Se compararmos a definição de Tx com a expressão de Ax no Exemplo4.6, não podemos deixar de perceber a semelhança: cada uma das coor-denadas de Tx coincide com as coordenadas de Ax. Vamos explicar essasemelhança. Para isso, consideremos a base canônica E = {e1, . . . , en} doRn. (Veja o Exemplo 3.31.)

Temos que x = (x1, . . . , xn) = x1e1 + . . . + xnen. Assim, como cada xi é umescalar e ei um vetor, temos

Tx = T(x1e1 + . . . + xnen) = x1Te1 + . . . + xnTen.

De acordo com a definição de Tx, escrevendo a imagem de cada vetor Teicomo uma matriz coluna, obtemos

Tei =

a1ia2i...

ami

e, portanto,

Tx = x1

a11a21...

am1

+ x2

a12a22...

am2

+ . . . + xn

a1na2n

...amn

=

a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

(4.2)

A matriz A = (aij) é chamada representação de T com relação às bases canô-nicas do Rn e Rm. �

Exercício 4.8 Considere T : R2 → R3 definida por

Tx = T(x1, x2) = (3x1 + x2, x1 + x2, x2).

Verifique que T é uma aplicação linear. Calcule a matriz A que representa T com relação às basescanônicas do R2 e R3.

Exercício 4.9 Seja T : Rn → Rm uma aplicação linear qualquer. Mostre que T(0) = 0.

Exemplo 4.10 Consideremos uma aplicação linear qualquer T : Rn → Rm.Vamos mostrar que, como no Exemplo 4.7, podemos identificar T com umamatriz. Para isso, notamos que, escolhida a base canônica do Rn, temos,como antes,

Tx = x1Te1 + . . . + xnTen. (4.3)

Cada Tei (i ∈ {1, . . . , n}) é um ponto do Rm. Denotando

Tei =

a1ia2i...

ami

∈ Rm

�

�“IntAL” — 2009/10/19 — 21:51 — page 44 — #44 �

�

�

�

�

�



a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

=


...am1x1 + am2x2 + . . . + amnxn

= Ax ∈ Rm.


A(x + λy) = Ax + λAy. �


A =

(2 1 7 51 1 1 1

).







T(x1, x2, x3) = (3x1 + 2x2, x1 + x2 + 2x3).




�

�“IntAL” — 2009/10/19 — 21:51 — page 44 — #44 �

�

�

�

�

�



a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

=


...am1x1 + am2x2 + . . . + amnxn

= Ax ∈ Rm.


A(x + λy) = Ax + λAy. �


A =

(2 1 7 51 1 1 1

).







T(x1, x2, x3) = (3x1 + 2x2, x1 + x2 + 2x3).




�

�“IntAL” — 2009/10/19 — 21:51 — page 44 — #44 �

�

�

�

�

�



a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

=


...am1x1 + am2x2 + . . . + amnxn

= Ax ∈ Rm.


A(x + λy) = Ax + λAy. �


A =

(2 1 7 51 1 1 1

).







T(x1, x2, x3) = (3x1 + 2x2, x1 + x2 + 2x3).




�

�“IntAL” — 2009/10/19 — 21:51 — page 44 — #44 �

�

�

�

�

�



a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

=


...am1x1 + am2x2 + . . . + amnxn

= Ax ∈ Rm.


A(x + λy) = Ax + λAy. �


A =

(2 1 7 51 1 1 1

).







T(x1, x2, x3) = (3x1 + 2x2, x1 + x2 + 2x3).





59

aula 4

�

�“IntAL” — 2009/10/19 — 21:51 — page 44 — #44 �

�

�

�

�

�



a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

=


...am1x1 + am2x2 + . . . + amnxn

= Ax ∈ Rm.


A(x + λy) = Ax + λAy. �


A =

(2 1 7 51 1 1 1

).







T(x1, x2, x3) = (3x1 + 2x2, x1 + x2 + 2x3).




�

�“IntAL” — 2009/10/19 — 21:51 — page 45 — #45 �

�

�

�

�

�


Se compararmos a definição de Tx com a expressão de Ax no Exemplo4.6, não podemos deixar de perceber a semelhança: cada uma das coor-denadas de Tx coincide com as coordenadas de Ax. Vamos explicar essasemelhança. Para isso, consideremos a base canônica E = {e1, . . . , en} doRn. (Veja o Exemplo 3.31.)

Temos que x = (x1, . . . , xn) = x1e1 + . . . + xnen. Assim, como cada xi é umescalar e ei um vetor, temos

Tx = T(x1e1 + . . . + xnen) = x1Te1 + . . . + xnTen.

De acordo com a definição de Tx, escrevendo a imagem de cada vetor Teicomo uma matriz coluna, obtemos

Tei =

a1ia2i...

ami

e, portanto,

Tx = x1

a11a21...

am1

+ x2

a12a22...

am2

+ . . . + xn

a1na2n

...amn

=

a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

(4.2)

A matriz A = (aij) é chamada representação de T com relação às bases canô-nicas do Rn e Rm. �

Exercício 4.8 Considere T : R2 → R3 definida por

Tx = T(x1, x2) = (3x1 + x2, x1 + x2, x2).

Verifique que T é uma aplicação linear. Calcule a matriz A que representa T com relação às basescanônicas do R2 e R3.

Exercício 4.9 Seja T : Rn → Rm uma aplicação linear qualquer. Mostre que T(0) = 0.

Exemplo 4.10 Consideremos uma aplicação linear qualquer T : Rn → Rm.Vamos mostrar que, como no Exemplo 4.7, podemos identificar T com umamatriz. Para isso, notamos que, escolhida a base canônica do Rn, temos,como antes,

Tx = x1Te1 + . . . + xnTen. (4.3)

Cada Tei (i ∈ {1, . . . , n}) é um ponto do Rm. Denotando

Tei =

a1ia2i...

ami

∈ Rm

�

�“IntAL” — 2009/10/19 — 21:51 — page 44 — #44 �

�

�

�

�

�



a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

=


...am1x1 + am2x2 + . . . + amnxn

= Ax ∈ Rm.


A(x + λy) = Ax + λAy. �


A =

(2 1 7 51 1 1 1

).







T(x1, x2, x3) = (3x1 + 2x2, x1 + x2 + 2x3).




�

�“IntAL” — 2009/10/19 — 21:51 — page 44 — #44 �

�

�

�

�

�



a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

=


...am1x1 + am2x2 + . . . + amnxn

= Ax ∈ Rm.


A(x + λy) = Ax + λAy. �


A =

(2 1 7 51 1 1 1

).







T(x1, x2, x3) = (3x1 + 2x2, x1 + x2 + 2x3).




�

�“IntAL” — 2009/10/19 — 21:51 — page 44 — #44 �

�

�

�

�

�



a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

=


...am1x1 + am2x2 + . . . + amnxn

= Ax ∈ Rm.


A(x + λy) = Ax + λAy. �


A =

(2 1 7 51 1 1 1

).







T(x1, x2, x3) = (3x1 + 2x2, x1 + x2 + 2x3).





60


�

�“IntAL” — 2009/10/19 — 21:51 — page 46 — #46 �

�

�

�

�

�


e substituindo em (4.3), chegamos, como no exemplo anterior, à igualdade

Tx =

a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

= Ax.

Quer dizer, escolhendo as bases canônicas do Rn e do Rm, qualquer apli-cação linear pode ser representada por uma matriz, chamada representa-ção de T com relação a essas bases canônicas, de modo que Tx = Ax.(Posteriormente veremos porque a base canônica do Rm foi apenas impli-citamente utilizada neste exemplo.) �

Salientamos o resultado que acabamos de mostrar:

Teorema 4.11 Seja T : Rn → Rm uma aplicação linear. Então a matriz querepresenta T com relação às bases canônicas do Rn e Rm é dada por

(Te1 Te2 . . . Ten),

em que Tei é uma matriz coluna.

Cada aplicação linear T : Rn → Rm define uma matriz m × n e vice-versa.Assim, qual é a diferença entre aplicações lineares e matrizes? Essa dife-rença é sutil: uma aplicação linear não depende de escolha de bases nodomínio e contra-domínio; se escolhermos essas bases, toda aplicaçãolinear é representada por uma matriz. Dito de outra maneira, falamos deaplicação linear quando os espaços envolvidos (Rn e Rm) são consideradossem quaisquer bases. Escolhidas as bases nesses espaços, aí então obtemosmatrizes. (Por enquanto, só escolhemos as bases canônicas no Rn e Rm.)

Exemplo 4.12 Seja T : R3 → R2 uma aplicação linear. Suponhamos que

Te1 =

(11

), Te2 =

(31

)e Te3 =

(12

).

Então podemos determinar Tx, qualquer que seja o vetor x ∈ R3. De fato,se x = (3, 2, 1) ∈ R3, então

Tx = 3Te1 + 2Te2 + 1Te2

= 3(

11

)+ 2

(31

)+ 1

(12

)=

(107

).

�

O Exemplo 4.12 nos mostra que aplicações lineares T : Rn → Rm são fun-ções muito rígidas: basta conhecermos seu valor em todos os pontos dabase canônica {e1, . . . , en} do Rn para conhecermos seu valor em qualquerponto do Rn! (No caso de T : R → R, isso significa que basta conhecer aimagem de Te1 = T(1) para conhecermos seu valor em qualquer ponto deR. Compare essa situação com a de uma função qualquer f : R → R.) Masa base canônica não tem nada de extraordinário: o mesmo resultado valepara qualquer base do Rn.

Teorema 4.13 Seja {v1, . . . , vn} uma base doRn. Fixados vetores arbitráriosw1, . . . , wn ∈ Rm, existe uma única aplicação linear T : Rn → Rm tal queTvi = wi.

�

�“IntAL” — 2009/10/19 — 21:51 — page 47 — #47 �

�

�

�

�

�


Demonstração: Dado v ∈ Rn, existem únicos escalares α1, . . . , αn tais quev = α1v1 + . . . + αnvn. Definimos então

Tv = α1w1 + . . . + αnwn.

Temos que T é linear. De fato, se v = α1v1 + . . . + αnvn e u = β1v1 + . . . +βnvn, então v + γu = (α1 + γβ1)v1 + . . . + (αn + γβn)vn, de modo que

T(v + γu) = (α1 + γβ1)w1 + . . . + (αn + γβn)wn

= α1w1 + . . . + αnwn + γ(β1w1 + . . . + βnwn)

= Tv + γTu.

Suponhamos agora que S : Rn → Rm seja uma aplicação linear comSvi = wi. Vamos mostrar que Sv = Tv para todo v ∈ Rn, o que garante aunicidade de T. De fato, se v = α1v1 + . . . + αnvn, então temos,

Sv = S(α1v1 + . . . + αnvn)

= α1Sv1 + . . . + αnSvn = α1w1 + . . . + αnwn = Tv,

mostrando o afirmado. �

Exercício 4.14 Sejam B = {v1 = (1, 1, 0), v2 = (1, 2, 0), v3 = (1, 1, 1)}. Ache a aplicação linearT : R3 → R4 tal que Tv1 = (1, 0, 0, 0), Tv2 = (0, 0, 0, 1) e Tv3 = (1, 1, 1, 1).

A rigidez de uma aplicação linear produz resultados surpreendentes. Porexemplo,

Proposição 4.15 Sejam T : Rn → Rm uma aplicação linear e {v1, . . . , vn}um conjunto qualquer. Se {Tv1, . . . , Tvn} for linearmente independente,então {v1, . . . , vn} é linearmente independente e, portanto, uma base doRn.

Demonstração: Suponhamos que

α1v1 + . . . + αnvn = 0. (4.4)

Queremos provar que αi = 0 para todo i ∈ {1, . . . , n}. Aplicando T emambos os lados da igualdade (4.4), obtemos

0 = T(α1v1 + . . . + αnvn) = α1(Tv1) + . . . + αn(Tvn).

Como os vetores Tv1, . . . , Tvn são linearmente independentes, temosα1 = . . . = αn = 0, como queríamos provar. O fato de {v1, . . . , vn} seruma base do Rn é consequência do Teorema 3.48. �


61

aula 4

�

�“IntAL” — 2009/10/19 — 21:51 — page 46 — #46 �

�

�

�

�

�


e substituindo em (4.3), chegamos, como no exemplo anterior, à igualdade

Tx =

a11 a12 . . . a1na21 a22 . . . a2n...

.... . .

...am1 am2 . . . amn

x1x2...

xn

= Ax.

Quer dizer, escolhendo as bases canônicas do Rn e do Rm, qualquer apli-cação linear pode ser representada por uma matriz, chamada representa-ção de T com relação a essas bases canônicas, de modo que Tx = Ax.(Posteriormente veremos porque a base canônica do Rm foi apenas impli-citamente utilizada neste exemplo.) �

Salientamos o resultado que acabamos de mostrar:

Teorema 4.11 Seja T : Rn → Rm uma aplicação linear. Então a matriz querepresenta T com relação às bases canônicas do Rn e Rm é dada por

(Te1 Te2 . . . Ten),

em que Tei é uma matriz coluna.

Cada aplicação linear T : Rn → Rm define uma matriz m × n e vice-versa.Assim, qual é a diferença entre aplicações lineares e matrizes? Essa dife-rença é sutil: uma aplicação linear não depende de escolha de bases nodomínio e contra-domínio; se escolhermos essas bases, toda aplicaçãolinear é representada por uma matriz. Dito de outra maneira, falamos deaplicação linear quando os espaços envolvidos (Rn e Rm) são consideradossem quaisquer bases. Escolhidas as bases nesses espaços, aí então obtemosmatrizes. (Por enquanto, só escolhemos as bases canônicas no Rn e Rm.)

Exemplo 4.12 Seja T : R3 → R2 uma aplicação linear. Suponhamos que

Te1 =

(11

), Te2 =

(31

)e Te3 =

(12

).

Então podemos determinar Tx, qualquer que seja o vetor x ∈ R3. De fato,se x = (3, 2, 1) ∈ R3, então

Tx = 3Te1 + 2Te2 + 1Te2

= 3(

11

)+ 2

(31

)+ 1

(12

)=

(107

).

�

O Exemplo 4.12 nos mostra que aplicações lineares T : Rn → Rm são fun-ções muito rígidas: basta conhecermos seu valor em todos os pontos dabase canônica {e1, . . . , en} do Rn para conhecermos seu valor em qualquerponto do Rn! (No caso de T : R → R, isso significa que basta conhecer aimagem de Te1 = T(1) para conhecermos seu valor em qualquer ponto deR. Compare essa situação com a de uma função qualquer f : R → R.) Masa base canônica não tem nada de extraordinário: o mesmo resultado valepara qualquer base do Rn.

Teorema 4.13 Seja {v1, . . . , vn} uma base doRn. Fixados vetores arbitráriosw1, . . . , wn ∈ Rm, existe uma única aplicação linear T : Rn → Rm tal queTvi = wi.

�

�“IntAL” — 2009/10/19 — 21:51 — page 47 — #47 �

�

�

�

�

�


Demonstração: Dado v ∈ Rn, existem únicos escalares α1, . . . , αn tais quev = α1v1 + . . . + αnvn. Definimos então

Tv = α1w1 + . . . + αnwn.

Temos que T é linear. De fato, se v = α1v1 + . . . + αnvn e u = β1v1 + . . . +βnvn, então v + γu = (α1 + γβ1)v1 + . . . + (αn + γβn)vn, de modo que

T(v + γu) = (α1 + γβ1)w1 + . . . + (αn + γβn)wn

= α1w1 + . . . + αnwn + γ(β1w1 + . . . + βnwn)

= Tv + γTu.

Suponhamos agora que S : Rn → Rm seja uma aplicação linear comSvi = wi. Vamos mostrar que Sv = Tv para todo v ∈ Rn, o que garante aunicidade de T. De fato, se v = α1v1 + . . . + αnvn, então temos,

Sv = S(α1v1 + . . . + αnvn)

= α1Sv1 + . . . + αnSvn = α1w1 + . . . + αnwn = Tv,


Exercício 4.14 Sejam B = {v1 = (1, 1, 0), v2 = (1, 2, 0), v3 = (1, 1, 1)}. Ache a aplicação linearT : R3 → R4 tal que Tv1 = (1, 0, 0, 0), Tv2 = (0, 0, 0, 1) e Tv3 = (1, 1, 1, 1).

A rigidez de uma aplicação linear produz resultados surpreendentes. Porexemplo,

Proposição 4.15 Sejam T : Rn → Rm uma aplicação linear e {v1, . . . , vn}um conjunto qualquer. Se {Tv1, . . . , Tvn} for linearmente independente,então {v1, . . . , vn} é linearmente independente e, portanto, uma base doRn.

Demonstração: Suponhamos que

α1v1 + . . . + αnvn = 0. (4.4)

Queremos provar que αi = 0 para todo i ∈ {1, . . . , n}. Aplicando T emambos os lados da igualdade (4.4), obtemos

0 = T(α1v1 + . . . + αnvn) = α1(Tv1) + . . . + αn(Tvn).

Como os vetores Tv1, . . . , Tvn são linearmente independentes, temosα1 = . . . = αn = 0, como queríamos provar. O fato de {v1, . . . , vn} seruma base do Rn é consequência do Teorema 3.48. �


62


�

�“IntAL” — 2009/10/19 — 21:51 — page 48 — #48 �

�

�

�

�

�


4.2 Espaço Linha e Espaço Coluna

Definimos agora os dois subespaços fundamentais associados a uma apli-cação linear:

Definição 4.16 Seja T : Rn → Rm uma aplicação linear. Definimos a ima-gem de T, denotada por im T, por

im T = {y ∈ Rm : y = Tx}.

Definimos o núcleo de T, denotado por ker T, por

ker T = {x ∈ Rn : Tx = 0}.

O núcleo e a imagem de T são subespaços vetoriais do domínio de T (istoé, o Rn) e do contradomínio de T (isto é, o Rm), respectivamente. De fato, sex1, x2 ∈ ker T e λ ∈ R, então T(x1 + λx2) = T(x1) + λT(x2) = 0 + λ0 = 0,provando que x1 + λx2 ∈ ker T. Se y1, y2 ∈ im T, então existem x1, x2 ∈ Xtais que y1 = T(x1) e y2 = T(x2). Logo, se λ ∈ R, y1 + λy2 = T(x1) +λT(x2) = T(x1 + λx2), o que mostra que y1 + λy2 ∈ im T.

O subespaço ker T já havia sido definido para uma matriz A. Existe algumadiferença entre as duas definições dadas? Como dissemos, ao definirmosker T, o espaço Rn está sendo considerado sem qualquer base (ou seja, semqualquer sistema de eixos coordenados); se A for a matriz que representaT (com relação às bases canônicas do Rn e Rm), então os elementos de ker Testão sendo descritos em relação à base canônica do Rn. Os elementos decada conjunto são os mesmos, mas não existem coordenadas envolvidasna definição de ker T!

Muitos problemas envolvem a obtenção de bases para esses dois subespa-ços. Em geral, partimos da base canônica para então obtermos uma baseadequada para cada um deles. Por esse motivo, muito do que faremos uti-liza a linguagem de matrizes.

Por isso, nesta seção estudaremos mais detalhadamente a matriz A = (aij).Como sabemos, ela pode ser vista por meio de suas linhas ou colunas:

A =

a11 . . . a1n...

. . ....

am1 . . . amn

= (c1 . . . cn) =

�1...�m

. (4.5)

Os vetores coluna c1, . . . , cn são naturalmente identificados com vetores doRm. Se C = {c1, . . . , cn}, chamamos de espaço coluna o espaço gerado por C,isto é, < C > ⊂ Rm.

Por outro lado, podemos interpretar as linhas de A como elementos dopróprio espaço Rn. Se denotarmos L = {�1, . . . , �m} ⊂ Kn, chamamos deespaço linha o espaço gerado por L, isto é, < L > ⊂ Kn.

Observação 4.17 Um vetor é identificado com uma matriz coluna:

(x1, . . . , xn) ←→

x1x2...

xn

.

�

�“IntAL” — 2009/10/19 — 21:51 — page 49 — #49 �

�

�

�

�

�

4.2. ESPAÇO LINHA E ESPAÇO COLUNA 49

A identificação de um vetor com uma matriz linha

(x1, . . . , xn) ←→ (x1 x2 . . . xn),

como feita na definição do espaço linha, é excepcional e deve ser evitada,pelo menos neste primeiro curso. �

Exemplo 4.18 Considere a matriz

A =

(2 1 11 1 2

).

O espaço coluna de A é o subespaço do R2

< C > =

{α

(21

)+ β

(11

)+ γ

(12

): α, β, γ ∈ R

}.

Como as duas primeiras colunas de A são dadas por vetores linearmenteindependentes, é claro que < C >= R2.

Por outro lado, o espaço linha de A é o subespaço do R3

< L > = {α(2, 1, 1) + β(1, 1, 2) : α, β ∈ R} .

Como as duas primeiras linhas de A são dadas por vetores linearmenteindependentes, < L > é um plano do R3. Note que as dimensões de < L >e < C > são iguais. �

Mas, qual o significado dos subespaços < C > e < L >? Começamosinterpretando o espaço coluna de uma matriz.

Lema 4.19 Considere o sistema linear não homogêneo Ax = b, em queA = (aij) é uma matriz m × n. Então são equivalentes:

(i) existe solução x para Ax = b;

(ii) o vetor b é combinação linear das colunas de A.

Demonstração: Basta notar que o sistema Ax = b é equivalente à equação

x1

a11a21...

am1

+ x2

a12a22...

am2

+ . . . + xn

a1na2n

...amn

=

b1b2...

bm

, (4.6)

de acordo com a equação (4.2).

Quer dizer, se x = (x1, . . . , xn) ∈ Rn for uma solução de Ax = b, entãob é combinação linear das colunas de A por meio dos escalares x1, . . . , xn.Reciprocamente, se existirem escalares x1, . . . , xn de modo que b seja com-binação linear das colunas de A, então o vetor x = (x1, . . . , xn) ∈ Rn ésolução de Ax = b. �

Em outras palavras, acabamos de mostrar que < C > é o subespaço im A.

Definição 4.20 Se A = (aij) for uma matriz m × n, definimos a transpostade A como a matriz n × m At = (at

ij), com atij = aji.

4 .2 ESPAÇO LINHA E ESPAÇO COLUNA


63

aula 4

�

�“IntAL” — 2009/10/19 — 21:51 — page 48 — #48 �

�

�

�

�

�


4.2 Espaço Linha e Espaço Coluna

Definimos agora os dois subespaços fundamentais associados a uma apli-cação linear:

Definição 4.16 Seja T : Rn → Rm uma aplicação linear. Definimos a ima-gem de T, denotada por im T, por

im T = {y ∈ Rm : y = Tx}.

Definimos o núcleo de T, denotado por ker T, por

ker T = {x ∈ Rn : Tx = 0}.

O núcleo e a imagem de T são subespaços vetoriais do domínio de T (istoé, o Rn) e do contradomínio de T (isto é, o Rm), respectivamente. De fato, sex1, x2 ∈ ker T e λ ∈ R, então T(x1 + λx2) = T(x1) + λT(x2) = 0 + λ0 = 0,provando que x1 + λx2 ∈ ker T. Se y1, y2 ∈ im T, então existem x1, x2 ∈ Xtais que y1 = T(x1) e y2 = T(x2). Logo, se λ ∈ R, y1 + λy2 = T(x1) +λT(x2) = T(x1 + λx2), o que mostra que y1 + λy2 ∈ im T.

O subespaço ker T já havia sido definido para uma matriz A. Existe algumadiferença entre as duas definições dadas? Como dissemos, ao definirmosker T, o espaço Rn está sendo considerado sem qualquer base (ou seja, semqualquer sistema de eixos coordenados); se A for a matriz que representaT (com relação às bases canônicas do Rn e Rm), então os elementos de ker Testão sendo descritos em relação à base canônica do Rn. Os elementos decada conjunto são os mesmos, mas não existem coordenadas envolvidasna definição de ker T!

Muitos problemas envolvem a obtenção de bases para esses dois subespa-ços. Em geral, partimos da base canônica para então obtermos uma baseadequada para cada um deles. Por esse motivo, muito do que faremos uti-liza a linguagem de matrizes.

Por isso, nesta seção estudaremos mais detalhadamente a matriz A = (aij).Como sabemos, ela pode ser vista por meio de suas linhas ou colunas:

A =

a11 . . . a1n...

. . ....

am1 . . . amn

= (c1 . . . cn) =

�1...�m

. (4.5)

Os vetores coluna c1, . . . , cn são naturalmente identificados com vetores doRm. Se C = {c1, . . . , cn}, chamamos de espaço coluna o espaço gerado por C,isto é, < C > ⊂ Rm.

Por outro lado, podemos interpretar as linhas de A como elementos dopróprio espaço Rn. Se denotarmos L = {�1, . . . , �m} ⊂ Kn, chamamos deespaço linha o espaço gerado por L, isto é, < L > ⊂ Kn.

Observação 4.17 Um vetor é identificado com uma matriz coluna:

(x1, . . . , xn) ←→

x1x2...

xn

.

�

�“IntAL” — 2009/10/19 — 21:51 — page 49 — #49 �

�

�

�

�

�


A identificação de um vetor com uma matriz linha

(x1, . . . , xn) ←→ (x1 x2 . . . xn),

como feita na definição do espaço linha, é excepcional e deve ser evitada,pelo menos neste primeiro curso. �

Exemplo 4.18 Considere a matriz

A =

(2 1 11 1 2

).

O espaço coluna de A é o subespaço do R2

< C > =

{α

(21

)+ β

(11

)+ γ

(12

): α, β, γ ∈ R

}.

Como as duas primeiras colunas de A são dadas por vetores linearmenteindependentes, é claro que < C >= R2.

Por outro lado, o espaço linha de A é o subespaço do R3

< L > = {α(2, 1, 1) + β(1, 1, 2) : α, β ∈ R} .

Como as duas primeiras linhas de A são dadas por vetores linearmenteindependentes, < L > é um plano do R3. Note que as dimensões de < L >e < C > são iguais. �

Mas, qual o significado dos subespaços < C > e < L >? Começamosinterpretando o espaço coluna de uma matriz.

Lema 4.19 Considere o sistema linear não homogêneo Ax = b, em queA = (aij) é uma matriz m × n. Então são equivalentes:

(i) existe solução x para Ax = b;

(ii) o vetor b é combinação linear das colunas de A.

Demonstração: Basta notar que o sistema Ax = b é equivalente à equação

x1

a11a21...

am1

+ x2

a12a22...

am2

+ . . . + xn

a1na2n

...amn

=

b1b2...

bm

, (4.6)

de acordo com a equação (4.2).

Quer dizer, se x = (x1, . . . , xn) ∈ Rn for uma solução de Ax = b, entãob é combinação linear das colunas de A por meio dos escalares x1, . . . , xn.Reciprocamente, se existirem escalares x1, . . . , xn de modo que b seja com-binação linear das colunas de A, então o vetor x = (x1, . . . , xn) ∈ Rn ésolução de Ax = b. �

Em outras palavras, acabamos de mostrar que < C > é o subespaço im A.

Definição 4.20 Se A = (aij) for uma matriz m × n, definimos a transpostade A como a matriz n × m At = (at

ij), com atij = aji.


64


�

�“IntAL” — 2009/10/19 — 21:51 — page 50 — #50 �

�

�

�

�

�


Logo, se A for a matriz dada por (4.5), então

At =

a11 . . . am1...

. . ....

a1n . . . amn

.

Assim, as colunas da matriz At são justamente as linhas da matriz A. Comoconsequência imediata do Lema 4.19, temos que

< L > = im At. (4.7)

Utilizando essas interpretações para os espaços linha e coluna de uma ma-triz, estamos em condições de resolver um problema fundamental: dadauma matriz A, encontrar bases para os espaços ker A e im A. Para isso,enunciamos o seguinte

Corolário 4.21 Seja A uma matriz m × n e R sua forma escalonada redu-zida por linhas. Então as colunas de A correspondentes aos pivôs de Rformam uma base do espaço coluna de A.

Demonstração: Considere a matriz aumentada (A|b), com b ∈ im A e suaforma escalonada reduzida por linhas (R|b′). É fácil ver que as colunasde R correspondentes aos pivôs formam uma base do espaço coluna de R.Quer dizer, existe uma solução x de (R|b′) com coordenadas não nulas ape-nas nas posições correspondentes aos pivôs. Como as soluções de Ax = be Rx = b′ são as mesmas, a equação (4.6) garante que combinações linearesde colunas de R produzem combinações lineares das colunas correspon-dentes de A. Em particular, as colunas de A correspondentes aos pivôs deR são linearmente independentes e geram o espaço coluna de A. �

Estude o próximo exemplo e então releia a demonstração do Corolário 4.21.

Exemplo 4.22 Vamos obter bases para o núcleo e a imagem da matriz

A =

3 1 2 4 11 1 1 1 22 2 2 1 1

.

Para obter o núcleo, resolvemos Ax = 0 levando a matriz A a sua formaescalonada reduzida por linhas:

3 1 2 4 11 1 1 1 22 2 2 1 1

−→

1 0 1/2 0 −50 1 1/2 0 40 0 0 1 3

.

Escrevendo as variáveis correspondentes aos pivôs em termos da variáveislivres, obtemos a solução geral do sistema homogêneo associado.

x1x2x3x4x5

= x3

−1/2−1/2

100

+ x5

5−4

0−3

1

(4.8)

�

�“IntAL” — 2009/10/19 — 21:51 — page 51 — #51 �

�

�

�

�

�


Assim, podemos concluir que o núcleo de A é um subespaço de dimensão2, gerado pelos vetores

u1 =

−1/2−1/2

100

∈ R5 e u2 =

5−4

0−3

1

∈ R5.

De acordo com o Corolário 4.21, temos que os vetores

v1 =

312

, v2 =

112

e v3 =

411

formam uma base da imagem de A, pois estes vetores coluna correspon-dem às posições dos pivôs na forma escalonada reduzida por linhas de A.

Vamos aproveitar este exemplo e ilustrar a demonstração do Corolário4.21. Se quisermos escrever a última coluna da matriz A como combina-ção linear das colunas de A correspondentes aos pivôs, basta tomar o vetorcorrespondente à variável livre x5. Esse vetor tem a quinta coordenada nãonula.

5−4

0−3

1

.

Essa é uma solução de Ax = 0. Assim,

5

312

− 4

112

+ 0

212

− 3

411

+ 1

121

=

000

.

Ou seja,

121

= −5

312

+ 4

112

+ 3

411

.

Veja que esses mesmos escalares escrevem a última coluna da matriz Rcomo combinação linear das colunas correspondentes aos pivôs:

−543

= −5

100

+ 4

010

+ 3

001

.

�

Observação 4.23 Resulta do Corolário 4.21 um método simples para a ob-tenção de uma base do subespaço < v1, . . . , vk >⊂ Rn: basta formar amatriz A = (v1 v2 . . . vk) e então selecionar as colunas correspondentesaos pivôs da sua forma escalonada reduzida por linhas. Compare com aObservação 3.23.

Um outro método para obter-se uma base para a imagem da matriz A con-siste em escrever suas colunas como linhas, ou seja, considerar a matriztransposta. Uma vez que o processo de escalonamento de uma matriz (nocaso, de At) produz apenas combinações lineares das linhas envolvidas,faz com que o espaço gerado por essas linhas seja conservado no processode escalonamento. Assim, as linhas não nulas da forma escalonada de At


65

aula 4

�

�“IntAL” — 2009/10/19 — 21:51 — page 50 — #50 �

�

�

�

�

�


Logo, se A for a matriz dada por (4.5), então

At =

a11 . . . am1...

. . ....

a1n . . . amn

.

Assim, as colunas da matriz At são justamente as linhas da matriz A. Comoconsequência imediata do Lema 4.19, temos que

< L > = im At. (4.7)

Utilizando essas interpretações para os espaços linha e coluna de uma ma-triz, estamos em condições de resolver um problema fundamental: dadauma matriz A, encontrar bases para os espaços ker A e im A. Para isso,enunciamos o seguinte

Corolário 4.21 Seja A uma matriz m × n e R sua forma escalonada redu-zida por linhas. Então as colunas de A correspondentes aos pivôs de Rformam uma base do espaço coluna de A.

Demonstração: Considere a matriz aumentada (A|b), com b ∈ im A e suaforma escalonada reduzida por linhas (R|b′). É fácil ver que as colunasde R correspondentes aos pivôs formam uma base do espaço coluna de R.Quer dizer, existe uma solução x de (R|b′) com coordenadas não nulas ape-nas nas posições correspondentes aos pivôs. Como as soluções de Ax = be Rx = b′ são as mesmas, a equação (4.6) garante que combinações linearesde colunas de R produzem combinações lineares das colunas correspon-dentes de A. Em particular, as colunas de A correspondentes aos pivôs deR são linearmente independentes e geram o espaço coluna de A. �

Estude o próximo exemplo e então releia a demonstração do Corolário 4.21.

Exemplo 4.22 Vamos obter bases para o núcleo e a imagem da matriz

A =

3 1 2 4 11 1 1 1 22 2 2 1 1

.

Para obter o núcleo, resolvemos Ax = 0 levando a matriz A a sua formaescalonada reduzida por linhas:

3 1 2 4 11 1 1 1 22 2 2 1 1

−→

1 0 1/2 0 −50 1 1/2 0 40 0 0 1 3

.

Escrevendo as variáveis correspondentes aos pivôs em termos da variáveislivres, obtemos a solução geral do sistema homogêneo associado.

x1x2x3x4x5

= x3

−1/2−1/2

100

+ x5

5−4

0−3

1

(4.8)

�

�“IntAL” — 2009/10/19 — 21:51 — page 51 — #51 �

�

�

�

�

�


Assim, podemos concluir que o núcleo de A é um subespaço de dimensão2, gerado pelos vetores

u1 =

−1/2−1/2

100

∈ R5 e u2 =

5−4

0−3

1

∈ R5.

De acordo com o Corolário 4.21, temos que os vetores

v1 =

312

, v2 =

112

e v3 =

411

formam uma base da imagem de A, pois estes vetores coluna correspon-dem às posições dos pivôs na forma escalonada reduzida por linhas de A.

Vamos aproveitar este exemplo e ilustrar a demonstração do Corolário4.21. Se quisermos escrever a última coluna da matriz A como combina-ção linear das colunas de A correspondentes aos pivôs, basta tomar o vetorcorrespondente à variável livre x5. Esse vetor tem a quinta coordenada nãonula.

5−4

0−3

1

.

Essa é uma solução de Ax = 0. Assim,

5

312

− 4

112

+ 0

212

− 3

411

+ 1

121

=

000

.

Ou seja,

121

= −5

312

+ 4

112

+ 3

411

.

Veja que esses mesmos escalares escrevem a última coluna da matriz Rcomo combinação linear das colunas correspondentes aos pivôs:

−543

= −5

100

+ 4

010

+ 3

001

.

�

Observação 4.23 Resulta do Corolário 4.21 um método simples para a ob-tenção de uma base do subespaço < v1, . . . , vk >⊂ Rn: basta formar amatriz A = (v1 v2 . . . vk) e então selecionar as colunas correspondentesaos pivôs da sua forma escalonada reduzida por linhas. Compare com aObservação 3.23.

Um outro método para obter-se uma base para a imagem da matriz A con-siste em escrever suas colunas como linhas, ou seja, considerar a matriztransposta. Uma vez que o processo de escalonamento de uma matriz (nocaso, de At) produz apenas combinações lineares das linhas envolvidas,faz com que o espaço gerado por essas linhas seja conservado no processode escalonamento. Assim, as linhas não nulas da forma escalonada de At


66


�

�“IntAL” — 2009/10/19 — 21:51 — page 52 — #52 �

�

�

�

�

�


são linearmente independentes e, escritas novamente como colunas, pro-duzem uma base para im A.

Note, contudo, que ao utilizar esse método, temos que escalonar duas ma-trizes distintas: a matriz A, para obter uma base para ker A, e a matriz At,para produzir uma base para im A. Quer dizer, a aplicação do Corolário4.21 é um método muito mais eficaz! �

Vamos agora relacionar as dimensões dos subespaços < C > e < L >de uma matriz A. Mostraremos que esses espaços têm a mesma dimen-são; isso é um fato notável, pois eles são subespaços de espaços vetoriaisdiferentes!

Teorema 4.24 Dada uma matriz m × n, seu espaço linha tem a mesma dimensãode seu espaço coluna.

Demonstração: Suponhamos que os vetores

b1 = (b11, b12, . . . , b1n), b2 = (b21, b22, . . . , b2n), . . . , br = (br1, br2, . . . , brn)

formem uma base do espaço linha da matriz A. Então cada linha �i de A écombinação linear desses elementos:

�1 = λ11b1 + . . . + λ1rbr

�2 = λ21b1 + . . . + λ2rbr... =

...�m = λm1b1 + . . . + λmrbr

Igualando a componente j de cada uma dessas equações, obtemos

a1j = λ11b1j + λ12b2j + . . . + λ1rbrj

a2j = λ21b1j + λ22b2j + . . . + λ2rbrj

... =...

amj = λm1b1j + λm2b2j + . . . + λmrbrj.

Assim,

a1ja2j...

amj

= b1j

λ11λ21

...λm1

+ b2j

λ12λ22

...λm2

+ . . . + brj

λ1rλ2r

...λmr

,

mostrando que as colunas de A são combinações lineares dos r vetores

λ11λ21

...λm1

, . . . ,

λ1rλ2r

...λmr

.

Isso quer dizer que o espaço coluna tem dimensão, no máximo, igual a r,ou seja,

dim < C > ≤ dim < L > .

Procedendo da mesma maneira com relação a uma base do espaço coluna,mostramos que

dim < L > ≤ dim < C > .

Assim, essas duas dimensões são iguais.1 �

�

�“IntAL” — 2009/10/19 — 21:51 — page 53 — #53 �

�

�

�

�

�

4.3. MULTIPLICAÇÃO DE MATRIZES 53

Definição 4.25 Definimos o posto da matriz A, denotado por posto A,como sendo

dim < C > = dim < L > .

Se A for uma representação matricial da aplicação linear T, definimos

posto T = posto A.

O seguinte resultado decorre imediatamente do Teorema 4.24:

Corolário 4.26 Seja A uma matriz m × n. Então,

dim(im A) = dim(im At).

4.3 Multiplicação de Matrizes

Sem dúvida, uma das definições mais estranhas da Matemática parece sera da multiplicação de matrizes: dadas as matrizes B = (bik), p × m, e A =(akj), m × n, e então o produto BA é a matriz d = (dij), definida por

dij =m

∑k=1

bikakj = (bi1 bi2 . . . bim)

a1ja2j...

amj

,

correspondente à multiplicação da linha �i da matriz B pela coluna cj damatriz A.

Historicamente, a definição da multiplicação de matrizes foi imposição deum fato muito mais elementar: a composição de funções (no caso, apli-cações lineares). Começamos mostrando que a composição de aplicaçõeslineares também define uma aplicação linear:

Lema 4.27 Sejam T : Rn → Rm e S : Rm → Rp duas aplicações lineares.Então a composta S ◦ T : Rn → Rp é uma aplicação linear:

Rn T→ Rm S→ Rp.

Demonstração: De fato, se x + λy ∈ Rn, então

(S ◦ T)(x + λy) = S(T(x + λy)

)

= S(Tx + λTy

)= S(Tx) + λS(Ty)

= (S ◦ T)x + λ(S ◦ T)y,

provando o afirmado. �

Suponhamos que T : Rn → Rm e S : Rm → Rp sejam representadas (comrelação às bases canônicas dos espaços envolvidos) pelas matrizes A e B,respectivamente. Assim,

Tx = Ax ∀ x ∈ Rn e Sy = By ∀ y ∈ Rm. (4.9)

Uma vez que Tx ∈ Rm, temos então que

(S ◦ T)x = S(Tx) = B(Ax) = (BA)x,

�

�“IntAL” — 2009/10/19 — 21:51 — page 53 — #53 �

�

�

�

�

�



dim < C > = dim < L > .


posto T = posto A.






dij =m

∑k=1


a1ja2j...

amj

,




Rn T→ Rm S→ Rp.


(S ◦ T)(x + λy) = S(T(x + λy)

)

= S(Tx + λTy

)= S(Tx) + λS(Ty)

= (S ◦ T)x + λ(S ◦ T)y,





(S ◦ T)x = S(Tx) = B(Ax) = (BA)x,

1 Podemos notar que mostramos

para qualquer matriz. Aplicando esse fato à matriz At, obtemos o resultado.


67

aula 4

�

�“IntAL” — 2009/10/19 — 21:51 — page 52 — #52 �

�

�

�

�

�


são linearmente independentes e, escritas novamente como colunas, pro-duzem uma base para im A.

Note, contudo, que ao utilizar esse método, temos que escalonar duas ma-trizes distintas: a matriz A, para obter uma base para ker A, e a matriz At,para produzir uma base para im A. Quer dizer, a aplicação do Corolário4.21 é um método muito mais eficaz! �

Vamos agora relacionar as dimensões dos subespaços < C > e < L >de uma matriz A. Mostraremos que esses espaços têm a mesma dimen-são; isso é um fato notável, pois eles são subespaços de espaços vetoriaisdiferentes!

Teorema 4.24 Dada uma matriz m × n, seu espaço linha tem a mesma dimensãode seu espaço coluna.

Demonstração: Suponhamos que os vetores

b1 = (b11, b12, . . . , b1n), b2 = (b21, b22, . . . , b2n), . . . , br = (br1, br2, . . . , brn)

formem uma base do espaço linha da matriz A. Então cada linha �i de A écombinação linear desses elementos:

�1 = λ11b1 + . . . + λ1rbr

�2 = λ21b1 + . . . + λ2rbr... =

...�m = λm1b1 + . . . + λmrbr

Igualando a componente j de cada uma dessas equações, obtemos

a1j = λ11b1j + λ12b2j + . . . + λ1rbrj

a2j = λ21b1j + λ22b2j + . . . + λ2rbrj

... =...

amj = λm1b1j + λm2b2j + . . . + λmrbrj.

Assim,

a1ja2j...

amj

= b1j

λ11λ21

...λm1

+ b2j

λ12λ22

...λm2

+ . . . + brj

λ1rλ2r

...λmr

,

mostrando que as colunas de A são combinações lineares dos r vetores

λ11λ21

...λm1

, . . . ,

λ1rλ2r

...λmr

.

Isso quer dizer que o espaço coluna tem dimensão, no máximo, igual a r,ou seja,

dim < C > ≤ dim < L > .

Procedendo da mesma maneira com relação a uma base do espaço coluna,mostramos que

dim < L > ≤ dim < C > .

Assim, essas duas dimensões são iguais.1 �

�

�“IntAL” — 2009/10/19 — 21:51 — page 53 — #53 �

�

�

�

�

�



dim < C > = dim < L > .


posto T = posto A.






dij =m

∑k=1


a1ja2j...

amj

,




Rn T→ Rm S→ Rp.


(S ◦ T)(x + λy) = S(T(x + λy)

)

= S(Tx + λTy

)= S(Tx) + λS(Ty)

= (S ◦ T)x + λ(S ◦ T)y,





(S ◦ T)x = S(Tx) = B(Ax) = (BA)x,

4 .3 MULTIPLICAÇÃO DE MATRIzES

�

�“IntAL” — 2009/10/19 — 21:51 — page 53 — #53 �

�

�

�

�

�



dim < C > = dim < L > .


posto T = posto A.






dij =m

∑k=1


a1ja2j...

amj

,




Rn T→ Rm S→ Rp.


(S ◦ T)(x + λy) = S(T(x + λy)

)

= S(Tx + λTy

)= S(Tx) + λS(Ty)

= (S ◦ T)x + λ(S ◦ T)y,





(S ◦ T)x = S(Tx) = B(Ax) = (BA)x,


68


�

�“IntAL” — 2009/10/19 — 21:51 — page 54 — #54 �

�

�

�

�

�


vemos que a composta S ◦ T é representada pela matriz BA. Esse fato jus-tifica uma notação frequentemente usada: ao invés de denotarmos S ◦ T,escrevemos simplesmente ST.

Mas, como obter a definição da multiplicação de matrizes BA a partir dacomposição ST de aplicações lineares? É o que passaremos a mostrar.

Partimos da linearidade da aplicação S:

Sx = S(x1e1 + . . . + xmem) = x1Se1 + . . . + xmSem. (4.10)

Denotando

Sej =

b1jb2j...

bmj

,

concluímos que

Sx =

b11x1 + . . . + b1mxmb21x1 + . . . + b2mxm

...bp1x1 + . . . + apmxm

, (4.11)

expressão resultante de (4.10) e da definição da adição de vetores no Rm.

Suponhamos que T : Rn → Rm e S : Rm → Rp sejam representadas (comrelação às bases canônicas dos espaços envolvidos) pelas matrizes A e B,respectivamente. Quer dizer,

A =(Te1 Te2 . . . Ten

)=

(c1 c2 . . . cn

)

e

B = (Se1 Se2 . . . Sem) =

b11 b12 . . . b1mb21 b22 . . . b2m

......

. . ....

bp1 bp2 . . . bpm

,

em que a matriz A está sendo denotada por suas colunas.

A aplicação linear ST : Rn → Rp é representada, com relação às bases canô-nicas do Rn e Rp, por uma matriz D (denotada por suas colunas) definidapor

D =((ST)e1 (ST)e2 . . . (ST)en

).

Para obter D, notamos que (ST)ej = S(Tej) = Scj, o que implica

D =(Sc1 Sc2 . . . Scn

).

Uma vez que (ST)x = (BA)x, obtemos a definição do produto BA, deacordo com a equação (4.11): a j-ésima coluna de BA é dada por

b11 b12 . . . b1mb21 b22 . . . b2m

......

. . ....

bp1 bp2 . . . bpm

a1ja2j...

amj

=

b11a1j + b12a2j + . . . + b1mamjb21a1j + b22a2j + . . . + b2mamj

...bp1a1j + bp2a2j + . . . + bpmamj

.

�

�“IntAL” — 2009/10/19 — 21:51 — page 55 — #55 �

�

�

�

�

�

4.4. EXERCÍCIOS 55

4.4 Exercícios

1. Considere as aplicações do R2

(a) Π1 : R2 → R2

Π1(x1, x2) = (x1, 0) (b) Π2 : R2 → R2

Π1(x1, x2) = (0, x2)

(c) R1 : R2 → R2

R1(x1, x2) = (x1,−x2)(d) R2 : R2 → R2

R2(x1, x2) = (−x1, x2).

Mostre que cada uma dessas aplicações é linear e encontre sua representação matricial (comrelação à base canônica do R2). Interprete-as geometricamente.

2. Verifique se a aplicação linear definida pela matriz A é injetora, se

(a) A =

1 1 11 2 32 3 4

; (b) A =

1 1 11 2 31 2 1

; (c) A =

0 1 11 1 20 0 1

.

3. Escreva a equação

123

= x1

123

+ x2

258

+ x3

323

na forma de um sistema não homogêneo Ax = b. Resolva-o, se esse sistema possuir solução.

4. Encontre bases para o espaço linha e para o espaço coluna da matriz A, dada por

(a)

1 2 1 12 1 2 10 1 1 0

; (b)

1 2 1 12 1 2 10 1 1 01 0 0 0

(c)

1 −2 12 1 −20 −1 1

.

5. Encontre bases para o núcleo e imagem da matriz

1 2 2 3 1 42 4 5 5 4 93 6 7 8 5 9

.

Determine o posto dessa matriz.

6. Seja T : Rn → Rm uma aplicação linear e {v1, . . . , vn} uma base do Rn. Mostre que im T égerada pelos vetores Tv1, Tv2, . . . , Tvn.

7. Seja A = (c1 c2 . . . cn) uma matriz quadrada, dada por suas colunas. Mostre que {c1, . . . , cn}é linearmente dependente se, e somente se, det A = 0.

8. Sejam A, B matrizes n × n. Mostre que AB = 0 se, e somente se, o espaço coluna de B estivercontido no núcleo de A.


69

�

�“IntAL” — 2009/10/19 — 21:51 — page 54 — #54 �

�

�

�

�

�


vemos que a composta S ◦ T é representada pela matriz BA. Esse fato jus-tifica uma notação frequentemente usada: ao invés de denotarmos S ◦ T,escrevemos simplesmente ST.

Mas, como obter a definição da multiplicação de matrizes BA a partir dacomposição ST de aplicações lineares? É o que passaremos a mostrar.

Partimos da linearidade da aplicação S:

Sx = S(x1e1 + . . . + xmem) = x1Se1 + . . . + xmSem. (4.10)

Denotando

Sej =

b1jb2j...

bmj

,

concluímos que

Sx =

b11x1 + . . . + b1mxmb21x1 + . . . + b2mxm

...bp1x1 + . . . + apmxm

, (4.11)

expressão resultante de (4.10) e da definição da adição de vetores no Rm.

Suponhamos que T : Rn → Rm e S : Rm → Rp sejam representadas (comrelação às bases canônicas dos espaços envolvidos) pelas matrizes A e B,respectivamente. Quer dizer,

A =(Te1 Te2 . . . Ten

)=

(c1 c2 . . . cn

)

e

B = (Se1 Se2 . . . Sem) =

b11 b12 . . . b1mb21 b22 . . . b2m

......

. . ....

bp1 bp2 . . . bpm

,

em que a matriz A está sendo denotada por suas colunas.

A aplicação linear ST : Rn → Rp é representada, com relação às bases canô-nicas do Rn e Rp, por uma matriz D (denotada por suas colunas) definidapor

D =((ST)e1 (ST)e2 . . . (ST)en

).

Para obter D, notamos que (ST)ej = S(Tej) = Scj, o que implica

D =(Sc1 Sc2 . . . Scn

).

Uma vez que (ST)x = (BA)x, obtemos a definição do produto BA, deacordo com a equação (4.11): a j-ésima coluna de BA é dada por

b11 b12 . . . b1mb21 b22 . . . b2m

......

. . ....

bp1 bp2 . . . bpm

a1ja2j...

amj

=

b11a1j + b12a2j + . . . + b1mamjb21a1j + b22a2j + . . . + b2mamj

...bp1a1j + bp2a2j + . . . + bpmamj

.

�

�“IntAL” — 2009/10/19 — 21:51 — page 55 — #55 �

�

�

�

�

�

4.4. EXERCÍCIOS 55

4.4 Exercícios

1. Considere as aplicações do R2

(a) Π1 : R2 → R2

Π1(x1, x2) = (x1, 0) (b) Π2 : R2 → R2

Π1(x1, x2) = (0, x2)

(c) R1 : R2 → R2

R1(x1, x2) = (x1,−x2)(d) R2 : R2 → R2

R2(x1, x2) = (−x1, x2).

Mostre que cada uma dessas aplicações é linear e encontre sua representação matricial (comrelação à base canônica do R2). Interprete-as geometricamente.

2. Verifique se a aplicação linear definida pela matriz A é injetora, se

(a) A =

1 1 11 2 32 3 4

; (b) A =

1 1 11 2 31 2 1

; (c) A =

0 1 11 1 20 0 1

.

3. Escreva a equação

123

= x1

123

+ x2

258

+ x3

323

na forma de um sistema não homogêneo Ax = b. Resolva-o, se esse sistema possuir solução.

4. Encontre bases para o espaço linha e para o espaço coluna da matriz A, dada por

(a)

1 2 1 12 1 2 10 1 1 0

; (b)

1 2 1 12 1 2 10 1 1 01 0 0 0

(c)

1 −2 12 1 −20 −1 1

.

5. Encontre bases para o núcleo e imagem da matriz

1 2 2 3 1 42 4 5 5 4 93 6 7 8 5 9

.

Determine o posto dessa matriz.

6. Seja T : Rn → Rm uma aplicação linear e {v1, . . . , vn} uma base do Rn. Mostre que im T égerada pelos vetores Tv1, Tv2, . . . , Tvn.

7. Seja A = (c1 c2 . . . cn) uma matriz quadrada, dada por suas colunas. Mostre que {c1, . . . , cn}é linearmente dependente se, e somente se, det A = 0.

8. Sejam A, B matrizes n × n. Mostre que AB = 0 se, e somente se, o espaço coluna de B estivercontido no núcleo de A.

4 .4 ExERCÍCIOS

aula 4


�

�“IntAL” — 2009/10/19 — 21:59 — page 57 — #57 �

�

�

�

�

�

Capítulo 5

O Teorema do Núcleo e daImagem


1. aplicar o teorema (da dimensão) do núcleo e da imagem;

2. obter a inversa de uma matriz por meio da forma escalonada redu-zida por linhas.

5.1 Teorema (da dimensão) do Núcleo e da Ima-gem

Nesta seção mostraremos um dos resultados mais importantes da ÁlgebraLinear, com implicações importantes no estudo de sistemas lineares.

Teorema 5.1 (do Núcleo e da Imagem)

Seja T : Rn → Rm uma aplicação linear. Então,

n = dim ker T + dim im T.

Demonstração: Se ker T �= {0}, seja {x1, . . . , xj} uma base de ker T. Esse éum conjunto linearmente independente no espaço Rn, de modo que pode-mos aplicar o Teorema 3.43 e obter uma base

B = {x1, . . . , xj, wj+1, . . . , wn}

do Rn. (Se ker T = {0}, simplesmente tomamos uma base do Rn.)

Afirmamos que {Twj+1, . . . , Twn} é uma base de im T ⊂ Y. De fato, supo-nhamos que

αj+1Twj+1 + . . . + αnTwn = 0.

Daí decorre que T(αj+1wj+1 + . . . + αnwn) = 0; definindo

w = αj+1wj+1 + . . . + αnwn,

concluímos que w ∈ ker T. Como {x1, . . . , xj} é uma base de ker T, temosque

w = β1x1 + . . . + β jxj.

57


AULA 5

O Teorema do Núcleo e da Imagem

OBjETIvOSNo final desta aula, o aluno deverá ser capaz de:1. aplicar o teorema (da dimensão) do núcleo e da imagem;2. obter a inversa de uma matriz por meio da forma escalonada reduzida por

linhas.

5 .1 TEOREMA (DA DIMENSÃO) DO NúCLEO E DA IMAGEM

�

�“IntAL” — 2009/10/19 — 21:59 — page 57 — #57 �

�

�

�

�

�

Capítulo 5

O Teorema do Núcleo e daImagem


1. aplicar o teorema (da dimensão) do núcleo e da imagem;

2. obter a inversa de uma matriz por meio da forma escalonada redu-zida por linhas.

5.1 Teorema (da dimensão) do Núcleo e da Ima-gem

Nesta seção mostraremos um dos resultados mais importantes da ÁlgebraLinear, com implicações importantes no estudo de sistemas lineares.

Teorema 5.1 (do Núcleo e da Imagem)

Seja T : Rn → Rm uma aplicação linear. Então,

n = dim ker T + dim im T.

Demonstração: Se ker T �= {0}, seja {x1, . . . , xj} uma base de ker T. Esse éum conjunto linearmente independente no espaço Rn, de modo que pode-mos aplicar o Teorema 3.43 e obter uma base

B = {x1, . . . , xj, wj+1, . . . , wn}

do Rn. (Se ker T = {0}, simplesmente tomamos uma base do Rn.)

Afirmamos que {Twj+1, . . . , Twn} é uma base de im T ⊂ Y. De fato, supo-nhamos que

αj+1Twj+1 + . . . + αnTwn = 0.

Daí decorre que T(αj+1wj+1 + . . . + αnwn) = 0; definindo

w = αj+1wj+1 + . . . + αnwn,

concluímos que w ∈ ker T. Como {x1, . . . , xj} é uma base de ker T, temosque

w = β1x1 + . . . + β jxj.

57


72


�

�“IntAL” — 2009/10/19 — 21:59 — page 58 — #58 �

�

�

�

�

�

58 CAPÍTULO 5. O TEOREMA DO NÚCLEO E DA IMAGEM

Ou seja,β1x1 + . . . + β jxj − αj+1wj − . . . − αnwn = 0.

Como B é uma base do Rn, concluímos que β1 = . . . = β j = −αj+1 == . . . = −αn = 0. Isso mostra que os vetores Twj+1, . . . , Twn são linear-mente independentes.

Seja agora y ∈ im T. Então existe x ∈ Rn tal que Tx = y. Como B é base deRn, x = α1x1 + . . . + αjxj + αj+1wj+1 + . . . + αnwn e, portanto,

y = Tx = α1Tx1 + . . . + αjTxj + αj+1Twj+1 + . . . + αnTwn

= αj+1Twj+1 + . . . + αnTwn,

pois Txi = 0, i ∈ {1, . . . , j}. Isso mostra que {Twj+1, . . . , Twn} gera im T econclui a prova. �

5.2 Isomorfismos e Inversas

Definição 5.2 Seja T : Rn → Rm uma aplicação linear. Dizemos que T é umisomorfismo se T for uma bijeção.1

Em geral, não é fácil verificar que uma função f : X → Y é injetora ousobrejetora. No caso de aplicações lineares, essa verificação é muito maissimples, como veremos.

Vamos mostrar que, se n �= m, então T : Rn → Rm não é um isomorfismo.

Lema 5.3 Se m > n, então T : Rn → Rm não é sobrejetora.

Demonstração: Pelo Teorema do Núcleo e da Imagem, temos que

dim im T = n − dim ker T ≤ n.

Como n < m, não podemos ter dim im T = m. �

Exemplo 5.4 Considere a aplicação linear S : R2 → R3 dada por

S(x1, x2) = (x1, x2, x1 + x2).

É fácil verificar que S é injetora. Mas S não é sobrejetora, pois não existex = (x1, x2) ∈ R2 tal que Sx = (1, 1, 0). �

Lema 5.5 Uma aplicação linear T : Rn → Rm é injetora se, e somente se,ker T = {0}.

Demonstração: Se existir x �= 0 tal que Tx = 0, então, T não é injetora, poistambém temos T(0) = 0.

Suponhamos agora ker T = {0} e que existam x1, x2 tais que Tx1 = Tx2.Daí decorre que Tx1 −Tx2 = 0, ou seja, T(x1 − x2) = 0. A última igualdadegarante que x1 − x2 ∈ ker T, isto é, x1 − x2 = 0 e, portanto, x1 = x2. Issomostra que T é injetora. �

Exercício 5.6 Seja T : R2 → R2 definida por T(x, y) = (2x + y, 3x + 2y). Mostre que T é injetora.Conclua que T é um isomorfismo. Obtenha a expressão de T−1.

�

�“IntAL” — 2009/10/19 — 21:59 — page 59 — #59 �

�

�

�

�

�

5.2. ISOMORFISMOS E INVERSAS 59

Corolário 5.7 Seja T : Rn → Rm uma aplicação linear. Se m < n, então,ker T �= {0}.

Demonstração: Pelo Teorema do Núcleo e da Imagem, temos

n = dim ker T + dim im T ≤ dim ker T + m,

pois dim im T ≤ m. Como m < n, temos dim ker T ≥ 1. �

Observe que o Corolário 5.7 nada mais é do que uma paráfrase do Teorema1.19. De fato, a aplicação T pode ser representada por uma matriz A, m× n.Pelo Teorema 1.19, Ax = 0 possui infinitas soluções. Ou seja, dim ker A ≥ 1ou, o que é o mesmo, dim ker T ≥ 1.

Resulta imediatamente dos Lemas 5.3 e 5.5 que

Teorema 5.8 Uma aplicação linear T : Rn → Rm só pode ser um isomor-fismo se tivermos n = m.

Exemplo 5.9 A aplicação linear S : R3 → R3 dada por S(x1, x2, x3) == (x1, x2, 0) não é uma bijeção, pois S(0, 0, 1) = (0, 0, 0). �

A verificação de que uma aplicação T : Rn → Rn é um isomorfismo é bas-tante simples:

Teorema 5.10 Uma aplicação linear T : Rn → Rn é injetora se, e somentese, for sobrejetora.

Demonstração: De fato, se tivermos ker T = {0}, então

dim im T = n − dim ker T = n.

Como a dimensão da imagem de T é igual a dimensão do contradomíniode T, temos que T é sobrejetora. Da mesma forma, se T for sobrejetora,então dim im T = n e daí deduzimos, como antes, dim ker T = 0. �

A formulação do Teorema 5.10 em termos de sistemas lineares é a seguinte:

Corolário 5.11 Seja A uma matriz n × n. Então o sistema não homogêneoAx = b tem solução única para todo b ∈ Y se, e somente se, o sistemahomogêneo Ax = 0 tiver solução única.

(Note que o Corolário 5.11 nada mais é do que o Teorema 1.21.)

De acordo com o Corolário 4.26, temos dim im A = dim im At para todamatriz A. Em geral, temos dim ker A �= dim ker At, a igualdade sendo vá-lida apenas para matrizes quadradas:

Corolário 5.12 Seja A uma matriz n × n. Então,

dim(ker A) = dim(ker At).

Demonstração: De fato, denotando r := dim(im A) = dim(im At), a apli-cação do Teorema do Núcleo e da Imagem garante que:

dim(ker A) = n − r e dim(ker At) = n − r.

Daí decorre o afirmado. �

5 .2 ISOMORFISMO E INvERSAS

�

�“IntAL” — 2009/10/19 — 21:59 — page 58 — #58 �

�

�

�

�

�






= αj+1Twj+1 + . . . + αnTwn,











S(x1, x2) = (x1, x2, x1 + x2).






1 Uma função f : X Y é injetora, se f (x1) = f (x2) implicar x1 = x2; uma função f : X Y é sobrejetora se, para todo y ϵ Y, existir x ϵ X tal que f (x) =y. Uma função f : X Y é uma bijeção, se f for injetora e sobrejetora.


73

aula 5

�

�“IntAL” — 2009/10/19 — 21:59 — page 58 — #58 �

�

�

�

�

�






= αj+1Twj+1 + . . . + αnTwn,











S(x1, x2) = (x1, x2, x1 + x2).






�

�“IntAL” — 2009/10/19 — 21:59 — page 59 — #59 �

�

�

�

�

�

5.2. ISOMORFISMOS E INVERSAS 59

Corolário 5.7 Seja T : Rn → Rm uma aplicação linear. Se m < n, então,ker T �= {0}.

Demonstração: Pelo Teorema do Núcleo e da Imagem, temos

n = dim ker T + dim im T ≤ dim ker T + m,

pois dim im T ≤ m. Como m < n, temos dim ker T ≥ 1. �

Observe que o Corolário 5.7 nada mais é do que uma paráfrase do Teorema1.19. De fato, a aplicação T pode ser representada por uma matriz A, m× n.Pelo Teorema 1.19, Ax = 0 possui infinitas soluções. Ou seja, dim ker A ≥ 1ou, o que é o mesmo, dim ker T ≥ 1.

Resulta imediatamente dos Lemas 5.3 e 5.5 que

Teorema 5.8 Uma aplicação linear T : Rn → Rm só pode ser um isomor-fismo se tivermos n = m.

Exemplo 5.9 A aplicação linear S : R3 → R3 dada por S(x1, x2, x3) == (x1, x2, 0) não é uma bijeção, pois S(0, 0, 1) = (0, 0, 0). �

A verificação de que uma aplicação T : Rn → Rn é um isomorfismo é bas-tante simples:

Teorema 5.10 Uma aplicação linear T : Rn → Rn é injetora se, e somentese, for sobrejetora.

Demonstração: De fato, se tivermos ker T = {0}, então

dim im T = n − dim ker T = n.

Como a dimensão da imagem de T é igual a dimensão do contradomíniode T, temos que T é sobrejetora. Da mesma forma, se T for sobrejetora,então dim im T = n e daí deduzimos, como antes, dim ker T = 0. �

A formulação do Teorema 5.10 em termos de sistemas lineares é a seguinte:

Corolário 5.11 Seja A uma matriz n × n. Então o sistema não homogêneoAx = b tem solução única para todo b ∈ Y se, e somente se, o sistemahomogêneo Ax = 0 tiver solução única.

(Note que o Corolário 5.11 nada mais é do que o Teorema 1.21.)

De acordo com o Corolário 4.26, temos dim im A = dim im At para todamatriz A. Em geral, temos dim ker A �= dim ker At, a igualdade sendo vá-lida apenas para matrizes quadradas:

Corolário 5.12 Seja A uma matriz n × n. Então,

dim(ker A) = dim(ker At).

Demonstração: De fato, denotando r := dim(im A) = dim(im At), a apli-cação do Teorema do Núcleo e da Imagem garante que:

dim(ker A) = n − r e dim(ker At) = n − r.

Daí decorre o afirmado. �

�

�“IntAL” — 2009/10/19 — 21:59 — page 58 — #58 �

�

�

�

�

�






= αj+1Twj+1 + . . . + αnTwn,











S(x1, x2) = (x1, x2, x1 + x2).







74


�

�“IntAL” — 2009/10/19 — 21:59 — page 60 — #60 �

�

�

�

�

�


Suponhamos que T : Rn → Rn seja um isomorfismo. (Isso quer dizer, emparticular, que T é linear.) Sabemos que T−1 : Rn → Rn existe. Tambémtemos que T−1 é uma aplicação linear?

Proposição 5.13 Suponhamos que T : Rn → Rn seja um isomorfismo.Então T−1 : Rn → Rn é uma aplicação linear.

Demonstração: Como T é linear, vale T(x1 + αx2) = Tx1 + αTx2. Apli-cando T−1 em ambos os lados dessa igualdade, obtemos

x1 + αx2 = T−1(Tx1 + αTx2).

Denotando z1 = Tx1 e z2 = Tx2, temos T−1z1 = x1, T−1z2 = x2 e

T−1(z1 + αz2) = x1 + αx2 = T−1z1 + αT−1z2,

provando a linearidade de T−1. �

Observação 5.14 Um isomorfismo T : Rn → Rn (veja o Teorema 5.8)corresponde a um “tradutor perfeito” entre o domínio de T (que é todoo Rn) e a imagem de T (que também é todo o Rn). O resultado de cadaoperação realizada no domínio de T corresponde, por meio de T, à mesmaoperação realizada na imagem de T, por meio da lei T(x1 + αx2) = Tx1 +αTx2. Além disso, o resultado de cada operação realizada em im T cor-responde à mesma operação realizada no domínio de T, por meio da lei:T−1(y1 + αy2) = T−1y1 + αT−1y2.

Comparemos com uma bijeção simples: f : R → R definida por f (x) = x3.Para verificar que f é injetora temos que provar que f (x1) = f (x2) implicax1 = x2. Ou seja, de x3

1 = x32 devemos obter x1 = x2. Ora,

x31 = x3

2 ⇔ 3√

x31 = 3

√x3

2 ⇔ x1 = x2.

Seja agora y ∈ R. Queremos provar que y ∈ im f , ou seja, que existe x ∈ Rtal que f (x) = y. Essa igualdade é o mesmo que x3 = y, de onde vemx = 3

√y. Assim, f é uma bijeção. Mas 8 = f (2) = f (1+ 1) �= f (1) + f (1) =

= 13 + 13 = 1 + 1 = 2.

Para verificar que uma aplicação linear T : Rn → Rn é uma bijeção, nãoprecisamos verificar que T é injetora e sobrejetora: basta verificar que T éinjetora, de acordo com Teorema 5.10! �

Exercício 5.15 Na demonstração do Teorema do Núcleo e da Imagem 5.1, mostre que T estabeleceum isomorfismo entre < wk+1, . . . , wn > e im T.

�

�“IntAL” — 2009/10/19 — 21:59 — page 61 — #61 �

�

�

�

�

�

5.3. OBTENÇÃO DA INVERSA DE UMA MATRIZ 61

5.3 Obtenção da Inversa de uma Matriz

Dado um isomorfismo T : Rn → Rn, como obter a aplicação inversaT−1 : Rn → Rn? Em geral, é mais fácil obter uma matriz A que representaT e então a inversa da matriz A. Relembramos:

Definição 5.16 Uma matriz B é inversa da matriz quadrada A se

AB = BA = I,

em que I é a matriz identidade. Se A possuir inversa, dizemos que A éinvertível.

É fácil ver que uma matriz invertível A possui uma única inversa,que denotaremos por A−1. De fato, suponhamos que AB = BA = I eAC = CA = I. Queremos mostrar que B = C. Temos

B = B(AC) = (BA)C = IC = C,

provando o afirmado.

Proposição 5.17 Seja A uma matriz quadrada. Suponhamos que exista umamatriz quadrada B tal que BA = I. Então

AB = I,

de modo que B = A−1 é a inversa de A.

Demonstração: Da igualdade BA = I deduzimos que ker A = {0}. Defato, se existisse x �= 0 tal Ax = 0, então BAx = B(0) = 0, o que contradizBAx = Ix = x �= 0. Como A é uma matriz quadrada, isso quer dizer queA é sobrejetora, de acordo com o Teorema 5.10. Portanto, A possui inversaA−1. Como BA = I, multiplicando essa igualdade à direita por A−1, vemBAA−1 = A−1, ou seja, provamos que B = A−1. �

O cálculo da inversa de uma matriz por meio da adjunta (clássica) da ma-triz quadrada A não é um método eficiente. Vamos mostrar uma maneiramais simples de obter a inversa de uma matriz quadrada.

Decorre do Lema 5.5 que uma matriz quadrada A é invertível se, e somentese, ker A = {0}. Em termos da forma escalonada reduzida por linhas damatriz A, isto quer dizer que não existem variáveis livres, pois a existênciadestas garante a existência de infinitos elementos x tais que Ax = 0. (Veja,a esse respeito, a Observação 1.12.) Uma vez que a forma escalonada Rda matriz n × n A possui n pivôs, vemos que R = I, em que I é a matrizidentidade.

Definição 5.18 Uma matriz E é elementar se puder ser obtida da matrizidentidade m × m por meio da aplicação de uma operação elementar.

O próximo resultado mostra que a aplicação de uma operação elementarsobre as linhas da matriz A é equivalente à multiplicação dessa matriz poruma matriz elementar.

Proposição 5.19 Seja e uma operação elementar sobre (as linhas de) a ma-triz A, m× n e E a matriz elementar igual a e(I), sendo I a matriz identidadem × m. Então e(A) = EA.


75

aula 5

�

�“IntAL” — 2009/10/19 — 21:59 — page 60 — #60 �

�

�

�

�

�


Suponhamos que T : Rn → Rn seja um isomorfismo. (Isso quer dizer, emparticular, que T é linear.) Sabemos que T−1 : Rn → Rn existe. Tambémtemos que T−1 é uma aplicação linear?

Proposição 5.13 Suponhamos que T : Rn → Rn seja um isomorfismo.Então T−1 : Rn → Rn é uma aplicação linear.

Demonstração: Como T é linear, vale T(x1 + αx2) = Tx1 + αTx2. Apli-cando T−1 em ambos os lados dessa igualdade, obtemos

x1 + αx2 = T−1(Tx1 + αTx2).

Denotando z1 = Tx1 e z2 = Tx2, temos T−1z1 = x1, T−1z2 = x2 e

T−1(z1 + αz2) = x1 + αx2 = T−1z1 + αT−1z2,

provando a linearidade de T−1. �

Observação 5.14 Um isomorfismo T : Rn → Rn (veja o Teorema 5.8)corresponde a um “tradutor perfeito” entre o domínio de T (que é todoo Rn) e a imagem de T (que também é todo o Rn). O resultado de cadaoperação realizada no domínio de T corresponde, por meio de T, à mesmaoperação realizada na imagem de T, por meio da lei T(x1 + αx2) = Tx1 +αTx2. Além disso, o resultado de cada operação realizada em im T cor-responde à mesma operação realizada no domínio de T, por meio da lei:T−1(y1 + αy2) = T−1y1 + αT−1y2.

Comparemos com uma bijeção simples: f : R → R definida por f (x) = x3.Para verificar que f é injetora temos que provar que f (x1) = f (x2) implicax1 = x2. Ou seja, de x3

1 = x32 devemos obter x1 = x2. Ora,

x31 = x3

2 ⇔ 3√

x31 = 3

√x3

2 ⇔ x1 = x2.

Seja agora y ∈ R. Queremos provar que y ∈ im f , ou seja, que existe x ∈ Rtal que f (x) = y. Essa igualdade é o mesmo que x3 = y, de onde vemx = 3

√y. Assim, f é uma bijeção. Mas 8 = f (2) = f (1+ 1) �= f (1) + f (1) =

= 13 + 13 = 1 + 1 = 2.

Para verificar que uma aplicação linear T : Rn → Rn é uma bijeção, nãoprecisamos verificar que T é injetora e sobrejetora: basta verificar que T éinjetora, de acordo com Teorema 5.10! �

Exercício 5.15 Na demonstração do Teorema do Núcleo e da Imagem 5.1, mostre que T estabeleceum isomorfismo entre < wk+1, . . . , wn > e im T.

�

�“IntAL” — 2009/10/19 — 21:59 — page 61 — #61 �

�

�

�

�

�


5.3 Obtenção da Inversa de uma Matriz

Dado um isomorfismo T : Rn → Rn, como obter a aplicação inversaT−1 : Rn → Rn? Em geral, é mais fácil obter uma matriz A que representaT e então a inversa da matriz A. Relembramos:

Definição 5.16 Uma matriz B é inversa da matriz quadrada A se

AB = BA = I,

em que I é a matriz identidade. Se A possuir inversa, dizemos que A éinvertível.

É fácil ver que uma matriz invertível A possui uma única inversa,que denotaremos por A−1. De fato, suponhamos que AB = BA = I eAC = CA = I. Queremos mostrar que B = C. Temos

B = B(AC) = (BA)C = IC = C,

provando o afirmado.

Proposição 5.17 Seja A uma matriz quadrada. Suponhamos que exista umamatriz quadrada B tal que BA = I. Então

AB = I,

de modo que B = A−1 é a inversa de A.

Demonstração: Da igualdade BA = I deduzimos que ker A = {0}. Defato, se existisse x �= 0 tal Ax = 0, então BAx = B(0) = 0, o que contradizBAx = Ix = x �= 0. Como A é uma matriz quadrada, isso quer dizer queA é sobrejetora, de acordo com o Teorema 5.10. Portanto, A possui inversaA−1. Como BA = I, multiplicando essa igualdade à direita por A−1, vemBAA−1 = A−1, ou seja, provamos que B = A−1. �

O cálculo da inversa de uma matriz por meio da adjunta (clássica) da ma-triz quadrada A não é um método eficiente. Vamos mostrar uma maneiramais simples de obter a inversa de uma matriz quadrada.

Decorre do Lema 5.5 que uma matriz quadrada A é invertível se, e somentese, ker A = {0}. Em termos da forma escalonada reduzida por linhas damatriz A, isto quer dizer que não existem variáveis livres, pois a existênciadestas garante a existência de infinitos elementos x tais que Ax = 0. (Veja,a esse respeito, a Observação 1.12.) Uma vez que a forma escalonada Rda matriz n × n A possui n pivôs, vemos que R = I, em que I é a matrizidentidade.

Definição 5.18 Uma matriz E é elementar se puder ser obtida da matrizidentidade m × m por meio da aplicação de uma operação elementar.

O próximo resultado mostra que a aplicação de uma operação elementarsobre as linhas da matriz A é equivalente à multiplicação dessa matriz poruma matriz elementar.

Proposição 5.19 Seja e uma operação elementar sobre (as linhas de) a ma-triz A, m× n e E a matriz elementar igual a e(I), sendo I a matriz identidadem × m. Então e(A) = EA.

5 .3 OBTENÇÃO DA INvERSA DE UMA MATRIz


76


�

�“IntAL” — 2009/10/19 — 21:59 — page 62 — #62 �

�

�

�

�

�


Demonstração: A demonstração deve ser feita para todos os tipos de ope-ração elementar. Consideraremos apenas a aplicação de uma operação ele-mentar (c): a linha j será substituída pela soma da linha j com λ vezes alinha i. A matriz E, nesse caso, é dada por

E =

1 0 . . . 0...

...0 . . . λ . . . 1 . . . 0...

...0 0 . . . 1

← linha j

↑coluna j

Então,

EA =

1 0 . . . 0...

...0 . . . λ . . . 1 . . . 0...

...0 0 . . . 1

a11 a12 . . . a1n...

...aj1 aj2 . . . ajn...

...am1 am2 . . . amn

=

a11 a12 . . . a1n...

...aj1 + λai1 aj2 + λai2 . . . ajn + λain

......

am1 am2 . . . amn

,

que é justamente e(A). �

Ora, uma sequência de operações elementares produz a forma escalonadareduzida por linhas da matriz invertível A, isto é, produz a matriz identi-dade. Quer dizer,

ekek−1 . . . e1(A) = I.

Exercício 5.20 Justifique a afirmação anterior. Isto é, mostre que a forma escalonada reduzida porlinhas de uma matriz n × n invertível é a matriz identidade n × n.

Em termos das matrizes elementares, isso quer dizer que

EkEk−1 . . . E1 A = I.

Definindo a matriz B = EkEk−1 . . . E1, acabamos de mostrar que BA = I.Mas isso significa que B = A−1, de acordo com a Proposição 5.17. Paraobter B, basta então aplicar a sequência de operações elementares ek . . . e1à matriz I, pois

ek . . . e1(A) = Ek . . . E1I = Ek . . . E1 = B.

Exemplo 5.21 Para obter a inversa da matriz

A =

1 1 1 02 1 4 02 3 5 00 0 0 1

,

�

�“IntAL” — 2009/10/19 — 21:59 — page 63 — #63 �

�

�

�

�

�


consideramos (A|I), em que I é a matriz identidade 4 × 4 e levamos a ma-triz A à sua forma escalonada reduzida por linhas:

1 1 1 0∣∣ 1 0 0 0

2 1 4 0∣∣ 0 1 0 0

2 3 5 0∣∣ 0 0 1 0

0 0 0 1∣∣ 0 0 0 1

→

1 1 1 0∣∣ 1 0 0 0

0 1 −2 0∣∣ 2 −1 0 0

0 1 3 0∣∣ −2 0 1 0

0 0 0 1∣∣ 0 0 0 1

→

1 0 3 0∣∣ −1 1 0 0

0 1 −2 0∣∣ 2 −1 0 0

0 0 5 0∣∣ −4 1 1 0

0 0 0 1∣∣ 0 0 0 1

→

1 0 3 0∣∣ −1 1 0 0

0 1 −2 0∣∣ 2 −1 0 0

0 0 1 0∣∣ − 4

515

15 0

0 0 0 1∣∣ 0 0 0 1

→

1 0 0 0∣∣∣ 7

525 − 3

5 0

0 1 0 0∣∣∣ 2

5 − 35

25 0

0 0 1 0∣∣∣ − 4

515

15 0

0 0 0 1∣∣∣ 0 0 0 1

A matriz do lado direito é a inversa da matriz A. �


77

aula 5

�

�“IntAL” — 2009/10/19 — 21:59 — page 62 — #62 �

�

�

�

�

�


Demonstração: A demonstração deve ser feita para todos os tipos de ope-ração elementar. Consideraremos apenas a aplicação de uma operação ele-mentar (c): a linha j será substituída pela soma da linha j com λ vezes alinha i. A matriz E, nesse caso, é dada por

E =

1 0 . . . 0...

...0 . . . λ . . . 1 . . . 0...

...0 0 . . . 1

← linha j

↑coluna j

Então,

EA =

1 0 . . . 0...

...0 . . . λ . . . 1 . . . 0...

...0 0 . . . 1

a11 a12 . . . a1n...

...aj1 aj2 . . . ajn...

...am1 am2 . . . amn

=

a11 a12 . . . a1n...

...aj1 + λai1 aj2 + λai2 . . . ajn + λain

......

am1 am2 . . . amn

,

que é justamente e(A). �

Ora, uma sequência de operações elementares produz a forma escalonadareduzida por linhas da matriz invertível A, isto é, produz a matriz identi-dade. Quer dizer,

ekek−1 . . . e1(A) = I.

Exercício 5.20 Justifique a afirmação anterior. Isto é, mostre que a forma escalonada reduzida porlinhas de uma matriz n × n invertível é a matriz identidade n × n.

Em termos das matrizes elementares, isso quer dizer que

EkEk−1 . . . E1 A = I.

Definindo a matriz B = EkEk−1 . . . E1, acabamos de mostrar que BA = I.Mas isso significa que B = A−1, de acordo com a Proposição 5.17. Paraobter B, basta então aplicar a sequência de operações elementares ek . . . e1à matriz I, pois

ek . . . e1(A) = Ek . . . E1I = Ek . . . E1 = B.

Exemplo 5.21 Para obter a inversa da matriz

A =

1 1 1 02 1 4 02 3 5 00 0 0 1

,

�

�“IntAL” — 2009/10/19 — 21:59 — page 63 — #63 �

�

�

�

�

�


consideramos (A|I), em que I é a matriz identidade 4 × 4 e levamos a ma-triz A à sua forma escalonada reduzida por linhas:

1 1 1 0∣∣ 1 0 0 0

2 1 4 0∣∣ 0 1 0 0

2 3 5 0∣∣ 0 0 1 0

0 0 0 1∣∣ 0 0 0 1

→

1 1 1 0∣∣ 1 0 0 0

0 1 −2 0∣∣ 2 −1 0 0

0 1 3 0∣∣ −2 0 1 0

0 0 0 1∣∣ 0 0 0 1

→

1 0 3 0∣∣ −1 1 0 0

0 1 −2 0∣∣ 2 −1 0 0

0 0 5 0∣∣ −4 1 1 0

0 0 0 1∣∣ 0 0 0 1

→

1 0 3 0∣∣ −1 1 0 0

0 1 −2 0∣∣ 2 −1 0 0

0 0 1 0∣∣ − 4

515

15 0

0 0 0 1∣∣ 0 0 0 1

→

1 0 0 0∣∣∣ 7

525 − 3

5 0

0 1 0 0∣∣∣ 2

5 − 35

25 0

0 0 1 0∣∣∣ − 4

515

15 0

0 0 0 1∣∣∣ 0 0 0 1

A matriz do lado direito é a inversa da matriz A. �


78


�

�“IntAL” — 2009/10/19 — 21:59 — page 64 — #64 �

�

�

�

�

�


5.4 Exercícios

1. Dê exemplos de aplicações lineares T : R3 → R3 tais que

(a) ker T = {x ∈ R3 : x3 = −x1};(b) im T = {x ∈ R3 : x1 = x2}.

2. Seja � : R3 → R uma aplicação linear.

(a) Mostre que existem escalares a, b e c tais que �(x1, x2, x3) = ax1 + bx2 + cx3;(b) descreva geometricamente todas as possibilidade para ker �.

3. Verdadeiro ou falso? Se for verdadeiro, justifique. Se for falso, dê um contraexemplo.Seja T : Rn → Rm uma aplicação linear.

(a) Uma base de im T é obtida ao se completar uma base de ker T, de modo a ter uma basedo Rn e então calcular a imagem desses vetores adicionais por T;

(b) uma base de im T é Te1, . . . , Ten;(c) toda função f : R → R é bijetora.

4. Seja T : Rn → Rm uma aplicação linear. Mostre que T é injetora se, e somente se, a imagem detodo conjunto linearmente independente (no Rn) for um conjunto linearmente independente(no Rm).

5. Encontre, se possível, as inversas das seguintes matrizes:

(a)

1 2 21 3 11 3 2

; (b)

1 1 1 11 2 −1 21 −1 2 11 3 3 2

; (c)

1 1 1 11 3 1 21 2 −1 15 9 1 6

.

6. Encontre todos os valores de a para os quais a matriz

A =

1 1 01 0 01 2 a

possui inversa.

�

�“IntAL” — 2009/10/17 — 10:02 — page 65 — #65 �

�

�

�

�

�

Capítulo 6

Mudanças de Base


1. obter as coordenadas de um vetor em diferentes bases;

2. obter a representação matricial de uma aplicação linear em diferentesbases;

3. saber como essas representações matriciais se relacionam.

6.1 Representação de um Vetor em uma Base

Como dissemos, uma base no Rn equivale a um sistema referencial, isto é, aum sistema de coordenadas. Mudando o sistema de coordenadas, mudamas coordenadas do ponto, mas o ponto permanece o mesmo.

Exemplo 6.1 Sejam v1 = (1, 1) e v2 = (−1, 1). É claro que B = {v1, v2}é uma base do R2. Consideremos x = (2, 2) ∈ R2. Na base B, temosx = 2v1 + 0v2. Quer dizer, as coordenadas de x na base B são 2 e 0. �

Figura 6.1: fig6.1

Figura 6.1: As coordenadas de x = (2, 2) na base B são 2 e 0, pois x = 2v1 + 0v2.

O exemplo anterior nos coloca algumas questões. Em primeiro lugar, comorepresentar as coordenadas do ponto x na base B? E, considerada uma baseB do Rn, como obter as coordenadas do ponto x na base B?

65

5 .4 ExERCÍCIOS


AULA

�

�“IntAL” — 2009/10/19 — 21:59 — page 64 — #64 �

�

�

�

�

�


5.4 Exercícios

1. Dê exemplos de aplicações lineares T : R3 → R3 tais que

(a) ker T = {x ∈ R3 : x3 = −x1};(b) im T = {x ∈ R3 : x1 = x2}.

2. Seja � : R3 → R uma aplicação linear.

(a) Mostre que existem escalares a, b e c tais que �(x1, x2, x3) = ax1 + bx2 + cx3;(b) descreva geometricamente todas as possibilidade para ker �.

3. Verdadeiro ou falso? Se for verdadeiro, justifique. Se for falso, dê um contraexemplo.Seja T : Rn → Rm uma aplicação linear.

(a) Uma base de im T é obtida ao se completar uma base de ker T, de modo a ter uma basedo Rn e então calcular a imagem desses vetores adicionais por T;

(b) uma base de im T é Te1, . . . , Ten;(c) toda função f : R → R é bijetora.

4. Seja T : Rn → Rm uma aplicação linear. Mostre que T é injetora se, e somente se, a imagem detodo conjunto linearmente independente (no Rn) for um conjunto linearmente independente(no Rm).

5. Encontre, se possível, as inversas das seguintes matrizes:

(a)

1 2 21 3 11 3 2

; (b)

1 1 1 11 2 −1 21 −1 2 11 3 3 2

; (c)

1 1 1 11 3 1 21 2 −1 15 9 1 6

.

6. Encontre todos os valores de a para os quais a matriz

A =

1 1 01 0 01 2 a

possui inversa.

6

Mudanças de Base

OBjETIvOSNo final desta aula, o aluno deverá ser capaz de:1. obter as coordenadas de um vetor em diferentes bases;2. obter a representação matricial de uma aplicação linear em diferentes bases;3. saber como essas representações matriciais se relacionam.

6 .1 REPRESENTAÇÃO DE UM vETOR EM UMA BASE

�

�“IntAL” — 2009/10/17 — 10:02 — page 65 — #65 �

�

�

�

�

�

Capítulo 6

Mudanças de Base


1. obter as coordenadas de um vetor em diferentes bases;

2. obter a representação matricial de uma aplicação linear em diferentesbases;

3. saber como essas representações matriciais se relacionam.

6.1 Representação de um Vetor em uma Base

Como dissemos, uma base no Rn equivale a um sistema referencial, isto é, aum sistema de coordenadas. Mudando o sistema de coordenadas, mudamas coordenadas do ponto, mas o ponto permanece o mesmo.

Exemplo 6.1 Sejam v1 = (1, 1) e v2 = (−1, 1). É claro que B = {v1, v2}é uma base do R2. Consideremos x = (2, 2) ∈ R2. Na base B, temosx = 2v1 + 0v2. Quer dizer, as coordenadas de x na base B são 2 e 0. �

Figura 6.1: fig6.1

Figura 6.1: As coordenadas de x = (2, 2) na base B são 2 e 0, pois x = 2v1 + 0v2.

O exemplo anterior nos coloca algumas questões. Em primeiro lugar, comorepresentar as coordenadas do ponto x na base B? E, considerada uma baseB do Rn, como obter as coordenadas do ponto x na base B?

65

x1

x2

v1

2

2

x

v2


80


�

�“IntAL” — 2009/10/17 — 10:02 — page 66 — #66 �

�

�

�

�

�

66 CAPÍTULO 6. MUDANÇAS DE BASE

Definição 6.2 Seja B = {v1, . . . , vn} uma base do Rn. Se x ∈ Rn, entãoexistem (únicos) escalares λ1, . . . , λn ∈ R tais que

x = λ1v1 + . . . + λnvn.

O vetor

[x]B =

λ1λ2...

λn

= λ1e1 + . . . + λnen ∈ Rn

é chamado representação de x na base B e λ1, . . . , λn as coordenadas de xna base B.

Se E for a base canônica do Rn, escrevemos simplesmente x ao invés de[x]E .

Observação 6.3 A Definição 6.2 merece alguns comentários. Em primeirolugar, ao escrever o vetor x como combinação linear dos vetores da base B,estamos justamente encontrando as coordenadas do vetor x no sistema decoordenadas formado por B.

Um segundo fato precisa ser ressaltado: uma base do Rn é um conjuntoordenado. Apenas essa ordenação permite dar sentido à representação deum vetor em uma base. �

Exemplo 6.4 Seja x = (3, 2) ∈ R2. Considere a base

B = {v1 = (1, 1), v2 = (−1, 1)}

do R2. Para encontrar [x]B , resolvemos o sistema

x = λ1v1 + λ2v2,

isto é,(3, 2) = λ1(1, 1) + λ2(−1, 1).

Como o sistema tem apenas duas incógnitas, não é necessário utilizar ométodo de Gauss-Jordan. Contudo, vamos aplicar esse método, pois ele ébastante útil em sistemas maiores. Levamos a matriz aumentada do sis-tema anterior à forma escalonada reduzida por linhas:1

(1 −1

∣∣ 31 1

∣∣ 2

)→

(1 −1

∣∣ 30 1

∣∣ − 12

)→

1 0

∣∣∣ 52

0 1∣∣∣ − 1

2

.

Assim,

[x]B =

(52

− 12

).

Proposição 6.5 Seja B = {v1, . . . , vn} uma base do Rn. Se x = λ1v1 + . . . +λnvn, a aplicação B : Rn → Rn dada por

Bx = [x]B =

λ1λ2...

λn

= λ1e1 + . . . + λnen ∈ Rn

é um isomorfismo. Para ressaltar que a imagem de B está sendo conside-rada com a base canônica, escreveremos B : Rn → (Rn, E).

�

�“IntAL” — 2009/10/17 — 10:02 — page 67 — #67 �

�

�

�

�

�

6.2. APLICAÇÕES LINEARES E MATRIZES – PARTE II 67

Demonstração: Se x = λ1v1 + . . . + λnvn e y = γ1v1 + . . . + γnvn, então,

B(x + αy) = B ((λ1 + αγ1)v1 + . . . + (λn + αγn)vn)

=

λ1 + αγ1λ2 + αγ2

...λn + αγn

=

λ1λ2...

λn

+ α

γ1γ2...

γn

= Bx + αBy,

mostrando a linearidade de B.

Se Bx = 0, então x = 0v1 + . . . + 0vn = 0, mostrando que ker B = {0}. Oresultado decorre então do Teorema 5.10. �

Observação 6.6 Uma vez que vi = 0v1 + . . . + 0vi−1 + 1vi + 0vi+1 + . . . +0vn, vemos que

Bvi =

0...1...0

= ei,

o i-ésimo vetor da base canônica do Rn. �

6.2 Aplicações Lineares e Matrizes – Parte II

Na primeira seção da Aula 4 mostramos como associar a cada aplicaçãolinear T : Rn → Rm uma matriz A = (aij), que representa T com relação àsbases canônicas do Rn e Rm. Mostraremos agora que a mesma associaçãoentre aplicações lineares e matrizes é válida para quaisquer escolhas debases B do espaço Rn e C do espaço Rm.

Escolhendo uma base arbitrária B = {v1, . . . , vn} do espaço Rn e escre-vendo x = λ1v1 + . . . + λnvn, já vimos que a aplicação

B : Rn → (Rn, E)

definida por

Bx =

λ1λ2...

λn

é um isomorfismo.

Da mesma forma, ao se escolher uma base C = {w1, . . . , wm} no espaçoRm, obtém-se um isomorfismo C entre Rm e Rm. (Note que as imagensdas aplicações B e C chegam, respectivamente, no Rn e Rm, esses espaçosconsiderados com suas bases canônicas.)

Seja T : Rn → Rm uma aplicação linear. Vamos considerar uma base B noespaço Rn e uma base C no espaço Rm. Nosso objetivo é mostrar comoassociar uma matriz à aplicação T, levando em conta as bases escolhidas Be C.

�

�“IntAL” — 2009/10/17 — 10:02 — page 67 — #67 �

�

�

�

�

�




=

λ1 + αγ1λ2 + αγ2

...λn + αγn

=

λ1λ2...

λn

+ α

γ1γ2...

γn

= Bx + αBy,




Bvi =

0...1...0

= ei,





B : Rn → (Rn, E)

definida por

Bx =

λ1λ2...

λn

é um isomorfismo.



1 Repetindo: os vetores dados aparecem como colunas da matriz!


81

aula 6

�

�“IntAL” — 2009/10/17 — 10:02 — page 66 — #66 �

�

�

�

�

�


Definição 6.2 Seja B = {v1, . . . , vn} uma base do Rn. Se x ∈ Rn, entãoexistem (únicos) escalares λ1, . . . , λn ∈ R tais que

x = λ1v1 + . . . + λnvn.

O vetor

[x]B =

λ1λ2...

λn

= λ1e1 + . . . + λnen ∈ Rn

é chamado representação de x na base B e λ1, . . . , λn as coordenadas de xna base B.

Se E for a base canônica do Rn, escrevemos simplesmente x ao invés de[x]E .

Observação 6.3 A Definição 6.2 merece alguns comentários. Em primeirolugar, ao escrever o vetor x como combinação linear dos vetores da base B,estamos justamente encontrando as coordenadas do vetor x no sistema decoordenadas formado por B.

Um segundo fato precisa ser ressaltado: uma base do Rn é um conjuntoordenado. Apenas essa ordenação permite dar sentido à representação deum vetor em uma base. �

Exemplo 6.4 Seja x = (3, 2) ∈ R2. Considere a base

B = {v1 = (1, 1), v2 = (−1, 1)}

do R2. Para encontrar [x]B , resolvemos o sistema

x = λ1v1 + λ2v2,

isto é,(3, 2) = λ1(1, 1) + λ2(−1, 1).

Como o sistema tem apenas duas incógnitas, não é necessário utilizar ométodo de Gauss-Jordan. Contudo, vamos aplicar esse método, pois ele ébastante útil em sistemas maiores. Levamos a matriz aumentada do sis-tema anterior à forma escalonada reduzida por linhas:1

(1 −1

∣∣ 31 1

∣∣ 2

)→

(1 −1

∣∣ 30 1

∣∣ − 12

)→

1 0

∣∣∣ 52

0 1∣∣∣ − 1

2

.

Assim,

[x]B =

(52

− 12

).

Proposição 6.5 Seja B = {v1, . . . , vn} uma base do Rn. Se x = λ1v1 + . . . +λnvn, a aplicação B : Rn → Rn dada por

Bx = [x]B =

λ1λ2...

λn

= λ1e1 + . . . + λnen ∈ Rn

é um isomorfismo. Para ressaltar que a imagem de B está sendo conside-rada com a base canônica, escreveremos B : Rn → (Rn, E).

�

�“IntAL” — 2009/10/17 — 10:02 — page 67 — #67 �

�

�

�

�

�




=

λ1 + αγ1λ2 + αγ2

...λn + αγn

=

λ1λ2...

λn

+ α

γ1γ2...

γn

= Bx + αBy,




Bvi =

0...1...0

= ei,





B : Rn → (Rn, E)

definida por

Bx =

λ1λ2...

λn

é um isomorfismo.



6 .2 APLICAÇõES LINEARES E MATRIzES – PARTE II

�

�“IntAL” — 2009/10/17 — 10:02 — page 67 — #67 �

�

�

�

�

�




=

λ1 + αγ1λ2 + αγ2

...λn + αγn

=

λ1λ2...

λn

+ α

γ1γ2...

γn

= Bx + αBy,




Bvi =

0...1...0

= ei,





B : Rn → (Rn, E)

definida por

Bx =

λ1λ2...

λn

é um isomorfismo.




82


�

�“IntAL” — 2009/10/17 — 10:02 — page 68 — #68 �

�

�

�

�

�


Temos o seguinte diagrama (as setas verticais sempre indicarão isomorfis-mos):

TRn −→ Rm

B ↓ ↓ C(Rn, E) −→ (Rm, E)

A

(6.1)

em que o mesmo símbolo E está representando as bases canônicas dosespaços Rn e Rm.

A aplicação linear A é definida como composta de aplicações lineares (es-tamos usando a notação de composta para enfatizar)

A = C ◦ T ◦ B−1

e é representada por uma matriz, de acordo com o que vimos na primeiraseção da Aula 4. É usual chamar essa matriz de representação da aplicaçãolinear T com respeito às bases B e C (dos espaços Rn e Rm, respectivamente)e denotá-la por TC

B . Veja que A = TCB é uma aplicação linear de (Rn, E) no

espaço (Rm, E).

Exemplo 6.7 Consideremos os espaços Rn e Rm com as basesB = {v1, . . . , vn} e C = {w1, . . . , wm}, respectivamente. Seja T : Rn → Rm

uma aplicação linear. Vejamos como obter TCB . Para isso, usamos o dia-

grama (6.1):T

Rn −→ Rm

B ↓ ↓ C(Rn, E) −→ (Rm, E)

TCB

.

Como vimos na primeira seção da Aula 4, a i-ésima coluna da matriz pro-curada é obtida ao se calcular TC

Bei = (CTB−1)ei. Mas, Bvi = ei, de modoque (CTB−1)ei = (CT)B−1ei = (CT)vi. Como C é a aplicação que associaa Tvi ∈ Rm às suas coordenadas na base C, temos que a i-ésima coluna damatriz procurada é [Tvi]C . �

No caso de aplicações lineares T : Rn → Rn, a mesma base B pode ser esco-lhida tanto no domínio quanto no contradomínio. Nesse caso, denotamosTB ao invés de TB

B .

Exemplo 6.8 Considere a aplicação linear T : R2 → R2 definida por

T(x, y) = (4x − 2y, 2x + y).

Seja B a base do R2 formada pelos vetores v1 = (1, 1) e v2 = (−1, 0). Vamosachar a matriz que representa T com relação à base B. (Quer dizer, estamosutilizando a mesma base no domínio e no contradomínio e procuramos amatriz TB .) Para isso, calculamos

T(v1) = (2, 3) = 3(1, 1) + (−1, 0) = 3v1 + v2.

Note que escrevemos a imagem de T(v1) na base B, utilizada tambémno contradomínio. De acordo com a notação introduzida na Definição 6.2,temos,

[T(v1)]B =

(31

).

�

�“IntAL” — 2009/10/17 — 10:02 — page 69 — #69 �

�

�

�

�

�


Da mesma forma, T(v2) = (−4,−2) = −2(1, 1) + 2(−1, 0) = −2v1 + 2v2e, portanto,

[T(v2)]B =

(−2

2

).

Assim,

TB =([Tv1]B [Tv2]B

)=

(3 −21 2

).

As colunas de TB são as imagens dos vetores da base B, escritas na própriabase B utilizada, nesse caso, também no contradomínio.

Se quisermos calcular a imagem do vetor (1, 2) = 1e1 + 2e2 ∈ R2 utilizandoa matriz TB , primeiro expressamos esse vetor na base B:

(1, 2) = 2(1, 1) + 1(−1, 0) = 2v1 + v2.

Calculando

TB

(21

)=

(3 −21 2

)(21

)=

(44

),

obtemos a “resposta” na base B. Se quisermos a resposta na base canônica,precisamos escrever o resultado obtido nesta base:

4v1 + 4v2 = 4(1, 1) + 4(−1, 0) = (0, 4) = 0e1 + 4e2,

que é o mesmo resultado que obtemos ao calcular T(1, 2) utilizando aexpressão T(x, y) = (4x − 2y, 2x + y). �

Escolhidas as bases B do Rn e C do Rm, associamos, assim, a cada aplicaçãolinear T : Rn → Rm a matriz TC

B , cuja expressão depende das bases B e C.Uma vez que cada escolha de base B no Rn produz um isomorfismo dife-rente entre (Rn,B) e (Rn, E) e o mesmo acontece com (Rm, C) e (Rm, E),vemos que existem muitas maneiras distintas de representar uma transfor-mação linear por meio de uma matriz. Como se relacionam essas diferentesmatrizes que representam a aplicação linear T?

Para responder a essa pergunta, começamos estudando como se relacio-nam as representações de x em bases B = {v1, . . . , vn} e B̄ = {v′1, . . . , v′n}do espaço Rn. O mesmo procedimento anterior pode ser utilizado (I denotaa aplicação identidade):

IRn −→ Rn

B ↓ ↓ B̄(Rn, E) −→ (Rn, E)

PB̄B

.

(Para sermos coerentes com a notação anterior, deveríamos escrever IB̄B aoinvés de PB̄

B . Entretanto, é usual denotar esse tipo de matriz pela letra P.)

De acordo com o Exemplo 6.7, a i-ésima coluna de PB̄B é obtida calculando-

-se a expressão de B̄IB−1(ei) = B̄I(vi) = B̄(vi) = [vi]B̄ . A matriz PB̄B é

chamada matriz mudança2 da base B para a base B̄. Dadas as coordenadasde x na base B, isto é, [x]B , as coordenadas de x na base B̄ são dadas por

PB̄B [x]B = [x]B̄ . (6.2)

Claramente a matriz PB̄B possui inversa PB

B̄ .


83

aula 6

�

�“IntAL” — 2009/10/17 — 10:02 — page 68 — #68 �

�

�

�

�

�


Temos o seguinte diagrama (as setas verticais sempre indicarão isomorfis-mos):

TRn −→ Rm

B ↓ ↓ C(Rn, E) −→ (Rm, E)

A

(6.1)

em que o mesmo símbolo E está representando as bases canônicas dosespaços Rn e Rm.

A aplicação linear A é definida como composta de aplicações lineares (es-tamos usando a notação de composta para enfatizar)

A = C ◦ T ◦ B−1

e é representada por uma matriz, de acordo com o que vimos na primeiraseção da Aula 4. É usual chamar essa matriz de representação da aplicaçãolinear T com respeito às bases B e C (dos espaços Rn e Rm, respectivamente)e denotá-la por TC

B . Veja que A = TCB é uma aplicação linear de (Rn, E) no

espaço (Rm, E).

Exemplo 6.7 Consideremos os espaços Rn e Rm com as basesB = {v1, . . . , vn} e C = {w1, . . . , wm}, respectivamente. Seja T : Rn → Rm

uma aplicação linear. Vejamos como obter TCB . Para isso, usamos o dia-

grama (6.1):T

Rn −→ Rm

B ↓ ↓ C(Rn, E) −→ (Rm, E)

TCB

.

Como vimos na primeira seção da Aula 4, a i-ésima coluna da matriz pro-curada é obtida ao se calcular TC

Bei = (CTB−1)ei. Mas, Bvi = ei, de modoque (CTB−1)ei = (CT)B−1ei = (CT)vi. Como C é a aplicação que associaa Tvi ∈ Rm às suas coordenadas na base C, temos que a i-ésima coluna damatriz procurada é [Tvi]C . �

No caso de aplicações lineares T : Rn → Rn, a mesma base B pode ser esco-lhida tanto no domínio quanto no contradomínio. Nesse caso, denotamosTB ao invés de TB

B .

Exemplo 6.8 Considere a aplicação linear T : R2 → R2 definida por

T(x, y) = (4x − 2y, 2x + y).

Seja B a base do R2 formada pelos vetores v1 = (1, 1) e v2 = (−1, 0). Vamosachar a matriz que representa T com relação à base B. (Quer dizer, estamosutilizando a mesma base no domínio e no contradomínio e procuramos amatriz TB .) Para isso, calculamos

T(v1) = (2, 3) = 3(1, 1) + (−1, 0) = 3v1 + v2.

Note que escrevemos a imagem de T(v1) na base B, utilizada tambémno contradomínio. De acordo com a notação introduzida na Definição 6.2,temos,

[T(v1)]B =

(31

).

�

�“IntAL” — 2009/10/17 — 10:02 — page 69 — #69 �

�

�

�

�

�


Da mesma forma, T(v2) = (−4,−2) = −2(1, 1) + 2(−1, 0) = −2v1 + 2v2e, portanto,

[T(v2)]B =

(−2

2

).

Assim,

TB =([Tv1]B [Tv2]B

)=

(3 −21 2

).

As colunas de TB são as imagens dos vetores da base B, escritas na própriabase B utilizada, nesse caso, também no contradomínio.

Se quisermos calcular a imagem do vetor (1, 2) = 1e1 + 2e2 ∈ R2 utilizandoa matriz TB , primeiro expressamos esse vetor na base B:

(1, 2) = 2(1, 1) + 1(−1, 0) = 2v1 + v2.

Calculando

TB

(21

)=

(3 −21 2

)(21

)=

(44

),

obtemos a “resposta” na base B. Se quisermos a resposta na base canônica,precisamos escrever o resultado obtido nesta base:

4v1 + 4v2 = 4(1, 1) + 4(−1, 0) = (0, 4) = 0e1 + 4e2,

que é o mesmo resultado que obtemos ao calcular T(1, 2) utilizando aexpressão T(x, y) = (4x − 2y, 2x + y). �

Escolhidas as bases B do Rn e C do Rm, associamos, assim, a cada aplicaçãolinear T : Rn → Rm a matriz TC

B , cuja expressão depende das bases B e C.Uma vez que cada escolha de base B no Rn produz um isomorfismo dife-rente entre (Rn,B) e (Rn, E) e o mesmo acontece com (Rm, C) e (Rm, E),vemos que existem muitas maneiras distintas de representar uma transfor-mação linear por meio de uma matriz. Como se relacionam essas diferentesmatrizes que representam a aplicação linear T?

Para responder a essa pergunta, começamos estudando como se relacio-nam as representações de x em bases B = {v1, . . . , vn} e B̄ = {v′1, . . . , v′n}do espaço Rn. O mesmo procedimento anterior pode ser utilizado (I denotaa aplicação identidade):

IRn −→ Rn

B ↓ ↓ B̄(Rn, E) −→ (Rn, E)

PB̄B

.

(Para sermos coerentes com a notação anterior, deveríamos escrever IB̄B aoinvés de PB̄

B . Entretanto, é usual denotar esse tipo de matriz pela letra P.)

De acordo com o Exemplo 6.7, a i-ésima coluna de PB̄B é obtida calculando-

-se a expressão de B̄IB−1(ei) = B̄I(vi) = B̄(vi) = [vi]B̄ . A matriz PB̄B é

chamada matriz mudança2 da base B para a base B̄. Dadas as coordenadasde x na base B, isto é, [x]B , as coordenadas de x na base B̄ são dadas por

PB̄B [x]B = [x]B̄ . (6.2)

Claramente a matriz PB̄B possui inversa PB

B̄ .

2 Alguns autores preferem chamar essa matriz de “matriz de passagem” da base B para a base B. Assim, a terminologia utilizada por eles fica invertida com relação à nossa.


84


�

�“IntAL” — 2009/10/17 — 10:02 — page 70 — #70 �

�

�

�

�

�


Exercício 6.9 Utilizando o diagrama anterior, justifique a última afirmação.

Exemplo 6.10 Voltemos ao Exemplo 6.8. Vamos obter a matriz PBE , matriz

mudança da base E para a base B. Ela é calculada pelo mesmo método:escrevemos a imagem dos vetores e1, e2 pela aplicação identidade na baseB. Temos

(1, 0) = 0(1, 1)− 1(−1, 0) = 0v1 − v2

e(0, 1) = 1(1, 1) + 1(−1, 0) = 1v1 + 1v2.

A matriz PBE é, então,

PBE =

(0 1

−1 1

).

�

Exercício 6.11 Continuando o Exemplo 6.8, calcule a matriz PEB . Verifique que (PB

E )−1 = PE

B .

É usual condensar o diagrama (6.1) e escrever

(Rn,B)TCB→ (Rm, C),

salientando as bases utilizadas para se produzir a matriz TCB . Note, con-

tudo, que (Rn,B) é apenas uma notação para o espaço Rn com a basecanônica!

Passemos então à pergunta feita anteriormente, utilizando essa novanotação: como se relacionam as matrizes TC

B e TC̄B̄? Temos o diagrama

TCB

(Rn,B) −→ (Rm, C)PB̄B ↓ ↓ QC̄

C(Rn, B̄) −→ (Rm, C̄)

TC̄B̄

.

Esse diagrama, cujas componentes são matrizes, nos mostra que

TCB = [QC̄

C ]−1TC̄

B̄PB̄B = QC

C̄TC̄B̄PB̄

B .

O caso em que n = m permite que se tome a mesma base no domínio econtradomínio. Nesse caso, a relação entre TB e TB̄ é dada por

TB̄ = [PBB̄ ]

−1TBPBB̄ = PB̄

B TBPBB̄ ,

para qualquer outra base B̄ do Rn.

Observação 6.12 Dada uma aplicação linear T : Rn → Rn, a escolha debases B e C no Rn pode fazer com que a representação matricial de Tassuma formas bem gerais. Por exemplo, se T for invertível, TC

B pode ser amatriz identidade! Assim, a representação de T em bases completamentearbitrárias quase não nos passa informação relevante sobre a aplicação T.Voltaremos a esse assunto no próximo curso de Álgebra Linear. �

�

�“IntAL” — 2009/10/17 — 10:02 — page 71 — #71 �

�

�

�

�

�


Exemplo 6.13 Voltemos ao Exemplo 6.8. Temos a aplicação linear T : R2 →R2 definida por

T(x, y) = (4x − 2y, 2x + y).

A representação de T na base canônica é a matriz cujas colunas são

T(1, 0) =(

42

)e T(0, 1) =

(−2

1

),

ou seja,

TE =

(4 −22 1

).

Por outro lado, no Exemplo 6.8 calculamos a matriz TB :

TB =

(3 −21 2

).

Vamos entender a relação entre as matrizes TE e TB . Para isso, analisamoso seguinte diagrama

TE(R2, E) −→ (R2, E)

PBE ↓ ↓ PB

E(R2,B) −→ (R2,B)

TB

.

A matriz PBE é a matriz mudança da base E para a base B calculada no

Exemplo 6.10:

PBE =

(0 1

−1 1

).

O diagrama anterior garante que

TE = [PBE ]

−1TBPBE ,

ou seja,

(4 −22 1

)=

(0 1

−1 1

)−1 ( 3 −21 2

)(0 1

−1 1

)

Se calcularmos a inversa da matriz PBE , verificaremos esse fato. Entretanto,

é fácil obter PEB . Essa matriz tem como colunas a expressão dos vetores v1

e v2 na base canônica. Assim, é claro que

PEB =

(1 −11 0

).

Verifique que PEB = [PB

E ]−1 e que TE = PE

BTBPBE .

Note que a última igualdade é coerente: dado um vetor x = [x]E (na basecanônica), podemos calcular diretamente TE x = TE [x]E = [Tx]E = Tx, deacordo com a nossa convenção de denotar [y]E simplesmente por y. Poroutro lado, calculando pelo lado direito da igualdade, temos

PEBTBPB

E x = PEBTBPB

E [x]E = PEBTB [x]B = PE

B [Tx]B = [Tx]E = Tx,

o que produz o mesmo resultado. �


85

aula 6

�

�“IntAL” — 2009/10/17 — 10:02 — page 70 — #70 �

�

�

�

�

�


Exercício 6.9 Utilizando o diagrama anterior, justifique a última afirmação.

Exemplo 6.10 Voltemos ao Exemplo 6.8. Vamos obter a matriz PBE , matriz

mudança da base E para a base B. Ela é calculada pelo mesmo método:escrevemos a imagem dos vetores e1, e2 pela aplicação identidade na baseB. Temos

(1, 0) = 0(1, 1)− 1(−1, 0) = 0v1 − v2

e(0, 1) = 1(1, 1) + 1(−1, 0) = 1v1 + 1v2.

A matriz PBE é, então,

PBE =

(0 1

−1 1

).

�

Exercício 6.11 Continuando o Exemplo 6.8, calcule a matriz PEB . Verifique que (PB

E )−1 = PE

B .

É usual condensar o diagrama (6.1) e escrever

(Rn,B)TCB→ (Rm, C),

salientando as bases utilizadas para se produzir a matriz TCB . Note, con-

tudo, que (Rn,B) é apenas uma notação para o espaço Rn com a basecanônica!

Passemos então à pergunta feita anteriormente, utilizando essa novanotação: como se relacionam as matrizes TC

B e TC̄B̄? Temos o diagrama

TCB

(Rn,B) −→ (Rm, C)PB̄B ↓ ↓ QC̄

C(Rn, B̄) −→ (Rm, C̄)

TC̄B̄

.

Esse diagrama, cujas componentes são matrizes, nos mostra que

TCB = [QC̄

C ]−1TC̄

B̄PB̄B = QC

C̄TC̄B̄PB̄

B .

O caso em que n = m permite que se tome a mesma base no domínio econtradomínio. Nesse caso, a relação entre TB e TB̄ é dada por

TB̄ = [PBB̄ ]

−1TBPBB̄ = PB̄

B TBPBB̄ ,

para qualquer outra base B̄ do Rn.

Observação 6.12 Dada uma aplicação linear T : Rn → Rn, a escolha debases B e C no Rn pode fazer com que a representação matricial de Tassuma formas bem gerais. Por exemplo, se T for invertível, TC

B pode ser amatriz identidade! Assim, a representação de T em bases completamentearbitrárias quase não nos passa informação relevante sobre a aplicação T.Voltaremos a esse assunto no próximo curso de Álgebra Linear. �

�

�“IntAL” — 2009/10/17 — 10:02 — page 71 — #71 �

�

�

�

�

�


Exemplo 6.13 Voltemos ao Exemplo 6.8. Temos a aplicação linear T : R2 →R2 definida por

T(x, y) = (4x − 2y, 2x + y).

A representação de T na base canônica é a matriz cujas colunas são

T(1, 0) =(

42

)e T(0, 1) =

(−2

1

),

ou seja,

TE =

(4 −22 1

).

Por outro lado, no Exemplo 6.8 calculamos a matriz TB :

TB =

(3 −21 2

).

Vamos entender a relação entre as matrizes TE e TB . Para isso, analisamoso seguinte diagrama

TE(R2, E) −→ (R2, E)

PBE ↓ ↓ PB

E(R2,B) −→ (R2,B)

TB

.

A matriz PBE é a matriz mudança da base E para a base B calculada no

Exemplo 6.10:

PBE =

(0 1

−1 1

).

O diagrama anterior garante que

TE = [PBE ]

−1TBPBE ,

ou seja,

(4 −22 1

)=

(0 1

−1 1

)−1 ( 3 −21 2

)(0 1

−1 1

)

Se calcularmos a inversa da matriz PBE , verificaremos esse fato. Entretanto,

é fácil obter PEB . Essa matriz tem como colunas a expressão dos vetores v1

e v2 na base canônica. Assim, é claro que

PEB =

(1 −11 0

).

Verifique que PEB = [PB

E ]−1 e que TE = PE

BTBPBE .

Note que a última igualdade é coerente: dado um vetor x = [x]E (na basecanônica), podemos calcular diretamente TE x = TE [x]E = [Tx]E = Tx, deacordo com a nossa convenção de denotar [y]E simplesmente por y. Poroutro lado, calculando pelo lado direito da igualdade, temos

PEBTBPB

E x = PEBTBPB

E [x]E = PEBTB [x]B = PE

B [Tx]B = [Tx]E = Tx,

o que produz o mesmo resultado. �

.


86


�

�“IntAL” — 2009/10/17 — 10:02 — page 72 — #72 �

�

�

�

�

�


6.3 Aplicação: Diagonalização de uma Matriz

Definição 6.14 Seja A uma matriz quadrada. O polinômio característicoda matriz A é o polinômio

p(z) = det(zI − A).

Exemplo 6.15 Vamos calcular o polinômio característico da matriz

A =

(1 −12 4

).

Para isso, devemos calcular o determinante da matriz

zI − A = z(

1 00 1

)−

(1 −12 4

)=

(z − 1 1−2 z − 4

).

Assim,

p(z) = det(

z − 1 1−2 z − 4

)= (z − 1)(z − 4) + 2 = z2 − 5z + 6.

�

Exercício 6.16 Calcule o polinômio característico p(z) da matriz

A =

2 2 31 2 12 −2 1

.

Vamos agora mostrar que podemos definir o polinômio característico deuma aplicação linear T : Rn → Rn. Para isso, escolhemos uma base B ecalculamos a matriz A = TB . Sabemos calcular o polinômio característicoda matriz A. Mas esse polinômio característico não depende da base Bescolhida? Vamos mostrar que não. Para isso, se C for uma outra base doRn e se a matriz B = TC for a representação de T na base C, já vimos queA = P−1BP, sendo P = PC

B a matriz de mudança da base B para a base C.Temos que

det(zI − A) = det(P−1(zI − B)P)

= det P−1 det(zI − B)det P = det(zI − B)det(P−1P)= det(zI − B),

mostrando que qualquer representação de T numa base do Rn possui omesmo polinômio característico. Em consequência, podemos definir:

Definição 6.17 O polinômio característico da aplicação linear

T : Rn → Rn

é o polinômio característico de qualquer uma de suas representações ma-triciais TB , sendo B uma base do Rn.

Uma vez definido o polinômio característico de uma aplicação linear T,estamos em condições de definir autovalores e autovetores de T.

�

�“IntAL” — 2009/10/17 — 10:02 — page 73 — #73 �

�

�

�

�

�

6.3. APLICAÇÃO: DIAGONALIZAÇÃO DE UMA MATRIZ 73

Definição 6.18 As raízes λ ∈ K do polinômio característico são os autova-lores de T. Se λ for um autovalor de T, os elementos 0 �= v ∈ ker(λI − T)são os autovetores de T associados ao autovalor λ.

Se 0 �= v for um autovetor de T associado ao autovalor λ, então (λI −T)v = 0, ou seja, Tv = λv. Lembramos que, dada uma matriz quadradaA, existe v �= 0 tal que Av = 0 se, e somente se, det A = 0. Assim, osautovalores de T nos fornecem justamente os valores λ tais que λI − T nãoé invertível. Mais precisamente, se B for uma representação matricial de Te λ um autovalor de T, então a matriz A = λI − B não é invertível.

Dada uma aplicação linear T : Rn → Rn, a obtenção de uma base B doRn formada por autovetores de T resolve um problema importante: nessabase, a representação de T, isto é, TB , é particularmente simples.

De fato, se B = {v1, . . . , vn} for uma base de autovetores de T : Rn → Rn

associados, respectivamente, aos autovalores λ1, . . . , λn, então,

TB = ([Tv1]B [Tv2]B . . . [Tvn]B)

= ([λ1v1]B [λ2v2]B . . . [λnvn]B)

=

λ1 0 . . . 00 λ2 . . . 0...

.... . .

...0 0 . . . λn

.

Exemplo 6.19 Seja T : R2 → R2 dada por

T(x1, x2) = (x1 + 4x2, 2x1 + 3x2).

Encontramos o polinômio característico de T ao escolher uma de suasrepresentações matriciais. Escolhendo a base canônica E do R2, encontra-mos

B = TE =

(1 42 3

).

O polinômio característico de T é, portanto,

det(zI − B) = det(

z − 1 −4−2 z − 3

)= z2 − 4z − 5.

Os autovalores de T são as raízes de p(z) = z2 − 4z − 5, que são dadas porλ = −1 e µ = 5. Para encontrarmos os autovetores associados a λ = −1,basta resolvermos o sistema (−I − B)v = 0, obtido ao substituirz = λ = −1 em (zI − B). Logo, temos

(−2 −4−2 −4

)→

(1 20 0

),

que nos fornece a solução

v = α

(−2

1

).

Tomamos α = 1 e o vetor

v1 =

(−2

1

),

pois qualquer outro autovetor associado a λ = −1 é múltiplo de v1.

6 .3 APLICAÇÃO: DIAGONALIzAÇÃO DE UMA MATRIz


87

aula 6

�

�“IntAL” — 2009/10/17 — 10:02 — page 72 — #72 �

�

�

�

�

�


6.3 Aplicação: Diagonalização de uma Matriz

Definição 6.14 Seja A uma matriz quadrada. O polinômio característicoda matriz A é o polinômio

p(z) = det(zI − A).

Exemplo 6.15 Vamos calcular o polinômio característico da matriz

A =

(1 −12 4

).

Para isso, devemos calcular o determinante da matriz

zI − A = z(

1 00 1

)−

(1 −12 4

)=

(z − 1 1−2 z − 4

).

Assim,

p(z) = det(

z − 1 1−2 z − 4

)= (z − 1)(z − 4) + 2 = z2 − 5z + 6.

�

Exercício 6.16 Calcule o polinômio característico p(z) da matriz

A =

2 2 31 2 12 −2 1

.

Vamos agora mostrar que podemos definir o polinômio característico deuma aplicação linear T : Rn → Rn. Para isso, escolhemos uma base B ecalculamos a matriz A = TB . Sabemos calcular o polinômio característicoda matriz A. Mas esse polinômio característico não depende da base Bescolhida? Vamos mostrar que não. Para isso, se C for uma outra base doRn e se a matriz B = TC for a representação de T na base C, já vimos queA = P−1BP, sendo P = PC

B a matriz de mudança da base B para a base C.Temos que

det(zI − A) = det(P−1(zI − B)P)

= det P−1 det(zI − B)det P = det(zI − B)det(P−1P)= det(zI − B),

mostrando que qualquer representação de T numa base do Rn possui omesmo polinômio característico. Em consequência, podemos definir:

Definição 6.17 O polinômio característico da aplicação linear

T : Rn → Rn

é o polinômio característico de qualquer uma de suas representações ma-triciais TB , sendo B uma base do Rn.

Uma vez definido o polinômio característico de uma aplicação linear T,estamos em condições de definir autovalores e autovetores de T.

�

�“IntAL” — 2009/10/17 — 10:02 — page 73 — #73 �

�

�

�

�

�

6.3. APLICAÇÃO: DIAGONALIZAÇÃO DE UMA MATRIZ 73

Definição 6.18 As raízes λ ∈ K do polinômio característico são os autova-lores de T. Se λ for um autovalor de T, os elementos 0 �= v ∈ ker(λI − T)são os autovetores de T associados ao autovalor λ.

Se 0 �= v for um autovetor de T associado ao autovalor λ, então (λI −T)v = 0, ou seja, Tv = λv. Lembramos que, dada uma matriz quadradaA, existe v �= 0 tal que Av = 0 se, e somente se, det A = 0. Assim, osautovalores de T nos fornecem justamente os valores λ tais que λI − T nãoé invertível. Mais precisamente, se B for uma representação matricial de Te λ um autovalor de T, então a matriz A = λI − B não é invertível.

Dada uma aplicação linear T : Rn → Rn, a obtenção de uma base B doRn formada por autovetores de T resolve um problema importante: nessabase, a representação de T, isto é, TB , é particularmente simples.

De fato, se B = {v1, . . . , vn} for uma base de autovetores de T : Rn → Rn

associados, respectivamente, aos autovalores λ1, . . . , λn, então,

TB = ([Tv1]B [Tv2]B . . . [Tvn]B)

= ([λ1v1]B [λ2v2]B . . . [λnvn]B)

=

λ1 0 . . . 00 λ2 . . . 0...

.... . .

...0 0 . . . λn

.

Exemplo 6.19 Seja T : R2 → R2 dada por

T(x1, x2) = (x1 + 4x2, 2x1 + 3x2).

Encontramos o polinômio característico de T ao escolher uma de suasrepresentações matriciais. Escolhendo a base canônica E do R2, encontra-mos

B = TE =

(1 42 3

).

O polinômio característico de T é, portanto,

det(zI − B) = det(

z − 1 −4−2 z − 3

)= z2 − 4z − 5.

Os autovalores de T são as raízes de p(z) = z2 − 4z − 5, que são dadas porλ = −1 e µ = 5. Para encontrarmos os autovetores associados a λ = −1,basta resolvermos o sistema (−I − B)v = 0, obtido ao substituirz = λ = −1 em (zI − B). Logo, temos

(−2 −4−2 −4

)→

(1 20 0

),

que nos fornece a solução

v = α

(−2

1

).


v1 =

(−2

1

),

pois qualquer outro autovetor associado a λ = −1 é múltiplo de v1.


88


�

�“IntAL” — 2009/10/17 — 10:02 — page 74 — #74 �

�

�

�

�

�


Do mesmo modo, encontramos os autovetores associados a µ = 5 resol-vendo o sistema (5I − B)v = 0, obtido ao substituir z = µ = 5 em zI − B,ou seja, (

4 −4−2 2

)→

(1 −10 0

),

cuja solução é

v = α

(11

).


v2 =

(11

),

pois qualquer outro autovetor associado a µ = 5 é múltiplo de v2.

Encontramos assim a base B = {v1, v2}, formada por autovetores da apli-cação T. A representação de T na base B é:

TB =

(−1 0

0 5

)

(justifique!) e nos mostre como a escolha de uma base adequada podesimplificar a representação matricial da aplicação linear T. �

Exemplo 6.20 Nem todas as matrizes (ou aplicações lineares) possuem umabase formada por autovalores. De fato, consideremos a matriz

A =

(0 10 0

).

O polinômio característico de A é p(z) = z2, de modo que o único autova-lor de A é λ = 0. Associado a esse autovalor existe apenas um autovetorlinearmente independente: o sistema Av = 0 possui a solução

v = α

(10

),

que nos fornece, ao escolhermos α = 1, o autovalor

v1 =

(10

).

Qualquer outro autovetor de A é múltiplo de v1, de modo que A não possuiuma base formada por autovetores. �

Observação 6.21 A existência de uma base B do Rn na qual uma uma apli-cação linear T : Rn → Rn tem representação matricial TB diagonal é um dosprincipais objetivos do curso de Álgebra Linear II. �


A =

0 1 00 0 14 −17 18

.

Mostre que existe uma base B = {v1, v2, v3} do R3 formada por autovetores da matriz A. Encontrea representação de A na base B e a matriz PE

B .

�

�“IntAL” — 2009/10/17 — 10:02 — page 75 — #75 �

�

�

�

�

�

6.4. EXERCÍCIOS 75

6.4 Exercícios

1. Considere a aplicação linear T : R3 → R3 definida por meio da matriz

A =

3 −1 −20 0 −20 0 −1

.

Seja B = {v1 = (1, 0, 0), v2 = (1, 2, 0), v3 = (0,−2, 1)}.

(a) Mostre que B é uma base do R3;(b) calcule B = TB ;(c) calcule as matrizes mudança de base PE

B e PBE ;

(d) escreva B em termos de A utilizando essas matrizes mudança de base.

2. Seja T : R3 → R3 a aplicação linear definida por

T(x1, x2, x3) = (x1 + x2 + 2x3, x2 + 2x3, x3).

(a) Ache A = TE , em que E é a base canônica do R3;(b) calcule A−1;(c) obtenha então a expressão de T−1.

3. Sejam T(x, y, x) = (x + y + z, y + z, x) e B = {(1, 0, 1), (0, 1, 0), (−1, 0, 1)}. Então:

(a) ache a matriz TB ;(b) usando essa matriz, especifique uma base para ker T e im T;(c) calcule T(1, 1, 1) utilizando a representação matricial calculada em (a).


A =

1 −2 0−2 0 2

0 2 −1

.

(a) Encontre o polinômio característico de A;(b) obtenha os autovalores de A e uma base B do R3 formada por autovetores de A;(c) ache a matriz TB ;(d) calcule TE , a matriz PE

B e sua inversa PBE ;

(e) verifique que PBE = (PE

B )t;

(f) utilizando as matrizes do item anterior, ache a relação entre TE e TB .

5. Seja

B =

0 1 00 0 14 −17 8

.

Obtenha os autovalores de B e uma base B do R3 formada por autovetores de B. Encontre arepresentação de B na base B.


89

�

�“IntAL” — 2009/10/17 — 10:02 — page 74 — #74 �

�

�

�

�

�


Do mesmo modo, encontramos os autovetores associados a µ = 5 resol-vendo o sistema (5I − B)v = 0, obtido ao substituir z = µ = 5 em zI − B,ou seja, (

4 −4−2 2

)→

(1 −10 0

),

cuja solução é

v = α

(11

).


v2 =

(11

),

pois qualquer outro autovetor associado a µ = 5 é múltiplo de v2.

Encontramos assim a base B = {v1, v2}, formada por autovetores da apli-cação T. A representação de T na base B é:

TB =

(−1 0

0 5

)

(justifique!) e nos mostre como a escolha de uma base adequada podesimplificar a representação matricial da aplicação linear T. �

Exemplo 6.20 Nem todas as matrizes (ou aplicações lineares) possuem umabase formada por autovalores. De fato, consideremos a matriz

A =

(0 10 0

).

O polinômio característico de A é p(z) = z2, de modo que o único autova-lor de A é λ = 0. Associado a esse autovalor existe apenas um autovetorlinearmente independente: o sistema Av = 0 possui a solução

v = α

(10

),

que nos fornece, ao escolhermos α = 1, o autovalor

v1 =

(10

).

Qualquer outro autovetor de A é múltiplo de v1, de modo que A não possuiuma base formada por autovetores. �

Observação 6.21 A existência de uma base B do Rn na qual uma uma apli-cação linear T : Rn → Rn tem representação matricial TB diagonal é um dosprincipais objetivos do curso de Álgebra Linear II. �


A =

0 1 00 0 14 −17 18

.

Mostre que existe uma base B = {v1, v2, v3} do R3 formada por autovetores da matriz A. Encontrea representação de A na base B e a matriz PE

B .

�

�“IntAL” — 2009/10/17 — 10:02 — page 75 — #75 �

�

�

�

�

�

6.4. EXERCÍCIOS 75

6.4 Exercícios

1. Considere a aplicação linear T : R3 → R3 definida por meio da matriz

A =

3 −1 −20 0 −20 0 −1

.

Seja B = {v1 = (1, 0, 0), v2 = (1, 2, 0), v3 = (0,−2, 1)}.

(a) Mostre que B é uma base do R3;(b) calcule B = TB ;(c) calcule as matrizes mudança de base PE

B e PBE ;

(d) escreva B em termos de A utilizando essas matrizes mudança de base.

2. Seja T : R3 → R3 a aplicação linear definida por

T(x1, x2, x3) = (x1 + x2 + 2x3, x2 + 2x3, x3).

(a) Ache A = TE , em que E é a base canônica do R3;(b) calcule A−1;(c) obtenha então a expressão de T−1.

3. Sejam T(x, y, x) = (x + y + z, y + z, x) e B = {(1, 0, 1), (0, 1, 0), (−1, 0, 1)}. Então:

(a) ache a matriz TB ;(b) usando essa matriz, especifique uma base para ker T e im T;(c) calcule T(1, 1, 1) utilizando a representação matricial calculada em (a).


A =

1 −2 0−2 0 2

0 2 −1

.

(a) Encontre o polinômio característico de A;(b) obtenha os autovalores de A e uma base B do R3 formada por autovetores de A;(c) ache a matriz TB ;(d) calcule TE , a matriz PE

B e sua inversa PBE ;

(e) verifique que PBE = (PE

B )t;

(f) utilizando as matrizes do item anterior, ache a relação entre TE e TB .

5. Seja

B =

0 1 00 0 14 −17 8

.

Obtenha os autovalores de B e uma base B do R3 formada por autovetores de B. Encontre arepresentação de B na base B.

aula 6

6 .4 ExERCÍCIOS


�

�“IntAL” — 2009/10/17 — 10:09 — page 77 — #77 �

�

�

�

�

�

Capítulo 7

O Teorema deCayley-Hamilton


7.1 Polinômios de Aplicações Lineares

Seja A uma matriz quadrada. Então faz sentido calcular A2 e, em geral, apotência Ak, qualquer que seja o número natural k ≥ 1.

Exemplo 7.1 Seja A a matriz quadrada

A =

(1 22 1

).

Então

A2 =

(5 44 5

), e A3 =

(13 1414 13

),

de modo que

3A3 + 1A2 + 5I =(

49 4646 49

).

Observe que 3A3 + 1A2 + 5I resulta da substituição de z = A no polinômio3z3 + z2 + 5, com a convenção de que a constante 5 é substituída por 5I, emque I é a matriz identidade 2 × 2. �

Um pouco mais geralmente, seja T : Rn → Rn uma aplicação linear. Pode-mos definir, para todo k ∈ N, Tk = T ◦ Tk−1 = T(Tk−1), se k ≥ 1 e T0 = I,em que I : Rn → Rn é a aplicação identidade. Denotaremos q ∈ R[z] paraindicar que o polinômio

q(z) = akzk + ak−1zk−1 + a1z + a0z0

tem coeficientes no corpo R. Podemos então calcular

q(T) := akTk + ak−1Tk−1 + · · ·+ a1T + a0 I.

77


AULA 7

O Teorema de Cayley-Hamilton

OBjETIvOSNo final desta aula, o aluno deverá ser capaz de:1. calcular polinômios de matrizes e de aplicações lineares;2. calcular o polinômio característico de uma aplicação linear;3. aplicar o Teorema de Cayley-Hamilton em situações simples.

7 .1 POLINôMIOS DE APLICAÇõES LINEARES

�

�“IntAL” — 2009/10/17 — 10:09 — page 77 — #77 �

�

�

�

�

�

Capítulo 7

O Teorema deCayley-Hamilton


7.1 Polinômios de Aplicações Lineares

Seja A uma matriz quadrada. Então faz sentido calcular A2 e, em geral, apotência Ak, qualquer que seja o número natural k ≥ 1.

Exemplo 7.1 Seja A a matriz quadrada

A =

(1 22 1

).

Então

A2 =

(5 44 5

), e A3 =

(13 1414 13

),

de modo que

3A3 + 1A2 + 5I =(

49 4646 49

).

Observe que 3A3 + 1A2 + 5I resulta da substituição de z = A no polinômio3z3 + z2 + 5, com a convenção de que a constante 5 é substituída por 5I, emque I é a matriz identidade 2 × 2. �

Um pouco mais geralmente, seja T : Rn → Rn uma aplicação linear. Pode-mos definir, para todo k ∈ N, Tk = T ◦ Tk−1 = T(Tk−1), se k ≥ 1 e T0 = I,em que I : Rn → Rn é a aplicação identidade. Denotaremos q ∈ R[z] paraindicar que o polinômio

q(z) = akzk + ak−1zk−1 + a1z + a0z0

tem coeficientes no corpo R. Podemos então calcular

q(T) := akTk + ak−1Tk−1 + · · ·+ a1T + a0 I.

77


92


�

�“IntAL” — 2009/10/17 — 10:09 — page 78 — #78 �

�

�

�

�

�

78 CAPÍTULO 7. O TEOREMA DE CAYLEY-HAMILTON

(Aqui, I a aplicação identidade I : Rn → Rn). Note que q(T) é uma apli-cação linear do Rn em Rn, que é representada por uma matriz n × n ao seescolher uma base do Rn.

Exercício 7.2 Seja

A =

1 2 22 1 21 1 1

.

Calcule q(A), se q(z) = z5 + 3z2 + z + 1.

7.2 Subespaços Invariantes

Definição 7.3 Um subespaço W ⊂ Rn é invariante por T : Rn → Rn seT(W) ⊂ W, isto é, Tw ∈ W para todo w ∈ W.

Exemplo 7.4 Considere a aplicação T : R3 → R3 definida por

T(x1, x2, x3) = (x1 − x2, x1 + x2, 3x3)

e o subespaço W = {(x1, x2, 0) : x1, x2 ∈ R} ⊂ R3. Afirmamos que W éinvariante por T. De fato, se w ∈ W, então w = (x1, x2, 0) para x1, x2 ∈ R.Logo,

Tw = T(x1, x2, 0) = (x1 − x2, x1 + x2, 0) ∈ W,


Para verificar que um subespaço W ⊂ Rn é invariante pela aplicação linearT : Rn → Rn basta considerar uma base {w1, . . . , wm} do espaço W.

Proposição 7.5 Seja B = {w1, . . . , wm} uma base do subespaço W ⊂ Rn. EntãoW é invariante pela aplicação linear T : Rn → Rn se, e somente se, Twi ∈ W paratodo i ∈ {1, . . . , m}.

Demonstração: É claro que se W for invariante por T, então Twi ∈ W paratodo i ∈ {1, . . . , m}. Reciprocamente, se w ∈ W, então existem (únicos)escalares α1, . . . , αn tais que w = α1w1 + . . . + αnwn. Como T é linear,

Tw = T(α1w1 + . . . + αnwn) = α1(Tw1) + . . . + αn(Twn).

Como Twi ∈ W para i ∈ {1, . . . , m}, concluímos que Tw ∈ W, pois W é umsubespaço. �

Seja T : Rn → Rn uma aplicação linear e W ⊂ Rn um subespaço. Supo-nhamos que T(W) ⊂ W, isto é, Tw ∈ W para todo w ∈ W. Consideremosuma base {w1, . . . , wm} de W. De acordo com o Teorema 3.43, existem ve-tores {xm+1, . . . , xn} de modo que

B = {w1, . . . , wm, xm+1, . . . , xn}

seja uma base do Rn. Vamos representar T nessa base, que dizer, vamosobter TB = TB

B . Temos que

TB = ([Tw1]B . . . [Twm]B [Txm+1]B . . . [Txn]B) .

�

�“IntAL” — 2009/10/17 — 10:09 — page 79 — #79 �

�

�

�

�

�

7.3. O TEOREMA DE CAYLEY-HAMILTON 79

Como Twj ∈ W, temos que

[Twj]B =

a1j...

amj0...0

.

Por outro lado, nada sabemos sobre Txj para j ∈ {m + 1, . . . , n}. Assim,

[Txj]B =

a1j...

amjb(m+1)j

...bnj

.

Em outras palavras, a matriz TB tem a forma

TB =

a11 a12 . . . a1m a1(m+1) . . . a1na21 a22 . . . a2m a2(m+1) . . . a2n... . . .

. . ....

... . . ....

am1 am2 . . . amm am(m+1) . . . amn0 0 . . . 0 a(m+1)(m+1) . . . a(m+1)n...

... . . ....

... . . ....

0 0 0 0 bn(m+1) . . . bnn

,

que pode ser escrita na forma

TB =

(A B0 D

).

7.3 O teorema de Cayley-Hamilton

Teorema 7.6 (Cayley-Hamilton)

Se p ∈ R[z] for o polinômio característico de T : Rn → Rn, então p(T) = 0.

Demonstração: Seja 0 �= v ∈ Rn arbitrário. Queremos mostrar quep(T)v = 0. Seja m o maior natural tal que o conjunto

S = {v, Tv, . . . , Tm−1v}

é linearmente independente. Então,

Tmv = α0v + . . . + αm−1Tm−1v. (7.1)

Seja W =< S > o subespaço gerado por S. Então os elementos de S for-mam uma base de W. O subespaço W é invariante por T, de acordo com aProposição 7.5 e a igualdade (7.1).

7 .2 SUBESPAÇOS INvARIANTES

�

�“IntAL” — 2009/10/17 — 10:09 — page 79 — #79 �

�

�

�

�

�



[Twj]B =

a1j...

amj0...0

.


[Txj]B =

a1j...

amjb(m+1)j

...bnj

.


TB =


. . ....

... . . ....


... . . ....

... . . ....

0 0 0 0 bn(m+1) . . . bnn

,


TB =

(A B0 D

).





S = {v, Tv, . . . , Tm−1v}


Tmv = α0v + . . . + αm−1Tm−1v. (7.1)


�

�“IntAL” — 2009/10/17 — 10:09 — page 78 — #78 �

�

�

�

�

�



Exercício 7.2 Seja

A =

1 2 22 1 21 1 1

.





T(x1, x2, x3) = (x1 − x2, x1 + x2, 3x3)


Tw = T(x1, x2, 0) = (x1 − x2, x1 + x2, 0) ∈ W,








B = {w1, . . . , wm, xm+1, . . . , xn}


B . Temos que



93

aula 7

�

�“IntAL” — 2009/10/17 — 10:09 — page 78 — #78 �

�

�

�

�

�



Exercício 7.2 Seja

A =

1 2 22 1 21 1 1

.





T(x1, x2, x3) = (x1 − x2, x1 + x2, 3x3)


Tw = T(x1, x2, 0) = (x1 − x2, x1 + x2, 0) ∈ W,








B = {w1, . . . , wm, xm+1, . . . , xn}


B . Temos que


�

�“IntAL” — 2009/10/17 — 10:09 — page 79 — #79 �

�

�

�

�

�



[Twj]B =

a1j...

amj0...0

.


[Txj]B =

a1j...

amjb(m+1)j

...bnj

.


TB =


. . ....

... . . ....


... . . ....

... . . ....

0 0 0 0 bn(m+1) . . . bnn

,


TB =

(A B0 D

).





S = {v, Tv, . . . , Tm−1v}


Tmv = α0v + . . . + αm−1Tm−1v. (7.1)


7 .3 O TEOREMA DE CAyLEy-HAMILTON

�

�“IntAL” — 2009/10/17 — 10:09 — page 79 — #79 �

�

�

�

�

�



[Twj]B =

a1j...

amj0...0

.


[Txj]B =

a1j...

amjb(m+1)j

...bnj

.


TB =


. . ....

... . . ....


... . . ....

... . . ....

0 0 0 0 bn(m+1) . . . bnn

,


TB =

(A B0 D

).





S = {v, Tv, . . . , Tm−1v}


Tmv = α0v + . . . + αm−1Tm−1v. (7.1)


�

�“IntAL” — 2009/10/17 — 10:09 — page 78 — #78 �

�

�

�

�

�



Exercício 7.2 Seja

A =

1 2 22 1 21 1 1

.





T(x1, x2, x3) = (x1 − x2, x1 + x2, 3x3)


Tw = T(x1, x2, 0) = (x1 − x2, x1 + x2, 0) ∈ W,








B = {w1, . . . , wm, xm+1, . . . , xn}


B . Temos que



94


�

�“IntAL” — 2009/10/17 — 10:09 — page 80 — #80 �

�

�

�

�

�


Completamos então a base S de modo a obter uma base B do Rn. Comovimos na seção 7.2, a representação de TB é dada por

(A B0 D

),

em que a matriz A é definida por

A =

0 0 · · · 0 α01 0 · · · 0 α1

0 1. . . 0 α2

......

. . ....

...0 0 · · · 1 αm−1

.

O polinômio característico de TB é

p(z) = det(

zI − A B0 zI − D

)= det(zI − A)det(zI − D) = q1(z)q2(z),

como consequência do Teorema 1.28. (Em cada expressão, os tamanhos dasmatrizes I são diferentes.)

Vamos calcular q1(z) = det(zI − A). Temos:

det(zI − A) = det

z 0 · · · 0 −α0−1 z · · · 0 −α1

0 −1. . . 0 −α2

......

. . ....

...0 0 · · · −1 z − αm−1

= z det

z 0 · · · −α1−1 z · · · −α2

... · · · . . ....

0 · · · −1 z − αm−1

+

(−α0)(−1)m+1 det

−1 z · · · 00 −1 · · · 0...

.... . .

...0 0 · · · −1

.

Como o determinante da última matriz é (−1)m−1, o último termo é justa-mente −α0. Assim,

det(zI − A) = z det

z 0 · · · −α1−1 z · · · −α2

... · · · . . ....

0 · · · −1 z − αm−1

− α0.

Procedendo do mesmo modo, obtemos

q1(z) = det(zI − A) = zm − αm−1zm−1 − . . . − α0.

Substituindo z por T e então calculando q1(T)v, a equação (7.1) nos mostraque q1(T)v=0. Assim, p(T)v = q2(T)q1(T)v = 0. Como v foi escolhidoarbitrariamente, concluímos que p(T) = 0. �

�

�“IntAL” — 2009/10/17 — 10:09 — page 81 — #81 �

�

�

�

�

�

7.4. APLICAÇÕES 81

7.4 Aplicações


A =

2 0 03 −1 00 4 3

.

O polinômio característico de A é

p(z) = (z − 2)(z + 1)(z − 3) = z3 − 4z2 + z + 6.

Se quisermos calcular, por exemplo, q(A), sendo q(z) = z8 − 4z7 + z6 +13z5 − 28z4 + 7z3 + 42z2 + z + 1, podemos efetuar a divisão euclidiana deq(z) por p(z) e obter

q(z) = (z5 + 7z2)p(z) + z + 1.

O Teorema de Cayley-Hamilton garante que p(A) = 0; assim,q(A) = (A5 + 7A2)p(A) + A + I = A + I. Logo,

q(A) = A + I =

3 0 03 0 00 4 4

.

�


95

aula 7

�

�“IntAL” — 2009/10/17 — 10:09 — page 80 — #80 �

�

�

�

�

�


Completamos então a base S de modo a obter uma base B do Rn. Comovimos na seção 7.2, a representação de TB é dada por

(A B0 D

),

em que a matriz A é definida por

A =

0 0 · · · 0 α01 0 · · · 0 α1

0 1. . . 0 α2

......

. . ....

...0 0 · · · 1 αm−1

.

O polinômio característico de TB é

p(z) = det(

zI − A B0 zI − D

)= det(zI − A)det(zI − D) = q1(z)q2(z),

como consequência do Teorema 1.28. (Em cada expressão, os tamanhos dasmatrizes I são diferentes.)

Vamos calcular q1(z) = det(zI − A). Temos:

det(zI − A) = det

z 0 · · · 0 −α0−1 z · · · 0 −α1

0 −1. . . 0 −α2

......

. . ....

...0 0 · · · −1 z − αm−1

= z det

z 0 · · · −α1−1 z · · · −α2

... · · · . . ....

0 · · · −1 z − αm−1

+

(−α0)(−1)m+1 det

−1 z · · · 00 −1 · · · 0...

.... . .

...0 0 · · · −1

.

Como o determinante da última matriz é (−1)m−1, o último termo é justa-mente −α0. Assim,

det(zI − A) = z det

z 0 · · · −α1−1 z · · · −α2

... · · · . . ....

0 · · · −1 z − αm−1

− α0.

Procedendo do mesmo modo, obtemos

q1(z) = det(zI − A) = zm − αm−1zm−1 − . . . − α0.

Substituindo z por T e então calculando q1(T)v, a equação (7.1) nos mostraque q1(T)v=0. Assim, p(T)v = q2(T)q1(T)v = 0. Como v foi escolhidoarbitrariamente, concluímos que p(T) = 0. �

�

�“IntAL” — 2009/10/17 — 10:09 — page 81 — #81 �

�

�

�

�

�

7.4. APLICAÇÕES 81

7.4 Aplicações


A =

2 0 03 −1 00 4 3

.

O polinômio característico de A é

p(z) = (z − 2)(z + 1)(z − 3) = z3 − 4z2 + z + 6.

Se quisermos calcular, por exemplo, q(A), sendo q(z) = z8 − 4z7 + z6 +13z5 − 28z4 + 7z3 + 42z2 + z + 1, podemos efetuar a divisão euclidiana deq(z) por p(z) e obter

q(z) = (z5 + 7z2)p(z) + z + 1.

O Teorema de Cayley-Hamilton garante que p(A) = 0; assim,q(A) = (A5 + 7A2)p(A) + A + I = A + I. Logo,

q(A) = A + I =

3 0 03 0 00 4 4

.

�

7 .4 APLICAÇõES


96


�

�“IntAL” — 2009/10/17 — 10:09 — page 82 — #82 �

�

�

�

�

�


7.5 Exercícios


A =

2 1 11 2 11 1 2

.

(a) Mostre que, se m(z) = (z − 1)(z − 4), então m(A) = 0. (O polinômio m não é o polinômiocaracterístico de A.)

(b) procedendo como no Exemplo 7.7, calcule A1000. Para isso, efetue a divisão euclidiana dez1000 por m(z) e obtenha o resto r(z) = c−1

3 z + 4−c3 , em que c = 41000. Conclua que

A1000 =

c+23

c−13

c−13

c−13

c+23

c−13

c−13

c−13

c+23

.

2. Se k ∈ {1, 2, . . .}, calcule Ak, se

(a) A =

2 1 20 0 00 −2 3

; (b) A =

0 0 00 0 −1

−1 1 0

.

7 .5 ExERCÍCIOS


�

�“IntAL” — 2009/10/17 — 10:09 — page 82 — #82 �

�

�

�

�

�


7.5 Exercícios


A =

2 1 11 2 11 1 2

.

(a) Mostre que, se m(z) = (z − 1)(z − 4), então m(A) = 0. (O polinômio m não é o polinômiocaracterístico de A.)

(b) procedendo como no Exemplo 7.7, calcule A1000. Para isso, efetue a divisão euclidiana dez1000 por m(z) e obtenha o resto r(z) = c−1

3 z + 4−c3 , em que c = 41000. Conclua que

A1000 =

c+23

c−13

c−13

c−13

c+23

c−13

c−13

c−13

c+23

.

2. Se k ∈ {1, 2, . . .}, calcule Ak, se

(a) A =

2 1 20 0 00 −2 3

; (b) A =

0 0 00 0 −1

−1 1 0

.

Referências

[1] AVRITZER, D. Geometria Analítica e Álgebra Linear: uma visão geomé-trica. Tomos I e II. Editora UFMG: Belo Horizonte, 2009.

[2] BUENO, H. Álgebra Linear – um segundo curso. Rio de Janeiro: Sociedade Brasileira de Matemática, 2006.

[3] SANTOS, R. J. Um curso de Geometria Analítica e Álgebra Linear. Belo Horizonte: Imprensa Universitária da UFMG, 2007.

[4] SANTOS, R. J. Introdução à Álgebra Linear. Belo Horizonte: Imprensa Universitária da UFMG, 2008.

[5] SANTOS, R. J. Álgebra Linear e aplicações. Belo Horizonte: Imprensa Universitária da UFMG, 2006.


�

�“IntAL” — 2009/10/13 — 21:58 — page 85 — #87 �

�

�

�

�

�

Índice Remissivo

basecanônica do Rn, 35de um subespaço, 35

cálculo de determinantesde matrizes em bloco, 13por meio do escalonamento, 12

combinação linear, 30conjunto

gerador, 31ordenado, 35

dimensãode um subespaço, 39

espaçovetorialRn, 21complexo, 23real, 23

Gauss-Jordan, 7

método de Gauss-Jordan, 7matriz

aumentada de um sistema, 7escalonamento de uma, 8forma escalonada, 8

reduzida por linhas, 8

núcleode uma matriz, 11

operações elementaressobre as linhas de uma matriz, 7

pivô, 7

regrada unidade, 21, 24

sistema linear, 7escalonamento, 8forma escalonada, 8

reduzida por linhas, 8homogêneo, 7matriz aumentada de um, 7não homogêneo, 7

homogêneo associado, 7operações elementares, 7pivô, 7variável livre, 9

subespaço, 27gerado por um conjunto de vetores, 29

teoremade unicidade da forma escalonada reduzida por linhas, 10

variável livre, 9vetor, 23

multiplicação por escalar, 22vetores

linearmente dependentes, 32linearmente independentes, 32soma de, 22

85


Índice remissivo

base canônica do n, 35 de um subespaço, 35cálculo de determinantes de matrizes em bloco, 13 por meio do escalonamento, 12combinação linear, 30conjunto gerador, 31 ordenado, 35dimensão de um subespaço, 39espaço vetorial n, 21 complexo, 23 real, 23Gauss-Jordan, 7método de Gauss-Jordan, 7matriz aumentada de um sistema, 7 escalonamento de uma, 8 forma escalonada, 8 reduzida por linhas, 8núcleo de uma matriz, 11operações elementares sobre as linhas de uma matriz, 7pivô, 7regra da unidade, 21, 24sistema linear, 7 escalonamento, 8 forma escalonada, 8 reduzida por linhas, 8 homogêneo, 7 matriz aumentada de um, 7 não homogêneo, 7 homogêneo associado, 7 operações elementares, 7 pivô, 7 variável livre, 9subespaço, 27 gerado por um conjunto de vetores, 29teorema de unicidade da forma escalonada reduzida por linhas, 10variável livre, 9vetor, 23 multiplicação por escalar, 22vetores linearmente dependentes, 32 linearmente independentes, 32 soma de, 22


Sobre o autor

HAMILTON PRADO BUENO doutorou-se em Matemática na PUC-Rio. É professor do Departamento de Matemática da UFMG desde 1979. Atua em pesquisa sobre equações diferenciais, área na qual tem publi-cado regularmente. Dedica-se também à produção de livros didáticos de Matemática.


A presente edição foi composta pela Editora UFMG, em caracteres Chaparral Pro e Optima Std, e impressa pela Imprensa Universitária da UFMG, em sistema off set 90g (miolo) e cartão supremo 250g (capa), em 2011.


introduÇÃo À Álgebra linear - matemática ufmg a algebra linear.pdf · hamilton prado bueno...

Documents