Download - Uma Introdução à Teoria Axiomática dos Conjuntos · PDF fileA Teoria dos Conjuntos ocupa papel de destaque como fundamentação teórica das disciplinas matemáticas. Neste trabalho,

Uma Introdução à Teoria Axiomática dos Conjuntos

Renan Maneli Mezabarba

(versão pessoal)

São Carlos - SP 2012

Renan Maneli Mezabarba

Uma Introdução à Teoria Axiomática dos Conjuntos

Monografia apresentada ao Curso de Matemática da UFMS, como requisito parcial para obtenção do grau de LICENCIADO em Matemática.

Orientador: Elias Tayar Galante Mestre em Matemática pela Unicamp

Aquidauana - MS 2011

versão pessoal: margens e capa alteradas.

Aos meus pais, Nadir e Antonio,

E à minha tia, Nilda.

Agradecimentos

Primeiramente, agradeço aos meus pais, Nadir e Antonio, sem os quais eu não

existiria em qualquer esfera de interpretação.

Aos professores Marcelo Dias Passos e Rodrigo Roque Dias, pela inspiração,

suporte bibliográfico e conselhos, não apenas para a realização deste trabalho, mas para a vida

acadêmica de modo geral.

Pelas horas de discussão, leituras, sugestões e paciência desprendidas pelos

demais vértices da Santíssima Trindade, Fernando da Silva Batista e Thales Fernando

Vilamaior Paiva.

Ao Professor Elias Tayar Galante, pela orientação, pelos pertinentes avisos e por

suas lições de humanidade e cosmo-ética, meus sinceros cosmo-agradecimentos.

A todos os amigos, supracitados ou não, que ajudaram direta ou indiretamente,

obrigado por vocês existirem!

In re mathematica ars proponendi quaestionem pluris facienda est quam solvendi (Na Matemática, a arte de propor questionamentos é mais importante do que a arte de resolvê-los).

Georg Cantor

Resumo

A Teoria dos Conjuntos ocupa papel de destaque como fundamentação teórica das disciplinas matemáticas. Neste trabalho, faz-se uma breve contextualização dos principais aspectos do desenvolvimento da Teoria dos Conjuntos ao longo da História, enfocando os trabalhos de Cantor, Dedekind e Zermelo. Os nove axiomas do sistema Zermelo-Fraenkel-Choice (ZFC) são postulados e discutidos. As principais operações entre conjuntos são definidas e suas propriedades elementares são demonstradas. Números ordinais, cardinais e naturais são estabelecidos em ZFC, bem como suas características básicas. Questões de consistência e independência de axiomas são tratadas suscintamente e de maneira informal. Demonstra-se a equivalência lógica entre o Axioma da Escolha e algumas proposições na Matemática, bem como prova-se que a Hipótese Generalizada do Continuum implica o Axioma da Escolha. Palavras-chave: Teoria dos Conjuntos; Axiomática Zermelo-Fraenkel-Choice; Equivalências do Axioma da Escolha.

Abstract

The Set Theory occupies an important role as theoretic foundation of mathematics disciplines. This work makes a brief contextualization about the main features of the development of Set Theory along the History, centering the efforts of Cantor, Dedekind and Zermelo. The nine axioms of Zermelo-Fraenkel-Choice system (ZFC) are postulated and discussed. The main operations between sets are defined and their elementary properties are proved. Ordinal, cardinal and natural numbers are founded in ZFC, as well their basics properties. Topics about consistency and independence of axioms are suddenly argued in an informal way. It’s proved the logical equivalence among the Axiom of Choice and some mathematical propositions, as well is proved that the Generalized Continuum Hypothesis implies the Axiom of Choice.

Key-words: Set Theory; Zermelo-Fraenkel-Choice Axiomatic System; Equivalences of

Axiom of Choice.

Sumário

Introdução................................................................................................................................... 7

Capítulo 1 — O Paraíso Criado por Cantor ............................................................................... 9

Capítulo 2 — Desenvolvimentos Iniciais em ZFC .................................................................. 27

2.1 . Preliminares: Alfabeto e Definições.......................................................... 27

2.2 . O Sistema de Axiomas Zermelo-Fraenkel-Choice .................................... 32

2.3 . Operações Básicas Entre Conjuntos .......................................................... 45

Capítulo 3 — Relações e Funções............................................................................................ 63

3.1 . Relações..................................................................................................... 63

3.2 . Relações de Equivalência .......................................................................... 70

3.3 . Funções ...................................................................................................... 75

Capítulo 4 — Conjuntos Bem Ordenados e Números Ordinais............................................... 92

4.1 . Conjuntos Bem Ordenados ........................................................................ 92

4.2 . Números Ordinais e a Recursão Transfinita............................................ 102

4.3 . Números Naturais e Conjuntos Finitos.................................................... 119

Capítulo 5 — O Axioma da Escolha ...................................................................................... 129

5.1 . Consistência e Independência.................................................................. 129

5.2 . Formulações Equivalentes do Axioma da Escolha ................................. 131

5.3 . A Hipótese Generalizada do Continuum ................................................. 139

Conclusão ............................................................................................................................... 142

Apêndice A — Leis do Cálculo Proposicional ...................................................................... 143

Apêndice B — Conjuntos Bem Fundados ............................................................................. 145

Bibliografia............................................................................................................................. 147

Índice Remissivo .................................................................................................................... 150

7

Introdução

Esta monografia tem por objetivo desenvolver os tópicos básicos da Teoria dos

Conjuntos de acordo com o sistema de axiomas Zermelo-Fraenkel-Choice (ZFC). Para tanto,

seguimos Hrbacek & Jech (1999) e Suppes (1972) como referência principal para a

elaboração do texto e da teoria. No entanto, como existem muitas formulações equivalentes de

ZFC, não abandonamos a visão de outros autores, como Kunen (1980), Fraenkel, Bar-Hillel &

Levy (1973) e Levy (1979), que foram exaustivamente consultados durante a elaboração deste

trabalho, principalmente na preparação dos tópicos sobre cardinais, ordinais e o Axioma da

Escolha.

Intuitivamente, um conjunto é uma coleção de objetos. Tomado de maneira mais

abstrata, podemos considerá-lo como uma coletânea de elementos que possuem alguma

propriedade em comum. Se nos restringirmos apenas às relações de pertinência e inclusão,

veremos que a noção de conjuntos é quase tão primitiva quanto à própria ideia de número —

numa manada de mamutes, por exemplo, temos o conjunto dos mamutes que pertencem a esta

manada.

Por muito tempo, matemáticos utilizaram tal conceito puramente intuitivo na

formulação dos muitos ramos da matemática que brotaram e chegaram até nós nos dias de

hoje. Contudo, no início do século XX, uma série de paradoxos estremeceu as bases da

imensa árvore da Matemática. Felizmente, tais tremores levaram os matemáticos a

abandonarem a abordagem intuitiva e “ingênua” e assumirem o rigor e a lógica formal como

bases para a reconstrução de toda a Matemática: a axiomatização.

O primeiro capítulo desta monografia dedica-se a uma breve contextualização

sobre a História da Teoria dos Conjuntos, desde seus primórdios ingênuos ou intuitivos até

sua axiomatização. Destacamos os papéis fundamentais de Georg Cantor e Richard Dedekind,

no estabelecimento da Teoria dos Conjuntos como disciplina matemática. Posteriormente,

citamos as contribuições de Ernst Zermelo, Abraham Fraenkel e Thoralf Skolem pela

“construção” do primeiro sistema axiomático que estabilizou as bases da Teoria dos

Conjuntos após a sucessão de paradoxos descobertos entre o final do século XIX e início do

século XX, sobre os quais também discutimos.

No segundo capítulo desenvolvemos os tópicos básicos da teoria axiomática dos

conjuntos de Zermelo-Fraenkel-Choice. Estabelecemos a linguagem básica a ser utilizada ao

8

longo do texto e postulamos os nove axiomas de ZFC. Definimos também as relações entre

conjuntos, como inclusão, interseção, união, produto cartesiano, etc. e demonstramos suas

propriedades elementares.

O terceiro capítulo destina-se à fundamentação em ZFC do conceito de relação

binária. Definimos domínio, imagem e contradomínio de relações e provamos alguns

resultados concernentes às relações de equivalência. Também discorremos sobre funções e

abordamos alguns problemas de equipotência, como o Teorema de Cantor-Bernstein.

Versamos sobre conjuntos bem ordenados e seus representantes canônicos, os

números ordinais, no quarto capítulo. Focamos rapidamente nosso estudo para os números

naturais, donde segue uma rápida discussão concernente a conjuntos finitos, infinitos

enumeráveis e não enumeráveis.

O quinto capítulo dedica-se exclusivamente ao Axioma da Escolha, isto é,

debatemos os “prós” e “contras” em assumi-lo como verdadeiro ou falso, ou seja, sobre a

ocorrência ou não de inconsistências na teoria. Demonstramos algumas equivalências entre o

Axioma da Escolha e outros princípios da Teoria dos Conjuntos, como o Lema de Zorn e a

Lei da Tricotomia. Por fim, provamos que a Hipótese Generalizada do Continuum implica o

Axioma da Escolha.

O Apêndice A consiste de uma lista de leis lógicas utilizadas ao longo deste

trabalho, como a contrapositiva, a transitividade da implicação, etc. No Apêndice B tratamos

concisamente de Conjuntos Bem Fundados, de maneira informal e introdutória. Julgamos

necessários tais apêndices por considerarmo-los muito importantes no contexto geral da

Matemática, apesar de não serem os focos deste trabalho.

9

Capítulo 1 — O Paraíso Criado por Cantor

Unter einer ‘Meng’ verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten m unserer Anschauung oder unseres Denkens (welche die Elemente von M genannt werden) zu einem Ganzen. (CANTOR, 1895/97, p. 282 apud FERREIRÓS, 2007, p. 292).

Com as palavras acima1, num de seus trabalhos realizados na segunda metade do

século XIX, o matemático Georg Cantor inaugurou uma das teorias mais importantes de toda

a Matemática, sobre a qual esta se fundamenta e se projeta: a Teoria dos Conjuntos. Da nossa

intuição, um conjunto é uma coleção de objetos. No entanto, ao adotarmos tal noção na

Matemática, devemos nos precaver, isto é, precisamos ter em mente que conjuntos de objetos

concretos não são necessariamente conjuntos matemáticos. Com efeito,

Conjuntos não são objetos do mundo real, como mesas ou estrelas; eles são criados por nossa mente, não por nossas mãos. Um saco de batatas não é um conjunto de batatas, um conjunto de moléculas numa gota d’água não é o mesmo objeto que tal gota d’água. A mente humana possui a habilidade de abstrair, pensar numa variedade de diferentes objetos ligados por alguma propriedade comum e assim formar um conjunto dos objetos que possuem essa propriedade. (HRBACEK & JECH, 1999, p. 1, tradução nossa).

Dessa forma, ao nos referirmos à Teoria dos Conjuntos, podemos entendê-la como

sendo o ramo da Matemática dedicado exclusivamente ao estudo dos conjuntos e de suas

propriedades, inseridos dentro de um contexto matemático. Por sua vez, tal teoria tem por

objetivo servir como fundação para as demais disciplinas matemáticas, haja vista que durante

séculos a Teoria dos Conjuntos — ou a noção intuitiva do que vem a ser um conjunto — foi

usada tacitamente por matemáticos e filósofos.

Na era clássica da matemática grega, os silogismos2 de Aristóteles já se baseavam

na noção intuitiva dos conjuntos, evidenciando que tais ideias fazem parte das raízes

históricas da Lógica e da Matemática. Um exemplo de tais silogismos é dado a seguir.

Suponha que todos os homens sejam mortais, se Sócrates é um homem, então Sócrates é

1 “Por conjunto, entendemos qualquer reunião 𝑀 bem definida de objetos distintos 𝑚 de nossa intuição ou pensamento (que são chamados os elementos de 𝑀)” (FERREIRÓS, 2007, tradução nossa).

2 São regras de argumentação desenvolvidas por Aristóteles, que tratam de relações do tipo “todo 𝐴 é 𝐵” e “algum 𝐴 é 𝐵”. Para uma discussão mais aprofundada, sugerimos Bourbaki (1968) e Boyer (1996).

10

mortal. Na linguagem moderna da Teoria dos Conjuntos temos o conjunto dos mortais 𝑀

contendo o subconjunto dos homens 𝐻, isto é, 𝐻 ⊂ 𝑀; assim, se Sócrates ∈ 𝐻, então Sócrates

∈ 𝑀 (BOYER, 1996).

Mais recentemente, em meados do século XIX, George Boole também “se

apropriou” dos conjuntos em sua lógica simbólica, utilizando-os para representar coleções de

pontos, números ou ideias, isto é, como extensões de conceitos lógicos. Sobre o “conjunto

universo” — conjunto de todos os objetos, que ele chamou de 1 — ele considerava como

operações a interseção e a união disjunta de conjuntos, denotados respectivamente por 𝑥𝑦 e

𝑥 + 𝑦, onde 𝑥 e 𝑦 são conjuntos. Boole também definiu o conjunto vazio — conjunto que não

possui objetos, denotado por 0 —, bem como o complementar de um conjunto 𝑥, isto é, o

conjunto dos objetos não pertencentes a 𝑥, e chamou-o de 1− 𝑥. O filósofo e matemático

Bertrand Russell, ao se referir à Matemática Pura como a maior descoberta do século XIX,

defendeu Boole como sendo o seu descobridor, um título considerado justo por muitos

historiadores e matemáticos.

Se levarmos em consideração o fato de que as operações definidas por Boole

atuavam sobre conjuntos, podemos até mesmo pensar que fora ele o “pai” da Teoria dos

Conjuntos. No entanto, tal inferência não é verdadeira. De fato, como citamos acima, desde

Aristóteles os conjuntos eram ferramentas costumeiras da Lógica. Fossem eles tomados de

maneira intuitiva como na era clássica grega ou como extensões de conceitos lógicos no

século XIX, as únicas operações consideradas sobre os conjuntos tratavam na verdade de

operações envolvendo os conceitos que formavam tais conjuntos, como exemplificamos com

o silogismo de Aristóteles. Assim, se restringíssemo-nos a essa visão de conjunto como

ferramenta da Lógica, poderíamos inferir que “um pai” da Teoria dos Conjuntos seria

Aristóteles ou então alguém que se encontra nalgum ponto da História anterior a este.

Ao referirmo-nos à Teoria dos Conjuntos, as propriedades inerentes aos conjuntos

e seus elementos não se restringem apenas às relações de pertinência, inclusão e afins, onde

Boole e os lógicos, de maneira geral, se limitaram. É neste ponto que se encontram as grandes

inovações dadas por Cantor, Dedekind e outros: eles estenderam a visão sobre os conjuntos,

aumentando de maneira significativa o leque de propriedades e relações existentes entre eles,

principalmente no que se refere aos conjuntos infinitos.

11

Obviamente o infinito já fora alvo de investidas intelectuais bem antes do século

XIX. Zenão de Eléia, com seus paradoxos sobre o movimento, como, por exemplo, o

Paradoxo de Aquiles3, foi certamente um dos primeiros filósofos gregos a questionar as

implicações do infinito. Aristóteles também ponderou sobre a natureza do infinito, chegando à

conclusão de que há dois tipos de infinito: o completo, também chamado de atual, e o

potencial. O infinito completo seria aquele em que infinitos objetos distintos existem

simultaneamente, enquanto o infinito potencial seria alguma coleção que pode ser

arbitrariamente estendida, isto é, cujo número de elementos pode ser aumentado de acordo

com a necessidade em questão, como o comprimento de um dado segmento ou o sucessor de

um número qualquer. Aristóteles defendia a existência do infinito potencial em detrimento do

infinito completo, e tal visão ecoou no pensamento filosófico e matemático durante os séculos

seguintes.

Em 1638, no livro Discorsi e Dimostrazioni Matematiche Intorno a Due Nuove

Scienze (Discursos e Demonstrações Matemáticas Sobre Duas Novas Ciências), Galileu

Galilei encontrou uma “estranha” propriedade do conjunto dos números naturais (inteiros não

nulos). Ele notou que na correspondência 𝑛 ⟶ 𝑛2 , onde 𝑛 é um número natural, todo número

𝑛 possui um quadrado perfeito; por outro lado, existem números naturais, como o número 2,

por exemplo, que não são quadrados perfeitos de algum outro número, ou seja, cujas raízes

não são números naturais. Seguiria daí, por um axioma de Euclides, o qual afirma que “o todo

é maior que a parte”, que o conjunto dos quadrados perfeitos deveria ser menor que o

conjunto dos naturais, pois o primeiro é subconjunto próprio do último. No entanto, pela

correspondência estabelecida por Galileu, todo número inteiro positivo deve possuir um

quadrado perfeito, donde se conclui, neste caso, que o todo é igual à parte, no que concerne a

quantia de elementos, um “absurdo”. Entretanto, em vez de impulsionar o estudo de conjuntos

infinitos, tal conclusão serviu apenas para afastar os estudiosos deste conceito, que viram na

estranha propriedade não uma característica de tais conjuntos, mas sim uma aberração

intuitiva, um paradoxo que contrariava o bom senso euclidiano e mais um motivo para rejeitar

tais conjuntos completamente infinitos (BOURBAKI, 1968).

3 Resumidamente, o Paradoxo de Aquiles se baseia na subdivisão infinita do trajeto a ser percorrido por Aquiles numa hipotética corrida contra uma tartaruga. Para percorrer um comprimento 𝑛, Aquiles teria que, antes disso, percorrer metade deste comprimento 𝑛, porém, para tanto ele deveria percorrer metade deste último e assim sucessivamente, resultando na impossibilidade do movimento, pois as subdivisões infinitas implicariam a estagnação de Aquiles, como pretendia Zenão (BOYER, 1996).

12

Sabe-se, por exemplo, que o grande matemático Friedrich Gauss escreveu num de

seus trabalhos:

“Eu protesto… Contra o uso de magnitudes infinitas como algo consumado, tal uso nunca é admissível na Matemática. O infinito é apenas um façon de parler [modo de falar]: tem-se em mente limites para os quais certas razões aproximam-se tanto quanto desejarmos, enquanto outras aumentam indefinidamente.” (1860 apud FRAENKEL, 1953, itálico do autor, tradução nossa).

É frequentemente aceito que o horror infiniti de Aristóteles permaneceu entre

cientistas e matemáticos até ser encerrado pela vigorosa defesa de Cantor em aceitar a

existência e a necessidade do infinito atual. No entanto, o mérito pela difusão do infinito

completo no meio científico não pertence exclusivamente a Cantor. Na Alemanha havia uma

forte tendência filosófica em aceitar o infinito completo bem antes dos trabalhos de Cantor, e

tal comportamento facilmente se propagou no meio matemático. Ainda em 1714, o filósofo e

matemático alemão Gottfried Leibniz, em seu trabalho intitulado Monadologie4, defendeu a

plausibilidade do infinito completo e influenciou as gerações vindouras de pensadores

alemães. Matemáticos como Bernhard Riemann e Richard Dedekind, que tiveram grande

importância para o desenvolvimento da Teoria dos Conjuntos, foram direta ou indiretamente

influenciados pelas ideias de Leibniz e, em ambos os casos, independentemente de Cantor.

(FERREIRÓS, 2007).

Uma importante contribuição posterior à Leibniz foi dada pelo filósofo, teólogo e

matemático Bernard Bolzano, não apenas em seu livro Paradoxien des Unendlichen

(Paradoxos do Infinito, publicado em 1851, três anos após sua morte), mas também num

trabalho anterior, Wissenchaftslehre (Teoria da Ciência, publicado em 1837). Bolzano

introduziu a noção de conjunto em muitas abordagens diferentes. Em geral, ele tratava de

coleções ou extensões de conceitos, mas distinguia aquelas nas quais a ordem dos elementos

era arbitrária, chamando-as de Mengen (quantidades) e, dentre estas, ele destacava as coleções

cujos elementos eram unidades, denominando-as multiplicidades. Para Bolzano, uma

multiplicidade é infinita se é maior que qualquer multiplicidade finita, isto é, se qualquer

Menge finito é apenas uma parte dele. Bernard Bolzano defendeu vigorosamente o infinito

4 Um dos mais conhecidos trabalhos de Leibniz, no qual ele defende uma concepção de universo composto por “unidades metafísicas” (FERREIRÓS, 2007).

13

completo, afirmando que os “paradoxos” encontrados em conjuntos infinitos não eram de fato

paradoxos, mas sim características próprias de tais conjuntos (FERREIRÓS, 2007).

Não apenas os desenvolvimentos da Análise e da Lógica no século XIX

impulsionaram o surgimento da Teoria dos Conjuntos, mas também a formalização presente

em praticamente todos os ramos da matemática neste período foram fatores marcantes para

que a Teoria dos Conjuntos se fizesse necessária. Segundo Ferreirós:

[…] durante a segunda metade do século XIX, a noção de conjuntos foi crucial para o surgimento de novas concepções na álgebra, nos fundamentos da aritmética e mesmo na geometria. Sobretudo, todo esse desenvolvimento antecedeu as mais antigas investigações de Cantor sobre a teoria dos conjuntos e, provavelmente, tal desenvolvimento motivou o seu trabalho. A concepção conjuntística [set-theoretical conception] dos diferentes ramos da matemática está, portanto, inscrita nas origens da teoria dos conjuntos. (FERREIRÓS, 2007, p. xvii, tradução nossa).

Ao se referir à “concepção conjuntística”, Ferreirós faz menção à tendência já

presente no século XIX de definir os objetos matemáticos com a utilização de termos e ideias

semelhantes àqueles pertencentes a atual Teoria dos Conjuntos. As definições dadas por Jakob

Steiner em 1832 num de seus trabalhos mais importantes sobre Geometria5 servem como

exemplo. Nele, “Steiner enfatiza as concepções de linha, plano, feixe de retas, etc. como

agregados de infinitos elementos” (FERREIRÓS, 2007, p. 22, tradução nossa) tratando, dessa

forma, não apenas de conjuntos ou “agregados”, mas também de conjuntos infinitos, dois

conceitos inerentes à Teoria dos Conjuntos.

Conforme lembrado por Ferreirós (2007), na mesma “concepção conjuntística”,

devemos citar a contribuição de Bernhard Riemann com suas variedades. Em 1854, numa

palestra (public lecture) na ocasião de seu Habilitation6 como professor de Göttingen e

publicado postumamente em 1868 por Dedekind, Riemann definiu “variedade” como sendo a

totalidade de “determinações” de um conceito genérico. Por exemplo, tomando como conceito

a cor, teríamos que cada cor particular em cada variação possível de tonalidade seria uma

determinação e, por conseguinte, a totalidade de tais cores formaria uma variedade. Riemann

utilizou tal conceituação conjuntística de variedade como uma generalização da ideia de

5 Systematische Entwicklung der Abhängigkeit geometrischer Gestalten von einander (Desenvolvimento Sistemático da Interdependência Entre as Configurações Geométricas, publicado em 1832) (FERREIRÓS, 2007).

6 Habilitation é o mais alto grau acadêmico que uma pessoa pode adquirir em certos países da Europa e da Ásia.

14

magnitude e abriu caminho para definir rigorosamente a noção de número pela utilização de

abordagens igualmente conjuntísticas, passagem na qual se destacou Richard Dedekind.

Deve-se a Dedekind a criação de um dos principais métodos para a construção dos

números reais pela utilização explícita de conjuntos. Aliás, muito de seu trabalho em números

algébricos baseou-se em conjuntos, os quais ele chamou de sistemas (FERREIRÓS, 2007). De

fato, seu uso foi tão forte que Dedekind chegou a definir tais conceitos, como podemos ver

abaixo:

[…] Eu entendo por objeto [thing] todas as coisas de nosso pensamento […]. Um objeto é completamente determinado por tudo o que pode ser afirmado ou pensado com respeito a ele. Um objeto 𝑎 é o mesmo que um objeto 𝑏 (idêntico à 𝑏), e 𝑏 é idêntico à 𝑎 se tudo o que puder ser pensado a respeito de 𝑎 puder também ser pensado a respeito de 𝑏 […]. É muito comum ocorrer que objetos distintos 𝑎, 𝑏, 𝑐 … por alguma razão sejam considerados comuns sob algum ponto de vista, podendo ser associados em nossa mente, e dizemos que eles formam um sistema 𝑆; nós chamamos os objetos 𝑎, 𝑏, 𝑐 … de elementos do sistema 𝑆 […]. (DEDEKIND, 1901, p. 44, itálico do autor, tradução nossa)7.

Na “teoria dos sistemas” de Dedekind o conceito de função (mappings) não se

baseou sobre a noção de conjuntos, mas foi tomado como um ente primitivo, de modo que ele

desenvolveu significativamente a teoria abstrata das funções. Seus escritos ainda fizeram

menção ao princípio da extensionalidade, o qual afirma que dois conjuntos 𝑆1 e 𝑆2 são iguais

se, e somente se, todos os objetos que pertencem a 𝑆1 pertencem a 𝑆2 e todos os objetos

pertencentes a 𝑆2 também pertencem a 𝑆1. Dedekind também definiu o que seriam as partes e

partes próprias de um sistema — o que atualmente chamamos de subconjuntos e subconjuntos

próprios de um conjunto, respectivamente (FERREIRÓS, 2007).

Com tais conceitos formulados, Dedekind definiu de maneira clara o que é um

conjunto infinito completo, utilizando a anomalia encontrada por Galileu como uma

caracterização para tais conjuntos. Para Dedekind, “um sistema 𝑆 é dito infinito quando é

similar a uma parte própria de si mesmo [quando existe uma injeção de 𝑆 sobre uma parte

própria de 𝑆]; caso contrário, 𝑆 é dito um conjunto finito.” (1901, p. 63, tradução nossa).

7 Essays On The Theory Of Numbers (Ensaios sobre a Teoria dos Números), publicado em 1901 é uma tradução inglesa das obras Stetigkeit und irrationale Zahlen (Continuidade e Números Irracionais) de 1872 e Was sind und was sollen die Zahlen? (O Que São os Números e O Que Poderiam Ser?) de 1888, ambas de autoria de Richard Dedekind.

15

Dada à importância do infinito completo para a atual Teoria dos Conjuntos,

julgamos interessante transcrever a demonstração do “Teorema 66” de Dedekind, no qual ele

argumenta favoravelmente à existência de conjuntos infinitos:

Prova: Meu próprio reino dos pensamentos, isto é, a totalidade 𝑆 de todas as coisas que podem ser objetos de meu pensamento, é infinita. Seja 𝑠 um elemento de 𝑆, então o pensamento 𝑠′ de que ‘𝑠 é um elemento de 𝑆’ é ele próprio um elemento de 𝑆. Se considerarmos isso como a transformação 𝜙(𝑠) do elemento 𝑠, então a transformação 𝜙 de 𝑆 [a imagem direta de 𝑆] tem, conforme determinamos, a propriedade de que 𝑆′ é uma parte de 𝑆; e 𝑆′ é certamente uma parte própria de 𝑆, pois existem elementos em 𝑆 (por exemplo, meu próprio ego) que são diferentes de quaisquer pensamentos 𝑠′ e, portanto, não estão contidos em 𝑆′. Finalmente é claro que se 𝑎, 𝑏 são elementos distintos de 𝑆, então as imagens 𝑎′ e 𝑏′ são também diferentes, e portanto a transformação 𝜙 é uma transformação distinta [injetora]. Dessa forma, 𝑆 é infinito, como queríamos provar. (DEDEKIND, 1901, p. 64, tradução nossa).

Em outras palavras, Dedekind considerou a função injetora 𝜙: 𝑆 ⟶ 𝑆 que associa

cada pensamento 𝑠 ao pensamento 𝜙(𝑠) = 𝑠′ de que “𝑠 é um elemento de 𝑆”, na qual tem-se

𝜙(𝑆) como subconjunto próprio de 𝑆. Devemos ressaltar que embora a prova de Dedekind

seja interessante devido aos seus questionamentos filosóficos, “[…] de forma nenhuma essa

demonstração satisfaz os padrões modernos.” (SUPPES, 1972, p. 138, tradução nossa).

Sem dúvidas, o aprofundamento da Análise e a obtenção de resultados patológicos

e não intuitivos motivaram o grande ímpeto, presente no século XIX, de aritmetizá-la. Tal

processo consistia em formalizar o conceito de número real de uma forma aritmética

independentemente das noções geométricas, pois até então números reais eram concebidos

como magnitudes, o que não condizia com a crescente formalização da Matemática. Como

exemplo de tais patologias, temos: a existência de uma função contínua em todos os pontos,

mas não derivável em todos eles, mostrada por Bolzano; Riemann exibiu uma função 𝑓

descontínua em infinitos pontos que ainda assim é integrável, o que o motivou a definir uma

nova e mais rigorosa noção de integral, que hoje recebe seu nome. Ambos os resultados acima

contrariavam a noção intuitiva de continuidade, mas estavam de acordo com as noções vagas

da época sobre números reais. (BOURBAKI, 1968).

Ferreirós (2007) também observa que concernente a tal formalização, não apenas

Dedekind, mas também Karl Weierstrass e Georg Cantor tiveram contribuições notáveis —

não obstante outros matemáticos tenham também desenvolvido métodos próprios — e, em

todos os casos, de uma forma ou de outra, concepções conjuntísticas foram utilizadas:

16

Weierstrass utilizou séries infinitas, Cantor empregou sequências de Cauchy e Dedekind

recorreu a sistemas de números racionais — os quais ele denominou de cortes8.

Georg Cantor começou como analista, trabalhando com séries trigonométricas, o

que provavelmente motivou seu interesse por problemas sobre equipotência. Em 1873, ele

provou que o conjunto dos números racionais é contável ou enumerável9, bem como o

conjunto dos números algébricos — números que são raízes de polinômios cujos coeficientes

são inteiros. Isto significa, grosso modo, que existe “a mesma quantidade” de números

naturais e de números algébricos. Por algum tempo, chegou-se a imaginar que a cardinalidade

do infinito fosse única, isto é, que conjuntos infinitos possuíssem sempre a mesma “quantia”

de elementos, mas logo Cantor chegou à conclusão contrária: o conjunto dos números reais é

incontável. Prosseguindo com suas pesquisas, Cantor tentou por três anos demonstrar a

impossibilidade de uma bijeção entre ℝ e ℝ𝑛, para 𝑛 > 1, quando em 1877, para seu

espanto10, provou que estava errado: ℝ e ℝ𝑛 são equipotentes para 𝑛 > 1 (BOURBAKI,

1968).

Ainda segundo Bourbaki (1968), munido de tais resultados, Cantor devotou-se

inteiramente à sua Mengelehre (Teoria das Coleções). Entre 1878 e 1884, numa série de seis

artigos publicados no periódico alemão Mathematische Annalen, dedicado à divulgação de

pesquisas matemáticas desde 1868, Cantor tratou de questões de topologia de ℝ e ℝ𝑛, de

problemas sobre equipotência, da Teoria dos Conjuntos totalmente ordenados, entre outros

tópicos.

Com o desenvolvimento da teoria sobre boas ordenações, Cantor pensou em

iterações “transfinitas” de conjuntos derivados de outros, gerando assim conjuntos cada vez

maiores. Para tanto, ele se baseou num teorema que havia provado11, o qual afirma que se 𝐴

for um conjunto então a cardinalidade de 𝐴 é estritamente menor do que a cardinalidade de

℘(𝐴), onde ℘(𝐴) é o conjunto cujos membros são os subconjuntos de 𝐴. Seguiu-se então um

detalhado estudo sobre as propriedades dos números cardinais, culminando na Hipótese do

8 Embora Dedekind tenha desenvolvido sua teoria dos números reais em 1858, ele só a publicou em 1872, mesmo ano em que Cantor publicou um artigo sobre séries trigonométricas, no qual ele expôs seu método. Weierstrass nunca chegou a publicar sua teoria sobre os números reais, o que se sabe a respeito de suas ideias corresponde a análises de redações de seus estudantes, que se difundiram rapidamente na comunidade matemática alemã por volta de 1860 (FERREIRÓS, 2007).

9 Ver Capítulo 4, Seção 4.3. 10 Numa carta escrita para Dedekind, Cantor pediu para que este verificasse sua prova da

equipotência e, referindo-se à própria descoberta, escreveu: “Eu vejo isso, mas não acredito.” (CANTOR & DEDEKIND, 1937, p. 34 apud FERREIRÓS, 2007, p. 171, tradução nossa).

11 Ver Capítulo 3, Teorema 3.13.

17

Continuum, que afirma não existir conjunto cuja cardinalidade seja estritamente menor do que

a cardinalidade dos números reais e maior do que a cardinalidade dos naturais.

Os números transfinitos marcam o ponto crucial dos trabalhos de Cantor rumo a

uma teoria abstrata dos conjuntos, onde esta se torna uma disciplina voltada para si mesma.

Ele republicou seus artigos sobre a Teoria dos Conjuntos no livro Grundlagen einer allgeimen

Mannigfaltigkeitslehre (Fundações de uma Teoria Geral das Multiplicidades, publicado em

1883), no qual ele também discute as implicações filosóficas e teológicas de suas “inovações”

matemáticas, motivado pela consciência de que suas novas ideias iam contra as visões

prevalentes de número e infinito, como ressaltado por Ferreirós (2007).

Portanto, conforme sintetizado por Ferreirós, Cantor e Dedekind contribuíram

para o desenvolvimento da Teoria dos Conjuntos em duas frentes distintas, pois

Durante o último quarto do século XIX, Dedekind e Cantor publicaram contribuições cruciais para a teoria abstrata dos conjuntos. Dedekind tentou elaborar uma base abstrata para uma fundação rigorosa da matemática pura — aritmética, álgebra e análise. Por sua vez, Cantor deu o passo radical de começar a explorar o reino dos conjuntos infinitos e, em tal processo, criou o que é usualmente chamado de teoria dos conjuntos no senso estrito. (FERREIRÓS, 2007, p. 170, tradução nossa).

Diz-se geralmente que a Teoria dos Conjuntos desenvolvida por Cantor não foi

bem acolhida em sua época. Entretanto, há muitos exemplos que revelam uma boa recepção

de suas ideias. Matemáticos como Henri Poincaré e Karl Weierstrass e Mittag-Leffer

aceitaram e fizeram uso das contribuições Cantorianas na Topologia Geral (point-set

topology). (FERREIRÓS, 2007).

Mas, obviamente, nem todas as suas ideias foram facilmente recebidas, haja vista

suas grandes inovações. O grande desacordo, vindo principalmente da velha guarda

matemática, residiu principalmente sobre os números transfinitos. O principal opositor a tais

conceitos foi Leopold Kronecker. Ele defendia a construção da Matemática tendo como base

os números naturais, mas rejeitava o infinito completo e, por conseguinte, desprezou todas as

definições de números irracionais, uma vez que tais definições exigiam a aceitação do infinito

completo e, pelo mesmo motivo, rejeitou os números transfinitos. Uma típica reação negativa

aos trabalhos de Cantor pode ser exemplificada pelo texto de Charles Hermite, que qualifica

suas pesquisas como “desastrosas […], [de tal maneira que julga ser] impossível encontrar,

dentre os resultados que podem ser compreendidos, apenas um que possua um interesse real e

presente.” (FERREIRÓS, 2007, p. 283, tradução nossa). Tal visão, segundo Ferreirós,

18

“corresponde à visão da maioria dos matemáticos contemporâneos a ele [Hermite] […]” (op.

cit. p. 283) para com as ideias de Cantor. No entanto, foi o apoio da nova geração — dentre os

quais se destaca Poincaré — que contribuiu para convencer a “velha guarda” da importância

da Teoria dos Conjuntos.

Assim, entre o final do século XIX e o início do século XX, após enfrentar muitas

ressalvas da comunidade matemática, as concepções essenciais das ideias de Cantor haviam

ganhado o reconhecimento da comunidade matemática, quando a Teoria dos Conjuntos

passou a ser aplicada à Geometria e à Análise. Justamente nesse período, paradoxos

começaram a surgir dentro da Teoria dos Conjuntos, abalando assim a recém-nascida

confiança que o mundo havia lhe depositado (FRAENKEL, BAR-HILLEL, & LEVY, 1973).

Antes de prosseguirmos, devemos tentar enxergar de maneira mais clara o que

vem a ser um paradoxo, também chamado de antinomia, uma contradição lógica. Em 1926,

Frank Ramsey foi provavelmente o primeiro a dividir os paradoxos em dois tipos: os

paradoxos lógicos ou matemáticos, e os paradoxos linguísticos ou semânticos.

Grosseiramente falando, a primeira classe surge de construções puramente matemáticas que

resultam em contradições; o segundo decorre de considerações da linguagem que usamos para

falar sobre as construções matemáticas e lógicas. Um exemplo de paradoxo semântico pode

ser dado pelo Paradoxo do Mentiroso, de Epimênides. Epimênides, o Cretense, disse: “eu

estou mentindo”. Se essa sentença for verdadeira então ele está mentindo e daí decorre que a

afirmação é falsa; se a sentença for falsa então ele não está mentindo e, portanto, ele está

mentindo, logo a afirmação é verdadeira (SUPPES, 1972).

Os paradoxos que abalaram a Teoria dos Conjuntos no final do século XIX fazem

parte da primeira classe de Ramsey, isto é, são paradoxos lógicos. Supõe-se que um dos

primeiros tenha sido encontrado por Cantor, ainda em 1899. Na teoria ingênua dos conjuntos,

não baseada explicitamente sobre axiomas, mas sim sobre a intuição, era comum aceitar como

válida a existência de um conjunto universo 𝑈, cujos membros são todos os objetos e

conjuntos que existem. Naturalmente, se denotarmos por 𝔠 o número cardinal de 𝑈, tem-se

que 𝔠 é o maior cardinal que existe. Porém, decorre de um teorema provado por Cantor, que se

℘(𝑈) tem como número cardinal 𝔭, então 𝔭 > 𝔠, o que contraria o fato de ser 𝔠 o maior

cardinal. Outro paradoxo semelhante, envolvendo o maior número ordinal existente também

19

foi encontrado nessa época, por Burali-Forti12. Ainda assim, tais antinomias não destruíram a

confiança na Teoria dos Conjuntos, principalmente por fazerem parte de contextos avançados

da teoria. A esperança, nesse caso, era que uma revisão nas demonstrações encerrasse os

paradoxos. No entanto, tal esperança morreu com a chegada do paradoxo de Russell.

O Paradoxo de Russell, observado pela primeira vez por Bertrand Russell, reside

num conceito fundamental da teoria ingênua dos conjuntos, chamado de Princípio (ou

Axioma) da Abstração: dada qualquer propriedade\condição 𝜙, existe um conjunto 𝐴 formado

por todos os elementos que possuem\satisfazem 𝜙 e, reciprocamente, todos os elementos que

satisfazem 𝜙 pertencem a 𝐴. A primeira formulação explícita de tal princípio parece ter sido

feita por Gottlob Frege em 1893, no primeiro volume de seu livro Grundgesetze der

Arithmetik (Fundamentos da Aritmética), no qual o autor elaborou de maneira extremamente

formal, entre outras coisas, a conceituação de número como sendo a cardinalidade de

conjuntos (SUPPES, 1972).

Para obter o paradoxo, basta considerarmos o conjunto 𝑅 formado pelos

elementos que possuem a propriedade de “não pertencer a si mesmo”. Nestas condições, se 𝑅

pertencer a si mesmo, então 𝑅 possui a propriedade e, portanto, não pertence a si mesmo,

absurdo. Logo, deve-se ter que 𝑅 não pertence a 𝑅, mas daí decorre que 𝑅 possui a

propriedade e então 𝑅 pertence a si mesmo.

Na linguagem simbólica que usaremos no Capítulo 2, podemos formular o

Axioma da Abstração como:

(1) (∃𝑦)(∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝜑(𝑥)�,

onde entende-se que 𝜑(𝑥) é uma fórmula na qual “𝑦” não é uma variável livre13. Para obter o

Paradoxo de Russell, tomamos 𝜑(𝑥) ≡ 𝑥 ∉ 𝑥. Então, temos garantido, por (1), que:

(2) (∃𝑅)(∀𝑥)(𝑥 ∈ 𝑅 ⟺ 𝑥 ∉ 𝑥).

Como (2) é verdadeiro para quaisquer “𝑥”, tomamos 𝑥 = 𝑅, donde segue que:

(3) 𝑅 ∈ 𝑅 ⟺ 𝑅 ∉ 𝑅.

De (3), obtemos:

12 Ver demonstração do item (vi) do Teorema 4.6, no Capítulo 4. 13 Ver Capítulo 2, Seção 2.1.

20

(𝑅 ∈ 𝑅 ⟺ 𝑅 ∉ 𝑅) ⟹𝑅 ∈ 𝑅 ∧ 𝑅 ∉ 𝑅,

um absurdo, pois viola o Princípio da Não Contradição: uma sentença não pode ser

verdadeira e falsa simultaneamente.

Deve-se frisar que a contradição não se encontra no fato de perguntarmos se 𝑅

pertence ou não a si mesmo, pois “exemplos” corriqueiros de ambos os casos abundam: o

conjunto dos números naturais, por exemplo, não é um número natural, da mesma forma que

o “conjunto” dos homens não é um homem; na outra vertente, temos o “conjunto” das

abstrações que é uma abstração, ou ainda a ideia intuitiva do conjunto de todos os conjuntos

que é um conjunto e, portanto, pertence a si mesmo. Frisamos apenas que tal situação de um

conjunto universo não ocorre em ZFC, como provamos no Teorema 2.1 do Capítulo 2.

A contradição se encontra em tomar como plausível a existência de um conjunto

cujos membros são exatamente todos os conjuntos que não pertencem a si mesmos. Nas

palavras de Hrbacek e Jech,

A lição contida no Paradoxo de Russell e outros exemplos similares é que meramente definir um conjunto não prova sua existência (da mesma forma que definir um unicórnio não prova que o unicórnio existe). Existem propriedades que não definem conjuntos, isto é, não é possível coletar todos os objetos com tais propriedades num único conjunto. Tal observação deixou para os estudiosos da teoria dos conjuntos a tarefa de determinar quais propriedades são capazes de definir conjuntos. Infelizmente, não se conhece atualmente como fazer isso, e alguns resultados de lógica — como o conhecido Teorema da Incompletude de Gödel — parecem indicar que uma resposta nem sequer é possível. (HRBACEK & JECH, 1999, p. 3, grifo nosso, tradução nossa).

O Paradoxo de Russell foi historicamente importante, dentre outras razões, por

motivar o desenvolvimento de novas e mais restritas formulações da Teoria dos Conjuntos.

Uma das questões que surgiu deste paradoxo foi, como visto acima, “quais propriedades são

capazes de definir conjuntos?” e, neste sentido, Miraglia traça uma interessante linha entre

duas importantes abordagens:

Uma resposta é, na realidade, ‘sei lá’. Concebe-se o universo como tendo dois tipos de entes: classes e conjuntos. A diferença entre eles é que conjuntos podem ser elementos de outros conjuntos e classes, mas uma classe não pode ser elemento de nada, a não ser que se exiba uma demonstração de que essa classe é, na realidade, um conjunto […]. Há variantes nessa linha de desenvolvimento, mas as teorias mais conhecidas são as de Von Neumann-Bernays-Gödel e Kelley-Morse. Outra resposta à mesma pergunta é ‘todas, se tomarmos certas precauções’. Essa é a característica da teoria de conjuntos desenvolvida por E. Zermelo e A. Fraenkel […]. (MIRAGLIA, 1991, p. 13).

21

A primeira tentativa de axiomatizar a Teoria dos Conjuntos após o descobrimento

e publicação dos paradoxos foi realizada em 1908 e se deve a Ernst Zermelo, em seu artigo

Untersuchungen über die Grundlagen der Mengenlehre (Estudos sobre os Fundamentos da

Teoria dos Conjuntos), publicado em 1908, na 65ª edição do Mathematische Annalen

(EBBINGHAUS & PECKHAUS, 2007).

É interessante frisar os aspectos marcantes que permeavam a atmosfera

matemática do início do século XX, pois eles nos auxiliam a vislumbrar pretextos implícitos

que levaram ao primeiro sistema axiomático da Teoria dos Conjuntos.

Como vemos em Bourbaki (1968), a História nos conta ser dos antigos gregos a

criação do método axiomático, remontando aos axiomas expostos por Euclides em “Os

Elementos”. Tal método consiste em assumir afirmações verdadeiras, os axiomas, e deduzir

delas a validade ou falsidade das proposições matemáticas.

O desenvolvimento das Geometrias Não Euclidianas, ainda no século XIX,

desencadeou uma nova análise sobre o papel dos axiomas na fundação das teorias

matemáticas. O trabalho de David Hilbert, que em seu livro Grundlagen der Geometrie

(Fundamentos da Geometria, publicado em 1899) formalizou a Geometria Euclidiana sobre

uma série de axiomas, foi o marco inicial do moderno método axiomático e estabeleceu a

posição formalista no contexto da filosofia matemática, sobre a qual discutimos brevemente.

Ao final do século XIX e início do século XX três “escolas de pensamento” se

distinguiram como as principais na filosofia matemática: os logicistas, os intuicionistas e os

formalistas. Uma discussão aprofundada sobre filosofia matemática foge ao escopo deste

trabalho, mas a fim de esclarecimento, resumidamente: os logicistas defendem que as

verdades Matemáticas são verdades da Lógica, considerando, grosso modo, a Matemática

como um subconjunto da Lógica; os intuicionistas pregam que os objetos matemáticos são

criações da mente humana que não podem ser expressos de maneira adequada por qualquer

tipo de linguagem e, além disso, a veracidade de alguma proposição prova-se apenas com sua

construção; os formalistas defendem a tomada de axiomas de natureza arbitrária, donde se

deriva a validade das proposições matemáticas por relações pré-estabelecidas que obedeçam

às leis da Lógica — notemos que, neste caso, a Lógica é usada como ferramenta matemática e

não como base desta, ao contrário do caso logicista (FRAENKEL, BAR-HILLEL, & LEVY,

1973).

O papel de destaque desempenhado por Hilbert no cenário da matemática mundial

certamente favoreceu a difusão de suas ideias e ideais, dentre os quais se destaca a proposta

22

de solucionar seus 23 problemas14, sendo que o primeiro deles se referia à Hipótese do

Continuum de Cantor. Ao propor a comprovação ou refutação desta proposição, Hilbert

adicionou outro questionamento, a respeito da possibilidade da boa ordenação do continuum.

Foi a este último problema que Zermelo respondeu, afirmativamente, em 1904, na 59ª edição

do Mathematische Annalen, com seu Teorema da Boa Ordenação e o debatido Axioma da

Escolha, base de sua demonstração (EBBINGHAUS & PECKHAUS, 2007).

As críticas da comunidade matemática ao Teorema da Boa Ordenação pousaram

rápida e precisamente sobre o Axioma da Escolha e seu caráter não construtivo que, numa de

suas muitas formulações, postula que “para qualquer conjunto 𝐴 existe uma função 𝑓 tal que,

para qualquer subconjunto não vazio 𝐵 de 𝐴, 𝑓(𝐵) ∈ 𝐵” (SUPPES, 1972, p. 239, tradução

nossa). O caráter “não construtivo” que fora alvo das críticas reside na ausência de uma

caracterização ou de um método sobre como conseguir tal função 𝑓, haja vista que o Axioma

da Escolha apenas postula sua existência.

No entanto, como Zermelo afirmou nos anos seguintes ao defender-se das críticas,

tal axioma fora usado tacitamente por outros matemáticos em diversas situações anteriores, de

modo que sua única inovação fora enunciar este princípio que até então fora tomado como

intuitivo. Um exemplo clássico é a prova de que todo conjunto infinito contém um

subconjunto infinito enumerável, dada por Dedekind anos antes. Assim, após muitos debates e

críticas, Ernst Zermelo formalizou seu sistema axiomático da Teoria dos Conjuntos, motivado

em parte pelo surgimento dos paradoxos na Teoria dos Conjuntos no início do século XX,

embora, como frisam Ebbinghaus & Peckhaus (2007), ele também possa ter objetivado criar

um sistema no qual o seu Axioma da Escolha fosse essencial.

Originalmente, Zermelo propôs oito axiomas que, segundo seus intuitos, deveriam

ser fortes o suficiente para deduzir toda a teoria criada por Cantor e Dedekind, obviamente

excetuando-se as antinomias descobertas no início do século. Além do Axioma da Escolha,

sua grande inovação foi aplicar uma restrição ao Axioma da Abstração, obtendo o que ele

chamou de Axioma da Separação (Axiom der Aussonderung), com o qual ele evitou

paradoxos lógicos como o de Russell (EBBINGHAUS & PECKHAUS, 2007).

14 Os “23 Problemas de Hilbert”, como ficaram conhecidos, foram propostos por David Hilbert, em Paris, no ano de 1900, durante o Segundo Congresso Internacional de Matemática. Tais problemas abordam questões importantes sobre os fundamentos da Matemática, como a Hipótese do Continuum e a consistência dos axiomas da Aritmética, Geometria, Física, Teoria dos Números e Topologia (BOYER, 1996).

23

Zermelo formulou o Axioma-Esquema da Separação em termos de questões ou

sentenças que têm a propriedade de ser “definida”. Ele dizia que uma sentença é definida se

for possível de um modo não arbitrário decidir se um objeto satisfaz ou não a sentença. Algo

consideravelmente vago e que, de certa forma, ainda deixava brechas suficientes para

paradoxos semânticos (SUPPES, 1972).

Um exemplo trivial de tais “paradoxos semânticos” pode ser dado pelo paradoxo

de Grelling-Nelson: chamemos de heterológico qualquer adjetivo, em português, que não

possua a característica que ele denota. Por exemplo, “monossílaba” é uma palavra polissílaba

e “francês” é uma palavra portuguesa, logo “monossílaba” e “francês” são adjetivos

heterológicos, ao passo que adjetivos como “polissílabo” e “português” não são. Pelo critério

de Zermelo exposto anteriormente, a propriedade “ser heterológico” está bem definida.

Contudo, decorre da definição desta propriedade que “heterológico” é heterológico se, e

somente se, não for heterológico, uma contradição. Isso evidencia a necessidade de se

aprimorar o conceito de boa definição a fim de evitar paradoxos (FRAENKEL, BAR-

HILLEL, & LEVY, 1973).

Segundo Suppes (1972), o primeiro esclarecimento significativo da noção do que

vem a ser a propriedade de ser “bem definido”, ou do que vem a ser uma “sentença bem

definida”, foi dado por Thoralf Skolem em 1922. Ele restringiu a linguagem matemática

apenas ao uso de símbolos, diminuindo significativamente o alfabeto com a qual as sentenças

são exprimíveis, e caracterizou-as como definidas apenas quando satisfazem sua definição de

fórmula em Lógica de Primeira Ordem. Uma vez que os paradoxos semânticos existentes em

expressões de linguagem referem-se a outras expressões na própria linguagem, podemos

inferir que qualquer linguagem com meios ilimitados de expressão é necessariamente

inconsistente15. Dessa forma ao “empobrecer” a linguagem objeto16 utilizada na Teoria dos

Conjuntos, Skolem impediu a autorreferência e, consequentemente encerrou os paradoxos

semânticos.

Ainda assim, os axiomas de Zermelo de 1908 não eram suficientes para abranger

satisfatoriamente a teoria dos números ordinais, de modo que foi necessária a concepção de

um axioma mais forte: o Axioma da Substituição, que fora formulado independentemente por

15 A esse respeito é curioso citar uma frase creditada ao matemático e lógico Kurt Gödel: “Quanto mais reflito sobre a linguagem, tanto mais me admiro que as pessoas consigam se entender umas as outras.” (apud. ÁVILA, 2000, p. 12).

16 Ver Capítulo 2, Seção 2.1.

24

Abraham Fraenkel e Thoralf Skolem em 1922. Com a adição do Axioma da Fundação, que

basicamente impede situações como 𝑆 ∈ 𝑆, feita por Zermelo em 1930, o sistema de axiomas

de Zermelo, Fraenkel e Skolem tomou praticamente a forma que conhecemos hoje, que é

conhecido como Sistema Axiomático de Zermelo-Fraenkel-Choice17, ou simplesmente ZFC

(SUPPES, 1972).

Atualmente, ZF designa os axiomas de Zermelo-Fraenkel de 1930 excetuando-se

o Axioma da Escolha, mas incluindo o Axioma do Infinito, haja vista que àquela altura

Zermelo o considerava como um “princípio lógico” (EBBINGHAUS & PECKHAUS, 2007).

ZFC representa a adição do Axioma da Escolha (Axiom of Choice, em inglês) a este último

grupo de postulados atuais, daí o nome Zermelo-Fraenkel-Choice. No próximo capítulo,

postularemos os axiomas de ZFC.

Uma sistematização bem mais recente para a Teoria dos Conjuntos foi

desenvolvida pelo professor Lotfi Zadeh na década de 1960, a qual não considera apenas

situações de verdade ou falsidade absoluta. Na Teoria dos Conjuntos Difusos (Fuzzy Set

Theory), para um conjunto 𝑋 qualquer, consideramos uma função de pertinência 𝜇𝑋 :𝑋 ⟶

[0, 1], de modo que 𝜇𝑋(𝑥) indica a possibilidade de 𝑥 pertencer a 𝑋. Uma exposição mais

detalhada e axiomática dos Conjuntos Fuzzy é feita por Dadam & Hein (2009).

Apesar de ZFC ser o sistema de axiomas mais utilizado como fundação para a

Teoria dos Conjuntos, devemos ressaltar a existência de outros sistemas de axiomas bem

sucedidos, apesar de não nos aprofundarmos no estudo teórico de tais sistemas. Na mesma

posição formalista, temos os sistemas de Von Neumann-Bernays-Gödel e de Morse-Kelley,

abreviadamente chamados de NBG e MK, respectivamente, cuja principal diferença com ZFC

reside na existência de classes próprias e de uma “classe Universo” cujos membros são todos

os conjuntos.

Em ambos os casos, todos os conjuntos são classes, mas a recíproca é falsa. Nelas,

𝑥 é um conjunto se, e somente se, existe 𝑦 tal que 𝑥 ∈ 𝑦; se, porém, não houver tal 𝑦, então 𝑥

é uma classe própria. Nos dois sistemas, os conjuntos “propriamente ditos” satisfazem os

axiomas usais de ZF. No sistema NBG existe o Axioma-Esquema da Abstração das Classes

17 Alguns autores defendem que, por rigor histórico, deveríamos chamá-lo de sistema axiomático Zermelo-Skolem-Fraenkel, em alusão às grandes contribuições de Thoralf Skolem para a formalização dos axiomas (SUPPES, 1972).

25

— “o mesmo” que na teoria Ingênua dos Conjuntos leva ao Paradoxo de Russell —, como

segue abaixo:

(∃𝑋)(∀𝑦)�𝑦 ∈ 𝑋 ⟺ 𝜙(𝑦)�,

onde 𝜙 pode ter outros conjuntos e classes como variáveis livres, mas as variáveis ligadas de

𝜙 são apenas conjuntos, pois, caso houvesse uma classe própria 𝑦′ ligada a 𝜙, então 𝑦′ ∈ 𝑋 e

daí 𝑦′ não seria uma classe própria. A proximidade entre NBG e ZF é tão grande que o

primeiro diz-se ser uma extensão conservativa do segundo: se 𝜓 é uma sentença cujas

variáveis são apenas conjuntos, 𝜓 pode ser provada em NBG se, e somente se, 𝜓 pode ser

provada em ZF. Por outro lado, NBG é finitamente axiomatizável18, o que não ocorre em ZF.

Já o sistema MK pode ser considerado mais forte que NBG por permitir que classes próprias

“apareçam” em 𝜙, embora não seja uma extensão conservativa de ZF e também não possa ser

finitamente axiomatizável.

Contudo, nenhuma dessas três teorias (ZF, NBG e MK) pode reivindicar o título

de “a teoria correta”, conforme ressaltado por Kunen (1980), pois todas elas possuem

limitações em alguma instância: ZF não admite classes próprias, como a classe de todos os

conjuntos; NBG admite classes próprias, mas seu uso é restringido em 𝜙 no axioma da

abstração das classes; MK não possui a limitação de NBG no axioma da abstração, no

entanto, certas relações sobre classes próprias não podem ser definidas de maneira formal.

Ainda assim, essas três teorias estão todas fundadas nos mesmos conceitos básicos, de modo

que a maioria das proposições demonstrações em ZF pode ser também demonstrada nas

outras duas teorias, dadas as devidas modificações.

A escola logicista também se preocupou com a reformulação da Teoria dos

Conjuntos, mas, seguindo sua própria filosofia, tal processo partiu dos fundamentos da

Lógica. A teoria dos tipos, desenvolvida por Bertrand Russell e Alfred Whitehead teve

basicamente o intuito de evitar os chamados ciclos viciosos, isto é, situações em que temos

um conjunto 𝑥 pertencendo a si mesmo, pois de tais ciclos surgem os principais paradoxos.

Para tanto, eles formalizaram de maneira profunda o conceito de hierarquia de conjuntos,

criando uma teoria intrincada e de difícil compreensão, geralmente preferida por lógicos e não

por matemáticos (BOURBAKI, 1968).

18 Isto é, os axiomas de NBG decorrem de um número finito de fórmulas atômicas — fórmulas atômicas são as sentenças básicas da linguagem formal, que definiremos no Capítulo 2 (KUNEN, 1980).

26

Fossem formalistas ou logicistas, a maioria dos matemáticos do início do século

XX recusou-se a abandonar a Teoria dos Conjuntos ao se depararem com os paradoxos, dada

a sua grande capacidade de generalização e abrangência à praticamente toda a Matemática: da

construção dos números à conceituação formal de 𝑛-úplas ordenadas e consequentemente às

funções reais, analíticas, etc. Certamente, o apreço da comunidade matemática para com a

Teoria dos Conjuntos é evidenciado por David Hilbert que, apesar de superestimar o papel de

Cantor como pai da Teoria dos Conjuntos, eternizou a expressão: “[…] Ninguém nos

expulsará do paraíso criado por Cantor.” (HILBERT, 1926 apud FERREIRÓS, 2007, p. 365,

tradução nossa).

27

Capítulo 2 — Desenvolvimentos Iniciais em ZFC

Neste capítulo, desenvolvemos os conceitos básicos da Teoria dos Conjuntos

segundo o sistema axiomático Zermelo-Fraenkel-Choice, isto é, a partir dos axiomas de ZFC.

Definimos e provamos as principais propriedades das relações entre conjuntos: inclusão,

interseção, união, potência e produto cartesiano. Tal desenvolvimento deve embasar o estudo

subsequente realizado nos capítulos seguintes.

2.1. Preliminares: Alfabeto e Definições

Os axiomas de ZFC são expressos numa “linguagem objeto” limitada a fim de

evitar inconsistências semânticas que permitam derivar paradoxos na teoria. Em nosso

contexto, a linguagem objeto é a linguagem na qual falamos sobre conjuntos, enquanto a

metalinguagem é a linguagem na qual discutimos a linguagem objeto. Em outras palavras, a

linguagem objeto é a linguagem formal e simbólica descrita a seguir, enquanto a

metalinguagem é, neste contexto, o português que será utilizado para descrever exatamente o

que se pretende com a simbologia utilizada. Salvo menção contrária, nesta seção baseamo-nos

em Suppes (1972).

Classificamos os símbolos utilizados na linguagem objeto — o “Alfabeto” — em

cinco grupos: (i) constantes, (ii) variáveis, (iii) conectivos lógicos, (iv) quantificadores e (v)

símbolos de pontuação, onde:

(i) As duas constantes primitivas de linguagem são o símbolo da relação de

pertinência “∈” e o predicado constante “=”, símbolo da identidade;

(ii) As variáveis genéricas são as letras “𝑥”, “𝑦”, “𝑧”,…, com ou sem

subscritos ou sobrescritos, maiúsculas ou minúsculas;

28

(iii) Os conectivos lógicos usuais: ∧, ∨, ⟹, ⟺, ¬ que indicam,

respectivamente, conjunção, disjunção, implicação, equivalência e negação, de modo a

obedecerem as leis do cálculo proposicional de primeira ordem1;

(iv) Os quantificadores existenciais (∃) e (∃!), e universal (∀);

(v) Parênteses esquerdo “(” e direito “)” são os únicos símbolos de pontuação.

Expressões de linguagem objeto são sequências finitas das cinco classes de

símbolos de linguagem definidas acima. Algumas destas expressões são chamadas de

fórmulas primitivas, devido à sua simplicidade estrutural, o que motiva a definição seguinte.

Definição 2.1. Uma fórmula atômica primitiva é uma expressão da forma (𝑣 ∈

𝑤), ou da forma (𝑣 = 𝑤), onde 𝑣 e 𝑤 são ambas variáveis genéricas.

Tais fórmulas denominam-se atômicas, pois todas as fórmulas da teoria devem ser

expressas por meio delas, isto é, por meio de combinações de fórmulas atômicas, cujas regras

gramaticais de composição (ou regras gramaticais do alfabeto), estabelecemos abaixo.

(i) Toda fórmula atômica primitiva é uma fórmula primitiva;

(ii) Se 𝑃 é uma fórmula primitiva, então ¬𝑃 é uma fórmula primitiva;

(iii) Se 𝑃 e 𝑄 são fórmulas primitivas, então (𝑃 ∧ 𝑄),(𝑃 ∨ 𝑄),(𝑃 ⟹ 𝑄) e

(𝑃⟺ 𝑄) são fórmulas primitivas;

(iv) Se 𝑃 é uma fórmula primitiva e 𝑣 é qualquer variável genérica, então

(∀𝑣)𝑃, (∃𝑣)𝑃 e (∃!𝑣)𝑃 são fórmulas primitivas2;

(v) Nenhuma expressão de linguagem objeto é uma fórmula primitiva a menos

que siga as regras estabelecidas acima.

Dessa forma, como (𝑣 ∈ 𝑤) e (𝑎 = 𝑏) são fórmulas atômicas primitivas, elas

próprias são fórmulas primitivas, bem como (𝑣 ∈ 𝑤) ∨ (𝑎 = 𝑏), (𝑣 ∈ 𝑤) ⟹ (𝑎 = 𝑏) e

¬(𝑎 = 𝑏).

Todos os axiomas e teoremas da Teoria dos Conjuntos que estabeleceremos

podem ser escritos como fórmulas primitivas de linguagem objeto. Aliás, nossa linguagem

objeto oficial deve consistir unicamente de fórmulas primitivas. No entanto, para fins de

1 Ver Apêndice A. 2 As expressões (∀𝑣)𝑃, (∃𝑣)𝑃 e (∃! 𝑣)𝑃 se leem respectivamente como “para todo 𝑣, tal que 𝑃”,

“existe 𝑣 tal que 𝑃” e “existe um único 𝑣 tal que 𝑃”.

29

trabalho, será comum e conveniente introduzir “por definição” consideráveis

notações/simbologias adicionais e, eventualmente, utilizar a metalinguagem para enunciar e

demonstrar determinados teoremas.

As expressões construídas com símbolos não presentes originalmente no alfabeto

serão denotadas simplesmente por fórmulas; notemos que tais fórmulas não são primitivas

exatamente por serem expressas por meio de símbolos exteriores ao alfabeto. A fim de definir

formalmente tais expressões na teoria, esperamos que nossas definições obedeçam a alguns

critérios.

Critério da Eliminabilidade. Uma fórmula 𝑃 introduzindo um novo símbolo

satisfaz o critério da eliminabilidade se, e somente se, sempre que 𝑄1 é uma fórmula na qual o

novo símbolo ocorre, então existe uma fórmula primitiva 𝑄2 , tal que 𝑃 ⟹ (𝑄1 ⟺ 𝑄2) é

derivável dos axiomas.

Critério da Não Criatividade. Uma fórmula 𝑃 introduzindo um novo símbolo

satisfaz o critério da não criatividade se, e somente se, não há fórmula primitiva 𝑄 tal que

𝑃 ⟹ 𝑄 é derivável dos axiomas, mas 𝑄 não é.

Vejamos o significado de tais critérios. O primeiro estabelece que o novo símbolo

que acrescentamos ao alfabeto precisa ser exprimível no próprio alfabeto. Por exemplo, a fim

de facilitar as notações futuras, adotamos a seguinte definição.

Definição 2.2.

(i) 𝑥 ∉ 𝑦 ⟺ ¬(𝑥 ∈ 𝑦);

(ii) 𝑥 ≠ 𝑦⟺ ¬(𝑥 = 𝑦).

Assim, por exemplo, (i) introduz o símbolo “∉” para indicar a “não pertinência”.

Qualquer fórmula que o utilize, digamos √2 ∉ ℚ, equivale a uma fórmula que não o utiliza,

isto é, ¬�√2 ∈ ℚ�. Neste caso, (𝑥 ∈ 𝑦) é uma fórmula atômica primitiva, ¬(𝑥 ∈ 𝑦) é uma

fórmula primitiva e 𝑥 ∉ 𝑦 é uma fórmula.

O segundo critério tem por objetivo evitar que definições permitam derivar

fórmulas primitivas que não possam ser derivadas dos axiomas da teoria.

Antes de prosseguirmos, precisamos distinguir o que são variáveis livres e

ligadas. Uma variável é uma variável ligada numa fórmula 𝜑 se ela estiver no interior do

30

escopo de um quantificador; ela é dita uma variável livre se não for ligada. Por exemplo, na

fórmula (∃𝑥)(𝑥 < 𝑦), “𝑥” é uma variável ligada, enquanto “𝑦” é uma variável livre. Uma

fórmula 𝜑 que possui variáveis livres é uma fórmula aberta, caso contrário, 𝜑 é uma fórmula

fechada.

Denotamos uma fórmula 𝜑 em que 𝑥 ocorre como variável livre por 𝜑(𝑥). Tal

fórmula é dita uma condição em 𝑥. Se existir em 𝜑 uma variável livre 𝑦 distinta de 𝑥,

simbolicamente escrevemos 𝜑(𝑥, 𝑦) e dizemos que 𝜑 é uma condição em 𝑥 e 𝑦 ou ainda que

𝜑 é uma condição em 𝑥 com parâmetro 𝑦 (FRAENKEL, BAR-HILLEL, & LEVY, 1973).

Se 𝑧 for tal que 𝜑(𝑥) seja falso quando 𝑥 = 𝑧, escrevemos ¬𝜑(𝑧), caso contrário,

escrevemos apenas 𝜑(𝑧) para indicar que (𝜑(𝑥)∧ 𝑥 = 𝑧) é verdadeiro3 e dizemos que 𝑧

satisfaz a condição 𝜑 ou que 𝜑 é uma propriedade de 𝑧. Assim, por exemplo, se 𝜑(𝑥) ≡ 𝑥 +

3 < 4, temos 𝜑(0) e ¬𝜑(2).

Além dos critérios supracitados, devemos estabelecer regras para as definições

que introduzem novos símbolos por meio de equivalências ou identidades.

Critério da definição por equivalência. Uma equivalência 𝑃 introduzindo um

novo símbolo de operação 𝑛-ária 𝑂 é uma definição adequada se, e somente se, 𝑃 é da forma:

𝑂(𝑣1,…, 𝑣𝑛) = 𝑤⟺ 𝑄��𝑃

,

de tal maneira que as restrições a seguir sejam satisfeitas:

(i) 𝑣1,…, 𝑣𝑛, 𝑤 são variáveis distintas;

(ii) As únicas variáveis livres de 𝑄 são 𝑣1,…, 𝑣𝑛, 𝑤;

(iii) 𝑄 é uma fórmula na qual as únicas constantes não lógicas4 são as

primitivas ou símbolos previamente definidos da Teoria dos Conjuntos;

(iv) A fórmula (∃!𝑤)𝑄 é derivável dos axiomas e definições precedentes.

Critério da definição por identidade: Uma identidade 𝑃 introduzindo um novo

símbolo de operação 𝑛-ária 𝑂 é uma definição adequada se, e somente se, 𝑃 é da forma:

3 O contexto geralmente deixa claro quando “𝜑(𝑥) ” se refere à “condição em 𝑥” e quando “𝜑(𝑥)” se refere ao valor lógico de 𝜑 com a variável 𝑥 .

4 As únicas constantes lógicas são os conectivos lógicos. As demais constantes são não lógicas.

31

𝑂(𝑣1,…, 𝑣𝑛) = 𝜏(𝑣1,…, 𝑣𝑛)��𝑃

,


(i) 𝑣1,…, 𝑣𝑛 são variáveis distintas;

(ii) O termo 𝜏 não possui variáveis livres que não sejam 𝑣1,…, 𝑣𝑛;

(iii) As únicas constantes não lógicas no termo 𝜏 são símbolos primitivos ou

símbolos previamente definidos na Teoria dos Conjuntos.

Não definimos neste trabalho o que é o termo 𝜏(𝑣1,…, 𝑣𝑛), mas esperamos que os

exemplos a seguir possibilitem um entendimento básico sobre como eles são. O termo

𝜏(𝑣1, 𝑣2) ≡ 𝑣1 ∩ 𝑣2 é tal que 𝜏(𝑥, 𝑦) = 𝑥 ∩ 𝑦, o termo 𝜏(𝑣1, 𝑣2) ≡ �{𝑣1}, {𝑣1, 𝑣2}� é tal que

𝜏(𝑥, 𝑦) = �{𝑥}, {𝑥, 𝑦}�. Grosso modo, 𝜏 é uma regra que nos fornece uma lista de operações

definidas na Teoria dos Conjuntos para se realizarem com conjuntos quaisquer.

A importância de (iv) no Critério da Equivalência resume-se na restrição de que

uma operação deve fornecer um único objeto. Por exemplo, consideremos a pseudo-operação

𝑂, onde:

(1) 𝑂(𝑥, 𝑦) = 𝑧 ⟺ 𝑥 < 𝑧 ∧ 𝑦 < 𝑧.

Obviamente, (1) viola (iv), e tal violação implica uma contradição lógica. É claro

que 1 < 3 e 2 < 3, logo, pode-se dizer, por (1), que:

(2) 𝑂(1, 2) = 3.

Contudo, também é evidente que 1 < 4 e 2 < 4, donde, por (1), concluímos que:

(3) 𝑂(1, 2) = 4.

Logo, de (2) e (3), vem que 3 = 4, absurdo.

Contudo, nem todas as definições obedecem simultaneamente aos critérios

estabelecidos acima, haja vista que são dadas, em sua maioria, sob a forma de condicionais.

Neste caso, também há regras bem estabelecidas.

Critério da definição condicional. Uma implicação 𝑃 introduzindo um novo

símbolo operacional 𝑂 é uma definição condicional se, e somente se, 𝑃 é da forma:

32

𝑄 ⟹ [𝑂(𝑣1,…, 𝑣𝑛) = 𝑤 ⟺ 𝑅]��𝑃

,


(i) A variável 𝑤 não é livre em 𝑄;

(ii) As variáveis 𝑣1,…, 𝑣𝑛, 𝑤 são distintas;

(iii) 𝑅 não possui variáveis livres além de 𝑣1,…, 𝑣𝑛, 𝑤;

(iv) 𝑄 e 𝑅 são fórmulas nas quais as únicas constantes não lógicas são os

símbolos primitivos ou símbolos previamente definidos na Teoria dos Conjuntos;

(v) A fórmula 𝑄 ⟹ (∃!𝑤)𝑅 é derivável dos axiomas e definições

precedentes.

Uma vez estabelecidos tais critérios, podemos iniciar o desenvolvimento

axiomático da Teoria dos Conjuntos.

2.2. O Sistema de Axiomas Zermelo-Fraenkel-Choice

Nesta seção postulamos os nove axiomas de Zermelo-Fraenkel-Choice (ZFC) e

discutimos brevemente cada um deles. Também provamos a existência e a unicidade de um

conjunto que não possui elementos e a inexistência de um conjunto ao qual tudo pertença.

Além disso, definimos alguns conceitos que contribuem para uma melhor compreensão dos

demais axiomas.

Originalmente desenvolvido por Ernst Zermelo, Abraham Fraenkel e Thoralf

Skolem, os axiomas de ZFC admitem diversas formulações. Em alguma delas, por exemplo,

postula-se a existência de um conjunto que não possua elementos, o Axioma do Conjunto

Vazio — tal abordagem é feita por Miraglia (1991) e Hrbacek & Jech (1999). Noutras,

postulam-se apenas sete axiomas, pois deles é possível derivar os axiomas da Separação e do

Par como teoremas — como encontramos em Levy (1979). Há ainda formulações que

permitem a existência de diversos indivíduos, isto é, objetos que não possuem elementos, mas

que podem pertencer a algum conjunto, denominados por Zermelo de urelementos — Suppes

(1972) trata de tais situações.

33

Neste trabalho, adotamos os nove axiomas propostos por Kunen (1980) e Jech

(2003), os quais garantem exclusivamente a existência de conjuntos, isto é, os axiomas

postulados asseguram a existência de elementos, que denominados conjuntos, famílias ou

coleções. Neste sentido, conjunto passa a ser tudo aquilo cuja existência é assegurada pelos

axiomas. Além disso, seguindo Levy (1979), provamos posteriormente que dois dos axiomas

são, de fato, teoremas em ZFC.

Axioma da Existência:

(A0) (∃𝑥)(𝑥 = 𝑥).

Este axioma não faz parte de ZFC. Postulamo-lo apenas para frisar que o universo

do discurso5 não é vazio, isto é, existe pelo menos um conjunto. Como frisado por Levy

(1979, p. 20), Jech (2003, p. 8) e Kunen (1980, p. 10), tal axioma é desnecessário, uma vez

que a validade de (∃𝑥)(𝑥 = 𝑥) decorre das leis da Lógica. Além disso, devido ao Axioma do

Infinito ((A6), página 39), que garante a existência de um conjunto infinito, temos assegurada

a não vacuidade do universo do discurso.

Numa abordagem ligeiramente distinta, Suppes (1972) assume o símbolo “0”

como uma constante do alfabeto, e define que 𝑦 é um conjunto se, e somente se, existe 𝑥 tal

que 𝑥 ∈ 𝑦 ou 𝑦 = 0. Neste caso, 0 é apenas uma das três constantes do alfabeto, um símbolo

sem qualquer significado específico, mas cuja existência é assumida a princípio. Em certo

sentido, tal definição assemelha-se a (A0), pois garante a existência de um conjunto, no

entanto, especifica que tal conjunto é exatamente 0. A utilidade em adotar a existência de um

indivíduo é justificada, pois

[…] Quando definimos a interseção de dois conjuntos 𝑟 e 𝑠, queremos que a interseção esteja definida mesmo no caso em que 𝑟 e 𝑠 não possuam membros em comum. Neste caso, a interseção 𝑡 não deve possuir membros, isto é, deve ser um indivíduo. Há muitos outros exemplos onde a existência de um indivíduo torna as coisas mais simples. As mesmas razões práticas que justificam a existência de tal elemento também sugerem que usemos sempre o mesmo elemento em tais situações […] e nos referíramos a este elemento como conjunto. Portanto, nós devemos chamar tal elemento de conjunto nulo [null-set] e nossos conjuntos são, a partir de

5 Ou domínio do discurso, ao qual pertencem os objetos tratados pelos axiomas. Não nos aprofundamos na questão sobre o que é o domínio do discurso, pois tal discussão foge ao escopo deste trabalho. Para tratar de tal questão, sugerimos Kunen (1980) e Fraenkel, Bar Hillel & Levy (1973).

34

agora, os elementos que possuem algum membro, bem como o conjunto nulo. (FRAENKEL, BAR-HILLEL, & LEVY, 1973, p. 24, tradução nossa).

Contudo, não assumimos a definição de Suppes por dois motivos. O primeiro se

deve ao fato de tal definição ser mais útil quando se pretende que existam indivíduos

distintos, o que não almejamos; em segundo, a existência de um único indivíduo é o suficiente

para a nossa teoria, e tal existência, bem com sua unicidade, pode ser derivada de (A0) e dos

dois próximos axiomas.

Axioma da Extensão:

(A1) (∀𝑥)(∀𝑦)(∀𝑧)�(𝑧 ∈ 𝑥 ⟺ 𝑧 ∈ 𝑦) ⟹𝑦 = 𝑥�.

Axioma (Esquema) da Separação:

(A2) (∀𝑥)(∃𝑦)(∀𝑧)�𝑧 ∈ 𝑦⟺ 𝑧 ∈ 𝑥 ∧ 𝜑(𝑧)�.

O primeiro axioma (A1) estabelece um critério que nos permite distinguir

conjuntos. Convencionemos que se 𝑧 ∈ 𝑦, então 𝑧 é chamado de elemento ou membro de 𝑦.

Dada tal convenção, decorre que (A1) afirma que se todo elemento de um conjunto 𝑥 é

também elemento de 𝑦 e todo elemento de 𝑦 for elemento de 𝑥, então os conjuntos 𝑥 e 𝑦 são

iguais. Portanto, o que caracteriza um conjunto são seus elementos. Nas palavras de Halmos

(1960, p. 2, tradução nossa), “o axioma da extensão não é apenas uma propriedade lógica

necessária, mas sim uma afirmação não trivial sobre pertinência”.

O segundo axioma (A2) é, na verdade, um esquema de axiomas, pois temos um

axioma para cada condição 𝜑 em 𝑧, possivelmente com vários parâmetros. É necessário frisar

que em (A2), 𝑦 não é uma variável livre em 𝜑. Tal restrição tem por objetivo não considerar

verdadeiras sentenças contraditórias, como

(∀𝑥)(∃𝑦)(∀𝑧)(𝑧 ∈ 𝑦 ⟺ 𝑧 ∈ 𝑥 ∧ 𝑧 ∉ 𝑦),

onde 𝜑(𝑧) ≡ 𝑧 ∉ 𝑦, o que nos leva, obviamente, a uma contradição.

Em palavras, (A2) afirma que para qualquer conjunto 𝑥 e para qualquer fórmula

𝜑, existe um conjunto 𝑦 (que não é uma variável livre em 𝜑), formado por todos os elementos

de 𝑥 que tornam a fórmula 𝜑 verdadeira. Notemos ainda que, conforme citado no capítulo

anterior, o Axioma da Separação é uma “restrição” do Axioma da Abstração, de tal maneira

que não é possível derivar o paradoxo de Russell. A grande distinção entre eles está no fato de

35

que (A2) é capaz de formar um conjunto cujos elementos satisfaçam uma condição arbitrária

desde que seja dado, a priori, um conjunto do qual possamos “separar” os elementos que

formarão o conjunto que pretendemos construir. Este conjunto dado a priori é qualquer

elemento cuja existência é garantida pelos axiomas de ZFC. Tal limitação impõe, entre outras

coisas, que não existe um conjunto universo em ZFC, conforme provamos a seguir.

Teorema 2.1. ¬(∃𝑦)(∀𝑥)(𝑥 ∈ 𝑦).

Demonstração.

Suponha, por absurdo, que seja verdadeira a sentença

(∃𝑦)(∀𝑥)(𝑥 ∈ 𝑦).

Decorre daí que, para qualquer 𝑥, deve-se ter 𝑥 ∈ 𝑦, isto é,

�†1� (∃𝑥)(𝑥 = 𝑥) ⟹ (𝑥 ∈ 𝑦).

Tomando 𝜑(𝑥) ≡ 𝑥 ∉ 𝑥, o Axioma da Separação nos garante que

(∃𝑧)(∀𝑥)(𝑥 ∈ 𝑧 ⟺ 𝑥 ∈ 𝑦 ∧ 𝑥 ∉ 𝑥),

e fazendo 𝑥 = 𝑧, inferimos

�†2� (∃𝑧)(𝑧 ∈ 𝑧 ⟺ 𝑧 ∈ 𝑦 ∧ 𝑧 ∉ 𝑧).

Como por �†1� é verdadeiro que 𝑧 ∈ 𝑦, deduzimos de �†2� que 𝑧 ∈ 𝑧 ⟺ 𝑧 ∉ 𝑧 ,

donde obtemos 𝑧 ∈ 𝑧 ∧ 𝑧 ∉ 𝑧, uma contradição. Portanto, ¬(∃𝑦)(∀𝑥)(𝑥 ∈ 𝑦). Q.E.D.

Notemos que o paradoxo de Russell não pode ser obtido tomando-se um conjunto

qualquer 𝑦. Com efeito, considerando a mesma propriedade 𝜑(𝑥) ≡ 𝑥 ∉ 𝑥 e um conjunto

genérico 𝑦, pelo Axioma da Separação temos

[†] (∃𝑧)(∀𝑥)(𝑥 ∈ 𝑧 ⟺ 𝑥 ∈ 𝑦 ∧ 𝑥 ∉ 𝑥).

Tomando 𝑥 = 𝑧 em [†], segue que

[††] (∃𝑧)(𝑧 ∈ 𝑧 ⟺ 𝑧 ∈ 𝑦 ∧𝑧 ∉ 𝑧),

o que não é contraditório. De fato, basta observarmos que como a sentença em [††] é uma

equivalência assegurada por (A2), é necessariamente verdadeiro que

36

(𝑧 ∈ 𝑧 ⟹ 𝑧 ∈ 𝑦 ∧ 𝑧 ∉ 𝑧) ∧ (𝑧 ∈ 𝑦 ∧ 𝑧 ∉ 𝑧 ⟹ 𝑧 ∈ 𝑧).

Se 𝑧 ∈ 𝑧 teríamos 𝑧 ∈ 𝑦 ∧ 𝑧 ∉ 𝑧 , o que é uma contradição, logo 𝑧 ∉ 𝑧; por outro

lado, se 𝑧 ∈ 𝑦 ∧ 𝑧 ∉ 𝑧 fosse verdadeiro, teríamos 𝑧 ∈ 𝑧, contrariando a conclusão anterior, daí

𝑧 ∈ 𝑦 ∧ 𝑧 ∉ 𝑧 tem de ser falso, e para tanto, 𝑧 ∉ 𝑦. Dessa forma, tanto 𝑧 ∈ 𝑧 quanto 𝑧 ∈ 𝑦 ∧

𝑧 ∉ 𝑧 são sentenças falsas, o que torna a equivalência [††] verdadeira6. Assim, vemos que a

existência de um conjunto universo 𝑦 em ZFC possibilita o paradoxo de Russell por implicar

a falsidade de 𝑧 ∉ 𝑦, para todo 𝑧.

Provamos a seguir a existência e a unicidade de um importante indivíduo em ZFC.

Teorema 2.2. (∃! 𝑦)(∀𝑥)(𝑥 ∉ 𝑦).

Demonstração.

Pelo Axioma da Existência, existe pelo menos um conjunto 𝑧. Daí, tomando

𝜑(𝑥) ≡ 𝑥 ≠ 𝑥, o Axioma da Separação garante a existência de um conjunto 𝑦 tal que

(∀𝑥)(𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑧 ∧ 𝑥 ≠ 𝑥).

Assim, se existir 𝑥 tal que 𝑥 ∈ 𝑦, concluiremos que 𝑥 ≠ 𝑥, o que é absurdo. Logo,

(∃𝑦)(∀𝑥)(𝑥 ∉ 𝑦). Supondo que exista 𝑦′ tal que (∀𝑥)(𝑥 ∉ 𝑦′), obtemos 𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑦′,

donde segue pelo Axioma da Extensão que 𝑦 = 𝑦′. Portanto, (∃!𝑦)(∀𝑥)(𝑥 ∉ 𝑦). Q.E.D.

Definição 2.3. ∅ = 𝑥 ⟺ (∀𝑦)(𝑦 ∉ 𝑥). O conjunto ∅ é denominado conjunto

vazio.

Tendo em vista que todos os elementos são conjuntos, não restringimos o uso de

letras minúsculas apenas aos elementos dos conjuntos, atitude muito comum na literatura

matemática. Entretanto, com o desenrolar da teoria, utilizamos letras maiúsculas ou

“estilizadas” a fim de facilitar a distinção entre os vários tipos de conjuntos.

O próximo axioma a ser assumido afirma que, para quaisquer conjuntos 𝑥 e 𝑦,

existe um conjunto 𝑧 cujos únicos membros são 𝑥 e 𝑦. Devido a tal axioma, podemos

formalizar em ZFC o conceito de par não ordenado, donde posteriormente deriva-se o par

ordenado, ambos de grande valor na Matemática. Logo após postularmos tal axioma,

6 Ver Apêndice A.

37

definimos o par não ordenado, devido à sua importância ainda nesta seção. Sua existência é

provada no Teorema 2.10.

Axioma do Par:

(A3) (∀𝑥)(∀𝑦)(∃𝑧)(∀𝑤)(𝑤∈ 𝑧 ⟺ 𝑤 = 𝑥 ∨ 𝑤 = 𝑦).

Definição 2.4. {𝑥, 𝑦} = 𝑧 ⟺ (∀𝑤)(𝑤 ∈ 𝑧 ⟺ 𝑤 = 𝑥 ∨ 𝑤 = 𝑦) .

Definição 2.5. {𝑥} = {𝑥, 𝑥}.

Chamamos o conjunto {𝑥, 𝑦} definido acima de par não ordenado formado por 𝑥

e 𝑦. Decorre imediatamente de sua definição que os únicos elementos de {𝑥, 𝑦} são 𝑥 e 𝑦, ou

em outras palavras 𝑧 ∈ {𝑥, 𝑦} se e só se 𝑧 = 𝑥 ou 𝑧 = 𝑦 — tal observação se encontra

formalizada na Proposição 2.3 (i).

Quando 𝑥 = 𝑦, temos o conjunto unitário de 𝑥 (singleton na literatura inglesa),

que consiste da coleção composta por um único elemento, a saber, o conjunto 𝑥. Devido a tal

unicidade, escreve-se {𝑥} em vez de {𝑥, 𝑥}. Vale notar que para qualquer 𝑦, ∅ ≠ {𝑦}: de fato,

enquanto não existe elemento 𝑧 tal que 𝑧 ∈ ∅, existe o próprio conjunto 𝑦 pertencente a {𝑦};

em particular, ∅ ≠ {∅}.

O axioma seguinte formaliza a reunião entre conjuntos.

Axioma da União:

(A4) (∀𝑥)(∃𝑦)(∀𝑧)�𝑧 ∈ 𝑦⟺ (∃𝑤)(𝑧 ∈ 𝑤 ∧ 𝑤 ∈ 𝑥)�.

Em palavras, (A4) afirma que para qualquer conjunto 𝑥 existe um conjunto 𝑦

cujos elementos pertencem a todos os membros de 𝑥. Assim, por exemplo, se 𝑋 = {𝑎, 𝑏} é o

conjunto cujos únicos membros são 𝑎 e 𝑏, então existe um conjunto 𝑦, tal que

(∀𝑧)(𝑧 ∈ 𝑦 ⟺ 𝑧 ∈ 𝑎 ∨ 𝑧 ∈ 𝑏).

Além disso, tal conjunto 𝑧 é único e, dada à sua importância, recebe uma notação

especial.

Definição 2.6. 𝑥 ∪ 𝑦 = 𝑧 ⟺ (∀𝑤)(𝑤 ∈ 𝑧 ⟺ 𝑤 ∈ 𝑥 ∨ 𝑤 ∈ 𝑦).

Obviamente, apenas definir um conjunto não prova sua existência. O Teorema

2.15, na próxima seção, garante que para quaisquer dois conjuntos 𝑥 e 𝑦, existe um único

38

conjunto 𝑧 ao qual pertencem todos os elementos pertencentes a 𝑥 ou 𝑦. Tal conjunto 𝑧 é

chamado de união dos conjuntos 𝑥 e 𝑦.

A fim de postular o Axioma das Partes, definimos a seguir a inclusão e a inclusão

própria de conjuntos, respectivamente.

Definição 2.7. 𝑥 ⊆ 𝑦⟺ (∀𝑧)(𝑧 ∈ 𝑥 ⟹ 𝑧 ∈ 𝑦).

Definição 2.8. 𝑥 ⊂ 𝑦⟺ 𝑥 ⊆ 𝑦 ∧ 𝑥 ≠ 𝑦.

Definição 2.9. 𝑥 ⊄ 𝑦⟺ ¬(𝑥 ⊆ 𝑦).

Se 𝑥 ⊆ 𝑦, dizemos que 𝑥 é subconjunto de 𝑦 ou 𝑥 está contido em 𝑦. Frisamos

que “𝑥 ∈ 𝑦” e “𝑥 ⊆ 𝑦” são sentenças que indicam conceitos distintos. Enquanto a primeira

afirma que 𝑥 é um elemento de 𝑦, a segunda expressa que os possíveis elementos de 𝑥, caso

existam, são também elementos de 𝑦, o que não garante que o próprio 𝑥 pertença a 𝑦.

Como exemplo, podemos citar o conjunto dos números naturais ℕ que contém o

conjunto dos naturais pares ℙ. Uma vez que ℙ não é um número natural, é claro que ℙ ∉ ℕ,

apesar de ser verdadeiro que ℙ ⊆ ℕ. Ainda neste mesmo exemplo, podemos notar que

existem elementos de ℕ que não pertencem a ℙ, e então escrevemos ℙ ⊂ ℕ e dizemos que ℙ

está propriamente contido em ℕ ou que ℙ é subconjunto próprio de ℕ.

É comum utilizar o símbolo “⊊” para representar a inclusão própria e o símbolo

“⊂” para a inclusão. Uma vez que tais símbolos não interferem no significado das operações,

a escolha de um ou outro é simplesmente uma questão de preferência pessoal. Optamos pelos

símbolos “⊆” e “⊂” para representar respectivamente a inclusão e a inclusão própria pelo fato

de que a maioria dos autores consultados para a elaboração deste trabalho utilizou a mesma

notação.

Uma vez definida a relação de inclusão de conjuntos, o próximo teorema nos

fornece um prático critério para determinar a igualdade entre dois conjuntos. De fato, ele é

apenas a reformulação de (A1) em termos da inclusão de conjuntos.

Teorema 2.3. (∀𝑥)(∀𝑦)(𝑥 = 𝑦 ⟺ 𝑥 ⊆ 𝑦 ∧ 𝑦 ⊆ 𝑥).

Demonstração.

Se 𝑥 = 𝑦, temos (∀𝑧)(𝑧 ∈ 𝑥 ⟺ 𝑧 ∈ 𝑦), donde se obtém

(∀𝑧)(𝑧 ∈ 𝑥 ⟹ 𝑧 ∈ 𝑦) ∧ (∀𝑧)(𝑧 ∈ 𝑦⟹ 𝑧 ∈ 𝑥),

e assim 𝑥 ⊆ 𝑦 e 𝑦 ⊆ 𝑥. Reciprocamente, se 𝑥 ⊆ 𝑦 e 𝑦 ⊆ 𝑥, decorre da Definição 2.7 que

39

(∀𝑧)(𝑧 ∈ 𝑥 ⟹ 𝑧 ∈ 𝑦) ∧ (∀𝑧)(𝑧 ∈ 𝑦⟹ 𝑧 ∈ 𝑥),

o que equivale a (∀𝑧)(𝑧 ∈ 𝑥 ⟺ 𝑧 ∈ 𝑦) e, por (A1), concluímos que 𝑥 = 𝑦. Q.E.D.

Vale notar que pela contrapositiva do teorema acima obtemos a sentença

𝑥 ≠ 𝑦 ⟺ 𝑥 ⊄ 𝑦 ∨ 𝑦 ⊄ 𝑥.

Uma vez definido o conceito de subconjunto, podemos postular o Axioma das

Partes de uma maneira bem simples.

Axioma das Partes:

(A5) (∀𝑥)(∃𝑦)(∀𝑧)(𝑧 ∈ 𝑦 ⟺ 𝑧 ⊆ 𝑦).

Este axioma nos garante que para qualquer conjunto 𝑥 existe um conjunto 𝑦 cujos

membros são todos os subconjuntos de 𝑥. Tal conjunto é único conforme provamos na

próxima seção, e denotado por ℘(𝑥). Além disso, (A5) permite, entre outras coisas,

formalizar em ZFC o produto cartesiano entre conjuntos, que é uma das muitas maneiras de se

formalizar o estudo das relações e das funções em ZFC. Definimos todos esses conceitos e

provamos suas principais propriedades na seção 2.3 e no Capítulo 3.

Axioma do Infinito:

(A6) (∃𝐼)�∅ ∈ 𝐼 ∧ (∀𝑥)(𝑥 ∈ 𝐼 ⟹ 𝑥 ∪ {𝑥} ∈ 𝐼)�.

Temos por (A6) assegurada a existência de ao menos um conjunto 𝐼 que, a

posteriori, é infinito. Vale notar que tal conjunto não poderia ser obtido por meio dos outros

axiomas de ZFC. Com efeito, de (A0), (A1) e (A2) obtemos a existência “concreta” de uma

única coleção, o conjunto vazio. Partindo dele, podemos construir {∅} pelo Axioma do Par ou

pelo Axioma das Partes e, por repetidas aplicações destes axiomas, obter �∅, {∅}�,

�∅, �∅, {∅}��, etc. Contudo, com a definição que adotamos de conjunto finito, no Capítulo 4,

∅ é um conjunto finito e consequentemente, {∅}, �∅, {∅}� e �∅, �∅, {∅}�� são finitos; de modo

geral, qualquer operação definida em termos dos demais axiomas de ZFC que se faça apenas

entre conjuntos finitos resulta num conjunto finito. Portanto, a fim de obtermos conjuntos

infinitos em ZFC é necessário postular a existência de pelo menos um conjunto infinito; por

tal motivo assumimos (A6).

40

Com os axiomas até aqui postulados, é possível determinar conjuntos finitos,

infinitos enumeráveis e não-enumeráveis7. Como exemplo, podemos citar o conjunto dos

números naturais ℕ, definido na seção 4.3. ℕ é infinito enumerável, enquanto ℘(ℕ),

℘�℘(ℕ)� e ℘�℘�℘(ℕ)�� são não-enumeráveis. Porém, não podemos definir o conjunto

enumerável

𝐴 = �ℕ, ℘(ℕ), ℘�℘(ℕ)�, ℘�℘�℘(ℕ)��,…�.

Pode-se tentar, é claro, definir tal conjunto 𝐴 por meio de (A3) e (A4): tomamos

{ℕ, ℘(ℕ)} e �℘�℘(ℕ)�� e formamos �ℕ, ℘(ℕ), ℘�℘(ℕ)��= {ℕ, ℘(ℕ)}∪ �℘�℘(ℕ)��,

repetimos o processo para acrescentar o conjunto �℘�℘�℘(ℕ)�� e assim por diante, ad

infinitum. Mas o que nos assegura que tal processo é válido? Garantir a existência de um

conjunto infinito, o que é feito por (A6), não nos permite dizer que os axiomas já assumidos

podem ser aplicados infinitas vezes às famílias já existentes. A fim de eliminar tal brecha,

postulamos o próximo axioma.

Axioma (Esquema) da Substituição:

(A7) (∀𝑥)(∀𝑦)(∀𝑧)(𝜑(𝑥, 𝑦) ∧ 𝜑(𝑥, 𝑧)⟹ 𝑧 = 𝑦) ⟹

⟹ (∀𝑋)(∃𝑌)(∀𝑤)�𝑤 ∈ 𝑌 ⟺ (∃𝑎)�𝑎 ∈ 𝑋 ∧ 𝜑(𝑎, 𝑤)��.

Frisamos que 𝑌 não pode ser uma variável livre em 𝜑, pelo mesmo motivo

apresentado nos esclarecimentos sobre (A2), bem como o fato de que 𝜑 possivelmente possa

ter vários parâmetros. Além disso, a formulação geral do axioma carece de esclarecimento,

uma vez que o postulamos de forma condicional. Dizemos que 𝜑 é funcional em 𝑥 caso ela

satisfaça a condição suficiente imposta por (A7), isto é, se para todo 𝑥 existir no máximo um

𝑦 tal que a fórmula 𝜑(𝑥, 𝑦) seja verdadeira. Assim, o axioma garante que se 𝜑 for funcional,

então para qualquer conjunto 𝑋 existe um conjunto 𝑌 cujos membros são exatamente os

elementos 𝑦 que satisfazem 𝜑(𝑥, 𝑦) para cada 𝑥 ∈ 𝑋. Também é importante lembrar que este

é um esquema de axiomas: para cada fórmula 𝜑 que satisfaz a condição de (A7) obtemos um

axioma.

7 Ver Capítulo 4.

41

Apesar de aparentemente artificial, o Axioma da Substituição pode ser visto de

maneira muito natural, conforme mostrado por Hrbacek & Jech, que traçam um interessante

paralelo entre (A2) e (A7):

Uma justificativa intuitiva para o Axioma Esquema da Substituição pode ser dada comparando-o com o Axioma Esquema da Separação. O último nos permite percorrer os elementos de um dado conjunto 𝐴, verificar para cada 𝑥 ∈ 𝐴 os elementos que possuem a propriedade 𝜑, e coletá-los num conjunto. De modo inteiramente análogo, o Axioma Esquema da Substituição permite-nos percorrer os elementos de 𝐴, tomar para cada 𝑥 ∈ 𝐴 o único 𝑦 [não necessariamente pertencente a 𝐴] correspondente que goza da propriedade 𝜑(𝑥, 𝑦) , e coletar tais elementos 𝑦 num conjunto [chamemos de 𝜑(𝐴) ]. É intuitivamente óbvio que o conjunto [𝜑(𝐴) ] ‘não é tão grande’ quanto o conjunto 𝐴. Em contraste, todos os exemplos conhecidos de ‘conjuntos paradoxais’ são ‘grandes’, como o ‘conjunto de todos os conjuntos’ (HRBACEK & JECH, 1999, p. 112 – 113, tradução nossa).

Nos dois próximos teoremas, provamos que (A7) ⟹ (A2) e (A7) ∧ (A5) ⟹ (A3).

Teorema 2.4. O Axioma da Separação é derivável do Axioma da Substituição.

Demonstração.

Seja 𝜓 uma condição em 𝑥. Tomemos a fórmula 𝜑(𝑥, 𝑦) ≡ 𝑥 = 𝑦 ∧ 𝜓(𝑦).

Claramente, 𝜑 é funcional em 𝑥. Então, pelo Axioma da Substituição, temos

[†] (∀𝑋)(∃𝑌)(∀𝑤)(𝑤 ∈ 𝑌 ⟺ (∃𝑎)�𝑎 ∈ 𝑋 ∧ 𝑎 = 𝑤∧ 𝜓(𝑤)�,

onde 𝑌 não é livre em 𝜑(𝑥, 𝑦) e consequentemente não é livre em 𝜓. Observando que [†]

equivale a

(∀𝑋)(∃𝑌)(∀𝑤)�𝑤 ∈ 𝑌 ⟺ 𝑤 ∈ 𝑋 ∧ 𝜓(𝑤)�,

obtemos exatamente o Axioma da Separação. Q.E.D.

Teorema 2.5. O Axioma do Par é derivável do Axioma da Substituição e do

Axioma das Partes.

Demonstração.

O teorema anterior nos mostrou que (A7) ⟹ (A2) e, por meio de (A2), provamos

que existe o conjunto vazio, ∅. Seja 𝑤 arbitrário tal que 𝑤 ⊆ ∅. Se, por absurdo, 𝑤 ≠ ∅, então

∅ ⊄ 𝑤, e assim existe 𝑧 ∈ ∅ tal que 𝑧 ∉ 𝑤, o que contraria a definição de ∅. Dessa forma,

�†1� 𝑤 ⊆ ∅⟺ 𝑤 = ∅.

42

Daí, devido a (A5), existe um conjunto 𝑃, tal que 𝑧 ∈ 𝑃⟺ 𝑧 ⊆ ∅ e, de �†1�

decorre 𝑧 ∈ 𝑃 ⟺ 𝑧 = ∅. Pela definição de par não ordenado e conjunto unitário, temos

𝑃 = {∅}. Aplicando novamente o Axioma das Partes, obtemos o conjunto 𝑋 = �∅, {∅}� —

note que não estamos usando o Axioma do Par para obter tais conjuntos, mas apenas a

notação do par não ordenado para denotar os conjuntos cuja existência derivamos do Axioma

das Partes.

Sejam 𝑎 e 𝑏 elementos quaisquer. Tomemos então

𝜑(𝑥, 𝑦) ≡ (𝑥 = ∅ ∧ 𝑦 = 𝑎) ∨ (𝑥 = {∅} ∧ 𝑦 = 𝑏).

𝜑 é obviamente funcional em 𝑥, pois 𝑎 e 𝑏 são únicos. O Axioma da Substituição

garante então que

(∃𝑌)(∀𝑧)�𝑧 ∈ 𝑌 ⟺ (∃𝑢) �𝑢 ∈ �∅, {∅}� ∧ 𝜑(𝑢, 𝑧)��,

o que equivale a

�†2� (∃𝑌)(∀𝑧)�𝑧 ∈ 𝑌 ⟺ (∃𝑢) �𝑢 ∈ �∅, {∅}� ∧ �(𝑢 = ∅ ∧ 𝑧 = 𝑎) ∨ (𝑢 = {∅} ∧ 𝑧 = 𝑏)��.

Devido a �†2�, temos

[∗] 𝑧 ∈ 𝑌 ⟹ 𝑧 = 𝑎 ∨ 𝑧 = 𝑏.

Por outro lado, se 𝑧 = 𝑎 ou 𝑧 = 𝑏 , então a sentença

(∃𝑢) �𝑢 ∈ �∅, {∅}� ∧ �(𝑢 = ∅ ∧ 𝑧 = 𝑎) ∨ (𝑢 = {∅} ∧ 𝑧 = 𝑏)��

é verdadeira, e novamente por �†2�, segue que

[∗∗] 𝑧 = 𝑎 ∨ 𝑧 = 𝑏 ⟹ 𝑧 ∈ 𝑌.

Como 𝑎 e 𝑏 foram tomados arbitrariamente, obtemos de [∗] e [∗∗] o Axioma do

Par. Q.E.D.

Definimos a seguir a interseção entre dois conjuntos. Sua existência, que decorre

imediatamente de (A2), é provada na próxima seção.

Definição 2.10. 𝑥 ∩ 𝑦 = 𝑧 ⟺ (∀𝑤)(𝑤 ∈ 𝑧 ⟺ 𝑤 ∈ 𝑥 ∧ 𝑤 ∈ 𝑦).

Definição 2.11. 𝑥 e 𝑦 são ditos conjuntos disjuntos se, e somente se, 𝑥 ∩ 𝑦 = ∅.

43

Definição 2.12. 𝑡 é uma família disjunta se, e somente se, quaisquer dois membros

distintos de 𝑡 forem disjuntos. Simbolicamente

(∀𝑥)�𝑥 ∈ 𝑡 ⟹ �(∀𝑦)(𝑦 ∈ 𝑡 ∧ 𝑦 ≠ 𝑥) ⟹ 𝑥 ∩𝑦 = ∅��.

Consideremos uma família disjunta 𝑡. Na próxima seção, provamos a existência

dos conjuntos denotados por ⋃𝑡 e ∏𝑡: o primeiro consiste da reunião de todos os membros de

𝑡, enquanto o segundo é composto por todos os conjuntos que possuem exatamente um

membro de cada membro de 𝑡; denominamos os membros de ∏𝑡 por conjuntos de seleção de

𝑡 (selection sets of 𝑡).

Assim, por exemplo, se 𝑡 = �{𝑎, 𝑏}, {𝑐}�, então ⋃𝑡 = {𝑎, 𝑏, 𝑐} e ∏𝑡 =

�{𝑎, 𝑐}, {𝑏, 𝑐}�. Notemos que todo membro 𝑥 de ∏𝑡 é um subconjunto de ⋃𝑡 tal que 𝑥 ∩ 𝑠 é

um conjunto unitário, para todo 𝑠 ∈ 𝑡; tal propriedade é, de fato, uma caracterização geral

para ∏𝑡. Caso ∅ ∈ 𝑡, temos necessariamente ∏𝑡 = ∅, pois do contrário deveria existir um

subconjunto de ⋃𝑡 cuja interseção com ∅ fosse um conjunto unitário, o que é absurdo. Porém

a partir dos axiomas até aqui postulados, não podemos responder, de modo geral, se quando

∅ ∉ 𝑡 tem-se necessariamente ∏𝑡 ≠ ∅, isto é, se existe ou não algum conjunto de seleção de 𝑡

(FRAENKEL, BAR-HILLEL, & LEVY, 1973).

Intuitivamente, faz sentido supor que ∏𝑡 ≠ ∅. De fato, uma vez que todo membro

de 𝑡 é não vazio, para cada elemento de 𝑦 (com 𝑦 ∈ 𝑡), podemos escolher arbitrariamente um

elemento 𝑧 ∈ 𝑦 e coletá-los num conjunto 𝑐; uma vez que 𝑐 é formado por membros de

membros de 𝑡, temos 𝑐 ⊆ ⋃ 𝑡 e, “por construção”, para todo 𝑦 ∈ 𝑡, 𝑐 ∩ 𝑦 é um conjunto

unitário, donde segue 𝑐 ∈ ∏𝑡. Entretanto, apesar de podermos definir ∏𝑡, não podemos

definir os elementos de ∏𝑡, como notam Fraenkel, Bar-Hillel & Levy (1973), pois escolher

arbitrariamente um elemento não é uma fórmula 𝜑 que possa ser aplicada convenientemente

ao Axioma da Separação a fim de obtermos um subconjunto de ⋃𝑡 bem determinado. É claro

que alguns conjuntos possuem certas propriedades que nos permitem escolher tais elementos

com alguma fórmula 𝜑 adequada, mas geralmente tal escolha não é derivável dos axiomas

anteriores.

44

A fim de garantir a não vacuidade de ∏ 𝑡, entre outras coisas, assumimos o

axioma seguinte8.

Axioma da Escolha:

(A8) (∀𝑡)(𝑡 é uma família disjunta ∧ ∅ ∉ 𝑡) ⟹ (∃𝑢)(∀𝑤)�𝑤 ∈ 𝑡 ⟹ (∃! 𝑧)(𝑧 ∈ 𝑢 ∩𝑤)�

Em palavras, asseguramos que para qualquer família disjunta 𝑡 com ∅ ∉ 𝑡, existe

um conjunto 𝑢 tal que para qualquer elemento 𝑤 de 𝑡 existe um único elemento 𝑧 de 𝑤

também pertencente a 𝑢, isto é, tal que 𝑤 ∩ 𝑢 = {𝑧}, o que garante ∏𝑡 ≠ ∅. Quando se tem

formalizado o conceito de função, o conjunto 𝑢 acima pode ser interpretado como uma função

escolha, uma “regra” que escolhe para cada conjunto de 𝑡 um único elemento. De fato, esta é

uma formulação equivalente, dentre tantas outras, para (A8). Ao longo deste trabalho,

demonstramos esta e outras afirmações equivalentes ao Axioma da Escolha. Por ora,

postulamos o último axioma de nossa lista.

Axioma da Fundação:

(A9) (∀𝑋)�𝑋 ≠ ∅⟹ (∃𝑥)(𝑥 ∈ 𝑋 ∧ 𝑋 ∩ 𝑥 = ∅)�.

A importância de tal axioma se encontra em contextos ligeiramente avançados.

Uma vez assumido, (A9) impede a existência de cadeias de pertinência circulares, como por

exemplo,

𝑥1 ∈ 𝑥2 ∧ 𝑥2 ∈ 𝑥3 ∧ … ∧ 𝑥𝑛−1 ∈ 𝑥𝑛 ∧ 𝑥𝑛 ∈ 𝑥1.

Além disso, ele permite provar que todo conjunto em ZFC “[…] pode ser obtido a

partir do vazio iterando-se as operações de união e partes.” (MIRAGLIA, 1991, p. 24), como

se existisse uma hierarquia de conjuntos: a primeira “camada” seria constituída pelos

elementos mais simples, os indivíduos, o que neste caso corresponde a ∅; a segunda seria

composta por todos os conjuntos que possuem indivíduos como membros, e assim

sucessivamente. Tratamos brevemente sobre “conjuntos bem fundados” e as aplicações do

Axioma da Fundação no Apêndice B.

8 Adaptamos esta formulação de Fraenkel, Bar-Hillel & Levy (1973). Os autores originalmente utilizam (∃𝑧)(∀𝑣)(𝑧 = 𝑣 ⟺ 𝑣 ∈ 𝑢 ∧ 𝑣 ∈ 𝑤) em vez de (∃!𝑧) (𝑧 ∈ 𝑢 ∩ 𝑤), mas tais sentenças são equivalentes.

45

Denominamos de Sistema Axiomático de Zermelo-Fraenkel-Choice à Teoria dos

Conjuntos derivada dos axiomas (A1),…, (A9), abreviadamente ZFC. ZF nomeia a Teoria dos

Conjuntos obtida dos axiomas (A1),…, (A7), (A9), isto é, não se assume o Axioma da

Escolha. Nas próximas seções provamos a existência e as propriedades de diversos conjuntos

que podem ser derivados dos axiomas de ZFC, os quais nos permitem definir, entre outras

coisas, relações, funções e o conjunto dos números naturais.

2.3. Operações Básicas Entre Conjuntos

Passamos a tratar das principais “operações” entre conjuntos e de suas

propriedades que podem ser derivadas dos axiomas de ZFC: o complementar relativo, a união,

pares (não ordenados e ordenados), interseção, potência e produto cartesiano. Notemos que,

apesar de nos referirmos a tais conceitos como “operações”, não podemos considerá-las como

funções no sentido estrito, pois para isso seria exigido um conjunto universo como domínio9.

O primeiro teorema desta seção é uma adaptação de uma observação feita por

Hrbacek & Jech (1999) sobre definições por abstração. Como já vimos anteriormente, o

Axioma da Abstração, por ser demasiado forte, gera paradoxos por assegurar a existência de

conjuntos definidos por propriedades pouco convenientes. No entanto, dado um conjunto 𝑥,

(A2) garante que para qualquer propriedade 𝜓 existe um subconjunto 𝑥𝜓 ⊆ 𝑥 constituído por

todos os elementos de 𝑥 que gozam de 𝜓. Tal conjunto é único devido ao Axioma da

Extensão, conforme provamos abaixo.

Teorema 2.6. (∀𝑧)(∃!𝑦)(∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥)�.

Demonstração.

Seja 𝑧 um conjunto qualquer e 𝜓(𝑥) uma condição em 𝑥. O Axioma da Separação

estabelece a existência de ao menos um conjunto 𝑦, tal que

(∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥)�.

9 Ver Capítulo 3.

46

Se existir 𝑦′ que satisfaça a sentença

(∀𝑥)�𝑥 ∈ 𝑦′ ⟺ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥)�,

então, para 𝑥 qualquer temos 𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥) ⟺ 𝑧 ∈ 𝑦′ e, por (A1), concluímos que

𝑦 = 𝑦′. Q.E.D.

Definição 2.13. {𝑥 ∈ 𝑧|𝜓(𝑥)} = 𝑦⟺ (∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥)�.

Suponhamos agora que exista uma condição 𝜓 em 𝑥 e um conjunto 𝑋 tais que

𝜓(𝑥) ⟹ 𝑥 ∈ 𝑋. Claramente, existe 𝐴 = {𝑥 ∈ 𝑋|𝜓(𝑥)}, e este é tal que 𝑥 ∈ 𝐴 se, e somente

se, 𝜓(𝑥). Contudo, se existir outro conjunto 𝑌 tal que 𝜓(𝑥) ⟹ 𝑥 ∈ 𝑌, então teremos

{𝑥 ∈ 𝑌|𝜓(𝑥)} = 𝐴. Em outras palavras, em tais condições podemos definir um conjunto 𝐴𝜓

nos moldes do Axioma da Abstração, isto é, tal que 𝑥 ∈ 𝐴𝜓 se, e somente se, 𝜓(𝑥); 𝐴𝜓 diz-se

ser definido por abstração. Tal resultado é demonstrado a seguir.

Teorema 2.7. (∃𝑧)(∀𝑥)(𝜓(𝑥)⟹ 𝑥 ∈ 𝑧) ⟹ (∃!𝑦)(∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝜓(𝑥)�.

Demonstração.

Definamos 𝑦 = {𝑥 ∈ 𝑧|𝜓(𝑥)}. Afirmamos que 𝑦 é tal que

[†] (∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝜓(𝑥)�.

Da hipótese do teorema, temos

𝜓(𝑥) ⟹ 𝑥 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥),

mas, como pela Definição 2.13

[††] 𝑥 ∈ 𝑦⟺ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥),

segue que 𝜓(𝑥) ⟹ 𝑥 ∈ 𝑦.

Obviamente, decorre de [††] que 𝑥 ∈ 𝑦 ⟹ 𝜓(𝑥). Logo, [†] é verdadeiro, como

afirmamos. A unicidade de 𝑦 segue então do teorema anterior. Q.E.D.

Definição 2.14.

(∃𝑧)(∀𝑥)(𝜓(𝑥) ⟹ 𝑥 ∈ 𝑧) ⟹ �{𝑥|𝜓(𝑥)} = 𝑦 ⟺ (∀𝑥)�𝑥 ∈ 𝑦⟺ 𝜓(𝑥)��.

Geralmente diz-se que {𝑥|𝜓(𝑥)} é o conjunto dos elementos 𝑥, tais que 𝜓(𝑥). É

comum encontrar textos matemáticos em que a barra vertical “|” usada na Definição 2.13 é

47

substituída por dois pontos “:”, escrevendo {𝑥 ∈ 𝑧:𝜓(𝑥)} = 𝑦. O significado de tal expressão

é o mesmo que transcrevemos acima. A preferência por um símbolo ou outro geralmente varia

com a natureza dos objetos matemáticos envolvidos no contexto. Neste trabalho, utilizamos as

duas notações de acordo com a conveniência.

Nesta seção, definimos vários conjuntos da forma {𝑥|𝜓(𝑥)}. Para provar que tais

conjuntos estão bem definidos, basta mostrarmos que existe um conjunto 𝐴 para o qual

𝜓(𝑥) ⟹ 𝑥 ∈ 𝐴. Assim, por exemplo, não podemos considerar o conjunto {𝑥|𝑥 = 𝑥}, pois se

existisse um conjunto 𝐴 tal que 𝑥 = 𝑥 ⟹ 𝑥 ∈ 𝐴, 𝐴 seria como um “conjunto universo”, o que

contraria o Teorema 2.1.

Vale frisar que Suppes (1972), utiliza uma definição sutilmente distinta sobre a

qual discutimos brevemente a seguir. O autor define {𝑥|𝜑(𝑥)} = 𝑦 como sendo o conjunto tal

que 𝑥 ∈ 𝑦 se e só se 𝜓(𝑥) ou {𝑥|𝜑(𝑥)} = ∅ caso não exista um conjunto que satisfaça a

condição imposta a 𝑦. Dessa forma, a notação {𝑥|𝜑(𝑥)} está sempre bem definida, embora

não se possa saber a priori se existe algum elemento em {𝑥|𝜑(𝑥)}, ao contrário da definição

condicional que adotamos.

Uma situação que exemplifica bem a diferença entre as duas definições é tomar

𝜑(𝑥) ≡ 𝑥 = 𝑥. Uma vez que não existe 𝑦 tal que 𝑥 ∈ 𝑦 ⟺ 𝜑(𝑥), devido ao Teorema 2.1, não

podemos, em posse da Definição 2.14, considerar formalmente {𝑥|𝑥 = 𝑥}. Todavia, pela

definição não condicional de Suppes (1972), {𝑥|𝑥 = 𝑥} existe e é idêntico ao conjunto vazio,

apesar de todo elemento satisfazer 𝜑. Ainda assim, mesmo para conjuntos {𝑥|𝜑(𝑥)}

sabidamente não vazios a posteriori, é preciso provar que existe um conjunto 𝐴 tal que

{𝑥|𝜑(𝑥)} = {𝑥 ∈ 𝐴|𝜑(𝑥)} para garantir que {𝑥|𝜑(𝑥)} ≠ ∅ caso exista algum elemento

satisfazendo 𝜑. Por tal motivo, optamos pela Definição 2.14.

Mesmo com tais diferenças, Suppes (1972) propõe teoremas muito úteis para

conjuntos da forma {𝑥|𝜑(𝑥)}, que podem ser adaptados para a Definição 2.14 sem grandes

dificuldades. Provamos abaixo tais resultados.

Teorema 2.8. (∃𝑧)(𝑧 = {𝑥|𝜓(𝑥)}) ⟹ (∀𝑦)�𝑦 ∈ {𝑥|𝜓(𝑥)} ⟺𝜓(𝑦)�.

Demonstração.

Decorre imediatamente da hipótese do teorema e da Definição 2.14. Q.E.D.

Observação: notemos que Suppes (1972) propõe apenas 𝑦 ∈ {𝑥|𝜑(𝑥)} ⟹𝜑(𝑦),

pois nas linhas da definição por abstração adotadas pelo autor não é imposta a hipótese de

que exista um conjunto 𝐴 para o qual 𝜑(𝑥) ⟹ 𝑥 ∈ 𝐴 e, por conseguinte, a recíproca não

48

poderia ser verdadeira. Basta considerar, por exemplo, 𝜑(𝑥) ≡ 𝑥 = 𝑥, 𝜑(𝑦) é válido para

todo 𝑦, mas tem-se que {𝑥|𝑥 = 𝑥} = ∅.

Proposição 2.1. (∀𝑦)(𝑦 = {𝑥|𝑥 ∈ 𝑦}).

Demonstração.

Basta notar que a fórmula 𝜑(𝑥) ≡ 𝑥 ∈ 𝑦 é tal que 𝜑(𝑥)⟹ 𝑥 ∈ 𝑦, donde se tem

pelo Teorema 2.7 que existe {𝑥|𝑥 ∈ 𝑦};a igualdade 𝑦 = {𝑥|𝑥 ∈ 𝑦} segue do teorema anterior e

do Axioma da Extensão. Q.E.D.

Teorema 2.9. Se existirem um conjunto {𝑥|𝜑(𝑥)} e uma condição 𝜓 em 𝑥 tais que

𝜓(𝑥) ⟺ 𝜑(𝑥) para todo 𝑥, então existe {𝑥|𝜓(𝑥)} e, além disso, {𝑥|𝜓(𝑥)} = {𝑥|𝜑(𝑥)}.

Demonstração.

Seja 𝑦 qualquer. Pelo Teorema 2.8 temos 𝑦 ∈ {𝑥|𝜑(𝑥)} ⟺ 𝜑(𝑦); então, pela

hipótese do teorema, obtemos

𝜓(𝑦) ⟺ 𝜑(𝑦) ⟺𝑦 ∈ {𝑥|𝜑(𝑥)},

donde segue 𝜓(𝑦) ⟹𝑦 ∈ {𝑥|𝜑(𝑥)} e assim existe {𝑥|𝜓(𝑥)}. Novamente, pelo mesmo

teorema, concluímos que

𝑦 ∈ {𝑥|𝜓(𝑥)} ⟺𝜓(𝑦) ⟺𝜑(𝑦) ⟺𝑦 ∈ {𝑥|𝜑(𝑥)},

isto é, 𝑦 ∈ {𝑥|𝜓(𝑥)} ⟺𝑦 ∈ {𝑥|𝜑(𝑥)}. A igualdade segue do Axioma da Extensão. Q.E.D.

O Teorema 2.9 tem grande importância no contexto matemático geral, pois prova

que condições equivalentes determinam conjuntos iguais. Assim, por exemplo,

{𝑥 ∈ ℝ|𝑥 2 − 1 = 0} = {𝑥 ∈ ℝ|𝑥 = 1 ∨ 𝑥 = −1}, haja vista que 𝑥2 − 1 = 0 ⟺ 𝑥 = ±1.

É claro que conjuntos da forma {𝑥 ∈ 𝐴|𝜓(𝑥)} podem ser vistos como conjuntos

definidos por abstração, conforme mostramos a seguir.

Proposição 2.2. (∀𝑦)({𝑥 ∈ 𝑦|𝜓(𝑥)} = {𝑥|𝑥 ∈ 𝑦 ∧ 𝜓(𝑥)}).

Demonstração.

Para um conjunto 𝑦 qualquer, existe o conjunto 𝑌 = {𝑥 ∈ 𝑦|𝜓(𝑥)}, tal que

[†] 𝑧 ∈ 𝑌 ⟺ 𝑧 ∈ 𝑦 ∧ 𝜓(𝑧).

Então, 𝑧 ∈ 𝑦 ∧ 𝜓(𝑧) ⟹ 𝑧 ∈ 𝑌. Logo, existe {𝑥|𝑥 ∈ 𝑦 ∧ 𝜓(𝑥)}. Finalmente, a

igualdade decorre do Teorema 2.8, de [†] e de (A1). Q.E.D.

49

Passamos a provar a existência dos conjuntos citados na seção anterior, bem como

suas principais propriedades.

Teorema 2.10. (∀𝑥)(∀𝑦)(∃! 𝑧)(∀𝑤)(𝑤∈ 𝑧 ⟺ 𝑤 = 𝑥 ∨ 𝑤 = 𝑦).

Demonstração.

Decorre diretamente do Axioma do Par a existência de tal conjunto 𝑧. Sua

unicidade segue do Axioma da Extensão. Q.E.D.

Teorema 2.11. (∀𝑎)(∀𝑏)(∃!𝑦)(∀𝑥)(𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑎 ∧ 𝑥 ∉ 𝑏).

Demonstração.

Basta tomar 𝑦 = {𝑥 ∈ 𝑎|𝑥 ∉ 𝑏}, único pelo Teorema 2.6. Então, do teorema

anterior, obtemos 𝑦 = {𝑥|𝑥 ∈ 𝑎 ∧ 𝑥 ∉ 𝑏}. Segue do Teorema 2.8 que para 𝑥 qualquer,

𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑎 ∧ 𝑥 ∉ 𝑏. Q.E.D.

Teorema 2.12. (∀𝑎)(∃!𝑦)(∀𝑥)�𝑥 ∈ 𝑦⟺ (∃𝑧)(𝑧 ∈ 𝑎 ∧ 𝑥 ∈ 𝑧)�.

Demonstração.

Decorre imediatamente de (A4) que existe um conjunto 𝑦 que satisfaz a

equivalência. Sua unicidade é consequência do Axioma da Extensão. Q.E.D.

Teorema 2.13. (∀𝑧)(∃!𝑦)(∀𝑥)(𝑥 ⊆ 𝑧 ⟺ 𝑥 ∈ 𝑦).

Demonstração.

A existência de tal 𝑦 segue de (A5); sua unicidade se deve à (A1). Q.E.D.

Teorema 2.14. (∀𝑧)�𝑧 ≠ ∅ ⟹ (∃!𝑦)(∀𝑥)�(∀𝑤)(𝑤 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑤) ⟹ 𝑥 ∈ 𝑦��.

Demonstração.

Seja 𝑧 ≠ ∅. Daí existe 𝑢 ∈ 𝑧. Definamos então

𝑦 = {𝑥 ∈ 𝑢|(∀𝑤)(𝑤 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑤)}.

Obviamente, para um 𝑥 arbitrário, temos

𝑥 ∈ 𝑦 ⟹ (∀𝑤)(𝑤 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑤).

Reciprocamente, se (∀𝑤)(𝑤 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑤) então, como 𝑢 ∈ 𝑧, obtemos

(∀𝑤)(𝑤 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑤) ∧ 𝑥 ∈ 𝑢,

donde segue que 𝑥 ∈ 𝑦. Logo, 𝑥 ∈ 𝑦 ⟺ (∀𝑤)(𝑤 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑤). Q.E.D.

50

Corolário 2.1. {𝑎, 𝑏} = {𝑥|𝑥 = 𝑎 ∨ 𝑥 = 𝑏}.

Demonstração.

Pelo Teorema 2.10, vimos que existe 𝑦 tal que (𝑥 = 𝑎 ∨ 𝑥 = 𝑏) ⟺ 𝑥 ∈ 𝑦. Logo,

existe {𝑥|𝑥 = 𝑎 ∨ 𝑥 = 𝑏}. Pelo Teorema 2.8 inferimos

𝑧 ∈ {𝑥|𝑥 = 𝑎 ∨ 𝑥 = 𝑏} ⟺ 𝑧 = 𝑎 ∨ 𝑧 = 𝑏,

e daí, pela Definição 2.4, concluímos que

𝑧 ∈ {𝑥|𝑥 = 𝑎 ∨ 𝑥 = 𝑏} ⟺ 𝑧 ∈ {𝑎, 𝑏}.

A igualdade decorre do Axioma da Extensão. Q.E.D.

Tais teoremas embasam as definições seguintes.

Definição 2.15. 𝑥 ∖ 𝑦 = {𝑧|𝑧 ∈ 𝑥 ∧ 𝑧 ∉ 𝑦}.

Definição 2.16. ⋃𝑥 = {𝑧|(∃𝑤)(𝑤 ∈ 𝑥 ∧ 𝑧 ∈ 𝑤)}.

Definição 2.17. ℘(𝑥) = {𝑧|𝑧 ⊆ 𝑥}.

Definição 2.18. 𝑥 ≠ ∅⟹ ⋂𝑥 = {𝑧|(∀𝑤)(𝑤 ∈ 𝑥 ⟹ 𝑧 ∈ 𝑤)}.

O Corolário 2.1 apenas estabelece uma definição equivalente para o par não

ordenado {𝑎, 𝑏}, cuja existência provamos no Teorema 2.10. O conjunto 𝑥 ∖ 𝑦 definido acima

é a coleção de todos os elementos pertencentes a 𝑥 que não pertencem a 𝑦, o qual chamamos

de complementar de 𝑦 em relação a 𝑥 , ou diferença entre 𝑥 e 𝑦. O conjunto das partes de 𝑥,

também chamado de conjunto potência de 𝑥 e denotado por ℘(𝑥) é a coleção de todos os

subconjuntos de 𝑥, cuja existência comprova-se pelo Teorema 2.13.

Para uma família 𝑥 de conjuntos, ⋃𝑥 designa a união da família 𝑥, isto é, a união

de todos os membros que pertencem a algum membro de 𝑥, cuja existência decorre do

Teorema 2.12. Por fim, dizemos que ⋂𝑥 é a interseção da família 𝑥, cujos membros são

exatamente os conjuntos que pertencem a todos os membros de 𝑥 simultaneamente.

Contudo, enquanto existe a união de ∅, não existe em ZFC um conjunto formado

por todos os membros que pertencem a algum membro de ∅: uma vez que ∅ não possui

membros, por vacuidade qualquer elemento 𝑤 pertence a todos os membros de ∅

simultaneamente, o que contraria o Teorema 2.1; isso justifica a condição 𝑥 ≠ ∅ para que

exista ⋂𝑥.

51

Como consequência imediata do Teorema 2.8, o próximo resultado formaliza

critérios de pertinência para os conjuntos definidos acima.

Proposição 2.3. Sejam 𝑥 e 𝑦 conjuntos quaisquer. São verdadeiras as sentenças:

(i) (∀𝑧)(𝑧 ∈ {𝑥, 𝑦} ⟺ 𝑧 = 𝑥 ∨ 𝑧 = 𝑦);

(ii) (∀𝑧)(𝑧 ∈ {𝑥} ⟺ 𝑧 = 𝑥);

(iii) (∀𝑧)(𝑧 ∈ 𝑥 ∖ 𝑦⟺ 𝑧 ∈ 𝑥 ∧ 𝑧 ∉ 𝑦);

(iv) (∀𝑧)�𝑧 ∈ ⋃𝑥 ⟺ (∃𝑤)(𝑤 ∈ 𝑥 ∧ 𝑧 ∈ 𝑤)�;

(v) (∀𝑧)(𝑧 ∈ ℘(𝑦) ⟺ 𝑧 ⊆ 𝑦);

(vi) (∀𝑧)(𝑧 ≠ ∅⟹ (∀𝑤)�𝑤 ∈ ⋂𝑧 ⟺ (∀𝑣)(𝑣 ∈ 𝑧 ⟹ 𝑤 ∈ 𝑣)�.

Demonstração.

Provamos apenas (iv), as demais sentenças se demonstram de maneira análoga.

Por definição, ⋃𝑥 = {𝑧|(∃𝑤)(𝑤 ∈ 𝑥 ∧ 𝑧 ∈ 𝑤)}. Fazendo 𝜓(𝑧) ≡ (∃𝑤)(𝑤 ∈ 𝑥 ∧

𝑧 ∈ 𝑤) no Teorema 2.8, obtemos 𝑧 ∈ ⋃𝑥 ⟺ (∃𝑤)(𝑤 ∈ 𝑥 ∧ 𝑧 ∈ 𝑤). Q.E.D.

Dados dois conjuntos 𝑥 e 𝑦, podemos considerar um caso particular da união, no

qual se reúnem os membros de 𝑥 e 𝑦 num único conjunto, denotado por 𝑥 ∪ 𝑦, o que

corresponde, segundo a definição dada na seção anterior, a

𝑥 ∪ 𝑦 = 𝑧 ⟺ (∀𝑤)(𝑤 ∈ 𝑧 ⟺ 𝑤 ∈ 𝑥 ∨ 𝑤 ∈ 𝑦).

No entanto, ainda não provamos que tal conjunto existe. Com efeito, podemos

considerar o par não ordenado {𝑥, 𝑦} e tomar ⋃{𝑥, 𝑦}. Como os únicos membros de {𝑥, 𝑦} são

𝑥 e 𝑦, tem-se que ⋃{𝑥, 𝑦} = 𝑥 ∪ 𝑦 segundo a Definição 2.6. Analogamente ⋂{𝑥, 𝑦} é um

conjunto cujos membros pertencem a 𝑥 e a 𝑦, isto é, ⋂{𝑥, 𝑦} = 𝑥 ∩ 𝑦 segundo a Definição

2.10. Provamos a existência de 𝑥 ∪ 𝑦 e 𝑥 ∩ 𝑦 no teorema seguinte.

Teorema 2.15. Sejam 𝑥 e 𝑦 conjuntos quaisquer.

(i) (∀𝑧)(𝑧 ∈ ⋃{𝑥, 𝑦} ⟺ 𝑧 ∈ 𝑥 ∨ 𝑧 ∈ 𝑦);

(ii) (∀𝑧)(𝑧 ∈ ⋂{𝑥, 𝑦} ⟺ 𝑧 ∈ 𝑥 ∧ 𝑧 ∈ 𝑦).

Demonstração.

Pela Proposição 2.3 (iv), temos

𝑧 ∈ ⋃{𝑥, 𝑦} ⟺ (∃𝑤)(𝑤 ∈ {𝑥, 𝑦} ∧ 𝑧 ∈ 𝑤),

52

daí, devido ao item (i) da Proposição 2.3,

𝑧 ∈ ⋃{𝑥, 𝑦} ⟺ (∃𝑤)�(𝑤 = 𝑥 ∨ 𝑤 = 𝑦) ∧ 𝑧 ∈ 𝑤� ⟺ 𝑧 ∈ 𝑥 ∨ 𝑧 ∈ 𝑦,

o que prova o item (i) do teorema.

Da Proposição 2.3 (i), temos 𝑥 ∈ {𝑥, 𝑦}, donde segue {𝑥, 𝑦} ≠ ∅. Logo, existe

⋂{𝑥, 𝑦}. Se 𝑧 ∈ ⋂{𝑥, 𝑦} então 𝑧 deve pertencer a todos os membros de {𝑥, 𝑦}, ou seja, 𝑧 ∈ 𝑥 e

𝑧 ∈ 𝑦. Reciprocamente, se 𝑧 ∈ 𝑥 e 𝑧 ∈ 𝑦, então 𝑧 pertence a todos os membros de {𝑥, 𝑦}.

Mostramos assim que (ii) é verdadeiro. Q.E.D.

Corolário 2.2. Para quaisquer conjuntos 𝑥 e 𝑦 são verdadeiras as igualdades

seguintes

(i) 𝑥 ∪ 𝑦 = ⋃{𝑥, 𝑦} = {𝑧|𝑧 ∈ 𝑥 ∨ 𝑧 ∈ 𝑦};

(ii) 𝑥 ∩ 𝑦 = ⋂{𝑥, 𝑦} = {𝑧|𝑧 ∈ 𝑥 ∧ 𝑧 ∈ 𝑦}.

Demonstração.

A validade de todos os itens decorre diretamente do teorema anterior, da

Definição 2.6 e Definição 2.10. Q.E.D.

No mesmo sentido da Proposição 2.3 temos o seguinte resultado.

Proposição 2.4. Sejam 𝑥 e 𝑦 conjuntos quaisquer. Então:

(i) (∀𝑧)(𝑧 ∈ 𝑥 ∪ 𝑦⟺ 𝑧 ∈ 𝑥 ∨ 𝑧 ∈ 𝑦);

(ii) (∀𝑧)(𝑧 ∈ 𝑥 ∩ 𝑦⟺ 𝑧 ∈ 𝑥 ∧ 𝑧 ∈ 𝑦).

Demonstração.

Análoga à demonstração da Proposição 2.3 (iv). Q.E.D.

Provamos a seguir uma série de propriedades dos conjuntos definidos até aqui,

todas decorrentes do Teorema 2.9 e das definições por abstração adotadas.

Proposição 2.5. Sejam 𝑥, 𝑦 e 𝑧 conjuntos quaisquer. As seguintes igualdades são

verdadeiras:

(i) 𝑥 ∪ 𝑥 = 𝑥 (Idempotência da união);

(ii) 𝑥 ∩ 𝑥 = 𝑥 (Idempotência da interseção);

(iii) {𝑥, 𝑦} = {𝑦, 𝑥};

(iv) 𝑥 ∪ 𝑦 = 𝑦 ∪ 𝑥 (Comutatividade da união);

(v) 𝑥 ∩ 𝑦 = 𝑦 ∩ 𝑥 (Comutatividade da interseção);

53

(vi) (𝑥 ∪ 𝑦) ∪ 𝑧 = 𝑥 ∪ (𝑦 ∪ 𝑧) (Associatividade da união);

(vii) (𝑥 ∩ 𝑦) ∩ 𝑧 = 𝑥 ∩ (𝑦 ∩ 𝑧) (Associatividade da interseção);

(viii) 𝑥 ∪ ∅ = 𝑥;

(ix) 𝑥 ∩ ∅ = ∅;

(x) 𝑥 ∖ ∅ = 𝑥;

(xi) 𝑥 ∖ 𝑥 = ∅;

(xii) {𝑣|𝑣 ≠ 𝑣} = ∅.

Demonstração.

Pelo Teorema 2.9 e pelas equivalências lógicas listadas abaixo, as igualdades

indicadas entre parênteses seguem de imediato.

(i) 𝑤 ∈ 𝑥 ∨ 𝑤 ∈ 𝑥 ⟺ 𝑤 ∈ 𝑥;

(ii) 𝑤 ∈ 𝑥 ∧ 𝑤 ∈ 𝑥 ⟺ 𝑤 ∈ 𝑥;

(iii) 𝑤 = 𝑥 ∨ 𝑤 = 𝑦⟺ 𝑤 = 𝑦 ∨ 𝑤 = 𝑥;

(iv) 𝑤 ∈ 𝑥 ∨ 𝑤 ∈ 𝑦⟺ 𝑤 ∈ 𝑦 ∨ 𝑤 ∈ 𝑥;

(v) 𝑤 ∈ 𝑥 ∧ 𝑤 ∈ 𝑦⟺ 𝑤 ∈ 𝑦 ∧ 𝑤 ∈ 𝑥;

(viii) 𝑤 ∈ 𝑥 ∨ 𝑤 ∈ ∅⟺ 𝑤 ∈ 𝑥;

(ix) 𝑤 ∈ 𝑥 ∧ 𝑤 ∈ ∅⟺ 𝑤 ∈ ∅;

(x) 𝑤 ∈ 𝑥 ∧ 𝑤 ∉ ∅⟺ 𝑤 ∈ 𝑥;

(xi) 𝑤 ∈ 𝑥 ∧ 𝑤 ∉ 𝑥 ⟺ 𝑤 ∈ ∅.

A validade de (vi) e (vii) decorre dos itens (i) e (ii) da Proposição 2.4, da

associatividade da disjunção e da conjunção lógica, bem como pela transitividade da

equivalência aliada ao Axioma da Extensão.

Finalmente, provemos (xii). Claramente “𝑥 ≠ 𝑥 ⟹ 𝑥 ∈ ∅” é uma implicação

verdadeira. Logo, {𝑥|𝑥 ≠ 𝑥} existe. Pelo Teorema 2.8, inferimos que 𝑦 ∈ {𝑥|𝑥 ≠ 𝑥} se, e

somente se, 𝑦 ≠ 𝑦. Portanto, não existe 𝑦 tal que 𝑦 ∈ {𝑥|𝑥 ≠ 𝑥} e assim, devido à Definição

2.3, concluímos que {𝑥|𝑥 ≠ 𝑥} = ∅. Q.E.D.

Na próxima proposição, citamos alguns resultados propostos por Suppes (1972, p.

29) sobre a diferença entre conjuntos10, mas não os provamos, haja vista que não influenciam

10 Ver também Hrbacek & Jech (1999, p. 15) e Kuratowski & Mostowski (1976, p. 11-12) para outras propriedades da diferença entre conjuntos.

54

diretamente o desenvolvimento do trabalho. Além disso, suas demonstrações não diferem em

aspectos significativos se comparadas com as provas dos teoremas anteriores.

Proposição 2.6. Sejam 𝑥 e 𝑦 conjuntos quaisquer. As seguintes igualdades são

verdadeiras:

(i) 𝑥 ∖ (𝑥 ∩ 𝑦) = 𝑥 ∖ 𝑦;

(ii) 𝑥 ∩ (𝑥 ∖ 𝑦) = 𝑥 ∖ 𝑦;

(iii) (𝑥 ∩ 𝑦) ∖ 𝑦 = ∅;

(iv) (𝑥 ∖ 𝑦) ∩ 𝑦 = ∅.

Teorema 2.16. (∀𝑥)¬(∃𝑦)(∀𝑧)(𝑧 ∈ 𝑦 ⟺ 𝑧 ∉ 𝑥).

Demonstração.

Seja 𝑥 um conjunto qualquer. Suponha, por absurdo, que exista 𝑦 tal que

[†] (∀𝑧)(𝑧 ∈ 𝑦⟺ 𝑧 ∉ 𝑥).

Obviamente, [†] equivale a

[††] (∀𝑧)(𝑧 ∈ 𝑥 ⟺ 𝑧 ∉ 𝑦).

Tomando então 𝑣 = 𝑥 ∪ 𝑦, obtemos de [†], [††] e do item (i) da Proposição 2.4

que

(∀𝑧)(𝑧 ∈ 𝑥 ∨ 𝑧 ∉ 𝑥) ⟺ (∀𝑧)(𝑧 ∈ 𝑥 ∨ 𝑧 ∈ 𝑦) ⟺ (∀𝑧)(𝑧 ∈ 𝑣),

o que contraria o Teorema 2.1. Absurdo. Q.E.D.

O teorema acima exclui em ZFC a existência de um conjunto complementar

universal, da forma 𝒱 = {𝑥|𝑥 ∉ 𝐴}, para qualquer conjunto 𝐴. O argumento utilizado para a

demonstração foi adaptado de FRAENKEL, BAR-HILLEL & LEVY (1973, p. 41).

Os próximos resultados referem-se à inclusão e à inclusão própria dos conjuntos

definidos até aqui. Baseamo-nos principalmente em Hrbacek & Jech (1999) e Suppes (1972),

nos quais as demonstrações omitidas abaixo podem ser encontradas.

Proposição 2.7. Sejam 𝑤, 𝑥, 𝑦, e 𝑧 conjuntos arbitrários. As inclusões abaixo são

verdadeiras:

(i) ∅ ⊆ 𝑥;

(ii) ∅ ∈ ℘(𝑥);

55

(iii) 𝑥 ⊆ 𝑥 (Reflexividade da inclusão);

(iv) 𝑥 ∈ ℘(𝑥);

(v) 𝑥 ⊆ ∅⟺ 𝑥 = ∅;

(vi) 𝑥 ⊆ 𝑦 ∧ 𝑦 ⊆ 𝑧 ⟹ 𝑥 ⊆ 𝑧 (Transitividade da inclusão);

(vii) 𝑥 ⊂ 𝑦⟹ 𝑥 ⊆ 𝑦;

(viii) ¬(𝑥 ⊂ 𝑥) (Irreflexividade da inclusão própria);

(ix) 𝑥 ⊂ 𝑦⟹ ¬(𝑦 ⊂ 𝑥) (Assimetria da inclusão própria);

(x) 𝑥 ⊂ 𝑦 ∧ 𝑦 ⊂ 𝑧 ⟹ 𝑥 ⊂ 𝑧 (Transitividade da inclusão própria);

(xi) 𝑥 ∩ 𝑦 ⊆ 𝑥;

(xii) 𝑥 ∩ 𝑦 ⊆ 𝑦;

(xiii) 𝑥 ⊆ 𝑥 ∪ 𝑦;

(xiv) 𝑦 ⊆ 𝑥 ∪ 𝑦;

(xv) 𝑥 ∩ 𝑦 ⊆ 𝑥 ∪ 𝑦;

(xvi) 𝑥 ∩ 𝑦 = 𝑥 ⟺ 𝑥 ⊆ 𝑦;

(xvii) 𝑥 ∪ 𝑦 = 𝑦 ⟺ 𝑥 ⊆ 𝑦;

(xviii) 𝑥 ⊆ 𝑧 ∧ 𝑦 ⊆ 𝑤 ⟹ 𝑥 ∪ 𝑦 ⊆ 𝑧 ∪𝑤;

(xix) 𝑥 ∈ 𝑦⟺ {𝑥} ⊆ 𝑦 ⟺ {𝑥} ∈ ℘(𝑦);

(xx) 𝑥 ∈ 𝑧 ∧ 𝑦 ∈ 𝑤 ⟹ {𝑥, 𝑦} ⊆ 𝑧 ∪𝑤.

(xxi) 𝑥 ⊆ 𝑦⟺ ℘(𝑥) ⊆ ℘(𝑦);

(xxii) ℘(𝑥) ∪ ℘(𝑦) ⊆ ℘(𝑥 ∪ 𝑦);

(xxiii) 𝑦 ∈ 𝑥 ⟹ ⋂𝑥 ⊆ 𝑦;

(xxiv) 𝑦 ∈ 𝑥 ⟹ 𝑦 ⊆ ⋃𝑥;

(xxv) (𝑦 ∈ 𝑥 ∧ 𝑦 ⊆ 𝑧) ⟹ ⋂𝑥 ⊆ 𝑧;

(xxvi) 𝑥 ≠ ∅⟹ ⋂𝑥 ⊆ ⋃𝑥.

Demonstração.

Provamos apenas os itens (v), (vi), (xviii), (xix) (xx) e (xxvi). Os demais são

imediatos. Abaixo, 𝑢 denota um conjunto qualquer.

(v) Seja 𝑥 ⊆ ∅ e suponha que exista 𝑢 ∈ 𝑥. Da Definição 2.7, segue que 𝑢 ∈

∅, absurdo. Assim, não existe 𝑢 pertencente a 𝑥. Logo, 𝑥 = ∅. A recíproca segue da

afirmação (iii) desta proposição.

56

(vi) Seja 𝑢 ∈ 𝑥 qualquer. Como 𝑥 ⊆ 𝑦, inferimos da Definição 2.7 que 𝑢 ∈ 𝑦,

daí, como 𝑦 ⊆ 𝑧, da definição de inclusão obtemos 𝑢 ∈ 𝑧. Assim, 𝑢 ∈ 𝑥 ⟹ 𝑢 ∈ 𝑧 e, portanto,

𝑥 ⊆ 𝑧.

(xviii) Tome 𝑢 ∈ 𝑥 ∪ 𝑦. Então 𝑢 ∈ 𝑥 ou 𝑢 ∈ 𝑦. Se 𝑢 ∈ 𝑥, temos da hipótese que

𝑢 ∈ 𝑧, se 𝑢 ∈ 𝑦 então a hipótese nos dá 𝑢 ∈ 𝑤. Logo, 𝑢 ∈ 𝑥 ∪ 𝑦⟹ 𝑢 ∈ 𝑧 ∪𝑤 e, portanto,

𝑥 ∪ 𝑦 ⊆ 𝑧 ∪𝑤.

(xix) Suponha que 𝑥 ∈ 𝑦 e tome 𝑢 ∈ {𝑥}. Segue da Proposição 2.3 (ii) que

𝑢 ∈ {𝑥} se, e só se 𝑢 = 𝑥, e daí 𝑢 ∈ 𝑦. Assim, 𝑢 ∈ {𝑥} ⟹𝑢 ∈ 𝑦, ou seja, {𝑥} ⊆ 𝑦. Se

{𝑥} ⊆ 𝑦, todo membro de {𝑥} deve pertencer a 𝑦; como 𝑥 é membro de {𝑥}, concluímos que

𝑥 ∈ 𝑦. Decorre da Proposição 2.3 (v) que {𝑥} ⊆ 𝑦⟺ {𝑥} ∈ ℘(𝑦). Mostramos assim que

𝑥 ∈ 𝑦 ⟺ {𝑥} ⊆ 𝑦 e {𝑥} ⊆ 𝑦⟺ {𝑥} ∈ ℘(𝑦), donde obtemos a equivalência proposta pela

transitividade desta relação lógica.

(xxvi) Como 𝑥 ≠ ∅, existe 𝑡 ∈ 𝑥, donde faz sentido considerar ⋂𝑥. Se ⋂𝑥 = ∅,

então não há o que provar. Se existe 𝑢 ∈ ⋂𝑥, então da Proposição 2.3 (vi) inferimos que

𝑢 ∈ 𝑣 , para todo 𝑣 ∈ 𝑥, em particular 𝑢 ∈ 𝑡 e 𝑡 ∈ 𝑥 , logo 𝑢 ∈ ⋃𝑥 . Portanto, ⋂𝑥 ⊆ ⋃𝑥 .

Q.E.D.

Observação: A inclusão contrária em (xxii) é verdadeira se, e somente se, 𝑥 ⊆ 𝑦

ou 𝑦 ⊆ 𝑥. De fato, se ℘(𝑥 ∪ 𝑦) ⊆ ℘(𝑥) ∪℘(𝑦), então 𝑧 ⊆ 𝑥 ∪ 𝑦 implica em 𝑧 ⊆ 𝑥 ∨ 𝑧 ⊆ 𝑦;

daí, como 𝑥 ∪ 𝑦 ⊆ 𝑥 ∪ 𝑦, segue que 𝑥 ∪ 𝑦 ⊆ 𝑥 ou 𝑥 ∪ 𝑦 ⊆ 𝑦, donde obtemos 𝑥 ⊆ 𝑦 ou 𝑦 ⊆

𝑥. A recíproca é imediata.

Como contraexemplo, podemos considerar 𝑥 = {1, 2} e 𝑦 = {3}. Notemos

primeiramente que 𝑥 ⊄ 𝑦 e 𝑦 ⊄ 𝑥. Por um lado, temos ℘(𝑥) = �∅, {1}, {2}, {1, 2}�, ℘(𝑦) =

�∅, {3}� e 𝑥 ∪ 𝑦 = {1, 2, 3}. Por outro lado, ℘(𝑥) ∪℘(𝑦) = �∅, {1}, {2}, {3}, {1, 2}�,

enquanto ℘(𝑥 ∪ 𝑦) = �∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}�.

Proposição 2.8.

(i) ℘(∅) = {∅};

(ii) ℘({∅}) = �∅, {∅}�;

(iii) ⋃{𝑥} = ⋂{𝑥} = 𝑥;

(iv) ∅ ∈ 𝑥 ⟹ ⋂𝑥 = ∅.

Demonstração.

Pelos resultados já obtidos, inferimos:

57

(i) 𝑦 ∈ ℘(∅) ⟺𝑦 ⊆ ∅⟺ 𝑦 = ∅ ⟺ 𝑦 ∈ {∅}, a igualdade provém de (A1).

(ii) É claro que 𝑦 ∈ ℘({∅}) ⟺ 𝑦 ⊆ {∅}; os únicos casos possíveis são 𝑦 = ∅

e 𝑦 = {∅}. Portanto 𝑦 ∈ ℘({∅}) ⟺𝑦 = ∅ ∨ 𝑦 = {∅} ⟺ 𝑦 ∈ �∅, {∅}�, donde se conclui por

(A1) que ℘({∅}) = �∅, {∅}�;

(iii) 𝑥 = 𝑥 ∩ 𝑥 = ⋂{𝑥, 𝑥} = ⋂{𝑥} e 𝑥 = 𝑥 ∪ 𝑥 = ⋃{𝑥, 𝑥} = ⋃{𝑥}.

(iv) Suponha por absurdo que exista 𝑦 ∈ ⋂𝑥, então para qualquer 𝑢 ∈ 𝑥 tem-se

𝑦 ∈ 𝑢, mas ∅ ∈ 𝑥, o que contraria a Definição 2.3, logo (∀𝑦)(𝑦 ∉ ⋂𝑥), ou seja, ⋂𝑥 = ∅.

Q.E.D.

Tratamos brevemente sobre as relações de distributividade entre a interseção, a

união e a diferença entre conjuntos no capítulo seguinte. Fazemos isso, pois, munidos do

conceito de função podemos interpretar conjuntos como contradomínios indexados, o que nos

fornece uma notação mais conveniente e intuitiva para ⋃𝑥 e ⋂𝑥 e, consequentemente, permite

dar mais sentido a tais leis. Por ora, discutimos o produto externo do conjunto 𝑥.

Para um conjunto arbitrário 𝑡, podemos definir o subconjunto 𝑇𝔓 de ℘(⋃𝑡) cujos

membros são todos os conjuntos que contém exatamente um único elemento de cada membro

de 𝑡. Em outras palavras, 𝑇𝔓 é constituído de todos os subconjuntos 𝑧 de ⋃𝑡 tais que para

qualquer 𝑣 ∈ 𝑡 tenha-se necessariamente 𝑣 ∩ 𝑧 um conjunto unitário. Fraenkel, Bar-Hillel &

Levy (1973, p. 40) definem tal conjunto por

𝑇𝔓 = {𝑧 ∈ ℘(⋃𝑡)|𝔓(𝑧)}, 𝔓(𝑧) ≡ (∀𝑣)�𝑣 ∈ 𝑡 ⟹ (∃𝑢)(𝑣 ∩ 𝑧 = {𝑢})�;

quando 𝑡 é uma família disjunta, 𝑇𝔓 é indicado por ∏𝑡 e denominado pelos autores de produto

externo (outer product).

Observemos que se 𝑧 ⊆ ⋃𝑡, então todo membro de 𝑧 é necessariamente membro

de algum membro de 𝑡. Assim, a condição 𝔓(𝑧) pode ser interpretada como “escolher

exatamente um elemento em cada membro de 𝑡”, o que justifica denominar os membros de

∏𝑡 como conjuntos seleção de 𝑡. Todavia, apesar de (A2) nos permitir separar os elementos

de ℘(⋃𝑡) que satisfazem 𝔓(𝑧), sem assumir (A8) não é possível de modo geral coletar os

elementos de ⋃𝑡 num subconjunto 𝑐 tal que 𝔓(𝑐), pois podem existir vários conjuntos 𝑐 com

tal propriedade. De fato,

[…] suponha que 𝑐 ⊆ ⋃𝑡 seja do tipo desejado [tal que 𝔓(𝑐) ] e tome 𝑦 ∈ 𝑐 de algum 𝑢 ∈ 𝑡; então, substituindo 𝑦 por um elemento diferente 𝑦′ do mesmo conjunto 𝑢 ∈ 𝑡 obtemos um novo subconjunto 𝑐′ ⊆ ⋃𝑡, diferente de 𝑐 , embora também

58

possua a propriedade desejada [isto é, 𝔓(𝑐′)]. Então, ao contrário dos subconjuntos determinados pelo Axioma dos Subconjuntos [Axioma da Separação], os subconjuntos de ⋃𝑡 para nosso propósito não são unicamente determinados. (FRAENKEL, BAR-HILLEL, & LEVY, 1973, p. 54, tradução nossa, grifo nosso).

Frisamos que a unicidade da determinação à qual os autores se referem acima diz

respeito ao próprio subconjunto e não aos seus elementos. Com efeito, num conjunto da forma

{𝑥|𝜓(𝑥)} podem existir diversos elementos que satisfaçam 𝜓, isto não é errado; no entanto, 𝜓

determina no máximo um único conjunto.

No próximo teorema, provamos que em ZFC, se 𝑡 for uma família disjunta, vale a

equivalência ∅ ∉ 𝑡 se, e somente se, ∏𝑡 ≠ ∅.

Teorema 2.17. Seja 𝑡 uma família disjunta não vazia. Então ∅ ∉ 𝑡 ⟺ ∏𝑡 ≠ ∅.

Demonstração.

Suponha que ∅ ∈ 𝑡. Se existisse algum elemento 𝑧 ∈ ∏𝑡, para todo elemento 𝑠 de

𝑡, 𝑠 ∩ 𝑧 deveria ser um conjunto unitário, mas ∅ ∈ 𝑡 e assim 𝑧 ∩ ∅ deveria ser um conjunto

não vazio, absurdo. Assim ∅ ∈ 𝑡 ⟹ ∏𝑡 = ∅ e, pela contrapositiva, obtemos

[†] ∏𝑡 ≠ ∅ ⟹ ∅ ∉ 𝑡.

Provemos a recíproca. Suponha ∅ ∉ 𝑡. Como 𝑡 é uma família disjunta, segue que

(∀𝑥)�𝑥 ∈ 𝑡 ⟹ ��𝑥 ≠ ∅ ∧ (∀𝑦)(𝑦 ∈ 𝑡 ∧ 𝑦 ≠ 𝑥)� ⟹ 𝑥 ∩ 𝑦 = ∅��,

logo, pelo Axioma da Escolha,

(∃𝑢)(∀𝑤)�𝑤 ∈ 𝑡 ⟹ (∃! 𝑧)(𝑧 ∈ 𝑤 ∩ 𝑢)�.

Basta então tomar 𝑐 = 𝑢 ∩℘(⋃𝑡), claramente 𝑐 ∈ ∏𝑡 e assim ∏𝑡 ≠ ∅. Portanto,

[††] ∅∉ 𝑡 ⟹ ∏𝑡 ≠ ∅.

Segue de [†] e [††] que ∅ ∉ 𝑡 ⟺ ∏𝑡 ≠ ∅. Q.E.D.

Definição 2.19. A igualdade

�𝑤�(∃𝑣1)…(∃𝑣𝑛)�𝑤 = 𝜏(𝑣1,…, 𝑣𝑛) ∧ 𝜑(𝑣1 ,…, 𝑣𝑛)�� = {𝜏(𝑣1,…, 𝑣𝑛)|𝜑(𝑣1,…, 𝑣𝑛)}

é verdadeira se, e somente se, as seguintes condições forem satisfeitas:

(i) 𝑣1,…, 𝑣𝑛 são quaisquer variáveis distintas;

59

(ii) 𝜏(𝑣1,…, 𝑣𝑛) é qualquer termo no qual não ocorrem variáveis ligadas e

exatamente 𝑣1,…, 𝑣𝑛 ocorrem livres;

(iii) 𝑤 não ocorre na fórmula 𝜑;

(iv) (∃𝑏)(∀𝑤)�(∃𝑣1)…(∃𝑣𝑛)�𝑤 = 𝜏(𝑣1,…, 𝑣𝑛) ∧ 𝜑(𝑣1,…, 𝑣𝑛)�⟹ 𝑤 ∈ 𝑏�.

A definição acima, adaptada de Suppes (1972), se destina a formalizar notações

mais simples, como ℙ = {2𝑛|𝑛 ∈ ℕ}, por exemplo, o conjunto dos números naturais pares.

Caso não adotássemos tal definição, deveríamos escrever ℙ = {𝑛|(∃𝑚)(𝑚 ∈ ℕ)∧ 𝑛 = 2𝑚},

um excesso de notação que não traz benefício à teoria.

Ressaltamos que a condição (iv) da Definição 2.19 exige que a sentença

(∃𝑣1)…(∃𝑣𝑛)�𝑤 = 𝜏(𝑣1,…, 𝑣𝑛) ∧ 𝜑(𝑣1,…, 𝑣𝑛)� defina um conjunto, nas condições do

Teorema 2.7. Tal notação é de grande valia para definir, por exemplo, o produto cartesiano de

dois conjuntos, o que fazemos a seguir.

Vimos na Proposição 2.5 (iii) que, para quaisquer conjuntos 𝑥 e 𝑦, {𝑥, 𝑦} =

{𝑦, 𝑥}. Tal propriedade é na verdade ainda mais forte, pois, se {𝑥, 𝑦} = {𝑎, 𝑏}, então 𝑥 = 𝑎 e

𝑦 = 𝑏 ou 𝑥 = 𝑏 e 𝑦 = 𝑎. Ou seja, a ordem em que se dispõe os conjuntos 𝑥 e 𝑦 em {𝑥, 𝑦} é

irrelevante; deve-se à tal característica a nomenclatura dada ao conjunto {𝑥, 𝑦}. Provamos tal

propriedade dos pares não ordenados a seguir.

Teorema 2.18. Sejam os conjuntos 𝑎, 𝑏, 𝑥 e 𝑦 arbitrários. Se {𝑥, 𝑦} = {𝑎, 𝑏},

então 𝑥 = 𝑎 e 𝑦 = 𝑏 ou 𝑥 = 𝑏 e 𝑦 = 𝑎.

Demonstração.

Já vimos que 𝑥 ∈ {𝑥, 𝑦} e 𝑦 ∈ {𝑥, 𝑦}. Como {𝑥, 𝑦} = {𝑎, 𝑏} inferimos que

[†] 𝑥 ∈ {𝑎, 𝑏} ⟺ 𝑥 = 𝑎 ∨𝑥 = 𝑏;

[††] 𝑦 ∈ {𝑎, 𝑏} ⟺𝑦 = 𝑎 ∨ 𝑦 = 𝑏.

Temos dois casos a considerar.

Se 𝑥 = 𝑦, [†] e [††] implicam respectivamente que 𝑥 = 𝑎 ou 𝑥 = 𝑏 e 𝑦 = 𝑎 ou

𝑦 = 𝑏. Mas 𝑥 = 𝑦, então 𝑥 = 𝑎 = 𝑏 = 𝑦, o que satisfaz ambas as igualdades propostas pelo

teorema.

Se 𝑥 ≠ 𝑦, então por [†], 𝑥 = 𝑎 ou 𝑥 = 𝑏. Se 𝑥 = 𝑎, então por [††] inferimos que

𝑦 = 𝑏 e 𝑦 ≠ 𝑎, pois se 𝑦 = 𝑎 então 𝑦 = 𝑎 = 𝑥, o que contraria a hipótese de que 𝑥 ≠ 𝑦.

Obtemos assim que 𝑥 = 𝑎 ∧ 𝑦 = 𝑏. Se 𝑥 = 𝑏, então por [††] deduzimos que 𝑦 = 𝑎 e 𝑦 ≠ 𝑏,

pois se 𝑦 = 𝑏 então 𝑦 = 𝑏 = 𝑥, absurdo. Logo, 𝑥 = 𝑏 ∧ 𝑦 = 𝑎. Q.E.D.

60

Corolário 2.3. (∀𝑥)(∀𝑦)({𝑥} = {𝑦} ⟹ 𝑥 = 𝑦).

Demonstração.

Decorre imediatamente do Teorema 2.18. Q.E.D.

A pergunta natural então é se existe algum conjunto da forma [𝑥, 𝑦] tal que

[𝑥, 𝑦] = [𝑎, 𝑏] se, e somente se, 𝑥 = 𝑎 e 𝑦 = 𝑏, isto é, no qual a ordem dos elementos

dispostos entre [ , ] seja relevante. A resposta é afirmativa.

Definição 2.20. ⟨𝑥, 𝑦⟩= �{𝑥}, {𝑥, 𝑦}�11.

Teorema 2.19. (∀𝑥)(∀𝑦)(∀𝑣)(∀𝑤)�⟨𝑥, 𝑦⟩= ⟨𝑣, 𝑤⟩ ⟹ (𝑥 = 𝑣 ∧ 𝑦 = 𝑤)�.

Demonstração.

Pela Definição 2.20, ⟨𝑥, 𝑦⟩ = ⟨𝑣, 𝑤⟩ equivale a �{𝑥}, {𝑥, 𝑦}� = �{𝑣}, {𝑣, 𝑤}� e

então, pelo Teorema 2.18 segue que:

[†] ({𝑥} = {𝑣} ∧ {𝑥, 𝑦} = {𝑣, 𝑤}) ∨ ({𝑥} = {𝑣, 𝑤}∧ {𝑥, 𝑦} = {𝑣}).

Há então dois casos a considerar em [†].

Se {𝑥} = {𝑣} e {𝑥, 𝑦} = {𝑣, 𝑤}, segue da primeira igualdade e do Corolário 2.3

que 𝑥 = 𝑣 e, da segunda igualdade, inferimos novamente do Teorema 2.18 que

(𝑥 = 𝑣 ∧ 𝑦 = 𝑤) ∨ (𝑥 = 𝑤 ∧ 𝑦 = 𝑣),

mas, como já obtivemos 𝑥 = 𝑣 , concluímos que 𝑥 = 𝑣 ∧ 𝑦 = 𝑤, como queríamos.

Se {𝑥} = {𝑣, 𝑤} e {𝑥, 𝑦} = {𝑣}, decorre que {𝑥, 𝑥} = {𝑣, 𝑤} e {𝑥, 𝑦} = {𝑣, 𝑣},

donde, obtemos

(𝑥 = 𝑣 ∧ 𝑥 = 𝑤) ∧ (𝑣 = 𝑥 ∧ 𝑣 = 𝑦),

ou seja, 𝑥 = 𝑣 = 𝑦 = 𝑤, em particular 𝑥 = 𝑣 e 𝑦 = 𝑤. Q.E.D.

O conjunto ⟨𝑥, 𝑦⟩ definido acima é chamado de par ordenado de 𝑥 e 𝑦, onde 𝑥 é a

primeira coordenada e 𝑦 é a segunda coordenada do par. É comum na literatura matemática

encontrá-lo escrito como (𝑥, 𝑦) em vez de ⟨𝑥, 𝑦⟩. A notação que adotamos de Suppes mostra-

11 Esta definição, elaborada por Kazimierz Kuratowski em 1921, foi historicamente importante para a teoria axiomática dos conjuntos por permitir tratar de relações e funções 𝑛-árias como conjuntos e, por conseguinte, ampliar o “alcance” da Teoria dos Conjuntos na Matemática. (FERREIRÓS, 2007).

61

se interessante por evitar equívocos com os símbolos de pontuação do alfabeto de nossa

linguagem objeto. De qualquer forma, o que importa no par ordenado é a propriedade que ele

possui e não a forma como o transcrevemos.

Sendo ⟨𝑥, 𝑦⟩ um par ordenado, podemos pensar num conjunto de pares ordenados

que possuam a primeira e segunda coordenadas pertencentes respectivamente a conjuntos 𝐴 e

𝐵, previamente dados. É exatamente isso o que se faz ao definir o produto cartesiano dos

conjuntos 𝐴 e 𝐵. A fim de embasar tal definição, provamos o teorema seguinte.

Lema 2.1. (∀𝑥)(∀𝑦)({𝑥} ∪ {𝑦} = {𝑥, 𝑦}).

Demonstração.

De fato, para 𝑢 qualquer, 𝑢 ∈ {𝑥, 𝑦} se, e somente se, 𝑢 = 𝑥 ou 𝑢 = 𝑦. Contudo,

𝑢 = 𝑥 ou 𝑢 = 𝑦 se, e somente se, 𝑢 ∈ {𝑥} ou 𝑢 ∈ {𝑦}, o que por sua vez equivale a afirmar

que 𝑢 ∈ {𝑥}∪ {𝑦}. Q.E.D.

Teorema 2.20.

(∃𝑋)(∀𝐴)(∀𝐵)(∀𝑥)�(∃𝑎)(∃𝑏)(𝑥 = ⟨𝑎, 𝑏⟩ ∧ 𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵) ⟹ 𝑥 ∈ 𝑋�.

Demonstração.

Suponha que existam 𝑎 ∈ 𝐴 e 𝑏 ∈ 𝐵 tais que 𝑥 = ⟨𝑎, 𝑏⟩. Vamos provar que

𝑥 ∈ ℘�℘(𝐴∪ 𝐵)�, donde o resultado seguirá pelo Teorema 2.7.

Por definição, ⟨𝑎, 𝑏⟩ = �{𝑎}, {𝑎, 𝑏}�. Pelos resultados obtidos até aqui, temos

𝑎 ∈ 𝐴 ⟹ {𝑎} ⊆ 𝐴⟹ {𝑎} ⊆ 𝐴 ∪𝐵 ⟹ {𝑎} ∈ ℘(𝐴 ∪𝐵) ⟹

⟹ �{𝑎}� ⊆ ℘(𝐴∪ 𝐵).

Por outro lado, pela Proposição 2.7 (xx),

𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵 ⟹ {𝑎, 𝑏} ⊆ 𝐴∪ 𝐵 ⟹ {𝑎, 𝑏} ∈ ℘(𝐴 ∪𝐵) ⟹

⟹ �{𝑎, 𝑏}� ⊆ ℘(𝐴 ∪𝐵).

Decorre da Proposição 2.7 (xviii) que �{𝑎}� ∪ �{𝑎, 𝑏}� ⊆ ℘(𝐴 ∪𝐵), o que

equivale a afirmar que �{𝑎}� ∪ �{𝑎, 𝑏}� ∈ ℘�℘(𝐴 ∪𝐵)�.

Enfim, pelo lema anterior, �{𝑎}� ∪ �{𝑎, 𝑏}� = �{𝑎}, {𝑎, 𝑏}�. Como ⟨𝑎, 𝑏⟩ =

�{𝑎}, {𝑎, 𝑏}� e ⟨𝑎, 𝑏⟩ = 𝑥, concluímos que 𝑥 ∈ ℘(℘(𝐴∪ 𝐵). Q.E.D.

Definição 2.21. 𝐴 × 𝐵 = {⟨𝑥, 𝑦⟩|𝑥 ∈ 𝐴∧ 𝑦 ∈ 𝐵}.

62

Temos assim o produto cartesiano de 𝐴 por 𝐵, cujos elementos são todos os pares

ordenados ⟨𝑥, 𝑦⟩ com 𝑥 ∈ 𝐴 e 𝑦 ∈ 𝐵. Vale frisar que Kunen (1980) obtém o conjunto 𝐴 × 𝐵

por meio de um método diferente, utilizando o Axioma do Par e o Axioma da Substituição em

vez do Axioma das Partes.

Os próximos resultados apenas formalizam suas propriedades imediatas;

demonstrações podem ser encontradas em Suppes (1972).

Proposição 2.9. Sejam 𝐴, 𝐵 e 𝐶 conjuntos quaisquer. As seguintes igualdades são

verdadeiras:

(i) (∀𝑥)�𝑥 ∈ 𝐴 × 𝐵 ⟺ (∃𝑎)(∃𝑏)(𝑥 = ⟨𝑎, 𝑏⟩ ∧ 𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵)�;

(ii) (∀𝑎)(∀𝑏)(⟨𝑎, 𝑏⟩ ∈ 𝐴 × 𝐵 ⟺ 𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵);

(iii) 𝐴 × 𝐵 = ∅ ⟺ 𝐴 = ∅ ∨ 𝐵 = ∅;

(iv) 𝐴 × 𝐵 = 𝐵 × 𝐴 ⟺ 𝐴 = ∅ ∨ 𝐵 = ∅ ∨ 𝐴 = 𝐵;

(v) 𝐴 ≠ ∅ ∧ 𝐴× 𝐵 ⊆ 𝐴 × 𝐶 ⟹ 𝐵 ⊆ 𝐶.

Com o par ordenado, podemos também definir “trios” (ou ternas) e “quartetos”

ordenados, fazendo ⟨𝑥, 𝑦, 𝑧⟩ = ⟨⟨𝑥, 𝑦⟩, 𝑧⟩ e ⟨𝑥, 𝑦, 𝑧, 𝑡⟩ = ⟨⟨𝑥, 𝑦, 𝑧⟩, 𝑡⟩ respectivamente, e daí

definirmos 𝐴 × 𝐵 × 𝐶 = (𝐴× 𝐵) × 𝐶 e 𝐴× 𝐵 × 𝐶 × 𝐷 = (𝐴 × 𝐵 × 𝐶) × 𝐷. No quarto

capítulo, com o advento dos números naturais, definimos 𝑛-úplas e produtos cartesianos de 𝑛

termos, para 𝑛 ∈ ℕ qualquer.

63

Capítulo 3 — Relações e Funções

Intuitivamente uma relação binária é qualquer coisa que de certa forma conecta

dois objetos e, de maneira geral, uma relação 𝑛-ária é algo que conecta 𝑛 elementos. Ao

formalizar tal conceito matematicamente, o significado da ligação entre os objetos fica de

certa forma em segundo plano, de tal maneira que restringimos nosso interesse na ordem que

eles assumem na relação. Neste capítulo, estudamos as propriedades básicas das relações em

ZFC. No que segue, baseamo-nos principalmente em Hrbacek & Jech (1999).

3.1. Relações

Por importarmo-nos com a ordem assumida pelos elementos numa relação,

definimos relação binária como sendo um conjunto cujos elementos são pares ordenados; uma

relação ternária é um conjunto constituído por ternas ordenadas e assim sucessivamente. No

entanto, como 𝑛-úplas ordenadas podem ser consideradas pares ordenados, as relações 𝑛-árias

são, sob certo sentido, relações binárias. De tal observação, segue a próxima definição.

Definição 3.1. 𝑅 é uma relação ⟺ (∀𝑎)�𝑎 ∈ 𝑅 ⟹ (∃𝑥)(∃𝑦)(𝑎 = ⟨𝑥, 𝑦⟩)�.

Assim, o conjunto 𝐴 = {⟨1, 2⟩, ⟨⋆ , ∎⟩, ⟨∅, {∅}⟩} é uma relação, pois todos os seus

elementos são pares ordenados. Também podemos considerar ingenuamente como relação o

“conjunto” 𝒫 = {⟨𝑥, 𝑦⟩|𝑥 é pai de 𝑦}. Adotamos letras maiúsculas para representar relações

com o intuito de distingui-las das coordenadas de seus pares ordenados. Definimos a seguir

uma notação conveniente para nos referirmos a elementos pertencentes a uma relação 𝑅.

Definição 3.2. Sejam 𝑅 uma relação e 𝑥, 𝑦 conjuntos quaisquer. Se ⟨𝑥, 𝑦⟩ ∈ 𝑅

dizemos que 𝑥 está em relação 𝑅 com 𝑦, ou ainda que 𝑦 é imagem de 𝑥 na relação 𝑅, e

indicamos por 𝑥𝑅𝑦.

Obviamente, o conjunto vazio é uma relação (por vacuidade). Da Definição 3.1, é

imediato que qualquer subconjunto de uma relação é também uma relação, bem como para

duas relações quaisquer, a interseção, a reunião e a diferença entre elas são também relações,

64

haja vista seus membros serem todos pares ordenados. Formalizamos tais observações na

próxima proposição; suas demonstrações seguem do que discutimos neste parágrafo.

Proposição 3.1. Sejam 𝑅 e 𝑇 relações quaisquer, então:

(i) Se 𝑆 ⊆ 𝑅, então 𝑆 é uma relação;

(ii) ∅ é uma relação;

(iii) 𝑅 ∩ 𝑇 é uma relação;

(iv) 𝑅 ∪ 𝑇 é uma relação;

(v) 𝑅 ∖ 𝑇 é uma relação.

A seguir, definimos importantes conjuntos para o estudo das relações e funções.

Em todos os casos abaixo, 𝑅 denota uma relação.

Definição 3.3. 𝔇(𝑅) = {𝑥|(∃𝑦)(𝑥𝑅𝑦)}.

Definição 3.4. ℑ(𝑅) = {𝑦|(∃𝑥)(𝑥𝑅𝑦)}.

Definição 3.5. 𝔉(𝑅) = 𝔇(𝑅) ∪ ℑ(𝑅).

Os conjuntos 𝔇(𝑅), ℑ(𝑅) e 𝔉(𝑅) são denominados respectivamente como

domínio de 𝑅, imagem de 𝑅 e campo de 𝑅.

A rigor, apenas definir os conjuntos acima não é suficiente para garantir a

existência deles em ZFC. Devemos provar que as fórmulas que estipulamos para tais

conjuntos satisfazem a condição imposta pelo Teorema 2.7.

Teorema 3.1. Seja 𝑅 uma relação. Então:

(i) (∃𝐴)(∀𝑥)�(∃𝑦)(𝑥𝑅𝑦) ⟹ 𝑥 ∈ 𝐴�;

(ii) 𝑥 ∈ 𝔇(𝑅) ⟺ (∃𝑦)(𝑥𝑅𝑦);

(iii) (∃𝐵)(∀𝑦)�(∃𝑥)(𝑥𝑅𝑦) ⟹𝑦 ∈ 𝐵�;

(iv) 𝑦 ∈ ℑ(𝑅) ⟺ (∃𝑥)(𝑥𝑅𝑦);

(v) 𝔇(𝑅) ≠ ∅ ⟺ ℑ(𝑅) ≠ ∅;

Demonstração.

(i) Suponha que exista 𝑦 tal que 𝑥𝑅𝑦, isto é, tal que ⟨𝑥, 𝑦⟩ ∈ 𝑅. Como

⟨𝑥, 𝑦⟩ = �{𝑥}, {𝑥, 𝑦}�, temos {𝑥} ∈ ⟨𝑥, 𝑦⟩, mas ⟨𝑥, 𝑦⟩ é um membro de 𝑅, logo {𝑥} ∈ ⋃𝑅.

Analogamente, 𝑥 ∈ {𝑥} e {𝑥} é um elemento de ⋃𝑅, donde segue que 𝑥 ∈ ⋃(⋃𝑅). Portanto,

basta tomar 𝐴 = ⋃(⋃𝑅).

65

(ii) Análoga à demonstração da Proposição 2.3 (iv).

(iii) Suponha que exista 𝑥 tal que ⟨𝑥, 𝑦⟩ ∈ 𝑅. Então {𝑥, 𝑦} ∈ ⟨𝑥, 𝑦⟩, mas

⟨𝑥, 𝑦⟩ ∈ 𝑅, donde segue que {𝑥, 𝑦} ∈ ⋃𝑅. Novamente, como 𝑦 ∈ {𝑥, 𝑦} e {𝑥, 𝑦} ∈ ⋃𝑅,

obtemos 𝑦 ∈ ⋃(⋃𝑅). Portanto, 𝐵 = ⋃(⋃𝑅).

(iv) Decorre do Teorema 2.8.

(v) Suponha que exista 𝑥 ∈ 𝔇(𝑅). Pelo item (ii), existe 𝑦 tal que 𝑥𝑅𝑦 e, por

(iv) obtemos 𝑦 ∈ ℑ(𝑅). Reciprocamente, se 𝑦 ∈ ℑ(𝑅), então existe 𝑥 tal que 𝑥𝑅𝑦 donde se

conclui que 𝑥 ∈ 𝔇(𝑅). Q.E.D.

O teorema anterior, além de garantir a existência de 𝔇(𝑅) e ℑ(𝑅) como conjuntos

em ZFC, nos fornece uma importante equivalência: o domínio de uma relação é vazio se, e

somente se, sua imagem é vazia. Assim, não é possível que uma relação tenha domínio vazio

e imagem não vazia e vice versa. Outra consequência do teorema anterior é a seguinte,

utilizada por Kuratowski & Mostowski (1976, p. 64) como definição de relação.

Teorema 3.2. 𝑅 é uma relação se, e somente se, existem conjuntos 𝐴 e 𝐵 tais que

𝑅 ⊆ 𝐴× 𝐵.

Demonstração.

Seja 𝑎 um elemento qualquer de 𝑅. Decorre da definição de relação que existem 𝑥

e 𝑦 tais que 𝑎 = ⟨𝑥, 𝑦⟩. Do teorema anterior, 𝑥 ∈ 𝔇(𝑅) e 𝑦 ∈ ℑ(𝑅). Logo, ⟨𝑥, 𝑦⟩ pertence a

𝔇(𝑅) × ℑ(𝑅), isto é, 𝑎 ∈ 𝔇(𝑅) × ℑ(𝑅). Como 𝑎 é qualquer, provamos que existem 𝐴 =

𝔇(𝑅) e 𝐵 = ℑ(𝑅) tais que 𝑅 ⊆ 𝐴 × 𝐵.

Reciprocamente, sejam os conjuntos 𝐴 e 𝐵 e considere 𝐴 × 𝐵. Se 𝐴 × 𝐵 = ∅

então 𝐴× 𝐵 é uma relação. Se 𝐴 × 𝐵 ≠ ∅, então existe 𝑢 ∈ 𝐴 × 𝐵. Por definição, existem

𝑎 ∈ 𝐴 e 𝑏 ∈ 𝐵 tais que 𝑢 = ⟨𝑎, 𝑏⟩. Então, pela Definição 3.1, obtemos que 𝐴 × 𝐵 é uma

relação. Enfim, devido à Proposição 3.1 (i), concluímos que qualquer subconjunto 𝑅 de 𝐴 × 𝐵

é uma relação. Q.E.D.

No caso em que 𝑅 ⊆ 𝐴 × 𝐵, decorre imediatamente da Definição 3.3 e da

Definição 3.4 que 𝔇(𝑅) ⊆ 𝐴 e ℑ(𝑅) ⊆ 𝐵. Obviamente, como 𝔇(𝑅) e ℑ(𝑅) são conjuntos,

𝔉(𝑅) é um conjunto. Se 𝔉(𝑅) ⊆ 𝑥, diz-se que 𝑅 é uma relação em 𝑥 ou 𝑅 é uma relação

entre elementos de 𝑥.

Sejam 𝑅 e 𝑆 relações quaisquer, 𝐴 ⊆ 𝔇(𝑅) e 𝐵 ⊆ ℑ(𝑅) subconjuntos arbitrários.

Definimos abaixo uma série de importantes conjuntos no estudo das relações.

66

Definição 3.6. 𝑅[𝐴] = {𝑦 ∈ ℑ(𝑅)|(∃𝑥)(𝑥 ∈ 𝐴∧ 𝑥𝑅𝑦)}.

Definição 3.7. 𝑅−1[𝐵] = {𝑥 ∈ 𝔇(𝑅)|(∃𝑦)(𝑦 ∈ 𝐵 ∧ 𝑥𝑅𝑦)}.

Definição 3.8. 𝑅 ↾ 𝐴 = {⟨𝑥, 𝑦⟩ ∈ 𝑅|𝑥 ∈ 𝐴}.

Definição 3.9. 𝑅−1 = {⟨𝑦, 𝑥⟩|𝑥𝑅𝑦}.

Definição 3.10. 𝑅 ∘ 𝑆 = {⟨𝑥, 𝑦⟩|(∃𝑧)(𝑥𝑆𝑧 ∧ 𝑧𝑅𝑦)}.

A Definição 3.6 nos dá o conjunto 𝑅[𝐴], o qual chamamos de imagem direta de 𝐴

em relação à 𝑅, que consiste de todos os membros da ℑ(𝑅) que são imagens dos elementos

de 𝐴. Analogamente, da Definição 3.7 temos 𝑅−1[𝐵], a imagem inversa de 𝐵 em relação à 𝑅,

subconjunto de 𝔇(𝑅) cujos membros estão em relação 𝑅 com os elementos de 𝐵.

De forma semelhante, da Definição 3.8 temos o conjunto 𝑅 ↾ 𝐴 ⊆ 𝑅, a restrição

de 𝑅 ao subconjunto 𝐴, cujos membros são todos os pares ordenados nos quais a primeira

coordenada pertence a 𝐴. Note que 𝑅 ↾ 𝐴 é uma relação, uma vez que 𝑅 ↾ 𝐴 ⊆ 𝑅, bem como

𝑅[𝐴] = ℑ(𝑅 ↾ 𝐴).

A Definição 3.9 estabelece o importante conceito de inversa da relação 𝑅, que

consiste basicamente em trocar a ordem dos pares ordenados da relação 𝑅, obtendo assim uma

nova relação, 𝑅−1. Outro modo de obter novas relações por meio de relações previamente

existentes é fornecido pela Definição 3.10: dadas duas relações 𝑅 e 𝑆, ⟨𝑥, 𝑦⟩ ∈ 𝑅 ∘ 𝑆 (ou

𝑥(𝑅 ∘ 𝑆)𝑦) se, e somente se, existir 𝑧, tal que 𝑥𝑆𝑧 e 𝑧𝑅𝑦 isto é, 𝑧 ∈ ℑ(𝑆) ∩ 𝔇(𝑅).

Obviamente, se ℑ(𝑆) ∩𝔇(𝑅) = ∅ então 𝑅 ∘ 𝑆 = ∅.

No próximo teorema, provamos que 𝑅−1 e 𝑅 ∘ 𝑆 existem em ZFC, no sentido do

Teorema 2.7.

Teorema 3.3. Sejam 𝑅 e 𝑆 relações.

(i) (∃𝐴)(∀𝑎)(∀𝑏)(⟨𝑎, 𝑏⟩ ∈ 𝑅 ⟹ ⟨𝑏, 𝑎⟩ ∈ 𝐴);

(ii) (∃𝐵)(∀𝑎)(∀𝑏)�(∃𝑐)(⟨𝑎, 𝑐⟩ ∈ 𝑆 ∧ ⟨𝑐, 𝑏⟩ ∈ 𝑅) ⟹ ⟨𝑎, 𝑏⟩ ∈ 𝐵�;

(iii) 𝑅−1 e 𝑅 ∘ 𝑆 são relações.

Demonstração.

Pelo Teorema 3.2, se 𝑅 e 𝑆 são relações, então

[†] 𝑅 ⊆ 𝔇(𝑅) × ℑ(𝑅) ∧ 𝑆 ⊆ 𝔇(𝑆) × ℑ(𝑆).

67

Assim, se ⟨𝑎, 𝑏⟩ ∈ 𝑅, temos 𝑎 ∈ 𝔇(𝑅) e 𝑏 ∈ ℑ(𝑅), donde segue pela Proposição

2.9 (ii) que ⟨𝑏, 𝑎⟩ ∈ ℑ(𝑅) × 𝔇(𝑅), o que prova (i).

Analogamente, se existe 𝑐 tal que ⟨𝑎, 𝑐⟩ ∈ 𝑆 e ⟨𝑐, 𝑏⟩ ∈ 𝑅, segue de [†] que

𝑎 ∈ 𝔇(𝑆) e 𝑏 ∈ ℑ(𝑅) e, portanto, ⟨𝑎, 𝑏⟩ ∈ 𝔇(𝑆) × ℑ(𝑅), o que valida (ii).

Decorre de (i) e (ii) que 𝑅−1 = {⟨𝑦, 𝑥⟩|𝑥𝑅𝑦} e 𝑅 ∘ 𝑆 = {⟨𝑥, 𝑦⟩|(∃𝑧)(𝑥𝑆𝑧 ∧ 𝑧𝑅𝑦)}

existem em ZFC. Por definição, qualquer membro de 𝑅−1 ou 𝑅 ∘ 𝑆 deve ser um par ordenado,

donde concluímos que 𝑅−1 e 𝑅 ∘ 𝑆 são relações, o que comprova (iii). Q.E.D.

Teorema 3.4. 𝑅 é uma relação ⟹ (𝑅−1)−1 = 𝑅.

Demonstração.

Como 𝑅 é uma relação, 𝑅−1 também é uma relação e, consequentemente,

(𝑅−1)−1 é uma relação. Da Definição 3.1, segue que

𝑎 ∈ (𝑅−1)−1 ⟹ (∃𝑥)(∃𝑦)(𝑎 = ⟨𝑥, 𝑦⟩),

daí, pela definição de inversa, decorre

𝑎 ∈ (𝑅−1)−1 ⟺ ⟨𝑥, 𝑦⟩ ∈ (𝑅−1)−1 ⟺ 𝑥(𝑅−1)−1𝑦⟺ 𝑦𝑅−1𝑥 ⟺

⟺ 𝑥𝑅𝑦 ⟺ ⟨𝑥, 𝑦⟩ ∈ 𝑅 ⟺ 𝑎 ∈ 𝑅.

A igualdade entre 𝑅 e (𝑅−1)−1 é consequência do Axioma da Extensão e da

transitividade da equivalência. Q.E.D.

Assim, por exemplo, em 𝐴 = {⟨1, 2⟩, ⟨⋆ , ∎⟩, ⟨∅, {∅}⟩}, temos 𝐴[{1, ⋆}] =

{2, ∎}, 𝐴−1��2, {∅}�� = {1, ∅}, 𝐴−1 = {⟨2, 1⟩, ⟨∎, ⋆⟩, ⟨{∅}, ∅⟩} e, tomando 𝐵 =

{⟨∎, ⋆⟩, ⟨𝑎, 1⟩, ⟨{∅}, 2⟩}, obtemos 𝐴 ∘ 𝐵 = {⟨∎, ∎⟩, ⟨𝑎, 2⟩} e 𝐵 ∘ 𝐴 = {⟨⋆ , ⋆⟩, ⟨∅, 2⟩}.

Naturalmente, relações binárias podem ser definidas por meio de condições em

duas variáveis, como por exemplo, a “relação” dada anteriormente, 𝒫 = {⟨𝑥, 𝑦⟩|𝑥 é pai de 𝑦},

no qual os “elementos” de 𝒫 são todos os pares ordenados ⟨𝑥, 𝑦⟩ que satisfazem a condição

“𝑥 é pai de 𝑦”. De fato, se admitíssemos classes próprias, bastaria fazer {⟨𝑥, 𝑦⟩|𝜓(𝑥, 𝑦)}.

Porém, pela Definição 2.14, se não existir um conjunto 𝑧 tal que 𝜓(𝑥, 𝑦)⟹ ⟨𝑥, 𝑦⟩ ∈ 𝑧, então

{⟨𝑥, 𝑦⟩|𝜓(𝑥, 𝑦)} não é um conjunto, embora possam existir elementos 𝑥 e 𝑦 tais que 𝜓(𝑥, 𝑦).

Por exemplo, em ZFC as relações de “igualdade” 𝐼 = {⟨𝑥, 𝑦⟩|𝑥 = 𝑦} e “inclusão”

𝒮 = {⟨𝐴, 𝐵⟩|𝐴 ⊆ 𝐵} não existem, apesar de existirem elementos satisfazendo às condições de

𝐼 e 𝒮. Pelo Teorema 2.1 é imediato que 𝐼 não existe. Provemos que 𝒮 não existe.

Suponha que 𝒮 = {⟨𝐴, 𝐵⟩|𝐴 ⊆ 𝐵} exista. Daí, pela Definição 2.14, a sentença

68

(∀𝑋)(∀𝑌)(⟨𝑋, 𝑌⟩ ∈ 𝒮 ⟺ 𝑋 ⊆ 𝑌)

é verdadeira. Entretanto, ∅ ⊆ 𝑌, para qualquer 𝑌. Assim, ⟨∅, 𝑌⟩ ∈ 𝒮 é verdadeiro para todo 𝑌,

donde concluímos que todo conjunto deve ser membro de ℑ(𝒮), o que é absurdo, pois

contraria o Teorema 2.1. Logo, 𝒮 não existe, como queríamos mostrar.

O próximo resultado, proposto por Fraenkel, Bar-Hillel & Levy (1973, p. 42),

fornece uma condição suficiente para garantir a existência de uma relação 𝑅 tal que 𝑥𝑅𝑦 ⟺

𝜓(𝑥, 𝑦).

Teorema 3.5. Seja 𝜓(𝑥, 𝑦) uma condição em 𝑥 e 𝑦. Se existir um conjunto 𝑧, tal

que

(∀𝑥)(∀𝑦)(𝜓(𝑥, 𝑦)⟹ {𝑥, 𝑦} ⊆ 𝑧),

então existe uma única relação 𝑅𝜓 , tal que 𝑥𝑅𝜓𝑦⟺ 𝜓(𝑥, 𝑦).

Demonstração.

Esta é apenas uma adaptação do Teorema 2.7.

Como por hipótese, 𝜓(𝑥, 𝑦)⟹ {𝑥, 𝑦} ⊆ 𝑧 para quaisquer 𝑥 e 𝑦, temos

𝜓(𝑥, 𝑦) ⟹ {𝑥, 𝑦} ⊆ 𝑧 ⟹ 𝑥 ∈ 𝑧 ∧ 𝑦 ∈ 𝑧 ⟹ ⟨𝑥, 𝑦⟩ ∈ 𝑧 × 𝑧.

Então basta definirmos 𝑅𝜓 = �𝑎�(∃𝑥)(∃𝑦)�𝜓(𝑥, 𝑦)� ∧ 𝑎 = ⟨𝑥, 𝑦⟩�, pois o

Teorema 2.7 garante que

𝑎 ∈ 𝑅𝜓 ⟺ (∃𝑥)(∃𝑦)�𝜓(𝑥, 𝑦)� ∧ 𝑎 = ⟨𝑥, 𝑦⟩,

ou equivalentemente, 𝑥𝑅𝜓𝑦⟺ 𝜓(𝑥, 𝑦). Notemos que, em vista da Definição 2.19, vale a

igualdade 𝑅𝜓 = {⟨𝑥, 𝑦⟩|𝜓(𝑥, 𝑦)}.Q.E.D.

Obviamente, se existirem uma relação 𝑅 e uma condição 𝜓(𝑥, 𝑦) tais que

𝑥𝑅𝑦⟺ 𝜓(𝑥, 𝑦), então existe um conjunto 𝑧 tal que 𝜓(𝑥, 𝑦) ⟹ {𝑥, 𝑦} ⊆ 𝑧 — a saber,

𝑧 = 𝔉(𝑅).

Podemos definir diversas relações sobre um dado conjunto. Por exemplo, para

qualquer conjunto 𝑋, 𝐼𝑑𝑋 = {⟨𝑥, 𝑦⟩ ∈ 𝑋 × 𝑋|𝑥 = 𝑦} é a relação de igualdade dos elementos

de 𝑋; temos também ⊂𝑋= {⟨𝑥, 𝑦⟩ ∈ 𝑋 × 𝑋|𝑥 ⊂ 𝑦}, a relação de inclusão própria entre os

elementos de 𝑋. Notemos que apesar de ambas serem relações, elas diferem quanto a algumas

propriedades de seus elementos.

69

Enquanto 𝑎𝐼𝑑𝑋𝑏 ⟺ 𝑏𝐼𝑑𝑋𝑎, e 𝑐 ∈ 𝑋 ⟹ 𝑐𝐼𝑑𝑋𝑐, temos 𝑎 ⊂𝑋 𝑏 ⟹ ¬(𝑏 ⊂𝑋 𝑎) e

𝑐 ∈ 𝑋 ⟹ ¬(𝑐 ⊂𝑋 𝑐). Apesar disso, as duas são “transitivas”, pois 𝑎𝐼𝑑𝑋𝑏 e 𝑏𝐼𝑑𝑋𝑐 implica

𝑎𝐼𝑑𝑋𝑐, bem como 𝑎 ⊂𝑋 𝑏 e 𝑏 ⊂𝑋 𝑐 é suficiente para 𝑎 ⊂𝑋 𝑐.

Vemos assim que as relações podem ser rotuladas de acordo com as propriedades

que possuem. As definições a seguir visam classificar os principais tipos de relações sobre um

conjunto arbitrário. Em todos os casos, assumimos 𝑅 como sendo uma relação em 𝑋 — isto é,

com 𝔉(𝑅) ⊆ 𝑋. Por simplicidade, a partir daqui escrevemos “𝑥, 𝑦 ∈ 𝑋” e “𝑥, 𝑦, 𝑧 ∈ 𝑋” em

vez de “𝑥 ∈ 𝑋 ∧ 𝑦 ∈ 𝑋” e “𝑥 ∈ 𝑋 ∧ 𝑦 ∈ 𝑋 ∧ 𝑧 ∈ 𝑋”, respectivamente, e assim por diante.

Definição 3.11. 𝑅 é reflexiva em 𝑋 ⟺ (∀𝑥)(𝑥 ∈ 𝑋 ⟹ 𝑥𝑅𝑥).

Definição 3.12. 𝑅 é irreflexiva em 𝑋 ⟺ (∀𝑥)�𝑥 ∈ 𝑋 ⟹ ¬(𝑥𝑅𝑥)�.

Definição 3.13. 𝑅 é simétrica em 𝑋 ⟺ (∀𝑥)(∀𝑦)(𝑥, 𝑦 ∈ 𝑋 ∧ 𝑥𝑅𝑦⟹ 𝑦𝑅𝑥).

Definição 3.14. 𝑅 é assimétrica em 𝑋 se, e somente se,

(∀𝑥)(∀𝑦)�𝑥, 𝑦 ∈ 𝑋 ∧ 𝑥𝑅𝑦⟹ ¬(𝑦𝑅𝑥)�.

Definição 3.15. 𝑅 é antissimétrica em 𝑋 se, e somente se,

(∀𝑥)(∀𝑦)�(𝑥, 𝑦 ∈ 𝑋 ∧ 𝑥𝑅𝑦 ∧ 𝑦𝑅𝑥) ⟹ 𝑥 = 𝑦�.

Definição 3.16. 𝑅 é transitiva em 𝑋 se, e somente se,

(∀𝑥)(∀𝑦)(∀𝑧)�(𝑥, 𝑦, 𝑧 ∈ 𝑋 ∧ 𝑥𝑅𝑦 ∧ 𝑦𝑅𝑧) ⟹ 𝑥𝑅𝑧�.

Definição 3.17. 𝑅 é uma equivalência sobre 𝑋 se, e somente se, 𝑅 é reflexiva,

simétrica e transitiva sobre 𝑋.

Definição 3.18. 𝑅 é uma ordem parcial em 𝑋 se, e somente se, 𝑅 é reflexiva,

antissimétrica e transitiva sobre 𝑋. Dizemos que ⟨𝑋, 𝑅⟩ é um conjunto parcialmente

ordenado.

Definição 3.19. 𝑅 é uma ordem estrita em 𝑋 se, e somente se, 𝑅 é assimétrica e

transitiva sobre 𝑋. Dizemos que ⟨𝑋, 𝑅⟩ é um conjunto estritamente ordenado.

70

Definição 3.20. Seja 𝑅 uma relação sobre 𝑋. Para quaisquer 𝑎, 𝑏 ∈ 𝑋, dizemos

que 𝑎 e 𝑏 são comparáveis na relação 𝑅 se, e somente se, 𝑎 = 𝑏, 𝑎𝑅𝑏 ou 𝑏𝑅𝑎. Caso

contrário, 𝑎 e 𝑏 são incomparáveis.

Definição 3.21. 𝑅 é conectada em 𝑋 se, e somente se,

(∀𝑥)(∀𝑦)�(𝑥, 𝑦 ∈ 𝑋 ∧ 𝑥 ≠ 𝑦) ⟹ 𝑥𝑅𝑦 ∨ 𝑦𝑅𝑥�.

Em outras palavras, 𝑅 é conectada se todos os elementos de 𝑋 são comparáveis.

Definição 3.22. 𝑅 é uma ordem linear (ou total) em 𝑋 se, e somente se, 𝑅 é

conectada e é uma ordem (parcial ou estrita) em 𝑋. Neste caso, dizemos que ⟨𝑋, 𝑅⟩ é um

conjunto linearmente (totalmente) ordenado.

Definição 3.23. 𝑅 é uma função se, e somente se,

𝑅 é uma relação ∧ (∀𝑥)(∀𝑦)(∀𝑧)�(𝑥𝑅𝑦 ∧ 𝑥𝑅𝑧) ⟹𝑦 = 𝑧�.

O estudo das relações pode ser exaustivamente aprofundado. Muitos teoremas

referentes aos vários tipos de relações definidas acima, bem como outros tipos de relações e

propriedades destas, podem ser encontrados em Suppes (1972) e Hrbacek & Jech (1999).

Neste trabalho, focamo-nos num tipo específico de relação de ordem (Capítulo 4) e nas

funções devido à sua importância para os números ordinais. Contudo, julgamos importante

uma breve discussão sobre relações de equivalência, o que fazemos na seção seguinte.

3.2. Relações de Equivalência

Relações de equivalência sobre um conjunto baseiam-se, em certo sentido, em

alguma noção de igualdade entre seus membros, o que permite “particionar” tal conjunto em

classes de equivalência. A rigor, definimos abaixo o que vêm a ser uma partição de um

conjunto, bem como uma classe de equivalência de uma relação de equivalência.

Definição 3.24. Seja 𝐴 ≠ ∅. Uma família 𝑆 ≠ ∅ é uma partição de 𝐴 se, e

somente se, 𝑆 possui as seguintes propriedades:

71

(i) (∀𝐵)(𝐵 ∈ 𝑆 ⟹ 𝐵 ≠ ∅);

(ii) (∀𝐶)(∀𝐷)�(𝐶, 𝐷 ∈ 𝑆 ∧ 𝐶 ≠ 𝐷) ⟹𝐶 ∩ 𝐷 = ∅�;

(iii) 𝐴 = ⋃𝑆.

Definição 3.25. Seja 𝐸 uma relação de equivalência sobre um conjunto 𝑋 ≠ ∅ e

𝑥 ∈ 𝑋 um elemento arbitrário. A classe de equivalência de 𝑥 módulo 𝐸 é o conjunto

[𝑥]𝐸 = {𝑦 ∈ 𝐴|𝑦𝐸𝑥};

o conjunto de todas as classes de equivalência é denotado por

𝑋/𝐸 = {[𝑥]𝐸 ∈ ℘(𝑋)|𝑥 ∈ 𝑋}.

O exemplo seguinte, sugerido por Hrbacek & Jech ilustra bem o que queremos

dizer.

Seja 𝑃 o conjunto de todas as pessoas vivendo na Terra. Dizemos que uma pessoa 𝑝 é equivalente a uma pessoa 𝑞 (𝑝 ≡ 𝑞) se 𝑝 e 𝑞 moram no mesmo país. Trivialmente, ≡ é reflexiva, simétrica e transitiva em 𝑃. Note que o conjunto 𝑃 pode ser quebrado em classes de elementos mutuamente equivalentes; todas as pessoas que moram nos Estados Unidos formam uma classe, todas as pessoas que moram na França determinam outra classe, etc. Todos os membros da mesma classe são mutuamente equivalentes; membros de diferentes classes nunca são equivalentes. As classes de equivalência correspondem exatamente aos diferentes países. (HRBACEK & JECH, 1999, p. 30, tradução nossa).

Reciprocamente, se um conjunto 𝐴 admite uma partição 𝑆, então podemos induzir

uma relação de equivalência em 𝐴, cujas classes de equivalência são exatamente os membros

de 𝑆. Formalizamos tais observações a seguir.

Lema 3.1. Seja 𝐸 uma relação de equivalência sobre um conjunto 𝑋 ≠ ∅, com 𝑥,

𝑦 ∈ 𝑋 quaisquer.

(i) [𝑥]𝐸 = [𝑦]𝐸 ⟺ 𝑥𝐸𝑦;

(ii) [𝑥]𝐸 ∩ [𝑦]𝐸 = ∅ ⟺ ¬(𝑥𝐸𝑦).

Demonstração.

(i) Se [𝑥]𝐸 = [𝑦]𝐸 então para qualquer 𝑤, 𝑤 ∈ [𝑥]𝐸 ⟺ 𝑤 ∈ [𝑦]𝐸, isto é,

𝑤𝐸𝑥 ⟺ 𝑤𝐸𝑦. Suponha 𝑤𝐸𝑥, então temos 𝑤𝐸𝑦, mas 𝐸 é simétrica, assim 𝑥𝐸𝑤 e 𝑤𝐸𝑦; da

transitividade de 𝐸 obtemos 𝑥𝐸𝑦.

72

Reciprocamente, suponha 𝑥𝐸𝑦. Para 𝑢 qualquer, temos 𝑢 ∈ [𝑥]𝐸 ⟺ 𝑢𝐸𝑥, como

𝑥𝐸𝑦 e 𝐸 é transitiva, inferimos 𝑢𝐸𝑦, o que equivale a 𝑢 ∈ [𝑦]𝐸. Logo, [𝑥]𝐸 ⊆ [𝑦]𝐸.

Analogamente mostra-se que [𝑦]𝐸 ⊆ [𝑥]𝐸. O resultado segue do Teorema 2.3.

(ii) Suponha [𝑥]𝐸 ∩ [𝑦]𝐸 = ∅. Se, por absurdo, 𝑥𝐸𝑦, teríamos pelo item

anterior que [𝑥]𝐸 = [𝑦]𝐸. Logo, [𝑥]𝐸 = [𝑦]𝐸 = ∅, o que é absurdo, uma vez que 𝑥 ∈ [𝑥]𝐸

— pois 𝑥𝐸𝑥. Assim,

(∗) [𝑥]𝐸 ∩ [𝑦]𝐸 = ∅⟹ ¬(𝑥𝐸𝑦).

Se [𝑥]𝐸 ∩ [𝑦]𝐸 ≠ ∅, segue que existe 𝑢 tal que 𝑢𝐸𝑥 e 𝑢𝐸𝑦. Da simetria e da

transitividade de 𝐸, obtemos 𝑥𝐸𝑦. Daí [𝑥]𝐸 ∩ [𝑦]𝐸 ≠ ∅ ⟹ 𝑥𝐸𝑦 donde, pela contrapositiva,

decorre

(∗∗) ¬(𝑥𝐸𝑦) ⟹ [𝑥]𝐸 ∩ [𝑦]𝐸 = ∅.

O resultado segue de (∗) e (∗∗). Q.E.D.

Teorema 3.6. Seja 𝑆 uma partição de um conjunto 𝑋 não vazio. Então o conjunto

𝐸𝑆 = {⟨𝑥, 𝑦⟩|(∃𝐶)(𝐶 ∈ 𝑆 ∧ 𝑥, 𝑦 ∈ 𝐶)}

é uma relação de equivalência em 𝑋. Além disso, 𝑋/𝐸𝑆 = 𝑆.

Demonstração.

Claramente 𝐸𝑆 é um conjunto (em particular, uma relação), pois 𝐸𝑆 ⊆ ⋃𝑆 × ⋃𝑆.

Devemos provar que 𝐸𝑆 é uma relação reflexiva, simétrica e transitiva sobre 𝑋.

Como 𝑆 é uma partição de 𝑋, segue que ⋃𝑆 = 𝑋; assim, para 𝑥 qualquer

pertencente a 𝑋, existe 𝐶 ∈ 𝑆 tal que 𝑥 ∈ 𝐶, logo 𝑥𝐸𝑆𝑥, isto é, 𝐸𝑆 é reflexiva.

Assumindo que 𝑥𝐸𝑆𝑦 para 𝑥, 𝑦 ∈ 𝑋 quaisquer, segue que existe 𝐶′ ∈ 𝑆 tal que 𝑥,

𝑦 ∈ 𝐶′. É claro que 𝑦, 𝑥 ∈ 𝐶′, e assim 𝑦𝐸𝑆𝑥 e, por conseguinte, 𝐸𝑆 é simétrica.

Se existirem 𝑥, 𝑦, 𝑧 ∈ 𝑋 tais que 𝑥𝐸𝑆𝑦 e 𝑦𝐸𝑆𝑧, então existem 𝐶1, 𝐶2 ∈ 𝑆 tais que

𝑥, 𝑦 ∈ 𝐶1 e 𝑦, 𝑧 ∈ 𝐶2. Assim 𝑦 ∈ 𝐶1 ∩ 𝐶2, mas como 𝑆 é uma partição, todos os membros de

𝑆 devem ser disjuntos, logo 𝐶1 = 𝐶2, donde segue que 𝑥, 𝑧 ∈ 𝐶1, ou seja, 𝑥𝐸𝑆𝑧 e, por

conseguinte, 𝐸𝑆 é transitiva.

Pelo que vimos, 𝐸𝑆 é uma relação de equivalência.

Provemos a igualdade 𝑋/𝐸𝑆 = 𝑆.

73

Tome 𝐴 ∈ 𝑋/𝐸𝑆 qualquer. Por definição existe 𝑥 ∈ 𝑋 tal que 𝑦 ∈ 𝐴 se, e somente

se, existe 𝐴 ∈ 𝑆 com 𝑥, 𝑦 ∈ 𝐴. Logo, para qualquer 𝑦 ∈ 𝐴 tem-se 𝑦 ∈ 𝐴, donde segue 𝐴 ⊆ 𝐴.

Da mesma forma, se 𝑦� ∈ 𝐴, então 𝑥, 𝑦� ∈ 𝐴, daí 𝐴 ⊆ 𝐴. Então 𝐴 = 𝐴, e assim 𝐴 ∈ 𝑆. Como 𝐴

é qualquer, mostramos que 𝑋/𝐸𝑆 ⊆ 𝑆.

Reciprocamente, tomemos 𝐵 ∈ 𝑆 qualquer e fixemos 𝑏 ∈ 𝐵. Como ⋃𝑆 = 𝑋,

segue que 𝑏 ∈ 𝑋 . Então existe 𝐵� = [𝑏]𝐸𝑆 tal que 𝑦 ∈ 𝐵� ⟺ 𝑦𝐸𝑆𝑏. Para qualquer 𝑏′ ∈ 𝐵,

temos 𝑏, 𝑏′ ∈ 𝐵 e daí 𝑏′𝐸𝑆𝑏, isto é, 𝑏′ ∈ 𝐵� , donde segue que 𝐵 ⊆ 𝐵� . Obviamente, se 𝑏� ∈ 𝐵�

então 𝑏 e 𝑏� pertencem ao mesmo conjunto de 𝑆 e, como 𝑆 é uma partição de 𝑋 e 𝑏 ∈ 𝐵,

concluímos que 𝑏� ∈ 𝐵, logo 𝐵� ⊆ 𝐵. Assim, 𝐵 = 𝐵� e 𝐵 ∈ 𝑋/𝐸𝑆, donde segue que 𝑆 ⊆ 𝑋/𝐸𝑆.

Q.E.D.

Teorema 3.7. Seja 𝐸 uma relação de equivalência num conjunto 𝑋. Então 𝑋/𝐸 é

uma partição de 𝑋. Além disso, 𝐸𝑋/𝐸 = 𝐸 (onde 𝐸𝑋/𝐸 é o conjunto definido no teorema

anterior obtido ao substituirmos 𝑆 por 𝑋/𝐸).

Demonstração.

Como 𝐸 é reflexiva, 𝑥 ∈ [𝑥]𝐸, para todo [𝑥]𝐸 ∈ 𝑋/𝐸, o que garante que todo

elemento de 𝑋/𝐸 é não vazio. Para 𝑎, 𝑏 ∈ 𝑋 quaisquer temos 𝑎𝐸𝑏 ou ¬(𝑎𝐸𝑏), donde

inferimos pelo Lema 3.1 que [𝑎]𝐸 = [𝑏]𝐸 ou [𝑎]𝐸 ∩ [𝑏]𝐸 = ∅: assim, elementos distintos de

𝑋/𝐸 são disjuntos.

Para 𝑥 ∈ 𝑋 qualquer tem-se 𝑥 ∈ [𝑥]𝐸, onde [𝑥]𝐸 é um membro de 𝑋/𝐸. Logo

𝑥 ∈ ⋃(𝑋/𝐸) e assim 𝑋 ⊆ ⋃(𝑋/𝐸). Obviamente, se 𝑤 ∈ ⋃(𝑋/𝐸), então existe 𝑊 ∈ 𝑋/𝐸 tal

que 𝑤 ∈ 𝑊; contudo 𝑊 ⊆ 𝑋 por definição, logo 𝑥 ∈ 𝑋 e assim ⋃(𝑋/𝐸)⊆ 𝑋. Portanto

⋃(𝑋 ∖ 𝐸) = 𝑋. Mostramos dessa forma que 𝑋/𝐸 satisfaz às três condições impostas pela

Definição 3.24, donde segue que 𝑋/𝐸 é uma partição de 𝑋.

Claramente 𝐸 = 𝐸𝑋/𝐸. De fato, 𝑥𝐸𝑦⟺ [𝑥]𝐸 = [𝑦]𝐸. Como 𝑥 ∈ [𝑥]𝐸 e 𝑦 ∈ [𝑦]𝐸,

obtemos 𝑥, 𝑦 ∈ [𝑥]𝐸, donde segue que 𝑥𝐸𝑋/𝐸𝑦, logo, 𝐸 ⊆ 𝐸𝑋/𝐸. A outra inclusão é imediata.

Q.E.D.

Algo muito conveniente ao se trabalhar com partições ou equivalências é ter um

conjunto de representantes das classes. É o que se faz em Álgebra com as relações de

divisibilidade em ℤ, e toma-se ℤ𝑚 = {0�, 1�,…, 𝑚− 1��}, ou do exemplo anterior, caso

tomássemos o conjunto dos presidentes dos países da Terra. Formalmente, adotamos a

definição de Hrbacek & Jech (1999).

74

Definição 3.26. Seja 𝐸 uma relação de equivalência em 𝑋 ≠ ∅. Um conjunto

𝐴 ⊆ 𝑋 é chamado conjunto de representantes de 𝐸 se, e somente se, para todo 𝐶 ∈ 𝑋/𝐸,

𝐴 ∩ 𝐶 = {𝑎}, para algum 𝑎 ∈ 𝐶. Analogamente, se 𝑆 é uma partição de 𝑋, um conjunto

𝐵 ⊆ 𝑋 é dito um conjunto de representantes da partição 𝑆 se para todo 𝐷 ∈ 𝑆, 𝐵 ∩ 𝐷 = {𝑎}

para algum 𝑎 ∈ 𝐷.

Uma pergunta aparentemente simples é se toda relação de equivalência sobre

algum conjunto admite um conjunto de representantes. É preciso assumir o Axioma da

Escolha a fim de obter uma resposta para tal questionamento: ela é afirmativa, conforme

provamos abaixo. Encerramos esta seção com a demonstração de tal fato.

Teorema 3.8. Seja 𝐸 uma relação sobre um conjunto 𝑋 ≠ ∅. Existe um conjunto

de representantes de 𝐸.

Demonstração.

Chamemos de 𝑃 = 𝑋/𝐸 a partição de 𝑋, cuja existência é garantida pelo Teorema

3.7. Por definição, 𝑃 é uma família disjunta tal que ∅ ∉ 𝑡. Logo, pelo Axioma da Escolha,

[†] (∃𝑈)(∀𝑤)�𝑤 ∈ 𝑃 ⟹ (∃!𝑣)(𝑣 ∈ 𝑤 ∩𝑈)�.

Tomemos 𝐶 = {𝑎 ∈ 𝑈|𝑎 ∈ 𝑋} = 𝑈 ∩ 𝑋. Obviamente 𝐶 ⊆ 𝑋. Notemos que para

qualquer 𝑐 ∈ 𝑃, tem-se por [†] que 𝑐 ∩ 𝑈 = {𝑣}, para algum 𝑣 ∈ 𝑐. Entretanto, como 𝑐 ⊆ 𝑋

— pois 𝑐 é uma classe de equivalência de 𝑃 = 𝑋/𝐸 —, temos 𝑣 ∈ 𝑋, donde segue que

{𝑣} = (𝑐 ∩ 𝑈) ∩ 𝑋 = 𝑐 ∩ (𝑈 ∩𝑋) = 𝑐 ∩ 𝐶 .

Portanto, para cada 𝑐 ∈ 𝑃, existe um único 𝑣 ∈ 𝑐 tal que 𝐶 ∩ 𝑐 = {𝑣} e, pela

Definição 3.26, concluímos que 𝐶 é um conjunto de representantes de 𝐸. Q.E.D.

Observação: No Capítulo 5, provamos que o “Teorema 3.8” é equivalente ao

Axioma da Escolha.

75

3.3. Funções

Funções estão no cerne da Matemática e têm fundamental importância em

diversas áreas de estudo, como Análise, Álgebra e Topologia. Uma função 𝑓 é, grosso modo,

“uma regra que relaciona a cada elemento 𝑥 de uma coleção um único elemento”

(FRAENKEL, BAR-HILLEL, & LEVY, 1973, p. 43, tradução nossa). Assim, é natural

considerar funções como subcasos das relações definidas anteriormente, o que foi feito na

Definição 3.231.

Todos os conceitos definidos anteriormente para relações — como domínio,

imagem, campo, restrição, etc. —, estendem-se para funções, uma vez que toda função é, por

definição, uma relação. A seguir, estabelecemos importantes notações e “tipos” de funções.

Posteriormente, provamos alguns teoremas concernentes a tais definições. No que segue,

baseamo-nos, sobretudo, em Hrbacek & Jech (1999).

Definição 3.27. Seja 𝑓 uma função. Admitimos as seguintes notações para indicar

(𝑥, 𝑦) ∈ 𝑓:

(i) 𝑓(𝑥) = 𝑦;

(ii) 𝑓𝑥 = 𝑦.

Definição 3.28. Seja 𝑓 uma função. Se ℑ(𝑓)⊆ 𝐵 e 𝔇(𝑓) = 𝐴, admitem-se as

seguintes notações para indicar a função 𝑓:

(i) 𝑓:𝐴 ⟶ 𝐵;

(ii) ⟨𝑓(𝑎)|𝑎 ∈ 𝐴⟩;

(iii) ⟨𝑓𝑎|𝑎 ∈ 𝐴⟩;

(iv) ⟨𝑓𝑎⟩𝑎∈𝐴.

Definição 3.29. Seja 𝑓:𝐴 ⟶ 𝐵. Dizemos que:

(i) 𝑓 é injetora ⟺ (∀𝑥)(∀𝑦)�(𝑥, 𝑦 ∈ 𝐴∧ 𝑥 ≠ 𝑦) ⟹𝑓(𝑥) ≠ 𝑓(𝑦)�;

(ii) 𝑓 é sobrejetora ⟺ℑ(𝑓) = 𝐵;

1 Tal definição se deve a Giuseppe Peano, em seu trabalho Formulaire de Mathématiques (Formulário de Matemática), de 1895 (KURATOWSKI & MOSTOWSKI, 1976).

76

(iii) 𝑓 é bijetora ⟺ 𝑓 é injetora e sobrejetora.

Notemos que a Definição 3.27 está bem definida, pois se 𝑓 é uma função e

𝑥 ∈ 𝔇(𝑓), então existe um único 𝑦 ∈ ℑ(𝑓) tal que 𝑥𝑓𝑦, que então chamamos 𝑓(𝑥) ou 𝑓𝑥; diz-

se neste caso que 𝑓 leva 𝑥 em 𝑦, 𝑓 transforma 𝑥 em 𝑦, etc., mas comumente lê-se apenas 𝑓 de

𝑥.

Por sua vez, diz-se que 𝑓:𝐴 ⟶ 𝐵 é a função 𝑓 de 𝐴 em 𝐵, onde 𝐵 é o

contradomínio da função 𝑓. Vale ressaltar que se para alguma função 𝑓, 𝔇(𝑓) ⊂ 𝐴, não se

utiliza a notação 𝑓:𝐴 ⟶ 𝐵. Ainda, no caso (iii) da Definição 3.28, 𝑓 = ⟨𝑓𝑎|𝑎 ∈ 𝐴⟩ é dito um

sistema de conjuntos indexados por 𝐴, e ℑ(𝑓) = {𝑓𝑎|𝑎 ∈ 𝐴} é um conjunto indexado por 𝑓,

enquanto 𝐴 é o conjunto de índices.

Um exemplo que ilustra bem tal nomenclatura consiste em tomar 𝐴 = {1, 2, 3}, 𝐵

um conjunto qualquer não vazio e 𝑓:𝐴 ⟶ 𝐵 uma função arbitrária: temos assim ℑ(𝑓) =

{𝑏1, 𝑏2 , 𝑏3} ⊆ 𝐵, um subconjunto de 𝐵 cujos elementos estão “indexados” pelos membros de

𝐴.

Uma função injetora de 𝐴 em 𝐵 (ou injetiva, correspondência biunívoca de 𝐴 em

𝐵, ou ainda uma injeção), é uma relação na qual todo elemento da imagem de 𝑓 está

relacionado a um único membro do domínio 𝐴; o que justifica a nomenclatura predominante

na literatura inglesa, função um-para-um (one-to-one). Uma função sobrejetora de 𝐴 em 𝐵

(sobrejeção, ou simplesmente uma função de 𝐴 sobre 𝐵) é uma função que tem como imagem

todo o contradomínio da função — obviamente, como ℑ(𝑓) = 𝑓[𝐴], tem-se que 𝑓:𝐴 ⟶ 𝑓[𝐴]

sempre é uma sobrejeção. Enfim, uma função bijetora de 𝐴 em 𝐵 (ou bijeção,

correspondência biunívoca de 𝐴 sobre 𝐵), é uma função na qual todo membro de 𝐴 está

relacionado a um único elemento de 𝐵 de tal maneira que todo elemento de 𝐵 é imagem de

algum membro de 𝐴. Tais funções constituem a pedra angular do estudo da equipotência entre

conjuntos.

Definição 3.30. Sejam 𝐴 e 𝐵 conjuntos quaisquer. 𝐴 ≾ 𝐵 se, e somente se, existir

uma função injetora 𝜑:𝐴 ⟶ 𝐵. Se 𝜑 for uma bijeção, dizemos que 𝐴 e 𝐵 são equipotentes

(ou têm a mesma cardinalidade), o que indicamos por 𝐴 ≈ 𝐵. Se 𝐴 ≾ 𝐵 e ¬(𝐵 ≾ 𝐴),

escrevemos 𝐴 ≺ 𝐵.

77

Como funções são relações, valem os mesmos conceitos de composição e inversa.

Contudo, enquanto a composta de duas funções é sempre uma função, o mesmo não vale para

a inversa de funções: elas existem, mas nem sempre são funções. Os teoremas a seguir

esclarecem estes e outros fatos.

Teorema 3.9 (Princípio da Extensionalidade Para Funções). Sejam as funções 𝑓 e

𝑔. Temos 𝑓 = 𝑔 se, e somente se, 𝔇(𝑓) = 𝔇(𝑔) e 𝑓(𝑥) = 𝑔(𝑥), para todo 𝑥 ∈ 𝔇(𝑓).

Demonstração.

Como 𝑓 e 𝑔 são funções, podemos dizer que, para um 𝑎 qualquer,

[†] 𝑎 ∈ 𝑓 ⟹ 𝑎 = ⟨𝑥, 𝑓(𝑥)⟩, 𝑎 ∈ 𝑔⟹ 𝑎 = ⟨𝑧, 𝑔(𝑧)⟩.

Suponha que 𝑓 = 𝑔. Assim,

[††] 𝑎 ∈ 𝑓 ⟺ 𝑎 ∈ 𝑔,

daí, por [†], segue que 𝑥 = 𝑧 e então 𝑓(𝑥) = 𝑔(𝑥). Além disso, temos

⟨𝑥, 𝑓(𝑥)⟩ ∈ 𝑓 ⟺ 𝑥 ∈ 𝔇(𝑓) e ⟨𝑥, 𝑔(𝑥)⟩ ∈ 𝑔 ⟺ 𝑥 ∈ 𝔇(𝑔),

donde, por [††], obtemos 𝑥 ∈ 𝔇(𝑓)⟺ 𝑥 ∈ 𝔇(𝑔). Assim, 𝔇(𝑓) = 𝔇(𝑔).

Reciprocamente, suponha 𝔇(𝑓) = 𝔇(𝑔) e 𝑓(𝑥) = 𝑔(𝑥) para todo 𝑥 ∈ 𝔇(𝑓). Seja

⟨𝑥, 𝑓(𝑥)⟩ ∈ 𝑓 arbitrário. Como 𝑥 ∈ 𝔇(𝑓), segue da hipótese que 𝑥 ∈ 𝔇(𝑔) e

consequentemente ⟨𝑥, 𝑔(𝑥)⟩ ∈ 𝑔; por outro lado, 𝑓(𝑥) = 𝑔(𝑥) e assim ⟨𝑥, 𝑓(𝑥)⟩ ∈ 𝑔. Por

termos tomado ⟨𝑥, 𝑓(𝑥)⟩ ∈ 𝑓 arbitrário, concluímos que 𝑓 ⊆ 𝑔. Analogamente mostra-se que

𝑔 ⊆ 𝑓, donde a igualdade segue-se. Q.E.D.

Lema 3.2. 𝑓 é função ⟹ (∀𝑥)(∀𝐴)�𝑥 ∈ 𝑓−1[𝐴] ⟺ (∃!𝑦)(𝑦 = 𝑓(𝑥) ∧ 𝑦 ∈ 𝐴)�.

Demonstração.

Pela Definição 3.7, se 𝑥 ∈ 𝑓−1[𝐴], então existe um único 𝑦 ∈ 𝐴 tal que 𝑦 = 𝑓(𝑥)

e 𝑓(𝑥) ∈ 𝐴. Reciprocamente, se existe um único 𝑦 tal que 𝑦 = 𝑓(𝑥), então 𝑥 ∈ 𝔇(𝑓) e por

𝑓(𝑥) ∈ 𝐴 segue que 𝑥 ∈ 𝑓−1[𝐴]. Q.E.D.

Teorema 3.10. Sejam as funções 𝑓 e 𝑔. Então 𝑔 ∘ 𝑓 é uma função. Além disso,

𝔇(𝑔 ∘ 𝑓) = 𝔇(𝑓) ∩ 𝑓−1[𝔇(𝑔)] e (𝑔 ∘ 𝑓)(𝑥) = 𝑔�𝑓(𝑥)�, para todo 𝑥 ∈ 𝔇(𝑔 ∘ 𝑓).

Demonstração.

78

Pelo Teorema 3.3 (iii), 𝑔 ∘ 𝑓 é uma relação. Provemos que 𝑔 ∘ 𝑓 é uma função.

Para tanto, seja 𝑥 ∈ 𝔇(𝑔 ∘ 𝑓) e suponha que existam 𝑦1, 𝑦2 ∈ ℑ(𝑔 ∘ 𝑓) tais que 𝑥(𝑔 ∘ 𝑓)𝑦1 e

𝑥(𝑔 ∘ 𝑓)𝑦2 . Pelo mesmo teorema, segue que existem 𝑧1 e 𝑧2 tais que

�†1� (𝑥𝑓𝑧1 ∧ 𝑧1𝑔𝑦1)∧ (𝑥𝑓𝑧2 ∧ 𝑧2𝑔𝑦2) ⟺ 𝑥(𝑔 ∘ 𝑓)𝑦1 ∧ 𝑥(𝑔 ∘ 𝑓)𝑦2 .

Como 𝑓 é função, 𝑧1 é único, isto é, 𝑧1 = 𝑧2 = 𝑓(𝑥). Assim,

�†2� �𝑥𝑓𝑧1 ∧ (𝑧1𝑔𝑦1 ∧ 𝑧1𝑔𝑦2) ∧ 𝑧1 = 𝑓(𝑥)�⟺ 𝑥(𝑔 ∘ 𝑓)𝑦1 ∧ 𝑥(𝑔 ∘ 𝑓)𝑦2 ,

e como 𝑔 também é função, segue que 𝑦1 = 𝑦2 — em particular, 𝑦1 = 𝑔(𝑧1) = 𝑔�𝑓(𝑥)�.

Logo, 𝑔 ∘ 𝑓 é função e, por �†2� temos ainda

�†3� 𝑥(𝑔 ∘ 𝑓)𝑦 ⟺ (𝑔 ∘ 𝑓)(𝑥) = 𝑦 ∧ 𝑦 = 𝑔�𝑓(𝑥)�.

Além disso, como 𝑓 e 𝑔 são funções, obtemos de �†1�, �†3� que

𝑥 ∈ 𝔇(𝑔 ∘ 𝑓) ⟺ (∃!𝑦)(∃! 𝑧)�𝑥𝑓𝑧∧ 𝑧𝑔𝑦 ∧ 𝑧 = 𝑓(𝑥)�⟺ 𝑥 ∈ 𝔇(𝑓) ∧ 𝑓(𝑥) ∈ 𝔇(𝑔),

o que equivale, pelo Lema 3.2, à

𝑥 ∈ 𝔇(𝑔 ∘ 𝑓) ⟺ 𝑥 ∈ 𝔇(𝑓) ∧ 𝑥 ∈ 𝑓−1[𝔇(𝑔)] ⟺ 𝑥 ∈ 𝔇(𝑓) ∩ 𝑓−1[𝔇(𝑔)];

a igualdade 𝔇(𝑔 ∘ 𝑓) = 𝔇(𝑓) ∩ 𝑓−1[𝔇(𝑔)] segue de (A1). Q.E.D.

Corolário 3.1. Sejam as funções 𝑓:𝐴 ⟶ 𝐵 e 𝑔:𝐶 ⟶ 𝐷. ℑ(𝑓)⊆ 𝐶 é uma

condição necessária e suficiente para que 𝑔 ∘ 𝑓:𝐴 ⟶ 𝐷.

Demonstração.

Suponha que 𝑔 ∘ 𝑓:𝐴 ⟶ 𝐷. Pelo teorema anterior, temos

𝔇(𝑔 ∘ 𝑓) = 𝔇(𝑓) ∩ 𝑓−1[𝔇(𝑔)] = 𝐴 ∩ 𝑓−1[𝐶] = 𝐴,

donde, pela Proposição 2.7 (xvi), inferimos 𝐴 ⊆ 𝑓−1[𝐶], isto é,

[†] (∀𝑥)(𝑥 ∈ 𝐴⟹ 𝑓(𝑥) ∈ 𝐶).

Tome então 𝑦 ∈ ℑ(𝑓) qualquer. Para tanto, existe 𝑥 ∈ 𝐴 tal que 𝑓(𝑥) = 𝑦, mas,

por [†], tem-se que 𝑓(𝑥) ∈ 𝐶. Logo, ℑ(𝑓)⊆ 𝐶.

Reciprocamente, assumamos ℑ(𝑓) ⊆ 𝐶. Decorre do Teorema 3.10 que

79

𝔇(𝑔 ∘ 𝑓) = 𝔇(𝑓) ∩ 𝑓−1[𝔇(𝑔)] = 𝐴 ∩ 𝑓−1[𝐶],

e assim 𝔇(𝑔 ∘ 𝑓) ⊆ 𝐴. Por outro lado, para 𝑥 qualquer, temos

𝑥 ∈ 𝐴 ⟺ 𝑥 ∈ 𝐴 ∧ 𝑥 ∈ 𝐴 ⟺ 𝑥 ∈ 𝐴 ∧ 𝑥 ∈ 𝔇(𝑓) ⟺ 𝑥 ∈ 𝐴 ∧ (∃!𝑦)(𝑦 ∈ ℑ(𝑓)∧ 𝑓(𝑥) = 𝑦),

contudo, ℑ(𝑓)⊆ 𝐶 por hipótese, donde segue que

𝑥 ∈ 𝐴⟹ 𝑥 ∈ 𝐴 ∧ (∃!𝑦)(𝑦 ∈ ℑ(𝑓) ∧ 𝑓(𝑥) = 𝑦) ⟹ 𝑥 ∈ 𝐴 ∧ (∃!𝑦)(𝑦 ∈ 𝐶 ∧ 𝑓(𝑥) = 𝑦) ⟹

⟹ 𝑥 ∈ 𝐴 ∧ 𝑥 ∈ 𝑓−1[𝐶] ⟹ 𝑥 ∈ 𝔇(𝑔 ∘ 𝑓).

Logo, 𝐴 ⊆ 𝔇(𝑔 ∘ 𝑓) e assim 𝐴 = 𝔇(𝑔 ∘ 𝑓) . Obviamente ℑ(𝑔∘ 𝑓) ⊆ 𝐷. Portanto,

𝑔 ∘ 𝑓:𝐴 ⟶ 𝐷. Q.E.D.

Corolário 3.2. Sejam 𝐴, 𝐵 e 𝐶 conjuntos não vazios, 𝑓:𝐴 ⟶ 𝐵 e 𝑔:𝐵 ⟶ 𝐶

funções quaisquer.

(i) Se 𝑓 e 𝑔 são injetoras então 𝑔 ∘ 𝑓 é injetora;

(ii) Se 𝑓 e 𝑔 são sobrejetoras então 𝑔 ∘ 𝑓 é sobrejetora;

(iii) Se 𝑓 e 𝑔 são bijetoras então 𝑔 ∘ 𝑓 é bijetora.

Demonstração.

Provamos apenas (i), pois (ii) se prova de maneira análoga e (iii) decorre dos itens

imediatamente anteriores. Pelo Corolário 3.1, 𝑔 ∘ 𝑓:𝐴 ⟶ 𝐶 (isto é, 𝑔 ∘ 𝑓 é função). Tomemos

𝑥1, 𝑥2 ∈ 𝐴 tais que (𝑔 ∘ 𝑓)(𝑥1)≠ (𝑔 ∘ 𝑓)(𝑥2). Temos 𝑔�𝑓(𝑥1)�≠ 𝑔�𝑓(𝑥2)�. Da injetividade

de 𝑔 segue 𝑓(𝑥1) ≠ 𝑓(𝑥2), da injetividade de 𝑓 segue 𝑥1 ≠ 𝑥2. Portanto, 𝑔 ∘ 𝑓 é injetora.

Q.E.D.

Teorema 3.112. Seja 𝑓 uma função de 𝐴 em 𝐵. 𝑓−1 é uma função de 𝐵 em 𝐴 se, e

somente se, 𝑓 é uma bijeção. Além disso, 𝑓−1 é bijetora e (𝑓−1)−1 = 𝑓.

Demonstração.

Suponha que 𝑓−1 seja uma função, com 𝔇(𝑓−1) = 𝐵 e ℑ(𝑓−1)⊆ 𝐴.

Seja 𝑦 ∈ 𝐵 qualquer. Como 𝑓−1 é função, existe um único 𝑥 ∈ ℑ(𝑓−1) tal que

𝑦𝑓−1𝑥, o que equivale a 𝑥𝑓𝑦 e daí 𝑦 ∈ ℑ(𝑓). Como 𝑦 é arbitrário, obtemos 𝐵 ⊆ ℑ(𝑓), no

2 Na maioria das obras consultadas para a realização deste trabalho, os autores propõem “𝑓−1 é função ⟺ 𝑓 é injetora”. Tal sentença não contradiz o Teorema 3.11, pois nele exigimos que 𝔇(𝑓−1) = 𝐵, o que não é cobrado pelos autores.

80

entanto, como ℑ(𝑓)⊆ 𝐵 por hipótese, concluímos que ℑ(𝑓) = 𝐵, donde segue que 𝑓 é

sobrejetora (∗).

Tomemos então 𝑦1, 𝑦2 ∈ ℑ(𝑓), onde 𝑥1𝑓𝑦1 e 𝑥2𝑓𝑦2 para certos 𝑥1, 𝑥2 ∈ 𝐴.

Suponha 𝑥1 ≠ 𝑥2. Temos 𝑦1𝑓−1𝑥1 e 𝑦2𝑓−1𝑥2. Como 𝑓−1 é função, segue que 𝑦1 ≠ 𝑦2 , do

contrário existiriam 𝑥1 ≠ 𝑥2 com 𝑦1𝑓−1𝑥1 e 𝑦1𝑓−1𝑥2, contrariando 𝑓−1 ser função. Logo,

𝑦1 ≠ 𝑦2 , isto é, 𝑓(𝑥1)≠ 𝑓(𝑥2). Assim, 𝑓 é injetora (∗∗).

Segue de (∗) e (∗∗) que 𝑓 é bijeção.

Reciprocamente, suponha que 𝑓:𝐴 ⟶ 𝐵 seja uma bijeção. Como 𝑓 é sobrejetora,

para todo 𝑦 ∈ 𝐵 existe 𝑥 ∈ 𝐴 tal que 𝑥𝑓𝑦, ou equivalentemente, 𝑦𝑓−1𝑥 e assim 𝔇(𝑓−1) = 𝐵.

Enfim, tome 𝑥1, 𝑥2 ∈ 𝐴 tais que 𝑦𝑓−1𝑥1 e 𝑦𝑓−1𝑥2 para algum 𝑦 ∈ 𝐵. Como 𝑓 é injetora

obtemos de 𝑥1𝑓𝑦 e 𝑥2𝑓𝑦 que 𝑥1 = 𝑥2, caso contrário 𝑓 não seria injetora. Portanto, 𝑓−1 é

função, como queríamos. Pelo Teorema 3.4, segue que (𝑓−1)−1 = 𝑓 e, pelo que vimos acima,

𝑓−1 é também bijetora. Q.E.D.

Corolário 3.3. Seja uma bijeção 𝑓 de 𝐴 em 𝐵. Então 𝑓(𝑥) = 𝑦 ⟺ 𝑓−1(𝑦) = 𝑥.

Demonstração.

Decorre imediatamente da definição de relação inversa. Q.E.D.

Observação: a inversa de uma função 𝑓 também pode ser caracterizada pela

avaliação do “resultado” da composição entre elas, isto é, se 𝑓:𝐴 ⟶ 𝐵 e 𝑔:𝐵 ⟶ 𝐴 são tais

que 𝑓 ∘ 𝑔 = 𝐼𝑑𝐵 e 𝑔 ∘ 𝑓 = 𝐼𝑑𝐴 , então 𝑔 = 𝑓−1. Tal caracterização é vista em detalhes, por

exemplo, por Lima (2009).

Corolário 3.4. Sejam 𝐴, 𝐵 e 𝐶 conjuntos quaisquer. Então:

(i) 𝐴 ≈ 𝐵 ⟹ 𝐴 ≾ 𝐵 ;

(ii) 𝐴 ≺ 𝐵 ⟹ 𝐴 ≾ 𝐵;

(iii) 𝐴 ≾ 𝐵 ∧ 𝐵 ≾ 𝐶 ⟹ 𝐴 ≾ 𝐶 (igualmente válido para ≺);

(iv) 𝐴 ≈ 𝐵 ⟺ 𝐵 ≈ 𝐴;

(v) 𝐴 ≈ 𝐵 ∧ 𝐵 ≈ 𝐶 ⟹ 𝐴 ≈ 𝐶;

(vi) 𝐴 × 𝐵 ≈ 𝐵 × 𝐴;

(vii) 𝐴 ≾ 𝐵 ⟹ ℘(𝐴) ≾ ℘(𝐵) (em particular, 𝐴 ≈ 𝐵 ⟹ ℘(𝐴) ≈ ℘(𝐵)).

Demonstração.

Como toda bijeção é também uma injeção, temos provado (i). (ii) decorre

imediatamente da definição. Os itens (iii), (iv) e (v) seguem imediatamente do Corolário 3.2 e

81

do Teorema 3.11. Obviamente, a função 𝑓: (𝐴× 𝐵) ⟶ (𝐵 × 𝐴) dada por 𝑓(⟨𝑎, 𝑏⟩) = ⟨𝑏, 𝑎⟩ é

uma bijeção, o que prova (vi). A validade de (vii) se obtém ao observar que se existe uma

injeção 𝑓:𝐴 ⟶ 𝐵, então a função 𝑔:℘(𝐴) ⟶℘(𝐵) dada por 𝑔(𝑆) = 𝑓[𝑆] para todo 𝑆 ⊆ 𝐴,

é uma injeção; se 𝑓 for bijetora, também 𝑔 será bijetora. Q.E.D.

Para mais propriedades sobre equipotência de conjuntos, sugerimos os resultados

propostos por Suppes (1972). O próximo lema visa estabelecer o Teorema de Cantor-

Bernstein: se 𝜓:𝐴 ⟶ 𝐵 e 𝜑:𝐵 ⟶ 𝐴 são injeções, então existe um bijeção Ω:𝐴⟶ 𝐵.

Adaptamos tais resultados de Miraglia (1991, p. 40) e Hrbacek & Jech (1999, p. 69).

Lema 3.3.

(i) (Teorema do Ponto Fixo de Tarski). Seja 𝜓:℘(𝐴) ⟶ ℘(𝐴) uma função

tal que se 𝑋 ⊆ 𝑌 ⊆ 𝐴 tenhamos 𝜓(𝑋) ⊆ 𝜓(𝑌). Nestas condições, existe 𝑉 ∈ ℘(𝐴) tal que

𝜓(𝑉) = 𝑉 (tal função 𝜓 é dita monótona, e o conjunto 𝑉 ∈ ℘(𝐴) é chamado de ponto fixo);

(ii) (∀𝑍)(∀𝐴)(∀𝐵)�(𝑍 ⊆ 𝐵 ∧ 𝐵 ⊆ 𝐴 ∧ 𝑍 ≈ 𝐴) ⟹ 𝐵 ≈ 𝐴�.

Demonstração.

Consideremos o conjunto 𝑇 = {𝑋 ⊆ 𝐴|𝑋 ⊆ 𝜓(𝑋)} e tomemos então 𝑋� = ⋃𝑇;

afirmamos que 𝑋� ∈ 𝑇. Primeiramente, notemos que para qualquer 𝑎 ∈ 𝑇, 𝑎 ⊆ 𝜓(𝑎) e da

condição imposta sobre 𝜓 segue que 𝜓(𝑎) ⊆ 𝜓�𝜓(𝑎)� e assim 𝜓(𝑎) ∈ 𝑇 .

Para 𝑧 ∈ 𝑇 qualquer, temos 𝑧 ⊆ 𝑋� e daí 𝑧 ⊆ 𝜓(𝑧)⊆ 𝜓(𝑋�), logo 𝑋� ⊆ 𝜓(𝑋�) e

dessa forma obtemos 𝑋� ∈ 𝑇 e 𝜓(𝑋�) ∈ 𝑇, isto é, 𝜓(𝑋�) = 𝑋�, provando (i).

Provemos (ii). Seja 𝑓:𝐴 ⟶ 𝑍 a bijeção obtida da hipótese de que 𝑍 ≈ 𝐴.

Definamos 𝐹:℘(𝐴) ⟶℘(𝐴) por 𝐹(𝑋) = (𝐴 ∖ 𝐵) ∪ 𝑓[𝑋], para todo 𝑋 ⊆ 𝐴. Obviamente, se

𝑋 ⊆ 𝑌 ⊆ 𝐴, então 𝑓[𝑋] ⊆ 𝑓[𝑌] e consequentemente 𝐹(𝑋) ⊆ 𝐹(𝑌). Pelo item (i) provado

acima, segue que existe 𝐶 ⊆ 𝐴 tal que 𝐶 = (𝐴 ∖ 𝐵) ∪ 𝑓[𝐶]; seja 𝐷 = 𝐴 ∖ 𝐶.

Como 𝐶 ∩𝐷 = ∅, podemos definir a função 𝑔:𝐴 ⟶ (𝑓[𝐶]∪ 𝐷) por

𝑔(𝑥) = �𝑓(𝑥), se 𝑥 ∈ 𝐶

𝑥 , se 𝑥 ∈ 𝐷.

Como 𝑓 é bijetora por hipótese, segue que 𝑔 ↾ 𝐶 e 𝑔 ↾ 𝐷 são bijeções sobre 𝑓[𝐶]

e 𝐷, respectivamente, acarretando que 𝑔 é uma bijeção de 𝐴 sobre 𝑓[𝐶] ∪𝐷. Finalmente,

como ℑ(𝑓) = 𝑍 ⊆ 𝐵 , segue que 𝑓[𝐶] ⊆ 𝐵. Por outro lado,

𝐷 = 𝐴 ∖ 𝐶 = 𝐴 ∖ �(𝐴 ∖ 𝐵) ∪ 𝑓[𝐶]�,

82

donde segue 𝐷 ⊆ 𝐵. Dessa forma, 𝑓[𝐶] ∪𝐷 ⊆ 𝐵. A inclusão contrária segue imediata: para

𝑏 ∈ 𝐵 qualquer, temos 𝐵 ⊆ 𝐴 e consequentemente 𝑔(𝑏) está definida; se 𝑏 ∈ 𝐶 e 𝑏 ∉ 𝑓[𝐶]

teríamos pela definição de 𝐶 que 𝑏 ∈ 𝐴 ∖ 𝐵, logo 𝑏 ∈ 𝑓[𝐶] ⊆ 𝑓[𝐶]∪𝐷; caso contrário, isto é,

se 𝑏 ∉ 𝐶 então 𝑏 ∈ 𝐴 ∖ 𝐶 = 𝐷, e 𝐷 ⊆ 𝑓[𝐶]∪𝐷. Portanto, 𝑓[𝐶]∪ 𝐷 = 𝐵. Q.E.D.

Teorema 3.12 (Teorema de Cantor-Bernstein). Para quaisquer conjuntos 𝐴 e 𝐵,

se 𝐴 ≾ 𝐵 e 𝐵 ≾ 𝐴 então 𝐴 ≈ 𝐵.

Demonstração.

Se 𝐴 ≾ 𝐵 e 𝐵 ≾ 𝐴, então existem injeções 𝑓:𝐴 ⟶ 𝐵 e 𝑔:𝐵 ⟶ 𝐴. Mostraremos

que 𝐴 ≈ 𝐵. Primeiramente, notemos que a função 𝑔 ∘ 𝑓:𝐴⟶ 𝐴 é injetora, por ser a

composição de injeções. Além disso, como 𝑓[𝐴] ⊆ 𝐵, segue que

[∗] 𝑔�𝑓[𝐴]� ⊆ 𝑔[𝐵]

e, por sua vez,

[∗∗] 𝑔[𝐵] ⊆ 𝐴.

Observando que 𝑔�𝑓[𝐴]� = ℑ(𝑔 ∘ 𝑓), decorre que 𝐴 ≈ 𝑔�𝑓[𝐴]�, haja vista que

𝑔 ∘ 𝑓:𝐴 ⟶ 𝑔�𝑓[𝐴]� é uma bijeção. Por [∗], [∗∗] e pelo lema anterior, inferimos 𝑔[𝐵] ≈ 𝐴 e,

como 𝑔:𝐵 ⟶ 𝑔[𝐵] é uma bijeção, obtemos 𝑔[𝐵] ≈ 𝐵 e, consequentemente, 𝐵 ≈ 𝐴. Q.E.D.

Teorema 3.13 (Teorema de Cantor). (∀𝑋)�𝑋 ≺ ℘(𝑋)�.

Demonstração.

A função 𝑔:𝑋 ⟶ ℘(𝑋) dada por 𝑔(𝑥) = {𝑥}, para todo 𝑥 ∈ 𝑋 é claramente uma

injeção, donde inferimos 𝑋 ≾ ℘(𝑋) . Se mostrarmos que não existe função sobrejetora de 𝑋

sobre ℘(𝑋), seguirá que não existe bijeção de 𝑋 sobre ℘(𝑋) e, consequentemente, não poderá

haver injeção de ℘(𝑋) em 𝑋, em vista do Teorema de Cantor-Bernstein.

Seja 𝜑:𝑋 ⟶ ℘(𝑋) uma função qualquer e considere o conjunto

𝑆 = {𝑥 ∈ 𝑋|𝑥 ∉ 𝜑(𝑥)} ∈ ℘(𝑋).

Pela definição de 𝑆, para 𝑥 qualquer vale que 𝑥 ∈ 𝑆 se, e somente se, 𝑥 ∉ 𝜑(𝑥).

Se existisse 𝑧 ∈ 𝑋 tal que 𝜑(𝑧) = 𝑆, teríamos

𝑧 ∈ 𝜑(𝑧) ⟺ 𝑧 ∉ 𝜑(𝑧),

absurdo. Portanto, 𝜑 não pode ser sobrejetora. Q.E.D.

83

Algo similar à composição de funções, e igualmente importante, é o que Miraglia

(1991, p. 32) denomina de colagem de funções. A ideia é simples: dadas duas funções 𝑓 e 𝑔,

queremos obter uma nova função que se comporte como 𝑓 e 𝑔 em seus respectivos domínios,

fazendo 𝑓 ∪ 𝑔. Fica claro pela definição de função que para não haver conflitos no domínio

(um elemento com duas imagens distintas), é preciso que 𝑓(𝑥) = 𝑔(𝑥) para todo 𝑥

pertencente à interseção dos domínios.

Definição 3.31. Duas funções 𝑓 e 𝑔 são compatíveis se 𝑓(𝑥) = 𝑔(𝑥) para todo

𝑥 ∈ 𝔇(𝑓) ∩𝔇(𝑔). Um conjunto de funções 𝐹 é um sistema compatível de funções se

quaisquer duas funções de 𝐹 são compatíveis.

Obviamente, duas funções 𝑓 e 𝑔 são compatíveis se, e somente se, 𝑓 ∪ 𝑔 for uma

função ou, equivalentemente, caso 𝑓 ↾ �𝔇(𝑓) ∩𝔇(𝑔)� = 𝑔 ↾ �𝔇(𝑓) ∩ 𝔇(𝑔)�. Não

provamos tais equivalências, mas demonstramos o teorema seguinte, adaptado de Hrbacek &

Jech (1999, p. 26), que terá grande utilidade no Teorema da Recursão Transfinita, o qual

provaremos no capítulo seguinte.

Teorema 3.14 (Princípio da Colagem de Funções). Se 𝐹 é um sistema de funções

compatíveis, então ⋃𝐹 é uma função tal que 𝔇(⋃𝐹) = ⋃{𝔇(𝑓)|𝑓 ∈ 𝐹}. Além disso,

⋃𝐹 ↾ 𝔇(𝑓) = 𝑓, para toda 𝑓 ∈ 𝐹 (diz-se que ⋃𝐹 estende todas as funções de 𝐹).

Demonstração.

Por simplicidade, chamemos ⋃𝐹 = 𝐹�. 𝐹� é uma relação, pois é a união de

conjuntos formados por pares ordenados e, consequentemente, é um conjunto de pares

ordenados; em particular 𝑓 ⊆ 𝐹�, para qualquer 𝑓 ∈ 𝐹 .

Provemos que ⋃{𝔇(𝑓)|𝑓 ∈ 𝐹} = 𝔇(𝐹�). Se 𝑥 ∈ ⋃{𝔇(𝑓)|𝑓 ∈ 𝐹}, deve haver

algum 𝑓 ∈ 𝐹 tal que 𝑥 ∈ 𝔇(𝑓), donde segue que existe 𝑦 tal que ⟨𝑥, 𝑦⟩ ∈ 𝑓, o que resulta

⟨𝑥, 𝑦⟩ ∈ 𝐹� e assim 𝑥 ∈ 𝔇(𝐹�), mostrando que ⋃{𝔇(𝑓)|𝑓 ∈ 𝐹} ⊆ 𝔇(𝐹�). A outra inclusão se

prova de maneira análoga.

Logo, para 𝑥 ∈ 𝔇(𝐹�), existe 𝑓 ∈ 𝐹 tal que 𝑥 ∈ 𝔇(𝑓) e, consequentemente, existe

um único 𝑦 ∈ ℑ(𝑓) tal que 𝑓(𝑥) = 𝑦 e daí 𝑥𝐹�𝑦. Se existisse 𝑦 ′ tal que 𝑥𝐹�𝑦′, existiria 𝑔 ∈ 𝐹

tal que 𝑥 ∈ 𝔇(𝑔) e 𝑔(𝑥) = 𝑦′. Contudo, 𝑓 e 𝑔 são compatíveis e 𝑥 ∈ 𝔇(𝑔) ∩𝔇(𝑓), o que

acarreta 𝑦′ = 𝑔(𝑥) = 𝑓(𝑥) = 𝑦. Portanto, 𝐹� é função. Como para 𝑓 ∈ 𝐹 qualquer temos

𝑓 ⊆ 𝐹�, segue que 𝐹� ↾ 𝔇(𝑓) = 𝑓. Q.E.D.

84

Teorema 3.15. Seja 𝑋 ≠ ∅. Então existe uma função 𝑓:𝐼 ⟶ 𝑋, para algum

conjunto 𝐼, tal que 𝑋 = {𝑓𝑖|𝑖 ∈ 𝐼}.

Demonstração.

Basta tomar 𝐼 = 𝑋 e definir a relação 𝐼𝑑𝑋 = {⟨𝑥, 𝑦⟩ ∈ 𝑋 × 𝑋|𝑥 = 𝑦}. Claramente

tem-se 𝔇(𝐼𝑑𝑋) = ℑ(𝐼𝑑𝑋) = 𝑋. Além disso, 𝐼𝑑𝑋 é uma função. De fato, sejam 𝑦1, 𝑦2 ∈ 𝑋 tais

que 𝑥𝐼𝑑𝑋𝑦1 e 𝑥𝐼𝑑𝑋𝑦2, da definição de 𝐼𝑑𝑋 decorre que 𝑥 = 𝑦1 e 𝑥 = 𝑦2 e assim 𝐼𝑑𝑋 é uma

função, tal que 𝑋 = ℑ(𝐼𝑑𝑋) = {(𝐼𝑑𝑋)𝑖|𝑖 ∈ 𝐼}. Q.E.D.

Pelo que nos mostrou o teorema anterior, todo conjunto pode ser indexado. Seja

então 𝐴 = {𝑓𝑖|𝑖 ∈ 𝐼}. Geralmente, utilizam-se as convenientes notações abaixo para

representar a união e a interseção de uma família 𝐴 (no caso da interseção, 𝐴 ≠ ∅):

[U] ⋃𝐴 = ⋃{𝑓𝑖|𝑖 ∈ 𝐼} = �𝑓𝑖𝑖∈𝐼

;

[I] ⋂𝐴 = ⋂{𝑓𝑖|𝑖 ∈ 𝐼} = �𝑓𝑖𝑖∈𝐼

.

Notemos que, como numa relação qualquer 𝑅 vale 𝔇(𝑅) ≠ ∅⟺ ℑ(𝑅) ≠ ∅, tem-

se {𝑓𝑖|𝑖 ∈ 𝐼} ≠ ∅⟺ 𝐼 ≠ ∅. Além disso, com o mesmo intuito da Definição 2.19,

consideramos conjuntos da forma {𝜏(𝑓𝑖)|𝑖 ∈ 𝐼}, apesar de não formalizarmos tal forma de

representação. Tais notações permitem generalizar de maneira mais clara as leis de

distributividade da interseção e da união, bem como as chamadas Leis de De Morgan.

Lema 3.4.

(∀𝑥)(∀𝑌)�𝑌 = {𝑓𝑖|𝑖 ∈ 𝐼} ⟹ �𝑥 ∈�𝑓𝑖𝑖∈𝐼

⟺ (∃𝑖)(𝑖 ∈ 𝐼 ∧ 𝑥 ∈ 𝑓𝑖)�� .

Demonstração.

Considere 𝑌 indexado por uma função 𝑓 com 𝔇(𝑓) = 𝐼. Decorre de [U] e dos

teoremas já provados sobre a união que

[†] 𝑥 ∈ �𝑓𝑖𝑖∈𝐼

⟺ 𝑥 ∈ ⋃𝑌⟺ (∃𝑧)(𝑧 ∈ 𝑌 ∧ 𝑥 ∈ 𝑧).

Mas 𝑌 = {𝑓𝑖|𝑖 ∈ 𝐼} = ℑ(𝑓). Assim, 𝑧 ∈ 𝑌 se, e somente se, existe 𝑖 ∈ 𝐼 tal que

𝑓𝑖 = 𝑧. Dessa forma, temos em [†]

85

𝑥 ∈�𝑓𝑖𝑖∈𝐼

⟺ (∃𝑖)(𝑖 ∈ 𝐼 ∧ 𝑥 ∈ 𝑓𝑖).

Q.E.D.

Lema 3.5.

(∀𝑥)(∀𝑌)�𝑌 ≠ ∅∧ 𝑌 = {𝑓𝑖|𝑖 ∈ 𝐼} ⟹ �𝑥 ∈ �𝑓𝑖𝑖∈𝐼

⟺ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝑓𝑖)��.

Demonstração.

Considere o conjunto 𝑌 ≠ ∅ indexado por uma função 𝑓 com 𝔇(𝑓) = 𝐼. Pelo que

vimos em [I], bem como pelas propriedades da interseção, temos

𝑥 ∈ �𝑓𝑖𝑖∈𝐼

⟺ 𝑥 ∈ ⋂𝑌⟺ (∀𝑧)(𝑧 ∈ 𝑌 ⟹ 𝑥 ∈ 𝑧).

Como 𝑌 = {𝑓𝑖|𝑖 ∈ 𝐼} = ℑ(𝑓), 𝑧 ∈ 𝑌 se e só se existe 𝑖 ∈ 𝐼 tal que 𝑓𝑖 = 𝑧, logo

𝑥 ∈ �𝑓𝑖𝑖∈𝐼

⟺ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝑓𝑖).

Q.E.D.

Teorema 3.16 (Leis de De Morgan). Seja 𝐵 um conjunto qualquer e 𝐴 =

{𝑓𝑖|𝑖 ∈ 𝐼} uma família não vazia de conjuntos. Então

(i) 𝐵 ∖�𝑓𝑖𝑖∈𝐼

= �(𝐵 ∖ 𝑓𝑖)𝑖∈𝐼

;

(ii) 𝐵∖�𝑓𝑖𝑖∈𝐼

= �(𝐵 ∖ 𝑓𝑖)𝑖∈𝐼

.

Demonstração.

Seja 𝑥 um elemento qualquer. Notemos primeiramente que se 𝐼 ≠ ∅, então

[†] 𝑥 ∈ 𝐵 ⟺ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝐵).

De fato, se 𝑥 ∈ 𝐵, então 𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝐵 é verdadeiro para qualquer 𝑖. A recíproca

é obviamente verdadeira, uma vez que 𝐼 ≠ ∅.

Provemos (i). Pelas propriedades das operações entre conjuntos, temos

𝑥 ∈ 𝐵 ∖�𝑓𝑖𝑖∈𝐼

⟺ 𝑥 ∈ 𝐵 ∧ ¬�𝑥 ∈�𝑓𝑖𝑖∈𝐼

� ⟺ 𝑥 ∈ 𝐵 ∧ ¬�(∃𝑖)(𝑖 ∈ 𝐼 ∧ 𝑥 ∈ 𝑓𝑖)�⟺

86

⟺ 𝑥 ∈ 𝐵 ∧ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∉ 𝑓𝑖),

mas, devido a [†],

𝑥 ∈ 𝐵 ∧ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∉ 𝑓𝑖)⟺ (∀𝑖)�(𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝐵) ∧ (𝑖 ∈ 𝐼 ⟹ 𝑥 ∉ 𝑓𝑖)�⟺

⟺ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝐵 ∖ 𝑓𝑖)⟺ 𝑥 ∈�(𝐵 ∖ 𝑓𝑖)𝑖∈𝐼

.

Da transitividade da equivalência e do Axioma da Extensão obtemos a primeira

igualdade. Provemos (ii). Para 𝑥 qualquer,

𝑥 ∈ 𝐵 ∖�𝑓𝑖𝑖∈𝐼

⟺ 𝑥 ∈ 𝐵 ∧ ¬ �𝑥 ∈�𝑓𝑖𝑖∈𝐼

� ⟺ 𝑥 ∈ 𝐵 ∧ ¬�(∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝑓𝑖)�⟺

⟺ 𝑥 ∈ 𝐵 ∧ (∃𝑖)(𝑖 ∈ 𝐼 ∧ 𝑥 ∉ 𝑓𝑖)⟺ (∃𝑖)(𝑖 ∈ 𝐼 ∧ 𝑥 ∈ 𝐵 ∖ 𝑓𝑖) ⟺ 𝑥 ∈�(𝐵 ∖ 𝑓𝑖)𝑖∈𝐼

.

A igualdade segue da transitividade da equivalência e do Axioma da Extensão.

Q.E.D.

Corolário 3.5. Sejam 𝑋, 𝑌 e 𝑍 conjuntos quaisquer. Então:

(i) 𝑋 ∖ (𝑌 ∪ 𝑍) = (𝑋∖ 𝑌) ∩ (𝑋∖ 𝑍) ;

(ii) 𝑋 ∖ (𝑌 ∩ 𝑍) = (𝑋∖ 𝑌) ∪ (𝑋∖ 𝑍) .

Demonstração.

Basta tomar 𝑓: {𝑍, 𝑌} ⟶ {𝑍, 𝑌} dada por 𝑓𝑖 = 𝑖, para todo 𝑖 ∈ {𝑍, 𝑌}. Obviamente

𝑓 é uma função e {𝑍, 𝑌} = �𝑓𝑖�𝑖 ∈ {𝑍, 𝑌}�. Pelo teorema anterior temos

𝑋 ∖ (𝑌 ∪ 𝑍) = 𝑋 ∖ � 𝑓𝑖𝑖∈{𝑍, 𝑌}

= � (𝑋 ∖ 𝑓𝑖)𝑖∈{𝑍, 𝑌}

= ⋂{𝑋 ∖ 𝑓𝑍, 𝑋 ∖ 𝑓𝑌} = (𝑋 ∖ 𝑍) ∩ (𝑋 ∖ 𝑌),

o que prova (i). Analogamente prova-se (ii). Q.E.D.

Teorema 3.17 (Leis Distributivas da União e da Interseção). Sejam 𝑋 =

{𝐹𝑎|𝑎 ∈ 𝐴} e 𝑌 = {𝐺𝑏|𝑏 ∈ 𝐵} dois conjuntos indexados. Então:

(i) ��𝐹𝑎𝑎∈𝐴

� ∩ ��𝐺𝑏𝑏∈𝐵

� = � (𝐹𝑎 ∩ 𝐺𝑏)⟨𝑎,𝑏⟩∈𝐴×𝐵

;

(ii) ��𝐹𝑎𝑎∈𝐴

� ∪ ��𝐺𝑏𝑏∈𝐵

�= � (𝐹𝑎 ∪ 𝐺𝑏)⟨𝑎,𝑏⟩∈𝐴×𝐵

.

87

Demonstração.

Seja 𝑥 qualquer. Segue do Lema 3.4 e dos resultados já vistos que

𝑥 ∈ ��𝐹𝑎𝑎∈𝐴

� ∩ ��𝐺𝑏𝑏∈𝐵

� ⟺ 𝑥 ∈ �𝐹𝑎𝑎∈𝐴

∧ 𝑥 ∈ �𝐺𝑏𝑏∈𝐵

⟺

⟺ (∃𝑎)(𝑎 ∈ 𝐴 ∧ 𝑥 ∈ 𝐹𝑎) ∧ (∃𝑏)(𝑏 ∈ 𝐵 ∧ 𝑥 ∈ 𝐺𝑏)⟺

⟺ (∃𝑎)(∃𝑏)(𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵 ∧ 𝑥 ∈ 𝐹𝑎 ∩ 𝐺𝑏)⟺

⟺ (∃𝑎)(∃𝑏)(⟨𝑎, 𝑏⟩ ∈ 𝐴 × 𝐵 ∧ 𝑥 ∈ 𝐹𝑎 ∩ 𝐺𝑏) ⟺

⟺ 𝑥 ∈ � (𝐹𝑎 ∩ 𝐺𝑏)⟨𝑎,𝑏⟩∈𝐴×𝐵

.

A igualdade de (i) segue então da transitividade da equivalência e do Axioma da

Extensão. (ii) se prova de maneira análoga, levando-se em consideração o Lema 3.5. Q.E.D.

Corolário 3.6. Sejam 𝐴, 𝐵, e 𝐶 conjuntos quaisquer. São verdadeiras as

igualdades:

(i) (𝐴∪ 𝐵) ∩ 𝐶 = (𝐴 ∩ 𝐶) ∪ (𝐵 ∩ 𝐶);

(ii) (𝐴∩ 𝐵) ∪ 𝐶 = (𝐴 ∪ 𝐶) ∩ (𝐵 ∪ 𝐶).

Demonstração.

Análoga à demonstração do Corolário 3.5. Q.E.D.

Teorema 3.18. Seja 𝜑(𝑥, 𝑦) uma condição funcional em 𝑥. Então, para qualquer

conjunto 𝐴 existe uma única função 𝜑𝐴 cujo domínio está contido em 𝐴 tal que 𝜑𝐴(𝑎) =

𝑦 ⟺ 𝜑(𝑎, 𝑦).

Demonstração.

Pelo Axioma da Substituição, existe um conjunto 𝐵 tal que

(∀𝑤)�𝑤 ∈ 𝐵 ⟺ (∃𝑥)�𝑥 ∈ 𝐴 ∧ 𝜑(𝑥, 𝑤)��.

Basta então definir 𝜑𝐴 = {⟨𝑥, 𝑦⟩ ∈ 𝐴 × 𝐵|𝜑(𝑥, 𝑦)}. Claramente, 𝜑𝐴 é uma

função, com 𝔇(𝜑𝐴) ⊆ 𝐴, cuja unicidade decorre do Axioma da Extensão. Q.E.D.

Definição 3.32. Seja 𝜑(𝑥, 𝑦) uma condição funcional. A operação induzida por 𝜑

é a relação funcional 𝐹(𝑥) = 𝑦 ⟺ 𝜑(𝑥, 𝑦). Para qualquer conjunto 𝐴, 𝐹 ↾ 𝐴 denota a

restrição de 𝐹 aos membros de 𝐴, isto é, 𝐹 ↾ 𝐴 = {⟨𝑥, 𝑦⟩|𝐹(𝑥) = 𝑦 ∧ 𝑥 ∈ 𝐴}. Se 𝐹(𝑥, 𝑦) = 𝑧

for uma operação (dita em duas variáveis), usamos a notação 𝐹𝑥 para indicar 𝐹𝑥(𝑦) = 𝐹(𝑥, 𝑦).

88

A expressão “funcional” diz respeito ao fato de existir um único 𝑦 para o qual

𝜑(𝑥, 𝑦) é verdadeira, o que justifica a igualdade 𝐹(𝑥) = 𝑦 segundo os critérios adotados no

início do Capítulo 2 — ver Critério da definição por identidade na seção 2.1.

Por exemplo, considerando 𝜑(𝑥, 𝑦) ≡ (∀𝑤)(𝑤 ⊆ 𝑥 ⟺ 𝑤 ∈ 𝑦), temos a relação

funcional ℘(𝑥) = 𝑦 ⟺ 𝜑(𝑥, 𝑦), que de modo geral não se comporta como função, pois todo

conjunto possui a sua respectiva potência, o que acarretaria um domínio “muito grande”.

Porém, para qualquer conjunto 𝐴, ℘ ↾ 𝐴 seria uma função, pois restringiríamos o escopo da

operação ℘ aos membros de 𝐴.

Um exemplo de operação da forma 𝐹(𝑥, 𝑦) = 𝑧 pode ser dado por ⋂(𝑥, 𝑦) =

𝑧 ⟺ 𝑥 ∩ 𝑦 = 𝑧. Funções definidas por meio de relações/condições funcionais são de grande

importância no próximo capítulo.

Teorema 3.19. (∀𝐴)(∀𝐵)(∃!𝒵)(𝑓 ∈ 𝒵 ⟺ 𝑓:𝐴 ⟶ 𝐵).

Demonstração.

O Teorema 2.6 garante a existência e unicidade do conjunto 𝒵, tal que

𝒵 = {𝑓 ∈ ℘(𝐴 × 𝐵)|𝑓:𝐴 ⟶ 𝐵}.

Afirmamos que 𝒵 satisfaz a equivalência

(∗) 𝑓 ∈ 𝒵 ⟺ 𝑓:𝐴 ⟶ 𝐵.

Obviamente, 𝑓 ∈ 𝒵 ⟹ 𝑓:𝐴 ⟶ 𝐵 devido à definição de 𝒵. Suponha que 𝑓 seja

uma função de 𝐴 em 𝐵. Como 𝑓 é uma relação, decorre que 𝑎 ∈ 𝑓 se, e somente se, existem 𝑥

e 𝑦 tais que 𝑎 = ⟨𝑥, 𝑦⟩. Como 𝔇(𝑓) = 𝐴 e ℑ(𝑓)⊆ 𝐵 segue que ⟨𝑥, 𝑦⟩ ∈ 𝐴 × 𝐵. Dessa forma,

𝑓 ⊆ 𝐴 × 𝐵 e daí 𝑓 ∈ ℘(𝐴 × 𝐵). Assim, 𝑓 ∈ 𝒵. Portanto,

𝑓 ∈ 𝒵 ⟺ 𝑓:𝐴⟶ 𝐵.

Q.E.D.

Teorema 3.20. Seja 𝑆 = ⟨𝑆𝑖|𝑖 ∈ 𝐼⟩. Existe um único conjunto 𝒫 tal que

𝑓 ∈ 𝒫 ⟺ 𝑓 é uma função, 𝔇(𝑓) = 𝐼 e 𝑓𝑖 ∈ 𝑆𝑖, para todo 𝑖 ∈ 𝐼.

Demonstração.

Análoga à demonstração do teorema anterior. Basta observar que o conjunto

89

𝒫 = �𝑓 ∈ ℘�𝐼 × �𝑆𝑖𝑖∈𝐼

� �𝑓:𝐼 ⟶ �𝑆𝑖𝑖∈𝐼

∧ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑓𝑖 ∈ 𝑆𝑖)�

satisfaz à condição da tese. Q.E.D.

Os dois teoremas anteriores nos permitem definir o conjunto de todas as funções

de 𝐴 em 𝐵, denotado por 𝐵𝐴 , cuja existência é assegurada pelo Teorema 3.19, e o produto

(cartesiano) do sistema indexado 𝑆, denotado por ∏𝑆, cuja existência decorre do Teorema

3.20.

Definição 3.33. 𝐵𝐴 = {𝑓|𝑓:𝐴 ⟶ 𝐵}.

Definição 3.34. Seja 𝑆 = ⟨𝑆𝑖|𝑖 ∈ 𝐼⟩. Definimos o conjunto ∏ 𝑆𝑖∈𝐼 por

�𝑆𝑖𝑖∈𝐼

= �𝑓�𝑓: 𝐼 ⟶�𝑆𝑖𝑖∈𝐼

∧ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑓𝑖 ∈ 𝑆𝑖)�.

Quando não houver risco de confusão, pode-se denotá-lo simplesmente por ∏𝑆.

Como veremos no próximo capítulo, o conjunto ∏𝑆 permite uma generalização da ideia de

produto cartesiano, não apenas para o produto de um número finito qualquer de conjuntos,

mas também para infinitos conjuntos, pois seus membros podem ser interpretados como listas

ordenadas de conjuntos. Há ainda outro aspecto interessante sobre os membros de ∏𝑆.

Primeiramente, 𝑆 é uma função que indexa algum conjunto 𝑋, isto é, 𝑋 =

{𝑆𝑖|𝑖 ∈ 𝐼}. Em segundo, cada membro de ∏𝑆 é uma função 𝑓: 𝐼 ⟶ ⋃𝑋, isto é, 𝑓 leva cada

membro do conjunto de índices 𝐼 em algum membro 𝑌 de 𝑋, ou seja 𝑓𝑖 ∈ 𝑌, para algum

𝑌 ∈ 𝑋. Finalmente, este 𝑌 ao qual 𝑓𝑖 pertence é tal que 𝑆(𝑖) = 𝑌 . Em outras palavras, 𝑓

“escolhe” um elemento em cada membro não vazio de {𝑆𝑖|𝑖 ∈ 𝐼}. Formalmente, adotamos a

seguinte definição dada por Hrbacek & Jech (1999).

Definição 3.35. Seja 𝑆 ≠ ∅ uma família não vazia de conjuntos. Uma função

𝑓: 𝑆 ⟶ ⋃𝑆 é uma função escolha para 𝑆 se 𝑓(𝑋) ∈ 𝑋 para todo 𝑋 ≠ ∅ tal que 𝑋 ∈ 𝑆.

Notemos que se 𝑓:℘(𝑋) ⟶𝑋 é tal que 𝑓(𝐴) ∈ 𝐴 para todo subconjunto não

vazio 𝐴 de 𝑋, então 𝑓 é uma função escolha, pois 𝑋 = ⋃�℘(𝑋)�. Na seção 2.3, definimos o

produto externo de uma família disjunta de conjuntos 𝑡, e adotamos a notação de Fraenkel,

Bar-Hillel & Levy (1973), ∏ 𝑡. O produto definido acima é simplesmente o correspondente

do produto externo interpretado com o conceito de função. De fato, lembremo-nos

primeiramente de que ∏ 𝑡 é o conjunto cujos membros são subconjuntos de ⋃𝑡 tais que existe

90

um único membro de cada membro de 𝑡 pertencente a eles. Seja 𝑧 ∈ ∏ 𝑡. Para todo 𝑣 ∈ 𝑡,

existe um único 𝑎 ∈ 𝑣 tal que 𝑧 ∩ 𝑣 = {𝑎} e assim basta definir 𝑓(𝑣) = 𝑣 ∩ 𝑧 , claramente

𝑓: 𝑡 ⟶ ⋃𝑡 é uma função escolha para 𝑡.

O Axioma da Escolha (A8) postulado na página 44 é equivalente à afirmação de

que para toda família de conjuntos existe uma função escolha. A fim de utilizarmos tal versão

do Axioma ao longo do texto, provamos o teorema seguinte, com o qual findamos este

capítulo.

Teorema 3.21. As seguintes afirmações são equivalentes em ZF:

(AC1) Existe uma função escolha para toda família disjunta 𝔉 de conjuntos não

vazios;

(A8) Para qualquer família disjunta 𝒯 de conjuntos não vazios existe um

conjunto 𝒞 ⊆ ⋃𝒯 tal que 𝒞 ∩𝒱 = {𝑎}, com 𝑎 ∈ 𝒱, para todo 𝒱 ∈ 𝒯;

(AC2) Para qualquer conjunto 𝒜 tal que ∅ ∉ 𝒜 existe uma função 𝑓 cujo

domínio é 𝒜, tal que 𝑓(𝑋) ∈ 𝑋, para todo 𝑋 ∈ 𝒜;

(AC3) Existe uma função escolha para qualquer família não vazia de conjuntos.

Demonstração.

Provemos que (AC1) ⟹ (A8).

Seja 𝒯 ≠ ∅ uma família disjunta de conjuntos tal que ∅ ∉ 𝒯. Decorre de (AC1)

que existe uma função 𝑓:𝒯⟶ ⋃𝒯 tal que 𝑓(𝑋) ∈ 𝑋, para todo 𝑋 ∈ 𝒯. Notemos que para 𝑥

qualquer,

𝑥 ∈ ℑ(𝑓)⟺ (∃𝑋)(𝑋 ∈ 𝒯 ∧ 𝑓(𝑋) = 𝑥 ∧ 𝑥 ∈ 𝑋).

Então, para 𝒱 ∈ 𝒯 arbitrário,

𝑥 ∈ ℑ(𝑓)∩ 𝒱 ⟺ (∃𝑋)(𝑋 ∈ 𝒯 ∧ 𝑓(𝑋) = 𝑥 ∧ 𝑥 ∈ 𝑋) ∧ 𝑥 ∈ 𝒱,

mas como 𝒯 é uma família disjunta, segue que 𝑋 = 𝒱 e daí 𝑥 ∈ ℑ(𝑓) ∩𝒱 ⟺ 𝑓(𝒱) = 𝑥.

Como 𝑓 é função, tal 𝑥 é único e, portanto, ℑ(𝑓) ∩𝒱 = {𝑓(𝒱)} = {𝑥}, para todo 𝒱 ∈ 𝒯 .

Desta forma, basta tomar 𝒞 = ℑ(𝑓).

Mostremos que (A8) ⟹ (AC2).

Seja 𝒜 um conjunto não vazio tal que ∅ ∉ 𝒜. Então, para todo 𝑠 ∈ 𝒜, existe

𝑢 ∈ 𝑠. Notemos que o conjunto {𝑠} × 𝑠 pertence ao conjunto ℘(𝒜 × ⋃𝒜). Com efeito, se

⟨𝑥, 𝑦⟩ ∈ {𝑠} × 𝑠, então 𝑥 = 𝑠 e 𝑦 ∈ 𝑠, donde segue que 𝑥 ∈ 𝒜 e 𝑦 ∈ ⋃𝒜 e, por conseguinte,

⟨𝑥, 𝑦⟩ ∈ 𝒜 × ⋃𝒜, ou seja, {𝑠} × 𝑠 ⊆ 𝒜 × ⋃𝒜. Assim, faz sentido definir

91

𝑇 = �{𝑠} × 𝑠�𝑠 ∈ 𝒜� ⊆ ℘(𝒜 × ⋃𝒜).

Afirmamos que 𝑇 é uma família disjunta de conjuntos não vazios. De fato, se

𝑤 ∈ 𝑇 então 𝑤 = {𝑠} × 𝑠 e, como 𝑠 ∈ 𝒜 e ∅ ∉ 𝒜, segue que {𝑠} e 𝑠 são não vazios, donde

obtemos 𝑤 ≠ ∅ e daí ∅ ∉ 𝑇. Para 𝑤1, 𝑤2 ∈ 𝑇 quaisquer, suponha 𝑤1 ≠ 𝑤2 . Logo, existem 𝑠1,

𝑠2 ∈ 𝒜 tais que 𝑤1 = {𝑠1} × 𝑠1, 𝑤2 = {𝑠2} × 𝑠2 e 𝑠1 ≠ 𝑠2 . Se, por absurdo, existir 𝑎 tal que

𝑎 ∈ 𝑤1 ∩𝑤2 , então 𝑎 = ⟨𝑥, 𝑦⟩, com ⟨𝑥, 𝑦⟩ ∈ ({𝑠1} × 𝑠1) ∩ ({𝑠2} × 𝑠2), donde conclui-se que

𝑥 = 𝑠1 = 𝑠2, uma contradição. Portanto, 𝑇 é uma família disjunta de conjuntos, com ∅ ∉ 𝑇.

Por (A8) existe 𝒞 ⊆ ⋃𝑇 tal que 𝒞 ∩𝒰 = {𝒞𝒰}, para todo 𝒰 ∈ 𝑇.

Claramente 𝒞 é uma relação, pois se 𝑤 ∈ 𝒞 então 𝑤 ∈ {𝑠} × 𝑠, para algum 𝑠 ∈ 𝒜.

Tomemos 𝑎 e 𝑏 quaisquer. Se 𝑎𝒞𝑏 então 𝑎 ∈ {𝑠} e 𝑏 ∈ 𝑠, para algum 𝑠 ∈ 𝒜, donde

consequentemente obtemos ℑ(𝒞)⊆ ⋃𝒜, e como 𝑎 = 𝑠, 𝔇(𝒞)⊆ 𝒜. Se 𝑎� ∈ 𝒜 então

{𝑎�} × 𝑎� ∈ 𝑇, mas 𝒞 ∩ ({𝑎�} × 𝑎�) é um conjunto unitário por hipótese e assim existe ⟨𝑥, 𝑦⟩ ∈ 𝒞

tal que 𝑥 = 𝑎� ∈ 𝔇(𝒞). Logo, 𝔇(𝒞) = 𝒜. Finalmente, se existir 𝑏′ ≠ 𝑏 tal que 𝑎𝒞𝑏 e 𝑎𝒞𝑏′,

então 𝒞 ∩ ({𝑎} × 𝑎) = {⟨𝑎, 𝑏⟩, ⟨𝑎, 𝑏′⟩}, absurdo. Portanto 𝒞 é uma função de 𝒜 em ⋃𝒜, tal

que para qualquer 𝑋 ∈ 𝒜, 𝒞(𝑋) ∈ 𝑋, isto é, 𝑓 é uma função escolha para 𝒜.

Suponha a validade de (AC2) e tome 𝐴 ≠ ∅. Vamos provar que vale (AC3).

Se ∅ ∉ 𝐴 então não há o que provar. Se 𝐴 for uma família de conjuntos tal que

∅ ∈ 𝐴, basta tomarmos uma função escolha 𝑓 para 𝐵 = 𝐴 ∖ {∅}, e fixar 𝑎 ∈ ⋃𝐴 qualquer. A

função 𝑔 = 𝑓 ∪ {⟨∅, 𝑎⟩} é claramente uma função escolha para 𝐴, o que prova (AC3).

É óbvio que (AC3) ⟹ (AC1). Q.E.D.

92

Capítulo 4 — Conjuntos Bem Ordenados e Números Ordinais

Tratamos a partir daqui sobre a fundamentação dos números ordinais dentro da

Teoria dos Conjuntos, nos quais se encontram o conjunto dos números naturais. Provamos o

Teorema da Recursão Transfinita, entre outros importantes resultados da Teoria dos

Conjuntos referentes aos números ordinais. Salvo menção contrária, baseamo-nos em

Hrbacek & Jech (1999) ao longo deste capítulo.

4.1. Conjuntos Bem Ordenados

Relações de ordem sobre um conjunto intuitivamente funcionam como um meio

de comparar os elementos do conjunto por meio de algum critério. Além disso,

Em toda a Matemática, e em particular, para a generalização dos processos de contagem dos conjuntos finitos para os conjuntos infinitos, a teoria da ordem [relações de ordem] ocupa um importante papel. As definições básicas são simples. A única coisa da qual se deve lembrar é que a motivação primária vem da relação ‘menor do que ou igual’ […]. (HALMOS, 1960, p. 54, tradução nossa).

Os dois tipos básicos de relações de ordem foram definidos no capítulo anterior:

parcial e estrita. Numa relação de ordem estrita, se 𝑥 está relacionado com 𝑦 diz-se que 𝑥 é

menor do que 𝑦; no caso de 𝑥 estar relacionado com 𝑦 por uma ordem parcial, diz-se que 𝑥 é

menor do que ou igual a 𝑦. De fato, enquanto uma ordem parcial permite que um elemento do

conjunto se relacione consigo mesmo, na ordem estrita isso não acontece. Apesar disso,

ordens parciais e estritas relacionam-se profundamente, como mostramos no teorema

seguinte.

Teorema 4.1. Seja 𝑋 ≠ ∅ um conjunto qualquer, tal que ⟨𝑋, ≺⟩ é um conjunto

estritamente ordenado e ⟨𝑋, ≤⟩ é um conjunto parcialmente ordenado. Então 𝑋 é

parcialmente ordenado pela relação ≼ e estritamente ordenado pela relação <, tais que

≼= {⟨𝑥, 𝑦⟩ ∈ 𝑋 × 𝑋|𝑥 ≺ 𝑦 ∨ 𝑥 = 𝑦} e <= {⟨𝑥, 𝑦⟩ ∈ 𝑋 × 𝑋|𝑥 ≤ 𝑦 ∧ 𝑥 ≠ 𝑦}.

Demonstração.

93

A reflexividade de ≼ é imediata, bem como a transitividade. A antissimetria de ≼

decorre da assimetria de ≺. De fato,

𝑥 ≼ 𝑦 ∧ 𝑦 ≼ 𝑥 ⟺ (𝑥 ≺ 𝑦 ∨ 𝑥 = 𝑦) ∧ (𝑦 ≺ 𝑥 ∨ 𝑥 = 𝑦) ⟺ (𝑥 ≺ 𝑦 ∧ 𝑦 ≺ 𝑥) ∨ 𝑥 = 𝑦 ⟺

⟺ 𝑥 = 𝑦.

Analogamente mostra-se que < é uma ordem estrita em 𝑋. Q.E.D.

Assim, para uma relação de ordem estrita ≺, escrevemos 𝑥 ≼ 𝑦 para indicar que

𝑥 ≺ 𝑦 ou 𝑥 = 𝑦, de tal maneira que ≼ é uma ordem parcial. Convencionamos a partir daqui

que < e ≺ indicam ordens estritas, enquanto que ≤ e ≼ representam as ordens parciais

correspondentes, de acordo com o que fizemos no teorema anterior1. Dada tal convenção,

formulamos as definições abaixo, referentes a conjuntos ordenados2.

Definição 4.1. Seja ⟨𝑊, ≺⟩ um conjunto estritamente ordenado e 𝑋 ⊆ 𝑊.

(i) 𝑎 ∈ 𝑋 é um menor elemento de 𝐴 ⟺ (∀𝑥)(𝑥 ∈ 𝑋 ⟹ 𝑎 ≼ 𝑥);

(ii) 𝑎 ∈ 𝑋 é um elemento mínimo de 𝐴 ⟺ (∀𝑥)�𝑥 ∈ 𝑋 ⟹ ¬(𝑥 ≺ 𝑎)�;

(iii) 𝑎 ∈ 𝑋 é um maior elemento de 𝐴 ⟺ (∀𝑥)(𝑥 ∈ 𝑋 ⟹ 𝑥 ≼ 𝑎);

(iv) 𝑎 ∈ 𝑋 é um elemento máximo de 𝐴 ⟺ (∀𝑥)�𝑥 ∈ 𝑋 ⟹ ¬(𝑎 ≺ 𝑥)�;

(v) 𝑎 ∈ 𝑊 é um limite inferior de 𝑋 em ⟨𝑊, ≺⟩ ⟺ (∀𝑥)(𝑥 ∈ 𝐴 ⟹ 𝑎 ≼ 𝑥);

(vi) 𝑎 ∈ 𝑊 é um ínfimo de 𝑋 em ⟨𝑊, ≺⟩ se, e somente se, 𝑎 é o maior

elemento do conjunto dos limites inferiores de 𝑋 em ⟨𝑊, ≺⟩;

(vii) 𝑎 ∈ 𝑊 é um limite superior de 𝑋 em ⟨𝑊, ≺⟩ ⟺ (∀𝑥)(𝑥 ∈ 𝐴 ⟹ 𝑥 ≼ 𝑎);

(viii) 𝑎 ∈ 𝑊 é um supremo de 𝑋 em ⟨𝑊, ≺⟩ se, e somente se, 𝑎 é o menor

elemento do conjunto dos limites superiores de 𝑋 em ⟨𝑊, ≺⟩.

Proposição 4.1. Seja ⟨𝐴, <⟩ um conjunto ordenado (parcial ou estritamente) e

𝐵 ⊆ 𝐴.

(i) Se existir, o menor elemento de 𝐵 é único, além disso, ele é também o

(único) elemento mínimo;

1 O contexto deixará claro quando 𝑥 ≺ 𝑦 se referir a uma ordem estrita definida em um conjunto e quando se referir à existência de uma injeção de 𝑥 em 𝑦, como estabelecido na Definição 3.30.

2 Tais definições não se restringem necessariamente a conjuntos ordenados. Todavia, neste trabalho focamo-nos em suas aplicações apenas a conjuntos ordenados.

94

(ii) Se existir, o maior elemento de 𝐵 é único, além disso, ele é também o

(único) elemento máximo;

(iii) Se existir, o ínfimo de um conjunto 𝐵 é único;

(iv) Se existir, o supremo de um conjunto 𝐵 é único.

Demonstração.

Provamos apenas (i), as demais afirmações se demonstram de maneira análoga.

Suponha, por absurdo, que 𝑏1, 𝑏2 ∈ 𝐵 sejam dois menores elementos distintos de

𝐵. Logo, para quaisquer 𝑥 ∈ 𝐵, tem-se 𝑏1 ≤ 𝑥 e 𝑏2 ≤ 𝑥; em particular,

𝑏1 ≤ 𝑏2 e 𝑏2 ≤ 𝑏1.

Como 𝑏1 ≠ 𝑏2 por hipótese, resta-nos 𝑏1 < 𝑏2 e 𝑏2 < 𝑏1o que contraria a

assimetria de <, absurdo. Logo, 𝑏1 = 𝑏2. Q.E.D.

As recíprocas das afirmações (i) e (ii) da proposição anterior não são verdadeiras

de modo geral. Consideremos, por exemplo, o conjunto ℕ+ dos números naturais positivos,

parcialmente ordenado pela relação de divisão |, onde 𝑛|𝑚⟺ 𝑛 divide 𝑚, para quaisquer 𝑛,

𝑚 ∈ ℕ. O subconjunto 𝐵 = ℕ ∖ {1} não possui um menor elemento na relação |, pois para

qualquer número 𝑎 ∈ 𝐵 pode-se tomar o número 𝑎 + 1 que não é divisível por 𝑎. Ainda

assim, qualquer número positivo primo 𝑝 é elemento mínimo de 𝐵, uma vez que não existe

qualquer número 𝑥 ∈ 𝐵 ∖ {𝑝} tal que 𝑥|𝑝. Para mais resultados referentes a elementos

máximos e mínimos em relações de ordem, bem como sobre supremo e ínfimo, sugerimos

Hrbacek & Jech (1999) e Suppes (1972).

A Proposição 4.1 justifica as seguintes simbologias.

Definição 4.2. Seja ⟨𝐴, <⟩ um conjunto ordenado e 𝑋 ⊆ 𝐴. Se existirem,

denotamos os seguintes elementos por:

(i) max(𝑋) é o maior elemento de 𝑋;

(ii) min(𝑋) é o menor elemento de 𝑋;

(iii) sup(𝑋) é o supremo de 𝑋;

(iv) inf(𝑋) é o ínfimo de 𝑋.

Definição 4.3. Sejam ⟨𝐴, <⟩ e ⟨𝐵, ≺⟩ conjuntos ordenados. Um isomorfismo entre

𝐴 e 𝐵 é uma função 𝜑:𝐴⟶ 𝐵 bijetora, tal que

95

(∀𝑎1)(∀𝑎2)�𝑎1, 𝑎2 ∈ 𝐴 ⟹ �𝑎1 < 𝑎2 ⟺ 𝜑(𝑎1)≺ 𝜑(𝑎2)��.

Em tal caso, 𝐴 e 𝐵 são ditos isomorfos, ou ainda 𝐴 é isomorfo a 𝐵, o que denotamos por

⟨𝐴, <⟩ ≅ ⟨𝐵, ≺⟩ ou simplesmente 𝐴 ≅ 𝐵. Se 𝐴 = 𝐵, 𝜑 é um automorfismo3.

Teorema 4.2.

(i) Todo conjunto ordenado é isomorfo a si mesmo;

(ii) Se ⟨𝑊1 , ≺⟩ ≅ ⟨𝑊2 , <⟩ então ⟨𝑊2 , <⟩ ≅ ⟨𝑊1 , ≺⟩;

(iii) Dois conjuntos ordenados isomorfos a um terceiro são isomorfos entre si.

Demonstração.

A validade de (i) é imediata: basta tomar a função identidade do conjunto.

Por sua vez, sejam ⟨𝑊1, <⟩ e ⟨𝑊2 , ≺⟩ conjuntos ordenados tais que 𝜑:𝑊1 ⟶ 𝑊2

é um isomorfismo; então 𝜑−1:𝑊2 ⟶𝑊1 é bijetora e, além disso, para 𝑤1, 𝑤2 ∈ 𝑊2

quaisquer, existem 𝑢1, 𝑢2 ∈ 𝑊1 tais que 𝜑(𝑢1) = 𝑤1 e 𝜑(𝑢2) = 𝑤2. Daí, 𝑤1 ≺ 𝑤2 ⟺

𝜑(𝑢1)≺ 𝜑(𝑢2)⟺ 𝑢1 < 𝑢2, mas 𝑢𝑖 = 𝜑−1(𝑤𝑖) para 𝑖 ∈ {1, 2}. Assim, 𝜑−1 é um

isomorfismo, o que prova que 𝑊2 ≅ 𝑊1 . Analogamente, mostra-se (iii). Q.E.D.

Quando a relação de ordem < sobre o conjunto 𝑊 for evidente pelo contexto,

diremos apenas que “𝑊 é um conjunto ordenado” em vez de “⟨𝑊, <⟩ é um conjunto

ordenado”. Além disso, para indicar a restrição de < a um subconjunto 𝑋 de 𝑊, indicamos

⟨𝑋, <⟩ em vez de ⟨𝑋, <∩ (𝑋 × 𝑋)⟩. Também denotamos 𝑥 ≥ 𝑦 e 𝑥 ≽ 𝑦 para significar 𝑦 ≤ 𝑥

e 𝑦 ≼ 𝑥, respectivamente.

Uma ordem total/linear sobre um conjunto 𝑋 é uma relação de ordem (parcial ou

estrita em vista do Teorema 4.1), tal que todo membro de 𝑋 é comparável segundo tal relação

de ordem, isto é: dados dois elementos de 𝑋, ou tais elementos são iguais ou um deles é

menor (na relação) do que o outro. Em conjuntos totalmente ordenados, vale a seguinte

proposição.

Proposição 4.2. Sejam ⟨𝑃, <⟩ e ⟨𝑄, ≺⟩ conjuntos totalmente ordenados, e uma

bijeção ℎ:𝑃 ⟶ 𝑄 tal que ℎ(𝑥)≺ ℎ(𝑦) sempre que 𝑥 < 𝑦, para quaisquer 𝑥, 𝑦 ∈ 𝑃. Então ℎ

é um isomorfismo entre ⟨𝑃, <⟩ e ⟨𝑄, ≺⟩.

3 Adotamos tal notação (≅) para indicar o isomorfismo, de Kunen (1980).

96

Demonstração.

Sejam 𝑝1, 𝑝2 ∈ 𝑃 quaisquer e suponha ℎ(𝑝1) ≺ ℎ(𝑝2). Se, por absurdo,

tivéssemos ¬(𝑝1 < 𝑝2), então 𝑝2 ≤ 𝑝1 , pois < ordena 𝑃 totalmente. Daí, pela hipótese da

proposição, se 𝑝1 = 𝑝2 então ℎ(𝑝1) = ℎ(𝑝2) e se 𝑝2 < 𝑝1 então ℎ(𝑝2) ≺ ℎ(𝑝1), contrariando

a suposição de que ℎ(𝑝1) ≺ ℎ(𝑝2). Portanto, ℎ(𝑝1) ≺ ℎ(𝑝2) ⟹𝑝1 < 𝑝2 . Q.E.D.

Definição 4.4. Seja ⟨𝐿, <⟩ um conjunto totalmente ordenado. Um conjunto 𝑆 ⊆ 𝐿

é um segmento inicial de 𝐿 se 𝑆 ≠ 𝐿 e, para todo 𝑎 ∈ 𝑆, 𝑥 < 𝑎 ⟹ 𝑥 ∈ 𝑆 , para qualquer 𝑥 ∈ 𝐿.

O conjunto dos números reais negativos, por exemplo, é um segmento inicial do

conjunto dos números reais ordenado pela relação ≤ usual, bem como o subconjunto {0, 1, 2}

dos números naturais é também um segmento inicial dos números naturais. A diferença básica

entre esses dois segmentos, além dos conjuntos nos quais estão contidos, reside no fato de o

segundo possuir um menor elemento na relação, o que não ocorre no segmento inicial obtido

dos números reais.

Uma boa ordem/ordenação sobre um conjunto 𝑋 é uma ordem linear4 em 𝑋 na

qual todo subconjunto não vazio de 𝑋 possui um menor elemento, que em vista da Proposição

4.1 (i) é o elemento mínimo de tal subconjunto. Como exemplificado por Aurichi (2011a, p.

3), “uma boa ordem nada mais é que uma fila”.

Com efeito, uma boa ordenação sobre um conjunto pode ser interpretada como um

enfileiramento de seus elementos, de modo que um elemento 𝑥 é menor do que 𝑦 se 𝑥 estiver

mais próximo do início da fila do que 𝑦. Consequentemente, o menor elemento do conjunto

corresponde ao primeiro membro da fila. É o que ocorre, por exemplo, com o conjunto dos

naturais, que é bem ordenado pela relação “<” usual. Formalmente, temos a definição

seguinte.

Definição 4.5. 𝑅 é uma boa ordem (ordenação) sobre 𝑋 se, e somente se, 𝑅 é

linear e todo subconjunto não vazio de 𝑋 possui um menor elemento. Dizemos que ⟨𝑋, 𝑅⟩ é

um conjunto bem ordenado.

4 Pode-se exigir apenas que a relação seja uma ordem parcial ou estrita sobre 𝑋, pois o fato de todo subconjunto não vazio de 𝑋 possuir menor elemento garante que quaisquer dois membros 𝑥 e 𝑦 de 𝑋 sejam comparáveis: basta considerar o subconjunto {𝑥, 𝑦} ⊆ 𝑋 .

97

A importância dos conjuntos bem ordenados reside a princípio no fato de que

conjuntos bem ordenados podem ser comparados entre si, como provaremos posteriormente

no Teorema 4.5. Além disso, num conjunto bem ordenado vale o Princípio da Indução, cujo

Princípio da Indução Natural é apenas um subcaso. Provamos tal afirmação abaixo, adaptada

de Miraglia (1991, p. 46).

Teorema 4.3 (Princípio da Indução para Conjuntos Bem Ordenados). Seja

⟨𝑊, ≺⟩ um conjunto bem ordenado e 𝔓(𝑥) uma condição em 𝑥, possivelmente com

parâmetros. Se 𝔓(min𝑊) e, para qualquer 𝑦 ∈ 𝑊, 𝔓(𝑤) para todo 𝑤 ≺ 𝑦 for suficiente

para 𝔓(𝑦), então 𝔓(𝑎), para todo 𝑎 ∈ 𝑊.

Demonstração.

Seja 𝐴 = {𝑤 ∈ 𝑊|𝔓(𝑤)}. Queremos provar que 𝐴 = 𝑊. Caso 𝑊 = {min𝑊}

então não há o que provar, pois 𝔓(min𝑊) por hipótese. Seja então {min 𝑊} ⊂𝑊 e suponha,

por absurdo, 𝐴 ≠ 𝑊; obviamente temos 𝐴 ∖ 𝑊 ≠ ∅.

Como 𝑊 é bem ordenado e 𝐴 ∖𝑊 ≠ ∅, existe 𝑢 ∈ 𝐴 ∖ 𝑊 o menor elemento de

𝐴 ∖𝑊. É claro que se 𝑥 ≺ 𝑢 então 𝔓(𝑥), do contrário 𝑥 ∈ 𝐴 ∖ 𝑊 o que contestaria a

definição de 𝑢 como menor elemento de 𝐴 ∖ 𝑊. Assim, se 𝑥 ≺ 𝑢 então 𝔓(𝑥), donde pela

hipótese concluímos que 𝔓(𝑢), isto é, 𝑢 ∉ 𝐴 ∖ 𝑊, absurdo. Q.E.D.

O Princípio da Indução também pode ser formulado como segue:

Seja ⟨𝑊, ≺⟩ um conjunto bem ordenado e 𝐵 ⊆ 𝑊 ; se min𝑊 ∈ 𝐵 e, para

qualquer 𝑦 ∈ 𝑊, 𝑤 ∈ 𝐵 para todo 𝑤 ≺ 𝑦 for suficiente para 𝑦 ∈ 𝐵, então 𝐵 = 𝑊.

Se retirarmos a hipótese de que 𝐵 ⊆ 𝑊, obtemos ainda uma nova formulação:

Seja ⟨𝑊, ≺⟩ um conjunto bem ordenado e 𝐵 um conjunto qualquer; se min𝑊 ∈

𝐵 e, para qualquer 𝑦 ∈ 𝑊, 𝑤 ∈ 𝐵 para todo 𝑤 ≺ 𝑦 for suficiente para 𝑦 ∈ 𝐵, então 𝑊 ⊆ 𝐵 .

O resultado seguinte, adaptado de Suppes (1972), nos mostra que, de certa forma,

a recíproca do resultado anterior é verdadeira.

Teorema 4.4. Sejam 𝐴 um conjunto e ≺ uma relação de ordem total sobre 𝐴, tal

que seja verdadeira a sentença

(∀𝐵)��(∀𝑦)�𝑦 ∈ 𝐴 ∧ �(∀𝑥)�(𝑥 ∈ 𝐴 ∧ 𝑥 ≺ 𝑦) ⟹ 𝑥 ∈ 𝐵�� ⟹ 𝑦 ∈ 𝐵� ⟹ 𝐴 ⊆ 𝐵�.

Então ≺ é uma boa ordenação sobre 𝐴.

98

Demonstração.

Seja 𝑋 um subconjunto não vazio de 𝐴; devemos mostrar que 𝑋 possui um menor

elemento. Assumamos, por absurdo, que 𝑋 não possua um menor elemento e consideremos o

conjunto 𝐴 ∖ 𝑋. Afirmamos que se 𝑘 ∈ 𝐴 ∖ 𝑋 para todo 𝑘 tal que 𝑘 ≺ 𝑦, então 𝑦 ∈ 𝐴 ∖ 𝑋: de

fato, caso 𝑦 ∉ 𝐴 ∖ 𝑋, teríamos 𝑦 ∈ 𝑋 e, como 𝑘 ≺ 𝑦 ⟹ 𝑘 ∈ 𝐴 ∖ 𝑋, para qualquer 𝑥 ∈ 𝑋

restaria necessariamente 𝑦 ≺ 𝑥 ou 𝑦 = 𝑥, ou seja, 𝑦 seria o menor elemento de 𝑋,

contrariando a hipótese. Mostramos assim que

(∀𝑦)��𝑦 ∈ 𝐴 ∧ �(∀𝑥)(𝑥 ∈ 𝐴 ∧ 𝑥 ≺ 𝑦) ⟹ 𝑥 ∈ 𝐴 ∖ 𝑋�� ⟹ 𝑦 ∈ 𝐴 ∖ 𝑋�,

donde obtém-se, pela hipótese do teorema, que 𝐴 ⊆ 𝐴 ∖ 𝑋, o que é absurdo, já que tomamos

𝑋 como subconjunto não vazio de 𝐴. Portanto, 𝑋 possui um menor elemento. Q.E.D.

O bom comportamento dos conjuntos bem ordenados também se reflete nas

propriedades de seus segmentos iniciais, como provamos nos dois próximos resultados.

Proposição 4.3. Se ⟨𝑊, ≺⟩ é um conjunto bem ordenado e 𝑆 é um segmento inicial

de 𝑊, então existe 𝑎 ∈ 𝑊 tal que 𝑆 = {𝑥 ∈ 𝑊|𝑥 ≺ 𝑎}.

Demonstração.

Considere 𝑋 = 𝑊 ∖ 𝑆. Como 𝑆 ≠ 𝑊, tem-se 𝑋 ≠ ∅. Uma vez que ≺ é uma boa

ordenação sobre 𝑊 e 𝑋 é um subconjunto não vazio, existe um elemento 𝑎 ∈ 𝑋 tal que 𝑎 ≼ 𝑥,

para todo 𝑥 ∈ 𝑋, ou seja, 𝑎 = min(𝑋). Se 𝑦 ≺ 𝑎, então 𝑦 ∉ 𝑋, do contrário 𝑎 não seria o

menor elemento de 𝑋, logo 𝑦 ≺ 𝑎⟹ 𝑦 ∈ 𝑆. Se 𝑎 ≼ 𝑦 então 𝑦 ∉ 𝑆, se não teríamos 𝑎 ∉ 𝑋

uma vez que 𝑆 é segmento inicial de 𝑊. Assim, 𝑦 ∈ 𝑆 ⟺ 𝑦 ≺ 𝑎. Portanto,

𝑆 = {𝑥 ∈ 𝑊|𝑥 ≺ 𝑎}. Q.E.D.

Proposição 4.4. Seja ⟨𝑊, <⟩ um conjunto bem ordenado e 𝑎 ∈ 𝑊 qualquer. Então

𝒜 = {𝑥 ∈ 𝑊|𝑥 < 𝑎} é um segmento inicial de 𝑊.

Demonstração.

Análoga à demonstração do lema anterior. Notemos que se 𝑎 é o menor elemento

de 𝑊, então 𝒜 = ∅. Q.E.D.

Definição 4.6. Seja ⟨𝑊, <⟩ um conjunto bem ordenado e 𝑎 ∈ 𝑊 qualquer. O

segmento inicial de 𝑊 dado por 𝑎 é o conjunto 𝑊[𝑎] = {𝑥 ∈ 𝑊|𝑥 < 𝑎}.

99

A proposição seguinte apenas formaliza as propriedades básicas dos segmentos

iniciais de um conjunto bem ordenado; decorrem imediatamente da definição e, por tal

motivo, omitimos sua demonstração.

Proposição 4.5. Sejam ⟨𝑊, ≺⟩ um conjunto bem ordenado, 𝑊[𝑎] e 𝑊[𝑏]

segmentos iniciais arbitrários para certos 𝑎, 𝑏 ∈ 𝑊.

(i) 𝑊[𝑎] é bem ordenado pela relação ≺;

(ii) 𝑊[𝑎] ⊂𝑊[𝑏] ⟺ 𝑎 ≺ 𝑏;

(iii) 𝑊[𝑎] = 𝑊[𝑏] ⟺ 𝑎 = 𝑏;

(iv) 𝑊[𝑎] = 𝑊[𝑏] ∨𝑊[𝑎] ⊂ 𝑊[𝑏]∨𝑊[𝑏] ⊂𝑊[𝑎];

(v) 𝑊[𝑎] ∩𝑊[𝑏] = ∅ ⟺𝑊[𝑎] = ∅ ∨𝑊[𝑏] = ∅.

Definição 4.7. Seja ⟨𝑊, <⟩ um conjunto ordenado. 𝑓:𝑊 ⟶𝑊 é uma função

crescente se 𝑥1 < 𝑥2 implicar 𝑓(𝑥1) < 𝑓(𝑥2), para quaisquer 𝑥1, 𝑥2 ∈ 𝑊.

Notemos que todo isomorfismo é uma função crescente. Além disso, algo

eventualmente útil é o seguinte isomorfismo obtido por construção.

Proposição 4.6. Seja ⟨𝑊, <⟩ um conjunto bem ordenado e 𝑋 um conjunto

qualquer. Se 𝜑:𝑊⟶ 𝑋 é uma bijeção, então a relação definida por

<𝜑= {⟨𝜑(𝑥), 𝜑(𝑦)⟩ ∈ 𝑋 × 𝑋|𝜑−1(𝑥) < 𝜑−1(𝑦)}

é uma boa ordem sobre 𝑋, tal que ⟨𝑋, <𝜑⟩ ≅ ⟨𝑊, <⟩.

Demonstração.

Claramente <𝜑 é assimétrica. Com efeito, para 𝑥, 𝑦 ∈ 𝑋 quaisquer, existem 𝑤,

𝑣 ∈ 𝑊 tais que 𝜑(𝑤) = 𝑥 e 𝜑(𝑣) = 𝑦, daí se 𝑥 <𝜑 𝑦 temos 𝑤 < 𝑣, logo ¬�𝑦 <𝜑 𝑥�, pois do

contrário teríamos 𝑣 < 𝑤, absurdo. Analogamente prova-se que <𝜑 é transitiva e total.

Para 𝑌 ⊆ 𝑋 não vazio qualquer, considere 𝜑−1[𝑌] ⊆ 𝑊. Da boa ordem de 𝑊

segue que existe min𝜑−1[𝑌] = 𝑦 ∈ 𝜑−1[𝑌]. Obviamente, min 𝑌 = 𝜑(𝑦). De fato, se

existisse 𝑢 ∈ 𝑌 tal que 𝑢 <𝜑 𝜑(𝑦), teríamos 𝜑−1(𝑢) < 𝑦 e, como 𝜑−1(𝑢) ∈ 𝜑−1[𝑌], isso nos

levaria a concluir que min 𝜑−1[𝑌] ≠ 𝑦. Portanto, 𝑌 possui um menor elemento. Q.E.D.

Lema 4.1. Se ⟨𝑊, <⟩ é um conjunto bem ordenado e 𝑓:𝑊⟶ 𝑊 é uma função

crescente, então 𝑓(𝑥) ≥ 𝑥, para todo 𝑥 ∈ 𝑊.

Demonstração.

100

Chame 𝑋 = {𝑥 ∈ 𝑊|𝑓(𝑥) < 𝑥}. Se 𝑋 ≠ ∅, então existe 𝑎 ∈ 𝑋 tal que 𝑎 é o menor

elemento de 𝑋. Logo, 𝑓(𝑎) < 𝑎. Mas como 𝑓 é crescente, 𝑓�𝑓(𝑎)� < 𝑓(𝑎) e daí 𝑓(𝑎) ∈ 𝑋, o

que contraria o fato de 𝑎 ser o menor elemento de 𝑋. Portanto, 𝑋 = {𝑥 ∈ 𝑊|𝑓(𝑥) < 𝑥} = ∅, o

que equivale a afirmar que para todo 𝑥 ∈ 𝑊 , 𝑓(𝑥) ≥ 𝑥. Q.E.D.

Corolário 4.1.

(i) Nenhum conjunto bem ordenado é isomorfo a um segmento inicial de si

mesmo;

(ii) Para todo conjunto bem ordenado existe um único automorfismo, a

identidade;

(iii) Se 𝑊1 e 𝑊2 são conjuntos bem ordenados isomorfos, então o isomorfismo

entre 𝑊1 e 𝑊2 é único;

Demonstração.

(i) Seja ⟨𝑊, <⟩ um conjunto bem ordenado e um segmento inicial 𝑊[𝑎] para

algum 𝑎 ∈ 𝑊. Se existir um isomorfismo 𝑓:𝑊 ⟶𝑊[𝑎], então 𝑓(𝑎) ∈ 𝑊[𝑎], isto é,

𝑓(𝑎) < 𝑎, o que contraria o lema anterior.

(ii) Seja 𝑊 um conjunto bem ordenado e 𝜑:𝑊⟶𝑊 um automorfismo. 𝑓 é

tal que 𝑓(𝑥) < 𝑓(𝑦) ⟺ 𝑥 < 𝑦, para 𝑥, 𝑦 ∈ 𝑊 quaisquer. Por sua vez,

𝑓−1(𝑥) ≥ 𝑓−1(𝑦) ⟹𝑓(𝑓−1)(𝑥)≥ 𝑓�𝑓−1(𝑦)�⟹ 𝑥 ≥ 𝑦,

donde segue que 𝑓−1 é crescente (pela contrapositiva). Daí, pelo lema anterior, 𝑓(𝑥) ≥ 𝑥 e

𝑓−1(𝑥) ≥ 𝑥 para quaisquer 𝑥 ∈ 𝑊, donde segue que 𝑥 ≥ 𝑓(𝑥). Portanto, da antissimetria de

≤, segue que 𝑓(𝑥) = 𝑥, para todo 𝑥 ∈ 𝑊. Daí, pelo Teorema 3.9, 𝑓 = 𝐼𝑑𝑊 .

(iii) Sejam 𝑓:𝑊1 ⟶ 𝑊2 e 𝑔:𝑊1 ⟶ 𝑊2 isomorfismos. Claramente, a

composição 𝑓 ∘ 𝑔−1:𝑊2 ⟶𝑊2 é um automorfismo, pois para 𝑥, 𝑥′ ∈ 𝑊2 ,

𝑓�𝑔−1(𝑥)� < 𝑓�𝑔−1(𝑥′)�⟺ 𝑔−1(𝑥) < 𝑔−1(𝑥′)⟺ 𝑥 < 𝑥′,

e daí, pelo item anterior, 𝑓�𝑔−1(𝑥)� = 𝑥, para todo 𝑥 ∈ 𝑊2 , donde segue que 𝑓−1(𝑥) =

𝑔−1(𝑥) para todo 𝑥 ∈ 𝑊2 , isto é, 𝑓−1 = 𝑔−1, e finalmente se obtém 𝑓 = 𝑔. Q.E.D.

Teorema 4.5. Se ⟨𝑊1, <1⟩ e ⟨𝑊2 , <2⟩ são conjuntos bem ordenados, então

exatamente uma das alternativas abaixo é verdadeira:

(i) 𝑊1 e 𝑊2 são isomorfos;

101

(ii) 𝑊1 é isomorfo a um segmento inicial de 𝑊2 ;

(iii) 𝑊2 é isomorfo a um segmento inicial de 𝑊1 .

Em todos os casos, o isomorfismo é único.

Demonstração.

É imediato do Lema 4.1 e do Corolário 4.1 que (i), (ii) e (iii) são mutuamente

excludentes. Assim, para provarmos o teorema, devemos negar dois dos itens e mostrar a

validade do terceiro.

Definamos a relação 𝑓 = {⟨𝑥, 𝑦⟩ ∈ 𝑊1 × 𝑊2 :𝑊1[𝑥] é isomorfo a 𝑊2[𝑦]}.

Afirmação: 𝑓:𝔇(𝑓)⟶ ℑ(𝑓) é um isomorfismo.

Em vista da Proposição 4.2, basta mostrarmos que 𝑓 é uma função injetora

crescente, com ⟨𝔇(𝑓), <1⟩ e ⟨ℑ(𝑓), <2⟩ totalmente ordenados.

Primeiramente, 𝑓 é uma função injetora. De fato, se 𝑥𝑓𝑦1 e 𝑥𝑓𝑦2 então 𝑊1[𝑥] é

isomorfo a 𝑊2[𝑦1] e 𝑊2[𝑦2], mas pela Proposição 4.5 (iv)

𝑊2[𝑦1] = 𝑊2[𝑦2], 𝑊2[𝑦1] ⊂ 𝑊2[𝑦2] ou 𝑊2[𝑦2] ⊂ 𝑊2[𝑦1].

Contudo, como 𝑊2 [𝑦1] e 𝑊2[𝑦2] são isomorfos, obtemos 𝑊2[𝑦1] = 𝑊2[𝑦2] e, por

conseguinte, 𝑦1 = 𝑦2 e assim 𝑓 é função. Pelo mesmo argumento, 𝑥1𝑓𝑦 e 𝑥2𝑓𝑦 implicam

𝑥1 = 𝑥2, donde concluímos que 𝑓 é injetora. A sobrejetividade de 𝑓 é óbvia. �†1�

Tomemos então 𝑥, 𝑥′ ∈ 𝔇(𝑓), tais que 𝑥 <1 𝑥′. Queremos mostrar que 𝑓 é

crescente, ou seja, 𝑓(𝑥) <2 𝑓(𝑥′). Para tanto, seja ℎ:𝑊1[𝑥′] ⟶𝑊2[𝑓(𝑥′)] o isomorfismo

cuja existência inferimos por 𝑥′ ∈ 𝔇(𝑓); em particular, ℎ(𝑥) <2 𝑓(𝑥′). Notemos que

ℎ� = ℎ ↾ 𝑊1[𝑥] é um isomorfismo entre 𝑊1[𝑥] e 𝑊2[ℎ(𝑥)].

De fato, como ℎ é injetora, segue que ℎ� é injetora. Se 𝑢 ∈ 𝑊1[𝑥] temos 𝑢 <1 𝑥 e

daí ℎ�(𝑢) = ℎ(𝑢) <2 ℎ(𝑥), mostrando que ℎ�(𝑢) ∈ 𝑊2[ℎ(𝑥)] e ℑ�ℎ�� ⊆ 𝑊2 [ℎ(𝑥)]. Se

𝑦 ∈ 𝑊2[ℎ(𝑥)] então 𝑦 <2 ℎ(𝑥), donde obtém-se ℎ−1(𝑦) <1 𝑥, isto é, ℎ−1(𝑦) ∈ 𝑊1[𝑥], e

assim 𝑊2[ℎ(𝑥)] ⊆ ℑ�ℎ��. Logo ℎ�:𝑊1[𝑥] ⟶𝑊2[ℎ(𝑥)] é bijetora e, por conseguinte, é

também isomorfismo, haja vista que ℎ é isomorfismo. Enfim, por termos 𝑊1[𝑥] ≅𝑊2 [𝑓(𝑥)]

por hipótese, obtemos 𝑊2[ℎ(𝑥)] ≅ 𝑊2[𝑓(𝑥)] e, consequentemente 𝑓(𝑥) = ℎ(𝑥) <2 𝑓(𝑥′).

�†2�

Uma vez que 𝔇(𝑓) ⊆𝑊1 e ℑ(𝑓) ⊆𝑊2 , é óbvio que ⟨𝔇(𝑓), <1⟩ e ⟨ℑ(𝑓), <2⟩ são

ordenações totais (em particular, são bem ordenados). �†3�

102

Segue de �†1�, �†2� e �†3� que 𝑓:𝔇(𝑓) ⟶ℑ(𝑓) é um isomorfismo, como

afirmamos.

Para concluirmos a demonstração basta mostrarmos que 𝔇(𝑓) e ℑ(𝑓) não podem

ser simultaneamente subconjuntos próprios de 𝑊1 e 𝑊2 , respectivamente.

Suponha 𝔇(𝑓)≠ 𝑊1 . Vamos provar que 𝔇(𝑓) é um segmento inicial de 𝑊1 e

ℑ(𝑓) = 𝑊2 . Para 𝑥 ∈ 𝔇(𝑓) qualquer, tome 𝑢 <1 𝑥; se ℎ:𝑊1[𝑥] ⟶ 𝑊2[𝑓(𝑥)] é um

isomorfismo, então ℎ ↾ 𝑊1[𝑢]:𝑊1[𝑢] ⟶ 𝑊2[ℎ(𝑢)] é isomorfismo, donde segue que

⟨𝑢, ℎ(𝑢)⟩ ∈ 𝑓, isto é, 𝑢 ∈ 𝔇(𝑓), logo 𝔇(𝑓) é um segmento inicial de 𝑊1 e, por conseguinte,

𝔇(𝑓) = 𝑊1[𝑎′], para algum 𝑎′ ∈ 𝑊1 . Se por absurdo ℑ(𝑓)≠ 𝑊2 , então por um argumento

análogo ao anterior mostra-se que ℑ(𝑓) = 𝑊2[𝑏′], para algum 𝑏′ ∈ 𝑊2 ; contudo, teríamos

assim que 𝑓:𝑊1[𝑎′] ⟶ 𝑊2[𝑏′] seria um isomorfismo e pela definição de 𝑓, ⟨𝑎′, 𝑏′⟩ ∈ 𝑓 e daí

𝑎′ ∈ 𝔇(𝑓) = 𝑊1[𝑎′], isto é, 𝑎′ <1 𝑎′, absurdo. Portanto, ℑ(𝑓) = 𝑊2 e é isomorfo a um

segmento inicial de 𝑊1 .

Da mesma forma mostra-se que ℑ(𝑓) ≠𝑊2 implica em ℑ(𝑓) = 𝑊2[𝑏] para

algum 𝑏 ∈ 𝑊2 e 𝔇(𝑓) = 𝑊1 , donde se obtém 𝑊1 isomorfo a um segmento inicial de 𝑊2 .

Enfim, se 𝔇(𝑓) = 𝑊1 e ℑ(𝑓) = 𝑊2 , então 𝑊1 ≅ 𝑊2 são isomorfos. A unicidade dos

isomorfismos provém em todos os casos do Corolário 4.1 (iii). Q.E.D.

O Teorema 4.5 nos garante que conjuntos bem ordenados podem ser

“comparados” entre si, numa analogia a tamanho ou comprimento, o que condiz com a

comparação feita anteriormente referente às filas. Ainda sob tal perspectiva, é natural procurar

uma generalização de tal processo de comparação a fim de encontrar, em ZFC, uma definição

formal para o conceito de número. É exatamente isso o que fazemos na próxima seção.

4.2. Números Ordinais e a Recursão Transfinita

A primeira questão que se apresenta é tão profunda quanto perguntar-se o que é

um conjunto: o que é um número? Muitas respostas já foram dadas por matemáticos e

filósofos, em diferentes abordagens. Para Russell,

Número é o que é característico de números, assim como homem é característica de homens. Um trio de homens, por exemplo, é um caso de número 3, e o número 3 é

103

um exemplo de número; mas o trio não é um caso de número […]. Um número particular não é idêntico a qualquer coleção que tenha tal número de elementos: o número 3 não é idêntico com o trio composto por Brown, Jones e Robinson. O número 3 é algo que todos os trios possuem em comum e que os distingue de outras coleções. Um número é algo que caracteriza certos conjuntos, a saber, aqueles que possuem este número [de elementos] (RUSSELL, 1920, p. 11-12, itálico do autor, tradução nossa).

A postura que adotamos perante tal questão é sintetizada por um exemplo dado

por Halmos, que se pergunta

Como um matemático define um metro? O procedimento envolve dois passos […]. Primeiro, seleciona-se um objeto dentre os quais se destina o conceito a ser definido — um objeto, em outras palavras, tal que num sentido intuitivo ou prático mereça ser considerado como tendo um metro de comprimento. Segundo, forma-se o conjunto de todos os objetos no universo que possuem o mesmo comprimento que o objeto selecionado (note que isso independe de sabermos o que é o metro), e define-se o metro como sendo tal conjunto. (HALMOS, 1960, p. 43, tradução nossa).

Importamo-nos então em “como definir um número”, sem necessariamente

sabermos “o que” ele é, mesma postura tomada sobre a natureza dos conjuntos. A ideia de

definir números naturais na Teoria dos Conjuntos se deve a Frege, em seu Grundlagen der

Arithmetik (Fundamentos da Aritmética), de 1884. O método que utilizamos aqui, muito

diferente do trabalho de Frege, foi desenvolvido inicialmente por Von Neumann em seu

trabalho Zur Einführung der transfiniten Zahlen (Introdução dos Números Transfinitos), de

1923.

Hrbacek & Jech (1999) definem primeiramente o conjunto dos números naturais

como sendo

ℕ = {𝑛 ∈ ℐ|(∀𝑋)(𝑋 é indutivo ⟹𝑛 ∈ 𝑋)},

provando suas propriedades principais e, posteriormente, generalizando-as para os números

ordinais. Apesar de basearmo-nos no autor, seguimos a linha contrária e tratamos dos

números ordinais para daí “obter” os números naturais como consequência da teoria exposta.

Ressaltamos o caráter introdutório do que segue; uma abordagem mais aprofundada pode ser

encontrada, por exemplo, no trabalho de Levy (1979) e Jech (2003).

Definição 4.8. Seja 𝑋 um conjunto. ∈𝑋= {⟨𝑥, 𝑦⟩ ∈ 𝑋 × 𝑋|𝑥 ∈ 𝑦}.

Definição 4.9. 𝑋 é transitivo ⟺ (∀𝑥)(∀𝑦)(𝑥 ∈ 𝑋 ∧ 𝑦 ∈ 𝑥 ⟹ 𝑦 ∈ 𝑋).

104

Definição 4.10. Seja 𝛼 um conjunto. 𝛼 é um número ordinal se 𝛼 é transitivo e

⟨𝛼, ∈𝛼⟩ é bem ordenado.

Definição 4.11. 𝑥 + 1 = 𝑥 ∪ {𝑥}.

Definição 4.12. Sejam 𝛼 e 𝛽 números ordinais. Denotamos

(i) 𝛼 < 𝛽 se, e somente se, 𝛼 ∈ 𝛽;

(ii) 𝛼 > 𝛽 se, e somente se, 𝛽 < 𝛼;

(iii) 𝛼 ≤ 𝛽 se, e somente se, 𝛼 < 𝛽 ou 𝛼 = 𝛽;

(iv) 𝛼 ≥ 𝛽 se, e somente se, 𝛽 < 𝛼 ou 𝛼 = 𝛽.

Números ordinais (abreviadamente chamados de ordinais) são os representantes

“canônicos” dos conjuntos bem ordenados, haja vista que, a posteriori, todo conjunto bem

ordenado é isomorfo a um único ordinal (Teorema 4.8). De certa forma, podem ser

compreendidos como a generalização dos números naturais, os quais se obtêm por um

processo de “adição”, dado pela Definição 4.11, que nos dá o sucessor de 𝑥. Sua formulação

parte de uma ideia muito simples: adicionar um elemento ao conjunto previamente dado,

obtendo um novo conjunto “maior”. De fato, se 𝑥 é um ordinal então 𝑥 + 1 é um ordinal tal

que 𝑥 < 𝑥 + 1, no sentido da Definição 4.12. O lema seguinte apenas formaliza as

propriedades imediatas dos números ordinais.

Lema 4.2.

(i) Se 𝛼 é um ordinal então 𝛼 + 1 é um ordinal e 𝛼 < 𝛼 + 1;

(ii) Se 𝛼 é um ordinal então 𝛼 ∉ 𝛼;

(iii) Se 𝛼 é um ordinal, então não existe ordinal 𝛽 tal que 𝛼 < 𝛽 < 𝛼 + 1;

(iv) Se 𝛽 ∈ 𝛼 e 𝛼 é um ordinal então 𝛽 é um ordinal;

(v) 𝛼 = {𝛽|𝛽 é ordinal ∧ 𝛽 < 𝛼}, para todo ordinal 𝛼;

(vi) Se 𝛼 e 𝛽 são ordinais tais que 𝛼 ⊂ 𝛽, então 𝛼 ∈ 𝛽;

(vii) Se 𝛼 e 𝛽 são ordinais, então 𝛼 ∩ 𝛽 é ordinal.

Demonstração.

Provamos apenas (v) e (vii), as demonstrações dos demais itens podem ser

encontradas em Hrbacek & Jech (1999), Suppes (1972) e Kuratowski & Mostowski (1976).

Se 𝛼 = ∅, então por vacuidade ∅ é um número ordinal. Além disso, ∅ = {𝛽|𝛽 é

ordinal ∧ 𝛽 < ∅}, uma vez que não existe 𝛽 ∈ ∅. Para um ordinal 𝛼 ≠ ∅ qualquer, se 𝛾 ∈ 𝛼

105

então pelo item (iv) deste lema segue que 𝛾 é ordinal e assim 𝛾 ∈ {𝛽|𝛽 é ordinal ∧ 𝛽 < 𝛼}.

Reciprocamente, se 𝛾 é ordinal e 𝛾 < 𝛼 , segue em particular que 𝛾 ∈ 𝛼 . Assim, (v) está

provado.

Provemos (vii). Se 𝛼 = ∅ ou 𝛽 = ∅ então não há o que provar, pois ∅ é ordinal.

Se 𝛼 ∩ 𝛽 ≠ ∅, então em particular a restrição de ∈𝛼 a 𝛼 ∩ 𝛽 é uma boa ordem: todos os

membros de 𝛼 ∩ 𝛽 são comparáveis, uma vez que são também membros de 𝛼; também todo

subconjunto não vazio de 𝛼 ∩ 𝛽 possui menor elemento, haja vista que tais subconjuntos são

também subconjuntos de 𝛼. Além disso, 𝛼 ∩ 𝛽 é transitivo, pois se 𝑥 ∈ 𝑣 e 𝑣 ∈ 𝛼 ∩ 𝛽 então

𝑥 ∈ 𝛼 e 𝑥 ∈ 𝛽, pois tanto 𝛼 quanto 𝛽 são transitivos, logo 𝑥 ∈ 𝛼 ∩ 𝛽. Portanto, 𝛼 ∩ 𝛽 é

ordinal. Q.E.D.

A demonstração acima torna pertinente a definição a seguir.

Definição 4.13. 0 = ∅ e 1 = 0 + 1.

Teorema 4.6. Sejam 𝛼, 𝛽 e 𝛾 ordinais quaisquer.

(i) 𝛼 < 𝛽 ∧ 𝛽 < 𝛾 ⟹ 𝛼 < 𝛾;

(ii) 𝛼 < 𝛽 ⟹ ¬(𝛽 < 𝛼);

(iii) 𝛼 < 𝛽 ∨ 𝛽 < 𝛼 ∨ 𝑎 = 𝛽;

(iv) Todo conjunto de ordinais é bem ordenado;

(v) Se 𝑋 é um conjunto de ordinais, então ⋃𝑋 é ordinal;

(vi) Para todo conjunto de ordinais 𝑋 existe um ordinal 𝛼 tal que 𝛼 ∉ 𝑋.

Demonstração.

(i) Se 𝛼 < 𝛽 e 𝛽 < 𝛾 temos 𝛼 ∈ 𝛽 e 𝛽 ∈ 𝛾, mas como 𝛾 é transitivo inferimos

que 𝛽 ⊂ 𝛾 e, por conseguinte, 𝛼 ∈ 𝛾, isto é, 𝛼 < 𝛾.

(ii) Se por absurdo 𝛼 < 𝛽 e 𝛽 < 𝛼 fosse verdadeiro, seguiria pelo item

anterior que 𝛼 < 𝛼, isto é, 𝛼 ∈ 𝛼, o que contraria o Lema 4.2 (ii).

(iii) Sejam 𝛼 e 𝛽 ordinais. Pelo Lema 4.2 (vii), 𝛼 ∩ 𝛽 é um ordinal. Se

𝛼 ∩ 𝛽 = 𝛼, então 𝛼 ⊆ 𝛽 (pois 𝛼 ∩ 𝛽 ⊆ 𝛽) e daí 𝛼 ∈ 𝛽 ou 𝛼 = 𝛽 pelo Lema 4.2 (vi). Da

mesma forma, se 𝛼 ∩ 𝛽 = 𝛽, segue que 𝛽 ∈ 𝛼 ou 𝛼 = 𝛽. Se 𝛼 ∩ 𝛽 ≠ 𝛼 e 𝛼 ∩ 𝛽 ≠ 𝛽, então

𝛼 ∩ 𝛽 ∈ 𝛼 e 𝛼 ∩ 𝛽 ∈ 𝛽, donde teríamos 𝛼 ∩ 𝛽 ∈ 𝛼 ∩ 𝛽, o que contraria o Lema 4.2 (ii).

(iv) Seja 𝒪 um conjunto de números ordinais. Se 𝒪 = ∅ não há o que provar.

Considere então 𝒪 ≠ ∅ e a relação ∈𝒪. Claramente ∈𝒪 é uma ordem total em 𝒪, haja vista

que como todos os membros de 𝒪 são números ordinais, todos são comparáveis segundo ∈𝒪.

106

Mostremos inicialmente que 𝒪 possui um menor elemento segundo ∈𝒪. Tome um

ordinal 𝛼 ∈ 𝒪. Se 𝛼 ∩𝒪 = ∅, então 𝛼 é o menor elemento de 𝒪: de fato, para qualquer 𝛽 ∈

𝒪, se 𝛽 ∈ 𝛼 (ou seja, 𝛽 < 𝛼) teríamos 𝛼 ∩𝒪 ≠ ∅, absurdo, logo 𝛼 ≤ 𝛽, para todo 𝛽 ∈ 𝒪. Se

𝛼 ∩𝒪 ≠ ∅, então existe 𝛾 ∈ 𝛼 ∩ 𝒪 ⊆ 𝛼 o menor elemento de 𝛼 ∩ 𝒪. Tal 𝛾 é o menor

elemento de 𝒪, caso contrário, existiria 𝜉 ∈ 𝒪 com 𝜉 < 𝛾, isto é, 𝜉 ∈ 𝛾 ∈ 𝛼 e assim 𝜉 ∈ 𝛼 ∩

𝒪, o que contraria o fato de 𝛾 ser o menor elemento de 𝛼 ∩𝒪. Em ambos os casos, 𝒪 possui

um menor elemento.

Como 𝒪 é um conjunto de ordinais arbitrário, segue que todo conjunto 𝑋 de

números ordinais é bem ordenado, pois qualquer subconjunto de 𝑋 é em particular um

conjunto de ordinais.

(v) Seja 𝑋 um conjunto de ordinais. Pelo item anterior, ⟨𝑋, ∈𝑋⟩ é bem

ordenado. Considere então ⋃𝑋. Se 𝑥 ∈ ⋃𝑋, existe um ordinal 𝛼 tal que 𝑥 ∈ 𝛼 , donde pelo

Lema 4.2 (iv) segue que 𝑥 é um ordinal. Logo, ⋃𝑋 é um conjunto de ordinais e, por

conseguinte, é bem ordenado. Resta provar apenas que ⋃𝑋 é transitivo, mas isto é óbvio: se

𝑥 ∈ ⋃𝑋, existe um ordinal 𝛼 tal que 𝑥 ∈ 𝛼, e se 𝑦 ∈ 𝑥 então 𝑦 ∈ 𝛼, logo 𝑦 ∈ ⋃𝑋. Portanto,

⋃𝑋 é bem ordenado pela relação ∈⋃𝑋 e é transitivo, ou seja, ⋃𝑋 é um número ordinal.

(vi) Em outras palavras queremos provar a não existência de um conjunto de

todos os números ordinais. Via reductio ad absurdum, considere Ω o “conjunto de todos os

ordinais”. Em particular, Ω é um conjunto de ordinais, donde obtemos pelo item anterior que

⋃Ω é um número ordinal, e pelo Lema 4.2 (i) 𝛼 = ⋃Ω+ 1 é ordinal. Se 𝛼 ∈ Ω então

obviamente 𝛼 ⊆ ⋃Ω e pelo Lema 4.2 (vi) temos 𝛼 ∈ ⋃Ω ou 𝛼 = ⋃Ω e, de ambos os casos,

concluímos que 𝛼 < 𝛼, absurdo. Logo 𝛼 ∉ Ω e, portanto, não existe um conjunto de todos os

números ordinais. Q.E.D.

Corolário 4.2. Se 𝑋 é um conjunto de números ordinais, então ⋃𝑋 é um número

ordinal tal que 𝛼 ≤ ⋃𝑋 para todo 𝛼 ∈ 𝑋; além disso, ⋃𝑋 é o menor ordinal com tal

propriedade.

Demonstração.

Vimos na demonstração do Teorema 4.6 (v) que ⋃𝑋 é um número ordinal.

Notemos que se 𝛼 ∈ 𝑋 então 𝛼 ⊆ ⋃𝑋 e, como ambos são ordinais, tem-se 𝛼 ≤ ⋃𝑋. Por

outro lado, se para algum ordinal 𝛾, 𝛼 ≤ 𝛾 para todo 𝛼 ∈ 𝑋, então ⋃𝑋 ≤ 𝛾: basta observar

que para todo 𝛼 ∈ ⋃𝑋 existe um ordinal 𝛽 ∈ 𝑋 tal que 𝛼 < 𝛽 ≤ 𝛾, donde decorre que 𝛼 ∈ 𝛾

e assim ⋃𝑋 ⊆ 𝛾, e daí ⋃𝑋 ≤ 𝛾. Q.E.D.

107

O corolário acima justifica chamar ⋃𝑋 de supremo de 𝑋.

Definição 4.14. Se 𝑋 é um conjunto de ordinais, sup𝑋 = ⋃𝑋 é o supremo de 𝑋.

Observação: Analogamente, para todo conjunto 𝑋 de ordinais, ⋂𝑋 é um ordinal

e, mais do que isso, min 𝑋 = ⋂𝑋.

Corolário 4.3. Para quaisquer ordinais 𝛼 e 𝛽 distintos, 𝛼 ⊂ 𝛽 ou 𝛽 ⊂ 𝛼. Além

disso, 𝛼 ⊂ 𝛽 se, e somente se, 𝛼 é um segmento inicial de 𝛽.

Demonstração.

Decorre imediatamente da Definição 4.12, do item (v) do Lema 4.2 e do item (iii)

do teorema anterior. Q.E.D.

Observação: Para dois ordinais 𝛼 e 𝛽, temos 𝛼 ≤ 𝛽⟺ 𝛼 ⊆ 𝛽 .

Corolário 4.4. Se 𝛼 e 𝛽 são ordinais tais que ⟨𝛼, ∈𝛼⟩ ≅ ⟨𝛽, ∈𝛽⟩, então 𝛼 = 𝛽.

Demonstração.

Se 𝛼 < 𝛽, então 𝛼 seria um segmento inicial de 𝛽 e daí o isomorfismo da hipótese

contrariaria o Corolário 4.1 (i); analogamente 𝛽 < 𝛼 nos leva a uma contradição. Em vista do

item (iii) do Teorema 4.6, resta apenas 𝛼 = 𝛽. Q.E.D.

Vemos assim que para os números ordinais vale uma espécie de tricotomia, apesar

de a “relação” de ordem dos ordinais não possuir um domínio, conforme nos mostrou o item

(vi) do teorema precedente. Notemos que isso elimina de ZFC o paradoxo de Burali-Forti,

existente na Teoria Ingênua dos Conjuntos. Isto evidencia justamente a impossibilidade de se

considerar verdadeira a existência de um conjunto de todos os ordinais. Grosso modo, assim

como o conjunto universo, o conjunto de todos os números ordinais é “grande demais” para

ser um conjunto.

Os dois próximos teoremas tem importância fundamental na Teoria dos Conjuntos

e justificam, por assim dizer, a importância do desenvolvimento dos números ordinais. Para

enunciá- los, temos a definição abaixo. Frisamos que ≾ indica a existência de função injetora.

Definição 4.15. Para um conjunto 𝐴 qualquer, o Número de Hartogs de 𝐴 é o

conjunto ℎ(𝐴) = {𝛼|𝛼 é ordinal ∧ (∃𝑊)(𝑊 ⊆ 𝐴 ∧ 𝛼 ≾ 𝑊)}.

108

O teorema seguinte prova que o Número de Hartogs existe para qualquer conjunto

𝐴. Sua demonstração é uma adaptação dos argumentos apresentados por Suppes (1972) e

Hrbacek & Jech (1999).

Teorema 4.7 (Número de Hartogs). ℎ(𝐴) existe para todo conjunto 𝐴 e pode ser

definido por ℎ(𝐴) = {𝛼|𝛼 é ordinal ∧ 𝛼 ≾ 𝐴}. Além disso, ℎ(𝐴) é o menor número ordinal tal

que ¬(ℎ(𝐴) ≾ 𝐴).

Demonstração.

Pelo Corolário 4.4 e pelo item (iii) do Teorema 4.2, se um conjunto ⟨𝑋, ≺⟩ bem

ordenado for isomorfo a dois ordinais 𝛼 e 𝛽, então 𝛼 = 𝛽, pois 𝛼 ≅ 𝛽. Logo, para toda

relação 𝑅 ∈ ℘(𝐴 × 𝐴) que seja uma boa ordem, existe no máximo um ordinal 𝛽𝑅 tal que

⟨𝔇(𝑅),𝑅⟩ ≅ ⟨𝛽𝑅, ∈𝛽𝑅 ⟩. Definamos então

𝒲(𝐴) = {⟨𝑋,𝑅⟩ ∈ ℘(𝐴) × ℘(𝐴 × 𝐴)|𝑋 = 𝔇(𝑅) ∧ 𝑅 é uma boa ordem sobre 𝑋},

cuja existência é obviamente garantida pelo Axioma da Separação. Pela observação feita no

início da demonstração, a condição 𝔓(𝑥, 𝑦) dada por

“𝔓(𝑥, 𝑦) ≡ (𝑥 ∈ 𝒲(𝐴) ∧ 𝑦 é um número ordinal tal que 𝑥 ≅ 𝑦) ∨ (𝑥 ∉ 𝒲(𝐴) ∧ 𝑦 = ∅)”

é funcional em 𝑥, donde segue que o Axioma da Substituição assegura a existência do

conjunto ℋ, onde

ℋ = {𝛼|𝛼 é ordinal ∧ (∃𝑥)(𝑥 ∈ 𝒲(𝐴) ∧ ⟨𝛼, ∈𝛼⟩ ≅ 𝑥}.

Afirmamos que ℋ contém todos os ordinais 𝛼 tais que 𝛼 ≾ 𝐵, onde 𝐵 ⊆ 𝐴. De

fato, se 𝛼 ≾ 𝐴, existe uma injeção 𝜑:𝛼 ⟶ 𝐴. Daí, 𝜑′:𝛼 ⟶ 𝜑[𝛼] dada por 𝜑′(𝛽) = 𝜑(𝛽)

para todo 𝛽 < 𝛼 é obviamente uma bijeção e, por construção, como fizemos na Proposição

4.6, existe uma relação 𝑅 tal que ⟨𝜑′[𝛼], 𝑅⟩ ≅ ⟨𝛼, ∈𝛼⟩, donde segue que 𝛼 ∈ ℋ.

Assim, basta fazermos ℎ(𝐴) = {𝛼 ∈ ℋ|𝛼 é ordinal ∧ 𝛼 ≾ 𝐴}, que claramente

satisfaz à Definição 4.15 e, pelo Teorema 2.7, também ℎ(𝐴) = {𝛼|𝛼 é ordinal∧ 𝛼 ≾ 𝐴}.

Por ser um conjunto de ordinais, ℎ(𝐴) é obviamente bem ordenado. Para mostrar

que ℎ(𝐴) é um número ordinal, precisamos apenas provar que ℎ(𝐴) é transitivo. Para

𝛼 ∈ ℎ(𝐴) qualquer, 𝛼 é um ordinal tal que 𝛼 ≾ 𝐴. Logo, se 𝑥 ∈ 𝛼 então 𝑥 também é um

ordinal e, obviamente, 𝑥 ≾ 𝐴: basta tomar a injeção 𝜑:𝛼 ⟶ 𝐴, cuja existência segue de

𝛼 ∈ ℎ(𝐴), e considerar 𝜑 ↾ 𝑥: 𝑥 ⟶ 𝐴. Portanto, ℎ(𝐴) é um ordinal.

109

Por ser um número ordinal, ℎ(𝐴) não admite injeção com qualquer subconjunto

de 𝐴: caso contrário, ℎ(𝐴) ∈ ℎ(𝐴) pela definição de ℎ(𝐴). Pelo mesmo motivo, 𝛾 < ℎ(𝐴)

implica 𝛾 ∈ ℎ(𝐴) e assim 𝛾 ≾ 𝐴, donde se obtém que ℎ(𝐴) é de fato o menor número ordinal

que não admite bijeção com qualquer subconjunto de 𝐴. Q.E.D.

Teorema 4.8. Todo conjunto bem ordenado é isomorfo a um único número

ordinal.

Demonstração.

Seja ⟨𝑊, ≺⟩ um conjunto bem ordenado e considere o número de Hartogs de 𝑊

ℎ(𝑊). Como ℎ(𝑊) é um conjunto bem ordenado, temos três possibilidades: ℎ(𝑊) e 𝑊

isomorfos; ℎ(𝑊) isomorfo a um segmento inicial de 𝑊; 𝑊 isomorfo a um segmento inicial

de ℎ(𝑊).

As duas primeiras possibilidades contrariam a definição de ℎ(𝑊), pois nos levam

a concluir que ℎ(𝑊)≾ 𝑊. Resta apenas 𝑊 isomorfo a um segmento inicial de ℎ(𝑊). Daí,

como ℎ(𝑊) é um número ordinal, pelo Corolário 4.3, qualquer segmento inicial de ℎ(𝑊) é

um número ordinal, donde obtemos que 𝑊 é isomorfo a um número ordinal 𝛼 < ℎ(𝑊). A

unicidade decorre do Corolário 4.4. Q.E.D.

Corolário 4.5. Se 𝑋 é bem ordenado, então 𝑋 ≾ ℎ(𝑋).

Demonstração.

Decorre imediatamente do que vimos na demonstração do teorema anterior.

Notemos que 𝑋 ≾ ℎ(𝑋) significa afirmar que existe uma injeção 𝜓:𝑋 ⟶ ℎ(𝑋). Q.E.D.

Corolário 4.6.

(i) Se 𝑋 ≾ 𝑌 então ℎ(𝑋) ≤ ℎ(𝑌);

(ii) Se 𝑋 ≈ 𝑌 então ℎ(𝑋) = ℎ(𝑌).

Demonstração.

Por definição, se 𝛼 ∈ ℎ(𝑋) então 𝛼 ≾ 𝑋. Se 𝑋 ≾ 𝑌, segue do Corolário 3.4 que

𝛼 ≾ 𝑌 e consequentemente 𝛼 ∈ ℎ(𝑌), mostrando que ℎ(𝑋) ⊆ ℎ(𝑌), e assim ℎ(𝑋) ≤ ℎ(𝑌).

Obviamente, se 𝑋 ≈ 𝑌, temos 𝑌 ≾ 𝑋 e 𝑋 ≾ 𝑌, donde ℎ(𝑋) ≤ ℎ(𝑌) e ℎ(𝑌) ≤ ℎ(𝑋). Q.E.D.

Observação: O Teorema 4.8 não depende diretamente da existência do Número de

Hartogs. Uma demonstração mais elaborada que independe de tal número pode ser encontrada

em Hrbacek & Jech (1999, p. 111). A argumentação que apresentamos foi adaptada de

Miraglia (1991).

110

Podemos assim adotar os números ordinais como representantes de conjuntos bem

ordenados a fim de compará-los. Mais do que isso, dos números ordinais deriva-se a definição

de número cardinal, a priori, válida apenas para conjuntos bem ordenados.

Definição 4.16. Se 𝑊 é um conjunto bem ordenado, o tipo de ordem (order type)

de 𝑊 é o único ordinal 𝛼 isomorfo a 𝑊, indicado por 𝑜𝑟𝑑 (𝑊) = 𝛼.

Definição 4.17. Um número ordinal 𝛼 é um número cardinal (ordinal inicial) se

não existe ordinal 𝛽 < 𝛼 tal que 𝛽 ≈ 𝛼.

Definição 4.18. Um conjunto 𝑋 é bem ordenável se existe 𝑅 ∈ ℘(𝑋 × 𝑋) tal que

⟨𝑋, 𝑅⟩ é bem ordenado.

Teorema 4.9. Todo conjunto bem ordenável é equipotente a um único cardinal,

independentemente da relação de boa ordem definida sobre ele.

Demonstração.

Seja ⟨𝑊, ≺⟩ um conjunto bem ordenado. Como vimos, existe 𝑜𝑟𝑑 ⟨𝑊, ≺⟩ = 𝛽 <

ℎ(𝑊). Logo, existe ao menos um ordinal 𝛼 equipotente a 𝑊, donde segue que o conjunto

𝐸(𝑊) = {𝛼 ∈ ℎ(𝑊)|𝛼 ≈ 𝑊} ⊆ ℎ(𝑊) é um subconjunto não vazio de ℎ(𝑊). De sua boa

ordenação segue que existe 𝛼0 = min 𝐸(𝑊). Da minimalidade de 𝛼0, segue facilmente que

𝛼0 é o único cardinal equipotente a 𝑊.

Analogamente, se < é outra boa ordenação sobre 𝑊, existe 𝑜𝑟𝑑 ⟨𝑊, <⟩ = 𝛽′ <

ℎ(𝑊) donde consequentemente obtemos 𝐸(𝑊) ≠ ∅, e o resultado segue-se. Q.E.D.

Proposição 4.7. ℎ(𝐴) é um número cardinal, para qualquer conjunto 𝐴.

Demonstração.

Se existisse 𝛽 < ℎ(𝐴) tal que 𝛽 ≈ ℎ(𝐴), então 𝛽 seria equipotente a algum

subconjunto de 𝐴 (pois 𝛽 < ℎ(𝐴) ⟺𝛽 ∈ ℎ(𝐴)). Assim, existiriam bijeções 𝜑:𝛽 ⟶ ℎ(𝐴) e

𝜓:𝛽 ⟶𝑊, com 𝑊 ⊆ 𝐴, donde 𝜓 ∘ (𝜑−1):ℎ(𝐴) ⟶𝑊 seria uma bijeção, e

consequentemente ℎ(𝐴) ∈ ℎ(𝐴), absurdo. Logo, não existe ordinal 𝛽 < ℎ(𝐴) tal que 𝛽 ≈

ℎ(𝐴). Q.E.D.

Definição 4.19. Se 𝑋 é um conjunto bem ordenável, o número cardinal de 𝑋,

denotado por |𝑋|, é o único cardinal 𝛼 tal que 𝛼 ≈ 𝑋.

Como são números ordinais, é válida para os números cardinais a “relação” <

estabelecida na Definição 4.12. Além disso, cardinais podem ser interpretados como os

111

representantes canônicos de conjuntos equipotentes entre si, pois respeitam a “ordem” de

equipotência ≾ definida no capítulo anterior, na Definição 3.30.

Teorema 4.10. Sejam 𝑋 e 𝑌 conjuntos bem ordenados.

(i) |𝑋| = |𝑌| ⟺𝑋 ≈ 𝑌;

(ii) |𝑋| < |𝑌| ⟺𝑋 ≺ 𝑌;

(iii) |𝑋| ≤ |𝑌| ⟺𝑋 ≾ 𝑌.

Demonstração.

Por definição temos

[†] 𝑋 ≈ |𝑋| e 𝑌 ≈ |𝑌|.

Decorre diretamente de [†] que se |𝑋| = |𝑌| então 𝑋 ≈ 𝑌. Reciprocamente, se

𝑋 ≈ 𝑌 então |𝑋| ≈ |𝑌|; logo, se |𝑋| ≠ |𝑌| teríamos |𝑋| < |𝑌| ou |𝑌| < |𝑋|; em ambos os

casos estaríamos contrariando o fato de |𝑌| ou |𝑋| serem os números cardinais de 𝑌 ou 𝑋,

respectivamente, o que prova (i).

Se |𝑋| < |𝑌|, então |𝑋| é isomorfo a algum segmento inicial de |𝑌|, donde se

conclui que |𝑋| ≾ |𝑌| e por [†] obtemos 𝑋 ≾ 𝑌. Contudo, se 𝑌 ≾ 𝑋, teríamos 𝑋 ≈ 𝑌 (em vista

do Teorema de Cantor-Bernstein), donde |𝑋| seria um ordinal menor que |𝑌| equipotente a 𝑌,

absurdo. Logo, 𝑋 ≺ 𝑌.

Reciprocamente, se 𝑋 ≺ 𝑌 então em particular 𝑋 ≾ 𝑌, e por [†] inferimos

|𝑋| ≾ |𝑌|. Se, por absurdo, |𝑌| < |𝑋|, seguiria que |𝑌| seria isomorfo a um segmento inicial

de |𝑋| e assim |𝑌| ≾ |𝑋|, resultando em |𝑋| ≈ |𝑌| e consequentemente 𝑋 ≈ 𝑌, absurdo. Logo,

|𝑋| ≤ |𝑌|; no entanto, se |𝑋| = |𝑌| teríamos por (i) que 𝑋 ≈ 𝑌, contrariando 𝑋 ≺ 𝑌. Portanto,

|𝑋| < |𝑌|, validando (ii).

(iii) decorre diretamente dos dois itens anteriores, bem como do Corolário 3.4.

Q.E.D.

O próximo teorema, adaptado de um resultado proposto por Kunen (1980, p. 28),

nos dá uma caracterização para os números cardinais.

Teorema 4.11. Um número ordinal 𝛼 é um número cardinal se, e somente se,

𝛼 = |𝛼|.

Demonstração.

112

Notemos primeiramente que para todo ordinal 𝛼 vale |𝛼| ≾ 𝛼. Claramente, como

𝛼 é bem ordenado, existe um número cardinal 𝛽 tal que |𝛼| = 𝛽 e, como 𝛼 ≈ 𝛼 , por definição

temos necessariamente 𝛽 ≤ 𝛼.

Então, se 𝛼 é um número cardinal, segue que não existe 𝛽 < 𝛼 tal que 𝛽 ≈ 𝛼,

logo |𝛼| = 𝛼. A recíproca é óbvia. Q.E.D.

Não nos aprofundamos no estudo dos números cardinais, de modo que voltamos a

eles apenas no final do capítulo, para definir os números cardinais transfinitos. Uma

introdução sistemática e clara aos cardinais é dada por Suppes (1972) e Hrbacek & Jech

(1999).

Na seção anterior vimos que num conjunto bem ordenado 𝑊 vale o Princípio da

Indução. Nesta seção, já mostramos que um conjunto formado unicamente por ordinais é bem

ordenado. Assim, se existisse um “conjunto de todos os números ordinais”, este seria bem

ordenado e, consequentemente, valeria o Princípio da Indução para números ordinais. Apesar

de tal conjunto não existir, o princípio é válido conforme provamos abaixo.

Teorema 4.12 (Princípio da Indução para Ordinais – Primeira Forma5). Seja

𝔓(𝑥) uma condição em 𝑥, possivelmente com parâmetros. Assumamos que para qualquer

ordinal 𝛼,

[†] �𝛽 é ordinal ∧ 𝛽 < 𝛼 ⟹ 𝔓(𝛽)�⟹ 𝔓(𝛼);

nestas condições, 𝔓(𝛾) é verdadeiro para todo número ordinal 𝛾.

Demonstração.

Suponha, por absurdo, que ¬𝔓(𝛾) para algum ordinal 𝛾 e considere 𝑆 =

{𝛽 ∈ 𝛾|𝛽 ≤ 𝛾 ∧ ¬𝔓(𝛽)}, isto é, 𝑆 é o conjunto dos ordinais menores que 𝛾 que não gozam da

propriedade 𝔓. Como todos os membros de 𝑆 são ordinais, segue que 𝑆 é bem ordenado e, por

conseguinte, possui um elemento mínimo 𝜇. Note que se 𝜇 = ∅ então não existe 𝛽 < 𝜇, o que

torna a implicação “𝛽 é ordinal ∧𝛽 < 𝛼 ⟹ 𝔓(𝛽)” verdadeira e devido a [†] temos 𝔓(𝜇), o

que contraria 𝜇 ∈ 𝑆. Se 𝜇 ≠ ∅, então para qualquer ordinal 𝛽 < 𝜇, 𝛽 ∉ 𝑆 e, por conseguinte,

𝔓(𝛽), donde por [†] obtemos 𝔓(𝜇) e, portanto, 𝜇 ∉ 𝑆, absurdo. Q.E.D.

5 Também chamado de Princípio da Indução Transfinita.

113

Pode-se formular o Princípio da Indução Transfinita de outra maneira. Para tanto,

temos a seguinte definição.

Definição 4.20. Um ordinal 𝛼 é um ordinal sucessor se 𝛼 = 𝛽 + 1, para algum

ordinal 𝛽. Caso contrário, 𝛼 é um ordinal limite.

Teorema 4.13 (Princípio da Indução para Ordinais – Segunda Forma). Seja 𝔓(𝑥)

uma condição em 𝑥. Se:

(i) 𝔓(∅);

(ii) 𝔓(𝛼) ⟹𝔓(𝛼 + 1), para quaisquer ordinais 𝛼;

(iii) Para todo ordinal limite 𝛾 ≠ ∅, se 𝔓(𝛽) para todo ordinal 𝛽 < 𝛾, então

𝔓(𝛾);

nestas condições, 𝔓(𝜆) é válido para todo ordinal 𝜆.

Demonstração.

Decorre imediatamente da primeira forma do Princípio da Indução Transfinita.

Uma demonstração detalhada é dada por Hrbacek & Jech (1999, p. 115). Q.E.D.

O próximo resultado, o Teorema da Recursão Transfinita, nos permite realizar

uma determinada operação (ou várias operações) repetidamente, na ordem dos números

ordinais. Por exemplo, para um conjunto 𝑥 qualquer, existe um único conjunto 𝑦 tal que

𝑦 = ℘(𝑥). Assim, a relação

𝔊(𝑥, 𝑦)≡ 𝑦 = ℘(𝑥)

é funcional em 𝑥. Podemos então considerar o “procedimento 6” dado pela lei

𝑉0 = ∅, 𝑉𝛼+1 = ℘(𝑉𝛼) se 𝛼 é um ordinal sucessor e

𝑉𝛼 = �𝑉𝛽𝛽<𝛼

, para todo ordinal limite 𝛼 ≠ 0.

Assim, 𝑉0 = ∅, 𝑉1 = ℘(∅) = {∅}, 𝑉2 = ℘({∅}) = �∅, {∅}�, etc.

6 Tal processo representa a construção da hierarquia dos conjuntos ditos bem fundados. O Axioma da Regularidade garante que, em ZFC, todo conjunto é membro de algum 𝑉𝛼 (ver Apêndice B).

114

Outro intento pode ser definir adição de números ordinais. A definição de

sucessor adotada é tal que para qualquer conjunto 𝑥, existe um único conjunto 𝑦 = 𝑥 + 1.

Podemos então iterar o processo de “adicionar 1” de modo a obtermos uma adição mais

ampla, definindo para qualquer ordinal 𝛽:

𝛽 + 0 = 𝛽, 𝛽 + (𝛼 + 1) = (𝛽 + 𝛼) + 1 para qualquer ordinal sucessor 𝛼 e

𝛽 + 𝛼 = sup{𝛽 + 𝛾|𝛾 < 𝛼} para todo ordinal limite 𝛼 ≠ 0.

Por mais que saibamos intuitivamente como operar seguindo tais regras, nada

garante até agora que elas possam ser definidas formalmente em ZFC. A fim de sanar tal

deficiência, provamos o Teorema da Recursão Transfinita.

Teorema 4.14 (Definição por Recursão Transfinita7 para Ordinais). Seja 𝔊 uma

operação, e considere a fórmula

𝔓(𝑥, 𝑦)≡ �𝑥 é um número ordinal ∧ 𝑦 = 𝑡(𝑥)� ∨ (𝑥 não é número ordinal ∧ 𝑦 = ∅),

onde 𝑡 é uma função com 𝔇(𝑡) = 𝑥 + 1 e tal que 𝑡(𝛽) = 𝔊(𝑡 ↾ 𝛽) para qualquer ordinal

𝛽 ≤ 𝑥. Então 𝔓 é funcional e, além disso, 𝔉(𝑥) = 𝑦 ⟺ 𝔓(𝑥, 𝑦) é tal que 𝔉(𝛾) = 𝔊(𝔉 ↾ 𝛾) ,

para qualquer ordinal 𝛾.

Demonstração.

Diremos que uma função 𝑡 é uma 𝛼-ésima iterada de 𝔊 se 𝔇(𝑡) = 𝛼 + 1 e, para

qualquer ordinal 𝛽 ≤ 𝛼, 𝑡(𝛽) = 𝔊(𝑡 ↾ 𝛽); em particular 𝑡(𝛼) = 𝔊(𝑡 ↾ 𝛼).

Provemos inicialmente que 𝔓 é funcional. Se 𝑥 não é um número ordinal então

não há o que provar. Se 𝑥 for um número ordinal, provaremos por indução transfinita que para

todo ordinal 𝛼 existe uma única 𝛼-ésima iterada de 𝔊, donde decorrerá que 𝔓(𝑥, 𝑦) é

funcional.

Assumamos que para qualquer 𝛽 < 𝛼 exista uma única 𝛽-ésima iterada de 𝔊 (por

simplicidade denotada 𝑡𝛽). Provemos que existe uma única 𝑡𝛼 . A hipótese de indução e o

Axioma da Substituição nos garantem a existência da família de funções

𝑇 = �𝑡𝛽�(∃𝛽)(𝛽 é ordinal ∧ 𝛽 < 𝛼)�.

7 Também chamada de Definição por Indução Transfinita, como vemos em Fraenkel, Bar-Hillel & Levy (1973, p. 93). A versão do teorema que provamos é uma adaptação do resultado provado por Hrbacek & Jech (1999, p. 115-117) e Jech (2003, p. 22).

115

Chamemos �̃� = ⋃𝑇 e finalmente 𝜏 = �̃� ∪ {⟨𝛼, 𝔊(�̃�)⟩}.

(Existência da 𝛼-ésima iterada): afirmamos que 𝜏 é uma 𝛼-ésima iterada de 𝔊.

Primeiramente, é óbvio que 𝜏 é uma relação, pois todos os membros de �̃� são

membros dos membros de 𝑇, isto é, pares ordenados. Mostremos então que 𝑇 é um sistema

compatível de funções.

Sejam 𝑡1, 𝑡2 ∈ 𝑇, tais que 𝔇(𝑡1) = 𝛽1 e 𝔇(𝑡2) = 𝛽2. Sem perda de generalidade,

assumamos 𝛽1 ≤ 𝛽2; como são ambos ordinais, 𝛽1 ⊆ 𝛽2. Assim, é suficiente provar que para

qualquer 𝛾 ≤ 𝛽1, 𝑡1(𝛾) = 𝑡2(𝛾), pois 𝛽1 ∩ 𝛽2 = 𝛽1. Procedemos por indução transfinita

(Teorema 4.3): seja 𝛾 < 𝛽1 e suponha que para qualquer 𝛿 < 𝛾, 𝑡1(𝛿) = 𝑡2(𝛿), então

𝑡1 ↾ 𝛾 = 𝑡2 ↾ 𝛾, e assim 𝑡1(𝛾) = 𝔊(𝑡1 ↾ 𝛾) = 𝔊(𝑡2 ↾ 𝛾) = 𝑡2(𝛾); logo, 𝑡1(𝛾) = 𝑡2(𝛾), para

quaisquer 𝛾 ∈ 𝛽1, como queríamos.

Segue então pelo Teorema 3.14 que �̃� = ⋃𝑇 é função. Além disso, considerando

𝐷 = {𝔇(𝑡)|𝑡 ∈ 𝑇}, temos pelo mesmo teorema 𝔇(�̃�) = ⋃𝐷. Como para todo 𝛽 < 𝛼 existe

𝑡 ∈ 𝑇 tal que 𝔇(𝑡) = 𝛽 + 1, bem como se 𝑡′ ∈ 𝑇 então 𝔇(𝑡′) = 𝛽′ + 1 para algum 𝛽′ < 𝛼,

segue que

𝔇(�̃�) = �𝔇(𝑡)𝑡∈𝑇

= �(𝛽+ 1)𝛽<𝛼

= 𝛼,

e daí 𝜏 é obviamente uma função, pois 𝛼 ∉ 𝔇(�̃�), de modo que 𝔇(𝜏) = 𝔇(�̃�) ∪ {𝛼} = 𝛼 + 1.

Em particular, 𝜏 ↾ 𝛼 = �̃�.

Resta mostrarmos que 𝜏(𝛽) = 𝔊(𝜏 ↾ 𝛽), para qualquer 𝛽 ≤ 𝛼.

Por construção, 𝜏(𝛼) = 𝔊(�̃�) = 𝔊(𝜏 ↾ 𝛼). Se 𝛽 < 𝛼, tomemos 𝑡 ∈ 𝑇 de modo que

𝛽 ∈ 𝔇(𝑡). Devido à definição de 𝑇, temos 𝑡(𝛽) = 𝔊(𝑡 ↾ 𝛽). Como 𝑇 é um sistema de

funções compatíveis, ⋃𝑇 = �̃� estende todas as funções de 𝑇 (Teorema 3.14), e assim 𝑡(𝜆) =

�̃�(𝜆) = 𝜏(𝜆) para todo 𝜆 ∈ 𝛽 e dessa forma, 𝑡 ↾ 𝛽 = 𝜏 ↾ 𝛽. Portanto, 𝜏(𝛽) = 𝔊(𝜏 ↾ 𝛽).

Segue do que vimos que 𝜏 é uma 𝛼-ésima iterada de 𝔊.

(Unicidade): Seja 𝜎 outra 𝛼-ésima iterada de 𝔊. Por definição, 𝔇(𝜎) = 𝔇(𝜏),

portanto, a fim de provarmos que 𝜎 = 𝜏 basta mostrar que para qualquer 𝛾 ≤ 𝛼, 𝜎(𝛾) = 𝜏(𝛾) .

Mas isto é imediato e faz-se por indução: se para qualquer 𝛿 < 𝛾 tivermos 𝜏(𝛿) = 𝜎(𝛿),

então 𝜏 ↾ 𝛾 = 𝜎 ↾ 𝛾 e assim 𝜏(𝛾) = 𝔊(𝜏 ↾ 𝛾) = 𝔊(𝜎 ↾ 𝛾) = 𝜎(𝛾) , como queríamos.

116

Mostramos dessa forma que para todo ordinal 𝛼 existe uma única 𝛼-ésima iterada

de 𝔊, que podemos denotar por 𝔱𝛼 . Pelo enunciado do teorema, 𝔉(𝛼) = 𝔱𝛼(𝛼) é uma

operação induzida por 𝔊, para todo ordinal 𝛼. Finalmente, provemos que 𝔉(𝛼) = 𝔊(𝔉 ↾ 𝛼).

Por definição, 𝔉(𝛼) = 𝔱𝛼(𝛼) = 𝔊(𝔱𝛼 ↾ 𝛼). Basta provarmos que 𝔱𝛼 ↾ 𝛼 = 𝔉 ↾ 𝛼 .

Mas isto é óbvio, pois para qualquer 𝛽 ∈ 𝛼,

𝔱𝛼(𝛽) = 𝔊(𝔱𝛼 ↾ 𝛽) = 𝔊�𝔱𝛽 ↾ 𝛽� = 𝔱𝛽(𝛽) = 𝔉(𝛽),

haja vista que 𝔱𝛼 e 𝔱𝛽 são compatíveis. Logo, 𝔉(𝛼) = 𝔊(𝔉 ↾ 𝛼). Q.E.D.

Assim como o Princípio da Indução, que admite versões para ordinais e conjuntos

bem ordenados, definições por recursão também podem ser feitas em conjuntos bem

ordenados quaisquer.

Teorema 4.15 (Definição por Recursão Transfinita para Conjuntos Bem

Ordenados). Seja 𝔊 uma operação e ⟨𝑊, ≺⟩ um conjunto bem ordenado. Então existe uma

única função 𝑓 com 𝔇(𝑓) = 𝑊 tal que 𝑓(𝑥) = 𝔊(𝑓 ↾ 𝑊[𝑥]), para todo 𝑥 ∈ 𝑊.

Demonstração.

A demonstração deste teorema consiste numa adaptação da demonstração

anterior.

Para 𝜇 ∈ 𝑊 chamaremos de 𝜇-ésima iterada de 𝔊 uma função 𝑓 tal que 𝔇(𝑓) =

𝑊[𝜇] ∪ {𝜇} = {𝑥 ∈ 𝑊|𝑥 ≼ 𝜇} e 𝑓(𝑥) = 𝔊(𝑓 ↾ 𝑊[𝑥]) para todo 𝑥 ≼ 𝜇 .

Seja 𝑤 ∈ 𝑊 arbitrário. Suponha que para todo 𝑦 ≺ 𝑤 exista uma única 𝑦-ésima

iterada de 𝔊, por simplicidade denotada por 𝑓𝑦. Construiremos uma 𝑤-ésima iterada de 𝔊 e

provaremos que esta é única, donde seguirá, por indução, que para todo membro de 𝑊 existe

uma iterada.

(Existência) Pelo Axioma da Substituição, existe o conjunto ℱ = �𝑓𝑦�𝑦 ≺ 𝑤�.

Afirmamos que ℱ é um sistema compatível de funções. De fato, notemos primeiramente que

para 𝑦1, 𝑦2 ∈ 𝑊 tais que 𝑦1 ≺ 𝑦2 ≺ 𝑤 tem-se por definição que

𝔇�𝑓𝑦1� ∩𝔇�𝑓𝑦2� = {𝑥 ∈ 𝑊|𝑥 ≼ 𝑦1} ∩ {𝑥 ∈ 𝑊|𝑥 ≼ 𝑦2} = 𝔇�𝑓𝑦1 �.

Mostremos que 𝑓𝑦1(𝑥) = 𝑓𝑦2(𝑥) para todo 𝑥 ≼ 𝑦1. Para 𝑢 ∈ 𝔇�𝑓𝑦1� qualquer,

assumamos 𝑓𝑦1(𝑡) = 𝑓𝑦2(𝑡) para todo 𝑡 ≺ 𝑢, o que acarreta 𝑓𝑦1 ↾ 𝑊[𝑢] = 𝑓𝑦2 ↾ 𝑊[𝑢]. Logo,

𝑓𝑦1(𝑢) = 𝔊�𝑓𝑦1 ↾ 𝑊[𝑢]� = 𝔊�𝑓𝑦2 ↾ 𝑊[𝑢]� = 𝑓𝑦2(𝑢). Pelo princípio da indução, segue que

117

𝑓𝑦1(𝑥) = 𝑓𝑦2(𝑥) para todo 𝑥 ∈ 𝔇�𝑓𝑦1� ∩𝔇�𝑓𝑦2 �. Como 𝑓𝑦1 e 𝑓𝑦2 são funções quaisquer de ℱ,

temos provada a afirmação de que ℱ é um sistema compatível de funções, donde pelo

Teorema 3.14 tem-se que ⋃ℱ é uma função, com 𝔇(⋃ℱ) = ⋃�𝔇�𝑓𝑦��𝑦 ≺ 𝑤� = 𝑊[𝑤].

Definamos então 𝑓̅ = (⋃ℱ) ∪ {⟨𝑤, 𝔊(⋃ℱ)⟩}. Claramente, 𝑓 ̅ é uma função, com

𝔇�𝑓�̅ = 𝑊[𝑤] ∪ {𝑤}. Além disso, ⋃ℱ = 𝑓̅ ↾ 𝑊[𝑤]. Assim, 𝑓(̅𝑥) = 𝔊�𝑓̅ ↾ 𝑊[𝑥]� para todo

𝑥 ∈ 𝔇�𝑓�̅, donde se obtém que 𝑓 ̅é uma 𝑤-ésima iterada de 𝔊.

(Unicidade) Se existisse uma função 𝔣 tal que 𝔇(𝔣) = {𝑥 ∈ 𝑊|𝑥 ≼ 𝑤} e 𝔣(𝑥) =

𝔊(𝔣 ↾ 𝑊[𝑥]) para todo 𝑥 ≼ 𝑤, teríamos obviamente 𝔣 = 𝑓̅ (a prova disso se dá por indução,

analogamente à demonstração de unicidade realizada no teorema anterior). Portanto, para todo

𝑤 ∈ 𝑊 existe uma única 𝑤-ésima iterada em 𝔊; pelo que expomos até aqui, quaisquer duas

iteradas de 𝔊 são compatíveis.

Finalmente, definamos 𝔉(𝑥) = 𝑓𝑥(𝑥). Afirmamos que 𝔉 é tal que

𝔉(𝑥) = 𝔊(𝔉 ↾ 𝑊[𝑥]), ∀𝑥 ∈ 𝑊.

Ora, para 𝑥 ∈ 𝑊 qualquer temos

𝔉(𝑥) = 𝑓𝑥(𝑥) = 𝔊(𝑓𝑥 ↾ 𝑊[𝑥]).

O teorema estará demonstrado se mostrarmos que 𝑓𝑥 ↾ 𝑊[𝑥] = 𝔉 ↾ 𝑊[𝑥], isto é,

que 𝑓𝑥(𝑎) = 𝔉(𝑎) para todo 𝑎 ≺ 𝑥. Contudo, tal igualdade decorre imediatamente do fato de

quaisquer duas iteradas de 𝔊 serem compatíveis, donde obtemos

𝑓𝑥(𝑎) = 𝔊(𝑓𝑥 ↾ 𝑊[𝑎]) = 𝔊(𝑓𝑎 ↾ 𝑊[𝑎]) = 𝔉(𝑎).

Q.E.D.

Existem outras formas de definir operações recursivamente; abaixo listamos as

principais formas. Todas elas podem ser demonstradas a partir do Teorema 4.14, bem como

admitem adaptações para conjuntos bem ordenados decorrentes do Teorema 4.15. No entanto,

não demonstramos tais resultados neste trabalho. Provas para as proposições seguintes podem

ser encontradas em Hrbacek & Jech (1999, p. 117-118).

Corolário 4.7 (Recursão Transfinita – outras formas).

(i) (Forma Paramétrica): Seja 𝔊(𝑧, 𝑥) uma operação, então existe uma

condição funcional em 𝑥 e 𝑧 𝔓(𝑧, 𝑥, 𝑦) tal que a operação 𝔉(𝑧, 𝑥) induzida por 𝔓 satisfaz

𝔉(𝑧, 𝛼) = 𝔉(𝑧, 𝔉𝑧 ↾ 𝛼), para quaisquer ordinais 𝛼 e para qualquer conjunto 𝑧;

118

(ii) Sejam 𝔊1, 𝔊2 e 𝔊3 operações. Então existem uma operação 𝔊 e uma

condição funcional em 𝑥 𝔓(𝑥, 𝑦), tais que a operação 𝔉 induzida por 𝔓 satisfaz:

𝔉(∅) = 𝔊1(0),

𝔉(𝛼 + 1) = 𝔊2�𝔉(𝛼)�, para todo ordinal 𝛼 e

𝔉(𝛼) = 𝔊3(𝔉 ↾ 𝛼), para todo ordinal limite 𝛼 ≠ ∅.

(iii) Seja Ω um número ordinal, 𝐴 um conjunto, 𝑆 = ⋃ 𝐴𝛼𝛼<Ω o conjunto de

todas as funções 𝑓:𝛼 ⟶ 𝐴 com 𝛼 < Ω e tome 𝑔: 𝑆 ⟶ 𝐴 uma função. Então existe uma única

função 𝑓:Ω⟶ 𝐴 tal que 𝑓(𝛼) = 𝑔(𝑓 ↾ 𝛼), para todo 𝛼 < Ω.

Enfim, definimos abaixo as principais operações para números ordinais. Para uma

discussão detalhada sobre aritmética ordinal e suas propriedades, recomendamos Suppes

(1972), Jech (2003) e Hrbacek & Jech (1999).

Definição 4.21 (Adição de Números Ordinais). Para quaisquer ordinais 𝛽,

(i) 𝛽 + 0 = 𝛽;

(ii) 𝛽 + (𝛼 + 1) = (𝛽 + 𝛼) + 1, para todo ordinal 𝛼;

(iii) 𝛽 + 𝛼 = sup{𝛽 + 𝛾|𝛾 < 𝛼} para todo ordinal limite 𝛼 ≠ 0.

Definição 4.22 (Multiplicação de Números Ordinais). Para quaisquer ordinais 𝛽,

(i) 𝛽 ⋅ 0 = 0;

(ii) 𝛽 ⋅ (𝛼 + 1) = 𝛽 ⋅ 𝛼 + 𝛽, para todo ordinal 𝛼;

(iii) 𝛽 ⋅ 𝛼 = sup{𝛽 ⋅ 𝛾|𝛾 < 𝛼}, para todo ordinal limite 𝛼.

Definição 4.23 (Exponenciação de Números Ordinais). Para todo ordinal 𝛽,

(i) 𝛽0 = 1;

(ii) 𝛽𝛼+1 = 𝛽𝛼 ⋅ 𝛽, para todo ordinal 𝛼;

(iii) 𝛽𝛼 = sup{𝛽𝛾|𝛾 < 𝛼}, para todo ordinal limite 𝛼.

119

4.3. Números Naturais e Conjuntos Finitos

Nesta seção, definimos os números naturais e abordamos brevemente suas

aplicações na definição de conjunto finito. Para tanto, adotamos a definição de número natural

dada por Kunen (1980, p. 18) e mostramos sua equivalência com a definição dada por

Hrbacek & Jech (1999, p. 41).

Definição 4.24. Seja 𝛼 um número ordinal. 𝛼 é um número natural se, e somente

se, para todo 𝛽 ≤ 𝛼 tivermos 𝛽 = 0 ou 𝛽 um ordinal sucessor.

Lema 4.3. Se 𝛼 é um número natural, então 𝛼 + 1 é um número natural. Além

disso, se 𝛽 ≤ 𝛼 então 𝛽 é um número natural.

Demonstração.

Seja 𝛽 um ordinal tal que 𝛽 < 𝛼 + 1, então 𝛽 < 𝛼 ou 𝛽 = 𝛼, pois 𝛼 + 1 = 𝛼 ∪

{𝛼}. Daí, como 𝛼 é um número natural por hipótese, segue que 𝛽 = 0 ou 𝛽 é um ordinal

sucessor. Se 𝛽 = 𝛼 + 1, então 𝛽 é um ordinal sucessor. Logo, 𝛼 + 1 é um número natural.

Para qualquer 𝛽 ≤ 𝛼, 𝛿 ≤ 𝛽 implica 𝛿 ≤ 𝛼 e daí 𝛿 = 0 ou 𝛿 é ordinal sucessor,

donde concluímos que 𝛽 é um número natural (notemos que todo número natural é um

número ordinal sucessor). Q.E.D.

Definição 4.25. Um conjunto ℐ é indutivo se, e somente se,

(i) ∅ ∈ ℐ;

(ii) (∀𝑛)(𝑛 ∈ ℐ ⟹ 𝑛 + 1 ∈ ℐ).

Teorema 4.16. Seja ℐ um conjunto indutivo. Se 𝛼 é um número natural, então

𝛼 ∈ ℐ.

Demonstração.

Suponha, via reductio ad absurdum, que para algum natural 𝛼 ≠ 0 tenha-se 𝛼 ∉

ℐ. Pela definição de número natural, 𝛼 é um ordinal sucessor, digamos 𝛼 = 𝛽+ 1. Então

𝛽 ∉ ℐ (do contrário 𝛼 ∈ ℐ, pela definição de conjunto indutivo).

Assim 𝐴 = 𝛼 ∖ ℐ ≠ ∅. Como todos os membros de 𝐴 são números ordinais, 𝐴 é

bem ordenado e daí existe um número natural 𝜉, o menor elemento de 𝐴. Se 𝜉 = 0 então

𝜉 ∈ ℐ, o que contradiz 𝜉 ∈ 𝐴. Assim, 𝜉 é um ordinal sucessor, donde segue que existe 𝛿 tal

120

que 𝜉 = 𝛿 + 1 com 𝛿 < 𝜉 e, por conseguinte, 𝛿 é um número natural. Se 𝛿 ∈ ℐ teríamos 𝜉 ∈

ℐ, o que contraria o fato de 𝜉 ∈ 𝐴. Logo 𝛿 ∉ ℐ, mas como 𝛿 ∈ 𝛼, concluímos que 𝛿 é o menor

elemento de 𝐴, absurdo. Portanto, para qualquer natural 𝛼, 𝛼 ∈ ℐ. Q.E.D.

A existência do conjunto indutivo ℐ no teorema anterior nos é garantida por (A6),

que aliado ao Teorema 2.7 e à Definição 2.14 nos permite definir o conjunto dos naturais por

abstração, como feito por Kunen e Suppes. Por meio de ℐ também podemos definir o conjunto

dos naturais como a interseção de todos os conjuntos indutivos, conforme feito por Hrbacek &

Jech. O teorema posterior prova que tais definições nos dão o mesmo conjunto.

Definição 4.26. 𝜔 = {𝑛|𝑛 é número natural}.

Definição 4.27. ℕ = {𝑥 ∈ 𝐼|(∀𝑦)(𝑦 é indutivo ⟹ 𝑥 ∈ 𝑦)}.

Lema 4.4.

(i) ℕ é indutivo;

(ii) Se 𝑋 é indutivo então ℕ ⊆ 𝑋.

(iii) (Princípio da Indução em ℕ): Seja 𝜑(𝑥) uma condição em 𝑥. Se 𝜑(0) e

para qualquer 𝑚 ∈ ℕ, 𝜑(𝑚) ⟹𝜑(𝑚 + 1), então 𝜑(𝑛) para todo 𝑛 ∈ ℕ.

(iv) 𝜔 é um número ordinal.

Demonstração.

Para todo conjunto indutivo ℐ, temos 0 ∈ ℐ, donde segue que 0 ∈ ℕ.

Analogamente, se 𝑛 ∈ ℕ, então 𝑛 ∈ ℐ para todo conjunto indutivo ℐ. Logo, 𝑛 + 1 ∈ ℐ, para

qualquer conjunto indutivo ℐ e, portanto, 𝑛 + 1 ∈ ℕ. Assim, ℕ é indutivo, como afirma (i). O

segundo item decorre imediatamente da definição de ℕ.

Provemos (iii). Chamemos de 𝑃𝜑 = {𝑛 ∈ ℕ|𝜑(𝑛)}. Pela hipótese de (iii), temos

0 ∈ 𝑃𝜑 e, se 𝑛 ∈ 𝑃𝜑, então 𝑛 + 1 ∈ 𝑃𝜑, para qualquer 𝑛 ∈ ℕ. Logo, 𝑃𝜑 é um conjunto

indutivo. Do item anterior, segue que ℕ ⊆ 𝑃𝜑 . Obviamente, 𝑃𝜑 ⊆ ℕ. Assim, ℕ =

{𝑛 ∈ ℕ|𝜑(𝑛)}, isto é, 𝜑(𝑛), para todo 𝑛 ∈ ℕ, como queríamos.

Finalmente, como 𝜔 é um conjunto de números ordinais, segue que 𝜔 é bem

ordenado pela relação ∈𝜔, além disso, para um natural qualquer 𝑛 ∈ 𝜔, se 𝑚 ∈ 𝑛 então

𝑚 < 𝑛 e, por conseguinte, 𝑚 é um número natural, donde obtemos 𝑚 ∈ 𝜔 , o que prova o

último item. Q.E.D.

Teorema 4.17. 𝜔 = ℕ.

121

Demonstração.

Provemos que 𝜔 é indutivo. De fato, 0 é um número natural por vacuidade, logo

0 ∈ 𝜔. Pelo Lema 4.3, se 𝛼 é natural, então 𝛼 + 1 é natural, isto é, 𝛼 ∈ 𝜔⟹ 𝛼 + 1 ∈ 𝜔.

Logo, 𝜔 é indutivo. Assim, pelo lema anterior, ℕ ⊆ 𝜔.

Reciprocamente, provemos que 𝜔 ⊆ ℕ. Como 𝜔 é um número ordinal, 𝜔 é bem

ordenado e assim procederemos por indução. Como 0 ∈ 𝜔 e 0 ∈ 𝐽, para todo conjunto

indutivo 𝐽, temos 0 ∈ ℕ. Se para algum 𝑛 ∈ 𝜔 tivermos 𝑛 ∈ ℕ, então para qualquer conjunto

indutivo 𝐽, teremos 𝑛 ∈ 𝐽, donde segue que 𝑛 + 1 ∈ 𝐽 e consequentemente 𝑛 + 1 ∈ ℕ. O

resultado segue do fato de que 𝑛 + 1 ∈ 𝜔. Q.E.D.

Observação: preferencialmente utilizamos a letra grega ômega “𝜔” para indicar o

conjunto dos números naturais.

Assim, formalizamos em ZFC o conjunto dos números naturais 𝜔, o menor

número ordinal limite diferente de 0. Seus elementos, denominados números naturais, são

obtidos por sucessão a partir de 0, de tal modo que todo número natural, exceto 0, é sucessor

de algum outro número natural e é sucedido por outro número natural. Embora à primeira

vista possa ser estranho considerar números como coleções de elementos, o que nos importa é

o fato de que tais conjuntos se comportam conforme esperaríamos que números naturais o

fizessem, em outras palavras, 𝜔 satisfaz os axiomas de Peano.

Teorema 4.18 (Axiomas de Peano). São verdadeiras as seguintes afirmações:

(i) 0 ∈ 𝜔;

(ii) (∀𝑛)(𝑛 ∈ 𝜔⟹ 𝑛 + 1 ∈ 𝜔);

(iii) ¬(∃𝑛)(𝑛 ∈ 𝜔 ∧ 𝑛 + 1 = 0);

(iv) (∀𝑛)(∀𝑚)(𝑚,𝑛 ∈ 𝜔 ∧ 𝑚 + 1 = 𝑛 + 1 ⟹𝑚 = 𝑛);

(v) (Princípio da Indução Natural): Seja 𝜑(𝑥) uma condição em 𝑥. Se 𝜑(0) e

para qualquer 𝑚 ∈ 𝜔, 𝜑(𝑚) ⟹𝜑(𝑚+ 1), então 𝜑(𝑛) para todo 𝑛 ∈ 𝜔.

Demonstração.

As afirmações (i) e (ii) seguem diretamente do fato de 𝜔 ser indutivo. A

veracidade de (iii) decorre do fato de que, do contrário, seria 0 = 𝑛 ∪ {𝑛}, donde teríamos que

𝑛 ∈ 0, absurdo, em vista de que 0 = ∅. O princípio da indução já foi provado anteriormente.

Resta-nos apenas o item (iv).

122

Sejam 𝑚, 𝑛 ∈ 𝜔 quaisquer, tais que 𝑚 + 1 = 𝑛 + 1. Como 𝑛 ∈ 𝑛 + 1, temos

𝑛 ∈ 𝑚 + 1. Então, 𝑛 ∈ 𝑚 ou 𝑛 = 𝑚. Analogamente, obtém-se 𝑚 ∈ 𝑛 ou 𝑛 = 𝑚. Se 𝑛 ≠ 𝑚,

então necessariamente 𝑛 ∈ 𝑚 e 𝑚 ∈ 𝑛. Como 𝑚 e 𝑛 são também ordinais, inferimos que

𝑛 < 𝑚 e 𝑚 < 𝑛, absurdo. Q.E.D.

Substituindo Ω por 𝜔 no Corolário 4.7 (iii) obtemos o Princípio da Recursão

Finita, uma restrição da Recursão Transfinita ao conjunto 𝜔, o que permite definir operações

entre números naturais, entre outras sequências quaisquer de conjuntos indexados pelos

membros de 𝜔. Como as principais operações para ordinais já foram definidas com o auxílio

da Recursão Transfinita, não nos aprofundamos no estudo da aritmética dos naturais ou sobre

definições por recursão finita, de modo que assumimos as propriedades aritméticas usuais dos

naturais.

Conforme dito anteriormente, em posse dos números naturais podemos definir 𝑛-

úplas em ZFC. Intuitivamente, uma 𝑛-úpla deve ser uma lista de conjuntos ⟨𝑎0,…, 𝑎𝑛−1⟩ tal

que ⟨𝑏0,…, 𝑏𝑛−1⟩ = ⟨𝑎0,…, 𝑎𝑛−1⟩ se, e somente se, 𝑏𝑖 = 𝑎𝑖, para cada 𝑖 = 0, 1,…, 𝑛. Uma

das maneiras mais simples de formalizar tal conceito em ZFC consiste em definir ⟨𝑎0,…,

𝑎𝑛−1⟩ como sendo um sistema de conjuntos indexados, isto é, uma função cujo domínio é o

número natural 𝑛, ⟨𝑎𝑖|𝑖 ∈ 𝑛⟩ que neste caso recebe o nome de sequência finita de extensão 𝑛

— de modo geral, se 𝔰 = ⟨𝑎𝑖|𝑖 ∈ 𝛼⟩ onde 𝛼 é um número ordinal qualquer, dizemos que 𝔰 é

uma sequência transfinita de extensão 𝛼 —, que também denotamos por

⟨𝑎𝑖|𝑖 < 𝑛⟩, ⟨𝑎𝑖|𝑖 = 0, 1,…, 𝑛− 1⟩ ou ⟨𝑎0,…, 𝑎𝑛−1⟩.

Definição 4.28. Para qualquer 𝑛 ∈ 𝜔, a 𝑛-úpla ordenada de coordenadas 𝑎0,

𝑎1,…, 𝑎𝑛−1 é ⟨𝑎0,…, 𝑎𝑛−1⟩ = ⟨𝑎𝑖|𝑖 ∈ 𝑛⟩.

Claramente, ⟨𝑎0,…, 𝑎𝑛−1⟩ = ⟨𝑏0,…, 𝑏𝑛−1⟩ se, e somente se, 𝑎𝑖 = 𝑏𝑖 para todo

𝑖 ∈ 𝑛: é uma consequência imediata do Princípio da Extensão para funções (Teorema 3.9). Na

𝑛-úpla ⟨𝑎0,…, 𝑎𝑛−1⟩, cada 𝑎𝑖 é chamado a (𝑖 + 1)-ésima coordenada de ⟨𝑎0,…, 𝑎𝑛−1⟩, para

todo 𝑖 < 𝑛.

Embora, por exemplo, a definição anterior de par ordenado difira da Definição

2.20, {⟨0, 𝑎0⟩, ⟨1, 𝑎1⟩} e �{𝑎0}, {𝑎0, 𝑎1}� comportam-se da mesma maneira no que concerne às

propriedades que desejamos que um par ordenado possua. Por tal motivo, não adotamos

123

ressalvas em utilizar a Definição 4.28 como generalização do conceito de 𝑛-úpla ordenada,

embora a mesma possa ser definida nos moldes da Definição 2.20 por recursão8.

Analogamente, se 𝐴 = ⟨𝐴𝑖|𝑖 ∈ 𝑛⟩ é um sequência finita de extensão 𝑛, então ∏𝐴

é o produto cartesiano entre 𝐴0, 𝐴1,…, 𝐴𝑛−1 : os elementos de ∏𝐴 são sequências

⟨𝑎𝑖|𝑖 ∈ 𝑛⟩, onde para cada 𝑖 ∈ 𝑛, 𝑎𝑖 ∈ 𝐴𝑖. Usualmente denota-se por

� 𝐴𝑖0≤𝑖<𝑛

.

Quando 𝐴𝑖 = 𝐴, para todo 𝑖 ∈ 𝑛, temos ∏ 𝐴𝑖0≤𝑖<𝑛 = 𝐴𝑛 , o conjunto de todas as

𝑛-úplas com coordenadas de 𝐴. A generalização natural do produto cartesiano para um

conjunto de índices 𝐼 qualquer já foi feita no capítulo anterior, quando definimos ∏ 𝐴𝑖𝑖∈𝐼 .

Para uma função 𝑠 = ⟨𝑎𝑖|𝑖 ∈ 𝜔⟩, dizemos que 𝑠 é uma sequência infinita. Outras

notações adotadas para sequências infinitas são

⟨𝑎0,…, 𝑎𝑛,… ⟩, ⟨𝑎𝑖|𝑖 = 0, 1, 2, …⟩ ou ⟨𝑎𝑖⟩𝑖=0∞ .

Notações análogas são aceitas para as imagens de sequências finitas e infinitas,

isto é, se 𝑠 = ⟨𝑎0,…, 𝑎𝑛−1⟩ e 𝑆 = ⟨𝑎𝑖|𝑖 ∈ 𝜔⟩, escrevemos {𝑎0,…, 𝑎𝑛−1}, {𝑎𝑖|𝑖 < 𝑛} ou

{𝑎𝑖|0 ≤ 𝑖 ≤ 𝑛} para indicar ℑ(𝑠), e {𝑎0,…, 𝑎𝑛,…}, {𝑎𝑖|𝑖 ∈ 𝜔} ou {𝑎𝑖}𝑖=0∞ para designar ℑ(𝑆).

Naturalmente, ℑ(𝑠) nos permite generalizar a ideia de par não ordenado, de modo a obtermos

a 𝑛-úpla não ordenada, mas não o fazemos formalmente.

O motivo pelo qual denominamos tais sequências de infinitas ou finitas se deve ao

fato de um conjunto ser dito finito se for equipotente a um número natural 𝑛. Formalmente

temos a definição seguinte.

Definição 4.29. Um conjunto 𝑋 é finito se, e somente se, existe 𝑛 ∈ 𝜔 tal que

𝑋 ≈ 𝑛. Se 𝑋 não é finito, dizemos que 𝑋 é infinito9.

A proposição seguinte apenas formaliza algumas consequências imediatas da

definição acima, bem como as relaciona com os números cardinais.

Proposição 4.8.

(i) Todo número natural é finito;

8 Para um estudo de tal abordagem, sugerimos Hrbacek & Jech (1999). 9 Existem critérios equivalentes que permitem definir conjuntos finitos sem requerer o uso de

números naturais. Hrbacek & Jech (1999) e principalmente Suppes (1972) tratam de tais definições.

124

(ii) Se 𝑛 ∈ 𝜔 então não existe bijeção 𝜑: 𝑛 ⟶ 𝑋 com 𝑋 ⊂ 𝑛;

(iii) Se 𝑚, 𝑛 ∈ 𝜔 e 𝜑: 𝑛 ⟶ 𝑋 e 𝜓:𝑚 ⟶ 𝑋 são bijeções, então 𝑚 = 𝑛;

(iv) Todo número natural é um número cardinal.

(v) 𝜔 é infinito;

(vi) 𝜔 é o menor número cardinal infinito;

(vii) Todo conjunto finito é bem ordenável;

(viii) Se 𝑋 ≈ 𝑛 e 𝑛 é um número natural então |𝑋| = 𝑛;

(ix) Se 𝑋 é finito e 𝑌 ⊆ 𝑋 então 𝑌 é finito;

(x) Se 𝑋 é uma família finita de conjuntos finitos então ⋃𝑋 é finito;

(xi) Se 𝑋 é finito então ℘(𝑋) é finito;

(xii) Se 𝑋 é finito e 𝑓 é uma função com 𝔇(𝑓) = 𝑋 então 𝑓[𝑋] é finito.

Demonstração.

Provamos apenas (iv), (vi), (vii) e (viii). As demais demonstrações podem ser

encontradas em Hrbacek & Jech (1999, p. 69-73) e baseiam-se em argumentos de indução e

recursão.

Os itens (iv) e (vi) decorrem da definição de número cardinal: todo número

natural 𝑛 é cardinal, pois do contrário, existiria um natural 𝑚 ⊂ 𝑛 equipotente a 𝑛,

contrariando o item (ii); se 𝜔 não fosse cardinal, existiria 𝑛 < 𝜔 e uma bijeção 𝑓:𝜔⟶ 𝑛,

donde teríamos que 𝑓 ↾ (𝑛 + 1):𝑛 + 1 ⟶𝑛 seria uma função injetora de 𝑛 + 1 num

subconjunto próprio de 𝑛 ⊂ 𝑛 + 1, contrariando o item (ii), logo 𝜔 é um número cardinal

(infinito, em vista do item (v)) e, como todos os demais cardinais menores que 𝜔 são finitos,

segue que 𝜔 é o menor número cardinal infinito.

A demonstração de (vii) é simplesmente uma adaptação da Proposição 4.6, pois

todo número natural 𝑛 é um número ordinal que, por sua vez, é bem ordenado. A validade de

(viii) também é imediata: como 𝑋 é finito, então é bem ordenável e daí |𝑋| = 𝛼, para algum

cardinal 𝛼; como 𝑋 ≈ 𝑛 por hipótese, se 𝛼 < 𝑛 teríamos 𝛼 ≈ 𝑛, contrariando o fato de 𝑛 ser

um cardinal. Q.E.D.

O próximo teorema é uma adaptação do exposto por Lima (2009, p. 48,49), que

mostra a equivalência em ZFC entre a noção de infinito exposta acima e àquela elaborada por

Dedekind.

Teorema 4.19 (Infinito de Dedekind). Um conjunto 𝑋 é infinito se, e somente se,

admite uma bijeção 𝜑:𝑋 ⟶ 𝑌, com 𝑌 ⊂ 𝑋.

125

Demonstração.

Provemos inicialmente que se 𝑋 é finito, então não existe bijeção 𝜑:𝑋 ⟶ 𝑌 onde

𝑌 é um subconjunto próprio de 𝑋. Suponha, por absurdo, que exista tal bijeção 𝜑. Seja 𝑛 o

número natural tal que 𝜓: 𝑛 ⟶ 𝑋 é uma bijeção e 𝑌 ⊂ 𝑋 um subconjunto próprio de 𝑋 —

notemos que existe 𝑎 ∈ 𝑋 ∖ 𝑌 , com 𝜓(𝑚) = 𝑎, para algum 𝑚 < 𝑛. Chamemos 𝐴 = 𝜓−1(𝑌).

Obviamente, 𝜓 ↾ 𝐴:𝐴 ⟶ 𝑌 é uma bijeção: sua injetividade decorre da

injetividade de 𝜓, enquanto sua sobrejetividade decorre da definição de 𝐴. Temos assim que

(𝜓 ↾ 𝐴)−1 ∘ 𝜑 ∘ 𝜓: 𝑛 ⟶ 𝐴 é uma bijeção. A contradição se encontra ao observarmos que

𝐴 ≠ 𝑛: de fato, se 𝐴 = 𝑛, então 𝑚 ∈ 𝐴 e teríamos 𝜓(𝑚) = 𝑎 ∈ 𝑌. Assim, construímos uma

bijeção entre 𝑛 e um subconjunto próprio de 𝑛, contrariando a Proposição 4.8 (ii).

Pela contrapositiva, se existir uma bijeção 𝜑:𝑋 ⟶ 𝑌 com 𝑌 ⊂ 𝑋 então 𝑋 é

infinito.

Reciprocamente, suponha que 𝑋 seja um conjunto infinito. Inicialmente,

construamos por recursão uma injeção 𝜉:𝜔 ⟶ 𝑋. Para tanto, considere uma função escolha

𝑓:℘(𝑋) ⟶𝑋. Para cada 𝑛 ∈ 𝜔, façamos 𝜉(𝑛) = 𝑓(𝑋∖ 𝜉[𝑛]). Note que 𝜉 é tal que

𝜉(0) = 𝑓(𝑋), 𝜉(1) = 𝑓(𝑋 ∖ {𝑓(𝑋)}), 𝜉(2) = 𝑓(𝑋 ∖ {𝑓(𝑋), 𝑓(𝑋 ∖ {𝑓(𝑋)})}),…

onde 𝑓(𝑋) é um elemento de 𝑋, 𝑓(𝑋 ∖ {𝑓(𝑋)}) é um elemento de 𝑋 ∖ {𝑓(𝑋)} e assim por

diante.

Para 𝑎, 𝑏 ∈ 𝜔 suponha 𝑎 < 𝑏. De tal desigualdade segue que 𝑎 ∈ 𝑏 e, por

conseguinte 𝜉(𝑎) ∈ 𝜉[𝑏]. Como 𝜉(𝑏) ∈ 𝑋 ∖ {𝜉[𝑏]}, temos 𝜉(𝑏) ≠ 𝜉(𝑎), logo 𝜉 é injetora.

Seja 𝑋𝜔 = {𝜉0,…, 𝜉𝑛 ,…} ⊆ 𝑋 a imagem de 𝜉. Evidentemente o subconjunto

𝑌 = (𝑋 ∖ 𝑋𝜔) ∪ {𝜉2𝑘|𝑘 ∈ 𝜔} = (𝑋∖ 𝑋𝜔) ∪ {𝜉0 , 𝜉2, 𝜉4,…} está contido propriamente em 𝑋,

haja vista que, por exemplo, 𝜉1 ∉ 𝑌. Definamos então a função Ω:𝑋 ⟶ 𝑌 por Ω(𝑥) = 𝑥 se

𝑥 ∈ 𝑋 ∖ 𝑋𝜔 e Ω(𝜉𝑛) = 𝜉2𝑛. Obviamente Ω é bijetora. Construímos assim uma bijeção entre 𝑋

e um subconjunto próprio de 𝑋. Q.E.D.

Teorema 4.20. (∀𝐴)(℘(𝐴) ≈ 2𝐴).

Demonstração.

Para cada 𝑆 ∈ ℘(𝐴), definamos 𝜒𝑆:𝐴⟶ {0, 1} por 𝜒𝑆(𝑎) = 1 se 𝑎 ∈ 𝑆, e

𝜒𝑆(𝑎) = 0 caso 𝑎 ∉ 𝑆, para todo 𝑎 ∈ 𝐴. Então, a função 𝜂:℘(𝐴) ⟶ 2𝐴 dada por 𝜂(𝑆) = 𝜒𝑆 é

claramente uma bijeção. Q.E.D.

Corolário 4.8: (∀𝐴)(∀𝐵)(𝐴 ≈ 𝐵 ⟹ 2𝐴 ≈ 2𝐵)

126

Demonstração.

Segue diretamente do Teorema 4.20 e do Corolário 3.4 (vii). Q.E.D.

Definição 4.30. Um conjunto 𝑋 é enumerável ou contável se, e somente se, 𝑋 for

finito ou existir uma bijeção 𝜑:𝜔 ⟶ 𝑋. Em caso contrário, 𝑋 é dito não enumerável.

No que se refere a números cardinais damos apenas a definição dos números

cardinais transfinitos, isto é, dos cardinais maiores ou iguais a 𝜔, geralmente indicados pela

letra hebraica Aleph (ℵ) acompanhada por um índice — embora em certos contextos sejam

denotados pela letra 𝜔 também acompanhada de subíndice.

Definição 4.31. Para todo ordinal 𝛼, definimos:

(i) ℵ0 = 𝜔 ;

(ii) ℵ𝛼+1 = ℎ(ℵ𝛼), para todo ordinal 𝛼;

(iii) ℵ𝛼 = sup�ℵ𝛾�𝛾 < 𝛼� se 𝛼 é um ordinal limite.

Como provaremos a seguir, para todo ordinal 𝛼, ℵ𝛼 é um cardinal. Contudo, tão

importante quanto este resultado, é o fato de que para todo cardinal transfinito 𝜅 existe um

número ordinal 𝛼 tal que ℵ𝛼 = 𝜅. Assim, a Definição 4.31 nos dá a regra que permite obter

todos os números cardinais transfinitos.

Lema 4.5. Se 𝑋 é um conjunto de números cardinais, então ⋃𝑋 é cardinal. Além

disso, se 𝛽 é um cardinal tal que 𝛼 ≤ 𝛽 para todo 𝛼 ∈ 𝑋, então ⋃𝑋 ≤ 𝛽.

Demonstração.

Já vimos que ⋃𝑋 = sup𝑋 é um número ordinal. Se existisse 𝛽 < ⋃𝑋 tal que

𝛽 ≈ ⋃𝑋, teríamos que existe um cardinal 𝛼 ∈ 𝑋 tal que 𝛽 < 𝛼 e, consequentemente, 𝛽 ≺ 𝛼

(no sentido de que existe uma injeção de 𝛽 em 𝛼). Temos assim 𝛽 ≺ 𝛼 ≾ ⋃𝑋 ≈ 𝛽, isto é,

concluímos que 𝛽 ≺ 𝛽, absurdo. O restante é imediato. Q.E.D.

Teorema 4.21.

(i) Se 𝛼 e 𝛽 são ordinais tais que 𝛼 < 𝛽, então ℵ𝛼 < ℵ𝛽 (em particular,

𝛼 ≤ 𝛽implica ℵ𝛼 ≤ ℵ𝛽);

(ii) ℵ𝛼 é um número cardinal para todo 𝛼;

(iii) Se 𝜅 é um cardinal transfinito, então existe um ordinal 𝛽 tal que ℵ𝛽 = 𝜅.

Demonstração.

127

Primeiramente, pela definição do número de Hartogs, vale ℵ𝛼 < ℵ𝛼+1, para todo

ordinal 𝛼. Por indução, se para todo ordinal 𝜗 < 𝛽, tivermos ℵ𝛼 < ℵ𝜗 sempre que 𝛼 < 𝜗,

então se 𝛽 = 𝜗′ + 1, temos ℵ𝛼 < ℵ𝜗′ < ℵ𝜗′+1 = ℵ𝛽 . Se 𝛼 < 𝛽 e 𝛽 é ordinal limite, então

qualquer ordinal 𝛾 ∈ ℵ𝛼 é também membro de ⋃{ℵ𝜀|𝜀 < 𝛽} = ℵ𝛽, provando (i).

A validade de (ii) prova-se por indução sobre 𝛼. Por definição ℵ0 é um número

cardinal. Obviamente se ℵ𝛼 é um cardinal, então ℎ(ℵ𝛼) = ℵ𝛼+1 é um cardinal (para qualquer

conjunto 𝐴, ℎ(𝐴) é um número cardinal). Para um ordinal limite 𝜇, temos por definição

ℵ𝜇 = sup{ℵ𝛼|𝛼 < 𝜇} = �ℵ𝛼𝛼<𝜇

,

de modo que supondo ℵ𝛼 ser cardinal para todo 𝛼 < 𝜇, segue do Lema 4.5 que ℵ𝜇 é um

número cardinal.

Finalmente, provemos (iii). Para tanto, precisamos provar a afirmação:

[†] 𝛼 ≤ ℵ𝛼, para todo ordinal 𝛼.

O resultado é trivial para 𝛼 finito. Consideremos então apenas os ordinais

transfinitos. Se para um dado ordinal transfinito 𝜇, 𝛽 ≤ ℵ𝛽 para todo 𝛽 < 𝜇, há dois casos a

considerar: se 𝜇 = 𝛿 + 1, então pela hipótese de indução 𝛿 ≤ ℵ𝛿 , logo para 𝛾 ∈ 𝜇 qualquer

temos 𝛾 ≤ 𝛿 ≤ ℵ𝛿 < ℵ𝛿+1 = ℵ𝜇, e assim 𝛾 ∈ ℵ𝜇, mostrando que 𝜇 ⊆ ℵ𝜇, isto é, 𝜇 ≤ ℵ𝜇; se 𝜇

for um ordinal limite, pela definição segue que ℵ𝜇 = ⋃ ℵ𝛽𝛽<𝜇 , logo, se 𝛾 ∈ 𝜇 então existe

𝛽 < 𝜇 tal que 𝛾 ∈ ℵ𝛽 ⊆ ℵ𝜇, e consequentemente 𝜇 ≤ ℵ𝜇.

Segue de [†] que para todo cardinal 𝜅 existe um ordinal 𝛼 tal que 𝜅 < ℵ𝛼

(tomemos, por exemplo, 𝛼 = 𝜅 + 1). Para demonstrarmos (iii) basta mostrarmos que para

qualquer ordinal 𝛼, dado um cardinal transfinito 𝜅 < ℵ𝛼 existe um ordinal 𝛾 < 𝛼 tal que

𝜅 = ℵ𝛾. Procedemos por indução sobre 𝛼.

O resultado é obviamente verdadeiro para 𝛼 = 0. Se 𝛼 = 𝛽 + 1, assumamos que

para todo cardinal transfinito 𝜆 < ℵ𝛽, exista 𝜉 < 𝛽 tal que 𝜆 = ℵ𝜉; logo, para todo cardinal

transfinito 𝜅 < ℵ𝛼 temos 𝜅 < ℵ𝛼 = ℎ�ℵ𝛽�, e assim 𝜅 ≾ ℵ𝛽 (pois ℎ�ℵ𝛽� é o menor ordinal

não equipotente a ℵ𝛽), donde segue que 𝜅 = ℵ𝛽 ou, pela hipótese de indução, 𝜅 = ℵ𝛾 , para

𝛾 < 𝛽 < 𝛼. Por fim, se 𝜇 é um ordinal limite, suponhamos que para 𝛽 < 𝜇 qualquer seja

verdadeiro que para todo cardinal transfinito 𝜆 < ℵ𝛽 , exista 𝜉 < 𝛽 tal que 𝜆 = ℵ𝜉; logo, para

um cardinal 𝜅 < ℵ𝜇 = ⋃ ℵ𝛾𝛾<𝜇 , existe 𝛾′ < 𝜇 tal que 𝜅 < ℵ𝛾′, donde o resultado segue da

128

hipótese de indução. Portanto, para todo cardinal transfinito 𝜅, existe 𝛾 ≤ 𝜅 tal que 𝜅 = ℵ𝛾.

Q.E.D.

Corolário 4.9. Não existe cardinal transfinito 𝜅 tal que ℵ𝛼 < 𝜅 < ℵ𝛼+1, para

qualquer ordinal 𝛼.

Demonstração.

Suponha, por absurdo, que exista tal cardinal transfinito 𝜅. Pelo teorema anterior,

existe um ordinal 𝛾 ≤ 𝜅 tal que 𝜅 = ℵ𝛾. Por um lado, a hipótese acarreta 𝛼 < 𝛾, caso

contrário, pelo mesmo teorema teríamos ℵ𝛾 < ℵ𝛼. Analogamente, 𝛾 < 𝛼 + 1. Logo, 𝛼 < 𝛾 <

𝛼 + 1, o que é absurdo, em vista do Lema 4.2 (iii). Q.E.D.

A Hipótese do Continuum conjectura que |℘(𝜔)| = ℵ1, ou seja, que |℘(𝜔)| =

ℎ(𝜔) = {𝛼|𝛼 ≾ 𝜔}; a referência ao continuum é feita, pois ℝ ≈ |℘(𝜔)| = |℘(ℵ0)| = |2ℵ𝛼|.

Sua generalização natural é a Hipótese Generalizada do Continuum, a qual afirma que

|2ℵ𝛼 | = ℵ𝛼+1, para qualquer ordinal 𝛼. Notemos que, a posteriori, faz sentido tratar de

|℘(𝜔)| ou |℘(ℵ𝛼)|, pois todo conjunto é bem ordenável (Teorema de Zermelo, página 132);

tratamos sobre a Hipótese Generalizada do Continuum no próximo capítulo.

Gostaríamos de observar que, com base no que foi exposto até aqui, pode-se obter

em ZFC não apenas o conjunto dos números naturais, mas também o conjunto dos inteiros,

dos racionais, dos números reais e consequentemente dos complexos. Os métodos de

construção baseiam-se nas operações até aqui definidas. Para uma discussão mais completa de

tais métodos, sugerimos Suppes (1972), Hrbacek & Jech (1999) e Dedekind (1901).

Além disso, com a formalização das funções, podemos estudar as propriedades de

funções entre conjuntos genéricos, caracterizando as operações e os critérios de

associatividade, comutatividade, etc., desenvolvendo dessa forma os principais tópicos da

Álgebra. Esses, dentre tantos outros exemplos, nos mostram que ZFC é uma formalização

satisfatória para os principais ramos da Matemática Pura.

129

Capítulo 5 — O Axioma da Escolha

Neste capítulo versamos sobre o papel do Axioma da Escolha na Teoria dos

Conjuntos e na Matemática de modo geral. Provamos algumas equivalências entre ele e outras

sentenças, dentre as quais destacamos o Lema de Zorn. Por fim, demonstramos que a Hipótese

Generalizada do Continuum é suficiente para o Axioma da Escolha.

5.1. Consistência e Independência

Discutimos ao longo deste trabalho algumas características do Axioma da

Escolha, o qual, grosso modo, nos garante que num conjunto 𝑋 qualquer sempre podemos

escolher um único elemento de cada subconjunto não vazio de 𝑋. Alguns conjuntos possuem

uma estrutura que nos permite escolher tal elemento sem a necessidade do Axioma da

Escolha; uma boa ordem é o exemplo mais natural de tal situação: se 𝑋 é bem ordenado,

escolha o menor elemento de cada subconjunto não vazio de 𝑋.

Como bem exemplificado por Russell (1920, p. 126), não precisamos do Axioma

da Escolha para escolher uma bota em cada par de botas numa coleção infinita de pares de

botas: basta que de cada par escolhamos o pé direito (ou esquerdo). Contudo, o axioma será

necessário caso queiramos escolher uma meia de cada par de meias numa coleção infinita de

pares de meias, pois num par de meias não se pode distinguir entre a meia direita e a

esquerda. Ou seja, a estrutura de alguns conjuntos não nos permite realizar escolhas infinitas.

Mas obviamente, a relutância que existiu em assumir o Axioma da Escolha como

um princípio válido na Matemática se deveu a questões bem mais profundas do que sua

aplicação em patologias informais. A preocupação principal concerne à consistência e

independência do Axioma da Escolha. Os exemplos a seguir, adaptados de Aurichi (2011b),

esclarecem bem o significado de tais conceitos.

Para desenvolver a Teoria dos Conjuntos neste trabalho, fixamos uma linguagem

simbólica, com suas “regras semânticas” e em seguida postulamos uma lista de axiomas

expressos nesta linguagem. Tal método estende-se para qualquer teoria matemática, como a

Teoria dos Corpos, na Álgebra, por exemplo.

130

Chamemos de teoria 𝑇 à “coleção” de todas as implicações de uma lista de

axiomas postulados ℒ. Informalmente, um conjunto 𝑀 é um “modelo” para a teoria 𝑇 se 𝑀

satisfaz a teoria 𝑇. Assim, por exemplo, ℝ e ℚ, munidos das operações usuais, são modelos

para a Teoria dos Corpos.

Uma teoria diz-se consistente se ela não contém uma proposição da forma

𝑃 ∧ (¬𝑃). Conforme provado por Gödel, uma teoria 𝑇 é consistente se, e somente se, admite

um modelo. A questão de independência se refere a uma fórmula particular da teoria: 𝜑

expressa na linguagem de 𝑇 diz-se independente se 𝑇 +𝜑 e 𝑇 + (¬𝜑) forem ambas

consistentes, onde 𝑇 +𝜑 e 𝑇 + (¬𝜑) indicam respectivamente, assumir a veracidade e a

falsidade de 𝜑.

Apesar de não soar natural a princípio, casos de independência ocorrem

frequentemente na Matemática. Na Teoria dos Corpos, por exemplo, considerando a fórmula

𝜑 ≡ (∃𝑥)(𝑥 ⋅ 𝑥 = 1 + 1), ℝ é um modelo para a Teoria dos Corpos + 𝜑, enquanto ℚ é um

modelo para a Teoria dos Corpos +(¬𝜑), o que mostra a independência de 𝜑 em relação aos

axiomas da Teoria dos Corpos.

Assim, questionar se o Axioma da Escolha é consistente com ZF basicamente

significa questionar-se se em ZFC é possível derivar alguma contradição. Um dos modos de

se responder a essa questão é encontrar um modelo para ZFC. O próprio Gödel desenvolveu

um modelo para ZFC, de modo que supondo a consistência de ZF, provou que assumir o

Axioma da Escolha não gera paradoxos. Anos depois, Paul Cohen também provou, por outro

método, que assumir a negação do Axioma da Escolha em ZF também é consistente.

Dessa forma, o Axioma da Escolha independe dos axiomas de ZF, ou seja, é

independente. Existem outras proposições independentes e consistentes, como é o caso da

Hipótese do Continuum, consistente e independente em ZFC. Sua versão generalizada, a

Hipótese Generalizada do Continuum, também é consistente em ZFC. Contudo, neste último

caso não temos sua independência em ZFC, pois como provamos na última seção, a Hipótese

Generalizada do Continuum implica o Axioma da Escolha.

Para uma discussão mais aprofundada sobre a consistência e a independência do

Axioma da Escolha, bem como de outras sentenças, recomendamos Kunen (1980) e Jech

(2003).

131

5.2. Formulações Equivalentes do Axioma da Escolha

Provamos nesta seção algumas formulações equivalentes em ZF ao Axioma da

Escolha. Fica implícito, portanto, que não assumimos a princípio a validade do Axioma da

Escolha durante as demonstrações. Salvo menção contrária, baseamo-nos em Hrbacek & Jech

(1999).


(i) (O Axioma da Escolha — (AC3)) Existe uma função escolha para

qualquer família não vazia de conjuntos;

(ii) Toda partição possui um conjunto de representantes;

(iii) Se 𝑋 = ⟨𝑋𝑖|𝑖 ∈ 𝐼⟩ é um sistema indexado tal que 𝑋𝑖 ≠ ∅ para todo 𝑖 ∈ 𝐼,

então existe uma função 𝑓: 𝐼 ⟶ ⋃ 𝑋𝑖𝑖∈𝐼 tal que 𝑓(𝑖) ∈ 𝑋𝑖, para todo 𝑖 ∈ 𝐼 (em outras

palavras, ∏𝑋 ≠ ∅).

Demonstração.

((i) ⟹ (ii)). No Teorema 3.8 provamos que os axiomas de ZF, aliados ao Axioma

da Escolha, garantem que para toda relação de equivalência sobre um conjunto não vazio

existe um conjunto de representantes. Por sua vez, toda partição determina uma relação de

equivalência na qual as classes de equivalência são os membros da partição.

((ii) ⟹ (iii)). Para cada 𝑖 ∈ 𝐼, definamos 𝐶𝑖 = {𝑖} × 𝑋𝑖. Claramente 𝑆 = {𝐶𝑖|𝑖 ∈ 𝐼}

é uma partição de 𝑋: como 𝑋𝑖 ≠ ∅ para todo 𝑖, vale 𝐶𝑖 ≠ ∅; para 𝑖 ≠ 𝑖 ′ é imediato que

𝐶𝑖 ∩ 𝐶𝑖′ = ∅; se ⟨𝑎, 𝑏⟩ ∈ 𝑋 então ⟨𝑎, 𝑏⟩ = ⟨𝑎, 𝑋𝑎⟩ ∈ 𝐶𝑎 = {𝑎} × 𝑋𝑎, pois 𝑋𝑎 = 𝑋(𝑎) = 𝑏 ,

donde segue que 𝑋 ⊆ ⋃𝑆. Devido a (ii), existe 𝔉 ⊆ 𝑋 de maneira que para todo 𝑖 ∈ 𝐼 existe

um único 𝑥𝑖 ∈ 𝑋𝑖 tal que 𝔉 ∩ 𝐶𝑖 = {⟨𝑖, 𝑥𝑖⟩}. Definindo 𝑓 = ⋃{𝔉 ∩ 𝐶𝑖|𝑖 ∈ 𝐼} = {⟨𝑖, 𝑥𝑖⟩|𝑖 ∈ 𝐼},

temos 𝑓 ∈ ∏𝑋.

((iii) ⟹ (i)). Seja 𝑆 ≠ ∅. Chamemos 𝐼 = 𝑆 ∖ {∅} e 𝑋𝑖 = 𝑖 para todo 𝑖 ∈ 𝐼. Então

⟨𝑋𝑖|𝑖 ∈ 𝐼⟩ é um sistema indexado de conjuntos não vazios, donde segue por (iii) que existe

𝑓: 𝐼 ⟶ ⋃𝐼 tal que 𝑓(𝑖) ∈ 𝑖 para todo 𝑖 ∈ 𝐼. Se ∅ ∉ 𝑆 então 𝑓 é uma função escolha para 𝑆; se

∅ ∈ 𝑆 então 𝑓̅ = 𝑓 ∪ {⟨∅, ∅⟩} é uma função escolha para 𝑆. Q.E.D.

132

A demonstração do teorema acima evidencia claramente a semelhança das

sentenças. Por (ii), em qualquer partição pode-se eleger um representante de cada membro da

partição e construir um conjunto com tais elementos. De (iii) segue que o produto cartesiano

de conjuntos não vazios é necessariamente não vazio; tal elemento que garante a não

vacuidade do produto cartesiano é justamente a função escolha.

A noção de produto cartesiano tornar-se-ia mais clara se 𝐼 fosse um conjunto bem

ordenado, pois assim 𝑓 ∈ ∏ 𝑆𝑖𝑖∈𝐼 seria da forma ⟨𝑓𝛼|𝛼 < 𝛼𝐼⟩, para algum ordinal 𝛼𝐼 isomorfo

a 𝐼: se 𝛼𝐼 fosse natural, 𝑓 seria uma 𝛼𝐼-úpla finita; caso 𝛼𝐼 = 𝜔, teríamos

𝑓 = ⟨𝑓0, 𝑓1,…, 𝑓𝑛,…⟩ uma sequência infinita na qual a 𝑖-ésima coordenada pertenceria a 𝑆𝑖, e

assim por diante. De fato, o axioma da escolha garante que 𝐼 é bem ordenável; mais do que

isso, qualquer conjunto admite uma boa ordenação.

Teorema 5.2 (Teorema da Boa Ordenação de Zermelo). As seguintes afirmações

são equivalentes em ZF:



(ii) (O Princípio da Boa Ordem) Todo conjunto é bem ordenável.

Demonstração.

((i) ⟹ (ii)). Seja 𝐴 um conjunto e 𝑎 ∉ 𝐴. Consideremos então uma função

escolha 𝑓:℘(𝐴) ⟶𝐴. Por recursão transfinita, definamos para todo ordinal 𝛼,

𝐹(𝛼) = �𝑓(𝐴 ∖ 𝐹[𝛼]), 𝑎 ,

se 𝐴 ∖ 𝐹[𝛼] ≠ ∅se 𝐴 ∖ 𝐹[𝛼] = ∅,

onde 𝐹[𝛼] denota por simplicidade ℑ(𝐹 ↾ 𝛼), em alusão à notação utilizada para imagem

direta.

Isto é, 𝐹 é tal que 𝐹(0) é algum elemento de 𝐴 escolhido por 𝑓 caso 𝐴 ≠ ∅, ou

𝐹(0) = 𝑎 caso 𝐴 = ∅; 𝐹(1) é algum elemento de 𝐴 ∖ {𝐹(0)} caso este seja não vazio, ou

𝐹(1) = 𝑎 caso contrário, e assim por diante. Intuitivamente, 𝐹 lista os elementos de 𝐴

enquanto eles existem; após listar o último elemento, 𝐹 assume o valor 𝑎.

Sejam 𝛼 e 𝛽 ordinais tais que 𝛼 < 𝛽. Se 𝐹(𝛽) ≠ 𝑎, então 𝐹(𝛽) ∈ 𝐴 ∖ 𝐹[𝛽] e,

como 𝛼 ∈ 𝛽 temos 𝐹(𝛼) ∈ 𝐹[𝛽], donde segue que 𝐹(𝛽) ≠ 𝐹(𝛼). Disso, decorre que existe

𝜆 < ℎ(𝐴) tal que 𝐹(𝜆) = 𝑎: de fato, se 𝐹(𝛼) ≠ 𝑎 para todo 𝛼 < ℎ(𝐴), 𝐹 ↾ ℎ(𝐴) seria uma

injeção de ℎ(𝐴) sobre um subconjunto de 𝐴, contrariando a definição do Número de Hartogs.

133

Seja então 𝜇 o menor número ordinal tal que 𝐹(𝜇) = 𝑎. Mostremos que 𝐹[𝜇] =

𝐴. Obviamente 𝐹[𝜇] ⊆ 𝐴, pois 𝐹(𝛼) ∈ ℑ(𝑓)⊆ 𝐴 para todo ordinal 𝛼 < 𝜇. Se, por absurdo,

𝐹[𝜇] ≠ 𝐴, existiria 𝑥 ∈ 𝐴 ∖ 𝐹[𝜇], donde pela definição de 𝐹 teríamos 𝐹(𝜇) ≠ 𝑎. Portanto, a

função 𝐹 ↾ 𝜇: 𝜇 ⟶ 𝐴 é uma bijeção. Definindo

≺𝐹= {⟨𝐹(𝛼), 𝐹(𝛽)⟩|𝛼 < 𝛽 < 𝜇},

segue pela Proposição 4.6 que ⟨𝐴, ≺𝐹⟩ é um conjunto bem ordenado isomorfo a 𝜇.

((ii) ⟹ (i)). Seja 𝐴 ≠ ∅ um conjunto qualquer e consideremos ⋃𝐴. Como todo

conjunto é bem ordenável por hipótese, existe uma relação de boa ordem < sobre ⋃𝐴. Para

𝑋 ∈ 𝐴 qualquer, se 𝑥 ∈ 𝑋 então 𝑥 ∈ ⋃𝐴. Logo, todo membro de 𝐴 é subconjunto de ⋃𝐴.

Enfim, como ⟨⋃𝐴 , <⟩ é uma boa ordem, todo subconjunto 𝑆 ≠ ∅ de ⋃𝐴 possui um (único)

menor elemento; assim a função 𝑓:𝐴 ⟶ ⋃𝐴 dada por 𝑓(𝑋) = min(𝑋), para todo 𝑋 ∈ 𝐴, é

uma função escolha de 𝐴. Q.E.D.

Deve-se frisar que a boa ordenação garantida pelo Axioma da Escolha nada tem a

ver necessariamente com alguma ordem pré-existente num dado conjunto. Assim, por

exemplo, ao dizermos que ℝ pode ser bem ordenado, não podemos supor que a boa ordem

seja a mesma da relação de ordem usual da reta.

Dentre outras consequências importantes, garantir que todo conjunto é bem

ordenável nos permite afirmar que para todo conjunto existe um único número cardinal

equipotente a ele, isto é, todo conjunto possui um número cardinal. Em particular, para um

ordinal 𝛼 qualquer, temos pelo Teorema de Cantor e pelo Teorema 4.20 que existe 𝛽 > 𝛼 tal

que ℵ𝛼 < |℘(ℵ𝛼)| = |2ℵ𝛼 | = ℵ𝛽 , ou seja, |2ℵ𝛼| ≥ ℵ𝛼+1.

Como cardinais são números ordinais, para dois cardinais 𝜅 e 𝜆 quaisquer, vale

exatamente um dentre os três casos: 𝜅 < 𝜆, 𝜆 < 𝜅 ou 𝜅 = 𝜆. Por outro lado, como vimos no

Teorema 4.10, números cardinais estão inteiramente relacionados ao conceito de

equipotência. Dessa forma, uma consequência natural do Axioma da Escolha é que para

quaisquer conjuntos 𝑋 e 𝑌, tem-se necessariamente 𝑋 ≺ 𝑌, 𝑌 ≺ 𝑋 ou 𝑋 ≈ 𝑌. Essa é a

chamada Lei da Tricotomia. Como vemos abaixo, a Lei da Tricotomia e o Princípio da Boa

Ordenação são logicamente equivalentes; adaptamos a demonstração de Suppes (1972, p.

247).


134

(i) (O Princípio da Boa Ordem) Todo conjunto é bem ordenável;

(ii) (Lei da Tricotomia) Para quaisquer conjuntos 𝑋 e 𝑌, tem-se exatamente

um dos casos: 𝑋 ≺ 𝑌, 𝑌 ≺ 𝑋 ou 𝑋 ≈ 𝑌;

(iii) (∀𝐴)�𝐴 ≺ ℎ(𝐴)�.

Demonstração.

((i) ⟹ (ii)). Sejam 𝑋 e 𝑌 conjuntos quaisquer. Decorre de (i) que 𝑋 e 𝑌 são bem

ordenáveis. Então, do Teorema 4.9 e da Definição 4.19, segue que existem únicos cardinais 𝜅

e 𝜆 tais que |𝑋| = 𝜅 e |𝑌| = 𝜆. Da tricotomia dos ordinais, temos necessariamente um dos

seguintes casos: 𝜅 < 𝜆, 𝜆 < 𝜅 ou 𝜅 = 𝜆. O resultado segue então do Teorema 4.10.

((ii) ⟹ (iii)). Seja 𝐴 um conjunto qualquer. Por definição, o Número de Hartogs

de 𝐴 é tal que ¬(ℎ(𝐴)≾ 𝐴). Daí, a lei da tricotomia implica em 𝐴 ≺ ℎ(𝐴).

((iii) ⟹ (i)). Para um conjunto 𝐴 qualquer, se 𝐴 ≺ ℎ(𝐴), então 𝐴 é bem

ordenável, conforme mostrado na Proposição 4.6. Q.E.D.

Outro importante resultado utilizado na Matemática é o Lema de Zorn, cuja

importância consiste na relativa simplicidade em utilizá-lo para demonstrações de existência,

que antes de sua formulação eram feitas por meio de indução transfinita. (KURATOWSKI &

MOSTOWSKI, 1976). Provamos a seguir que o Lema de Zorn é equivalente ao Axioma da

Escolha (AC3).

Definição 5.1. Seja ⟨𝐴, ≤⟩ um conjunto parcialmente ordenado e 𝐵 ⊆ 𝐴. 𝐵 é uma

cadeia de 𝐴 se, e somente se, ⟨𝐵, ≤⟩ é uma ordem total.




(ii) (O Lema de Zorn) Se toda cadeia num conjunto parcialmente ordenado

possui um limite superior, então o conjunto parcialmente ordenado possui um elemento

máximo.

Demonstração.

((i) ⟹ (ii)). Seja ⟨𝐴, ≼⟩ um conjunto parcialmente ordenado e assuma que toda

cadeia possua um limite superior. Fixemos 𝑏 ∉ 𝐴 e 𝑔:℘(𝐴) ⟶𝐴 uma função escolha. Por

recursão transfinita, definamos para todo ordinal 𝛼, o termo 𝑎𝛼, tal que

135

𝑎𝛼 = �𝑔(𝐴𝛼), se 𝑏 ∉ 𝑎[𝛼] ∧ 𝐴𝛼 = �𝑎 ∈ 𝐴�(∀𝜉)�(𝜉 é ordinal ∧ 𝜉 < 𝛼) ⟹𝑎𝜉 < 𝑎�� ≠ ∅

𝑏 , se 𝐴𝛼 = �𝑎 ∈ 𝐴�(∀𝜉) �(𝜉 é ordinal ∧ 𝜉 < 𝛼) ⟹ 𝑎𝜉 < 𝑎�� = ∅ ∨ 𝑏 ∈ 𝑎[𝛼],

onde 𝑎[𝛼] = �𝑎𝜉�𝜉 é ordinal ∧ 𝜉 < 𝛼�.

Notemos que para 𝛼 = 0, temos

𝐴0 = �𝑎 ∈ 𝐴�(∀𝜉)�(𝜉 é ordinal ∧ 𝜉 < 0) ⟹ 𝑎𝜉 < 𝑎�� = 𝐴,

e assim 𝑎0 é algum elemento de 𝐴; para 𝛼 = 1,

𝐴1 = �𝑎 ∈ 𝐴�(∀𝜉) �(𝜉 é ordinal ∧ 𝜉 < 1) ⟹𝑎𝜉 < 𝑎�� = {𝑎 ∈ 𝐴|𝑎 > 𝑎0},

e daí 𝑎1 é algum elemento maior do que 𝑎0, e assim sucessivamente: cada 𝑎𝛼 é um membro

de 𝐴 maior do que todos os 𝑎𝛽 anteriores. Claramente, deve existir algum ordinal 𝜆 < ℎ(𝐴)

para o qual 𝑎𝜆 = 𝑏, caso contrário 𝑎 ↾ ℎ(𝐴): ℎ(𝐴) ⟶𝐴 seria uma função injetora,

contrariando a definição de ℎ(𝐴); fixemos o menor ordinal 𝜆 tal que 𝑎𝜆 = 𝑏.

Então, �𝑎𝜉�𝜉 < 𝜆� é uma cadeia em 𝐴 por construção, pois todos os seus membros

são comparáveis. Logo, pela hipótese que assumimos sobre 𝐴, existe 𝑐 ∈ 𝐴 tal que 𝑐 ≽ 𝑎𝜉 ,

para todo 𝜉 < 𝜆. Se existisse 𝑣 ∈ 𝐴 tal que 𝑣 ≻ 𝑐, teríamos 𝑣 ≻ 𝑎𝜉 para todo 𝜉 < 𝜆 e,

consequentemente,

𝑣 ∈ 𝐴𝜆 = �𝑎 ∈ 𝐴�(∀𝜉) �(𝜉 é ordinal ∧ 𝜉 < 𝜆) ⟹𝑎𝜉 < 𝑎�� ≠ ∅

acarretando 𝑎𝜆 = 𝑔(𝐴𝜆) ≠ 𝑏 . Portanto, 𝑐 é um elemento máximo de 𝐴.

((ii) ⟹ (i)). Seja 𝐴 ≠ ∅. Provemos que existe 𝑓:𝐴 ⟶ ⋃𝐴 tal que 𝑓(𝑎) ∈ 𝑎, para

todo 𝑎 ∈ 𝐴, com 𝑎 ≠ ∅. Consideremos o conjunto

𝐹 = �𝑓 ∈ ℘�𝐴 × (⋃𝐴)��𝑓:𝔇(𝑓) ⟶⋃𝐴 ∧ (∀𝑎)(𝑎 ∈ 𝔇(𝑓) ⟹𝑓(𝑎) ∈ 𝑎)�,

isto é, 𝐹 é o conjunto das funções 𝑓 cujo domínio está contido em 𝐴 e tais que 𝑓(𝑎) ∈ 𝑎 para

todo 𝑎 ∈ 𝔇(𝑓). Tomando ⊆𝐹= {⟨𝑥, 𝑦⟩ ∈ 𝐹 ×𝐹|𝑥 ⊆ 𝑦}, é evidente que ⟨𝐹, ⊆𝐹⟩ é

parcialmente ordenado. Suponha então que 𝐹0 seja uma cadeia em 𝐹. Afirmamos que

𝑓̅ = ⋃𝐹0 é um limite superior de 𝐹0 . Obviamente 𝑓 ⊆ 𝑓,̅ para qualquer 𝑓 ∈ 𝐹0 ; como 𝐹0 é

totalmente ordenado pela ⊆𝐹, para quaisquer 𝑓, 𝑔 ∈ 𝐹0 , 𝑓 ⊆ 𝑔 ou 𝑔 ⊆ 𝑓, donde segue que 𝐹0

136

é um sistema de funções compatíveis e daí, pelo Teorema 3.14, 𝑓̅ ∈ 𝐹 , o que mostra que 𝑓 ̅ é

um limite superior de 𝐹0 .

Como 𝐹0 é uma cadeia arbitrária de 𝐹, segue que toda cadeia em 𝐹 tem limite

superior e, pelo Lema de Zorn, existe 𝔉 ∈ 𝐹 tal que para qualquer função 𝑓 ∈ 𝐹 , 𝔉 ⊄ 𝑓. Se

provarmos que 𝔇(𝔉) = 𝐴, garantiremos que 𝔉 é uma função escolha de 𝐴. De fato, se por

absurdo 𝔇(𝔉)≠ 𝐴, então existe 𝑎 ∈ 𝐴 ∖ 𝔇(𝔉). Se 𝑎 ≠ ∅, existe 𝑎� ∈ 𝑎, daí basta tomarmos

𝔉� = 𝔉 ∪ {⟨𝑎, 𝑎�⟩} ∈ 𝐹; se 𝑎 = ∅, fixemos 𝑥 ∈ ⋃𝐴 qualquer e façamos 𝔉� = 𝔉 ∪ {⟨∅, 𝑥⟩} ∈ 𝐹 .

Em ambos os casos, 𝔉� é tal que 𝔉 ⊂ 𝔉�, contrariando a maximalidade de 𝔉 garantida pelo

Lema de Zorn. Q.E.D.

Existem ainda várias sentenças equivalentes ao Axioma da Escolha em ZF. A

maioria dos autores consultados discute as equivalências tratadas aqui, bem como tantas

outras — principalmente Jech (1973). Um resultado por vezes citado unicamente como

consequência do Axioma da Escolha, a existência de uma base para todo espaço vetorial, é na

verdade equivalente a este, conforme provado em 1984, por Andreas Blass. Encerramos esta

seção com a demonstração de tal fato; assumimos conhecidos os conceitos de Álgebra

utilizados abaixo, os quais podem ser encontrados, por exemplo, no trabalho de Coelho &

Lourenço (2007) e Rotman (2005).


(i) (O Lema de Zorn) Se toda cadeia num conjunto parcialmente ordenado

possui um limite superior, então o conjunto parcialmente ordenado possui um elemento

máximo;

(ii) Todo espaço vetorial admite uma base;

(iii) Para qualquer família disjunta 𝐴 = {𝐴𝑖|𝑖 ∈ 𝐼} de conjuntos não vazios,

existe 𝑓: 𝐼 ⟶ ℘(⋃𝐴) tal que 𝑓(𝑖)⊆ 𝐴𝑖 é um subconjunto finito não vazio de 𝐴𝑖, para todo

𝑖 ∈ 𝐼;

(iv) (O Axioma da Escolha — (AC3)) Existe uma função escolha para

qualquer família não vazia de conjuntos.

Demonstração.

Devido às equivalências já vistas, basta provarmos que (i) ⟹ (ii) ⟹ (iii) ⟹ (iv).

Assumimos como fato que (iii) ⟹ (iv); sua demonstração se baseia em conceitos

abordados apenas superficialmente no Apêndice B. Uma prova detalhada pode ser encontrada

em Komjáth & Totik (2006, p. 477). Mostraremos então que (i) ⟹ (ii) ⟹ (iii).

137

((i) ⟹ (ii)). Seja 𝑉 um 𝕂-espaço vetorial não nulo. Logo, existe um subconjunto

𝒞 ⊆ 𝑉 linearmente independente (l.i.) em 𝑉. Consideremos então o conjunto

𝐹 = {𝐿 ∈ ℘(𝑉)|𝒞 ⊆ 𝐿 ∧ 𝐿 é l.i.}.

Obviamente, ⟨𝐹, ⊆𝐹⟩ é parcialmente ordenado. Tomemos uma cadeia em 𝐹, que

seja 𝐹′. Provar que existe um limite superior para 𝐹′ consiste em exibir um subconjunto 𝐹�

linearmente independente em 𝑉 tal que, para todo 𝐴 ∈ 𝐹′, 𝐴 ⊆ 𝐹�. Afirmamos que 𝐹� = ⋃𝐹′ é

um limite superior para 𝐹′.

De fato, se 𝐴 ∈ 𝐹′ então 𝐴 ⊆ 𝐹�. Seja então 𝐹�𝑛 = {𝑣0 ,…, 𝑣𝑛} ⊆ 𝐹� um subconjunto

finito de 𝐹�. Para cada 𝑖 ≤ 𝑛, existe 𝐴𝑖 ∈ 𝐹′ tal que 𝑣𝑖 ∈ 𝐴𝑖. Segue do fato de 𝐹′ ser uma

cadeia que existe 𝑗 ≤ 𝑛 tal que 𝑣𝑖 ∈ 𝐴𝑗 , para todo 𝑖 ≤ 𝑛 e, como 𝐴𝑗 ∈ 𝐹′, decorre que 𝐹�𝑛 é l.i.

Como 𝐹�𝑛 é um subconjunto qualquer de 𝐹�, conclui-se que 𝐹� é um limite superior para 𝐹′.

Segue do Lema de Zorn que existe 𝔅 ∈ 𝐹 um elemento maximal de 𝐹, isto é, para

o qual não é válido 𝐴 ⊂ 𝔅, para qualquer 𝐴 ∈ 𝐹 . Se, por absurdo, 𝔅 não fosse um conjunto

gerador de 𝑉, existiria 𝑣 ∈ 𝑉 ∖ [𝔅] e, consequentemente, 𝔅′ = (𝔅 ∪ {𝑣}) ∈ 𝐹 seria tal que

𝔅 ⊂ 𝔅′, contrariando a maximalidade de 𝔅. Portanto, 𝔅 é um conjunto gerador de 𝑉

linearmente independente, ou seja, 𝔅 é uma base de 𝑉.

((ii) ⟹ (iii)) 1. Seja 𝐴 = {𝐴𝑖|𝑖 ∈ 𝐼} ≠ ∅ uma família de conjuntos não vazios dois

a dois disjuntos, 𝕜 um corpo qualquer e 𝑋 = ⋃ 𝐴𝑖𝑖∈𝐼 . Seja 𝕜[𝑋] o anel de polinômios cujas

indeterminadas são os membros de 𝑋 e 𝕜(𝑋) o corpo das funções racionais de 𝑋, isto é, das

funções da forma 𝑝𝑞 com 𝑝, 𝑞 ∈ 𝕜[𝑋] e 𝑞 ≠ 0𝕜[𝑋]. Notemos que 𝑋 ⊆ 𝕜[𝑋].

Para um polinômio 𝑝 ∈ 𝕜[𝑋], chamemo-lo de 𝑖-homogêneo de grau 𝑑 se a soma

dos expoentes das variáveis de 𝐴𝑖 for 𝑑 em cada monômio de 𝑝. Analogamente, chamemos a

função racional 𝑝𝑞∈ 𝕜(𝑋) de 𝑖-homogênea de grau 𝑑 se 𝑝 for 𝑖-homogêneo de grau 𝑛 + 𝑑 e 𝑞

for 𝑖-homogêneo de grau 𝑛. O conjunto 𝐾 das funções 𝑖-homogêneas de grau 0, para todo

𝑖 ∈ 𝐼, constitui um subcorpo de 𝕜(𝑋) e, portanto, 𝕜(𝑋) é um espaço vetorial sobre 𝐾.

Consideremos então 𝑉 = [𝑋] ⊆ 𝕜(𝑋), o subespaço vetorial de 𝕜(𝑋) gerado por

𝑋. Por hipótese, existe uma base 𝔅⊆ [𝑋] de 𝑉. Para cada 𝑖 ∈ 𝐼 e 𝑥 ∈ 𝐴𝑖, 𝑥 pode ser

unicamente representado como uma combinação 𝐾-linear finita

1 Adaptamos de Blass (1984) a demonstração de tal implicação.

138

�†1� 𝑥 = � 𝛼𝑏(𝑥)𝑏𝑏∈𝐵(𝑥)

,

onde 𝐵(𝑥) ⊆ 𝔅 é um subconjunto finito e 𝛼𝑏(𝑥) ∈ 𝐾 ∖ {0𝐾}, para todo 𝑏 ∈ 𝐵(𝑥). Para outro

𝑦 ∈ 𝐴𝑖 qualquer, temos

�†2� 𝑦 = � 𝛼𝑏(𝑦)𝑏𝑏∈𝐵(𝑦)

.

Como 𝑥, 𝑦 ∈ 𝐴𝑖, segue que 𝑦𝑥∈ 𝕜(𝑋) é uma função 𝑖-homogênea de grau 0 para

todo 𝑖, e daí 𝑦𝑥∈ 𝐾. Multiplicando �†1� por 𝑦

𝑥, obtemos

�†3� 𝑦 = �𝑦𝑥𝛼𝑏(𝑥)𝑏

𝑏∈𝐵(𝑥)

,

daí, por �†2�, �†3� e da unicidade dos coeficientes envolvidos na representação de 𝑦, 𝐵(𝑥) =

𝐵(𝑦) e 𝛼𝑏(𝑦) = 𝑦𝑥𝛼𝑏(𝑥), para todo 𝑦 ∈ 𝐴𝑖. Logo,

𝑐𝑏 =𝛼𝑏(𝑥)𝑥

=𝛼𝑏(𝑦)𝑦

.

Como 𝑥 e 𝑦 são elementos arbitrários de 𝐴𝑖, segue que 𝑐𝑏 e 𝐵(𝑥) independem da

escolha dos elementos de 𝐴𝑖, dependendo apenas de 𝑖. Dessa forma, podemos dizer que para

cada 𝑖 ∈ 𝐼, existe um subconjunto finito não vazio 𝐵(𝑖)⊆ 𝔅 e escalares 𝑐𝑏(𝑖) ∈ 𝐾, para cada

𝑏 ∈ 𝐵(𝑖), tais que para qualquer 𝑥 ∈ 𝐴𝑖,

𝑥 = � 𝑥𝑐𝑏(𝑖)𝑏𝑏∈𝐵(𝑖)

,

daí, como 𝑐𝑏(𝑖) = 𝛼𝑏(𝑥)𝑥

e 𝛼𝑏(𝑥) ∈ 𝐾, segue que 𝑐𝑏(𝑖) é 𝑖-homogêneo de grau −1.

Consequentemente, quando expresso sob a forma reduzida, devem ocorrer (finitas) variáveis

de 𝐴𝑖 no denominador de 𝑐𝑏(𝑖); tais variáveis são, por construção, elementos de 𝐴𝑖.

Chamemos de 𝐵�𝑖 o conjunto das variáveis de 𝐴𝑖 que ocorrem no denominador de 𝑐𝑏(𝑖) para

todo 𝑏 ∈ 𝐵(𝑖); pelo o que discutimos, 𝐵�𝑖 é um subconjunto finito não vazio de 𝐴𝑖, para todo

𝑖 ∈ 𝐼. Daí, claramente a função 𝑓: 𝐼 ⟶ ℘(⋃𝐴) dada por 𝑓(𝑖) = 𝐵�𝑖 satisfaz (iii). Q.E.D.

139

5.3. A Hipótese Generalizada do Continuum

Encerramos este capítulo com a demonstração de que a Hipótese Generalizada do

Continuum (HGC) implica o Axioma da Escolha. Em outras palavras, assumir HGC como um

axioma em ZF permite derivar (AC3) como um teorema. Tal resultado se mostra interessante

por evidenciar a enorme gama de resultados que se pode obter ao trabalharmos com

proposições independentes. Julgamos pertinentes alguns comentários preliminares.

Vimos na seção anterior que, em ZFC, |2ℵ𝛼| = ℵ𝛽 ≥ ℵ𝛼+1 , para algum 𝛽 > 𝛼.

Não podemos determinar em ZFC, de modo geral, qual “o valor” do ordinal 𝛽. Sabe-se

apenas que 𝛽 > 𝛼. A formulação mais comum de HGC estabelece que 𝛽 = 𝛼 + 1.

HGC1 — |2ℵ𝛼 | = ℵ𝛼+1.

Em outras palavras, HGC1 afirma que para qualquer ordinal 𝛼, ℘(ℵ𝛼)≈ ℎ(ℵ𝛼),

pois ℵ𝛼+1 = ℎ(ℵ𝛼) por definição. Claro que, como em ZFC todo conjunto infinito possui um

cardinal transfinito, poderíamos considerar HGC como sendo a afirmação:

HGC2 — Se 𝐴 é infinito então ℘(𝐴) ≈ ℎ(𝐴),

ou equivalentemente,

HGC2’ — Se 𝐴 é infinito então 2𝐴 ≈ ℎ(𝐴).

Por outro lado, como vimos no Corolário 4.9, para qualquer ordinal 𝛼 não existe

cardinal transfinito 𝜅 tal que ℵ𝛼 < 𝜅 < ℵ𝛼+1, donde se conclui (em ZFC) que se 𝑋 é infinito,

então não existe conjunto 𝑌 tal que |𝑋| < |𝑌| < |℘(𝑋)|, ou equivalentemente, se |𝑋| ≤ |𝑌| ≤

|℘(𝑋)|, então |𝑋| = |𝑌| ou |𝑌| = |℘(𝑋)|. É essa última formulação que adotamos como

oficial para HGC, que encontramos no trabalho de Miraglia (1991).

Hipótese Generalizada do Continuum (HGC). Se 𝑋 é um conjunto infinito e o

conjunto 𝑌 é tal que 𝑋 ≾ 𝑌 e 𝑌 ≾ 2𝑋 , então 𝑋 ≈ 𝑌 ou 𝑌 ≈ 2𝑋 .

Grosso modo, dado um conjunto infinito 𝑋, HGC estabelece que não existe

qualquer conjunto 𝑌 que admita injeções 𝜑:𝑋 ⟶ 𝑌 e 𝜓:𝑌 ⟶ ℘(𝑋) , e não seja equipotente a

𝑋 ou a ℘(𝑋). A demonstração de que HGC implica (AC3) dada por Miraglia requer alguns

140

pré-requisitos, os quais são dados a seguir; as demonstrações podem ser encontradas em

(MIRAGLIA, 1991).

Teorema 5.6.

(i) HGC ⟹ Se 𝛼 é ordinal tal que 𝜔 ≤ 𝛼, então 2𝛼 ≈ ℎ(𝛼);

(ii) ℎ(𝑋 × 𝑌) ≈ ℎ(𝑋) × ℎ(𝑌) ≈ max{ℎ(𝑋), ℎ(𝑌)} para 𝑋 e 𝑌 infinitos (em

particular, ℎ(𝑋 × 𝑌) = max{ℎ(𝑋), ℎ(𝑌)});

(iii) Denotemos 𝑋 + 𝑌 = ({0} × 𝑋) ∪ ({1} × 𝑌); se 𝑋 + ℎ(𝑋) ≈ 𝑋 × ℎ(𝑋),

então 𝑋 é bem ordenável, para qualquer conjunto 𝑋 infinito;

(iv) Se 𝑋 é infinito, então 2𝑋 × 2ℎ(𝑋) ≈ 2𝑋+ℎ(𝑋) .

Em posse de tais resultados, provamos o teorema seguinte.

Teorema 5.7. HGC ⟹ (AC3).

Demonstração.

Seja 𝑋 um conjunto infinito qualquer e fixemos 𝑥 ∈ 𝑋. As funções

𝑓1:𝑋 + ℎ(𝑋) ⟶ 𝑋 × ℎ(𝑋), 𝑓2 :𝑋 × ℎ(𝑋) ⟶ ℘(𝑋) × ℘�ℎ(𝑋)� e

𝑓3 :℘(𝑋) × ℘�ℎ(𝑋)� ⟶ ℘�𝑋 × ℎ(𝑋)�

dadas respectivamente por

𝑓1(⟨𝛼, 𝑦⟩) = �⟨𝑦, 𝛼⟩ , se 𝛼 = 0⟨𝑥, 𝑦⟩ , se 𝛼 = 1, para quaisquer ⟨𝛼, 𝑦⟩ ∈ 𝑋 + ℎ(𝑋),

𝑓2(⟨𝑥, 𝛼⟩) = ⟨{𝑥},{𝛼}⟩, para todo ⟨𝑥, 𝛼⟩ ∈ 𝑋 × ℎ(𝑋) e

𝑓3(⟨𝑆, Ω⟩) = 𝑆 × Ω, para qualquer ⟨𝑆, Ω⟩ ∈ ℘(𝑋) × ℘�ℎ(𝑋)�,

são injetoras, e mostram que

𝑋 + ℎ(𝑋) ≾ 𝑋 × ℎ(𝑋) ≾ 2𝑋 × 2ℎ(𝑋) ,

donde segue pelo item (iv) do Teorema 5.6 que

𝑋 + ℎ(𝑋) ≾ 𝑋 × ℎ(𝑋) ≾ 2𝑋+ℎ(𝑋),

e daí, por HGC, 𝑋 + ℎ(𝑋) ≈ 𝑋 × ℎ(𝑋) ou 𝑋 × ℎ(𝑋) ≈ 2𝑋 × 2ℎ(𝑋).

141

Se provarmos que 𝑋 + ℎ(𝑋) ≈ 𝑋 × ℎ(𝑋), seguirá pelo item (iii) do Teorema 5.6

que 𝑋 é bem ordenável, donde concluiremos que todo conjunto é bem ordenável, o que

equivale ao Axioma da Escolha.

Devido a HGC, basta mostrarmos que não podemos ter 𝑋 × ℎ(𝑋) ≈ 2𝑋 × 2ℎ(𝑋).

Se, por absurdo, tal equipotência fosse verdadeira, teríamos ℎ�𝑋 × ℎ(𝑋)� = ℎ�2𝑋 × 2ℎ(𝑋)�.

Então, pelo item (ii) do Teorema 5.6, obteríamos, por um lado

ℎ�𝑋 × ℎ(𝑋)� = max�ℎ(𝑋), ℎ�ℎ(𝑋)�� = ℎ�ℎ(𝑋)�,

e, por outro lado,

ℎ�2𝑋 × 2ℎ(𝑋)� = max�ℎ(2𝑋), ℎ�2ℎ(𝑋)�� ≥ ℎ�2ℎ(𝑋)�.

Logo, ℎ�2ℎ(𝑋)� ≤ ℎ�ℎ(𝑋)� e, consequentemente, ℎ�2ℎ(𝑋)�≾ ℎ�ℎ(𝑋)�. Porém,

pelo item (i) do Teorema 5.6, temos ℎ�ℎ(𝑋)� ≈ 2ℎ(𝑋), donde concluímos que

ℎ�2ℎ(𝑋)�≾ 2ℎ(𝑋).

Absurdo. Portanto, 𝑋 + ℎ(𝑋) ≈ 𝑋 × ℎ(𝑋). Q.E.D.

Assim, HGC implica (AC3). Logo, ao assumirmos HGC, para todo conjunto

infinito 𝐴 existe um ordinal 𝛼 tal que 𝐴 ≈ ℵ𝛼. Observemos então que ℵ𝛼+1 = ℎ(𝐴) e também

que 2ℵ𝛼 ≈ 2𝐴 . Por termos 2ℵ𝛼 ≈ ℵ𝛼+1 , segue que ℎ(𝐴) ≈ 2𝐴 . Ou seja, HGC ⟹ HGC2.

Por outro lado, HGC2 ⟹ HGC. De fato, se ℘(𝐴) ≈ ℎ(𝐴) para todo conjunto 𝐴

infinito, então ℘(𝐴) é bem ordenável, donde consequentemente 𝑃 = �{𝑥}�𝑥 ∈ 𝐴� é um

subconjunto bem ordenado de ℘(𝐴). Como 𝐴 ≈ 𝑃, inferimos que 𝐴 é bem ordenável, o que

mostra a validade do Princípio da Boa Ordem e, por conseguinte, do Axioma da Escolha.

Logo, para todo conjunto infinito 𝐴, existe um ordinal 𝛼 tal que ℵ𝛼 ≈ 𝐴. Como HGC2 afirma

que ℘(𝐴) ≈ ℎ(𝐴) e ℘(𝐴) ≈ 2𝐴 conforme já provamos, temos 2ℵ𝛼 ≈ ℵ𝛼+1 e, do Corolário

4.9, segue que vale HGC. Portanto, HGC ⟺ HGC2.

142

Conclusão

Como vimos, a Teoria dos Conjuntos mostra-se altamente adaptada à

generalização e à abstração, peças fundamentais para o desenvolvimento da Matemática Pura.

Vemos hoje que não apenas sua linguagem, mas também seus conceitos fundamentais

encontram-se intrinsecamente ligados a praticamente todos os ramos da Matemática. Neste

sentido, ZFC pode ser visto como uma fundamentação para as principais áreas da Matemática,

uma vez que permite o desenvolvimento da Teoria dos Conjuntos, a qual engloba a

formalização dos números e das funções.

Como os números naturais são a base para o desenvolvimento dos demais

conjuntos numéricos, o que se faz por meio de operações definidas em ZFC, podemos ver que

os principais tópicos da Álgebra, da Topologia e da Análise encontram-se sustentados pelos

axiomas que postulamos. Apenas temas mais avançados, os quais eventualmente podem

requerer a Teoria das Categorias e a existência de classes próprias, podem não encontrar

fundamentação formal suficiente em ZFC. Ainda assim, existem outros sistemas de axiomas,

bem próximos de ZFC, que preenchem tal lacuna.

No que concerne à própria Teoria dos Conjuntos, ainda existem grandes questões

a serem estudadas. As pesquisas referentes à consistência e independência de muitas

sentenças em ZFC abrem caminhos para muitos questionamentos interessantes: Quais outras

hipóteses implicam o Axioma da Escolha? Alguma delas o nega? Quais os efeitos em negar

algum dos axiomas de ZFC no desenvolvimento subsequente da Matemática? O que se pode

fazer na Topologia, na Álgebra, na Análise, etc., ao negarmos, por exemplo, o Axioma do

Infinito, ou o Axioma das Partes?

No mesmo sentido do que ocorreu com a Geometria no advento da discussão

sobre o postulado das paralelas, o avanço das pesquisas sobre os axiomas da Teoria dos

Conjuntos pode culminar no desenvolvimento de diferentes “Teorias dos Conjuntos” de

acordo com os axiomas que venham a ser adotados. Contudo, é certo que por mais “Teorias

dos Conjuntos” que venham a surgir com o desenrolar da História, ZFC, bem como a

Geometria Euclidiana, tem garantido seu lugar entre os blocos fundamentais da Matemática.

143

Apêndice A — Leis do Cálculo Proposicional

No que segue, baseamo-nos em Kuratowski & Mostowski (1976).

Designemos sentenças matemáticas arbitrárias por 𝑝, 𝑞, 𝑟, …, etc. Assumimos

que todas as sentenças podem assumir valor lógico verdadeiro ou falso. Para expressar

explicitamente a sentença 𝑝, utilizamos o símbolo “≡” para indicar que a sentença do lado

oposto a 𝑝 é justamente 𝑝. Assim, “𝑝 ≡ 3 > 2” indica que 𝑝 afirma que 2 é menor do que 3.

Para duas sentenças 𝑝 e 𝑞, podemos obter uma nova sentença por meio dos

conectivos:

“e”, “ou”, “se… então”, “… se, e somente se,…”.

A sentença “𝑝 e 𝑞”, que indicamos por 𝑝 ∧ 𝑞, é a conjunção lógica de 𝑝 e 𝑞. A

conjunção 𝑝 ∧ 𝑞 só assume valor verdadeiro quando 𝑝 e 𝑞 são ambos verdadeiros, nos demais

casos 𝑝 ∧ 𝑞 é falso. A sentença “𝑝 ou 𝑞”, designada por 𝑝 ∨ 𝑞, é a disjunção lógica de 𝑝 e 𝑞,

verdadeira sempre que 𝑝 ou 𝑞 forem verdadeiros, de modo que só é falsa quando ambas as

sentenças são falsas.

“Se 𝑝 então 𝑞” é a implicação de 𝑞 por 𝑝, indicada por 𝑝 ⟹ 𝑞. Seu valor lógico é

falso apenas se 𝑝 for verdadeiro e 𝑞 for falso. Intuitivamente, a implicação 𝑝⟹ 𝑞 é

verdadeira quando 𝑞 for verdadeiro sempre que 𝑝 for verdadeiro, de modo que se 𝑝 for falso,

o valor de 𝑞 é irrelevante. Isso justifica 𝑝⟹ 𝑞 ser falso apenas se 𝑝 for verdadeiro e 𝑞 falso.

A sentença “𝑝 se, e somente se, 𝑞” é a equivalência lógica de 𝑝 e 𝑞, indicada por

𝑝 ⟺ 𝑞, que só é verdadeira quando os valores lógicos de 𝑝 e 𝑞 coincidem: se 𝑝 for verdadeiro

/falso então 𝑞 é verdadeiro/falso, se 𝑞 for verdadeiro/falso então 𝑝 é verdadeiro/falso.

Naturalmente, (𝑝⟺ 𝑞) ⟺ �(𝑝⟹ 𝑞) ∧ (𝑞 ⟹ 𝑝)�.

Uma sentença sempre falsa é uma contradição, que denotaremos por F; uma

sentença sempre verdadeira é uma tautologia, denominada por V.

Para uma sentença 𝑝 qualquer, “não é verdade que 𝑝” é a negação de 𝑝, denotada

por ¬𝑝. Quando 𝑝 é verdadeiro, ¬𝑝 é falso; quando 𝑝 é falso, ¬𝑝 é verdadeiro; ou seja,

(𝑝 ∨ ¬𝑝) ⟺ 𝑉, uma das sentenças 𝑝 ou ¬𝑝 sempre deve ser verdadeira, este é o Princípio do

Terceiro Excluído, que nos “permite” realizar demonstrações via reductio ad absurdum. O

Princípio da Não Contradição estabelece que (𝑝 ∧ ¬𝑝) ⟺ 𝐹: uma proposição não pode ser

verdadeira e falsa simultaneamente.

144

Em suma, temos ainda as seguintes leis:

(𝑝 ∨ 𝑞) ⟺ (𝑞 ∨ 𝑝) comutatividade da disjunção;

(𝑝 ∧ 𝑞) ⟺ (𝑞 ∧ 𝑝) comutatividade da conjunção;

(𝑝 ∨ 𝑞) ∨ 𝑟 ⟺ 𝑝 ∨ (𝑞 ∨ 𝑟) associatividade da disjunção;

(𝑝 ∧ 𝑞) ∧ 𝑟 ⟺ 𝑝 ∧ (𝑞 ∧ 𝑟) associatividade da conjunção;

𝑝 ∧ (𝑞 ∨ 𝑟) ⟺ (𝑝 ∧ 𝑞) ∨ (𝑝 ∧ 𝑟) primeira lei distributiva;

𝑝 ∨ (𝑞 ∧ 𝑟) ⟺ (𝑝 ∨ 𝑞) ∧ (𝑝 ∨ 𝑟) segunda lei distributiva;

(𝑝 ∨ 𝑝) ⟺𝑝, (𝑝 ∧ 𝑝) ⟺𝑝 lei da tautologia ou idempotência;

(𝑝 ∧ 𝐹)⟺ 𝐹 , (𝑝 ∧ 𝑉) ⟺𝑝 lei de absorção da conjunção;

(𝑝 ∨ 𝐹)⟺ 𝑝, (𝑝 ∨ 𝑉) ⟺𝑉 lei de absorção da disjunção;

[(𝑝⟹ 𝑞) ∧ (𝑞 ⟹ 𝑟)] ⟹ (𝑝 ⟹ 𝑟) lei do silogismo hipotético

ou transitividade da implicação;

[(𝑝⟺ 𝑞) ∧ (𝑞 ⟺ 𝑟)] ⟹ (𝑝 ⟺ 𝑟) transitividade da equivalência;

𝑝⟺ ¬(¬𝑝) lei da dupla negação;

(𝑝⟹ 𝑞) ⟺ (¬𝑞 ⟹ ¬𝑝) lei da contrapositiva;

(𝑝⟹ 𝑞) ⟺ (¬𝑝 ∨ 𝑞) definição equivalente da implicação.

Podemos também ter 𝑝 como um “esquema de sentenças”, em que 𝑥 ocorre como

variável livre em 𝑝, de modo a indicarmos 𝑝 por 𝑝(𝑥). Por exemplo, se 𝑝(𝑥) ≡ 𝑥 > 3, para

cada valor de 𝑥 obtemos uma sentença, para a qual são válidas as leis vistas acima. Em tais

casos, geralmente usamos quantificadores: existencial (∃) e universal (∀).

Dizemos que existe 𝑦 tal que 𝑝 (ou existe 𝑦 que satisfaz 𝑝, 𝑝 é verdadeiro para 𝑦,

etc.) se, ao substituirmos 𝑥 por 𝑦 em 𝑝(𝑥) obtivermos o valor lógico de 𝑝(𝑦) verdadeiro;

neste trabalho indicamos isso por (∃𝑦)�𝑝(𝑦)�. Por exemplo, considerando 𝑝(𝑥) ≡ 3𝑥 > 4,

existe 𝑦 tal que 𝑝: basta tomar 𝑦 = 2. Se o 𝑦 que satisfizer 𝑝 for único, indica-se por

(∃!𝑦)�𝑝(𝑦)�.

O quantificador universal indica a validade de alguma sentença 𝑝 para todo

elemento 𝑥, o que indicamos por (∀𝑥)�𝑝(𝑥)�. Um bom exemplo é o Teorema de Cantor, que

estabelece (∀𝑥)�𝑥 ≺ ℘(𝑥)�. Vale notarmos que (∀𝑥)�𝑝(𝑥)�⟺ ¬(∃𝑥)�¬𝑝(𝑥)�, ou seja, é

equivalente afirmar que “para todo 𝑥 vale 𝑝” e “não existe 𝑥 tal que ¬𝑝(𝑥)”. Em particular,

se existir 𝑥 tal que ¬𝑝(𝑥), então ¬(∀𝑥)�𝑝(𝑥)�.

145

Apêndice B — Conjuntos Bem Fundados

Neste apêndice discutimos de maneira informal os conceitos básicos sobre os

conjuntos bem fundados e sua ligação com o Axioma da Fundação. Baseamo-nos em

Fraenkel, Bar-Hillel & Levy (1973) e Kunen (1980), que tratam mais profundamente do

assunto que se segue.

Uma questão simples, mas fundamental, envolvendo a natureza dos conjuntos não

pode ser respondida pelos axiomas (A1), (A2),…,(A8): existe 𝑥 tal que 𝑥 ∈ 𝑥? Numa

“tentativa” de encontrar um conjunto com tal propriedade, poderíamos tentar verificar se

conseguimos construir tal conjunto. Procedemos por “camadas”. Chamaremos de conjuntos

bem fundados os membros de tais “camadas”.

A primeira camada (que chamaremos de 𝑉0 ) deve constituir-se de todos os

indivíduos que admitimos, o que consiste neste caso no conjunto vazio. Nesta camada não há

membros que pertençam a si mesmos. A segunda camada (𝑉1 ) é composta por todos os

subconjuntos de 𝑉0 , ou seja, devemos ter 𝑉1 = {∅}. Novamente, 𝑉1 ∉ 𝑉1 e não há membros de

𝑉1 (subconjuntos de 𝑉0 ) que pertençam a si mesmos. Procedendo recursivamente, para um

dado ordinal 𝛼, definimos 𝑉𝛼+1 = ℘(𝑉𝛼) e, para o caso de 𝛼 ser um ordinal limite, fazemos

𝑉𝛼 = �𝑉𝛾𝛾<𝛼

.

Prova-se que para qualquer ordinal 𝛼, 𝑉𝛼 ∉ 𝑉𝛼 e, para qualquer membro 𝑥 de 𝑉𝛼,

𝑥 ∉ 𝑥, ou ainda, para qualquer membro 𝑥 de um elemento 𝑦 de 𝑉𝛼, 𝑥 ∉ 𝑥 e 𝑦 ∉ 𝑦 e assim por

diante. Por outro lado, para todo 𝛼, tomando quaisquer 𝑥, 𝑦 ∈ 𝑉𝛼 tem-se que ℘(𝑥), ⋃𝑥, 𝑥 ×

𝑦, {𝑥, 𝑦}, 𝑥 ∪ 𝑦, 𝑥𝑦, 𝑥 ∖ 𝑦, ⋂𝑥 (caso 𝑥 ≠ ∅), etc. são conjuntos bem fundados. Em outras

palavras, começando por ∅ e aplicando recursivamente todas as operações entre conjuntos

que definimos, obtemos sempre conjuntos bem fundados. E nisso, consiste o Axioma da

Fundação:

(AF) Todo conjunto é bem fundado.

Apesar de não demonstrarmos, frisamos que (A9), postulado ainda no Capítulo 2, é

equivalente à (AF).

146

A importância do Axioma da Fundação se faz presente em contextos inerentes à

própria Teoria dos Conjuntos. Por exemplo, enquanto negar o Axioma da Escolha nos gera

consequências na Álgebra e na Topologia, assumir ou não (AF) é irrelevante para a

Matemática em geral, haja vista que todos os conjuntos definidos por meio dos demais

axiomas são bem fundados. Conjuntos bem fundados servem como um modelo (no sentido do

que discutimos na seção 5.1), sendo dessa forma imprescindíveis para o estudo de questões

sobre os fundamentos da Teoria dos Conjuntos.

Além disso, faz-se o uso de (AF) em outras situações. Por exemplo, a

demonstração de que (iii) ⟹ (iv) no Teorema 5.5 se faz mostrando que para todo ordinal 𝛼,

𝑉𝛼 é bem ordenável, o que permite concluir que todo conjunto é bem ordenável.

Para encerrar este apêndice, respondemos à questão que o iniciou, e provamos a

seguir que para qualquer conjunto 𝑋, 𝑋 ∉ 𝑋.

Teorema. (∀𝑋)(𝑋 ∉ 𝑋).

Demonstração.

Suponha, por absurdo, que exista 𝑋 tal que 𝑋 ∈ 𝑋. Então 𝑋 ∈ {𝑋} e,

consequentemente, 𝑋 ∈ {𝑋} ∩ 𝑋. Devido a (A9), existe 𝑥 ∈ {𝑋} tal que 𝑥 ∩ {𝑋} = ∅.

Contudo, como {𝑋} é unitário, segue que 𝑥 = 𝑋 e, consequentemente, 𝑋 ∩ {𝑋} = ∅, absurdo.

Portanto, não existe 𝑋 tal que 𝑋 ∈ 𝑋. Q.E.D.

147

Bibliografia

AURICHI, L. F. fundamentos.pdf. 2011. Portable Document Format. Disponível em: <http://www.icmc.usp.br/~aurichi/Ensino/Verao2011/fundamentos.pdf>. Acesso em: 17 jun. 2011.

_______ . independência.pdf. 2011. Portable Document Format. Disponível em:

<http://www.icmc.usp.br/~aurichi/Ensino/Verao2011/independ%C3%AAncia.pdf>. Acesso em: 17 jun. 2011.

ÁVILA, G. Cantor e a Teoria dos Conjuntos. Revista do Professor de

Matemática, São Paulo, n. 43, p. 6-14, 2000. BLASS, A. Existence of Bases Implies The Axiom Of Choice. Contemporary

Mathematics, Providence, R.I., v. 31, p. 31-33, 1984. BOURBAKI, N. Elements of Mathematics, Theory of Sets. London: Addison-

Wesley, 1968. BOYER, C. B. História da Matemática. São Paulo: Blücher, 1996. COELHO, F. U.; LOURENÇO, M. L. Um Curso de Álgebra Linear. 2. ed. São

Paulo: Edusp, 2007. DADAM, F.; HEIN, N. Teoria Unificada dos Conjuntos. Rio de Janeiro:

Ciência Moderna, 2009. DEDEKIND, R. Essays On The Theory Of Numbers. Chicago: Open Court,

1901. EBBINGHAUS, H.-D.; PECKHAUS, V. Ernst Zermelo, An Aproach to His

Life and Work. Berlin: Springer, 2007. FERREIRÓS, J. Labyrinth of Thought, A History of Set Theory and Its Role

in Modern Mathematics. 2. ed. Berlin: Birkhäuser, 2007.

148

FRAENKEL, A. A. Abstract Set Theory. Amsterdam: North-Holland, 1953. FRAENKEL, A. A.; BAR-HILLEL, Y.; LEVY, A. Foundations of Set Theory.

2. ed. Amsterdam: Elsevier, 1973. HALMOS, P. R. Naive Set Theory. New York: Van Nostrand Reinhold

Company, 1960. HRBACEK, K.; JECH, T. Introduction to Set Theory. 3. ed. New York: Marcel

Dekker, 1999. JECH, T. The Axiom of Choice. Amsterdam: North-Holland, 1973. _______ . Set Theory. 3. ed. Berlin: Springer, 2003. KOMJÁTH, P.; TOTIK, V. Problems and Theorems in Classical Set Theory.

New York: Springer, 2006. KUNEN, K. Set Theory, An Introduction to Independence Proofs.

Amsterdam: North-Holland, 1980. KURATOWSKI, K.; MOSTOWSKI, A. Set Theory, With An Introduction To

Descriptive Set Theory. 2. ed. Warszawa: North-Holland, 1976. LEVY, A. Basic Set Theory. Mineola: Dover, 1979. LIMA, E. L. Curso de Análise Real. Vol. I. 12. ed. Rio de Janeiro: IMPA, 2009. MIRAGLIA, F. Teoria dos Conjuntos: Um Mínimo. São Paulo: Edusp, 1991. MORAIS FILHO, D. C. Manual de Redação Matemática. Campina Grande:

Fábrica de Ensino, 2010. ROTMAN, J. J. A First Course In Abstract Algebra. 3. ed. Upper Saddle River:

Prentice Hall, 2005.

149

RUSSELL, B. Introduction To Mathematical Philosophy. 2. ed. Mineola: Dover, 1920.

SUPPES, P. Axiomatic Set Theory. 2. ed. New York: Dover, 1972.

150

Índice Remissivo

Abraham Fraenkel, 24

Aleph. ver número cardinal transfinito

Alfabeto, 27

Alfred Whitehead, 25

Aristóteles, 11 silogismo de, 9

Axioma, 21 da Abstração, 19 da Escolha, 139 da Escolha, 22, 44, 90, 131 da Existência, 33 da Extensão, 34 da Fundação, 24, 44 da Separação, 22, 34 da Substituição, 23, 40 da União, 37 das Partes, 39 do Infinito, 39 do Par, 37

Bernard Bolzano, 12

Bernhard Riemann, 13

Bertrand Russell, 10, 25

conjunto bem ordenado, 96 cadeia, 134 cardinal do, 110 classe de equivalência, 71 compatível de funções, 83 complementar relativo, 50 das partes, 50 de funções, 89 de representantes, 74 definição intuitiva, 9 dos números naturais, 120 elemento do, 34 enumerável, 126 estritamente ordenado, 69 finito, 123 indexado, 76 indutivo, 119 ínfimo do, 93

infinito, 123 infinito de Dedekind, 14, 124 interseção, 50 interseção do par, 42 limite inferior do, 93 limite superior do, 93 não enumerável, 126 parcialmente ordenado, 69 partição do, 70 produto cartesiano finito, 123 produto do, 89 produto externo. ver produto do conjunto segmento inicial, 96 seleção, 43 sistema de Dedekind, 14 subconjunto, 38 subconjunto próprio, 38 sucessor, 104 supremo do, 93 totalmente ordenado, 70 transitivo, 103 união, 50 união do par, 38, 52 unitário, 37 universo, 10, 35 vazio, 10, 36

conjuntos disjuntos, 42 inclusão de, 38 inclusão própria de, 38 produto cartesiano de, 62

Critério da definição condicional, 31 da definição por equivalência, 30 da definição por identidade, 30 da eliminabilidade, 29 da não criatividade, 29

David Hilbert, 21 Problemas de, 22

definição por abstração, 46 por Recursão Transfinita, 116, 117, ver

Teorema da Recursão Transfinita

151

Epimênides, 18

Ernst Zermelo, 21

expressões de linguagem, 28

extensão conservativa, 25

formalismo, 21

fórmula, 29 aberta, 30 atômica primitiva, 28 condição em x, 30 fechada, 30 funcional, 40 operação induzida pela, 87

Frank Ramsey, 18

função automorfismo, 95 bijetora, 76 colagem de, 83 crescente, 99 escolha, 89 injetora, 75 isomorfismo, 94 sequência finita, 122 sequência infinita, 123 sequência transfinita, 122 sobrejetora, 75

Galileu Galilei, 11

Georg Cantor, 9, 15, 16

George Boole, 10

Giuseppe Peano, 75 Axiomas de, 121

Gottfried Leibniz, 12

Gottlob Frege, 19, 103

heterológico. ver paradoxo de Grelling-

Nelson

Hipótese do Continuum, 17, 128

Hipótese Generalizada do Continuum, 128,

139

imagem direta, 66

inversa, 66

indivíduo, 32

infinito completo, 11 de Dedekind, 124 potencial, 11

intuicionismo, 21

Jakob Steiner, 13

Karl Weierstrass, 15

Kazimierz Kuratowski, 60

Lei da Tricotomia, 134

Leis de De Morgan, 85

Lema de Zorn, 134, 136

linguagem objeto, 27

logicismo, 21

metalinguagem, 27

número cardinal, 110 cardinal transfinito, 126 de Hartogs, 108 natural, 119 ordinal, 104 ordinal limite, 113 ordinal sucessor, 113 ordinal, adição de, 118 ordinal, exponenciação de, 118 ordinal, multiplicação de, 118

n-úpla não ordenada, 123 ordenada, 122

par não ordenado, 37 ordenado, 60, 122

paradoxo, 18 de Aquiles, 11 de Burali-Forti, 19, 105 de Cantor, 18 de Grelling-Nelson, 23 de Russell, 19, 36

152

do Mentiroso, 18 linguístico, 18 lógico, 18

Princípio da Indução Natural, 120 para conjuntos bem ordenados, 97 para ordinais, 112, 113

relação antissimétrica, 69 assimétrica, 69 binária, 63 campo da, 64 conectada, 70 de boa ordem, 96 de equivalência, 69 de ordem estrita, 69 de ordem linear, 70 definição de, 63 domínio da, 64 elemento máximo da, 93 elemento mínimo da, 93 elementos comparáveis, 70 elementos incomparáveis, 70 função, 70 imagem da, 64 inversa da, 66 irreflexiva, 69 maior elemento da, 93 menor elemento da, 93 reflexiva, 69 restrição da, 66

simétrica, 69 transitiva, 69

Richard Dedekind, 14 infinito de. ver conjunto infinito de

Dedekind

Sistema axiomático de Morse-Kelley, 24 de Von Neumann-Bernays-Gödel, 24 de Zermelo-Fraenkel (ZF), 24 Zermelo-Fraenkel-Choice (ZFC), 24

Teorema da Boa Ordenação, 22, 132 da Recursão Transfinita, 114 de Cantor, 82 de Cantor-Bernstein, 82 do Ponto Fixo de Tarski, 81

Teoria dos tipos, 25

Thoralf Skolem, 23

variável ligada, 29 livre, 30

variedade. ver Bernhard Riemann

Von Neumann, 103

Zenão de Eléia, 11

Download - Uma Introdução à Teoria Axiomática dos Conjuntos · PDF fileA Teoria dos Conjuntos ocupa papel de destaque como fundamentação teórica das disciplinas matemáticas. Neste trabalho,

Top Related