Uma Introdução à Teoria Axiomática dos Conjuntos
Renan Maneli Mezabarba
(versão pessoal)
São Carlos - SP 2012
Renan Maneli Mezabarba
Uma Introdução à Teoria Axiomática dos Conjuntos
Monografia apresentada ao Curso de Matemática da UFMS, como requisito parcial para obtenção do grau de LICENCIADO em Matemática.
Orientador: Elias Tayar Galante Mestre em Matemática pela Unicamp
Aquidauana - MS 2011
versão pessoal: margens e capa alteradas.
Aos meus pais, Nadir e Antonio,
E à minha tia, Nilda.
Agradecimentos
Primeiramente, agradeço aos meus pais, Nadir e Antonio, sem os quais eu não
existiria em qualquer esfera de interpretação.
Aos professores Marcelo Dias Passos e Rodrigo Roque Dias, pela inspiração,
suporte bibliográfico e conselhos, não apenas para a realização deste trabalho, mas para a vida
acadêmica de modo geral.
Pelas horas de discussão, leituras, sugestões e paciência desprendidas pelos
demais vértices da Santíssima Trindade, Fernando da Silva Batista e Thales Fernando
Vilamaior Paiva.
Ao Professor Elias Tayar Galante, pela orientação, pelos pertinentes avisos e por
suas lições de humanidade e cosmo-ética, meus sinceros cosmo-agradecimentos.
A todos os amigos, supracitados ou não, que ajudaram direta ou indiretamente,
obrigado por vocês existirem!
In re mathematica ars proponendi quaestionem pluris facienda est quam solvendi (Na Matemática, a arte de propor questionamentos é mais importante do que a arte de resolvê-los).
Georg Cantor
Resumo
A Teoria dos Conjuntos ocupa papel de destaque como fundamentação teórica das disciplinas matemáticas. Neste trabalho, faz-se uma breve contextualização dos principais aspectos do desenvolvimento da Teoria dos Conjuntos ao longo da História, enfocando os trabalhos de Cantor, Dedekind e Zermelo. Os nove axiomas do sistema Zermelo-Fraenkel-Choice (ZFC) são postulados e discutidos. As principais operações entre conjuntos são definidas e suas propriedades elementares são demonstradas. Números ordinais, cardinais e naturais são estabelecidos em ZFC, bem como suas características básicas. Questões de consistência e independência de axiomas são tratadas suscintamente e de maneira informal. Demonstra-se a equivalência lógica entre o Axioma da Escolha e algumas proposições na Matemática, bem como prova-se que a Hipótese Generalizada do Continuum implica o Axioma da Escolha. Palavras-chave: Teoria dos Conjuntos; Axiomática Zermelo-Fraenkel-Choice; Equivalências do Axioma da Escolha.
Abstract
The Set Theory occupies an important role as theoretic foundation of mathematics disciplines. This work makes a brief contextualization about the main features of the development of Set Theory along the History, centering the efforts of Cantor, Dedekind and Zermelo. The nine axioms of Zermelo-Fraenkel-Choice system (ZFC) are postulated and discussed. The main operations between sets are defined and their elementary properties are proved. Ordinal, cardinal and natural numbers are founded in ZFC, as well their basics properties. Topics about consistency and independence of axioms are suddenly argued in an informal way. It’s proved the logical equivalence among the Axiom of Choice and some mathematical propositions, as well is proved that the Generalized Continuum Hypothesis implies the Axiom of Choice.
Key-words: Set Theory; Zermelo-Fraenkel-Choice Axiomatic System; Equivalences of
Axiom of Choice.
Sumário
Introdução................................................................................................................................... 7
Capítulo 1 — O Paraíso Criado por Cantor ............................................................................... 9
Capítulo 2 — Desenvolvimentos Iniciais em ZFC .................................................................. 27
2.1 . Preliminares: Alfabeto e Definições.......................................................... 27
2.2 . O Sistema de Axiomas Zermelo-Fraenkel-Choice .................................... 32
2.3 . Operações Básicas Entre Conjuntos .......................................................... 45
Capítulo 3 — Relações e Funções............................................................................................ 63
3.1 . Relações..................................................................................................... 63
3.2 . Relações de Equivalência .......................................................................... 70
3.3 . Funções ...................................................................................................... 75
Capítulo 4 — Conjuntos Bem Ordenados e Números Ordinais............................................... 92
4.1 . Conjuntos Bem Ordenados ........................................................................ 92
4.2 . Números Ordinais e a Recursão Transfinita............................................ 102
4.3 . Números Naturais e Conjuntos Finitos.................................................... 119
Capítulo 5 — O Axioma da Escolha ...................................................................................... 129
5.1 . Consistência e Independência.................................................................. 129
5.2 . Formulações Equivalentes do Axioma da Escolha ................................. 131
5.3 . A Hipótese Generalizada do Continuum ................................................. 139
Conclusão ............................................................................................................................... 142
Apêndice A — Leis do Cálculo Proposicional ...................................................................... 143
Apêndice B — Conjuntos Bem Fundados ............................................................................. 145
Bibliografia............................................................................................................................. 147
Índice Remissivo .................................................................................................................... 150
7
Introdução
Esta monografia tem por objetivo desenvolver os tópicos básicos da Teoria dos
Conjuntos de acordo com o sistema de axiomas Zermelo-Fraenkel-Choice (ZFC). Para tanto,
seguimos Hrbacek & Jech (1999) e Suppes (1972) como referência principal para a
elaboração do texto e da teoria. No entanto, como existem muitas formulações equivalentes de
ZFC, não abandonamos a visão de outros autores, como Kunen (1980), Fraenkel, Bar-Hillel &
Levy (1973) e Levy (1979), que foram exaustivamente consultados durante a elaboração deste
trabalho, principalmente na preparação dos tópicos sobre cardinais, ordinais e o Axioma da
Escolha.
Intuitivamente, um conjunto é uma coleção de objetos. Tomado de maneira mais
abstrata, podemos considerá-lo como uma coletânea de elementos que possuem alguma
propriedade em comum. Se nos restringirmos apenas às relações de pertinência e inclusão,
veremos que a noção de conjuntos é quase tão primitiva quanto à própria ideia de número —
numa manada de mamutes, por exemplo, temos o conjunto dos mamutes que pertencem a esta
manada.
Por muito tempo, matemáticos utilizaram tal conceito puramente intuitivo na
formulação dos muitos ramos da matemática que brotaram e chegaram até nós nos dias de
hoje. Contudo, no início do século XX, uma série de paradoxos estremeceu as bases da
imensa árvore da Matemática. Felizmente, tais tremores levaram os matemáticos a
abandonarem a abordagem intuitiva e “ingênua” e assumirem o rigor e a lógica formal como
bases para a reconstrução de toda a Matemática: a axiomatização.
O primeiro capítulo desta monografia dedica-se a uma breve contextualização
sobre a História da Teoria dos Conjuntos, desde seus primórdios ingênuos ou intuitivos até
sua axiomatização. Destacamos os papéis fundamentais de Georg Cantor e Richard Dedekind,
no estabelecimento da Teoria dos Conjuntos como disciplina matemática. Posteriormente,
citamos as contribuições de Ernst Zermelo, Abraham Fraenkel e Thoralf Skolem pela
“construção” do primeiro sistema axiomático que estabilizou as bases da Teoria dos
Conjuntos após a sucessão de paradoxos descobertos entre o final do século XIX e início do
século XX, sobre os quais também discutimos.
No segundo capítulo desenvolvemos os tópicos básicos da teoria axiomática dos
conjuntos de Zermelo-Fraenkel-Choice. Estabelecemos a linguagem básica a ser utilizada ao
8
longo do texto e postulamos os nove axiomas de ZFC. Definimos também as relações entre
conjuntos, como inclusão, interseção, união, produto cartesiano, etc. e demonstramos suas
propriedades elementares.
O terceiro capítulo destina-se à fundamentação em ZFC do conceito de relação
binária. Definimos domínio, imagem e contradomínio de relações e provamos alguns
resultados concernentes às relações de equivalência. Também discorremos sobre funções e
abordamos alguns problemas de equipotência, como o Teorema de Cantor-Bernstein.
Versamos sobre conjuntos bem ordenados e seus representantes canônicos, os
números ordinais, no quarto capítulo. Focamos rapidamente nosso estudo para os números
naturais, donde segue uma rápida discussão concernente a conjuntos finitos, infinitos
enumeráveis e não enumeráveis.
O quinto capítulo dedica-se exclusivamente ao Axioma da Escolha, isto é,
debatemos os “prós” e “contras” em assumi-lo como verdadeiro ou falso, ou seja, sobre a
ocorrência ou não de inconsistências na teoria. Demonstramos algumas equivalências entre o
Axioma da Escolha e outros princípios da Teoria dos Conjuntos, como o Lema de Zorn e a
Lei da Tricotomia. Por fim, provamos que a Hipótese Generalizada do Continuum implica o
Axioma da Escolha.
O Apêndice A consiste de uma lista de leis lógicas utilizadas ao longo deste
trabalho, como a contrapositiva, a transitividade da implicação, etc. No Apêndice B tratamos
concisamente de Conjuntos Bem Fundados, de maneira informal e introdutória. Julgamos
necessários tais apêndices por considerarmo-los muito importantes no contexto geral da
Matemática, apesar de não serem os focos deste trabalho.
9
Capítulo 1 — O Paraíso Criado por Cantor
Unter einer ‘Meng’ verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten m unserer Anschauung oder unseres Denkens (welche die Elemente von M genannt werden) zu einem Ganzen. (CANTOR, 1895/97, p. 282 apud FERREIRÓS, 2007, p. 292).
Com as palavras acima1, num de seus trabalhos realizados na segunda metade do
século XIX, o matemático Georg Cantor inaugurou uma das teorias mais importantes de toda
a Matemática, sobre a qual esta se fundamenta e se projeta: a Teoria dos Conjuntos. Da nossa
intuição, um conjunto é uma coleção de objetos. No entanto, ao adotarmos tal noção na
Matemática, devemos nos precaver, isto é, precisamos ter em mente que conjuntos de objetos
concretos não são necessariamente conjuntos matemáticos. Com efeito,
Conjuntos não são objetos do mundo real, como mesas ou estrelas; eles são criados por nossa mente, não por nossas mãos. Um saco de batatas não é um conjunto de batatas, um conjunto de moléculas numa gota d’água não é o mesmo objeto que tal gota d’água. A mente humana possui a habilidade de abstrair, pensar numa variedade de diferentes objetos ligados por alguma propriedade comum e assim formar um conjunto dos objetos que possuem essa propriedade. (HRBACEK & JECH, 1999, p. 1, tradução nossa).
Dessa forma, ao nos referirmos à Teoria dos Conjuntos, podemos entendê-la como
sendo o ramo da Matemática dedicado exclusivamente ao estudo dos conjuntos e de suas
propriedades, inseridos dentro de um contexto matemático. Por sua vez, tal teoria tem por
objetivo servir como fundação para as demais disciplinas matemáticas, haja vista que durante
séculos a Teoria dos Conjuntos — ou a noção intuitiva do que vem a ser um conjunto — foi
usada tacitamente por matemáticos e filósofos.
Na era clássica da matemática grega, os silogismos2 de Aristóteles já se baseavam
na noção intuitiva dos conjuntos, evidenciando que tais ideias fazem parte das raízes
históricas da Lógica e da Matemática. Um exemplo de tais silogismos é dado a seguir.
Suponha que todos os homens sejam mortais, se Sócrates é um homem, então Sócrates é
1 “Por conjunto, entendemos qualquer reunião 𝑀 bem definida de objetos distintos 𝑚 de nossa intuição ou pensamento (que são chamados os elementos de 𝑀)” (FERREIRÓS, 2007, tradução nossa).
2 São regras de argumentação desenvolvidas por Aristóteles, que tratam de relações do tipo “todo 𝐴 é 𝐵” e “algum 𝐴 é 𝐵”. Para uma discussão mais aprofundada, sugerimos Bourbaki (1968) e Boyer (1996).
10
mortal. Na linguagem moderna da Teoria dos Conjuntos temos o conjunto dos mortais 𝑀
contendo o subconjunto dos homens 𝐻, isto é, 𝐻 ⊂ 𝑀; assim, se Sócrates ∈ 𝐻, então Sócrates
∈ 𝑀 (BOYER, 1996).
Mais recentemente, em meados do século XIX, George Boole também “se
apropriou” dos conjuntos em sua lógica simbólica, utilizando-os para representar coleções de
pontos, números ou ideias, isto é, como extensões de conceitos lógicos. Sobre o “conjunto
universo” — conjunto de todos os objetos, que ele chamou de 1 — ele considerava como
operações a interseção e a união disjunta de conjuntos, denotados respectivamente por 𝑥𝑦 e
𝑥 + 𝑦, onde 𝑥 e 𝑦 são conjuntos. Boole também definiu o conjunto vazio — conjunto que não
possui objetos, denotado por 0 —, bem como o complementar de um conjunto 𝑥, isto é, o
conjunto dos objetos não pertencentes a 𝑥, e chamou-o de 1− 𝑥. O filósofo e matemático
Bertrand Russell, ao se referir à Matemática Pura como a maior descoberta do século XIX,
defendeu Boole como sendo o seu descobridor, um título considerado justo por muitos
historiadores e matemáticos.
Se levarmos em consideração o fato de que as operações definidas por Boole
atuavam sobre conjuntos, podemos até mesmo pensar que fora ele o “pai” da Teoria dos
Conjuntos. No entanto, tal inferência não é verdadeira. De fato, como citamos acima, desde
Aristóteles os conjuntos eram ferramentas costumeiras da Lógica. Fossem eles tomados de
maneira intuitiva como na era clássica grega ou como extensões de conceitos lógicos no
século XIX, as únicas operações consideradas sobre os conjuntos tratavam na verdade de
operações envolvendo os conceitos que formavam tais conjuntos, como exemplificamos com
o silogismo de Aristóteles. Assim, se restringíssemo-nos a essa visão de conjunto como
ferramenta da Lógica, poderíamos inferir que “um pai” da Teoria dos Conjuntos seria
Aristóteles ou então alguém que se encontra nalgum ponto da História anterior a este.
Ao referirmo-nos à Teoria dos Conjuntos, as propriedades inerentes aos conjuntos
e seus elementos não se restringem apenas às relações de pertinência, inclusão e afins, onde
Boole e os lógicos, de maneira geral, se limitaram. É neste ponto que se encontram as grandes
inovações dadas por Cantor, Dedekind e outros: eles estenderam a visão sobre os conjuntos,
aumentando de maneira significativa o leque de propriedades e relações existentes entre eles,
principalmente no que se refere aos conjuntos infinitos.
11
Obviamente o infinito já fora alvo de investidas intelectuais bem antes do século
XIX. Zenão de Eléia, com seus paradoxos sobre o movimento, como, por exemplo, o
Paradoxo de Aquiles3, foi certamente um dos primeiros filósofos gregos a questionar as
implicações do infinito. Aristóteles também ponderou sobre a natureza do infinito, chegando à
conclusão de que há dois tipos de infinito: o completo, também chamado de atual, e o
potencial. O infinito completo seria aquele em que infinitos objetos distintos existem
simultaneamente, enquanto o infinito potencial seria alguma coleção que pode ser
arbitrariamente estendida, isto é, cujo número de elementos pode ser aumentado de acordo
com a necessidade em questão, como o comprimento de um dado segmento ou o sucessor de
um número qualquer. Aristóteles defendia a existência do infinito potencial em detrimento do
infinito completo, e tal visão ecoou no pensamento filosófico e matemático durante os séculos
seguintes.
Em 1638, no livro Discorsi e Dimostrazioni Matematiche Intorno a Due Nuove
Scienze (Discursos e Demonstrações Matemáticas Sobre Duas Novas Ciências), Galileu
Galilei encontrou uma “estranha” propriedade do conjunto dos números naturais (inteiros não
nulos). Ele notou que na correspondência 𝑛 ⟶ 𝑛2 , onde 𝑛 é um número natural, todo número
𝑛 possui um quadrado perfeito; por outro lado, existem números naturais, como o número 2,
por exemplo, que não são quadrados perfeitos de algum outro número, ou seja, cujas raízes
não são números naturais. Seguiria daí, por um axioma de Euclides, o qual afirma que “o todo
é maior que a parte”, que o conjunto dos quadrados perfeitos deveria ser menor que o
conjunto dos naturais, pois o primeiro é subconjunto próprio do último. No entanto, pela
correspondência estabelecida por Galileu, todo número inteiro positivo deve possuir um
quadrado perfeito, donde se conclui, neste caso, que o todo é igual à parte, no que concerne a
quantia de elementos, um “absurdo”. Entretanto, em vez de impulsionar o estudo de conjuntos
infinitos, tal conclusão serviu apenas para afastar os estudiosos deste conceito, que viram na
estranha propriedade não uma característica de tais conjuntos, mas sim uma aberração
intuitiva, um paradoxo que contrariava o bom senso euclidiano e mais um motivo para rejeitar
tais conjuntos completamente infinitos (BOURBAKI, 1968).
3 Resumidamente, o Paradoxo de Aquiles se baseia na subdivisão infinita do trajeto a ser percorrido por Aquiles numa hipotética corrida contra uma tartaruga. Para percorrer um comprimento 𝑛, Aquiles teria que, antes disso, percorrer metade deste comprimento 𝑛, porém, para tanto ele deveria percorrer metade deste último e assim sucessivamente, resultando na impossibilidade do movimento, pois as subdivisões infinitas implicariam a estagnação de Aquiles, como pretendia Zenão (BOYER, 1996).
12
Sabe-se, por exemplo, que o grande matemático Friedrich Gauss escreveu num de
seus trabalhos:
“Eu protesto… Contra o uso de magnitudes infinitas como algo consumado, tal uso nunca é admissível na Matemática. O infinito é apenas um façon de parler [modo de falar]: tem-se em mente limites para os quais certas razões aproximam-se tanto quanto desejarmos, enquanto outras aumentam indefinidamente.” (1860 apud FRAENKEL, 1953, itálico do autor, tradução nossa).
É frequentemente aceito que o horror infiniti de Aristóteles permaneceu entre
cientistas e matemáticos até ser encerrado pela vigorosa defesa de Cantor em aceitar a
existência e a necessidade do infinito atual. No entanto, o mérito pela difusão do infinito
completo no meio científico não pertence exclusivamente a Cantor. Na Alemanha havia uma
forte tendência filosófica em aceitar o infinito completo bem antes dos trabalhos de Cantor, e
tal comportamento facilmente se propagou no meio matemático. Ainda em 1714, o filósofo e
matemático alemão Gottfried Leibniz, em seu trabalho intitulado Monadologie4, defendeu a
plausibilidade do infinito completo e influenciou as gerações vindouras de pensadores
alemães. Matemáticos como Bernhard Riemann e Richard Dedekind, que tiveram grande
importância para o desenvolvimento da Teoria dos Conjuntos, foram direta ou indiretamente
influenciados pelas ideias de Leibniz e, em ambos os casos, independentemente de Cantor.
(FERREIRÓS, 2007).
Uma importante contribuição posterior à Leibniz foi dada pelo filósofo, teólogo e
matemático Bernard Bolzano, não apenas em seu livro Paradoxien des Unendlichen
(Paradoxos do Infinito, publicado em 1851, três anos após sua morte), mas também num
trabalho anterior, Wissenchaftslehre (Teoria da Ciência, publicado em 1837). Bolzano
introduziu a noção de conjunto em muitas abordagens diferentes. Em geral, ele tratava de
coleções ou extensões de conceitos, mas distinguia aquelas nas quais a ordem dos elementos
era arbitrária, chamando-as de Mengen (quantidades) e, dentre estas, ele destacava as coleções
cujos elementos eram unidades, denominando-as multiplicidades. Para Bolzano, uma
multiplicidade é infinita se é maior que qualquer multiplicidade finita, isto é, se qualquer
Menge finito é apenas uma parte dele. Bernard Bolzano defendeu vigorosamente o infinito
4 Um dos mais conhecidos trabalhos de Leibniz, no qual ele defende uma concepção de universo composto por “unidades metafísicas” (FERREIRÓS, 2007).
13
completo, afirmando que os “paradoxos” encontrados em conjuntos infinitos não eram de fato
paradoxos, mas sim características próprias de tais conjuntos (FERREIRÓS, 2007).
Não apenas os desenvolvimentos da Análise e da Lógica no século XIX
impulsionaram o surgimento da Teoria dos Conjuntos, mas também a formalização presente
em praticamente todos os ramos da matemática neste período foram fatores marcantes para
que a Teoria dos Conjuntos se fizesse necessária. Segundo Ferreirós:
[…] durante a segunda metade do século XIX, a noção de conjuntos foi crucial para o surgimento de novas concepções na álgebra, nos fundamentos da aritmética e mesmo na geometria. Sobretudo, todo esse desenvolvimento antecedeu as mais antigas investigações de Cantor sobre a teoria dos conjuntos e, provavelmente, tal desenvolvimento motivou o seu trabalho. A concepção conjuntística [set-theoretical conception] dos diferentes ramos da matemática está, portanto, inscrita nas origens da teoria dos conjuntos. (FERREIRÓS, 2007, p. xvii, tradução nossa).
Ao se referir à “concepção conjuntística”, Ferreirós faz menção à tendência já
presente no século XIX de definir os objetos matemáticos com a utilização de termos e ideias
semelhantes àqueles pertencentes a atual Teoria dos Conjuntos. As definições dadas por Jakob
Steiner em 1832 num de seus trabalhos mais importantes sobre Geometria5 servem como
exemplo. Nele, “Steiner enfatiza as concepções de linha, plano, feixe de retas, etc. como
agregados de infinitos elementos” (FERREIRÓS, 2007, p. 22, tradução nossa) tratando, dessa
forma, não apenas de conjuntos ou “agregados”, mas também de conjuntos infinitos, dois
conceitos inerentes à Teoria dos Conjuntos.
Conforme lembrado por Ferreirós (2007), na mesma “concepção conjuntística”,
devemos citar a contribuição de Bernhard Riemann com suas variedades. Em 1854, numa
palestra (public lecture) na ocasião de seu Habilitation6 como professor de Göttingen e
publicado postumamente em 1868 por Dedekind, Riemann definiu “variedade” como sendo a
totalidade de “determinações” de um conceito genérico. Por exemplo, tomando como conceito
a cor, teríamos que cada cor particular em cada variação possível de tonalidade seria uma
determinação e, por conseguinte, a totalidade de tais cores formaria uma variedade. Riemann
utilizou tal conceituação conjuntística de variedade como uma generalização da ideia de
5 Systematische Entwicklung der Abhängigkeit geometrischer Gestalten von einander (Desenvolvimento Sistemático da Interdependência Entre as Configurações Geométricas, publicado em 1832) (FERREIRÓS, 2007).
6 Habilitation é o mais alto grau acadêmico que uma pessoa pode adquirir em certos países da Europa e da Ásia.
14
magnitude e abriu caminho para definir rigorosamente a noção de número pela utilização de
abordagens igualmente conjuntísticas, passagem na qual se destacou Richard Dedekind.
Deve-se a Dedekind a criação de um dos principais métodos para a construção dos
números reais pela utilização explícita de conjuntos. Aliás, muito de seu trabalho em números
algébricos baseou-se em conjuntos, os quais ele chamou de sistemas (FERREIRÓS, 2007). De
fato, seu uso foi tão forte que Dedekind chegou a definir tais conceitos, como podemos ver
abaixo:
[…] Eu entendo por objeto [thing] todas as coisas de nosso pensamento […]. Um objeto é completamente determinado por tudo o que pode ser afirmado ou pensado com respeito a ele. Um objeto 𝑎 é o mesmo que um objeto 𝑏 (idêntico à 𝑏), e 𝑏 é idêntico à 𝑎 se tudo o que puder ser pensado a respeito de 𝑎 puder também ser pensado a respeito de 𝑏 […]. É muito comum ocorrer que objetos distintos 𝑎, 𝑏, 𝑐 … por alguma razão sejam considerados comuns sob algum ponto de vista, podendo ser associados em nossa mente, e dizemos que eles formam um sistema 𝑆; nós chamamos os objetos 𝑎, 𝑏, 𝑐 … de elementos do sistema 𝑆 […]. (DEDEKIND, 1901, p. 44, itálico do autor, tradução nossa)7.
Na “teoria dos sistemas” de Dedekind o conceito de função (mappings) não se
baseou sobre a noção de conjuntos, mas foi tomado como um ente primitivo, de modo que ele
desenvolveu significativamente a teoria abstrata das funções. Seus escritos ainda fizeram
menção ao princípio da extensionalidade, o qual afirma que dois conjuntos 𝑆1 e 𝑆2 são iguais
se, e somente se, todos os objetos que pertencem a 𝑆1 pertencem a 𝑆2 e todos os objetos
pertencentes a 𝑆2 também pertencem a 𝑆1. Dedekind também definiu o que seriam as partes e
partes próprias de um sistema — o que atualmente chamamos de subconjuntos e subconjuntos
próprios de um conjunto, respectivamente (FERREIRÓS, 2007).
Com tais conceitos formulados, Dedekind definiu de maneira clara o que é um
conjunto infinito completo, utilizando a anomalia encontrada por Galileu como uma
caracterização para tais conjuntos. Para Dedekind, “um sistema 𝑆 é dito infinito quando é
similar a uma parte própria de si mesmo [quando existe uma injeção de 𝑆 sobre uma parte
própria de 𝑆]; caso contrário, 𝑆 é dito um conjunto finito.” (1901, p. 63, tradução nossa).
7 Essays On The Theory Of Numbers (Ensaios sobre a Teoria dos Números), publicado em 1901 é uma tradução inglesa das obras Stetigkeit und irrationale Zahlen (Continuidade e Números Irracionais) de 1872 e Was sind und was sollen die Zahlen? (O Que São os Números e O Que Poderiam Ser?) de 1888, ambas de autoria de Richard Dedekind.
15
Dada à importância do infinito completo para a atual Teoria dos Conjuntos,
julgamos interessante transcrever a demonstração do “Teorema 66” de Dedekind, no qual ele
argumenta favoravelmente à existência de conjuntos infinitos:
Prova: Meu próprio reino dos pensamentos, isto é, a totalidade 𝑆 de todas as coisas que podem ser objetos de meu pensamento, é infinita. Seja 𝑠 um elemento de 𝑆, então o pensamento 𝑠′ de que ‘𝑠 é um elemento de 𝑆’ é ele próprio um elemento de 𝑆. Se considerarmos isso como a transformação 𝜙(𝑠) do elemento 𝑠, então a transformação 𝜙 de 𝑆 [a imagem direta de 𝑆] tem, conforme determinamos, a propriedade de que 𝑆′ é uma parte de 𝑆; e 𝑆′ é certamente uma parte própria de 𝑆, pois existem elementos em 𝑆 (por exemplo, meu próprio ego) que são diferentes de quaisquer pensamentos 𝑠′ e, portanto, não estão contidos em 𝑆′. Finalmente é claro que se 𝑎, 𝑏 são elementos distintos de 𝑆, então as imagens 𝑎′ e 𝑏′ são também diferentes, e portanto a transformação 𝜙 é uma transformação distinta [injetora]. Dessa forma, 𝑆 é infinito, como queríamos provar. (DEDEKIND, 1901, p. 64, tradução nossa).
Em outras palavras, Dedekind considerou a função injetora 𝜙: 𝑆 ⟶ 𝑆 que associa
cada pensamento 𝑠 ao pensamento 𝜙(𝑠) = 𝑠′ de que “𝑠 é um elemento de 𝑆”, na qual tem-se
𝜙(𝑆) como subconjunto próprio de 𝑆. Devemos ressaltar que embora a prova de Dedekind
seja interessante devido aos seus questionamentos filosóficos, “[…] de forma nenhuma essa
demonstração satisfaz os padrões modernos.” (SUPPES, 1972, p. 138, tradução nossa).
Sem dúvidas, o aprofundamento da Análise e a obtenção de resultados patológicos
e não intuitivos motivaram o grande ímpeto, presente no século XIX, de aritmetizá-la. Tal
processo consistia em formalizar o conceito de número real de uma forma aritmética
independentemente das noções geométricas, pois até então números reais eram concebidos
como magnitudes, o que não condizia com a crescente formalização da Matemática. Como
exemplo de tais patologias, temos: a existência de uma função contínua em todos os pontos,
mas não derivável em todos eles, mostrada por Bolzano; Riemann exibiu uma função 𝑓
descontínua em infinitos pontos que ainda assim é integrável, o que o motivou a definir uma
nova e mais rigorosa noção de integral, que hoje recebe seu nome. Ambos os resultados acima
contrariavam a noção intuitiva de continuidade, mas estavam de acordo com as noções vagas
da época sobre números reais. (BOURBAKI, 1968).
Ferreirós (2007) também observa que concernente a tal formalização, não apenas
Dedekind, mas também Karl Weierstrass e Georg Cantor tiveram contribuições notáveis —
não obstante outros matemáticos tenham também desenvolvido métodos próprios — e, em
todos os casos, de uma forma ou de outra, concepções conjuntísticas foram utilizadas:
16
Weierstrass utilizou séries infinitas, Cantor empregou sequências de Cauchy e Dedekind
recorreu a sistemas de números racionais — os quais ele denominou de cortes8.
Georg Cantor começou como analista, trabalhando com séries trigonométricas, o
que provavelmente motivou seu interesse por problemas sobre equipotência. Em 1873, ele
provou que o conjunto dos números racionais é contável ou enumerável9, bem como o
conjunto dos números algébricos — números que são raízes de polinômios cujos coeficientes
são inteiros. Isto significa, grosso modo, que existe “a mesma quantidade” de números
naturais e de números algébricos. Por algum tempo, chegou-se a imaginar que a cardinalidade
do infinito fosse única, isto é, que conjuntos infinitos possuíssem sempre a mesma “quantia”
de elementos, mas logo Cantor chegou à conclusão contrária: o conjunto dos números reais é
incontável. Prosseguindo com suas pesquisas, Cantor tentou por três anos demonstrar a
impossibilidade de uma bijeção entre ℝ e ℝ𝑛, para 𝑛 > 1, quando em 1877, para seu
espanto10, provou que estava errado: ℝ e ℝ𝑛 são equipotentes para 𝑛 > 1 (BOURBAKI,
1968).
Ainda segundo Bourbaki (1968), munido de tais resultados, Cantor devotou-se
inteiramente à sua Mengelehre (Teoria das Coleções). Entre 1878 e 1884, numa série de seis
artigos publicados no periódico alemão Mathematische Annalen, dedicado à divulgação de
pesquisas matemáticas desde 1868, Cantor tratou de questões de topologia de ℝ e ℝ𝑛, de
problemas sobre equipotência, da Teoria dos Conjuntos totalmente ordenados, entre outros
tópicos.
Com o desenvolvimento da teoria sobre boas ordenações, Cantor pensou em
iterações “transfinitas” de conjuntos derivados de outros, gerando assim conjuntos cada vez
maiores. Para tanto, ele se baseou num teorema que havia provado11, o qual afirma que se 𝐴
for um conjunto então a cardinalidade de 𝐴 é estritamente menor do que a cardinalidade de
℘(𝐴), onde ℘(𝐴) é o conjunto cujos membros são os subconjuntos de 𝐴. Seguiu-se então um
detalhado estudo sobre as propriedades dos números cardinais, culminando na Hipótese do
8 Embora Dedekind tenha desenvolvido sua teoria dos números reais em 1858, ele só a publicou em 1872, mesmo ano em que Cantor publicou um artigo sobre séries trigonométricas, no qual ele expôs seu método. Weierstrass nunca chegou a publicar sua teoria sobre os números reais, o que se sabe a respeito de suas ideias corresponde a análises de redações de seus estudantes, que se difundiram rapidamente na comunidade matemática alemã por volta de 1860 (FERREIRÓS, 2007).
9 Ver Capítulo 4, Seção 4.3. 10 Numa carta escrita para Dedekind, Cantor pediu para que este verificasse sua prova da
equipotência e, referindo-se à própria descoberta, escreveu: “Eu vejo isso, mas não acredito.” (CANTOR & DEDEKIND, 1937, p. 34 apud FERREIRÓS, 2007, p. 171, tradução nossa).
11 Ver Capítulo 3, Teorema 3.13.
17
Continuum, que afirma não existir conjunto cuja cardinalidade seja estritamente menor do que
a cardinalidade dos números reais e maior do que a cardinalidade dos naturais.
Os números transfinitos marcam o ponto crucial dos trabalhos de Cantor rumo a
uma teoria abstrata dos conjuntos, onde esta se torna uma disciplina voltada para si mesma.
Ele republicou seus artigos sobre a Teoria dos Conjuntos no livro Grundlagen einer allgeimen
Mannigfaltigkeitslehre (Fundações de uma Teoria Geral das Multiplicidades, publicado em
1883), no qual ele também discute as implicações filosóficas e teológicas de suas “inovações”
matemáticas, motivado pela consciência de que suas novas ideias iam contra as visões
prevalentes de número e infinito, como ressaltado por Ferreirós (2007).
Portanto, conforme sintetizado por Ferreirós, Cantor e Dedekind contribuíram
para o desenvolvimento da Teoria dos Conjuntos em duas frentes distintas, pois
Durante o último quarto do século XIX, Dedekind e Cantor publicaram contribuições cruciais para a teoria abstrata dos conjuntos. Dedekind tentou elaborar uma base abstrata para uma fundação rigorosa da matemática pura — aritmética, álgebra e análise. Por sua vez, Cantor deu o passo radical de começar a explorar o reino dos conjuntos infinitos e, em tal processo, criou o que é usualmente chamado de teoria dos conjuntos no senso estrito. (FERREIRÓS, 2007, p. 170, tradução nossa).
Diz-se geralmente que a Teoria dos Conjuntos desenvolvida por Cantor não foi
bem acolhida em sua época. Entretanto, há muitos exemplos que revelam uma boa recepção
de suas ideias. Matemáticos como Henri Poincaré e Karl Weierstrass e Mittag-Leffer
aceitaram e fizeram uso das contribuições Cantorianas na Topologia Geral (point-set
topology). (FERREIRÓS, 2007).
Mas, obviamente, nem todas as suas ideias foram facilmente recebidas, haja vista
suas grandes inovações. O grande desacordo, vindo principalmente da velha guarda
matemática, residiu principalmente sobre os números transfinitos. O principal opositor a tais
conceitos foi Leopold Kronecker. Ele defendia a construção da Matemática tendo como base
os números naturais, mas rejeitava o infinito completo e, por conseguinte, desprezou todas as
definições de números irracionais, uma vez que tais definições exigiam a aceitação do infinito
completo e, pelo mesmo motivo, rejeitou os números transfinitos. Uma típica reação negativa
aos trabalhos de Cantor pode ser exemplificada pelo texto de Charles Hermite, que qualifica
suas pesquisas como “desastrosas […], [de tal maneira que julga ser] impossível encontrar,
dentre os resultados que podem ser compreendidos, apenas um que possua um interesse real e
presente.” (FERREIRÓS, 2007, p. 283, tradução nossa). Tal visão, segundo Ferreirós,
18
“corresponde à visão da maioria dos matemáticos contemporâneos a ele [Hermite] […]” (op.
cit. p. 283) para com as ideias de Cantor. No entanto, foi o apoio da nova geração — dentre os
quais se destaca Poincaré — que contribuiu para convencer a “velha guarda” da importância
da Teoria dos Conjuntos.
Assim, entre o final do século XIX e o início do século XX, após enfrentar muitas
ressalvas da comunidade matemática, as concepções essenciais das ideias de Cantor haviam
ganhado o reconhecimento da comunidade matemática, quando a Teoria dos Conjuntos
passou a ser aplicada à Geometria e à Análise. Justamente nesse período, paradoxos
começaram a surgir dentro da Teoria dos Conjuntos, abalando assim a recém-nascida
confiança que o mundo havia lhe depositado (FRAENKEL, BAR-HILLEL, & LEVY, 1973).
Antes de prosseguirmos, devemos tentar enxergar de maneira mais clara o que
vem a ser um paradoxo, também chamado de antinomia, uma contradição lógica. Em 1926,
Frank Ramsey foi provavelmente o primeiro a dividir os paradoxos em dois tipos: os
paradoxos lógicos ou matemáticos, e os paradoxos linguísticos ou semânticos.
Grosseiramente falando, a primeira classe surge de construções puramente matemáticas que
resultam em contradições; o segundo decorre de considerações da linguagem que usamos para
falar sobre as construções matemáticas e lógicas. Um exemplo de paradoxo semântico pode
ser dado pelo Paradoxo do Mentiroso, de Epimênides. Epimênides, o Cretense, disse: “eu
estou mentindo”. Se essa sentença for verdadeira então ele está mentindo e daí decorre que a
afirmação é falsa; se a sentença for falsa então ele não está mentindo e, portanto, ele está
mentindo, logo a afirmação é verdadeira (SUPPES, 1972).
Os paradoxos que abalaram a Teoria dos Conjuntos no final do século XIX fazem
parte da primeira classe de Ramsey, isto é, são paradoxos lógicos. Supõe-se que um dos
primeiros tenha sido encontrado por Cantor, ainda em 1899. Na teoria ingênua dos conjuntos,
não baseada explicitamente sobre axiomas, mas sim sobre a intuição, era comum aceitar como
válida a existência de um conjunto universo 𝑈, cujos membros são todos os objetos e
conjuntos que existem. Naturalmente, se denotarmos por 𝔠 o número cardinal de 𝑈, tem-se
que 𝔠 é o maior cardinal que existe. Porém, decorre de um teorema provado por Cantor, que se
℘(𝑈) tem como número cardinal 𝔭, então 𝔭 > 𝔠, o que contraria o fato de ser 𝔠 o maior
cardinal. Outro paradoxo semelhante, envolvendo o maior número ordinal existente também
19
foi encontrado nessa época, por Burali-Forti12. Ainda assim, tais antinomias não destruíram a
confiança na Teoria dos Conjuntos, principalmente por fazerem parte de contextos avançados
da teoria. A esperança, nesse caso, era que uma revisão nas demonstrações encerrasse os
paradoxos. No entanto, tal esperança morreu com a chegada do paradoxo de Russell.
O Paradoxo de Russell, observado pela primeira vez por Bertrand Russell, reside
num conceito fundamental da teoria ingênua dos conjuntos, chamado de Princípio (ou
Axioma) da Abstração: dada qualquer propriedade\condição 𝜙, existe um conjunto 𝐴 formado
por todos os elementos que possuem\satisfazem 𝜙 e, reciprocamente, todos os elementos que
satisfazem 𝜙 pertencem a 𝐴. A primeira formulação explícita de tal princípio parece ter sido
feita por Gottlob Frege em 1893, no primeiro volume de seu livro Grundgesetze der
Arithmetik (Fundamentos da Aritmética), no qual o autor elaborou de maneira extremamente
formal, entre outras coisas, a conceituação de número como sendo a cardinalidade de
conjuntos (SUPPES, 1972).
Para obter o paradoxo, basta considerarmos o conjunto 𝑅 formado pelos
elementos que possuem a propriedade de “não pertencer a si mesmo”. Nestas condições, se 𝑅
pertencer a si mesmo, então 𝑅 possui a propriedade e, portanto, não pertence a si mesmo,
absurdo. Logo, deve-se ter que 𝑅 não pertence a 𝑅, mas daí decorre que 𝑅 possui a
propriedade e então 𝑅 pertence a si mesmo.
Na linguagem simbólica que usaremos no Capítulo 2, podemos formular o
Axioma da Abstração como:
(1) (∃𝑦)(∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝜑(𝑥)�,
onde entende-se que 𝜑(𝑥) é uma fórmula na qual “𝑦” não é uma variável livre13. Para obter o
Paradoxo de Russell, tomamos 𝜑(𝑥) ≡ 𝑥 ∉ 𝑥. Então, temos garantido, por (1), que:
(2) (∃𝑅)(∀𝑥)(𝑥 ∈ 𝑅 ⟺ 𝑥 ∉ 𝑥).
Como (2) é verdadeiro para quaisquer “𝑥”, tomamos 𝑥 = 𝑅, donde segue que:
(3) 𝑅 ∈ 𝑅 ⟺ 𝑅 ∉ 𝑅.
De (3), obtemos:
12 Ver demonstração do item (vi) do Teorema 4.6, no Capítulo 4. 13 Ver Capítulo 2, Seção 2.1.
20
(𝑅 ∈ 𝑅 ⟺ 𝑅 ∉ 𝑅) ⟹𝑅 ∈ 𝑅 ∧ 𝑅 ∉ 𝑅,
um absurdo, pois viola o Princípio da Não Contradição: uma sentença não pode ser
verdadeira e falsa simultaneamente.
Deve-se frisar que a contradição não se encontra no fato de perguntarmos se 𝑅
pertence ou não a si mesmo, pois “exemplos” corriqueiros de ambos os casos abundam: o
conjunto dos números naturais, por exemplo, não é um número natural, da mesma forma que
o “conjunto” dos homens não é um homem; na outra vertente, temos o “conjunto” das
abstrações que é uma abstração, ou ainda a ideia intuitiva do conjunto de todos os conjuntos
que é um conjunto e, portanto, pertence a si mesmo. Frisamos apenas que tal situação de um
conjunto universo não ocorre em ZFC, como provamos no Teorema 2.1 do Capítulo 2.
A contradição se encontra em tomar como plausível a existência de um conjunto
cujos membros são exatamente todos os conjuntos que não pertencem a si mesmos. Nas
palavras de Hrbacek e Jech,
A lição contida no Paradoxo de Russell e outros exemplos similares é que meramente definir um conjunto não prova sua existência (da mesma forma que definir um unicórnio não prova que o unicórnio existe). Existem propriedades que não definem conjuntos, isto é, não é possível coletar todos os objetos com tais propriedades num único conjunto. Tal observação deixou para os estudiosos da teoria dos conjuntos a tarefa de determinar quais propriedades são capazes de definir conjuntos. Infelizmente, não se conhece atualmente como fazer isso, e alguns resultados de lógica — como o conhecido Teorema da Incompletude de Gödel — parecem indicar que uma resposta nem sequer é possível. (HRBACEK & JECH, 1999, p. 3, grifo nosso, tradução nossa).
O Paradoxo de Russell foi historicamente importante, dentre outras razões, por
motivar o desenvolvimento de novas e mais restritas formulações da Teoria dos Conjuntos.
Uma das questões que surgiu deste paradoxo foi, como visto acima, “quais propriedades são
capazes de definir conjuntos?” e, neste sentido, Miraglia traça uma interessante linha entre
duas importantes abordagens:
Uma resposta é, na realidade, ‘sei lá’. Concebe-se o universo como tendo dois tipos de entes: classes e conjuntos. A diferença entre eles é que conjuntos podem ser elementos de outros conjuntos e classes, mas uma classe não pode ser elemento de nada, a não ser que se exiba uma demonstração de que essa classe é, na realidade, um conjunto […]. Há variantes nessa linha de desenvolvimento, mas as teorias mais conhecidas são as de Von Neumann-Bernays-Gödel e Kelley-Morse. Outra resposta à mesma pergunta é ‘todas, se tomarmos certas precauções’. Essa é a característica da teoria de conjuntos desenvolvida por E. Zermelo e A. Fraenkel […]. (MIRAGLIA, 1991, p. 13).
21
A primeira tentativa de axiomatizar a Teoria dos Conjuntos após o descobrimento
e publicação dos paradoxos foi realizada em 1908 e se deve a Ernst Zermelo, em seu artigo
Untersuchungen über die Grundlagen der Mengenlehre (Estudos sobre os Fundamentos da
Teoria dos Conjuntos), publicado em 1908, na 65ª edição do Mathematische Annalen
(EBBINGHAUS & PECKHAUS, 2007).
É interessante frisar os aspectos marcantes que permeavam a atmosfera
matemática do início do século XX, pois eles nos auxiliam a vislumbrar pretextos implícitos
que levaram ao primeiro sistema axiomático da Teoria dos Conjuntos.
Como vemos em Bourbaki (1968), a História nos conta ser dos antigos gregos a
criação do método axiomático, remontando aos axiomas expostos por Euclides em “Os
Elementos”. Tal método consiste em assumir afirmações verdadeiras, os axiomas, e deduzir
delas a validade ou falsidade das proposições matemáticas.
O desenvolvimento das Geometrias Não Euclidianas, ainda no século XIX,
desencadeou uma nova análise sobre o papel dos axiomas na fundação das teorias
matemáticas. O trabalho de David Hilbert, que em seu livro Grundlagen der Geometrie
(Fundamentos da Geometria, publicado em 1899) formalizou a Geometria Euclidiana sobre
uma série de axiomas, foi o marco inicial do moderno método axiomático e estabeleceu a
posição formalista no contexto da filosofia matemática, sobre a qual discutimos brevemente.
Ao final do século XIX e início do século XX três “escolas de pensamento” se
distinguiram como as principais na filosofia matemática: os logicistas, os intuicionistas e os
formalistas. Uma discussão aprofundada sobre filosofia matemática foge ao escopo deste
trabalho, mas a fim de esclarecimento, resumidamente: os logicistas defendem que as
verdades Matemáticas são verdades da Lógica, considerando, grosso modo, a Matemática
como um subconjunto da Lógica; os intuicionistas pregam que os objetos matemáticos são
criações da mente humana que não podem ser expressos de maneira adequada por qualquer
tipo de linguagem e, além disso, a veracidade de alguma proposição prova-se apenas com sua
construção; os formalistas defendem a tomada de axiomas de natureza arbitrária, donde se
deriva a validade das proposições matemáticas por relações pré-estabelecidas que obedeçam
às leis da Lógica — notemos que, neste caso, a Lógica é usada como ferramenta matemática e
não como base desta, ao contrário do caso logicista (FRAENKEL, BAR-HILLEL, & LEVY,
1973).
O papel de destaque desempenhado por Hilbert no cenário da matemática mundial
certamente favoreceu a difusão de suas ideias e ideais, dentre os quais se destaca a proposta
22
de solucionar seus 23 problemas14, sendo que o primeiro deles se referia à Hipótese do
Continuum de Cantor. Ao propor a comprovação ou refutação desta proposição, Hilbert
adicionou outro questionamento, a respeito da possibilidade da boa ordenação do continuum.
Foi a este último problema que Zermelo respondeu, afirmativamente, em 1904, na 59ª edição
do Mathematische Annalen, com seu Teorema da Boa Ordenação e o debatido Axioma da
Escolha, base de sua demonstração (EBBINGHAUS & PECKHAUS, 2007).
As críticas da comunidade matemática ao Teorema da Boa Ordenação pousaram
rápida e precisamente sobre o Axioma da Escolha e seu caráter não construtivo que, numa de
suas muitas formulações, postula que “para qualquer conjunto 𝐴 existe uma função 𝑓 tal que,
para qualquer subconjunto não vazio 𝐵 de 𝐴, 𝑓(𝐵) ∈ 𝐵” (SUPPES, 1972, p. 239, tradução
nossa). O caráter “não construtivo” que fora alvo das críticas reside na ausência de uma
caracterização ou de um método sobre como conseguir tal função 𝑓, haja vista que o Axioma
da Escolha apenas postula sua existência.
No entanto, como Zermelo afirmou nos anos seguintes ao defender-se das críticas,
tal axioma fora usado tacitamente por outros matemáticos em diversas situações anteriores, de
modo que sua única inovação fora enunciar este princípio que até então fora tomado como
intuitivo. Um exemplo clássico é a prova de que todo conjunto infinito contém um
subconjunto infinito enumerável, dada por Dedekind anos antes. Assim, após muitos debates e
críticas, Ernst Zermelo formalizou seu sistema axiomático da Teoria dos Conjuntos, motivado
em parte pelo surgimento dos paradoxos na Teoria dos Conjuntos no início do século XX,
embora, como frisam Ebbinghaus & Peckhaus (2007), ele também possa ter objetivado criar
um sistema no qual o seu Axioma da Escolha fosse essencial.
Originalmente, Zermelo propôs oito axiomas que, segundo seus intuitos, deveriam
ser fortes o suficiente para deduzir toda a teoria criada por Cantor e Dedekind, obviamente
excetuando-se as antinomias descobertas no início do século. Além do Axioma da Escolha,
sua grande inovação foi aplicar uma restrição ao Axioma da Abstração, obtendo o que ele
chamou de Axioma da Separação (Axiom der Aussonderung), com o qual ele evitou
paradoxos lógicos como o de Russell (EBBINGHAUS & PECKHAUS, 2007).
14 Os “23 Problemas de Hilbert”, como ficaram conhecidos, foram propostos por David Hilbert, em Paris, no ano de 1900, durante o Segundo Congresso Internacional de Matemática. Tais problemas abordam questões importantes sobre os fundamentos da Matemática, como a Hipótese do Continuum e a consistência dos axiomas da Aritmética, Geometria, Física, Teoria dos Números e Topologia (BOYER, 1996).
23
Zermelo formulou o Axioma-Esquema da Separação em termos de questões ou
sentenças que têm a propriedade de ser “definida”. Ele dizia que uma sentença é definida se
for possível de um modo não arbitrário decidir se um objeto satisfaz ou não a sentença. Algo
consideravelmente vago e que, de certa forma, ainda deixava brechas suficientes para
paradoxos semânticos (SUPPES, 1972).
Um exemplo trivial de tais “paradoxos semânticos” pode ser dado pelo paradoxo
de Grelling-Nelson: chamemos de heterológico qualquer adjetivo, em português, que não
possua a característica que ele denota. Por exemplo, “monossílaba” é uma palavra polissílaba
e “francês” é uma palavra portuguesa, logo “monossílaba” e “francês” são adjetivos
heterológicos, ao passo que adjetivos como “polissílabo” e “português” não são. Pelo critério
de Zermelo exposto anteriormente, a propriedade “ser heterológico” está bem definida.
Contudo, decorre da definição desta propriedade que “heterológico” é heterológico se, e
somente se, não for heterológico, uma contradição. Isso evidencia a necessidade de se
aprimorar o conceito de boa definição a fim de evitar paradoxos (FRAENKEL, BAR-
HILLEL, & LEVY, 1973).
Segundo Suppes (1972), o primeiro esclarecimento significativo da noção do que
vem a ser a propriedade de ser “bem definido”, ou do que vem a ser uma “sentença bem
definida”, foi dado por Thoralf Skolem em 1922. Ele restringiu a linguagem matemática
apenas ao uso de símbolos, diminuindo significativamente o alfabeto com a qual as sentenças
são exprimíveis, e caracterizou-as como definidas apenas quando satisfazem sua definição de
fórmula em Lógica de Primeira Ordem. Uma vez que os paradoxos semânticos existentes em
expressões de linguagem referem-se a outras expressões na própria linguagem, podemos
inferir que qualquer linguagem com meios ilimitados de expressão é necessariamente
inconsistente15. Dessa forma ao “empobrecer” a linguagem objeto16 utilizada na Teoria dos
Conjuntos, Skolem impediu a autorreferência e, consequentemente encerrou os paradoxos
semânticos.
Ainda assim, os axiomas de Zermelo de 1908 não eram suficientes para abranger
satisfatoriamente a teoria dos números ordinais, de modo que foi necessária a concepção de
um axioma mais forte: o Axioma da Substituição, que fora formulado independentemente por
15 A esse respeito é curioso citar uma frase creditada ao matemático e lógico Kurt Gödel: “Quanto mais reflito sobre a linguagem, tanto mais me admiro que as pessoas consigam se entender umas as outras.” (apud. ÁVILA, 2000, p. 12).
16 Ver Capítulo 2, Seção 2.1.
24
Abraham Fraenkel e Thoralf Skolem em 1922. Com a adição do Axioma da Fundação, que
basicamente impede situações como 𝑆 ∈ 𝑆, feita por Zermelo em 1930, o sistema de axiomas
de Zermelo, Fraenkel e Skolem tomou praticamente a forma que conhecemos hoje, que é
conhecido como Sistema Axiomático de Zermelo-Fraenkel-Choice17, ou simplesmente ZFC
(SUPPES, 1972).
Atualmente, ZF designa os axiomas de Zermelo-Fraenkel de 1930 excetuando-se
o Axioma da Escolha, mas incluindo o Axioma do Infinito, haja vista que àquela altura
Zermelo o considerava como um “princípio lógico” (EBBINGHAUS & PECKHAUS, 2007).
ZFC representa a adição do Axioma da Escolha (Axiom of Choice, em inglês) a este último
grupo de postulados atuais, daí o nome Zermelo-Fraenkel-Choice. No próximo capítulo,
postularemos os axiomas de ZFC.
Uma sistematização bem mais recente para a Teoria dos Conjuntos foi
desenvolvida pelo professor Lotfi Zadeh na década de 1960, a qual não considera apenas
situações de verdade ou falsidade absoluta. Na Teoria dos Conjuntos Difusos (Fuzzy Set
Theory), para um conjunto 𝑋 qualquer, consideramos uma função de pertinência 𝜇𝑋 :𝑋 ⟶
[0, 1], de modo que 𝜇𝑋(𝑥) indica a possibilidade de 𝑥 pertencer a 𝑋. Uma exposição mais
detalhada e axiomática dos Conjuntos Fuzzy é feita por Dadam & Hein (2009).
Apesar de ZFC ser o sistema de axiomas mais utilizado como fundação para a
Teoria dos Conjuntos, devemos ressaltar a existência de outros sistemas de axiomas bem
sucedidos, apesar de não nos aprofundarmos no estudo teórico de tais sistemas. Na mesma
posição formalista, temos os sistemas de Von Neumann-Bernays-Gödel e de Morse-Kelley,
abreviadamente chamados de NBG e MK, respectivamente, cuja principal diferença com ZFC
reside na existência de classes próprias e de uma “classe Universo” cujos membros são todos
os conjuntos.
Em ambos os casos, todos os conjuntos são classes, mas a recíproca é falsa. Nelas,
𝑥 é um conjunto se, e somente se, existe 𝑦 tal que 𝑥 ∈ 𝑦; se, porém, não houver tal 𝑦, então 𝑥
é uma classe própria. Nos dois sistemas, os conjuntos “propriamente ditos” satisfazem os
axiomas usais de ZF. No sistema NBG existe o Axioma-Esquema da Abstração das Classes
17 Alguns autores defendem que, por rigor histórico, deveríamos chamá-lo de sistema axiomático Zermelo-Skolem-Fraenkel, em alusão às grandes contribuições de Thoralf Skolem para a formalização dos axiomas (SUPPES, 1972).
25
— “o mesmo” que na teoria Ingênua dos Conjuntos leva ao Paradoxo de Russell —, como
segue abaixo:
(∃𝑋)(∀𝑦)�𝑦 ∈ 𝑋 ⟺ 𝜙(𝑦)�,
onde 𝜙 pode ter outros conjuntos e classes como variáveis livres, mas as variáveis ligadas de
𝜙 são apenas conjuntos, pois, caso houvesse uma classe própria 𝑦′ ligada a 𝜙, então 𝑦′ ∈ 𝑋 e
daí 𝑦′ não seria uma classe própria. A proximidade entre NBG e ZF é tão grande que o
primeiro diz-se ser uma extensão conservativa do segundo: se 𝜓 é uma sentença cujas
variáveis são apenas conjuntos, 𝜓 pode ser provada em NBG se, e somente se, 𝜓 pode ser
provada em ZF. Por outro lado, NBG é finitamente axiomatizável18, o que não ocorre em ZF.
Já o sistema MK pode ser considerado mais forte que NBG por permitir que classes próprias
“apareçam” em 𝜙, embora não seja uma extensão conservativa de ZF e também não possa ser
finitamente axiomatizável.
Contudo, nenhuma dessas três teorias (ZF, NBG e MK) pode reivindicar o título
de “a teoria correta”, conforme ressaltado por Kunen (1980), pois todas elas possuem
limitações em alguma instância: ZF não admite classes próprias, como a classe de todos os
conjuntos; NBG admite classes próprias, mas seu uso é restringido em 𝜙 no axioma da
abstração das classes; MK não possui a limitação de NBG no axioma da abstração, no
entanto, certas relações sobre classes próprias não podem ser definidas de maneira formal.
Ainda assim, essas três teorias estão todas fundadas nos mesmos conceitos básicos, de modo
que a maioria das proposições demonstrações em ZF pode ser também demonstrada nas
outras duas teorias, dadas as devidas modificações.
A escola logicista também se preocupou com a reformulação da Teoria dos
Conjuntos, mas, seguindo sua própria filosofia, tal processo partiu dos fundamentos da
Lógica. A teoria dos tipos, desenvolvida por Bertrand Russell e Alfred Whitehead teve
basicamente o intuito de evitar os chamados ciclos viciosos, isto é, situações em que temos
um conjunto 𝑥 pertencendo a si mesmo, pois de tais ciclos surgem os principais paradoxos.
Para tanto, eles formalizaram de maneira profunda o conceito de hierarquia de conjuntos,
criando uma teoria intrincada e de difícil compreensão, geralmente preferida por lógicos e não
por matemáticos (BOURBAKI, 1968).
18 Isto é, os axiomas de NBG decorrem de um número finito de fórmulas atômicas — fórmulas atômicas são as sentenças básicas da linguagem formal, que definiremos no Capítulo 2 (KUNEN, 1980).
26
Fossem formalistas ou logicistas, a maioria dos matemáticos do início do século
XX recusou-se a abandonar a Teoria dos Conjuntos ao se depararem com os paradoxos, dada
a sua grande capacidade de generalização e abrangência à praticamente toda a Matemática: da
construção dos números à conceituação formal de 𝑛-úplas ordenadas e consequentemente às
funções reais, analíticas, etc. Certamente, o apreço da comunidade matemática para com a
Teoria dos Conjuntos é evidenciado por David Hilbert que, apesar de superestimar o papel de
Cantor como pai da Teoria dos Conjuntos, eternizou a expressão: “[…] Ninguém nos
expulsará do paraíso criado por Cantor.” (HILBERT, 1926 apud FERREIRÓS, 2007, p. 365,
tradução nossa).
27
Capítulo 2 — Desenvolvimentos Iniciais em ZFC
Neste capítulo, desenvolvemos os conceitos básicos da Teoria dos Conjuntos
segundo o sistema axiomático Zermelo-Fraenkel-Choice, isto é, a partir dos axiomas de ZFC.
Definimos e provamos as principais propriedades das relações entre conjuntos: inclusão,
interseção, união, potência e produto cartesiano. Tal desenvolvimento deve embasar o estudo
subsequente realizado nos capítulos seguintes.
2.1. Preliminares: Alfabeto e Definições
Os axiomas de ZFC são expressos numa “linguagem objeto” limitada a fim de
evitar inconsistências semânticas que permitam derivar paradoxos na teoria. Em nosso
contexto, a linguagem objeto é a linguagem na qual falamos sobre conjuntos, enquanto a
metalinguagem é a linguagem na qual discutimos a linguagem objeto. Em outras palavras, a
linguagem objeto é a linguagem formal e simbólica descrita a seguir, enquanto a
metalinguagem é, neste contexto, o português que será utilizado para descrever exatamente o
que se pretende com a simbologia utilizada. Salvo menção contrária, nesta seção baseamo-nos
em Suppes (1972).
Classificamos os símbolos utilizados na linguagem objeto — o “Alfabeto” — em
cinco grupos: (i) constantes, (ii) variáveis, (iii) conectivos lógicos, (iv) quantificadores e (v)
símbolos de pontuação, onde:
(i) As duas constantes primitivas de linguagem são o símbolo da relação de
pertinência “∈” e o predicado constante “=”, símbolo da identidade;
(ii) As variáveis genéricas são as letras “𝑥”, “𝑦”, “𝑧”,…, com ou sem
subscritos ou sobrescritos, maiúsculas ou minúsculas;
28
(iii) Os conectivos lógicos usuais: ∧, ∨, ⟹, ⟺, ¬ que indicam,
respectivamente, conjunção, disjunção, implicação, equivalência e negação, de modo a
obedecerem as leis do cálculo proposicional de primeira ordem1;
(iv) Os quantificadores existenciais (∃) e (∃!), e universal (∀);
(v) Parênteses esquerdo “(” e direito “)” são os únicos símbolos de pontuação.
Expressões de linguagem objeto são sequências finitas das cinco classes de
símbolos de linguagem definidas acima. Algumas destas expressões são chamadas de
fórmulas primitivas, devido à sua simplicidade estrutural, o que motiva a definição seguinte.
Definição 2.1. Uma fórmula atômica primitiva é uma expressão da forma (𝑣 ∈
𝑤), ou da forma (𝑣 = 𝑤), onde 𝑣 e 𝑤 são ambas variáveis genéricas.
Tais fórmulas denominam-se atômicas, pois todas as fórmulas da teoria devem ser
expressas por meio delas, isto é, por meio de combinações de fórmulas atômicas, cujas regras
gramaticais de composição (ou regras gramaticais do alfabeto), estabelecemos abaixo.
(i) Toda fórmula atômica primitiva é uma fórmula primitiva;
(ii) Se 𝑃 é uma fórmula primitiva, então ¬𝑃 é uma fórmula primitiva;
(iii) Se 𝑃 e 𝑄 são fórmulas primitivas, então (𝑃 ∧ 𝑄),(𝑃 ∨ 𝑄),(𝑃 ⟹ 𝑄) e
(𝑃⟺ 𝑄) são fórmulas primitivas;
(iv) Se 𝑃 é uma fórmula primitiva e 𝑣 é qualquer variável genérica, então
(∀𝑣)𝑃, (∃𝑣)𝑃 e (∃!𝑣)𝑃 são fórmulas primitivas2;
(v) Nenhuma expressão de linguagem objeto é uma fórmula primitiva a menos
que siga as regras estabelecidas acima.
Dessa forma, como (𝑣 ∈ 𝑤) e (𝑎 = 𝑏) são fórmulas atômicas primitivas, elas
próprias são fórmulas primitivas, bem como (𝑣 ∈ 𝑤) ∨ (𝑎 = 𝑏), (𝑣 ∈ 𝑤) ⟹ (𝑎 = 𝑏) e
¬(𝑎 = 𝑏).
Todos os axiomas e teoremas da Teoria dos Conjuntos que estabeleceremos
podem ser escritos como fórmulas primitivas de linguagem objeto. Aliás, nossa linguagem
objeto oficial deve consistir unicamente de fórmulas primitivas. No entanto, para fins de
1 Ver Apêndice A. 2 As expressões (∀𝑣)𝑃, (∃𝑣)𝑃 e (∃! 𝑣)𝑃 se leem respectivamente como “para todo 𝑣, tal que 𝑃”,
“existe 𝑣 tal que 𝑃” e “existe um único 𝑣 tal que 𝑃”.
29
trabalho, será comum e conveniente introduzir “por definição” consideráveis
notações/simbologias adicionais e, eventualmente, utilizar a metalinguagem para enunciar e
demonstrar determinados teoremas.
As expressões construídas com símbolos não presentes originalmente no alfabeto
serão denotadas simplesmente por fórmulas; notemos que tais fórmulas não são primitivas
exatamente por serem expressas por meio de símbolos exteriores ao alfabeto. A fim de definir
formalmente tais expressões na teoria, esperamos que nossas definições obedeçam a alguns
critérios.
Critério da Eliminabilidade. Uma fórmula 𝑃 introduzindo um novo símbolo
satisfaz o critério da eliminabilidade se, e somente se, sempre que 𝑄1 é uma fórmula na qual o
novo símbolo ocorre, então existe uma fórmula primitiva 𝑄2 , tal que 𝑃 ⟹ (𝑄1 ⟺ 𝑄2) é
derivável dos axiomas.
Critério da Não Criatividade. Uma fórmula 𝑃 introduzindo um novo símbolo
satisfaz o critério da não criatividade se, e somente se, não há fórmula primitiva 𝑄 tal que
𝑃 ⟹ 𝑄 é derivável dos axiomas, mas 𝑄 não é.
Vejamos o significado de tais critérios. O primeiro estabelece que o novo símbolo
que acrescentamos ao alfabeto precisa ser exprimível no próprio alfabeto. Por exemplo, a fim
de facilitar as notações futuras, adotamos a seguinte definição.
Definição 2.2.
(i) 𝑥 ∉ 𝑦 ⟺ ¬(𝑥 ∈ 𝑦);
(ii) 𝑥 ≠ 𝑦⟺ ¬(𝑥 = 𝑦).
Assim, por exemplo, (i) introduz o símbolo “∉” para indicar a “não pertinência”.
Qualquer fórmula que o utilize, digamos √2 ∉ ℚ, equivale a uma fórmula que não o utiliza,
isto é, ¬�√2 ∈ ℚ�. Neste caso, (𝑥 ∈ 𝑦) é uma fórmula atômica primitiva, ¬(𝑥 ∈ 𝑦) é uma
fórmula primitiva e 𝑥 ∉ 𝑦 é uma fórmula.
O segundo critério tem por objetivo evitar que definições permitam derivar
fórmulas primitivas que não possam ser derivadas dos axiomas da teoria.
Antes de prosseguirmos, precisamos distinguir o que são variáveis livres e
ligadas. Uma variável é uma variável ligada numa fórmula 𝜑 se ela estiver no interior do
30
escopo de um quantificador; ela é dita uma variável livre se não for ligada. Por exemplo, na
fórmula (∃𝑥)(𝑥 < 𝑦), “𝑥” é uma variável ligada, enquanto “𝑦” é uma variável livre. Uma
fórmula 𝜑 que possui variáveis livres é uma fórmula aberta, caso contrário, 𝜑 é uma fórmula
fechada.
Denotamos uma fórmula 𝜑 em que 𝑥 ocorre como variável livre por 𝜑(𝑥). Tal
fórmula é dita uma condição em 𝑥. Se existir em 𝜑 uma variável livre 𝑦 distinta de 𝑥,
simbolicamente escrevemos 𝜑(𝑥, 𝑦) e dizemos que 𝜑 é uma condição em 𝑥 e 𝑦 ou ainda que
𝜑 é uma condição em 𝑥 com parâmetro 𝑦 (FRAENKEL, BAR-HILLEL, & LEVY, 1973).
Se 𝑧 for tal que 𝜑(𝑥) seja falso quando 𝑥 = 𝑧, escrevemos ¬𝜑(𝑧), caso contrário,
escrevemos apenas 𝜑(𝑧) para indicar que (𝜑(𝑥)∧ 𝑥 = 𝑧) é verdadeiro3 e dizemos que 𝑧
satisfaz a condição 𝜑 ou que 𝜑 é uma propriedade de 𝑧. Assim, por exemplo, se 𝜑(𝑥) ≡ 𝑥 +
3 < 4, temos 𝜑(0) e ¬𝜑(2).
Além dos critérios supracitados, devemos estabelecer regras para as definições
que introduzem novos símbolos por meio de equivalências ou identidades.
Critério da definição por equivalência. Uma equivalência 𝑃 introduzindo um
novo símbolo de operação 𝑛-ária 𝑂 é uma definição adequada se, e somente se, 𝑃 é da forma:
𝑂(𝑣1,…, 𝑣𝑛) = 𝑤⟺ 𝑄���������������𝑃
,
de tal maneira que as restrições a seguir sejam satisfeitas:
(i) 𝑣1,…, 𝑣𝑛, 𝑤 são variáveis distintas;
(ii) As únicas variáveis livres de 𝑄 são 𝑣1,…, 𝑣𝑛, 𝑤;
(iii) 𝑄 é uma fórmula na qual as únicas constantes não lógicas4 são as
primitivas ou símbolos previamente definidos da Teoria dos Conjuntos;
(iv) A fórmula (∃!𝑤)𝑄 é derivável dos axiomas e definições precedentes.
Critério da definição por identidade: Uma identidade 𝑃 introduzindo um novo
símbolo de operação 𝑛-ária 𝑂 é uma definição adequada se, e somente se, 𝑃 é da forma:
3 O contexto geralmente deixa claro quando “𝜑(𝑥) ” se refere à “condição em 𝑥” e quando “𝜑(𝑥)” se refere ao valor lógico de 𝜑 com a variável 𝑥 .
4 As únicas constantes lógicas são os conectivos lógicos. As demais constantes são não lógicas.
31
𝑂(𝑣1,…, 𝑣𝑛) = 𝜏(𝑣1,…, 𝑣𝑛)�������������������𝑃
,
de tal maneira que as restrições a seguir sejam satisfeitas:
(i) 𝑣1,…, 𝑣𝑛 são variáveis distintas;
(ii) O termo 𝜏 não possui variáveis livres que não sejam 𝑣1,…, 𝑣𝑛;
(iii) As únicas constantes não lógicas no termo 𝜏 são símbolos primitivos ou
símbolos previamente definidos na Teoria dos Conjuntos.
Não definimos neste trabalho o que é o termo 𝜏(𝑣1,…, 𝑣𝑛), mas esperamos que os
exemplos a seguir possibilitem um entendimento básico sobre como eles são. O termo
𝜏(𝑣1, 𝑣2) ≡ 𝑣1 ∩ 𝑣2 é tal que 𝜏(𝑥, 𝑦) = 𝑥 ∩ 𝑦, o termo 𝜏(𝑣1, 𝑣2) ≡ �{𝑣1}, {𝑣1, 𝑣2}� é tal que
𝜏(𝑥, 𝑦) = �{𝑥}, {𝑥, 𝑦}�. Grosso modo, 𝜏 é uma regra que nos fornece uma lista de operações
definidas na Teoria dos Conjuntos para se realizarem com conjuntos quaisquer.
A importância de (iv) no Critério da Equivalência resume-se na restrição de que
uma operação deve fornecer um único objeto. Por exemplo, consideremos a pseudo-operação
𝑂, onde:
(1) 𝑂(𝑥, 𝑦) = 𝑧 ⟺ 𝑥 < 𝑧 ∧ 𝑦 < 𝑧.
Obviamente, (1) viola (iv), e tal violação implica uma contradição lógica. É claro
que 1 < 3 e 2 < 3, logo, pode-se dizer, por (1), que:
(2) 𝑂(1, 2) = 3.
Contudo, também é evidente que 1 < 4 e 2 < 4, donde, por (1), concluímos que:
(3) 𝑂(1, 2) = 4.
Logo, de (2) e (3), vem que 3 = 4, absurdo.
Contudo, nem todas as definições obedecem simultaneamente aos critérios
estabelecidos acima, haja vista que são dadas, em sua maioria, sob a forma de condicionais.
Neste caso, também há regras bem estabelecidas.
Critério da definição condicional. Uma implicação 𝑃 introduzindo um novo
símbolo operacional 𝑂 é uma definição condicional se, e somente se, 𝑃 é da forma:
32
𝑄 ⟹ [𝑂(𝑣1,…, 𝑣𝑛) = 𝑤 ⟺ 𝑅]���������������������𝑃
,
de tal maneira que as restrições a seguir sejam satisfeitas:
(i) A variável 𝑤 não é livre em 𝑄;
(ii) As variáveis 𝑣1,…, 𝑣𝑛, 𝑤 são distintas;
(iii) 𝑅 não possui variáveis livres além de 𝑣1,…, 𝑣𝑛, 𝑤;
(iv) 𝑄 e 𝑅 são fórmulas nas quais as únicas constantes não lógicas são os
símbolos primitivos ou símbolos previamente definidos na Teoria dos Conjuntos;
(v) A fórmula 𝑄 ⟹ (∃!𝑤)𝑅 é derivável dos axiomas e definições
precedentes.
Uma vez estabelecidos tais critérios, podemos iniciar o desenvolvimento
axiomático da Teoria dos Conjuntos.
2.2. O Sistema de Axiomas Zermelo-Fraenkel-Choice
Nesta seção postulamos os nove axiomas de Zermelo-Fraenkel-Choice (ZFC) e
discutimos brevemente cada um deles. Também provamos a existência e a unicidade de um
conjunto que não possui elementos e a inexistência de um conjunto ao qual tudo pertença.
Além disso, definimos alguns conceitos que contribuem para uma melhor compreensão dos
demais axiomas.
Originalmente desenvolvido por Ernst Zermelo, Abraham Fraenkel e Thoralf
Skolem, os axiomas de ZFC admitem diversas formulações. Em alguma delas, por exemplo,
postula-se a existência de um conjunto que não possua elementos, o Axioma do Conjunto
Vazio — tal abordagem é feita por Miraglia (1991) e Hrbacek & Jech (1999). Noutras,
postulam-se apenas sete axiomas, pois deles é possível derivar os axiomas da Separação e do
Par como teoremas — como encontramos em Levy (1979). Há ainda formulações que
permitem a existência de diversos indivíduos, isto é, objetos que não possuem elementos, mas
que podem pertencer a algum conjunto, denominados por Zermelo de urelementos — Suppes
(1972) trata de tais situações.
33
Neste trabalho, adotamos os nove axiomas propostos por Kunen (1980) e Jech
(2003), os quais garantem exclusivamente a existência de conjuntos, isto é, os axiomas
postulados asseguram a existência de elementos, que denominados conjuntos, famílias ou
coleções. Neste sentido, conjunto passa a ser tudo aquilo cuja existência é assegurada pelos
axiomas. Além disso, seguindo Levy (1979), provamos posteriormente que dois dos axiomas
são, de fato, teoremas em ZFC.
Axioma da Existência:
(A0) (∃𝑥)(𝑥 = 𝑥).
Este axioma não faz parte de ZFC. Postulamo-lo apenas para frisar que o universo
do discurso5 não é vazio, isto é, existe pelo menos um conjunto. Como frisado por Levy
(1979, p. 20), Jech (2003, p. 8) e Kunen (1980, p. 10), tal axioma é desnecessário, uma vez
que a validade de (∃𝑥)(𝑥 = 𝑥) decorre das leis da Lógica. Além disso, devido ao Axioma do
Infinito ((A6), página 39), que garante a existência de um conjunto infinito, temos assegurada
a não vacuidade do universo do discurso.
Numa abordagem ligeiramente distinta, Suppes (1972) assume o símbolo “0”
como uma constante do alfabeto, e define que 𝑦 é um conjunto se, e somente se, existe 𝑥 tal
que 𝑥 ∈ 𝑦 ou 𝑦 = 0. Neste caso, 0 é apenas uma das três constantes do alfabeto, um símbolo
sem qualquer significado específico, mas cuja existência é assumida a princípio. Em certo
sentido, tal definição assemelha-se a (A0), pois garante a existência de um conjunto, no
entanto, especifica que tal conjunto é exatamente 0. A utilidade em adotar a existência de um
indivíduo é justificada, pois
[…] Quando definimos a interseção de dois conjuntos 𝑟 e 𝑠, queremos que a interseção esteja definida mesmo no caso em que 𝑟 e 𝑠 não possuam membros em comum. Neste caso, a interseção 𝑡 não deve possuir membros, isto é, deve ser um indivíduo. Há muitos outros exemplos onde a existência de um indivíduo torna as coisas mais simples. As mesmas razões práticas que justificam a existência de tal elemento também sugerem que usemos sempre o mesmo elemento em tais situações […] e nos referíramos a este elemento como conjunto. Portanto, nós devemos chamar tal elemento de conjunto nulo [null-set] e nossos conjuntos são, a partir de
5 Ou domínio do discurso, ao qual pertencem os objetos tratados pelos axiomas. Não nos aprofundamos na questão sobre o que é o domínio do discurso, pois tal discussão foge ao escopo deste trabalho. Para tratar de tal questão, sugerimos Kunen (1980) e Fraenkel, Bar Hillel & Levy (1973).
34
agora, os elementos que possuem algum membro, bem como o conjunto nulo. (FRAENKEL, BAR-HILLEL, & LEVY, 1973, p. 24, tradução nossa).
Contudo, não assumimos a definição de Suppes por dois motivos. O primeiro se
deve ao fato de tal definição ser mais útil quando se pretende que existam indivíduos
distintos, o que não almejamos; em segundo, a existência de um único indivíduo é o suficiente
para a nossa teoria, e tal existência, bem com sua unicidade, pode ser derivada de (A0) e dos
dois próximos axiomas.
Axioma da Extensão:
(A1) (∀𝑥)(∀𝑦)(∀𝑧)�(𝑧 ∈ 𝑥 ⟺ 𝑧 ∈ 𝑦) ⟹𝑦 = 𝑥�.
Axioma (Esquema) da Separação:
(A2) (∀𝑥)(∃𝑦)(∀𝑧)�𝑧 ∈ 𝑦⟺ 𝑧 ∈ 𝑥 ∧ 𝜑(𝑧)�.
O primeiro axioma (A1) estabelece um critério que nos permite distinguir
conjuntos. Convencionemos que se 𝑧 ∈ 𝑦, então 𝑧 é chamado de elemento ou membro de 𝑦.
Dada tal convenção, decorre que (A1) afirma que se todo elemento de um conjunto 𝑥 é
também elemento de 𝑦 e todo elemento de 𝑦 for elemento de 𝑥, então os conjuntos 𝑥 e 𝑦 são
iguais. Portanto, o que caracteriza um conjunto são seus elementos. Nas palavras de Halmos
(1960, p. 2, tradução nossa), “o axioma da extensão não é apenas uma propriedade lógica
necessária, mas sim uma afirmação não trivial sobre pertinência”.
O segundo axioma (A2) é, na verdade, um esquema de axiomas, pois temos um
axioma para cada condição 𝜑 em 𝑧, possivelmente com vários parâmetros. É necessário frisar
que em (A2), 𝑦 não é uma variável livre em 𝜑. Tal restrição tem por objetivo não considerar
verdadeiras sentenças contraditórias, como
(∀𝑥)(∃𝑦)(∀𝑧)(𝑧 ∈ 𝑦 ⟺ 𝑧 ∈ 𝑥 ∧ 𝑧 ∉ 𝑦),
onde 𝜑(𝑧) ≡ 𝑧 ∉ 𝑦, o que nos leva, obviamente, a uma contradição.
Em palavras, (A2) afirma que para qualquer conjunto 𝑥 e para qualquer fórmula
𝜑, existe um conjunto 𝑦 (que não é uma variável livre em 𝜑), formado por todos os elementos
de 𝑥 que tornam a fórmula 𝜑 verdadeira. Notemos ainda que, conforme citado no capítulo
anterior, o Axioma da Separação é uma “restrição” do Axioma da Abstração, de tal maneira
que não é possível derivar o paradoxo de Russell. A grande distinção entre eles está no fato de
35
que (A2) é capaz de formar um conjunto cujos elementos satisfaçam uma condição arbitrária
desde que seja dado, a priori, um conjunto do qual possamos “separar” os elementos que
formarão o conjunto que pretendemos construir. Este conjunto dado a priori é qualquer
elemento cuja existência é garantida pelos axiomas de ZFC. Tal limitação impõe, entre outras
coisas, que não existe um conjunto universo em ZFC, conforme provamos a seguir.
Teorema 2.1. ¬(∃𝑦)(∀𝑥)(𝑥 ∈ 𝑦).
Demonstração.
Suponha, por absurdo, que seja verdadeira a sentença
(∃𝑦)(∀𝑥)(𝑥 ∈ 𝑦).
Decorre daí que, para qualquer 𝑥, deve-se ter 𝑥 ∈ 𝑦, isto é,
�†1� (∃𝑥)(𝑥 = 𝑥) ⟹ (𝑥 ∈ 𝑦).
Tomando 𝜑(𝑥) ≡ 𝑥 ∉ 𝑥, o Axioma da Separação nos garante que
(∃𝑧)(∀𝑥)(𝑥 ∈ 𝑧 ⟺ 𝑥 ∈ 𝑦 ∧ 𝑥 ∉ 𝑥),
e fazendo 𝑥 = 𝑧, inferimos
�†2� (∃𝑧)(𝑧 ∈ 𝑧 ⟺ 𝑧 ∈ 𝑦 ∧ 𝑧 ∉ 𝑧).
Como por �†1� é verdadeiro que 𝑧 ∈ 𝑦, deduzimos de �†2� que 𝑧 ∈ 𝑧 ⟺ 𝑧 ∉ 𝑧 ,
donde obtemos 𝑧 ∈ 𝑧 ∧ 𝑧 ∉ 𝑧, uma contradição. Portanto, ¬(∃𝑦)(∀𝑥)(𝑥 ∈ 𝑦). Q.E.D.
Notemos que o paradoxo de Russell não pode ser obtido tomando-se um conjunto
qualquer 𝑦. Com efeito, considerando a mesma propriedade 𝜑(𝑥) ≡ 𝑥 ∉ 𝑥 e um conjunto
genérico 𝑦, pelo Axioma da Separação temos
[†] (∃𝑧)(∀𝑥)(𝑥 ∈ 𝑧 ⟺ 𝑥 ∈ 𝑦 ∧ 𝑥 ∉ 𝑥).
Tomando 𝑥 = 𝑧 em [†], segue que
[††] (∃𝑧)(𝑧 ∈ 𝑧 ⟺ 𝑧 ∈ 𝑦 ∧𝑧 ∉ 𝑧),
o que não é contraditório. De fato, basta observarmos que como a sentença em [††] é uma
equivalência assegurada por (A2), é necessariamente verdadeiro que
36
(𝑧 ∈ 𝑧 ⟹ 𝑧 ∈ 𝑦 ∧ 𝑧 ∉ 𝑧) ∧ (𝑧 ∈ 𝑦 ∧ 𝑧 ∉ 𝑧 ⟹ 𝑧 ∈ 𝑧).
Se 𝑧 ∈ 𝑧 teríamos 𝑧 ∈ 𝑦 ∧ 𝑧 ∉ 𝑧 , o que é uma contradição, logo 𝑧 ∉ 𝑧; por outro
lado, se 𝑧 ∈ 𝑦 ∧ 𝑧 ∉ 𝑧 fosse verdadeiro, teríamos 𝑧 ∈ 𝑧, contrariando a conclusão anterior, daí
𝑧 ∈ 𝑦 ∧ 𝑧 ∉ 𝑧 tem de ser falso, e para tanto, 𝑧 ∉ 𝑦. Dessa forma, tanto 𝑧 ∈ 𝑧 quanto 𝑧 ∈ 𝑦 ∧
𝑧 ∉ 𝑧 são sentenças falsas, o que torna a equivalência [††] verdadeira6. Assim, vemos que a
existência de um conjunto universo 𝑦 em ZFC possibilita o paradoxo de Russell por implicar
a falsidade de 𝑧 ∉ 𝑦, para todo 𝑧.
Provamos a seguir a existência e a unicidade de um importante indivíduo em ZFC.
Teorema 2.2. (∃! 𝑦)(∀𝑥)(𝑥 ∉ 𝑦).
Demonstração.
Pelo Axioma da Existência, existe pelo menos um conjunto 𝑧. Daí, tomando
𝜑(𝑥) ≡ 𝑥 ≠ 𝑥, o Axioma da Separação garante a existência de um conjunto 𝑦 tal que
(∀𝑥)(𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑧 ∧ 𝑥 ≠ 𝑥).
Assim, se existir 𝑥 tal que 𝑥 ∈ 𝑦, concluiremos que 𝑥 ≠ 𝑥, o que é absurdo. Logo,
(∃𝑦)(∀𝑥)(𝑥 ∉ 𝑦). Supondo que exista 𝑦′ tal que (∀𝑥)(𝑥 ∉ 𝑦′), obtemos 𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑦′,
donde segue pelo Axioma da Extensão que 𝑦 = 𝑦′. Portanto, (∃!𝑦)(∀𝑥)(𝑥 ∉ 𝑦). Q.E.D.
Definição 2.3. ∅ = 𝑥 ⟺ (∀𝑦)(𝑦 ∉ 𝑥). O conjunto ∅ é denominado conjunto
vazio.
Tendo em vista que todos os elementos são conjuntos, não restringimos o uso de
letras minúsculas apenas aos elementos dos conjuntos, atitude muito comum na literatura
matemática. Entretanto, com o desenrolar da teoria, utilizamos letras maiúsculas ou
“estilizadas” a fim de facilitar a distinção entre os vários tipos de conjuntos.
O próximo axioma a ser assumido afirma que, para quaisquer conjuntos 𝑥 e 𝑦,
existe um conjunto 𝑧 cujos únicos membros são 𝑥 e 𝑦. Devido a tal axioma, podemos
formalizar em ZFC o conceito de par não ordenado, donde posteriormente deriva-se o par
ordenado, ambos de grande valor na Matemática. Logo após postularmos tal axioma,
6 Ver Apêndice A.
37
definimos o par não ordenado, devido à sua importância ainda nesta seção. Sua existência é
provada no Teorema 2.10.
Axioma do Par:
(A3) (∀𝑥)(∀𝑦)(∃𝑧)(∀𝑤)(𝑤∈ 𝑧 ⟺ 𝑤 = 𝑥 ∨ 𝑤 = 𝑦).
Definição 2.4. {𝑥, 𝑦} = 𝑧 ⟺ (∀𝑤)(𝑤 ∈ 𝑧 ⟺ 𝑤 = 𝑥 ∨ 𝑤 = 𝑦) .
Definição 2.5. {𝑥} = {𝑥, 𝑥}.
Chamamos o conjunto {𝑥, 𝑦} definido acima de par não ordenado formado por 𝑥
e 𝑦. Decorre imediatamente de sua definição que os únicos elementos de {𝑥, 𝑦} são 𝑥 e 𝑦, ou
em outras palavras 𝑧 ∈ {𝑥, 𝑦} se e só se 𝑧 = 𝑥 ou 𝑧 = 𝑦 — tal observação se encontra
formalizada na Proposição 2.3 (i).
Quando 𝑥 = 𝑦, temos o conjunto unitário de 𝑥 (singleton na literatura inglesa),
que consiste da coleção composta por um único elemento, a saber, o conjunto 𝑥. Devido a tal
unicidade, escreve-se {𝑥} em vez de {𝑥, 𝑥}. Vale notar que para qualquer 𝑦, ∅ ≠ {𝑦}: de fato,
enquanto não existe elemento 𝑧 tal que 𝑧 ∈ ∅, existe o próprio conjunto 𝑦 pertencente a {𝑦};
em particular, ∅ ≠ {∅}.
O axioma seguinte formaliza a reunião entre conjuntos.
Axioma da União:
(A4) (∀𝑥)(∃𝑦)(∀𝑧)�𝑧 ∈ 𝑦⟺ (∃𝑤)(𝑧 ∈ 𝑤 ∧ 𝑤 ∈ 𝑥)�.
Em palavras, (A4) afirma que para qualquer conjunto 𝑥 existe um conjunto 𝑦
cujos elementos pertencem a todos os membros de 𝑥. Assim, por exemplo, se 𝑋 = {𝑎, 𝑏} é o
conjunto cujos únicos membros são 𝑎 e 𝑏, então existe um conjunto 𝑦, tal que
(∀𝑧)(𝑧 ∈ 𝑦 ⟺ 𝑧 ∈ 𝑎 ∨ 𝑧 ∈ 𝑏).
Além disso, tal conjunto 𝑧 é único e, dada à sua importância, recebe uma notação
especial.
Definição 2.6. 𝑥 ∪ 𝑦 = 𝑧 ⟺ (∀𝑤)(𝑤 ∈ 𝑧 ⟺ 𝑤 ∈ 𝑥 ∨ 𝑤 ∈ 𝑦).
Obviamente, apenas definir um conjunto não prova sua existência. O Teorema
2.15, na próxima seção, garante que para quaisquer dois conjuntos 𝑥 e 𝑦, existe um único
38
conjunto 𝑧 ao qual pertencem todos os elementos pertencentes a 𝑥 ou 𝑦. Tal conjunto 𝑧 é
chamado de união dos conjuntos 𝑥 e 𝑦.
A fim de postular o Axioma das Partes, definimos a seguir a inclusão e a inclusão
própria de conjuntos, respectivamente.
Definição 2.7. 𝑥 ⊆ 𝑦⟺ (∀𝑧)(𝑧 ∈ 𝑥 ⟹ 𝑧 ∈ 𝑦).
Definição 2.8. 𝑥 ⊂ 𝑦⟺ 𝑥 ⊆ 𝑦 ∧ 𝑥 ≠ 𝑦.
Definição 2.9. 𝑥 ⊄ 𝑦⟺ ¬(𝑥 ⊆ 𝑦).
Se 𝑥 ⊆ 𝑦, dizemos que 𝑥 é subconjunto de 𝑦 ou 𝑥 está contido em 𝑦. Frisamos
que “𝑥 ∈ 𝑦” e “𝑥 ⊆ 𝑦” são sentenças que indicam conceitos distintos. Enquanto a primeira
afirma que 𝑥 é um elemento de 𝑦, a segunda expressa que os possíveis elementos de 𝑥, caso
existam, são também elementos de 𝑦, o que não garante que o próprio 𝑥 pertença a 𝑦.
Como exemplo, podemos citar o conjunto dos números naturais ℕ que contém o
conjunto dos naturais pares ℙ. Uma vez que ℙ não é um número natural, é claro que ℙ ∉ ℕ,
apesar de ser verdadeiro que ℙ ⊆ ℕ. Ainda neste mesmo exemplo, podemos notar que
existem elementos de ℕ que não pertencem a ℙ, e então escrevemos ℙ ⊂ ℕ e dizemos que ℙ
está propriamente contido em ℕ ou que ℙ é subconjunto próprio de ℕ.
É comum utilizar o símbolo “⊊” para representar a inclusão própria e o símbolo
“⊂” para a inclusão. Uma vez que tais símbolos não interferem no significado das operações,
a escolha de um ou outro é simplesmente uma questão de preferência pessoal. Optamos pelos
símbolos “⊆” e “⊂” para representar respectivamente a inclusão e a inclusão própria pelo fato
de que a maioria dos autores consultados para a elaboração deste trabalho utilizou a mesma
notação.
Uma vez definida a relação de inclusão de conjuntos, o próximo teorema nos
fornece um prático critério para determinar a igualdade entre dois conjuntos. De fato, ele é
apenas a reformulação de (A1) em termos da inclusão de conjuntos.
Teorema 2.3. (∀𝑥)(∀𝑦)(𝑥 = 𝑦 ⟺ 𝑥 ⊆ 𝑦 ∧ 𝑦 ⊆ 𝑥).
Demonstração.
Se 𝑥 = 𝑦, temos (∀𝑧)(𝑧 ∈ 𝑥 ⟺ 𝑧 ∈ 𝑦), donde se obtém
(∀𝑧)(𝑧 ∈ 𝑥 ⟹ 𝑧 ∈ 𝑦) ∧ (∀𝑧)(𝑧 ∈ 𝑦⟹ 𝑧 ∈ 𝑥),
e assim 𝑥 ⊆ 𝑦 e 𝑦 ⊆ 𝑥. Reciprocamente, se 𝑥 ⊆ 𝑦 e 𝑦 ⊆ 𝑥, decorre da Definição 2.7 que
39
(∀𝑧)(𝑧 ∈ 𝑥 ⟹ 𝑧 ∈ 𝑦) ∧ (∀𝑧)(𝑧 ∈ 𝑦⟹ 𝑧 ∈ 𝑥),
o que equivale a (∀𝑧)(𝑧 ∈ 𝑥 ⟺ 𝑧 ∈ 𝑦) e, por (A1), concluímos que 𝑥 = 𝑦. Q.E.D.
Vale notar que pela contrapositiva do teorema acima obtemos a sentença
𝑥 ≠ 𝑦 ⟺ 𝑥 ⊄ 𝑦 ∨ 𝑦 ⊄ 𝑥.
Uma vez definido o conceito de subconjunto, podemos postular o Axioma das
Partes de uma maneira bem simples.
Axioma das Partes:
(A5) (∀𝑥)(∃𝑦)(∀𝑧)(𝑧 ∈ 𝑦 ⟺ 𝑧 ⊆ 𝑦).
Este axioma nos garante que para qualquer conjunto 𝑥 existe um conjunto 𝑦 cujos
membros são todos os subconjuntos de 𝑥. Tal conjunto é único conforme provamos na
próxima seção, e denotado por ℘(𝑥). Além disso, (A5) permite, entre outras coisas,
formalizar em ZFC o produto cartesiano entre conjuntos, que é uma das muitas maneiras de se
formalizar o estudo das relações e das funções em ZFC. Definimos todos esses conceitos e
provamos suas principais propriedades na seção 2.3 e no Capítulo 3.
Axioma do Infinito:
(A6) (∃𝐼)�∅ ∈ 𝐼 ∧ (∀𝑥)(𝑥 ∈ 𝐼 ⟹ 𝑥 ∪ {𝑥} ∈ 𝐼)�.
Temos por (A6) assegurada a existência de ao menos um conjunto 𝐼 que, a
posteriori, é infinito. Vale notar que tal conjunto não poderia ser obtido por meio dos outros
axiomas de ZFC. Com efeito, de (A0), (A1) e (A2) obtemos a existência “concreta” de uma
única coleção, o conjunto vazio. Partindo dele, podemos construir {∅} pelo Axioma do Par ou
pelo Axioma das Partes e, por repetidas aplicações destes axiomas, obter �∅, {∅}�,
�∅, �∅, {∅}��, etc. Contudo, com a definição que adotamos de conjunto finito, no Capítulo 4,
∅ é um conjunto finito e consequentemente, {∅}, �∅, {∅}� e �∅, �∅, {∅}�� são finitos; de modo
geral, qualquer operação definida em termos dos demais axiomas de ZFC que se faça apenas
entre conjuntos finitos resulta num conjunto finito. Portanto, a fim de obtermos conjuntos
infinitos em ZFC é necessário postular a existência de pelo menos um conjunto infinito; por
tal motivo assumimos (A6).
40
Com os axiomas até aqui postulados, é possível determinar conjuntos finitos,
infinitos enumeráveis e não-enumeráveis7. Como exemplo, podemos citar o conjunto dos
números naturais ℕ, definido na seção 4.3. ℕ é infinito enumerável, enquanto ℘(ℕ),
℘�℘(ℕ)� e ℘�℘�℘(ℕ)�� são não-enumeráveis. Porém, não podemos definir o conjunto
enumerável
𝐴 = �ℕ, ℘(ℕ), ℘�℘(ℕ)�, ℘�℘�℘(ℕ)��,…�.
Pode-se tentar, é claro, definir tal conjunto 𝐴 por meio de (A3) e (A4): tomamos
{ℕ, ℘(ℕ)} e �℘�℘(ℕ)�� e formamos �ℕ, ℘(ℕ), ℘�℘(ℕ)��= {ℕ, ℘(ℕ)}∪ �℘�℘(ℕ)��,
repetimos o processo para acrescentar o conjunto �℘�℘�℘(ℕ)��� e assim por diante, ad
infinitum. Mas o que nos assegura que tal processo é válido? Garantir a existência de um
conjunto infinito, o que é feito por (A6), não nos permite dizer que os axiomas já assumidos
podem ser aplicados infinitas vezes às famílias já existentes. A fim de eliminar tal brecha,
postulamos o próximo axioma.
Axioma (Esquema) da Substituição:
(A7) (∀𝑥)(∀𝑦)(∀𝑧)(𝜑(𝑥, 𝑦) ∧ 𝜑(𝑥, 𝑧)⟹ 𝑧 = 𝑦) ⟹
⟹ (∀𝑋)(∃𝑌)(∀𝑤)�𝑤 ∈ 𝑌 ⟺ (∃𝑎)�𝑎 ∈ 𝑋 ∧ 𝜑(𝑎, 𝑤)��.
Frisamos que 𝑌 não pode ser uma variável livre em 𝜑, pelo mesmo motivo
apresentado nos esclarecimentos sobre (A2), bem como o fato de que 𝜑 possivelmente possa
ter vários parâmetros. Além disso, a formulação geral do axioma carece de esclarecimento,
uma vez que o postulamos de forma condicional. Dizemos que 𝜑 é funcional em 𝑥 caso ela
satisfaça a condição suficiente imposta por (A7), isto é, se para todo 𝑥 existir no máximo um
𝑦 tal que a fórmula 𝜑(𝑥, 𝑦) seja verdadeira. Assim, o axioma garante que se 𝜑 for funcional,
então para qualquer conjunto 𝑋 existe um conjunto 𝑌 cujos membros são exatamente os
elementos 𝑦 que satisfazem 𝜑(𝑥, 𝑦) para cada 𝑥 ∈ 𝑋. Também é importante lembrar que este
é um esquema de axiomas: para cada fórmula 𝜑 que satisfaz a condição de (A7) obtemos um
axioma.
7 Ver Capítulo 4.
41
Apesar de aparentemente artificial, o Axioma da Substituição pode ser visto de
maneira muito natural, conforme mostrado por Hrbacek & Jech, que traçam um interessante
paralelo entre (A2) e (A7):
Uma justificativa intuitiva para o Axioma Esquema da Substituição pode ser dada comparando-o com o Axioma Esquema da Separação. O último nos permite percorrer os elementos de um dado conjunto 𝐴, verificar para cada 𝑥 ∈ 𝐴 os elementos que possuem a propriedade 𝜑, e coletá-los num conjunto. De modo inteiramente análogo, o Axioma Esquema da Substituição permite-nos percorrer os elementos de 𝐴, tomar para cada 𝑥 ∈ 𝐴 o único 𝑦 [não necessariamente pertencente a 𝐴] correspondente que goza da propriedade 𝜑(𝑥, 𝑦) , e coletar tais elementos 𝑦 num conjunto [chamemos de 𝜑(𝐴) ]. É intuitivamente óbvio que o conjunto [𝜑(𝐴) ] ‘não é tão grande’ quanto o conjunto 𝐴. Em contraste, todos os exemplos conhecidos de ‘conjuntos paradoxais’ são ‘grandes’, como o ‘conjunto de todos os conjuntos’ (HRBACEK & JECH, 1999, p. 112 – 113, tradução nossa).
Nos dois próximos teoremas, provamos que (A7) ⟹ (A2) e (A7) ∧ (A5) ⟹ (A3).
Teorema 2.4. O Axioma da Separação é derivável do Axioma da Substituição.
Demonstração.
Seja 𝜓 uma condição em 𝑥. Tomemos a fórmula 𝜑(𝑥, 𝑦) ≡ 𝑥 = 𝑦 ∧ 𝜓(𝑦).
Claramente, 𝜑 é funcional em 𝑥. Então, pelo Axioma da Substituição, temos
[†] (∀𝑋)(∃𝑌)(∀𝑤)(𝑤 ∈ 𝑌 ⟺ (∃𝑎)�𝑎 ∈ 𝑋 ∧ 𝑎 = 𝑤∧ 𝜓(𝑤)�,
onde 𝑌 não é livre em 𝜑(𝑥, 𝑦) e consequentemente não é livre em 𝜓. Observando que [†]
equivale a
(∀𝑋)(∃𝑌)(∀𝑤)�𝑤 ∈ 𝑌 ⟺ 𝑤 ∈ 𝑋 ∧ 𝜓(𝑤)�,
obtemos exatamente o Axioma da Separação. Q.E.D.
Teorema 2.5. O Axioma do Par é derivável do Axioma da Substituição e do
Axioma das Partes.
Demonstração.
O teorema anterior nos mostrou que (A7) ⟹ (A2) e, por meio de (A2), provamos
que existe o conjunto vazio, ∅. Seja 𝑤 arbitrário tal que 𝑤 ⊆ ∅. Se, por absurdo, 𝑤 ≠ ∅, então
∅ ⊄ 𝑤, e assim existe 𝑧 ∈ ∅ tal que 𝑧 ∉ 𝑤, o que contraria a definição de ∅. Dessa forma,
�†1� 𝑤 ⊆ ∅⟺ 𝑤 = ∅.
42
Daí, devido a (A5), existe um conjunto 𝑃, tal que 𝑧 ∈ 𝑃⟺ 𝑧 ⊆ ∅ e, de �†1�
decorre 𝑧 ∈ 𝑃 ⟺ 𝑧 = ∅. Pela definição de par não ordenado e conjunto unitário, temos
𝑃 = {∅}. Aplicando novamente o Axioma das Partes, obtemos o conjunto 𝑋 = �∅, {∅}� —
note que não estamos usando o Axioma do Par para obter tais conjuntos, mas apenas a
notação do par não ordenado para denotar os conjuntos cuja existência derivamos do Axioma
das Partes.
Sejam 𝑎 e 𝑏 elementos quaisquer. Tomemos então
𝜑(𝑥, 𝑦) ≡ (𝑥 = ∅ ∧ 𝑦 = 𝑎) ∨ (𝑥 = {∅} ∧ 𝑦 = 𝑏).
𝜑 é obviamente funcional em 𝑥, pois 𝑎 e 𝑏 são únicos. O Axioma da Substituição
garante então que
(∃𝑌)(∀𝑧)�𝑧 ∈ 𝑌 ⟺ (∃𝑢) �𝑢 ∈ �∅, {∅}� ∧ 𝜑(𝑢, 𝑧)��,
o que equivale a
�†2� (∃𝑌)(∀𝑧)�𝑧 ∈ 𝑌 ⟺ (∃𝑢) �𝑢 ∈ �∅, {∅}� ∧ �(𝑢 = ∅ ∧ 𝑧 = 𝑎) ∨ (𝑢 = {∅} ∧ 𝑧 = 𝑏)���.
Devido a �†2�, temos
[∗] 𝑧 ∈ 𝑌 ⟹ 𝑧 = 𝑎 ∨ 𝑧 = 𝑏.
Por outro lado, se 𝑧 = 𝑎 ou 𝑧 = 𝑏 , então a sentença
(∃𝑢) �𝑢 ∈ �∅, {∅}� ∧ �(𝑢 = ∅ ∧ 𝑧 = 𝑎) ∨ (𝑢 = {∅} ∧ 𝑧 = 𝑏)��
é verdadeira, e novamente por �†2�, segue que
[∗∗] 𝑧 = 𝑎 ∨ 𝑧 = 𝑏 ⟹ 𝑧 ∈ 𝑌.
Como 𝑎 e 𝑏 foram tomados arbitrariamente, obtemos de [∗] e [∗∗] o Axioma do
Par. Q.E.D.
Definimos a seguir a interseção entre dois conjuntos. Sua existência, que decorre
imediatamente de (A2), é provada na próxima seção.
Definição 2.10. 𝑥 ∩ 𝑦 = 𝑧 ⟺ (∀𝑤)(𝑤 ∈ 𝑧 ⟺ 𝑤 ∈ 𝑥 ∧ 𝑤 ∈ 𝑦).
Definição 2.11. 𝑥 e 𝑦 são ditos conjuntos disjuntos se, e somente se, 𝑥 ∩ 𝑦 = ∅.
43
Definição 2.12. 𝑡 é uma família disjunta se, e somente se, quaisquer dois membros
distintos de 𝑡 forem disjuntos. Simbolicamente
(∀𝑥)�𝑥 ∈ 𝑡 ⟹ �(∀𝑦)(𝑦 ∈ 𝑡 ∧ 𝑦 ≠ 𝑥) ⟹ 𝑥 ∩𝑦 = ∅��.
Consideremos uma família disjunta 𝑡. Na próxima seção, provamos a existência
dos conjuntos denotados por ⋃𝑡 e ∏𝑡: o primeiro consiste da reunião de todos os membros de
𝑡, enquanto o segundo é composto por todos os conjuntos que possuem exatamente um
membro de cada membro de 𝑡; denominamos os membros de ∏𝑡 por conjuntos de seleção de
𝑡 (selection sets of 𝑡).
Assim, por exemplo, se 𝑡 = �{𝑎, 𝑏}, {𝑐}�, então ⋃𝑡 = {𝑎, 𝑏, 𝑐} e ∏𝑡 =
�{𝑎, 𝑐}, {𝑏, 𝑐}�. Notemos que todo membro 𝑥 de ∏𝑡 é um subconjunto de ⋃𝑡 tal que 𝑥 ∩ 𝑠 é
um conjunto unitário, para todo 𝑠 ∈ 𝑡; tal propriedade é, de fato, uma caracterização geral
para ∏𝑡. Caso ∅ ∈ 𝑡, temos necessariamente ∏𝑡 = ∅, pois do contrário deveria existir um
subconjunto de ⋃𝑡 cuja interseção com ∅ fosse um conjunto unitário, o que é absurdo. Porém
a partir dos axiomas até aqui postulados, não podemos responder, de modo geral, se quando
∅ ∉ 𝑡 tem-se necessariamente ∏𝑡 ≠ ∅, isto é, se existe ou não algum conjunto de seleção de 𝑡
(FRAENKEL, BAR-HILLEL, & LEVY, 1973).
Intuitivamente, faz sentido supor que ∏𝑡 ≠ ∅. De fato, uma vez que todo membro
de 𝑡 é não vazio, para cada elemento de 𝑦 (com 𝑦 ∈ 𝑡), podemos escolher arbitrariamente um
elemento 𝑧 ∈ 𝑦 e coletá-los num conjunto 𝑐; uma vez que 𝑐 é formado por membros de
membros de 𝑡, temos 𝑐 ⊆ ⋃ 𝑡 e, “por construção”, para todo 𝑦 ∈ 𝑡, 𝑐 ∩ 𝑦 é um conjunto
unitário, donde segue 𝑐 ∈ ∏𝑡. Entretanto, apesar de podermos definir ∏𝑡, não podemos
definir os elementos de ∏𝑡, como notam Fraenkel, Bar-Hillel & Levy (1973), pois escolher
arbitrariamente um elemento não é uma fórmula 𝜑 que possa ser aplicada convenientemente
ao Axioma da Separação a fim de obtermos um subconjunto de ⋃𝑡 bem determinado. É claro
que alguns conjuntos possuem certas propriedades que nos permitem escolher tais elementos
com alguma fórmula 𝜑 adequada, mas geralmente tal escolha não é derivável dos axiomas
anteriores.
44
A fim de garantir a não vacuidade de ∏ 𝑡, entre outras coisas, assumimos o
axioma seguinte8.
Axioma da Escolha:
(A8) (∀𝑡)(𝑡 é uma família disjunta ∧ ∅ ∉ 𝑡) ⟹ (∃𝑢)(∀𝑤)�𝑤 ∈ 𝑡 ⟹ (∃! 𝑧)(𝑧 ∈ 𝑢 ∩𝑤)�
Em palavras, asseguramos que para qualquer família disjunta 𝑡 com ∅ ∉ 𝑡, existe
um conjunto 𝑢 tal que para qualquer elemento 𝑤 de 𝑡 existe um único elemento 𝑧 de 𝑤
também pertencente a 𝑢, isto é, tal que 𝑤 ∩ 𝑢 = {𝑧}, o que garante ∏𝑡 ≠ ∅. Quando se tem
formalizado o conceito de função, o conjunto 𝑢 acima pode ser interpretado como uma função
escolha, uma “regra” que escolhe para cada conjunto de 𝑡 um único elemento. De fato, esta é
uma formulação equivalente, dentre tantas outras, para (A8). Ao longo deste trabalho,
demonstramos esta e outras afirmações equivalentes ao Axioma da Escolha. Por ora,
postulamos o último axioma de nossa lista.
Axioma da Fundação:
(A9) (∀𝑋)�𝑋 ≠ ∅⟹ (∃𝑥)(𝑥 ∈ 𝑋 ∧ 𝑋 ∩ 𝑥 = ∅)�.
A importância de tal axioma se encontra em contextos ligeiramente avançados.
Uma vez assumido, (A9) impede a existência de cadeias de pertinência circulares, como por
exemplo,
𝑥1 ∈ 𝑥2 ∧ 𝑥2 ∈ 𝑥3 ∧ … ∧ 𝑥𝑛−1 ∈ 𝑥𝑛 ∧ 𝑥𝑛 ∈ 𝑥1.
Além disso, ele permite provar que todo conjunto em ZFC “[…] pode ser obtido a
partir do vazio iterando-se as operações de união e partes.” (MIRAGLIA, 1991, p. 24), como
se existisse uma hierarquia de conjuntos: a primeira “camada” seria constituída pelos
elementos mais simples, os indivíduos, o que neste caso corresponde a ∅; a segunda seria
composta por todos os conjuntos que possuem indivíduos como membros, e assim
sucessivamente. Tratamos brevemente sobre “conjuntos bem fundados” e as aplicações do
Axioma da Fundação no Apêndice B.
8 Adaptamos esta formulação de Fraenkel, Bar-Hillel & Levy (1973). Os autores originalmente utilizam (∃𝑧)(∀𝑣)(𝑧 = 𝑣 ⟺ 𝑣 ∈ 𝑢 ∧ 𝑣 ∈ 𝑤) em vez de (∃!𝑧) (𝑧 ∈ 𝑢 ∩ 𝑤), mas tais sentenças são equivalentes.
45
Denominamos de Sistema Axiomático de Zermelo-Fraenkel-Choice à Teoria dos
Conjuntos derivada dos axiomas (A1),…, (A9), abreviadamente ZFC. ZF nomeia a Teoria dos
Conjuntos obtida dos axiomas (A1),…, (A7), (A9), isto é, não se assume o Axioma da
Escolha. Nas próximas seções provamos a existência e as propriedades de diversos conjuntos
que podem ser derivados dos axiomas de ZFC, os quais nos permitem definir, entre outras
coisas, relações, funções e o conjunto dos números naturais.
2.3. Operações Básicas Entre Conjuntos
Passamos a tratar das principais “operações” entre conjuntos e de suas
propriedades que podem ser derivadas dos axiomas de ZFC: o complementar relativo, a união,
pares (não ordenados e ordenados), interseção, potência e produto cartesiano. Notemos que,
apesar de nos referirmos a tais conceitos como “operações”, não podemos considerá-las como
funções no sentido estrito, pois para isso seria exigido um conjunto universo como domínio9.
O primeiro teorema desta seção é uma adaptação de uma observação feita por
Hrbacek & Jech (1999) sobre definições por abstração. Como já vimos anteriormente, o
Axioma da Abstração, por ser demasiado forte, gera paradoxos por assegurar a existência de
conjuntos definidos por propriedades pouco convenientes. No entanto, dado um conjunto 𝑥,
(A2) garante que para qualquer propriedade 𝜓 existe um subconjunto 𝑥𝜓 ⊆ 𝑥 constituído por
todos os elementos de 𝑥 que gozam de 𝜓. Tal conjunto é único devido ao Axioma da
Extensão, conforme provamos abaixo.
Teorema 2.6. (∀𝑧)(∃!𝑦)(∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥)�.
Demonstração.
Seja 𝑧 um conjunto qualquer e 𝜓(𝑥) uma condição em 𝑥. O Axioma da Separação
estabelece a existência de ao menos um conjunto 𝑦, tal que
(∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥)�.
9 Ver Capítulo 3.
46
Se existir 𝑦′ que satisfaça a sentença
(∀𝑥)�𝑥 ∈ 𝑦′ ⟺ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥)�,
então, para 𝑥 qualquer temos 𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥) ⟺ 𝑧 ∈ 𝑦′ e, por (A1), concluímos que
𝑦 = 𝑦′. Q.E.D.
Definição 2.13. {𝑥 ∈ 𝑧|𝜓(𝑥)} = 𝑦⟺ (∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥)�.
Suponhamos agora que exista uma condição 𝜓 em 𝑥 e um conjunto 𝑋 tais que
𝜓(𝑥) ⟹ 𝑥 ∈ 𝑋. Claramente, existe 𝐴 = {𝑥 ∈ 𝑋|𝜓(𝑥)}, e este é tal que 𝑥 ∈ 𝐴 se, e somente
se, 𝜓(𝑥). Contudo, se existir outro conjunto 𝑌 tal que 𝜓(𝑥) ⟹ 𝑥 ∈ 𝑌, então teremos
{𝑥 ∈ 𝑌|𝜓(𝑥)} = 𝐴. Em outras palavras, em tais condições podemos definir um conjunto 𝐴𝜓
nos moldes do Axioma da Abstração, isto é, tal que 𝑥 ∈ 𝐴𝜓 se, e somente se, 𝜓(𝑥); 𝐴𝜓 diz-se
ser definido por abstração. Tal resultado é demonstrado a seguir.
Teorema 2.7. (∃𝑧)(∀𝑥)(𝜓(𝑥)⟹ 𝑥 ∈ 𝑧) ⟹ (∃!𝑦)(∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝜓(𝑥)�.
Demonstração.
Definamos 𝑦 = {𝑥 ∈ 𝑧|𝜓(𝑥)}. Afirmamos que 𝑦 é tal que
[†] (∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝜓(𝑥)�.
Da hipótese do teorema, temos
𝜓(𝑥) ⟹ 𝑥 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥),
mas, como pela Definição 2.13
[††] 𝑥 ∈ 𝑦⟺ 𝑥 ∈ 𝑧 ∧ 𝜓(𝑥),
segue que 𝜓(𝑥) ⟹ 𝑥 ∈ 𝑦.
Obviamente, decorre de [††] que 𝑥 ∈ 𝑦 ⟹ 𝜓(𝑥). Logo, [†] é verdadeiro, como
afirmamos. A unicidade de 𝑦 segue então do teorema anterior. Q.E.D.
Definição 2.14.
(∃𝑧)(∀𝑥)(𝜓(𝑥) ⟹ 𝑥 ∈ 𝑧) ⟹ �{𝑥|𝜓(𝑥)} = 𝑦 ⟺ (∀𝑥)�𝑥 ∈ 𝑦⟺ 𝜓(𝑥)��.
Geralmente diz-se que {𝑥|𝜓(𝑥)} é o conjunto dos elementos 𝑥, tais que 𝜓(𝑥). É
comum encontrar textos matemáticos em que a barra vertical “|” usada na Definição 2.13 é
47
substituída por dois pontos “:”, escrevendo {𝑥 ∈ 𝑧:𝜓(𝑥)} = 𝑦. O significado de tal expressão
é o mesmo que transcrevemos acima. A preferência por um símbolo ou outro geralmente varia
com a natureza dos objetos matemáticos envolvidos no contexto. Neste trabalho, utilizamos as
duas notações de acordo com a conveniência.
Nesta seção, definimos vários conjuntos da forma {𝑥|𝜓(𝑥)}. Para provar que tais
conjuntos estão bem definidos, basta mostrarmos que existe um conjunto 𝐴 para o qual
𝜓(𝑥) ⟹ 𝑥 ∈ 𝐴. Assim, por exemplo, não podemos considerar o conjunto {𝑥|𝑥 = 𝑥}, pois se
existisse um conjunto 𝐴 tal que 𝑥 = 𝑥 ⟹ 𝑥 ∈ 𝐴, 𝐴 seria como um “conjunto universo”, o que
contraria o Teorema 2.1.
Vale frisar que Suppes (1972), utiliza uma definição sutilmente distinta sobre a
qual discutimos brevemente a seguir. O autor define {𝑥|𝜑(𝑥)} = 𝑦 como sendo o conjunto tal
que 𝑥 ∈ 𝑦 se e só se 𝜓(𝑥) ou {𝑥|𝜑(𝑥)} = ∅ caso não exista um conjunto que satisfaça a
condição imposta a 𝑦. Dessa forma, a notação {𝑥|𝜑(𝑥)} está sempre bem definida, embora
não se possa saber a priori se existe algum elemento em {𝑥|𝜑(𝑥)}, ao contrário da definição
condicional que adotamos.
Uma situação que exemplifica bem a diferença entre as duas definições é tomar
𝜑(𝑥) ≡ 𝑥 = 𝑥. Uma vez que não existe 𝑦 tal que 𝑥 ∈ 𝑦 ⟺ 𝜑(𝑥), devido ao Teorema 2.1, não
podemos, em posse da Definição 2.14, considerar formalmente {𝑥|𝑥 = 𝑥}. Todavia, pela
definição não condicional de Suppes (1972), {𝑥|𝑥 = 𝑥} existe e é idêntico ao conjunto vazio,
apesar de todo elemento satisfazer 𝜑. Ainda assim, mesmo para conjuntos {𝑥|𝜑(𝑥)}
sabidamente não vazios a posteriori, é preciso provar que existe um conjunto 𝐴 tal que
{𝑥|𝜑(𝑥)} = {𝑥 ∈ 𝐴|𝜑(𝑥)} para garantir que {𝑥|𝜑(𝑥)} ≠ ∅ caso exista algum elemento
satisfazendo 𝜑. Por tal motivo, optamos pela Definição 2.14.
Mesmo com tais diferenças, Suppes (1972) propõe teoremas muito úteis para
conjuntos da forma {𝑥|𝜑(𝑥)}, que podem ser adaptados para a Definição 2.14 sem grandes
dificuldades. Provamos abaixo tais resultados.
Teorema 2.8. (∃𝑧)(𝑧 = {𝑥|𝜓(𝑥)}) ⟹ (∀𝑦)�𝑦 ∈ {𝑥|𝜓(𝑥)} ⟺𝜓(𝑦)�.
Demonstração.
Decorre imediatamente da hipótese do teorema e da Definição 2.14. Q.E.D.
Observação: notemos que Suppes (1972) propõe apenas 𝑦 ∈ {𝑥|𝜑(𝑥)} ⟹𝜑(𝑦),
pois nas linhas da definição por abstração adotadas pelo autor não é imposta a hipótese de
que exista um conjunto 𝐴 para o qual 𝜑(𝑥) ⟹ 𝑥 ∈ 𝐴 e, por conseguinte, a recíproca não
48
poderia ser verdadeira. Basta considerar, por exemplo, 𝜑(𝑥) ≡ 𝑥 = 𝑥, 𝜑(𝑦) é válido para
todo 𝑦, mas tem-se que {𝑥|𝑥 = 𝑥} = ∅.
Proposição 2.1. (∀𝑦)(𝑦 = {𝑥|𝑥 ∈ 𝑦}).
Demonstração.
Basta notar que a fórmula 𝜑(𝑥) ≡ 𝑥 ∈ 𝑦 é tal que 𝜑(𝑥)⟹ 𝑥 ∈ 𝑦, donde se tem
pelo Teorema 2.7 que existe {𝑥|𝑥 ∈ 𝑦};a igualdade 𝑦 = {𝑥|𝑥 ∈ 𝑦} segue do teorema anterior e
do Axioma da Extensão. Q.E.D.
Teorema 2.9. Se existirem um conjunto {𝑥|𝜑(𝑥)} e uma condição 𝜓 em 𝑥 tais que
𝜓(𝑥) ⟺ 𝜑(𝑥) para todo 𝑥, então existe {𝑥|𝜓(𝑥)} e, além disso, {𝑥|𝜓(𝑥)} = {𝑥|𝜑(𝑥)}.
Demonstração.
Seja 𝑦 qualquer. Pelo Teorema 2.8 temos 𝑦 ∈ {𝑥|𝜑(𝑥)} ⟺ 𝜑(𝑦); então, pela
hipótese do teorema, obtemos
𝜓(𝑦) ⟺ 𝜑(𝑦) ⟺𝑦 ∈ {𝑥|𝜑(𝑥)},
donde segue 𝜓(𝑦) ⟹𝑦 ∈ {𝑥|𝜑(𝑥)} e assim existe {𝑥|𝜓(𝑥)}. Novamente, pelo mesmo
teorema, concluímos que
𝑦 ∈ {𝑥|𝜓(𝑥)} ⟺𝜓(𝑦) ⟺𝜑(𝑦) ⟺𝑦 ∈ {𝑥|𝜑(𝑥)},
isto é, 𝑦 ∈ {𝑥|𝜓(𝑥)} ⟺𝑦 ∈ {𝑥|𝜑(𝑥)}. A igualdade segue do Axioma da Extensão. Q.E.D.
O Teorema 2.9 tem grande importância no contexto matemático geral, pois prova
que condições equivalentes determinam conjuntos iguais. Assim, por exemplo,
{𝑥 ∈ ℝ|𝑥 2 − 1 = 0} = {𝑥 ∈ ℝ|𝑥 = 1 ∨ 𝑥 = −1}, haja vista que 𝑥2 − 1 = 0 ⟺ 𝑥 = ±1.
É claro que conjuntos da forma {𝑥 ∈ 𝐴|𝜓(𝑥)} podem ser vistos como conjuntos
definidos por abstração, conforme mostramos a seguir.
Proposição 2.2. (∀𝑦)({𝑥 ∈ 𝑦|𝜓(𝑥)} = {𝑥|𝑥 ∈ 𝑦 ∧ 𝜓(𝑥)}).
Demonstração.
Para um conjunto 𝑦 qualquer, existe o conjunto 𝑌 = {𝑥 ∈ 𝑦|𝜓(𝑥)}, tal que
[†] 𝑧 ∈ 𝑌 ⟺ 𝑧 ∈ 𝑦 ∧ 𝜓(𝑧).
Então, 𝑧 ∈ 𝑦 ∧ 𝜓(𝑧) ⟹ 𝑧 ∈ 𝑌. Logo, existe {𝑥|𝑥 ∈ 𝑦 ∧ 𝜓(𝑥)}. Finalmente, a
igualdade decorre do Teorema 2.8, de [†] e de (A1). Q.E.D.
49
Passamos a provar a existência dos conjuntos citados na seção anterior, bem como
suas principais propriedades.
Teorema 2.10. (∀𝑥)(∀𝑦)(∃! 𝑧)(∀𝑤)(𝑤∈ 𝑧 ⟺ 𝑤 = 𝑥 ∨ 𝑤 = 𝑦).
Demonstração.
Decorre diretamente do Axioma do Par a existência de tal conjunto 𝑧. Sua
unicidade segue do Axioma da Extensão. Q.E.D.
Teorema 2.11. (∀𝑎)(∀𝑏)(∃!𝑦)(∀𝑥)(𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑎 ∧ 𝑥 ∉ 𝑏).
Demonstração.
Basta tomar 𝑦 = {𝑥 ∈ 𝑎|𝑥 ∉ 𝑏}, único pelo Teorema 2.6. Então, do teorema
anterior, obtemos 𝑦 = {𝑥|𝑥 ∈ 𝑎 ∧ 𝑥 ∉ 𝑏}. Segue do Teorema 2.8 que para 𝑥 qualquer,
𝑥 ∈ 𝑦 ⟺ 𝑥 ∈ 𝑎 ∧ 𝑥 ∉ 𝑏. Q.E.D.
Teorema 2.12. (∀𝑎)(∃!𝑦)(∀𝑥)�𝑥 ∈ 𝑦⟺ (∃𝑧)(𝑧 ∈ 𝑎 ∧ 𝑥 ∈ 𝑧)�.
Demonstração.
Decorre imediatamente de (A4) que existe um conjunto 𝑦 que satisfaz a
equivalência. Sua unicidade é consequência do Axioma da Extensão. Q.E.D.
Teorema 2.13. (∀𝑧)(∃!𝑦)(∀𝑥)(𝑥 ⊆ 𝑧 ⟺ 𝑥 ∈ 𝑦).
Demonstração.
A existência de tal 𝑦 segue de (A5); sua unicidade se deve à (A1). Q.E.D.
Teorema 2.14. (∀𝑧)�𝑧 ≠ ∅ ⟹ (∃!𝑦)(∀𝑥)�(∀𝑤)(𝑤 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑤) ⟹ 𝑥 ∈ 𝑦��.
Demonstração.
Seja 𝑧 ≠ ∅. Daí existe 𝑢 ∈ 𝑧. Definamos então
𝑦 = {𝑥 ∈ 𝑢|(∀𝑤)(𝑤 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑤)}.
Obviamente, para um 𝑥 arbitrário, temos
𝑥 ∈ 𝑦 ⟹ (∀𝑤)(𝑤 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑤).
Reciprocamente, se (∀𝑤)(𝑤 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑤) então, como 𝑢 ∈ 𝑧, obtemos
(∀𝑤)(𝑤 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑤) ∧ 𝑥 ∈ 𝑢,
donde segue que 𝑥 ∈ 𝑦. Logo, 𝑥 ∈ 𝑦 ⟺ (∀𝑤)(𝑤 ∈ 𝑧 ⟹ 𝑥 ∈ 𝑤). Q.E.D.
50
Corolário 2.1. {𝑎, 𝑏} = {𝑥|𝑥 = 𝑎 ∨ 𝑥 = 𝑏}.
Demonstração.
Pelo Teorema 2.10, vimos que existe 𝑦 tal que (𝑥 = 𝑎 ∨ 𝑥 = 𝑏) ⟺ 𝑥 ∈ 𝑦. Logo,
existe {𝑥|𝑥 = 𝑎 ∨ 𝑥 = 𝑏}. Pelo Teorema 2.8 inferimos
𝑧 ∈ {𝑥|𝑥 = 𝑎 ∨ 𝑥 = 𝑏} ⟺ 𝑧 = 𝑎 ∨ 𝑧 = 𝑏,
e daí, pela Definição 2.4, concluímos que
𝑧 ∈ {𝑥|𝑥 = 𝑎 ∨ 𝑥 = 𝑏} ⟺ 𝑧 ∈ {𝑎, 𝑏}.
A igualdade decorre do Axioma da Extensão. Q.E.D.
Tais teoremas embasam as definições seguintes.
Definição 2.15. 𝑥 ∖ 𝑦 = {𝑧|𝑧 ∈ 𝑥 ∧ 𝑧 ∉ 𝑦}.
Definição 2.16. ⋃𝑥 = {𝑧|(∃𝑤)(𝑤 ∈ 𝑥 ∧ 𝑧 ∈ 𝑤)}.
Definição 2.17. ℘(𝑥) = {𝑧|𝑧 ⊆ 𝑥}.
Definição 2.18. 𝑥 ≠ ∅⟹ ⋂𝑥 = {𝑧|(∀𝑤)(𝑤 ∈ 𝑥 ⟹ 𝑧 ∈ 𝑤)}.
O Corolário 2.1 apenas estabelece uma definição equivalente para o par não
ordenado {𝑎, 𝑏}, cuja existência provamos no Teorema 2.10. O conjunto 𝑥 ∖ 𝑦 definido acima
é a coleção de todos os elementos pertencentes a 𝑥 que não pertencem a 𝑦, o qual chamamos
de complementar de 𝑦 em relação a 𝑥 , ou diferença entre 𝑥 e 𝑦. O conjunto das partes de 𝑥,
também chamado de conjunto potência de 𝑥 e denotado por ℘(𝑥) é a coleção de todos os
subconjuntos de 𝑥, cuja existência comprova-se pelo Teorema 2.13.
Para uma família 𝑥 de conjuntos, ⋃𝑥 designa a união da família 𝑥, isto é, a união
de todos os membros que pertencem a algum membro de 𝑥, cuja existência decorre do
Teorema 2.12. Por fim, dizemos que ⋂𝑥 é a interseção da família 𝑥, cujos membros são
exatamente os conjuntos que pertencem a todos os membros de 𝑥 simultaneamente.
Contudo, enquanto existe a união de ∅, não existe em ZFC um conjunto formado
por todos os membros que pertencem a algum membro de ∅: uma vez que ∅ não possui
membros, por vacuidade qualquer elemento 𝑤 pertence a todos os membros de ∅
simultaneamente, o que contraria o Teorema 2.1; isso justifica a condição 𝑥 ≠ ∅ para que
exista ⋂𝑥.
51
Como consequência imediata do Teorema 2.8, o próximo resultado formaliza
critérios de pertinência para os conjuntos definidos acima.
Proposição 2.3. Sejam 𝑥 e 𝑦 conjuntos quaisquer. São verdadeiras as sentenças:
(i) (∀𝑧)(𝑧 ∈ {𝑥, 𝑦} ⟺ 𝑧 = 𝑥 ∨ 𝑧 = 𝑦);
(ii) (∀𝑧)(𝑧 ∈ {𝑥} ⟺ 𝑧 = 𝑥);
(iii) (∀𝑧)(𝑧 ∈ 𝑥 ∖ 𝑦⟺ 𝑧 ∈ 𝑥 ∧ 𝑧 ∉ 𝑦);
(iv) (∀𝑧)�𝑧 ∈ ⋃𝑥 ⟺ (∃𝑤)(𝑤 ∈ 𝑥 ∧ 𝑧 ∈ 𝑤)�;
(v) (∀𝑧)(𝑧 ∈ ℘(𝑦) ⟺ 𝑧 ⊆ 𝑦);
(vi) (∀𝑧)(𝑧 ≠ ∅⟹ (∀𝑤)�𝑤 ∈ ⋂𝑧 ⟺ (∀𝑣)(𝑣 ∈ 𝑧 ⟹ 𝑤 ∈ 𝑣)�.
Demonstração.
Provamos apenas (iv), as demais sentenças se demonstram de maneira análoga.
Por definição, ⋃𝑥 = {𝑧|(∃𝑤)(𝑤 ∈ 𝑥 ∧ 𝑧 ∈ 𝑤)}. Fazendo 𝜓(𝑧) ≡ (∃𝑤)(𝑤 ∈ 𝑥 ∧
𝑧 ∈ 𝑤) no Teorema 2.8, obtemos 𝑧 ∈ ⋃𝑥 ⟺ (∃𝑤)(𝑤 ∈ 𝑥 ∧ 𝑧 ∈ 𝑤). Q.E.D.
Dados dois conjuntos 𝑥 e 𝑦, podemos considerar um caso particular da união, no
qual se reúnem os membros de 𝑥 e 𝑦 num único conjunto, denotado por 𝑥 ∪ 𝑦, o que
corresponde, segundo a definição dada na seção anterior, a
𝑥 ∪ 𝑦 = 𝑧 ⟺ (∀𝑤)(𝑤 ∈ 𝑧 ⟺ 𝑤 ∈ 𝑥 ∨ 𝑤 ∈ 𝑦).
No entanto, ainda não provamos que tal conjunto existe. Com efeito, podemos
considerar o par não ordenado {𝑥, 𝑦} e tomar ⋃{𝑥, 𝑦}. Como os únicos membros de {𝑥, 𝑦} são
𝑥 e 𝑦, tem-se que ⋃{𝑥, 𝑦} = 𝑥 ∪ 𝑦 segundo a Definição 2.6. Analogamente ⋂{𝑥, 𝑦} é um
conjunto cujos membros pertencem a 𝑥 e a 𝑦, isto é, ⋂{𝑥, 𝑦} = 𝑥 ∩ 𝑦 segundo a Definição
2.10. Provamos a existência de 𝑥 ∪ 𝑦 e 𝑥 ∩ 𝑦 no teorema seguinte.
Teorema 2.15. Sejam 𝑥 e 𝑦 conjuntos quaisquer.
(i) (∀𝑧)(𝑧 ∈ ⋃{𝑥, 𝑦} ⟺ 𝑧 ∈ 𝑥 ∨ 𝑧 ∈ 𝑦);
(ii) (∀𝑧)(𝑧 ∈ ⋂{𝑥, 𝑦} ⟺ 𝑧 ∈ 𝑥 ∧ 𝑧 ∈ 𝑦).
Demonstração.
Pela Proposição 2.3 (iv), temos
𝑧 ∈ ⋃{𝑥, 𝑦} ⟺ (∃𝑤)(𝑤 ∈ {𝑥, 𝑦} ∧ 𝑧 ∈ 𝑤),
52
daí, devido ao item (i) da Proposição 2.3,
𝑧 ∈ ⋃{𝑥, 𝑦} ⟺ (∃𝑤)�(𝑤 = 𝑥 ∨ 𝑤 = 𝑦) ∧ 𝑧 ∈ 𝑤� ⟺ 𝑧 ∈ 𝑥 ∨ 𝑧 ∈ 𝑦,
o que prova o item (i) do teorema.
Da Proposição 2.3 (i), temos 𝑥 ∈ {𝑥, 𝑦}, donde segue {𝑥, 𝑦} ≠ ∅. Logo, existe
⋂{𝑥, 𝑦}. Se 𝑧 ∈ ⋂{𝑥, 𝑦} então 𝑧 deve pertencer a todos os membros de {𝑥, 𝑦}, ou seja, 𝑧 ∈ 𝑥 e
𝑧 ∈ 𝑦. Reciprocamente, se 𝑧 ∈ 𝑥 e 𝑧 ∈ 𝑦, então 𝑧 pertence a todos os membros de {𝑥, 𝑦}.
Mostramos assim que (ii) é verdadeiro. Q.E.D.
Corolário 2.2. Para quaisquer conjuntos 𝑥 e 𝑦 são verdadeiras as igualdades
seguintes
(i) 𝑥 ∪ 𝑦 = ⋃{𝑥, 𝑦} = {𝑧|𝑧 ∈ 𝑥 ∨ 𝑧 ∈ 𝑦};
(ii) 𝑥 ∩ 𝑦 = ⋂{𝑥, 𝑦} = {𝑧|𝑧 ∈ 𝑥 ∧ 𝑧 ∈ 𝑦}.
Demonstração.
A validade de todos os itens decorre diretamente do teorema anterior, da
Definição 2.6 e Definição 2.10. Q.E.D.
No mesmo sentido da Proposição 2.3 temos o seguinte resultado.
Proposição 2.4. Sejam 𝑥 e 𝑦 conjuntos quaisquer. Então:
(i) (∀𝑧)(𝑧 ∈ 𝑥 ∪ 𝑦⟺ 𝑧 ∈ 𝑥 ∨ 𝑧 ∈ 𝑦);
(ii) (∀𝑧)(𝑧 ∈ 𝑥 ∩ 𝑦⟺ 𝑧 ∈ 𝑥 ∧ 𝑧 ∈ 𝑦).
Demonstração.
Análoga à demonstração da Proposição 2.3 (iv). Q.E.D.
Provamos a seguir uma série de propriedades dos conjuntos definidos até aqui,
todas decorrentes do Teorema 2.9 e das definições por abstração adotadas.
Proposição 2.5. Sejam 𝑥, 𝑦 e 𝑧 conjuntos quaisquer. As seguintes igualdades são
verdadeiras:
(i) 𝑥 ∪ 𝑥 = 𝑥 (Idempotência da união);
(ii) 𝑥 ∩ 𝑥 = 𝑥 (Idempotência da interseção);
(iii) {𝑥, 𝑦} = {𝑦, 𝑥};
(iv) 𝑥 ∪ 𝑦 = 𝑦 ∪ 𝑥 (Comutatividade da união);
(v) 𝑥 ∩ 𝑦 = 𝑦 ∩ 𝑥 (Comutatividade da interseção);
53
(vi) (𝑥 ∪ 𝑦) ∪ 𝑧 = 𝑥 ∪ (𝑦 ∪ 𝑧) (Associatividade da união);
(vii) (𝑥 ∩ 𝑦) ∩ 𝑧 = 𝑥 ∩ (𝑦 ∩ 𝑧) (Associatividade da interseção);
(viii) 𝑥 ∪ ∅ = 𝑥;
(ix) 𝑥 ∩ ∅ = ∅;
(x) 𝑥 ∖ ∅ = 𝑥;
(xi) 𝑥 ∖ 𝑥 = ∅;
(xii) {𝑣|𝑣 ≠ 𝑣} = ∅.
Demonstração.
Pelo Teorema 2.9 e pelas equivalências lógicas listadas abaixo, as igualdades
indicadas entre parênteses seguem de imediato.
(i) 𝑤 ∈ 𝑥 ∨ 𝑤 ∈ 𝑥 ⟺ 𝑤 ∈ 𝑥;
(ii) 𝑤 ∈ 𝑥 ∧ 𝑤 ∈ 𝑥 ⟺ 𝑤 ∈ 𝑥;
(iii) 𝑤 = 𝑥 ∨ 𝑤 = 𝑦⟺ 𝑤 = 𝑦 ∨ 𝑤 = 𝑥;
(iv) 𝑤 ∈ 𝑥 ∨ 𝑤 ∈ 𝑦⟺ 𝑤 ∈ 𝑦 ∨ 𝑤 ∈ 𝑥;
(v) 𝑤 ∈ 𝑥 ∧ 𝑤 ∈ 𝑦⟺ 𝑤 ∈ 𝑦 ∧ 𝑤 ∈ 𝑥;
(viii) 𝑤 ∈ 𝑥 ∨ 𝑤 ∈ ∅⟺ 𝑤 ∈ 𝑥;
(ix) 𝑤 ∈ 𝑥 ∧ 𝑤 ∈ ∅⟺ 𝑤 ∈ ∅;
(x) 𝑤 ∈ 𝑥 ∧ 𝑤 ∉ ∅⟺ 𝑤 ∈ 𝑥;
(xi) 𝑤 ∈ 𝑥 ∧ 𝑤 ∉ 𝑥 ⟺ 𝑤 ∈ ∅.
A validade de (vi) e (vii) decorre dos itens (i) e (ii) da Proposição 2.4, da
associatividade da disjunção e da conjunção lógica, bem como pela transitividade da
equivalência aliada ao Axioma da Extensão.
Finalmente, provemos (xii). Claramente “𝑥 ≠ 𝑥 ⟹ 𝑥 ∈ ∅” é uma implicação
verdadeira. Logo, {𝑥|𝑥 ≠ 𝑥} existe. Pelo Teorema 2.8, inferimos que 𝑦 ∈ {𝑥|𝑥 ≠ 𝑥} se, e
somente se, 𝑦 ≠ 𝑦. Portanto, não existe 𝑦 tal que 𝑦 ∈ {𝑥|𝑥 ≠ 𝑥} e assim, devido à Definição
2.3, concluímos que {𝑥|𝑥 ≠ 𝑥} = ∅. Q.E.D.
Na próxima proposição, citamos alguns resultados propostos por Suppes (1972, p.
29) sobre a diferença entre conjuntos10, mas não os provamos, haja vista que não influenciam
10 Ver também Hrbacek & Jech (1999, p. 15) e Kuratowski & Mostowski (1976, p. 11-12) para outras propriedades da diferença entre conjuntos.
54
diretamente o desenvolvimento do trabalho. Além disso, suas demonstrações não diferem em
aspectos significativos se comparadas com as provas dos teoremas anteriores.
Proposição 2.6. Sejam 𝑥 e 𝑦 conjuntos quaisquer. As seguintes igualdades são
verdadeiras:
(i) 𝑥 ∖ (𝑥 ∩ 𝑦) = 𝑥 ∖ 𝑦;
(ii) 𝑥 ∩ (𝑥 ∖ 𝑦) = 𝑥 ∖ 𝑦;
(iii) (𝑥 ∩ 𝑦) ∖ 𝑦 = ∅;
(iv) (𝑥 ∖ 𝑦) ∩ 𝑦 = ∅.
Teorema 2.16. (∀𝑥)¬(∃𝑦)(∀𝑧)(𝑧 ∈ 𝑦 ⟺ 𝑧 ∉ 𝑥).
Demonstração.
Seja 𝑥 um conjunto qualquer. Suponha, por absurdo, que exista 𝑦 tal que
[†] (∀𝑧)(𝑧 ∈ 𝑦⟺ 𝑧 ∉ 𝑥).
Obviamente, [†] equivale a
[††] (∀𝑧)(𝑧 ∈ 𝑥 ⟺ 𝑧 ∉ 𝑦).
Tomando então 𝑣 = 𝑥 ∪ 𝑦, obtemos de [†], [††] e do item (i) da Proposição 2.4
que
(∀𝑧)(𝑧 ∈ 𝑥 ∨ 𝑧 ∉ 𝑥) ⟺ (∀𝑧)(𝑧 ∈ 𝑥 ∨ 𝑧 ∈ 𝑦) ⟺ (∀𝑧)(𝑧 ∈ 𝑣),
o que contraria o Teorema 2.1. Absurdo. Q.E.D.
O teorema acima exclui em ZFC a existência de um conjunto complementar
universal, da forma 𝒱 = {𝑥|𝑥 ∉ 𝐴}, para qualquer conjunto 𝐴. O argumento utilizado para a
demonstração foi adaptado de FRAENKEL, BAR-HILLEL & LEVY (1973, p. 41).
Os próximos resultados referem-se à inclusão e à inclusão própria dos conjuntos
definidos até aqui. Baseamo-nos principalmente em Hrbacek & Jech (1999) e Suppes (1972),
nos quais as demonstrações omitidas abaixo podem ser encontradas.
Proposição 2.7. Sejam 𝑤, 𝑥, 𝑦, e 𝑧 conjuntos arbitrários. As inclusões abaixo são
verdadeiras:
(i) ∅ ⊆ 𝑥;
(ii) ∅ ∈ ℘(𝑥);
55
(iii) 𝑥 ⊆ 𝑥 (Reflexividade da inclusão);
(iv) 𝑥 ∈ ℘(𝑥);
(v) 𝑥 ⊆ ∅⟺ 𝑥 = ∅;
(vi) 𝑥 ⊆ 𝑦 ∧ 𝑦 ⊆ 𝑧 ⟹ 𝑥 ⊆ 𝑧 (Transitividade da inclusão);
(vii) 𝑥 ⊂ 𝑦⟹ 𝑥 ⊆ 𝑦;
(viii) ¬(𝑥 ⊂ 𝑥) (Irreflexividade da inclusão própria);
(ix) 𝑥 ⊂ 𝑦⟹ ¬(𝑦 ⊂ 𝑥) (Assimetria da inclusão própria);
(x) 𝑥 ⊂ 𝑦 ∧ 𝑦 ⊂ 𝑧 ⟹ 𝑥 ⊂ 𝑧 (Transitividade da inclusão própria);
(xi) 𝑥 ∩ 𝑦 ⊆ 𝑥;
(xii) 𝑥 ∩ 𝑦 ⊆ 𝑦;
(xiii) 𝑥 ⊆ 𝑥 ∪ 𝑦;
(xiv) 𝑦 ⊆ 𝑥 ∪ 𝑦;
(xv) 𝑥 ∩ 𝑦 ⊆ 𝑥 ∪ 𝑦;
(xvi) 𝑥 ∩ 𝑦 = 𝑥 ⟺ 𝑥 ⊆ 𝑦;
(xvii) 𝑥 ∪ 𝑦 = 𝑦 ⟺ 𝑥 ⊆ 𝑦;
(xviii) 𝑥 ⊆ 𝑧 ∧ 𝑦 ⊆ 𝑤 ⟹ 𝑥 ∪ 𝑦 ⊆ 𝑧 ∪𝑤;
(xix) 𝑥 ∈ 𝑦⟺ {𝑥} ⊆ 𝑦 ⟺ {𝑥} ∈ ℘(𝑦);
(xx) 𝑥 ∈ 𝑧 ∧ 𝑦 ∈ 𝑤 ⟹ {𝑥, 𝑦} ⊆ 𝑧 ∪𝑤.
(xxi) 𝑥 ⊆ 𝑦⟺ ℘(𝑥) ⊆ ℘(𝑦);
(xxii) ℘(𝑥) ∪ ℘(𝑦) ⊆ ℘(𝑥 ∪ 𝑦);
(xxiii) 𝑦 ∈ 𝑥 ⟹ ⋂𝑥 ⊆ 𝑦;
(xxiv) 𝑦 ∈ 𝑥 ⟹ 𝑦 ⊆ ⋃𝑥;
(xxv) (𝑦 ∈ 𝑥 ∧ 𝑦 ⊆ 𝑧) ⟹ ⋂𝑥 ⊆ 𝑧;
(xxvi) 𝑥 ≠ ∅⟹ ⋂𝑥 ⊆ ⋃𝑥.
Demonstração.
Provamos apenas os itens (v), (vi), (xviii), (xix) (xx) e (xxvi). Os demais são
imediatos. Abaixo, 𝑢 denota um conjunto qualquer.
(v) Seja 𝑥 ⊆ ∅ e suponha que exista 𝑢 ∈ 𝑥. Da Definição 2.7, segue que 𝑢 ∈
∅, absurdo. Assim, não existe 𝑢 pertencente a 𝑥. Logo, 𝑥 = ∅. A recíproca segue da
afirmação (iii) desta proposição.
56
(vi) Seja 𝑢 ∈ 𝑥 qualquer. Como 𝑥 ⊆ 𝑦, inferimos da Definição 2.7 que 𝑢 ∈ 𝑦,
daí, como 𝑦 ⊆ 𝑧, da definição de inclusão obtemos 𝑢 ∈ 𝑧. Assim, 𝑢 ∈ 𝑥 ⟹ 𝑢 ∈ 𝑧 e, portanto,
𝑥 ⊆ 𝑧.
(xviii) Tome 𝑢 ∈ 𝑥 ∪ 𝑦. Então 𝑢 ∈ 𝑥 ou 𝑢 ∈ 𝑦. Se 𝑢 ∈ 𝑥, temos da hipótese que
𝑢 ∈ 𝑧, se 𝑢 ∈ 𝑦 então a hipótese nos dá 𝑢 ∈ 𝑤. Logo, 𝑢 ∈ 𝑥 ∪ 𝑦⟹ 𝑢 ∈ 𝑧 ∪𝑤 e, portanto,
𝑥 ∪ 𝑦 ⊆ 𝑧 ∪𝑤.
(xix) Suponha que 𝑥 ∈ 𝑦 e tome 𝑢 ∈ {𝑥}. Segue da Proposição 2.3 (ii) que
𝑢 ∈ {𝑥} se, e só se 𝑢 = 𝑥, e daí 𝑢 ∈ 𝑦. Assim, 𝑢 ∈ {𝑥} ⟹𝑢 ∈ 𝑦, ou seja, {𝑥} ⊆ 𝑦. Se
{𝑥} ⊆ 𝑦, todo membro de {𝑥} deve pertencer a 𝑦; como 𝑥 é membro de {𝑥}, concluímos que
𝑥 ∈ 𝑦. Decorre da Proposição 2.3 (v) que {𝑥} ⊆ 𝑦⟺ {𝑥} ∈ ℘(𝑦). Mostramos assim que
𝑥 ∈ 𝑦 ⟺ {𝑥} ⊆ 𝑦 e {𝑥} ⊆ 𝑦⟺ {𝑥} ∈ ℘(𝑦), donde obtemos a equivalência proposta pela
transitividade desta relação lógica.
(xxvi) Como 𝑥 ≠ ∅, existe 𝑡 ∈ 𝑥, donde faz sentido considerar ⋂𝑥. Se ⋂𝑥 = ∅,
então não há o que provar. Se existe 𝑢 ∈ ⋂𝑥, então da Proposição 2.3 (vi) inferimos que
𝑢 ∈ 𝑣 , para todo 𝑣 ∈ 𝑥, em particular 𝑢 ∈ 𝑡 e 𝑡 ∈ 𝑥 , logo 𝑢 ∈ ⋃𝑥 . Portanto, ⋂𝑥 ⊆ ⋃𝑥 .
Q.E.D.
Observação: A inclusão contrária em (xxii) é verdadeira se, e somente se, 𝑥 ⊆ 𝑦
ou 𝑦 ⊆ 𝑥. De fato, se ℘(𝑥 ∪ 𝑦) ⊆ ℘(𝑥) ∪℘(𝑦), então 𝑧 ⊆ 𝑥 ∪ 𝑦 implica em 𝑧 ⊆ 𝑥 ∨ 𝑧 ⊆ 𝑦;
daí, como 𝑥 ∪ 𝑦 ⊆ 𝑥 ∪ 𝑦, segue que 𝑥 ∪ 𝑦 ⊆ 𝑥 ou 𝑥 ∪ 𝑦 ⊆ 𝑦, donde obtemos 𝑥 ⊆ 𝑦 ou 𝑦 ⊆
𝑥. A recíproca é imediata.
Como contraexemplo, podemos considerar 𝑥 = {1, 2} e 𝑦 = {3}. Notemos
primeiramente que 𝑥 ⊄ 𝑦 e 𝑦 ⊄ 𝑥. Por um lado, temos ℘(𝑥) = �∅, {1}, {2}, {1, 2}�, ℘(𝑦) =
�∅, {3}� e 𝑥 ∪ 𝑦 = {1, 2, 3}. Por outro lado, ℘(𝑥) ∪℘(𝑦) = �∅, {1}, {2}, {3}, {1, 2}�,
enquanto ℘(𝑥 ∪ 𝑦) = �∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}�.
Proposição 2.8.
(i) ℘(∅) = {∅};
(ii) ℘({∅}) = �∅, {∅}�;
(iii) ⋃{𝑥} = ⋂{𝑥} = 𝑥;
(iv) ∅ ∈ 𝑥 ⟹ ⋂𝑥 = ∅.
Demonstração.
Pelos resultados já obtidos, inferimos:
57
(i) 𝑦 ∈ ℘(∅) ⟺𝑦 ⊆ ∅⟺ 𝑦 = ∅ ⟺ 𝑦 ∈ {∅}, a igualdade provém de (A1).
(ii) É claro que 𝑦 ∈ ℘({∅}) ⟺ 𝑦 ⊆ {∅}; os únicos casos possíveis são 𝑦 = ∅
e 𝑦 = {∅}. Portanto 𝑦 ∈ ℘({∅}) ⟺𝑦 = ∅ ∨ 𝑦 = {∅} ⟺ 𝑦 ∈ �∅, {∅}�, donde se conclui por
(A1) que ℘({∅}) = �∅, {∅}�;
(iii) 𝑥 = 𝑥 ∩ 𝑥 = ⋂{𝑥, 𝑥} = ⋂{𝑥} e 𝑥 = 𝑥 ∪ 𝑥 = ⋃{𝑥, 𝑥} = ⋃{𝑥}.
(iv) Suponha por absurdo que exista 𝑦 ∈ ⋂𝑥, então para qualquer 𝑢 ∈ 𝑥 tem-se
𝑦 ∈ 𝑢, mas ∅ ∈ 𝑥, o que contraria a Definição 2.3, logo (∀𝑦)(𝑦 ∉ ⋂𝑥), ou seja, ⋂𝑥 = ∅.
Q.E.D.
Tratamos brevemente sobre as relações de distributividade entre a interseção, a
união e a diferença entre conjuntos no capítulo seguinte. Fazemos isso, pois, munidos do
conceito de função podemos interpretar conjuntos como contradomínios indexados, o que nos
fornece uma notação mais conveniente e intuitiva para ⋃𝑥 e ⋂𝑥 e, consequentemente, permite
dar mais sentido a tais leis. Por ora, discutimos o produto externo do conjunto 𝑥.
Para um conjunto arbitrário 𝑡, podemos definir o subconjunto 𝑇𝔓 de ℘(⋃𝑡) cujos
membros são todos os conjuntos que contém exatamente um único elemento de cada membro
de 𝑡. Em outras palavras, 𝑇𝔓 é constituído de todos os subconjuntos 𝑧 de ⋃𝑡 tais que para
qualquer 𝑣 ∈ 𝑡 tenha-se necessariamente 𝑣 ∩ 𝑧 um conjunto unitário. Fraenkel, Bar-Hillel &
Levy (1973, p. 40) definem tal conjunto por
𝑇𝔓 = {𝑧 ∈ ℘(⋃𝑡)|𝔓(𝑧)}, 𝔓(𝑧) ≡ (∀𝑣)�𝑣 ∈ 𝑡 ⟹ (∃𝑢)(𝑣 ∩ 𝑧 = {𝑢})�;
quando 𝑡 é uma família disjunta, 𝑇𝔓 é indicado por ∏𝑡 e denominado pelos autores de produto
externo (outer product).
Observemos que se 𝑧 ⊆ ⋃𝑡, então todo membro de 𝑧 é necessariamente membro
de algum membro de 𝑡. Assim, a condição 𝔓(𝑧) pode ser interpretada como “escolher
exatamente um elemento em cada membro de 𝑡”, o que justifica denominar os membros de
∏𝑡 como conjuntos seleção de 𝑡. Todavia, apesar de (A2) nos permitir separar os elementos
de ℘(⋃𝑡) que satisfazem 𝔓(𝑧), sem assumir (A8) não é possível de modo geral coletar os
elementos de ⋃𝑡 num subconjunto 𝑐 tal que 𝔓(𝑐), pois podem existir vários conjuntos 𝑐 com
tal propriedade. De fato,
[…] suponha que 𝑐 ⊆ ⋃𝑡 seja do tipo desejado [tal que 𝔓(𝑐) ] e tome 𝑦 ∈ 𝑐 de algum 𝑢 ∈ 𝑡; então, substituindo 𝑦 por um elemento diferente 𝑦′ do mesmo conjunto 𝑢 ∈ 𝑡 obtemos um novo subconjunto 𝑐′ ⊆ ⋃𝑡, diferente de 𝑐 , embora também
58
possua a propriedade desejada [isto é, 𝔓(𝑐′)]. Então, ao contrário dos subconjuntos determinados pelo Axioma dos Subconjuntos [Axioma da Separação], os subconjuntos de ⋃𝑡 para nosso propósito não são unicamente determinados. (FRAENKEL, BAR-HILLEL, & LEVY, 1973, p. 54, tradução nossa, grifo nosso).
Frisamos que a unicidade da determinação à qual os autores se referem acima diz
respeito ao próprio subconjunto e não aos seus elementos. Com efeito, num conjunto da forma
{𝑥|𝜓(𝑥)} podem existir diversos elementos que satisfaçam 𝜓, isto não é errado; no entanto, 𝜓
determina no máximo um único conjunto.
No próximo teorema, provamos que em ZFC, se 𝑡 for uma família disjunta, vale a
equivalência ∅ ∉ 𝑡 se, e somente se, ∏𝑡 ≠ ∅.
Teorema 2.17. Seja 𝑡 uma família disjunta não vazia. Então ∅ ∉ 𝑡 ⟺ ∏𝑡 ≠ ∅.
Demonstração.
Suponha que ∅ ∈ 𝑡. Se existisse algum elemento 𝑧 ∈ ∏𝑡, para todo elemento 𝑠 de
𝑡, 𝑠 ∩ 𝑧 deveria ser um conjunto unitário, mas ∅ ∈ 𝑡 e assim 𝑧 ∩ ∅ deveria ser um conjunto
não vazio, absurdo. Assim ∅ ∈ 𝑡 ⟹ ∏𝑡 = ∅ e, pela contrapositiva, obtemos
[†] ∏𝑡 ≠ ∅ ⟹ ∅ ∉ 𝑡.
Provemos a recíproca. Suponha ∅ ∉ 𝑡. Como 𝑡 é uma família disjunta, segue que
(∀𝑥)�𝑥 ∈ 𝑡 ⟹ ��𝑥 ≠ ∅ ∧ (∀𝑦)(𝑦 ∈ 𝑡 ∧ 𝑦 ≠ 𝑥)� ⟹ 𝑥 ∩ 𝑦 = ∅��,
logo, pelo Axioma da Escolha,
(∃𝑢)(∀𝑤)�𝑤 ∈ 𝑡 ⟹ (∃! 𝑧)(𝑧 ∈ 𝑤 ∩ 𝑢)�.
Basta então tomar 𝑐 = 𝑢 ∩℘(⋃𝑡), claramente 𝑐 ∈ ∏𝑡 e assim ∏𝑡 ≠ ∅. Portanto,
[††] ∅∉ 𝑡 ⟹ ∏𝑡 ≠ ∅.
Segue de [†] e [††] que ∅ ∉ 𝑡 ⟺ ∏𝑡 ≠ ∅. Q.E.D.
Definição 2.19. A igualdade
�𝑤�(∃𝑣1)…(∃𝑣𝑛)�𝑤 = 𝜏(𝑣1,…, 𝑣𝑛) ∧ 𝜑(𝑣1 ,…, 𝑣𝑛)�� = {𝜏(𝑣1,…, 𝑣𝑛)|𝜑(𝑣1,…, 𝑣𝑛)}
é verdadeira se, e somente se, as seguintes condições forem satisfeitas:
(i) 𝑣1,…, 𝑣𝑛 são quaisquer variáveis distintas;
59
(ii) 𝜏(𝑣1,…, 𝑣𝑛) é qualquer termo no qual não ocorrem variáveis ligadas e
exatamente 𝑣1,…, 𝑣𝑛 ocorrem livres;
(iii) 𝑤 não ocorre na fórmula 𝜑;
(iv) (∃𝑏)(∀𝑤)�(∃𝑣1)…(∃𝑣𝑛)�𝑤 = 𝜏(𝑣1,…, 𝑣𝑛) ∧ 𝜑(𝑣1,…, 𝑣𝑛)�⟹ 𝑤 ∈ 𝑏�.
A definição acima, adaptada de Suppes (1972), se destina a formalizar notações
mais simples, como ℙ = {2𝑛|𝑛 ∈ ℕ}, por exemplo, o conjunto dos números naturais pares.
Caso não adotássemos tal definição, deveríamos escrever ℙ = {𝑛|(∃𝑚)(𝑚 ∈ ℕ)∧ 𝑛 = 2𝑚},
um excesso de notação que não traz benefício à teoria.
Ressaltamos que a condição (iv) da Definição 2.19 exige que a sentença
(∃𝑣1)…(∃𝑣𝑛)�𝑤 = 𝜏(𝑣1,…, 𝑣𝑛) ∧ 𝜑(𝑣1,…, 𝑣𝑛)� defina um conjunto, nas condições do
Teorema 2.7. Tal notação é de grande valia para definir, por exemplo, o produto cartesiano de
dois conjuntos, o que fazemos a seguir.
Vimos na Proposição 2.5 (iii) que, para quaisquer conjuntos 𝑥 e 𝑦, {𝑥, 𝑦} =
{𝑦, 𝑥}. Tal propriedade é na verdade ainda mais forte, pois, se {𝑥, 𝑦} = {𝑎, 𝑏}, então 𝑥 = 𝑎 e
𝑦 = 𝑏 ou 𝑥 = 𝑏 e 𝑦 = 𝑎. Ou seja, a ordem em que se dispõe os conjuntos 𝑥 e 𝑦 em {𝑥, 𝑦} é
irrelevante; deve-se à tal característica a nomenclatura dada ao conjunto {𝑥, 𝑦}. Provamos tal
propriedade dos pares não ordenados a seguir.
Teorema 2.18. Sejam os conjuntos 𝑎, 𝑏, 𝑥 e 𝑦 arbitrários. Se {𝑥, 𝑦} = {𝑎, 𝑏},
então 𝑥 = 𝑎 e 𝑦 = 𝑏 ou 𝑥 = 𝑏 e 𝑦 = 𝑎.
Demonstração.
Já vimos que 𝑥 ∈ {𝑥, 𝑦} e 𝑦 ∈ {𝑥, 𝑦}. Como {𝑥, 𝑦} = {𝑎, 𝑏} inferimos que
[†] 𝑥 ∈ {𝑎, 𝑏} ⟺ 𝑥 = 𝑎 ∨𝑥 = 𝑏;
[††] 𝑦 ∈ {𝑎, 𝑏} ⟺𝑦 = 𝑎 ∨ 𝑦 = 𝑏.
Temos dois casos a considerar.
Se 𝑥 = 𝑦, [†] e [††] implicam respectivamente que 𝑥 = 𝑎 ou 𝑥 = 𝑏 e 𝑦 = 𝑎 ou
𝑦 = 𝑏. Mas 𝑥 = 𝑦, então 𝑥 = 𝑎 = 𝑏 = 𝑦, o que satisfaz ambas as igualdades propostas pelo
teorema.
Se 𝑥 ≠ 𝑦, então por [†], 𝑥 = 𝑎 ou 𝑥 = 𝑏. Se 𝑥 = 𝑎, então por [††] inferimos que
𝑦 = 𝑏 e 𝑦 ≠ 𝑎, pois se 𝑦 = 𝑎 então 𝑦 = 𝑎 = 𝑥, o que contraria a hipótese de que 𝑥 ≠ 𝑦.
Obtemos assim que 𝑥 = 𝑎 ∧ 𝑦 = 𝑏. Se 𝑥 = 𝑏, então por [††] deduzimos que 𝑦 = 𝑎 e 𝑦 ≠ 𝑏,
pois se 𝑦 = 𝑏 então 𝑦 = 𝑏 = 𝑥, absurdo. Logo, 𝑥 = 𝑏 ∧ 𝑦 = 𝑎. Q.E.D.
60
Corolário 2.3. (∀𝑥)(∀𝑦)({𝑥} = {𝑦} ⟹ 𝑥 = 𝑦).
Demonstração.
Decorre imediatamente do Teorema 2.18. Q.E.D.
A pergunta natural então é se existe algum conjunto da forma [𝑥, 𝑦] tal que
[𝑥, 𝑦] = [𝑎, 𝑏] se, e somente se, 𝑥 = 𝑎 e 𝑦 = 𝑏, isto é, no qual a ordem dos elementos
dispostos entre [ , ] seja relevante. A resposta é afirmativa.
Definição 2.20. ⟨𝑥, 𝑦⟩= �{𝑥}, {𝑥, 𝑦}�11.
Teorema 2.19. (∀𝑥)(∀𝑦)(∀𝑣)(∀𝑤)�⟨𝑥, 𝑦⟩= ⟨𝑣, 𝑤⟩ ⟹ (𝑥 = 𝑣 ∧ 𝑦 = 𝑤)�.
Demonstração.
Pela Definição 2.20, ⟨𝑥, 𝑦⟩ = ⟨𝑣, 𝑤⟩ equivale a �{𝑥}, {𝑥, 𝑦}� = �{𝑣}, {𝑣, 𝑤}� e
então, pelo Teorema 2.18 segue que:
[†] ({𝑥} = {𝑣} ∧ {𝑥, 𝑦} = {𝑣, 𝑤}) ∨ ({𝑥} = {𝑣, 𝑤}∧ {𝑥, 𝑦} = {𝑣}).
Há então dois casos a considerar em [†].
Se {𝑥} = {𝑣} e {𝑥, 𝑦} = {𝑣, 𝑤}, segue da primeira igualdade e do Corolário 2.3
que 𝑥 = 𝑣 e, da segunda igualdade, inferimos novamente do Teorema 2.18 que
(𝑥 = 𝑣 ∧ 𝑦 = 𝑤) ∨ (𝑥 = 𝑤 ∧ 𝑦 = 𝑣),
mas, como já obtivemos 𝑥 = 𝑣 , concluímos que 𝑥 = 𝑣 ∧ 𝑦 = 𝑤, como queríamos.
Se {𝑥} = {𝑣, 𝑤} e {𝑥, 𝑦} = {𝑣}, decorre que {𝑥, 𝑥} = {𝑣, 𝑤} e {𝑥, 𝑦} = {𝑣, 𝑣},
donde, obtemos
(𝑥 = 𝑣 ∧ 𝑥 = 𝑤) ∧ (𝑣 = 𝑥 ∧ 𝑣 = 𝑦),
ou seja, 𝑥 = 𝑣 = 𝑦 = 𝑤, em particular 𝑥 = 𝑣 e 𝑦 = 𝑤. Q.E.D.
O conjunto ⟨𝑥, 𝑦⟩ definido acima é chamado de par ordenado de 𝑥 e 𝑦, onde 𝑥 é a
primeira coordenada e 𝑦 é a segunda coordenada do par. É comum na literatura matemática
encontrá-lo escrito como (𝑥, 𝑦) em vez de ⟨𝑥, 𝑦⟩. A notação que adotamos de Suppes mostra-
11 Esta definição, elaborada por Kazimierz Kuratowski em 1921, foi historicamente importante para a teoria axiomática dos conjuntos por permitir tratar de relações e funções 𝑛-árias como conjuntos e, por conseguinte, ampliar o “alcance” da Teoria dos Conjuntos na Matemática. (FERREIRÓS, 2007).
61
se interessante por evitar equívocos com os símbolos de pontuação do alfabeto de nossa
linguagem objeto. De qualquer forma, o que importa no par ordenado é a propriedade que ele
possui e não a forma como o transcrevemos.
Sendo ⟨𝑥, 𝑦⟩ um par ordenado, podemos pensar num conjunto de pares ordenados
que possuam a primeira e segunda coordenadas pertencentes respectivamente a conjuntos 𝐴 e
𝐵, previamente dados. É exatamente isso o que se faz ao definir o produto cartesiano dos
conjuntos 𝐴 e 𝐵. A fim de embasar tal definição, provamos o teorema seguinte.
Lema 2.1. (∀𝑥)(∀𝑦)({𝑥} ∪ {𝑦} = {𝑥, 𝑦}).
Demonstração.
De fato, para 𝑢 qualquer, 𝑢 ∈ {𝑥, 𝑦} se, e somente se, 𝑢 = 𝑥 ou 𝑢 = 𝑦. Contudo,
𝑢 = 𝑥 ou 𝑢 = 𝑦 se, e somente se, 𝑢 ∈ {𝑥} ou 𝑢 ∈ {𝑦}, o que por sua vez equivale a afirmar
que 𝑢 ∈ {𝑥}∪ {𝑦}. Q.E.D.
Teorema 2.20.
(∃𝑋)(∀𝐴)(∀𝐵)(∀𝑥)�(∃𝑎)(∃𝑏)(𝑥 = ⟨𝑎, 𝑏⟩ ∧ 𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵) ⟹ 𝑥 ∈ 𝑋�.
Demonstração.
Suponha que existam 𝑎 ∈ 𝐴 e 𝑏 ∈ 𝐵 tais que 𝑥 = ⟨𝑎, 𝑏⟩. Vamos provar que
𝑥 ∈ ℘�℘(𝐴∪ 𝐵)�, donde o resultado seguirá pelo Teorema 2.7.
Por definição, ⟨𝑎, 𝑏⟩ = �{𝑎}, {𝑎, 𝑏}�. Pelos resultados obtidos até aqui, temos
𝑎 ∈ 𝐴 ⟹ {𝑎} ⊆ 𝐴⟹ {𝑎} ⊆ 𝐴 ∪𝐵 ⟹ {𝑎} ∈ ℘(𝐴 ∪𝐵) ⟹
⟹ �{𝑎}� ⊆ ℘(𝐴∪ 𝐵).
Por outro lado, pela Proposição 2.7 (xx),
𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵 ⟹ {𝑎, 𝑏} ⊆ 𝐴∪ 𝐵 ⟹ {𝑎, 𝑏} ∈ ℘(𝐴 ∪𝐵) ⟹
⟹ �{𝑎, 𝑏}� ⊆ ℘(𝐴 ∪𝐵).
Decorre da Proposição 2.7 (xviii) que �{𝑎}� ∪ �{𝑎, 𝑏}� ⊆ ℘(𝐴 ∪𝐵), o que
equivale a afirmar que �{𝑎}� ∪ �{𝑎, 𝑏}� ∈ ℘�℘(𝐴 ∪𝐵)�.
Enfim, pelo lema anterior, �{𝑎}� ∪ �{𝑎, 𝑏}� = �{𝑎}, {𝑎, 𝑏}�. Como ⟨𝑎, 𝑏⟩ =
�{𝑎}, {𝑎, 𝑏}� e ⟨𝑎, 𝑏⟩ = 𝑥, concluímos que 𝑥 ∈ ℘(℘(𝐴∪ 𝐵). Q.E.D.
Definição 2.21. 𝐴 × 𝐵 = {⟨𝑥, 𝑦⟩|𝑥 ∈ 𝐴∧ 𝑦 ∈ 𝐵}.
62
Temos assim o produto cartesiano de 𝐴 por 𝐵, cujos elementos são todos os pares
ordenados ⟨𝑥, 𝑦⟩ com 𝑥 ∈ 𝐴 e 𝑦 ∈ 𝐵. Vale frisar que Kunen (1980) obtém o conjunto 𝐴 × 𝐵
por meio de um método diferente, utilizando o Axioma do Par e o Axioma da Substituição em
vez do Axioma das Partes.
Os próximos resultados apenas formalizam suas propriedades imediatas;
demonstrações podem ser encontradas em Suppes (1972).
Proposição 2.9. Sejam 𝐴, 𝐵 e 𝐶 conjuntos quaisquer. As seguintes igualdades são
verdadeiras:
(i) (∀𝑥)�𝑥 ∈ 𝐴 × 𝐵 ⟺ (∃𝑎)(∃𝑏)(𝑥 = ⟨𝑎, 𝑏⟩ ∧ 𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵)�;
(ii) (∀𝑎)(∀𝑏)(⟨𝑎, 𝑏⟩ ∈ 𝐴 × 𝐵 ⟺ 𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵);
(iii) 𝐴 × 𝐵 = ∅ ⟺ 𝐴 = ∅ ∨ 𝐵 = ∅;
(iv) 𝐴 × 𝐵 = 𝐵 × 𝐴 ⟺ 𝐴 = ∅ ∨ 𝐵 = ∅ ∨ 𝐴 = 𝐵;
(v) 𝐴 ≠ ∅ ∧ 𝐴× 𝐵 ⊆ 𝐴 × 𝐶 ⟹ 𝐵 ⊆ 𝐶.
Com o par ordenado, podemos também definir “trios” (ou ternas) e “quartetos”
ordenados, fazendo ⟨𝑥, 𝑦, 𝑧⟩ = ⟨⟨𝑥, 𝑦⟩, 𝑧⟩ e ⟨𝑥, 𝑦, 𝑧, 𝑡⟩ = ⟨⟨𝑥, 𝑦, 𝑧⟩, 𝑡⟩ respectivamente, e daí
definirmos 𝐴 × 𝐵 × 𝐶 = (𝐴× 𝐵) × 𝐶 e 𝐴× 𝐵 × 𝐶 × 𝐷 = (𝐴 × 𝐵 × 𝐶) × 𝐷. No quarto
capítulo, com o advento dos números naturais, definimos 𝑛-úplas e produtos cartesianos de 𝑛
termos, para 𝑛 ∈ ℕ qualquer.
63
Capítulo 3 — Relações e Funções
Intuitivamente uma relação binária é qualquer coisa que de certa forma conecta
dois objetos e, de maneira geral, uma relação 𝑛-ária é algo que conecta 𝑛 elementos. Ao
formalizar tal conceito matematicamente, o significado da ligação entre os objetos fica de
certa forma em segundo plano, de tal maneira que restringimos nosso interesse na ordem que
eles assumem na relação. Neste capítulo, estudamos as propriedades básicas das relações em
ZFC. No que segue, baseamo-nos principalmente em Hrbacek & Jech (1999).
3.1. Relações
Por importarmo-nos com a ordem assumida pelos elementos numa relação,
definimos relação binária como sendo um conjunto cujos elementos são pares ordenados; uma
relação ternária é um conjunto constituído por ternas ordenadas e assim sucessivamente. No
entanto, como 𝑛-úplas ordenadas podem ser consideradas pares ordenados, as relações 𝑛-árias
são, sob certo sentido, relações binárias. De tal observação, segue a próxima definição.
Definição 3.1. 𝑅 é uma relação ⟺ (∀𝑎)�𝑎 ∈ 𝑅 ⟹ (∃𝑥)(∃𝑦)(𝑎 = ⟨𝑥, 𝑦⟩)�.
Assim, o conjunto 𝐴 = {⟨1, 2⟩, ⟨⋆ , ∎⟩, ⟨∅, {∅}⟩} é uma relação, pois todos os seus
elementos são pares ordenados. Também podemos considerar ingenuamente como relação o
“conjunto” 𝒫 = {⟨𝑥, 𝑦⟩|𝑥 é pai de 𝑦}. Adotamos letras maiúsculas para representar relações
com o intuito de distingui-las das coordenadas de seus pares ordenados. Definimos a seguir
uma notação conveniente para nos referirmos a elementos pertencentes a uma relação 𝑅.
Definição 3.2. Sejam 𝑅 uma relação e 𝑥, 𝑦 conjuntos quaisquer. Se ⟨𝑥, 𝑦⟩ ∈ 𝑅
dizemos que 𝑥 está em relação 𝑅 com 𝑦, ou ainda que 𝑦 é imagem de 𝑥 na relação 𝑅, e
indicamos por 𝑥𝑅𝑦.
Obviamente, o conjunto vazio é uma relação (por vacuidade). Da Definição 3.1, é
imediato que qualquer subconjunto de uma relação é também uma relação, bem como para
duas relações quaisquer, a interseção, a reunião e a diferença entre elas são também relações,
64
haja vista seus membros serem todos pares ordenados. Formalizamos tais observações na
próxima proposição; suas demonstrações seguem do que discutimos neste parágrafo.
Proposição 3.1. Sejam 𝑅 e 𝑇 relações quaisquer, então:
(i) Se 𝑆 ⊆ 𝑅, então 𝑆 é uma relação;
(ii) ∅ é uma relação;
(iii) 𝑅 ∩ 𝑇 é uma relação;
(iv) 𝑅 ∪ 𝑇 é uma relação;
(v) 𝑅 ∖ 𝑇 é uma relação.
A seguir, definimos importantes conjuntos para o estudo das relações e funções.
Em todos os casos abaixo, 𝑅 denota uma relação.
Definição 3.3. 𝔇(𝑅) = {𝑥|(∃𝑦)(𝑥𝑅𝑦)}.
Definição 3.4. ℑ(𝑅) = {𝑦|(∃𝑥)(𝑥𝑅𝑦)}.
Definição 3.5. 𝔉(𝑅) = 𝔇(𝑅) ∪ ℑ(𝑅).
Os conjuntos 𝔇(𝑅), ℑ(𝑅) e 𝔉(𝑅) são denominados respectivamente como
domínio de 𝑅, imagem de 𝑅 e campo de 𝑅.
A rigor, apenas definir os conjuntos acima não é suficiente para garantir a
existência deles em ZFC. Devemos provar que as fórmulas que estipulamos para tais
conjuntos satisfazem a condição imposta pelo Teorema 2.7.
Teorema 3.1. Seja 𝑅 uma relação. Então:
(i) (∃𝐴)(∀𝑥)�(∃𝑦)(𝑥𝑅𝑦) ⟹ 𝑥 ∈ 𝐴�;
(ii) 𝑥 ∈ 𝔇(𝑅) ⟺ (∃𝑦)(𝑥𝑅𝑦);
(iii) (∃𝐵)(∀𝑦)�(∃𝑥)(𝑥𝑅𝑦) ⟹𝑦 ∈ 𝐵�;
(iv) 𝑦 ∈ ℑ(𝑅) ⟺ (∃𝑥)(𝑥𝑅𝑦);
(v) 𝔇(𝑅) ≠ ∅ ⟺ ℑ(𝑅) ≠ ∅;
Demonstração.
(i) Suponha que exista 𝑦 tal que 𝑥𝑅𝑦, isto é, tal que ⟨𝑥, 𝑦⟩ ∈ 𝑅. Como
⟨𝑥, 𝑦⟩ = �{𝑥}, {𝑥, 𝑦}�, temos {𝑥} ∈ ⟨𝑥, 𝑦⟩, mas ⟨𝑥, 𝑦⟩ é um membro de 𝑅, logo {𝑥} ∈ ⋃𝑅.
Analogamente, 𝑥 ∈ {𝑥} e {𝑥} é um elemento de ⋃𝑅, donde segue que 𝑥 ∈ ⋃(⋃𝑅). Portanto,
basta tomar 𝐴 = ⋃(⋃𝑅).
65
(ii) Análoga à demonstração da Proposição 2.3 (iv).
(iii) Suponha que exista 𝑥 tal que ⟨𝑥, 𝑦⟩ ∈ 𝑅. Então {𝑥, 𝑦} ∈ ⟨𝑥, 𝑦⟩, mas
⟨𝑥, 𝑦⟩ ∈ 𝑅, donde segue que {𝑥, 𝑦} ∈ ⋃𝑅. Novamente, como 𝑦 ∈ {𝑥, 𝑦} e {𝑥, 𝑦} ∈ ⋃𝑅,
obtemos 𝑦 ∈ ⋃(⋃𝑅). Portanto, 𝐵 = ⋃(⋃𝑅).
(iv) Decorre do Teorema 2.8.
(v) Suponha que exista 𝑥 ∈ 𝔇(𝑅). Pelo item (ii), existe 𝑦 tal que 𝑥𝑅𝑦 e, por
(iv) obtemos 𝑦 ∈ ℑ(𝑅). Reciprocamente, se 𝑦 ∈ ℑ(𝑅), então existe 𝑥 tal que 𝑥𝑅𝑦 donde se
conclui que 𝑥 ∈ 𝔇(𝑅). Q.E.D.
O teorema anterior, além de garantir a existência de 𝔇(𝑅) e ℑ(𝑅) como conjuntos
em ZFC, nos fornece uma importante equivalência: o domínio de uma relação é vazio se, e
somente se, sua imagem é vazia. Assim, não é possível que uma relação tenha domínio vazio
e imagem não vazia e vice versa. Outra consequência do teorema anterior é a seguinte,
utilizada por Kuratowski & Mostowski (1976, p. 64) como definição de relação.
Teorema 3.2. 𝑅 é uma relação se, e somente se, existem conjuntos 𝐴 e 𝐵 tais que
𝑅 ⊆ 𝐴× 𝐵.
Demonstração.
Seja 𝑎 um elemento qualquer de 𝑅. Decorre da definição de relação que existem 𝑥
e 𝑦 tais que 𝑎 = ⟨𝑥, 𝑦⟩. Do teorema anterior, 𝑥 ∈ 𝔇(𝑅) e 𝑦 ∈ ℑ(𝑅). Logo, ⟨𝑥, 𝑦⟩ pertence a
𝔇(𝑅) × ℑ(𝑅), isto é, 𝑎 ∈ 𝔇(𝑅) × ℑ(𝑅). Como 𝑎 é qualquer, provamos que existem 𝐴 =
𝔇(𝑅) e 𝐵 = ℑ(𝑅) tais que 𝑅 ⊆ 𝐴 × 𝐵.
Reciprocamente, sejam os conjuntos 𝐴 e 𝐵 e considere 𝐴 × 𝐵. Se 𝐴 × 𝐵 = ∅
então 𝐴× 𝐵 é uma relação. Se 𝐴 × 𝐵 ≠ ∅, então existe 𝑢 ∈ 𝐴 × 𝐵. Por definição, existem
𝑎 ∈ 𝐴 e 𝑏 ∈ 𝐵 tais que 𝑢 = ⟨𝑎, 𝑏⟩. Então, pela Definição 3.1, obtemos que 𝐴 × 𝐵 é uma
relação. Enfim, devido à Proposição 3.1 (i), concluímos que qualquer subconjunto 𝑅 de 𝐴 × 𝐵
é uma relação. Q.E.D.
No caso em que 𝑅 ⊆ 𝐴 × 𝐵, decorre imediatamente da Definição 3.3 e da
Definição 3.4 que 𝔇(𝑅) ⊆ 𝐴 e ℑ(𝑅) ⊆ 𝐵. Obviamente, como 𝔇(𝑅) e ℑ(𝑅) são conjuntos,
𝔉(𝑅) é um conjunto. Se 𝔉(𝑅) ⊆ 𝑥, diz-se que 𝑅 é uma relação em 𝑥 ou 𝑅 é uma relação
entre elementos de 𝑥.
Sejam 𝑅 e 𝑆 relações quaisquer, 𝐴 ⊆ 𝔇(𝑅) e 𝐵 ⊆ ℑ(𝑅) subconjuntos arbitrários.
Definimos abaixo uma série de importantes conjuntos no estudo das relações.
66
Definição 3.6. 𝑅[𝐴] = {𝑦 ∈ ℑ(𝑅)|(∃𝑥)(𝑥 ∈ 𝐴∧ 𝑥𝑅𝑦)}.
Definição 3.7. 𝑅−1[𝐵] = {𝑥 ∈ 𝔇(𝑅)|(∃𝑦)(𝑦 ∈ 𝐵 ∧ 𝑥𝑅𝑦)}.
Definição 3.8. 𝑅 ↾ 𝐴 = {⟨𝑥, 𝑦⟩ ∈ 𝑅|𝑥 ∈ 𝐴}.
Definição 3.9. 𝑅−1 = {⟨𝑦, 𝑥⟩|𝑥𝑅𝑦}.
Definição 3.10. 𝑅 ∘ 𝑆 = {⟨𝑥, 𝑦⟩|(∃𝑧)(𝑥𝑆𝑧 ∧ 𝑧𝑅𝑦)}.
A Definição 3.6 nos dá o conjunto 𝑅[𝐴], o qual chamamos de imagem direta de 𝐴
em relação à 𝑅, que consiste de todos os membros da ℑ(𝑅) que são imagens dos elementos
de 𝐴. Analogamente, da Definição 3.7 temos 𝑅−1[𝐵], a imagem inversa de 𝐵 em relação à 𝑅,
subconjunto de 𝔇(𝑅) cujos membros estão em relação 𝑅 com os elementos de 𝐵.
De forma semelhante, da Definição 3.8 temos o conjunto 𝑅 ↾ 𝐴 ⊆ 𝑅, a restrição
de 𝑅 ao subconjunto 𝐴, cujos membros são todos os pares ordenados nos quais a primeira
coordenada pertence a 𝐴. Note que 𝑅 ↾ 𝐴 é uma relação, uma vez que 𝑅 ↾ 𝐴 ⊆ 𝑅, bem como
𝑅[𝐴] = ℑ(𝑅 ↾ 𝐴).
A Definição 3.9 estabelece o importante conceito de inversa da relação 𝑅, que
consiste basicamente em trocar a ordem dos pares ordenados da relação 𝑅, obtendo assim uma
nova relação, 𝑅−1. Outro modo de obter novas relações por meio de relações previamente
existentes é fornecido pela Definição 3.10: dadas duas relações 𝑅 e 𝑆, ⟨𝑥, 𝑦⟩ ∈ 𝑅 ∘ 𝑆 (ou
𝑥(𝑅 ∘ 𝑆)𝑦) se, e somente se, existir 𝑧, tal que 𝑥𝑆𝑧 e 𝑧𝑅𝑦 isto é, 𝑧 ∈ ℑ(𝑆) ∩ 𝔇(𝑅).
Obviamente, se ℑ(𝑆) ∩𝔇(𝑅) = ∅ então 𝑅 ∘ 𝑆 = ∅.
No próximo teorema, provamos que 𝑅−1 e 𝑅 ∘ 𝑆 existem em ZFC, no sentido do
Teorema 2.7.
Teorema 3.3. Sejam 𝑅 e 𝑆 relações.
(i) (∃𝐴)(∀𝑎)(∀𝑏)(⟨𝑎, 𝑏⟩ ∈ 𝑅 ⟹ ⟨𝑏, 𝑎⟩ ∈ 𝐴);
(ii) (∃𝐵)(∀𝑎)(∀𝑏)�(∃𝑐)(⟨𝑎, 𝑐⟩ ∈ 𝑆 ∧ ⟨𝑐, 𝑏⟩ ∈ 𝑅) ⟹ ⟨𝑎, 𝑏⟩ ∈ 𝐵�;
(iii) 𝑅−1 e 𝑅 ∘ 𝑆 são relações.
Demonstração.
Pelo Teorema 3.2, se 𝑅 e 𝑆 são relações, então
[†] 𝑅 ⊆ 𝔇(𝑅) × ℑ(𝑅) ∧ 𝑆 ⊆ 𝔇(𝑆) × ℑ(𝑆).
67
Assim, se ⟨𝑎, 𝑏⟩ ∈ 𝑅, temos 𝑎 ∈ 𝔇(𝑅) e 𝑏 ∈ ℑ(𝑅), donde segue pela Proposição
2.9 (ii) que ⟨𝑏, 𝑎⟩ ∈ ℑ(𝑅) × 𝔇(𝑅), o que prova (i).
Analogamente, se existe 𝑐 tal que ⟨𝑎, 𝑐⟩ ∈ 𝑆 e ⟨𝑐, 𝑏⟩ ∈ 𝑅, segue de [†] que
𝑎 ∈ 𝔇(𝑆) e 𝑏 ∈ ℑ(𝑅) e, portanto, ⟨𝑎, 𝑏⟩ ∈ 𝔇(𝑆) × ℑ(𝑅), o que valida (ii).
Decorre de (i) e (ii) que 𝑅−1 = {⟨𝑦, 𝑥⟩|𝑥𝑅𝑦} e 𝑅 ∘ 𝑆 = {⟨𝑥, 𝑦⟩|(∃𝑧)(𝑥𝑆𝑧 ∧ 𝑧𝑅𝑦)}
existem em ZFC. Por definição, qualquer membro de 𝑅−1 ou 𝑅 ∘ 𝑆 deve ser um par ordenado,
donde concluímos que 𝑅−1 e 𝑅 ∘ 𝑆 são relações, o que comprova (iii). Q.E.D.
Teorema 3.4. 𝑅 é uma relação ⟹ (𝑅−1)−1 = 𝑅.
Demonstração.
Como 𝑅 é uma relação, 𝑅−1 também é uma relação e, consequentemente,
(𝑅−1)−1 é uma relação. Da Definição 3.1, segue que
𝑎 ∈ (𝑅−1)−1 ⟹ (∃𝑥)(∃𝑦)(𝑎 = ⟨𝑥, 𝑦⟩),
daí, pela definição de inversa, decorre
𝑎 ∈ (𝑅−1)−1 ⟺ ⟨𝑥, 𝑦⟩ ∈ (𝑅−1)−1 ⟺ 𝑥(𝑅−1)−1𝑦⟺ 𝑦𝑅−1𝑥 ⟺
⟺ 𝑥𝑅𝑦 ⟺ ⟨𝑥, 𝑦⟩ ∈ 𝑅 ⟺ 𝑎 ∈ 𝑅.
A igualdade entre 𝑅 e (𝑅−1)−1 é consequência do Axioma da Extensão e da
transitividade da equivalência. Q.E.D.
Assim, por exemplo, em 𝐴 = {⟨1, 2⟩, ⟨⋆ , ∎⟩, ⟨∅, {∅}⟩}, temos 𝐴[{1, ⋆}] =
{2, ∎}, 𝐴−1��2, {∅}�� = {1, ∅}, 𝐴−1 = {⟨2, 1⟩, ⟨∎, ⋆⟩, ⟨{∅}, ∅⟩} e, tomando 𝐵 =
{⟨∎, ⋆⟩, ⟨𝑎, 1⟩, ⟨{∅}, 2⟩}, obtemos 𝐴 ∘ 𝐵 = {⟨∎, ∎⟩, ⟨𝑎, 2⟩} e 𝐵 ∘ 𝐴 = {⟨⋆ , ⋆⟩, ⟨∅, 2⟩}.
Naturalmente, relações binárias podem ser definidas por meio de condições em
duas variáveis, como por exemplo, a “relação” dada anteriormente, 𝒫 = {⟨𝑥, 𝑦⟩|𝑥 é pai de 𝑦},
no qual os “elementos” de 𝒫 são todos os pares ordenados ⟨𝑥, 𝑦⟩ que satisfazem a condição
“𝑥 é pai de 𝑦”. De fato, se admitíssemos classes próprias, bastaria fazer {⟨𝑥, 𝑦⟩|𝜓(𝑥, 𝑦)}.
Porém, pela Definição 2.14, se não existir um conjunto 𝑧 tal que 𝜓(𝑥, 𝑦)⟹ ⟨𝑥, 𝑦⟩ ∈ 𝑧, então
{⟨𝑥, 𝑦⟩|𝜓(𝑥, 𝑦)} não é um conjunto, embora possam existir elementos 𝑥 e 𝑦 tais que 𝜓(𝑥, 𝑦).
Por exemplo, em ZFC as relações de “igualdade” 𝐼 = {⟨𝑥, 𝑦⟩|𝑥 = 𝑦} e “inclusão”
𝒮 = {⟨𝐴, 𝐵⟩|𝐴 ⊆ 𝐵} não existem, apesar de existirem elementos satisfazendo às condições de
𝐼 e 𝒮. Pelo Teorema 2.1 é imediato que 𝐼 não existe. Provemos que 𝒮 não existe.
Suponha que 𝒮 = {⟨𝐴, 𝐵⟩|𝐴 ⊆ 𝐵} exista. Daí, pela Definição 2.14, a sentença
68
(∀𝑋)(∀𝑌)(⟨𝑋, 𝑌⟩ ∈ 𝒮 ⟺ 𝑋 ⊆ 𝑌)
é verdadeira. Entretanto, ∅ ⊆ 𝑌, para qualquer 𝑌. Assim, ⟨∅, 𝑌⟩ ∈ 𝒮 é verdadeiro para todo 𝑌,
donde concluímos que todo conjunto deve ser membro de ℑ(𝒮), o que é absurdo, pois
contraria o Teorema 2.1. Logo, 𝒮 não existe, como queríamos mostrar.
O próximo resultado, proposto por Fraenkel, Bar-Hillel & Levy (1973, p. 42),
fornece uma condição suficiente para garantir a existência de uma relação 𝑅 tal que 𝑥𝑅𝑦 ⟺
𝜓(𝑥, 𝑦).
Teorema 3.5. Seja 𝜓(𝑥, 𝑦) uma condição em 𝑥 e 𝑦. Se existir um conjunto 𝑧, tal
que
(∀𝑥)(∀𝑦)(𝜓(𝑥, 𝑦)⟹ {𝑥, 𝑦} ⊆ 𝑧),
então existe uma única relação 𝑅𝜓 , tal que 𝑥𝑅𝜓𝑦⟺ 𝜓(𝑥, 𝑦).
Demonstração.
Esta é apenas uma adaptação do Teorema 2.7.
Como por hipótese, 𝜓(𝑥, 𝑦)⟹ {𝑥, 𝑦} ⊆ 𝑧 para quaisquer 𝑥 e 𝑦, temos
𝜓(𝑥, 𝑦) ⟹ {𝑥, 𝑦} ⊆ 𝑧 ⟹ 𝑥 ∈ 𝑧 ∧ 𝑦 ∈ 𝑧 ⟹ ⟨𝑥, 𝑦⟩ ∈ 𝑧 × 𝑧.
Então basta definirmos 𝑅𝜓 = �𝑎�(∃𝑥)(∃𝑦)�𝜓(𝑥, 𝑦)� ∧ 𝑎 = ⟨𝑥, 𝑦⟩�, pois o
Teorema 2.7 garante que
𝑎 ∈ 𝑅𝜓 ⟺ (∃𝑥)(∃𝑦)�𝜓(𝑥, 𝑦)� ∧ 𝑎 = ⟨𝑥, 𝑦⟩,
ou equivalentemente, 𝑥𝑅𝜓𝑦⟺ 𝜓(𝑥, 𝑦). Notemos que, em vista da Definição 2.19, vale a
igualdade 𝑅𝜓 = {⟨𝑥, 𝑦⟩|𝜓(𝑥, 𝑦)}.Q.E.D.
Obviamente, se existirem uma relação 𝑅 e uma condição 𝜓(𝑥, 𝑦) tais que
𝑥𝑅𝑦⟺ 𝜓(𝑥, 𝑦), então existe um conjunto 𝑧 tal que 𝜓(𝑥, 𝑦) ⟹ {𝑥, 𝑦} ⊆ 𝑧 — a saber,
𝑧 = 𝔉(𝑅).
Podemos definir diversas relações sobre um dado conjunto. Por exemplo, para
qualquer conjunto 𝑋, 𝐼𝑑𝑋 = {⟨𝑥, 𝑦⟩ ∈ 𝑋 × 𝑋|𝑥 = 𝑦} é a relação de igualdade dos elementos
de 𝑋; temos também ⊂𝑋= {⟨𝑥, 𝑦⟩ ∈ 𝑋 × 𝑋|𝑥 ⊂ 𝑦}, a relação de inclusão própria entre os
elementos de 𝑋. Notemos que apesar de ambas serem relações, elas diferem quanto a algumas
propriedades de seus elementos.
69
Enquanto 𝑎𝐼𝑑𝑋𝑏 ⟺ 𝑏𝐼𝑑𝑋𝑎, e 𝑐 ∈ 𝑋 ⟹ 𝑐𝐼𝑑𝑋𝑐, temos 𝑎 ⊂𝑋 𝑏 ⟹ ¬(𝑏 ⊂𝑋 𝑎) e
𝑐 ∈ 𝑋 ⟹ ¬(𝑐 ⊂𝑋 𝑐). Apesar disso, as duas são “transitivas”, pois 𝑎𝐼𝑑𝑋𝑏 e 𝑏𝐼𝑑𝑋𝑐 implica
𝑎𝐼𝑑𝑋𝑐, bem como 𝑎 ⊂𝑋 𝑏 e 𝑏 ⊂𝑋 𝑐 é suficiente para 𝑎 ⊂𝑋 𝑐.
Vemos assim que as relações podem ser rotuladas de acordo com as propriedades
que possuem. As definições a seguir visam classificar os principais tipos de relações sobre um
conjunto arbitrário. Em todos os casos, assumimos 𝑅 como sendo uma relação em 𝑋 — isto é,
com 𝔉(𝑅) ⊆ 𝑋. Por simplicidade, a partir daqui escrevemos “𝑥, 𝑦 ∈ 𝑋” e “𝑥, 𝑦, 𝑧 ∈ 𝑋” em
vez de “𝑥 ∈ 𝑋 ∧ 𝑦 ∈ 𝑋” e “𝑥 ∈ 𝑋 ∧ 𝑦 ∈ 𝑋 ∧ 𝑧 ∈ 𝑋”, respectivamente, e assim por diante.
Definição 3.11. 𝑅 é reflexiva em 𝑋 ⟺ (∀𝑥)(𝑥 ∈ 𝑋 ⟹ 𝑥𝑅𝑥).
Definição 3.12. 𝑅 é irreflexiva em 𝑋 ⟺ (∀𝑥)�𝑥 ∈ 𝑋 ⟹ ¬(𝑥𝑅𝑥)�.
Definição 3.13. 𝑅 é simétrica em 𝑋 ⟺ (∀𝑥)(∀𝑦)(𝑥, 𝑦 ∈ 𝑋 ∧ 𝑥𝑅𝑦⟹ 𝑦𝑅𝑥).
Definição 3.14. 𝑅 é assimétrica em 𝑋 se, e somente se,
(∀𝑥)(∀𝑦)�𝑥, 𝑦 ∈ 𝑋 ∧ 𝑥𝑅𝑦⟹ ¬(𝑦𝑅𝑥)�.
Definição 3.15. 𝑅 é antissimétrica em 𝑋 se, e somente se,
(∀𝑥)(∀𝑦)�(𝑥, 𝑦 ∈ 𝑋 ∧ 𝑥𝑅𝑦 ∧ 𝑦𝑅𝑥) ⟹ 𝑥 = 𝑦�.
Definição 3.16. 𝑅 é transitiva em 𝑋 se, e somente se,
(∀𝑥)(∀𝑦)(∀𝑧)�(𝑥, 𝑦, 𝑧 ∈ 𝑋 ∧ 𝑥𝑅𝑦 ∧ 𝑦𝑅𝑧) ⟹ 𝑥𝑅𝑧�.
Definição 3.17. 𝑅 é uma equivalência sobre 𝑋 se, e somente se, 𝑅 é reflexiva,
simétrica e transitiva sobre 𝑋.
Definição 3.18. 𝑅 é uma ordem parcial em 𝑋 se, e somente se, 𝑅 é reflexiva,
antissimétrica e transitiva sobre 𝑋. Dizemos que ⟨𝑋, 𝑅⟩ é um conjunto parcialmente
ordenado.
Definição 3.19. 𝑅 é uma ordem estrita em 𝑋 se, e somente se, 𝑅 é assimétrica e
transitiva sobre 𝑋. Dizemos que ⟨𝑋, 𝑅⟩ é um conjunto estritamente ordenado.
70
Definição 3.20. Seja 𝑅 uma relação sobre 𝑋. Para quaisquer 𝑎, 𝑏 ∈ 𝑋, dizemos
que 𝑎 e 𝑏 são comparáveis na relação 𝑅 se, e somente se, 𝑎 = 𝑏, 𝑎𝑅𝑏 ou 𝑏𝑅𝑎. Caso
contrário, 𝑎 e 𝑏 são incomparáveis.
Definição 3.21. 𝑅 é conectada em 𝑋 se, e somente se,
(∀𝑥)(∀𝑦)�(𝑥, 𝑦 ∈ 𝑋 ∧ 𝑥 ≠ 𝑦) ⟹ 𝑥𝑅𝑦 ∨ 𝑦𝑅𝑥�.
Em outras palavras, 𝑅 é conectada se todos os elementos de 𝑋 são comparáveis.
Definição 3.22. 𝑅 é uma ordem linear (ou total) em 𝑋 se, e somente se, 𝑅 é
conectada e é uma ordem (parcial ou estrita) em 𝑋. Neste caso, dizemos que ⟨𝑋, 𝑅⟩ é um
conjunto linearmente (totalmente) ordenado.
Definição 3.23. 𝑅 é uma função se, e somente se,
𝑅 é uma relação ∧ (∀𝑥)(∀𝑦)(∀𝑧)�(𝑥𝑅𝑦 ∧ 𝑥𝑅𝑧) ⟹𝑦 = 𝑧�.
O estudo das relações pode ser exaustivamente aprofundado. Muitos teoremas
referentes aos vários tipos de relações definidas acima, bem como outros tipos de relações e
propriedades destas, podem ser encontrados em Suppes (1972) e Hrbacek & Jech (1999).
Neste trabalho, focamo-nos num tipo específico de relação de ordem (Capítulo 4) e nas
funções devido à sua importância para os números ordinais. Contudo, julgamos importante
uma breve discussão sobre relações de equivalência, o que fazemos na seção seguinte.
3.2. Relações de Equivalência
Relações de equivalência sobre um conjunto baseiam-se, em certo sentido, em
alguma noção de igualdade entre seus membros, o que permite “particionar” tal conjunto em
classes de equivalência. A rigor, definimos abaixo o que vêm a ser uma partição de um
conjunto, bem como uma classe de equivalência de uma relação de equivalência.
Definição 3.24. Seja 𝐴 ≠ ∅. Uma família 𝑆 ≠ ∅ é uma partição de 𝐴 se, e
somente se, 𝑆 possui as seguintes propriedades:
71
(i) (∀𝐵)(𝐵 ∈ 𝑆 ⟹ 𝐵 ≠ ∅);
(ii) (∀𝐶)(∀𝐷)�(𝐶, 𝐷 ∈ 𝑆 ∧ 𝐶 ≠ 𝐷) ⟹𝐶 ∩ 𝐷 = ∅�;
(iii) 𝐴 = ⋃𝑆.
Definição 3.25. Seja 𝐸 uma relação de equivalência sobre um conjunto 𝑋 ≠ ∅ e
𝑥 ∈ 𝑋 um elemento arbitrário. A classe de equivalência de 𝑥 módulo 𝐸 é o conjunto
[𝑥]𝐸 = {𝑦 ∈ 𝐴|𝑦𝐸𝑥};
o conjunto de todas as classes de equivalência é denotado por
𝑋/𝐸 = {[𝑥]𝐸 ∈ ℘(𝑋)|𝑥 ∈ 𝑋}.
O exemplo seguinte, sugerido por Hrbacek & Jech ilustra bem o que queremos
dizer.
Seja 𝑃 o conjunto de todas as pessoas vivendo na Terra. Dizemos que uma pessoa 𝑝 é equivalente a uma pessoa 𝑞 (𝑝 ≡ 𝑞) se 𝑝 e 𝑞 moram no mesmo país. Trivialmente, ≡ é reflexiva, simétrica e transitiva em 𝑃. Note que o conjunto 𝑃 pode ser quebrado em classes de elementos mutuamente equivalentes; todas as pessoas que moram nos Estados Unidos formam uma classe, todas as pessoas que moram na França determinam outra classe, etc. Todos os membros da mesma classe são mutuamente equivalentes; membros de diferentes classes nunca são equivalentes. As classes de equivalência correspondem exatamente aos diferentes países. (HRBACEK & JECH, 1999, p. 30, tradução nossa).
Reciprocamente, se um conjunto 𝐴 admite uma partição 𝑆, então podemos induzir
uma relação de equivalência em 𝐴, cujas classes de equivalência são exatamente os membros
de 𝑆. Formalizamos tais observações a seguir.
Lema 3.1. Seja 𝐸 uma relação de equivalência sobre um conjunto 𝑋 ≠ ∅, com 𝑥,
𝑦 ∈ 𝑋 quaisquer.
(i) [𝑥]𝐸 = [𝑦]𝐸 ⟺ 𝑥𝐸𝑦;
(ii) [𝑥]𝐸 ∩ [𝑦]𝐸 = ∅ ⟺ ¬(𝑥𝐸𝑦).
Demonstração.
(i) Se [𝑥]𝐸 = [𝑦]𝐸 então para qualquer 𝑤, 𝑤 ∈ [𝑥]𝐸 ⟺ 𝑤 ∈ [𝑦]𝐸, isto é,
𝑤𝐸𝑥 ⟺ 𝑤𝐸𝑦. Suponha 𝑤𝐸𝑥, então temos 𝑤𝐸𝑦, mas 𝐸 é simétrica, assim 𝑥𝐸𝑤 e 𝑤𝐸𝑦; da
transitividade de 𝐸 obtemos 𝑥𝐸𝑦.
72
Reciprocamente, suponha 𝑥𝐸𝑦. Para 𝑢 qualquer, temos 𝑢 ∈ [𝑥]𝐸 ⟺ 𝑢𝐸𝑥, como
𝑥𝐸𝑦 e 𝐸 é transitiva, inferimos 𝑢𝐸𝑦, o que equivale a 𝑢 ∈ [𝑦]𝐸. Logo, [𝑥]𝐸 ⊆ [𝑦]𝐸.
Analogamente mostra-se que [𝑦]𝐸 ⊆ [𝑥]𝐸. O resultado segue do Teorema 2.3.
(ii) Suponha [𝑥]𝐸 ∩ [𝑦]𝐸 = ∅. Se, por absurdo, 𝑥𝐸𝑦, teríamos pelo item
anterior que [𝑥]𝐸 = [𝑦]𝐸. Logo, [𝑥]𝐸 = [𝑦]𝐸 = ∅, o que é absurdo, uma vez que 𝑥 ∈ [𝑥]𝐸
— pois 𝑥𝐸𝑥. Assim,
(∗) [𝑥]𝐸 ∩ [𝑦]𝐸 = ∅⟹ ¬(𝑥𝐸𝑦).
Se [𝑥]𝐸 ∩ [𝑦]𝐸 ≠ ∅, segue que existe 𝑢 tal que 𝑢𝐸𝑥 e 𝑢𝐸𝑦. Da simetria e da
transitividade de 𝐸, obtemos 𝑥𝐸𝑦. Daí [𝑥]𝐸 ∩ [𝑦]𝐸 ≠ ∅ ⟹ 𝑥𝐸𝑦 donde, pela contrapositiva,
decorre
(∗∗) ¬(𝑥𝐸𝑦) ⟹ [𝑥]𝐸 ∩ [𝑦]𝐸 = ∅.
O resultado segue de (∗) e (∗∗). Q.E.D.
Teorema 3.6. Seja 𝑆 uma partição de um conjunto 𝑋 não vazio. Então o conjunto
𝐸𝑆 = {⟨𝑥, 𝑦⟩|(∃𝐶)(𝐶 ∈ 𝑆 ∧ 𝑥, 𝑦 ∈ 𝐶)}
é uma relação de equivalência em 𝑋. Além disso, 𝑋/𝐸𝑆 = 𝑆.
Demonstração.
Claramente 𝐸𝑆 é um conjunto (em particular, uma relação), pois 𝐸𝑆 ⊆ ⋃𝑆 × ⋃𝑆.
Devemos provar que 𝐸𝑆 é uma relação reflexiva, simétrica e transitiva sobre 𝑋.
Como 𝑆 é uma partição de 𝑋, segue que ⋃𝑆 = 𝑋; assim, para 𝑥 qualquer
pertencente a 𝑋, existe 𝐶 ∈ 𝑆 tal que 𝑥 ∈ 𝐶, logo 𝑥𝐸𝑆𝑥, isto é, 𝐸𝑆 é reflexiva.
Assumindo que 𝑥𝐸𝑆𝑦 para 𝑥, 𝑦 ∈ 𝑋 quaisquer, segue que existe 𝐶′ ∈ 𝑆 tal que 𝑥,
𝑦 ∈ 𝐶′. É claro que 𝑦, 𝑥 ∈ 𝐶′, e assim 𝑦𝐸𝑆𝑥 e, por conseguinte, 𝐸𝑆 é simétrica.
Se existirem 𝑥, 𝑦, 𝑧 ∈ 𝑋 tais que 𝑥𝐸𝑆𝑦 e 𝑦𝐸𝑆𝑧, então existem 𝐶1, 𝐶2 ∈ 𝑆 tais que
𝑥, 𝑦 ∈ 𝐶1 e 𝑦, 𝑧 ∈ 𝐶2. Assim 𝑦 ∈ 𝐶1 ∩ 𝐶2, mas como 𝑆 é uma partição, todos os membros de
𝑆 devem ser disjuntos, logo 𝐶1 = 𝐶2, donde segue que 𝑥, 𝑧 ∈ 𝐶1, ou seja, 𝑥𝐸𝑆𝑧 e, por
conseguinte, 𝐸𝑆 é transitiva.
Pelo que vimos, 𝐸𝑆 é uma relação de equivalência.
Provemos a igualdade 𝑋/𝐸𝑆 = 𝑆.
73
Tome 𝐴 ∈ 𝑋/𝐸𝑆 qualquer. Por definição existe 𝑥 ∈ 𝑋 tal que 𝑦 ∈ 𝐴 se, e somente
se, existe 𝐴 ∈ 𝑆 com 𝑥, 𝑦 ∈ 𝐴. Logo, para qualquer 𝑦 ∈ 𝐴 tem-se 𝑦 ∈ 𝐴, donde segue 𝐴 ⊆ 𝐴.
Da mesma forma, se 𝑦� ∈ 𝐴, então 𝑥, 𝑦� ∈ 𝐴, daí 𝐴 ⊆ 𝐴. Então 𝐴 = 𝐴, e assim 𝐴 ∈ 𝑆. Como 𝐴
é qualquer, mostramos que 𝑋/𝐸𝑆 ⊆ 𝑆.
Reciprocamente, tomemos 𝐵 ∈ 𝑆 qualquer e fixemos 𝑏 ∈ 𝐵. Como ⋃𝑆 = 𝑋,
segue que 𝑏 ∈ 𝑋 . Então existe 𝐵� = [𝑏]𝐸𝑆 tal que 𝑦 ∈ 𝐵� ⟺ 𝑦𝐸𝑆𝑏. Para qualquer 𝑏′ ∈ 𝐵,
temos 𝑏, 𝑏′ ∈ 𝐵 e daí 𝑏′𝐸𝑆𝑏, isto é, 𝑏′ ∈ 𝐵� , donde segue que 𝐵 ⊆ 𝐵� . Obviamente, se 𝑏� ∈ 𝐵�
então 𝑏 e 𝑏� pertencem ao mesmo conjunto de 𝑆 e, como 𝑆 é uma partição de 𝑋 e 𝑏 ∈ 𝐵,
concluímos que 𝑏� ∈ 𝐵, logo 𝐵� ⊆ 𝐵. Assim, 𝐵 = 𝐵� e 𝐵 ∈ 𝑋/𝐸𝑆, donde segue que 𝑆 ⊆ 𝑋/𝐸𝑆.
Q.E.D.
Teorema 3.7. Seja 𝐸 uma relação de equivalência num conjunto 𝑋. Então 𝑋/𝐸 é
uma partição de 𝑋. Além disso, 𝐸𝑋/𝐸 = 𝐸 (onde 𝐸𝑋/𝐸 é o conjunto definido no teorema
anterior obtido ao substituirmos 𝑆 por 𝑋/𝐸).
Demonstração.
Como 𝐸 é reflexiva, 𝑥 ∈ [𝑥]𝐸, para todo [𝑥]𝐸 ∈ 𝑋/𝐸, o que garante que todo
elemento de 𝑋/𝐸 é não vazio. Para 𝑎, 𝑏 ∈ 𝑋 quaisquer temos 𝑎𝐸𝑏 ou ¬(𝑎𝐸𝑏), donde
inferimos pelo Lema 3.1 que [𝑎]𝐸 = [𝑏]𝐸 ou [𝑎]𝐸 ∩ [𝑏]𝐸 = ∅: assim, elementos distintos de
𝑋/𝐸 são disjuntos.
Para 𝑥 ∈ 𝑋 qualquer tem-se 𝑥 ∈ [𝑥]𝐸, onde [𝑥]𝐸 é um membro de 𝑋/𝐸. Logo
𝑥 ∈ ⋃(𝑋/𝐸) e assim 𝑋 ⊆ ⋃(𝑋/𝐸). Obviamente, se 𝑤 ∈ ⋃(𝑋/𝐸), então existe 𝑊 ∈ 𝑋/𝐸 tal
que 𝑤 ∈ 𝑊; contudo 𝑊 ⊆ 𝑋 por definição, logo 𝑥 ∈ 𝑋 e assim ⋃(𝑋/𝐸)⊆ 𝑋. Portanto
⋃(𝑋 ∖ 𝐸) = 𝑋. Mostramos dessa forma que 𝑋/𝐸 satisfaz às três condições impostas pela
Definição 3.24, donde segue que 𝑋/𝐸 é uma partição de 𝑋.
Claramente 𝐸 = 𝐸𝑋/𝐸. De fato, 𝑥𝐸𝑦⟺ [𝑥]𝐸 = [𝑦]𝐸. Como 𝑥 ∈ [𝑥]𝐸 e 𝑦 ∈ [𝑦]𝐸,
obtemos 𝑥, 𝑦 ∈ [𝑥]𝐸, donde segue que 𝑥𝐸𝑋/𝐸𝑦, logo, 𝐸 ⊆ 𝐸𝑋/𝐸. A outra inclusão é imediata.
Q.E.D.
Algo muito conveniente ao se trabalhar com partições ou equivalências é ter um
conjunto de representantes das classes. É o que se faz em Álgebra com as relações de
divisibilidade em ℤ, e toma-se ℤ𝑚 = {0�, 1�,…, 𝑚− 1��������}, ou do exemplo anterior, caso
tomássemos o conjunto dos presidentes dos países da Terra. Formalmente, adotamos a
definição de Hrbacek & Jech (1999).
74
Definição 3.26. Seja 𝐸 uma relação de equivalência em 𝑋 ≠ ∅. Um conjunto
𝐴 ⊆ 𝑋 é chamado conjunto de representantes de 𝐸 se, e somente se, para todo 𝐶 ∈ 𝑋/𝐸,
𝐴 ∩ 𝐶 = {𝑎}, para algum 𝑎 ∈ 𝐶. Analogamente, se 𝑆 é uma partição de 𝑋, um conjunto
𝐵 ⊆ 𝑋 é dito um conjunto de representantes da partição 𝑆 se para todo 𝐷 ∈ 𝑆, 𝐵 ∩ 𝐷 = {𝑎}
para algum 𝑎 ∈ 𝐷.
Uma pergunta aparentemente simples é se toda relação de equivalência sobre
algum conjunto admite um conjunto de representantes. É preciso assumir o Axioma da
Escolha a fim de obter uma resposta para tal questionamento: ela é afirmativa, conforme
provamos abaixo. Encerramos esta seção com a demonstração de tal fato.
Teorema 3.8. Seja 𝐸 uma relação sobre um conjunto 𝑋 ≠ ∅. Existe um conjunto
de representantes de 𝐸.
Demonstração.
Chamemos de 𝑃 = 𝑋/𝐸 a partição de 𝑋, cuja existência é garantida pelo Teorema
3.7. Por definição, 𝑃 é uma família disjunta tal que ∅ ∉ 𝑡. Logo, pelo Axioma da Escolha,
[†] (∃𝑈)(∀𝑤)�𝑤 ∈ 𝑃 ⟹ (∃!𝑣)(𝑣 ∈ 𝑤 ∩𝑈)�.
Tomemos 𝐶 = {𝑎 ∈ 𝑈|𝑎 ∈ 𝑋} = 𝑈 ∩ 𝑋. Obviamente 𝐶 ⊆ 𝑋. Notemos que para
qualquer 𝑐 ∈ 𝑃, tem-se por [†] que 𝑐 ∩ 𝑈 = {𝑣}, para algum 𝑣 ∈ 𝑐. Entretanto, como 𝑐 ⊆ 𝑋
— pois 𝑐 é uma classe de equivalência de 𝑃 = 𝑋/𝐸 —, temos 𝑣 ∈ 𝑋, donde segue que
{𝑣} = (𝑐 ∩ 𝑈) ∩ 𝑋 = 𝑐 ∩ (𝑈 ∩𝑋) = 𝑐 ∩ 𝐶 .
Portanto, para cada 𝑐 ∈ 𝑃, existe um único 𝑣 ∈ 𝑐 tal que 𝐶 ∩ 𝑐 = {𝑣} e, pela
Definição 3.26, concluímos que 𝐶 é um conjunto de representantes de 𝐸. Q.E.D.
Observação: No Capítulo 5, provamos que o “Teorema 3.8” é equivalente ao
Axioma da Escolha.
75
3.3. Funções
Funções estão no cerne da Matemática e têm fundamental importância em
diversas áreas de estudo, como Análise, Álgebra e Topologia. Uma função 𝑓 é, grosso modo,
“uma regra que relaciona a cada elemento 𝑥 de uma coleção um único elemento”
(FRAENKEL, BAR-HILLEL, & LEVY, 1973, p. 43, tradução nossa). Assim, é natural
considerar funções como subcasos das relações definidas anteriormente, o que foi feito na
Definição 3.231.
Todos os conceitos definidos anteriormente para relações — como domínio,
imagem, campo, restrição, etc. —, estendem-se para funções, uma vez que toda função é, por
definição, uma relação. A seguir, estabelecemos importantes notações e “tipos” de funções.
Posteriormente, provamos alguns teoremas concernentes a tais definições. No que segue,
baseamo-nos, sobretudo, em Hrbacek & Jech (1999).
Definição 3.27. Seja 𝑓 uma função. Admitimos as seguintes notações para indicar
(𝑥, 𝑦) ∈ 𝑓:
(i) 𝑓(𝑥) = 𝑦;
(ii) 𝑓𝑥 = 𝑦.
Definição 3.28. Seja 𝑓 uma função. Se ℑ(𝑓)⊆ 𝐵 e 𝔇(𝑓) = 𝐴, admitem-se as
seguintes notações para indicar a função 𝑓:
(i) 𝑓:𝐴 ⟶ 𝐵;
(ii) ⟨𝑓(𝑎)|𝑎 ∈ 𝐴⟩;
(iii) ⟨𝑓𝑎|𝑎 ∈ 𝐴⟩;
(iv) ⟨𝑓𝑎⟩𝑎∈𝐴.
Definição 3.29. Seja 𝑓:𝐴 ⟶ 𝐵. Dizemos que:
(i) 𝑓 é injetora ⟺ (∀𝑥)(∀𝑦)�(𝑥, 𝑦 ∈ 𝐴∧ 𝑥 ≠ 𝑦) ⟹𝑓(𝑥) ≠ 𝑓(𝑦)�;
(ii) 𝑓 é sobrejetora ⟺ℑ(𝑓) = 𝐵;
1 Tal definição se deve a Giuseppe Peano, em seu trabalho Formulaire de Mathématiques (Formulário de Matemática), de 1895 (KURATOWSKI & MOSTOWSKI, 1976).
76
(iii) 𝑓 é bijetora ⟺ 𝑓 é injetora e sobrejetora.
Notemos que a Definição 3.27 está bem definida, pois se 𝑓 é uma função e
𝑥 ∈ 𝔇(𝑓), então existe um único 𝑦 ∈ ℑ(𝑓) tal que 𝑥𝑓𝑦, que então chamamos 𝑓(𝑥) ou 𝑓𝑥; diz-
se neste caso que 𝑓 leva 𝑥 em 𝑦, 𝑓 transforma 𝑥 em 𝑦, etc., mas comumente lê-se apenas 𝑓 de
𝑥.
Por sua vez, diz-se que 𝑓:𝐴 ⟶ 𝐵 é a função 𝑓 de 𝐴 em 𝐵, onde 𝐵 é o
contradomínio da função 𝑓. Vale ressaltar que se para alguma função 𝑓, 𝔇(𝑓) ⊂ 𝐴, não se
utiliza a notação 𝑓:𝐴 ⟶ 𝐵. Ainda, no caso (iii) da Definição 3.28, 𝑓 = ⟨𝑓𝑎|𝑎 ∈ 𝐴⟩ é dito um
sistema de conjuntos indexados por 𝐴, e ℑ(𝑓) = {𝑓𝑎|𝑎 ∈ 𝐴} é um conjunto indexado por 𝑓,
enquanto 𝐴 é o conjunto de índices.
Um exemplo que ilustra bem tal nomenclatura consiste em tomar 𝐴 = {1, 2, 3}, 𝐵
um conjunto qualquer não vazio e 𝑓:𝐴 ⟶ 𝐵 uma função arbitrária: temos assim ℑ(𝑓) =
{𝑏1, 𝑏2 , 𝑏3} ⊆ 𝐵, um subconjunto de 𝐵 cujos elementos estão “indexados” pelos membros de
𝐴.
Uma função injetora de 𝐴 em 𝐵 (ou injetiva, correspondência biunívoca de 𝐴 em
𝐵, ou ainda uma injeção), é uma relação na qual todo elemento da imagem de 𝑓 está
relacionado a um único membro do domínio 𝐴; o que justifica a nomenclatura predominante
na literatura inglesa, função um-para-um (one-to-one). Uma função sobrejetora de 𝐴 em 𝐵
(sobrejeção, ou simplesmente uma função de 𝐴 sobre 𝐵) é uma função que tem como imagem
todo o contradomínio da função — obviamente, como ℑ(𝑓) = 𝑓[𝐴], tem-se que 𝑓:𝐴 ⟶ 𝑓[𝐴]
sempre é uma sobrejeção. Enfim, uma função bijetora de 𝐴 em 𝐵 (ou bijeção,
correspondência biunívoca de 𝐴 sobre 𝐵), é uma função na qual todo membro de 𝐴 está
relacionado a um único elemento de 𝐵 de tal maneira que todo elemento de 𝐵 é imagem de
algum membro de 𝐴. Tais funções constituem a pedra angular do estudo da equipotência entre
conjuntos.
Definição 3.30. Sejam 𝐴 e 𝐵 conjuntos quaisquer. 𝐴 ≾ 𝐵 se, e somente se, existir
uma função injetora 𝜑:𝐴 ⟶ 𝐵. Se 𝜑 for uma bijeção, dizemos que 𝐴 e 𝐵 são equipotentes
(ou têm a mesma cardinalidade), o que indicamos por 𝐴 ≈ 𝐵. Se 𝐴 ≾ 𝐵 e ¬(𝐵 ≾ 𝐴),
escrevemos 𝐴 ≺ 𝐵.
77
Como funções são relações, valem os mesmos conceitos de composição e inversa.
Contudo, enquanto a composta de duas funções é sempre uma função, o mesmo não vale para
a inversa de funções: elas existem, mas nem sempre são funções. Os teoremas a seguir
esclarecem estes e outros fatos.
Teorema 3.9 (Princípio da Extensionalidade Para Funções). Sejam as funções 𝑓 e
𝑔. Temos 𝑓 = 𝑔 se, e somente se, 𝔇(𝑓) = 𝔇(𝑔) e 𝑓(𝑥) = 𝑔(𝑥), para todo 𝑥 ∈ 𝔇(𝑓).
Demonstração.
Como 𝑓 e 𝑔 são funções, podemos dizer que, para um 𝑎 qualquer,
[†] 𝑎 ∈ 𝑓 ⟹ 𝑎 = ⟨𝑥, 𝑓(𝑥)⟩, 𝑎 ∈ 𝑔⟹ 𝑎 = ⟨𝑧, 𝑔(𝑧)⟩.
Suponha que 𝑓 = 𝑔. Assim,
[††] 𝑎 ∈ 𝑓 ⟺ 𝑎 ∈ 𝑔,
daí, por [†], segue que 𝑥 = 𝑧 e então 𝑓(𝑥) = 𝑔(𝑥). Além disso, temos
⟨𝑥, 𝑓(𝑥)⟩ ∈ 𝑓 ⟺ 𝑥 ∈ 𝔇(𝑓) e ⟨𝑥, 𝑔(𝑥)⟩ ∈ 𝑔 ⟺ 𝑥 ∈ 𝔇(𝑔),
donde, por [††], obtemos 𝑥 ∈ 𝔇(𝑓)⟺ 𝑥 ∈ 𝔇(𝑔). Assim, 𝔇(𝑓) = 𝔇(𝑔).
Reciprocamente, suponha 𝔇(𝑓) = 𝔇(𝑔) e 𝑓(𝑥) = 𝑔(𝑥) para todo 𝑥 ∈ 𝔇(𝑓). Seja
⟨𝑥, 𝑓(𝑥)⟩ ∈ 𝑓 arbitrário. Como 𝑥 ∈ 𝔇(𝑓), segue da hipótese que 𝑥 ∈ 𝔇(𝑔) e
consequentemente ⟨𝑥, 𝑔(𝑥)⟩ ∈ 𝑔; por outro lado, 𝑓(𝑥) = 𝑔(𝑥) e assim ⟨𝑥, 𝑓(𝑥)⟩ ∈ 𝑔. Por
termos tomado ⟨𝑥, 𝑓(𝑥)⟩ ∈ 𝑓 arbitrário, concluímos que 𝑓 ⊆ 𝑔. Analogamente mostra-se que
𝑔 ⊆ 𝑓, donde a igualdade segue-se. Q.E.D.
Lema 3.2. 𝑓 é função ⟹ (∀𝑥)(∀𝐴)�𝑥 ∈ 𝑓−1[𝐴] ⟺ (∃!𝑦)(𝑦 = 𝑓(𝑥) ∧ 𝑦 ∈ 𝐴)�.
Demonstração.
Pela Definição 3.7, se 𝑥 ∈ 𝑓−1[𝐴], então existe um único 𝑦 ∈ 𝐴 tal que 𝑦 = 𝑓(𝑥)
e 𝑓(𝑥) ∈ 𝐴. Reciprocamente, se existe um único 𝑦 tal que 𝑦 = 𝑓(𝑥), então 𝑥 ∈ 𝔇(𝑓) e por
𝑓(𝑥) ∈ 𝐴 segue que 𝑥 ∈ 𝑓−1[𝐴]. Q.E.D.
Teorema 3.10. Sejam as funções 𝑓 e 𝑔. Então 𝑔 ∘ 𝑓 é uma função. Além disso,
𝔇(𝑔 ∘ 𝑓) = 𝔇(𝑓) ∩ 𝑓−1[𝔇(𝑔)] e (𝑔 ∘ 𝑓)(𝑥) = 𝑔�𝑓(𝑥)�, para todo 𝑥 ∈ 𝔇(𝑔 ∘ 𝑓).
Demonstração.
78
Pelo Teorema 3.3 (iii), 𝑔 ∘ 𝑓 é uma relação. Provemos que 𝑔 ∘ 𝑓 é uma função.
Para tanto, seja 𝑥 ∈ 𝔇(𝑔 ∘ 𝑓) e suponha que existam 𝑦1, 𝑦2 ∈ ℑ(𝑔 ∘ 𝑓) tais que 𝑥(𝑔 ∘ 𝑓)𝑦1 e
𝑥(𝑔 ∘ 𝑓)𝑦2 . Pelo mesmo teorema, segue que existem 𝑧1 e 𝑧2 tais que
�†1� (𝑥𝑓𝑧1 ∧ 𝑧1𝑔𝑦1)∧ (𝑥𝑓𝑧2 ∧ 𝑧2𝑔𝑦2) ⟺ 𝑥(𝑔 ∘ 𝑓)𝑦1 ∧ 𝑥(𝑔 ∘ 𝑓)𝑦2 .
Como 𝑓 é função, 𝑧1 é único, isto é, 𝑧1 = 𝑧2 = 𝑓(𝑥). Assim,
�†2� �𝑥𝑓𝑧1 ∧ (𝑧1𝑔𝑦1 ∧ 𝑧1𝑔𝑦2) ∧ 𝑧1 = 𝑓(𝑥)�⟺ 𝑥(𝑔 ∘ 𝑓)𝑦1 ∧ 𝑥(𝑔 ∘ 𝑓)𝑦2 ,
e como 𝑔 também é função, segue que 𝑦1 = 𝑦2 — em particular, 𝑦1 = 𝑔(𝑧1) = 𝑔�𝑓(𝑥)�.
Logo, 𝑔 ∘ 𝑓 é função e, por �†2� temos ainda
�†3� 𝑥(𝑔 ∘ 𝑓)𝑦 ⟺ (𝑔 ∘ 𝑓)(𝑥) = 𝑦 ∧ 𝑦 = 𝑔�𝑓(𝑥)�.
Além disso, como 𝑓 e 𝑔 são funções, obtemos de �†1�, �†3� que
𝑥 ∈ 𝔇(𝑔 ∘ 𝑓) ⟺ (∃!𝑦)(∃! 𝑧)�𝑥𝑓𝑧∧ 𝑧𝑔𝑦 ∧ 𝑧 = 𝑓(𝑥)�⟺ 𝑥 ∈ 𝔇(𝑓) ∧ 𝑓(𝑥) ∈ 𝔇(𝑔),
o que equivale, pelo Lema 3.2, à
𝑥 ∈ 𝔇(𝑔 ∘ 𝑓) ⟺ 𝑥 ∈ 𝔇(𝑓) ∧ 𝑥 ∈ 𝑓−1[𝔇(𝑔)] ⟺ 𝑥 ∈ 𝔇(𝑓) ∩ 𝑓−1[𝔇(𝑔)];
a igualdade 𝔇(𝑔 ∘ 𝑓) = 𝔇(𝑓) ∩ 𝑓−1[𝔇(𝑔)] segue de (A1). Q.E.D.
Corolário 3.1. Sejam as funções 𝑓:𝐴 ⟶ 𝐵 e 𝑔:𝐶 ⟶ 𝐷. ℑ(𝑓)⊆ 𝐶 é uma
condição necessária e suficiente para que 𝑔 ∘ 𝑓:𝐴 ⟶ 𝐷.
Demonstração.
Suponha que 𝑔 ∘ 𝑓:𝐴 ⟶ 𝐷. Pelo teorema anterior, temos
𝔇(𝑔 ∘ 𝑓) = 𝔇(𝑓) ∩ 𝑓−1[𝔇(𝑔)] = 𝐴 ∩ 𝑓−1[𝐶] = 𝐴,
donde, pela Proposição 2.7 (xvi), inferimos 𝐴 ⊆ 𝑓−1[𝐶], isto é,
[†] (∀𝑥)(𝑥 ∈ 𝐴⟹ 𝑓(𝑥) ∈ 𝐶).
Tome então 𝑦 ∈ ℑ(𝑓) qualquer. Para tanto, existe 𝑥 ∈ 𝐴 tal que 𝑓(𝑥) = 𝑦, mas,
por [†], tem-se que 𝑓(𝑥) ∈ 𝐶. Logo, ℑ(𝑓)⊆ 𝐶.
Reciprocamente, assumamos ℑ(𝑓) ⊆ 𝐶. Decorre do Teorema 3.10 que
79
𝔇(𝑔 ∘ 𝑓) = 𝔇(𝑓) ∩ 𝑓−1[𝔇(𝑔)] = 𝐴 ∩ 𝑓−1[𝐶],
e assim 𝔇(𝑔 ∘ 𝑓) ⊆ 𝐴. Por outro lado, para 𝑥 qualquer, temos
𝑥 ∈ 𝐴 ⟺ 𝑥 ∈ 𝐴 ∧ 𝑥 ∈ 𝐴 ⟺ 𝑥 ∈ 𝐴 ∧ 𝑥 ∈ 𝔇(𝑓) ⟺ 𝑥 ∈ 𝐴 ∧ (∃!𝑦)(𝑦 ∈ ℑ(𝑓)∧ 𝑓(𝑥) = 𝑦),
contudo, ℑ(𝑓)⊆ 𝐶 por hipótese, donde segue que
𝑥 ∈ 𝐴⟹ 𝑥 ∈ 𝐴 ∧ (∃!𝑦)(𝑦 ∈ ℑ(𝑓) ∧ 𝑓(𝑥) = 𝑦) ⟹ 𝑥 ∈ 𝐴 ∧ (∃!𝑦)(𝑦 ∈ 𝐶 ∧ 𝑓(𝑥) = 𝑦) ⟹
⟹ 𝑥 ∈ 𝐴 ∧ 𝑥 ∈ 𝑓−1[𝐶] ⟹ 𝑥 ∈ 𝔇(𝑔 ∘ 𝑓).
Logo, 𝐴 ⊆ 𝔇(𝑔 ∘ 𝑓) e assim 𝐴 = 𝔇(𝑔 ∘ 𝑓) . Obviamente ℑ(𝑔∘ 𝑓) ⊆ 𝐷. Portanto,
𝑔 ∘ 𝑓:𝐴 ⟶ 𝐷. Q.E.D.
Corolário 3.2. Sejam 𝐴, 𝐵 e 𝐶 conjuntos não vazios, 𝑓:𝐴 ⟶ 𝐵 e 𝑔:𝐵 ⟶ 𝐶
funções quaisquer.
(i) Se 𝑓 e 𝑔 são injetoras então 𝑔 ∘ 𝑓 é injetora;
(ii) Se 𝑓 e 𝑔 são sobrejetoras então 𝑔 ∘ 𝑓 é sobrejetora;
(iii) Se 𝑓 e 𝑔 são bijetoras então 𝑔 ∘ 𝑓 é bijetora.
Demonstração.
Provamos apenas (i), pois (ii) se prova de maneira análoga e (iii) decorre dos itens
imediatamente anteriores. Pelo Corolário 3.1, 𝑔 ∘ 𝑓:𝐴 ⟶ 𝐶 (isto é, 𝑔 ∘ 𝑓 é função). Tomemos
𝑥1, 𝑥2 ∈ 𝐴 tais que (𝑔 ∘ 𝑓)(𝑥1)≠ (𝑔 ∘ 𝑓)(𝑥2). Temos 𝑔�𝑓(𝑥1)�≠ 𝑔�𝑓(𝑥2)�. Da injetividade
de 𝑔 segue 𝑓(𝑥1) ≠ 𝑓(𝑥2), da injetividade de 𝑓 segue 𝑥1 ≠ 𝑥2. Portanto, 𝑔 ∘ 𝑓 é injetora.
Q.E.D.
Teorema 3.112. Seja 𝑓 uma função de 𝐴 em 𝐵. 𝑓−1 é uma função de 𝐵 em 𝐴 se, e
somente se, 𝑓 é uma bijeção. Além disso, 𝑓−1 é bijetora e (𝑓−1)−1 = 𝑓.
Demonstração.
Suponha que 𝑓−1 seja uma função, com 𝔇(𝑓−1) = 𝐵 e ℑ(𝑓−1)⊆ 𝐴.
Seja 𝑦 ∈ 𝐵 qualquer. Como 𝑓−1 é função, existe um único 𝑥 ∈ ℑ(𝑓−1) tal que
𝑦𝑓−1𝑥, o que equivale a 𝑥𝑓𝑦 e daí 𝑦 ∈ ℑ(𝑓). Como 𝑦 é arbitrário, obtemos 𝐵 ⊆ ℑ(𝑓), no
2 Na maioria das obras consultadas para a realização deste trabalho, os autores propõem “𝑓−1 é função ⟺ 𝑓 é injetora”. Tal sentença não contradiz o Teorema 3.11, pois nele exigimos que 𝔇(𝑓−1) = 𝐵, o que não é cobrado pelos autores.
80
entanto, como ℑ(𝑓)⊆ 𝐵 por hipótese, concluímos que ℑ(𝑓) = 𝐵, donde segue que 𝑓 é
sobrejetora (∗).
Tomemos então 𝑦1, 𝑦2 ∈ ℑ(𝑓), onde 𝑥1𝑓𝑦1 e 𝑥2𝑓𝑦2 para certos 𝑥1, 𝑥2 ∈ 𝐴.
Suponha 𝑥1 ≠ 𝑥2. Temos 𝑦1𝑓−1𝑥1 e 𝑦2𝑓−1𝑥2. Como 𝑓−1 é função, segue que 𝑦1 ≠ 𝑦2 , do
contrário existiriam 𝑥1 ≠ 𝑥2 com 𝑦1𝑓−1𝑥1 e 𝑦1𝑓−1𝑥2, contrariando 𝑓−1 ser função. Logo,
𝑦1 ≠ 𝑦2 , isto é, 𝑓(𝑥1)≠ 𝑓(𝑥2). Assim, 𝑓 é injetora (∗∗).
Segue de (∗) e (∗∗) que 𝑓 é bijeção.
Reciprocamente, suponha que 𝑓:𝐴 ⟶ 𝐵 seja uma bijeção. Como 𝑓 é sobrejetora,
para todo 𝑦 ∈ 𝐵 existe 𝑥 ∈ 𝐴 tal que 𝑥𝑓𝑦, ou equivalentemente, 𝑦𝑓−1𝑥 e assim 𝔇(𝑓−1) = 𝐵.
Enfim, tome 𝑥1, 𝑥2 ∈ 𝐴 tais que 𝑦𝑓−1𝑥1 e 𝑦𝑓−1𝑥2 para algum 𝑦 ∈ 𝐵. Como 𝑓 é injetora
obtemos de 𝑥1𝑓𝑦 e 𝑥2𝑓𝑦 que 𝑥1 = 𝑥2, caso contrário 𝑓 não seria injetora. Portanto, 𝑓−1 é
função, como queríamos. Pelo Teorema 3.4, segue que (𝑓−1)−1 = 𝑓 e, pelo que vimos acima,
𝑓−1 é também bijetora. Q.E.D.
Corolário 3.3. Seja uma bijeção 𝑓 de 𝐴 em 𝐵. Então 𝑓(𝑥) = 𝑦 ⟺ 𝑓−1(𝑦) = 𝑥.
Demonstração.
Decorre imediatamente da definição de relação inversa. Q.E.D.
Observação: a inversa de uma função 𝑓 também pode ser caracterizada pela
avaliação do “resultado” da composição entre elas, isto é, se 𝑓:𝐴 ⟶ 𝐵 e 𝑔:𝐵 ⟶ 𝐴 são tais
que 𝑓 ∘ 𝑔 = 𝐼𝑑𝐵 e 𝑔 ∘ 𝑓 = 𝐼𝑑𝐴 , então 𝑔 = 𝑓−1. Tal caracterização é vista em detalhes, por
exemplo, por Lima (2009).
Corolário 3.4. Sejam 𝐴, 𝐵 e 𝐶 conjuntos quaisquer. Então:
(i) 𝐴 ≈ 𝐵 ⟹ 𝐴 ≾ 𝐵 ;
(ii) 𝐴 ≺ 𝐵 ⟹ 𝐴 ≾ 𝐵;
(iii) 𝐴 ≾ 𝐵 ∧ 𝐵 ≾ 𝐶 ⟹ 𝐴 ≾ 𝐶 (igualmente válido para ≺);
(iv) 𝐴 ≈ 𝐵 ⟺ 𝐵 ≈ 𝐴;
(v) 𝐴 ≈ 𝐵 ∧ 𝐵 ≈ 𝐶 ⟹ 𝐴 ≈ 𝐶;
(vi) 𝐴 × 𝐵 ≈ 𝐵 × 𝐴;
(vii) 𝐴 ≾ 𝐵 ⟹ ℘(𝐴) ≾ ℘(𝐵) (em particular, 𝐴 ≈ 𝐵 ⟹ ℘(𝐴) ≈ ℘(𝐵)).
Demonstração.
Como toda bijeção é também uma injeção, temos provado (i). (ii) decorre
imediatamente da definição. Os itens (iii), (iv) e (v) seguem imediatamente do Corolário 3.2 e
81
do Teorema 3.11. Obviamente, a função 𝑓: (𝐴× 𝐵) ⟶ (𝐵 × 𝐴) dada por 𝑓(⟨𝑎, 𝑏⟩) = ⟨𝑏, 𝑎⟩ é
uma bijeção, o que prova (vi). A validade de (vii) se obtém ao observar que se existe uma
injeção 𝑓:𝐴 ⟶ 𝐵, então a função 𝑔:℘(𝐴) ⟶℘(𝐵) dada por 𝑔(𝑆) = 𝑓[𝑆] para todo 𝑆 ⊆ 𝐴,
é uma injeção; se 𝑓 for bijetora, também 𝑔 será bijetora. Q.E.D.
Para mais propriedades sobre equipotência de conjuntos, sugerimos os resultados
propostos por Suppes (1972). O próximo lema visa estabelecer o Teorema de Cantor-
Bernstein: se 𝜓:𝐴 ⟶ 𝐵 e 𝜑:𝐵 ⟶ 𝐴 são injeções, então existe um bijeção Ω:𝐴⟶ 𝐵.
Adaptamos tais resultados de Miraglia (1991, p. 40) e Hrbacek & Jech (1999, p. 69).
Lema 3.3.
(i) (Teorema do Ponto Fixo de Tarski). Seja 𝜓:℘(𝐴) ⟶ ℘(𝐴) uma função
tal que se 𝑋 ⊆ 𝑌 ⊆ 𝐴 tenhamos 𝜓(𝑋) ⊆ 𝜓(𝑌). Nestas condições, existe 𝑉 ∈ ℘(𝐴) tal que
𝜓(𝑉) = 𝑉 (tal função 𝜓 é dita monótona, e o conjunto 𝑉 ∈ ℘(𝐴) é chamado de ponto fixo);
(ii) (∀𝑍)(∀𝐴)(∀𝐵)�(𝑍 ⊆ 𝐵 ∧ 𝐵 ⊆ 𝐴 ∧ 𝑍 ≈ 𝐴) ⟹ 𝐵 ≈ 𝐴�.
Demonstração.
Consideremos o conjunto 𝑇 = {𝑋 ⊆ 𝐴|𝑋 ⊆ 𝜓(𝑋)} e tomemos então 𝑋� = ⋃𝑇;
afirmamos que 𝑋� ∈ 𝑇. Primeiramente, notemos que para qualquer 𝑎 ∈ 𝑇, 𝑎 ⊆ 𝜓(𝑎) e da
condição imposta sobre 𝜓 segue que 𝜓(𝑎) ⊆ 𝜓�𝜓(𝑎)� e assim 𝜓(𝑎) ∈ 𝑇 .
Para 𝑧 ∈ 𝑇 qualquer, temos 𝑧 ⊆ 𝑋� e daí 𝑧 ⊆ 𝜓(𝑧)⊆ 𝜓(𝑋�), logo 𝑋� ⊆ 𝜓(𝑋�) e
dessa forma obtemos 𝑋� ∈ 𝑇 e 𝜓(𝑋�) ∈ 𝑇, isto é, 𝜓(𝑋�) = 𝑋�, provando (i).
Provemos (ii). Seja 𝑓:𝐴 ⟶ 𝑍 a bijeção obtida da hipótese de que 𝑍 ≈ 𝐴.
Definamos 𝐹:℘(𝐴) ⟶℘(𝐴) por 𝐹(𝑋) = (𝐴 ∖ 𝐵) ∪ 𝑓[𝑋], para todo 𝑋 ⊆ 𝐴. Obviamente, se
𝑋 ⊆ 𝑌 ⊆ 𝐴, então 𝑓[𝑋] ⊆ 𝑓[𝑌] e consequentemente 𝐹(𝑋) ⊆ 𝐹(𝑌). Pelo item (i) provado
acima, segue que existe 𝐶 ⊆ 𝐴 tal que 𝐶 = (𝐴 ∖ 𝐵) ∪ 𝑓[𝐶]; seja 𝐷 = 𝐴 ∖ 𝐶.
Como 𝐶 ∩𝐷 = ∅, podemos definir a função 𝑔:𝐴 ⟶ (𝑓[𝐶]∪ 𝐷) por
𝑔(𝑥) = �𝑓(𝑥), se 𝑥 ∈ 𝐶
𝑥 , se 𝑥 ∈ 𝐷.
Como 𝑓 é bijetora por hipótese, segue que 𝑔 ↾ 𝐶 e 𝑔 ↾ 𝐷 são bijeções sobre 𝑓[𝐶]
e 𝐷, respectivamente, acarretando que 𝑔 é uma bijeção de 𝐴 sobre 𝑓[𝐶] ∪𝐷. Finalmente,
como ℑ(𝑓) = 𝑍 ⊆ 𝐵 , segue que 𝑓[𝐶] ⊆ 𝐵. Por outro lado,
𝐷 = 𝐴 ∖ 𝐶 = 𝐴 ∖ �(𝐴 ∖ 𝐵) ∪ 𝑓[𝐶]�,
82
donde segue 𝐷 ⊆ 𝐵. Dessa forma, 𝑓[𝐶] ∪𝐷 ⊆ 𝐵. A inclusão contrária segue imediata: para
𝑏 ∈ 𝐵 qualquer, temos 𝐵 ⊆ 𝐴 e consequentemente 𝑔(𝑏) está definida; se 𝑏 ∈ 𝐶 e 𝑏 ∉ 𝑓[𝐶]
teríamos pela definição de 𝐶 que 𝑏 ∈ 𝐴 ∖ 𝐵, logo 𝑏 ∈ 𝑓[𝐶] ⊆ 𝑓[𝐶]∪𝐷; caso contrário, isto é,
se 𝑏 ∉ 𝐶 então 𝑏 ∈ 𝐴 ∖ 𝐶 = 𝐷, e 𝐷 ⊆ 𝑓[𝐶]∪𝐷. Portanto, 𝑓[𝐶]∪ 𝐷 = 𝐵. Q.E.D.
Teorema 3.12 (Teorema de Cantor-Bernstein). Para quaisquer conjuntos 𝐴 e 𝐵,
se 𝐴 ≾ 𝐵 e 𝐵 ≾ 𝐴 então 𝐴 ≈ 𝐵.
Demonstração.
Se 𝐴 ≾ 𝐵 e 𝐵 ≾ 𝐴, então existem injeções 𝑓:𝐴 ⟶ 𝐵 e 𝑔:𝐵 ⟶ 𝐴. Mostraremos
que 𝐴 ≈ 𝐵. Primeiramente, notemos que a função 𝑔 ∘ 𝑓:𝐴⟶ 𝐴 é injetora, por ser a
composição de injeções. Além disso, como 𝑓[𝐴] ⊆ 𝐵, segue que
[∗] 𝑔�𝑓[𝐴]� ⊆ 𝑔[𝐵]
e, por sua vez,
[∗∗] 𝑔[𝐵] ⊆ 𝐴.
Observando que 𝑔�𝑓[𝐴]� = ℑ(𝑔 ∘ 𝑓), decorre que 𝐴 ≈ 𝑔�𝑓[𝐴]�, haja vista que
𝑔 ∘ 𝑓:𝐴 ⟶ 𝑔�𝑓[𝐴]� é uma bijeção. Por [∗], [∗∗] e pelo lema anterior, inferimos 𝑔[𝐵] ≈ 𝐴 e,
como 𝑔:𝐵 ⟶ 𝑔[𝐵] é uma bijeção, obtemos 𝑔[𝐵] ≈ 𝐵 e, consequentemente, 𝐵 ≈ 𝐴. Q.E.D.
Teorema 3.13 (Teorema de Cantor). (∀𝑋)�𝑋 ≺ ℘(𝑋)�.
Demonstração.
A função 𝑔:𝑋 ⟶ ℘(𝑋) dada por 𝑔(𝑥) = {𝑥}, para todo 𝑥 ∈ 𝑋 é claramente uma
injeção, donde inferimos 𝑋 ≾ ℘(𝑋) . Se mostrarmos que não existe função sobrejetora de 𝑋
sobre ℘(𝑋), seguirá que não existe bijeção de 𝑋 sobre ℘(𝑋) e, consequentemente, não poderá
haver injeção de ℘(𝑋) em 𝑋, em vista do Teorema de Cantor-Bernstein.
Seja 𝜑:𝑋 ⟶ ℘(𝑋) uma função qualquer e considere o conjunto
𝑆 = {𝑥 ∈ 𝑋|𝑥 ∉ 𝜑(𝑥)} ∈ ℘(𝑋).
Pela definição de 𝑆, para 𝑥 qualquer vale que 𝑥 ∈ 𝑆 se, e somente se, 𝑥 ∉ 𝜑(𝑥).
Se existisse 𝑧 ∈ 𝑋 tal que 𝜑(𝑧) = 𝑆, teríamos
𝑧 ∈ 𝜑(𝑧) ⟺ 𝑧 ∉ 𝜑(𝑧),
absurdo. Portanto, 𝜑 não pode ser sobrejetora. Q.E.D.
83
Algo similar à composição de funções, e igualmente importante, é o que Miraglia
(1991, p. 32) denomina de colagem de funções. A ideia é simples: dadas duas funções 𝑓 e 𝑔,
queremos obter uma nova função que se comporte como 𝑓 e 𝑔 em seus respectivos domínios,
fazendo 𝑓 ∪ 𝑔. Fica claro pela definição de função que para não haver conflitos no domínio
(um elemento com duas imagens distintas), é preciso que 𝑓(𝑥) = 𝑔(𝑥) para todo 𝑥
pertencente à interseção dos domínios.
Definição 3.31. Duas funções 𝑓 e 𝑔 são compatíveis se 𝑓(𝑥) = 𝑔(𝑥) para todo
𝑥 ∈ 𝔇(𝑓) ∩𝔇(𝑔). Um conjunto de funções 𝐹 é um sistema compatível de funções se
quaisquer duas funções de 𝐹 são compatíveis.
Obviamente, duas funções 𝑓 e 𝑔 são compatíveis se, e somente se, 𝑓 ∪ 𝑔 for uma
função ou, equivalentemente, caso 𝑓 ↾ �𝔇(𝑓) ∩𝔇(𝑔)� = 𝑔 ↾ �𝔇(𝑓) ∩ 𝔇(𝑔)�. Não
provamos tais equivalências, mas demonstramos o teorema seguinte, adaptado de Hrbacek &
Jech (1999, p. 26), que terá grande utilidade no Teorema da Recursão Transfinita, o qual
provaremos no capítulo seguinte.
Teorema 3.14 (Princípio da Colagem de Funções). Se 𝐹 é um sistema de funções
compatíveis, então ⋃𝐹 é uma função tal que 𝔇(⋃𝐹) = ⋃{𝔇(𝑓)|𝑓 ∈ 𝐹}. Além disso,
⋃𝐹 ↾ 𝔇(𝑓) = 𝑓, para toda 𝑓 ∈ 𝐹 (diz-se que ⋃𝐹 estende todas as funções de 𝐹).
Demonstração.
Por simplicidade, chamemos ⋃𝐹 = 𝐹�. 𝐹� é uma relação, pois é a união de
conjuntos formados por pares ordenados e, consequentemente, é um conjunto de pares
ordenados; em particular 𝑓 ⊆ 𝐹�, para qualquer 𝑓 ∈ 𝐹 .
Provemos que ⋃{𝔇(𝑓)|𝑓 ∈ 𝐹} = 𝔇(𝐹�). Se 𝑥 ∈ ⋃{𝔇(𝑓)|𝑓 ∈ 𝐹}, deve haver
algum 𝑓 ∈ 𝐹 tal que 𝑥 ∈ 𝔇(𝑓), donde segue que existe 𝑦 tal que ⟨𝑥, 𝑦⟩ ∈ 𝑓, o que resulta
⟨𝑥, 𝑦⟩ ∈ 𝐹� e assim 𝑥 ∈ 𝔇(𝐹�), mostrando que ⋃{𝔇(𝑓)|𝑓 ∈ 𝐹} ⊆ 𝔇(𝐹�). A outra inclusão se
prova de maneira análoga.
Logo, para 𝑥 ∈ 𝔇(𝐹�), existe 𝑓 ∈ 𝐹 tal que 𝑥 ∈ 𝔇(𝑓) e, consequentemente, existe
um único 𝑦 ∈ ℑ(𝑓) tal que 𝑓(𝑥) = 𝑦 e daí 𝑥𝐹�𝑦. Se existisse 𝑦 ′ tal que 𝑥𝐹�𝑦′, existiria 𝑔 ∈ 𝐹
tal que 𝑥 ∈ 𝔇(𝑔) e 𝑔(𝑥) = 𝑦′. Contudo, 𝑓 e 𝑔 são compatíveis e 𝑥 ∈ 𝔇(𝑔) ∩𝔇(𝑓), o que
acarreta 𝑦′ = 𝑔(𝑥) = 𝑓(𝑥) = 𝑦. Portanto, 𝐹� é função. Como para 𝑓 ∈ 𝐹 qualquer temos
𝑓 ⊆ 𝐹�, segue que 𝐹� ↾ 𝔇(𝑓) = 𝑓. Q.E.D.
84
Teorema 3.15. Seja 𝑋 ≠ ∅. Então existe uma função 𝑓:𝐼 ⟶ 𝑋, para algum
conjunto 𝐼, tal que 𝑋 = {𝑓𝑖|𝑖 ∈ 𝐼}.
Demonstração.
Basta tomar 𝐼 = 𝑋 e definir a relação 𝐼𝑑𝑋 = {⟨𝑥, 𝑦⟩ ∈ 𝑋 × 𝑋|𝑥 = 𝑦}. Claramente
tem-se 𝔇(𝐼𝑑𝑋) = ℑ(𝐼𝑑𝑋) = 𝑋. Além disso, 𝐼𝑑𝑋 é uma função. De fato, sejam 𝑦1, 𝑦2 ∈ 𝑋 tais
que 𝑥𝐼𝑑𝑋𝑦1 e 𝑥𝐼𝑑𝑋𝑦2, da definição de 𝐼𝑑𝑋 decorre que 𝑥 = 𝑦1 e 𝑥 = 𝑦2 e assim 𝐼𝑑𝑋 é uma
função, tal que 𝑋 = ℑ(𝐼𝑑𝑋) = {(𝐼𝑑𝑋)𝑖|𝑖 ∈ 𝐼}. Q.E.D.
Pelo que nos mostrou o teorema anterior, todo conjunto pode ser indexado. Seja
então 𝐴 = {𝑓𝑖|𝑖 ∈ 𝐼}. Geralmente, utilizam-se as convenientes notações abaixo para
representar a união e a interseção de uma família 𝐴 (no caso da interseção, 𝐴 ≠ ∅):
[U] ⋃𝐴 = ⋃{𝑓𝑖|𝑖 ∈ 𝐼} = �𝑓𝑖𝑖∈𝐼
;
[I] ⋂𝐴 = ⋂{𝑓𝑖|𝑖 ∈ 𝐼} = �𝑓𝑖𝑖∈𝐼
.
Notemos que, como numa relação qualquer 𝑅 vale 𝔇(𝑅) ≠ ∅⟺ ℑ(𝑅) ≠ ∅, tem-
se {𝑓𝑖|𝑖 ∈ 𝐼} ≠ ∅⟺ 𝐼 ≠ ∅. Além disso, com o mesmo intuito da Definição 2.19,
consideramos conjuntos da forma {𝜏(𝑓𝑖)|𝑖 ∈ 𝐼}, apesar de não formalizarmos tal forma de
representação. Tais notações permitem generalizar de maneira mais clara as leis de
distributividade da interseção e da união, bem como as chamadas Leis de De Morgan.
Lema 3.4.
(∀𝑥)(∀𝑌)�𝑌 = {𝑓𝑖|𝑖 ∈ 𝐼} ⟹ �𝑥 ∈�𝑓𝑖𝑖∈𝐼
⟺ (∃𝑖)(𝑖 ∈ 𝐼 ∧ 𝑥 ∈ 𝑓𝑖)�� .
Demonstração.
Considere 𝑌 indexado por uma função 𝑓 com 𝔇(𝑓) = 𝐼. Decorre de [U] e dos
teoremas já provados sobre a união que
[†] 𝑥 ∈ �𝑓𝑖𝑖∈𝐼
⟺ 𝑥 ∈ ⋃𝑌⟺ (∃𝑧)(𝑧 ∈ 𝑌 ∧ 𝑥 ∈ 𝑧).
Mas 𝑌 = {𝑓𝑖|𝑖 ∈ 𝐼} = ℑ(𝑓). Assim, 𝑧 ∈ 𝑌 se, e somente se, existe 𝑖 ∈ 𝐼 tal que
𝑓𝑖 = 𝑧. Dessa forma, temos em [†]
85
𝑥 ∈�𝑓𝑖𝑖∈𝐼
⟺ (∃𝑖)(𝑖 ∈ 𝐼 ∧ 𝑥 ∈ 𝑓𝑖).
Q.E.D.
Lema 3.5.
(∀𝑥)(∀𝑌)�𝑌 ≠ ∅∧ 𝑌 = {𝑓𝑖|𝑖 ∈ 𝐼} ⟹ �𝑥 ∈ �𝑓𝑖𝑖∈𝐼
⟺ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝑓𝑖)��.
Demonstração.
Considere o conjunto 𝑌 ≠ ∅ indexado por uma função 𝑓 com 𝔇(𝑓) = 𝐼. Pelo que
vimos em [I], bem como pelas propriedades da interseção, temos
𝑥 ∈ �𝑓𝑖𝑖∈𝐼
⟺ 𝑥 ∈ ⋂𝑌⟺ (∀𝑧)(𝑧 ∈ 𝑌 ⟹ 𝑥 ∈ 𝑧).
Como 𝑌 = {𝑓𝑖|𝑖 ∈ 𝐼} = ℑ(𝑓), 𝑧 ∈ 𝑌 se e só se existe 𝑖 ∈ 𝐼 tal que 𝑓𝑖 = 𝑧, logo
𝑥 ∈ �𝑓𝑖𝑖∈𝐼
⟺ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝑓𝑖).
Q.E.D.
Teorema 3.16 (Leis de De Morgan). Seja 𝐵 um conjunto qualquer e 𝐴 =
{𝑓𝑖|𝑖 ∈ 𝐼} uma família não vazia de conjuntos. Então
(i) 𝐵 ∖�𝑓𝑖𝑖∈𝐼
= �(𝐵 ∖ 𝑓𝑖)𝑖∈𝐼
;
(ii) 𝐵∖�𝑓𝑖𝑖∈𝐼
= �(𝐵 ∖ 𝑓𝑖)𝑖∈𝐼
.
Demonstração.
Seja 𝑥 um elemento qualquer. Notemos primeiramente que se 𝐼 ≠ ∅, então
[†] 𝑥 ∈ 𝐵 ⟺ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝐵).
De fato, se 𝑥 ∈ 𝐵, então 𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝐵 é verdadeiro para qualquer 𝑖. A recíproca
é obviamente verdadeira, uma vez que 𝐼 ≠ ∅.
Provemos (i). Pelas propriedades das operações entre conjuntos, temos
𝑥 ∈ 𝐵 ∖�𝑓𝑖𝑖∈𝐼
⟺ 𝑥 ∈ 𝐵 ∧ ¬�𝑥 ∈�𝑓𝑖𝑖∈𝐼
� ⟺ 𝑥 ∈ 𝐵 ∧ ¬�(∃𝑖)(𝑖 ∈ 𝐼 ∧ 𝑥 ∈ 𝑓𝑖)�⟺
86
⟺ 𝑥 ∈ 𝐵 ∧ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∉ 𝑓𝑖),
mas, devido a [†],
𝑥 ∈ 𝐵 ∧ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∉ 𝑓𝑖)⟺ (∀𝑖)�(𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝐵) ∧ (𝑖 ∈ 𝐼 ⟹ 𝑥 ∉ 𝑓𝑖)�⟺
⟺ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝐵 ∖ 𝑓𝑖)⟺ 𝑥 ∈�(𝐵 ∖ 𝑓𝑖)𝑖∈𝐼
.
Da transitividade da equivalência e do Axioma da Extensão obtemos a primeira
igualdade. Provemos (ii). Para 𝑥 qualquer,
𝑥 ∈ 𝐵 ∖�𝑓𝑖𝑖∈𝐼
⟺ 𝑥 ∈ 𝐵 ∧ ¬ �𝑥 ∈�𝑓𝑖𝑖∈𝐼
� ⟺ 𝑥 ∈ 𝐵 ∧ ¬�(∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑥 ∈ 𝑓𝑖)�⟺
⟺ 𝑥 ∈ 𝐵 ∧ (∃𝑖)(𝑖 ∈ 𝐼 ∧ 𝑥 ∉ 𝑓𝑖)⟺ (∃𝑖)(𝑖 ∈ 𝐼 ∧ 𝑥 ∈ 𝐵 ∖ 𝑓𝑖) ⟺ 𝑥 ∈�(𝐵 ∖ 𝑓𝑖)𝑖∈𝐼
.
A igualdade segue da transitividade da equivalência e do Axioma da Extensão.
Q.E.D.
Corolário 3.5. Sejam 𝑋, 𝑌 e 𝑍 conjuntos quaisquer. Então:
(i) 𝑋 ∖ (𝑌 ∪ 𝑍) = (𝑋∖ 𝑌) ∩ (𝑋∖ 𝑍) ;
(ii) 𝑋 ∖ (𝑌 ∩ 𝑍) = (𝑋∖ 𝑌) ∪ (𝑋∖ 𝑍) .
Demonstração.
Basta tomar 𝑓: {𝑍, 𝑌} ⟶ {𝑍, 𝑌} dada por 𝑓𝑖 = 𝑖, para todo 𝑖 ∈ {𝑍, 𝑌}. Obviamente
𝑓 é uma função e {𝑍, 𝑌} = �𝑓𝑖�𝑖 ∈ {𝑍, 𝑌}�. Pelo teorema anterior temos
𝑋 ∖ (𝑌 ∪ 𝑍) = 𝑋 ∖ � 𝑓𝑖𝑖∈{𝑍, 𝑌}
= � (𝑋 ∖ 𝑓𝑖)𝑖∈{𝑍, 𝑌}
= ⋂{𝑋 ∖ 𝑓𝑍, 𝑋 ∖ 𝑓𝑌} = (𝑋 ∖ 𝑍) ∩ (𝑋 ∖ 𝑌),
o que prova (i). Analogamente prova-se (ii). Q.E.D.
Teorema 3.17 (Leis Distributivas da União e da Interseção). Sejam 𝑋 =
{𝐹𝑎|𝑎 ∈ 𝐴} e 𝑌 = {𝐺𝑏|𝑏 ∈ 𝐵} dois conjuntos indexados. Então:
(i) ��𝐹𝑎𝑎∈𝐴
� ∩ ��𝐺𝑏𝑏∈𝐵
� = � (𝐹𝑎 ∩ 𝐺𝑏)⟨𝑎,𝑏⟩∈𝐴×𝐵
;
(ii) ��𝐹𝑎𝑎∈𝐴
� ∪ ��𝐺𝑏𝑏∈𝐵
�= � (𝐹𝑎 ∪ 𝐺𝑏)⟨𝑎,𝑏⟩∈𝐴×𝐵
.
87
Demonstração.
Seja 𝑥 qualquer. Segue do Lema 3.4 e dos resultados já vistos que
𝑥 ∈ ��𝐹𝑎𝑎∈𝐴
� ∩ ��𝐺𝑏𝑏∈𝐵
� ⟺ 𝑥 ∈ �𝐹𝑎𝑎∈𝐴
∧ 𝑥 ∈ �𝐺𝑏𝑏∈𝐵
⟺
⟺ (∃𝑎)(𝑎 ∈ 𝐴 ∧ 𝑥 ∈ 𝐹𝑎) ∧ (∃𝑏)(𝑏 ∈ 𝐵 ∧ 𝑥 ∈ 𝐺𝑏)⟺
⟺ (∃𝑎)(∃𝑏)(𝑎 ∈ 𝐴 ∧ 𝑏 ∈ 𝐵 ∧ 𝑥 ∈ 𝐹𝑎 ∩ 𝐺𝑏)⟺
⟺ (∃𝑎)(∃𝑏)(⟨𝑎, 𝑏⟩ ∈ 𝐴 × 𝐵 ∧ 𝑥 ∈ 𝐹𝑎 ∩ 𝐺𝑏) ⟺
⟺ 𝑥 ∈ � (𝐹𝑎 ∩ 𝐺𝑏)⟨𝑎,𝑏⟩∈𝐴×𝐵
.
A igualdade de (i) segue então da transitividade da equivalência e do Axioma da
Extensão. (ii) se prova de maneira análoga, levando-se em consideração o Lema 3.5. Q.E.D.
Corolário 3.6. Sejam 𝐴, 𝐵, e 𝐶 conjuntos quaisquer. São verdadeiras as
igualdades:
(i) (𝐴∪ 𝐵) ∩ 𝐶 = (𝐴 ∩ 𝐶) ∪ (𝐵 ∩ 𝐶);
(ii) (𝐴∩ 𝐵) ∪ 𝐶 = (𝐴 ∪ 𝐶) ∩ (𝐵 ∪ 𝐶).
Demonstração.
Análoga à demonstração do Corolário 3.5. Q.E.D.
Teorema 3.18. Seja 𝜑(𝑥, 𝑦) uma condição funcional em 𝑥. Então, para qualquer
conjunto 𝐴 existe uma única função 𝜑𝐴 cujo domínio está contido em 𝐴 tal que 𝜑𝐴(𝑎) =
𝑦 ⟺ 𝜑(𝑎, 𝑦).
Demonstração.
Pelo Axioma da Substituição, existe um conjunto 𝐵 tal que
(∀𝑤)�𝑤 ∈ 𝐵 ⟺ (∃𝑥)�𝑥 ∈ 𝐴 ∧ 𝜑(𝑥, 𝑤)��.
Basta então definir 𝜑𝐴 = {⟨𝑥, 𝑦⟩ ∈ 𝐴 × 𝐵|𝜑(𝑥, 𝑦)}. Claramente, 𝜑𝐴 é uma
função, com 𝔇(𝜑𝐴) ⊆ 𝐴, cuja unicidade decorre do Axioma da Extensão. Q.E.D.
Definição 3.32. Seja 𝜑(𝑥, 𝑦) uma condição funcional. A operação induzida por 𝜑
é a relação funcional 𝐹(𝑥) = 𝑦 ⟺ 𝜑(𝑥, 𝑦). Para qualquer conjunto 𝐴, 𝐹 ↾ 𝐴 denota a
restrição de 𝐹 aos membros de 𝐴, isto é, 𝐹 ↾ 𝐴 = {⟨𝑥, 𝑦⟩|𝐹(𝑥) = 𝑦 ∧ 𝑥 ∈ 𝐴}. Se 𝐹(𝑥, 𝑦) = 𝑧
for uma operação (dita em duas variáveis), usamos a notação 𝐹𝑥 para indicar 𝐹𝑥(𝑦) = 𝐹(𝑥, 𝑦).
88
A expressão “funcional” diz respeito ao fato de existir um único 𝑦 para o qual
𝜑(𝑥, 𝑦) é verdadeira, o que justifica a igualdade 𝐹(𝑥) = 𝑦 segundo os critérios adotados no
início do Capítulo 2 — ver Critério da definição por identidade na seção 2.1.
Por exemplo, considerando 𝜑(𝑥, 𝑦) ≡ (∀𝑤)(𝑤 ⊆ 𝑥 ⟺ 𝑤 ∈ 𝑦), temos a relação
funcional ℘(𝑥) = 𝑦 ⟺ 𝜑(𝑥, 𝑦), que de modo geral não se comporta como função, pois todo
conjunto possui a sua respectiva potência, o que acarretaria um domínio “muito grande”.
Porém, para qualquer conjunto 𝐴, ℘ ↾ 𝐴 seria uma função, pois restringiríamos o escopo da
operação ℘ aos membros de 𝐴.
Um exemplo de operação da forma 𝐹(𝑥, 𝑦) = 𝑧 pode ser dado por ⋂(𝑥, 𝑦) =
𝑧 ⟺ 𝑥 ∩ 𝑦 = 𝑧. Funções definidas por meio de relações/condições funcionais são de grande
importância no próximo capítulo.
Teorema 3.19. (∀𝐴)(∀𝐵)(∃!𝒵)(𝑓 ∈ 𝒵 ⟺ 𝑓:𝐴 ⟶ 𝐵).
Demonstração.
O Teorema 2.6 garante a existência e unicidade do conjunto 𝒵, tal que
𝒵 = {𝑓 ∈ ℘(𝐴 × 𝐵)|𝑓:𝐴 ⟶ 𝐵}.
Afirmamos que 𝒵 satisfaz a equivalência
(∗) 𝑓 ∈ 𝒵 ⟺ 𝑓:𝐴 ⟶ 𝐵.
Obviamente, 𝑓 ∈ 𝒵 ⟹ 𝑓:𝐴 ⟶ 𝐵 devido à definição de 𝒵. Suponha que 𝑓 seja
uma função de 𝐴 em 𝐵. Como 𝑓 é uma relação, decorre que 𝑎 ∈ 𝑓 se, e somente se, existem 𝑥
e 𝑦 tais que 𝑎 = ⟨𝑥, 𝑦⟩. Como 𝔇(𝑓) = 𝐴 e ℑ(𝑓)⊆ 𝐵 segue que ⟨𝑥, 𝑦⟩ ∈ 𝐴 × 𝐵. Dessa forma,
𝑓 ⊆ 𝐴 × 𝐵 e daí 𝑓 ∈ ℘(𝐴 × 𝐵). Assim, 𝑓 ∈ 𝒵. Portanto,
𝑓 ∈ 𝒵 ⟺ 𝑓:𝐴⟶ 𝐵.
Q.E.D.
Teorema 3.20. Seja 𝑆 = ⟨𝑆𝑖|𝑖 ∈ 𝐼⟩. Existe um único conjunto 𝒫 tal que
𝑓 ∈ 𝒫 ⟺ 𝑓 é uma função, 𝔇(𝑓) = 𝐼 e 𝑓𝑖 ∈ 𝑆𝑖, para todo 𝑖 ∈ 𝐼.
Demonstração.
Análoga à demonstração do teorema anterior. Basta observar que o conjunto
89
𝒫 = �𝑓 ∈ ℘�𝐼 × �𝑆𝑖𝑖∈𝐼
� �𝑓:𝐼 ⟶ �𝑆𝑖𝑖∈𝐼
∧ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑓𝑖 ∈ 𝑆𝑖)�
satisfaz à condição da tese. Q.E.D.
Os dois teoremas anteriores nos permitem definir o conjunto de todas as funções
de 𝐴 em 𝐵, denotado por 𝐵𝐴 , cuja existência é assegurada pelo Teorema 3.19, e o produto
(cartesiano) do sistema indexado 𝑆, denotado por ∏𝑆, cuja existência decorre do Teorema
3.20.
Definição 3.33. 𝐵𝐴 = {𝑓|𝑓:𝐴 ⟶ 𝐵}.
Definição 3.34. Seja 𝑆 = ⟨𝑆𝑖|𝑖 ∈ 𝐼⟩. Definimos o conjunto ∏ 𝑆𝑖∈𝐼 por
�𝑆𝑖𝑖∈𝐼
= �𝑓�𝑓: 𝐼 ⟶�𝑆𝑖𝑖∈𝐼
∧ (∀𝑖)(𝑖 ∈ 𝐼 ⟹ 𝑓𝑖 ∈ 𝑆𝑖)�.
Quando não houver risco de confusão, pode-se denotá-lo simplesmente por ∏𝑆.
Como veremos no próximo capítulo, o conjunto ∏𝑆 permite uma generalização da ideia de
produto cartesiano, não apenas para o produto de um número finito qualquer de conjuntos,
mas também para infinitos conjuntos, pois seus membros podem ser interpretados como listas
ordenadas de conjuntos. Há ainda outro aspecto interessante sobre os membros de ∏𝑆.
Primeiramente, 𝑆 é uma função que indexa algum conjunto 𝑋, isto é, 𝑋 =
{𝑆𝑖|𝑖 ∈ 𝐼}. Em segundo, cada membro de ∏𝑆 é uma função 𝑓: 𝐼 ⟶ ⋃𝑋, isto é, 𝑓 leva cada
membro do conjunto de índices 𝐼 em algum membro 𝑌 de 𝑋, ou seja 𝑓𝑖 ∈ 𝑌, para algum
𝑌 ∈ 𝑋. Finalmente, este 𝑌 ao qual 𝑓𝑖 pertence é tal que 𝑆(𝑖) = 𝑌 . Em outras palavras, 𝑓
“escolhe” um elemento em cada membro não vazio de {𝑆𝑖|𝑖 ∈ 𝐼}. Formalmente, adotamos a
seguinte definição dada por Hrbacek & Jech (1999).
Definição 3.35. Seja 𝑆 ≠ ∅ uma família não vazia de conjuntos. Uma função
𝑓: 𝑆 ⟶ ⋃𝑆 é uma função escolha para 𝑆 se 𝑓(𝑋) ∈ 𝑋 para todo 𝑋 ≠ ∅ tal que 𝑋 ∈ 𝑆.
Notemos que se 𝑓:℘(𝑋) ⟶𝑋 é tal que 𝑓(𝐴) ∈ 𝐴 para todo subconjunto não
vazio 𝐴 de 𝑋, então 𝑓 é uma função escolha, pois 𝑋 = ⋃�℘(𝑋)�. Na seção 2.3, definimos o
produto externo de uma família disjunta de conjuntos 𝑡, e adotamos a notação de Fraenkel,
Bar-Hillel & Levy (1973), ∏ 𝑡. O produto definido acima é simplesmente o correspondente
do produto externo interpretado com o conceito de função. De fato, lembremo-nos
primeiramente de que ∏ 𝑡 é o conjunto cujos membros são subconjuntos de ⋃𝑡 tais que existe
90
um único membro de cada membro de 𝑡 pertencente a eles. Seja 𝑧 ∈ ∏ 𝑡. Para todo 𝑣 ∈ 𝑡,
existe um único 𝑎 ∈ 𝑣 tal que 𝑧 ∩ 𝑣 = {𝑎} e assim basta definir 𝑓(𝑣) = 𝑣 ∩ 𝑧 , claramente
𝑓: 𝑡 ⟶ ⋃𝑡 é uma função escolha para 𝑡.
O Axioma da Escolha (A8) postulado na página 44 é equivalente à afirmação de
que para toda família de conjuntos existe uma função escolha. A fim de utilizarmos tal versão
do Axioma ao longo do texto, provamos o teorema seguinte, com o qual findamos este
capítulo.
Teorema 3.21. As seguintes afirmações são equivalentes em ZF:
(AC1) Existe uma função escolha para toda família disjunta 𝔉 de conjuntos não
vazios;
(A8) Para qualquer família disjunta 𝒯 de conjuntos não vazios existe um
conjunto 𝒞 ⊆ ⋃𝒯 tal que 𝒞 ∩𝒱 = {𝑎}, com 𝑎 ∈ 𝒱, para todo 𝒱 ∈ 𝒯;
(AC2) Para qualquer conjunto 𝒜 tal que ∅ ∉ 𝒜 existe uma função 𝑓 cujo
domínio é 𝒜, tal que 𝑓(𝑋) ∈ 𝑋, para todo 𝑋 ∈ 𝒜;
(AC3) Existe uma função escolha para qualquer família não vazia de conjuntos.
Demonstração.
Provemos que (AC1) ⟹ (A8).
Seja 𝒯 ≠ ∅ uma família disjunta de conjuntos tal que ∅ ∉ 𝒯. Decorre de (AC1)
que existe uma função 𝑓:𝒯⟶ ⋃𝒯 tal que 𝑓(𝑋) ∈ 𝑋, para todo 𝑋 ∈ 𝒯. Notemos que para 𝑥
qualquer,
𝑥 ∈ ℑ(𝑓)⟺ (∃𝑋)(𝑋 ∈ 𝒯 ∧ 𝑓(𝑋) = 𝑥 ∧ 𝑥 ∈ 𝑋).
Então, para 𝒱 ∈ 𝒯 arbitrário,
𝑥 ∈ ℑ(𝑓)∩ 𝒱 ⟺ (∃𝑋)(𝑋 ∈ 𝒯 ∧ 𝑓(𝑋) = 𝑥 ∧ 𝑥 ∈ 𝑋) ∧ 𝑥 ∈ 𝒱,
mas como 𝒯 é uma família disjunta, segue que 𝑋 = 𝒱 e daí 𝑥 ∈ ℑ(𝑓) ∩𝒱 ⟺ 𝑓(𝒱) = 𝑥.
Como 𝑓 é função, tal 𝑥 é único e, portanto, ℑ(𝑓) ∩𝒱 = {𝑓(𝒱)} = {𝑥}, para todo 𝒱 ∈ 𝒯 .
Desta forma, basta tomar 𝒞 = ℑ(𝑓).
Mostremos que (A8) ⟹ (AC2).
Seja 𝒜 um conjunto não vazio tal que ∅ ∉ 𝒜. Então, para todo 𝑠 ∈ 𝒜, existe
𝑢 ∈ 𝑠. Notemos que o conjunto {𝑠} × 𝑠 pertence ao conjunto ℘(𝒜 × ⋃𝒜). Com efeito, se
⟨𝑥, 𝑦⟩ ∈ {𝑠} × 𝑠, então 𝑥 = 𝑠 e 𝑦 ∈ 𝑠, donde segue que 𝑥 ∈ 𝒜 e 𝑦 ∈ ⋃𝒜 e, por conseguinte,
⟨𝑥, 𝑦⟩ ∈ 𝒜 × ⋃𝒜, ou seja, {𝑠} × 𝑠 ⊆ 𝒜 × ⋃𝒜. Assim, faz sentido definir
91
𝑇 = �{𝑠} × 𝑠�𝑠 ∈ 𝒜� ⊆ ℘(𝒜 × ⋃𝒜).
Afirmamos que 𝑇 é uma família disjunta de conjuntos não vazios. De fato, se
𝑤 ∈ 𝑇 então 𝑤 = {𝑠} × 𝑠 e, como 𝑠 ∈ 𝒜 e ∅ ∉ 𝒜, segue que {𝑠} e 𝑠 são não vazios, donde
obtemos 𝑤 ≠ ∅ e daí ∅ ∉ 𝑇. Para 𝑤1, 𝑤2 ∈ 𝑇 quaisquer, suponha 𝑤1 ≠ 𝑤2 . Logo, existem 𝑠1,
𝑠2 ∈ 𝒜 tais que 𝑤1 = {𝑠1} × 𝑠1, 𝑤2 = {𝑠2} × 𝑠2 e 𝑠1 ≠ 𝑠2 . Se, por absurdo, existir 𝑎 tal que
𝑎 ∈ 𝑤1 ∩𝑤2 , então 𝑎 = ⟨𝑥, 𝑦⟩, com ⟨𝑥, 𝑦⟩ ∈ ({𝑠1} × 𝑠1) ∩ ({𝑠2} × 𝑠2), donde conclui-se que
𝑥 = 𝑠1 = 𝑠2, uma contradição. Portanto, 𝑇 é uma família disjunta de conjuntos, com ∅ ∉ 𝑇.
Por (A8) existe 𝒞 ⊆ ⋃𝑇 tal que 𝒞 ∩𝒰 = {𝒞𝒰}, para todo 𝒰 ∈ 𝑇.
Claramente 𝒞 é uma relação, pois se 𝑤 ∈ 𝒞 então 𝑤 ∈ {𝑠} × 𝑠, para algum 𝑠 ∈ 𝒜.
Tomemos 𝑎 e 𝑏 quaisquer. Se 𝑎𝒞𝑏 então 𝑎 ∈ {𝑠} e 𝑏 ∈ 𝑠, para algum 𝑠 ∈ 𝒜, donde
consequentemente obtemos ℑ(𝒞)⊆ ⋃𝒜, e como 𝑎 = 𝑠, 𝔇(𝒞)⊆ 𝒜. Se 𝑎� ∈ 𝒜 então
{𝑎�} × 𝑎� ∈ 𝑇, mas 𝒞 ∩ ({𝑎�} × 𝑎�) é um conjunto unitário por hipótese e assim existe ⟨𝑥, 𝑦⟩ ∈ 𝒞
tal que 𝑥 = 𝑎� ∈ 𝔇(𝒞). Logo, 𝔇(𝒞) = 𝒜. Finalmente, se existir 𝑏′ ≠ 𝑏 tal que 𝑎𝒞𝑏 e 𝑎𝒞𝑏′,
então 𝒞 ∩ ({𝑎} × 𝑎) = {⟨𝑎, 𝑏⟩, ⟨𝑎, 𝑏′⟩}, absurdo. Portanto 𝒞 é uma função de 𝒜 em ⋃𝒜, tal
que para qualquer 𝑋 ∈ 𝒜, 𝒞(𝑋) ∈ 𝑋, isto é, 𝑓 é uma função escolha para 𝒜.
Suponha a validade de (AC2) e tome 𝐴 ≠ ∅. Vamos provar que vale (AC3).
Se ∅ ∉ 𝐴 então não há o que provar. Se 𝐴 for uma família de conjuntos tal que
∅ ∈ 𝐴, basta tomarmos uma função escolha 𝑓 para 𝐵 = 𝐴 ∖ {∅}, e fixar 𝑎 ∈ ⋃𝐴 qualquer. A
função 𝑔 = 𝑓 ∪ {⟨∅, 𝑎⟩} é claramente uma função escolha para 𝐴, o que prova (AC3).
É óbvio que (AC3) ⟹ (AC1). Q.E.D.
92
Capítulo 4 — Conjuntos Bem Ordenados e Números Ordinais
Tratamos a partir daqui sobre a fundamentação dos números ordinais dentro da
Teoria dos Conjuntos, nos quais se encontram o conjunto dos números naturais. Provamos o
Teorema da Recursão Transfinita, entre outros importantes resultados da Teoria dos
Conjuntos referentes aos números ordinais. Salvo menção contrária, baseamo-nos em
Hrbacek & Jech (1999) ao longo deste capítulo.
4.1. Conjuntos Bem Ordenados
Relações de ordem sobre um conjunto intuitivamente funcionam como um meio
de comparar os elementos do conjunto por meio de algum critério. Além disso,
Em toda a Matemática, e em particular, para a generalização dos processos de contagem dos conjuntos finitos para os conjuntos infinitos, a teoria da ordem [relações de ordem] ocupa um importante papel. As definições básicas são simples. A única coisa da qual se deve lembrar é que a motivação primária vem da relação ‘menor do que ou igual’ […]. (HALMOS, 1960, p. 54, tradução nossa).
Os dois tipos básicos de relações de ordem foram definidos no capítulo anterior:
parcial e estrita. Numa relação de ordem estrita, se 𝑥 está relacionado com 𝑦 diz-se que 𝑥 é
menor do que 𝑦; no caso de 𝑥 estar relacionado com 𝑦 por uma ordem parcial, diz-se que 𝑥 é
menor do que ou igual a 𝑦. De fato, enquanto uma ordem parcial permite que um elemento do
conjunto se relacione consigo mesmo, na ordem estrita isso não acontece. Apesar disso,
ordens parciais e estritas relacionam-se profundamente, como mostramos no teorema
seguinte.
Teorema 4.1. Seja 𝑋 ≠ ∅ um conjunto qualquer, tal que ⟨𝑋, ≺⟩ é um conjunto
estritamente ordenado e ⟨𝑋, ≤⟩ é um conjunto parcialmente ordenado. Então 𝑋 é
parcialmente ordenado pela relação ≼ e estritamente ordenado pela relação <, tais que
≼= {⟨𝑥, 𝑦⟩ ∈ 𝑋 × 𝑋|𝑥 ≺ 𝑦 ∨ 𝑥 = 𝑦} e <= {⟨𝑥, 𝑦⟩ ∈ 𝑋 × 𝑋|𝑥 ≤ 𝑦 ∧ 𝑥 ≠ 𝑦}.
Demonstração.
93
A reflexividade de ≼ é imediata, bem como a transitividade. A antissimetria de ≼
decorre da assimetria de ≺. De fato,
𝑥 ≼ 𝑦 ∧ 𝑦 ≼ 𝑥 ⟺ (𝑥 ≺ 𝑦 ∨ 𝑥 = 𝑦) ∧ (𝑦 ≺ 𝑥 ∨ 𝑥 = 𝑦) ⟺ (𝑥 ≺ 𝑦 ∧ 𝑦 ≺ 𝑥) ∨ 𝑥 = 𝑦 ⟺
⟺ 𝑥 = 𝑦.
Analogamente mostra-se que < é uma ordem estrita em 𝑋. Q.E.D.
Assim, para uma relação de ordem estrita ≺, escrevemos 𝑥 ≼ 𝑦 para indicar que
𝑥 ≺ 𝑦 ou 𝑥 = 𝑦, de tal maneira que ≼ é uma ordem parcial. Convencionamos a partir daqui
que < e ≺ indicam ordens estritas, enquanto que ≤ e ≼ representam as ordens parciais
correspondentes, de acordo com o que fizemos no teorema anterior1. Dada tal convenção,
formulamos as definições abaixo, referentes a conjuntos ordenados2.
Definição 4.1. Seja ⟨𝑊, ≺⟩ um conjunto estritamente ordenado e 𝑋 ⊆ 𝑊.
(i) 𝑎 ∈ 𝑋 é um menor elemento de 𝐴 ⟺ (∀𝑥)(𝑥 ∈ 𝑋 ⟹ 𝑎 ≼ 𝑥);
(ii) 𝑎 ∈ 𝑋 é um elemento mínimo de 𝐴 ⟺ (∀𝑥)�𝑥 ∈ 𝑋 ⟹ ¬(𝑥 ≺ 𝑎)�;
(iii) 𝑎 ∈ 𝑋 é um maior elemento de 𝐴 ⟺ (∀𝑥)(𝑥 ∈ 𝑋 ⟹ 𝑥 ≼ 𝑎);
(iv) 𝑎 ∈ 𝑋 é um elemento máximo de 𝐴 ⟺ (∀𝑥)�𝑥 ∈ 𝑋 ⟹ ¬(𝑎 ≺ 𝑥)�;
(v) 𝑎 ∈ 𝑊 é um limite inferior de 𝑋 em ⟨𝑊, ≺⟩ ⟺ (∀𝑥)(𝑥 ∈ 𝐴 ⟹ 𝑎 ≼ 𝑥);
(vi) 𝑎 ∈ 𝑊 é um ínfimo de 𝑋 em ⟨𝑊, ≺⟩ se, e somente se, 𝑎 é o maior
elemento do conjunto dos limites inferiores de 𝑋 em ⟨𝑊, ≺⟩;
(vii) 𝑎 ∈ 𝑊 é um limite superior de 𝑋 em ⟨𝑊, ≺⟩ ⟺ (∀𝑥)(𝑥 ∈ 𝐴 ⟹ 𝑥 ≼ 𝑎);
(viii) 𝑎 ∈ 𝑊 é um supremo de 𝑋 em ⟨𝑊, ≺⟩ se, e somente se, 𝑎 é o menor
elemento do conjunto dos limites superiores de 𝑋 em ⟨𝑊, ≺⟩.
Proposição 4.1. Seja ⟨𝐴, <⟩ um conjunto ordenado (parcial ou estritamente) e
𝐵 ⊆ 𝐴.
(i) Se existir, o menor elemento de 𝐵 é único, além disso, ele é também o
(único) elemento mínimo;
1 O contexto deixará claro quando 𝑥 ≺ 𝑦 se referir a uma ordem estrita definida em um conjunto e quando se referir à existência de uma injeção de 𝑥 em 𝑦, como estabelecido na Definição 3.30.
2 Tais definições não se restringem necessariamente a conjuntos ordenados. Todavia, neste trabalho focamo-nos em suas aplicações apenas a conjuntos ordenados.
94
(ii) Se existir, o maior elemento de 𝐵 é único, além disso, ele é também o
(único) elemento máximo;
(iii) Se existir, o ínfimo de um conjunto 𝐵 é único;
(iv) Se existir, o supremo de um conjunto 𝐵 é único.
Demonstração.
Provamos apenas (i), as demais afirmações se demonstram de maneira análoga.
Suponha, por absurdo, que 𝑏1, 𝑏2 ∈ 𝐵 sejam dois menores elementos distintos de
𝐵. Logo, para quaisquer 𝑥 ∈ 𝐵, tem-se 𝑏1 ≤ 𝑥 e 𝑏2 ≤ 𝑥; em particular,
𝑏1 ≤ 𝑏2 e 𝑏2 ≤ 𝑏1.
Como 𝑏1 ≠ 𝑏2 por hipótese, resta-nos 𝑏1 < 𝑏2 e 𝑏2 < 𝑏1o que contraria a
assimetria de <, absurdo. Logo, 𝑏1 = 𝑏2. Q.E.D.
As recíprocas das afirmações (i) e (ii) da proposição anterior não são verdadeiras
de modo geral. Consideremos, por exemplo, o conjunto ℕ+ dos números naturais positivos,
parcialmente ordenado pela relação de divisão |, onde 𝑛|𝑚⟺ 𝑛 divide 𝑚, para quaisquer 𝑛,
𝑚 ∈ ℕ. O subconjunto 𝐵 = ℕ ∖ {1} não possui um menor elemento na relação |, pois para
qualquer número 𝑎 ∈ 𝐵 pode-se tomar o número 𝑎 + 1 que não é divisível por 𝑎. Ainda
assim, qualquer número positivo primo 𝑝 é elemento mínimo de 𝐵, uma vez que não existe
qualquer número 𝑥 ∈ 𝐵 ∖ {𝑝} tal que 𝑥|𝑝. Para mais resultados referentes a elementos
máximos e mínimos em relações de ordem, bem como sobre supremo e ínfimo, sugerimos
Hrbacek & Jech (1999) e Suppes (1972).
A Proposição 4.1 justifica as seguintes simbologias.
Definição 4.2. Seja ⟨𝐴, <⟩ um conjunto ordenado e 𝑋 ⊆ 𝐴. Se existirem,
denotamos os seguintes elementos por:
(i) max(𝑋) é o maior elemento de 𝑋;
(ii) min(𝑋) é o menor elemento de 𝑋;
(iii) sup(𝑋) é o supremo de 𝑋;
(iv) inf(𝑋) é o ínfimo de 𝑋.
Definição 4.3. Sejam ⟨𝐴, <⟩ e ⟨𝐵, ≺⟩ conjuntos ordenados. Um isomorfismo entre
𝐴 e 𝐵 é uma função 𝜑:𝐴⟶ 𝐵 bijetora, tal que
95
(∀𝑎1)(∀𝑎2)�𝑎1, 𝑎2 ∈ 𝐴 ⟹ �𝑎1 < 𝑎2 ⟺ 𝜑(𝑎1)≺ 𝜑(𝑎2)��.
Em tal caso, 𝐴 e 𝐵 são ditos isomorfos, ou ainda 𝐴 é isomorfo a 𝐵, o que denotamos por
⟨𝐴, <⟩ ≅ ⟨𝐵, ≺⟩ ou simplesmente 𝐴 ≅ 𝐵. Se 𝐴 = 𝐵, 𝜑 é um automorfismo3.
Teorema 4.2.
(i) Todo conjunto ordenado é isomorfo a si mesmo;
(ii) Se ⟨𝑊1 , ≺⟩ ≅ ⟨𝑊2 , <⟩ então ⟨𝑊2 , <⟩ ≅ ⟨𝑊1 , ≺⟩;
(iii) Dois conjuntos ordenados isomorfos a um terceiro são isomorfos entre si.
Demonstração.
A validade de (i) é imediata: basta tomar a função identidade do conjunto.
Por sua vez, sejam ⟨𝑊1, <⟩ e ⟨𝑊2 , ≺⟩ conjuntos ordenados tais que 𝜑:𝑊1 ⟶ 𝑊2
é um isomorfismo; então 𝜑−1:𝑊2 ⟶𝑊1 é bijetora e, além disso, para 𝑤1, 𝑤2 ∈ 𝑊2
quaisquer, existem 𝑢1, 𝑢2 ∈ 𝑊1 tais que 𝜑(𝑢1) = 𝑤1 e 𝜑(𝑢2) = 𝑤2. Daí, 𝑤1 ≺ 𝑤2 ⟺
𝜑(𝑢1)≺ 𝜑(𝑢2)⟺ 𝑢1 < 𝑢2, mas 𝑢𝑖 = 𝜑−1(𝑤𝑖) para 𝑖 ∈ {1, 2}. Assim, 𝜑−1 é um
isomorfismo, o que prova que 𝑊2 ≅ 𝑊1 . Analogamente, mostra-se (iii). Q.E.D.
Quando a relação de ordem < sobre o conjunto 𝑊 for evidente pelo contexto,
diremos apenas que “𝑊 é um conjunto ordenado” em vez de “⟨𝑊, <⟩ é um conjunto
ordenado”. Além disso, para indicar a restrição de < a um subconjunto 𝑋 de 𝑊, indicamos
⟨𝑋, <⟩ em vez de ⟨𝑋, <∩ (𝑋 × 𝑋)⟩. Também denotamos 𝑥 ≥ 𝑦 e 𝑥 ≽ 𝑦 para significar 𝑦 ≤ 𝑥
e 𝑦 ≼ 𝑥, respectivamente.
Uma ordem total/linear sobre um conjunto 𝑋 é uma relação de ordem (parcial ou
estrita em vista do Teorema 4.1), tal que todo membro de 𝑋 é comparável segundo tal relação
de ordem, isto é: dados dois elementos de 𝑋, ou tais elementos são iguais ou um deles é
menor (na relação) do que o outro. Em conjuntos totalmente ordenados, vale a seguinte
proposição.
Proposição 4.2. Sejam ⟨𝑃, <⟩ e ⟨𝑄, ≺⟩ conjuntos totalmente ordenados, e uma
bijeção ℎ:𝑃 ⟶ 𝑄 tal que ℎ(𝑥)≺ ℎ(𝑦) sempre que 𝑥 < 𝑦, para quaisquer 𝑥, 𝑦 ∈ 𝑃. Então ℎ
é um isomorfismo entre ⟨𝑃, <⟩ e ⟨𝑄, ≺⟩.
3 Adotamos tal notação (≅) para indicar o isomorfismo, de Kunen (1980).
96
Demonstração.
Sejam 𝑝1, 𝑝2 ∈ 𝑃 quaisquer e suponha ℎ(𝑝1) ≺ ℎ(𝑝2). Se, por absurdo,
tivéssemos ¬(𝑝1 < 𝑝2), então 𝑝2 ≤ 𝑝1 , pois < ordena 𝑃 totalmente. Daí, pela hipótese da
proposição, se 𝑝1 = 𝑝2 então ℎ(𝑝1) = ℎ(𝑝2) e se 𝑝2 < 𝑝1 então ℎ(𝑝2) ≺ ℎ(𝑝1), contrariando
a suposição de que ℎ(𝑝1) ≺ ℎ(𝑝2). Portanto, ℎ(𝑝1) ≺ ℎ(𝑝2) ⟹𝑝1 < 𝑝2 . Q.E.D.
Definição 4.4. Seja ⟨𝐿, <⟩ um conjunto totalmente ordenado. Um conjunto 𝑆 ⊆ 𝐿
é um segmento inicial de 𝐿 se 𝑆 ≠ 𝐿 e, para todo 𝑎 ∈ 𝑆, 𝑥 < 𝑎 ⟹ 𝑥 ∈ 𝑆 , para qualquer 𝑥 ∈ 𝐿.
O conjunto dos números reais negativos, por exemplo, é um segmento inicial do
conjunto dos números reais ordenado pela relação ≤ usual, bem como o subconjunto {0, 1, 2}
dos números naturais é também um segmento inicial dos números naturais. A diferença básica
entre esses dois segmentos, além dos conjuntos nos quais estão contidos, reside no fato de o
segundo possuir um menor elemento na relação, o que não ocorre no segmento inicial obtido
dos números reais.
Uma boa ordem/ordenação sobre um conjunto 𝑋 é uma ordem linear4 em 𝑋 na
qual todo subconjunto não vazio de 𝑋 possui um menor elemento, que em vista da Proposição
4.1 (i) é o elemento mínimo de tal subconjunto. Como exemplificado por Aurichi (2011a, p.
3), “uma boa ordem nada mais é que uma fila”.
Com efeito, uma boa ordenação sobre um conjunto pode ser interpretada como um
enfileiramento de seus elementos, de modo que um elemento 𝑥 é menor do que 𝑦 se 𝑥 estiver
mais próximo do início da fila do que 𝑦. Consequentemente, o menor elemento do conjunto
corresponde ao primeiro membro da fila. É o que ocorre, por exemplo, com o conjunto dos
naturais, que é bem ordenado pela relação “<” usual. Formalmente, temos a definição
seguinte.
Definição 4.5. 𝑅 é uma boa ordem (ordenação) sobre 𝑋 se, e somente se, 𝑅 é
linear e todo subconjunto não vazio de 𝑋 possui um menor elemento. Dizemos que ⟨𝑋, 𝑅⟩ é
um conjunto bem ordenado.
4 Pode-se exigir apenas que a relação seja uma ordem parcial ou estrita sobre 𝑋, pois o fato de todo subconjunto não vazio de 𝑋 possuir menor elemento garante que quaisquer dois membros 𝑥 e 𝑦 de 𝑋 sejam comparáveis: basta considerar o subconjunto {𝑥, 𝑦} ⊆ 𝑋 .
97
A importância dos conjuntos bem ordenados reside a princípio no fato de que
conjuntos bem ordenados podem ser comparados entre si, como provaremos posteriormente
no Teorema 4.5. Além disso, num conjunto bem ordenado vale o Princípio da Indução, cujo
Princípio da Indução Natural é apenas um subcaso. Provamos tal afirmação abaixo, adaptada
de Miraglia (1991, p. 46).
Teorema 4.3 (Princípio da Indução para Conjuntos Bem Ordenados). Seja
⟨𝑊, ≺⟩ um conjunto bem ordenado e 𝔓(𝑥) uma condição em 𝑥, possivelmente com
parâmetros. Se 𝔓(min𝑊) e, para qualquer 𝑦 ∈ 𝑊, 𝔓(𝑤) para todo 𝑤 ≺ 𝑦 for suficiente
para 𝔓(𝑦), então 𝔓(𝑎), para todo 𝑎 ∈ 𝑊.
Demonstração.
Seja 𝐴 = {𝑤 ∈ 𝑊|𝔓(𝑤)}. Queremos provar que 𝐴 = 𝑊. Caso 𝑊 = {min𝑊}
então não há o que provar, pois 𝔓(min𝑊) por hipótese. Seja então {min 𝑊} ⊂𝑊 e suponha,
por absurdo, 𝐴 ≠ 𝑊; obviamente temos 𝐴 ∖ 𝑊 ≠ ∅.
Como 𝑊 é bem ordenado e 𝐴 ∖𝑊 ≠ ∅, existe 𝑢 ∈ 𝐴 ∖ 𝑊 o menor elemento de
𝐴 ∖𝑊. É claro que se 𝑥 ≺ 𝑢 então 𝔓(𝑥), do contrário 𝑥 ∈ 𝐴 ∖ 𝑊 o que contestaria a
definição de 𝑢 como menor elemento de 𝐴 ∖ 𝑊. Assim, se 𝑥 ≺ 𝑢 então 𝔓(𝑥), donde pela
hipótese concluímos que 𝔓(𝑢), isto é, 𝑢 ∉ 𝐴 ∖ 𝑊, absurdo. Q.E.D.
O Princípio da Indução também pode ser formulado como segue:
Seja ⟨𝑊, ≺⟩ um conjunto bem ordenado e 𝐵 ⊆ 𝑊 ; se min𝑊 ∈ 𝐵 e, para
qualquer 𝑦 ∈ 𝑊, 𝑤 ∈ 𝐵 para todo 𝑤 ≺ 𝑦 for suficiente para 𝑦 ∈ 𝐵, então 𝐵 = 𝑊.
Se retirarmos a hipótese de que 𝐵 ⊆ 𝑊, obtemos ainda uma nova formulação:
Seja ⟨𝑊, ≺⟩ um conjunto bem ordenado e 𝐵 um conjunto qualquer; se min𝑊 ∈
𝐵 e, para qualquer 𝑦 ∈ 𝑊, 𝑤 ∈ 𝐵 para todo 𝑤 ≺ 𝑦 for suficiente para 𝑦 ∈ 𝐵, então 𝑊 ⊆ 𝐵 .
O resultado seguinte, adaptado de Suppes (1972), nos mostra que, de certa forma,
a recíproca do resultado anterior é verdadeira.
Teorema 4.4. Sejam 𝐴 um conjunto e ≺ uma relação de ordem total sobre 𝐴, tal
que seja verdadeira a sentença
(∀𝐵)��(∀𝑦)�𝑦 ∈ 𝐴 ∧ �(∀𝑥)�(𝑥 ∈ 𝐴 ∧ 𝑥 ≺ 𝑦) ⟹ 𝑥 ∈ 𝐵��� ⟹ 𝑦 ∈ 𝐵� ⟹ 𝐴 ⊆ 𝐵�.
Então ≺ é uma boa ordenação sobre 𝐴.
98
Demonstração.
Seja 𝑋 um subconjunto não vazio de 𝐴; devemos mostrar que 𝑋 possui um menor
elemento. Assumamos, por absurdo, que 𝑋 não possua um menor elemento e consideremos o
conjunto 𝐴 ∖ 𝑋. Afirmamos que se 𝑘 ∈ 𝐴 ∖ 𝑋 para todo 𝑘 tal que 𝑘 ≺ 𝑦, então 𝑦 ∈ 𝐴 ∖ 𝑋: de
fato, caso 𝑦 ∉ 𝐴 ∖ 𝑋, teríamos 𝑦 ∈ 𝑋 e, como 𝑘 ≺ 𝑦 ⟹ 𝑘 ∈ 𝐴 ∖ 𝑋, para qualquer 𝑥 ∈ 𝑋
restaria necessariamente 𝑦 ≺ 𝑥 ou 𝑦 = 𝑥, ou seja, 𝑦 seria o menor elemento de 𝑋,
contrariando a hipótese. Mostramos assim que
(∀𝑦)��𝑦 ∈ 𝐴 ∧ �(∀𝑥)(𝑥 ∈ 𝐴 ∧ 𝑥 ≺ 𝑦) ⟹ 𝑥 ∈ 𝐴 ∖ 𝑋�� ⟹ 𝑦 ∈ 𝐴 ∖ 𝑋�,
donde obtém-se, pela hipótese do teorema, que 𝐴 ⊆ 𝐴 ∖ 𝑋, o que é absurdo, já que tomamos
𝑋 como subconjunto não vazio de 𝐴. Portanto, 𝑋 possui um menor elemento. Q.E.D.
O bom comportamento dos conjuntos bem ordenados também se reflete nas
propriedades de seus segmentos iniciais, como provamos nos dois próximos resultados.
Proposição 4.3. Se ⟨𝑊, ≺⟩ é um conjunto bem ordenado e 𝑆 é um segmento inicial
de 𝑊, então existe 𝑎 ∈ 𝑊 tal que 𝑆 = {𝑥 ∈ 𝑊|𝑥 ≺ 𝑎}.
Demonstração.
Considere 𝑋 = 𝑊 ∖ 𝑆. Como 𝑆 ≠ 𝑊, tem-se 𝑋 ≠ ∅. Uma vez que ≺ é uma boa
ordenação sobre 𝑊 e 𝑋 é um subconjunto não vazio, existe um elemento 𝑎 ∈ 𝑋 tal que 𝑎 ≼ 𝑥,
para todo 𝑥 ∈ 𝑋, ou seja, 𝑎 = min(𝑋). Se 𝑦 ≺ 𝑎, então 𝑦 ∉ 𝑋, do contrário 𝑎 não seria o
menor elemento de 𝑋, logo 𝑦 ≺ 𝑎⟹ 𝑦 ∈ 𝑆. Se 𝑎 ≼ 𝑦 então 𝑦 ∉ 𝑆, se não teríamos 𝑎 ∉ 𝑋
uma vez que 𝑆 é segmento inicial de 𝑊. Assim, 𝑦 ∈ 𝑆 ⟺ 𝑦 ≺ 𝑎. Portanto,
𝑆 = {𝑥 ∈ 𝑊|𝑥 ≺ 𝑎}. Q.E.D.
Proposição 4.4. Seja ⟨𝑊, <⟩ um conjunto bem ordenado e 𝑎 ∈ 𝑊 qualquer. Então
𝒜 = {𝑥 ∈ 𝑊|𝑥 < 𝑎} é um segmento inicial de 𝑊.
Demonstração.
Análoga à demonstração do lema anterior. Notemos que se 𝑎 é o menor elemento
de 𝑊, então 𝒜 = ∅. Q.E.D.
Definição 4.6. Seja ⟨𝑊, <⟩ um conjunto bem ordenado e 𝑎 ∈ 𝑊 qualquer. O
segmento inicial de 𝑊 dado por 𝑎 é o conjunto 𝑊[𝑎] = {𝑥 ∈ 𝑊|𝑥 < 𝑎}.
99
A proposição seguinte apenas formaliza as propriedades básicas dos segmentos
iniciais de um conjunto bem ordenado; decorrem imediatamente da definição e, por tal
motivo, omitimos sua demonstração.
Proposição 4.5. Sejam ⟨𝑊, ≺⟩ um conjunto bem ordenado, 𝑊[𝑎] e 𝑊[𝑏]
segmentos iniciais arbitrários para certos 𝑎, 𝑏 ∈ 𝑊.
(i) 𝑊[𝑎] é bem ordenado pela relação ≺;
(ii) 𝑊[𝑎] ⊂𝑊[𝑏] ⟺ 𝑎 ≺ 𝑏;
(iii) 𝑊[𝑎] = 𝑊[𝑏] ⟺ 𝑎 = 𝑏;
(iv) 𝑊[𝑎] = 𝑊[𝑏] ∨𝑊[𝑎] ⊂ 𝑊[𝑏]∨𝑊[𝑏] ⊂𝑊[𝑎];
(v) 𝑊[𝑎] ∩𝑊[𝑏] = ∅ ⟺𝑊[𝑎] = ∅ ∨𝑊[𝑏] = ∅.
Definição 4.7. Seja ⟨𝑊, <⟩ um conjunto ordenado. 𝑓:𝑊 ⟶𝑊 é uma função
crescente se 𝑥1 < 𝑥2 implicar 𝑓(𝑥1) < 𝑓(𝑥2), para quaisquer 𝑥1, 𝑥2 ∈ 𝑊.
Notemos que todo isomorfismo é uma função crescente. Além disso, algo
eventualmente útil é o seguinte isomorfismo obtido por construção.
Proposição 4.6. Seja ⟨𝑊, <⟩ um conjunto bem ordenado e 𝑋 um conjunto
qualquer. Se 𝜑:𝑊⟶ 𝑋 é uma bijeção, então a relação definida por
<𝜑= {⟨𝜑(𝑥), 𝜑(𝑦)⟩ ∈ 𝑋 × 𝑋|𝜑−1(𝑥) < 𝜑−1(𝑦)}
é uma boa ordem sobre 𝑋, tal que ⟨𝑋, <𝜑⟩ ≅ ⟨𝑊, <⟩.
Demonstração.
Claramente <𝜑 é assimétrica. Com efeito, para 𝑥, 𝑦 ∈ 𝑋 quaisquer, existem 𝑤,
𝑣 ∈ 𝑊 tais que 𝜑(𝑤) = 𝑥 e 𝜑(𝑣) = 𝑦, daí se 𝑥 <𝜑 𝑦 temos 𝑤 < 𝑣, logo ¬�𝑦 <𝜑 𝑥�, pois do
contrário teríamos 𝑣 < 𝑤, absurdo. Analogamente prova-se que <𝜑 é transitiva e total.
Para 𝑌 ⊆ 𝑋 não vazio qualquer, considere 𝜑−1[𝑌] ⊆ 𝑊. Da boa ordem de 𝑊
segue que existe min𝜑−1[𝑌] = 𝑦 ∈ 𝜑−1[𝑌]. Obviamente, min 𝑌 = 𝜑(𝑦). De fato, se
existisse 𝑢 ∈ 𝑌 tal que 𝑢 <𝜑 𝜑(𝑦), teríamos 𝜑−1(𝑢) < 𝑦 e, como 𝜑−1(𝑢) ∈ 𝜑−1[𝑌], isso nos
levaria a concluir que min 𝜑−1[𝑌] ≠ 𝑦. Portanto, 𝑌 possui um menor elemento. Q.E.D.
Lema 4.1. Se ⟨𝑊, <⟩ é um conjunto bem ordenado e 𝑓:𝑊⟶ 𝑊 é uma função
crescente, então 𝑓(𝑥) ≥ 𝑥, para todo 𝑥 ∈ 𝑊.
Demonstração.
100
Chame 𝑋 = {𝑥 ∈ 𝑊|𝑓(𝑥) < 𝑥}. Se 𝑋 ≠ ∅, então existe 𝑎 ∈ 𝑋 tal que 𝑎 é o menor
elemento de 𝑋. Logo, 𝑓(𝑎) < 𝑎. Mas como 𝑓 é crescente, 𝑓�𝑓(𝑎)� < 𝑓(𝑎) e daí 𝑓(𝑎) ∈ 𝑋, o
que contraria o fato de 𝑎 ser o menor elemento de 𝑋. Portanto, 𝑋 = {𝑥 ∈ 𝑊|𝑓(𝑥) < 𝑥} = ∅, o
que equivale a afirmar que para todo 𝑥 ∈ 𝑊 , 𝑓(𝑥) ≥ 𝑥. Q.E.D.
Corolário 4.1.
(i) Nenhum conjunto bem ordenado é isomorfo a um segmento inicial de si
mesmo;
(ii) Para todo conjunto bem ordenado existe um único automorfismo, a
identidade;
(iii) Se 𝑊1 e 𝑊2 são conjuntos bem ordenados isomorfos, então o isomorfismo
entre 𝑊1 e 𝑊2 é único;
Demonstração.
(i) Seja ⟨𝑊, <⟩ um conjunto bem ordenado e um segmento inicial 𝑊[𝑎] para
algum 𝑎 ∈ 𝑊. Se existir um isomorfismo 𝑓:𝑊 ⟶𝑊[𝑎], então 𝑓(𝑎) ∈ 𝑊[𝑎], isto é,
𝑓(𝑎) < 𝑎, o que contraria o lema anterior.
(ii) Seja 𝑊 um conjunto bem ordenado e 𝜑:𝑊⟶𝑊 um automorfismo. 𝑓 é
tal que 𝑓(𝑥) < 𝑓(𝑦) ⟺ 𝑥 < 𝑦, para 𝑥, 𝑦 ∈ 𝑊 quaisquer. Por sua vez,
𝑓−1(𝑥) ≥ 𝑓−1(𝑦) ⟹𝑓(𝑓−1)(𝑥)≥ 𝑓�𝑓−1(𝑦)�⟹ 𝑥 ≥ 𝑦,
donde segue que 𝑓−1 é crescente (pela contrapositiva). Daí, pelo lema anterior, 𝑓(𝑥) ≥ 𝑥 e
𝑓−1(𝑥) ≥ 𝑥 para quaisquer 𝑥 ∈ 𝑊, donde segue que 𝑥 ≥ 𝑓(𝑥). Portanto, da antissimetria de
≤, segue que 𝑓(𝑥) = 𝑥, para todo 𝑥 ∈ 𝑊. Daí, pelo Teorema 3.9, 𝑓 = 𝐼𝑑𝑊 .
(iii) Sejam 𝑓:𝑊1 ⟶ 𝑊2 e 𝑔:𝑊1 ⟶ 𝑊2 isomorfismos. Claramente, a
composição 𝑓 ∘ 𝑔−1:𝑊2 ⟶𝑊2 é um automorfismo, pois para 𝑥, 𝑥′ ∈ 𝑊2 ,
𝑓�𝑔−1(𝑥)� < 𝑓�𝑔−1(𝑥′)�⟺ 𝑔−1(𝑥) < 𝑔−1(𝑥′)⟺ 𝑥 < 𝑥′,
e daí, pelo item anterior, 𝑓�𝑔−1(𝑥)� = 𝑥, para todo 𝑥 ∈ 𝑊2 , donde segue que 𝑓−1(𝑥) =
𝑔−1(𝑥) para todo 𝑥 ∈ 𝑊2 , isto é, 𝑓−1 = 𝑔−1, e finalmente se obtém 𝑓 = 𝑔. Q.E.D.
Teorema 4.5. Se ⟨𝑊1, <1⟩ e ⟨𝑊2 , <2⟩ são conjuntos bem ordenados, então
exatamente uma das alternativas abaixo é verdadeira:
(i) 𝑊1 e 𝑊2 são isomorfos;
101
(ii) 𝑊1 é isomorfo a um segmento inicial de 𝑊2 ;
(iii) 𝑊2 é isomorfo a um segmento inicial de 𝑊1 .
Em todos os casos, o isomorfismo é único.
Demonstração.
É imediato do Lema 4.1 e do Corolário 4.1 que (i), (ii) e (iii) são mutuamente
excludentes. Assim, para provarmos o teorema, devemos negar dois dos itens e mostrar a
validade do terceiro.
Definamos a relação 𝑓 = {⟨𝑥, 𝑦⟩ ∈ 𝑊1 × 𝑊2 :𝑊1[𝑥] é isomorfo a 𝑊2[𝑦]}.
Afirmação: 𝑓:𝔇(𝑓)⟶ ℑ(𝑓) é um isomorfismo.
Em vista da Proposição 4.2, basta mostrarmos que 𝑓 é uma função injetora
crescente, com ⟨𝔇(𝑓), <1⟩ e ⟨ℑ(𝑓), <2⟩ totalmente ordenados.
Primeiramente, 𝑓 é uma função injetora. De fato, se 𝑥𝑓𝑦1 e 𝑥𝑓𝑦2 então 𝑊1[𝑥] é
isomorfo a 𝑊2[𝑦1] e 𝑊2[𝑦2], mas pela Proposição 4.5 (iv)
𝑊2[𝑦1] = 𝑊2[𝑦2], 𝑊2[𝑦1] ⊂ 𝑊2[𝑦2] ou 𝑊2[𝑦2] ⊂ 𝑊2[𝑦1].
Contudo, como 𝑊2 [𝑦1] e 𝑊2[𝑦2] são isomorfos, obtemos 𝑊2[𝑦1] = 𝑊2[𝑦2] e, por
conseguinte, 𝑦1 = 𝑦2 e assim 𝑓 é função. Pelo mesmo argumento, 𝑥1𝑓𝑦 e 𝑥2𝑓𝑦 implicam
𝑥1 = 𝑥2, donde concluímos que 𝑓 é injetora. A sobrejetividade de 𝑓 é óbvia. �†1�
Tomemos então 𝑥, 𝑥′ ∈ 𝔇(𝑓), tais que 𝑥 <1 𝑥′. Queremos mostrar que 𝑓 é
crescente, ou seja, 𝑓(𝑥) <2 𝑓(𝑥′). Para tanto, seja ℎ:𝑊1[𝑥′] ⟶𝑊2[𝑓(𝑥′)] o isomorfismo
cuja existência inferimos por 𝑥′ ∈ 𝔇(𝑓); em particular, ℎ(𝑥) <2 𝑓(𝑥′). Notemos que
ℎ� = ℎ ↾ 𝑊1[𝑥] é um isomorfismo entre 𝑊1[𝑥] e 𝑊2[ℎ(𝑥)].
De fato, como ℎ é injetora, segue que ℎ� é injetora. Se 𝑢 ∈ 𝑊1[𝑥] temos 𝑢 <1 𝑥 e
daí ℎ�(𝑢) = ℎ(𝑢) <2 ℎ(𝑥), mostrando que ℎ�(𝑢) ∈ 𝑊2[ℎ(𝑥)] e ℑ�ℎ�� ⊆ 𝑊2 [ℎ(𝑥)]. Se
𝑦 ∈ 𝑊2[ℎ(𝑥)] então 𝑦 <2 ℎ(𝑥), donde obtém-se ℎ−1(𝑦) <1 𝑥, isto é, ℎ−1(𝑦) ∈ 𝑊1[𝑥], e
assim 𝑊2[ℎ(𝑥)] ⊆ ℑ�ℎ��. Logo ℎ�:𝑊1[𝑥] ⟶𝑊2[ℎ(𝑥)] é bijetora e, por conseguinte, é
também isomorfismo, haja vista que ℎ é isomorfismo. Enfim, por termos 𝑊1[𝑥] ≅𝑊2 [𝑓(𝑥)]
por hipótese, obtemos 𝑊2[ℎ(𝑥)] ≅ 𝑊2[𝑓(𝑥)] e, consequentemente 𝑓(𝑥) = ℎ(𝑥) <2 𝑓(𝑥′).
�†2�
Uma vez que 𝔇(𝑓) ⊆𝑊1 e ℑ(𝑓) ⊆𝑊2 , é óbvio que ⟨𝔇(𝑓), <1⟩ e ⟨ℑ(𝑓), <2⟩ são
ordenações totais (em particular, são bem ordenados). �†3�
102
Segue de �†1�, �†2� e �†3� que 𝑓:𝔇(𝑓) ⟶ℑ(𝑓) é um isomorfismo, como
afirmamos.
Para concluirmos a demonstração basta mostrarmos que 𝔇(𝑓) e ℑ(𝑓) não podem
ser simultaneamente subconjuntos próprios de 𝑊1 e 𝑊2 , respectivamente.
Suponha 𝔇(𝑓)≠ 𝑊1 . Vamos provar que 𝔇(𝑓) é um segmento inicial de 𝑊1 e
ℑ(𝑓) = 𝑊2 . Para 𝑥 ∈ 𝔇(𝑓) qualquer, tome 𝑢 <1 𝑥; se ℎ:𝑊1[𝑥] ⟶ 𝑊2[𝑓(𝑥)] é um
isomorfismo, então ℎ ↾ 𝑊1[𝑢]:𝑊1[𝑢] ⟶ 𝑊2[ℎ(𝑢)] é isomorfismo, donde segue que
⟨𝑢, ℎ(𝑢)⟩ ∈ 𝑓, isto é, 𝑢 ∈ 𝔇(𝑓), logo 𝔇(𝑓) é um segmento inicial de 𝑊1 e, por conseguinte,
𝔇(𝑓) = 𝑊1[𝑎′], para algum 𝑎′ ∈ 𝑊1 . Se por absurdo ℑ(𝑓)≠ 𝑊2 , então por um argumento
análogo ao anterior mostra-se que ℑ(𝑓) = 𝑊2[𝑏′], para algum 𝑏′ ∈ 𝑊2 ; contudo, teríamos
assim que 𝑓:𝑊1[𝑎′] ⟶ 𝑊2[𝑏′] seria um isomorfismo e pela definição de 𝑓, ⟨𝑎′, 𝑏′⟩ ∈ 𝑓 e daí
𝑎′ ∈ 𝔇(𝑓) = 𝑊1[𝑎′], isto é, 𝑎′ <1 𝑎′, absurdo. Portanto, ℑ(𝑓) = 𝑊2 e é isomorfo a um
segmento inicial de 𝑊1 .
Da mesma forma mostra-se que ℑ(𝑓) ≠𝑊2 implica em ℑ(𝑓) = 𝑊2[𝑏] para
algum 𝑏 ∈ 𝑊2 e 𝔇(𝑓) = 𝑊1 , donde se obtém 𝑊1 isomorfo a um segmento inicial de 𝑊2 .
Enfim, se 𝔇(𝑓) = 𝑊1 e ℑ(𝑓) = 𝑊2 , então 𝑊1 ≅ 𝑊2 são isomorfos. A unicidade dos
isomorfismos provém em todos os casos do Corolário 4.1 (iii). Q.E.D.
O Teorema 4.5 nos garante que conjuntos bem ordenados podem ser
“comparados” entre si, numa analogia a tamanho ou comprimento, o que condiz com a
comparação feita anteriormente referente às filas. Ainda sob tal perspectiva, é natural procurar
uma generalização de tal processo de comparação a fim de encontrar, em ZFC, uma definição
formal para o conceito de número. É exatamente isso o que fazemos na próxima seção.
4.2. Números Ordinais e a Recursão Transfinita
A primeira questão que se apresenta é tão profunda quanto perguntar-se o que é
um conjunto: o que é um número? Muitas respostas já foram dadas por matemáticos e
filósofos, em diferentes abordagens. Para Russell,
Número é o que é característico de números, assim como homem é característica de homens. Um trio de homens, por exemplo, é um caso de número 3, e o número 3 é
103
um exemplo de número; mas o trio não é um caso de número […]. Um número particular não é idêntico a qualquer coleção que tenha tal número de elementos: o número 3 não é idêntico com o trio composto por Brown, Jones e Robinson. O número 3 é algo que todos os trios possuem em comum e que os distingue de outras coleções. Um número é algo que caracteriza certos conjuntos, a saber, aqueles que possuem este número [de elementos] (RUSSELL, 1920, p. 11-12, itálico do autor, tradução nossa).
A postura que adotamos perante tal questão é sintetizada por um exemplo dado
por Halmos, que se pergunta
Como um matemático define um metro? O procedimento envolve dois passos […]. Primeiro, seleciona-se um objeto dentre os quais se destina o conceito a ser definido — um objeto, em outras palavras, tal que num sentido intuitivo ou prático mereça ser considerado como tendo um metro de comprimento. Segundo, forma-se o conjunto de todos os objetos no universo que possuem o mesmo comprimento que o objeto selecionado (note que isso independe de sabermos o que é o metro), e define-se o metro como sendo tal conjunto. (HALMOS, 1960, p. 43, tradução nossa).
Importamo-nos então em “como definir um número”, sem necessariamente
sabermos “o que” ele é, mesma postura tomada sobre a natureza dos conjuntos. A ideia de
definir números naturais na Teoria dos Conjuntos se deve a Frege, em seu Grundlagen der
Arithmetik (Fundamentos da Aritmética), de 1884. O método que utilizamos aqui, muito
diferente do trabalho de Frege, foi desenvolvido inicialmente por Von Neumann em seu
trabalho Zur Einführung der transfiniten Zahlen (Introdução dos Números Transfinitos), de
1923.
Hrbacek & Jech (1999) definem primeiramente o conjunto dos números naturais
como sendo
ℕ = {𝑛 ∈ ℐ|(∀𝑋)(𝑋 é indutivo ⟹𝑛 ∈ 𝑋)},
provando suas propriedades principais e, posteriormente, generalizando-as para os números
ordinais. Apesar de basearmo-nos no autor, seguimos a linha contrária e tratamos dos
números ordinais para daí “obter” os números naturais como consequência da teoria exposta.
Ressaltamos o caráter introdutório do que segue; uma abordagem mais aprofundada pode ser
encontrada, por exemplo, no trabalho de Levy (1979) e Jech (2003).
Definição 4.8. Seja 𝑋 um conjunto. ∈𝑋= {⟨𝑥, 𝑦⟩ ∈ 𝑋 × 𝑋|𝑥 ∈ 𝑦}.
Definição 4.9. 𝑋 é transitivo ⟺ (∀𝑥)(∀𝑦)(𝑥 ∈ 𝑋 ∧ 𝑦 ∈ 𝑥 ⟹ 𝑦 ∈ 𝑋).
104
Definição 4.10. Seja 𝛼 um conjunto. 𝛼 é um número ordinal se 𝛼 é transitivo e
⟨𝛼, ∈𝛼⟩ é bem ordenado.
Definição 4.11. 𝑥 + 1 = 𝑥 ∪ {𝑥}.
Definição 4.12. Sejam 𝛼 e 𝛽 números ordinais. Denotamos
(i) 𝛼 < 𝛽 se, e somente se, 𝛼 ∈ 𝛽;
(ii) 𝛼 > 𝛽 se, e somente se, 𝛽 < 𝛼;
(iii) 𝛼 ≤ 𝛽 se, e somente se, 𝛼 < 𝛽 ou 𝛼 = 𝛽;
(iv) 𝛼 ≥ 𝛽 se, e somente se, 𝛽 < 𝛼 ou 𝛼 = 𝛽.
Números ordinais (abreviadamente chamados de ordinais) são os representantes
“canônicos” dos conjuntos bem ordenados, haja vista que, a posteriori, todo conjunto bem
ordenado é isomorfo a um único ordinal (Teorema 4.8). De certa forma, podem ser
compreendidos como a generalização dos números naturais, os quais se obtêm por um
processo de “adição”, dado pela Definição 4.11, que nos dá o sucessor de 𝑥. Sua formulação
parte de uma ideia muito simples: adicionar um elemento ao conjunto previamente dado,
obtendo um novo conjunto “maior”. De fato, se 𝑥 é um ordinal então 𝑥 + 1 é um ordinal tal
que 𝑥 < 𝑥 + 1, no sentido da Definição 4.12. O lema seguinte apenas formaliza as
propriedades imediatas dos números ordinais.
Lema 4.2.
(i) Se 𝛼 é um ordinal então 𝛼 + 1 é um ordinal e 𝛼 < 𝛼 + 1;
(ii) Se 𝛼 é um ordinal então 𝛼 ∉ 𝛼;
(iii) Se 𝛼 é um ordinal, então não existe ordinal 𝛽 tal que 𝛼 < 𝛽 < 𝛼 + 1;
(iv) Se 𝛽 ∈ 𝛼 e 𝛼 é um ordinal então 𝛽 é um ordinal;
(v) 𝛼 = {𝛽|𝛽 é ordinal ∧ 𝛽 < 𝛼}, para todo ordinal 𝛼;
(vi) Se 𝛼 e 𝛽 são ordinais tais que 𝛼 ⊂ 𝛽, então 𝛼 ∈ 𝛽;
(vii) Se 𝛼 e 𝛽 são ordinais, então 𝛼 ∩ 𝛽 é ordinal.
Demonstração.
Provamos apenas (v) e (vii), as demonstrações dos demais itens podem ser
encontradas em Hrbacek & Jech (1999), Suppes (1972) e Kuratowski & Mostowski (1976).
Se 𝛼 = ∅, então por vacuidade ∅ é um número ordinal. Além disso, ∅ = {𝛽|𝛽 é
ordinal ∧ 𝛽 < ∅}, uma vez que não existe 𝛽 ∈ ∅. Para um ordinal 𝛼 ≠ ∅ qualquer, se 𝛾 ∈ 𝛼
105
então pelo item (iv) deste lema segue que 𝛾 é ordinal e assim 𝛾 ∈ {𝛽|𝛽 é ordinal ∧ 𝛽 < 𝛼}.
Reciprocamente, se 𝛾 é ordinal e 𝛾 < 𝛼 , segue em particular que 𝛾 ∈ 𝛼 . Assim, (v) está
provado.
Provemos (vii). Se 𝛼 = ∅ ou 𝛽 = ∅ então não há o que provar, pois ∅ é ordinal.
Se 𝛼 ∩ 𝛽 ≠ ∅, então em particular a restrição de ∈𝛼 a 𝛼 ∩ 𝛽 é uma boa ordem: todos os
membros de 𝛼 ∩ 𝛽 são comparáveis, uma vez que são também membros de 𝛼; também todo
subconjunto não vazio de 𝛼 ∩ 𝛽 possui menor elemento, haja vista que tais subconjuntos são
também subconjuntos de 𝛼. Além disso, 𝛼 ∩ 𝛽 é transitivo, pois se 𝑥 ∈ 𝑣 e 𝑣 ∈ 𝛼 ∩ 𝛽 então
𝑥 ∈ 𝛼 e 𝑥 ∈ 𝛽, pois tanto 𝛼 quanto 𝛽 são transitivos, logo 𝑥 ∈ 𝛼 ∩ 𝛽. Portanto, 𝛼 ∩ 𝛽 é
ordinal. Q.E.D.
A demonstração acima torna pertinente a definição a seguir.
Definição 4.13. 0 = ∅ e 1 = 0 + 1.
Teorema 4.6. Sejam 𝛼, 𝛽 e 𝛾 ordinais quaisquer.
(i) 𝛼 < 𝛽 ∧ 𝛽 < 𝛾 ⟹ 𝛼 < 𝛾;
(ii) 𝛼 < 𝛽 ⟹ ¬(𝛽 < 𝛼);
(iii) 𝛼 < 𝛽 ∨ 𝛽 < 𝛼 ∨ 𝑎 = 𝛽;
(iv) Todo conjunto de ordinais é bem ordenado;
(v) Se 𝑋 é um conjunto de ordinais, então ⋃𝑋 é ordinal;
(vi) Para todo conjunto de ordinais 𝑋 existe um ordinal 𝛼 tal que 𝛼 ∉ 𝑋.
Demonstração.
(i) Se 𝛼 < 𝛽 e 𝛽 < 𝛾 temos 𝛼 ∈ 𝛽 e 𝛽 ∈ 𝛾, mas como 𝛾 é transitivo inferimos
que 𝛽 ⊂ 𝛾 e, por conseguinte, 𝛼 ∈ 𝛾, isto é, 𝛼 < 𝛾.
(ii) Se por absurdo 𝛼 < 𝛽 e 𝛽 < 𝛼 fosse verdadeiro, seguiria pelo item
anterior que 𝛼 < 𝛼, isto é, 𝛼 ∈ 𝛼, o que contraria o Lema 4.2 (ii).
(iii) Sejam 𝛼 e 𝛽 ordinais. Pelo Lema 4.2 (vii), 𝛼 ∩ 𝛽 é um ordinal. Se
𝛼 ∩ 𝛽 = 𝛼, então 𝛼 ⊆ 𝛽 (pois 𝛼 ∩ 𝛽 ⊆ 𝛽) e daí 𝛼 ∈ 𝛽 ou 𝛼 = 𝛽 pelo Lema 4.2 (vi). Da
mesma forma, se 𝛼 ∩ 𝛽 = 𝛽, segue que 𝛽 ∈ 𝛼 ou 𝛼 = 𝛽. Se 𝛼 ∩ 𝛽 ≠ 𝛼 e 𝛼 ∩ 𝛽 ≠ 𝛽, então
𝛼 ∩ 𝛽 ∈ 𝛼 e 𝛼 ∩ 𝛽 ∈ 𝛽, donde teríamos 𝛼 ∩ 𝛽 ∈ 𝛼 ∩ 𝛽, o que contraria o Lema 4.2 (ii).
(iv) Seja 𝒪 um conjunto de números ordinais. Se 𝒪 = ∅ não há o que provar.
Considere então 𝒪 ≠ ∅ e a relação ∈𝒪. Claramente ∈𝒪 é uma ordem total em 𝒪, haja vista
que como todos os membros de 𝒪 são números ordinais, todos são comparáveis segundo ∈𝒪.
106
Mostremos inicialmente que 𝒪 possui um menor elemento segundo ∈𝒪. Tome um
ordinal 𝛼 ∈ 𝒪. Se 𝛼 ∩𝒪 = ∅, então 𝛼 é o menor elemento de 𝒪: de fato, para qualquer 𝛽 ∈
𝒪, se 𝛽 ∈ 𝛼 (ou seja, 𝛽 < 𝛼) teríamos 𝛼 ∩𝒪 ≠ ∅, absurdo, logo 𝛼 ≤ 𝛽, para todo 𝛽 ∈ 𝒪. Se
𝛼 ∩𝒪 ≠ ∅, então existe 𝛾 ∈ 𝛼 ∩ 𝒪 ⊆ 𝛼 o menor elemento de 𝛼 ∩ 𝒪. Tal 𝛾 é o menor
elemento de 𝒪, caso contrário, existiria 𝜉 ∈ 𝒪 com 𝜉 < 𝛾, isto é, 𝜉 ∈ 𝛾 ∈ 𝛼 e assim 𝜉 ∈ 𝛼 ∩
𝒪, o que contraria o fato de 𝛾 ser o menor elemento de 𝛼 ∩𝒪. Em ambos os casos, 𝒪 possui
um menor elemento.
Como 𝒪 é um conjunto de ordinais arbitrário, segue que todo conjunto 𝑋 de
números ordinais é bem ordenado, pois qualquer subconjunto de 𝑋 é em particular um
conjunto de ordinais.
(v) Seja 𝑋 um conjunto de ordinais. Pelo item anterior, ⟨𝑋, ∈𝑋⟩ é bem
ordenado. Considere então ⋃𝑋. Se 𝑥 ∈ ⋃𝑋, existe um ordinal 𝛼 tal que 𝑥 ∈ 𝛼 , donde pelo
Lema 4.2 (iv) segue que 𝑥 é um ordinal. Logo, ⋃𝑋 é um conjunto de ordinais e, por
conseguinte, é bem ordenado. Resta provar apenas que ⋃𝑋 é transitivo, mas isto é óbvio: se
𝑥 ∈ ⋃𝑋, existe um ordinal 𝛼 tal que 𝑥 ∈ 𝛼, e se 𝑦 ∈ 𝑥 então 𝑦 ∈ 𝛼, logo 𝑦 ∈ ⋃𝑋. Portanto,
⋃𝑋 é bem ordenado pela relação ∈⋃𝑋 e é transitivo, ou seja, ⋃𝑋 é um número ordinal.
(vi) Em outras palavras queremos provar a não existência de um conjunto de
todos os números ordinais. Via reductio ad absurdum, considere Ω o “conjunto de todos os
ordinais”. Em particular, Ω é um conjunto de ordinais, donde obtemos pelo item anterior que
⋃Ω é um número ordinal, e pelo Lema 4.2 (i) 𝛼 = ⋃Ω+ 1 é ordinal. Se 𝛼 ∈ Ω então
obviamente 𝛼 ⊆ ⋃Ω e pelo Lema 4.2 (vi) temos 𝛼 ∈ ⋃Ω ou 𝛼 = ⋃Ω e, de ambos os casos,
concluímos que 𝛼 < 𝛼, absurdo. Logo 𝛼 ∉ Ω e, portanto, não existe um conjunto de todos os
números ordinais. Q.E.D.
Corolário 4.2. Se 𝑋 é um conjunto de números ordinais, então ⋃𝑋 é um número
ordinal tal que 𝛼 ≤ ⋃𝑋 para todo 𝛼 ∈ 𝑋; além disso, ⋃𝑋 é o menor ordinal com tal
propriedade.
Demonstração.
Vimos na demonstração do Teorema 4.6 (v) que ⋃𝑋 é um número ordinal.
Notemos que se 𝛼 ∈ 𝑋 então 𝛼 ⊆ ⋃𝑋 e, como ambos são ordinais, tem-se 𝛼 ≤ ⋃𝑋. Por
outro lado, se para algum ordinal 𝛾, 𝛼 ≤ 𝛾 para todo 𝛼 ∈ 𝑋, então ⋃𝑋 ≤ 𝛾: basta observar
que para todo 𝛼 ∈ ⋃𝑋 existe um ordinal 𝛽 ∈ 𝑋 tal que 𝛼 < 𝛽 ≤ 𝛾, donde decorre que 𝛼 ∈ 𝛾
e assim ⋃𝑋 ⊆ 𝛾, e daí ⋃𝑋 ≤ 𝛾. Q.E.D.
107
O corolário acima justifica chamar ⋃𝑋 de supremo de 𝑋.
Definição 4.14. Se 𝑋 é um conjunto de ordinais, sup𝑋 = ⋃𝑋 é o supremo de 𝑋.
Observação: Analogamente, para todo conjunto 𝑋 de ordinais, ⋂𝑋 é um ordinal
e, mais do que isso, min 𝑋 = ⋂𝑋.
Corolário 4.3. Para quaisquer ordinais 𝛼 e 𝛽 distintos, 𝛼 ⊂ 𝛽 ou 𝛽 ⊂ 𝛼. Além
disso, 𝛼 ⊂ 𝛽 se, e somente se, 𝛼 é um segmento inicial de 𝛽.
Demonstração.
Decorre imediatamente da Definição 4.12, do item (v) do Lema 4.2 e do item (iii)
do teorema anterior. Q.E.D.
Observação: Para dois ordinais 𝛼 e 𝛽, temos 𝛼 ≤ 𝛽⟺ 𝛼 ⊆ 𝛽 .
Corolário 4.4. Se 𝛼 e 𝛽 são ordinais tais que ⟨𝛼, ∈𝛼⟩ ≅ ⟨𝛽, ∈𝛽⟩, então 𝛼 = 𝛽.
Demonstração.
Se 𝛼 < 𝛽, então 𝛼 seria um segmento inicial de 𝛽 e daí o isomorfismo da hipótese
contrariaria o Corolário 4.1 (i); analogamente 𝛽 < 𝛼 nos leva a uma contradição. Em vista do
item (iii) do Teorema 4.6, resta apenas 𝛼 = 𝛽. Q.E.D.
Vemos assim que para os números ordinais vale uma espécie de tricotomia, apesar
de a “relação” de ordem dos ordinais não possuir um domínio, conforme nos mostrou o item
(vi) do teorema precedente. Notemos que isso elimina de ZFC o paradoxo de Burali-Forti,
existente na Teoria Ingênua dos Conjuntos. Isto evidencia justamente a impossibilidade de se
considerar verdadeira a existência de um conjunto de todos os ordinais. Grosso modo, assim
como o conjunto universo, o conjunto de todos os números ordinais é “grande demais” para
ser um conjunto.
Os dois próximos teoremas tem importância fundamental na Teoria dos Conjuntos
e justificam, por assim dizer, a importância do desenvolvimento dos números ordinais. Para
enunciá- los, temos a definição abaixo. Frisamos que ≾ indica a existência de função injetora.
Definição 4.15. Para um conjunto 𝐴 qualquer, o Número de Hartogs de 𝐴 é o
conjunto ℎ(𝐴) = {𝛼|𝛼 é ordinal ∧ (∃𝑊)(𝑊 ⊆ 𝐴 ∧ 𝛼 ≾ 𝑊)}.
108
O teorema seguinte prova que o Número de Hartogs existe para qualquer conjunto
𝐴. Sua demonstração é uma adaptação dos argumentos apresentados por Suppes (1972) e
Hrbacek & Jech (1999).
Teorema 4.7 (Número de Hartogs). ℎ(𝐴) existe para todo conjunto 𝐴 e pode ser
definido por ℎ(𝐴) = {𝛼|𝛼 é ordinal ∧ 𝛼 ≾ 𝐴}. Além disso, ℎ(𝐴) é o menor número ordinal tal
que ¬(ℎ(𝐴) ≾ 𝐴).
Demonstração.
Pelo Corolário 4.4 e pelo item (iii) do Teorema 4.2, se um conjunto ⟨𝑋, ≺⟩ bem
ordenado for isomorfo a dois ordinais 𝛼 e 𝛽, então 𝛼 = 𝛽, pois 𝛼 ≅ 𝛽. Logo, para toda
relação 𝑅 ∈ ℘(𝐴 × 𝐴) que seja uma boa ordem, existe no máximo um ordinal 𝛽𝑅 tal que
⟨𝔇(𝑅),𝑅⟩ ≅ ⟨𝛽𝑅, ∈𝛽𝑅 ⟩. Definamos então
𝒲(𝐴) = {⟨𝑋,𝑅⟩ ∈ ℘(𝐴) × ℘(𝐴 × 𝐴)|𝑋 = 𝔇(𝑅) ∧ 𝑅 é uma boa ordem sobre 𝑋},
cuja existência é obviamente garantida pelo Axioma da Separação. Pela observação feita no
início da demonstração, a condição 𝔓(𝑥, 𝑦) dada por
“𝔓(𝑥, 𝑦) ≡ (𝑥 ∈ 𝒲(𝐴) ∧ 𝑦 é um número ordinal tal que 𝑥 ≅ 𝑦) ∨ (𝑥 ∉ 𝒲(𝐴) ∧ 𝑦 = ∅)”
é funcional em 𝑥, donde segue que o Axioma da Substituição assegura a existência do
conjunto ℋ, onde
ℋ = {𝛼|𝛼 é ordinal ∧ (∃𝑥)(𝑥 ∈ 𝒲(𝐴) ∧ ⟨𝛼, ∈𝛼⟩ ≅ 𝑥}.
Afirmamos que ℋ contém todos os ordinais 𝛼 tais que 𝛼 ≾ 𝐵, onde 𝐵 ⊆ 𝐴. De
fato, se 𝛼 ≾ 𝐴, existe uma injeção 𝜑:𝛼 ⟶ 𝐴. Daí, 𝜑′:𝛼 ⟶ 𝜑[𝛼] dada por 𝜑′(𝛽) = 𝜑(𝛽)
para todo 𝛽 < 𝛼 é obviamente uma bijeção e, por construção, como fizemos na Proposição
4.6, existe uma relação 𝑅 tal que ⟨𝜑′[𝛼], 𝑅⟩ ≅ ⟨𝛼, ∈𝛼⟩, donde segue que 𝛼 ∈ ℋ.
Assim, basta fazermos ℎ(𝐴) = {𝛼 ∈ ℋ|𝛼 é ordinal ∧ 𝛼 ≾ 𝐴}, que claramente
satisfaz à Definição 4.15 e, pelo Teorema 2.7, também ℎ(𝐴) = {𝛼|𝛼 é ordinal∧ 𝛼 ≾ 𝐴}.
Por ser um conjunto de ordinais, ℎ(𝐴) é obviamente bem ordenado. Para mostrar
que ℎ(𝐴) é um número ordinal, precisamos apenas provar que ℎ(𝐴) é transitivo. Para
𝛼 ∈ ℎ(𝐴) qualquer, 𝛼 é um ordinal tal que 𝛼 ≾ 𝐴. Logo, se 𝑥 ∈ 𝛼 então 𝑥 também é um
ordinal e, obviamente, 𝑥 ≾ 𝐴: basta tomar a injeção 𝜑:𝛼 ⟶ 𝐴, cuja existência segue de
𝛼 ∈ ℎ(𝐴), e considerar 𝜑 ↾ 𝑥: 𝑥 ⟶ 𝐴. Portanto, ℎ(𝐴) é um ordinal.
109
Por ser um número ordinal, ℎ(𝐴) não admite injeção com qualquer subconjunto
de 𝐴: caso contrário, ℎ(𝐴) ∈ ℎ(𝐴) pela definição de ℎ(𝐴). Pelo mesmo motivo, 𝛾 < ℎ(𝐴)
implica 𝛾 ∈ ℎ(𝐴) e assim 𝛾 ≾ 𝐴, donde se obtém que ℎ(𝐴) é de fato o menor número ordinal
que não admite bijeção com qualquer subconjunto de 𝐴. Q.E.D.
Teorema 4.8. Todo conjunto bem ordenado é isomorfo a um único número
ordinal.
Demonstração.
Seja ⟨𝑊, ≺⟩ um conjunto bem ordenado e considere o número de Hartogs de 𝑊
ℎ(𝑊). Como ℎ(𝑊) é um conjunto bem ordenado, temos três possibilidades: ℎ(𝑊) e 𝑊
isomorfos; ℎ(𝑊) isomorfo a um segmento inicial de 𝑊; 𝑊 isomorfo a um segmento inicial
de ℎ(𝑊).
As duas primeiras possibilidades contrariam a definição de ℎ(𝑊), pois nos levam
a concluir que ℎ(𝑊)≾ 𝑊. Resta apenas 𝑊 isomorfo a um segmento inicial de ℎ(𝑊). Daí,
como ℎ(𝑊) é um número ordinal, pelo Corolário 4.3, qualquer segmento inicial de ℎ(𝑊) é
um número ordinal, donde obtemos que 𝑊 é isomorfo a um número ordinal 𝛼 < ℎ(𝑊). A
unicidade decorre do Corolário 4.4. Q.E.D.
Corolário 4.5. Se 𝑋 é bem ordenado, então 𝑋 ≾ ℎ(𝑋).
Demonstração.
Decorre imediatamente do que vimos na demonstração do teorema anterior.
Notemos que 𝑋 ≾ ℎ(𝑋) significa afirmar que existe uma injeção 𝜓:𝑋 ⟶ ℎ(𝑋). Q.E.D.
Corolário 4.6.
(i) Se 𝑋 ≾ 𝑌 então ℎ(𝑋) ≤ ℎ(𝑌);
(ii) Se 𝑋 ≈ 𝑌 então ℎ(𝑋) = ℎ(𝑌).
Demonstração.
Por definição, se 𝛼 ∈ ℎ(𝑋) então 𝛼 ≾ 𝑋. Se 𝑋 ≾ 𝑌, segue do Corolário 3.4 que
𝛼 ≾ 𝑌 e consequentemente 𝛼 ∈ ℎ(𝑌), mostrando que ℎ(𝑋) ⊆ ℎ(𝑌), e assim ℎ(𝑋) ≤ ℎ(𝑌).
Obviamente, se 𝑋 ≈ 𝑌, temos 𝑌 ≾ 𝑋 e 𝑋 ≾ 𝑌, donde ℎ(𝑋) ≤ ℎ(𝑌) e ℎ(𝑌) ≤ ℎ(𝑋). Q.E.D.
Observação: O Teorema 4.8 não depende diretamente da existência do Número de
Hartogs. Uma demonstração mais elaborada que independe de tal número pode ser encontrada
em Hrbacek & Jech (1999, p. 111). A argumentação que apresentamos foi adaptada de
Miraglia (1991).
110
Podemos assim adotar os números ordinais como representantes de conjuntos bem
ordenados a fim de compará-los. Mais do que isso, dos números ordinais deriva-se a definição
de número cardinal, a priori, válida apenas para conjuntos bem ordenados.
Definição 4.16. Se 𝑊 é um conjunto bem ordenado, o tipo de ordem (order type)
de 𝑊 é o único ordinal 𝛼 isomorfo a 𝑊, indicado por 𝑜𝑟𝑑 (𝑊) = 𝛼.
Definição 4.17. Um número ordinal 𝛼 é um número cardinal (ordinal inicial) se
não existe ordinal 𝛽 < 𝛼 tal que 𝛽 ≈ 𝛼.
Definição 4.18. Um conjunto 𝑋 é bem ordenável se existe 𝑅 ∈ ℘(𝑋 × 𝑋) tal que
⟨𝑋, 𝑅⟩ é bem ordenado.
Teorema 4.9. Todo conjunto bem ordenável é equipotente a um único cardinal,
independentemente da relação de boa ordem definida sobre ele.
Demonstração.
Seja ⟨𝑊, ≺⟩ um conjunto bem ordenado. Como vimos, existe 𝑜𝑟𝑑 ⟨𝑊, ≺⟩ = 𝛽 <
ℎ(𝑊). Logo, existe ao menos um ordinal 𝛼 equipotente a 𝑊, donde segue que o conjunto
𝐸(𝑊) = {𝛼 ∈ ℎ(𝑊)|𝛼 ≈ 𝑊} ⊆ ℎ(𝑊) é um subconjunto não vazio de ℎ(𝑊). De sua boa
ordenação segue que existe 𝛼0 = min 𝐸(𝑊). Da minimalidade de 𝛼0, segue facilmente que
𝛼0 é o único cardinal equipotente a 𝑊.
Analogamente, se < é outra boa ordenação sobre 𝑊, existe 𝑜𝑟𝑑 ⟨𝑊, <⟩ = 𝛽′ <
ℎ(𝑊) donde consequentemente obtemos 𝐸(𝑊) ≠ ∅, e o resultado segue-se. Q.E.D.
Proposição 4.7. ℎ(𝐴) é um número cardinal, para qualquer conjunto 𝐴.
Demonstração.
Se existisse 𝛽 < ℎ(𝐴) tal que 𝛽 ≈ ℎ(𝐴), então 𝛽 seria equipotente a algum
subconjunto de 𝐴 (pois 𝛽 < ℎ(𝐴) ⟺𝛽 ∈ ℎ(𝐴)). Assim, existiriam bijeções 𝜑:𝛽 ⟶ ℎ(𝐴) e
𝜓:𝛽 ⟶𝑊, com 𝑊 ⊆ 𝐴, donde 𝜓 ∘ (𝜑−1):ℎ(𝐴) ⟶𝑊 seria uma bijeção, e
consequentemente ℎ(𝐴) ∈ ℎ(𝐴), absurdo. Logo, não existe ordinal 𝛽 < ℎ(𝐴) tal que 𝛽 ≈
ℎ(𝐴). Q.E.D.
Definição 4.19. Se 𝑋 é um conjunto bem ordenável, o número cardinal de 𝑋,
denotado por |𝑋|, é o único cardinal 𝛼 tal que 𝛼 ≈ 𝑋.
Como são números ordinais, é válida para os números cardinais a “relação” <
estabelecida na Definição 4.12. Além disso, cardinais podem ser interpretados como os
111
representantes canônicos de conjuntos equipotentes entre si, pois respeitam a “ordem” de
equipotência ≾ definida no capítulo anterior, na Definição 3.30.
Teorema 4.10. Sejam 𝑋 e 𝑌 conjuntos bem ordenados.
(i) |𝑋| = |𝑌| ⟺𝑋 ≈ 𝑌;
(ii) |𝑋| < |𝑌| ⟺𝑋 ≺ 𝑌;
(iii) |𝑋| ≤ |𝑌| ⟺𝑋 ≾ 𝑌.
Demonstração.
Por definição temos
[†] 𝑋 ≈ |𝑋| e 𝑌 ≈ |𝑌|.
Decorre diretamente de [†] que se |𝑋| = |𝑌| então 𝑋 ≈ 𝑌. Reciprocamente, se
𝑋 ≈ 𝑌 então |𝑋| ≈ |𝑌|; logo, se |𝑋| ≠ |𝑌| teríamos |𝑋| < |𝑌| ou |𝑌| < |𝑋|; em ambos os
casos estaríamos contrariando o fato de |𝑌| ou |𝑋| serem os números cardinais de 𝑌 ou 𝑋,
respectivamente, o que prova (i).
Se |𝑋| < |𝑌|, então |𝑋| é isomorfo a algum segmento inicial de |𝑌|, donde se
conclui que |𝑋| ≾ |𝑌| e por [†] obtemos 𝑋 ≾ 𝑌. Contudo, se 𝑌 ≾ 𝑋, teríamos 𝑋 ≈ 𝑌 (em vista
do Teorema de Cantor-Bernstein), donde |𝑋| seria um ordinal menor que |𝑌| equipotente a 𝑌,
absurdo. Logo, 𝑋 ≺ 𝑌.
Reciprocamente, se 𝑋 ≺ 𝑌 então em particular 𝑋 ≾ 𝑌, e por [†] inferimos
|𝑋| ≾ |𝑌|. Se, por absurdo, |𝑌| < |𝑋|, seguiria que |𝑌| seria isomorfo a um segmento inicial
de |𝑋| e assim |𝑌| ≾ |𝑋|, resultando em |𝑋| ≈ |𝑌| e consequentemente 𝑋 ≈ 𝑌, absurdo. Logo,
|𝑋| ≤ |𝑌|; no entanto, se |𝑋| = |𝑌| teríamos por (i) que 𝑋 ≈ 𝑌, contrariando 𝑋 ≺ 𝑌. Portanto,
|𝑋| < |𝑌|, validando (ii).
(iii) decorre diretamente dos dois itens anteriores, bem como do Corolário 3.4.
Q.E.D.
O próximo teorema, adaptado de um resultado proposto por Kunen (1980, p. 28),
nos dá uma caracterização para os números cardinais.
Teorema 4.11. Um número ordinal 𝛼 é um número cardinal se, e somente se,
𝛼 = |𝛼|.
Demonstração.
112
Notemos primeiramente que para todo ordinal 𝛼 vale |𝛼| ≾ 𝛼. Claramente, como
𝛼 é bem ordenado, existe um número cardinal 𝛽 tal que |𝛼| = 𝛽 e, como 𝛼 ≈ 𝛼 , por definição
temos necessariamente 𝛽 ≤ 𝛼.
Então, se 𝛼 é um número cardinal, segue que não existe 𝛽 < 𝛼 tal que 𝛽 ≈ 𝛼,
logo |𝛼| = 𝛼. A recíproca é óbvia. Q.E.D.
Não nos aprofundamos no estudo dos números cardinais, de modo que voltamos a
eles apenas no final do capítulo, para definir os números cardinais transfinitos. Uma
introdução sistemática e clara aos cardinais é dada por Suppes (1972) e Hrbacek & Jech
(1999).
Na seção anterior vimos que num conjunto bem ordenado 𝑊 vale o Princípio da
Indução. Nesta seção, já mostramos que um conjunto formado unicamente por ordinais é bem
ordenado. Assim, se existisse um “conjunto de todos os números ordinais”, este seria bem
ordenado e, consequentemente, valeria o Princípio da Indução para números ordinais. Apesar
de tal conjunto não existir, o princípio é válido conforme provamos abaixo.
Teorema 4.12 (Princípio da Indução para Ordinais – Primeira Forma5). Seja
𝔓(𝑥) uma condição em 𝑥, possivelmente com parâmetros. Assumamos que para qualquer
ordinal 𝛼,
[†] �𝛽 é ordinal ∧ 𝛽 < 𝛼 ⟹ 𝔓(𝛽)�⟹ 𝔓(𝛼);
nestas condições, 𝔓(𝛾) é verdadeiro para todo número ordinal 𝛾.
Demonstração.
Suponha, por absurdo, que ¬𝔓(𝛾) para algum ordinal 𝛾 e considere 𝑆 =
{𝛽 ∈ 𝛾|𝛽 ≤ 𝛾 ∧ ¬𝔓(𝛽)}, isto é, 𝑆 é o conjunto dos ordinais menores que 𝛾 que não gozam da
propriedade 𝔓. Como todos os membros de 𝑆 são ordinais, segue que 𝑆 é bem ordenado e, por
conseguinte, possui um elemento mínimo 𝜇. Note que se 𝜇 = ∅ então não existe 𝛽 < 𝜇, o que
torna a implicação “𝛽 é ordinal ∧𝛽 < 𝛼 ⟹ 𝔓(𝛽)” verdadeira e devido a [†] temos 𝔓(𝜇), o
que contraria 𝜇 ∈ 𝑆. Se 𝜇 ≠ ∅, então para qualquer ordinal 𝛽 < 𝜇, 𝛽 ∉ 𝑆 e, por conseguinte,
𝔓(𝛽), donde por [†] obtemos 𝔓(𝜇) e, portanto, 𝜇 ∉ 𝑆, absurdo. Q.E.D.
5 Também chamado de Princípio da Indução Transfinita.
113
Pode-se formular o Princípio da Indução Transfinita de outra maneira. Para tanto,
temos a seguinte definição.
Definição 4.20. Um ordinal 𝛼 é um ordinal sucessor se 𝛼 = 𝛽 + 1, para algum
ordinal 𝛽. Caso contrário, 𝛼 é um ordinal limite.
Teorema 4.13 (Princípio da Indução para Ordinais – Segunda Forma). Seja 𝔓(𝑥)
uma condição em 𝑥. Se:
(i) 𝔓(∅);
(ii) 𝔓(𝛼) ⟹𝔓(𝛼 + 1), para quaisquer ordinais 𝛼;
(iii) Para todo ordinal limite 𝛾 ≠ ∅, se 𝔓(𝛽) para todo ordinal 𝛽 < 𝛾, então
𝔓(𝛾);
nestas condições, 𝔓(𝜆) é válido para todo ordinal 𝜆.
Demonstração.
Decorre imediatamente da primeira forma do Princípio da Indução Transfinita.
Uma demonstração detalhada é dada por Hrbacek & Jech (1999, p. 115). Q.E.D.
O próximo resultado, o Teorema da Recursão Transfinita, nos permite realizar
uma determinada operação (ou várias operações) repetidamente, na ordem dos números
ordinais. Por exemplo, para um conjunto 𝑥 qualquer, existe um único conjunto 𝑦 tal que
𝑦 = ℘(𝑥). Assim, a relação
𝔊(𝑥, 𝑦)≡ 𝑦 = ℘(𝑥)
é funcional em 𝑥. Podemos então considerar o “procedimento 6” dado pela lei
𝑉0 = ∅, 𝑉𝛼+1 = ℘(𝑉𝛼) se 𝛼 é um ordinal sucessor e
𝑉𝛼 = �𝑉𝛽𝛽<𝛼
, para todo ordinal limite 𝛼 ≠ 0.
Assim, 𝑉0 = ∅, 𝑉1 = ℘(∅) = {∅}, 𝑉2 = ℘({∅}) = �∅, {∅}�, etc.
6 Tal processo representa a construção da hierarquia dos conjuntos ditos bem fundados. O Axioma da Regularidade garante que, em ZFC, todo conjunto é membro de algum 𝑉𝛼 (ver Apêndice B).
114
Outro intento pode ser definir adição de números ordinais. A definição de
sucessor adotada é tal que para qualquer conjunto 𝑥, existe um único conjunto 𝑦 = 𝑥 + 1.
Podemos então iterar o processo de “adicionar 1” de modo a obtermos uma adição mais
ampla, definindo para qualquer ordinal 𝛽:
𝛽 + 0 = 𝛽, 𝛽 + (𝛼 + 1) = (𝛽 + 𝛼) + 1 para qualquer ordinal sucessor 𝛼 e
𝛽 + 𝛼 = sup{𝛽 + 𝛾|𝛾 < 𝛼} para todo ordinal limite 𝛼 ≠ 0.
Por mais que saibamos intuitivamente como operar seguindo tais regras, nada
garante até agora que elas possam ser definidas formalmente em ZFC. A fim de sanar tal
deficiência, provamos o Teorema da Recursão Transfinita.
Teorema 4.14 (Definição por Recursão Transfinita7 para Ordinais). Seja 𝔊 uma
operação, e considere a fórmula
𝔓(𝑥, 𝑦)≡ �𝑥 é um número ordinal ∧ 𝑦 = 𝑡(𝑥)� ∨ (𝑥 não é número ordinal ∧ 𝑦 = ∅),
onde 𝑡 é uma função com 𝔇(𝑡) = 𝑥 + 1 e tal que 𝑡(𝛽) = 𝔊(𝑡 ↾ 𝛽) para qualquer ordinal
𝛽 ≤ 𝑥. Então 𝔓 é funcional e, além disso, 𝔉(𝑥) = 𝑦 ⟺ 𝔓(𝑥, 𝑦) é tal que 𝔉(𝛾) = 𝔊(𝔉 ↾ 𝛾) ,
para qualquer ordinal 𝛾.
Demonstração.
Diremos que uma função 𝑡 é uma 𝛼-ésima iterada de 𝔊 se 𝔇(𝑡) = 𝛼 + 1 e, para
qualquer ordinal 𝛽 ≤ 𝛼, 𝑡(𝛽) = 𝔊(𝑡 ↾ 𝛽); em particular 𝑡(𝛼) = 𝔊(𝑡 ↾ 𝛼).
Provemos inicialmente que 𝔓 é funcional. Se 𝑥 não é um número ordinal então
não há o que provar. Se 𝑥 for um número ordinal, provaremos por indução transfinita que para
todo ordinal 𝛼 existe uma única 𝛼-ésima iterada de 𝔊, donde decorrerá que 𝔓(𝑥, 𝑦) é
funcional.
Assumamos que para qualquer 𝛽 < 𝛼 exista uma única 𝛽-ésima iterada de 𝔊 (por
simplicidade denotada 𝑡𝛽). Provemos que existe uma única 𝑡𝛼 . A hipótese de indução e o
Axioma da Substituição nos garantem a existência da família de funções
𝑇 = �𝑡𝛽�(∃𝛽)(𝛽 é ordinal ∧ 𝛽 < 𝛼)�.
7 Também chamada de Definição por Indução Transfinita, como vemos em Fraenkel, Bar-Hillel & Levy (1973, p. 93). A versão do teorema que provamos é uma adaptação do resultado provado por Hrbacek & Jech (1999, p. 115-117) e Jech (2003, p. 22).
115
Chamemos �̃� = ⋃𝑇 e finalmente 𝜏 = �̃� ∪ {⟨𝛼, 𝔊(�̃�)⟩}.
(Existência da 𝛼-ésima iterada): afirmamos que 𝜏 é uma 𝛼-ésima iterada de 𝔊.
Primeiramente, é óbvio que 𝜏 é uma relação, pois todos os membros de �̃� são
membros dos membros de 𝑇, isto é, pares ordenados. Mostremos então que 𝑇 é um sistema
compatível de funções.
Sejam 𝑡1, 𝑡2 ∈ 𝑇, tais que 𝔇(𝑡1) = 𝛽1 e 𝔇(𝑡2) = 𝛽2. Sem perda de generalidade,
assumamos 𝛽1 ≤ 𝛽2; como são ambos ordinais, 𝛽1 ⊆ 𝛽2. Assim, é suficiente provar que para
qualquer 𝛾 ≤ 𝛽1, 𝑡1(𝛾) = 𝑡2(𝛾), pois 𝛽1 ∩ 𝛽2 = 𝛽1. Procedemos por indução transfinita
(Teorema 4.3): seja 𝛾 < 𝛽1 e suponha que para qualquer 𝛿 < 𝛾, 𝑡1(𝛿) = 𝑡2(𝛿), então
𝑡1 ↾ 𝛾 = 𝑡2 ↾ 𝛾, e assim 𝑡1(𝛾) = 𝔊(𝑡1 ↾ 𝛾) = 𝔊(𝑡2 ↾ 𝛾) = 𝑡2(𝛾); logo, 𝑡1(𝛾) = 𝑡2(𝛾), para
quaisquer 𝛾 ∈ 𝛽1, como queríamos.
Segue então pelo Teorema 3.14 que �̃� = ⋃𝑇 é função. Além disso, considerando
𝐷 = {𝔇(𝑡)|𝑡 ∈ 𝑇}, temos pelo mesmo teorema 𝔇(�̃�) = ⋃𝐷. Como para todo 𝛽 < 𝛼 existe
𝑡 ∈ 𝑇 tal que 𝔇(𝑡) = 𝛽 + 1, bem como se 𝑡′ ∈ 𝑇 então 𝔇(𝑡′) = 𝛽′ + 1 para algum 𝛽′ < 𝛼,
segue que
𝔇(�̃�) = �𝔇(𝑡)𝑡∈𝑇
= �(𝛽+ 1)𝛽<𝛼
= 𝛼,
e daí 𝜏 é obviamente uma função, pois 𝛼 ∉ 𝔇(�̃�), de modo que 𝔇(𝜏) = 𝔇(�̃�) ∪ {𝛼} = 𝛼 + 1.
Em particular, 𝜏 ↾ 𝛼 = �̃�.
Resta mostrarmos que 𝜏(𝛽) = 𝔊(𝜏 ↾ 𝛽), para qualquer 𝛽 ≤ 𝛼.
Por construção, 𝜏(𝛼) = 𝔊(�̃�) = 𝔊(𝜏 ↾ 𝛼). Se 𝛽 < 𝛼, tomemos 𝑡 ∈ 𝑇 de modo que
𝛽 ∈ 𝔇(𝑡). Devido à definição de 𝑇, temos 𝑡(𝛽) = 𝔊(𝑡 ↾ 𝛽). Como 𝑇 é um sistema de
funções compatíveis, ⋃𝑇 = �̃� estende todas as funções de 𝑇 (Teorema 3.14), e assim 𝑡(𝜆) =
�̃�(𝜆) = 𝜏(𝜆) para todo 𝜆 ∈ 𝛽 e dessa forma, 𝑡 ↾ 𝛽 = 𝜏 ↾ 𝛽. Portanto, 𝜏(𝛽) = 𝔊(𝜏 ↾ 𝛽).
Segue do que vimos que 𝜏 é uma 𝛼-ésima iterada de 𝔊.
(Unicidade): Seja 𝜎 outra 𝛼-ésima iterada de 𝔊. Por definição, 𝔇(𝜎) = 𝔇(𝜏),
portanto, a fim de provarmos que 𝜎 = 𝜏 basta mostrar que para qualquer 𝛾 ≤ 𝛼, 𝜎(𝛾) = 𝜏(𝛾) .
Mas isto é imediato e faz-se por indução: se para qualquer 𝛿 < 𝛾 tivermos 𝜏(𝛿) = 𝜎(𝛿),
então 𝜏 ↾ 𝛾 = 𝜎 ↾ 𝛾 e assim 𝜏(𝛾) = 𝔊(𝜏 ↾ 𝛾) = 𝔊(𝜎 ↾ 𝛾) = 𝜎(𝛾) , como queríamos.
116
Mostramos dessa forma que para todo ordinal 𝛼 existe uma única 𝛼-ésima iterada
de 𝔊, que podemos denotar por 𝔱𝛼 . Pelo enunciado do teorema, 𝔉(𝛼) = 𝔱𝛼(𝛼) é uma
operação induzida por 𝔊, para todo ordinal 𝛼. Finalmente, provemos que 𝔉(𝛼) = 𝔊(𝔉 ↾ 𝛼).
Por definição, 𝔉(𝛼) = 𝔱𝛼(𝛼) = 𝔊(𝔱𝛼 ↾ 𝛼). Basta provarmos que 𝔱𝛼 ↾ 𝛼 = 𝔉 ↾ 𝛼 .
Mas isto é óbvio, pois para qualquer 𝛽 ∈ 𝛼,
𝔱𝛼(𝛽) = 𝔊(𝔱𝛼 ↾ 𝛽) = 𝔊�𝔱𝛽 ↾ 𝛽� = 𝔱𝛽(𝛽) = 𝔉(𝛽),
haja vista que 𝔱𝛼 e 𝔱𝛽 são compatíveis. Logo, 𝔉(𝛼) = 𝔊(𝔉 ↾ 𝛼). Q.E.D.
Assim como o Princípio da Indução, que admite versões para ordinais e conjuntos
bem ordenados, definições por recursão também podem ser feitas em conjuntos bem
ordenados quaisquer.
Teorema 4.15 (Definição por Recursão Transfinita para Conjuntos Bem
Ordenados). Seja 𝔊 uma operação e ⟨𝑊, ≺⟩ um conjunto bem ordenado. Então existe uma
única função 𝑓 com 𝔇(𝑓) = 𝑊 tal que 𝑓(𝑥) = 𝔊(𝑓 ↾ 𝑊[𝑥]), para todo 𝑥 ∈ 𝑊.
Demonstração.
A demonstração deste teorema consiste numa adaptação da demonstração
anterior.
Para 𝜇 ∈ 𝑊 chamaremos de 𝜇-ésima iterada de 𝔊 uma função 𝑓 tal que 𝔇(𝑓) =
𝑊[𝜇] ∪ {𝜇} = {𝑥 ∈ 𝑊|𝑥 ≼ 𝜇} e 𝑓(𝑥) = 𝔊(𝑓 ↾ 𝑊[𝑥]) para todo 𝑥 ≼ 𝜇 .
Seja 𝑤 ∈ 𝑊 arbitrário. Suponha que para todo 𝑦 ≺ 𝑤 exista uma única 𝑦-ésima
iterada de 𝔊, por simplicidade denotada por 𝑓𝑦. Construiremos uma 𝑤-ésima iterada de 𝔊 e
provaremos que esta é única, donde seguirá, por indução, que para todo membro de 𝑊 existe
uma iterada.
(Existência) Pelo Axioma da Substituição, existe o conjunto ℱ = �𝑓𝑦�𝑦 ≺ 𝑤�.
Afirmamos que ℱ é um sistema compatível de funções. De fato, notemos primeiramente que
para 𝑦1, 𝑦2 ∈ 𝑊 tais que 𝑦1 ≺ 𝑦2 ≺ 𝑤 tem-se por definição que
𝔇�𝑓𝑦1� ∩𝔇�𝑓𝑦2� = {𝑥 ∈ 𝑊|𝑥 ≼ 𝑦1} ∩ {𝑥 ∈ 𝑊|𝑥 ≼ 𝑦2} = 𝔇�𝑓𝑦1 �.
Mostremos que 𝑓𝑦1(𝑥) = 𝑓𝑦2(𝑥) para todo 𝑥 ≼ 𝑦1. Para 𝑢 ∈ 𝔇�𝑓𝑦1� qualquer,
assumamos 𝑓𝑦1(𝑡) = 𝑓𝑦2(𝑡) para todo 𝑡 ≺ 𝑢, o que acarreta 𝑓𝑦1 ↾ 𝑊[𝑢] = 𝑓𝑦2 ↾ 𝑊[𝑢]. Logo,
𝑓𝑦1(𝑢) = 𝔊�𝑓𝑦1 ↾ 𝑊[𝑢]� = 𝔊�𝑓𝑦2 ↾ 𝑊[𝑢]� = 𝑓𝑦2(𝑢). Pelo princípio da indução, segue que
117
𝑓𝑦1(𝑥) = 𝑓𝑦2(𝑥) para todo 𝑥 ∈ 𝔇�𝑓𝑦1� ∩𝔇�𝑓𝑦2 �. Como 𝑓𝑦1 e 𝑓𝑦2 são funções quaisquer de ℱ,
temos provada a afirmação de que ℱ é um sistema compatível de funções, donde pelo
Teorema 3.14 tem-se que ⋃ℱ é uma função, com 𝔇(⋃ℱ) = ⋃�𝔇�𝑓𝑦��𝑦 ≺ 𝑤� = 𝑊[𝑤].
Definamos então 𝑓̅ = (⋃ℱ) ∪ {⟨𝑤, 𝔊(⋃ℱ)⟩}. Claramente, 𝑓 ̅ é uma função, com
𝔇�𝑓�̅ = 𝑊[𝑤] ∪ {𝑤}. Além disso, ⋃ℱ = 𝑓̅ ↾ 𝑊[𝑤]. Assim, 𝑓(̅𝑥) = 𝔊�𝑓̅ ↾ 𝑊[𝑥]� para todo
𝑥 ∈ 𝔇�𝑓�̅, donde se obtém que 𝑓 ̅é uma 𝑤-ésima iterada de 𝔊.
(Unicidade) Se existisse uma função 𝔣 tal que 𝔇(𝔣) = {𝑥 ∈ 𝑊|𝑥 ≼ 𝑤} e 𝔣(𝑥) =
𝔊(𝔣 ↾ 𝑊[𝑥]) para todo 𝑥 ≼ 𝑤, teríamos obviamente 𝔣 = 𝑓̅ (a prova disso se dá por indução,
analogamente à demonstração de unicidade realizada no teorema anterior). Portanto, para todo
𝑤 ∈ 𝑊 existe uma única 𝑤-ésima iterada em 𝔊; pelo que expomos até aqui, quaisquer duas
iteradas de 𝔊 são compatíveis.
Finalmente, definamos 𝔉(𝑥) = 𝑓𝑥(𝑥). Afirmamos que 𝔉 é tal que
𝔉(𝑥) = 𝔊(𝔉 ↾ 𝑊[𝑥]), ∀𝑥 ∈ 𝑊.
Ora, para 𝑥 ∈ 𝑊 qualquer temos
𝔉(𝑥) = 𝑓𝑥(𝑥) = 𝔊(𝑓𝑥 ↾ 𝑊[𝑥]).
O teorema estará demonstrado se mostrarmos que 𝑓𝑥 ↾ 𝑊[𝑥] = 𝔉 ↾ 𝑊[𝑥], isto é,
que 𝑓𝑥(𝑎) = 𝔉(𝑎) para todo 𝑎 ≺ 𝑥. Contudo, tal igualdade decorre imediatamente do fato de
quaisquer duas iteradas de 𝔊 serem compatíveis, donde obtemos
𝑓𝑥(𝑎) = 𝔊(𝑓𝑥 ↾ 𝑊[𝑎]) = 𝔊(𝑓𝑎 ↾ 𝑊[𝑎]) = 𝔉(𝑎).
Q.E.D.
Existem outras formas de definir operações recursivamente; abaixo listamos as
principais formas. Todas elas podem ser demonstradas a partir do Teorema 4.14, bem como
admitem adaptações para conjuntos bem ordenados decorrentes do Teorema 4.15. No entanto,
não demonstramos tais resultados neste trabalho. Provas para as proposições seguintes podem
ser encontradas em Hrbacek & Jech (1999, p. 117-118).
Corolário 4.7 (Recursão Transfinita – outras formas).
(i) (Forma Paramétrica): Seja 𝔊(𝑧, 𝑥) uma operação, então existe uma
condição funcional em 𝑥 e 𝑧 𝔓(𝑧, 𝑥, 𝑦) tal que a operação 𝔉(𝑧, 𝑥) induzida por 𝔓 satisfaz
𝔉(𝑧, 𝛼) = 𝔉(𝑧, 𝔉𝑧 ↾ 𝛼), para quaisquer ordinais 𝛼 e para qualquer conjunto 𝑧;
118
(ii) Sejam 𝔊1, 𝔊2 e 𝔊3 operações. Então existem uma operação 𝔊 e uma
condição funcional em 𝑥 𝔓(𝑥, 𝑦), tais que a operação 𝔉 induzida por 𝔓 satisfaz:
𝔉(∅) = 𝔊1(0),
𝔉(𝛼 + 1) = 𝔊2�𝔉(𝛼)�, para todo ordinal 𝛼 e
𝔉(𝛼) = 𝔊3(𝔉 ↾ 𝛼), para todo ordinal limite 𝛼 ≠ ∅.
(iii) Seja Ω um número ordinal, 𝐴 um conjunto, 𝑆 = ⋃ 𝐴𝛼𝛼<Ω o conjunto de
todas as funções 𝑓:𝛼 ⟶ 𝐴 com 𝛼 < Ω e tome 𝑔: 𝑆 ⟶ 𝐴 uma função. Então existe uma única
função 𝑓:Ω⟶ 𝐴 tal que 𝑓(𝛼) = 𝑔(𝑓 ↾ 𝛼), para todo 𝛼 < Ω.
Enfim, definimos abaixo as principais operações para números ordinais. Para uma
discussão detalhada sobre aritmética ordinal e suas propriedades, recomendamos Suppes
(1972), Jech (2003) e Hrbacek & Jech (1999).
Definição 4.21 (Adição de Números Ordinais). Para quaisquer ordinais 𝛽,
(i) 𝛽 + 0 = 𝛽;
(ii) 𝛽 + (𝛼 + 1) = (𝛽 + 𝛼) + 1, para todo ordinal 𝛼;
(iii) 𝛽 + 𝛼 = sup{𝛽 + 𝛾|𝛾 < 𝛼} para todo ordinal limite 𝛼 ≠ 0.
Definição 4.22 (Multiplicação de Números Ordinais). Para quaisquer ordinais 𝛽,
(i) 𝛽 ⋅ 0 = 0;
(ii) 𝛽 ⋅ (𝛼 + 1) = 𝛽 ⋅ 𝛼 + 𝛽, para todo ordinal 𝛼;
(iii) 𝛽 ⋅ 𝛼 = sup{𝛽 ⋅ 𝛾|𝛾 < 𝛼}, para todo ordinal limite 𝛼.
Definição 4.23 (Exponenciação de Números Ordinais). Para todo ordinal 𝛽,
(i) 𝛽0 = 1;
(ii) 𝛽𝛼+1 = 𝛽𝛼 ⋅ 𝛽, para todo ordinal 𝛼;
(iii) 𝛽𝛼 = sup{𝛽𝛾|𝛾 < 𝛼}, para todo ordinal limite 𝛼.
119
4.3. Números Naturais e Conjuntos Finitos
Nesta seção, definimos os números naturais e abordamos brevemente suas
aplicações na definição de conjunto finito. Para tanto, adotamos a definição de número natural
dada por Kunen (1980, p. 18) e mostramos sua equivalência com a definição dada por
Hrbacek & Jech (1999, p. 41).
Definição 4.24. Seja 𝛼 um número ordinal. 𝛼 é um número natural se, e somente
se, para todo 𝛽 ≤ 𝛼 tivermos 𝛽 = 0 ou 𝛽 um ordinal sucessor.
Lema 4.3. Se 𝛼 é um número natural, então 𝛼 + 1 é um número natural. Além
disso, se 𝛽 ≤ 𝛼 então 𝛽 é um número natural.
Demonstração.
Seja 𝛽 um ordinal tal que 𝛽 < 𝛼 + 1, então 𝛽 < 𝛼 ou 𝛽 = 𝛼, pois 𝛼 + 1 = 𝛼 ∪
{𝛼}. Daí, como 𝛼 é um número natural por hipótese, segue que 𝛽 = 0 ou 𝛽 é um ordinal
sucessor. Se 𝛽 = 𝛼 + 1, então 𝛽 é um ordinal sucessor. Logo, 𝛼 + 1 é um número natural.
Para qualquer 𝛽 ≤ 𝛼, 𝛿 ≤ 𝛽 implica 𝛿 ≤ 𝛼 e daí 𝛿 = 0 ou 𝛿 é ordinal sucessor,
donde concluímos que 𝛽 é um número natural (notemos que todo número natural é um
número ordinal sucessor). Q.E.D.
Definição 4.25. Um conjunto ℐ é indutivo se, e somente se,
(i) ∅ ∈ ℐ;
(ii) (∀𝑛)(𝑛 ∈ ℐ ⟹ 𝑛 + 1 ∈ ℐ).
Teorema 4.16. Seja ℐ um conjunto indutivo. Se 𝛼 é um número natural, então
𝛼 ∈ ℐ.
Demonstração.
Suponha, via reductio ad absurdum, que para algum natural 𝛼 ≠ 0 tenha-se 𝛼 ∉
ℐ. Pela definição de número natural, 𝛼 é um ordinal sucessor, digamos 𝛼 = 𝛽+ 1. Então
𝛽 ∉ ℐ (do contrário 𝛼 ∈ ℐ, pela definição de conjunto indutivo).
Assim 𝐴 = 𝛼 ∖ ℐ ≠ ∅. Como todos os membros de 𝐴 são números ordinais, 𝐴 é
bem ordenado e daí existe um número natural 𝜉, o menor elemento de 𝐴. Se 𝜉 = 0 então
𝜉 ∈ ℐ, o que contradiz 𝜉 ∈ 𝐴. Assim, 𝜉 é um ordinal sucessor, donde segue que existe 𝛿 tal
120
que 𝜉 = 𝛿 + 1 com 𝛿 < 𝜉 e, por conseguinte, 𝛿 é um número natural. Se 𝛿 ∈ ℐ teríamos 𝜉 ∈
ℐ, o que contraria o fato de 𝜉 ∈ 𝐴. Logo 𝛿 ∉ ℐ, mas como 𝛿 ∈ 𝛼, concluímos que 𝛿 é o menor
elemento de 𝐴, absurdo. Portanto, para qualquer natural 𝛼, 𝛼 ∈ ℐ. Q.E.D.
A existência do conjunto indutivo ℐ no teorema anterior nos é garantida por (A6),
que aliado ao Teorema 2.7 e à Definição 2.14 nos permite definir o conjunto dos naturais por
abstração, como feito por Kunen e Suppes. Por meio de ℐ também podemos definir o conjunto
dos naturais como a interseção de todos os conjuntos indutivos, conforme feito por Hrbacek &
Jech. O teorema posterior prova que tais definições nos dão o mesmo conjunto.
Definição 4.26. 𝜔 = {𝑛|𝑛 é número natural}.
Definição 4.27. ℕ = {𝑥 ∈ 𝐼|(∀𝑦)(𝑦 é indutivo ⟹ 𝑥 ∈ 𝑦)}.
Lema 4.4.
(i) ℕ é indutivo;
(ii) Se 𝑋 é indutivo então ℕ ⊆ 𝑋.
(iii) (Princípio da Indução em ℕ): Seja 𝜑(𝑥) uma condição em 𝑥. Se 𝜑(0) e
para qualquer 𝑚 ∈ ℕ, 𝜑(𝑚) ⟹𝜑(𝑚 + 1), então 𝜑(𝑛) para todo 𝑛 ∈ ℕ.
(iv) 𝜔 é um número ordinal.
Demonstração.
Para todo conjunto indutivo ℐ, temos 0 ∈ ℐ, donde segue que 0 ∈ ℕ.
Analogamente, se 𝑛 ∈ ℕ, então 𝑛 ∈ ℐ para todo conjunto indutivo ℐ. Logo, 𝑛 + 1 ∈ ℐ, para
qualquer conjunto indutivo ℐ e, portanto, 𝑛 + 1 ∈ ℕ. Assim, ℕ é indutivo, como afirma (i). O
segundo item decorre imediatamente da definição de ℕ.
Provemos (iii). Chamemos de 𝑃𝜑 = {𝑛 ∈ ℕ|𝜑(𝑛)}. Pela hipótese de (iii), temos
0 ∈ 𝑃𝜑 e, se 𝑛 ∈ 𝑃𝜑, então 𝑛 + 1 ∈ 𝑃𝜑, para qualquer 𝑛 ∈ ℕ. Logo, 𝑃𝜑 é um conjunto
indutivo. Do item anterior, segue que ℕ ⊆ 𝑃𝜑 . Obviamente, 𝑃𝜑 ⊆ ℕ. Assim, ℕ =
{𝑛 ∈ ℕ|𝜑(𝑛)}, isto é, 𝜑(𝑛), para todo 𝑛 ∈ ℕ, como queríamos.
Finalmente, como 𝜔 é um conjunto de números ordinais, segue que 𝜔 é bem
ordenado pela relação ∈𝜔, além disso, para um natural qualquer 𝑛 ∈ 𝜔, se 𝑚 ∈ 𝑛 então
𝑚 < 𝑛 e, por conseguinte, 𝑚 é um número natural, donde obtemos 𝑚 ∈ 𝜔 , o que prova o
último item. Q.E.D.
Teorema 4.17. 𝜔 = ℕ.
121
Demonstração.
Provemos que 𝜔 é indutivo. De fato, 0 é um número natural por vacuidade, logo
0 ∈ 𝜔. Pelo Lema 4.3, se 𝛼 é natural, então 𝛼 + 1 é natural, isto é, 𝛼 ∈ 𝜔⟹ 𝛼 + 1 ∈ 𝜔.
Logo, 𝜔 é indutivo. Assim, pelo lema anterior, ℕ ⊆ 𝜔.
Reciprocamente, provemos que 𝜔 ⊆ ℕ. Como 𝜔 é um número ordinal, 𝜔 é bem
ordenado e assim procederemos por indução. Como 0 ∈ 𝜔 e 0 ∈ 𝐽, para todo conjunto
indutivo 𝐽, temos 0 ∈ ℕ. Se para algum 𝑛 ∈ 𝜔 tivermos 𝑛 ∈ ℕ, então para qualquer conjunto
indutivo 𝐽, teremos 𝑛 ∈ 𝐽, donde segue que 𝑛 + 1 ∈ 𝐽 e consequentemente 𝑛 + 1 ∈ ℕ. O
resultado segue do fato de que 𝑛 + 1 ∈ 𝜔. Q.E.D.
Observação: preferencialmente utilizamos a letra grega ômega “𝜔” para indicar o
conjunto dos números naturais.
Assim, formalizamos em ZFC o conjunto dos números naturais 𝜔, o menor
número ordinal limite diferente de 0. Seus elementos, denominados números naturais, são
obtidos por sucessão a partir de 0, de tal modo que todo número natural, exceto 0, é sucessor
de algum outro número natural e é sucedido por outro número natural. Embora à primeira
vista possa ser estranho considerar números como coleções de elementos, o que nos importa é
o fato de que tais conjuntos se comportam conforme esperaríamos que números naturais o
fizessem, em outras palavras, 𝜔 satisfaz os axiomas de Peano.
Teorema 4.18 (Axiomas de Peano). São verdadeiras as seguintes afirmações:
(i) 0 ∈ 𝜔;
(ii) (∀𝑛)(𝑛 ∈ 𝜔⟹ 𝑛 + 1 ∈ 𝜔);
(iii) ¬(∃𝑛)(𝑛 ∈ 𝜔 ∧ 𝑛 + 1 = 0);
(iv) (∀𝑛)(∀𝑚)(𝑚,𝑛 ∈ 𝜔 ∧ 𝑚 + 1 = 𝑛 + 1 ⟹𝑚 = 𝑛);
(v) (Princípio da Indução Natural): Seja 𝜑(𝑥) uma condição em 𝑥. Se 𝜑(0) e
para qualquer 𝑚 ∈ 𝜔, 𝜑(𝑚) ⟹𝜑(𝑚+ 1), então 𝜑(𝑛) para todo 𝑛 ∈ 𝜔.
Demonstração.
As afirmações (i) e (ii) seguem diretamente do fato de 𝜔 ser indutivo. A
veracidade de (iii) decorre do fato de que, do contrário, seria 0 = 𝑛 ∪ {𝑛}, donde teríamos que
𝑛 ∈ 0, absurdo, em vista de que 0 = ∅. O princípio da indução já foi provado anteriormente.
Resta-nos apenas o item (iv).
122
Sejam 𝑚, 𝑛 ∈ 𝜔 quaisquer, tais que 𝑚 + 1 = 𝑛 + 1. Como 𝑛 ∈ 𝑛 + 1, temos
𝑛 ∈ 𝑚 + 1. Então, 𝑛 ∈ 𝑚 ou 𝑛 = 𝑚. Analogamente, obtém-se 𝑚 ∈ 𝑛 ou 𝑛 = 𝑚. Se 𝑛 ≠ 𝑚,
então necessariamente 𝑛 ∈ 𝑚 e 𝑚 ∈ 𝑛. Como 𝑚 e 𝑛 são também ordinais, inferimos que
𝑛 < 𝑚 e 𝑚 < 𝑛, absurdo. Q.E.D.
Substituindo Ω por 𝜔 no Corolário 4.7 (iii) obtemos o Princípio da Recursão
Finita, uma restrição da Recursão Transfinita ao conjunto 𝜔, o que permite definir operações
entre números naturais, entre outras sequências quaisquer de conjuntos indexados pelos
membros de 𝜔. Como as principais operações para ordinais já foram definidas com o auxílio
da Recursão Transfinita, não nos aprofundamos no estudo da aritmética dos naturais ou sobre
definições por recursão finita, de modo que assumimos as propriedades aritméticas usuais dos
naturais.
Conforme dito anteriormente, em posse dos números naturais podemos definir 𝑛-
úplas em ZFC. Intuitivamente, uma 𝑛-úpla deve ser uma lista de conjuntos ⟨𝑎0,…, 𝑎𝑛−1⟩ tal
que ⟨𝑏0,…, 𝑏𝑛−1⟩ = ⟨𝑎0,…, 𝑎𝑛−1⟩ se, e somente se, 𝑏𝑖 = 𝑎𝑖, para cada 𝑖 = 0, 1,…, 𝑛. Uma
das maneiras mais simples de formalizar tal conceito em ZFC consiste em definir ⟨𝑎0,…,
𝑎𝑛−1⟩ como sendo um sistema de conjuntos indexados, isto é, uma função cujo domínio é o
número natural 𝑛, ⟨𝑎𝑖|𝑖 ∈ 𝑛⟩ que neste caso recebe o nome de sequência finita de extensão 𝑛
— de modo geral, se 𝔰 = ⟨𝑎𝑖|𝑖 ∈ 𝛼⟩ onde 𝛼 é um número ordinal qualquer, dizemos que 𝔰 é
uma sequência transfinita de extensão 𝛼 —, que também denotamos por
⟨𝑎𝑖|𝑖 < 𝑛⟩, ⟨𝑎𝑖|𝑖 = 0, 1,…, 𝑛− 1⟩ ou ⟨𝑎0,…, 𝑎𝑛−1⟩.
Definição 4.28. Para qualquer 𝑛 ∈ 𝜔, a 𝑛-úpla ordenada de coordenadas 𝑎0,
𝑎1,…, 𝑎𝑛−1 é ⟨𝑎0,…, 𝑎𝑛−1⟩ = ⟨𝑎𝑖|𝑖 ∈ 𝑛⟩.
Claramente, ⟨𝑎0,…, 𝑎𝑛−1⟩ = ⟨𝑏0,…, 𝑏𝑛−1⟩ se, e somente se, 𝑎𝑖 = 𝑏𝑖 para todo
𝑖 ∈ 𝑛: é uma consequência imediata do Princípio da Extensão para funções (Teorema 3.9). Na
𝑛-úpla ⟨𝑎0,…, 𝑎𝑛−1⟩, cada 𝑎𝑖 é chamado a (𝑖 + 1)-ésima coordenada de ⟨𝑎0,…, 𝑎𝑛−1⟩, para
todo 𝑖 < 𝑛.
Embora, por exemplo, a definição anterior de par ordenado difira da Definição
2.20, {⟨0, 𝑎0⟩, ⟨1, 𝑎1⟩} e �{𝑎0}, {𝑎0, 𝑎1}� comportam-se da mesma maneira no que concerne às
propriedades que desejamos que um par ordenado possua. Por tal motivo, não adotamos
123
ressalvas em utilizar a Definição 4.28 como generalização do conceito de 𝑛-úpla ordenada,
embora a mesma possa ser definida nos moldes da Definição 2.20 por recursão8.
Analogamente, se 𝐴 = ⟨𝐴𝑖|𝑖 ∈ 𝑛⟩ é um sequência finita de extensão 𝑛, então ∏𝐴
é o produto cartesiano entre 𝐴0, 𝐴1,…, 𝐴𝑛−1 : os elementos de ∏𝐴 são sequências
⟨𝑎𝑖|𝑖 ∈ 𝑛⟩, onde para cada 𝑖 ∈ 𝑛, 𝑎𝑖 ∈ 𝐴𝑖. Usualmente denota-se por
� 𝐴𝑖0≤𝑖<𝑛
.
Quando 𝐴𝑖 = 𝐴, para todo 𝑖 ∈ 𝑛, temos ∏ 𝐴𝑖0≤𝑖<𝑛 = 𝐴𝑛 , o conjunto de todas as
𝑛-úplas com coordenadas de 𝐴. A generalização natural do produto cartesiano para um
conjunto de índices 𝐼 qualquer já foi feita no capítulo anterior, quando definimos ∏ 𝐴𝑖𝑖∈𝐼 .
Para uma função 𝑠 = ⟨𝑎𝑖|𝑖 ∈ 𝜔⟩, dizemos que 𝑠 é uma sequência infinita. Outras
notações adotadas para sequências infinitas são
⟨𝑎0,…, 𝑎𝑛,… ⟩, ⟨𝑎𝑖|𝑖 = 0, 1, 2, …⟩ ou ⟨𝑎𝑖⟩𝑖=0∞ .
Notações análogas são aceitas para as imagens de sequências finitas e infinitas,
isto é, se 𝑠 = ⟨𝑎0,…, 𝑎𝑛−1⟩ e 𝑆 = ⟨𝑎𝑖|𝑖 ∈ 𝜔⟩, escrevemos {𝑎0,…, 𝑎𝑛−1}, {𝑎𝑖|𝑖 < 𝑛} ou
{𝑎𝑖|0 ≤ 𝑖 ≤ 𝑛} para indicar ℑ(𝑠), e {𝑎0,…, 𝑎𝑛,…}, {𝑎𝑖|𝑖 ∈ 𝜔} ou {𝑎𝑖}𝑖=0∞ para designar ℑ(𝑆).
Naturalmente, ℑ(𝑠) nos permite generalizar a ideia de par não ordenado, de modo a obtermos
a 𝑛-úpla não ordenada, mas não o fazemos formalmente.
O motivo pelo qual denominamos tais sequências de infinitas ou finitas se deve ao
fato de um conjunto ser dito finito se for equipotente a um número natural 𝑛. Formalmente
temos a definição seguinte.
Definição 4.29. Um conjunto 𝑋 é finito se, e somente se, existe 𝑛 ∈ 𝜔 tal que
𝑋 ≈ 𝑛. Se 𝑋 não é finito, dizemos que 𝑋 é infinito9.
A proposição seguinte apenas formaliza algumas consequências imediatas da
definição acima, bem como as relaciona com os números cardinais.
Proposição 4.8.
(i) Todo número natural é finito;
8 Para um estudo de tal abordagem, sugerimos Hrbacek & Jech (1999). 9 Existem critérios equivalentes que permitem definir conjuntos finitos sem requerer o uso de
números naturais. Hrbacek & Jech (1999) e principalmente Suppes (1972) tratam de tais definições.
124
(ii) Se 𝑛 ∈ 𝜔 então não existe bijeção 𝜑: 𝑛 ⟶ 𝑋 com 𝑋 ⊂ 𝑛;
(iii) Se 𝑚, 𝑛 ∈ 𝜔 e 𝜑: 𝑛 ⟶ 𝑋 e 𝜓:𝑚 ⟶ 𝑋 são bijeções, então 𝑚 = 𝑛;
(iv) Todo número natural é um número cardinal.
(v) 𝜔 é infinito;
(vi) 𝜔 é o menor número cardinal infinito;
(vii) Todo conjunto finito é bem ordenável;
(viii) Se 𝑋 ≈ 𝑛 e 𝑛 é um número natural então |𝑋| = 𝑛;
(ix) Se 𝑋 é finito e 𝑌 ⊆ 𝑋 então 𝑌 é finito;
(x) Se 𝑋 é uma família finita de conjuntos finitos então ⋃𝑋 é finito;
(xi) Se 𝑋 é finito então ℘(𝑋) é finito;
(xii) Se 𝑋 é finito e 𝑓 é uma função com 𝔇(𝑓) = 𝑋 então 𝑓[𝑋] é finito.
Demonstração.
Provamos apenas (iv), (vi), (vii) e (viii). As demais demonstrações podem ser
encontradas em Hrbacek & Jech (1999, p. 69-73) e baseiam-se em argumentos de indução e
recursão.
Os itens (iv) e (vi) decorrem da definição de número cardinal: todo número
natural 𝑛 é cardinal, pois do contrário, existiria um natural 𝑚 ⊂ 𝑛 equipotente a 𝑛,
contrariando o item (ii); se 𝜔 não fosse cardinal, existiria 𝑛 < 𝜔 e uma bijeção 𝑓:𝜔⟶ 𝑛,
donde teríamos que 𝑓 ↾ (𝑛 + 1):𝑛 + 1 ⟶𝑛 seria uma função injetora de 𝑛 + 1 num
subconjunto próprio de 𝑛 ⊂ 𝑛 + 1, contrariando o item (ii), logo 𝜔 é um número cardinal
(infinito, em vista do item (v)) e, como todos os demais cardinais menores que 𝜔 são finitos,
segue que 𝜔 é o menor número cardinal infinito.
A demonstração de (vii) é simplesmente uma adaptação da Proposição 4.6, pois
todo número natural 𝑛 é um número ordinal que, por sua vez, é bem ordenado. A validade de
(viii) também é imediata: como 𝑋 é finito, então é bem ordenável e daí |𝑋| = 𝛼, para algum
cardinal 𝛼; como 𝑋 ≈ 𝑛 por hipótese, se 𝛼 < 𝑛 teríamos 𝛼 ≈ 𝑛, contrariando o fato de 𝑛 ser
um cardinal. Q.E.D.
O próximo teorema é uma adaptação do exposto por Lima (2009, p. 48,49), que
mostra a equivalência em ZFC entre a noção de infinito exposta acima e àquela elaborada por
Dedekind.
Teorema 4.19 (Infinito de Dedekind). Um conjunto 𝑋 é infinito se, e somente se,
admite uma bijeção 𝜑:𝑋 ⟶ 𝑌, com 𝑌 ⊂ 𝑋.
125
Demonstração.
Provemos inicialmente que se 𝑋 é finito, então não existe bijeção 𝜑:𝑋 ⟶ 𝑌 onde
𝑌 é um subconjunto próprio de 𝑋. Suponha, por absurdo, que exista tal bijeção 𝜑. Seja 𝑛 o
número natural tal que 𝜓: 𝑛 ⟶ 𝑋 é uma bijeção e 𝑌 ⊂ 𝑋 um subconjunto próprio de 𝑋 —
notemos que existe 𝑎 ∈ 𝑋 ∖ 𝑌 , com 𝜓(𝑚) = 𝑎, para algum 𝑚 < 𝑛. Chamemos 𝐴 = 𝜓−1(𝑌).
Obviamente, 𝜓 ↾ 𝐴:𝐴 ⟶ 𝑌 é uma bijeção: sua injetividade decorre da
injetividade de 𝜓, enquanto sua sobrejetividade decorre da definição de 𝐴. Temos assim que
(𝜓 ↾ 𝐴)−1 ∘ 𝜑 ∘ 𝜓: 𝑛 ⟶ 𝐴 é uma bijeção. A contradição se encontra ao observarmos que
𝐴 ≠ 𝑛: de fato, se 𝐴 = 𝑛, então 𝑚 ∈ 𝐴 e teríamos 𝜓(𝑚) = 𝑎 ∈ 𝑌. Assim, construímos uma
bijeção entre 𝑛 e um subconjunto próprio de 𝑛, contrariando a Proposição 4.8 (ii).
Pela contrapositiva, se existir uma bijeção 𝜑:𝑋 ⟶ 𝑌 com 𝑌 ⊂ 𝑋 então 𝑋 é
infinito.
Reciprocamente, suponha que 𝑋 seja um conjunto infinito. Inicialmente,
construamos por recursão uma injeção 𝜉:𝜔 ⟶ 𝑋. Para tanto, considere uma função escolha
𝑓:℘(𝑋) ⟶𝑋. Para cada 𝑛 ∈ 𝜔, façamos 𝜉(𝑛) = 𝑓(𝑋∖ 𝜉[𝑛]). Note que 𝜉 é tal que
𝜉(0) = 𝑓(𝑋), 𝜉(1) = 𝑓(𝑋 ∖ {𝑓(𝑋)}), 𝜉(2) = 𝑓(𝑋 ∖ {𝑓(𝑋), 𝑓(𝑋 ∖ {𝑓(𝑋)})}),…
onde 𝑓(𝑋) é um elemento de 𝑋, 𝑓(𝑋 ∖ {𝑓(𝑋)}) é um elemento de 𝑋 ∖ {𝑓(𝑋)} e assim por
diante.
Para 𝑎, 𝑏 ∈ 𝜔 suponha 𝑎 < 𝑏. De tal desigualdade segue que 𝑎 ∈ 𝑏 e, por
conseguinte 𝜉(𝑎) ∈ 𝜉[𝑏]. Como 𝜉(𝑏) ∈ 𝑋 ∖ {𝜉[𝑏]}, temos 𝜉(𝑏) ≠ 𝜉(𝑎), logo 𝜉 é injetora.
Seja 𝑋𝜔 = {𝜉0,…, 𝜉𝑛 ,…} ⊆ 𝑋 a imagem de 𝜉. Evidentemente o subconjunto
𝑌 = (𝑋 ∖ 𝑋𝜔) ∪ {𝜉2𝑘|𝑘 ∈ 𝜔} = (𝑋∖ 𝑋𝜔) ∪ {𝜉0 , 𝜉2, 𝜉4,…} está contido propriamente em 𝑋,
haja vista que, por exemplo, 𝜉1 ∉ 𝑌. Definamos então a função Ω:𝑋 ⟶ 𝑌 por Ω(𝑥) = 𝑥 se
𝑥 ∈ 𝑋 ∖ 𝑋𝜔 e Ω(𝜉𝑛) = 𝜉2𝑛. Obviamente Ω é bijetora. Construímos assim uma bijeção entre 𝑋
e um subconjunto próprio de 𝑋. Q.E.D.
Teorema 4.20. (∀𝐴)(℘(𝐴) ≈ 2𝐴).
Demonstração.
Para cada 𝑆 ∈ ℘(𝐴), definamos 𝜒𝑆:𝐴⟶ {0, 1} por 𝜒𝑆(𝑎) = 1 se 𝑎 ∈ 𝑆, e
𝜒𝑆(𝑎) = 0 caso 𝑎 ∉ 𝑆, para todo 𝑎 ∈ 𝐴. Então, a função 𝜂:℘(𝐴) ⟶ 2𝐴 dada por 𝜂(𝑆) = 𝜒𝑆 é
claramente uma bijeção. Q.E.D.
Corolário 4.8: (∀𝐴)(∀𝐵)(𝐴 ≈ 𝐵 ⟹ 2𝐴 ≈ 2𝐵)
126
Demonstração.
Segue diretamente do Teorema 4.20 e do Corolário 3.4 (vii). Q.E.D.
Definição 4.30. Um conjunto 𝑋 é enumerável ou contável se, e somente se, 𝑋 for
finito ou existir uma bijeção 𝜑:𝜔 ⟶ 𝑋. Em caso contrário, 𝑋 é dito não enumerável.
No que se refere a números cardinais damos apenas a definição dos números
cardinais transfinitos, isto é, dos cardinais maiores ou iguais a 𝜔, geralmente indicados pela
letra hebraica Aleph (ℵ) acompanhada por um índice — embora em certos contextos sejam
denotados pela letra 𝜔 também acompanhada de subíndice.
Definição 4.31. Para todo ordinal 𝛼, definimos:
(i) ℵ0 = 𝜔 ;
(ii) ℵ𝛼+1 = ℎ(ℵ𝛼), para todo ordinal 𝛼;
(iii) ℵ𝛼 = sup�ℵ𝛾�𝛾 < 𝛼� se 𝛼 é um ordinal limite.
Como provaremos a seguir, para todo ordinal 𝛼, ℵ𝛼 é um cardinal. Contudo, tão
importante quanto este resultado, é o fato de que para todo cardinal transfinito 𝜅 existe um
número ordinal 𝛼 tal que ℵ𝛼 = 𝜅. Assim, a Definição 4.31 nos dá a regra que permite obter
todos os números cardinais transfinitos.
Lema 4.5. Se 𝑋 é um conjunto de números cardinais, então ⋃𝑋 é cardinal. Além
disso, se 𝛽 é um cardinal tal que 𝛼 ≤ 𝛽 para todo 𝛼 ∈ 𝑋, então ⋃𝑋 ≤ 𝛽.
Demonstração.
Já vimos que ⋃𝑋 = sup𝑋 é um número ordinal. Se existisse 𝛽 < ⋃𝑋 tal que
𝛽 ≈ ⋃𝑋, teríamos que existe um cardinal 𝛼 ∈ 𝑋 tal que 𝛽 < 𝛼 e, consequentemente, 𝛽 ≺ 𝛼
(no sentido de que existe uma injeção de 𝛽 em 𝛼). Temos assim 𝛽 ≺ 𝛼 ≾ ⋃𝑋 ≈ 𝛽, isto é,
concluímos que 𝛽 ≺ 𝛽, absurdo. O restante é imediato. Q.E.D.
Teorema 4.21.
(i) Se 𝛼 e 𝛽 são ordinais tais que 𝛼 < 𝛽, então ℵ𝛼 < ℵ𝛽 (em particular,
𝛼 ≤ 𝛽implica ℵ𝛼 ≤ ℵ𝛽);
(ii) ℵ𝛼 é um número cardinal para todo 𝛼;
(iii) Se 𝜅 é um cardinal transfinito, então existe um ordinal 𝛽 tal que ℵ𝛽 = 𝜅.
Demonstração.
127
Primeiramente, pela definição do número de Hartogs, vale ℵ𝛼 < ℵ𝛼+1, para todo
ordinal 𝛼. Por indução, se para todo ordinal 𝜗 < 𝛽, tivermos ℵ𝛼 < ℵ𝜗 sempre que 𝛼 < 𝜗,
então se 𝛽 = 𝜗′ + 1, temos ℵ𝛼 < ℵ𝜗′ < ℵ𝜗′+1 = ℵ𝛽 . Se 𝛼 < 𝛽 e 𝛽 é ordinal limite, então
qualquer ordinal 𝛾 ∈ ℵ𝛼 é também membro de ⋃{ℵ𝜀|𝜀 < 𝛽} = ℵ𝛽, provando (i).
A validade de (ii) prova-se por indução sobre 𝛼. Por definição ℵ0 é um número
cardinal. Obviamente se ℵ𝛼 é um cardinal, então ℎ(ℵ𝛼) = ℵ𝛼+1 é um cardinal (para qualquer
conjunto 𝐴, ℎ(𝐴) é um número cardinal). Para um ordinal limite 𝜇, temos por definição
ℵ𝜇 = sup{ℵ𝛼|𝛼 < 𝜇} = �ℵ𝛼𝛼<𝜇
,
de modo que supondo ℵ𝛼 ser cardinal para todo 𝛼 < 𝜇, segue do Lema 4.5 que ℵ𝜇 é um
número cardinal.
Finalmente, provemos (iii). Para tanto, precisamos provar a afirmação:
[†] 𝛼 ≤ ℵ𝛼, para todo ordinal 𝛼.
O resultado é trivial para 𝛼 finito. Consideremos então apenas os ordinais
transfinitos. Se para um dado ordinal transfinito 𝜇, 𝛽 ≤ ℵ𝛽 para todo 𝛽 < 𝜇, há dois casos a
considerar: se 𝜇 = 𝛿 + 1, então pela hipótese de indução 𝛿 ≤ ℵ𝛿 , logo para 𝛾 ∈ 𝜇 qualquer
temos 𝛾 ≤ 𝛿 ≤ ℵ𝛿 < ℵ𝛿+1 = ℵ𝜇, e assim 𝛾 ∈ ℵ𝜇, mostrando que 𝜇 ⊆ ℵ𝜇, isto é, 𝜇 ≤ ℵ𝜇; se 𝜇
for um ordinal limite, pela definição segue que ℵ𝜇 = ⋃ ℵ𝛽𝛽<𝜇 , logo, se 𝛾 ∈ 𝜇 então existe
𝛽 < 𝜇 tal que 𝛾 ∈ ℵ𝛽 ⊆ ℵ𝜇, e consequentemente 𝜇 ≤ ℵ𝜇.
Segue de [†] que para todo cardinal 𝜅 existe um ordinal 𝛼 tal que 𝜅 < ℵ𝛼
(tomemos, por exemplo, 𝛼 = 𝜅 + 1). Para demonstrarmos (iii) basta mostrarmos que para
qualquer ordinal 𝛼, dado um cardinal transfinito 𝜅 < ℵ𝛼 existe um ordinal 𝛾 < 𝛼 tal que
𝜅 = ℵ𝛾. Procedemos por indução sobre 𝛼.
O resultado é obviamente verdadeiro para 𝛼 = 0. Se 𝛼 = 𝛽 + 1, assumamos que
para todo cardinal transfinito 𝜆 < ℵ𝛽, exista 𝜉 < 𝛽 tal que 𝜆 = ℵ𝜉; logo, para todo cardinal
transfinito 𝜅 < ℵ𝛼 temos 𝜅 < ℵ𝛼 = ℎ�ℵ𝛽�, e assim 𝜅 ≾ ℵ𝛽 (pois ℎ�ℵ𝛽� é o menor ordinal
não equipotente a ℵ𝛽), donde segue que 𝜅 = ℵ𝛽 ou, pela hipótese de indução, 𝜅 = ℵ𝛾 , para
𝛾 < 𝛽 < 𝛼. Por fim, se 𝜇 é um ordinal limite, suponhamos que para 𝛽 < 𝜇 qualquer seja
verdadeiro que para todo cardinal transfinito 𝜆 < ℵ𝛽 , exista 𝜉 < 𝛽 tal que 𝜆 = ℵ𝜉; logo, para
um cardinal 𝜅 < ℵ𝜇 = ⋃ ℵ𝛾𝛾<𝜇 , existe 𝛾′ < 𝜇 tal que 𝜅 < ℵ𝛾′, donde o resultado segue da
128
hipótese de indução. Portanto, para todo cardinal transfinito 𝜅, existe 𝛾 ≤ 𝜅 tal que 𝜅 = ℵ𝛾.
Q.E.D.
Corolário 4.9. Não existe cardinal transfinito 𝜅 tal que ℵ𝛼 < 𝜅 < ℵ𝛼+1, para
qualquer ordinal 𝛼.
Demonstração.
Suponha, por absurdo, que exista tal cardinal transfinito 𝜅. Pelo teorema anterior,
existe um ordinal 𝛾 ≤ 𝜅 tal que 𝜅 = ℵ𝛾. Por um lado, a hipótese acarreta 𝛼 < 𝛾, caso
contrário, pelo mesmo teorema teríamos ℵ𝛾 < ℵ𝛼. Analogamente, 𝛾 < 𝛼 + 1. Logo, 𝛼 < 𝛾 <
𝛼 + 1, o que é absurdo, em vista do Lema 4.2 (iii). Q.E.D.
A Hipótese do Continuum conjectura que |℘(𝜔)| = ℵ1, ou seja, que |℘(𝜔)| =
ℎ(𝜔) = {𝛼|𝛼 ≾ 𝜔}; a referência ao continuum é feita, pois ℝ ≈ |℘(𝜔)| = |℘(ℵ0)| = |2ℵ𝛼|.
Sua generalização natural é a Hipótese Generalizada do Continuum, a qual afirma que
|2ℵ𝛼 | = ℵ𝛼+1, para qualquer ordinal 𝛼. Notemos que, a posteriori, faz sentido tratar de
|℘(𝜔)| ou |℘(ℵ𝛼)|, pois todo conjunto é bem ordenável (Teorema de Zermelo, página 132);
tratamos sobre a Hipótese Generalizada do Continuum no próximo capítulo.
Gostaríamos de observar que, com base no que foi exposto até aqui, pode-se obter
em ZFC não apenas o conjunto dos números naturais, mas também o conjunto dos inteiros,
dos racionais, dos números reais e consequentemente dos complexos. Os métodos de
construção baseiam-se nas operações até aqui definidas. Para uma discussão mais completa de
tais métodos, sugerimos Suppes (1972), Hrbacek & Jech (1999) e Dedekind (1901).
Além disso, com a formalização das funções, podemos estudar as propriedades de
funções entre conjuntos genéricos, caracterizando as operações e os critérios de
associatividade, comutatividade, etc., desenvolvendo dessa forma os principais tópicos da
Álgebra. Esses, dentre tantos outros exemplos, nos mostram que ZFC é uma formalização
satisfatória para os principais ramos da Matemática Pura.
129
Capítulo 5 — O Axioma da Escolha
Neste capítulo versamos sobre o papel do Axioma da Escolha na Teoria dos
Conjuntos e na Matemática de modo geral. Provamos algumas equivalências entre ele e outras
sentenças, dentre as quais destacamos o Lema de Zorn. Por fim, demonstramos que a Hipótese
Generalizada do Continuum é suficiente para o Axioma da Escolha.
5.1. Consistência e Independência
Discutimos ao longo deste trabalho algumas características do Axioma da
Escolha, o qual, grosso modo, nos garante que num conjunto 𝑋 qualquer sempre podemos
escolher um único elemento de cada subconjunto não vazio de 𝑋. Alguns conjuntos possuem
uma estrutura que nos permite escolher tal elemento sem a necessidade do Axioma da
Escolha; uma boa ordem é o exemplo mais natural de tal situação: se 𝑋 é bem ordenado,
escolha o menor elemento de cada subconjunto não vazio de 𝑋.
Como bem exemplificado por Russell (1920, p. 126), não precisamos do Axioma
da Escolha para escolher uma bota em cada par de botas numa coleção infinita de pares de
botas: basta que de cada par escolhamos o pé direito (ou esquerdo). Contudo, o axioma será
necessário caso queiramos escolher uma meia de cada par de meias numa coleção infinita de
pares de meias, pois num par de meias não se pode distinguir entre a meia direita e a
esquerda. Ou seja, a estrutura de alguns conjuntos não nos permite realizar escolhas infinitas.
Mas obviamente, a relutância que existiu em assumir o Axioma da Escolha como
um princípio válido na Matemática se deveu a questões bem mais profundas do que sua
aplicação em patologias informais. A preocupação principal concerne à consistência e
independência do Axioma da Escolha. Os exemplos a seguir, adaptados de Aurichi (2011b),
esclarecem bem o significado de tais conceitos.
Para desenvolver a Teoria dos Conjuntos neste trabalho, fixamos uma linguagem
simbólica, com suas “regras semânticas” e em seguida postulamos uma lista de axiomas
expressos nesta linguagem. Tal método estende-se para qualquer teoria matemática, como a
Teoria dos Corpos, na Álgebra, por exemplo.
130
Chamemos de teoria 𝑇 à “coleção” de todas as implicações de uma lista de
axiomas postulados ℒ. Informalmente, um conjunto 𝑀 é um “modelo” para a teoria 𝑇 se 𝑀
satisfaz a teoria 𝑇. Assim, por exemplo, ℝ e ℚ, munidos das operações usuais, são modelos
para a Teoria dos Corpos.
Uma teoria diz-se consistente se ela não contém uma proposição da forma
𝑃 ∧ (¬𝑃). Conforme provado por Gödel, uma teoria 𝑇 é consistente se, e somente se, admite
um modelo. A questão de independência se refere a uma fórmula particular da teoria: 𝜑
expressa na linguagem de 𝑇 diz-se independente se 𝑇 +𝜑 e 𝑇 + (¬𝜑) forem ambas
consistentes, onde 𝑇 +𝜑 e 𝑇 + (¬𝜑) indicam respectivamente, assumir a veracidade e a
falsidade de 𝜑.
Apesar de não soar natural a princípio, casos de independência ocorrem
frequentemente na Matemática. Na Teoria dos Corpos, por exemplo, considerando a fórmula
𝜑 ≡ (∃𝑥)(𝑥 ⋅ 𝑥 = 1 + 1), ℝ é um modelo para a Teoria dos Corpos + 𝜑, enquanto ℚ é um
modelo para a Teoria dos Corpos +(¬𝜑), o que mostra a independência de 𝜑 em relação aos
axiomas da Teoria dos Corpos.
Assim, questionar se o Axioma da Escolha é consistente com ZF basicamente
significa questionar-se se em ZFC é possível derivar alguma contradição. Um dos modos de
se responder a essa questão é encontrar um modelo para ZFC. O próprio Gödel desenvolveu
um modelo para ZFC, de modo que supondo a consistência de ZF, provou que assumir o
Axioma da Escolha não gera paradoxos. Anos depois, Paul Cohen também provou, por outro
método, que assumir a negação do Axioma da Escolha em ZF também é consistente.
Dessa forma, o Axioma da Escolha independe dos axiomas de ZF, ou seja, é
independente. Existem outras proposições independentes e consistentes, como é o caso da
Hipótese do Continuum, consistente e independente em ZFC. Sua versão generalizada, a
Hipótese Generalizada do Continuum, também é consistente em ZFC. Contudo, neste último
caso não temos sua independência em ZFC, pois como provamos na última seção, a Hipótese
Generalizada do Continuum implica o Axioma da Escolha.
Para uma discussão mais aprofundada sobre a consistência e a independência do
Axioma da Escolha, bem como de outras sentenças, recomendamos Kunen (1980) e Jech
(2003).
131
5.2. Formulações Equivalentes do Axioma da Escolha
Provamos nesta seção algumas formulações equivalentes em ZF ao Axioma da
Escolha. Fica implícito, portanto, que não assumimos a princípio a validade do Axioma da
Escolha durante as demonstrações. Salvo menção contrária, baseamo-nos em Hrbacek & Jech
(1999).
Teorema 5.1. As seguintes afirmações são equivalentes em ZF:
(i) (O Axioma da Escolha — (AC3)) Existe uma função escolha para
qualquer família não vazia de conjuntos;
(ii) Toda partição possui um conjunto de representantes;
(iii) Se 𝑋 = ⟨𝑋𝑖|𝑖 ∈ 𝐼⟩ é um sistema indexado tal que 𝑋𝑖 ≠ ∅ para todo 𝑖 ∈ 𝐼,
então existe uma função 𝑓: 𝐼 ⟶ ⋃ 𝑋𝑖𝑖∈𝐼 tal que 𝑓(𝑖) ∈ 𝑋𝑖, para todo 𝑖 ∈ 𝐼 (em outras
palavras, ∏𝑋 ≠ ∅).
Demonstração.
((i) ⟹ (ii)). No Teorema 3.8 provamos que os axiomas de ZF, aliados ao Axioma
da Escolha, garantem que para toda relação de equivalência sobre um conjunto não vazio
existe um conjunto de representantes. Por sua vez, toda partição determina uma relação de
equivalência na qual as classes de equivalência são os membros da partição.
((ii) ⟹ (iii)). Para cada 𝑖 ∈ 𝐼, definamos 𝐶𝑖 = {𝑖} × 𝑋𝑖. Claramente 𝑆 = {𝐶𝑖|𝑖 ∈ 𝐼}
é uma partição de 𝑋: como 𝑋𝑖 ≠ ∅ para todo 𝑖, vale 𝐶𝑖 ≠ ∅; para 𝑖 ≠ 𝑖 ′ é imediato que
𝐶𝑖 ∩ 𝐶𝑖′ = ∅; se ⟨𝑎, 𝑏⟩ ∈ 𝑋 então ⟨𝑎, 𝑏⟩ = ⟨𝑎, 𝑋𝑎⟩ ∈ 𝐶𝑎 = {𝑎} × 𝑋𝑎, pois 𝑋𝑎 = 𝑋(𝑎) = 𝑏 ,
donde segue que 𝑋 ⊆ ⋃𝑆. Devido a (ii), existe 𝔉 ⊆ 𝑋 de maneira que para todo 𝑖 ∈ 𝐼 existe
um único 𝑥𝑖 ∈ 𝑋𝑖 tal que 𝔉 ∩ 𝐶𝑖 = {⟨𝑖, 𝑥𝑖⟩}. Definindo 𝑓 = ⋃{𝔉 ∩ 𝐶𝑖|𝑖 ∈ 𝐼} = {⟨𝑖, 𝑥𝑖⟩|𝑖 ∈ 𝐼},
temos 𝑓 ∈ ∏𝑋.
((iii) ⟹ (i)). Seja 𝑆 ≠ ∅. Chamemos 𝐼 = 𝑆 ∖ {∅} e 𝑋𝑖 = 𝑖 para todo 𝑖 ∈ 𝐼. Então
⟨𝑋𝑖|𝑖 ∈ 𝐼⟩ é um sistema indexado de conjuntos não vazios, donde segue por (iii) que existe
𝑓: 𝐼 ⟶ ⋃𝐼 tal que 𝑓(𝑖) ∈ 𝑖 para todo 𝑖 ∈ 𝐼. Se ∅ ∉ 𝑆 então 𝑓 é uma função escolha para 𝑆; se
∅ ∈ 𝑆 então 𝑓̅ = 𝑓 ∪ {⟨∅, ∅⟩} é uma função escolha para 𝑆. Q.E.D.
132
A demonstração do teorema acima evidencia claramente a semelhança das
sentenças. Por (ii), em qualquer partição pode-se eleger um representante de cada membro da
partição e construir um conjunto com tais elementos. De (iii) segue que o produto cartesiano
de conjuntos não vazios é necessariamente não vazio; tal elemento que garante a não
vacuidade do produto cartesiano é justamente a função escolha.
A noção de produto cartesiano tornar-se-ia mais clara se 𝐼 fosse um conjunto bem
ordenado, pois assim 𝑓 ∈ ∏ 𝑆𝑖𝑖∈𝐼 seria da forma ⟨𝑓𝛼|𝛼 < 𝛼𝐼⟩, para algum ordinal 𝛼𝐼 isomorfo
a 𝐼: se 𝛼𝐼 fosse natural, 𝑓 seria uma 𝛼𝐼-úpla finita; caso 𝛼𝐼 = 𝜔, teríamos
𝑓 = ⟨𝑓0, 𝑓1,…, 𝑓𝑛,…⟩ uma sequência infinita na qual a 𝑖-ésima coordenada pertenceria a 𝑆𝑖, e
assim por diante. De fato, o axioma da escolha garante que 𝐼 é bem ordenável; mais do que
isso, qualquer conjunto admite uma boa ordenação.
Teorema 5.2 (Teorema da Boa Ordenação de Zermelo). As seguintes afirmações
são equivalentes em ZF:
(i) (O Axioma da Escolha — (AC3)) Existe uma função escolha para
qualquer família não vazia de conjuntos;
(ii) (O Princípio da Boa Ordem) Todo conjunto é bem ordenável.
Demonstração.
((i) ⟹ (ii)). Seja 𝐴 um conjunto e 𝑎 ∉ 𝐴. Consideremos então uma função
escolha 𝑓:℘(𝐴) ⟶𝐴. Por recursão transfinita, definamos para todo ordinal 𝛼,
𝐹(𝛼) = �𝑓(𝐴 ∖ 𝐹[𝛼]), 𝑎 ,
se 𝐴 ∖ 𝐹[𝛼] ≠ ∅se 𝐴 ∖ 𝐹[𝛼] = ∅,
onde 𝐹[𝛼] denota por simplicidade ℑ(𝐹 ↾ 𝛼), em alusão à notação utilizada para imagem
direta.
Isto é, 𝐹 é tal que 𝐹(0) é algum elemento de 𝐴 escolhido por 𝑓 caso 𝐴 ≠ ∅, ou
𝐹(0) = 𝑎 caso 𝐴 = ∅; 𝐹(1) é algum elemento de 𝐴 ∖ {𝐹(0)} caso este seja não vazio, ou
𝐹(1) = 𝑎 caso contrário, e assim por diante. Intuitivamente, 𝐹 lista os elementos de 𝐴
enquanto eles existem; após listar o último elemento, 𝐹 assume o valor 𝑎.
Sejam 𝛼 e 𝛽 ordinais tais que 𝛼 < 𝛽. Se 𝐹(𝛽) ≠ 𝑎, então 𝐹(𝛽) ∈ 𝐴 ∖ 𝐹[𝛽] e,
como 𝛼 ∈ 𝛽 temos 𝐹(𝛼) ∈ 𝐹[𝛽], donde segue que 𝐹(𝛽) ≠ 𝐹(𝛼). Disso, decorre que existe
𝜆 < ℎ(𝐴) tal que 𝐹(𝜆) = 𝑎: de fato, se 𝐹(𝛼) ≠ 𝑎 para todo 𝛼 < ℎ(𝐴), 𝐹 ↾ ℎ(𝐴) seria uma
injeção de ℎ(𝐴) sobre um subconjunto de 𝐴, contrariando a definição do Número de Hartogs.
133
Seja então 𝜇 o menor número ordinal tal que 𝐹(𝜇) = 𝑎. Mostremos que 𝐹[𝜇] =
𝐴. Obviamente 𝐹[𝜇] ⊆ 𝐴, pois 𝐹(𝛼) ∈ ℑ(𝑓)⊆ 𝐴 para todo ordinal 𝛼 < 𝜇. Se, por absurdo,
𝐹[𝜇] ≠ 𝐴, existiria 𝑥 ∈ 𝐴 ∖ 𝐹[𝜇], donde pela definição de 𝐹 teríamos 𝐹(𝜇) ≠ 𝑎. Portanto, a
função 𝐹 ↾ 𝜇: 𝜇 ⟶ 𝐴 é uma bijeção. Definindo
≺𝐹= {⟨𝐹(𝛼), 𝐹(𝛽)⟩|𝛼 < 𝛽 < 𝜇},
segue pela Proposição 4.6 que ⟨𝐴, ≺𝐹⟩ é um conjunto bem ordenado isomorfo a 𝜇.
((ii) ⟹ (i)). Seja 𝐴 ≠ ∅ um conjunto qualquer e consideremos ⋃𝐴. Como todo
conjunto é bem ordenável por hipótese, existe uma relação de boa ordem < sobre ⋃𝐴. Para
𝑋 ∈ 𝐴 qualquer, se 𝑥 ∈ 𝑋 então 𝑥 ∈ ⋃𝐴. Logo, todo membro de 𝐴 é subconjunto de ⋃𝐴.
Enfim, como ⟨⋃𝐴 , <⟩ é uma boa ordem, todo subconjunto 𝑆 ≠ ∅ de ⋃𝐴 possui um (único)
menor elemento; assim a função 𝑓:𝐴 ⟶ ⋃𝐴 dada por 𝑓(𝑋) = min(𝑋), para todo 𝑋 ∈ 𝐴, é
uma função escolha de 𝐴. Q.E.D.
Deve-se frisar que a boa ordenação garantida pelo Axioma da Escolha nada tem a
ver necessariamente com alguma ordem pré-existente num dado conjunto. Assim, por
exemplo, ao dizermos que ℝ pode ser bem ordenado, não podemos supor que a boa ordem
seja a mesma da relação de ordem usual da reta.
Dentre outras consequências importantes, garantir que todo conjunto é bem
ordenável nos permite afirmar que para todo conjunto existe um único número cardinal
equipotente a ele, isto é, todo conjunto possui um número cardinal. Em particular, para um
ordinal 𝛼 qualquer, temos pelo Teorema de Cantor e pelo Teorema 4.20 que existe 𝛽 > 𝛼 tal
que ℵ𝛼 < |℘(ℵ𝛼)| = |2ℵ𝛼 | = ℵ𝛽 , ou seja, |2ℵ𝛼| ≥ ℵ𝛼+1.
Como cardinais são números ordinais, para dois cardinais 𝜅 e 𝜆 quaisquer, vale
exatamente um dentre os três casos: 𝜅 < 𝜆, 𝜆 < 𝜅 ou 𝜅 = 𝜆. Por outro lado, como vimos no
Teorema 4.10, números cardinais estão inteiramente relacionados ao conceito de
equipotência. Dessa forma, uma consequência natural do Axioma da Escolha é que para
quaisquer conjuntos 𝑋 e 𝑌, tem-se necessariamente 𝑋 ≺ 𝑌, 𝑌 ≺ 𝑋 ou 𝑋 ≈ 𝑌. Essa é a
chamada Lei da Tricotomia. Como vemos abaixo, a Lei da Tricotomia e o Princípio da Boa
Ordenação são logicamente equivalentes; adaptamos a demonstração de Suppes (1972, p.
247).
Teorema 5.3. As seguintes afirmações são equivalentes em ZF:
134
(i) (O Princípio da Boa Ordem) Todo conjunto é bem ordenável;
(ii) (Lei da Tricotomia) Para quaisquer conjuntos 𝑋 e 𝑌, tem-se exatamente
um dos casos: 𝑋 ≺ 𝑌, 𝑌 ≺ 𝑋 ou 𝑋 ≈ 𝑌;
(iii) (∀𝐴)�𝐴 ≺ ℎ(𝐴)�.
Demonstração.
((i) ⟹ (ii)). Sejam 𝑋 e 𝑌 conjuntos quaisquer. Decorre de (i) que 𝑋 e 𝑌 são bem
ordenáveis. Então, do Teorema 4.9 e da Definição 4.19, segue que existem únicos cardinais 𝜅
e 𝜆 tais que |𝑋| = 𝜅 e |𝑌| = 𝜆. Da tricotomia dos ordinais, temos necessariamente um dos
seguintes casos: 𝜅 < 𝜆, 𝜆 < 𝜅 ou 𝜅 = 𝜆. O resultado segue então do Teorema 4.10.
((ii) ⟹ (iii)). Seja 𝐴 um conjunto qualquer. Por definição, o Número de Hartogs
de 𝐴 é tal que ¬(ℎ(𝐴)≾ 𝐴). Daí, a lei da tricotomia implica em 𝐴 ≺ ℎ(𝐴).
((iii) ⟹ (i)). Para um conjunto 𝐴 qualquer, se 𝐴 ≺ ℎ(𝐴), então 𝐴 é bem
ordenável, conforme mostrado na Proposição 4.6. Q.E.D.
Outro importante resultado utilizado na Matemática é o Lema de Zorn, cuja
importância consiste na relativa simplicidade em utilizá-lo para demonstrações de existência,
que antes de sua formulação eram feitas por meio de indução transfinita. (KURATOWSKI &
MOSTOWSKI, 1976). Provamos a seguir que o Lema de Zorn é equivalente ao Axioma da
Escolha (AC3).
Definição 5.1. Seja ⟨𝐴, ≤⟩ um conjunto parcialmente ordenado e 𝐵 ⊆ 𝐴. 𝐵 é uma
cadeia de 𝐴 se, e somente se, ⟨𝐵, ≤⟩ é uma ordem total.
Teorema 5.4. As seguintes afirmações são equivalentes em ZF:
(i) (O Axioma da Escolha — (AC3)) Existe uma função escolha para
qualquer família não vazia de conjuntos;
(ii) (O Lema de Zorn) Se toda cadeia num conjunto parcialmente ordenado
possui um limite superior, então o conjunto parcialmente ordenado possui um elemento
máximo.
Demonstração.
((i) ⟹ (ii)). Seja ⟨𝐴, ≼⟩ um conjunto parcialmente ordenado e assuma que toda
cadeia possua um limite superior. Fixemos 𝑏 ∉ 𝐴 e 𝑔:℘(𝐴) ⟶𝐴 uma função escolha. Por
recursão transfinita, definamos para todo ordinal 𝛼, o termo 𝑎𝛼, tal que
135
𝑎𝛼 = �𝑔(𝐴𝛼), se 𝑏 ∉ 𝑎[𝛼] ∧ 𝐴𝛼 = �𝑎 ∈ 𝐴�(∀𝜉)�(𝜉 é ordinal ∧ 𝜉 < 𝛼) ⟹𝑎𝜉 < 𝑎�� ≠ ∅
𝑏 , se 𝐴𝛼 = �𝑎 ∈ 𝐴�(∀𝜉) �(𝜉 é ordinal ∧ 𝜉 < 𝛼) ⟹ 𝑎𝜉 < 𝑎�� = ∅ ∨ 𝑏 ∈ 𝑎[𝛼],
onde 𝑎[𝛼] = �𝑎𝜉�𝜉 é ordinal ∧ 𝜉 < 𝛼�.
Notemos que para 𝛼 = 0, temos
𝐴0 = �𝑎 ∈ 𝐴�(∀𝜉)�(𝜉 é ordinal ∧ 𝜉 < 0) ⟹ 𝑎𝜉 < 𝑎�� = 𝐴,
e assim 𝑎0 é algum elemento de 𝐴; para 𝛼 = 1,
𝐴1 = �𝑎 ∈ 𝐴�(∀𝜉) �(𝜉 é ordinal ∧ 𝜉 < 1) ⟹𝑎𝜉 < 𝑎�� = {𝑎 ∈ 𝐴|𝑎 > 𝑎0},
e daí 𝑎1 é algum elemento maior do que 𝑎0, e assim sucessivamente: cada 𝑎𝛼 é um membro
de 𝐴 maior do que todos os 𝑎𝛽 anteriores. Claramente, deve existir algum ordinal 𝜆 < ℎ(𝐴)
para o qual 𝑎𝜆 = 𝑏, caso contrário 𝑎 ↾ ℎ(𝐴): ℎ(𝐴) ⟶𝐴 seria uma função injetora,
contrariando a definição de ℎ(𝐴); fixemos o menor ordinal 𝜆 tal que 𝑎𝜆 = 𝑏.
Então, �𝑎𝜉�𝜉 < 𝜆� é uma cadeia em 𝐴 por construção, pois todos os seus membros
são comparáveis. Logo, pela hipótese que assumimos sobre 𝐴, existe 𝑐 ∈ 𝐴 tal que 𝑐 ≽ 𝑎𝜉 ,
para todo 𝜉 < 𝜆. Se existisse 𝑣 ∈ 𝐴 tal que 𝑣 ≻ 𝑐, teríamos 𝑣 ≻ 𝑎𝜉 para todo 𝜉 < 𝜆 e,
consequentemente,
𝑣 ∈ 𝐴𝜆 = �𝑎 ∈ 𝐴�(∀𝜉) �(𝜉 é ordinal ∧ 𝜉 < 𝜆) ⟹𝑎𝜉 < 𝑎�� ≠ ∅
acarretando 𝑎𝜆 = 𝑔(𝐴𝜆) ≠ 𝑏 . Portanto, 𝑐 é um elemento máximo de 𝐴.
((ii) ⟹ (i)). Seja 𝐴 ≠ ∅. Provemos que existe 𝑓:𝐴 ⟶ ⋃𝐴 tal que 𝑓(𝑎) ∈ 𝑎, para
todo 𝑎 ∈ 𝐴, com 𝑎 ≠ ∅. Consideremos o conjunto
𝐹 = �𝑓 ∈ ℘�𝐴 × (⋃𝐴)��𝑓:𝔇(𝑓) ⟶⋃𝐴 ∧ (∀𝑎)(𝑎 ∈ 𝔇(𝑓) ⟹𝑓(𝑎) ∈ 𝑎)�,
isto é, 𝐹 é o conjunto das funções 𝑓 cujo domínio está contido em 𝐴 e tais que 𝑓(𝑎) ∈ 𝑎 para
todo 𝑎 ∈ 𝔇(𝑓). Tomando ⊆𝐹= {⟨𝑥, 𝑦⟩ ∈ 𝐹 ×𝐹|𝑥 ⊆ 𝑦}, é evidente que ⟨𝐹, ⊆𝐹⟩ é
parcialmente ordenado. Suponha então que 𝐹0 seja uma cadeia em 𝐹. Afirmamos que
𝑓̅ = ⋃𝐹0 é um limite superior de 𝐹0 . Obviamente 𝑓 ⊆ 𝑓,̅ para qualquer 𝑓 ∈ 𝐹0 ; como 𝐹0 é
totalmente ordenado pela ⊆𝐹, para quaisquer 𝑓, 𝑔 ∈ 𝐹0 , 𝑓 ⊆ 𝑔 ou 𝑔 ⊆ 𝑓, donde segue que 𝐹0
136
é um sistema de funções compatíveis e daí, pelo Teorema 3.14, 𝑓̅ ∈ 𝐹 , o que mostra que 𝑓 ̅ é
um limite superior de 𝐹0 .
Como 𝐹0 é uma cadeia arbitrária de 𝐹, segue que toda cadeia em 𝐹 tem limite
superior e, pelo Lema de Zorn, existe 𝔉 ∈ 𝐹 tal que para qualquer função 𝑓 ∈ 𝐹 , 𝔉 ⊄ 𝑓. Se
provarmos que 𝔇(𝔉) = 𝐴, garantiremos que 𝔉 é uma função escolha de 𝐴. De fato, se por
absurdo 𝔇(𝔉)≠ 𝐴, então existe 𝑎 ∈ 𝐴 ∖ 𝔇(𝔉). Se 𝑎 ≠ ∅, existe 𝑎� ∈ 𝑎, daí basta tomarmos
𝔉� = 𝔉 ∪ {⟨𝑎, 𝑎�⟩} ∈ 𝐹; se 𝑎 = ∅, fixemos 𝑥 ∈ ⋃𝐴 qualquer e façamos 𝔉� = 𝔉 ∪ {⟨∅, 𝑥⟩} ∈ 𝐹 .
Em ambos os casos, 𝔉� é tal que 𝔉 ⊂ 𝔉�, contrariando a maximalidade de 𝔉 garantida pelo
Lema de Zorn. Q.E.D.
Existem ainda várias sentenças equivalentes ao Axioma da Escolha em ZF. A
maioria dos autores consultados discute as equivalências tratadas aqui, bem como tantas
outras — principalmente Jech (1973). Um resultado por vezes citado unicamente como
consequência do Axioma da Escolha, a existência de uma base para todo espaço vetorial, é na
verdade equivalente a este, conforme provado em 1984, por Andreas Blass. Encerramos esta
seção com a demonstração de tal fato; assumimos conhecidos os conceitos de Álgebra
utilizados abaixo, os quais podem ser encontrados, por exemplo, no trabalho de Coelho &
Lourenço (2007) e Rotman (2005).
Teorema 5.5. As seguintes afirmações são equivalentes em ZF:
(i) (O Lema de Zorn) Se toda cadeia num conjunto parcialmente ordenado
possui um limite superior, então o conjunto parcialmente ordenado possui um elemento
máximo;
(ii) Todo espaço vetorial admite uma base;
(iii) Para qualquer família disjunta 𝐴 = {𝐴𝑖|𝑖 ∈ 𝐼} de conjuntos não vazios,
existe 𝑓: 𝐼 ⟶ ℘(⋃𝐴) tal que 𝑓(𝑖)⊆ 𝐴𝑖 é um subconjunto finito não vazio de 𝐴𝑖, para todo
𝑖 ∈ 𝐼;
(iv) (O Axioma da Escolha — (AC3)) Existe uma função escolha para
qualquer família não vazia de conjuntos.
Demonstração.
Devido às equivalências já vistas, basta provarmos que (i) ⟹ (ii) ⟹ (iii) ⟹ (iv).
Assumimos como fato que (iii) ⟹ (iv); sua demonstração se baseia em conceitos
abordados apenas superficialmente no Apêndice B. Uma prova detalhada pode ser encontrada
em Komjáth & Totik (2006, p. 477). Mostraremos então que (i) ⟹ (ii) ⟹ (iii).
137
((i) ⟹ (ii)). Seja 𝑉 um 𝕂-espaço vetorial não nulo. Logo, existe um subconjunto
𝒞 ⊆ 𝑉 linearmente independente (l.i.) em 𝑉. Consideremos então o conjunto
𝐹 = {𝐿 ∈ ℘(𝑉)|𝒞 ⊆ 𝐿 ∧ 𝐿 é l.i.}.
Obviamente, ⟨𝐹, ⊆𝐹⟩ é parcialmente ordenado. Tomemos uma cadeia em 𝐹, que
seja 𝐹′. Provar que existe um limite superior para 𝐹′ consiste em exibir um subconjunto 𝐹�
linearmente independente em 𝑉 tal que, para todo 𝐴 ∈ 𝐹′, 𝐴 ⊆ 𝐹�. Afirmamos que 𝐹� = ⋃𝐹′ é
um limite superior para 𝐹′.
De fato, se 𝐴 ∈ 𝐹′ então 𝐴 ⊆ 𝐹�. Seja então 𝐹�𝑛 = {𝑣0 ,…, 𝑣𝑛} ⊆ 𝐹� um subconjunto
finito de 𝐹�. Para cada 𝑖 ≤ 𝑛, existe 𝐴𝑖 ∈ 𝐹′ tal que 𝑣𝑖 ∈ 𝐴𝑖. Segue do fato de 𝐹′ ser uma
cadeia que existe 𝑗 ≤ 𝑛 tal que 𝑣𝑖 ∈ 𝐴𝑗 , para todo 𝑖 ≤ 𝑛 e, como 𝐴𝑗 ∈ 𝐹′, decorre que 𝐹�𝑛 é l.i.
Como 𝐹�𝑛 é um subconjunto qualquer de 𝐹�, conclui-se que 𝐹� é um limite superior para 𝐹′.
Segue do Lema de Zorn que existe 𝔅 ∈ 𝐹 um elemento maximal de 𝐹, isto é, para
o qual não é válido 𝐴 ⊂ 𝔅, para qualquer 𝐴 ∈ 𝐹 . Se, por absurdo, 𝔅 não fosse um conjunto
gerador de 𝑉, existiria 𝑣 ∈ 𝑉 ∖ [𝔅] e, consequentemente, 𝔅′ = (𝔅 ∪ {𝑣}) ∈ 𝐹 seria tal que
𝔅 ⊂ 𝔅′, contrariando a maximalidade de 𝔅. Portanto, 𝔅 é um conjunto gerador de 𝑉
linearmente independente, ou seja, 𝔅 é uma base de 𝑉.
((ii) ⟹ (iii)) 1. Seja 𝐴 = {𝐴𝑖|𝑖 ∈ 𝐼} ≠ ∅ uma família de conjuntos não vazios dois
a dois disjuntos, 𝕜 um corpo qualquer e 𝑋 = ⋃ 𝐴𝑖𝑖∈𝐼 . Seja 𝕜[𝑋] o anel de polinômios cujas
indeterminadas são os membros de 𝑋 e 𝕜(𝑋) o corpo das funções racionais de 𝑋, isto é, das
funções da forma 𝑝𝑞 com 𝑝, 𝑞 ∈ 𝕜[𝑋] e 𝑞 ≠ 0𝕜[𝑋]. Notemos que 𝑋 ⊆ 𝕜[𝑋].
Para um polinômio 𝑝 ∈ 𝕜[𝑋], chamemo-lo de 𝑖-homogêneo de grau 𝑑 se a soma
dos expoentes das variáveis de 𝐴𝑖 for 𝑑 em cada monômio de 𝑝. Analogamente, chamemos a
função racional 𝑝𝑞∈ 𝕜(𝑋) de 𝑖-homogênea de grau 𝑑 se 𝑝 for 𝑖-homogêneo de grau 𝑛 + 𝑑 e 𝑞
for 𝑖-homogêneo de grau 𝑛. O conjunto 𝐾 das funções 𝑖-homogêneas de grau 0, para todo
𝑖 ∈ 𝐼, constitui um subcorpo de 𝕜(𝑋) e, portanto, 𝕜(𝑋) é um espaço vetorial sobre 𝐾.
Consideremos então 𝑉 = [𝑋] ⊆ 𝕜(𝑋), o subespaço vetorial de 𝕜(𝑋) gerado por
𝑋. Por hipótese, existe uma base 𝔅⊆ [𝑋] de 𝑉. Para cada 𝑖 ∈ 𝐼 e 𝑥 ∈ 𝐴𝑖, 𝑥 pode ser
unicamente representado como uma combinação 𝐾-linear finita
1 Adaptamos de Blass (1984) a demonstração de tal implicação.
138
�†1� 𝑥 = � 𝛼𝑏(𝑥)𝑏𝑏∈𝐵(𝑥)
,
onde 𝐵(𝑥) ⊆ 𝔅 é um subconjunto finito e 𝛼𝑏(𝑥) ∈ 𝐾 ∖ {0𝐾}, para todo 𝑏 ∈ 𝐵(𝑥). Para outro
𝑦 ∈ 𝐴𝑖 qualquer, temos
�†2� 𝑦 = � 𝛼𝑏(𝑦)𝑏𝑏∈𝐵(𝑦)
.
Como 𝑥, 𝑦 ∈ 𝐴𝑖, segue que 𝑦𝑥∈ 𝕜(𝑋) é uma função 𝑖-homogênea de grau 0 para
todo 𝑖, e daí 𝑦𝑥∈ 𝐾. Multiplicando �†1� por 𝑦
𝑥, obtemos
�†3� 𝑦 = �𝑦𝑥𝛼𝑏(𝑥)𝑏
𝑏∈𝐵(𝑥)
,
daí, por �†2�, �†3� e da unicidade dos coeficientes envolvidos na representação de 𝑦, 𝐵(𝑥) =
𝐵(𝑦) e 𝛼𝑏(𝑦) = 𝑦𝑥𝛼𝑏(𝑥), para todo 𝑦 ∈ 𝐴𝑖. Logo,
𝑐𝑏 =𝛼𝑏(𝑥)𝑥
=𝛼𝑏(𝑦)𝑦
.
Como 𝑥 e 𝑦 são elementos arbitrários de 𝐴𝑖, segue que 𝑐𝑏 e 𝐵(𝑥) independem da
escolha dos elementos de 𝐴𝑖, dependendo apenas de 𝑖. Dessa forma, podemos dizer que para
cada 𝑖 ∈ 𝐼, existe um subconjunto finito não vazio 𝐵(𝑖)⊆ 𝔅 e escalares 𝑐𝑏(𝑖) ∈ 𝐾, para cada
𝑏 ∈ 𝐵(𝑖), tais que para qualquer 𝑥 ∈ 𝐴𝑖,
𝑥 = � 𝑥𝑐𝑏(𝑖)𝑏𝑏∈𝐵(𝑖)
,
daí, como 𝑐𝑏(𝑖) = 𝛼𝑏(𝑥)𝑥
e 𝛼𝑏(𝑥) ∈ 𝐾, segue que 𝑐𝑏(𝑖) é 𝑖-homogêneo de grau −1.
Consequentemente, quando expresso sob a forma reduzida, devem ocorrer (finitas) variáveis
de 𝐴𝑖 no denominador de 𝑐𝑏(𝑖); tais variáveis são, por construção, elementos de 𝐴𝑖.
Chamemos de 𝐵�𝑖 o conjunto das variáveis de 𝐴𝑖 que ocorrem no denominador de 𝑐𝑏(𝑖) para
todo 𝑏 ∈ 𝐵(𝑖); pelo o que discutimos, 𝐵�𝑖 é um subconjunto finito não vazio de 𝐴𝑖, para todo
𝑖 ∈ 𝐼. Daí, claramente a função 𝑓: 𝐼 ⟶ ℘(⋃𝐴) dada por 𝑓(𝑖) = 𝐵�𝑖 satisfaz (iii). Q.E.D.
139
5.3. A Hipótese Generalizada do Continuum
Encerramos este capítulo com a demonstração de que a Hipótese Generalizada do
Continuum (HGC) implica o Axioma da Escolha. Em outras palavras, assumir HGC como um
axioma em ZF permite derivar (AC3) como um teorema. Tal resultado se mostra interessante
por evidenciar a enorme gama de resultados que se pode obter ao trabalharmos com
proposições independentes. Julgamos pertinentes alguns comentários preliminares.
Vimos na seção anterior que, em ZFC, |2ℵ𝛼| = ℵ𝛽 ≥ ℵ𝛼+1 , para algum 𝛽 > 𝛼.
Não podemos determinar em ZFC, de modo geral, qual “o valor” do ordinal 𝛽. Sabe-se
apenas que 𝛽 > 𝛼. A formulação mais comum de HGC estabelece que 𝛽 = 𝛼 + 1.
HGC1 — |2ℵ𝛼 | = ℵ𝛼+1.
Em outras palavras, HGC1 afirma que para qualquer ordinal 𝛼, ℘(ℵ𝛼)≈ ℎ(ℵ𝛼),
pois ℵ𝛼+1 = ℎ(ℵ𝛼) por definição. Claro que, como em ZFC todo conjunto infinito possui um
cardinal transfinito, poderíamos considerar HGC como sendo a afirmação:
HGC2 — Se 𝐴 é infinito então ℘(𝐴) ≈ ℎ(𝐴),
ou equivalentemente,
HGC2’ — Se 𝐴 é infinito então 2𝐴 ≈ ℎ(𝐴).
Por outro lado, como vimos no Corolário 4.9, para qualquer ordinal 𝛼 não existe
cardinal transfinito 𝜅 tal que ℵ𝛼 < 𝜅 < ℵ𝛼+1, donde se conclui (em ZFC) que se 𝑋 é infinito,
então não existe conjunto 𝑌 tal que |𝑋| < |𝑌| < |℘(𝑋)|, ou equivalentemente, se |𝑋| ≤ |𝑌| ≤
|℘(𝑋)|, então |𝑋| = |𝑌| ou |𝑌| = |℘(𝑋)|. É essa última formulação que adotamos como
oficial para HGC, que encontramos no trabalho de Miraglia (1991).
Hipótese Generalizada do Continuum (HGC). Se 𝑋 é um conjunto infinito e o
conjunto 𝑌 é tal que 𝑋 ≾ 𝑌 e 𝑌 ≾ 2𝑋 , então 𝑋 ≈ 𝑌 ou 𝑌 ≈ 2𝑋 .
Grosso modo, dado um conjunto infinito 𝑋, HGC estabelece que não existe
qualquer conjunto 𝑌 que admita injeções 𝜑:𝑋 ⟶ 𝑌 e 𝜓:𝑌 ⟶ ℘(𝑋) , e não seja equipotente a
𝑋 ou a ℘(𝑋). A demonstração de que HGC implica (AC3) dada por Miraglia requer alguns
140
pré-requisitos, os quais são dados a seguir; as demonstrações podem ser encontradas em
(MIRAGLIA, 1991).
Teorema 5.6.
(i) HGC ⟹ Se 𝛼 é ordinal tal que 𝜔 ≤ 𝛼, então 2𝛼 ≈ ℎ(𝛼);
(ii) ℎ(𝑋 × 𝑌) ≈ ℎ(𝑋) × ℎ(𝑌) ≈ max{ℎ(𝑋), ℎ(𝑌)} para 𝑋 e 𝑌 infinitos (em
particular, ℎ(𝑋 × 𝑌) = max{ℎ(𝑋), ℎ(𝑌)});
(iii) Denotemos 𝑋 + 𝑌 = ({0} × 𝑋) ∪ ({1} × 𝑌); se 𝑋 + ℎ(𝑋) ≈ 𝑋 × ℎ(𝑋),
então 𝑋 é bem ordenável, para qualquer conjunto 𝑋 infinito;
(iv) Se 𝑋 é infinito, então 2𝑋 × 2ℎ(𝑋) ≈ 2𝑋+ℎ(𝑋) .
Em posse de tais resultados, provamos o teorema seguinte.
Teorema 5.7. HGC ⟹ (AC3).
Demonstração.
Seja 𝑋 um conjunto infinito qualquer e fixemos 𝑥 ∈ 𝑋. As funções
𝑓1:𝑋 + ℎ(𝑋) ⟶ 𝑋 × ℎ(𝑋), 𝑓2 :𝑋 × ℎ(𝑋) ⟶ ℘(𝑋) × ℘�ℎ(𝑋)� e
𝑓3 :℘(𝑋) × ℘�ℎ(𝑋)� ⟶ ℘�𝑋 × ℎ(𝑋)�
dadas respectivamente por
𝑓1(⟨𝛼, 𝑦⟩) = �⟨𝑦, 𝛼⟩ , se 𝛼 = 0⟨𝑥, 𝑦⟩ , se 𝛼 = 1, para quaisquer ⟨𝛼, 𝑦⟩ ∈ 𝑋 + ℎ(𝑋),
𝑓2(⟨𝑥, 𝛼⟩) = ⟨{𝑥},{𝛼}⟩, para todo ⟨𝑥, 𝛼⟩ ∈ 𝑋 × ℎ(𝑋) e
𝑓3(⟨𝑆, Ω⟩) = 𝑆 × Ω, para qualquer ⟨𝑆, Ω⟩ ∈ ℘(𝑋) × ℘�ℎ(𝑋)�,
são injetoras, e mostram que
𝑋 + ℎ(𝑋) ≾ 𝑋 × ℎ(𝑋) ≾ 2𝑋 × 2ℎ(𝑋) ,
donde segue pelo item (iv) do Teorema 5.6 que
𝑋 + ℎ(𝑋) ≾ 𝑋 × ℎ(𝑋) ≾ 2𝑋+ℎ(𝑋),
e daí, por HGC, 𝑋 + ℎ(𝑋) ≈ 𝑋 × ℎ(𝑋) ou 𝑋 × ℎ(𝑋) ≈ 2𝑋 × 2ℎ(𝑋).
141
Se provarmos que 𝑋 + ℎ(𝑋) ≈ 𝑋 × ℎ(𝑋), seguirá pelo item (iii) do Teorema 5.6
que 𝑋 é bem ordenável, donde concluiremos que todo conjunto é bem ordenável, o que
equivale ao Axioma da Escolha.
Devido a HGC, basta mostrarmos que não podemos ter 𝑋 × ℎ(𝑋) ≈ 2𝑋 × 2ℎ(𝑋).
Se, por absurdo, tal equipotência fosse verdadeira, teríamos ℎ�𝑋 × ℎ(𝑋)� = ℎ�2𝑋 × 2ℎ(𝑋)�.
Então, pelo item (ii) do Teorema 5.6, obteríamos, por um lado
ℎ�𝑋 × ℎ(𝑋)� = max�ℎ(𝑋), ℎ�ℎ(𝑋)�� = ℎ�ℎ(𝑋)�,
e, por outro lado,
ℎ�2𝑋 × 2ℎ(𝑋)� = max�ℎ(2𝑋), ℎ�2ℎ(𝑋)�� ≥ ℎ�2ℎ(𝑋)�.
Logo, ℎ�2ℎ(𝑋)� ≤ ℎ�ℎ(𝑋)� e, consequentemente, ℎ�2ℎ(𝑋)�≾ ℎ�ℎ(𝑋)�. Porém,
pelo item (i) do Teorema 5.6, temos ℎ�ℎ(𝑋)� ≈ 2ℎ(𝑋), donde concluímos que
ℎ�2ℎ(𝑋)�≾ 2ℎ(𝑋).
Absurdo. Portanto, 𝑋 + ℎ(𝑋) ≈ 𝑋 × ℎ(𝑋). Q.E.D.
Assim, HGC implica (AC3). Logo, ao assumirmos HGC, para todo conjunto
infinito 𝐴 existe um ordinal 𝛼 tal que 𝐴 ≈ ℵ𝛼. Observemos então que ℵ𝛼+1 = ℎ(𝐴) e também
que 2ℵ𝛼 ≈ 2𝐴 . Por termos 2ℵ𝛼 ≈ ℵ𝛼+1 , segue que ℎ(𝐴) ≈ 2𝐴 . Ou seja, HGC ⟹ HGC2.
Por outro lado, HGC2 ⟹ HGC. De fato, se ℘(𝐴) ≈ ℎ(𝐴) para todo conjunto 𝐴
infinito, então ℘(𝐴) é bem ordenável, donde consequentemente 𝑃 = �{𝑥}�𝑥 ∈ 𝐴� é um
subconjunto bem ordenado de ℘(𝐴). Como 𝐴 ≈ 𝑃, inferimos que 𝐴 é bem ordenável, o que
mostra a validade do Princípio da Boa Ordem e, por conseguinte, do Axioma da Escolha.
Logo, para todo conjunto infinito 𝐴, existe um ordinal 𝛼 tal que ℵ𝛼 ≈ 𝐴. Como HGC2 afirma
que ℘(𝐴) ≈ ℎ(𝐴) e ℘(𝐴) ≈ 2𝐴 conforme já provamos, temos 2ℵ𝛼 ≈ ℵ𝛼+1 e, do Corolário
4.9, segue que vale HGC. Portanto, HGC ⟺ HGC2.
142
Conclusão
Como vimos, a Teoria dos Conjuntos mostra-se altamente adaptada à
generalização e à abstração, peças fundamentais para o desenvolvimento da Matemática Pura.
Vemos hoje que não apenas sua linguagem, mas também seus conceitos fundamentais
encontram-se intrinsecamente ligados a praticamente todos os ramos da Matemática. Neste
sentido, ZFC pode ser visto como uma fundamentação para as principais áreas da Matemática,
uma vez que permite o desenvolvimento da Teoria dos Conjuntos, a qual engloba a
formalização dos números e das funções.
Como os números naturais são a base para o desenvolvimento dos demais
conjuntos numéricos, o que se faz por meio de operações definidas em ZFC, podemos ver que
os principais tópicos da Álgebra, da Topologia e da Análise encontram-se sustentados pelos
axiomas que postulamos. Apenas temas mais avançados, os quais eventualmente podem
requerer a Teoria das Categorias e a existência de classes próprias, podem não encontrar
fundamentação formal suficiente em ZFC. Ainda assim, existem outros sistemas de axiomas,
bem próximos de ZFC, que preenchem tal lacuna.
No que concerne à própria Teoria dos Conjuntos, ainda existem grandes questões
a serem estudadas. As pesquisas referentes à consistência e independência de muitas
sentenças em ZFC abrem caminhos para muitos questionamentos interessantes: Quais outras
hipóteses implicam o Axioma da Escolha? Alguma delas o nega? Quais os efeitos em negar
algum dos axiomas de ZFC no desenvolvimento subsequente da Matemática? O que se pode
fazer na Topologia, na Álgebra, na Análise, etc., ao negarmos, por exemplo, o Axioma do
Infinito, ou o Axioma das Partes?
No mesmo sentido do que ocorreu com a Geometria no advento da discussão
sobre o postulado das paralelas, o avanço das pesquisas sobre os axiomas da Teoria dos
Conjuntos pode culminar no desenvolvimento de diferentes “Teorias dos Conjuntos” de
acordo com os axiomas que venham a ser adotados. Contudo, é certo que por mais “Teorias
dos Conjuntos” que venham a surgir com o desenrolar da História, ZFC, bem como a
Geometria Euclidiana, tem garantido seu lugar entre os blocos fundamentais da Matemática.
143
Apêndice A — Leis do Cálculo Proposicional
No que segue, baseamo-nos em Kuratowski & Mostowski (1976).
Designemos sentenças matemáticas arbitrárias por 𝑝, 𝑞, 𝑟, …, etc. Assumimos
que todas as sentenças podem assumir valor lógico verdadeiro ou falso. Para expressar
explicitamente a sentença 𝑝, utilizamos o símbolo “≡” para indicar que a sentença do lado
oposto a 𝑝 é justamente 𝑝. Assim, “𝑝 ≡ 3 > 2” indica que 𝑝 afirma que 2 é menor do que 3.
Para duas sentenças 𝑝 e 𝑞, podemos obter uma nova sentença por meio dos
conectivos:
“e”, “ou”, “se… então”, “… se, e somente se,…”.
A sentença “𝑝 e 𝑞”, que indicamos por 𝑝 ∧ 𝑞, é a conjunção lógica de 𝑝 e 𝑞. A
conjunção 𝑝 ∧ 𝑞 só assume valor verdadeiro quando 𝑝 e 𝑞 são ambos verdadeiros, nos demais
casos 𝑝 ∧ 𝑞 é falso. A sentença “𝑝 ou 𝑞”, designada por 𝑝 ∨ 𝑞, é a disjunção lógica de 𝑝 e 𝑞,
verdadeira sempre que 𝑝 ou 𝑞 forem verdadeiros, de modo que só é falsa quando ambas as
sentenças são falsas.
“Se 𝑝 então 𝑞” é a implicação de 𝑞 por 𝑝, indicada por 𝑝 ⟹ 𝑞. Seu valor lógico é
falso apenas se 𝑝 for verdadeiro e 𝑞 for falso. Intuitivamente, a implicação 𝑝⟹ 𝑞 é
verdadeira quando 𝑞 for verdadeiro sempre que 𝑝 for verdadeiro, de modo que se 𝑝 for falso,
o valor de 𝑞 é irrelevante. Isso justifica 𝑝⟹ 𝑞 ser falso apenas se 𝑝 for verdadeiro e 𝑞 falso.
A sentença “𝑝 se, e somente se, 𝑞” é a equivalência lógica de 𝑝 e 𝑞, indicada por
𝑝 ⟺ 𝑞, que só é verdadeira quando os valores lógicos de 𝑝 e 𝑞 coincidem: se 𝑝 for verdadeiro
/falso então 𝑞 é verdadeiro/falso, se 𝑞 for verdadeiro/falso então 𝑝 é verdadeiro/falso.
Naturalmente, (𝑝⟺ 𝑞) ⟺ �(𝑝⟹ 𝑞) ∧ (𝑞 ⟹ 𝑝)�.
Uma sentença sempre falsa é uma contradição, que denotaremos por F; uma
sentença sempre verdadeira é uma tautologia, denominada por V.
Para uma sentença 𝑝 qualquer, “não é verdade que 𝑝” é a negação de 𝑝, denotada
por ¬𝑝. Quando 𝑝 é verdadeiro, ¬𝑝 é falso; quando 𝑝 é falso, ¬𝑝 é verdadeiro; ou seja,
(𝑝 ∨ ¬𝑝) ⟺ 𝑉, uma das sentenças 𝑝 ou ¬𝑝 sempre deve ser verdadeira, este é o Princípio do
Terceiro Excluído, que nos “permite” realizar demonstrações via reductio ad absurdum. O
Princípio da Não Contradição estabelece que (𝑝 ∧ ¬𝑝) ⟺ 𝐹: uma proposição não pode ser
verdadeira e falsa simultaneamente.
144
Em suma, temos ainda as seguintes leis:
(𝑝 ∨ 𝑞) ⟺ (𝑞 ∨ 𝑝) comutatividade da disjunção;
(𝑝 ∧ 𝑞) ⟺ (𝑞 ∧ 𝑝) comutatividade da conjunção;
(𝑝 ∨ 𝑞) ∨ 𝑟 ⟺ 𝑝 ∨ (𝑞 ∨ 𝑟) associatividade da disjunção;
(𝑝 ∧ 𝑞) ∧ 𝑟 ⟺ 𝑝 ∧ (𝑞 ∧ 𝑟) associatividade da conjunção;
𝑝 ∧ (𝑞 ∨ 𝑟) ⟺ (𝑝 ∧ 𝑞) ∨ (𝑝 ∧ 𝑟) primeira lei distributiva;
𝑝 ∨ (𝑞 ∧ 𝑟) ⟺ (𝑝 ∨ 𝑞) ∧ (𝑝 ∨ 𝑟) segunda lei distributiva;
(𝑝 ∨ 𝑝) ⟺𝑝, (𝑝 ∧ 𝑝) ⟺𝑝 lei da tautologia ou idempotência;
(𝑝 ∧ 𝐹)⟺ 𝐹 , (𝑝 ∧ 𝑉) ⟺𝑝 lei de absorção da conjunção;
(𝑝 ∨ 𝐹)⟺ 𝑝, (𝑝 ∨ 𝑉) ⟺𝑉 lei de absorção da disjunção;
[(𝑝⟹ 𝑞) ∧ (𝑞 ⟹ 𝑟)] ⟹ (𝑝 ⟹ 𝑟) lei do silogismo hipotético
ou transitividade da implicação;
[(𝑝⟺ 𝑞) ∧ (𝑞 ⟺ 𝑟)] ⟹ (𝑝 ⟺ 𝑟) transitividade da equivalência;
𝑝⟺ ¬(¬𝑝) lei da dupla negação;
(𝑝⟹ 𝑞) ⟺ (¬𝑞 ⟹ ¬𝑝) lei da contrapositiva;
(𝑝⟹ 𝑞) ⟺ (¬𝑝 ∨ 𝑞) definição equivalente da implicação.
Podemos também ter 𝑝 como um “esquema de sentenças”, em que 𝑥 ocorre como
variável livre em 𝑝, de modo a indicarmos 𝑝 por 𝑝(𝑥). Por exemplo, se 𝑝(𝑥) ≡ 𝑥 > 3, para
cada valor de 𝑥 obtemos uma sentença, para a qual são válidas as leis vistas acima. Em tais
casos, geralmente usamos quantificadores: existencial (∃) e universal (∀).
Dizemos que existe 𝑦 tal que 𝑝 (ou existe 𝑦 que satisfaz 𝑝, 𝑝 é verdadeiro para 𝑦,
etc.) se, ao substituirmos 𝑥 por 𝑦 em 𝑝(𝑥) obtivermos o valor lógico de 𝑝(𝑦) verdadeiro;
neste trabalho indicamos isso por (∃𝑦)�𝑝(𝑦)�. Por exemplo, considerando 𝑝(𝑥) ≡ 3𝑥 > 4,
existe 𝑦 tal que 𝑝: basta tomar 𝑦 = 2. Se o 𝑦 que satisfizer 𝑝 for único, indica-se por
(∃!𝑦)�𝑝(𝑦)�.
O quantificador universal indica a validade de alguma sentença 𝑝 para todo
elemento 𝑥, o que indicamos por (∀𝑥)�𝑝(𝑥)�. Um bom exemplo é o Teorema de Cantor, que
estabelece (∀𝑥)�𝑥 ≺ ℘(𝑥)�. Vale notarmos que (∀𝑥)�𝑝(𝑥)�⟺ ¬(∃𝑥)�¬𝑝(𝑥)�, ou seja, é
equivalente afirmar que “para todo 𝑥 vale 𝑝” e “não existe 𝑥 tal que ¬𝑝(𝑥)”. Em particular,
se existir 𝑥 tal que ¬𝑝(𝑥), então ¬(∀𝑥)�𝑝(𝑥)�.
145
Apêndice B — Conjuntos Bem Fundados
Neste apêndice discutimos de maneira informal os conceitos básicos sobre os
conjuntos bem fundados e sua ligação com o Axioma da Fundação. Baseamo-nos em
Fraenkel, Bar-Hillel & Levy (1973) e Kunen (1980), que tratam mais profundamente do
assunto que se segue.
Uma questão simples, mas fundamental, envolvendo a natureza dos conjuntos não
pode ser respondida pelos axiomas (A1), (A2),…,(A8): existe 𝑥 tal que 𝑥 ∈ 𝑥? Numa
“tentativa” de encontrar um conjunto com tal propriedade, poderíamos tentar verificar se
conseguimos construir tal conjunto. Procedemos por “camadas”. Chamaremos de conjuntos
bem fundados os membros de tais “camadas”.
A primeira camada (que chamaremos de 𝑉0 ) deve constituir-se de todos os
indivíduos que admitimos, o que consiste neste caso no conjunto vazio. Nesta camada não há
membros que pertençam a si mesmos. A segunda camada (𝑉1 ) é composta por todos os
subconjuntos de 𝑉0 , ou seja, devemos ter 𝑉1 = {∅}. Novamente, 𝑉1 ∉ 𝑉1 e não há membros de
𝑉1 (subconjuntos de 𝑉0 ) que pertençam a si mesmos. Procedendo recursivamente, para um
dado ordinal 𝛼, definimos 𝑉𝛼+1 = ℘(𝑉𝛼) e, para o caso de 𝛼 ser um ordinal limite, fazemos
𝑉𝛼 = �𝑉𝛾𝛾<𝛼
.
Prova-se que para qualquer ordinal 𝛼, 𝑉𝛼 ∉ 𝑉𝛼 e, para qualquer membro 𝑥 de 𝑉𝛼,
𝑥 ∉ 𝑥, ou ainda, para qualquer membro 𝑥 de um elemento 𝑦 de 𝑉𝛼, 𝑥 ∉ 𝑥 e 𝑦 ∉ 𝑦 e assim por
diante. Por outro lado, para todo 𝛼, tomando quaisquer 𝑥, 𝑦 ∈ 𝑉𝛼 tem-se que ℘(𝑥), ⋃𝑥, 𝑥 ×
𝑦, {𝑥, 𝑦}, 𝑥 ∪ 𝑦, 𝑥𝑦, 𝑥 ∖ 𝑦, ⋂𝑥 (caso 𝑥 ≠ ∅), etc. são conjuntos bem fundados. Em outras
palavras, começando por ∅ e aplicando recursivamente todas as operações entre conjuntos
que definimos, obtemos sempre conjuntos bem fundados. E nisso, consiste o Axioma da
Fundação:
(AF) Todo conjunto é bem fundado.
Apesar de não demonstrarmos, frisamos que (A9), postulado ainda no Capítulo 2, é
equivalente à (AF).
146
A importância do Axioma da Fundação se faz presente em contextos inerentes à
própria Teoria dos Conjuntos. Por exemplo, enquanto negar o Axioma da Escolha nos gera
consequências na Álgebra e na Topologia, assumir ou não (AF) é irrelevante para a
Matemática em geral, haja vista que todos os conjuntos definidos por meio dos demais
axiomas são bem fundados. Conjuntos bem fundados servem como um modelo (no sentido do
que discutimos na seção 5.1), sendo dessa forma imprescindíveis para o estudo de questões
sobre os fundamentos da Teoria dos Conjuntos.
Além disso, faz-se o uso de (AF) em outras situações. Por exemplo, a
demonstração de que (iii) ⟹ (iv) no Teorema 5.5 se faz mostrando que para todo ordinal 𝛼,
𝑉𝛼 é bem ordenável, o que permite concluir que todo conjunto é bem ordenável.
Para encerrar este apêndice, respondemos à questão que o iniciou, e provamos a
seguir que para qualquer conjunto 𝑋, 𝑋 ∉ 𝑋.
Teorema. (∀𝑋)(𝑋 ∉ 𝑋).
Demonstração.
Suponha, por absurdo, que exista 𝑋 tal que 𝑋 ∈ 𝑋. Então 𝑋 ∈ {𝑋} e,
consequentemente, 𝑋 ∈ {𝑋} ∩ 𝑋. Devido a (A9), existe 𝑥 ∈ {𝑋} tal que 𝑥 ∩ {𝑋} = ∅.
Contudo, como {𝑋} é unitário, segue que 𝑥 = 𝑋 e, consequentemente, 𝑋 ∩ {𝑋} = ∅, absurdo.
Portanto, não existe 𝑋 tal que 𝑋 ∈ 𝑋. Q.E.D.
147
Bibliografia
AURICHI, L. F. fundamentos.pdf. 2011. Portable Document Format. Disponível em: <http://www.icmc.usp.br/~aurichi/Ensino/Verao2011/fundamentos.pdf>. Acesso em: 17 jun. 2011.
_______ . independência.pdf. 2011. Portable Document Format. Disponível em:
<http://www.icmc.usp.br/~aurichi/Ensino/Verao2011/independ%C3%AAncia.pdf>. Acesso em: 17 jun. 2011.
ÁVILA, G. Cantor e a Teoria dos Conjuntos. Revista do Professor de
Matemática, São Paulo, n. 43, p. 6-14, 2000. BLASS, A. Existence of Bases Implies The Axiom Of Choice. Contemporary
Mathematics, Providence, R.I., v. 31, p. 31-33, 1984. BOURBAKI, N. Elements of Mathematics, Theory of Sets. London: Addison-
Wesley, 1968. BOYER, C. B. História da Matemática. São Paulo: Blücher, 1996. COELHO, F. U.; LOURENÇO, M. L. Um Curso de Álgebra Linear. 2. ed. São
Paulo: Edusp, 2007. DADAM, F.; HEIN, N. Teoria Unificada dos Conjuntos. Rio de Janeiro:
Ciência Moderna, 2009. DEDEKIND, R. Essays On The Theory Of Numbers. Chicago: Open Court,
1901. EBBINGHAUS, H.-D.; PECKHAUS, V. Ernst Zermelo, An Aproach to His
Life and Work. Berlin: Springer, 2007. FERREIRÓS, J. Labyrinth of Thought, A History of Set Theory and Its Role
in Modern Mathematics. 2. ed. Berlin: Birkhäuser, 2007.
148
FRAENKEL, A. A. Abstract Set Theory. Amsterdam: North-Holland, 1953. FRAENKEL, A. A.; BAR-HILLEL, Y.; LEVY, A. Foundations of Set Theory.
2. ed. Amsterdam: Elsevier, 1973. HALMOS, P. R. Naive Set Theory. New York: Van Nostrand Reinhold
Company, 1960. HRBACEK, K.; JECH, T. Introduction to Set Theory. 3. ed. New York: Marcel
Dekker, 1999. JECH, T. The Axiom of Choice. Amsterdam: North-Holland, 1973. _______ . Set Theory. 3. ed. Berlin: Springer, 2003. KOMJÁTH, P.; TOTIK, V. Problems and Theorems in Classical Set Theory.
New York: Springer, 2006. KUNEN, K. Set Theory, An Introduction to Independence Proofs.
Amsterdam: North-Holland, 1980. KURATOWSKI, K.; MOSTOWSKI, A. Set Theory, With An Introduction To
Descriptive Set Theory. 2. ed. Warszawa: North-Holland, 1976. LEVY, A. Basic Set Theory. Mineola: Dover, 1979. LIMA, E. L. Curso de Análise Real. Vol. I. 12. ed. Rio de Janeiro: IMPA, 2009. MIRAGLIA, F. Teoria dos Conjuntos: Um Mínimo. São Paulo: Edusp, 1991. MORAIS FILHO, D. C. Manual de Redação Matemática. Campina Grande:
Fábrica de Ensino, 2010. ROTMAN, J. J. A First Course In Abstract Algebra. 3. ed. Upper Saddle River:
Prentice Hall, 2005.
149
RUSSELL, B. Introduction To Mathematical Philosophy. 2. ed. Mineola: Dover, 1920.
SUPPES, P. Axiomatic Set Theory. 2. ed. New York: Dover, 1972.
150
Índice Remissivo
Abraham Fraenkel, 24
Aleph. ver número cardinal transfinito
Alfabeto, 27
Alfred Whitehead, 25
Aristóteles, 11 silogismo de, 9
Axioma, 21 da Abstração, 19 da Escolha, 139 da Escolha, 22, 44, 90, 131 da Existência, 33 da Extensão, 34 da Fundação, 24, 44 da Separação, 22, 34 da Substituição, 23, 40 da União, 37 das Partes, 39 do Infinito, 39 do Par, 37
Bernard Bolzano, 12
Bernhard Riemann, 13
Bertrand Russell, 10, 25
conjunto bem ordenado, 96 cadeia, 134 cardinal do, 110 classe de equivalência, 71 compatível de funções, 83 complementar relativo, 50 das partes, 50 de funções, 89 de representantes, 74 definição intuitiva, 9 dos números naturais, 120 elemento do, 34 enumerável, 126 estritamente ordenado, 69 finito, 123 indexado, 76 indutivo, 119 ínfimo do, 93
infinito, 123 infinito de Dedekind, 14, 124 interseção, 50 interseção do par, 42 limite inferior do, 93 limite superior do, 93 não enumerável, 126 parcialmente ordenado, 69 partição do, 70 produto cartesiano finito, 123 produto do, 89 produto externo. ver produto do conjunto segmento inicial, 96 seleção, 43 sistema de Dedekind, 14 subconjunto, 38 subconjunto próprio, 38 sucessor, 104 supremo do, 93 totalmente ordenado, 70 transitivo, 103 união, 50 união do par, 38, 52 unitário, 37 universo, 10, 35 vazio, 10, 36
conjuntos disjuntos, 42 inclusão de, 38 inclusão própria de, 38 produto cartesiano de, 62
Critério da definição condicional, 31 da definição por equivalência, 30 da definição por identidade, 30 da eliminabilidade, 29 da não criatividade, 29
David Hilbert, 21 Problemas de, 22
definição por abstração, 46 por Recursão Transfinita, 116, 117, ver
Teorema da Recursão Transfinita
151
Epimênides, 18
Ernst Zermelo, 21
expressões de linguagem, 28
extensão conservativa, 25
formalismo, 21
fórmula, 29 aberta, 30 atômica primitiva, 28 condição em x, 30 fechada, 30 funcional, 40 operação induzida pela, 87
Frank Ramsey, 18
função automorfismo, 95 bijetora, 76 colagem de, 83 crescente, 99 escolha, 89 injetora, 75 isomorfismo, 94 sequência finita, 122 sequência infinita, 123 sequência transfinita, 122 sobrejetora, 75
Galileu Galilei, 11
Georg Cantor, 9, 15, 16
George Boole, 10
Giuseppe Peano, 75 Axiomas de, 121
Gottfried Leibniz, 12
Gottlob Frege, 19, 103
heterológico. ver paradoxo de Grelling-
Nelson
Hipótese do Continuum, 17, 128
Hipótese Generalizada do Continuum, 128,
139
imagem direta, 66
inversa, 66
indivíduo, 32
infinito completo, 11 de Dedekind, 124 potencial, 11
intuicionismo, 21
Jakob Steiner, 13
Karl Weierstrass, 15
Kazimierz Kuratowski, 60
Lei da Tricotomia, 134
Leis de De Morgan, 85
Lema de Zorn, 134, 136
linguagem objeto, 27
logicismo, 21
metalinguagem, 27
número cardinal, 110 cardinal transfinito, 126 de Hartogs, 108 natural, 119 ordinal, 104 ordinal limite, 113 ordinal sucessor, 113 ordinal, adição de, 118 ordinal, exponenciação de, 118 ordinal, multiplicação de, 118
n-úpla não ordenada, 123 ordenada, 122
par não ordenado, 37 ordenado, 60, 122
paradoxo, 18 de Aquiles, 11 de Burali-Forti, 19, 105 de Cantor, 18 de Grelling-Nelson, 23 de Russell, 19, 36
152
do Mentiroso, 18 linguístico, 18 lógico, 18
Princípio da Indução Natural, 120 para conjuntos bem ordenados, 97 para ordinais, 112, 113
relação antissimétrica, 69 assimétrica, 69 binária, 63 campo da, 64 conectada, 70 de boa ordem, 96 de equivalência, 69 de ordem estrita, 69 de ordem linear, 70 definição de, 63 domínio da, 64 elemento máximo da, 93 elemento mínimo da, 93 elementos comparáveis, 70 elementos incomparáveis, 70 função, 70 imagem da, 64 inversa da, 66 irreflexiva, 69 maior elemento da, 93 menor elemento da, 93 reflexiva, 69 restrição da, 66
simétrica, 69 transitiva, 69
Richard Dedekind, 14 infinito de. ver conjunto infinito de
Dedekind
Sistema axiomático de Morse-Kelley, 24 de Von Neumann-Bernays-Gödel, 24 de Zermelo-Fraenkel (ZF), 24 Zermelo-Fraenkel-Choice (ZFC), 24
Teorema da Boa Ordenação, 22, 132 da Recursão Transfinita, 114 de Cantor, 82 de Cantor-Bernstein, 82 do Ponto Fixo de Tarski, 81
Teoria dos tipos, 25
Thoralf Skolem, 23
variável ligada, 29 livre, 30
variedade. ver Bernhard Riemann
Von Neumann, 103
Zenão de Eléia, 11