probabilidade circa 1914 e a construção de pacheco...

769
UNIVERSIDADE DE LISBOA FACULDADE DE CIÊNCIAS Departamento de Estatística e Investigação Operacional Probabilidade Circa 1914 e a Construção de Pacheco d’Amorim Rui Filipe Vargas de Sousa Santos Doutoramento em Estatística e Investigação Operacional (Especialidade de Probabilidades e Estatística) 2008

Upload: lekhanh

Post on 11-Nov-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

  • UNIVERSIDADE DE LISBOA

    FACULDADE DE CINCIAS

    Departamento de Estatstica e Investigao Operacional

    Probabilidade Circa 1914

    e a Construo de

    Pacheco dAmorim

    Rui Filipe Vargas de Sousa Santos

    Doutoramento em Estatstica e Investigao Operacional

    (Especialidade de Probabilidades e Estatstica)

    2008

  • UNIVERSIDADE DE LISBOA

    FACULDADE DE CINCIAS

    Departamento de Estatstica e Investigao Operacional

    Probabilidade Circa 1914

    e a Construo de

    Pacheco dAmorim

    Rui Filipe Vargas de Sousa Santos

    Tese orientada pelo Professor Doutor Dinis D. F. Pestana

    Doutoramento em Estatstica e Investigao Operacional

    (Especialidade de Probabilidades e Estatstica)

    2008

  • Dissertao apresentada Faculdade de Cincias

    da Universidade de Lisboa, para a obteno do grau

    de Doutor em Probabilidades e Estatstica.

  • i

    Resumo

    Diogo Pacheco dAmorim defendeu a sua tese de doutoramento, intitu-

    lada Elementos de Clculo das Probabilidades, em 1914. Nela prope uma

    construo rigorosa para a Teoria da Probabilidade baseada no conceito, que

    considera primitivo, de tiragem ao acaso. Nesta estruturao o autor co-

    mea por admitir um modelo padro, em que o agente da seleco procede

    a escolhas (ou a lanamentos) em situao de plena aleatoriedade, com total

    conhecimento do espao amostra. Assim, pode deduzir a possibilidade de

    cada elemento sem recorrer ao polmico princpio da razo insuficiente de

    J. Bernoulli e Laplace. O conceito primitivo de que parte o de probabili-

    dade condicionada, ainda que a sua definio no seja geral. Um outro seu

    conceito, o de ponto imagem, antecipa muitas ideias subjacentes s variveis

    aleatrias, ficando perto de alcanar a definio de funo de distribuio.

    Como eplogo, o autor analisa luz das leis limites, Lei dos Grandes Nme-

    ros e Teorema Limite Central, os casos onde no somos ns os agentes e/ou

    no temos total informao do espao amostra, expondo a sua viso sobre as

    aplicaes da Probabilidade, isto , a sua concepo de Estatstica.

    Neste trabalho comentaremos as principais ideias apresentadas por Pa-

    checo dAmorim na sua tese de doutoramento, comparando-a com trabalhos

    da mesma poca, nomeadamente da escola francesa, onde no s salientamos

    os aspectos mais inovadores na sua conceptualizao de Probabilidade, mas

    tambm mostramos as limitaes de alguns dos conceitos que usa.

    Palavras chave: Axiomatizao da Probabilidade, Escolha Aleatria,

    Probabilidade Condicional, Fundamentos da Probabilidade, Histria da Pro-

    babilidade.

    AMS (2000) Subject Classification: 60A05, 01A90.

  • iii

    Abstract

    Diogo Pacheco dAmorim presented his thesis Elements of Probability

    Calculus in 1914. His main goal was the axiomatization of Probability. He

    built up Probability upon the idea of random choice (or random throw); his

    concept of possibilities, leading to conditional probability, elegantly solves

    the problem of getting unequal probabilities for elementary events. But his

    definition of conditional probability is not general. His ideas of image point

    are a predecessor of many interesting developments on functions of random

    variables, without, unfortunately, inventing the idea of distribution function.

    His reconstruction of Fubinnis theorem clearly shows that he is aware of the

    richness brought in, in dealing with random vectors, by the concept of de-

    pendence. His construction, distinguishing several layers of incomplete kno-

    wledge, begins by a thorough investigation of the standard model (random

    choice performed by ourselves with perfect knowledge of the sample space);

    then, using Bernoullis laws and their consequences, he devises objective ways

    of deciding whether a random choice performed by someone else, or even by

    a mechanical device, is undistinguishable from random choice performed by

    the subject, and thence can be reduced to the standard model.

    The main goal of this work is to analyse the contribution to the foundati-

    ons of Probability Theory, and the bridge between probability and observed

    data, contained in Pacheco dAmorim proposal. We also review other previ-

    ous and contemporary contributions to point out the meaning and complexity

    of the problem of the foundations of the notion of probability, which is part

    of Hilberts sixth problem, and the deep difficulties previous to the definitive

    axiomatization by Kolmogoroff in 1933.

    Keywords: Axiomatization of Probability, Random Choice, Conditional

    Probability, Foundations of Probability, History of Probability.

    AMS (2000) Subject Classification: 60A05, 01A90.

  • Contedo

    Lista de Figuras xv

    Lista de Tabelas xviii

    Agradecimentos xix

    I Introduo 1

    1 Probabilidade Circa 1914 e a Construo de Pacheco

    dAmorim 3

    II Traduo 17

    2 Elements of Probability Calculus 21

    Preface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    2.1 CHAPTER I Finite sets . . . . . . . . . . . . . . . . . . . . 28

    2.2 CHAPTER II Continuous Probability . . . . . . . . . . . . 47

    2.3 CHAPTER III Random Figures . . . . . . . . . . . . . . . 61

    v

  • vi Probabilidade Circa 1914 e a Construo de Pacheco dAmorim

    2.3.1 First Part Random rigid figures . . . . . . . . . . . 61

    2.3.2 Second Part Random variable figures . . . . . . . . 71

    2.4 CHAPTER IV Image Point . . . . . . . . . . . . . . . . . . 76

    2.4.1 Application . . . . . . . . . . . . . . . . . . . . . . . . 77

    2.4.2 Law of possibilities and law of probability . . . . . . . 86

    2.4.3 A priori and a posteriori laws . . . . . . . . . . . . . . 87

    2.5 CHAPTER V Jacob Bernoullis Theorems and the Error

    Law . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

    2.5.1 First Part Jacob Bernoullis theorems . . . . . . . . 93

    2.5.2 Second Part Law of deviations (Error law) . . . . . 113

    2.6 CHAPTER VI Mathematical Expectation and Mean Value 124

    2.7 CHAPTER VII Conclusion . . . . . . . . . . . . . . . . . . 139

    III A Construo de Pacheco dAmorim 153

    O Autor 157

    Prefcio 161

    Introduo 165

    3 Classes Finitas 169

    3.1 Elementos e classes possveis . . . . . . . . . . . . . . . . . . . 170

    3.2 Possibilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

    3.3 Probabilidade de A em relao a A . . . . . . . . . . . . . . 178

    3.4 Teorema da Probabilidade Total e Composta . . . . . . . . . . 189

  • Contedo vii

    3.5 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . 196

    3.6 Frmulas inversas da de Bayes . . . . . . . . . . . . . . . . . . 204

    3.7 Regra da Sucesso de Laplace . . . . . . . . . . . . . . . . . . 206

    3.8 Comentrio geral ao captulo . . . . . . . . . . . . . . . . . . . 218

    4 Probabilidade Contnua 221

    4.1 Pontos e regies possveis . . . . . . . . . . . . . . . . . . . . . 222

    4.2 Possibilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

    4.3 Probabilidade de X em relao a X . . . . . . . . . . . . . . 239

    4.4 Problema do tringulo . . . . . . . . . . . . . . . . . . . . . . 245

    4.5 Simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254

    4.6 Paradoxo de Borel-Kolmogoroff . . . . . . . . . . . . . . . . . 255

    4.7 Lanamentos em regies ilimitadas . . . . . . . . . . . . . . . 262

    4.8 Comentrio geral ao captulo . . . . . . . . . . . . . . . . . . . 263

    5 Lanamento, Sorte, de Figuras 265

    5.1 Lanamento, sorte, de figuras rgidas . . . . . . . . . . . . . 266

    5.1.1 Problema do encontro dos dois amigos . . . . . . . . . 271

    5.1.2 Paradoxo de Bertrand . . . . . . . . . . . . . . . . . . 274

    5.1.3 Problema da Agulha de Buffon . . . . . . . . . . . . . 289

    5.2 Lanamento, sorte, de figuras variveis . . . . . . . . . . . . 296

    5.2.1 Figuras poligonais abertas . . . . . . . . . . . . . . . . 297

    5.2.2 Figuras poligonais fechadas . . . . . . . . . . . . . . . 298

    5.2.3 Curvas flexveis e inextensveis . . . . . . . . . . . . . . 313

    5.3 Comentrio geral ao captulo . . . . . . . . . . . . . . . . . . . 314

  • viii Probabilidade Circa 1914 e a Construo de Pacheco dAmorim

    6 Ponto Imagem 319

    6.1 Definio de Ponto Imagem . . . . . . . . . . . . . . . . . . . 320

    6.2 Aplicao do Ponto Imagem . . . . . . . . . . . . . . . . . . . 330

    6.2.1 Princpio de Borel . . . . . . . . . . . . . . . . . . . . . 333

    6.2.2 Primeiro caso . . . . . . . . . . . . . . . . . . . . . . . 341

    6.2.3 Segundo caso . . . . . . . . . . . . . . . . . . . . . . . 342

    6.2.4 Terceiro caso . . . . . . . . . . . . . . . . . . . . . . . 351

    6.3 Lei da Possibilidade e Lei da Probabilidade . . . . . . . . . . . 353

    6.4 Leis a priori e leis a posteriori . . . . . . . . . . . . . . . . . . 369

    6.4.1 Leis a priori . . . . . . . . . . . . . . . . . . . . . . . . 369

    6.4.2 Leis a posteriori . . . . . . . . . . . . . . . . . . . . . . 371

    6.5 Probabilidade composta e Teorema de Bayes . . . . . . . . . . 372

    6.5.1 Frmulas inversas da de Bayes . . . . . . . . . . . . . . 374

    6.6 Comentrio geral ao captulo . . . . . . . . . . . . . . . . . . . 375

    7 Teorema de Jacob Bernoulli e Lei dos Desvios 379

    7.1 Resultados preliminares . . . . . . . . . . . . . . . . . . . . . 381

    7.2 Teoremas de Jacob Bernoulli . . . . . . . . . . . . . . . . . . . 395

    7.3 Ordem de convergncia do nmero de experincias em relao

    aos afastamentos . . . . . . . . . . . . . . . . . . . . . . . . . 414

    7.4 Probabilidade de um nmero racional . . . . . . . . . . . . . . 425

    7.4.1 Os nmeros Normais de Borel . . . . . . . . . . . . . . 429

    7.5 Lei dos desvios . . . . . . . . . . . . . . . . . . . . . . . . . . 444

    7.6 Comentrio geral ao captulo . . . . . . . . . . . . . . . . . . . 458

  • Contedo ix

    8 Esperana Matemtica e Valor Mdio 461

    8.1 Esperana Matemtica e valor mdio em Classes . . . . . . . . 463

    8.1.1 Definio . . . . . . . . . . . . . . . . . . . . . . . . . 464

    8.1.2 Propriedades . . . . . . . . . . . . . . . . . . . . . . . 469

    8.2 Esperana matemtica e valor mdio em Regies . . . . . . . . 473

    8.2.1 Definio . . . . . . . . . . . . . . . . . . . . . . . . . 473

    8.2.2 Propriedades . . . . . . . . . . . . . . . . . . . . . . . 474

    8.3 Desigualdade . . . . . . . . . . . . . . . . . . . . . . . . . . . 483

    8.4 Problema da curva flexvel e inextensvel . . . . . . . . . . . . 485

    8.4.1 Abandonando a hiptese de independncia . . . . . . . 497

    8.4.2 Problema de escala . . . . . . . . . . . . . . . . . . . . 512

    8.4.3 Passeios aleatrios em reticulados . . . . . . . . . . . . 525

    8.4.4 O movimento browniano . . . . . . . . . . . . . . . . . 534

    8.5 Problema da agulha de Buffon tratado como valores esperados 545

    8.6 Lei dos Grandes Nmeros . . . . . . . . . . . . . . . . . . . . 550

    8.7 Propriedades da Lei de Gauss . . . . . . . . . . . . . . . . . . 559

    8.8 Comentrio geral ao captulo . . . . . . . . . . . . . . . . . . . 569

    9 Concluso 573

    9.1 Reduo ao fenmeno padro . . . . . . . . . . . . . . . . . . 575

    9.2 Leis de Bernoulli e anlogas . . . . . . . . . . . . . . . . . . . 577

    9.3 Probabilidade versus certeza . . . . . . . . . . . . . . . . . . . 581

    9.4 Informao incompleta . . . . . . . . . . . . . . . . . . . . . . 586

    9.4.1 Primeiro sub-grupo Caso discreto . . . . . . . . . . 586

  • x Probabilidade Circa 1914 e a Construo de Pacheco dAmorim

    9.4.2 Segundo sub-grupo Caso contnuo . . . . . . . . . . 589

    9.5 Aleatoriedade . . . . . . . . . . . . . . . . . . . . . . . . . . . 596

    9.6 Estatstica circa 1914 . . . . . . . . . . . . . . . . . . . . . . . 601

    9.7 Comentrio geral ao captulo . . . . . . . . . . . . . . . . . . . 610

    IV Concluso 613

    10 Comentrio Geral Construo de Pacheco dAmorim 615

    10.1 Formalizao da concepo geral de Pacheco dAmorim . . . . 617

    10.2 Grundbegriffe de Kolmogoroff (1933) . . . . . . . . . . . . . . 625

    10.2.1 Contextualizao . . . . . . . . . . . . . . . . . . . . . 626

    10.2.2 Axiomtica . . . . . . . . . . . . . . . . . . . . . . . . 633

    10.2.3 Variveis Aleatrias e Funo de Distribuio . . . . . 649

    10.2.4 Esperana Matemtica e Probabilidade Condicionada . 660

    10.2.5 Espaos de dimenso superior e independncia . . . . . 664

    10.2.6 Aplicabilidade . . . . . . . . . . . . . . . . . . . . . . . 669

    10.2.7 Comentrio aos fundamentos de Kolmogoroff e a verso

    condicional de Rnyi . . . . . . . . . . . . . . . . . . . 672

    10.3 Os Colectivos de von Mises e a viso frequencista . . . . . . . 679

    10.3.1 A axiomtica de Richard von Mises . . . . . . . . . . . 681

    10.3.2 O Clculo das Probabilidades nos colectivos . . . . . . 682

    10.3.3 Os Teoremas Fundamentais . . . . . . . . . . . . . . . 689

    10.3.4 Independncia versus Estatstica clssica . . . . . . . . 691

    10.4 A Permutabilidade de Bruno de Finetti e a viso bayesiana . . 692

  • Contedo xi

    10.4.1 Axiomtica de Bruno de Finetti . . . . . . . . . . . . . 695

    10.4.2 Definio de probabilidade e princpio da coerncia . . 696

    10.4.3 Aditividade versus -aditividade . . . . . . . . . . . . 701

    10.4.4 Probabilidade Condicionada . . . . . . . . . . . . . . . 707

    10.4.5 Permutabilidade e Teoremas de Representao . . . . . 710

    10.4.6 A viso lgica indutiva . . . . . . . . . . . . . . . . . . 716

    10.5 Comentrio final construo de Diogo Pacheco dAmorim . . 722

    Bibliografia 727

  • xii Probabilidade Circa 1914 e a Construo de Pacheco dAmorim

  • Lista de Figuras

    2.1 Figure 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

    2.2 Figure 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

    2.3 Figure 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

    2.4 Figure 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

    2.5 Figure 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

    2.6 Figure 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

    2.7 Figure 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    2.8 Figure 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

    2.9 Figure 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

    2.10 Figure 10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

    2.11 Figure 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

    2.12 Figure 12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

    4.1 Lanar, sorte, um ponto numa regio composta . . . . . . . 226

    4.2 Lanar, sorte, um ponto num complexo de regies 1 . . . 226

    4.3 Lanar, sorte, um ponto num complexo de regies 2 . . . 227

    4.4 Lanar, sorte, um ponto num crculo . . . . . . . . . . . . . 231

    4.5 Lanar, sorte, um ponto num complexo de regies . . . . . 232

    xiii

  • xiv Probabilidade Circa 1914 e a Construo de Pacheco dAmorim

    4.6 Inverso da ordem de lanamento de um complexo de regies 237

    4.7 Lanar, sorte, um ponto num quadrado . . . . . . . . . . . 246

    4.8 Problemas dos Tringulos . . . . . . . . . . . . . . . . . . . . 250

    4.9 Problemas dos Tringulos 2 . . . . . . . . . . . . . . . . . . . 250

    5.1 Lanar, sorte, a regio plana A na regio plana B . . . . . 271

    5.2 Problema do encontro de dois amigos . . . . . . . . . . . . . 272

    5.3 Problema de Bertrand Soluo de Pacheco dAmorim . . . . 274

    5.4 Problema de Bertrand 1a Soluo de Bertrand . . . . . . . 276

    5.5 Problema de Bertrand 2a Soluo de Bertrand . . . . . . . 277

    5.6 Problema de Bertrand 3a Soluo de Bertrand . . . . . . . 278

    5.7 Erro de Pacheco dAmorim no Problema de Bertrand . . . . . 280

    5.8 Lanamento, sorte, de pontos num crculo . . . . . . . . . . 281

    5.9 Cordas escolhidas aleatoriamente . . . . . . . . . . . . . . . . 282

    5.10 Simulao do Problema de Bertrand . . . . . . . . . . . . . . 283

    5.11 Duas cordas com possibilidades distintas . . . . . . . . . . . . 286

    5.12 Problema da Agulha de Buffon . . . . . . . . . . . . . . . . . 289

    5.13 Regio de lanamento da agulha . . . . . . . . . . . . . . . . 290

    5.14 Campo de variao da agulha . . . . . . . . . . . . . . . . . . 292

    5.15 O jogo do franc-carreau . . . . . . . . . . . . . . . . . . . . . 293

    5.16 Tirar, sorte, a forma de um vrtice . . . . . . . . . . . . . . 297

    5.17 Tirar, sorte, a forma de um tringulo . . . . . . . . . . . . . 299

    5.18 Tirar, sorte, a forma de um quadriltero . . . . . . . . . . . 300

    5.19 Quando um quadriltero sorte sai tringulo . . . . . . . . . 303

  • Lista de Figuras xv

    5.20 Quadrilteros tirados sorte . . . . . . . . . . . . . . . . . . 305

    5.21 Grficos dos ngulos de um quadriltero . . . . . . . . . . . . 306

    5.22 Tirar, sorte, a forma de um pentgono (original) . . . . . . 308

    5.23 Tirar, sorte, a forma de um pentgono (alterado) . . . . . . 309

    6.1 Leis priori . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370

    6.2 Leis posteriori . . . . . . . . . . . . . . . . . . . . . . . . . 371

    8.1 Simulao do Problema curva flexvel . . . . . . . . . . . . . 490

    8.2 Simulao do Problema curva flexvel com dependncia . . . . 498

    8.3 Passeios aleatrios utilizando distribuio Beta . . . . . . . . 501

    8.4 Grfico de f(x) = sin(x)x

    . . . . . . . . . . . . . . . . . . . . . 508

    8.5 Grfico de g(x) = 3(

    sin(x)x3

    cos(x)x2

    ). . . . . . . . . . . . . . . 510

    8.6 Passeios aleatrios com n distinto . . . . . . . . . . . . . . . . 514

    8.7 Passeios com normalizao . . . . . . . . . . . . . . . . . . . 518

    8.8 Passeios com distncia esperada fixa . . . . . . . . . . . . . . 522

    8.9 Passeios aleatrios em reticulados . . . . . . . . . . . . . . . . 527

  • xvi Probabilidade Circa 1914 e a Construo de Pacheco dAmorim

  • Lista de Tabelas

    5.1 Simulao do Problema de Bertrand . . . . . . . . . . . . . . 283

    5.2 Variao dos ngulos de um quadriltero . . . . . . . . . . . . 307

    7.1 Valores de enpnq

    p

    q

    em 50 provas com p = 0.5 . . . . . . . 397

    8.1 Simulao do Problema curva flexvel . . . . . . . . . . . . . 491

    8.2 Simulao do Problema curva flexvel com dependncia . . . . 499

    8.3 Simulao do Problema curva flexvel com dependncia . . . . 500

    8.4 Simulao do Problema curva flexvel com dependncia Beta . 502

    8.5 Quadrado das distncias entre os pontos extremos . . . . . . 513

    8.6 Quadrado das distncias entre os pontos extremos . . . . . . 519

    8.7 Simulao com processo com limite esperado fixo . . . . . . . 520

    8.8 Evoluo de E (d2) em funo de n e . . . . . . . . . . . . . 521

    8.9 Distncias entre os pontos extremos . . . . . . . . . . . . . . 523

    8.10 Simulao com distncia esperada fixa . . . . . . . . . . . . . 524

    8.11 Simulao de pela Lei de Gauss . . . . . . . . . . . . . . . 564

    8.12 Simulao de pela agulha de Buffon com = 1 e = 0.5 . . 565

    8.13 Simulao de pela agulha de Buffon com = = 1 . . . . . 566

    xvii

  • xviii Probabilidade Circa 1914 e a Construo de Pacheco dAmorim

    8.14 Simulao de pelo lanamento de um ponto . . . . . . . . . 567

    8.15 Erros de estimao pela frmula de Wallis . . . . . . . . . . . 568

  • Agradecimentos

    Para que fosse possvel a realizao deste trabalho muitos foram os que,

    directa ou indirectamente, deram um contributo significativo para a sua con-

    cretizao. Por este motivo, gostaria de expressar aqui a minha enorme

    gratido a todos aqueles que, de alguma forma, contriburam para este fim,

    especialmente:

    Ao Professor Dinis Pestana, pelo tema sugerido, pela contnua orientao

    e disponibilidade, pela preciso e pertinncia dos comentrios, pela confiana

    e apoio desmedido, pelo entusiasmo contagiante e renovado em cada conversa,

    pela compreenso e amizade patenteada ao longo deste projecto, bem como

    pelas sugestes e crticas imprescindveis concretizao deste trabalho;

    Professora Sandra Mendona, pela troca de ideias, sempre proveitosas e

    enriquecedoras, que me ajudaram a compreender melhor algumas das teorias

    concebidas por Pacheco dAmorim;

    Ao Professor Jos Bayolo Pacheco de Amorim, pela sua autorizao na

    divulgao da edio diplomtica da traduo da tese de doutoramento do seu

    pai, bem como pelo manifesto apoio nesta investigao e na disponibilidade

    em partilhar connosco histrias sobre os feitos de Diogo Pacheco dAmorim;

    Ao Instituto Politcnico de Leiria e ao Centro de Estatstica e Aplicaes

    da Universidade de Lisboa pelas facilidades com que, ao longo dos ltimos

    xix

  • xx Probabilidade Circa 1914 e a Construo de Pacheco dAmorim

    anos, me criaram condies favorveis para a concretizao desta dissertao;

    Ao Nuno Dias, colega de pesquisa em Histria da Matemtica em Portu-

    gal, pelas diversas informaes que me facultou e pela sua contnua preocu-

    pao com a minha investigao;

    Ao Miguel Felgueiras, colega de gabinete e de pesquisa em Probabilidades,

    pela permanente troca de ideias bem como pelo ambiente que me propiciou;

    A todos os meus colegas do Instituto Politcnico de Leiria, nomeadamente

    do Departamento de Matemtica, pela forma como me encorajaram e confia-

    ram nas minhas capacidades, em todas as circunstncias, tornando-me apto

    a completar este ciclo;

    A todos os meus amigos pelas oportunas manifestaes de companheiris-

    mo e de encorajamento que me permitiram manter o nimo sempre elevado;

    Ao Nuno, Dalila e ao David pela sua enorme amizade e por estarem

    sempre presentes;

    Aos meus Pais, Jorge e Antonieta, por toda a dedicao com que me

    criaram, desde o seu amor e carinho constantes at ao investimento que efec-

    tuaram na minha educao, cuja contnua orientao tornou possvel atingir

    esta meta;

    Susana e ao Pedro, minhas fontes inspiradoras, por tudo o que abdi-

    caram em prol das minhas pesquisas; pelo seu amor infinito, a sua pacincia

    ilimitada e a sua confiana inesgotvel, que foram factores determinantes ao

    longo deste trabalho, cujo apoio incondicional tornou esta tarefa exequvel.

  • Dedicatria xxi

    Aos meus Pais,

    Susana

    e ao Pedro.

  • xxii Probabilidade Circa 1914 e a Construo de Pacheco dAmorim

  • Parte I

    Introduo

    1

  • Captulo 1

    Probabilidade Circa 1914 e a

    Construo de Pacheco dAmorim

    Le nom seul de calcul des probabilits est un paradoxe: la pro-

    babilit, oppose la certitude, cest ce quon ne connat pas?

    Cependant, beaucoup de savants minents se sont occups de ce

    calcul, et lon ne saurait nier que la science nen ait tir quelque

    profit. Comment expliquer cette apparente contradiction?

    [Poincar, 1902, p. 210]

    No incio do sculo xx, a Teoria da Probabilidade (ou Clculo de Proba-

    bilidades como nessa altura apelidada, nomeadamente pela escola francesa)

    atravessa um perodo conturbado na sua evoluo.

    O Clculo das Probabilidades, para utilizar a mesma nomenclatura que

    Hacking (1975), emergiu no sculo xvii com a anlise dos resultados de jogos

    de azar (1), sendo habitualmente identificado o despontar desta cincia com

    a correspondncia entre Fermat (16011665) e Pascal (16231662) em 1654

    (1) Segundo o Dicionrio Etimolgico da Lngua Portuguesa, azar advm do rabe az-

    zahar que significa felicidade, acto, caso feliz, dado; segundo o Dicionrio Aurlio azar

    tem origem no rabe em az-zahar ou az-zahr e significa m sorte; fortuna adversa;

    3

  • 4 Introduo

    para resolver os problemas propostos por Chevalier de Mr (16101685)

    sobre a fraco da aposta que cabe a cada adversrio quando uma partida

    de jogos interrompida antes da concluso.

    Os resultados dos jogos de azar so caracterizados por terem duas facetas

    primeira vista antagnicas. Por um lado, so descritos por uma desordem

    individual, isto , pela impossibilidade de previso de um resultado especfico,

    consequncia da incerteza associada a cada um dos resultados particulares

    de um jogo de azar (caso contrrio no seria realmente um jogo de azar);

    por outro lado, so tambm caracterizados pela sua ordem colectiva, ou seja,

    pela regularidade existente quando visualizamos um conjunto (com um n-

    mero razovel) de resultados. Os fenmenos caracterizados por esta dupla

    faceta, denominados fenmenos aleatrios, so o alvo de anlise da Teoria

    da Probabilidade. Todavia, os fenmenos aleatrios no se restringem aos

    resultados de jogos de azar.

    Ao longo do sculo xvii verifica-se uma crescente observao e coleco de

    dados, nomeadamente de tabelas de mortalidade(2), sendo cada vez mais no-

    tria a regularidade das frequncias relativas quando temos um conjunto com

    um nmero elevado de observaes, tornando-se evidente que os resultados

    revs; fatalidade; desgraa; infortnio; casualidade; acaso. Tiago de Oliveira (1991a)

    refere que a palavra azar deriva do rabe al azhar que apresenta no s a conotao

    que habitualmente lhe damos de m-sorte ou m-fortuna, mas tambm designa acaso,

    sendo az-zahar a patrona da fortuna, correspondente deusa Tykhe (ou Tych) da

    mitologia grega e deusa Fortuna presente na mitologia romana. Refira-se que estes

    deuses simbolizam o acaso dos destinos humanos que, segundo os seus caprichos, ser

    benvolo ou malvolo.

    (2) Por exemplo, os trabalhos realizados por John Graunt (16201674), John de Witt

    (16251672) e Edmond Halley (16561742), para citar algumas das mais importantes re-

    ferncias desta poca.

  • Probabilidade Circa 1914 e a Construo de Pacheco dAmorim 5

    dos jogos de azar no so os nicos fenmenos aleatrios(3).

    Por este motivo aparecem, nesta poca, as primeiras tentativas de infe-

    rncia estatstica, verificando-se um aumento da importncia da Teoria da

    Probabilidade na Estatstica, surgindo novos resultados tericos para justi-

    ficar esta aproximao, destacando-se a Lei [fraca] dos Grandes Nmeros de

    Bernoulli (1713)(4) e os primeiros enunciados do Teorema Limite Central,

    inicialmente restritos s provas de Bernoulli, em de Moivre (1738) e Laplace

    (1812). Assim, a Teoria da Probabilidade conseguiu, lentamente, libertar-se

    da sua inicial dependncia dos jogos de azar, o que leva, por exemplo, Laplace

    a afirmar

    en les appliquant aux questions les plus importantes de la vie, qui

    ne sont en effet, pour la plupart, que des problmes de probabilit.

    [Laplace 1812, Introduction, p. i ]

    No entanto, apesar da crescente progresso de interesse da Teoria da

    Probabilidade, como ser possvel desenvolver esta teoria sem ter os seus

    conceitos bsicos, tais com probabilidade, acaso ou aleatrio, rigorosamente

    definidos? Desta forma, sendo essencial obter-se uma definio clara destas

    (3) Hacking (1975), Stigler (1986), Bernstein (1998) e Hald (2003) fazem uma boa descri-

    o das origens da Teoria da Probabilidade, das suas primeiras obras, no s da sua inicial

    dependncia na anlise de resultados de jogos de azar e do clculo combinatrio, como

    ainda do seu aumento de importncia na Estatstica com a constatao de regularidade

    quando se possui uma grande quantidade de dados.

    (4) Esta Lei foi apresentada pela primeira vez por Jakob (ou Jacob, que foi traduzido

    para Jacques pelos francfonos, para James pelos anglo-saxnicos e para Giacomo pelos

    italianos) Bernoulli (16541705) na quarta parte da sua obra inacabada e pstuma, pu-

    blicada pelo seu sobrinho Nicolau Bernoulli oito anos aps a sua morte, sob o ttulo de

    Ars Conjectandi (A arte de conjecturar). Este resultado foi depois designado por Lei

    dos Grandes Nmeros por Poisson (1837, p. 7), sendo ainda hoje um dos resultados mais

    importantes da Teoria da Probabilidade e da sua ligao Estatstica.

  • 6 Introduo

    noes, ao longo do sculo xix diversas obras debatem quer as possveis

    definies destes conceitos quer os limites de aplicabilidade desta cincia.

    Porm, a obteno de uma definio rigorosa de alguns destes conceitos uma

    tarefa delicada, como podemos deduzir das seguintes palavras de Bertrand

    (18221900).

    Comment oser parler des lois du hasard? Le hasard nest-il pas

    lantithse de toute loi? En repoussant cette dfinition, je nen

    proposerai aucune autre.

    [Bertrand, 1888, p. vi ]

    Assim, neste perodo sentida uma insatisfao geral na definio de pro-

    babilidade baseada na equiprobabilidade, principal definio adoptada desde

    a publicao da obra prima de Laplace (17491827), Thorie Analytique des

    Probabilits em 1812(5). Nesta definio, actualmente denominada clssica

    ou laplaceana, a probabilidade de um dado acontecimento igual ao quo-

    ciente entre o nmero de casos favorveis a esse acontecimento e o nmero

    total de casos possveis, sob a hiptese de os casos serem igualmente provveis

    (equiprobabilidade) e serem em nmero finito. As hipteses, excessivamente

    restritas, subjacentes a esta definio tornam necessria uma nova definio

    de probabilidade, de forma a incluir as situaes em que no existe equi-

    probabilidade dos acontecimentos ou situaes onde o universo no finito,

    quer este seja numervel ou no (contnuo). Todavia, parece haver um certo

    cepticismo na possibilidade de existncia de uma definio mais geral de pro-

    babilidade, bem patente nas seguintes palavras de Poincar (18541912).

    On ne peut gure donner une dfinition satisfaisant de la Proba-

    bilit. On dit ordinairement: la probabilit dun vnement est le

    (5) Ian Hacking (1975) identifica a origem da utilizao da equipossibilidade (ou equi-

    probabilidade) num memorandum intitulado De incerti aestimatione de Leibniz que data

    de 1678.

  • Probabilidade Circa 1914 e a Construo de Pacheco dAmorim 7

    rapport du nombre des cas favorables cet vnement au nombre

    total des cas possibles.

    [Poincar, 1896, pg. 24]

    H ainda a acrescentar, para salientar as dificuldades sentidas nesta pro-

    cura de uma definio mais geral de probabilidade, um descrdito na Teoria

    da Probabilidade devido existncia de inmeros paradoxos, como os apre-

    sentados por Bertrand em 1888. Um dos paradoxos (Bertrand 1888, p. 45),

    actualmente conhecido por paradoxo de Bertrand, consiste em apresentar trs

    possibilidades distintas de resoluo de um problema, qualquer uma delas ri-

    gorosamente coerente e em consonncia com uma abordagem intuitiva, mas

    que fornecem trs valores distintos para a probabilidade pretendida. Outro

    paradoxo apresentado por Bertrand (1988, p. 4) coloca em causa a extenso,

    muitas vezes utilizada, da definio clssica probabilidade contnua, isto

    , utilizando uma medida representativa da sua proporo geomtrica (com-

    primento, rea, volume) e definindo a probabilidade de uma regio (regio

    favorvel) como sendo o quociente entre a sua medida e a medida da regio

    total (universo) sob a hiptese de a probabilidade ser proporcional medida e

    a medida do universo ser finita (interpretao geomtrica de probabilidade).

    Deste modo, a Teoria de Probabilidade , nesta altura, assombrada por

    diversos paradoxos(6) que ilustram a ambiguidade existente em diversas no-

    es bsicas tais como a escolha ao acaso (au hasard), sendo necessria a

    construo de uma teoria que clarifique estes conceitos.

    Apesar desta depreciao na Teoria da Probabilidade, existe uma enorme

    motivao na procura de uma definio mais geral de probabilidade. Um dos

    factores determinantes a crescente importncia da Teoria da Probabilidade

    na Fsica, pois nesta altura que surgem as primeiras ideias que iro dar ori-

    (6) Szkely (1986) explora bem diversos paradoxos na evoluo da Teoria da Probabili-

    dade e da Estatstica.

  • 8 Introduo

    gem, na terceira dcada do sculo xx, Mecnica Quntica e ao paradigma

    da incerteza aplicado ao mundo microscpico. Provavelmente por este motivo

    David Hilbert (18621943), um dos matemtico mais notveis da poca, na

    sua famosa alocuo no Congresso Internacional de Matemtica de Paris de

    1900(7), expe um conjunto de 23 problemas por resolver que deveriam orien-

    tar a investigao em Matemtica durante o sculo xx, consistindo um desses

    problemas, o sexto, na axiomatizao das reas da Fsica onde a Matemtica

    desempenha um papel predominante, figurando o Clculo das Probabilidades

    e a Mecnica como as primeiras da lista. Desta forma, David Hilbert desafia

    a comunidade matemtica a procurar uma fundamentao rigorosa para a

    Teoria da Probabilidade a fim de que esta possa ser tratada de uma forma

    axiomtica, como as outras reas da Matemtica, de modo a ser utilizada

    sem ambiguidade. Plato (1994) refere diversas tentativas frustradas de axio-

    matizao da probabilidade anteriores ao tratado de Kolmogoroff, que surge

    em 1933, onde se apresenta a primeira axiomatizao de probabilidade que

    definitivamente resolve os paradoxos patentes nesta teoria, intitulada Grund-

    begriffe der Wahrscheinlichkeitstheorie e traduzida para ingls em 1950 por

    Foundations of the Theory of Probability. Esta axiomtica baseia-se nas ca-

    ractersticas das funes de conjuntos, nomeadamente na rea actualmente

    denominada por Teoria da Medida, definindo probabilidade como uma me-

    dida em que a probabilidade do universo unitria. Contudo, as bases para

    que a probabilidade fosse tratada como uma medida foram criadas, essencial-

    mente, por mile Borel (18711956), Henri Lebesgue (18751941), Maurice

    Frchet (18781973), Constantin Carathodory (1873-1950), Johann Radon

    (18871956), Otto Nikodym (1889 1974), entre outros, algumas das quais

    so posteriores tese de doutoramento de Diogo Pacheco dAmorim.

    neste panorama, antecedente aos fundamentos de Kolmogoroff e a resul-

    (7) Estes problemas podem ser consultados em Hilbert (1902).

  • Probabilidade Circa 1914 e a Construo de Pacheco dAmorim 9

    tados que permitiram uma maior abstraco na Teoria da Medida, que sur-

    gem os Elementos de Clculo das Probabilidades de Diogo Pacheco dAmorim,

    em 1914, sendo objectivo do autor, conforme enuncia no Prefcio da sua

    obra, responder ao desafio de David Hilbert, isto , fornecer resposta aos pro-

    blemas que na poca assombravam a Teoria da Probabilidade, generalizando

    a definio de probabilidade e clarificando os conceitos bsicos desta Teoria,

    de forma que esta consiga desenvolver-se sem ambiguidade ou paradoxos.

    Assim, Pacheco dAmorim procura dar uma definio mais geral de pro-

    babilidade, assentando a construo da sua teoria na proposio, que con-

    sidera primitiva, de tirar, sorte, um elemento de uma classe finita (ou,

    o correspondente para a probabilidade contnua, lanar, sorte, um ponto

    numa regio limitada), considerando que esta proposio perfeitamente

    clara quando somos ns os agentes da tiragem e desfrutamos de total conhe-

    cimento do espao amostra. Pacheco dAmorim constri toda a teoria sob

    estas hipteses, generalizando na Concluso da sua obra quer para o caso

    em que a tiragem de um elemento (ou lanamento de um ponto) no efec-

    tuada por ns, mas por um ser semelhante a ns ou por um agente de outra

    natureza, quer para a situao em que ns no possumos total informao

    do espao amostra.

    Com base no seu conceito primitivo, Pacheco dAmorim define possibi-

    lidade de uma classe (regio) para posteriormente definir probabilidade de

    uma classe (regio) A em relao a outra classe (regio) A que contm a

    primeira. Desta forma, para Pacheco dAmorim, a probabilidade de uma

    classe (regio) s est definida em relao a outra classe (regio), pelo que a

    definio de probabilidade de Pacheco dAmorim corresponde ao conceito de

    probabilidade condicionada actualmente utilizado, restrito ao caso em que

    A A(8). De facto, com a sua construo, Pacheco dAmorim consegue ge-

    (8) Refira-se que Pacheco dAmorim no o nico que define probabilidade somente na

  • 10 Introduo

    neralizar o conceito de probabilidade para acontecimentos no equiprovveis

    atravs de uma elaborada construo de complexos de classes (regies).

    Um outro aspecto que consideramos notvel na tese de doutoramento de

    Pacheco dAmorim a sua constante tentativa de aproximar Probabilidade

    e Medida, apresentando, no captulo Ponto Imagem, uma admirvel cons-

    truo que nos permite passar de um ponto lanado sorte directamente

    numa regio (distribuio uniforme na regio) para outro que sua imagem.

    Desta forma o autor obtm a funo densidade de uma varivel aleatria,

    ou lei de possibilidade de uma regio, como ele a denomina, que pode ser

    distinta da uniforme sem ser necessrio recorrer aos complexos de regies.

    Assim, parece-nos que Pacheco dAmorim fica prximo de obter a definio

    moderna de varivel aleatria, faltando-lhe o conceito de funo de distri-

    buio, noo que actualmente fundamental para a construo da Teoria

    da Probabilidade. Ainda no mesmo captulo, Pacheco dAmorim apresenta

    uma notvel reconstruo do Teorema de Fubinni (ou Teorema de Fubinni-

    Tonelli), usando a noo de projeco e de condicionamento, permitindo

    abordar o clculo de integrais mltiplos de forma simples, com integrais ite-

    rados.

    Parece-nos que, nesta parte da sua obra, Pacheco dAmorim tem um

    mrito excepcional no trabalho que desenvolve, demonstrando ter a intuio

    de que a Teoria da Medida o caminho correcto para a construo rigorosa da

    Teoria da Probabilidade, antecipando, de certa forma, as ideias notveis de

    Frchet de que probabilidade uma faceta de medida, e que os instrumentos

    para tratar probabilidade e integral so os mesmos.

    Temos que admitir, contudo, que a sua obra , por vezes, pouco clara.

    situao de condicionamento, pois, por exemplo, Keynes (1921), de Finetti (1937), Jeffreys

    (1939) ou Rnyi (1955) tambm o fazem, apesar de a sua fundamentao ser bem distinta

    da apresentada por Pacheco dAmorim em 1914.

  • Probabilidade Circa 1914 e a Construo de Pacheco dAmorim 11

    Uma das razes assenta na notao adoptada, que pouco diversificada,

    sendo utilizado o mesmo smbolo para diversos objectos, como, por exemplo,

    quando o autor utiliza (A), que entre outras coisas pode significar um ele-

    mentos da classe (A), a prpria classe (A), o nmero de elementos da classe

    (A), um ponto de uma regio (A), a prpria regio (A), a medida da regio

    (A). Outra razo que contribui para aumentar a dificuldade de interpretao

    de algumas afirmaes de Pacheco dAmorim a escassa, quase inexistente,

    bibliografia por ele usada. O autor, ao longo de toda a sua obra, limita-se

    a fazer, em notas de rodap, sete referncias a cinco obras: aos clssicos J.

    Bernoulli [Ars Conjectandi ] e Laplace [Essai Philosophique sur les Probabi-

    lits ], e aos seus contemporneos H. Poincar [La Science et lHypothse],

    E. Borel [lments de la Thorie des Probabilits] e Bertrand [Calcul des

    Probabilits ] que pertencem escola francesa de probabilidades. Refira-se

    tambm que, destas sete referncias, uma feita no Prefcio e cinco na

    Concluso da tese, restando apenas uma referncia ao longo do desenvol-

    vimento da sua teoria. Desta forma, torna-se difcil distinguir o que criado

    por Pacheco dAmorim do que reconstrudo com base em outras obras por

    ele consultadas.

    Torna-se, tambm, delicado interpretar algumas afirmaes do autor, de

    entre as quais salientamos, pela estranheza que nos causaram, particular-

    mente trs. A primeira encontra-se numa referncia ao Teorema de Bayes,

    ao afirmar que:

    errnea a deduo que desta frmula se faz nos livros de pro-

    babilidade

    [Pacheco dAmorim, 1914, p. 27]

    quando, por exemplo, Laplace (1774, 1812) parece dominar bem o assunto.

    Refira-se, contudo, que Pacheco dAmorim no o nico insatisfeito com

    as demonstraes deste teorema existentes na poca, pois Bertrand (1888, p.

  • 12 Introduo

    2526) e, alguns anos mais tarde, Keynes (1921, p. 176) tambm mostram um

    certo descontentamento com as fundamentaes normalmente apresentadas

    na poca acerca da frmula de Bayes. Todavia, parece-nos que as dificuldades

    sentidas por Pacheco dAmorim se devem ao facto de a sua definio de

    probabilidade condicionada P (A | B) = P(A)P(B)

    ser restrita ao caso A B,pois, se esta definio fosse estendida para o caso geral, por exemplo atravs

    de P(A | B) = P(A B | B), teria obtido a definio de probabilidadecondicionada actualmente utilizada, o que levaria a uma demonstrao do

    Teorema de Bayes menos penosa.

    A segunda afirmao enigmtica a que nos referimos resulta da distino

    que o autor faz entre esperana matemtica e valor mdio, mencionando em

    nota de rodap:

    Embora esta distino entre esperana matemtica e valor mdio

    no costume vir explicitamente feita nos livro de probabilidades,

    todos os autores do a estes termos a significao que acabamos

    de atribuir-lhes.

    [Pacheco dAmorim, 1914, p. 137]

    Ora, nas obras da poca por ns consultadas, no identificamos, nem

    implicitamente nem explicitamente, esta distino (pelo menos de forma se-

    melhante utilizada por Pacheco dAmorim). H, ainda no captulo dedicado

    esperana matemtica e valor mdio, outra afirmao bastante misteriosa:

    O valor provvel do quadrado da distncia que separa os pontos

    extremos duma curva flexvel, lanada sorte sobre um plano,

    nulo, qualquer que seja o comprimento da curva, logo que seja

    finito.

    [Pacheco dAmorim, 1914, p. 147]

    Se o quadrado da distncia, que naturalmente no assume valores nega-

    tivos, tem valor esperado nulo, ento Pacheco dAmorim est a afirmar que,

  • Probabilidade Circa 1914 e a Construo de Pacheco dAmorim 13

    se lanarmos sorte uma curva flexvel e inextensvel sobre um plano (com

    comprimento finito e fixo) vamos obter quase certamente uma curva fechada.

    No nos parece tal ideia aceitvel.

    O captulo do Lanamento, sorte, de figuras decepcionante,

    no sendo decifrveis as intenes do autor. Com as suas definies de lan-

    amentos de figuras consegue, de facto, obter uma nica resposta para o

    problema (paradoxo) de Bertrand. Contudo, acrescente-se ainda que, ao

    contrrio das trs resolues apresentadas por Bertrand (1888, p. 45), a

    soluo de Pacheco dAmorim no satisfatria, pois nela no existe uma

    correspondncia biunvoca entre o ponto lanado sorte e as cordas, isto , a

    cada ponto no corresponde uma nica corda e vice-versa, enquanto nas trs

    propostas de resoluo de Bertrand esta relao verificada (com excepo

    de, numa das solues, o centro da circunferncia que um conjunto singular,

    de medida nula). Todavia, neste captulo, o autor resolve o problema da agu-

    lha de Buffon utilizando um argumento interessante e porventura inovador,

    que para a discusso da probabilidade no necessrio considerar o plano

    R2, sendo suficiente considerar um paralelograma com uns lados paralelos s

    rectas da folha e os outros paralelos direco achada para a agulha (uti-

    lizando a Proposio IX do Captulo II, pois todos os paralelogramas assim

    definidos possuem a mesma probabilidade e a Definio IV pelo facto de ser

    possvel obter uma regio plana to grande quanto se queira com a unio de

    paralelogramas assim definidos).

    H, tambm, a salientar, pela negativa, alguns erros incompreensveis.

    Referimo-nos, por exemplo, s frmulas inversas do Teorema de Bayes

    aquando da anlise das classes finitas (p. 27 e 28), onde atravs de Pi

    =

    ip

    i

    kp

    k

    deduz (correctamente) a frmula de i

    =P

    i

    pi

    ( Pk

    pk

    )1e induz (er-

    radamente), justificando-se pela simetria da primeira frmula em relao a

    ie a p

    i, que p

    i=

    Pi

    i

    ( Pk

    k

    )1, esquecendo-se que na deduo da primeira

  • 14 Introduo

    utiliza o facto de

    i= 1 que, obviamente, no pode utilizar na segunda,

    poisp

    i6= 1 (provavelmente uma das razes deste erro a sua notao no

    ser clara, no especificando que pidepende quer das causas quer dos efeitos,

    pois trata-se de uma probabilidade condicionada).

    Em relao ao tratamento dos teoremas limite (resultados assimptticos),

    onde dada maior importncia Lei dos Grandes Nmeros que ao Teorema

    Limite Central, consideramos que Pacheco dAmorim vacila entre os dois ex-

    tremos qualitativos opostos. Por um lado, a sua anlise decepcionante pelo

    facto de ser restrita a uma linha clssica de aproximar probabilidades (em

    provas de Bernoulli com probabilidade fixa p) atravs da regra de Stirling,

    no se ocupando do contexto mais geral de considerar uma sucesso de vari-

    veis aleatrias convergentes para uma varivel aleatria gaussiana, problema

    deveras mais delicado, cuja anlise exige outro tipo de ferramentas mais so-

    fisticadas, como as transformadas de Laplace. Desta forma, parece-nos que o

    autor desconhece os resultados obtidos pela escola russa, como, por exemplo,

    as demonstraes de Markoff (1913) dos resultados obtidos por Lyapounov

    em 1901. Contudo, mesmo tendo em considerao o alheamento do autor em

    relao a estes resultados seus contemporneos, Pacheco dAmorim poderia

    ter tentado ir mais longe, pois j Laplace (1812) e Poisson (1837) analisam

    esta situao, apesar de no fornecerem demonstraes rigorosas, e este te-

    orema assume um papel preponderante na Teoria da Probabilidade, razo

    pela qual Plya (1920) o denominou por Teorema Limite Central. Por outro

    lado, existe uma originalidade na justificao de que a convergncia para a

    distribuio gaussiana (lei dos desvios) s se verifica se a ordem do nmero

    de provas relativas ao afastamento a segunda, justificando este resultado

    pela demonstrao de que, considerando um valor qualquer positivo e o

    nmero de sucessos a mais relativamente ao nmero de sucessos esperado, a

    probabilidade de > mn

    n+1 para n > 1 converge para zero e a probabilidade

  • Probabilidade Circa 1914 e a Construo de Pacheco dAmorim 15

    de < m1n quando n > 2 tambm converge para zero(9).

    Apesar dos erros contidos na sua obra e de algumas afirmaes obscu-

    ras, as ideias apresentadas por Pacheco dAmorim, quer a sua abordagem

    filosfica na construo da probabilidade e na sua aplicao, quer na apro-

    ximao constante entre o tratamento integral e probabilidade, quer a sua

    demonstrao do Teorema Limite Central, so de uma originalidade e de uma

    riqueza invulgar, razo pela qual consideramos urgente uma anlise cuidada

    desta obra. Vamos, ento, apresentar uma anlise detalhada dos principais

    assuntos dissecados por Pacheco dAmorim na sua tese de doutoramento inti-

    tulada Elementos do Clculo das Probabilidades. Desta forma, comearemos

    por expor, na segunda parte deste trabalho, a traduo para Ingls da tese

    de doutoramento de Pacheco dAmorim efectuada em colaborao com o

    Professor Doutor Dinis Pestana e a Professora Doutora Sandra Mendona.

    Na Terceira parte, que intitulamos A construo de Diogo Pacheco

    dAmorim, comentaremos os Elementos do Clculo das Probabilidades ca-

    ptulo a captulo, isto , vamos expor a construo de Pacheco dAmorim tal

    e qual como o autor a concebeu, ilustrando a sua validade e as suas limita-

    es e comparando os seus resultados com os patentes nas principais obras

    internacionais disponveis na poca (onde nos centramos na escola francesa

    pelo facto desta constituir a principal fonte bibliogrfica do autor). Fina-

    lizaremos este trabalho com uma apreciao geral tese de doutoramento

    de Pacheco dAmorim onde apresentaremos, com o objectivo de salientar a

    riqueza da proposta de Pacheco dAmorim, outras construes posteriores

    sua obra, tais como as axiomticas de Kolmogoroff e de Rnyi, fundamenta-

    (9) Na verdade, no encontramos este tratamento em mais nenhuma obra na poca e

    Manuel dos Reis (1929) atribui, na sua tese de Doutoramento, a primazia destes resultados

    a Pacheco dAmorim (apesar de considerar que estes poderiam ser obtidos como corolrios

    do Teorema de Moivre-Laplace, como ilustraremos no captulo 7).

  • 16 Introduo

    das na Teoria da Medida, a viso frequencista de Richard von Mises, baseada

    em colectivos, e a interpretao bayesiana personalista de Bruno de Finetti,

    fundada na permutabilidade.

  • Parte II

    Traduo

    17

  • Elements of Probability Calculus 19

    Traduo

    Esta parte tem como finalidade apresentar a traduo, para Ingls, da

    tese de doutoramento de Pacheco dAmorim que foi efectuada em colabora-

    o com o Professor Doutor Dinis Pestana e a Professora Doutora Sandra

    Mendona, estando disponvel on-line(10) com um formato diferente. Na ver-

    so disponvel na Internet houve o cuidado de paginar de acordo com a obra

    original, correspondendo cada pgina da traduo pgina com igual nume-

    rao do original, pelo que o ficheiro disponvel contm, lado a lado, o fac

    simile da obra e a respectiva verso em ingls. Na traduo que de seguida

    apresentamos o aspecto foi alterado com o objectivo de melhorar a apre-

    sentao e esta no se tornar demasiado longa, mas mantendo o contedo.

    Saliente-se que, nesta traduo, o principal objectivo foi obter um texto que

    espelhasse as ideias concebidas por Diogo Pacheco dAmorim. Neste sentido,

    da parte dos tradutores, houve a tentativa de apresentar, com o maior rigor,

    a fundamentao de Pacheco dAmorim, tentando no proceder a qualquer

    interpretao ou aperfeioamento, por maior que fosse a inclinao natural

    para faz-lo. Todavia, com o objectivo de tornar mais clara a sua leitura, si-

    tuaes houve onde sentimos a necessidade de alterar ligeiramente a notao

    e, em alguns casos, efectuar algumas correces (que assinalmos em forma

    de nota de rodap).

    Deste modo expomos, de seguida, a traduo dos Elementos de Clculo

    das Probabilidades de Diogo Pacheco dAmorim.

    (10) Consultar, por exemplo, em

    www.estg.ipleiria.pt/rsantos/Elements_of_Probability_Calculus.pdf.

  • 20 Elements of Probability Calculus

  • Captulo 2

    Elements of Probability Calculus

    Preface

    This volume, for which the title An Essay Towards Rationalizing Proba-

    bility Calculus would perhaps be more appropriate, gives an outstanding

    role to a concept that, until now, never got the relevance it deserves the

    concept of extracting, at random, an element from a set or of throwing, at

    random, a point in a region.

    Henri Poincar(1) goes as far as saying that such a statement has, by

    itself, no meaning. But the truth is that this proposition has a very clear

    and precise meaning for the agent of the random extraction or of the random

    throw, and this allows us to construct the theory of probability with clarity

    and rigor. Starting from this primitive concept, the theory of probability

    can be reduced to a systematic sequence of propositions and definitions, as

    any other branch of pure mathematics. In this approach, discontinuous and

    continuous probability are identical in all aspects, and paradoxes have no

    place in the ensuing theory.

    (1) H. POINCAR, La Science et lHypothse, p. 226.

    21

  • 22 Elements of Probability Calculus

    Once the theory of probability of random extractions and of random th-

    rows done by ourselves has been built, its extension to phenomena whose

    outcomes are similar to extractions or throws performed by agents similar to

    us is rather easy, in case the extractions are done under some rigid circums-

    tances.

    The theory thus constructed can be applied to the study of natural pheno-

    mena, insofar as we reject, a priori, the determinist hypothesis, that, in fact,

    is incompatible with probability theory; under this proviso, the application

    is easily done.

    The perspective we have adopted led us to change the form and the

    essence of Probability. We had to generalize the definition of probability, a

    generalization needed to prove Bayes formula, and absolutely unavoidable in

    the study of continuous probability, as we can see in problem 3, page 48.

    We had to distinguish the probability of one point from the probability of

    another point which is the image of the first one, and from this the concept

    of probability law emerged, etc.

    The order of presentation couldnt, therefore, conform to the classical

    one.

    In this book, continuous probability is presented in parallel with dis-

    continuous probability, and with the development it deserves. Bernoullis

    theorems are a natural follow up, since they can be applied to both disconti-

    nuous and continuous probability. After Bernoullis 3rd theorem, we present

    some variants and extensions, necessary to establish the error law with the

    rigorous demonstration its usual presentation lacks. We next develop the

    theory of Mathematical Expectation, since the importance of this concept is

    more evident with the application of Bernoullis 3rd theorem than with the

    definition of mathematical expectation itself. Finally, we broaden the scope

  • Introduction 23

    of applications of Probability, dealing with phenomena of which we are not

    the agents. We also postpone until the end a classification of the phenomena

    that are the object of this science, since we believe that the classification

    is clear and rational after a deep understanding of how Probability deals

    with the standard phenomenon, discussed in the Introduction, and develo-

    ped in the core of this thesis. I had in mind to finish with a justification

    of our concept of probability, and to add an Appendix developing the study

    of probability in denumerable sets; but the unusual extension of the present

    dissertation persuaded me to postpone the publication of these matters.

    Introduction

    The aim of Probability Calculus, as of any other science, is to find associations

    relating known facts to other facts that, although being unknown, can be

    related to the former ones.

    We begin by an example, illustrative of what we consider our [degree of]

    knowledge of the facts.

    Suppose that one urn contains balls, identical in all aspects save, eventu-

    ally, in their color.

    There are three possible situations:

    1. we do not know the colors of the balls in the urn, and therefore we do

    not know the percentage of each color, as well;

    2. we know the colors of the balls [for instance, there are white balls and

    there are black balls], but we ignore the percentage of the balls of each

    color;

    3. we know the colors, and the percentage of balls of each color in the urn.

  • 24 Elements of Probability Calculus

    A ball will be randomly extracted from the urn, and we have to bet on

    the color of the ball.

    What bet should we choose?

    In the first case, the question doesnt make sense. As we do not know

    anything about the colors present in the urn, there is no reason whatsoever

    to prefer any color to bet in.

    In the second case, our ignorance has been moderated, since we know

    that the ball that will be extracted can be either white or black.

    But as we still ignore the percentage of balls of each color, there are no

    grounds to decide which bet to take.

    On the other hand, in the third case, assuming for instance that we know

    that 90% of the balls are white, we would surely decide to bet that a random

    extraction would produce white ball.

    Obviously, we do not know for sure the color of the ball that will be

    extracted, it can be black or white, but we do not hesitate in choosing white

    as the sensible bet.

    This distinguishes the third case from the former ones. It can serve as an

    example on how to take rational decisions with incomplete information.

    For this reason we shall say that the third case describes a known urn.

    The third case deals with random extractions from one urn whose com-

    position is qualitatively and quantitatively known.

    We shall assume that any phenomenon whose outcomes can be identified

    with random extractions of balls from one urn of qualitatively and quan-

    titatively known composition is explained once that identification has been

    made. More generally, we consider explained any phenomenon which can be

    identified with a random selection of elements in a finite set, qualitatively

  • Introduction 25

    and quantitatively known.

    As we have seen, we have distinguished the third case as known, because

    it can serve as a standard model on how to take decisions under uncertainty,

    i.e., under circumstances that we synthesized in the form of taking a bet.

    Let us analyze in more detail the reasons that led us, in that example, to

    bet in white color.

    The first reason was, indeed, the fact that we knew that more white

    balls than black balls existed in the urn, or, as stated in the example, the

    percentage of white balls was larger than the percentage of black balls.

    The second one was the knowledge that the extraction was performed at

    random.

    If one of these assumptions is withdrawn, there is no rationale for choosing

    to bet white ball.

    The reason why the first condition is an argument in favor of betting in

    white ball comes from Arithmetic; the explanation why the second condition

    is needed can be found only in the emerging science of Probability.

    In that science we will therefore take the statement

    to extract an element, at random, from a finite set

    as a primitive concept in this branch of Mathematics.

    We shall build Probability Calculus starting from this primitive concept.

    It is worth observing that we didnt choose the concept randomness or

    uncertainty as the primitive concept upon which the theory of Probability

    would be constructed, since these concepts are vague, and as such inadequate

    to serve as the foundation for any science; our choice has been quite different,

    the concept of extracting an element, at random, from a finite set.

  • 26 Elements of Probability Calculus

    Some could accuse us of using a foundation as vague as the concept of

    randomness, since this concept is used in our primitive statement.

    However, in the statement we choose as primitive, it is immaterial whether

    the formulation at random is or isnt vague, insofar as the proposition using

    it can be understood and expresses an idea that can guide our choices and

    decisions under precise circumstances.

    Whatever we say about this proposition is irrelevant either from the

    mathematical viewpoint or in the perspective of applications.

    The same could be said about the concepts of space in Geometry, or of

    time in Mechanics.

    The discussion of these concepts is irrelevant in Mathematics, they are

    from the scope of Philosophy. Mathematics would be the same theoretical

    construct if these concepts didnt exist. The knowledge of what we consider

    Geometry and Mechanics would be latent in the symbolism of Mathematical

    Analysis, and no more, but this knowledge would still be valid, although less

    visible.

    The usefulness of the concepts space and time can be compared to the

    usefulness of coloring reagents in Chemistry: they enhance the visibility of

    the phenomena, but these exist independently of being or not being enhanced

    by the coloring reagent.

    An important question must be raised at once: how can we distinguish

    between random and non-random extractions?

    It is obvious that there are extractions that are non-random, and therefore

    we need a criterion to distinguish random from non-random extractions.

    To construct such criterion, we shall assume that any individual knows

    whether an extraction has been made at random if the extraction has been

    made by him.

  • Introduction 27

    Under this assumption, we shall build up a theory of probability, which is

    a subjective science, as all pure science is. This theory will allow us to cons-

    truct a criterion to distinguish between random and non-random extractions,

    when we are not, ourselves, the agent performing the extraction.

    This area of Probability Calculus is at the onset of applications.

    The usefulness of science is its general ability to forecast events with an

    approximation considered good enough in practical applications.

    This pragmatism seems unfeasible in Probability Calculus.

    In effect, how could we predict the color of the ball that will be extracted

    from one urn containing two white balls and one black ball?

    It is obvious that Probability Calculus is unable to make an useful pre-

    diction, in this situation.

    If instead of two white balls and one black ball, the urn composition was

    one thousand white balls and one black ball, prediction of the outcome of

    a random extraction would still be impossible, but to our intuition it would

    seem more plausible to forecast that a white ball would be extracted.

    The practical usefulness of Probability Calculus lies in this evaluation of

    the degree of probability of a future event, and in the ensuing confidence

    that our intuition attaches to the plausibility of events whose probability

    approximates certitude.

    Confidence based in probability will, in its essence, be different from cer-

    titude, no matter how nearly the percentage of white balls in the urn appro-

    ximates 1. But this doesnt deface the real practical usefulness of Probability

    in decision making under incomplete or unreliable information.

    What we have said about random extractions of elements from a finite

    set can also be said about randomly throwing points in a bounded region of

    space, in any number of dimensions.

  • 28 Elements of Probability Calculus

    2.1 CHAPTER I Finite sets

    We shall denote A, B, . . . sets with a [finite] number of elements.

    The symbol A B will denote the set of ordered pairs (a, b), obtainedfrom the sets A and B, by associating each a A with each b B.

    The symbol #A denotes the cardinal of the set A.

    With these notations, it is obvious that

    #AB = #A #B.

    Each ordered pair (a, b) AB is said to be compound of a and b.

    The set A B is compound from the sets A and B. A set composed ofcompound elements (a, b) is not, necessarily, a compound set.

    Primitive concept

    a)

    We consider the statement to extract, at random [or to select], an element

    from the set A as having a self evident meaning, and henceforth needing no

    further explanation; in other words, to select, at random, an element from a

    finite set is considered a primitive concept.

    b)

    The statement a is a randomly chosen element from the set A has the

    same meaning; b) is better suited to the formal symbolism of mathematical

    logic, while a) is more appropriate for the natural language.

    From the above assertions, the propositions randomly extracting a card

    from a card deck, randomly throwing a die (randomly selecting of one die

  • CHAPTER I Finite sets 29

    face), randomly extracting a ball from an urn, etc., do not need further

    explanation.

    DEFINITION 1

    Randomly extracting an element from A, or B, or C, . . . , is the same as

    randomly taking an element from A B C , the set having all theelements from the sets A, B, C, . . .

    DEFINITION 2

    a)

    Randomly extracting an element from A and, [independently,] another

    from B is, by definition, the same as randomly extracting an element from

    AB.

    b)

    Randomly extracting an element from A, another from B and another

    from C, [the extractions being mutually independent] is, by definition, the

    same as randomly extracting an element from A B and another from C,etc.

    According to this definition, randomly choosing a suit and then randomly

    choosing a number(2), [independently,] is the same as randomly choosing a

    card from the card deck.

    (2) In this context the numbers are 1 or ace, 2, 3, 4, 5, 6, 7, 8, 9, 10, knave, queen, king,

    i.e. the card value, whichever the suit.

  • 30 Elements of Probability Calculus

    DEFINITION 3

    a)

    Let us associate to each a A a set Ba, and denote {a} B

    athe set of

    ordered pairs {(a, b) : b Ba}.

    Randomly extracting an element from A and another element from the

    corresponding set Ba

    is, by definition, the same as randomly extracting an

    element (a, b) from ABa.

    b)

    If to each b Ba

    we associate a set Cb, randomly extracting an element

    from A, another element from the corresponding set Ba

    and another element

    from the corresponding set Cb

    is, by definition, the same as randomly extrac-

    ting an element (a, b, c) from ABa C

    b.

    Possibility

    1 Possible elements

    According to the above definitions, random extractions have a meaning

    either in a single set (primitive concept, definitions 1 and 2) or in a complex

    of sets [definition 3, a) and b)].

    All depends on the extracting system, and on the sets from where the

    extractions are performed.

    When the extractions are performed from a single set, or performed in

    such a way that they are equivalent to extractions from a single set (primitive

    concept, definitions 1 and 2), we say that all the elements from that set are

    possible.

  • CHAPTER I Finite sets 31

    When the extractions are sequentially performed from a complex of sets,

    as explained in definition 3 a), we say that the possible elements are those in

    A ;

    B =

    aA{a} B

    a.

    On the other hand, in what concerns definition 3 b), the possible ele-

    ments are those that can be sequentially extracted randomly choosing a A,and then randomly choosing one element b B

    a, and next randomly

    choosing an element c Cb, i.e., the elements from the complex of sets

    A ;

    B ;

    C =

    {(a, b, c)

    (a,b)A ;

    B

    {(a, b)} Cb

    }, etc.

    2 Possible sets

    The total possible set A [resp. B, AB, A ; B, etc.] is the set with allpossible elements.

    Any A A is a possible set, i.e. is a set whose elements are possible.

    DEFINITION 4

    The possibility of a randomly chosen element a A (or in any of itspossible subsets), or unit possibility, is

    a

    =1

    #A.

    Thus, all elements randomly chosen in the same set (or randomly chosen

    using an extracting system which is equivalent to random extraction from

    the same set) are equally possible.

    Proposition I

    The possibility of a compound element (a, b) A B is the product ofthe possibilities of its components.

  • 32 Elements of Probability Calculus

    This is an obvious consequence of #AB = #A #B:

    1

    #AB =1

    #A 1

    #B,

    and thus

    (a,b)

    = a

    b.

    DEFINITION 5

    The possibility A

    of a possible set A is the sum of the possibilities of

    its elements,

    A

    =

    aA

    a.

    Proposition II

    If A is a possible set which may be partitioned into pairwise disjoint sets

    A = A1 A

    2 A

    n

    then

    A

    = A

    1

    +A

    2

    + +A

    n

    .

    This is an immediate consequence of Definition 5.

    Proposition III

    The possibility of the total possible set is 1.

  • CHAPTER I Finite sets 33

    a)

    If all the possible elements result from random extractions performed in the

    same set A, the proposition is obvious, since

    A

    =

    aA

    1

    #A=

    #A

    #A= 1.

    b)

    Let us consider now sequential extractions from a complex of sets. Without

    loss of generality, consider the extraction system in definition 3 a).

    Let A = {a1 , a2 , . . . , an}, and denote Bak, k = 1, 2, . . . , n the set associ-

    ated with each element ak A. From Proposition I, the possibility of any

    element resulting from pairing ak

    with bj B

    ak

    is

    (a

    k,b

    j)=

    1

    #A #Ba

    k

    ,

    and therefore the possibility of the set akB

    ak

    is

    bjBa

    k

    (a

    k,b

    j)=

    1

    #A

    bjBa

    k

    1

    #Ba

    k

    =1

    #A.

    Thus, in view of Proposition II, the possibility of the total possible set is

    aA

    1

    #A= 1.

    The above proof is easily extended for any complex extracting system.

    Proposition IV

    If the set AB is compound from the sets A and B, then

    AB

    = A

    B,

    since the possibility of each element (a, b) is the product of the possibility of

    an element of A by the possibility of an element of B.

  • 34 Elements of Probability Calculus

    Probability

    DEFINITION 6

    Let A be a possible set and A A another possible set(3). We shall callprobability of A relative to A the number

    PA

    (A) =

    A

    A

    ,

    A

    andA

    denoting, as above, the possibilities of A and of A, respectively.

    In the above context, the set A is said to be the favorable set, and AA

    is said to be the unfavorable or contrary set.

    Sometimes we shall use the word case meaning element.

    If the elements in A are equally possible, it follows that

    A

    = #A a,

    A= #A

    a

    and therefore

    PA

    (A) =#A

    #A.

    In other words: When the elements in the possible set are equally possible,

    the probability is the number of favorable cases divided by the number of

    possible cases.

    When the possible set A is the total possible set A, from

    A

    = 1

    it follows that

    PA(A) =

    A(4).

    (3) We shall use, as a rule, A A A.

    (4) The most general definition of probability that can be found in Laplace is coincident

    with this particular case, of the reference set being the total possibility set A, with A

    = 1.

  • CHAPTER I Finite sets 35

    If the favorable set A is the possible class A,

    PA

    (A) = 1

    and in this case probability is certitude.

    If the favorable set is empty, A = ,

    = 0

    and therefore

    PA

    () = 0.

    In this case, probability is renamed impossibility.

    Therefore, probability takes values between 0 and 1.

    Postulate

    Let S and S be two extracting systems, originating qualitatively equal

    elements. We say that those two systems are equivalent if qualitatively equal

    sets have the same probability under S and S .

    The term equivalent in the above postulate means that similar extractions

    performed under S and under S imply similar decisions.

    This postulate reduces all extracting systems to extractions from a single

    set.

    Proposition V

    Total probability

    If the possible set A is partitioned pairwise disjoint partial sets A1, A

    2,

    . . . , An,

    A = A1 A

    2 A

    n,

  • 36 Elements of Probability Calculus

    we have (Prop. II)

    A

    = A

    1

    +A

    2

    + +A

    n

    and henceforth

    PA

    (A) = PA

    (A

    1

    )+ P

    A

    (A

    2

    )+ + P

    A

    (A

    n

    )

    i.e., the probability of the union of pairwise disjoint sets is the sum of the

    probabilities of the partial sets.

    Proposition VI

    Compound probability

    a)

    If A B is a possible set compound from A and B, and A B is apossible subset of A B, we have (Prop. IV)

    AB

    = A

    B

    and

    AB

    = A

    B

    and therefore

    PAB

    (A B) = PA

    (A) PB

    (B).

    In case the sets A and B are independent, this proposition may be stated

    as: the probability of a compound set is the product of the probabilities of its

    components.

  • CHAPTER I Finite sets 37

    b)

    Proposition VI has been proved under the hypothesis that both the favo-

    rable and the possible sets are compound. It can, however, be generalized in

    the following ways:

    1st

    If A B = AB is the total possible class, and thus

    AB

    = 1

    we have

    A

    = B

    = AB

    = 1

    and from this it follows that

    PAB

    (A B) = PA

    (A) PB

    (B).

    2nd

    If

    AB

    = A,

    i.e., if the possible set is obtained from the total possible set by excluding

    some elements a A together with all the elements from the correspondingsets B

    a, from the fact that

    B

    = 1

    it follows that

    PAB

    (A B) = PA

    (A) PB

    (B).

  • 38 Elements of Probability Calculus

    Proposition VII

    Let A A A be possible sets. As

    A

    A

    =

    A

    A

    A

    A

    it follows that

    PA(A) = P

    A(A) P

    A(A). (1.1)

    Corollary

    From (1.1) it follows that

    PA

    (A) =P

    A(A)

    PA(A)

    Proposition VIII

    On the probability of causes

    When the random extractions are performed as described in Definition 3,

    the set A is the set of causes, and the sets B =

    aAB

    ais the set of effects.

    The problem of the probability of possible causes may be typified as

    follows:

    Let us consider a set of N urns, n1 of which have a fraction p1 of white

    balls, n2 of which have a fraction p2 of white balls, etc.

    Randomly choose one among the N urns, and from that urn randomly ex-

    tract a ball; lets investigate the consequences of assuming that the extracted

    ball is white.

    What is the probability that this ball has been extracted from an urn

    with percentage piof white balls?

  • CHAPTER I Finite sets 39

    The solution may be constructed as follows:

    Under the hypothesis that the extracted ball is white, the elements of the

    possible set A are all the compound elements of the form

    (any urn, white ball).

    Denoting A

    the possibility of this set, from Prop. II and IV we get that

    A

    =n1N

    p1 +n2N

    p2 +

    or, denoting

    nk

    N=

    k,

    A

    =

    kp

    k.

    The elements of the favorable set A are all the compound elements of the

    form

    (urn with pi 100% white balls, white ball);

    and therefore (Prop. IV)

    A

    = ip

    i.

    Thus (Def. 6)

    PA(A) =

    ip

    i

    kp

    k

    , (1.2)

    an expression known as Bayes formula.

    In the above expression, i

    is the probability of extracting, among the

    N urns, one with percentage pi

    of white balls, and it is known as a priori

    probability of the urns with pi 100% white balls.

  • 40 Elements of Probability Calculus

    The probability (1.2), Pi

    = PA(A) =

    ip

    i

    kp

    k

    , is the probability of ex-

    tracting, among the N urns, one with percentage pi

    of white balls, after

    performing the first extraction, resulting in white ball; for that reason, it is

    known as a posteriori probability of the urns with pi 100% white balls.

    It is obvious that the causes we are investigating may arise in any random

    extraction system, and that we cannot limit ourselves with extractions in a

    single set.

    We now generalize formula (1.2) for sequential extractions from a complex

    of sets:

    Denote

    1 , 2 , . . . , n

    the a priori probabilities of the n causes which may originate the extraction

    of white ball, and denote

    p1 , p2 , . . . , pn

    the probabilities that each of these causes confers to the event extraction of

    white ball.

    Let us denote A the set that we obtain by associating each of the causes

    with each of the balls whose extraction it can originate. On the other hand,

    let us denote A the set that we obtain by associating each of the causes with

    each of the white balls whose extraction it can originate. And let us denote

    Ak, k = 1, 2, . . . , n the set that we obtain by associating each k-th cause with

    each of the white balls whose extraction each of these causes can originate.

    From Prop. VI, b), 1st, we know that

    PA(A

    i) =

    ip

    i; (1.3)

    on the other hand (Prop. VII)

    PA(A

    i) = P

    A(A)P

    A(A

    i) (1.4)

  • CHAPTER I Finite sets 41

    and (Prop. V)

    PA(A) =

    n

    k=1

    kp

    k

    since

    A =n

    k=1

    Ak.

    Thus

    PA

    (Ai) =

    ip

    i

    n

    k=1

    kp

    k

    .

    The above proof clearly shows that the usual argumentation that appears

    in other probability books is erroneous. In fact, when the urns do not have

    the same number of balls, the usual demonstration uses the formulas (1.3)

    and (1.4), justifying their use with the compound probability principle. But

    Proposition VI cannot be reduced to Proposition VII, since Prop. VII cannot

    be applied to compound elements.

    This error was not evident due to lack of clarification of the meaning of

    compound event [and of complex event].

    In fact, without this error it would have been impossible to establish

    Bayes formula with the definition of probability adopted is those books, since

    Bayes formula refers to a situation unforeseen in their definition: unequal

    probability of elementary events in a possible set which is a proper subset of

    the total probability set.

    Proposition IX

    Inverse formulas to Bayes formula

    Denoting the a posteriori probability of the i-th cause Pi, we have esta-

    blished that

    Pi=

    ip

    i

    kp

    k

    . (1.5)

  • 42 Elements of Probability Calculus

    This formula is symmetrical in what concerns the use of the k

    and of pk,

    which are given(5).

    Let us now assume that the pk

    and of Pk

    are given, and that our aim is

    to compute the a priori probabilities i. We now prove that

    i=

    Pi

    pi P

    k

    pk

    .

    In fact, from (1.5) we get that

    Pi

    pi

    =

    i

    kp

    k

    ;

    therefore,

    Pi

    pi

    =

    i

    kp

    k

    =1

    kp

    k

    and thus i=

    Pi

    pi P

    k

    pk

    .

    Due to the symmetry of (1.5), we also have the inversion formula

    pi=

    Pi

    i P

    k

    k

    . (6)

    (5) Editors note: this is not true:

    i= 1, but

    p

    ican be different from 1. For

    instance, in the classical Laplaces urn problemp

    i=

    Nk=0

    kN

    = N+12 .

    (6) Editors note: this is not true, unlessp

    i= 1. The usefulness of the correct

    expressionp

    ip

    k

    =

    Pi

    i P

    k

    k

    seems rather limited. On the other hand, i=

    Pi

    pi P

    kp

    k

    is true.

  • CHAPTER I Finite sets 43

    Proposition X

    Let us now solve the problem that follows, where we assume the conditions

    stated for the problem of the probability of causes.

    From a randomly chosen urn, extract one ball; this ball is white, and

    after observation it is returned to the urn. What is the probability that a

    second extraction from this urn will result in white ball?

    1st solution

    We shall solve this problem directly using the definition of probability.

    The possible set is the set of all compound events of the form

    (any urn, white ball, any ball)

    and therefore

    A

    =

    kp

    k 1 =

    kp

    k.

    The favorable set is the set of all compound events of the form

    (any urn, white ball, white ball)

    and thus

    A

    =

    kp

    kp

    k=

    kp

    2

    k.

    From the above, we get

    PA(A) =

    kp

    2

    k

    kp

    k

    .

  • 44 Elements of Probability Calculus

    2nd solution

    We may alternatively solve the problem in the following way: the effect of

    the observation of white ball in the first extraction is to change the a priori

    probabilities k

    by the a posteriori probabilities Pk

    formerly computed. This

    problem is therefore equivalent to the following one:

    If n causes with probabilities

    P1 , P2 , . . . , Pn

    may result in a given effect with probabilities

    p1 , p2 , . . . , pn ,

    respectively, what is the probability of that effect?

    The desired probability is (Prop. V)

    P =

    Pkp

    k=

    kp

    2

    k

    kp

    k

    .

    More generally:

    If we perform m + n extractions from a randomly chosen urn (returning

    each extracted ball to the urn after observation, before proceeding to the

    next extraction), resulting in m white balls and n black balls, the probability

    of getting white ball in the (m+ n+ 1)-th extraction is

    P =

    kp

    m+1

    kq

    n

    k

    kp

    m

    kq

    n

    k

    . [q = 1 p]

    This result may be established by any of the two methods used in solving

    the former problem, which was the particular case of two extractions.

  • CHAPTER I Finite sets 45

    Corollary

    If the urns have the same a priori probability, i.e., if

    k

    = constant

    then

    P =

    p

    m+1

    kq

    n

    k

    p

    m

    kq

    n

    k

    .

    Problem

    One urn contains N balls, either white or black, in unknown proporti-

    ons. Assuming that all the possible proportions(0, 1

    N, . . . , 1

    )of white balls

    are equiprobable, what is the probability of extracting white ball in the

    (m+ n+ 1)-th extraction, if we know that the previous m + n extractions

    resulted m times in white ball and n times in black ball?

    The above problem is equivalent to the following one:

    There are N + 1 urns, one of them with N black balls, another one with

    1 white and N 1 black balls, another one with 2 white and N 2 blackballs, etc., until the last urn, containing N white balls.

    Performing m + n extractions of one ball from a randomly chosen urn

    (always returning the extracted ball to the urn before proceeding to the

    next extraction), white ball is observed in m occasions, and black ball in n

    occasions. What is the probability of extracting white ball in the (m+n+1)-

    th extraction?

    The solution is given in the corollary above, where we may use

    pk

    =k

    Nand q

    k=N kN

    ,

  • 46 Elements of Probability Calculus

    obtaining

    P =

    N

    k=0

    (k

    N

    )m+1 (N kN

    )n

    N

    k=0

    (k

    N

    )m (N kN

    )n ,

    which may be approximated by

    P

    N

    0

    ( N

    )m+1 (N N

    )nd

    N

    0

    ( N

    )m (N N

    )nd

    .

    Using the substitution

    = N x,

    P

    1

    0

    xm+1

    (1 x)n dx

    1

    0

    xm

    (1 x)n dx

    .

    As1

    0

    xm

    (1 x)n dx = (m+ 1) (n+ 1)(m+ n+ 2)

    and, for natural n,

    (n) = (n 1)!

    it follows that

    P (m+ 2) (n+ 1)(m+ n+ 3)

    (m+ n+ 2)

    (m+ 1) (n+ 1)

    or

    P m+ 1m+ n+ 2

    ,

    where the closeness of the approximation improves with the increase of N .

  • CHAPTER II Continuous Probability 47

    2.2 CHAPTER II Continuous Probability

    If A, B, . . . denote bounded regions in a space with any number of dimensi-

    ons, A B denotes the region with all the points from A, B, . . .

    If A, B, . . . denote regions whatever, AB will denote the set of orderedpairs (a, b), obtained from the sets A and B, by associating each point a Awith each point b B.

    In the above definitions the use of geometric terminology is merely me-

    taphoric, the word point meaning no more than any n-uple of numbers.

    It has been proved in Pangeometry that if A and B are regions and

    (A), (B) the corresponding measures, then

    (AB) = (A) (B);

    more precisely, Pangeometry has generalized the concept of measure in hyper-

    space in such a way that the relation

    (AB) = (A) (B);

    is valid.

    We shall say that A B is a compound region from A and B, and itspoints (a, b) are referred to as compound points of a and b, similarly to the

    conventions we have adopted in the former chapter, dealing with discontinu-

    ous probability.

    Primitive concept

    a)

    As in the case of probability of finite discontinuous sets, we consider as

    primitive the concept of throwing [or selecting, or choosing, or extracting]

    a point, at random, in the bounded region A in any number of dimensions.

  • 48 Elements of Probability Calculus

    b)

    The statement X is a point thrown, at random, in A has the same mea-

    ning as a), b) being better suited to the formal symbolism of mathematical

    logic.

    DEFINITION 1

    Randomly extracting one point from A, or B, or C, . . . , is the same as

    randomly choosing one point in the region A B C

    DEFINITION 2

    a)

    Randomly throwing one point from A and another[, independently,] from

    B is, by definition, the same as randomly throwing one point from AB.

    b)

    Randomly throwing one point from A, another from B and another from

    C is, by definition, the same as randomly throwing one point from AB andanother from C, [independently,] etc.

    Thus, randomly choosing one point X in the segment ab and one point

    Y in the segment ac is the same as randomly choosing one point Z in the

    parallelogram [abcd] (Fig. 1).

    Randomly choosing one point in one arc and one point in a non coplanar

    line segment is the same as randomly choosing a point in the cylindrical

    surface generated by them, etc.

  • CHAPTER II Continuous Probability 49

    a b

    c d

    X

    Y Z

    Figura 2.1: Figure 1

    DEFINITION 3

    a)

    We now consider the case of constrained random selection, made in regi-

    ons subject to some sort of mutual dependence.

    Let us associate with each a A a region Ba, and denote {a} B

    athe

    set of ordered pairs {(a, b) : b Ba}.

    Randomly selecting (or throwing) one point in A and another point in the

    corresponding region Ba

    is, by definition, the same as randomly choosing one

    point (a, b) from ABa.

    b)

    If to each b Ba

    we associate a regi