análise bayesiana de decisões aspectos práticos

200
An´ alise Bayesiana de Decis˜ oes Aspectos Pr´ aticos Helio S. Migon 1 e Hedibert F. Lopes Universidade Federal do Rio de Janeiro (UFRJ) 1 Endere¸ co para correspondˆ encia: Universidade Federal do Rio de Janeiro (UFRJ), Caixa Postal 68530, CEP 21945-970, Rio de Janeiro RJ - Brazil, Fax: 55-21-2290 1095, telefone: 55-21-2562-8290, emails: [email protected] e [email protected]

Upload: universidade-federal-fluminense

Post on 04-Jul-2015

223 views

Category:

Education


2 download

DESCRIPTION

Material de apoio - desenvolvido por terceiros - ao curso de Ciências Atuariais

TRANSCRIPT

Page 1: Análise bayesiana de decisões   aspectos práticos

Analise Bayesiana de DecisoesAspectos Praticos

Helio S. Migon1 e Hedibert F. Lopes

Universidade Federal do Rio de Janeiro (UFRJ)

1Endereco para correspondencia: Universidade Federal do Rio de Janeiro(UFRJ), Caixa Postal 68530, CEP 21945-970, Rio de Janeiro RJ - Brazil,

Fax: 55-21-2290 1095, telefone: 55-21-2562-8290, emails: [email protected] [email protected]

Page 2: Análise bayesiana de decisões   aspectos práticos

Prefacio

Esta monografia tem origem em notas de aulas ministradas em cursosdo bacharelado de Estatıstica e do mestrado de Pesquisa Operacional daUFRJ. A motivacao para preparar este texto vem de duas fontes alterna-tivas. A primeira, e mais obvia, e a inexistencia de textos cobrindo estasorte de conteudo num nıvel adequado. Alem disso, as tentativas de seescrever sobre esse topico, ca no Brasil, foram sempre muito limitadas,nao passando, em geral, da descricao dos elementos basicos da teoriade decisao. A segunda, talvez de maior desafio, decorre da inexistenciadessa disciplina nas nossas graduacoes de estatıstica. Pretendemos queesta monografia colabore para reverter esta posicao paradoxal.

Nossa proposta neste texto e combinar aspectos teoricos e praticos.O termo analise de decisoes e um reconhecimento de que a disciplina detomada de decisoes vai alem da descricao dos formalismos matematicos,como por exemplo, a axiomatizacao da teoria de utilidade e os tecnicis-mos da inferencia estatıstica. Alguns aspectos que merecem destaque saoa abordagem de modelos graficos: diagramas de influencia e arvores dedecisao e a introducao a programacao dinamica estocastica. A discussaode metodos de maximizacao da utilidade esperada atraves de tecnicas deMonte Carlo e outro aspecto de extrema importancia pratica. Os meritosdeste trabalho, esperamos, estao na forma como o material coletado dediversas fontes de extremo valor aplicado e teorico esta organizado. Den-tre os textos classicos que influiram na organizacao desta monografia,

i

Page 3: Análise bayesiana de decisões   aspectos práticos

ii

destacamos DeGroot (1970), Lindley (1971), Bunn (1984) e, mais recen-temente, Clemen (1996) e French and Rios-Insua (2000).

Como ja mencionamos, o nıvel do livro e adequado para alunos degraduacao em Estatıstica, Atuaria e Pesquisa Operacional, que tenhamum mınimo de conhecimentos de Inferencia Estatıstica. Sera util, tambem,para alunos de Administracao e Economia, em nıvel de pos-graduacao.Embora pretendamos que este seja um livro texto em analise de decisoes,nessa versao nao incluımos exercıcios selecionados ao final dos capıtulos.O material como um todo pode ser aplicado em cursos de um perıodo leti-vo, cerca de 45 horas. Os capıtulos 1, 2, 3 e 5 sao essenciais para principi-antes, pois introduzem nocoes elementares de teoria da decisao, bem comomecanismos de solucao e avaliacao de problemas de decisao (arvores de de-cisoes, diagramas de influencia, analise de sensibilidade). Os capıtulos 4,6 e 7 introduzem metodologia mais avancada. No capıtulo 4 introduzem-se, resumidamente, os fundamentos que tornam cientificamente coerentea teoria da decisao vista nos outros capı tulos. Os capıtulos 6 e 7 tratam,respectivamente, de problemas de decisoes sequenciais e da aplicacao demetodos Monte Carlo para a solucao do problema da maximizacao dautilidade esperada. Portanto, acreditamos que essa monografia possa serflexivelmente utilizada para cursos introdutorios (graduacao) bem comopara cursos intermediarios (mestrado).

Varias pessoas colaboraram, de uma forma ou de outra e em variosestagios, para tornar viavel a elaboracao desse trabalho. Alguns exem-plos mencionados neste texto tiveram origem em temas de iniciacoescientıficas e dissertacoes de mestrado que supervisionamos nos ultimosanos no IM e na COPPE/UFRJ. Destacamos a colaboracao de AlcioneMiranda (doutoranda de Pesquisa Operacional) em aplicacoes do pacoteDPL, alem da elaboracao de varios graficos, juntamente com Andre LuizSilva e Lilian Migon. Agradecemos a Giovanni Parmigiani e Lurdes In-oue que, juntamente com o segundo autor (HFL), gentilmente cederamalguns capıtulos de seu livro Statistical Decision Theory, com publicacao

Page 4: Análise bayesiana de decisões   aspectos práticos

iii

prevista para 2003.Finalmente agradecemos a Associacao Brasileira de Estatıstica (ABE)

- pela oportunidade de apresentar este conteudo no XV Simposio Nacionalde Probabilidade e Estatıstica (SINAPE). Certamente muitas omissoes evarios erros serao detectados pelos eventuais leitores, aos quais pedimos,desde ja, desculpas. Todas as crıticas e comentarios serao seriamente con-sideradas e contribuirao para tornar mais completa uma proxima edicaorevisada e ampliada deste material.

Rio de Janeiro, 25 de marco de 2002.HSM e HFL

Page 5: Análise bayesiana de decisões   aspectos práticos

iv

Page 6: Análise bayesiana de decisões   aspectos práticos

Sumario

1 Introducao 31.1 Uma breve nota historica . . . . . . . . . . . . . . . . . . . 3

1.2 Sobrevoando o livro . . . . . . . . . . . . . . . . . . . . . . 5

1.3 Notacao basica . . . . . . . . . . . . . . . . . . . . . . . . 161.4 Organizacao do Livro . . . . . . . . . . . . . . . . . . . . . 17

2 Conceitos Basicos 232.1 Elementos da analise de decisoes . . . . . . . . . . . . . . . 24

2.2 Especificando a funcao de perda . . . . . . . . . . . . . . . 29

2.3 Funcao de perda nao negativa . . . . . . . . . . . . . . . . 342.4 Concavidade do risco de Bayes . . . . . . . . . . . . . . . . 36

2.5 Problema de decisao com Θ e A finitos . . . . . . . . . . . 38

2.6 Revisitando a regra minimax . . . . . . . . . . . . . . . . . 43

2.7 Problema de decisao usando dados . . . . . . . . . . . . . 462.8 Analise de risco . . . . . . . . . . . . . . . . . . . . . . . . 50

2.9 Dominancia estocastica . . . . . . . . . . . . . . . . . . . . 55

3 Modelos Graficos 61

3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

3.2 Redes Bayesianas . . . . . . . . . . . . . . . . . . . . . . . 633.3 Diagrama de influencia e arvore de decisao . . . . . . . . . 68

v

Page 7: Análise bayesiana de decisões   aspectos práticos

vi SUMARIO

3.4 Introducao ao DPL . . . . . . . . . . . . . . . . . . . . . . 78

4 Probabilidade subjetiva e utilidade 894.1 ”Dutch book” e regras escore . . . . . . . . . . . . . . . . 924.2 Utilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

4.2.1 Paradoxo de Saint Petersburg . . . . . . . . . . . . 984.2.2 Teorema de von Neumann–Morgernstern . . . . . . 98

4.3 Multiplos atributos . . . . . . . . . . . . . . . . . . . . . . 1034.4 Medidas de aversao ao risco . . . . . . . . . . . . . . . . . 105

5 Analise de Sensibilidade 1095.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 1095.2 Identificacao e estrutura . . . . . . . . . . . . . . . . . . . 1105.3 Exemplo de analise preliminar de sensibilidade . . . . . . . 1135.4 Conceitos basicos de analise de sensibilidade . . . . . . . . 1185.5 Sensibilidade da distribuicao a priori . . . . . . . . . . . . 1225.6 Sensibilidade conjunta: priori e utilidade . . . . . . . . . . 126

6 Programacao Dinamica 1356.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 1356.2 Uma classe de problemas de otimizacao . . . . . . . . . . . 1366.3 Programacao dinamica . . . . . . . . . . . . . . . . . . . . 138

6.3.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . 1446.4 Arvore de decisao e programacao dinamica . . . . . . . . . 1496.5 Opcoes reais: uma introducao . . . . . . . . . . . . . . . . 152

7 MUE via metodos Monte Carlo 1637.1 Aproximando U(d) via Monte Carlo . . . . . . . . . . . . . 1647.2 Ajuste da curva de utilidade . . . . . . . . . . . . . . . . . 1667.3 Simulando o modelo aumentado . . . . . . . . . . . . . . . 167

7.3.1 Tempera simulada em problemas de decisao . . . . 1687.4 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

Page 8: Análise bayesiana de decisões   aspectos práticos

SUMARIO vii

7.4.1 Tamanho amostral da Normal . . . . . . . . . . . . 1717.4.2 Tamanho amostral da Binomial . . . . . . . . . . . 1737.4.3 Defibrilacao do coracao . . . . . . . . . . . . . . . . 175

Page 9: Análise bayesiana de decisões   aspectos práticos

viii SUMARIO

Page 10: Análise bayesiana de decisões   aspectos práticos

Lista de Figuras

1.1 Diagrama de influencia . . . . . . . . . . . . . . . . . . . . 71.2 Arvore de decisao inicial . . . . . . . . . . . . . . . . . . . 81.3 Solucao via arvore de decisao . . . . . . . . . . . . . . . . 8

1.4 Valor monetario esperado. a1 - linha cheia; a2 - linha pon-tilhada; a3 - linha tracejada. . . . . . . . . . . . . . . . . . 9

1.5 Decisoes sequenciais: diagrama de influencia . . . . . . . . 11

1.6 Decisoes sequenciais: arvore de decisao . . . . . . . . . . . 201.7 Decisoes sequenciais: solucao . . . . . . . . . . . . . . . . . 21

1.8 Diagrama de influencia para informacao imperfeita . . . . 21

2.1 Funcoes de perda alternativas em problemas de estimacao:perda zero-um (linha cheia), perda quadratica (linha pon-tilhada) e perda absoluta (linha tracejada). . . . . . . . . . 31

2.2 Concavidade do risco de Bayes: n(A) < ∞ (figura da es-querda); n(A) = ∞ (figura da direita). . . . . . . . . . . . 38

2.3 Efeito da imprecisao sobre π: incremento no risco de Bayes 392.4 Representacao grafica de G . . . . . . . . . . . . . . . . . . 40

2.5 Poliedro convexo; caso k = 2 e m = 6 . . . . . . . . . . . 432.6 Regra minimax - determinacao grafica . . . . . . . . . . . 452.7 Regra minimax - determinacao grafica . . . . . . . . . . . 46

2.8 Admissibilidade da regra de Bayes . . . . . . . . . . . . . . 472.9 Risco de Bayes - exemplo com dados . . . . . . . . . . . . 51

ix

Page 11: Análise bayesiana de decisões   aspectos práticos

x LISTA DE FIGURAS

2.10 F domina G estocasticamente em primeira ordem. . . . . . 57

2.11 G e um espalhamento de F com preservacao da media. . . 58

3.1 Rede Bayesiana: cada no refere-se a uma variavel aleatoriadicotomica . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

3.2 Rede Bayesiana para o modelo fatorial. . . . . . . . . . . . 66

3.3 Modelo fatorial estatico no WinBugs. . . . . . . . . . . . . 67

3.4 DI para risco basico: decisao primaria (a), evento incerto(θ) e consequencias (c) . . . . . . . . . . . . . . . . . . . . 71

3.5 DI para polıtica de risco basico . . . . . . . . . . . . . . . 71

3.6 AD para investimento em ativo de risco: a decisao primariaseria investir ou nao, o evento incerto caracterizaria o suces-so ou fracasso do investimento e a consequencia seria omontante auferido. . . . . . . . . . . . . . . . . . . . . . . 72

3.7 DI e AD para informacao imperfeita. . . . . . . . . . . . . 74

3.8 DI para calculos intermediarios; uma situacao de objetivosmultiplos sem decisao de risco. . . . . . . . . . . . . . . . . 74

3.9 DI agregado sobre o uso de quımico. uso: nıvel de uti-lizacao do produto quımico, risco: risco de cancer, valor:valor economico, ψ: potencial cancerıgeno e λ: taxa deexposicao ao produto quımico. . . . . . . . . . . . . . . . . 75

3.10 DI para calculo do risco de cancer . . . . . . . . . . . . . . 76

3.11 Diagrama de influencia para decisoes sequenciais . . . . . . 77

3.12 Diagrama de influencia . . . . . . . . . . . . . . . . . . . . 81

3.13 Resultado final . . . . . . . . . . . . . . . . . . . . . . . . 82

3.14 Rainbow diagram . . . . . . . . . . . . . . . . . . . . . . . 83

3.15 Valor da informacao perfeita . . . . . . . . . . . . . . . . . 84

3.16 Diagrama de influencia - informacao imperfeita . . . . . . 85

3.17 Diagrama de influencia - informacao imperfeita . . . . . . 88

4.1 Funcao de utilidade de um agente averso ao risco. . . . . . 106

Page 12: Análise bayesiana de decisões   aspectos práticos

LISTA DE FIGURAS xi

5.1 Diagrama de influencia: receita e custo . . . . . . . . . . . 1165.2 Diagrama de influencia completo . . . . . . . . . . . . . . 1175.3 Diagrama tornado . . . . . . . . . . . . . . . . . . . . . . . 1195.4 Valor esperado da distribuicao preditiva, segundo duas pri-

oris alternativas, e frequencias observadas no perıodo t =9 · · · 24. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

5.5 Grafico de π versus µ com regiao de sensibilidade de π . . 1305.6 Efeito de σ2 na regiao de indiferenca. . . . . . . . . . . . . 1325.7 Efeito de a - coeficiente de aversao ao risco na curva de

indiferenca. . . . . . . . . . . . . . . . . . . . . . . . . . . 133

6.1 A linha cheia representa o caminho mais curto ligando a ac e a linha pontilhada um caminho alternativo de b a c, talque o trajeto total seja mais longo. . . . . . . . . . . . . . 137

6.2 O grafo acima tem vertices rotulados de 1 a 10 e arcos comas distancias anotadas (di,j) . . . . . . . . . . . . . . . . . 139

6.3 Comparacao de tres funcoes de utilidades alternativas: u(a) =a1/2, u(a) = 1 − exp(−a), a > 0 ou u(a) = 1 − 1/(1 + a). . 146

6.4 Arvore de decisao com um numero finito de estagios. . . . 151

7.1 (a) Utilidade esperada, (b) Utilidade esperada obtida porIntegracao Monte Carlo (M=10.000), (c) 10.000 pares (ni, ui)e (d) Curva ajustada (loess no S-plus). Valores fixados:(σ, µ, τ, c) = (1.0, 0.0, 1.0, 0.01). . . . . . . . . . . . . . . . 172

7.2 (a) Utilidade esperada, (b) Utilidade esperada obtida porIntegracao Monte Carlo (M=10.000), (c) 10.000 pares (ni, ui)e (d) Curva ajustada (loess no S-plus). Valores fixados:(σ, µ, τ, c) = (3.0, 0.0, 3.0, 0.01). . . . . . . . . . . . . . . . 173

7.3 UJ (n) para J = 20 e M = 10.000 simulacoes. . . . . . . . . 1747.4 As linhas fina e grossa representam, respectivamente, os

valores aproximado e verdadeiro de U(n) (Muller and Parmi-giani, 1995). . . . . . . . . . . . . . . . . . . . . . . . . . . 176

Page 13: Análise bayesiana de decisões   aspectos práticos

xii LISTA DE FIGURAS

7.5 U(D) para c = 0.02. O planejamento otimo foi d0 = 9.25 ea = 0.30, que estao marcados com um triangulo no grafico(Clyde, Muller and Parmigiani, 1993). . . . . . . . . . . . 179

Page 14: Análise bayesiana de decisões   aspectos práticos

Lista de Tabelas

1.1 Consequencias (custos) em unidades monetarias (u.m.) . . 6

1.2 Variaveis de entrada - domınio de variacao . . . . . . . . . 12

1.3 Verossimilhanca - p(x|θ) . . . . . . . . . . . . . . . . . . . 15

1.4 Distribuicoes a posteriori, π(θ|x), e preditiva, p(x). . . . . 15

2.1 Perda associada a cada acao e cada estado da natureza. . . 26

2.2 Funcao de ganho da livraria (em dezenas) . . . . . . . . . 28

2.3 Perdas monetarias (em milhares) . . . . . . . . . . . . . . 35

2.4 Funcao de perda nao negativa (L0(θ, a) = L(θ, a) − λ0(θ)) . 35

2.5 Funcao de perda . . . . . . . . . . . . . . . . . . . . . . . 35

2.6 Funcao de perda nao negativa . . . . . . . . . . . . . . . . 36

2.7 Funcao de perda nao negativa . . . . . . . . . . . . . . . . 41

2.8 Funcao de perda . . . . . . . . . . . . . . . . . . . . . . . 44

2.9 Funcao de perda nao negativa . . . . . . . . . . . . . . . . 44

2.10 Funcao de perda. . . . . . . . . . . . . . . . . . . . . . . . 49

2.11 Funcao de probabilidade, p(x|θ). . . . . . . . . . . . . . . . 49

2.12 Distribuicao conjunta de θ e x. . . . . . . . . . . . . . . . 50

2.13 Retornos mensais de dois ativos de risco . . . . . . . . . . 54

2.14 Retornos e riscos dos ativos a1 e a2 . . . . . . . . . . . . . 54

2.15 Matriz de ganhos . . . . . . . . . . . . . . . . . . . . . . . 55

3.1 Probabilidades conjuntas sobre X × Θ . . . . . . . . . . . 86

xiii

Page 15: Análise bayesiana de decisões   aspectos práticos

LISTA DE TABELAS 1

3.2 Consequencias – lucro lıquido em A×Θ . . . . . . . . . . 87

5.1 Variaveis de entrada - domınio de variacao . . . . . . . . . 1185.2 Dados de numero de consultas medicas . . . . . . . . . . . 1215.3 Novos valores associados as variaveis mais relevantes . . . 1255.4 Problema de decisao sem dados. . . . . . . . . . . . . . . . 1265.5 Alternativas considerando as variacoes extremas de π. . . . 1275.6 Perdas no mercado de comodities. . . . . . . . . . . . . . . 1285.7 Valor equivalente certo. . . . . . . . . . . . . . . . . . . . . 131

6.1 Polıtica otima (em negrito) . . . . . . . . . . . . . . . . . . 1416.2 Comparacao dos ganhos sequenciais com os do Profeta . . 150

Page 16: Análise bayesiana de decisões   aspectos práticos

2 LISTA DE TABELAS

Page 17: Análise bayesiana de decisões   aspectos práticos

Capıtulo 1

Introducao

1.1 Uma breve nota historica

Teoria de Decisao e uma area que vem se desenvolvendo aceleradamentedesde o meado do seculo passado. Uma solida base axiomatica foi intro-duzida por von Neumann and Morgenstern (1944). Os trabalhos de Wald(1949) e Savage (1954) sao absolutamente centrais nos desenvolvimentosestatısticos da teoria da decisao, embora esta area envolva muitos outrosaspectos, sendo claramente de natureza interdisciplinar.

O termo teoria da decisao e utilizado de forma muito generica e in-terdisciplinar, decorrendo, possıvelmente, da natureza ampla do processode decisao. Dentre as areas do conhecimento que consideram aspectosda tomada de decisao destacam-se: inteligencia artificial, economia, busi-ness, matematica, pesquisa operacional e estatıstica, e claro. Desta formaa Teoria da Decisao e uma disciplina de estatıstica envolvendo e explo-rando a estrutura do processo de tomada de decisao.

Existe um grande numero de excelentes livros de analise, teoria esuporte a decisao. Embora a escolha de alternativas com base no valoresperado da utilidade tenha varios seculos (vale mencionar a contribuicao

3

Page 18: Análise bayesiana de decisões   aspectos práticos

4 CAPITULO 1. INTRODUCAO

de Bernoulli, 1738, no famoso paradoxo de St. Petersburg), nos limitare-mos a listar e comentar parte da literatura pos-guerra. Os desenvolvi-mentos em teoria dos jogos estao descritos pelo menos em tres livrosfundamentais: von Neumann and Morgenstern (1944), Wald (1949) eSavage (1954). von Neumann and Morgenstern (1944) introduzem aspropriedades minimax, o teorema minimax e a extensao dessas ideias avarias classes de jogos. Por sua vez, Savage (1954) estende a axiom-atizacao de von Neumann and Morgenstern para cobrir probabilidadessubjetivas e utilidades. Savage pode ser mencionado como um dos princi-pais mentores da inferencia Bayesiana. Luce and Raiffa (1957) resumemmuito da teoria dos jogos e alguns resultados experimentais.

Nos anos 60 destacamos os livros de Raiffa and Schlaifer (1961) ondese encontra pela primeira vez a tecnologia simples de se tomar decisoesconcatenadamente. Os resultados de programacao dinamica obtidos porBellman (1957) sao relacionados com os procedimentos de maximizacaoda utilidade esperada num artigo historico de Lindley (1961). Surgem,ainda, nesta decada varios textos de teoria estatıstica da decisao. Cita-mos como exemplos marcantes os livros de Ferguson (1967) e o DeGroot(1970). No que concerne a analise de decisoes, isto e: aspectos mais apli-cados da tomada de decisoes sob incerteza, podemos mencionar os livrosde Raiffa (1996), Lindley (1971) e Lindgren (1971).

Uma retomada na publicacao de textos nesta area e observada nasultimas duas decadas. Uma das caracterısticas dessas novas publicacoese incorporar, mais e mais, aspectos praticos incluindo o uso de softwaresespecıficos (DPL 4.0 (1998) e BUGS Spiegelhalter, Thomas, Best, andGilks (1996)). Novidades em termos de diagramas de influencia sao en-contradas em Smith (1988) e discussoes sobre decisoes em grupos ampla-mente discutidos em French (1989). Um classico desta decada, com forteenfase em aspectos estatısticos da teoria da decisao, e o texto de Berger(1985). Mais recentemente temos um texto excelente, a nıvel introdutorio,de Clemen (1996). Diversos aspectos operacionais sao exemplificados uti-

Page 19: Análise bayesiana de decisões   aspectos práticos

1.2. SOBREVOANDO O LIVRO 5

lizando um software especıfico - o DPL. Alem disto, aspectos de teoriada utilidade multi-atributo sao discutidos a um nıvel intermediario.

1.2 Sobrevoando o livro

Utilizaremos um exemplo muito simples para promover um sobrevoo dametodologia apresentada nos proximos seis capıtulos e apendices. Esteexemplo e baseado no famoso artigo The rev counter decision, P.G. Mooreand H. Thomas, (1973), Opl.Res. Q., 24, 337-351.

Parte 1: Colocacao do problema e analise preliminar

Uma fabrica de componentes de automovel - Pethold - esta enfrentandouma nova demanda por um de seus produtos. Um dos diretores e quatroexecutivos se reunem para considerar formas alternativas de lidar comeste eventual aumento da demanda.

Apos algumas discussoes concluem por duas acoes alternativas (maiso status quo) capazes de atender a nova demanda:

a1 - comprar novos equipamentos (NvEqui)

a2 - contratar horas extras (HrExt)

a3 - manter nıvel de producao atual (NvAtua)

O Diretor nao admite subcontratar outro fornecedor por questoes es-trategicas. Alem disto, para simplificar, nao ha expectativas de variacoesnos precos. Apos discutirem o que aconteceria sob cada uma das alterna-tivas e decidirem trabalhar com um horizonte de planejamento de um ano,o pessoal de marketing julgou que a demanda, a se manter a tendenciaatual, poderia subir uns 15% (Alta), mas nao exclui a possibilidade deuma queda de 5% (Baixa) caso o mercado se torne sofrıvel. As chances

Page 20: Análise bayesiana de decisões   aspectos práticos

6 CAPITULO 1. INTRODUCAO

relativas com relacao a esses dois estados sao de 3:2 a favor do crescimentodas vendas, ou seja, a probabilidade de Alta, π, e igual a 0.6.

Neste momento solicitaram ao pessoal de contabilidade que levantasseos custos de cada uma das alternativas. Apos varias idas e vindas, envol-vendo os gerentes producao, de pessoal e financeiro, responsaveis peloscustos de material e equipamentos, de salarios e pelos custos financeiros,respectivamente, chegaram aos numeros da tabela 1.1.

EstadosAcoes Alta Baixa

NvEqui 220 130HrExtr 210 150NvAtua 170 150

Tabela 1.1: Consequencias (custos) em unidades monetarias (u.m.)

Essa tabela contem varios ingredientes que serao discutidos estensi-vamente nos capıtulos subsequentes. Por exemplo, NvEqui, HrExtr eNvAtua pertencem ao espaco das acoes (decisoes), enquanto Alta e Baixacompoem os estados da natureza. A tabela 1.1 representa a funcao obje-tivo (custos, perdas, ganhos, utilidades, etc). No capıtulo 2 esses e outroselementos basicos da teoria da decisao estatıstica serao introduzidos for-malmente. Voltando ao problem e dado o grande volume de informacoeso gerente de producao sugere a utilizacao de um pacote de analise de de-cisoes para organizar um diagrama de influencia (figura 1.1), introduziros dados, obter a arvore de decisao (figura 1.2) e resolver o problema.

O diagrama de influencia apresenta atraves de grafos o problema dedecisao a ser resolvido. Nesse grafo as relacoes entre as incertezas en-volvidas (vendas e ganhos) e as acoes disponıveis sao representadas porsetas direcionadas. Existe uma relacao biunıvuca entre a arvore de de-cisao e o diagrama de influencia em um problema de decisao, sendo o

Page 21: Análise bayesiana de decisões   aspectos práticos

1.2. SOBREVOANDO O LIVRO 7

Figura 1.1: Diagrama de influencia

segundo de mais facil elaboracao em problemas relativamente complex-os. O capıtulo 3 e inteiramente dedicado a introducao e discussao acercadesses mecanismos de decisao, bem como sua implementacao atraves doDPL. Inicialmente, para manter as coisas bem simples, evitam ate mesmoa inclusao de certos custos de investimento em capital e outros.

O gerente de marketing explica para os demais que o desejavel e es-colher, dentre as alternativas, aquela que produzir o melhor ganho esper-ado global. Assim o criterio de selecao sera o chamado EMV - ExpectedMonetary Value. Utilizando o pacote ele obtem facilmente o resultadosdesejados.

Observe que os valores monetarios esperados das tres alternativas(acoes a1, a2 e a3) sao, respectivamente, 184, 186 e 162. Como se de-seja a acao de menor custo esperado, a manutencao do nıvel de producaoatual e a melhor estrategia.

Considerando a arbitrariedade das chances relativas dos eventos in-

Page 22: Análise bayesiana de decisões   aspectos práticos

8 CAPITULO 1. INTRODUCAO

Figura 1.2: Arvore de decisao inicial

Figura 1.3: Solucao via arvore de decisao

Page 23: Análise bayesiana de decisões   aspectos práticos

1.2. SOBREVOANDO O LIVRO 9

certos o gerente financeiro sugere uma analise de sensibilidade, topicoabordado no capıtulo 5. O que ocorreria se as chances relativas fossemmodificadas? Se o valor de π fosse, por exemplo, 15%, ao inves de 60%,os valores monetarios esperados para cada uma das acoes seriam 143.5,159 e 153. Nesse novo cenario, a melhor estrategia e a compra de novosequipamentos. Como funcao de π os custos sao

a1 : 90π + 130a2 : 60π + 150a3 : 20π + 150

Note que a3 e dominada por a2, uma vez que para todos os valoresde π ∈ (0, 1) a reta que descreve o valor esperado de a3 passa por baixoda reta que descreve o valor esperado de a2. Isso pode ser visto na figura1.4.

Figura 1.4: Valor monetario esperado. a1 - linha cheia; a2 - linha pontil-hada; a3 - linha tracejada.

Page 24: Análise bayesiana de decisões   aspectos práticos

10 CAPITULO 1. INTRODUCAO

O mesmo ja nao ocorre com respeito a a1. Diante disto, nao contin-uaremos considerando a acao a3. Por outro lado, a acao a1 sera preferıvela a2 se e somente se 90π + 130 > 60π + 150 ou seja p > 2/3. A solucaoque obtivemos e insensıvel a escolha de π, desde que se acredite que πseja pelo menos igual a 2/3.

Para finalizar esta primeira parte o diretor intervem alertando queo problema foi excessivamente simplificado. Os valores monetarios saorazoaveis (variacao de 5% no maximo), a solucao final nao e sensıvel aovalor de π, mas deveriam tentar um horizonte de planejamento maior ediscutir se o EMV e adequado para este tipo de tomada de decisao.

Parte 2: Analise sequencial com maior horizonte de

planejamento

Ao voltarem do lanche ja encontraram preparados, pelos gerentes finan-ceiro e de marketing, um novo diagrama de influencia e uma nova arvorede decisao (figuras 1.5 e 1.6, respectivamente). Esta nova configuracao in-clui uma analise mais realista feita ao longo de dois anos, utiliza somentea1 e a2 e particiona as vendas no segundo ano em tres nıveis: alta, media

e baixa. Como podemos observar temos duas caixas decisorias, dois nosaleatorios, denominados vend1 e vend2 e um unico no de consequencia(ver figura 1.5.

Esse diagrama resume os valores monetarios lıquidos totais sem levarem conta o valor do dinheiro no tempo. Destacamos que as decisoes saoconectadas por arcos, traduzindo a natureza sequencial do problema e queos nos aleatorios tambem se conectam por arcos, indicando que a segundadistribuicao de probabilidae e condicional aos resultados observados noprimeiro no.

Finalmente, as consequencias dependem destes quatro elementos. Pre-cisamos portanto acessar 24 consequencias monetarias, as quais estao ap-resentados na tabela 1.2.

Page 25: Análise bayesiana de decisões   aspectos práticos

1.2. SOBREVOANDO O LIVRO 11

Figura 1.5: Decisoes sequenciais: diagrama de influencia

Na tabela 1.2 sao apresentados os custos relativos aos dois anos paracada uma das alternativas. Por exemplo, a4 corresponde a decidir porNvEqui no primeiro ano e, tambem, no segundo ano, e assim sucessiva-mente. Lembre-se que a decisao a3 foi eliminada da analise.Avaliacao de Probabilidades

Como recem comentamos as probabilidades do crescimento das ven-das do segundo ano ser alto, medio ou baixo, dependera do ocorrido noprimeiro. Suponha que

P [A2|B1] = P [M2|B1] = 0.4 e P [B2|B1] = 0.2P [A2|A1] = 0.5, P [M2|A1] = 0.4 e P [B2|A1] = 0.1

onde A,M e B representam os eventos alta, media e baixa, respecti-vamente. Estas probabilidades foram obtidas com base nas informacoesdisponıveis, subjetivas ou nao, dos gerentes de marketing e de financas.Na verdade sao educated guesses. A solucao e facilmente obtida atraves

Page 26: Análise bayesiana de decisões   aspectos práticos

12 CAPITULO 1. INTRODUCAO

Acoes Alto Media Baixaa4 410 395 380a5 425 408 395a6 350 300 280a7 345 325 310a8 400 350 315a9 380 320 370a10 280 220 400a11 300.25 204 460

Tabela 1.2: Variaveis de entrada - domınio de variacao

do pacote e utiliza um algoritmo que intercala operacoes de calculo deesperanca para eliminar incertezas e maximizacao de consequencias es-peradas para eliminar as alternativas menos interessantes. O algoritmoopera de tras para a frente ou seja backwards. Na figura 1.7 observa-mos os resultados finais obtidos dessas operacoes, os quais foram obtidosquase que instantaneamente (o diretor deixou-os trabalhando, supondoque demorariam muito!).

Por exemplo os valores 401 e 415.2 no extremo direito superior daarvore refere-se as esperancas calculadas com a distribuicao condicionaldescritas acima. E claro que a alternativa HrExtr e preferıvel pois temmaior ganho esperado. Chegamos, assim, a um novo no aleatorio e ter-emos de calcular novas esperancas. Desta vez usaremos a distribuicaomarginal referente a variavel aleatoria denominada vendas do primeiroano. A melhor decisao e no primeiro ano sera contratar HrExtra, o quedifere da solucao obtida anteriormente. Quais as razoes para esta subtamodificacao? Uma das razoes e que em um ano a NvAtual e melhor poisos custos de investimento nao se cobrem neste curto prazo.

Alternativa ao EMV

Page 27: Análise bayesiana de decisões   aspectos práticos

1.2. SOBREVOANDO O LIVRO 13

O diretor esta intrigado com o uso do EMV e propoe a aplicacao deum princıpio alternativo: maxmin. Este princıpio se basea na escolha dopior que pode acontecer; isto e, seleciona-se a pior consequencia em cadasequencia de alternativas. Estas variam de 200 a 395. A seguir escolha amelhor das piores alternativas. E claro que a sequencia de acoes levandoa 395 sera escolhida. Esta inicia-se tambem pela alternativa a1. Umavez convencido o diretor assumiu a decisao de comprar de imediato osequipamentos necessarios e usar no segundo ano horas extras qualquer queseja o caso. Na verdade ele sugere que ao longo do ano sejam coletadosmais dados sobre o problema, que se continue discutindo os criterios deselecao de alternativas e formas de incorporar essas novas informacoes.

Parte 3: Justificando o questionamento ao uso do

EVM

Alguns meses mais tarde, com a orientacao de especialista em analise dedecisoes, compreenderam a razao de estarem duvidosos diante do uso doEMV. O ponto e que, ainda que de forma inconsciente, percebiam que suasreacoes aos resultados monetarios variam de acordo com o capital anteri-ormente acumulado. O especialista em analise de decisoes, provavelmenteum academico, didaticamente providenciou um exemplo exclarecedor.

Suponha que voce se ve diante de uma escolha compulsoria entre doisjogos, assim descritos:

(i) voce perde R$10.000,00 com probabilidade 0.001 ou, ao contrario,nao perde nada com probabilidade 0.999.

(ii) voce perde R$15,00 com probabilidade 1, isto e com certeza.

Embora o valor esperado de (i) seja ligeiramente menor do que o de(ii) (10 < 15), nao e um absurdo encontrar tomadores de decisoes queprefiram (ii) a (i). Quando uma pessoa segura seu carro, sua casa, ou

Page 28: Análise bayesiana de decisões   aspectos práticos

14 CAPITULO 1. INTRODUCAO

qualquer outro bem, ela geralmente prefere pagar (perder) R$15,00 do quecorrer a remota chance de perder o bem. Portanto, se as consequenciasmonetarias sao pequenas proporcionalmente ao capital, entao a adocao doEMV e razoavel. Caso contrario, e mais prudente (leia-se coerente) lancarmao de uma funcao de utilidade do dinheiro, a qual considere a formaconservadora diante do risco, ou qualquer outra maneira de considerar aaversao ao risco. Esse problema central da teoria da decisao, ou seja aquantificacao da utilidade do dinheiro (ou da saude, do empreendimento,etc), e extensivamente abordado no capıtulo 4.

O diretor levanta um outro ponto relevante: o momento em que saofeitas as despesas e realizadas as receitas. Isto significa que o dinheirotem valor diferente no tempo. E preciso usar o valor presente dos retornoslıquidos.

Parte 4: Usando um especialista

Apos varias discussoes surgiu uma nova possibilidade: contratar um con-sultor! Embora esse servico gere um custo adicional de, digamos 5000reais, ele produzira um relatorio detalhado sobre o mercado de auto-pecase fara uma avaliacao favoravel ou nao sobre o crescimento do mercado doproximo ano. Como ele e falıvel, o gerente de marketing assessou asinformacoes objetivas sobre o desempenho do consultor baseando, porexemplo, em informacoes obtidas junto a outras firmas do ramo. Essainformacao e apresentada na tabela 1.3 abaixo.

E claro que um consultor perfeito (impossıvel ou muito caro!) teriauma tabela com 1’s e 0’s. Note que tinhamos uma distribuicao a pri-ori sobre os estados da natureza, π(θ), e agora temos na tabela 1.3 adistribuicao de x (a informacao adquirida) dado θ (estado da natureza),p(x|θ), ou seja, a funcao de verossimilhanca. Podemos, entao, obter asdistribuicoes a posteriori e preditiva sem maiores dificuldades, como ap-resentadas na tabela 1.4. Assim

Page 29: Análise bayesiana de decisões   aspectos práticos

1.2. SOBREVOANDO O LIVRO 15

Avaliacao (x)Estados (θ) Favoravel DesfavoravelAlta 0.9 0.1Baixa 0.2 0.8

Tabela 1.3: Verossimilhanca - p(x|θ)

Mercado (Θ) x1 x2 π(θ)Alta 0.87 0.16 0.6Baixa 0.13 0.84 0.4p(x) 0.62 0.38

Tabela 1.4: Distribuicoes a posteriori, π(θ|x), e preditiva, p(x).

O diagrama de influencia e entao refeito incluindo um quadrado ref-erente a alternativa de contratacao do consultor.

O resultado final usando a distribuicao a posteriori, nos ramos maisa direita da arvore de decisao isomorfa ao diagrama de influencia acimafornece, por exemplo, os valores esperados: a1 : 208.3, a2 : 202.2 e a3 :167.4. Assim, a1 e preferıvel dado que o consultor e favoravel (x1) e seuvalor esperado e 208.3. Por outro lado se o consultor nao for favoravel(x2) entao a2 e preferıvel e seu valor esperado sera 159.6. Agora temosessas duas consequencias e devemos usar novamente o valor esperado.Como p(x1) = .62, entao obtemos: 208.3 × .62 + 159.6 × .38 − 5 = 184.8.Este valor compara desfavoravelmente com o obtido anteriormente, 162.Assim o consultor nao deve ser contratado.

Page 30: Análise bayesiana de decisões   aspectos práticos

16 CAPITULO 1. INTRODUCAO

1.3 Notacao basica

Nos proximos 6 capıtulos varios conceitos novos serao introduzidos, trazen-do consigo uma enormidade de notacao matematica necessaria para facil-itar a exposicao e o desenvolvimento dos mesmos. Abaixo introduzimosuma lista abreviada com as principais notacoes. Tambem introduzimosaqui algumas siglas comumente utilizadas no livro.

A: Espaco das acoes (decisoes). Elementos sao denotados por a.

Θ: Espaco dos estados da natureza. Elementos sao denotados por θ.

L(θ, a): Perda associada ao estado da natureza θ sob a acao a.

U(θ, a): Funcao de utilidade. Geralmente, L(θ, a) = −U(θ, a).

π(θ): Distribuicao a priori de θ.

r(π, a): Risco ou perda esperada da acao a. r(π, a) =∫L(θ, a)π(θ)dθ.

ab: Acao (decisao) de Bayes. ab = arg mina r(π, a).

am: Acao minimax. am = argmina maxθ L(θ, a).

X : Espaco amostral. Elementos sao x.

p(x|θ): Modelo probabilıstico

δ(x): Regra de decisao.

p(x): Distribuicao preditiva.

π(θ|x): Distribuicao a posteriori de θ dado x.

AD: Arvore de Decisao.

Page 31: Análise bayesiana de decisões   aspectos práticos

1.4. ORGANIZACAO DO LIVRO 17

DI: Diagrama de Influencia.

DPL: Decision Programming Language - Software para teoria da decisaoatraves de AD e DI.

DAG: Direct Acyclic Graph.

BUGS: Bayesian Using Gibbs Sampling.

DsR: Downside Risk.

RaM: Retorno Aceitavel Mınimo.

VaR: Value at Risk.

u.m.: unidade monetaria.

MCMC: Monte Carlo via Cadeias de Markov.

1.4 Organizacao do Livro

No capıtulo 2 discutiremos varios aspectos introdutorios da teoria de de-cisao. Especificaremos a tripla que caracteriza um problema de decisaoe apresentaremosdiversas funcoes de perda para problemas especıficos.Tambem analisamos a concavidade do risco de Bayes e exploraremosgraficamente varias propriedades das regras de Bayes e minimax. Prob-lemas de decisao com espaco de decisoes e espaco de estados da naturezafinitos, problema de decisao baseado em dados experimentais, diferentesconceitos e medidas de risco e dominancia estocastica tambem sao intro-duzidos nesse capıtulo.

No capıtulo 3 apresentaremos varios instrumentos graficos disponıveispara facilitar a modelagem de problemas complexos de decisao. Inicia-remos pela descricao das redes Bayesianas e depois apresentaremos os

Page 32: Análise bayesiana de decisões   aspectos práticos

18 CAPITULO 1. INTRODUCAO

diagramas de influencia e as arvores de decisao. Serao tambem apre-sentados neste capıtulo os principais aspectos dos pacotes DPL - dataprogramming language e um exemplo envolvendo o uso do WinBUGS -Bayesian analysis using Gibbs sampler.

O capıtulo 4 introduz alguns resultados fundamentais para a teoriaestatıstica da decisao e que servem como solida base para o uso rotineirodos princıpios da teoria da decisao. Introduzimos o princıpio da coerenciaatraves do famoso argumento Dutch book para, em seguida, introduzir asscoring rules (ou regras escores), que induzem o tomador de decisoes afornecer suas probabilidades subjetivas, ou seja obriga-o a ser honesto aoinformar suas probabilidades. O tambem famoso (e curioso) paradoxo deSt. Petersburg que ilustra a dificuldade de se dissociar o valor do dinheirode sua utilidade tambem e discutido. Ainda nesse capıtulo introduzimos oteorema de representacao von Neumann-Morgenstern que essencialmenteintroduz todos os alicerces necessarios para o tomador de decisoes sobreincerteza escolher entre duas alternativas de acao tendo sem sua frentesomente os possıveis estados da natureza, suas utilidades e probabilidades.

Discutiremos alguns aspectos da analise de sensibilidade no capıtulo 5.Esse e problema central na estruturacao e solucao de modelos de decisao.As tecnicas de analise de decisao usam como ingrediente fundamental jul-gamentos do tomador de decisao atraves de suas preferencias e crencas.A distribuicao a priori, o modelo que descreve os dados disponıveis e afuncao de perda ou utilidade impactam a solucao final do problema. Aquestao e avaliar a sensibilidade dos resultados finais a variacoes a esseselementos da analise. Iniciaremos discutindo alguns aspectos de identi-ficacao do problema e de sua estruturacao para a seguir atacar questoesligadas a robustez das componentes do modelo de decisao.

Trataremos de problemas de decisao em multiplos estagios ou sequen-ciais no capıtulo 6. Esses problemas se caracterizam por poderem serseparados em um certo numero de passos sequenciais ou estagios, cadaestagio se conclui com uma decisao. Em geral, o tempo e usado para

Page 33: Análise bayesiana de decisões   aspectos práticos

1.4. ORGANIZACAO DO LIVRO 19

ordenar a sequencia de problemas decisorios.No capıtulo 7 apresentaremos estrategias para a solucao do problema

de decisao baseadas em metodos Monte Carlo. Comecamos com a apli-cacao de integracao de Monte Carlo para resolver a integral que surge nocalculo da perda (ou utilidade) esperada. Introduziremos a ideia de seajustar uma curva a um conjunto finito de pares decisao-utilidade e, paraespacos decis´ orios de dimensao relativamente grande, introduziremosum metodo para resolver o problema de otimizacao e integracao comoum problema de simulacao, atraves de metodos Monte Carlo via cadeiasde Markov (MCMC).

Page 34: Análise bayesiana de decisões   aspectos práticos

20 CAPITULO 1. INTRODUCAO

Figura 1.6: Decisoes sequenciais: arvore de decisao

Page 35: Análise bayesiana de decisões   aspectos práticos

1.4. ORGANIZACAO DO LIVRO 21

Figura 1.7: Decisoes sequenciais: solucao

Figura 1.8: Diagrama de influencia para informacao imperfeita

Page 36: Análise bayesiana de decisões   aspectos práticos

22 CAPITULO 1. INTRODUCAO

Page 37: Análise bayesiana de decisões   aspectos práticos

Capıtulo 2

Conceitos Basicos

Como sugerido nos exemplos do Capıtulo 1 a analise de decisoes estaenvolvida com problemas complexos os quais incluem uma ou mais dasseguintes caracterısticas:

• Incerteza: como escolher um curso de acao - estrategia - quandosuas consequencias dependem de eventos incertos.

• Objetivos multiplos: sao frequentes as situacoes onde a escol-ha de alternativas envolve consequencias de natureza multipla, emgeral conflitantes. Por exemplo, a localizacao de uma usina nu-clear requer a avaliacao dos custos envolvidos, da confiabilidade doprojeto, de questoes ambientais etc.

• Alternativas multiplas: e imprescindıvel escrutinar todas as al-ternativas ou opcoes possıveis, eliminando-se aquelas dominadasmas evitando-se omissoes ou simplificacoes excessivas.

• Sequenciamento: muitas decisoes sao de natureza sequencial en-volvendo, portanto multiplos estagios de decisao. As decisoes emdado estagio do processo sao selecionadas com base nas decisoes

23

Page 38: Análise bayesiana de decisões   aspectos práticos

24 CAPITULO 2. CONCEITOS BASICOS

ja exercidas, nas informacoes disponıveis e no conhecimentos doseventos incertos ja ocorridos.

Um modelo de decisao consiste de dois aspectos basicos: (i) especifi-cacao estrutural e (ii) definicao de criterios para comparacao de alterna-tivas. A especificacao estrutural envolve a identificacao dos elementos doproblema de decisao, isto e os eventos incertos, as alternativas possıveis,os parametros desconhecidos e as relacoes estruturais relacionando esteselementos. Os criterios para comparacao das consequencias associadas asvarias alternativas devem possibilitar ao decisor uma certa racionalidadeou coerencia no processo decisorio. Uma condicao necessaria para o com-portamento racional dos decisores sera denominada de coerencia. Devemser eliminadas as regras que conduzem a ideia da perpetual money makingmachine como introduzido por Lindley (1971).

Neste capıtulo discutiremos varios aspectos introdutorios da teoria dedecisao (veja secao 2.1). Especificaremos a tripla que caracteriza um prob-lema de decisao e apresentaremos, nas secoes 2.2 e 2.3, diversas funcoesde perda para problemas especıficos. Na secao 2.4, caracterizaremos aconcavidade do risco de Bayes e exploraremos graficamente varias pro-priedades das regras de Bayes e minimax. Problemas de decisao comespaco de decisoes e espaco de estados da natureza finitos serao tratadosna secao 2.5. A regra minimax e revisitada na secao 2.6. O problemade decisao baseado em dados experimentais sera discutido na secao 2.7 ediferentes conceitos e medidas de risco serao apresentados na secao 2.8.Este capıtulo e concluıdo com a secao 2.9 falando sobre dominancia es-tocastica.

2.1 Elementos da analise de decisoes

Como identificado nos exemplos do Capıtulo 1, um problema de decisaoe especificado pela tripla (A,Θ, L), onde A e o espaco das acoes, Θ e

Page 39: Análise bayesiana de decisões   aspectos práticos

2.1. ELEMENTOS DA ANALISE DE DECISOES 25

o conjunto dos estados da natureza e L(θ, a) representa a perda sofridapela escolha da acao a ∈ A quando ocorre θ ∈ Θ, i.e. L : Θ ×A → <.Equivalentemente podemos definir a funcao de utlidade por U(θ, a) =−L(θ, a).

Precisamos, agora, descrever procedimentos para selecao da acao otima.Apresentaremos, a seguir, duas alternativas, uma determinıstica que naoleva em consideracao a probabilidade de ocorrencia dos estados da na-tureza, e outra estocastica que assinala pesos para os diversos (talveznao-enumeraveis) elementos de Θ. No final do capıtulo, na secao 2.9,discutiremos o conceito de dominancia estocastica.

Definicao 2.1 A acao am ∈ A e denominada minimax se

am = argmina

maxθ

L(θ, a)

Este criterio e de natureza conservadora pois escolhe dentre as acoesde maior perda, aquela acao de menor valor. Em outras palavras, escolhe-se a menos pior dentre as piores. Pode-se dizer, sem muito rigor, que umtomador de decisoes que adota um algoritmo minimax para tomada dedecisoes e averso ao risco. Veja o seguinte exemplo extraıdo de Berger(1985, pagina 6-7)

Exemplo 2.1 Um investidor deve decidir entre investir (acao a1) ou naoinvestir (acao a2) 1000 unidades monetarias (u.m.) em um fundo de in-vestimento arriscado. Esse fundo de investimento e arriscado pois podelevar o investidor a perda total de seu investimento (θ2). Seu atrativo,entretanto, e a possibilidade de um lucro lıquido (θ1), de 500 u.m. Alter-nativamente, ao nao investir nesse fundo, ele investiria suas 1000 u.m.numa poupanca com rendimento lıquido e certo de 30%, ou seja, 300 u.m.A tabela 2.1 apresenta as perdas (valores negativos sao ganhos) possıveisem ambas as acoes.

Page 40: Análise bayesiana de decisões   aspectos práticos

26 CAPITULO 2. CONCEITOS BASICOS

EstadosAcoes θ1 θ2

a1 -500 1000a2 -300 -300

Tabela 2.1: Perda associada a cada acao e cada estado da natureza.

Mais especificamente, θ1 representa um retorno lucrativo para o fundo,enquanto θ2 representa a perda total do dinheiro investido. E facil ver queo investidor devera aplicar seu dinheiro na poupanca pois essa acao temperda menor entre as maiores perdas de cada acao: 1000 e -300, para a1

e a2, respectivamente. Em outras palavras,

maxθL(θ, a1) = max−500, 1000 = 1000

maxθL(θ, a2) = max−300,−300 = −300

portanto, a2 e a regra minimax.

O exemplo acima e interessante pois nos remete naturalmente a seguintepergunta: Existe alguma forma de incorporar as incertezas associadas aθ1 e θ2 no processo decisorio, de sorte que o investidor (decisor) nao tenhaque ser totalmente averso ao risco? Mais especificamente, Qual o impactoque a 90% de grau de crenca de que θ1 ocorrera teria na hora do investi-dor tomar sua decisao? Claro que nenhum impacto se ele decidir porum procedimento minimax. Nem sempre, felizmente ou infelizmente, de-cisoes sao tomada dessa forma e as chances associadas as ocorrencias dosmais diversos tipos de eventos tem importancia no momento da tomadade decisoes. Assim, como no exemplo supracitado, seja π(θ), θ ∈ Θ umadensidade de probabilidade que mede a informacao fornecida ao tomadorde decisoes (atraves de introspecao ou estudo previo), antes de θ ter sidoobservado. Define-se o risco de uma acao da seguinte forma.

Page 41: Análise bayesiana de decisões   aspectos práticos

2.1. ELEMENTOS DA ANALISE DE DECISOES 27

Definicao 2.2 O risco ou perda esperada de uma acao a ∈ A e dadopor

r(π, a) =∫

ΘL(θ, a)π(θ)dθ

onde π(θ) e uma funcao de densidade sobre Θ.

Para o exemplo 2.1, onde π(θ1) = 1−π(θ2) = 0.9, e simples se observarque r(π, a1) = −350 e r(π, a2) = −300, ou seja, que a1 tem valor esperadode perda menor que a2, apesar de a2 ser, como ja vimos, a regra minimax.A acao que minimiza o valor esperado da perda e comumente conhecidacomo acao de Bayes com respeito a π.

Definicao 2.3 A acao ab ∈ A e denominada acao de Bayes com respeitoa π(θ) se

ab = argmina

ΘL(θ, a)π(θ)dθ

= argmina

r(π, a)

com r(π, a) comumente denominada perda esperada a priori e o seu valormınimo, r(π, ab), o risco de Bayes associado.

Ja vimos que para o investidor do exemplo 2.1 a acao de Bayes einvestir o dinheiro no fundo de investimento e o risco de Bayes vale −350u.m. O seguinte exemplo corrobora para fundamentar as ideias ate aquiapresentadas.

Exemplo 2.2 O gerente de uma livraria do campus da UFRJ deseja de-cidir quantas unidade de um certo livro texto devera encomendar para oinıcio do proximo perıodo. Seu ganho e de 15 u.m. por exemplar ven-dido e a editora aceita receber de volta aquelas unidades nao vendidasate a segunda semana apos o inicıo das classes. Como esta disciplina

Page 42: Análise bayesiana de decisões   aspectos práticos

28 CAPITULO 2. CONCEITOS BASICOS

nao sera oferecida novamente durante o presente ano letivo os livros re-manescentes, nao vendidos, imporao uma perda de 5 u.m., por exemplar,no final do perıodo. Uma questao importante sera , por exemplo, deter-minar o tamanho ideal da compra a ser realizada pela livraria. A funcaode ganho ou utilidade e obviamente dada por:

U(θ, a) =

15θ − 5(a− θ) se θ < a15a se θ ≥ a

Supondo, para simplificar, que as ordens (a) e as vendas (θ) sejammultiplos de 10 unidades e limitadas a um maximo de 70 unidades temos.A tabela 2.2 mostra os ganhos (perdas sao ganhos negativos) associadosa cada acao e cada possıvel estado da natureza (vendas efetuadas).

Vendas PerdaAcoes 0 10 20 30 40 50 60 70 Max r(π, a)0 0 0 0 0 0 0 0 0 0 0.010 -5 15 15 15 15 15 15 15 -5 14.720 -10 10 30 30 30 30 30 30 -10 27.630 -15 5 25 45 45 45 45 45 -15 35.940 -20 0 20 40 60 60 60 60 -20 37.750 -25 -5 15 35 55 75 75 75 -25 34.860 -30 -10 10 30 50 70 90 90 -30 30.270 -35 -15 5 25 45 65 85 105 -35 25.3

100π(θ) 1.7 8.7 23.2 32.4 23.2 8.7 1.7 0.4

Tabela 2.2: Funcao de ganho da livraria (em dezenas)

Este e um exemplo muito simples onde a funcao de ganho fica deter-minada pelo valor do ganho lıquido e do ressarcimento por devolucao. Aquantidade demandada (e desconhecida) de livros, θ, aparece discretizadaem multiplos de 10 unidades. Analogamente, para facilitar a exposicao,

Page 43: Análise bayesiana de decisões   aspectos práticos

2.2. ESPECIFICANDO A FUNCAO DE PERDA 29

as encomendas (acoes) tambem estao ordenadas em multiplos de 10. Estee um exemplo onde o numero de possıveis estados da natureza e n(Θ) = 8e existem n(A) = 8 possıveis acoes. Mesmo com estas simplificacoes atarefa de escolher a melhor decisao nao e muito simples, a menos do ca-so do decisor utilizar a regra minimax. Curiosamente, nesse exemplo,a regra minimax e de pouca valia uma vez que sugere que o vendedornao compre nenhum livro (veja a penultima coluna da tabela 2.2). Alemdisso, note que um comerciante poderia ordenar 70 unidades e obter umganho de 1050 u.m. caso todos os livros sejam vendidos. Todavia, seguin-do essa mesma alternativa, existe o risco da perda de 350 u.m. caso asvendas sejam nulas. Intuitivamente, pode ser argumentado, precisaria-seassessar a distribuicao de probabilidade da quantidade incerta - quanti-dade demandada de livros. Para ilustracao, suponhamos que π(θ) paraθ = 0, 10, . . . , 70 sejam aqueles apresentados na ultima linha da tabela2.2. De acordo com essa distribuicao de probabilidade calculamos a ultimacoluna na mesma tabela. De acordo com esses resultados vemos que a de-cisao otima, ou acao de Bayes, e a compra de 40 unidades.

Para mais detalhes sobre a regra minimax veja a secao 2.6. No capıtulo4 mostra-se porque a maximizacao (minimizacao) da utilidade (perda) es-perada e a regra de decisao comumente utilizada em problemas de decisaosob incerteza.

2.2 Especificando a funcao de perda

Nesta secao apresentaremos alguns exemplos de funcao de perda que ocor-rem comumente nas aplicacoes. Iniciaremos com uma classe geral defuncoes de perda, discutiremos os problemas da inferencia estatıstica nocontexto da teoria da decisao e introduziremos dois exemplos de naturezamais aplicada.

Page 44: Análise bayesiana de decisões   aspectos práticos

30 CAPITULO 2. CONCEITOS BASICOS

Uma classe geral de perdas

Defina L(θ, a) = ω(θ)|θ−a|α, onde ω(θ) e uma funcao de peso que dependesomente de θ. Alguns casos especiais serao apresentados no contexto daestimacao de parametros.

Estimacao

Um problema de estimacao fica caracterizado pelo fato de que A = Θ.Uma famılia de funcoes de perda adequada para o problema de estimacaoe dada por L(θ, a) = |θ − a|α. Suponhamos que na famılia de perdasdefinidas anteriormente ω(θ) = 1. Se α = 1 temos a perda absoluta e seα = 2 a popular perda quadratica. Um aspecto importante do problemade estimacao e que os espaco do parametro e das decisoes sao coinci-dentes. A minimizacao da perda esperada nos casos acima e alcancada,respectivamente, pela mediana e pela media da distribuicao de θ. Outrafuncao de perda comum em problemas de estimacao de parametros e adenominada perda zero-um,

L(θ, a) =k se |θ − a| ≥ ε0 se |θ − a| < ε

onde ε > 0 e arbitrario e k e uma constante, em geral unitaria. A regrade decisao de Bayes, neste caso, coincidira com a moda da distribuicaode θ. A figura 2.1 apresenta as tres funcoes de perda citadas acima.

Teste de Hipotese

Este e um outro problema tıpico da inferencia estatıstica. Sua principalcaracterıstica e que tanto o espaco das acoes como o espaco do parametrosao dicotomicos, isto e, A = a0, a1 e Θ = Θ0 ∪ Θ1. As acoes a0 e a1

correspondem as decisoes de aceitar H0 e H1, respectivamente, onde Hi

e a hipotese que afirma que o parametro percente ao sub-espaco Θi, para

Page 45: Análise bayesiana de decisões   aspectos práticos

2.2. ESPECIFICANDO A FUNCAO DE PERDA 31

Figura 2.1: Funcoes de perda alternativas em problemas de estimacao:perda zero-um (linha cheia), perda quadratica (linha pontilhada) e perdaabsoluta (linha tracejada).

i = 0, 1. Nesse contexto, a funcao de perda fica definida por

L(θ, ai) =

0 se θ ∈ Θi

ci caso contrario

onde i = 0, 1. A escolha de c0 6= c1 permite reconhecer que os erros dedecisao podem ter impactos diferenciados. Por exemplo, se o problemaconsiste em decidir, a luz de algumas informacoes, se a economia estanum estado de recessao ou de expansao, os custos associados as decisoeserradas sao naturalmente distintos. Os falsos alarmes podem, claramente,ter custos diferenciados. A solucao deste problema, assumindo-se que π =

Page 46: Análise bayesiana de decisões   aspectos práticos

32 CAPITULO 2. CONCEITOS BASICOS

Pr(θ ∈ Θ0), sera dada pela comparacao das perdas esperadas, r(π, a0) =c0(1 − π) e r(π, a1) = c1π.

Uma pequena generalizacao dessa formulacao, denominada na liter-atura de problema da decisao multipla, consiste em fazer uma particao doespaco do parametro em m classes. Sua solucao sera diretamente obtidaatraves dos conceitos desenvolvidos ao longo desse capıtulo.

Uma outra funcao de perda

Suponha que Θ = θ1, θ2 e que A = a1, a2. Seja a funcao de perda

L(θ, ai) =

0 se θ = θi

θ2i se θ 6= θi,

para i = 1, 2. Entao, para qualquer π(θ), a acao de Bayes sera a1 seE(θ2

1) < E(θ22) e a2 caso contrario. Se E(θ2

1) = E(θ22), entao ambas sao

acoes de Bayes sob π. Para obter este resultado basta lembrar que,

E[L(θ, a1)] =∫

Θ1

θ21

[∫

Θ2

π(θ1, θ2)dθ2

]dθ1 =

Θ1

θ21π(θ1)dθ1 = E(θ2

1)

Funcao de Perda de Esscher

Na literatura de Atuaria aparece com frequencia a funcao de perda deEsscher,

L(θ, a) = exp (γθ)(θ − a)2

onde a ∈ A, θ ∈ Θ ⊂ R+ e γ > 0 e denominado coeficiente de aversaoao risco. E claro que esta especificacao corresponde a um caso particularde perda geral apresentada no comeco dessa sec ao, isto e ω(θ) = exp(γθ)e α = 2. Seja π(θ) uma distribuicao a priori sobre Θ, entao o risco deBayes sera,

r(π, a) = E[L(θ, a)] = E[exp (αθ)(θ − a)2]

Page 47: Análise bayesiana de decisões   aspectos práticos

2.2. ESPECIFICANDO A FUNCAO DE PERDA 33

A minimizacao da funcao de perda satisfara a condicao de primeiraordem,

d

dar(π, a) = 2

∫exp (αθ)(θ − a)π(θ)dθ = 0

de forma queab = E[θ exp (αθ)]/E[exp (αθ)]

A condicao de segunda ordem pode ser facilmente verificada e seradeixada como exercıcio. Esta decisao de Bayes e denominada, no contextoatuarial, de premio de Esscher.

Selecao de um Portfolio

Seja Ψ = a′θ, onde θ e um vetor representando os retornos de k inves-timentos e a = (a1, . . . , ak) o vetor de alocacao de uma riqueza unitaria,tal que ai > 0 para todo i = 1, . . . , k e

∑i ai = 1. A seguinte funcao de

perda e adequada para este problema de diversificacao de risco,

L(θ,a) = exp(αΨ) − 1

Suponhamos ainda que θ ∼ N(µ,Σ). Nestas condicoes, Ψ ∼ N [µΨ, σ2Ψ],

onde µΨ = a′µ e σ2Ψ = a′Σa. Alem disto, exp (Ψ) tera uma distribuicao

log-normal. Assim

E[L(θ,a)] = E[exp(αΨ)]− 1= exp(−αµΨ + α2σ2

Ψ/2) − 1

e, portanto, e facil verificar que

mina

r(Ψ,a) ≡ maxa

µΨ − ασ2

Ψ/2

A interpretacao e clara: deseja-se diversificar obtendo um risco mınimo,isto e variancia mınima, e simultaneamente maximo retorno esperado.

Page 48: Análise bayesiana de decisões   aspectos práticos

34 CAPITULO 2. CONCEITOS BASICOS

Este exemplo e particularmente interessante pois aponta para uma di-ficuldade que ocorre com frequencia. Nossas acoes podem ser julgadasatraves de consequencias multiplas e conflitantes. Neste exemplo dese-jamos claramente maxizar o retorno esperado, todavia restrito a um certonıvel de risco, avaliado pela variancia do retorno do portfolio selecionado.

2.3 Funcao de perda nao negativa

Seja α > 0 uma constante dada e λ(θ) uma funcao real tal que∫

Θλ(θ)π(θ)dθ <∞

Defina a nova funcao de perda como sendo

L0(θ, a) = αL(θ, a) − λ(θ),∀θ ∈ Θ, a ∈ AE claro que uma acao de Bayes, ab sob L(θ, a) tambem sera Bayes sob

L0(θ, a). Defina agora λ0(θ) = mina L(θ, a) e

L0(θ, a) = L(θ, a) − λ0(θ)

E facil ver que a nova funcao de perda e tal que (i) L0(θ, a) ≥ 0 e(ii) mina L0(θ, a) = 0. A seguir apresentamos dois exemplos de situacoescom funcao de perda nao negativa.

Exemplo 2.3 Seja um problema de decisao onde o numero de elementosde A seja 2, isto e n(A) = 2 e que o numero de elementos de Θ tambemseja 2, isto e n(Θ) = 2 e considere a funcao de perda com valores reaisapresentados na tabela 2.3. Segue que λ0(θ1) = −10 e λ0(θ2) = −20. Atabela de perdas pode entao ser reescrita como na tabela 2.4.

Supondo, alem disto, que π(θ1) = 0.7. Entao teremos r(π, a1) = 64 er(π, a2) = 17. Portanto, a2 e a acao de Bayes. Note que r0(π, a1) = 77e r0(π, a2) = 30, de sorte que a2 continua sendo a acao de Bayes, comoesperado.

Page 49: Análise bayesiana de decisões   aspectos práticos

2.3. FUNCAO DE PERDA NAO NEGATIVA 35

EstadosAcoes θ1 θ2

a1 100 -20a2 -10 80

Tabela 2.3: Perdas monetarias (em milhares)

EstadosAcoes θ1 θ2

a1 110 0a2 0 100

Tabela 2.4: Funcao de perda nao negativa (L0(θ, a) = L(θ, a)− λ0(θ))

Exemplo 2.4 Considere um problema com cinco acoes e dois estadosda natureza. Uma tabela envolvendo perdas nao negativas e a tabela 2.5.Vale notar que agora temos uma perda nula para cada um dos estadose com os demais valores extritamente positivos, como ilustrado na tabela2.6.

AcoesEstados a1 a2 a3 a4 a5 mina L(θ, a)θ1 2 4 3 5 3 2θ2 3 0 3 2 5 0

Tabela 2.5: Funcao de perda

O leitor pode facilmente verificar que a1 e a3 sao minimax para atabela 2.5, enquanto a2 e minimax para a tabela 2.6. Voltaremos a esse

Page 50: Análise bayesiana de decisões   aspectos práticos

36 CAPITULO 2. CONCEITOS BASICOS

AcoesEstados a1 a2 a3 a4 a5

θ1 0 2 1 3 1θ2 3 0 3 2 5

Tabela 2.6: Funcao de perda nao negativa

exemplo no secao 2.6 quando revisitarmos a regra minimax e daremosuma justificativa geometria para esse problema.

2.4 Concavidade do risco de Bayes

Nesta secao estudaremos a forma da funcao que descreve o risco de Bayes.Mostraremos que esta e uma funcao concava, o que permitira entre outrascoisas examinar o efeito da imprecisao na especificacao da distribuicao apriori. Introduzimos, na secao 2.1, o risco de Bayes segundo π(θ) (vejadefinicao 2.3), como sendo r(π) = r(π, ab). Este e o valor do risco mınimoou da perda espera mınima sob a distribuicao a priori π.

Definicao 2.4 Sejam π1 e π2 duas densidades sobre Θ e seja α ∈ (0, 1)um escalar. A combinacao linear π = απ1 + (1 − α)π2 e uma novadensidade sobre Θ, chamada de mistura das densidade π1 e π2.

Teorema 2.1 Seja π uma mistura das densidades π1 e π2, sobre Θ, paraα ∈ (0, 1). Entao

r(π) ≥ αr(π1) + (1 − α)r(π2)

Prova:

Page 51: Análise bayesiana de decisões   aspectos práticos

2.4. CONCAVIDADE DO RISCO DE BAYES 37

(i) Mistura de riscos

r(π, a) =∫

ΘL(θ, a)π(θ)dθ =

ΘL(θ, a)[απ1(θ) + (1 − α)π2(θ)]dθ

= αr(π1, a) + (1 − α)r(π2, a)

(ii) Como r(π) = minar(π, a), entao

r(π) = mina[αr(π1, a) + (1 − α)r(π1, a)]

Como o mınimo da soma de duas funcoes nao pode ser nunca menor quea soma dos mınimos individuais, segue que:

r(π) ≥ α minar(π1, a) + (1 − α) minar(π2, a)

= αr(π1) + (1 − α)r(π2)

utA partir dos item (i) e (ii) acima pode ser verificado que a funcao

concava r(π) e o mınimo da famılia de funcoes lineares r(π, a) geradapelas diferentes acoes em A. Ilustracoes graficas sao possıveis no caso emque Θ = θ1, θ2. E claro que nestas condicoes π = Pr(Θ = θ1). Assimr(π) e funcao concava de π ∈ (0, 1) (veja a ilustracao na figura 2.2).

Consequencia da Imprecisao de π

Suponha, ainda no caso de um espaco de acoes com dois elementos so-mente, que a acao a0 seja escolhida a acao de Bayes segundo π0 e suponhaque o verdadeiro valor de π seja, digamos π1. Seja δ = r(π1, a0) − r(π0)o incremento em risco, como ilustrado na figura 2.3. Se a curva r(π) forsuave no entorno de π0, o qual deve conter π1 entao δ sera pequeno.

Page 52: Análise bayesiana de decisões   aspectos práticos

38 CAPITULO 2. CONCEITOS BASICOS

Figura 2.2: Concavidade do risco de Bayes: n(A) <∞ (figura da esquer-da); n(A) = ∞ (figura da direita).

2.5 Problema de decisao com Θ e A finitos

Supor espacos de estados da natureza e de parametros finitos facilitam asilustracoes de algumas propriedades. Poderemos representar graficamenteo conjunto de todas as acoes mistas e estudar suas propriedades. SejamΘ = θ1, · · · , θk e A = a1, · · · , am.Definicao 2.5 Uma decisao mista e definida pela combinacao linear con-vexa de decisoes em A. Esta classe e denotada por M. ObviamenteA ⊂ M e a funcao de perda de uma decisao mista a ∈ M sera dada por:

Li(a) = L(θi, a) =m∑

j=1

pjL(θi, aj), i = 1, · · · , k

Page 53: Análise bayesiana de decisões   aspectos práticos

2.5. PROBLEMA DE DECISAO COM Θ E A FINITOS 39

Figura 2.3: Efeito da imprecisao sobre π: incremento no risco de Bayes

Alternativamente podemos escrever

L(a) = (L1(a), · · · , Lk(a))′ = Lα

para α = (α1, . . . , αm), a = (a1, . . . , am) e L(θi, aj) o (i, j) − esimo ele-mento de L.

Denote por G ⊂ <k o conjunto convexo definido por G = L(a) ∈<k, a ∈ A,p = (p1, · · · , pm)′, pi ≥ 0,

∑pi = 1.

Definicao 2.6 Dominancia e Admissibilidade

(a) Uma acao a ∈ M domina a acao a′ ∈ M se Li(a′) ≥ Li(a),∀θ ∈ Θ.

Se a desigualdade for estrita a dominancia sera dita estrita.

Page 54: Análise bayesiana de decisões   aspectos práticos

40 CAPITULO 2. CONCEITOS BASICOS

(b) Uma decisao a ∈ A e admissıvel se nenhuma outra acao a dominaestritamente. Isto e, se nao existe outra decisao a′ ∈ A tal queLi(a

′) ≤ Li(a), i = 1, · · · , k e Li(a) < Li(a′) para pelo menos um i.

Assim a ∈ M e admissıvel se e somente se pertencer a fronteirade admissibilidade de G. As acoes puras, elementos de A, correspon-dem a distribuicoes de probabilidade sobre A degeneradas, isto e: p =(0, . . . , 0, 1, 0, . . . , 0). Assim os pontos de G correspondendo as acoes emA sao vertices de um poliedro convexo.

Exemplo 2.5 Este exemplo envolve um problema de decisao com m = 6alternativas e k = 2 estados da natureza (Figura 2.4) e perdas dadas pelatabela 2.5.

Figura 2.4: Representacao grafica de G

Page 55: Análise bayesiana de decisões   aspectos práticos

2.5. PROBLEMA DE DECISAO COM Θ E A FINITOS 41

Vale interpretar Li(a), i = 1, · · · , k como centro de gravidade de umsistema de massas com pesos pj em aj, j = 1, · · · ,m. Considere agorauma distribuicao de probabilidade sobre Θ, π(θ) = (π1, · · · , πk)

′, πi ≥0 e

∑πi = 1. Para qualquer decisao a ∈ A obtemos o risco

r(π, a) = π′L(a)

onde π = (π1, · · · , πk)′.

Definicao 2.7 Uma acao ab e Bayes segundo π se e somente se minimizaπ′L(a), a ∈ A

E interessante mostrar que ab pertence a fronteira de Bayes de G. Comoa fronteira admissıvel de G esta contida na fronteira de Bayes segue quetoda decisao admissıvel em M e Bayes para alguma π.

Teorema 2.2 Seja a∗ uma acao em M. O vetor L(a∗) pertence a fron-teira de Bayes de G se e somente se existe alguma distribuicao π sobreΘ tal que a∗ e Bayes segundo π.

Exemplo 2.6 Seja um problema com k = 2 estados da natureza, m = 6alternativas e perdas dadas pelos elementos da tabela abaixo.

AcoesEstados a1 a2 a3 a4 a5 a6

θ1 10 8 4 2 0 0θ2 0 1 2 5 6 10

Tabela 2.7: Funcao de perda nao negativa

Os pontos L(ai), i = 1, · · · , 6 estao plotados na figura 2.5. A fronteiraadmissıvel consiste dos segmentos de reta unindo L1a L3 e L3 a L5. Logo

Page 56: Análise bayesiana de decisões   aspectos práticos

42 CAPITULO 2. CONCEITOS BASICOS

as acoes a1, a3 ea5 ∈ A sao admissıveis. Neste exemplo a fronbteirade Bayes incluira tambem o segmento de reta L5 a L6, de forma que afronteira de Bayes sera constituida pelas acoes a1, a3, a5, a6.

Suponha que deseja-se determinar uma decisao de Bayes segundo apriori π = (1/3, 2/3)′. Considere a equacao da reta L1/3 + 2L2/3 = c,isto e com inclinacao −1/2. Verifique se esta e uma linha de suporte emalgum ponto da fronteira de Bayes. Neste exemplo somente a3 satisfazesta condicao.

E util relembrar que a perda esperada para acoes em M sao da forma:

π′L(a) =k∑

i=1

π(θi)Ep[L(θi, a)]

=k∑

i=1

π(θi)m∑

j=1

pjL(θi, aj)

A decisao de Bayes e obtida como funcao de (p1, · · · , pm) ou dependede m − 1 variaveis. Assim o problema de minimizar a perda esperadaequivale a determinar o mınino de uma funcao m− 1 dimensional.

Para fixar ideias um outro exemplo faz-se necessario. A figura abaixocorresponde ao problema de decisao com m = 5 alternativas e k = 2estados da natureza descrito anteriormente (Tabela 2.4). Expressan-do E[L(θ, ai)] = r(π, ai) como funcao de π ∈ [0, 1], temos as seguinteequacoes:

r(π, a1) = 3 − π

r(π, a2) = 4π

r(π, a3) = 3

r(π, a4) = 3π + 1

r(π, a5) = 5 − 2π

produzindo a figura 2.5

Page 57: Análise bayesiana de decisões   aspectos práticos

2.6. REVISITANDO A REGRA MINIMAX 43

Figura 2.5: Poliedro convexo; caso k = 2 e m = 6

2.6 Revisitando a regra minimax

Uma forma alternativa de ordenar as acoes de um problema de decisao,como ja vimos e exatamente o procedimento minimax. O objetivo agorae mostrar como obter uma acao minimax graficamente e discutir algumasde suas propriedades.

Relembrando, am = argminmaxaL(θ, a). No exemplo 2.4, ondeconcorriam m = 5 alternativas para k = 2 estados da natureza, tinhamosa tabela de perdas com a ultima coluna apresentando o mina L(θ, a) obti-do para cada estado da natureza (tabela 2.6). Podemos agora obter paracada acao o maxθ L(θ, a) (ver a ultima linha da tabela 2.8).

A partir desta coluna e facil ver que as acoes a1 e a3 sao ambas min-

Page 58: Análise bayesiana de decisões   aspectos práticos

44 CAPITULO 2. CONCEITOS BASICOS

AcoesEstados a1 a2 a3 a4 a5

θ1 2 4 3 5 3θ2 3 0 3 2 5maxθ 3 4 3 5 5

Tabela 2.8: Funcao de perda

imax. Se, alternativamente, tivessemos usado as perdas nao negativasteriamos obtido

AcoesEstados a1 a2 a3 a4 a5

θ1 0 2 1 3 1θ2 3 0 3 2 5max 3 2 3 3 5

Tabela 2.9: Funcao de perda nao negativa

Neste caso somente a acao a2 e minimax. Porque esta diferenca? Osgraficos da figura 2.7 apresentam as perdas para as acoes a1 a a5, no planoL(a) = (L1, L2), e servem para esclarecer o que ocorre. Se (L1, L2) saoas perdas em um problema com dois estados da natureza e claro que omaximo das perdas sera L1 se o par (L1, L2) cair abaixo do bissetor e, L2

se o par (L1, L2) cair acima do bissetor (veja figura 2.6).A acao minimax e obtida graficamente movendo-se para cima um

linha horizontal/vertical ate atingir uma das acoes, isto para aquelas aci-ma/abaixo do bissetor do primeiro quadrante. Quando se usa a funcaode perda nao negativa a solucao nao se mantem pois a origem se deslocae entao a primeira acao a ser atingida pelas linhas horizontais/verticais

Page 59: Análise bayesiana de decisões   aspectos práticos

2.6. REVISITANDO A REGRA MINIMAX 45

Figura 2.6: Regra minimax - determinacao grafica

pode mudar.

Para concluir vejamos o que ocorre se tiver diante de acoes mistas.Neste caso o bissetor do primeiro quadrante atingira primeiramente umadas acoes mista que expressam atraves da combinacao linear das acoespura a1 e a2. Mais precisamente a solucao corresponde a escolha deπ = 3/4.

Um ultimo ponto que merece consideracao e que toda decisao de Bayese admissıvel e toda decisao minimax e acao de Bayes. Alem disso, asdecisoes admissıveis sao acoes de Bayes para alguma distribuicao a priori.Segundo DeGroot (1970), um ponto x = (x1, . . . , xk) em G, um conjuntoconvexo, pertence ao limite de admissibilidade de G se nao existir nenhumponto y tambem em G tal que yi ≤ xi para i = 1, . . . , k e yi < xi para

Page 60: Análise bayesiana de decisões   aspectos práticos

46 CAPITULO 2. CONCEITOS BASICOS

Figura 2.7: Regra minimax - determinacao grafica

pelo menos um i. Adicionalmente, um ponto x em G percente ao limitede Bayes se nao existir nenhum ponto y em G tal que yi < xi parai = 1, . . . , k. A figura 2.8 ajuda a visualizar essas questoes e definicoes.

2.7 Problema de decisao usando dados

Seja X uma quantidade aleatoria relacionada com o estado da naturezaθ e considere uma regra de decisao δ(x) , isto e, uma funcao de X , espacoamostral , com valores em A, espaco do parametro. Seja p(x|θ), x ∈ Xa funcao de densidade de X condicional a θ.

Page 61: Análise bayesiana de decisões   aspectos práticos

2.7. PROBLEMA DE DECISAO USANDO DADOS 47

Figura 2.8: Admissibilidade da regra de Bayes

Definicao 2.8 A funcao de risco ou perda esperada sera definida por

r(π, δ) = E[L(θ, δ(x))]

=∫

X

ΘL(θ, δ(x))p(x|θ)π(θ)dθdx (2.1)

onde estamos assumindo que L(θ, δ(x)) e integravel em X e tambem emΘ.

Valer destacar que

(i) ∀a ∈ A, r(π, a) =∫Θ L(θ, a)π(θ)dθ, como definido anteriormente, e

(ii) ∀θ ∈ Θ, r(π, δ(X)) =∫X L(θ, δ(x))π(x|θ)dx

Page 62: Análise bayesiana de decisões   aspectos práticos

48 CAPITULO 2. CONCEITOS BASICOS

Para qualquer regra de decisao δ(x) a funcao r(π, δ(x)) sera denomin-dada de risco de δ. Assim sendo δ∗ sera uma decisao de Bayes se

δ∗ = argminδ(x)

Θr(θ, δ(x))π(θ)dθ

A funcao δ∗(x) sera determinada pela expressao acima para cada x ∈ X .Continuaremos denotando por r(π) = r(π, δ∗) o risco de Bayes sob π.

Construindo a regra de decisao de Bayes

Segunda a expressao 2.1, minδr(π, δ) pode ser obtido minimizando a in-tegral interna para cada x ∈ X . Assim, ∀x ∈ X , obteremos δ∗(x) mini-mizando embfTheta, ∫

ΘL(θ, δ(x))p(x|θ)π(θ)dθ

oup(x)

ΘL(θ, δ(x))p(x|θ)π(θ)/p(x)dθ

onde p(x) =∫Θ p(x|θ)π(θ)dθ. Assim,

r(π, δ) =∫

Xp(x)

[∫

ΘL(θ, δ(x)π(θ|x)dθ

]dx

Exemplo 2.7 Suponha que Θ = θ1, θ2 e A = a1, a2 com perdasapresentadas na tabela 2.10.

A distribuicao a posteriori e obtida facilmente levando em consid-eracao a funcao de verossimilhanca dada pela tabela 2.11.

Como Θ tem somente dois elementos, a distribuicao a priori fica com-pletamente caracterizada por π = Pr(θ1) = 1−Pr(θ2). Usando o teoremade Bayes

π(θ|x) ∝ π(θ)p(x|θ) = q(θ, x)

Page 63: Análise bayesiana de decisões   aspectos práticos

2.7. PROBLEMA DE DECISAO USANDO DADOS 49

L(θ, a) a1 a2

θ1 0 5θ2 10 0

Tabela 2.10: Funcao de perda.

xEstados 0 1θ1 3/4 1/4θ2 1/3 2/3

Tabela 2.11: Funcao de probabilidade, p(x|θ).

obtemos os resultados da tabela 2.12As probabilidades a posteriori serao obtidas da normalizacao dos q(θ, x).

Denotando por ψ(x) = π(θ1|x) teremos:

ψ(x) =q(θ1, x)∑θ q(θ, x)

Assim, qualquer que seja x, os valores esperados das perdas serao

r(π, a1|x) = 10[1 − ψ(x)]r(π, a2|x) = 5ψ(x)

Daı, a1 sera preferıvel a a2 se e somente se r(π, a1) < r(π, a2), o queequivale a dizer que 10[1−ψ(x)] < 10[1−ψ(x)], ou ainda que ψ(x) > 2/3.Suponhamos agora que o resultado experimental tenha sido x = 1. Adecisao de Bayes sera a2 se ψ(1) < 2/3, ou seja,

3π/4

3π/4 + (1 − π)/3< 2/3

Page 64: Análise bayesiana de decisões   aspectos práticos

50 CAPITULO 2. CONCEITOS BASICOS

xq(θ, x) 0 1θ1 3π/4 π/4θ2 (1 − π)/3 2(1 − π)/3

Tabela 2.12: Distribuicao conjunta de θ e x.

logo, a decisao de Bayes sera a2 se π < 8/17. Analogamente, se x = 0 adecisao a2 sera preferıvel se π < 16/19. De uma forma geral teremos,

r(π) =

5π se 0 < π < 8/175π/4 + 10(1 − π) se 8/17 < π < 16/1910(1 − π) se 16/19 < π < 1

permitindo se fazer o grafico do risco de Bayes (Figura 2.9) como funcaode π, a probabilidade a priori.

2.8 Analise de risco

Neste capıtulo discutindo alguns aspectos da analise de risco. Esta e umaarea da analise de decisoes que vem ganhando importancia nos dias atuais.O termo risco e utilizado de uma forma nao sistematica com seu sentidovariando expressivamente nos diferentes ramos de aplicacao. Falamos derisco financeiro, risco medico, risco atuarial etc. Apresentaremos algunscriterios de risco comumente utilizados nessas diferentes areas. Iniciare-mos por um exemplo.

Exemplo 2.8 Suponha que estejamos diante da escolha de uma de duasopcoes:

Page 65: Análise bayesiana de decisões   aspectos práticos

2.8. ANALISE DE RISCO 51

Figura 2.9: Risco de Bayes - exemplo com dados

a1) Apostar num jogo onde ganha-se 1 u.m. se certo evento ocorrer,com probabilidade π ou perde-se 1 u.m., caso contrario, com prob-abilidade 1 − π.

a2) Apostar num jogo onde ganha-se 1000 u.m. se certo evento ocorrer,com probabilidade π ou perde-se 1000 u.m., caso contrario, comprobabilidade 1 − π.

Suponha que π = 1/2. E senso comum que a segunda alternativae mais arriscada do que a primeira, embora do ponto de vista do valoresperado da perda monetaria sejam equivalentes. A segunda alternativaimpoe uma eventual perda de valor expressivo.

Page 66: Análise bayesiana de decisões   aspectos práticos

52 CAPITULO 2. CONCEITOS BASICOS

Os criterios apresentados anteriormente aferem risco atraves da perdaesperada ou do criterio minimax nao levando em consideracao a ampli-tude envolvida nos resultados monetarios associados as varias opcoes.Nas aplicacoes os riscos podem ser avaliados pela probabilidade de certoseventos indesejaveis ou por alguma medida de dispersao. Por exemplo,em risco polıtico o evento poderia ser a expropriacao do capital de umfirma em certo paıs estrangeiro, enquanto que na area de seguro o riscopoderia ser mensurado como a quantidade maxima de u.m. que umaseguradora pode perder em uma certa apolice.

Nas aplicacoes financeiras o conceito de risco confunde-se com o devariabilidade associada a distribuicao dos ganhos ou perdas monetarias.Um exemplo classico esta presente na analise de portfolios onde pretende-se maximizar o retorno esperado sujeito a uma limitacao de variancia(risco). Uma classe de medidas de risco em financas e dada por:

r(aj) =∫ ∞

−∞(y − c)αpj(y)dy

onde aj representa a j-esima acao, y os retornos com densidade pj(y), de-pendendo da acao j e c e um valor crıtico particular, tambem denominadode RaM - retorno aceitavel mınimo. Alguns casos especiais sao,

Variancia

Esta e a medida tradicionalmente usada em decisoes financeiras. Emnosso exemplo anterior sobre a construcao de um portfolio, nosso criterioconsistia em simultaneamente minimizar a variancia e maximizar o re-torno. Esta medida de risco e obtida a partir de nossa definicao geralfazendo-se c = µj = Ej(y) e α = 2.

Page 67: Análise bayesiana de decisões   aspectos práticos

2.8. ANALISE DE RISCO 53

Semivariancia ou Downside-risk

Sua principal vantagem e levar em conta somente o domınio de riscode real interesse, por exemplo os retornos mais baixos. Fica definidapara α = 2 e c um valor crıtico qualquer. Uma definicao alternativadesta medida de risco, frequentemente encontrada na lituratura recentede financas, denominada downside risk - DsR, e definida por:

DsR(aj) =∫ ∞

−∞min(0, y − c)2pj(y)dy

Probabilidade crıtica

Semelhante a semivariancia, mas tendo como medida de risco a probabil-idade, isto e:

V aR(aj) = Pj [y ≤ c] =∫ c

−∞pj(y)dy

Na literatura recente de financas esta quantidade recebe o nome de VaR- value at risk.

Sobra ainda a questao de como comparar as opcoes apos o calculo deuma dessas medidade de risco. Por exemplo, como comparar o par (valoresperado, risco)? Uma possibilidade e definir uma regra de dominancia.Se duas opcoes tem o mesmo valor esperado seleciona-se aquela de menorrisco. Se, por outro lado, duas opcoes tem o mesmo risco, selecione aquelade maior valor esperado. Observa-se assim que a medida de risco podeservir como uma mera restricao num problema de otimizacao.

Exemplo 2.9 As alternativas de investimentos em ativos de risco. Natabela abaixo apresentamos os retornos mensais, em percentagem, obser-vados ao longo de um ano.

Podemos calcular, com base nesses dados, os correspondentes amostraisdas medidas de risco definidas acima, supondo, por exemplo c = 10%.

Page 68: Análise bayesiana de decisões   aspectos práticos

54 CAPITULO 2. CONCEITOS BASICOS

MesesAcoes 1 2 3 4 5 6 7 8 9 10a1 12 17 11 18 17 23 20 19 13 10.3a2 2.71 4.86 5.28 2.28 2.71 .14 1.42 1.86 4.43 5.58

Tabela 2.13: Retornos mensais de dois ativos de risco

Obtendo-se, apos alguns calculos, os resultados da tabela 2.14. Vale no-tar que como todos os retornos do ativo a1 superam c, gerando assimmedidas de risco alternativas nulas. Fica tambem facil ver que o V aR doativo a2 e igual a 1, pois c supera todos seus retornos observados. Por-tanto, as conclusoes sao: o ativo a1 tem risco menor, exceto quando estamedida for a variancia, e retorno medio significativamente maior. Logoa1 sera preferıvel sempre que usarmos umas das medidas alternativas derisco e um valor de c ≤ 10.3%.

Se c = 4% fosse utilizado, teriamos DsR = 2.29 e V aR = .58 paraa2. Decrescendo c, obviamente, as medidas de risco, exceto a variancia,diminuirao. Analogamente, para c = 15% teriamos V aR = 0.33 e DsR =3.59 para a acao a1, com os equivalentes de a2 inalterados. Assim sec = 15% e se a medida de risco utilizada fosse o DsR, a acao a2 seriapreferıvel.

Ativos Media Variancia VaR DsRa1 16.03 18.05 0 0a2 3.13 3.32 1.0 3.32

Tabela 2.14: Retornos e riscos dos ativos a1 e a2

Page 69: Análise bayesiana de decisões   aspectos práticos

2.9. DOMINANCIA ESTOCASTICA 55

2.9 Dominancia estocastica

Em varias situacoes pode ser pouco natural comparar alternativas (de-cisoes) simplesmente atraves de seus retornos (monetarios) esperados.Entretanto, existem situacoes onde se deseja encontrar alternativas quesejam dominantes de maneiras mais gerais e mais abrangentes. Nessasecao introduziremos o conceito de dominancia estocastica de primeira(relativa aos retornos) e segunda ordem (relativa aos riscos). A intuicaobasica e poder encontrar meios para dizer, por exemplo, que ”a dis-tribuicao F produz retornos maiores que a distribuicao G” ou que ”adistribuicao F tem menor risco do que a distribuicao G”. Vejamos umpequeno exemplo para introduzir essas ideias.

Exemplo 2.10 Suponha que, em um problema de decisao, existam trespossıveis acoes, a1, a2, a3, tres possıveis estados da natureza, θ1, θ2, θ3,com ganhos descritos pela tabela 2.15. Pode ser facilmente constatadoque a acao a1 domina a acao a2 pois os retornos sob a1 sao maiores queos retornos sob a1 para todos os possıveis estados da natureza. O mesmoja nao pode ser dito quando se compara a1 e a3 ou a2 e a3.

AcoesEstados a1 a2 a3

θ1 6 3 8θ2 5 4 2θ3 7 6 3

Tabela 2.15: Matriz de ganhos

Essa secao e essencialmente inspirada em Mas-Colell, Whinston, andGreen (1995), que dedica um capıtulo inteiro ao problema de decisao sobincerteza. Outras referencias sobre dominancia estocastica sao: o capıtulo

Page 70: Análise bayesiana de decisões   aspectos práticos

56 CAPITULO 2. CONCEITOS BASICOS

4 de Bunn (1984), Whitmore and Findlay (1978) e, mais recentemente,Levy (1998).

Definicao 2.9 Dominancia Estocastica de Primeira Ordem: Adistribuicao F domina G estocasticamente em primeira ordem se, paratoda funcao nao-decrescente u : < → <,

∫u(x)dF (x) ≥

∫u(x)dG(x)

Pode ser mostrado o seguinte resultado imediato dessa definicao.

Teorema 2.3 F domina G estocasticamente em primeira ordem se esomente se F (x) ≤ G(x) para todo x.

A figura 2.10 ilustra a ideia de dominancia estocastica de primeiraordem. Aqui F domina G pois o grafico da F esta uniformemente abaixodo grafico da G indicando que valores maiores tem maiores probabilidadessob F .

Como pode ser visto, dominancia estocastica nao necessariamente im-plica que todo possıvel retorno em F sera maior que todo possıvel retornoem G. Dominancia estocastica de primeira ordem implica que a media deX sob F , EF (X), e maior que a media de X sob G, EG(X). O contrarionao e necessariamente verdadeiro, isto e, EF (X) ≥ EG(X) nao implica emF ser estocasticamente dominante com relacao a G. Isso se deve ao fatode toda a distribuicao ser relevante quando se fala em dominancia. Umasegunda forma de dominancia pode ser definida se quisermos compararos riscos (dispersao) associados as distribuicoes dos retornos. Intuitiva-mente, dizemos que G(.) e mais arriscada que F (.) quanto todo tomadorde decisoes averso ao risco preferir

Definicao 2.10 Dominancia Estocastica de Segunda Ordem: Se-jam F e G, tais que EF (X) = EG(X). A distribuicao F domina G

Page 71: Análise bayesiana de decisões   aspectos práticos

2.9. DOMINANCIA ESTOCASTICA 57

Figura 2.10: F domina G estocasticamente em primeira ordem.

estocasticamente em segunda ordem se, para toda funcao concava nao-decrescente u : <+ → <,

∫u(x)dF (x) ≥

∫u(x)dG(x)

Uma forma alternativa de caracterizar dominancia de segunda ordeme atraves do conceito de mean-presearving spread (espalhamento compreservacao da media). Considere a seguinte loteria composta em doispassos:

1. Um premio intermediario x e sorteado a partir da distribuicao F (.)

2. Ao premio x e acrescido o valor z (que pode ser negativo). Esse

Page 72: Análise bayesiana de decisões   aspectos práticos

58 CAPITULO 2. CONCEITOS BASICOS

ultimo e sorteado a partir de uma distribuicao Hx(.) com medianula, de sorte que x+ z tambem tenha media x

Denote por G(.) essa loteria composta. Quando uma loteria G puderser obtida a partir de uma outra loteria F , para alguma Hx, diz-se que Ge um espalhamento de F com preservacao da media. O exemplo abaixoilustra essa nova ideia Mas-Colell, Whinston, and Green (1995).

Exemplo 2.11 Seja F a funcao de distribuicao com massas iguais em2 e 3. Entao a funcao de distribuicao, G, com massas iguais em 1,2,3,4e um espalhamento de F com preservaca da media (veja a figura 2.11).

Figura 2.11: G e um espalhamento de F com preservacao da media.

Page 73: Análise bayesiana de decisões   aspectos práticos

2.9. DOMINANCIA ESTOCASTICA 59

Se u(.) e concava,

∫u(x)dG(x) =

∫ (∫u(x+ z)dHx(z)

)dF (x)

≤∫u(∫

(x+ z)dHx(z))dF (x)

=∫u(x)dF (x)

e pode ser mostrado que o seguinte resultado e valido.

Teorema 2.4 G(.) e um espalhamento de F com preservacao da media eequivalente a dizer que F domina G estocasticamente em segunda ordem

Nos proximos capıtulos formalizaremos o conceito de funcao de utili-dade, probabilidade subjetiva, entre outros. Veremos, por exemplo, quenem sempre a utilidade do dinheiro, ou de qualquer outro bem, pode sermedida atraves do valor do dinheiro.

Page 74: Análise bayesiana de decisões   aspectos práticos

60 CAPITULO 2. CONCEITOS BASICOS

Page 75: Análise bayesiana de decisões   aspectos práticos

Capıtulo 3

Modelos Graficos

3.1 Introducao

Neste capıtulo iremos apresentar varios instrumentos graficos disponıveispara facilitar a modelagem de problemas complexos de decisao.

Iniciaremos pela descricao das redes Bayesianas e depois apresentare-mos os diagramas de influencia e as arvores de decisao. Os diagramasde influencia sao grafos acıclicos direcionados (DAG). Incluem como casoespecial as redes Bayesianas de probabilidade, as quais serao exemplifi-cadas ao longo deste texto. As arvores de decisao representam igualmenteproblemas de decisao considerando eventuais assimetrias, o que facilitaa sua implementacao computacional. Um caso particular de arvore dedecisao servira para a simples descricao grafica de distribuicoes conjuntasde probabilidade.

Serao tambem apresentados neste capıtulo os principais aspectos dospacotes DPL - data programming language e um exemplo envolvendo ouso do WinBUGS - Bayesian analysis using Gibbs sampler. O primeiroimplementa um problema de decisao estatıstica atraves de diagrama deinfluencia (DI) e arvores de decisao (AD). Varias facilidades de analise

61

Page 76: Análise bayesiana de decisões   aspectos práticos

62 CAPITULO 3. MODELOS GRAFICOS

sao encontradas neste pacote como, por exemplo, analise de sensibilidade,interface com planilhas eletronicas, simulacoes de Monte Carlo, etc. OBUGS por seu turno descreve modelos probabilısticos complexos a partirde um DAG, permitindo que as inferencias e previsoes sejam realizadaspor metodos de simulacao estocastica. Sua estrutura e tao ampla quemereceria ser descrito num capıtulo proprio, o que foge aos propositosdeste texto. Finalmente, na area de redes Bayesianas mencionamos oHugin e o JavaBayes, os quais permitem a avalicao de probabilidadescondicionais de forma simples. Atraves deles e possıvel calcular proba-bilidades marginais das variaveis de interesse, bem como executar analisede robustez ou de sensibilidade.

Modelos graficos constituem uma ferramenta natural para lidar comproblemas que envolvem incerteza e complexidade. Podem, resumida-mente, ser caracterizados como uma fusao perfeita entre a teoria de prob-abilidades e a teoria de grafos. Portanto, modelos graficos sao merosgrafos onde os nos sao variaveis aleatorias e a ausencia de arcos represen-ta alguma hipotese de independencia condicional. Existem duas classesde modelos graficos: os baseados em grafos nao direcionados e aque-les baseados em grafos direcionados. Os primeiros, incluem os modelosde campos aleatorios Markovianos e os ultimos, as denominadas redesBayesianas e os diagramas de influencia. Um exemplo de grafo nao dire-cionados em estatıstica ocorre em modelos log-lineares. Nesta monografiaso utilizaremos modelos baseados em grafos direcionados.

Iniciaremos o capıtulo com a discussao de redes Bayesianas. Aposapresentar os principais conceitos envolvidos discutiremos um exemplobastante simples. A seguir, os principais modelos de decisao sob incertezaserao apresentados, incluindo os diagramas de risco simples, informacaoimperfeita, decisoes sequenciais, modelos com multi-atributos e diagra-mas de calculos intermediarios. Concluiremos com uma ampla discussaodo uso do DPL, incluindo um exemplo razoavelmente complexo. As re-ferencias mais influentes neste capıtulo sao Clemen (1996) e Golub (1997)

Page 77: Análise bayesiana de decisões   aspectos práticos

3.2. REDES BAYESIANAS 63

no que se refere aos conceitos de diagramas de influencias e Murphy (2001)e Jensen (1998), nos conceitos de modelos graficos e, em particular, emredes Bayesianas.

3.2 Redes Bayesianas

Os modelos de redes Bayesianas sao grafos direcionados nos quais osnos representam variaveis aleatorias e a ausencia de arcos, suposicoes deindependencia condicional (Murphy, 2001). Um arco de A para B podeinformalmente ser interpretado como A causando B. Frequentemente,nao se permite a ocorrencia de ciclos. Denomina-se de pais de certo no atodos aqueles nos que o influenciam diretamente ou o antecedem. Assimdado seus pais um no, ν, e independente de todos os demais nos do grafo,exceto os que sao seus descendentes. Uma afirmacao de independenciacondicional envolvida na estrutura de uma rede Bayesiana e de que um noe independente dos ascendentes de seus pais. Estes sao conceitos ligadosa uma particular topologia ordenando os nos.

Exemplo 3.1 Consideremos o exemplo da figura 3.1, onde os nos saovariaveis aleatorias binarias. Denote porM a variavel aleatoria “a gramaesta molhada”, por N , o “tempo esta nublado”, por C, o evento “estarchovendo” e por G, o evento “girador d’agua esta ligado”.

O evento M tem duas causas possıveis: G ou C. Isto e, a grama estaramolhada por conta do girador d’agua estar ligado ou por estar choven-do. As probabilidades condicionais P [M |G,C] refletem a forca dessasrelacoes. Como o no N nao possui pais, suas probabilidades condicionaisserao denominadas de probabilidades a priori. Por exemplo, P [N = 1] =.5, P [G = 1|N = 1] = 0.1, P [M = 1|G = 1, C = 1] = 0.99. Observe queM ⊥ N |G,C. Pelas regras basicas de probabilidade teremos:

P [N,G,C,M ] = P [N ] × P [G|N ] × P [C|N,G]× P [M |N,G,C]

Page 78: Análise bayesiana de decisões   aspectos práticos

64 CAPITULO 3. MODELOS GRAFICOS

Figura 3.1: Rede Bayesiana: cada no refere-se a uma variavel aleatoriadicotomica

entretanto a topologia do grafo associado a este exemplo permite usar asindependencia condicional para obter-se:

P [N,G,C,M ] = P [N ] × P [G|N ] × P [C|N ]× P [M |G,C]

ou seja: C ⊥ G|N e M ⊥ N |G,C.A partir do modelo descrito pelo DAG desejamos fazer inferencias,

isto e, calcular probabilidade de alguns nao observaveis com base nos da-dos observados. Podemos distinguir duas operacoes complementares: di-agnostico e predicao. No primeiro, observamos as folhas do grafo e faze-mos inferencias sobre as causas. No exemplo anterior teriamos P [G =1|M = 1] representando a probabilidade do girador estar ligado consid-erando-se que a grama esta molhada e, tambem, P [C = 1|M = 1]. Pode-riamos decidir qual a causa mais provavel da grama estar molhada. Aoutra situacao corresponde a predizer, com base nas causas, o estado fi-nal de algumas variaveis de interesse. Por exemplo: qual a probabilidade

Page 79: Análise bayesiana de decisões   aspectos práticos

3.2. REDES BAYESIANAS 65

da grama estar molhada dado que o girador esta ligado mas nao estachovendo – P [M = 1|G = 1, C = 0].

A complexidade computacional decorre sobretudo da avaliacao daconstante de normalizacao envolvida na aplicacao do teorema de Bayes.Varios algorıtmos sao apresentados na literatura para lidar com o prob-lema da eliminacao de variaveis.

Para concluir esta secao apresentaremos o DAG de um problema es-tatıstico razoavelmente complexo onde os nos envolvemvariaveis aleatoriascontınuas.

Exemplo 3.2 Modelo Fatorial Consideremos a seguinte estrutura.

yt|ft ∼ N(βft,Σ)

ft ∼ N(0, I)

onde yt e um vetor m-dimensional, ft e um vetor k-dimensional de fa-tores comuns e Σ e uma matriz de variancia-covariancias de dimensaom × m, geralmente diagonal. Em geral k e bem menor que m de for-ma que o modelo trata de explicar um vetor de alta dimensao a partirde combinacoes lineares de aspectos de menor dimensao nao observaveis(daı o nome fatores comuns). Note que o modelo acima descreve a es-trutura de variabilidade marginal de yt, a quantidade observavel, atravesde ββ ′ + Σ. Varias simplificacoes deste modelo sao possıveis. Por ex-emplo, se Σ = σ2Im entao, condicionalmente a ft as componentes deyt serao tambem independentes e possuirao a mesma variancia. A redeBayesiana ilustrada na figura 3.2 descreve este modelo. Se σ2 → 0 entaoa estimacao de maxima verossimilhanca de β sera dada pelos m autove-tores principais, isto e, correspondente aos maiores autovalores da matrizde covariancia amostral.

Na figura 3.3 apresentamos o algoritmo escrito (automaticamente)pelo WinBugs para o DAG da figura 3.2. Nesse contexto, Σ e diagonal

Page 80: Análise bayesiana de decisões   aspectos práticos

66 CAPITULO 3. MODELOS GRAFICOS

Figura 3.2: Rede Bayesiana para o modelo fatorial.

com elementos σ2j = τ−2

j , para j = 1, . . . ,m, na diagonal principal. Ainformacao a priori, assim como na figura 3.2, e tal que,

τ 2j ∼ Gama(v0j, v0s

20j)

βj ∼ N(m0j, C0j)

para j = 1, . . . ,m e hiperparametros v0j, s20j,m0j e C0j fixos para j =

1, . . . ,m.

Page 81: Análise bayesiana de decisões   aspectos práticos

3.2. REDES BAYESIANAS 67

model;

for( j in 1 : M )

for( i in 1 : T )

y[i , j] ~ dnorm(m[i , j],tau2[j])

for( j in 1 : M )

for( i in 1 : T )

m[i , j] <- beta[j] * f[i]

for( j in 1 : M )

for( i in 1 : T )

f[i] ~ dnorm( 0.0, 1.0)

for( j in 1 : M )

tau2[j] ~ dgamma(v0[j],v0s02[j])

for( j in 1 : M )

beta[j] ~ dnorm(m0[j],C0[j])

Figura 3.3: Modelo fatorial estatico no WinBugs.

Page 82: Análise bayesiana de decisões   aspectos práticos

68 CAPITULO 3. MODELOS GRAFICOS

Mais referencias e detalhes a repeito dos modelos fatoriais (estaticosou dinamicos) podem ser encontrados na tese de doutorado do segundoautor (Lopes 2000), alem de Lopes, Aguilar, and West (2000) e Lopesand Migon (2002). Num contexto mais especıfico, o seguinte exemploilustra uma aplicacao recente de modelos fatoriais dinamicos para dadosde mercados acionarios latino americanos.

Exemplo 3.3 Um tema bastante atual em financas e a forma com queos mercados acionarios se contagiam em perıodos de crises. Os anos 90forem repletos de tais eventos: Efeito Tequila em 1994, Gripe Asiatica em1997, Resfriado Siberiano em 1998, e a Febre Brasileira de 1999. Numestudo recente (Lopes and Migon 2002), analisamos dados de quatro mer-cados latino-americanos, alem dos Estados Unidos. Foram observadas astaxas de retorno diarias dos ındices IBOVESPA, MEXBOL, MERVALe IPSA, alem do Dow Jones, no perıodo de agosto de 1994 a fevereirode 2001, num total de 1484 observacoes. Um modelo de analise fato-rial com volatilidade estocastica com parametros variando no tempo foidesenvolvido e aplicado.

3.3 Diagrama de influencia e arvore de de-

cisao

Nesta secao descreveremos os modelos basicos de decisao e suas represen-tacoes atraves de diagramas de influencia e arvores de decisao. Estes doisdiagramas sao de alguma forma complementares. Os primeiros sao maisuteis na etapa de modelagem enquanto que as AD sao mais adequadaspara se implementar a solucao otima atraves do algorıtmo de inducao detras para diante (backward induction). Este, como ja comentamos, inter-cala operacoes de esperanca, para eliminar incertezas, com operacoes demaximizacao para escolher as acoes que maximizem a utilidade esperada.

Page 83: Análise bayesiana de decisões   aspectos práticos

3.3. DIAGRAMA DE INFLUENCIA E ARVORE DE DECISAO 69

Alem disto, como os diagramas de influencia sao muito mais compactosna descricao da estrutura do problema, serao preferıveis para a comu-nicacao, sobretudo, com pessoas nao tecnicas envolvidas na analise dedecisao de um problema. As solucoes otimas independem da escolha feitapara representacao de nossos problemas posto que os DI e as arvores dedecisao sao isomorfos. Varios metodos foram prospostos para a solucaodo diagrama de influencia como, por exemplo, o algoritmo proposto porShachter (1986) o qual permite a avaliacao do diagrama de influencia semser necessario transforma-lo em uma arvore de decisao.

Um sımbolo especial sera utilizado para representar cada uma dascomponentes da tripla que caracterisa um problema de decisao - Θ-espacodos estados da natureza, A - espaco das acoes e L(a, θ) - a funcao de per-da. Os eventos incertos serao representados por cırculos, as decisoes porretangulos e os valores assumidos pela funcao de perda ou consequenciaspor retangulos com as arestas arredondadas.

Dois tipos de arcos – os de sequencia e os de relevancia – caracteri-zam um diagrama de influencia. Esta nomeclatura e particularmente utilna descricao dos algorıtimos eficientes para a solucao de diagramas deinfluencia.

Definicao 3.1 Um arco e dito de sequencia se aponta para um no de-cisorio e sera denominado de relevancia se aponta para um no de chanceou de consequencia.

Assim um no de relevancia indica que o predecessor e fundamen-tal para descrever as incertezas referentes aos eventos incertos. Porseu turno os arcos de sequencia prestam-se para descrever informacoesdisponıveis no momento de se tomar decisoes. Esses conceitos sao partic-ularmente importantes para o desenvolvimento de algorıtmos eficientespara a solucao dos diagramas de influencia.

Com estes conceitos mınimos a mao, passaremos a descrever algunsdiagramas de influencia uteis para representar componentes de um prob-

Page 84: Análise bayesiana de decisões   aspectos práticos

70 CAPITULO 3. MODELOS GRAFICOS

lema de decisao complexo. Nos limitaremos aos aspectos estatısticos ede aplicacao da analise de decisao. Muitos desenvolvimentos na area demodelos graficos ocorrem na fronteira da estatıstica, matematica aplicada– grafos – e em ciencia da computacao.

Risco Basico

Este e o modelo mais simples de tomada de decisao sob incerteza. E utilpara representar decisoes de investimentos e, tambem, na area atuarial,por exemplo quando temos de decidir se contratamos ou nao um seguropara nossos bens.

No problema de decisao de risco basico, a satisfacao do decisor e funcaoda acao escolhida e de um evento incerto. Seu diagrama de influencia eextremamente simples. As possıveis acoes estao representadas por umretangulo, o evento incerto por um cırculo e as consequencias por umretangulo com bordas abauladas. Os arcos orientados conectam as acoese os eventos incertos ao retangulo de bordas abauladas, que representa asconsequencia, descrevendo a relacao funcional existente (figura 3.4). Nasredes Bayesianas de probabilidades nao apareciam os nos decisorias e deconsequencias caracterizando uma tenue diferenca entre estes instrumen-tos.

No exemplo atuarial poderıamos ter a decisao de adquirir um segurode vida de certo valor, as incertezas seriam traduzidas pelas taxas demortalidade e as consequencias descritas por alguma medida do suportefinanceiro da famılia.

Uma pequena variante deste modelo mais simples, que denomiremosde polıtica de risco basico, inclue um arco conectando as acoes aocırculo que representa os estados da natureza ou eventos incertos. Emalguns problemas a acao escolhida influencia as probabilidades sobre oseventos incertos (figura 3.5). Este fato sera descrito pela inclusao de umarco de relevancia conectando o no de decisao ao no aleatorio.

Page 85: Análise bayesiana de decisões   aspectos práticos

3.3. DIAGRAMA DE INFLUENCIA E ARVORE DE DECISAO 71

Figura 3.4: DI para risco basico: decisao primaria (a), evento incerto (θ)e consequencias (c)

Figura 3.5: DI para polıtica de risco basico

Page 86: Análise bayesiana de decisões   aspectos práticos

72 CAPITULO 3. MODELOS GRAFICOS

Estes dois modelos poderiam ser representados atraves de uma arvorede decisao. Um exemplo de arvore de decisao mais concreto seria o deum problema de investimento. Suponha que temos somente duas alter-nativas: realizar um investimento em ativo de risco ou nao. Os estadosda natureza representam as possibilidades de um excelente retorno ouuma derrocada. Nao investindo obterıamos o retorno de um ativo livrede risco, por exemplo a caderneta de poupanca. Assim terıamos:

Figura 3.6: AD para investimento em ativo de risco: a decisao primariaseria investir ou nao, o evento incerto caracterizaria o sucesso ou fracassodo investimento e a consequencia seria o montante auferido.

Vale notar que neste exemplo a arvore de decisao permite facilmenteconsiderar a assimetria presente no processo de decisao. Uma dasalternativas promove um ganho pequeno, porem certo. Esta e uma dasvantagens da arvore de decisao em relacao ao diagrama de influencia, aqual se torna relevante quando se esta diante de um problema de altacomplexidade.

Uma pequena variante seria uma arvore de decisao para um modelo

Page 87: Análise bayesiana de decisões   aspectos práticos

3.3. DIAGRAMA DE INFLUENCIA E ARVORE DE DECISAO 73

de risco basico duplo. Temos, como no exemplo anterior, somenteduas acoes alternativas. Por exemplo, investir num ativo de risco ou, porexemplo, numa ativo real. Ambos podem gerar como consequencia umexcelente retorno ou nao.

Modelo de Informacao Imperfeita

Em muitas situacoes desejamos descrever no processo de tomada de de-cisoes a possibilidade de se obter informacoes imperfeitas sobre eventosincertos, os quais afetam, obviamente, as consequencias decorrentes daescolha das acoes otimas. A origem dessas informacoes pode ser de pelomenos tres naturezas: previsoes, diagnosticos ou estimacao. Frequente-mente, provem de um especialista ou de um modelo computacional, emgeral de natureza estatıstica. Incluiremos um novo no aleatorio para rep-resentar a informacao imperfeita o qual recebera um arco com origem nono aleatorio e originara outro com destino ao no decisorio. O primeirosera um arco de relevancia e o outro de sequencia.

Diagramas de calculos intermediarios

A principal caracterıstica dos diagramas de influencia para calculos inter-mediarios e que nao envolvem nos aleatorios. Limitam-se a representarrelacoes estruturais entre nos de constantes ou de calculo.

Antes de prosseguir seria util apresentarmos um exemplo envolvendoum diagrama de influencia com certa complexidade. Este e um exemploextraıdo do livro de Clemen (1996).

Exemplo 3.4 Uso de certo Produto QuımicoUma agencia de protecao ambiental, frequentemente, deve decidir se

autoriza ou nao o uso de um certo produto quımico, economicamenteviavel, mas que pode ter efeitos cancerıgenos. As decisoes serao tomadascom informacoes imperfeitas sobre os riscos a saude e os benefıcios de

Page 88: Análise bayesiana de decisões   aspectos práticos

74 CAPITULO 3. MODELOS GRAFICOS

Figura 3.7: DI e AD para informacao imperfeita.

Figura 3.8: DI para calculos intermediarios; uma situacao de objetivosmultiplos sem decisao de risco.

Page 89: Análise bayesiana de decisões   aspectos práticos

3.3. DIAGRAMA DE INFLUENCIA E ARVORE DE DECISAO 75

longo prazo. Os diferentes cursos de acao incluem conceder a permissaode uso, autoriza-lo com restricao ou nao autorizar o uso. Do lado es-tatıstico devemos realizar ensaios clınicos para determinar o potencialcancerıgeno do produto quımico e levantar, atraves de pesquisa, o grau deexposicao de seus usuarios ao produto quımico. Esses dados sao muitoimportantes pois, por exemplo, se o produto for suavemente toxico e se ataxa de exposicao for pequena entao e razoavel decidir por um uso restrito.Deseja-se deteminar um nıvel de utilizacao do produto de forma a atenderos objetivo de maximizar o valor economico do uso e, simultaneamente,minimizar o custo do cancer.

Figura 3.9: DI agregado sobre o uso de quımico. uso: nıvel de utilizacaodo produto quımico, risco: risco de cancer, valor: valor economico, ψ:potencial cancerıgeno e λ: taxa de exposicao ao produto quımico.

Alem do nıvel de utilizacao do produto quımico as quantidades incer-tas, potencial cancerıgeno e taxa de exposicao ao produto afetam o riscode cancer, o qual permitira o calculo do custo do cancer. Assim teremosum segundo diagrama de influencia para calculos intermediarios (figura

Page 90: Análise bayesiana de decisões   aspectos práticos

76 CAPITULO 3. MODELOS GRAFICOS

3.10).

Figura 3.10: DI para calculo do risco de cancer

Falta ainda incorporar as informacoes imperfeitas provenientes dostestes de potencial cancerıgeno e das pesquisas para determinacao do graude exposicao ao toxico. Observe que teremos um arco conectando a quanti-dade desconhecida - potencial cancerıgeno - ao no estocastico que descreveo teste de ensaio clınico para sua determinacao. Assim, denotando-se opotencial cancerıgeno por ψ, o teste tera uma distribuicao denotada porT |ψ. Da mesma forma, denotamos a quantidade nao observavel, taxade exposicao, por λ e por S|λ, a informacao imperfeita decorrente dapesquisa de exposicao ao produto. E importante observar que tanto ψquanto λ afetam o risco de cancer. Este exemplo demonstra a efetivi-dade do uso de diagramas de influencia na estruturacao de um problemade decisao. Embora este seja relativamente complexo, seu diagrama deinflencia e compacto e de facil compreensao.

Page 91: Análise bayesiana de decisões   aspectos práticos

3.3. DIAGRAMA DE INFLUENCIA E ARVORE DE DECISAO 77

Decisoes sequenciais

Estas surgem em modelos complexos onde as decisoes estao implicitaou explicitamente ordenadas temporalmente. As condicoes decisorias semodificam dinamicamente, de sorte que e plausıvel assumir que alterna-tivas selecionadas em certo momento poderao ser revisadas em instantesfuturos. Uma caracterıstica basica dessas estruturas e que as decisoesse sucedem, umas influindo nas outras, e as consequencias quando mon-etarias devem ser resumidas num unico valor obtido da aplicacao do con-ceito de valor presente a cada uma das parcelas. Para isto utiliza-se umfator de desconto, em geral suposto temporalmente invariante e conheci-do precisamente. Um exemplo, para motivar, poderia ser aquele de uminvestidor que antes de se decidir pelo investimento em certo ativo derisco prefere contratar os servicos de um consultor que o orientara. As-sim antes de mais nada, ele se coloca uma nova questao: deve ou naocontratar um consultor? Sera que o custo dessas informacoes imperfeitase aceitavel, face ao conteudo de informacao disponibilizado?

Figura 3.11: Diagrama de influencia para decisoes sequenciais

Page 92: Análise bayesiana de decisões   aspectos práticos

78 CAPITULO 3. MODELOS GRAFICOS

Para completar esta secao destacaremos alguns erros comumente cometi-dos na elaboracao dos diagramas de influencia. E bom comecar distin-guindo um diagrama de influencia de um fluxograma. Um fluxogramalimita-se a descrever sequencialmente atividades e eventos, enquanto queum DI descreve um instantaneo de um processo decisorio levando emconsideracao todos os elementos envolvidos nas decisoes imediatas. Umsegundo erro comumente cometido e conectar os nos de chance ao nodecisorio na tentativa de representar que as decisoes sao tomadas em am-biente de incerteza. Como vimos um arco em direcao a um no decisoriorepresentara alguma forma de informacao disponıvel ao tempo de se es-colher as decisoes. Estes sao arcos de sequencia, indicando portanto queo decisor deve aguardar a resolucao dessas incertezas antes de decidir.Finalmente, nao e permitido incluir ciclos em DI. Estes prestam-se pararepresentar alguma forma de feedback (retroalimentacao). Como nossosDI representam um instantaneo do processo decisorio nao havera oportu-nidade para se considerar feedback.

3.4 Introducao ao DPL

Como ja amencionamos o DPL - Decision Programing Language e umdos softwares disponıveis para modelar e resolver problemas de analisede decisoes atraves de diagramas de influencia e arvores de decisoes. De-screveremos nesta secao alguns aspectos introdutorios da versao de es-tudante – DPL - Student version release 4.01.00, Copyright 1989-1998-Applied Decision Analysis LLC, Pricewaterhouse Coopers LLP. Este e umproduto Windows based incorporando, portanto, suas facilidades usuais.O sistema permite definir projetos – conjuntos de tarefas – que podemser salvos a cada sessao. Alem disto, podemos exportar ou importar com-ponentes de um projeto, o que pode ser util quando, por exemplo, umdiagrama de influencia de um projeto deva ser incluıdo em outro. Existeum modulo de programacao e facilidades de comunicacao com planil-

Page 93: Análise bayesiana de decisões   aspectos práticos

3.4. INTRODUCAO AO DPL 79

has. Um sistema de ajuda e varias facilidades tıpicas do Windows estao,tambem, disponıveis. Nos limitaremos nesta secao, a introduzir os princi-pais conceitos envolvidos na janela relativa ao interface grafico do sistema- DPL draw window, o qual estara automaticamente disponıvel na versaoque estaremos utilizando.

Como ja dissemos apresentaremos somente os comandos essenciaspara resolver um problema introdutorio de decisoes. Detalhes adicionaispoderao ser encontrados no proprio help do sistema.

Aspectos basicos

Na barra de comandos encontram-se os sımbolos graficos necessarios paraa elaboracao de um diagrama de influencia: retangulo amarelo pararepresentar o espaco das acoes, cırculo verde para descrever o espaco dosestados da natureza, retangulo abaulado azul claro e arco magenta paraindicar relacoes ou condicionamento entre os elementos.

Ao se clicar com o botao da esquerda do mouse sob um elementografico (no) se abrira uma caixa onde podemos atribuir nomes, valores,comentarios e coneccoes. Na atribuicao de valores existe uma linha paraa introducao de formulas. Esta se utiliza de funcoes especiais do sistema(sımbolo f , a esquerda) e das variaveis disponıveis (idem, ν).

Neste momento, o melhor sera apresentar um pequeno exemplo.

Exemplo 3.5 Em certa manha de setembro, ao se preparar para sairem direcao a universidade voce devera decidir se leva ou nao um guarda-chuva. E claro que podera chover ao longo de seu trajeto. Nesta epocado ano, voce atribui probabilidade de 0.6 de se ter um dia ensolarado. Asconsequencias associadas as estas decisoes e estados da natureza decor-rem de dois fatos: os incovenientes de se tomar chuva (roupa molhada,resfriado etc) e o fato de que voce costuma perder seu guarda-chuva sis-tematicamente, tendo de gastar preciosos reais na compra de outro.

Page 94: Análise bayesiana de decisões   aspectos práticos

80 CAPITULO 3. MODELOS GRAFICOS

Temos dois objetivos distintos denominados: catastrofe para represen-tar o quao desagradavel sera voce assistir as aulas com as roupas molhadase conveniencia para descrever o seu desagrado em carregar um guarda-chuva e eventualmente perde-lo. Suponhamos que os ganhos associadosao primeiro desses objetivos sejam de 100 unidades, em geral, e 0 quandochove e voce nao levou o guarda-chuva. Com relacao ao segundo ob-jetivo o ganho sera de 100 unidades se voce nao levar o guarda-chuvae de 0 se o levar. Note que o no denominado catastrofe e funcao dosnos guarda-chuva e chove, denominacoes escolhidas para o nos que rep-resentam, respectivamente, o espaco das acoes e dos estados da natureza.Finalmente, suponha que Voce julga que a importancia relativa dessesdois objetivos esta na razao de 4 para 1 a favor do no catastrofe. Istosignifica que voce considera 4 vezes mais relevante o primeiro objetivo doque o segundo. Assim, voce devera construir um no denominado satis-facao total poderando os valores dos nos de catastrofe e conveniencia compesos 4

4+1= 0.8 e 0.2, respectivamente.

O pacote disponibilizara uma tela com tres janelas. A da esquerda eo modulo grafico. Na parte superior voce podera descrever seu diagra-ma de influencia. No presente exemplo deveremos pegar, na barra deferramentas, uma caixa amarela para representar o no de decisoes, tresretangulos com vertices abaulados e de cor azul clara para representar asconsequencias e um cırculo verde para o evento incerto. Arcos devem serutilizados para conectar os nos convenientemente. Por exemplo, os nosde chance e decisorio se conectam com o no catastrofe, enquanto que so-mente o no decisorio se conectara com o no conveniencia. Finalmente,os nos de objetivo se conectam ao no satisfacao total.

Ao se clicar sobre um no ele assumira a cor magenta. Clicando duasvezes seguidas se abrira uma tela com possibilidades de se atribuir nomes,os quais sao sensitivos a letras minusculas e maiusculas, e valores aos nos,como ja mencionado. Apos atribuir nome aos nos deveremos introduziros valores das consequencias e das probabilidades.

Page 95: Análise bayesiana de decisões   aspectos práticos

3.4. INTRODUCAO AO DPL 81

Figura 3.12: Diagrama de influencia

Neste ponto e importante destacar dois cuidados:

i) na tela de dados do no catastrofe temos, inicialmente, de definir queseus resultados sao condicionados aos nos chove e guarda-chuva,para, a seguir, atribuir o valor das consequencias a cada uma dasalternativas possıveis.

ii) na tela geral de um no de chance este, inicialmente aparecera comtres alternativas possıveis. Devemos, no nosso exemplo, eliminaruma delas e depois associar as probabilidades desejadas.

Introduzindo os valores mencionados no texto passamos a ter o dia-grama completo.

Na barra superior de comandos, no tıtulo Analysis encontramos o co-mando run. Clicando nele obtemos o resulatado:

Duas facilidades adicionais, que serao retomadas nos proximos capıtu-los sao: analise de sensibilidade e valor esperado da informacao perfeita.

Page 96: Análise bayesiana de decisões   aspectos práticos

82 CAPITULO 3. MODELOS GRAFICOS

Figura 3.13: Resultado final

Analise de sensibilidade

Para se realizar uma analise de sensibilidade sobre o valor da probabi-lidade de chover devemos, inicialmente, criar uma caixa com a variavelque representara a probabilidade do evento, digamos π, e trocar no nochuva a probabilidade de chover de 0.4 para π. A seguir poderemos rodaro rainbow diagram clicando em Analysis. Este fara o valor de π variar nointervalo desejado, digamos entre (0, 1). Ajustamos o numero de passosem 20 para obter o grafico abaixo referente a: r(a1) ≤ r(a2) se somentese 80 ≤ 20π + 100(1 − π) ou seja π ≤ .25.

Valor esperado da informacao perfeita

Suponha que alteramos o diagrama de influencia colocando um arcocom origem em chuva e destino em guarda-chuva. Isto devera ser inter-pretado como se a decisao fosse tomada com conhecimento do estado danatureza. Se este for chover entao o melhor seria levar o guarda-chuvacom um ganho de 80, e se fizer sol entao nao levariamos o guarda-chuva,

Page 97: Análise bayesiana de decisões   aspectos práticos

3.4. INTRODUCAO AO DPL 83

Figura 3.14: Rainbow diagram

com um ganho de 100. O valor esperado sera portanto 92, como podemosobservar na arvore de decisao da figura 3.15.

Para completar este capıtulo apresentaremos um exemplo bastante in-teressante e sua implementacao em DPL.

Exemplo 3.6 Exploracao de Petroleo (Smith, 86) Uma companhia pe-trolıfera tem a opcao de perfurar pocos de petroleo em um de dois campos:A e B. As probabilidades iniciais de que se tenha oleo nesses campossao, respectivamente, 0.1 e 0.2 e esses eventos podem ser consideradosindependentes. Se A produzir oleo um ganho lıquido de 77 milhoes deu.m. e esperado na sua fase de operacao. No caso de B, teremos umganho lıquido de 195 milhoes de u.m. .

A companhia encontra-se diante das alternativas:

i) nao aceitar explorar nos campos A e B,

ii) aceitar explorar em A ou em B imediatamente e

Page 98: Análise bayesiana de decisões   aspectos práticos

84 CAPITULO 3. MODELOS GRAFICOS

Figura 3.15: Valor da informacao perfeita

iii) pagar por uma investigacao de somente um dos campos (nao dosdois).

O resultado dessa investigacao sera simplesmente aconselhar ou naoa perfuracao. Com base nessas informacoes a firma escolhera entre asopcoes (i) e (ii). E claro que a investigacao nao e livre de incerteza, carac-terizando um modelo de informacao imperfeita. Se o oleo estiver presenteentao a investigacao aconselhara a perfuracao com probabilidade 0.8. Senao estiver presente aconselhara com probabilidade 0.4. O custo da opcaoe perfuracao do campo escolhido e de 31 milhoes de u.m. enquanto quea investigacao custa 6 milhoes de u.m. Um diagrama de influencia paraeste problema e tao simples quanto apresentado na figura 3.16.

Resumindo temos as seguintes informacoes probabilısticas disponıveis:

P (A) = 0.2 e P (B) = 0.4

P (X = x|θ) =

0.8 se x = 10.2 se x = 0

Page 99: Análise bayesiana de decisões   aspectos práticos

3.4. INTRODUCAO AO DPL 85

Figura 3.16: Diagrama de influencia - informacao imperfeita

P (X = x|θ) =

0.6 se x = 10.4 se x = 0

onde A e B representam os eventos ter petroleo em A e em B e as prob-abilidades condicionais acima valem tanto para θ = θ1 como para θ = θ2.

Alem disto, Θ = θ1∩ θ2, θ1∩ θ2, θ1∩ θ2, θ1∩ θ2, onde θ e o indicadorda presenca de petroleo, o ındice o numero do campo petrolıfero e a barrasobre θ a negacao da presenca de oleo. Logo, os estados da naturezarepresentam: ter petroleo em ambos, em exatamente um deles e nao terpetroleo nos dois campos.

O espaco das acoes tera cinco elementos, A = a1, · · · , a5, onde a1

significa investigar o campo I, a2 - investigar o campo II, a3 - perfuraro campo I sem investigar, a4 - perfurar o campo II sem investigar e a5 -nao investigar e nao perfurar.

Com as hipoteses feitas anteriormente e com os dados resumidos aci-ma podemos facilmente calcular as probabilidades associadas aos estadosda natureza. Necessitaremos tambem, ao longo da solucao via arvore de

Page 100: Análise bayesiana de decisões   aspectos práticos

86 CAPITULO 3. MODELOS GRAFICOS

decisao, das probabilidades sobre Θ condicionalmente aos resultados dasinvestigacoes - X e ainda da marginal de X. Isto e:

P (θ|X = 1) ∝ P (θ) × P (X = 1|θ)P (X = 1) =

θ∈Θ

P (X = 1, θ)

A tabela abaixo resume esses calculos

θ1θ2 θ1θ2 θ1θ2 θ1θ2

X1 = 1 0.064 0.048 0.256 0.192 0.56= 0 0.016 0.072 0.064 0.288 0.44

X2 = 1 0.064 0.096 0.128 0.192 0.48= 0 0.016 0.024 0.192 0.288 0.52

P [θ] 0.08 0.12 0.32 0.48

Tabela 3.1: Probabilidades conjuntas sobre X × Θ

onde, por exemplo:

P [θ1θ2] = 0.4 × 0.2 = 0.08P [X1 = 1] = P [X1 = 1 ∩ θ1] + P [X1 = 1 ∩ θ1]

= 0.4 × 0.8 + 0.6 × 0.4 = 0.56

Para finalizar a implementacao devemos, ainda, obter a tabela de con-sequencias, neste exemplo lucros lıquidos. Esta envolvera somente asacoes terminais: perfurar I, perfurar II e nao perfurar. Esses lucroslıquidos nao levaram em consideracao os custos de experimentacao.

Por exemplo, 46 = 77 − 31, isto e: ganho lıquido de operacao menoso custo da perfuracao.

Podemos agora fazer uso de um pacote como, por exemplo o DPL, paraobter as solucoes possıveis. Para implementacao no DPL trabalhamos

Page 101: Análise bayesiana de decisões   aspectos práticos

3.4. INTRODUCAO AO DPL 87

θ1θ2 θ1θ2 θ1θ2 θ1θ2

a3 46 -31 46 -31a4 164 164 -31 -31a5 0 0 0 0

Tabela 3.2: Consequencias – lucro lıquido em A× Θ

com o espaco dos estados da natureza Ω = Θ1 ×Θ2 = ω1, ω2, ω3, ω4. Aarvore de decisao abaixo, gerada pelo pacote apresenta a solucao otima.A solucao otima consiste em primeiro tomar a acao a2 isto e investigarno campo II. A seguir, observado o resultado experimental devemos decirpor a3, a4 ou a5. Se o experimento resultar em X2 = 1 entao devemosperfurar no campo II. Todavia, se X2 = 0 entao a acao a5 deve serconsiderada. Este curso de acao otimo e denominado regra de decisaode Bayes. A recompensa associada a este curso de acao sera de 10.32milhoes de u.m (figura 3.17).

Outro aspecto interessante neste exemplo e o calculo do valor esper-ado da informacao perfeita. Isto e, seu ganho esperado sobre o conhec-imento da existencia ou nao de petroleo em cada um dos dois camposmenos sua performance sem experimentacao. Assim, temos da tabela 3.2que os resultados possıveis seriam: 164, 164, 46 e 0 com probabilidades0.08,0.12,0.32 e 0.48 respectivamente, menos 8 milhoes de u.m. corre-spondentes a solucao sem investigacao previa. As consequencias acimacorrespondem a escolha de maior retorno em cada possıvel estado da na-tureza. Por exemplo, se θ1θ2 e verdadeiro entao escolho a acao a4 e facoum ganho de 146 milhoes de u.m.

Page 102: Análise bayesiana de decisões   aspectos práticos

88 CAPITULO 3. MODELOS GRAFICOS

Figura 3.17: Diagrama de influencia - informacao imperfeita

Page 103: Análise bayesiana de decisões   aspectos práticos

Capıtulo 4

Probabilidade subjetiva eutilidade

Savage (1954) comeca o capıtulo 3 (sobre probabilidade subjetiva) deseu celebre livro The Foundations of Statistics da seguinte forma (nossatraducao):

Eu pessoalmente considero mais provavel que um presidenteRepublicano seja eleito em 1996 do que caia neve em Chicagoem algum dia de maio de 1994. Entretanto, mesmo essa nevede fim de primavera parece-me mais provavel do que AdolfHitler ainda esteja vivo.

Apesar de transmitir a sensacao de completa falta de estrutura, essasafirmacoes probabilısticas sao perfeitamente razoaveis e externam o graude crenca ou grau de incerteza de um observador (tomador de decisoesem nosso contexto) a respeito de varios eventos (ainda) nao-observaveis.Adicionalmente, Kyburg and Smokler (1980) editaram um compendiosobre probabilidade subjetiva intitulado Studies in Subjective Probabilitye iniciam sua introducao com um debate sobre a multitude que o conceitode probabilidade tras em si (nossa traducao):

89

Page 104: Análise bayesiana de decisões   aspectos práticos

90 CAPITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE

”Probabilidade” e uma palavra constantemente utilizada nasciencias empıricas, na matematica, na filosofia, e em umamultitude de situacoes da vida diaria. E uma palavra quese tornou (juntamente com sinonimos tais como ”verossim-ilhanca,” ”chance,” etc.) mais e mais difundida na cienciadesde que as leis simples e determinısticas do seculo dezoitoforam suplementadas, e algumas vezes superpostas, pelas leisde carater estatıstico ou probabilıstico. Tendo em vista seuuso frequente em uma ampla variedade de contextos, nao e desurpreender que a palavra ”probabilidade” tenha adquiridovarios significados que sao dificilmente distinguıveis uns dosoutros. Em discurso ordinario nao importa que significado apalavra tem, desde que o sentido particularmente utilizado se-ja claro no contexto em que e utilizado. Entretanto ”probabil-idade” e tambem uma palavra tecnica, aparecendo na cienciae na matematica; quando utilizada de forma tecnica, deve-ria possuir um significado claro e definitivo para o contextoem que e utilizada. O mesmo e verdadeiro para seus usosfilosoficos. Varias propostas foram feitas a esse respeito; ateoria de probabilidade subjetivista e uma delas.

No capıtulo 2 introduzimos o princıpio da teoria estatıstica da utili-dade que diz que um tomador de decisoes deve procurar maximizar suautilidade esperada, onde a esperanca e tomada com relacao as probabil-idades associadas (subjetivamente ou nao) aos possıveis estados da na-tureza do problema em questao. Entretanto, nada foi ainda dito sobreque probabilidades sao essas e como sao elicitadas, a mesma indagacaoexistindo para as utilidades associadas as consequencias das possıveis de-cisoes.

Nesse capıtulo introduziremos alguns resultados fundamentais paraa teoria estatıstica da decisao e que servem como base solida para ouso rotineiro dos princıpios da teoria da decisao como ela e comumente

Page 105: Análise bayesiana de decisões   aspectos práticos

91

utilizada por microeconomistas teoricos, tomadores de decisoes medicas,e em modelagem e decisao em financas (por exemplo, na confeccao emonitoramento de carteiras de ativos financeiros) e tantas outras areasda ciencia.

Iniciaremos introduzindo o princıpio da coerencia na proxima secao,atraves do famoso argumento Dutch book. Atraves desse argumento umtomador de decisoes sempre devera quantificar as incertezas associadas aeventos atraves do calculo das probabilidades; caso contrario ele (tomadorde decisoes) estara sendo incoerente e predisposto a participar de uma lo-teria com probabilidade nula de bonificacao. Em seguida, ainda na secao4.1, introduziremos as scoring rules que induzem o tomador de decisoesa fornecer suas probabilidades subjetivas, ou seja obriga-o a ser honestoao informar suas probabilidades. Por exemplo, um previsor do tempo,pode, por motivos de calibracao de suas previsoes, fornecer como proba-bilidade de chuva para amanha uma quantidade que nao necessariamenterepresente seu verdadeiro grau de incerteza a respeito do evento.

A secao 4.2 comeca com o famoso (e curioso) paradoxo de St. Peters-burg que ilustra a dificuldade de se dissociar o valor do dinheiro de suautilidade nos tempos de Bernoulli (Bernoulli 1738). Ainda nessa secaointroduzimos um dos resultados mais importantes da teoria da decisao, oteorema de representacao de von Neumann-Morgenstern. O teorema basi-camente introduz ferramental necessario para o tomador de decisoes sobreincerteza escolher entre duas alternativas de acao tendo sem sua frente so-mente os possıveis estados da natureza, suas utilidades e probabilidades.O resultado vai alem ao mostrar que o tomador de decisoes precisa so-mente de discernir sobre dois estados extremos, um muito bom e outromuito ruim cujas utilidades poderiam, arbitrariamente, ser um e zero,respectivamente; com utilidades para todas as outras consequencias obti-das a partir dessas duas. A ideia de problemas de decisao com multiplosatributos sera breve e superficialmente abordada na secao 4.3.

Page 106: Análise bayesiana de decisões   aspectos práticos

92 CAPITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE

4.1 ”Dutch book” e regras escore

Em seu famoso livro de 1974 sobre teoria da probabilidade Bruno deFinetti afirma que probabilidade nao existe. De Finetti e reconhecido at-ualmente como um dos mais influentes pensadores e precursores do pensa-mento bayesiano. O que ele realmente queria dizer com essa afirmativa eraque probabilidade tem somente uma existencia subjetiva. Em seu maiscelebre trabalho de Finetti (1937) estabelece em termos e sob condicoesrelativamente simples e matematicamente elegantes que um tomador dedecisoes deve representar interteza atraves do calculo das probabilidades,caso contrario suas decisoes serao consideradas incoerentes.

Consideremos, inicialmente, que uma aposta seja feita na ocorrenciade um certo evento, E. O preco dessa aposta e πS, ou seja, uma fracao, π,do premio S. Em outras palavras, se E ocorrer o apostador contabilizarao premio de S−πS = (1−π)S. Caso E nao ocorra, o apostador perderaos πS inicialmente apostados. A razao π : (1 − π) e conhecida por razaode aposta a favor de E.

Estamos, portanto, em condicoes de enunciar o teorema do ”dutchbook” ou teorema de Ramsey-de Finetti.

Teorema 4.1 (Ramsey-de Finetti) Se π for uma probabilidade, entaosera coerente e seguira os axiomas de Kolmogorov:

Axioma 4.1 0 ≤ πE ≤ 1, para todo E;

Axioma 4.2 πE∪Ec = 1;

Axioma 4.3 Se E e F sao tais que E ∩ F = ∅, entao πE + πF = πE∪F .

Prova: Apresentaremos a prova desse resultado devido a sua simplici-dade matematica, o que nao diminui sua importancia e impacto.

Page 107: Análise bayesiana de decisões   aspectos práticos

4.1. ”DUTCH BOOK” E REGRAS ESCORE 93

• Axioma 4.1: Se, por contradicao, πE > 1 e S > 0, entao os ganhos,relativos a E e Ec, serao negativos e iguais a (1 − πE)S e −πES,respectivamente, causando assim perda certa para o apostador. Omesmo ocorre para o caso πE < 0 e S < 0 tambem implica emperda certa.

• Axioma 4.2: Se o axioma 1 prevalece e 0 ≤ πE∩Ec < 1, entao oapostador tera perda certa quando SE∩Ec < 0.

• Axioma 4.3: Consideremos apostas nos eventos E,F e E ∪ F compremios de SE, SF e SE∪F , respectivamente. O ganho lıquido serade

GE = SE + SE∪F − (πESE + πFSF + πE∪FSE∪F )

GF = SF + SE∪F − (πESE + πFSF + πE∪FSE∪F )

GEc∩F c = −(πESE + πFSF + πE∪FSE∪F )

e a unica maneira desse sistema de equacoes lineares nao ter solucao,ou seja, de nao haver perda certa, e a nulidade de seu determinante.E trivial de se mostrar que isso ocorre quando:

πE + πF − πE∪F = 0.

Esse resultado pode ser facilmente estendido para a obtencao de prob-abilidades condicionais e para demonstrar a validade do teorema de Bayes.Deixaremos essas demonstracoes para o leitor que pode encontrar maisdetalhes em de Finetti (1974).

Esse teorema nos leva a conclusao de que a unica maneira coerente dese medir incerteza, ou o grau de crenca, a respeito de eventos e atravesde probabilidades. Esse resultado e um dos alicerces do pensamentoBayesiano.

Page 108: Análise bayesiana de decisões   aspectos práticos

94 CAPITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE

Como acabamos de ver, o uso de probabilidade para medir incertezaleva o tomador de decisoes a agir racionalmente (coerentemente). O teo-rema do ”Dutch Book” de De Finetti guarante que para ser coerente,ou seja evitar perda certa, o tomador de decisoes deve utilizar o calculodas probabilidades para representar incerteza. Entretanto, nada e ditosobre a relacao entre a probabilidade utilizada pelo tomador de decisoese seu grau de crenca a respeito dos eventos em questao. Em um artigo de1996, Robert Winkler diz que os axiomas de de Finetti-Savage acerca daprobabilidade subjetiva remove regras inconsistentes, ou incoerentes, masque coerencia nao e suficiente para garantir ”boas” probabilidades e quenao cria incentivos para elicitacao honesta e cuidadosa de probabilidadesa priori.

Esse nao e um problema novo. Brier (1950) e Good (1952) ja tin-ham essa preocupacao em mente. Brier percebeu essa necessidade emproblemas de previsao do tempo, onde os previsores estao diariamentefornecendo, por exemplo, suas probabilidades de chuva, sejam atraves dejulgamento pessoal puro sejam atraves de modelos estatısticos e meteo-rologicos. A pergunta que Brier se fez foi: ”Sob que circunstancias essasprobabilidades representam o verdadeiro grau de crenca do previsor?”.

Nessa secao sera introduzido o conceito de regras escore, que nadamais sao do que funcoes que representam as utilidades de funcoes deprobabilidades sobre eventos desconhecidos. Good (1952), Savage (1971),de Finetti (1974), Lindley (1982) e Winkler (1996) sao referencias essen-ciais sobre o assunto. O exemplo abaixo ilustra de forma simplificada oproblema em questao.

Exemplo 4.1 Suponhamos que um apostador tenha a : (1 − a) comorazao de chances a favor de um certo evento, digamos E e que seu graude crenca a respeito do evento E seja representado pela probabilidadeπ. Aqui π e a estao em [0, 1], portanto o apostador e uma tomador dedecisoes coerente. Suponhamos tambem que voce leitor seja o bookmaker,

Page 109: Análise bayesiana de decisões   aspectos práticos

4.1. ”DUTCH BOOK” E REGRAS ESCORE 95

ou seja, o controlador da mesa de apostas. Voce recebera −(1− a)S casoE se realize, e aS caso contrario. Seu ganho esperado e de

−(1 − a)Sπ + aS(1 − π) = S(a− π)

Um outro apostador com grau de crenca π ′ sobre E tera um ganho es-perado de S(π′ − a) e sera incentivado a apostar um valor positivo em Esempre que π′ > a.

Portanto, surge a necessidade de se penalizar previsoes ruins e bonificarprevisoes acuradas. Basicamente, as funcoes de utilidade utilizadas emproblemas de decisao onde a acao representa a escolha de uma proba-bilidade (distribuicao de probabilidade) sao conhecidas comumente porregras escore. Mais geralmente, se o vetor a = (a1, . . . , aJ) representaas probabilidades anunciadas pelo previsor a respeito de eventos mutua-mente exclusivos, E = (E1, . . . , EJ), e se suas verdadeiras probabilidadessubjetivas forem π = (π1, . . . , πJ).

Definicao 4.1 Regra Escore: Uma regra escores u para a em E e umafuncao real u(Ej,a) para cada par (Ej ,a).

Definicao 4.2 Regra Escore propria: Uma regra escore e propria se,e so se, para cada π em E

supa∈A

j∈J

u(Ej,a)πj

=

j∈J

u(Ej,π)πj (4.1)

onde A e a classe de todas as distribuicoes de probabilidade em E.

Exemplo 4.2 Suponha que a Secretaria de Municipal de Turismo do Riode Janeiro esteja planejando um evento cultural na areia da praia deCopacabana para o proximo final de semana. Para obter mais informacaoda possibilidade de chuva naquele final de semana, o Secretario Municipal

Page 110: Análise bayesiana de decisões   aspectos práticos

96 CAPITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE

de Turismo ligou para o Centro Nacional de Meteorologia. O evento deinteresse e chuva para o final de semana, E. O verdadeiro grau de crencado Centro sobre esse evento e π que e julgado atraves da seguinte regraescore

u(E, a) = −(a− 1)2

u(Ec, a) = −10(a − 0)2

portanto, a Secretaria escolhera a = π/(10 − 9π) que maximize

Eu(E, a) = −(a− 1)2π − 10a2(1 − π)

E facil perceber que essa regra nao e propria e, consequentemente, asera sempre menor que π.

Brier (1950) introduziu uma das regras escore propria mais utilizadas,a regra quadratica, como uma regra de verificacao. Outras propriedadesdessa regra podem ser encontradas em Savage (1971). Alem da regraquadratica, outras regras comumente presente na literatura sao a log-arıtmica (Good 1952) e as regras esfericas (Savage 1971):

Quadratica : u(Ej,a) = 2aj −∑

i

a2i

Logarıtmica : u(Ej,a) = logaj

Esferica : u(Ej,a) =aj

(∑

i a2i )

1/2

O resultado abaixo afirma que a regra escore quadratica pode ser uti-lizada para mostrar que se os graus de crenca do tomador de decisoes(previsor) nao forem coerentes, entao uma acao (distribuicao de proba-bilidade) com escore maior pode ser obtida.

Teorema 4.2 Se a viola uma das seguintes condicoes,

Page 111: Análise bayesiana de decisões   aspectos práticos

4.2. UTILIDADE 97

1. 0 ≤ aj ≤ 1 para todo j = 1, . . . , k.

2.∑k

j=1 aj = 1.

entao, pode-se encontrar a′ que satisfaz 1 e 2 tal que u(Ej,a) ≤ u(Ej,a′)

para todo j = 1, . . . , k e u(Ej,a) < u(Ej,a′) para pelo menos um j.

4.2 Utilidade

DeGroot (1970) comeca o capıtulo 7 de seu livro, Optimal StatisticalDecision, dizendo:

As probabilidades subjetivas de um estatıstico sao represen-tacoes numericas de suas crencas e informacoes. Suas utili-dades sao representacoes numericas de suas preferencias.

Essencialmente, a teoria da utilidade que falaremos aqui selecionaaquela decisao que maximiza a utilidade esperada, onde a esperanca etomada com respeito a probabilidade subjetivamente elicitada a respeitodos possıveis estados da natureza. O tomador de decisoes que seguir es-sa postura descritiva e dito possuir um comportamento racional. Nessasecao veremos que existe uma estreita relacao entre agir racionalmente eordenar acoes segundo suas utilidades esperadas. Assumiremos, inicial-mente, que todas as probabilidades dos possıveis estados da natureza saoconhecidas. Ja estudamos a relacao entre agir racionalmente e medindoincerteza atraves do calculo das probabilidades na secao anterior. As util-idades foram consideradas em segundo plano tanto no caso das regras deescore quanto no desenvolvimento da nocao de probabilidade subjetivacoerente.

Nessa secao apresentaremos os subsıdios acerca da maximizacao dautilidade esperada. Mas antes, introduziremos o paradoxo de Saint Pe-tersburg para ilustar que, em geral, funcoes de utilidade quando consid-eradas funcoes de retornos monetarios nao serao lineares.

Page 112: Análise bayesiana de decisões   aspectos práticos

98 CAPITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE

4.2.1 Paradoxo de Saint Petersburg

O Paradoxo de Saint Petersburg foi primeiramente investigado por DanielBernoulli em 1738 ao tentar analisar o comportamento de indivıduos apresenca de incerteza presente em jogos de azar. Mais especificamente,Bernoulli tinha dentro de si o seguinte paradoxo a sua frente: Um apos-tador tinha uma moeda honesta a sua frente para ser jogada ate que carafosse observada (n ensaios, digamos), o que daria ao apostador 2n reais.Quantos reais uma pessoa estaria disposta a pagar para entrar nesse jogo?A resposta e imediata para um tomador de decisoes que tente maximizaro retorno monetario esperado: quantidade infinita de reais!. Mais especi-ficamente, o ganho monetarios esperado e de

∞∑

n=1

2n(

1

2

)n

= ∞

Entretanto, qualquer pessoa, disposta a nao rasgar ou jogar dinheirofora, nao pagaria mais do que uma quantidade finita, e possivelmentepequena, de reais para participar desse jogo. O paradoxo desse problemadesaparece quando o tomador de decisoes leva em consideracao a utilidadedos reais (dinheiro) ao inves de seu valor monetario incondicional. Abaixoapresentamos um dos resultados mais importantes da teoria da decisao eque resolve de uma vez por todas o paradoxo de Saint Petersburg.

4.2.2 Teorema de von Neumann–Morgernstern

von Neumann and Morgenstern (1944) apresentam um dos resultadosmais importantes da teoria da decisao que compara duas acoes atravesde suas utilidades esperadas. Do ponto de vista pratico, eles criaram umdos esquemas mais utilizados para elicitacao das utilidades associadas aconsequencias. Isso e feito atraves da aplicacao iterativa do famoso teo-rema da representacao de von Neumann e Morgernstern. Esse teorema

Page 113: Análise bayesiana de decisões   aspectos práticos

4.2. UTILIDADE 99

e fundamentado em tres axiomas, os quais serao brevemente apresen-tados aqui. Considere, inicialmente, que Z represente o conjunto comn possıveis consequencias z1, z2, · · · , zn, e A o conjunto de todas asfuncoes de probabilidade, ou acoes, em Z. Para fixar a notacao, imagineo seguinte exemplo.

Exemplo 4.3 Suponhamos que voce acaba de receber R$5.000,00 e que,apos conversar com o gerente do seu banco, tres possıveis linhas de in-vestimento surgiram, a saber:

a Aplicar os R$5.000,00 na poupanca e receber, no final do mes, R$50,00de rendimento;

a′ Aplicar os R$5.000,00 num fundo de renda fixa e receber, no final domes, R$200,00 de rendimento com probabilidade p ou nada comprobabilidade 1 − p

a′′ Aplicar os R$5.000,00 numa unica acao e receber, no final do mes,R$1000,00 de rendimento com probabilidade q ou ter um rendimentonegativo de R$200,00 com probabilidade 1 − q.

onde p = 0.8 e q = 0.95. Nesse contexto fictıcio e simplificado, o conjun-to Z, de rendimentos lıquidos, tem 5 elementos, −200, 0, 50, 200, 1000,enquanto que as loterias (ou acoes) a, a′, a′′ representam as seguintes dis-tribuicoes de probabilidade em Z:

a = (0.00, 0.00, 1.00, 0.00, 0.00)

a′ = (0.00, 0.50, 0.00, 0.50, 0.00)

a′′ = (0.05, 0.00, 0.00, 0.00, 0.95)

Qual das tres formas de investimento voce preferiria? Como voce or-denaria (da pior para a melhor), esses tres cenarios? Ou ainda, para quevalor de p voce seria indiferente entre a e a′? Similarmente, para quevalores de q e s voce seria indiferente entre a e a′′? Pense um pouco eveja a continuacao desse exemplo mais a frente, ainda nessa secao.

Page 114: Análise bayesiana de decisões   aspectos práticos

100 CAPITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE

De forma geral, as consequencias podem ser as mais diversas e com-plexas, tais como as reacoes de um grupo de pacientes a aplicacao ounao de um novo medicamento contra certo tipo de cancer; ou possıveisrendimentos lıquidos (negativos ou positivos ou nulos) de aplicacoes emdiversos fundos de investimento, como exemplo 4.3 acima. O teoremade von Neumann e Morgernstern (vNM) afirma que a comparacao entreacoes (loterias) pode ser feita atraves da comparacao quantitativa dos val-ores esperados das utilidades das consequencias quando ponderadas pelasdistribuicoes de probabilidades das respectivas loterias. No contexto doexemplo acima, dizer que a e preferıvel a a′, significa dizer que a utili-dade dos R$50,00 de rendimento que a poupanca garante ao investidor emaior do que metade da utilidade dos R$200,00 que o investidor poderiavir a receber se investisse segundo a′. Considerando-se que um investidorsempre preferira mais dinheiro e que a utilidade de 0 e nula (veremosabaixo que essa suposicao podera ser feita sem perda de generalidade).Denota-se por a ≺ a′ quando a acao a e preferıvel a acao a′. Com essadefinicao e os seguintes axiomas apresentaremos, em seguida o teoremada representacao de von Neumann e Morgernstern. Os axiomas da teoriade utilidade de vNM sao os seguintes

Axioma 4.4 NM1: Relacao de preferencias: ≺ e completa e transitiva

• A, uma e somente uma das seguintes relacoes deve ser satisfeita:

– a ≺ a′, or

– a a′, or

– nenhuma delas.

• Transitividade: Para quaisquer a, a′ e a′′ em A, tais que a a′ ea′ ≺ a′′, entao a ≺ a′′.

Page 115: Análise bayesiana de decisões   aspectos práticos

4.2. UTILIDADE 101

Axioma 4.5 NM2: Independencia: Para toda acao a, a′ e a′′ em A eα ∈ (0, 1]:

a a′ implies (1 − α)a′′ + αa (1 − α)a′′ + αa′.

Axioma 4.6 NM3: Arquimediana: Para toda acao a, a′ e a′′ em A taisque a a′ a′′ podem ser encontrados α, β ∈ (0, 1) tais que

αa+ (1 − α)a′′ a′ βa+ (1 − β)a′′.

Antes de falarmos mais detalhadamente sobre os axiomas, vamos ap-resentar um dos principais teoremas da teoria moderna da decisao.

Teorema 4.3 Representacao de Neumann-Morgernstern: Os ax-iomas 4.4, 4.5 e 4.6 sao verdadeiros se e somente se existir uma funcaou tal que ∀a, a′

a a′ ⇐⇒ U(a) ≡∑

z∈Z

a(z)u(z) >∑

z∈Z

a′(z)u(z) ≡ U(a′) (4.2)

com u unica a menos de transformacoes lineares.

Adicionalmente, pode ser mostrado o seguinte resultado,

Lema 4.1 Se em Z satisfaz os axiomas 4.4, 4.5 e 4.6, entao existemz0 e z0 em Z tais que δz0 a δz0

para todo a em A.

Nessa notacao, δz e a distribuicao de probabilidade com massa pontualem z. No exemplo 4.3, z0 = −200 e z0 = 1000. Voltemos ao exemplo 4.3

Page 116: Análise bayesiana de decisões   aspectos práticos

102 CAPITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE

Exemplo 4.4 Utilizando os resultados do Teorema 4.3 e do Lema 4.1podemos assumir que u(−200) = 0 e u(1000) = 1. Supondo que o valorde p = 0.8 torne os investimentos a e a′′ investimentos com utilidadesiguais, segue-se imediatamente que u(50) = 0.95u(1000)+0.05u(−200) =0.95. Ainda, se o rendimento da poupanca fosse de apenas R$200 entaoq = 0.99 tornaria o investidor indiferente entre os investimentos a e a′′

seria u(200) = 0.99u(1000) + 0.05u(−200) = 0.99 Finalmente, p = 0.8tornaria a e a′ equivalentes, ou seja, u(50) = 0.8u(200)+0.2u(0). Daı, autilidade do rendimento nulo e, u(0) = 0.79. Note que apesar de R$200,00representar apenas 20% de R$1.000,00, suas utilidades sao bem proximas,mostrando uma forte aversao ao risco por parte do investidor. Na secao4.4 abordaremos a utilidade do dinheiro, muito util para tomadores dedecisoes economicas.

Alguma explicacao sobre os axiomas devem ser feitas. Complituderequer basicamente que o tomador de decisoes nao saiba o que fazerquando questionado a respeito de sua preferencia em relacao a paresde acoes. A transitividade permitira que problemas multidimensionaispossam ser quebrados em pequenos problemas unidimensionais. Inde-pendencia afirma que duas acoes sejam comparadas somente atraves deseus componentes diferentes. Esse e um dos axiomas mais controver-tidos e varios paradoxos foram apresentados ao longo dos anos contraessa hipotese. Allais (1953) apresenta uma serie de exemplo normativos edescritivos que mostram a violacao do axioma da independencia. Kahne-man and Tversky (1979) tambem apresentam uma serie de experimentosempıricos. Seidenfeld (1988) apresenta um argumento normativo a favordo axioma. O axioma archimediano e tambem conhecido como axiomada continuidade pois diz que uma acao pode ser preferida a outra, masnao de forma extrema e que evite que combinacao de outras acoes naopossam ser preferidas. Para mais detalhes sobre os axiomas de vNM esuas implicacoes praticas e teoricas, veja Jensen (1967), Fishburn (1981),Fishburn (1982) e Kreps (1988).

Page 117: Análise bayesiana de decisões   aspectos práticos

4.3. MULTIPLOS ATRIBUTOS 103

4.3 Multiplos atributos

Na maioria dos problemas de decisao encontrados na pratica a dimensaodo espaco de decisoes nao e unidimensional. Existe, na maioria dos ca-sos, varios atributos a serem considerados, por exemplo, ao decidir entreduas oportunidades de trabalho seria natural esperar que o tomador dedecisoes prefira um salario maior a um menor, mas tambem se espera queele prefira uma funcao que lhe de algum tipo de satisfacao profissional,uma localizacao adequada para sua locomocao, colegas de trabalho quesejam minimamente simpaticos e solıcitos, assim como um patrao que se-ja mais um amigo. E claro que maximizar todos esses atributos e tarefapraticamente impossıvel, gerando assim a necessidade de o tomador dedecisoes pondera-los de alguma forma para encontrar aquela funcao quede uma forma global lhe satisfaca mais, que tenha a maior utilidade. Por-tanto, precisamos analisar o problema de decisao, nesses contextos, sobuma otica conjunta, multifacetada. Genericamente, U(x1, x2, . . . , xn) rep-resenta a funcao de utilidade caracterizada pelos atributos x1, x2, . . . , xn.

Assim como no caso univariado, a forma mais natural de obtencaoda utilidade para um ponto x = (x1, . . . , xn) seria encontrar uma lote-ria cujo retorno medio (calculado com base nos casos extremos: melhorcaso e pior caso) faria com que o tomador de decisoes fosse indiferenteentre essa loteria e o evento certo x. Entretanto, nao e difıcil perceberque essa ideia natural tornasse impraticavel quando n cresce e neces-sariamente muito mais comparacoes (e loterias) sao necessarias. Nessasecao introduziremos algumas das simplificacoes comumente utilizadaspara tornar os problemas de multiatributos trataveis. A capacidade dequebrar uma funcao de utilidade multiatributo em partes menores, emgeral univariadas, e conhecida por separabilidade. Abaixo mencionamosbrevemente algumas condicoes para que tal ”quebra” seja viabilizada.Consideraremos o caso bivariado para exposicao das ideias. Maiores de-talhes sobre problemas tridimensionals ou gerais podem ser encontrados,

Page 118: Análise bayesiana de decisões   aspectos práticos

104 CAPITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE

por exemplo, em Clemen (1996). Dessa forma, consideramos a seguintedecomposicao:

U(x1, x2) = a0 +2∑

i=1

aiUXi(xi) + a4UX1

(x1)UX2(x2)

Definicao 4.3 Independencia preferencial mutua: Um atributo X1

e considerado preferencialmente independente de X2 se as preferenciaspara resultados especıficos de X2 nao dependem do nivel do atributo X1.Se o mesmo acontece quando as posicoes de X1 e X2 sao invertidas temoso conceito de independencia preferencial mutua. E uma ideia relativa-mente interessante, principalmente em situacoes onde ”tempo” e ”custo”sao os atributos em questao.

Definicao 4.4 Utilidade-independente E um pouco mais forte do queo conceito de independencia mutua pois involve a nocao de incerteza,quase sempre presente nos problemas de decisao. Um atributo X1 e con-siderado ”utility independent” do atributo X2 se preferencias por escolhasincertas envolvendo nıveis diferenciados de X1 sao independentes do val-or de X2. Novamente, se o mesmo vale quando os papeis de X1 e X2 saoinvertidos, dizemos que X1 e X2 sao mutuamente utilidade-independente.Pode-se mostrar que

U(x1, x2) = cX1UX1

(x1) + cX2UX2

(x2) + (1 − cX1− cX2

)UX1(x1)UX2

(x2)

onde cX1= U(x+

1 , x−2 ) e cX2

= U(x−1 , x+2 ). Tambem, UX1

(x1)UX2(x2)

representa a interacao entre os atributos.

Definicao 4.5 Independencia aditiva: Quando, na expressao acima,

cX1= U(x+

1 , x−2 ) + cX2

= U(x−1 , x+2 ) = 1

temos queU(x1, x2) = cX1

UX1(x1) + (1 − cX1

)UX2(x2)

O conceito de independencia aditiva e portanto mais forte que aqueles ateaqui introduzidos.

Page 119: Análise bayesiana de decisões   aspectos práticos

4.4. MEDIDAS DE AVERSAO AO RISCO 105

4.4 Medidas de aversao ao risco

No exemplo 4.3 vimos que o tomador de decisao parecia averso ao risco,uma vez que, mesmo tempo uma opcao de retorno medio de investimentoigual a R$100,00 (0.5(R$200, 00) + 0.5(R$0.00)), a opcao de deixar odinheiro na poupanca (retorno fixo e igual a R$50,00) e preferida, ouseja, tem maior utilidade. Esse tipo de comportamento e relativamentecomum e algumas de suas propriedades serao brevemente estudada nessasecao.

Inicialmente, suponha que x represente a quantidade de dinheiro e Fseja uma funcao de distribuicao que mede probabilidades a respeito de x.Adicionalmente, F e o espaco de todas as funcoes de distribuicao paraquantidades nao negativas de dinheiro. Estendendo os resultados acer-ca da utilidade esperada de von Neumann e Morgernstern (secao 4.2.2,diremos que a utilidade da funcao F (.) sera

U(F ) =∫u(x)dF (x)

ou U(F ) =∫u(x)f(x)dx se x poder ser visto como uma variavel aleatoria

contınua com funcao densidade de probabilidade f . O seguinte resultadogeneraliza a discussao do inıcio dessa secao.

Definicao 4.6 Um tomador de decisoes e considerado averso ao risco se,e so se,

∫u(x)dF (x) ≤ u

(∫xdF (x)

)para todoF em F (4.3)

Equivalentemente, um tomador de decisoes e averso ao risco se u(.) foruma funcao concava. Em outras palavras, aversao ao risco implica que,para dado nıvel x de riqueza, a utilidade adicionada por uma unidadede dinheiro e menor que a utilidade subtraıda pela mesma uma unidadede dinheiro. Esse comportamento esta ilustrado na figura 4.1. Pode ser

Page 120: Análise bayesiana de decisões   aspectos práticos

106 CAPITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE

visto que, com riqueza de 2 unidades monetarias a utilidade adicional deuma unidade monetaria, u(3) − u(2), e menor que a utilidade subtraıda,u(2) − u(1), mostrando que o investidor e mais propenso a rejeitar acoes(investimentos) mais arriscadas. Quando a expressao 4.3 for uma igual-dade, diz-se que o tomador de decisoes e neutro ao risco. Nesse ultimocaso a utilidade e linear na quantidade de dinheiro.

Figura 4.1: Funcao de utilidade de um agente averso ao risco.

Uma outra quantidade comumente obtida em problemas de decisaocom retornos monetarios, e a quantidade de dinheiro para a qual o toma-dor de decisoes se torna indiferente entre F (.) e a quantidade

∫u(x)dF (x),

chamada de certainty equivalent. Na figura 4.1, o certainty equivalent e ovalor assinalado por CE. O certainty equivalent, em problemas atuariais,corresponde a quantidade maxima que o segurado pagaria para nao correr

Page 121: Análise bayesiana de decisões   aspectos práticos

4.4. MEDIDAS DE AVERSAO AO RISCO 107

os riscos associado a F (.). O seguinte resultado sobre aversao ao riscopode ser obtido

Teorema 4.4 O tomador de decisoes e averso ao risco se c(F, u) ≤∫xdF (x) para todos F ∈ F .

E natural esperar que o grau de aversao ao risco esteja associado acurvatura de u, possivelmente atraves de u′′(x). Uma medida bastanteconhecido e o coeficiente de aversao absoluta ao risco de Arrow-Pratt.

Teorema 4.5 Seja u uma funcao de utilidade duplamente diferenciavel.Entao o coeficiente de aversao absoluta ao risco de Arrow-Pratt e dadopor:

rA(x) =u′′(x)

u′(x)

Naturalmente, o coeficiente vale zero para situacoes onde o tomadorde decisoes seja neutro ao risco.

Page 122: Análise bayesiana de decisões   aspectos práticos

108 CAPITULO 4. PROBABILIDADE SUBJETIVA E UTILIDADE

Page 123: Análise bayesiana de decisões   aspectos práticos

Capıtulo 5

Analise de Sensibilidade

5.1 Introducao

Neste capıtulo discutiremos alguns aspectos da analise de sensibilidadea qual e central na estruturacao e solucao de modelos de decisao. Astecnicas de analise de decisao usam como ingrediente fundamental jul-gamentos do tomador de decisao atraves de suas preferencias e crencas.A distribuicao a priori, o modelo que descreve os dados disponıveis ea funcao de perda ou utilidade impactam a solucao final do problema.A questao central deste capıtulo e avaliar a sensibilidade dos resultadosfinais a variacoes a esses elementos da analise.

Iniciaremos discutindo alguns aspectos de identificacao do problemae de sua estruturacao para a seguir atacar questoes ligadas a robustezdas componentes do modelo de decisao. Este capıtulo esta influenciadofortemente pelos textos de Clemen (1996) e French and Rios-Insua (2000).

109

Page 124: Análise bayesiana de decisões   aspectos práticos

110 CAPITULO 5. ANALISE DE SENSIBILIDADE

5.2 Identificacao e estrutura

Ao nos depararmos com um problema de decisao devemos cumprir umaserie de estagios iterativos ate a implementacao de uma das alternativasescolhidas. Iniciamos, portanto, pela identificacao do problema de de-cisao. Devemos identificar sua estrutura e entender os objetivos almeja-dos, pois somente assim poderemos enumerar as alternativas disponıveis.Num proximo passo deveremos especificar as partes integrantes do mode-lo. As incertezas e as preferencias devem ser eliciadas de forma a possibil-itar a escolha do melhor curso de acao ou a alternativa otima. O estudoda sensibilidade dos resultados quando aplicados as etapas de identifi-cacao e estruturacao do problema sera denominado de analise preliminarde sensibilidade.

Com respeito a identificacao do problema devemos ser extremamentecuidadosos para evitarmos cometer o chamado erro tipo III Clemen (1996),que consiste em resolver, com esmero, o problema errado. Vejamos umpequeno exemplo.

Exemplo 5.1 Ha alguns anos atras nos deparamos (um dos autores,HSM) com um problema desafiador. Tratava-se de desenvolver um mod-elo para decidir da viabilidade da introducao de certo estoque reguladorde precos para o mercado internacional do cafe. Apos gastar um tempopara compreender a estrutura do mercado internacional do cafe e discutirestrategias metodologicas alternativas nos decidimos pela implementacaode um modelo econometrico que descrevesse os fluxos de cafe entre osmercados produtores e consumidores, alem, e claro, dos precos pratica-dos. Levantamos dados para um perıodo de dez anos, em bases trimestraise ajustamos um modelo econometrico com varias equacoes estocasticas ealgumas identidades ou equacoes de balanco. O mercado produtor foi seg-mentado segundo os tipos de cafe: arabica, robusta e suaves. Os primeirostipicamente produzidos no Brasil, os segundos de origem africana e osultimos produzidos na Amercia Central e Colombia. Pelo lado dos im-

Page 125: Análise bayesiana de decisões   aspectos práticos

5.2. IDENTIFICACAO E ESTRUTURA 111

portadores segmentamos os mercados em Estados Unidos, Europa, Japaoe resto do mundo. Assim tınhamos fluxos de oferta e demanda de quatroorigens para quatros destinos. Coletados os dados e ajustado os modeloseconometricos implementamos varias regras de compra e venda a serempraticadas pelo organismo regulador de forma a manter os precos flutuan-do em uma faixa de variacao adequada. A solucao envolveu simulacaoestocastica uma vez que as regras de compra e venda do buffer stock eramextremamente nao lineares. Concluiu-se que o estoque regulador de precosera viavel. Onde esta o erro tipo III? A questao e que se o mercado inter-nacional do cafe ficasse tao “eficiente”, como proposto pela presenca doestoque regulador de precos, a producao aumentaria descontroladamentefazendo com que o mercado ficasse encharcado de cafe. Obviamente erapreciso considerar algum componente de longo prazo no modelo, que evi-tasse este tipo de reacao dos agentes envolvidos.

Este exemplo ilustrou a importancia de se caracterizar precisamenteo problema a ser resolvido. Esta etapa e denominada de identificacao doproblema e envolve varios agentes: o tomador de decisao, o analista dedecisoes etc. Vale notar que esta e uma fase comumente praticada namodelagem estatıstica. Identifica-se o modelo, ajusta-se os parametros,realiza-se testes de diagnosticos e retorna-se a fase de identificacao ate queo modelo ajustado seja validado e entao aplicado para fazer inferencias epredicoes.

Um segundo aspecto de relevancia e a estrutura do problema. Asvezes, introduzindo-se uma alternativa a mais, a solucao pode modificar-se profundamente. Analogamente, algumas quantidades incertas podemser tratadas com maior nıvel de detalhe do que outras em razao de seuimpacto no resultado final. Ilustraremos este aspecto com dois exemplos.

Exemplo 5.2 Num certo problema medico a decisao otima pode ser sen-sıvel a estrutura do problema. A inclusao de mais uma alternativa podeafetar a maneira como encaramos o problema. Imagine que um amigo

Page 126: Análise bayesiana de decisões   aspectos práticos

112 CAPITULO 5. ANALISE DE SENSIBILIDADE

nosso sofreu um ataque cardıaco e que o medico recomenda uma pontede safena. A cirurgia pode resolver o problema. Quando perguntado, omedico revela que existe um certo risco cirurgico. Uns poucos indivıduosmorrem durante a cirurgia mas, muitos se recuperam, e a cirurgia e umcompleto sucesso. Assim nosso amigo tem muitas razoes para anteciparuma longa vida, plena de saude. Sem a operacao, todavia, teria uma qual-idade de vida que continuamente se deterioraria e, possivelmente, seriacurta. Suponhamos que o objetivo central de nosso amigo e maximizar aqualidade de sua vida. E bastante claro que a cirurgia deva ser consider-ada seriamente. Entretanto, antes de enfrentar este problema decisorioele sai em busca de uma segunda opiniao. Um outro medico discute umdesfecho alternativo: complicacoes decorrentes da cirurgia podem implicarem longos e penosos tratamentos. Se isto ocorrer, o resultado final poderaser: recuperacao completa, recuperacao parcial (uso de cadeira de rodas!)ou morte dentro de alguns meses. Esta terceira alternativa podera modi-ficar completamente a decisao final. Provavelmente a alternativa cirurgicaseja desconsiderada em razao deste detalhamento adicional da estruturado problema.

O proximo exemplo tem por objetivo mostrar que, as vezes, a estru-turacao do problema varia com a otica dos agentes envolvidos. Por umlado poderiamos ter uma situacao com um unico decisor e por outro umasituacao envolvendo varios agentes.

Exemplo 5.3 Este e um exemplo extraıdo do texto de von Winterfeldtand Edwards (1986) e envolve o estabelecimento de padroes para poluicaodecorrente da extracao de petroleo em alto mar. Uma das formas deabordar o problema seria do ponto de vista de uma agencia regulado-ra. As alternativas consistiriam na definicao de padroes aceitaveis depoluicao e na definicao de polıticas de controle. Obviamente, os objetivosfinais seriam minimizar o ındice de poluicao mantendo a producao efi-ciente. Uma estrutura alternativa decorreria de examinar a questao como

Page 127: Análise bayesiana de decisões   aspectos práticos

5.3. EXEMPLO DE ANALISE PRELIMINAR DE SENSIBILIDADE113

a competicao entre tres agentes: a agencia reguladora, a industria de ex-tracao de petroleo e as eventuais vıtimas de possıveis catastrofes. Este eum exemplo de como uma mesma situacao decisoria pode ser tratada dediferentes formas.

A analise de sensibilidade pode colaborar na escolha de uma particularestrutura mais adequada para atacar o problema, e ajudando na identifi-cacao de aspectos especıficos que devem realmente ser considerados pelodecisor.

Na proxima secao examinaremos um problema onde a analise prelimi-nar de sensibilidade sera util para descrever quais das incertezas presentesmerecem ser descritas com maior nıvel de detalhamento. O criterio deidentificacao dessas incertezas sera basedo no impacto que elas provocamsobre os resultados finais. Analises de sensibilidade envolvendo o impactoao se variar um unico fator por vez serao discutidas e, tambem, analisesde dois fatores serao apresentadas.

E sempre uma boa pratica iniciar-se por analises simplificadas. Emb-ora avaliar o impacto de um fator por vez possa ser enganoso dado que osfatores podem iteragir, e, todavia, inegavel que simplifica imensamente acompreensao e analise dos resultados.

5.3 Exemplo de analise preliminar de sen-

sibilidade

Para exemplificar alguns aspectos da analise preliminar de sensibilidadeutilizaremos um excelente exemplo descrito no livro de Clemen (1996).

Certa companhia aerea, Aguia, esta considerando a possibilidade deexpandir suas operacoes. Para isto necessita de mais uma aeronave. At-ualmente opera com tres bimotores, tanto em voos fretados quanto emtransportes regulares de passageiros. Esta pequena companhia esta satis-

Page 128: Análise bayesiana de decisões   aspectos práticos

114 CAPITULO 5. ANALISE DE SENSIBILIDADE

feita com a combinacao dessas atividades: fretamento e transportes regu-lares de passageiros. Estes correspondem a 50% das operacoes e consistemem voos de em media 90 minutos e com distancias de 480 kilometros.

A expansao de suas atividades se dara na area de fretamento. Estee um novo nicho de mercado em franca expansao. Necessita, portanto,de um novo aviao. Coincidentemente surgiu uma oportunidade. Existeum Piper Seneca a venda por 95000 dolares por uma empresa do OrienteMedio. Este e um bimotor em boas condicoes de manutencao, isto e,satisfazendo as normas das autoridades aeronauticas. Apos sua ultimarevisao geral, seus motores ja operaram 150 horas. Esta aeronave aco-moda 5 passageiros, alem do piloto e bagagens. Possui os instrumentosde navegacao e comunicacao necessarios para operar nas condicoes dosdemais equipamentos da AGUIA, e voa a uma velocidade de 200 milhaspor hora. Seu custo operacional esta estimado em 245 dolares por hora,incluindo combustıvel, manutencao e salario do piloto, alem de outrasdespesas fixas, incluindo seguro, encargos financeiros etc e montando a20000 dolares anuais.

A receita que espera auferir, com este novo aviao, proveniente dessasduas atividades e de 300 a 350 dolares por hora de fretamento e 100dolares por passageiro hora nos voos regulares, esperando uma taxa mediade ocupacao de cerca de 50% dos assentos. Estima, ainda, voar 1000 horaspor ano, sendo todavia mais realista que voe 800 horas por ano.

Para realizar este negocio a AGUIA necessita de um emprestimo deaproximadamente 40% do valor da aeronave. A taxa de juros de mercadoe em media 9.5% a.a, mas sujeita a variacoes. Dentre as condicoes decompra destacamos as alternativas:

• Compra imediata

• Aquisicao de uma opcao de compra com validade de um ano a umcusto anual variando de 2500 a 4000 dolares.

Page 129: Análise bayesiana de decisões   aspectos práticos

5.3. EXEMPLO DE ANALISE PRELIMINAR DE SENSIBILIDADE115

• Investimento de seus atuais recursos, ao inves da compra do aviao,no mercado financeiro a uma taxa media de 8% a.a.

Vale ressaltar, novamente, que muitos dos valores numericos envolvi-dos na descricao desse exemplo sao meras estimativas, alguns sobre con-trole da propria AGUIA, outros nao.

Vamos ajudar a AGUIA a comparar essas alternativas. Sera que osnumeros envolvidos fazem muita diferenca? A opcao de compra vale apena? Deixamos de considerar algum aspecto essencial? Essas e outrassao questoes que a analise preliminar de sensibilidade pretende responder.

Iniciemos descrevendo a estrutura do problema acima apresentadoatraves de um diagrama de influencia para as receitas e outro para oscustos.

Do ponto de vista dos custos temos duas fontes: os custos operacionais- fixos ou variaveis - e os custos associados ao financiamento de parte dovalor de compra. Assim as horas voadas (hvoa) vezes o custo da hora voada(chora) compoem com o custo fixo, seguro e outras encargos financeiras,(cfixo) o custo operacional (coper).

coper = chora × hvoa + cfixo

Por seu turno o custo do financiamento (cfina) depende da taxa de ju-ros (tjuro), do percentual a financiar (φfina) e, obviamente, do preco decompra do aviao (pcomp):

cfina = tjuro × φfina × pcomp

Logo o custo total sera:

ctota = coper + cfina

Pelo lado da receita devemos considerar as horas voadas (hvoa), a pro-porcao de voos fretados (φfret), a taxa de ocupacao de voos de passageiros(φpass), o preco do frete (pfret) e o preco da passagem por assento (passe):

rtota = npass ∗ [1 − φfret] × φpass × hvoa × ppass + φfret × hvoa × pfret

Page 130: Análise bayesiana de decisões   aspectos práticos

116 CAPITULO 5. ANALISE DE SENSIBILIDADE

onde o numero de passageiros (npass) e suposto fixo e igual a 5, nesteexemplo.

Os diagramas de influencia apresentados nas figuras 5.1 e 5.2 resumemos calculos descritos nas formulas acima. Estes sao tipicamente diagramasde calculos intermediarios. Temos os nos decisorios referentes aos precosdo frete e do assento em voo regular e da percentagem a financiar. Estassao as variaveis sob o controle da AGUIA.

Figura 5.1: Diagrama de influencia: receita e custo

Note que estes dois diagramas de influencia podem ser juntados numunico mais complexo onde fica definido o conceito de lucro (Lucro) eonde e incluıdo um no decisorio descrevendo a alternativa de postergara compra por um ano, adquirindo, no momento, somente a opcao decompra. Teremos agora os seguintes nos: de consequencia - o no delucro, nos de calculos intermediarios - custo de financiamento e total.Alem disto, temos varias constantes de entrada: taxa de juros, seguro eprecos.

Suponha que tenhamos acessado para cada uma das dez variaveis en-

Page 131: Análise bayesiana de decisões   aspectos práticos

5.3. EXEMPLO DE ANALISE PRELIMINAR DE SENSIBILIDADE117

Figura 5.2: Diagrama de influencia completo

volvidas neste processo decisorio tres valores: o mais provavel, o extremoinferior e o extremo superior. Desejamos, variando um por vez, verificarqual o impacto de cada item no valor final - lucro - do nosso sistema.Suponha que estes valores sejam aqueles apresentados na tabela 5.1.

Utilizaremos como funcao de influencia global

Sg(i) = T (sxi) − T (sx¯ i)

onde T (sx) e o lucro lıquido considerando o vetor de dados sx e osub-ındice i significa que todas as componentes exceto a i-esima seraofixadas no seu valor mais provavel. Podemos, agora, ordenar descres-centemente as variaveis segundo o valor de Sg(i) e construir o graficoda figura 5.3 onde plotamos barras horizontais representando o intervalo

Page 132: Análise bayesiana de decisões   aspectos práticos

118 CAPITULO 5. ANALISE DE SENSIBILIDADE

Variavel Linf Media Lsup

hvoa 500 800 1000pfret 300 325 350pass 95 100 108φpass .40 .50 .60φfret .45 .50 .70chora 230 245 260cfixo 18000 20000 25000φfina .30 .40 .50tjuro .105 .115 .13pcomp 85000 87500 90000

Tabela 5.1: Variaveis de entrada - domınio de variacao

(T (sxı), T (sx¯ ı)). No pacote DPL este grafico e denominado Tornado e

permite visualizar o efeito de cada variavel no resultado final. Aquelasvariaveis mais influentes deverao ser tratadas como estados da naturezae suas incertezas eliciadas com maior rigor, enquanto que as demais seraomantidas fixas em seu valor mais provavel. Este exemplo sera recon-siderado na secao 5.5 onde a sensibilidade a escolhas das probabilidadesatribuıdas as variaveis: φpass, chora e hvoa, serao avaliadas.

5.4 Conceitos basicos de analise de sensi-

bilidade

Vimos nos capıtulos anteriores que um problema de decisao depende fun-damentalmente das preferencias e crencas do decisor. E preciso especi-ficar os antecedentes – distribuicoes a priori, as consequencias – a funcaoutilidade – e o modelo probabilıstico, o qual descreve os experimentos

Page 133: Análise bayesiana de decisões   aspectos práticos

5.4. CONCEITOS BASICOS DE ANALISE DE SENSIBILIDADE 119

Figura 5.3: Diagrama tornado

realizados com o intuito de reduzir as incertezas. Essas quantidades saode difıcil especificacao, sobretudo no caso de varios decisores ou multiplosespecialistas.

Neste contexto torna-se importante avaliar a sensibilidade dos resulta-dos obtidos a variacoes nessas quantidades. Existe uma extensa literaturaestatıstica discutindo robustez Bayesiana e analise de sensibilidade. Nes-ta secao nos limitaremos a introduzir uma notacao geral para descrevero problema e discutir, atraves de exemplos, algumas questoes relevantes.O tema e relativamente teorico e exige conhecimentos acima dos assum-idos neste texto. Recomenda-se, aos interessados, a leitura French andRios-Insua (2000).

Exemplo 5.4 Uma companhia de seguro de saude dispoe de dados men-sais sobre o numero de ocorrencias de sinistros – consultas medicas –e, obviamente, o numero de segurados mes a mes (Migon 2001). Noprocesso de decidir sobre o premio atuarial a companhia deve modelar aevolucao do numero de sinistros e, tambem, o valor dos mesmos. Dese-

Page 134: Análise bayesiana de decisões   aspectos práticos

120 CAPITULO 5. ANALISE DE SENSIBILIDADE

jamos exemplificar o efeito da escolha da distribuicao a priori na previsaodo numero futuro de sinistros. Denotemos por Nt o numero observado desinistros e por πt a populacao segurada, no mes t, t = 1, · · · , T . Suponhaque o numero de sinistros mensais seja distribuıdo segundo uma Poisson,isto e

Nt|λ, πt ∼ Po(πtλ)

onde πt e suposto conhecido e λ e a taxa de sinistros por segurado messuposta estacionaria. O parametro λ e desconhecido e desejamos eliciaruma priori para ele. Consultando-se dados internacionais, por exemploda Organizacao Mundial de Saude (OMS), obtemos a informacao de que,em media, cada segurado faz 4 consultas medicas por ano. Assumindo-seum coeficiente de variacao de 2 unidades podemos especificar uma priorina famılia Ga(a, b), a, b > 0 usando as relacoes:

E[λ|a, b] = a/b e CoV 2[λ|a, b] = 1/a

isto e: a/b = 4 e 1/a = 1/4, ou seja a = 0.25 e b = 0.0625. Vale notarque alternativamente poderıamos ter eliciado os quartis e determinado ae b atraves de um ajuste. Por exemplo N0.25 = 0.05, N0.5 = 0.80 e N0.75 =4.0.

Assim a distribuicao a posteriori sera:

λ|sNT , sπT ∼ Ga(a1, b1)

onde sNt representa o vetor de observacoes ate o tempo t, sπt o vetor dapopulacao segurada ate o tempo t e

a1 = 0.25 +t∑

t=1

πk e b1 = 0.0625 +t∑

k=1

Nk

A media e a variancia da distribuicao preditiva, a qual sera uma BinomialNegativa, seguem facilmente das expressoes gerais:

E[Nt+1] = E[E[Nt+1|λ, sNt, sπt+1]]

Page 135: Análise bayesiana de decisões   aspectos práticos

5.4. CONCEITOS BASICOS DE ANALISE DE SENSIBILIDADE 121

V [Nt+1] = E[V [Nt+1|λ, sNt, sπt+1]] + E[V [Nt+1|λ, sNt, sπt+1]]

Representando a informacao disponıvel ate o tempo t porDt = (sNt, sπt),teremos no nosso exemplo:

E[Nt+1|Dt] = E[E[Nt+1|Dt, sπt+1]]

= πt+1 × E[λ|Dt]

= πt+1 ×0.25 +

∑tk=1 Nk

0.0625 +∑t

k=1 πk

t 1 2 3 4 5 6 7 8nt 643 796 817 938 958 1056 1363 2115πt 1130 1234 1282 1329 1412 1454 2027 2144t 9 10 11 12 13 14 15 16nt 2046 2543 2901 2368 2442 2613 2935 2965πt 2289 2685 2737 3016 3069 3114 3179 3225t 17 18 19 20 21 22 23nt 2085 2571 3172 3046 2781 3592 3204πt 3260 3304 3334 3405 3474 3578 3645

Tabela 5.2: Dados de numero de consultas medicas

Para examinar o efeito da distribuicao a priori sobre as previsoespodemos fazer um grafico (figura 5.4) plotando o valor esperado da dis-tribuicao preditiva contra o numero observado de consultas para os perıodos,digamos t = 9 a t = 23.

Duas distribuicoes a priori foram utilizadas, ambas relativamente pre-cisas mas com medias (4 e 1, respectivamente) afastadas dos valores ob-servados. Como temos uma quantidade muito grande de observacoes rapi-damente o efeito inicial dessas prioris fica diluıdo. Logo, podemos afirmarque os resultados sao pouco sensıveis a escolha da priori.

Page 136: Análise bayesiana de decisões   aspectos práticos

122 CAPITULO 5. ANALISE DE SENSIBILIDADE

Figura 5.4: Valor esperado da distribuicao preditiva, segundo duas priorisalternativas, e frequencias observadas no perıodo t = 9 · · · 24.

Esta analise sofre de varias crıticas. Por um lado, e pouco razoavel queλ seja invariante no tempo, por outro, a distribuicao a priori e arbitrariapor considerar somente umas poucas informacoes da Organizacao Mundi-al da Saude (OMS) e, tambem, pela escolha de conveniencia a famılia dasdistribuicoes gama. Uma classe mais ampla de distribuicoes a priori serainvestigada e o efeito desta imprecisao sera avaliado mais adiante.

5.5 Sensibilidade da distribuicao a priori

Embora seja bem sabido que considerar isoladamente os efeitos da dis-tribuicao a priori e da funcao de utilidade e uma grave limitacao naanalise de sensibilidade, vamos iniciar pela analise isolada dos efeitos dadistribuicao a priori. Alem disto, no que se segue, o modelo sera consid-erado como fixo, sem perda de generalidade.

Uma notacao geral facilitara a exposicao do conceito de sensibilidade

Page 137: Análise bayesiana de decisões   aspectos práticos

5.5. SENSIBILIDADE DA DISTRIBUICAO A PRIORI 123

global. Denote por T (l, p, pX , a) um funcional – valor esperado a posteri-ori da perda – como funcao de l – funcao de perda, p(θ) – distribuicao apriori, p(x|θ) – distribuicao das observacoes e a uma acao. Assim teremos:

T (l, pθ, pX , a) =∫

Θl(a, θ)p(x|θ)p(θ) × 1

p(x)dθ

onde p(x) =∫Θ p(x|θ)p(θ)dθ denota a distribuicao preditiva.

Denotaremos por ab a regra de Bayes, isto e:

ab = argminaT (., ., ., a)

Dentre as classes de distribuicoes a priori discutidas na literaturadestacam-se:

Famılias conjugadas - a principal vantagem desta famılia e a possi-bilidade de se obter calculos em forma fechada. Alem disto, saoflexıveis o suficiente para acomodar as crencas do tomador de de-cisao.

Classe de distribuicoes vizinhas - esta famılia e construida a par-tir de uma distribuicao base p0(θ) e uma dada metrica. Todas asdensidades vizinhas de po(θ) serao membros da classe. Um exemploseria a classe das distribuicoes ε-contaminadas, isto e: P = pε =(1 − ε)po(θ) + εp(θ)

Classe dos momentos - e a colecao de todas as prioris com momentosproximos aos eliciados pelo decisor.

Classe dos quantis - esta e a classe de distribuicoes satisfazendo cer-tas restricoes, estabelecidas subjetivamente pelo decisor, sobre osquantis.

A sensitividade global examina o range de variacao a posteriori (ouna preditiva) de um funcional para p(θ) ∈ P.

Page 138: Análise bayesiana de decisões   aspectos práticos

124 CAPITULO 5. ANALISE DE SENSIBILIDADE

Definicao 5.1 Seja P uma classe de prioris. Uma medida de sensi-bilidade global (Sg) e dada pela amplitude de variacao do funcional deinteresse:

Sg(p(θ)) = suppθ∈PT (p(θ)) − infpθ∈PT (p(θ))

Esta medida e simples de interpretar. A quantidade a posteriori erobusta a desvios da priori quando esta amplitude for pequena e naoe robusta quando a amplitude for grande. Por exemplo, se fixamos aperda quadratica, l(θ, a) = (θ − a)2, entao T (p(θ)) = E[θ|sx] e Sg(p(θ))a amplitude de variacao da media a posteriori quando a distribuicao apriori variar em uma particular classe de distribuicoes.

Exemplo 5.5 Compra ou Leasing de Aviao: apos a analise preliminarde sensibilidade decidimos modelar estocasticamente as quantidades ho-ras voadas, custo por hora voada e ocupacao de assentos. A quanti-dade preco do fretamento, embora tambem de grande influencia nos re-sultados finais, e de fato uma variavel de controle da companhia. Es-tas quantidades incertas foram examinadas como binarias, representan-do uma situacao pessimista (codificada como 0) ou otimista (codifica-da como 1). Admitiu-se que chora e φpass sao distribuidas independente-mente, mas que hvoa tem distribuicao dependendo de φpass. Assim temosas probabilidades p = P [Chora = 1] e q = P [Φpass = 1], com a letrasmaiusculas, como usual, representando variaveis aleatorias. Finalmenteteremos r = P [Hvoa = 0|Φpass = 0] e s = P [Hvoa = 0|Φpass = 1], comr > s. Para estudarmos a influencia dessas quantidades nos resultadosfinais assumiremos ainda que s = 0.8×r e que p = 0.5. Alem disto iremossupor que as decisoes disponiveis para a Aguia sao somente a1 comprarou a2 - nao comprar o aviao. No segundo caso, obviamente, a Aguiainvestira seus recursos proprios no mercado financeiro. No limitaremos,assim a examinar conjuntamente o efeito de q e r. Os valores monetariosdessas quantidades foram, tambem, revisados. Teremos, respectivamente,para os casos pessimista e otimistas, as seguintes informacoes.

Page 139: Análise bayesiana de decisões   aspectos práticos

5.5. SENSIBILIDADE DA DISTRIBUICAO A PRIORI 125

Pessimista Otimistachora 253 237φpass 0.45 0.55hvoa 650 900

Tabela 5.3: Novos valores associados as variaveis mais relevantes

As demais quantidades foram mantidas nos seus valores base (tabela5.1). Apos algumas simplificacoes chegamos a equacoes de receita e de-spesas como funcao das quatidade incertas

ctota = 24025 + chora × hvoa

rtota = 250 × φpass × hvoa + 162.5 × hvoa

Poderiamos utilizar uma vez mais o DPL para esta analise. Temosde calcular o valor esperado do Lucro para cada uma das alternativase examinar a regao do plano (q, r) que, por exemplo, leva a compra doaviao. Esta analise de sensibilidade servira para orientar a quantidade deesforco necessario para se modelar as incertezas. Neste exemplo temos:

r(a1) = q × (3500 × r − 22500) − 1100 × r + 25475

Desejamos comprar o aviao somente se este lucro esperado superar oinvestimento nomercado financeiro, que ja sabemos gera um ganho de4200 UM . Apos um pouco de algebra chegamos a desigualdade:

21275 − 11000 × r > q × [22500 − 3500 × r]

Escolhas de pares (q, r) proximos a curva que define esta fronteira saomais sensıveis do que valores distantes.

Page 140: Análise bayesiana de decisões   aspectos práticos

126 CAPITULO 5. ANALISE DE SENSIBILIDADE

5.6 Sensibilidade conjunta: priori e utili-

dade

Nestas secao discutiremos alguns aspectos adicionais sobre sensibilidade.Iniciaremos discutindo o efeito simultaneo de imprecisoes na distribuicaoa priori e no valor das consequencias. Como ja mencionamos essas analisesrapidamente tornam-se computacionalmente complexas e com resultadosde difıcil interpretacao. Uma boa pratica e ganhar experiencia atravesde exemplos simples e variando tanto a priori como as consequencias emsomente um alguns poucos valores. Um exemplo discutido em Frenchand Rios-Insua (2000) e apresentado a seguir. Serao tambem discuti-das situacoes mais atraentes e realistas onde analisaremos a influenciasimultanea da consequencia media de certo investimento de risco e daprobabilidade a priori de um investimento alternativo cujo desfecho ebinario. Ressaltamos que quando estamos diante de um problema com-putacionalmente complexo e boa pratica iniciar a analise de sensibilidadeavaliando somente alguns pares de valores da priori e das utilidades. Eclaro que isto pode nao ser suficiente como veremos no exemplo abaixo.

Sensibilidade conjunta

Vejamos um exemplo. Suponha que estamos diante de um problema dedecisao sem dados dado pela tabela 5.4.

θ1 θ2

a1 c1 c2a2 c2 c3

π 1 − π

Tabela 5.4: Problema de decisao sem dados.

Page 141: Análise bayesiana de decisões   aspectos práticos

5.6. SENSIBILIDADE CONJUNTA: PRIORI E UTILIDADE 127

Suponha que eliciou-se que 0.4 < π < 0.6, que −0.5 < c1 = l(a1, θ1) <0, −0.75 < c2 = l(a1, θ2) < −0.25 e −1.0 < c3 = l(a2, θ2) < −0.5. Temosassim doze alternativas considerando as variacoes extremas de π e fixandoas consequencias, ora no seu valor mınimo, ora no maximo (ver figura ??).

π l(c1) l(c2) l(c3)0.4 0 -0.25 -0.5

-0.5 -0.75 -1.00.6 0 -0.25 -0.5

-0.5 -0.75 -1.0

Tabela 5.5: Alternativas considerando as variacoes extremas de π.

Vale notar que T (l, pθ, a1) > T (l, pθ, a2) para todos os quatro casos e,portanto, alternativa a2 e sempre preferıvel a alternativa a1.

E claro que poderemos construir muitas outras combinacoes. Porexemplo, se fixamos c1 no seu valor mınimo, c1 = −0.5, e c2 e c3 nos seusvalores maximos, c2 = −0.25 e c3 = −0.5 e π = .6, entao T (l, pθ, a1) =−0.4 e T (l, pθ, a2) = −0.35 levantando duvida sobre a preferencia de a2

sobre a1.Outra alternativa seria fazer uma analise com respeito a priori com a

perda fixada ou vice-versa, incorrendo nas crıticas anterior. Por exemplo,fixando π = 0.5 teremos:

T (l, pθ, a1) − T (l, pθ, a2) = (c1 + c2)/2 − (c2 + c3)/2 = (c1 − c3)/2

Como c1 e sempre maior que c2 entao o problema e robusto comrespeito as consequencias. Entretanto, se fixarmos c1 = −0.25, c2 =−0.5 e c3 = −0.75 e deixarmos π livre, teremos:

T (l, pθ, a1)−T (l, pθ, a2) = −0.25π−0.5(1−π)+0.5π+0.75(1−π) = 0.25

Page 142: Análise bayesiana de decisões   aspectos práticos

128 CAPITULO 5. ANALISE DE SENSIBILIDADE

Logo teremos robustez com relacao a variacao na priori. Nao podemosentretanto concluir que o problema e robusto como mencionado anterior-mente.

Efeito do comportamento do decisor diante do risco

Vamos agora discutir um outro exemplo, onde analisamos a sensibil-idade simultanea a probabilidade a priori e ao valor esperado da perda.Este exemplo abordara, inicialmente, o caso de um decisor neutro aorisco e, posteriormente, o de um decisor averso ao risco. O contextodeste exemplo envolve a decisao de investir no mercado de comoditiesou, alternativamente, participar de uma sociedade limitada. O investi-mento sera de 2000 u.m. e a expectativa e de que o investimento nomercado de comodities, embora, de maior risco promete ganhos maiores.Suponhamos que os ganhos no mercado de comodities sejam descritos pordistribuicao normal de media µ e variancia σ2. Alem disto, para facitilara analise, iremos supor que neste mercado o pior e melhor ganhos estaolimitados em -1000 u.m. e 5000 u.m., no sentido de que as probabilidadesnas caudas desta N(µ, σ2) sao desprezıveis, respectivamente, para val-ores abaixo e acima destes extremos. Po outro lado, o ganho produzidopelo investimento na sociedade limitada sera descrito por uma variavelaleatoria binaria, assumindo os valores de 10000u.m., no caso de suces-so e de −4000u.m. no caso de fracasso. Resumindo teremos a situacaoexposta na tabelatab:neutro.

Fracasso Sucessoa1 -1000 5000a2 -4000 10000

Tabela 5.6: Perdas no mercado de comodities.

As quantidades relevantes desta aplicacao sao: µ = E[θ1], onde θ1

representa o retorno da aplicacao no mercado de comodities e π = Pr[θ2 =

Page 143: Análise bayesiana de decisões   aspectos práticos

5.6. SENSIBILIDADE CONJUNTA: PRIORI E UTILIDADE 129

1], representando sucesso da sociedade. E claro que:

r(a1) = E[u(a1, θ1)] = µr(a2) = E[u(a2, θ2)] = 10000π − 4000(1 − π) = 14000π − 4000

Note que a opcao a1 e prefer´ ivel a opcao a2 se e somente se 14000π−4000 ≥ µ, onde a igualdade representaria a indiferenca entre essas opcoes.

A principal conclusao desta parte do exemplo e que a decisao, mesmonao se conhecendo exatamente o valor de π e de µ, independe da varianciade θ1 no contexto, e claro, de um decisor neutro ao risco.

Para prosseguir com a analise, facamos θ1 assumir seu valor mınimo,respectivamente, maximo. Assim teremos:

14000π − 4000 = −1000= 50000

implicando que π = 3/14 = 0.21 ou π = 9/14 = 0.64. Logo π ∈(0.21, 0.64) quando θ1 assume seus valores extremos. Assim as analisesde sensibilidade com respeito a π podem se restringir a este intervalo.

Esses resultados podem ser resumidos num grafico representando ospares de valores (π, µ), onde a diagonal descreve o conjunto de pontos deindiferenca entre as acoes a1 e a2. Os pares acima desta diagonal favore-cem a escolha da acao a1 e os abaixo, a escolha de a2. A caixa centralrepresenta a regiao de sensibilidade aos valores de π como mencionadoanteriormente.

Por exemplo, se perguntamos ao decisor os valores de π e µ e elefornece duas alternativas: (i) (0.8, 2000) e (ii) (0.4, 1500), uma fora dointervalo descrito acima e a outra na regiao, entao teremos muito maisfacilidade em decidir quando no segundo ponto do que no primeiro.Noteque:

E0.8[[u(a1, θ2)]] = 0.8 × 10000 − 0.2 × 4000 = 7200

enquanto que

E0.4[u(a1, θ2)] = 0.4 × 10000 − 0.6 × 4000 = 1600

Page 144: Análise bayesiana de decisões   aspectos práticos

130 CAPITULO 5. ANALISE DE SENSIBILIDADE

Figura 5.5: Grafico de π versus µ com regiao de sensibilidade de π

Estes valores serao comparados respectivamente com µ = 2000, no primeirocaso e µ = 1500, no segundo caso. As amplitudes de variacao serao re-spectivemente 5200 e 100 u.m., deixando claro que o segundo caso e maisrobusto.

Iremos, finalmente, analisar o problema acima relaxando a suposicaode decisor neutro ao risco. Suponha, agora, que nosso decisor utiliza afuncao de utilidade

u(x) = 1 − exp(−ax)para algum valor de a.

Suponha que desejamos iniciar verificando o efeito da escolha de acoeficiente de aversao ao risco de nosso decisor. Fixemos para iniciarπ = 0.5. Assim teremos, respectivamente, para o decisor neutro ao riscoe para o averso ao risco, o valor equivalente certo (cp)

cp(a2) = 0.5 × 10000 − 0.5 × 4000 = 3000cp(a2) = log(1 − 0.5(1 − exp(−1000a) − 0.5(1 − exp(4000a))/a

Page 145: Análise bayesiana de decisões   aspectos práticos

5.6. SENSIBILIDADE CONJUNTA: PRIORI E UTILIDADE 131

Fazendo a variar podemos observar o efeito do coeficiente de aversaoao risco no equivalente certo. Quanto mais averso ao risco mais negati-vo sera o equivalente certo, considerando-se π = 0.5. Este efeito pode,tambem ser observado na figura 5.6.

a cp(a2)0 3000

0.00002 25120.00020 -8290.00100 -3325

Tabela 5.7: Valor equivalente certo.

Note que a condicao de indiferenca sera dada por:

E[u(a2)] = E[u(a1)] ⇐⇒ π×u(10000)+(1−π)u(−4000) = EN [µ,σ2](u(a1)]

Como estamos supondo que θ1 e normal distribuıdo, entao exp(θ1) seralog-normal distribuıdo e

E[u(a1)] = 1 − exp(−am+ am2σ2/2)

Logo teremos

µ = aσ2/2 + u−1[E(a2)]

= aσ2/2 − log(1 − π(1 − exp(−1000a) − (1 − π)(1 − exp(4000a))/a

Destaca-se que µ cresce com a variancia de θ1 e, mais ainda, indepen-dentemente de π. Por outro lado, µ e proporcional ao equivallente certode a2 para σ2 fixo.

A sensibilidade de a e σ2 pode ser verificada nas figuras a seguir. Nafigura 5.6 fixamos a = 0.00005 e fazemos o grafico de µ como funcao de

Page 146: Análise bayesiana de decisões   aspectos práticos

132 CAPITULO 5. ANALISE DE SENSIBILIDADE

π, para duas situacoes: σ2 = 0 e σ2 = 10002. Plotamos ainda a a reta deindiferenca para o decisor neutro ao risco. A diferenca entre as curvas deindiferenca sao relativamente pequenas. Lembre-se que acima da curvade indiferenca preferimos a1 a a2. Assim σ2 nao e um parametro muitosensitivo.

Figura 5.6: Efeito de σ2 na regiao de indiferenca.

Vamos examinar agora a sensibiliddae de a. Na figura 5.7 observamosas curvas de indiferenca para a = 0, a = .00005 e a = 0.0002 fixando avariancia σ2 igual a 1. Note que a medida que a tende a zero (decisorneutro ao risco) as curvas de indiferenca se modificam expressivamente.Isto comprova quao sensıvel e o parametro a. E facil, por exemplo, veri-ficar que para π = 0.5 a decisao a2 - investir na sociedade - parece maisatraente para um decisor neutro ao risco, enquanto que para um decisorcom um alto coeficiente de aversao ao risco, por exemplo igual 0.0002,a opcao a1 - investir no mercado de comodities - e preferıvel. E facilverificar que para valores maiores do coeficiente de aversao ao risco, porexemplo a = 0.001, o decisor nunca preferira a opcao a2.

Page 147: Análise bayesiana de decisões   aspectos práticos

5.6. SENSIBILIDADE CONJUNTA: PRIORI E UTILIDADE 133

Figura 5.7: Efeito de a - coeficiente de aversao ao risco na curva deindiferenca.

Page 148: Análise bayesiana de decisões   aspectos práticos

134 CAPITULO 5. ANALISE DE SENSIBILIDADE

Page 149: Análise bayesiana de decisões   aspectos práticos

Capıtulo 6

Programacao Dinamica

6.1 Introducao

Trataremos de problemas de decisao em multiplos estagios ou sequenci-ais. Esses problemas se caracterizam por poderem ser separados em umcerto numero de passos sequenciais ou estagios, cada estagio se concluicom uma decisao. Em geral, o tempo e usado para ordenar a sequenciade problemas decisorios. Desejamos descrever a sequencia de decisoestomadas em cada estagio. As principais referencias sao: DeGroot (1970),Berger (1985), French and Rios-Insua (2000) e Bather (2000), alem deParmigiani, Inoue, and Lopes (2003). Alem disto, a relacao MEU com aprogramacao dinamica pode ser encontrada em Lindley (1961).

O capıtulo esta estruturado da seguinte forma. Inicialmente apre-sentamos alguns conceitos basicos para a seguir discutirmos o problemageral de alocacao e um exemplo de caminho crıtico. Na proxima secaosera introduzida a programacao dinamica determinıstica e exemplos. Fi-nalmente, a programacao dinamica estocastica – modelos Markovianossera apresentada.

135

Page 150: Análise bayesiana de decisões   aspectos práticos

136 CAPITULO 6. PROGRAMACAO DINAMICA

6.2 Uma classe de problemas de otimizacao

Para motivar a tecnica de programacao dinamica iniciaremos descreven-do uma classe especial de problemas de otimizacao. Sua principal carac-terıstica e a possibilidade de decompor a funcao objetivo em um numerofinito de estagios e, assim, introduzir a ideia central da programacaodinamica, ou seja a otimizacao de tras para diante ou backward induc-tion.

Esta ampla classe de problemas de programacao matematica fica defini-da por

otimizar f1(x1) + · · · + fn(xn)sujeito a x1 + · · · + xn ≤ b

com xi > 0 e xi inteiros (6.1)

onde fi(xi), i = 1, · · · , n sao funcoes conhecidas de uma unica variavel(lineares ou nao lineares), b > 0 e uma quantidade conhecida e n e onumero de estagios.

Esta classe de problemas e conhecida como processo de decisao multi-estagio. No estagio inicial temos a variavel de decisao x1 e sua con-sequencia ou custo f(x1). Um caso especial, denominado problema dealocacao ocorre quando os estados sao inteiros e b tambem e inteiro.

Algumas caracterısticas destes problemas merecem ser destacadas:

• o problema pode ser separado em estagios ou passos,

• as decisoes caracterizam formas de concluir um estagio,

• uma solucao do problema sera denominada uma polıtica e consistiranuma sequencia de decisoes

Exemplo 6.1 Determinar quanto investir em cada oportunidade (ao lon-go do tempo) de forma a maximizar o retorno total. Suponha que temos

Page 151: Análise bayesiana de decisões   aspectos práticos

6.2. UMA CLASSE DE PROBLEMAS DE OTIMIZACAO 137

tres estagios de investimentos i = 1, 2, 3. O estado do processo no estagioi e a quantia disponıvel para investir naquele instante. E claro que noestagio 1 temos todo o capital disponıvel para investir. Suponha que temosao todo 4 unidades monetarias no estagio 1. Nos estagios 2 e 3 os re-cursos disponıveis poderao assumir os valores: 0, 1, 2, 3 ou 4, dependendodas alocacoes previas. Esta e exatamente a expressao (6.1) para n = 3 eb = 4.

Um segundo exemplo permitira fixar alguns princıpios fundamentaisenvolvidos na estrutura (6.1). Suponha que se deseja obter o caminhomais curto entre dois pontos como exemplificado na 6.1. Existem doiscaminhos de a ate c. Devemos escolher a trajetoria descrita pela linhacheia, no trecho de b para c, pois esta e menor.

Figura 6.1: A linha cheia representa o caminho mais curto ligando a a ce a linha pontilhada um caminho alternativo de b a c, tal que o trajetototal seja mais longo.

Page 152: Análise bayesiana de decisões   aspectos práticos

138 CAPITULO 6. PROGRAMACAO DINAMICA

Exemplo 6.2 Seja o grafo, isto e, um conjunto de vertices conectadosatraves de arcos, como introduzido no capıtulo 3. Suponha que os verticessejam denotados por 1, 2, · · · , n. Alguns pares de vertices podem estarconectados atraves de arcos. A distancia entre os vertices i e j seradenotada por di,j. Denote por fi o comprimento do caminho mais curtoligando o vertice i ao j. Assim

fi = minjdi,j + fj

onde j representa um vertice que pode ser alcancado partindo-se do verticei. E claro tambem que fn = 0.

Suponha que deseja-se obter o caminho mais curto entre os vertices 1e 10 da figura 6.2 abaixo. Nesta figura observamos um grafo com verticesnumerados de 1 a 10 e arcos conectando particulares pares de vertices. Asolucao otima sera obtida resolvendo-se o problema do fim para o inıciocomo veremos mais adiante. Este pode ser visto, tambem, como um prob-lema de alocacao com n = 10.

Sao varios os problemas classicos de otimizacao que podem ser de-scritos como acima. Por exemplo, os problemas de sequenciamento, dealocacao otima, modelos de inventario e varios outros.

6.3 Programacao dinamica

No capıtulo 3 aprendemos a resolver empiricamente um problema de de-cisao usando modelos graficos tais como arvores de decisao e diagramasde influencia. Nos capıtulos 2 e 4 usamos sempre um espaco de acoese de estados da natureza discretos e com um numero finito de alterna-tivas. Em geral este expediente e uma boa aproximacao, complemen-tada por uma analise de sensibilidade (capıtulo 5). Agora e chegado omomento de formalizar estas ideias e estabelecer um algorıtimo geral.Estamos primordialmente interessados em resolver problemas de decisao

Page 153: Análise bayesiana de decisões   aspectos práticos

6.3. PROGRAMACAO DINAMICA 139

Figura 6.2: O grafo acima tem vertices rotulados de 1 a 10 e arcos comas distancias anotadas (di,j)

multi-dimensionais ou mais precisamente que possam ser decompostos emmultiplos estagios.

A tecnica de solucao de problemas de decisao em estagios multiplos edenominada programacao dinamica ou inducao para tras. Lindley (1961)mostra, claramente, a necessidade de se trabalhar de tras para adiantecomo vimos na solucao das arvores de decisao e diagramas de influencia.Esta relacao esta bem estabelecida no artigo anteriormente mencionado.A decisao no estagio presente e de pouca utilidade pois o otimo presenteenvolve o otimo futuro. No exemplo da distancia mınima entre os vertices1 e 10, de nada adianta, no estagio 4, digamos, escolher entre as rotas4 → 5 ou 4 → 7 a de menor custo, pois o otimo deste estagio dependerados estagios futuros como veremos. A notacao i→ j representa a decisaode se utiliar a rota com inıcio no vertice i e fim no j.

Os problemas que trararemos sao tipicamente problemas de otimizacao.O termo dinamico indica que os estagios se relacionam dinamicamente

Page 154: Análise bayesiana de decisões   aspectos práticos

140 CAPITULO 6. PROGRAMACAO DINAMICA

ou, para simplificar, temporalmente (ainda que esta nocao possa ser ar-tificial!). Os problemas multi-estagio podem ser convencionalmente for-mulados como um unico estagio, pagando-se o preco da complexidadeou dimensionalidade. Como mencionado por Bellman (1957), se temosN estagios e M decisoes possıveis em cada estagio entao teremos umproblema NM -dimensional com um unico estagio.

A solucao que descreveremos agora decompoe o problema original emN sub-problemas, mais simples, um para cada estagio. Assim a complex-idade computacional crescera linearmente com o numero de estagios ousub-problemas e nao mais exponencialmente com o numero de variaveis.

Antes de prosseguirmos e introduzir o algorıtmo geral sera ilustrativoapresentarmos uma solucao intuitiva do exemplo 6.2.

Exemplo 6.3 Continuacao do exemplo 6.2: Vamos reverter a ordem dosestagios iniciando, portanto, pelo estagio i = 10. E obvio que f10 = 0 e,entao, podemos passar imediatamente para o caso i = 9. Para tantoutilizaremos a relacao fi = minjdi,j + fj. Temos que avaliar f9 =minjd9,j, f10. Como j so pode assumir o valor 10 e claro que f9 = 2coincidindo com d9,10.

O proximo caso sera ligeiramente mais elaborado. Quando i = 8,j podera assumir os valores 9 ou 10. Logo temos de determinar f8 =mind8,10+f10, d8,9+f9. Assim f8 = 5 e a solucao consistira em escolhero caminho 8 → 9, onde i → j representa a decisao de se caminhar dovertice i para o j.

Facamos agora i = 7. Como este vertice esta conectado tanto aovertice 8 como ao 9 teremos: f7 = minjd7,9+f9, f7,8+f8. Substituindo-se os valores das distancias correspondentes chegamos a f7 = 4 e portantoa solucao sera 7 → 9. Assim do vertice 7 devemos seguir para o 9 edaıpara o 10, com uma distancia total igual a 4 unidades. Logo a rotaalternativa 8 → 9 nao fara parte da polıtica otima uma vez que e maiseconomico seguir diretamente de 7 para 9 e daı ao fim.

Page 155: Análise bayesiana de decisões   aspectos práticos

6.3. PROGRAMACAO DINAMICA 141

Prosseguindo teremos f5 = minjd5,7 + f7, f5,8 + f8 = minj3 +4, 6 + 5. Entao f5 = 7 e, coerentemente com o fato de 8 → 9 ja ter sidoeliminado da polıtica otima, incorporaremos a solucao otima o trecho5 → 7. Continuando de forma analoga ate o vertice inicial obtemos atabela 6.1. A solucao otima tera uma distancia total de 14 unidades eseguira o caminho:

1 → 3 → 5 → 7 → 9 → 10

Vale observar mais uma vez que alguns caminhos foram deletados. Porexemplo, o vertice 4 conduziria ao 8 o qual ja havia sido preterido pelocaminho de 7 para 9. Analogamente, o caminho que passa pelo vertice 6e tambem preterido.

i 10 9 7 8 5 4 3 2 1 6fi 0 2 4 5 7 11 12 13 14 16

Tabela 6.1: Polıtica otima (em negrito)

Vamos agora descrever, em termos gerais, o algoritmo da progra-macao dinamica. Inicialmente trataremos somente de problemas com umnumero finito de estagios - T . Nosso problema consiste em determinar deforma otima uma sequencia de acoes A = a1, · · · , aT, condicionalmenteao estado inicial do sistema. O espaco das acoes disponıveis no t-esimoestagio sera denotado por At e o espaco de estados da natureza, em cadaestagio, denotado por Θt, como introduzido no capıtulo 2.

E claro que ao atingir o estagio t teremos uma historia descrita por:

Dt = a1, · · · , at, θ1, · · · , θt ∈ A1 × · · · × At,Θ1 × · · · × ΘtPara completar a descricao do problema devemos definir uma funcao

que descreva a dinamica dos estados da natureza. Seja

G : Θt−1 ×At → Θt

Page 156: Análise bayesiana de decisões   aspectos práticos

142 CAPITULO 6. PROGRAMACAO DINAMICA

isto e: θt = G(θt−1, at). Esta funcao de evolucao dos estados, de na-tureza Markoviana, induz a distribuicao de probabilidade sobre Θt, quesera denotada por p(θt|at, θt−1). Esta distribuicao condicional sera especi-ficada, na pratica, por uma funcao de probabilidade ou por uma funcaode densidade dependendo de termos um espaco de estados discreto oucontınuo.

Para cada acao at ∈ At fica definida a funcao de custo esperado

ct = E[c(θt, at)|Dt−1] =∫

Θt

c(θt, at)p(θt|Dt−1)

onde Dt representa a informacao disponıvel ate o instante t. Uma de-scricao grafica deste processo, atraves de um diagrama de influencia, foiapresentado no capıtulo 3, figura 3.11.

Desejamos minimizar o custo esperado total dado o estado inicial θ0

minA

c1 + · · · + cT

Para fixar a notacao recem introduzida sera util apresentarmos umexemplo.

Exemplo 6.4 Suponha que nosso problema consista em controlar os movi-mentos de um objeto que partindo de um ponto θ0 deva atingir, em Testagios, certo alvo. As acoes corresponderao a escolha otima dos movi-mentos de nosso objeto em direcao ao alvo. Existira um custo final cor-respondendo a uma penalizacao por nao atingir o alvo. Consideremos afuncao de dinamica

G(θt−1, at) = θt−1 + at + ωt

onde ωt ∼ N [µ, σ2] e a funcao de custo de transicao e dada por

c(at, θt) = ca2t ,

Page 157: Análise bayesiana de decisões   aspectos práticos

6.3. PROGRAMACAO DINAMICA 143

onde c > 0 e uma constante conhecida. Observa-se que esta funcao decusto nao depende de θt sendo, portanto, determinıstica. Se na funcaode evolucao, ωt = 0,∀t entao terıamos um problema de controle otimodeterminıstico, onde o custo de desvio do alvo apos T etapas seria dadopor

f0(θ) = mθ2

onde m > 0 e, tambem, uma constante conhecida.

A ideia central da programacao dinamica e que, em qualquer tempot, para minimizar a expressao acima necessitamos somente considerar aminimizacao do custo esperado total no futuro:

minA

ct + · · · + cT

isto porque a escolha das decisoes presentes e futuras nao devem, possivel-mente, influir no passado. Este problema mais simples envolve n = T − tvariaveis de decisao, cuja solucao sera obtida sequencialmente desde n = 1ate n = T , seguindo o princıpio de optimalidade de Bellman, descritoabaixo.

Princıpio de Optimalidade de Bellman

Um polıtica otima tem a propriedade de que, qualquer que sejam o estadoe a decisao iniciais, as decisoes remanescentes constituem uma polıticaotima com respeito aos estados remanescentes.

Seja o custo mınimo esperado futuro para qualquer estado θt e qual-quer n = T − t, numero de perıodos restantes.

fn(θt) = minat,···,aT E[ct + · · · + cT |θt]

Esta expressao de recorrencia exibe o valor mınimo do custo esperadofuturo em termos de θt, em t = T − n. Podemos aplicar sucessivamentea expressao acima obtendo-se:

Page 158: Análise bayesiana de decisões   aspectos práticos

144 CAPITULO 6. PROGRAMACAO DINAMICA

n = 1 : f1(θ) = maxaT

cTn = 2 : f2(θ) = max

aT−1,aT E[cT−1 + f1(θ)|θT−1]

Genericamente teremos,

fn(θn) = minancn + E[fn−1(θn|θn)]onde a esperanca e sobre a distribuicao de (θn|θn−1, at) induzida pelaevolucao dos estados da natureza.

6.3.1 Exemplos

Apresentaremos nesta secao tres exemplos. Comecaremos com o prob-lema do investimento tratado como algo determinıstico, continuaremoscom o exemplo de controle e, com o intuito de demonstrar o que se perdepela abordagem sequencial, mostraremos o exemplo do profeta.

Consumo versus Investimento

Suponha que um indivıduo deva decidir a cada instante de tempo t quantode sua renda devera ser utilizada para consumo e quanto destinado ainvestimento. Suponha que seu capital inicial seja θ0 e que ele decidaconsumir, no instante t, at, 0 < at < θt, investindo o restante a uma taxar ∈ (0, 1). Assim seu capital um perıodo a frente sera dado por

θt+1 = G(θt, at) = λ(θt − at), onde λ = (1 + r)

Estamos supondo que o investimento produz um ganho conhecido e certo,caracterizando um problema determinıstico. Neste exemplo nosso obje-tivo sera maximizar a utilidade decorrente do consumo realizado, a qualsera dada por

u(θt, at) = a1/2t

Page 159: Análise bayesiana de decisões   aspectos práticos

6.3. PROGRAMACAO DINAMICA 145

Para manter a notacao introduzida anteriormente fazemos ct =−E[u(θt, at)|θt]. Assim desejamos maximizar uma funcao de T variaveis,a1, · · · , aT sujeito a θt > 0, t = 1, . . . , T . Resumindo temos:

maxA

u(a1) + · · · + u(aT )

sujeito a 0 ≤ at ≤ θt

com θt+1 = λ(θt − at) (6.2)

sendo θ1 dado e t = 1 . . . , T . A equacao de recorrencia basica sera dadapor

fn(θ) = max0≤a≤θ

u(a) + fn−1(λ(θ − a)) (6.3)

onde de fato terıamos a = aT−n e fn−1(aT−n+1) = fn−1(λ(θT−n − aT−n)usando a funcao de evolucao. Destacamos ainda que, como a evolucaoe determinıstica, nao temos que tomar o valor esperado de fn−1(θ). Asolucao otima devera satisfazer:

fn(θ) = (1 + λ + λ2 + · · · + λn−1)1/2 θ1/2

an = θ/(1 + λ+ · · · + λn−1), n ≥ 1 e θ > 0 (6.4)

Para verificar este fato basta usar inducao. Por exemplo, f1(θ) =max0≤a≤θ

a1/2 = θ1/2 pois a funcao de utilidade e monotona para a > 0. Logo,a1 = θ. Usando 6.3, obtemos f2(θ) = max0≤a≤θa1/2 + λ1/2(θ − a)1/2 e,portanto, a2 = θ/(1 + λ) e f2(θ) = (1 + λ)1/2θ1/2. E assim por diante.

E facil verificar que no caso de um problema sequencial com T estagiose capital inicial θ0 a solucao acima satisfaz

a0 = θ0/(1 + λ+ · · · + λT−1)a1 = λ2θ0/(1 + λ+ · · · + λT−1)

Page 160: Análise bayesiana de decisões   aspectos práticos

146 CAPITULO 6. PROGRAMACAO DINAMICA

...aT = λ2Tθ0/(1 + λ+ · · · + λT−1)

Seria interessante resolver este mesmo problema com funcoes de util-idade alternativas. Por exemplo: u(a) = 1 − exp(−a), a > 0 ou u(a) =1− 1/(1 + a). A figura 6.3 mostra a diferenca entre estas tres funcoes deutilidade.

Figura 6.3: Comparacao de tres funcoes de utilidades alternativas: u(a) =a1/2, u(a) = 1 − exp(−a), a > 0 ou u(a) = 1 − 1/(1 + a).

Controle Estocastico

Este exemplo e uma continuacao do exemplo 6.4, onde desejamos contro-lar os movimentos de um objeto, a partir de θ0, por T estagios, ate chegaro mais proximo possıvel de um alvo. Relembrando, temos a funcao deevolucao

G(θt−1, at) = θt−1 + at + ωt

Page 161: Análise bayesiana de decisões   aspectos práticos

6.3. PROGRAMACAO DINAMICA 147

onde ωt ∼ N [µ, σ2] e as funcoes de custo de controle e de custo terminalpor se distanciar do alvo, dadas, respectivamente, por:

c(at, θt) = ca2t ,

f0(θ) = mθ2

ondem > 0 e, tambem, uma constante conhecida. E claro que θt|θt−1, at ∼N [θt−1 + at + µ, σ2]. Logo teremos

f1 = mina

cT−1 + E[f0(θT )|θT−1, aT ]= min

aca2 +m(θ + a+ µ+ σ2), pois

E[f0(θT )|θT−1, aT ] = m× E[θ2t |θt−1, at]

= m× var[θt|θt−1, at] + E[θt|θt−1, at]2

= m× [σ2 + [µ+ θt−1 + at]2]

Logo teremos a solucao:

a1 = −m/(c+m)(θ + µ) = m1(θ + µ)f1(θ) = cm/(c+m)(θ+ µ)2 +mσ2 = cm1(θ + µ)2 +mσ2

Nao e difiıcil obter a expressao de recurrencia geral:

fn(θ) = minamn(θ + nµ)2 + (m0 +m1 + · · · +mn−1)σ2

O Profeta

Este exemplo envolve a escolha de um dentre T premios de valor mon-etario representado por uma variavel aleatoria nao negativa. O espacodos estados da natureza pode ser descrito pelos reais positivos. O espacodas acoes, em cada um dos T estagios, sera discreto com dois elementos

Page 162: Análise bayesiana de decisões   aspectos práticos

148 CAPITULO 6. PROGRAMACAO DINAMICA

somente, correspondendo a: a0 - aceitar o premio e a1 - prosseguir no jo-go. Estaremos assumindo que as variaveis aleatorias θt sao independentese com esperanca µt ≤ ∞.

Analisaremos, inicialmente, dois casos extremos de tomada de decisao:sem inspecionar os premios e inspecionando cada um deles. Obviamente,o segundo caso so e disponıvel para o Profeta. Assim teremos:

a) ganho esperado - Wm = maxµ1, . . . , µT

b) ganho esperado - Wp = E[maxθ1, . . . , θT]

Desejamos comparar esses ganhos maximos com uma terceira alter-nativa que corresponde a uma solucao sequencial, em T estagios. Intu-itivamente teremos Wm ≤ Ws ≤ Wp, onde m refere-se ao procedimentoem media, p ao profeta e s ao procedimento sequencial. Pode-se verificarque Ws e Wp sao muito maiores que Wm e, alem disto, que Wp ≤ 2Ws, ouseja que um decisor usando o procedimento sequencial pode ganhar pelomenos a metade do que ganharia o Profeta. E claro que este e um de-cisor muito especial pois tem o poder da clarevidencia ou da informacaoperfeita. Uma demonstracao destes fatos e varias referencias sobre for-mas alternativas da desigualdade do Profeta podem ser encontradas emBather (2000).

No caso sequencial a utilidade de se parar no t-esimo estagio sera dadapor ut(a0) = θs e a de prosseguir sera denotada por ut(a1). No estagiofinal -T - a utilidade esperada sera obviamente

f1(θT ) = E[uT (a0)] = µT

pois necessariamente o jogo terminara. No estagio anterior, T − 1, ouaceitamos o premio de θT−1 ou esperamos para examinar θT . Assim

f2(θT−1) = E[maxθT−1, f1(θT = E[maxθT−1, µT]

Page 163: Análise bayesiana de decisões   aspectos práticos

6.4. ARVORE DE DECISAO E PROGRAMACAO DINAMICA 149

Em geral, usando a inducao para tras teremos

fn(θT−n) = E[maxθT−n, fn−1(θT−n)] (6.5)

para n = 1, . . . , T − 1.

Caso Particular: Suponha que θ1, . . . , θT sao variaveis aleatorias inde-pendentes e identicamente distribuidas segundo uma uniforme em (0, 1).E facil obter neste caso que

Wp = E[maxθ1, . . . , θT] =∫ ∞

0[1 − F T(θ)]dθ

onde F T (θ) = yI(0,1)(y). Assim Wp = n(n+1)

. E claro que Wm = 12

poistodos os θ´s tem medias iguais. Verificamos neste exemplo queWp ≥ Wm,com a igualdade valendo somente pra n = 1. Falta somente avaliar arecorrencia estabelecida acima, equacao 6.1, para o caso sequencial. Efacil verificar que para variaveis aleatorias nao negativas de media finita

E[maxθ,w] = w +∫ ∞

w[1 − F (θ)]dθ

No caso dos θ´s serem uniformemente distribuıdos e fazendo Ws,n corre-sponder a fn(θT−n), ∀n ≥ 1, teremos:

Ws,n = ws,n−1 +∫ ∞

ws,n−1

(1 − θ)dθ

=1

2[1 + w2

s,n−1], n ≥ 2

Supondo ws,0 = 1/4 e variando n teremos os ganhos da tabela 6.2.

6.4 Arvore de decisao e programacao dinamica

Consideremos um problema de decisao descrito por uma arvore de decisaocom um numero limitado e finito de estagios T . Iremos ver agora como

Page 164: Análise bayesiana de decisões   aspectos práticos

150 CAPITULO 6. PROGRAMACAO DINAMICA

n 1 2 4 10 20Wp 0.5 0.667 0.800 0.909 0.952Ws,n 0.25 0.531 0.705 0.852 0.917

Tabela 6.2: Comparacao dos ganhos sequenciais com os do Profeta

resolver este problema de decisao atraves do algoritmo da programacaodinamica.

O espaco das acoes disponıveis no t-esimo estagio sera denotado porAt = a(t)

0 , . . . , a(t)nt, onde a

(t)0 representa a decisao de terminar ou nao o

problema de decisao no estagio t (Parmigiani, Inoue, and Lopes 2003). O

espaco de estados da natureza em cada estagio sera denotado por Θ(t)i =

θ(t)i,1, · · · , θ(t)

i,ki, onde ki e o numero de estados associados a i-esima acao

do estagio t, a(t)i . Assim Θ(t) = Θ

(t)1 × · · · ×Θ(t)

nt. E claro que ao atingir o

estagio t teremos uma historia descrita por:

Dt = a(1)i1, · · · , a(t)

it , θ(1)i1,j1

, · · · , θ(t)it,jt

∈ A(1)× · · · ×A(t),Θ(1) × · · · ×Θ(t)

onde, para cada acao a(t)i ∈ A(t), fica definida a funcao de utilidade es-

perada

u(t)(a(t)i ) = E[u(θ(t), a(t))|Dt−1] =

kt∑

j=1

u(t)i,jp(θ

(t)i,j |Dt−1)

Para completar esta notacao devemos definir uma funcao que descrevaa dinamica dos estados da natureza. Seja

G : Θ(t−1) ×A(t−1) → Θt

isto e, θt = G(θt−1, at−1). Esta funcao de evolucao dos estados, de na-tureza Markoviana, induz a distribuicao de probabilidade sobre Θ(t), que

Page 165: Análise bayesiana de decisões   aspectos práticos

6.4. ARVORE DE DECISAO E PROGRAMACAO DINAMICA 151

sera denotada por p(θ(t)|at−1, θt−1). Na pratica esta distribuicao condi-cional sera especificada por uma funcao de probabilidade ou por umafuncao de densidade.

Figura 6.4: Arvore de decisao com um numero finito de estagios.

A programacao dinamica procede da seguinte forma. Iniciamos resol-vendo o problema de decisao do ultimo estagio T . Esta etapa correspondea maximixar a utilidade esperada. A seguir, condicionalmente ao estagioT resolveremos o problema do estagio T − 1, novamente maximizandoa utilidade esperada. Este procedimento se repetira ate alcancarmos oestagio inicial. Resumindo:

Algoritmo

(1) Inicie em T

(a) Calcule uT (aTi ) =

∑ktj=1 u

Ti,jπ(θT

i,j|DT−1)

(b) Obtenha a decisao de Bayes, a∗,T = arg maxuT (aTi )

Page 166: Análise bayesiana de decisões   aspectos práticos

152 CAPITULO 6. PROGRAMACAO DINAMICA

(2) Repita os seguintes passos

(i) No estagio t0 calcule a utilidade esperada ut(ati) para i− 1, . . . , nt,

onde nt e o numero de acoes em t

ut(ati) =

kt∑

=1

uti,jπ(θt

i,j|Dt−1), para t = 1, . . . , T − 1

uti,j = maxut(at

i), t = 2, . . . , T − 1 (6.6)

(ii) Resolver a otimizacao do estagio t, ou seja faca sua escolha daacao otima:

a∗,t = arg maxi

ut(ati) + u∗(t+1)

(iii) Va para o estagio t-1

Ate que t = 1.

Dentre os varios exemplos interessantes deste tipo de modelo temos oproblema da secretaria ou do casamento, que podem ser encontrados emDeGroot (1970), Bernardo and Smith (1994) e Bather (2000).

6.5 Opcoes reais: uma introducao

Esta secao trata de um tema classico em Economia, a alocacao de recur-sos ou investimentos sob incerteza. Da mesma maneira que as opcoes decompra no mercado financeiro, as opcoes reais representam direitos, semobrigacao de adquirir ou trocar um ativo por um preco especificado. Apossibilidade de se considerar deferimento, abandono e contracao de uminvestimento tem revolucionado a teoria moderna de alocacao de recursos.E bem conhecido, hoje em dia, que o metodo tradicional do fluxo de caixadescontado nao permite revisar e adaptar decisoes em respostas a desen-volvimentos inesperados do mercado. Modernamente, todavia, deseja-se

Page 167: Análise bayesiana de decisões   aspectos práticos

6.5. OPCOES REAIS: UMA INTRODUCAO 153

um metodo capaz de considerar as incertezas futuras e incorporar, di-namicamente, as informacoes que chegam ao mercado, recalculando osfluxos de caixa descontados.

Alguns conceitos proprios da area de opcoes reais serao inicialmenteapresentados, visando caracterizar aspectos essenciais de um investimen-to. A seguir, apresentaremos um exemplo com o objetivo de mostrar queo metodo convencional do valor presente lıquido, tao ensinado ainda hojenas escolas de business, pode levar a conclusoes duvidosas. Este mesmoexemplo sera reanalisado atraves das tecnicas de programacao dinamica,produzindo solucoes muito mais coerentes.

Os conceitos centrais na abordagem de opcoes reais sao: irreversibili-dade, incerteza sobre retornos futuros e temporalidade.

Definicao 6.1 A propriedade de irreversibilidade caracteriza basicamenteuma classe de investimentos cujo valor inicialmente investido e parcial-mente ou integralmente perdido.

Nao e recuperavel se voce deseja modificar, no futuro, sua decisaopresente. Um exemplo seria a aplicacao numa fabrica cujo produto eextremamente especıfico e as maquinas nao sendo adaptaveis para outrasfinalidades.

Outra caracterıstica e que os retornos futuros sao incertos, de sorteque so podem ser descritos probabilisticamente, sem perda de general-idade, atraves de uma distribuicao discreta. Por exemplo, o compor-tamento do mercado futuro para os componentes produzidos por nossoinvestimento variara no futuro em funcao de varios fatores de mercado.Finalmente, a temporalidade diz respeito a caracterıstica de que a decisaode investir pode ser postergada ate dispor-se de mais informacoes sobre ofuturo. Estas caracterısticas estao frequentemente presentes em decisoessequenciais sobre investimentos e se encaixam naturalmente na forma deanalise que desenvolvemos nesse capıtulo.

Page 168: Análise bayesiana de decisões   aspectos práticos

154 CAPITULO 6. PROGRAMACAO DINAMICA

Exemplo 6.5 A tıtulo de exemplo imaginemos uma firma que deseja de-cidir sobre investir ou nao em uma fabrica de componentes mecanicos.O investimento e irreversıvel, pois os equipamentos sao especıficos para aproducao deste particular tipo de componente. Por exemplo, se o merca-do para este componente mecanico acabar, sera impossıvel recuperar (oudesinvestir) os gastos realizados.

A firma tem um custo de instalacao I, instantaneo e a producao e deuma unidade por ano, para simplificar. O preco do componente mecanicoe de 200 u.m., no momento, mas certamente se modificara no proximoano. Isto e, com probabilidade π crescera para 300 u.m. ou caira para100 u.m. Para manter o exemplo simples admitiremos que o preco ficaraconstante no restante do horizonte de decisao. Alem disto, sera supostoainda que a taxa de juros e de 10% e livre de risco.

Assim, se π = 0.5 e I = 1600 u.m., entao o valor presente lıquido doinvestimento sera:

V PL1 = −1600 +∞∑

t=0

200

(1 + 0.10)t= 600

Este calculo, tao frequentemente usado para se decidir por realizar ounao certo investimentos, esta incorreto pois ignora o custo de oportu-nidade de investir agora ao inves de esperar ou ate mesmo nao investir,caso o preco caia, por exemplo. Suponha que aguardamos um perıodo einvestimos somente se o preco subir para 300 u.m. O valor presente nestecaso seria

V PL2 = 0.5 ×[−1600

1.1+

∞∑

t=1

300

(1 + 0.10)t

]= 773

pois no ano inicial nao ha despesas nem receitas e com probabilidade 0.5teremos retorno zero, pois nao investiremos se o preco cair. E claro quee preferıvel esperar um ano, obter mais informacao, e investir somentese o preco subir para 300, pois o V PL1 < V PL2. Obviamente:

Page 169: Análise bayesiana de decisões   aspectos práticos

6.5. OPCOES REAIS: UMA INTRODUCAO 155

i) se a unica alternativa disponıvel para o tomador de decisao for investirou nao no instante inicial, a escolha seria realizar o investimento.

ii) se, entretanto, a decisao for sequencial, isto e: existir a opcao deaguardar para decidir se investe ou nao amanha, entao a escol-ha sera exercer a opcao, dado que estamos assumindo que o precosubiu.

Para isto e preciso que o investimento seja irreversıvel e sequencial. Noteque nem sempre e possıvel adiar a decisao de investir por questoes deconcorrencia, patentes que estao por expirar, etc. A pergunta que secoloca e: Quanto vale a flexibilidade de se poder investir no proximo anoao inves de ”agora ou nunca”?. No exemplo, o custo de oportunidade ouvalor da opcao flexıvel foi de 773−600 = 173. Em geral, teremos ainda aquestao: Qual o valor do investimento I∗, no proximo perıodo, equivalentea I? A solucao sera determinar o valor de um investimento flexıvel comvalor presente lıquido igual ao da proposta do ”agora ou nunca”. Logo,

V PL∗ = 0.05

[−I∗1.1

+∞∑

t=1

200

(1 + 0.10)t

]= V PL1

de sorte que resolvendo-se em I∗ teremos

I∗ = 3300 − 0.5 ×[

1

1.1

]−1

× V PL1 = 1980

Assim a oportunidade de constuir uma fabrica de componentes mecanicoshoje e somente hoje ao custo de 1600 u.m. e equivalente a ser ter a opcaode faze-lo no proximo perıodo a um custo de 1980 u.m.

Opcoes Reais: analogia com opcoes financeiras

Inicialmente vale a pena observar a analogia com uma opcao do tipo callno mercado de acoes. A opcao real da o direito de exerce-la ou nao para

Page 170: Análise bayesiana de decisões   aspectos práticos

156 CAPITULO 6. PROGRAMACAO DINAMICA

fazer um investimento (preco da opcao) e receber um projeto (uma acao)cujo valor e incerto. No exemplo temos uma opcao in the money istoe: se exercida gerara uma receita positiva. Embora seja in the money epreferıvel, no exemplo, esperar do que exerce-la de imediato. Lembre-seque V PL1 = 600 enquanto que V PL2 = 733.

Assim sendo propoe-se examinar o problema anterior a luz da teoriade opcoes em financas. Sejam F0 o valor do investimento e F1 o valor daopcao de investimento no futuro. E claro que F1 e uma variavel aleatoria,pois depende do preco futuro. Se o preco crescer para 300 u.m. entao F1 =1700 e se cair para 100 u.m., entao F1 = 0, pois a opcao de investimentonao sera exercida.

Construiremos um portfolio livre de risco. Isto e, composto de certonumero de componentes mecanicos, tal que o valor futuro seja indepen-dente da variacao dos precos no mercado. Seja um portfolio onde compra-se a descoberto n componentes mecanicos e mantem-se a oportunidadede investimento. Seu valor hoje sera:

Φ0 = F0 − n× p0 = F0 − 200 × n

e no futuroΦ1 = F1 − n × p1

o qual dependera do preco subir ou nao

Φ1 = F1 − n× p1 =

1700 − 300 × n se subir−100 × n se cair

Escolhe-se n tal que o portfolio seja livre de risco, isto e:

1700 − 300n = −100n ⇔ n = 8.5

O retorno de se manter este portfolio sera: Φ1 − Φ0 que corresponde aocusto da posicao descoberta (short). Como o portfolio esta descoberto em

Page 171: Análise bayesiana de decisões   aspectos práticos

6.5. OPCOES REAIS: UMA INTRODUCAO 157

8.5 unidades devera pagar a taxa de risco de 1% sobre o valor monetariode cada unidade, isto e: 200 × 0.1 × 8.5 = 170 u.m. Assim

Φ1 − Φ0 − 170 = Φ1 − (F0 − np0) − 170= −850 − F0 + 1700 − 170= 680 − F0

Porque e risco livre, entao 680−F0 = 0.1× (F0− 1700) ou seja F0 = 773.

Programacao dinamica: aplicacao a opcoes reais

Relembrando, na tecnica de programacao dinamica uma sequencia dedecisoes e particionada em somente duas: a decisao imediata e uma funcaode valor que contempla as consequencias de todas as decisoes passadas.Esta e uma propriedade de natureza Markoviana.

O horizonte de planejamento pode ser finito ou nao. Se finito (n),entao a decisao no ultimo estagio sera obtida de uma otimizacao estatica,pois nada seguira a ela. Esta otimizacao fornecera a consequencia a serutilizada - funcao de valor - no penultimo estagio. Assim o novo problemade decisao considera a decisao do estagio n − 1 e a funcao de valor doestagio n. Pode-se progredir assim ate a condicao inicial.

Vamos comecar examinando o nosso problema somente em dois perıodos.Lembre-se que

p1 =

(1 + u)× p0, cp π(1 − d) × p0, cp 1 − π

caracterizando a funcao de evolucao dos estados da natureza. Suponha,tambem, que a taxa de juros e r ∈ (0, 1) fixo. Teremos de considerar duassituacoes:

(i) a oportunidade de investimento ocorre somente no perıodo inicial,portanto do tipo agora ou nunca

Page 172: Análise bayesiana de decisões   aspectos práticos

158 CAPITULO 6. PROGRAMACAO DINAMICA

(ii) a oportunidade de investimento permanece disponıvel no perıodo 1.

Note que agora no instante inicial a firma tem de decidir: a1 investiragora e a2 esperar e decidir mais tarde, investindo ou nao.

No caso (i) teremos o valor presente esperado

E[V0|D0] = p0 + [π × (1 + u)p0 + (1 − π)× (1 − d)p0]

×[

1

1 + r+

1

(1 + r)2+ · · ·

]

pois estamos supondo que a partir do perıodo 2 os precos serao estaveis.Temos, entao, a serie de valores futuros medios descontados para o perıodoinicial. A expressao acima se simplifica para

E[V0|D0] = p0 × [1 + r + π(u+ d) − d]/r

Assim, se E[V0|D0] − I > 0 entao realizo o investimento. A quanti-dade maxE[V0|D0]−I, 0 sera o lucro, tambem denominado de valor determino no tempo 0. No caso (ii) temos de calcular:

V1 = p1 + p1 ×[

1

(1 + r)+

1

(1 + r)2+ · · ·

]p1 ×

1 + r

r

A firma decidira pelo investimento somente se V1 > I, produzindo umganho lıquido de F1 = maxV1 − I, 0. Vale mencionar que, da otica doperıodo zero, p1 e uma quantidade aleatoria tanto quanto F1 e V1. Assim

E[F1|D0] = π ×max(1 + u)p0 ×1 + r

r− I, 0

+ (1 − π)×max(1 − d)p0 ×1 + r

r− I, 0

Esta quantidade sera denominada de valor esperado de continuacao ousimplesmente valor de continuacao. Voltando ao perıodo inicial teremos:

F0 = maxE[V0|D0] − I,

1

1 + rE[F1|D0]

Page 173: Análise bayesiana de decisões   aspectos práticos

6.5. OPCOES REAIS: UMA INTRODUCAO 159

A decisao otima da firma sera aquela que maximizar o valor presentelıquido. Note que o exemplo foi desenvolvido no espırito da programacaodinamica. O problema foi decomposto em duas etapas: a escolha imediatae as decisoes remanescentes. A sequencia de solucoes otimas e obtida cal-culando de tras para frente. A diferenca entre F0 e maxE[V0|D0]−I, 0,o qual corresponde a solucao do tipo agora ou nunca, sera denominadode valor da opcao de se postergar a decisao de investir ou o valor queretrata este grau de liberdade extra. Como veremos abaixo a estruturade solucao descrita anteriormente estende-se facilmente para o caso demultiplos perıodos.

Analise do problema com multiplos perıodos

No exemplo que acabamos de abordar tinhamos, por conveniencia, so-mente dois perıodos. E claro que em situacoes reais multiplos perıodos etempo contınuo sao, em geral, a regra. Por ora, entretanto, descreveremosas incertezas atraves de processos markovianos discretos. Vale mencionarque os processos de difusao podem ser vistos como caso limite de passeiosao acaso em tempo discreto.

Embora a teoria da programacao dinamica estocastica seja totalmentegeral insistiremos no exemplo do investimento. Denotemos por θ, escalarou nao, o estado da natureza que descreve o ”status” corrente da firma, oqual afeta sua operacao e oportunidades de expansao. Assumiremos queθt = θt−1 + ωt ou seja p(θt|θt−1). No tempo t a firma devera realizar umadecisao que denotamos por a. No nosso exemplo a e uma quantidadebinaria caracterizando investir ou nao investir, mas em muitas aplicacoespodera ser uma variavel contınua, ate mesmo vetorial. Por exemplo, apoderia ser a dupla escolha do investimento e da contratacao mao de obratemporaria. A funcao de valor c(θt, at) e a distribuicao de probabilidadep(θt+1|θt, at) permitem calcular as parcelas necessarias a obtencao da se-quencia at nao se esquecendo do fator de desconto (1 + r)−1, onde r e

Page 174: Análise bayesiana de decisões   aspectos práticos

160 CAPITULO 6. PROGRAMACAO DINAMICA

taxa de juros ou taxa de desconto.Suponha que o processo termine em T , com um ganho final que de-

pende do estado alcancado F (θt). A aplicacao da programacao dinamicadivide o processo em dois estagios: o imediato e a continuacao completa,apos este estado. Seja Ft(θt) o valor esperado lıquido presente do fluxo dereceitas da firma e u(θt, at) o ganho imediato em t pela escolha da acaoat. E claro que Ft(θt+1) e uma variavel aleatoria dada a informacao ate t.Assim teremos E[Ft+1(θt)|Dt] o denominado valor de continuacao. Agoradevemos trazer todos os valor para o instante inicial, fazendo:

u(θt, at) +1

1 + rE[Ft+1(θt)|Dt]

A equacao de Bellman ou equacao fundamental de optimalidade sera dadapor

Ft(θt) = maxat

u(θt, at) +

1

1 + rE[Ft+1(θt+1)|Dt]

O primeiro termo a direita e o ganho imediato e o segundo o valor decontinuacao e a∗t e a acao que maximiza a soma dos ganhos. No exemploque vimos discutindo temos um caso particular da expressao acima pois aassume somente os valores 1 ou 0 representando, respectivamente, investirno instante inicial e esperar ate o tempo 1. Se o problema de variosperıodos tem um horizonte finito T podemos operar de tras para frente.Assim, no final do horizonte, teremos: FT (θT ) e

FT−1(θT−1) = maxat

u(θT−1, aT−1) +

1

1 + rE[FT (θT−1)|Dt]

Podemos resolver o problema para T − 2 obtendo a∗T−2 e o valor de con-tinuacao FT−2(aT−2) e continuar desta forma ate atingir o estagio inicial.

Analise considerando o horizonte infinito

Como nao dispomos da funcao de valor num ponto final do horizonte deplanejamento, nao podemos implementar a inducao de tras para a frente.

Page 175: Análise bayesiana de decisões   aspectos práticos

6.5. OPCOES REAIS: UMA INTRODUCAO 161

Se as funcoes de valor e as probabilidades de transicao forem invariantesno tempo e, alem disto se r for fixo ao longo do tempo poderemos chegara uma grande simplificacao. Estas condicoes sao satisfeitas em muitasaplicacoes economicas e tornam o problema viavel. A equacao de Bellmanpode ser reescrita, para todo t, como:

F (θ) = maxa

u(θ, a) +

1

1 + rE[F (θ′)|θ, a]

onde θ e θ′ sao dois pontos no espaco dos estados da natureza e a euma acao em A. Esta e denominada de equacao de Bellman para aprogramacao dinamica recursiva ou com horizonte infinito.

Necessitamos, em cada aplicacao, garantir a existencia da solucao eassegurar um meio de encontra-la, o que, em geral, nao e muito difıcil.

Esta equacao e nao linear e a escolha otima de a depende de todosos valores de F (θ) ponderados pelas probabilidades envolvidas no calculoda esperanca. Em geral, nao sabemos se um funcional nao linear temsolucao e muito menos se e unica. Felizmente a equacao recursiva deBellman tem uma estrutura especial que permite provar a existencia eunicidade de F (θ) sob condicoes tıpicas das aplicacoes economicas. Umesboco de demonstracao pode ser visto em Dixit and Pindyck (1994),onde outras referencias teoricas sao mencionadas.

Decorre, desta discusao mais tecnica, um procedimento iterativo paradeterminacao de F (θ). Inicie em F 1(θ), aplique no lado direito da equacaoacima e obtenha a1. Sustituindo este valor na equacao, obtemos F 2(θ).Repetimos o processo ate convergencia para o verdadeiro valor de F (θ).Este resultado fica garantido pela presenca do fator 1

1+rno lado direito da

expressao. Este fator e menor do que um e contrai os erro envolvidos nes-sas iteracoes. A convergencia pode, eventualmente, ser lenta, sobretudoquando r e pequeno.

O leitor interessado pode encontrar varios exemplos de aplicacao destemetodo no contexto economico no livro de Dixit and Pindyck (1994).

Page 176: Análise bayesiana de decisões   aspectos práticos

162 CAPITULO 6. PROGRAMACAO DINAMICA

Em muitas dessas aplicacoes, o tempo e contınuo e as incertezas sobre oespaco dos estados da natureza evoluem segundo um processo de Wiernerou, mais geralmente, segundo um processo de difusao.

Page 177: Análise bayesiana de decisões   aspectos práticos

Capıtulo 7

MUE via metodos MonteCarlo

Relembrando os capıtulos anteriores, o problema de maximizacao da util-idade esperada e o problema central da teoria da utilidade. Do ponto devista inferencial, o problema Bayesiano e simples e pode ser genericamentevisto como a busca da decisao otima, d, tal que

d = argmaxd∈D

U(d) (7.1)

para

U(d) =∫u(d, θ, y)pd(y, θd)dθddy (7.2)

onde pd(y, θd) = pd(y|θd)pd(θd) e pd(y|θd) e pd(θd) representam, respecti-vamente, o modelo e a distribuicao mais recente de θd quando a decisaofor d.

Por exemplo, quando o interesse esta em estimar pontualmente o pa-rametro θ e a funcao de utilidade e u(d, θ, y) = −(θ−d)2, a decisao otima,d, se iguala a esperanca de θ com respeito a pd(θ|y) (ver, por exemplo,DeGroot 1970). Entretanto, somente em problemas triviais e de pouco

163

Page 178: Análise bayesiana de decisões   aspectos práticos

164 CAPITULO 7. MUE VIA METODOS MONTE CARLO

interesse pratico e possıvel se obter analiticamente para a integral em(7.2) e/ou para o problema de maximizacao em (7.1).

Nesse capıtulo apresentaremos estrategias para a solucao do prob-lema de decisao baseadas em metodos Monte Carlo. Comecamos, nasecao 7.1, com a aplicacao de integracao de Monte Carlo para resolvera integral em (7.2). Na secao 7.2 introduziremos a ideia de se ajus-tar uma curva a um conjunto finito de pares decisao-utilidade. Essaideia baseia-se na continuidade da funcao de utilidade para pequenasvariacoes de d. Essa ideia foi introduzida por Muller and Parmigiani(1995). Entretanto, quando o espaco das decisoes e de dimensao relativa-mente grande esse metodo torna-se computacionalmente ineficiente, umavez que varios pontos d ∈ D deverao ser selecionados. Clyde, Muller, andParmigiani (1995) e Bielza, Muller, and Rios-Insua (1999) propuseramum metodo para resolver o problema de otimizacao que reescreve (7.2)como um problema de simulacao, atraves de metodos Monte Carlo viacadeias de Markov (MCMC), onde o modelo probabilıstico e aumentadopara h(d, θ, y) = u(d, θ, y)pd(y, θd), ou seja, incorporando a decisao, d,no modelo. Esse metodo e apresentado na secao 7.3, bem como algunsde seus problemas implementacionais. Dois exemplos reais, e suas re-ferencias, serao apresentados na secao 7.4 juntamente com um exemplodidatico, onde o problema de decisao pode ser resolvido analiticamente.Os metodos apresentados nesse capıtulo foram essencialmente extraıdosde Muller (1999), que faz uma revisao extensa dos metodos Monte Carloaplicados a problemas de planejamento Bayesiano otimo, alem de apre-sentar varias referencias com aplicoes diversas.

7.1 Aproximando U(d) via Monte Carlo

Dado d, pd(y, θd) e em geral de facil simulacao, possivelmente em doispassos:

Page 179: Análise bayesiana de decisões   aspectos práticos

7.1. APROXIMANDO U(D) VIA MONTE CARLO 165

• Simulando da priori: θd ∼ pd(θd)

• Simulando do modelo:y ∼ pd(y|θd)

Dessa forma, para cada d, U(d) pode ser aproximada por

U(d) =1

M

M∑

i=1

u(d, θ(i)d , y(i)) (7.3)

onde os pares (θ(i)d , y

(i)), para i = 1, . . . ,M sao gerados a partir do proced-imento em dois passos mencionado acima. Esse procedimento representasimplesmente a solucao de uma integral pelo simples metodo de MonteCarlo (veja, por exemplo, Geweke (1989)).

Claramente, se no instante da tomada de decisao x ∼ p(x|θd) e obser-vado, a expressao em (7.2) e facilmente reescrita por:

U(d) =∫u(d, θ, y)pd(y|θd)p(θd|x)dθddy (7.4)

assumindo que p(y|θd, x) = p(y|θd). Dessa forma, o primeiro passo do al-goritmo apresentado acima seria amostrar θd de p(θd|x). Esse passo geral-mente envolve simulacao de θd atraves de metodos MCMC, dependendoda complexidade de p(θd|x). Esse tipo de situacao e bastante comum, porexemplo em estudos medicos onde decisoes devem ser tomadas com basena informacao obtida atraves de observacoes (estudos, pacientes, etc) pre-existentes. Uma outra situacao comumente encontrada por investidores ea alocacao de recursos em uma carteira de acoes, moedas, taxas de juros,etc. O investidor inteligente baseara sua alocacao em modelos proba-bilısticos que levem em consideracao todas as observacoes dos mercados(de acoes, juros, cambio, etc.), ate o instante da tomada da decisao (verAguilar and West (2001) e Lopes and Migon (2002), por exemplo).

Page 180: Análise bayesiana de decisões   aspectos práticos

166 CAPITULO 7. MUE VIA METODOS MONTE CARLO

7.2 Ajuste da curva de utilidade

Voltando ao problema em (7.1), uma solucao imediata seria obter U(d)para todas as possıveis decisoes em D, e escolher d que maximizasse autilidade esperada aproximada. Entretanto, esse metodo e ineficiente poisdesconsidera completamente a possıvel continuidade da funcao de utili-dade, U(d), comumente presente na maioria dos casos. Ao se desconsider-ar tal dependencia, enormes simulacoes (Monte Carlo simples ou MCMC)serao replicados para valores de d′ muito proximos de d, segundo algumametrica razoavel, ignorando que U(d) e U(d′) venham provavelmente ater valores muito proximos.

Muller and Parmigiani (1995) propuseram um esquema numerico debusca da decisao otima que explora a continuidade da funcao utilidade.O algoritmo pode ser descrito da seguinte maneira:

• Selecione dj em D, possivelmente numa grade

• Simule (θj, yj) ∼ pdj(θ, y) e calcule uj ≡ u(dj, θj, yj)

• Ajuste uma curva aos pontos (dj , uj)

• Encontre, deterministicamente, o maximo da curva ajustada

A integral em (7.2) pode ser aproximada por um ajuste de curva dos paresdj (eixo das abscissas) e uj (eixo das ordenadas). Consequentemente, adecisao otima pode ser obtida como o maximo da curva ajustada. Elesmostram que sob suposicoes especıficas no espaco das decisoes, na funcaode utilidade e na escolha do metodo de suavizacao de curva, a decisaootima obtida por esse procedimento e um estimador consistente de d.

Apesar desse metodo ter um apelo bastante intuitivo, a continuidadeda funcao de utilidade, sua implementacao tambem sofre de um grandeproblema; a medida que o espacødas decisoes aumenta de dimensao fi-ca mais difıcil selecionar dj de forma a tornar a aproximacao da cur-va de ajuste minimamente confiavel. Na proxima secao introduziremos

Page 181: Análise bayesiana de decisões   aspectos práticos

7.3. SIMULANDO O MODELO AUMENTADO 167

o metodo proposto por Clyde, Muller, and Parmigiani (1995) e Bielza,Muller, and Rios-Insua (1999).

7.3 Simulando o modelo aumentado

Clyde, Muller, and Parmigiani (1995) e Bielza, Muller, and Rios-Insua(1999) propuseram um metodo aproximado que incorpora o espaco dasdecisoes aos espacos dos parametros e dos observaveis e utiliza metodosMonte Carlo via cadeias de Markov. Esse metodo aproxima a decisaootima atraves da moda da distribuicao marginal de d. Mais especifica-mente, define-se uma distribuicao artificial

h(d, θ, y) ∝ u(d, θ, y)p(θ)pd(y|θ) (7.5)

no espaco produto D × Θ × Y, assumindo-se que D e limitado, u e umafuncao nao-negativa, tambem limitada. Nesse contexto, h(d) sera exata-mente U(d), portanto a decisao otima sera a moda de h(d). O algoritmoabaixo descreve um dos possıveis esquemas MCMC para amostrar de h,

Algoritmo 1: Cadeias Independentes para d

1. Valor inicial para a decisao: d0

2. Simule (θ, y) a partir de pd0(θ, y) e compute u0 = u(d0, θ, y).

3. Valor proposto para a decisao: gera-se d a partir da proposta g(d|d0)

4. Simule (θ, y) a partir de pd(θ, y) e compute u = u(d, θ, y).

5. Calcule a probabilidade de aceitacao como sendo α = min1, A,onde

A =h(d, θ, y)

h(d0, θ, y)

g(d0|d)g(d|d0)

pd0(θ, y)

pd(θ, y)=

u

u0

g(d0|d)g(d|d0)

(7.6)

Page 182: Análise bayesiana de decisões   aspectos práticos

168 CAPITULO 7. MUE VIA METODOS MONTE CARLO

6. Faca

(d1, u1) =

(d, u) com prob. α(d0, u0) com prob. 1 − α

7. Repita os passos 3 a 6 ate convergencia da cadeia.

Esse esquema, caso particular dos esquemas apresentados por Tier-ney (1994), se beneficia de todos os resultados a respeito de simulacaode cadeias de Markov que tem h como distribuicao limite (de equilıbrio,posteriori, etc). Portanto, toda a parafernalia dos metodos MCMC po-dem ser utilizadas para se alcancar o obtjetivo maior, ou seja encontraro maximo de h(d) = U(d). Por exemplo, se o espaco das decisoes formultidimensional com d = (d1, . . . , dp) e se h(dj|d1, . . . , dj−1, dj+1, . . . , dp)for de facil simulacao, entao teremos um algoritmo similar ao amostradorde Gibbs que amostra individualmente as p componentes do vetor de de-cisoes. Caso essas condicionais completas nao sejam de facil amostragem,entao cadeias de Markov com passeio aleatorio poderiam ser utilizadas.

Na proxima secao veremos que nem sempre e possıvel se encontrar deforma pratica e eficiente o maximo de h(d) baseando-se numa amostra dospares (d, u). Para tanto, o algoritmo 1 sera modificado para deformar afuncao de utilidade de tal forma que seu maximo fique mais evidente. Issosera feito atraves do famoso metodo simulated annealing que resolvemostraduzir aqui por tempera simulada.

7.3.1 Tempera simulada em problemas de decisao

Apesar de colocado em segundo plano, o problema da obtencao da mo-da de h pode ser tao ou mais complicado do que o procedimento deamostragem a partir de h. Em muitos casos, como veremos na secaode exemplos, a funcao de utilidade esperada nao possui um maximo quepossa ser facilmente encontrado pelos metodos tradicionais. A inspecaovisual, de histogramas, torna-se impraticavel quando p, a dimensao do

Page 183: Análise bayesiana de decisões   aspectos práticos

7.3. SIMULANDO O MODELO AUMENTADO 169

vetor de decisoes, e maior que dois. Em geral, a funcao de utilidade e vir-tualmente a mesma para um conjunto grande de decisoes; decisoes essasque nao necessariamente sao similares. Portanto, e necessario se pensarem formas mais eficazes de encontrar o maximo de uma funcao com essascaracterısticas e que esta representada apenas por um conjunto finito,mas grande, de pares (d, u).

Muller (1999) sugere substituir U(d) por uma transformacao do tipopotencia, UJ (d), uma vez que para J suficientemente grande a funcao seconcentrara ao redor do maximo de U(d). Esse efeito pode ser alcancadoatraves da seguinte modificacao em h(d, θ, y)

hj(d, θ1, y1, . . . , θJ , yJ) ∝J∏

j=1

u(d, θj, yj)pd(θj, yj) (7.7)

de tal sorte que hJ(d) ∝ UJ (d), como desejado. Com essa modificacaopara evidenciar as modas em utilidades muito planas, o algoritmo 1 podeser reescrito da seguinte forma.

Algoritmo 2: Simulando de UJ (d)

1. Valor inicial para a decisao: d0

2. Simule (θj, yj) a partir de pd0(θ, y) e compute u0 =∏J

j=1 u(d0, θj, yj).

3. Valor proposto para a decisao: gera-se d a partir da proposta g(d|d0)

4. Simule (θj, yj) a partir de pd(θ, y) e compute u =∏J

j=1 u(d, θj, yj).

5. Calcule a probabilidade de aceitacao como sendo α = min1, A,onde

A =h(d, θ, y)

h(d0, θ, y)

g(d0|d)g(d|d0)

pd0(θ, y)

pd(θ, y)=

u

u0

g(d0|d)g(d|d0)

(7.8)

Page 184: Análise bayesiana de decisões   aspectos práticos

170 CAPITULO 7. MUE VIA METODOS MONTE CARLO

6. Faca

(d1, u1) =

(d, u) com prob. α(d0, u0) com prob. 1 − α

7. Repita os passos 3 a 6 ate convergencia da cadeia.

A escolha de J deve ser feita caso a caso, sendo que valores em tornode 10 ou 20 tem sido utilizados amplamente. Na proxima secao apre-sentaremos algumas situacoes reais em que a aplicacao dessas tecnicasaproximadas possibilitou a solucao do problema de decisao latente.

7.4 Exemplos

Nessa secao ilustraremos os metodos citados acima com problemas de de-cisao encontrados em Muller and Parmigiani (1995), Clyde, Muller, andParmigiani (1993), Muller (1999). Aplicacoes interessantes e recentespodem ser encontradas em Parmigiani, Berry, Iversen Jr., Muller, Schild-kraut, and Winer (1997), Sanso and Muller (1997), Rios-Insua, Slewicz,Muller, and Bielza (1996), Bielza, Muller, and Rios-Insua (1999), Parmi-giani and Muller (1994),Stroud, Muller, and Rosner (1999),Muller andPalmer (1997), entre outros.

Sanso and Muller (1997) consideram o problema de como reduzir de80 para 40 o numero de estacoes de monitoracao de chuva no estado deGuarico na Venezuela. Em seu problema o objetivo e minimizar os cus-tos e ainda ter um m´ inimo de controle sobre a quantidade de chuva nasdiversas regioes do estado. Parmigiani, Berry, Iversen Jr., Muller, Schild-kraut, and Winer (1997) estudam a propensao genatica do cancer de ma-ma onde um dos problemas mais importantes e a predicao da propensaogenetica baseando-se na historia familiar do paciente e fatores de risco.Ja Stroud, Muller, and Rosner (1999) consideram o problema da escolhado instantes de tempo para aplicacao de um certo medicamento contra

Page 185: Análise bayesiana de decisões   aspectos práticos

7.4. EXEMPLOS 171

um certo tipo de cancer baseando-se em modelos que descrevem o com-portamento farmacocinetico e farmacodinamico da droga. Similarmente,Muller and Palmer (1997) estudam a escolha dos intantes de tempo paracoleta de sangue (celulas tronco) em pacientes com cancer. A funcao ob-jetivo e a maximizacao do numero de celulas tronco num menor numeropossıvel de coletas.

Iniciaremos com um exemplo onde a solucao exata e facilmente obtida.

7.4.1 Tamanho amostral da Normal

Suponhamos que x1, . . . , xn formem uma amostra da N(θ, σ2), para θdesconhecido e σ2 desconhecido, e que o problema de decisao seja obtero tamanho amostral otimo para se estimar θ. Adicionalmente supon-hamos que θ ∼ N(µ, τ 2), para µ e τ conhecidos. Finalmente, a funcaode utilidade da decisao final tem a forma quadratica, u(n, a, θ, y) =−(θ − a)2 + C(n), para C(n) = cn e c conhecido. Esse problema podeser resolvido analiticamente. Sabemos que, para n conhecido, E(θ|x) e oestimador otimo de θ sob a funcao de utilidade especificada. Assim,

U(n) =σ2/n

σ2/n+ τ 2µ+

τ 2

σ2/n + τ 2x

de forma que o tamanho amostral otimo e igual a

n∗ = σ/√c− σ2/τ 2

Para valores de σ, µ, τ e c iguais a 1.0, 0.0, 1.0 e 0.01, respectivamente,o tamanho amostral otimo e igual a 9 observacoes. Isso esta ilustradona Figura 7.1(a). A figura 7.1(b) ilustra a utilizacao do algoritmo MonteCarlo (secao 7.1), com M=10.000 amostras para n = 1, . . . , 20. A perfor-mance do metodo proposto por Muller and Parmigiani (1995) (secao 7.2) eapresentada nas figuras 7.1(c,d). Nesse caso foram utilizados M = 10000

Page 186: Análise bayesiana de decisões   aspectos práticos

172 CAPITULO 7. MUE VIA METODOS MONTE CARLO

Figura 7.1: (a) Utilidade esperada, (b) Utilidade esperada obtida porIntegracao Monte Carlo (M=10.000), (c) 10.000 pares (ni, ui) e (d)Curva ajustada (loess no S-plus). Valores fixados: (σ, µ, τ, c) =(1.0, 0.0, 1.0, 0.01).

pares (n, u) para o ajuste de curva, que foi feito utilizando a funcao loess

do S-plus. Essa aproximacao sugere n∗ = 8 observacoes.

A figura 7.2 apresenta resultados analogos para a situacao em queσ = τ = 3.0. Note que, contrario a primeira situacao, aqui a valor aprox-imado para n∗ e superior ao verdadeiro, n∗ = 29. Esse exemplo ilustra aspotencialidades das tecnicas apresentadas nesse capitulo bem como suaslimitacoes, mesmo em problemas relativamente simples e unidimension-ais.

Finalmente, a figura 7.3 mostra o resultado do algoritmo 2 (secao

Page 187: Análise bayesiana de decisões   aspectos práticos

7.4. EXEMPLOS 173

Figura 7.2: (a) Utilidade esperada, (b) Utilidade esperada obtida porIntegracao Monte Carlo (M=10.000), (c) 10.000 pares (ni, ui) e (d)Curva ajustada (loess no S-plus). Valores fixados: (σ, µ, τ, c) =(3.0, 0.0, 3.0, 0.01).

7.3.1) para J = 20. A aproximacao nao e tao boa quando aquelas encon-tradas aplicando-se os outros metodos. Entretanto, em situacoes maiscomplexas esse metodo certamente sera a unica alternativa pratica deuso.

7.4.2 Tamanho amostral da Binomial

Muller and Parmigiani (1995) ilustram o metodo apresentado na secao7.2 no problema da escolha do tamanho amostral em um experimento

Page 188: Análise bayesiana de decisões   aspectos práticos

174 CAPITULO 7. MUE VIA METODOS MONTE CARLO

Figura 7.3: UJ (n) para J = 20 e M = 10.000 simulacoes.

binomial. Mais especificamente, o problema e a escolha de n tal quey|θ ∼ Binomial(n, θ), onde a informacao a priori a respeito de θ e tal queθ ∼ 0.5Beta(3, 1)+0.5Beta(3, 3), o que poderia representar uma misturade opinioes de especialistas. Se a decisao terminal e a estimacao de θutilizando uma funcao de perda absoluta, isto e, U(r(y), θ) = −|r(y)−θ|.Sabe-se que a mediana a posteriori,my, e a regra de Bayes que maximiza autilidade esperada da decisao terminal. Dessa forma, deseja-se encontrarn que maximize:

U(n) =∫ 1

0

n∑

y=0

[−|my − θ| − 0.0008n]Cny θ

y(1 − θ)(n − y)p(θ)dθ (7.9)

Page 189: Análise bayesiana de decisões   aspectos práticos

7.4. EXEMPLOS 175

onde 0.0008 e o custo fixo de cada observacao adicional. Eles escolhemN = 200 pontos ni numa grande uniforme no intervalo (0, 120). Aos 200pares (ni, ui), eles ajustam uma curva de regressao nao-linear da forma:

U(n) = −0.0008n − 0.2023(1 + bn)−a

de sorte que o tamanho amostral otimo pode ser diretamente calculadocomo

n∗ =1

b

(

0.2023ab

0.0008

) 1

a+1

− 1

que vale n∗ = 29. Eles ainda exploram o formato da funcao de utilidade epercebem que ela pode ser parcialmente integrada analiticamente quandoreescrita da seguinte forma

U(n) =n∑

y=0

∫ 1

0[−|my − θ| − 0.0008n]p(θ|y)dθm(y) (7.10)

Nessa nova versao, para cada ni calcula-se a integral internal ana-liticamente, ui. Apos esses novos calculos, n∗ = 34 foi o valor otimoencontrado. A figura 7.4 foi extraıda de Muller and Parmigiani (1995)e sumariza a discussao acima. Para valores de n no intervalo (20, 40)eles tambem calculam o valor verdadeiro de U(d), obtido por integracaoMonte Carlo (secao 7.1), o que mostra que os metodos aproximados saorelativamente eficientes em encontrar o tamanho amostral otimo. Notetambem que a variabilidade dos pontos (ni, ui) e bem menor que a dospontos (ni, ui), devido exclusivamente ao fato de integrar-se analitica-mente parte da expressao 7.10

7.4.3 Defibrilacao do coracao

Em Clyde, Muller, and Parmigiani (1993) (CMP) o problema de decisaoe a escolha da potencia de um defibrilador para o coracao em pacientes

Page 190: Análise bayesiana de decisões   aspectos práticos

176 CAPITULO 7. MUE VIA METODOS MONTE CARLO

Figura 7.4: As linhas fina e grossa representam, respectivamente, os val-ores aproximado e verdadeiro de U(n) (Muller and Parmigiani, 1995).

com problemas cardıacos. Esses aparelhos diminuem a mortalidade de-vida a ataques cardıacos. Para pacientes com fibrilacao, o defibriladordescarrega um pulso especıfico de energia de forma a fazer o coracao dopaciente retomar seu batimento normal.

Em geral, o medico fibrila o coracao do paciente varias vezes (tipica-mente de 3 a 12 vezes) com potencias diferentes, xi para encontrar aquelanecessaria para defibrilacao. Infelizmente, cada um desses testes aumentao risco de serios problemas cardıacos, o que torna a escolha do numerode testes e seus respectivos nıveis de energia uma questao de extremaimportancia.

Uma das estrategias e implantar o aparelho a um nıvel de energia queo faca defibrilar 95% das vezes que o coracao do paciente apresente falha(ED95). Em CMP, para cada xi (nıvel de energia), o experimentadorobserva uma resposta binaria, yi, onde yi = 1 indica que o aparelhofuncionou corretamente e yi = 0 indica que defibrilacao nao ocorreu, ou

Page 191: Análise bayesiana de decisões   aspectos práticos

7.4. EXEMPLOS 177

seja, o nıvel de energia xi nao interrompeu fibrilacao. Dessa forma,

p(yi = 1|θ, xi) = [1 + exp−β(xi − λ) − log(0.95/0.05)]−1

para θ = (β, λ) e φ = (log(β), log(λ)). O interesse maior esta em estimarλ (ou log(λ)). Eles utilizam a seguinte funcao de utilidade

u(φ, y,D) = −log(λ) − E[log(λ)|y,D]2 − cn(D)

onde D e planejamento dos teste (mais detalhes abaixo), E[log(λ)|y,D] ea media a posteriori de log(ED95) e cn e o custo de cada um dos n testesassociados a x. Daı a utilidade esperada sera

U(D) = −∫V ar(log(λ)|y,D)p(y|D)dy − c

∫n(D, y)p(y|φ,D)p(φ)dφdy

e maximizacao de U e complicada, segundo eles, por basicamente doismotivos: (i) nao existe forma fechada para V ar(log(λ)) e (ii) a integralacima nao pode ser obtida analiticamente. CMP desenvolvem um esque-ma sequencial para que os testes sejam interrompidos tao logo ED95 sejaacuradamente estimado. O planejamento, D, e o seguinte:

(i) Comeca-se com uma dose d0 = x1;

(ii) Induz-se fibrilacao e observa-se y1

(iii) Se y1 = 0 (nao ocorre defibrilacao) um choque reativador e dado ea proxima dose e aumentada para x2 = x1(1 + a);

(iv) Se y1 = 1 (defibrilacao bem sucedida) a proxima dose e diminuıdapara x2 = x1(1 − a);

(v) Repete-se (ii) a (iv) ate o mınimo entre r = 3 reversoes (yi+1 = 1−yi)e s = 10 testes.

Page 192: Análise bayesiana de decisões   aspectos práticos

178 CAPITULO 7. MUE VIA METODOS MONTE CARLO

O problema de decisao aqui e a escolha do par (d0, a). O par (r, s)tambem poderiam ser incluıdos no planejamento, mas isso nao foi feitopor CMP. CMP utilizam o algoritmo 1 proposto por Muller and Parmi-giani (1995) para obter D∗ que maximiza U(D) atraves de um ajustenao-parametrico de curva aos pares (Di, ui) (secao 7.2). A decisao otima,para c = 0, e d0 = 9.77 joules, a = 0.23 e tamanho amostral esperadode 8.6 observacoes. O planejamento que minimiza o tamanho amostral ed0 = 7.33 e a = 0.58, cujo tamanho amostral medio e de 7.55 observacoes.A figura 7.5 mostra U(d) quando c = 0.02. Nesse caso, o planejamentootimo e d0 = 9.25 e a = 0.30, cujo tamanho amostral medio e de 8.3obsrvacoes.

Page 193: Análise bayesiana de decisões   aspectos práticos

7.4. EXEMPLOS 179

Figura 7.5: U(D) para c = 0.02. O planejamento otimo foi d0 = 9.25 ea = 0.30, que estao marcados com um triangulo no grafico (Clyde, Mullerand Parmigiani, 1993).

Page 194: Análise bayesiana de decisões   aspectos práticos

180 CAPITULO 7. MUE VIA METODOS MONTE CARLO

Page 195: Análise bayesiana de decisões   aspectos práticos

Referencias

Aguilar, O. and M. West (2001). Bayesian dynamic factor modelsand variance matrix discounting for portfolio allocation. Journalof Business and Economic Statistics 18, 338–357.

Allais, M. (1953). Le comportement de l’homme rationnel devant lerisque: critique des postulats et axiomes de l’ecole americaine.Econometrica 21, 503–546.

Bather, J. (2000). Decision Theory-an introduction to dynamic pro-gramming and sequential decisions. John Wiley, New York.

Bellman, R. (1957). Dynamic Programming. Princeton UniversityPress.

Berger, J. (1985). Statistical Decision Theory and Bayesian Analysis.Springer-Verlag.

Bernardo, J. and A. Smith (1994). Bayesian Theory. John Wiley, NewYork.

Bernoulli, D. (1738). Specimen theoriae novae de mensura sortis. Com-mentarii academiae scientiarum imperialis Petropolitanae 5, 175–192.

Bielza, C., P. Muller, and D. Rios-Insua (1999). Decision analysis byaugmented probability simulation. Management Science 45, 995–1007.

181

Page 196: Análise bayesiana de decisões   aspectos práticos

182 REFERENCIAS

Brier, G. (1950). Verification of forecasts expressed in terms of proba-bility. Monthly Weather Review 78, 1–3.

Bunn, D. W. (1984). Applied Decision Analysis. McGraw-Hill.

Clemen, R. (1996). Making Hard Decisions: An Introduction to Deci-sion Analysis. International Thomson Publishing.

Clyde, M., P. Muller, and G. Parmigiani (1993). Optimal design forheart defibrillators. Discussion paper 93-27, Institute of Statisticand Decision Science.

Clyde, M., P. Muller, and G. Parmigiani (1995). Exploring expectedutility surfaces by markov chains. Discussion paper 95-39, Instituteof Statistic and Decision Science.

de Finetti, B. (1937). Foresight: Its logical laws, its subjective sources.Wiley.

de Finetti, B. (1974). The Theory of Probability (2 volumes). New York:John Wiley.

DeGroot, M. H. (1970). Optimal Statistical Decisions. Mc Graw-Hill.

Dixit, A. and R. Pindyck (1994). Investment under uncertainty. Prince-ton University Press, Princeton, New Jersey.

Ferguson, T. (1967). Mathematical statistics: a decision theoretic ap-proach. Academic Press, New York.

Fishburn, P. C. (1981). Subjective expected utility: A review of nor-mative theories. Theory and Decision 13, 139–199.

Fishburn, P. C. (1982). The Foundations of Expected Utility. Dordrecht:Reidel.

French, S. (1989). Readings in Decision Analysis. Chapman Hall.

French, S. and D. Rios-Insua (2000). Statistical Decision Theory. Ed-ward Arnold: London.

Page 197: Análise bayesiana de decisões   aspectos práticos

REFERENCIAS 183

Geweke, J. (1989). Bayesian inference in econometric models usingMonte Carlo integration. Econometrica 57, 1317–1340.

Golub, J. (1997). Decision Analysis - an integrated approach. JohnWiley, New York.

Good, I. J. (1952). Rational decisions. Journal of the Royal StatisticalSociety, Series B, Methodological 14, 107–114.

Jensen, N. E. (1967). An introduction to Bernoullian utility theory: IUtility functions. Swedish Journal of Economics 69, 163–183.

Kahneman, D. and A. Tversky (1979). Prospect theory: An analysisof decision under risk. Econometrica 47, 263–291.

Kreps, D. M. (1988). Notes on the theory of choice. Boulder: WestviewPress.

Kyburg, H. and H. Smokler (1980). Studies in Subjective probability(Second Edition). Krieger, Garden City.

Levy, H. (1998). Stochastic Dominance. Kluwer Academic Publishers,Norwell, MA.

Lindgren, B. (1971). Elements of Decision Theory. Macmillan, London.

Lindley, D. (1961). Dynamic programming and decision. Applied Sta-tistics 10, 39–51.

Lindley, D. (1971). Making Decisions. John Wiley, Chichester.

Lindley, D. V. (1982). Scoring rules and the inevitability of probability(with discussion). International Statistical Review 50, 1–26.

Lopes, H. (2000). Bayesian Analysis in Latent Factor and LongitudinalModels. Ph. D. thesis, Duke University.

Lopes, H. F., O. Aguilar, and M. West (2000). Time-varying covariancestructures in currency markets. In Proceedings of the XXII BrazilianMeeting of Econometrics.

Page 198: Análise bayesiana de decisões   aspectos práticos

184 REFERENCIAS

Lopes, H. F. and H. S. Migon (2002). Comovements and contagionin emergent markets: Stock indexes volatilities. In C. Gatsonis,R. Kass, A. Carriquiry, A. Gelman, Verdinelli, D. Pauler, andD. Higdon (Eds.), Case Studies in Bayesian Statistics, Volume 6,pp. 287–302.

Luce, R. D. and H. Raiffa (1957). Games and Decision. John Wileyand Sons, New York.

Mas-Colell, A., M. Whinston, and J. Green (1995). MicroeconomicTheory. Oxford University Press.

Migon, H. (2001). Bayesian analysis of a health insurance model. Re-latorio tecnico, PO-COPPE/UFRJ.

Muller, P. (1999). Simulation-based optimal design. In J. Bernardo,J. Berger, A. Dawid, and A. Smith (Eds.), Bayesian Statistics 6.

Muller, P. and J. Palmer (1997). Optimal design in longitudinal datamodels. Discussion paper 97-32, Institute of Statistic and DecisionScience.

Muller, P. and G. Parmigiani (1995). Optimal design via curve fittingof Monte Carlo experiments. Journal of the American StatisticalAssociation 90, 1322–1330.

Parmigiani, G., D. Berry, E. Iversen Jr., P. Muller, J. Schildkraut, andE. Winer (1997). Modeling risk of brest cancer and decisions aboutgenetic testing. Discussion paper 97-26, Institute of Statistic andDecision Science.

Parmigiani, G., L. Inoue, and H. F. Lopes (2003). Statistical DecisionTheory. John Wiley, New York.

Parmigiani, G. and P. Muller (1994). Simulation approach to one-stageand sequential optimal design problems. Discussion paper 94-18,Institute of Statistic and Decision Science.

Page 199: Análise bayesiana de decisões   aspectos práticos

REFERENCIAS 185

Raiffa, H. (1996). Decision Analysis Introductory lectures on choicesunder uncertainty. Addison Wesley.

Raiffa, H. and R. Schlaifer (1961). Applied statistical decision theory.Graduate School of Business Administration, Harvard University.

Rios-Insua, D., K. Slewicz, P. Muller, and C. Bielza (1996). Bayesianmethods in reservoir operations: the zambezi river case. Discussionpaper 96-30, Institute of Statistic and Decision Science.

Sanso, B. and B. Muller (1997). Redesigning a network of rainfall sta-tions. Discussion paper 97-25, Institute of Statistic and DecisionScience.

Savage, L. (1954). The Foundations of Statistical Inference. New York:John Wiley.

Savage, L. J. (1971). Elicitation of personal probabilities and expecta-tions. Journal of the American Statistical Association 66, 783–801.

Seidenfeld, T. (1988). Decision theory without “independence” or with-out “ordering”. what is the difference? Economics and Philoso-phy 4, 267–290.

Shachter, R. (1986). Evaluating influence diagrams. Operations Re-search 34, 589–604.

Smith, J. (1988). Decision Analysis: A Bayesian Approach. Chapmanand Hall, London.

Spiegelhalter, D., A. Thomas, N. Best, and W. Gilks (1996). BUGS0.5: Bayesian Inference Using Gibbs Sampling. MRC BiostatisticsUnit, Cambridge.

Stroud, J., P. Muller, and G. Rosner (1999). Simulation-based methodsfor optimal sampling times in population PK/PD studies. Discus-sion paper 99-31, Institute of Statistic and Decision Science.

Page 200: Análise bayesiana de decisões   aspectos práticos

186 REFERENCIAS

Tierney, L. (1994). Markov chain for exploring posterior distributions(with discussion). Annals of Statistics 22, 1701–1786.

von Neumann, J. and O. Morgenstern (1944). Theory of Games andEconomic Behavior. New York: Wiley.

von Winterfeldt, D. and W. Edwards (1986). Decision Analysis andBehavioral Research. Cambridge University Press.

Wald, A. (1949). Statistical Decision Functions. John Wiley, New York.

Whitmore, G. and M. Findlay (1978). Stochastic Dominance. D.C.Heath, Lexington, Mass.

Winkler, R. L. (1996). Scoring rules and the evaluation of probabilities(with discussion). Test 5, 1–60.