introduÇÃo À pesquisa operacional - dep.ufscar.br - 2011/ipo - aula 7 - 2011.pdf · introduÇÃo...

32
INTRODUÇÃO À PESQUISA OPERACIONAL ** Decisão com Incerteza Parte 1 ** Profa. Vitória Pureza 2º Semestre

Upload: lamxuyen

Post on 17-Nov-2018

236 views

Category:

Documents


0 download

TRANSCRIPT

INTRODUÇÃO À PESQUISA OPERACIONAL

** Decisão com Incerteza – Parte 1 **

Profa. Vitória Pureza

2º Semestre

Roteiro

• Critérios de Decisão em Situações de Incerteza

• Teoria de Utilidade

• Axiomas de Von Neumann-Morgenstern

• Relação entre a Função de Utilidade e a Atitude em relação ao Risco

Winston, cap. 13

Decisões em Situações com Incerteza

• Nestas situações, considera-se que um tomador de decisão primeiro escolhe uma ação ai de um conjunto A={a1, a2, ..., ak} de ações disponíveis

• O estado do sistema é então observado; com probabilidade pj, o estado do sistema é sj S={s1, s2, ..., sn}

• Se a ação ai tiver sido escolhida e o estado do sistema é sj, o tomador de decisão recebe uma recompensa rij. Este modelo é chamado de modelo de tomada de decisões do estado do sistema

Critérios de Decisão em Situações de Incerteza

Exemplo de modelo de estados do sistema

• Um vendedor de jornais vende jornais na esquina de 2 avenidas, e a cada dia ele precisa determinar quantos jornais devem ser vendidos. O vendedor paga $0,20 por cada jornal e vende cada um deles por $0,25. Jornais não vendidos no fim do dia são descartados. O vendedor sabe que cada dia ele pode vender entre 6 e 10 jornais com probabilidade uniforme

Neste exemplo:

– S={6, 7, 8, 9, 10} e pi=1/5, para todo i={6, 7, 8, 9, 10}

– O vendedor precisa escolher uma ação (número de jornais a comprar a cada dia) do conjunto A={6, 7, 8, 9, 10}

Note que se o vendedor faz um pedido de i jornais e j jornais são demandados, então:

– i jornais são comprados a um custo de $0,20

– Min(i,j) jornais são vendidos a um preço de $0,25 (ele pode ter comprado menos jornais do que o demandado, ou seja, i < j)

Portanto, se o vendedor faz um pedidos de i jornais e j jornais são demandados, ele obtém uma recompensa ou lucro líquido de rij, tal que:

rij = 0,25i – 0,20i = 0,05i ( i j)

rij = 0,25j – 0,20i ( i j)

Valores de rij para cada valor de i e j

• Não foi considerada a possibilidade do vendedor pedir 1,2,...,5 jornais ou mais de 10 jornais A razão disso é que estas ações são dominadas pelas ações de pedidos de 6, 7,...,10 jornais

• Uma ação ai é dominada por uma ação ai’ se para todo sj S, rij ri’j, e para algum estado sj’, rij’ < ri’j’

• Se uma ação ai é dominada, então em nenhum estado do sistema, ai será melhor que ai’, e em pelo menos um estado do sistema, ai é inferior a ai’ (ai

sempre seria uma escolha melhor)

PEDIDO DE JORNAIS

(AÇÃO)

JORNAIS DEMANDADOS (ESTADO)

6 7 8 9 10

6 0,30 0,30 0,30 0,30 0,30

7 0,10 0,35 0,35 0,35 0,35

8 -0,10 0,15 0,40 0,40 0,40

9 -0,30 -0,05 0,20 0,45 0,45

10 -0,50 -0,25 0 0,25 0,50

Se o vendedor pedir 1, 2,..., 5 jornais, ele obterá um lucro (qualquer que seja o estado do sistema) de $0,05i

• Ou seja, na melhor das hipóteses (5 jornais), terá um lucro de $0,25

• Pela tabela da recompensa, vemos que para i=1, 2,..., 5, o pedido de 6 jornais domina pedidos de i jornais, pois se consegue um lucro mínimo de $0,30

• Da mesma forma, fazer um pedido de i jornais (i > 11) é dominado pelo pedido de 10 jornais. Nenhuma das ações em A={6, 7,..., 10} são dominadas

Portanto, o vendedor deve escolher sua ação do conjunto A={6, 7, 8, 9,10}

Critérios para Escolha da Ação

1. MAXIMIN

Para cada ação, determine o pior resultado (menor recompensa). O critério MAXIMIN escolhe a ação com o “melhor” pior resultado (Max {MinjS rij}

O critério MAXIMIN recomenda o pedido de 6 jornais, uma vez que ele assegura que pelo menos haverá uma recompensa de $0,30

PEDIDO DE JORNAIS PIOR ESTADO DO SISTEMARECOMPENSA NO PIOR

ESTADO

6 6, 7, 8, 9, 10 0,30

7 6 0,10

8 6 -0,10

9 6 -0,30

10 6 -0,50

Critérios para Escolha da Ação

2. MAXIMAX

Para cada ação determine o melhor resultado (maior recompensa). O critério MAXIMAX escolhe a ação com o maior valor de MaxjS rij

O critério MAXIMAX recomenda o pedido de 10 jornais, uma vez que no melhor estado, haverá uma recompensa de $0,50

PEDIDO DE JORNAISESTADO QUE RESULTA NO

MELHOR RESULTADO

MELHOR RESULTADO

6 6, 7, 8, 9, 10 0,30

7 7, 8, 9, 10 0,35

8 8, 9, 10 0,40

9 9, 10 0,45

10 10 0,50

Critérios para Escolha da Ação

3. MINIMAX ARREPENDIMENTO (L. J. Savage)

Este critério usa o conceito de custo de oportunidade para chegar a uma decisão

• Para cada possível estado do sistema sj, encontre uma ação i*(j) que maximize rij (ou seja, i*(j) é a melhor ação possível se o estado do sistema for realmente sj)

• Para cada ação e estado sj, a perda de oportunidade (ou

arrependimento) para ai em sj é ri*(k), j - rij

Exemplo: Se j=7, a melhor decisão é pedir i*(7)=7 jornais, resultando em um lucro de r77=7(0,25) – 7(0,20)= 0,35

Suponha que tenham sido pedidos 6 jornais. Como r67=6(0,25) – 6(0,20)=

0,30, a perda de oportunidade é 0,35 – 0,30 = 0,05. Em outras

palavras, ao escolhermos pedir 6 jornais, estaremos deixando de ganhar 0,05, caso a escolha ótima (i=7) tivesse sido feita

Matriz de arrependimento

Máximo arrependimento de cada ação

MINIMAX ARREPENDIMENTO procura minimizar o desapontamento sobre o que poderia ter sido obtido com a ação ótima. Portanto, seria recomendado o pedido de 6 ou 7 jornais

PEDIDO DE JORNAIS

(AÇÃO)

JORNAIS DEMANDADOS (ESTADO)

6 7 8 9 10

6 0,30– 0,30=0 0,35–0,3= 0,05 0,40– 0,30=0,10 0,45-0,30=0,15 0,50-0,30=0,20

7 0,30– 0,10=0,20 0,35–0,35= 0 0,40– 0,35=0,05 0,45-0,35=0,10 0,50-0,35=0,15

8 0,30+ 0,10=0,40 0,35–0,15= 0,20 0,40– 0,40=0 0,45-0,40=0,05 0,50-0,40=0,10

9 0,30+0,30=0,60 0,35+0,5= 0,40 0,40– 0,20=0,20 0,45-0,45=0 0,50-0,45=0,05

10 0,30+0,50=0,80 0,35+0,25= 0,60 0,40– 0=0,40 0,45-0,25=0,20 0,50-0,50=0

PEDIDO DE JORNAIS (AÇÃO) MÁXIMO ARREPENDIMENTO

6 0,20

7 0,20

8 0,40

9 0,60

10 0,80

Critérios para Escolha da Ação

4. VALOR ESPERADO

O VALOR ESPERADO escolhe a ação que resulta no maior valor esperado de recompensa. Como pode ser visto na tabela abaixo, este critério recomendaria o pedido de 6 ou 7 jornais

PEDIDO DE JORNAIS VALOR ESPERADO

6 1/5(0,30 + 0,30 + 0,30 + 0,30 + 0,30) = 0,30

7 1/5(0,10 + 0,35 + 0,35 + 0,35 + 0,35) = 0,30

8 1/5(-0,10 + 0,15 + 0,40 + 0,40 + 0,40) = 0,25

9 1/5(-0,30 + 0,05 + 0,20 + 0,45 + 0,45) = 0,15

10 1/5(-0,50 - 0,25 + 0 + 0,25 + 0,50) = 0

Pizza Hut e Domino competem pelo mercado de pizzas. Cada empresaprecisa determinar simultaneamente se deve adotar uma campanha demarketing de pequeno, médio ou grande porte. Pizza Hut acredita queseja igualmente provável que Domino adote qualquer uma dascampanhas. Para cada possível ação de cada empresa, os lucros de PizzaHut são apresentados na tabela abaixo. Determine a campanha escolhidapor Pizza Hut considerando os critérios maximin, maximax, minimaxarrependimento, e valor esperado

Matriz de lucros (recompensas) de Pizza Hut

PORTE DA CAMPANHA

DE PIZZA HUT (AÇÃO)

PORTE DA CAMPANHA DE DOMINO (ESTADO)

PEQUENO MÉDIO GRANDE

PEQUENO $6000 $5000 $2000

MÉDIO $5000 $6000 $1000

GRANDE $9000 $6000 $0

Os critérios discutidos aqui podem parecer razoáveis mas

muitas pessoas tomam decisões sem usar nenhum deles. Um modelo de tomada de decisão individual – Modelo de Utilidade de Von Neumann-Morgenstern – é discutido a seguir

Teoria de Utilidade

• Considere uma situação na qual uma pessoa receberá uma recompensa ri com probabilidade pi (i=1,2,...,n). Isto é denotado de loteria(p1, r1; p2, r2; ..., pn, rn)

Uma loteria é geralmente representada por uma árvore na qual cada ramo representa um resultado possível da loteria e o número de cada ramo representa a probabilidade de que o resultado ocorrerá. Portanto, a loteria (1/4,$500; ¾, $0) pode ser denotada por:

$500

$0

1/4

¾

Suponha que tenhamos que escolher entre duas loterias (L1 e L2). Com probabilidade 1, a loteria L1 resulta em $10.000:

A loteria L2 consiste em jogar uma moeda balanceada. Se a face de cima for cara, recebe-se $30.000 e se for coroa, recebe-se $0:

• L1 resulta em um ganho esperado de $10.000 e L2 resulta em um ganho esperado de $15.000.

L1 $10.0001

$30.000

$0

½

½L2

• Apesar de L2 ter um valor esperado maior que L1, a maioria das pessoas prefeririam L1, porque ela oferece a garantia de um retorno relativamente grande, enquanto L2 resulta em uma chance substancial de um ganho igual a 0.

• Em resumo, a maioria das pessoas, prefeririam L1 pois ela envolve menor risco ou incerteza que L2.

Nosso objetivo é determinar um método que uma pessoa possa usar para escolher uma entre duas loterias. Considere:

• L1pL2: a pessoa prefere L1 a L2

• L2pL1: a pessoa prefere L2 a L1

• L1iL2: a pessoa é indiferente entre as duas loterias (as loterias são equivalentes)

Método de Von-Neumann-Morgenstern

Considere que se deseje classificar as seguintes 4 loterias:

L1 $10.0001

L3 $01$10.000

$500

0.02

0.98L4

$30.000

$0

½

½L2

1. Identifique o resultado mais favorável ($30.000) e o menos favorável (-$10.000)

2. Para todos os outros possíveis resultados (r1=$10.000, r2=$500 e r3=$0), determine a probabilidade pi tal que o tomador de decisão seria indiferente entre duas loterias:

ri e1

$30.000

$10.000

pi

1- pi

Suponha que:

2a) Para r1=$10.000, o tomador de decisão seja indiferente entre:

2b) Para r2=$500, o tomador de decisão seja indiferente entre:

2c) Para r2=$0, o tomador de decisão seja indiferente entre:

$10.000 e1

$30.000

$10.000

0,9

0,1

$500 e1

$30.000

$10.000

0,62

0,38

$0 e1

$30.000

$10.000

0,60

0,40

3. Construa as loterias L’1, L’2, L’3 e L’4 tal que L’i i Li e cada L’i

envolva apenas o melhor ($30.000) e o pior (-$10.000) possíveis resultados

De 2a) vemos que L1 i L’1, onde:

De 2c) vemos que L2 i L’’2, onde:

L’1

$30.000

$10.000

0,90

0,10

$30.000½

½L’’2

$30.000

-$10.000

0.60

0.40

L’’2 é uma loteria composta na qual com probabilidade ½ recebe-se $30.000 e com probabilidade ½, joga-se uma loteria com 0,6 de probabilidade de se obter $30.000 e 0,4 de probabilidade de se obter $10.000.

Uma loteria L é composta se para algum i, existe uma probabilidade pi de que o ganho do tomador de decisão é de jogar uma outra loteria L’. Se uma loteria não é composta, ela é chamada de loteria simples.

Note que L’’2 é uma loteria que resulta em:

• Probabilidade 0,5 + 0,5(0,6) = 0,8 de se obter $30.000, e

• Probabilidade 0,4(0,5)=0,2 de se obter $10.000.

Portanto, L2 i L’’2 i L’2,, onde:

Obtenha L’3 tal que L’3 i L3, e L’4 tal que L’4 i L4

$30.000

$10.000

0,8

0,2L’2

Como Li i L’i, pode-se classificar L1, L2, L3 e L4 classificando L’1, L’2, L’3 e L’4

• Considere duas loterias cujos únicos possíveis resultados sejam $30.000 ( o mais favorável) e $-10.000 ( o menos favorável). O tomador de decisão precisa simplesmente escolher a loteria com maior chance de ter o resultado mais favorável

Aplicando este conceito de L’1 a L’4:• Para L’1 = 0.9

• Para L’2 = 0.8

• Para L’3 = 0.6

• Para L’4 = 0.6076

Logo, L’1 p L’2 p L’4 p L’3

Descrição Formal do Método de Von-Neumann-Morgenstern

A utilidade da recompensa ri (u(ri)) é o número qi tal que o tomador de

decisão é indiferente entre as seguintes duas loterias:

Esta definição força u(menos favorável)=0 e u(mais favorável)=1

Para o exemplo anterior, u($30.000)=1 e u(-$10.000)=0. Além disso u($10.000)=0.9, u($500)=0.62 e u($0)=0.60. A especificação de u(ri) para todos os resultados ri é chamada de função de utilidade do tomador de decisão

ri e1Resultado mais favorável

Resultado menos favorável

qi

1- qi

Para uma dada loteria L = (p1, r1; p2, r2; ..., pn, rn), defina a utilidade esperada da loteria L, E(U para L), por:

No nosso exemplo:

• E(U para L1) = 1.(0,9) = 0,9 E(U para L2) = 0,5.(1) + 0,5.(0,6) = 0,80

• E(U para L3) = 1.(0,6) = 0,6 E(U para L4) = 0,02.(0) + 0,98.(0,62) = 0,6076

Note que Li i L’i e que L’i resultou em uma probabilidade E(U para L) para $30.000 e em uma probabilidade 1 - E(U para L) para -$10.000.

Assim, ao escolher entre as loterias L’1, L’2, L’3 e L’4 (ou equivalentemente entre L1, L2, L3 e L4), pode-se escolher entre elas através dos critérios de utilidade esperados:

• L1 p L2 se e somente se E(U para L1) > E(U para L2)

• L2 p L1 se e somente se E(U para L2) > E(U para L1)

• L1 i L2 se e somente se E(U para L1) = E(U para L2)

n

i

ii rupLparaUE1

)()(

Axiomas de Von Neumann-Morgenstern

Von Neumann e Morgenstern provaram que se a preferência de uma pessoa satisfaz os axiomas seguintes, ela pode escolher entre loterias usando o critério da utilidade esperada

AXIOMA 1: AXIOMA DA ORDENAÇÃO COMPLETA

Para quaisquer duas recompensas r1 e r2, um dos seguintes precisa ser verdadeiro: o tomador de decisão (1) prefere r1 a r2, (2) prefere r2 a r1, ou (3) é indiferente entre r1 e r2. Além disso, se a pessoa prefere r1 a r2 e prefere r2 a r3, então ela deve preferir r1 a r3 (transitividade das preferências)

Axiomas de Von Neumann-Morgenstern

AXIOMA 2: AXIOMA DA CONTINUIDADE

Se o tomador de decisão prefere r1 a r2 e prefere r2 a r3, então para algum c

(0 < c < 1), L1i L2, onde

Usamos o axioma da continuidade quando encontramos, por exemplo, que L3 i L’3, onde

L1r2 e1

r1

r3

c

1- cL2

$30.000

-$10.000

0.60

0.40L’3L3 $0

1

Axiomas de Von Neumann-Morgenstern

AXIOMA 3: AXIOMA DA INDEPENDÊNCIA

Suponha que o tomador de decisão seja indiferente entre as recompensas r1

e r2. Seja r3 qualquer outra recompensa. Então para qualquer (0 < c< 1),

L1 i L2, onde

L1 e L2 diferem apenas no fato de que L1 tem uma probabilidade c de gerar arecompensa r1, enquanto L2 tem uma probabilidade c de resultar narecompensa r2. Portanto, o axioma da independência implica que o tomadorde decisão vê uma chance c de r1 e uma chance c de r2 serem de valoridêntico, e esta visão vale para todos os valores de c e r3

r2

r3

c

1 - cL2

r1

r3

c

1 - cL1

Axiomas de Von Neumann-Morgenstern

AXIOMA 3: AXIOMA DA INDEPENDÊNCIA

Aplicamos o axioma da independência quando concluímos que L2 i L’’2, onde

$30.000½

½L’’2 $30.000

-$10.000

0.60

0.40

$30.000

$0

½

½L2

Axiomas de Von Neumann-Morgenstern

AXIOMA 4: AXIOMA DA PROBABILIDADE DESIGUAL

Suponha que o tomador de decisão prefere a recompensa r1 à recompensa

r2. Se duas loterias têm apenas r1 e r2 como possíveis resultados, ele

preferirá a loteria com a maior probabilidade de obter r1

Usamos o axioma da probabilidade desigual quando concluímos, por exemplo, que L’1 era preferível a L’2 porque L’1 tinha uma chance de 0.9 para $30.000 e L’2 tinha uma chance de 0.8 para $30.000

Axiomas de Von Neumann-Morgenstern

AXIOMA 5: AXIOMA DA LOTERIA COMPOSTA

Suponha que quando todos os possíveis resultados são considerados, uma

loteria composta L resulta (para i=1,2,...,n) em uma probabilidade pi de

receber uma recompensa ri. Então L i L’ , onde L’ é uma loteria simples

Por exemplo, considere a seguinte loteria composta:

Então, P(-$4)=1/2 + ½*0.4 = 0.7 e P($6)=½*0.6 = 0.3

Assim, L i L’’ onde

-$4

½

½L

$6

-$4

0.60

0.40

-$4

-$6

0.7

0.3L