INTRODUÇÃO À PESQUISA OPERACIONAL
** Decisão com Incerteza – Parte 1 **
Profa. Vitória Pureza
2º Semestre
Roteiro
• Critérios de Decisão em Situações de Incerteza
• Teoria de Utilidade
• Axiomas de Von Neumann-Morgenstern
• Relação entre a Função de Utilidade e a Atitude em relação ao Risco
Winston, cap. 13
Decisões em Situações com Incerteza
• Nestas situações, considera-se que um tomador de decisão primeiro escolhe uma ação ai de um conjunto A={a1, a2, ..., ak} de ações disponíveis
• O estado do sistema é então observado; com probabilidade pj, o estado do sistema é sj S={s1, s2, ..., sn}
• Se a ação ai tiver sido escolhida e o estado do sistema é sj, o tomador de decisão recebe uma recompensa rij. Este modelo é chamado de modelo de tomada de decisões do estado do sistema
Critérios de Decisão em Situações de Incerteza
Exemplo de modelo de estados do sistema
• Um vendedor de jornais vende jornais na esquina de 2 avenidas, e a cada dia ele precisa determinar quantos jornais devem ser vendidos. O vendedor paga $0,20 por cada jornal e vende cada um deles por $0,25. Jornais não vendidos no fim do dia são descartados. O vendedor sabe que cada dia ele pode vender entre 6 e 10 jornais com probabilidade uniforme
Neste exemplo:
– S={6, 7, 8, 9, 10} e pi=1/5, para todo i={6, 7, 8, 9, 10}
– O vendedor precisa escolher uma ação (número de jornais a comprar a cada dia) do conjunto A={6, 7, 8, 9, 10}
Note que se o vendedor faz um pedido de i jornais e j jornais são demandados, então:
– i jornais são comprados a um custo de $0,20
– Min(i,j) jornais são vendidos a um preço de $0,25 (ele pode ter comprado menos jornais do que o demandado, ou seja, i < j)
Portanto, se o vendedor faz um pedidos de i jornais e j jornais são demandados, ele obtém uma recompensa ou lucro líquido de rij, tal que:
rij = 0,25i – 0,20i = 0,05i ( i j)
rij = 0,25j – 0,20i ( i j)
Valores de rij para cada valor de i e j
• Não foi considerada a possibilidade do vendedor pedir 1,2,...,5 jornais ou mais de 10 jornais A razão disso é que estas ações são dominadas pelas ações de pedidos de 6, 7,...,10 jornais
• Uma ação ai é dominada por uma ação ai’ se para todo sj S, rij ri’j, e para algum estado sj’, rij’ < ri’j’
• Se uma ação ai é dominada, então em nenhum estado do sistema, ai será melhor que ai’, e em pelo menos um estado do sistema, ai é inferior a ai’ (ai
sempre seria uma escolha melhor)
PEDIDO DE JORNAIS
(AÇÃO)
JORNAIS DEMANDADOS (ESTADO)
6 7 8 9 10
6 0,30 0,30 0,30 0,30 0,30
7 0,10 0,35 0,35 0,35 0,35
8 -0,10 0,15 0,40 0,40 0,40
9 -0,30 -0,05 0,20 0,45 0,45
10 -0,50 -0,25 0 0,25 0,50
Se o vendedor pedir 1, 2,..., 5 jornais, ele obterá um lucro (qualquer que seja o estado do sistema) de $0,05i
• Ou seja, na melhor das hipóteses (5 jornais), terá um lucro de $0,25
• Pela tabela da recompensa, vemos que para i=1, 2,..., 5, o pedido de 6 jornais domina pedidos de i jornais, pois se consegue um lucro mínimo de $0,30
• Da mesma forma, fazer um pedido de i jornais (i > 11) é dominado pelo pedido de 10 jornais. Nenhuma das ações em A={6, 7,..., 10} são dominadas
Portanto, o vendedor deve escolher sua ação do conjunto A={6, 7, 8, 9,10}
Critérios para Escolha da Ação
1. MAXIMIN
Para cada ação, determine o pior resultado (menor recompensa). O critério MAXIMIN escolhe a ação com o “melhor” pior resultado (Max {MinjS rij}
O critério MAXIMIN recomenda o pedido de 6 jornais, uma vez que ele assegura que pelo menos haverá uma recompensa de $0,30
PEDIDO DE JORNAIS PIOR ESTADO DO SISTEMARECOMPENSA NO PIOR
ESTADO
6 6, 7, 8, 9, 10 0,30
7 6 0,10
8 6 -0,10
9 6 -0,30
10 6 -0,50
Critérios para Escolha da Ação
2. MAXIMAX
Para cada ação determine o melhor resultado (maior recompensa). O critério MAXIMAX escolhe a ação com o maior valor de MaxjS rij
O critério MAXIMAX recomenda o pedido de 10 jornais, uma vez que no melhor estado, haverá uma recompensa de $0,50
PEDIDO DE JORNAISESTADO QUE RESULTA NO
MELHOR RESULTADO
MELHOR RESULTADO
6 6, 7, 8, 9, 10 0,30
7 7, 8, 9, 10 0,35
8 8, 9, 10 0,40
9 9, 10 0,45
10 10 0,50
Critérios para Escolha da Ação
3. MINIMAX ARREPENDIMENTO (L. J. Savage)
Este critério usa o conceito de custo de oportunidade para chegar a uma decisão
• Para cada possível estado do sistema sj, encontre uma ação i*(j) que maximize rij (ou seja, i*(j) é a melhor ação possível se o estado do sistema for realmente sj)
• Para cada ação e estado sj, a perda de oportunidade (ou
arrependimento) para ai em sj é ri*(k), j - rij
Exemplo: Se j=7, a melhor decisão é pedir i*(7)=7 jornais, resultando em um lucro de r77=7(0,25) – 7(0,20)= 0,35
Suponha que tenham sido pedidos 6 jornais. Como r67=6(0,25) – 6(0,20)=
0,30, a perda de oportunidade é 0,35 – 0,30 = 0,05. Em outras
palavras, ao escolhermos pedir 6 jornais, estaremos deixando de ganhar 0,05, caso a escolha ótima (i=7) tivesse sido feita
Matriz de arrependimento
Máximo arrependimento de cada ação
MINIMAX ARREPENDIMENTO procura minimizar o desapontamento sobre o que poderia ter sido obtido com a ação ótima. Portanto, seria recomendado o pedido de 6 ou 7 jornais
PEDIDO DE JORNAIS
(AÇÃO)
JORNAIS DEMANDADOS (ESTADO)
6 7 8 9 10
6 0,30– 0,30=0 0,35–0,3= 0,05 0,40– 0,30=0,10 0,45-0,30=0,15 0,50-0,30=0,20
7 0,30– 0,10=0,20 0,35–0,35= 0 0,40– 0,35=0,05 0,45-0,35=0,10 0,50-0,35=0,15
8 0,30+ 0,10=0,40 0,35–0,15= 0,20 0,40– 0,40=0 0,45-0,40=0,05 0,50-0,40=0,10
9 0,30+0,30=0,60 0,35+0,5= 0,40 0,40– 0,20=0,20 0,45-0,45=0 0,50-0,45=0,05
10 0,30+0,50=0,80 0,35+0,25= 0,60 0,40– 0=0,40 0,45-0,25=0,20 0,50-0,50=0
PEDIDO DE JORNAIS (AÇÃO) MÁXIMO ARREPENDIMENTO
6 0,20
7 0,20
8 0,40
9 0,60
10 0,80
Critérios para Escolha da Ação
4. VALOR ESPERADO
O VALOR ESPERADO escolhe a ação que resulta no maior valor esperado de recompensa. Como pode ser visto na tabela abaixo, este critério recomendaria o pedido de 6 ou 7 jornais
PEDIDO DE JORNAIS VALOR ESPERADO
6 1/5(0,30 + 0,30 + 0,30 + 0,30 + 0,30) = 0,30
7 1/5(0,10 + 0,35 + 0,35 + 0,35 + 0,35) = 0,30
8 1/5(-0,10 + 0,15 + 0,40 + 0,40 + 0,40) = 0,25
9 1/5(-0,30 + 0,05 + 0,20 + 0,45 + 0,45) = 0,15
10 1/5(-0,50 - 0,25 + 0 + 0,25 + 0,50) = 0
Pizza Hut e Domino competem pelo mercado de pizzas. Cada empresaprecisa determinar simultaneamente se deve adotar uma campanha demarketing de pequeno, médio ou grande porte. Pizza Hut acredita queseja igualmente provável que Domino adote qualquer uma dascampanhas. Para cada possível ação de cada empresa, os lucros de PizzaHut são apresentados na tabela abaixo. Determine a campanha escolhidapor Pizza Hut considerando os critérios maximin, maximax, minimaxarrependimento, e valor esperado
Matriz de lucros (recompensas) de Pizza Hut
PORTE DA CAMPANHA
DE PIZZA HUT (AÇÃO)
PORTE DA CAMPANHA DE DOMINO (ESTADO)
PEQUENO MÉDIO GRANDE
PEQUENO $6000 $5000 $2000
MÉDIO $5000 $6000 $1000
GRANDE $9000 $6000 $0
Os critérios discutidos aqui podem parecer razoáveis mas
muitas pessoas tomam decisões sem usar nenhum deles. Um modelo de tomada de decisão individual – Modelo de Utilidade de Von Neumann-Morgenstern – é discutido a seguir
Teoria de Utilidade
• Considere uma situação na qual uma pessoa receberá uma recompensa ri com probabilidade pi (i=1,2,...,n). Isto é denotado de loteria(p1, r1; p2, r2; ..., pn, rn)
Uma loteria é geralmente representada por uma árvore na qual cada ramo representa um resultado possível da loteria e o número de cada ramo representa a probabilidade de que o resultado ocorrerá. Portanto, a loteria (1/4,$500; ¾, $0) pode ser denotada por:
$500
$0
1/4
¾
Suponha que tenhamos que escolher entre duas loterias (L1 e L2). Com probabilidade 1, a loteria L1 resulta em $10.000:
A loteria L2 consiste em jogar uma moeda balanceada. Se a face de cima for cara, recebe-se $30.000 e se for coroa, recebe-se $0:
• L1 resulta em um ganho esperado de $10.000 e L2 resulta em um ganho esperado de $15.000.
L1 $10.0001
$30.000
$0
½
½L2
• Apesar de L2 ter um valor esperado maior que L1, a maioria das pessoas prefeririam L1, porque ela oferece a garantia de um retorno relativamente grande, enquanto L2 resulta em uma chance substancial de um ganho igual a 0.
• Em resumo, a maioria das pessoas, prefeririam L1 pois ela envolve menor risco ou incerteza que L2.
Nosso objetivo é determinar um método que uma pessoa possa usar para escolher uma entre duas loterias. Considere:
• L1pL2: a pessoa prefere L1 a L2
• L2pL1: a pessoa prefere L2 a L1
• L1iL2: a pessoa é indiferente entre as duas loterias (as loterias são equivalentes)
Método de Von-Neumann-Morgenstern
Considere que se deseje classificar as seguintes 4 loterias:
L1 $10.0001
L3 $01$10.000
$500
0.02
0.98L4
$30.000
$0
½
½L2
1. Identifique o resultado mais favorável ($30.000) e o menos favorável (-$10.000)
2. Para todos os outros possíveis resultados (r1=$10.000, r2=$500 e r3=$0), determine a probabilidade pi tal que o tomador de decisão seria indiferente entre duas loterias:
ri e1
$30.000
$10.000
pi
1- pi
Suponha que:
2a) Para r1=$10.000, o tomador de decisão seja indiferente entre:
2b) Para r2=$500, o tomador de decisão seja indiferente entre:
2c) Para r2=$0, o tomador de decisão seja indiferente entre:
$10.000 e1
$30.000
$10.000
0,9
0,1
$500 e1
$30.000
$10.000
0,62
0,38
$0 e1
$30.000
$10.000
0,60
0,40
3. Construa as loterias L’1, L’2, L’3 e L’4 tal que L’i i Li e cada L’i
envolva apenas o melhor ($30.000) e o pior (-$10.000) possíveis resultados
De 2a) vemos que L1 i L’1, onde:
De 2c) vemos que L2 i L’’2, onde:
L’1
$30.000
$10.000
0,90
0,10
$30.000½
½L’’2
$30.000
-$10.000
0.60
0.40
L’’2 é uma loteria composta na qual com probabilidade ½ recebe-se $30.000 e com probabilidade ½, joga-se uma loteria com 0,6 de probabilidade de se obter $30.000 e 0,4 de probabilidade de se obter $10.000.
Uma loteria L é composta se para algum i, existe uma probabilidade pi de que o ganho do tomador de decisão é de jogar uma outra loteria L’. Se uma loteria não é composta, ela é chamada de loteria simples.
Note que L’’2 é uma loteria que resulta em:
• Probabilidade 0,5 + 0,5(0,6) = 0,8 de se obter $30.000, e
• Probabilidade 0,4(0,5)=0,2 de se obter $10.000.
Portanto, L2 i L’’2 i L’2,, onde:
Obtenha L’3 tal que L’3 i L3, e L’4 tal que L’4 i L4
$30.000
$10.000
0,8
0,2L’2
Como Li i L’i, pode-se classificar L1, L2, L3 e L4 classificando L’1, L’2, L’3 e L’4
• Considere duas loterias cujos únicos possíveis resultados sejam $30.000 ( o mais favorável) e $-10.000 ( o menos favorável). O tomador de decisão precisa simplesmente escolher a loteria com maior chance de ter o resultado mais favorável
Aplicando este conceito de L’1 a L’4:• Para L’1 = 0.9
• Para L’2 = 0.8
• Para L’3 = 0.6
• Para L’4 = 0.6076
Logo, L’1 p L’2 p L’4 p L’3
Descrição Formal do Método de Von-Neumann-Morgenstern
A utilidade da recompensa ri (u(ri)) é o número qi tal que o tomador de
decisão é indiferente entre as seguintes duas loterias:
Esta definição força u(menos favorável)=0 e u(mais favorável)=1
Para o exemplo anterior, u($30.000)=1 e u(-$10.000)=0. Além disso u($10.000)=0.9, u($500)=0.62 e u($0)=0.60. A especificação de u(ri) para todos os resultados ri é chamada de função de utilidade do tomador de decisão
ri e1Resultado mais favorável
Resultado menos favorável
qi
1- qi
Para uma dada loteria L = (p1, r1; p2, r2; ..., pn, rn), defina a utilidade esperada da loteria L, E(U para L), por:
No nosso exemplo:
• E(U para L1) = 1.(0,9) = 0,9 E(U para L2) = 0,5.(1) + 0,5.(0,6) = 0,80
• E(U para L3) = 1.(0,6) = 0,6 E(U para L4) = 0,02.(0) + 0,98.(0,62) = 0,6076
Note que Li i L’i e que L’i resultou em uma probabilidade E(U para L) para $30.000 e em uma probabilidade 1 - E(U para L) para -$10.000.
Assim, ao escolher entre as loterias L’1, L’2, L’3 e L’4 (ou equivalentemente entre L1, L2, L3 e L4), pode-se escolher entre elas através dos critérios de utilidade esperados:
• L1 p L2 se e somente se E(U para L1) > E(U para L2)
• L2 p L1 se e somente se E(U para L2) > E(U para L1)
• L1 i L2 se e somente se E(U para L1) = E(U para L2)
n
i
ii rupLparaUE1
)()(
Axiomas de Von Neumann-Morgenstern
Von Neumann e Morgenstern provaram que se a preferência de uma pessoa satisfaz os axiomas seguintes, ela pode escolher entre loterias usando o critério da utilidade esperada
AXIOMA 1: AXIOMA DA ORDENAÇÃO COMPLETA
Para quaisquer duas recompensas r1 e r2, um dos seguintes precisa ser verdadeiro: o tomador de decisão (1) prefere r1 a r2, (2) prefere r2 a r1, ou (3) é indiferente entre r1 e r2. Além disso, se a pessoa prefere r1 a r2 e prefere r2 a r3, então ela deve preferir r1 a r3 (transitividade das preferências)
Axiomas de Von Neumann-Morgenstern
AXIOMA 2: AXIOMA DA CONTINUIDADE
Se o tomador de decisão prefere r1 a r2 e prefere r2 a r3, então para algum c
(0 < c < 1), L1i L2, onde
Usamos o axioma da continuidade quando encontramos, por exemplo, que L3 i L’3, onde
L1r2 e1
r1
r3
c
1- cL2
$30.000
-$10.000
0.60
0.40L’3L3 $0
1
Axiomas de Von Neumann-Morgenstern
AXIOMA 3: AXIOMA DA INDEPENDÊNCIA
Suponha que o tomador de decisão seja indiferente entre as recompensas r1
e r2. Seja r3 qualquer outra recompensa. Então para qualquer (0 < c< 1),
L1 i L2, onde
L1 e L2 diferem apenas no fato de que L1 tem uma probabilidade c de gerar arecompensa r1, enquanto L2 tem uma probabilidade c de resultar narecompensa r2. Portanto, o axioma da independência implica que o tomadorde decisão vê uma chance c de r1 e uma chance c de r2 serem de valoridêntico, e esta visão vale para todos os valores de c e r3
r2
r3
c
1 - cL2
r1
r3
c
1 - cL1
Axiomas de Von Neumann-Morgenstern
AXIOMA 3: AXIOMA DA INDEPENDÊNCIA
Aplicamos o axioma da independência quando concluímos que L2 i L’’2, onde
$30.000½
½L’’2 $30.000
-$10.000
0.60
0.40
$30.000
$0
½
½L2
Axiomas de Von Neumann-Morgenstern
AXIOMA 4: AXIOMA DA PROBABILIDADE DESIGUAL
Suponha que o tomador de decisão prefere a recompensa r1 à recompensa
r2. Se duas loterias têm apenas r1 e r2 como possíveis resultados, ele
preferirá a loteria com a maior probabilidade de obter r1
Usamos o axioma da probabilidade desigual quando concluímos, por exemplo, que L’1 era preferível a L’2 porque L’1 tinha uma chance de 0.9 para $30.000 e L’2 tinha uma chance de 0.8 para $30.000
Axiomas de Von Neumann-Morgenstern
AXIOMA 5: AXIOMA DA LOTERIA COMPOSTA
Suponha que quando todos os possíveis resultados são considerados, uma
loteria composta L resulta (para i=1,2,...,n) em uma probabilidade pi de
receber uma recompensa ri. Então L i L’ , onde L’ é uma loteria simples
Por exemplo, considere a seguinte loteria composta:
Então, P(-$4)=1/2 + ½*0.4 = 0.7 e P($6)=½*0.6 = 0.3
Assim, L i L’’ onde
-$4
½
½L
$6
-$4
0.60
0.40
-$4
-$6
0.7
0.3L