第六章 不确定性决策
DESCRIPTION
第六章 不确定性决策. 6.1 不确定决策问题的概述 6.2 不确定型决策 6.3 风险型决策 6.4 决策树. 6.1 不确定决策问题的概述. 6.1.1 不确定决策的概念 6.1.2 不确定决策的模型 6.1.3 不确定决策的分类. 不确定决策的概念. 不确定决策是人与自然的博弈 自然方与人的差异,自然方的行动不是主动的,它也没有收益函数。. 6.1.1 不确定决策问题的引入. 问题的提出: - PowerPoint PPT PresentationTRANSCRIPT
第六章 不确定性决策
6.1 不确定决策问题的概述
6.2 不确定型决策
6.3 风险型决策
6.4 决策树
6.1 不确定决策问题的概述
6.1.1 不确定决策的概念 6.1.2 不确定决策的模型 6.1.3 不确定决策的分类
不确定决策的概念
不确定决策是人与自然的博弈 自然方与人的差异,自然方的行动不是主动的,
它也没有收益函数。
6.1.1 不确定决策问题的引入
问题的提出: 以西瓜的进货量为例 ,假设水果商无法预知各种气温状况出现的概率,决策表如表 6-1 所示,
那么这类问题便属于不确定型决策问题。表 6-1 购进西瓜决策表 单位:元
收益矩阵 状态方案
气温在 30度以下
气温介于 30 度和 35 度
气温在 35度以上
购进西瓜 2000kg 600 800 800
购进西瓜 5000kg 150 2000 2000
购进西瓜 8000kg -300 1550 3200
6.1.2 不确定决策模型的构成
不确定决策模型的基本要素:
1. 决策者( Decision Maker ) 2. 备选方案( Alternative ) 3. 自然状态( State of Nature ) 4. 收益( Payoff )
6.1.3 决策的分类
根据对未来的把握程度不同可以分为: 1. 确定型决策 2. 不确定型决策 3. 风险型决策 按照决策过程的复杂程度不同可以分为: 1. 单项决策(单阶段决策) 2. 序列决策(多阶段决策)
6.2 不确定型决策的准则
6.2.1 乐观准则 6.2.2 等可能性准则 6.2.3 悲观准则 6.2.4 折中准则 6.2.5 后悔值准则
6.2.1 乐观准则
决策的态度: 乐观、冒险 决策的步骤: 1. 从决策表中选出各方案的收益的最大值 2. 在选出的最大值中,再次选出最大值。该
值对应的方案就是最优方案。
6.2.1 乐观准则——实例分析
西瓜的进货量决策问题 乐观准则下的决策结果见表 6-2 。
收益矩阵 状态方案
在 30 度以下
介于 30 度和 35 度
在 35度以上
各方案收益最大值
购进西瓜 2000kg 600 800 800 800
购进西瓜 5000kg 150 2000 2000 2000
购进西瓜 8000kg -300 1550 3200 3200
最优收益值 3200
表 6-2 乐观决策下的决策表 单位:元
6.2.2 等可能性准则
决策的态度: 认为各种自然状态发生的机会是均等的 决策的步骤: 1. 计算各方案的收益平均值 平均值 = 该方案在各种自然状态下收益值的和 / 自然状态数
2. 在这些收益平均值中选出最大者,该值对应的方案就是最优方案。
6.2.2 等可能性准则——实例分析
西瓜的进货量决策问题等可能性准则下的决策结果见表 6-3 。
收益矩阵 状态 方案
在 30 度以下
介于 30 度和 35 度
在 35度以上
各方案收益平均值
购进西瓜 2000kg 600 800 800 7333.3
购进西瓜 5000kg 150 2000 2000 1383.3
购进西瓜 8000kg -300 1550 3200 1483.3
最优收益值 1483.3
表 6-3 等可能性准则下的决策表 单位:元
6.2.3 悲观准则
决策的态度: 悲观、谨慎、保守 决策的步骤: 1. 从决策表中选出各方案的收益的最小值 2. 在选出的小值中,选出最大值。该值对应的
方案就是最优方案。
6.2.3 悲观准则——实例分析
西瓜的进货量决策问题悲观准则下的决策结果见表 6-4 。
收益矩阵 状态 方案
在 30 度以下
介于 30 度和 35 度
在 35度以上
各方案收益最小值
购进西瓜 2000kg 600 800 800 600
购进西瓜 5000kg 150 2000 2000 150
购进西瓜 8000kg -300 1550 3200 -300
最优收益值 600
表 6-4 悲观准则下的决策表 单位:元
6.2.4 折中准则
决策的态度: 在乐观与悲观之间的折中 决策的步骤: 1. 计算折中收益值: Hi=αAimax+ ( 1- α ) Aimin
2. 其中 Aimax 和 Aimin 分别表示第 i 个方案可能实现的最大收益值和最小收益值,从计算的折中收益值中选出最大值,该值对应的方案就是最优方案。
6.2.4 折中准则——实例分析
西瓜的进货量决策问题折中准则下的决策结果见表 6-5 。
收益矩阵 状态 方案
在 30 度以下
介于 30 度和 35 度
在 35度以上
各方案折中收益值 α =0.4
购进西瓜 2000kg 600 800 800 680
购进西瓜 5000kg 150 2000 2000 890
购进西瓜 8000kg -300 1550 3200 1100
最优收益值 1100
表 6-5 折中准则下的决策表 单位:元
6.2.5 后悔值准则
决策的态度: 最小机会损失 决策的步骤: 1. 将收益矩阵转变为相应的后悔值矩阵,后
悔值的计算方法为: 后悔值 = 同一自然状态下的最大收益值 - 收益值 2. 选出后悔值矩阵中每个方案的最大值。 3. 从最大后悔值中选出最小值,该值对应的
方案就是最优方案。
6.2.5 后悔值准则——实例分析
西瓜的进货量决策问题后悔值准则下的决策结果见表 6-6 。
收益矩阵 状态 方案
在 30 度以下
介于 30 度和 35 度
在 35度以上
各方案最大后悔值
购进西瓜 2000kg 0 1200 2400 2400
购进西瓜 5000kg 450 0 1200 1200
购进西瓜 8000kg 900 450 0 900
最小后悔值 900
表 6-6 后悔值准则下的决策表 单位:元
6.3 风险型决策
6.3.1 风险决策的概念 6.3.2 最大期望收益决策准则 6.3.3 最小机会损失决策准则 6.3.4 完全情报价值 6.3.5 贝叶斯决策
6.3 风险型决策——问题的提出
以投资决策为例 ,假设投资者可以收集各种信息,确定各种自然状态下的概率,决策表如表 6-7 所示,那么这类问题便属于风险型决策问题。
收益矩阵 状态概率方案
经济形势好 p1=0.3
经济形势一般 p2=0.5
经济形势差 p3=0.1
证券投资 A 800 5500 300
证券投资 B 650 600 500
证券投资 C 250 400 1000
表 6-7 证券投资决策信息 单位:元
6.3.1 风险决策的概念
是指决策者不能完全掌握环境未来的信息,但可获得各种自然状态发生的概率, 依据这些概率计算出各备选方案的收益期望值,进而进行决策。
常用的决策准则: 1. 最大期望收益决策准则 2. 最小机会损失决策准则
6.3.2 最大期望收益决策准则
决策的态度: 风险中性 决策的步骤: 1. 计算各方案的期望收益值 E ( Ai ) =∑Pjaij(i=1,2, …,n)
2. 从得出的期望收益值中选出最大值,该值对应的方案就是最优方案。
6.3.2 最大期望收益决策准则——实例分析
收益矩阵 状态概率方案 经济形势
好 p1=0.3经济形势一般 p2=0.5
经济形势差 p3=0.1
期望的收益值
证券投资 A 800 5500 300 575
证券投资 B 650 600 500 595
证券投资 C 250 400 1000 475
最优期望收益值 595
表 6-8 最大期望收益决策准则下的决策表 单位:元
投资决策问题最大期望收益决策准则下的决策结果见表 6-8 。
6.3.3 最小机会损失决策准则
决策的态度: 最小机会损失、谨慎 决策的步骤: 1. 将收益矩阵转变为相应的后悔值矩阵,后悔值的计算
方法为: 后悔值 = 同一自然状态下的最大收益值 - 收益值 2. 依各自然状态发生的概率计算出各方案的期望损失值。 3. 从期望损失值中选出最小值,该值对应的方案就是最
优方案。
6.3.3 最小机会损失决策准则——实例分析
收益矩阵 状态概率方案 经济形势
好 p1=0.3经济形势一般 p2=0.5
经济形势差 p3=0.1
期望损失值
证券投资 A 0 50 700 165
证券投资 B 150 0 500 145
证券投资 C 550 200 0 265
最优期望收益值 145
表 6-9 最小机会损失决策准则下的决策表 单位:元
投资决策问题最小机会损失决策准则下的决策结果见表 6-9 。
6.3.4 完全情报价值
完全情报价值,等于因获得了这项情报而使决策者的期望收益增加的数值。
完全情报价值给出了支付情报费用的上限。 即 EVPI=EPPL-EMV 其中: EVPI :完全情报价值 EPPL :获得完全情报的期望收益值 EMV :最大期望收益值
6.3.4 完全情报价值——实例分析
收益矩阵 状态概率决策方法 经济形势
好 p1=0.3经济形势一般 p2=0.5
经济形势差 p3=0.1
最优的期望值
完全情报 800 600 1000 740
最大期望收益准则 - - - 595
最小机会损失准则 - - - 145
表 6-10 完全情报认定下的决策表 单位:元
投资决策问题,假如需花费 200 元购买完全情报。完全情报认定下的决策结果见表 6-10 。
可以看出:与最大期望收益准则相比,完全情报价值是 145 ,小于 200 元,不购买。与最小机会损失准则相比,完全情报价值是 595 ,大于 200 元,可以购买。
6.3.5 贝叶斯决策
贝叶斯公式可以用来修正原来的概率估计,提高决策的准确性。
贝叶斯决策的步骤: 1. 通过以往的经验或专家估计获得各种自然状
态发生的先验概率。 2. 通过抽样检验、专家估计等方法获得条件概
率,利用贝叶斯公式计算。 3. 根据后验概率调整决策。
6.3.5 贝叶斯决策——实例分析
收益矩阵 状态概率方案 经济形势
好 p1=0.3经济形势一般 p2=0.5
经济形势差 p3=0.1 期望的
最大收益值 后验概率
0.67 0.30 0.03
证券投资 A 800 5500 300 710
证券投资 B 650 600 500 630.5
证券投资 C 250 400 1000 317.5
最优期望收益值 710
表 6-11 贝叶斯决策下的决策表 单位:元
投资决策问题,条件概率分别为 0.75 , 0.2 , 0.05贝叶斯决策下的决策结果见表 6-11 。
6.4 决策树
6.4.1 决策树的结构
6.4.2 决策步骤
6.4.1 决策树的结构
决策节点
方案枝
方案枝
状态节点
状态节点
概率枝
概率枝
结果节点
结果节点
图 6-12 决策树的结构
决策树的构成要素:
1. 决策节点:以 表示,是决策者遇到的决策问题,和它相连的是方案枝。
2. 状态节点:以 表示,它的左边跟方案枝相连,它的右端连着概率枝。
3. 结果节点:以 表示,它是概率枝的末端,旁边的数字是相应方案的在某个自然状态下的损益值。
4. 分枝:包括方案枝和概率枝两种,通常用直线表达。它连接着决策树中的某两个结点。
6.4.2 决策步骤
决策过程为自左向右进行,具体步骤: 1. 根据收益值及其对应的概率枝上的概率,计算每一方
案的期望收益值,并标于状态节点上方。 2. 根据各方案的预期收益之进行决策,决定方案的取舍。舍弃方案称为修改,标上“ ++”符号。
3. 最后将所剩方案枝的期望收益值标于决策节点上方,并以此为最优方案。
多阶段决策的原则
未来优先,逆向递推的分析方法,体现了序贯理性的思维方法。
以单阶段决策的逐次应用,在多次重复中不断简化决策树,从而解决了多阶段的决策问题。
6.4.2 决策树——应用实例
假设限制资金数额为 50万元,其他数据见表 6-12
方案 投资股票 投资债券 对内投资自然状态
好 中 差 正常 异常 无需追加投资 需追加投资
出现概率
0.5
0.3
0.2
0.9 0.1 0.6 0.4
收益万元
10 4 -5 5 -3 6
追加投资 退出
概率 0.6 0.4 0.7 0.3
收益 18 -15 4 -10
6.4.2 决策树——应用实例
1投资决策
投资股票 ++
投资债券
收益期望值
经济形势一般( 0.3 )
经济形势好( 0.5 )
经济形势差( 0.2 )
104
-5
异常情况( 0.1 )
正常情况( 0.9 ) 5
-3对内投资无需追加投资( 0.6 ) 6
2
转让( 0.7 )清算( 0.3 ) -10
4
情况不好( 0.4 )
情况好( 0.6 ) 18-15
追加投资
++退出
5.2
4.2
5.52
4.8
-0.2追加投资决策 4.8
5.52
需要追加投资( 0.4 )
转让( 0.7 )清算( 0.3 ) -10
4
情况不好( 0.4 )
情况好( 0.6 ) 18-15
2
追加投资
++退出
4.8
-0.2追加投资决策 4.8
需要追加投资( 0.4 )
1、在决策结 2进行单阶段决策
1投资决策
投资股票 ++
投资债券
收益期望值
经济形势一般( 0.3 )
经济形势好( 0.5 )
经济形势差( 0.2 )
104
-5
异常情况( 0.1 )
正常情况( 0.9 ) 5
-3对内投资无需追加投资( 0.6 ) 6
5.2
4.2
5.52
追加投资决策 4.8
5.52
需要追加投资( 0.4 ) 4.8需追加投资( 0.4 )
2、在决策结 1进行决策
决策结论:
选择“对内投资”方案,若出现需要追加投资的情况,则选择“追加投资”方案。该决策序列的期望收益为 5.52万元。