第六章不确定性决策

第六章不确定性决策

6.1 不确定决策问题的概述

6.2 不确定型决策

6.3 风险型决策

6.4 决策树

6.1 不确定决策问题的概述

6.1.1 不确定决策的概念 6.1.2 不确定决策的模型 6.1.3 不确定决策的分类

不确定决策的概念

不确定决策是人与自然的博弈自然方与人的差异，自然方的行动不是主动的，

它也没有收益函数。

6.1.1 不确定决策问题的引入

问题的提出：以西瓜的进货量为例，假设水果商无法预知各种气温状况出现的概率，决策表如表 6-1 所示，

那么这类问题便属于不确定型决策问题。表 6-1 购进西瓜决策表单位：元

收益矩阵状态方案

气温在 30度以下

气温介于 30 度和 35 度

气温在 35度以上

购进西瓜 2000kg 600 800 800

购进西瓜 5000kg 150 2000 2000

购进西瓜 8000kg -300 1550 3200

6.1.2 不确定决策模型的构成

不确定决策模型的基本要素：

1. 决策者（ Decision Maker ） 2. 备选方案（ Alternative ） 3. 自然状态（ State of Nature ） 4. 收益（ Payoff ）

6.1.3 决策的分类

根据对未来的把握程度不同可以分为： 1. 确定型决策 2. 不确定型决策 3. 风险型决策按照决策过程的复杂程度不同可以分为： 1. 单项决策（单阶段决策） 2. 序列决策（多阶段决策）

6.2 不确定型决策的准则

6.2.1 乐观准则 6.2.2 等可能性准则 6.2.3 悲观准则 6.2.4 折中准则 6.2.5 后悔值准则

6.2.1 乐观准则

决策的态度：乐观、冒险决策的步骤： 1. 从决策表中选出各方案的收益的最大值 2. 在选出的最大值中，再次选出最大值。该

值对应的方案就是最优方案。

6.2.1 乐观准则——实例分析

西瓜的进货量决策问题乐观准则下的决策结果见表 6-2 。


在 30 度以下

介于 30 度和 35 度

在 35度以上

各方案收益最大值

购进西瓜 2000kg 600 800 800 800

购进西瓜 5000kg 150 2000 2000 2000

购进西瓜 8000kg -300 1550 3200 3200

最优收益值 3200

表 6-2 乐观决策下的决策表单位：元

6.2.2 等可能性准则

决策的态度：认为各种自然状态发生的机会是均等的决策的步骤： 1. 计算各方案的收益平均值平均值 = 该方案在各种自然状态下收益值的和 / 自然状态数

2. 在这些收益平均值中选出最大者，该值对应的方案就是最优方案。

6.2.2 等可能性准则——实例分析

西瓜的进货量决策问题等可能性准则下的决策结果见表 6-3 。


在 30 度以下

介于 30 度和 35 度

在 35度以上

各方案收益平均值

购进西瓜 2000kg 600 800 800 7333.3

购进西瓜 5000kg 150 2000 2000 1383.3

购进西瓜 8000kg -300 1550 3200 1483.3

最优收益值 1483.3

表 6-3 等可能性准则下的决策表单位：元

6.2.3 悲观准则

决策的态度：悲观、谨慎、保守决策的步骤： 1. 从决策表中选出各方案的收益的最小值 2. 在选出的小值中，选出最大值。该值对应的

方案就是最优方案。

6.2.3 悲观准则——实例分析

西瓜的进货量决策问题悲观准则下的决策结果见表 6-4 。


在 30 度以下

介于 30 度和 35 度

在 35度以上

各方案收益最小值

购进西瓜 2000kg 600 800 800 600

购进西瓜 5000kg 150 2000 2000 150

购进西瓜 8000kg -300 1550 3200 -300

最优收益值 600

表 6-4 悲观准则下的决策表单位：元

6.2.4 折中准则

决策的态度：在乐观与悲观之间的折中决策的步骤： 1. 计算折中收益值： Hi=αAimax+ （ 1- α ） Aimin

2. 其中 Aimax 和 Aimin 分别表示第 i 个方案可能实现的最大收益值和最小收益值，从计算的折中收益值中选出最大值，该值对应的方案就是最优方案。

6.2.4 折中准则——实例分析

西瓜的进货量决策问题折中准则下的决策结果见表 6-5 。


在 30 度以下

介于 30 度和 35 度

在 35度以上

各方案折中收益值 α =0.4

购进西瓜 2000kg 600 800 800 680

购进西瓜 5000kg 150 2000 2000 890

购进西瓜 8000kg -300 1550 3200 1100

最优收益值 1100

表 6-5 折中准则下的决策表单位：元

6.2.5 后悔值准则

决策的态度：最小机会损失决策的步骤： 1. 将收益矩阵转变为相应的后悔值矩阵，后

悔值的计算方法为：后悔值 = 同一自然状态下的最大收益值 - 收益值 2. 选出后悔值矩阵中每个方案的最大值。 3. 从最大后悔值中选出最小值，该值对应的

方案就是最优方案。

6.2.5 后悔值准则——实例分析

西瓜的进货量决策问题后悔值准则下的决策结果见表 6-6 。


在 30 度以下

介于 30 度和 35 度

在 35度以上

各方案最大后悔值

购进西瓜 2000kg 0 1200 2400 2400

购进西瓜 5000kg 450 0 1200 1200

购进西瓜 8000kg 900 450 0 900

最小后悔值 900

表 6-6 后悔值准则下的决策表单位：元

6.3 风险型决策

6.3.1 风险决策的概念 6.3.2 最大期望收益决策准则 6.3.3 最小机会损失决策准则 6.3.4 完全情报价值 6.3.5 贝叶斯决策

6.3 风险型决策——问题的提出

以投资决策为例，假设投资者可以收集各种信息，确定各种自然状态下的概率，决策表如表 6-7 所示，那么这类问题便属于风险型决策问题。

收益矩阵状态概率方案

经济形势好 p1=0.3

经济形势一般 p2=0.5

经济形势差 p3=0.1

证券投资 A 800 5500 300

证券投资 B 650 600 500

证券投资 C 250 400 1000

表 6-7 证券投资决策信息单位：元

6.3.1 风险决策的概念

是指决策者不能完全掌握环境未来的信息，但可获得各种自然状态发生的概率，依据这些概率计算出各备选方案的收益期望值，进而进行决策。

常用的决策准则： 1. 最大期望收益决策准则 2. 最小机会损失决策准则

6.3.2 最大期望收益决策准则

决策的态度：风险中性决策的步骤： 1. 计算各方案的期望收益值 E （ Ai ） =∑Pjaij(i=1,2, …,n)

2. 从得出的期望收益值中选出最大值，该值对应的方案就是最优方案。

6.3.2 最大期望收益决策准则——实例分析

收益矩阵状态概率方案经济形势

好 p1=0.3经济形势一般 p2=0.5


期望的收益值

证券投资 A 800 5500 300 575

证券投资 B 650 600 500 595

证券投资 C 250 400 1000 475

最优期望收益值 595

表 6-8 最大期望收益决策准则下的决策表单位：元

投资决策问题最大期望收益决策准则下的决策结果见表 6-8 。

6.3.3 最小机会损失决策准则

决策的态度：最小机会损失、谨慎决策的步骤： 1. 将收益矩阵转变为相应的后悔值矩阵，后悔值的计算

方法为：后悔值 = 同一自然状态下的最大收益值 - 收益值 2. 依各自然状态发生的概率计算出各方案的期望损失值。 3. 从期望损失值中选出最小值，该值对应的方案就是最

优方案。

6.3.3 最小机会损失决策准则——实例分析




期望损失值

证券投资 A 0 50 700 165

证券投资 B 150 0 500 145

证券投资 C 550 200 0 265


表 6-9 最小机会损失决策准则下的决策表单位：元

投资决策问题最小机会损失决策准则下的决策结果见表 6-9 。

6.3.4 完全情报价值

完全情报价值，等于因获得了这项情报而使决策者的期望收益增加的数值。

完全情报价值给出了支付情报费用的上限。即 EVPI=EPPL-EMV 其中： EVPI ：完全情报价值 EPPL ：获得完全情报的期望收益值 EMV ：最大期望收益值

6.3.4 完全情报价值——实例分析

收益矩阵状态概率决策方法经济形势



最优的期望值

完全情报 800 600 1000 740

最大期望收益准则 - - - 595

最小机会损失准则 - - - 145

表 6-10 完全情报认定下的决策表单位：元

投资决策问题，假如需花费 200 元购买完全情报。完全情报认定下的决策结果见表 6-10 。

可以看出：与最大期望收益准则相比，完全情报价值是 145 ，小于 200 元，不购买。与最小机会损失准则相比，完全情报价值是 595 ，大于 200 元，可以购买。

6.3.5 贝叶斯决策

贝叶斯公式可以用来修正原来的概率估计，提高决策的准确性。

贝叶斯决策的步骤： 1. 通过以往的经验或专家估计获得各种自然状

态发生的先验概率。 2. 通过抽样检验、专家估计等方法获得条件概

率，利用贝叶斯公式计算。 3. 根据后验概率调整决策。

6.3.5 贝叶斯决策——实例分析



经济形势差 p3=0.1 期望的

最大收益值后验概率

0.67 0.30 0.03

证券投资 A 800 5500 300 710

证券投资 B 650 600 500 630.5

证券投资 C 250 400 1000 317.5


表 6-11 贝叶斯决策下的决策表单位：元

投资决策问题，条件概率分别为 0.75 ， 0.2 ， 0.05贝叶斯决策下的决策结果见表 6-11 。

6.4 决策树

6.4.1 决策树的结构

6.4.2 决策步骤

6.4.1 决策树的结构

决策节点

方案枝

方案枝

状态节点

状态节点

概率枝

概率枝

结果节点

结果节点

图 6-12 决策树的结构

决策树的构成要素：

1. 决策节点：以表示，是决策者遇到的决策问题，和它相连的是方案枝。

2. 状态节点：以表示，它的左边跟方案枝相连，它的右端连着概率枝。

3. 结果节点：以表示，它是概率枝的末端，旁边的数字是相应方案的在某个自然状态下的损益值。

4. 分枝：包括方案枝和概率枝两种，通常用直线表达。它连接着决策树中的某两个结点。

6.4.2 决策步骤

决策过程为自左向右进行，具体步骤： 1. 根据收益值及其对应的概率枝上的概率，计算每一方

案的期望收益值，并标于状态节点上方。 2. 根据各方案的预期收益之进行决策，决定方案的取舍。舍弃方案称为修改，标上“ ++”符号。

3. 最后将所剩方案枝的期望收益值标于决策节点上方，并以此为最优方案。

多阶段决策的原则

未来优先，逆向递推的分析方法，体现了序贯理性的思维方法。

以单阶段决策的逐次应用，在多次重复中不断简化决策树，从而解决了多阶段的决策问题。

6.4.2 决策树——应用实例

假设限制资金数额为 50万元，其他数据见表 6-12

方案投资股票投资债券对内投资自然状态

好中差正常异常无需追加投资需追加投资

出现概率

0.5

0.3

0.2

0.9 0.1 0.6 0.4

收益万元

10 4 -5 5 -3 6

追加投资退出

概率 0.6 0.4 0.7 0.3

收益 18 -15 4 -10

6.4.2 决策树——应用实例

1投资决策

投资股票 ++

投资债券

收益期望值

经济形势一般（ 0.3 ）

经济形势好（ 0.5 ）

经济形势差（ 0.2 ）

104

-5

异常情况（ 0.1 ）

正常情况（ 0.9 ） 5

-3对内投资无需追加投资（ 0.6 ） 6

2

转让（ 0.7 ）清算（ 0.3 ） -10

4

情况不好（ 0.4 ）

情况好（ 0.6 ） 18-15

追加投资

++退出

5.2

4.2

5.52

4.8

-0.2追加投资决策 4.8

5.52

需要追加投资（ 0.4 ）

转让（ 0.7 ）清算（ 0.3 ） -10

4

情况不好（ 0.4 ）

情况好（ 0.6 ） 18-15

2

追加投资

++退出

4.8

-0.2追加投资决策 4.8

需要追加投资（ 0.4 ）

1、在决策结 2进行单阶段决策

1投资决策

投资股票 ++

投资债券

收益期望值

经济形势一般（ 0.3 ）

经济形势好（ 0.5 ）

经济形势差（ 0.2 ）

104

-5

异常情况（ 0.1 ）

正常情况（ 0.9 ） 5

-3对内投资无需追加投资（ 0.6 ） 6

5.2

4.2

5.52

追加投资决策 4.8

5.52

需要追加投资（ 0.4 ） 4.8需追加投资（ 0.4 ）

2、在决策结 1进行决策

决策结论：

选择“对内投资”方案，若出现需要追加投资的情况，则选择“追加投资”方案。该决策序列的期望收益为 5.52万元。

第六章 不确定性决策

Documents

第六章不确定性决策