data, model and decisions 数据、模型与决策

50
Data, Model and Decisions 数数 数数数 数数 数数数数数数数数数

Upload: kylee

Post on 04-Jan-2016

162 views

Category:

Documents


0 download

DESCRIPTION

Data, Model and Decisions 数据、模型与决策. 第3章 随机变量和概率分布. Session Topics. Basic Probability Concepts 基本概率概念 Discrete Random Variable 离散随机变量 Continuous Random Variable 连续随机变量. Sample Spaces 样本空间. 收集所有可能出现的结果 : 例如 6 个摔子都出现 1 点 今天老师备课笔记丢了. 随机事件. (一)随机试验与事件 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Data, Model and Decisions  数据、模型与决策

Data, Model and Decisions 数据、模型与决策

第3章 随机变量和概率分布

Page 2: Data, Model and Decisions  数据、模型与决策

Session Topics

Basic Probability Concepts 基本概率概念 Discrete Random Variable

离散随机变量 Continuous Random Variable

连续随机变量

Page 3: Data, Model and Decisions  数据、模型与决策

Sample Spaces

样本空间

收集所有可能出现的结果 :

例如 6 个摔子都出现 1 点

今天老师备课笔记丢了

Page 4: Data, Model and Decisions  数据、模型与决策

随机事件

(一)随机试验与事件

随机现象的特点是:在条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。对随机现象的试验或观测称为随机试验,它必须满足以下的性质:

( 1 )每次试验的可能结果不是唯一的;

( 2 )每次试验之前不能确定何种结果会出现;

( 3 )试验可在相同条件下重复进行。

Page 5: Data, Model and Decisions  数据、模型与决策

随机事件

在随机试验中,可能出现也可能不出现的结果,称之为随机事件,简称事件。试验的结果可能是一个简单事件,也可能是一个复杂事件。简单事件就是不可以再分解的事件,又称为基本事件。复杂事件是由简单事件组合而成的事件。基本事件还可称为样本点,设试验有 n 个基本事件,分别记为 (i=1,2,… , n) 。集合 Ω={ω1 ,ω2 , … ,

ωn} 称为样本空间, Ω 中的元素就是样本点。i

Page 6: Data, Model and Decisions  数据、模型与决策

Events

事件

简单事件( Simple event ) :

从样本空间出现的结果只有一个特征例如:从一副牌中抽出的是一张红桃

联合或混合事件( Joint/Compound event ):涉及同时出现两个或以上特征例如:从一副牌中抽出的是一张红桃

这是一张红桃 Ace

Page 7: Data, Model and Decisions  数据、模型与决策

Visualizing Events

事件形象化

关联表

树图

Ace Not Ace Total

Red 2 24 26

Black 2 24 26

Total 4 48 52

Page 8: Data, Model and Decisions  数据、模型与决策

Special Events

特殊事件

空事件( Null Event )

非事件、补事件( Complement of Event )

独立与非独立事件 ( Dependent or Independent Events )

Page 9: Data, Model and Decisions  数据、模型与决策

Contingency Table

关联表

一副 52 张的牌

Ace Not anAce

Total

Red

Black

Total

2 24

2 24

26

26

4 48 52样本空间

Red Ace

Page 10: Data, Model and Decisions  数据、模型与决策

Tree Diagram

树形图

事件可能性Red Cards

Black Cards

Ace

Not an Ace

Ace

Not an Ace

所有牌

Page 11: Data, Model and Decisions  数据、模型与决策

(二)概率

1. 概率的定义 概率就是指随机事件发生的可能性,或称为机率,是对随机事件发

生可能性的度量。 进行 n 次重复试验,随机事件 A 发生的次数是 m

次,发生的频率是 m/n ,当试验的次数 n 很大时,如果频率在某一数值 p 附近摆动,而且随着试验次数 n 的不断增加,频率的摆动幅度越来越小,则称 p 为事件 A 发生的概率,记为: P(A)=p 。在古典概型场合 , 即基本事件发生的概率都一样的场合 :

样本点总数

包含的样本点个数A

n

mAP

样本点总数的有利场合数A

Page 12: Data, Model and Decisions  数据、模型与决策

2. 概率的基本性质

性质 1 1≥P(A)≥0 。

性质 2 P(Ω)=1 。

性质 3 若事件 A 与事件 B 互不相容,即 AB=Ф ,则 P(A B)=∪P(A)+P(B) 。

推论 1 不可能事件的概率为 0 ,即: P(Ф)=0 。

推论 2 P( )=1-P(A), 表示 A 的对立事件,即它们二者必有一事件发生但又不能同时发生。

A A

Page 13: Data, Model and Decisions  数据、模型与决策

3. 事件的独立性

定义 对事件 A 与 B ,若 p(AB)=p(B)p(A) ,则称它们是统计独立的,简称相互独立。

例:已知袋中有 6 只红球 , 4 只白球。从袋中有放回地取两次球 , 每次都取 1 球。设 表示第 i 次取到红球。那么,

因此, ,也就是说, B1,B2 相互独立

。从题目条件看,这一结论是显然的。

iB

1 2

6 3( ) ( )

10 5P B P B 1 2

2 11

36( ) 3100( )3( ) 5

5

P B BP B B

P B

1 2 2 1 1 1 2

3 3( ) ( ) ( ) ( ) ( )

5 5P B B P B B P B P B P B

Page 14: Data, Model and Decisions  数据、模型与决策

Computing Joint Probability

计算联合概率

A 和 B 事件的联合概率为:

例如 . P(Red Card 和 Ace) =

CardsofNumberTotal

Acesd

52

Re226

1

P(A and B) =A 和 B 事件联合出现的结果个数

样本空间的总个数

Page 15: Data, Model and Decisions  数据、模型与决策

Computing Compound Probability

计算混合概率

A 、 B 的混合事件( A or B ):

样本空间总个数出现的事件结果个数出现或或 BA

BAP )(

例如: P(Red Card or Ace)

CardsNumberofTotal

AcesdCardsdAces

52

Re2Re264

13

7

52

28

Page 16: Data, Model and Decisions  数据、模型与决策

Compound Probability Addition Rule

混合概率规则

P(A1 or B1 ) = P(A1) +P(B1) - P(A1 and B1)

对于互斥事件 : P(A or B) = P(A) + P(B)

P(A1 and B1)

P(B2)P(B1)

P(A2 and B2)P(A2 and B1)

事件事件 Total

Total 1

P(A1 and B2) P(A1)A1

A2

B1 B2

P(A2)

Page 17: Data, Model and Decisions  数据、模型与决策

条件概率是指一个事件给定下另一事件发生的可能性 :

给定事件 B 发生,事件 A 发生的概率

P(A B) =

例如: P(Red Card 给定是一张 Ace) =

)(

)(

BP

BandAP

2

1

4

2

Aces

AcesdRe

Computing Conditional Probability

计算条件概率

Page 18: Data, Model and Decisions  数据、模型与决策

Discrete Random Variable

离散随机变量

随机变量 : 是一次试验的结果的数值性描述 离散随机变量 :

指有限个数值或一系列无穷个数值的随机变量

Page 19: Data, Model and Decisions  数据、模型与决策

Discrete Random Variable Example

离散随机变量例

值 概率

0 1/4 = .25

1 2/4 = .50

2 1/4 = .25

事件 : 抛 2 个硬币 . 数是正面的个数

T

T

T T

Page 20: Data, Model and Decisions  数据、模型与决策

Discrete Probability Distribution

离散概率分布

列出所有可能的 [ Xi, f (Xi) ]

Xi = 随机变量的值 ( 结果 )

P(Xi) = 取这个值的概率 相互排斥 ( 没有重叠 ) 穷举性 ( 没有漏下 )

0 f(xi) 1 f(xi) = 1

Page 21: Data, Model and Decisions  数据、模型与决策

Discrete Random Variable Measures

离散随机变量的度量

数学期望( Expected Value ) 或平均值度量随机变量的中心位置 E E ((x x ) = ) = = = xf xf ((x x ))方差( Variance )

随机变量的取值离均值的变异程度Var(Var(x x ) = ) = 22 = = ((xx - - ))22f f ((x x ))

Page 22: Data, Model and Decisions  数据、模型与决策

Important Discrete Probability Distribution

重要的离散概率分布

离散概率分布

Binomial

二项分布Poisson

泊松分布

Page 23: Data, Model and Decisions  数据、模型与决策

贝努里试验

有时我们只对试验中某事件 A 是否出现感兴趣,如果 A 发生,我们称“成功”,否则称“失败”。像这样只有两种结果的试验称为贝努里试验。设 A 出现的概率为 p ,我们独立地重复进行 n 次贝努里试验,称为 n 重贝努里试验 .

Page 24: Data, Model and Decisions  数据、模型与决策

Binomial Probability Distributions

二项分布

二项试验的性质 试验由一个包括 n 次相同的试验的序列组

成 . 每次试验有两个结果 , 成功和失败 . 成功的概率为 p, 每次试验都相同 . 试验都是独立的 .

Page 25: Data, Model and Decisions  数据、模型与决策

二项分布函数二项分布函数

其中其中

f f ((x x ) = ) = nn 次试验中成功 次试验中成功 xx 次的概率次的概率

nn = = 试验次数试验次数

pp = = 每次试验中成功的概率每次试验中成功的概率

Binomial Probability Distributions

二项分布

f xn

x n xp px n x( )

!!( )!

( ) ( )

1f xn

x n xp px n x( )

!!( )!

( ) ( )

1

Page 26: Data, Model and Decisions  数据、模型与决策

EXCEL 函数

BINOMDIST(number_s, trials, probability_s, cumulative)

Page 27: Data, Model and Decisions  数据、模型与决策

二项分布示例

Page 28: Data, Model and Decisions  数据、模型与决策

Poisson Distribution

泊松分布

泊松试验的性质: 任意两个相等长度的区间发生一次的概率

相等 . 任意区间发生或不发生与其他区间发生与

否独立 .

Page 29: Data, Model and Decisions  数据、模型与决策

Poisson Probability Distribution Function

泊松概率分布函数

泊松概率分布函数:

其中 f (x ) = 在一个区间发生 x 次的概率

= 在一个区间发生次数的数学期望 e = 2.71828

f xex

x( )

!

f x

ex

x( )

!

Page 30: Data, Model and Decisions  数据、模型与决策

Excel 函数

POISSON (x, mean, cumulative)

Page 31: Data, Model and Decisions  数据、模型与决策

泊松分布 ( = 12)

Page 32: Data, Model and Decisions  数据、模型与决策

The Normal Distribution

正态分布

钟形 对称 均值 , 中位数,众数相等 随机变量无限取值

X

f(X)

Page 33: Data, Model and Decisions  数据、模型与决策

The Mathematical Model

数学模型

f(X) = 随机变量 X 的分布密度函数 = 3.14159; e = 2.71828 = 总体标准方差X = 随机变量取值 (-∞< X < +∞ ) = 总体均值

f(x) =e

-(x- )2

2

2

2

2

Page 34: Data, Model and Decisions  数据、模型与决策

Many Normal Distributions

许多正态分布

变动参数 和 , 我们得到许多不同的正态分布

Page 35: Data, Model and Decisions  数据、模型与决策

The Standardized Normal Distribution

标准正态分布

标准正态分布表 = 0 and = 1

Z = 0.12

Z .00 .01

0.0 .0000.0040 .0080

.0398 .0438

0.2 .0793 .0832 .0871

0.3 .0179 .0217 .0255

.0478.02

0.1 .0478

Probabilities

Page 36: Data, Model and Decisions  数据、模型与决策

Standardizing Example

标准化例

12010

526 ..XZ

Z = 0

Z = 1

.12

正态分布 标准正态分布

X = 5

= 10

6.2

Page 37: Data, Model and Decisions  数据、模型与决策

Example:P(2.9 < X < 7.1) = .1664举例计算 P(2.9 < X < 7.1)

0

= 1

-.21 Z.21

正态分布

.1664

.0832.0832

标准正态分布

5

= 10

2.9 7.1 X

2110

592.

.xz

21

10

517.

.xz

Page 38: Data, Model and Decisions  数据、模型与决策

Finding Z Values for Known Probabilities

已知概率找 Z 值

Z .00 0.2

0.0 .0000 .0040 .0080

0.1 .0398 .0438 .0478

0.2 .0793 .0832 .0871

.1179 .1255

Z = 0

= 1

.31

.1217.01

0.3

标准正态分布表

.1217

Page 39: Data, Model and Decisions  数据、模型与决策

Z = 0

= 1

.31X = 5

= 10

?

正态分布 标准正态分布

.1217 .1217

X 8.1 Z= 5 + (0.31)(10) =

Finding X Values for Known Probabilities

已知概率找 X 值

Page 40: Data, Model and Decisions  数据、模型与决策

EXCEL 的正态分布函数

1 .正态分布函数

2 .绘制正态分布图形

Page 41: Data, Model and Decisions  数据、模型与决策

1 .正态分布函数

( 1 )正态分布函数。

( 2 )标准正态分布函数。

( 3 )正态分布函数的反函数。

( 4 )标准正态分布函数的反函数。NORMDI

ST返回给定平均值和标准偏差的正态分布的

累积函数。NORMDIST(x,mean,standar

d_dev,cumulative)

NORMINV

返回给定平均值和标准偏差的正态分布的累积函数的逆函数。

NORMINV(probability,mean,standard_dev)

NORMSDIST

返回标准正态分布的累积函数,该分布的平均值为 0,标准偏差为 1。 NORMSDIST(z)

NORMSINV

返回标准正态分布累积函数的逆函数。该分布的平均值为 0,标准偏差为 1。 NORMSINV(probability)

Page 42: Data, Model and Decisions  数据、模型与决策

2 .绘制正态分布图形

( 1 )建立正态分布基本数据。

( 2 )绘制正态分布图形。

Page 43: Data, Model and Decisions  数据、模型与决策

“序列”对话框

数据填充编辑 /填充 /序列

Page 44: Data, Model and Decisions  数据、模型与决策

结果显示( 4~117 行隐藏)

Page 45: Data, Model and Decisions  数据、模型与决策

图 4-10 “ 数据系列格式”对话框

Page 46: Data, Model and Decisions  数据、模型与决策

正态分布图绘制结果

返回本节

Page 47: Data, Model and Decisions  数据、模型与决策

Exponential Distributions

指数分布

e = 2.71828

P arrival time < X( ) 1 - e - x

= 到达的均值X = 连续随机变量

f(X)

X

= 0.5

= 2.0

Page 48: Data, Model and Decisions  数据、模型与决策

The Uniform Probability Distribution

均匀分布

随机变量在一个区间内均匀分布,对应的概率与区间的长度成正比例

均匀分别密度函数 f (x) = 1/(b - a) for a < x <

b = 0 elsewhere

数学期望 E(x) = (a + b)/2方差 Var(x) = (b - a)2/12

Page 49: Data, Model and Decisions  数据、模型与决策

概率分布曲线

Page 50: Data, Model and Decisions  数据、模型与决策

The End of Session 9