data, model and decisions 数据、模型与决策

Post on 04-Jan-2016

163 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Data, Model and Decisions 数据、模型与决策. 第3章 随机变量和概率分布. Session Topics. Basic Probability Concepts 基本概率概念 Discrete Random Variable 离散随机变量 Continuous Random Variable 连续随机变量. Sample Spaces 样本空间. 收集所有可能出现的结果 : 例如 6 个摔子都出现 1 点 今天老师备课笔记丢了. 随机事件. (一)随机试验与事件 - PowerPoint PPT Presentation

TRANSCRIPT

Data, Model and Decisions 数据、模型与决策

第3章 随机变量和概率分布

Session Topics

Basic Probability Concepts 基本概率概念 Discrete Random Variable

离散随机变量 Continuous Random Variable

连续随机变量

Sample Spaces

样本空间

收集所有可能出现的结果 :

例如 6 个摔子都出现 1 点

今天老师备课笔记丢了

随机事件

(一)随机试验与事件

随机现象的特点是:在条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。对随机现象的试验或观测称为随机试验,它必须满足以下的性质:

( 1 )每次试验的可能结果不是唯一的;

( 2 )每次试验之前不能确定何种结果会出现;

( 3 )试验可在相同条件下重复进行。

随机事件

在随机试验中,可能出现也可能不出现的结果,称之为随机事件,简称事件。试验的结果可能是一个简单事件,也可能是一个复杂事件。简单事件就是不可以再分解的事件,又称为基本事件。复杂事件是由简单事件组合而成的事件。基本事件还可称为样本点,设试验有 n 个基本事件,分别记为 (i=1,2,… , n) 。集合 Ω={ω1 ,ω2 , … ,

ωn} 称为样本空间, Ω 中的元素就是样本点。i

Events

事件

简单事件( Simple event ) :

从样本空间出现的结果只有一个特征例如:从一副牌中抽出的是一张红桃

联合或混合事件( Joint/Compound event ):涉及同时出现两个或以上特征例如:从一副牌中抽出的是一张红桃

这是一张红桃 Ace

Visualizing Events

事件形象化

关联表

树图

Ace Not Ace Total

Red 2 24 26

Black 2 24 26

Total 4 48 52

Special Events

特殊事件

空事件( Null Event )

非事件、补事件( Complement of Event )

独立与非独立事件 ( Dependent or Independent Events )

Contingency Table

关联表

一副 52 张的牌

Ace Not anAce

Total

Red

Black

Total

2 24

2 24

26

26

4 48 52样本空间

Red Ace

Tree Diagram

树形图

事件可能性Red Cards

Black Cards

Ace

Not an Ace

Ace

Not an Ace

所有牌

(二)概率

1. 概率的定义 概率就是指随机事件发生的可能性,或称为机率,是对随机事件发

生可能性的度量。 进行 n 次重复试验,随机事件 A 发生的次数是 m

次,发生的频率是 m/n ,当试验的次数 n 很大时,如果频率在某一数值 p 附近摆动,而且随着试验次数 n 的不断增加,频率的摆动幅度越来越小,则称 p 为事件 A 发生的概率,记为: P(A)=p 。在古典概型场合 , 即基本事件发生的概率都一样的场合 :

样本点总数

包含的样本点个数A

n

mAP

样本点总数的有利场合数A

2. 概率的基本性质

性质 1 1≥P(A)≥0 。

性质 2 P(Ω)=1 。

性质 3 若事件 A 与事件 B 互不相容,即 AB=Ф ,则 P(A B)=∪P(A)+P(B) 。

推论 1 不可能事件的概率为 0 ,即: P(Ф)=0 。

推论 2 P( )=1-P(A), 表示 A 的对立事件,即它们二者必有一事件发生但又不能同时发生。

A A

3. 事件的独立性

定义 对事件 A 与 B ,若 p(AB)=p(B)p(A) ,则称它们是统计独立的,简称相互独立。

例:已知袋中有 6 只红球 , 4 只白球。从袋中有放回地取两次球 , 每次都取 1 球。设 表示第 i 次取到红球。那么,

因此, ,也就是说, B1,B2 相互独立

。从题目条件看,这一结论是显然的。

iB

1 2

6 3( ) ( )

10 5P B P B 1 2

2 11

36( ) 3100( )3( ) 5

5

P B BP B B

P B

1 2 2 1 1 1 2

3 3( ) ( ) ( ) ( ) ( )

5 5P B B P B B P B P B P B

Computing Joint Probability

计算联合概率

A 和 B 事件的联合概率为:

例如 . P(Red Card 和 Ace) =

CardsofNumberTotal

Acesd

52

Re226

1

P(A and B) =A 和 B 事件联合出现的结果个数

样本空间的总个数

Computing Compound Probability

计算混合概率

A 、 B 的混合事件( A or B ):

样本空间总个数出现的事件结果个数出现或或 BA

BAP )(

例如: P(Red Card or Ace)

CardsNumberofTotal

AcesdCardsdAces

52

Re2Re264

13

7

52

28

Compound Probability Addition Rule

混合概率规则

P(A1 or B1 ) = P(A1) +P(B1) - P(A1 and B1)

对于互斥事件 : P(A or B) = P(A) + P(B)

P(A1 and B1)

P(B2)P(B1)

P(A2 and B2)P(A2 and B1)

事件事件 Total

Total 1

P(A1 and B2) P(A1)A1

A2

B1 B2

P(A2)

条件概率是指一个事件给定下另一事件发生的可能性 :

给定事件 B 发生,事件 A 发生的概率

P(A B) =

例如: P(Red Card 给定是一张 Ace) =

)(

)(

BP

BandAP

2

1

4

2

Aces

AcesdRe

Computing Conditional Probability

计算条件概率

Discrete Random Variable

离散随机变量

随机变量 : 是一次试验的结果的数值性描述 离散随机变量 :

指有限个数值或一系列无穷个数值的随机变量

Discrete Random Variable Example

离散随机变量例

值 概率

0 1/4 = .25

1 2/4 = .50

2 1/4 = .25

事件 : 抛 2 个硬币 . 数是正面的个数

T

T

T T

Discrete Probability Distribution

离散概率分布

列出所有可能的 [ Xi, f (Xi) ]

Xi = 随机变量的值 ( 结果 )

P(Xi) = 取这个值的概率 相互排斥 ( 没有重叠 ) 穷举性 ( 没有漏下 )

0 f(xi) 1 f(xi) = 1

Discrete Random Variable Measures

离散随机变量的度量

数学期望( Expected Value ) 或平均值度量随机变量的中心位置 E E ((x x ) = ) = = = xf xf ((x x ))方差( Variance )

随机变量的取值离均值的变异程度Var(Var(x x ) = ) = 22 = = ((xx - - ))22f f ((x x ))

Important Discrete Probability Distribution

重要的离散概率分布

离散概率分布

Binomial

二项分布Poisson

泊松分布

贝努里试验

有时我们只对试验中某事件 A 是否出现感兴趣,如果 A 发生,我们称“成功”,否则称“失败”。像这样只有两种结果的试验称为贝努里试验。设 A 出现的概率为 p ,我们独立地重复进行 n 次贝努里试验,称为 n 重贝努里试验 .

Binomial Probability Distributions

二项分布

二项试验的性质 试验由一个包括 n 次相同的试验的序列组

成 . 每次试验有两个结果 , 成功和失败 . 成功的概率为 p, 每次试验都相同 . 试验都是独立的 .

二项分布函数二项分布函数

其中其中

f f ((x x ) = ) = nn 次试验中成功 次试验中成功 xx 次的概率次的概率

nn = = 试验次数试验次数

pp = = 每次试验中成功的概率每次试验中成功的概率

Binomial Probability Distributions

二项分布

f xn

x n xp px n x( )

!!( )!

( ) ( )

1f xn

x n xp px n x( )

!!( )!

( ) ( )

1

EXCEL 函数

BINOMDIST(number_s, trials, probability_s, cumulative)

二项分布示例

Poisson Distribution

泊松分布

泊松试验的性质: 任意两个相等长度的区间发生一次的概率

相等 . 任意区间发生或不发生与其他区间发生与

否独立 .

Poisson Probability Distribution Function

泊松概率分布函数

泊松概率分布函数:

其中 f (x ) = 在一个区间发生 x 次的概率

= 在一个区间发生次数的数学期望 e = 2.71828

f xex

x( )

!

f x

ex

x( )

!

Excel 函数

POISSON (x, mean, cumulative)

泊松分布 ( = 12)

The Normal Distribution

正态分布

钟形 对称 均值 , 中位数,众数相等 随机变量无限取值

X

f(X)

The Mathematical Model

数学模型

f(X) = 随机变量 X 的分布密度函数 = 3.14159; e = 2.71828 = 总体标准方差X = 随机变量取值 (-∞< X < +∞ ) = 总体均值

f(x) =e

-(x- )2

2

2

2

2

Many Normal Distributions

许多正态分布

变动参数 和 , 我们得到许多不同的正态分布

The Standardized Normal Distribution

标准正态分布

标准正态分布表 = 0 and = 1

Z = 0.12

Z .00 .01

0.0 .0000.0040 .0080

.0398 .0438

0.2 .0793 .0832 .0871

0.3 .0179 .0217 .0255

.0478.02

0.1 .0478

Probabilities

Standardizing Example

标准化例

12010

526 ..XZ

Z = 0

Z = 1

.12

正态分布 标准正态分布

X = 5

= 10

6.2

Example:P(2.9 < X < 7.1) = .1664举例计算 P(2.9 < X < 7.1)

0

= 1

-.21 Z.21

正态分布

.1664

.0832.0832

标准正态分布

5

= 10

2.9 7.1 X

2110

592.

.xz

21

10

517.

.xz

Finding Z Values for Known Probabilities

已知概率找 Z 值

Z .00 0.2

0.0 .0000 .0040 .0080

0.1 .0398 .0438 .0478

0.2 .0793 .0832 .0871

.1179 .1255

Z = 0

= 1

.31

.1217.01

0.3

标准正态分布表

.1217

Z = 0

= 1

.31X = 5

= 10

?

正态分布 标准正态分布

.1217 .1217

X 8.1 Z= 5 + (0.31)(10) =

Finding X Values for Known Probabilities

已知概率找 X 值

EXCEL 的正态分布函数

1 .正态分布函数

2 .绘制正态分布图形

1 .正态分布函数

( 1 )正态分布函数。

( 2 )标准正态分布函数。

( 3 )正态分布函数的反函数。

( 4 )标准正态分布函数的反函数。NORMDI

ST返回给定平均值和标准偏差的正态分布的

累积函数。NORMDIST(x,mean,standar

d_dev,cumulative)

NORMINV

返回给定平均值和标准偏差的正态分布的累积函数的逆函数。

NORMINV(probability,mean,standard_dev)

NORMSDIST

返回标准正态分布的累积函数,该分布的平均值为 0,标准偏差为 1。 NORMSDIST(z)

NORMSINV

返回标准正态分布累积函数的逆函数。该分布的平均值为 0,标准偏差为 1。 NORMSINV(probability)

2 .绘制正态分布图形

( 1 )建立正态分布基本数据。

( 2 )绘制正态分布图形。

“序列”对话框

数据填充编辑 /填充 /序列

结果显示( 4~117 行隐藏)

图 4-10 “ 数据系列格式”对话框

正态分布图绘制结果

返回本节

Exponential Distributions

指数分布

e = 2.71828

P arrival time < X( ) 1 - e - x

= 到达的均值X = 连续随机变量

f(X)

X

= 0.5

= 2.0

The Uniform Probability Distribution

均匀分布

随机变量在一个区间内均匀分布,对应的概率与区间的长度成正比例

均匀分别密度函数 f (x) = 1/(b - a) for a < x <

b = 0 elsewhere

数学期望 E(x) = (a + b)/2方差 Var(x) = (b - a)2/12

概率分布曲线

The End of Session 9

top related