matlab 在概率统计中的应用 1 求平均值 一组数据用 x 表示 则 ...

29
1 MATLAB 在在在 在在在在在 1 在在在在 在在在在 x 在在 mean(x) 在在在在在在在在在 sum(x.*p) 在在在在在在在在在在p在 在在在在在在 在在在在在在max, min, median 在在在在 () , sort 在在在在在 () , range 在在在 在 (), sum 在在 x 在在在在在 , cumsum 在在 x 在在在在在在在

Upload: denna

Post on 13-Jan-2016

174 views

Category:

Documents


16 download

DESCRIPTION

MATLAB 在概率统计中的应用 1 求平均值 一组数据用 x 表示 则 mean(x) 为各元素的 算术 平均 而 sum(x.*p) 为该组数据的 加权 平均, p 为对 应数据的权重 其他命令包括: max, min, median (中位数) , sort (递增排序) , range (级差), sum ( 向量 x 的元素总和 ) , cumsum ( 向量 x 的累计元素总和 ). - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

1

MATLAB 在概率统计中的应用1 求平均值

一组数据用 x 表示

则 mean(x) 为各元素的算术平均

而 sum(x.*p) 为该组数据的加权平均, p 为对

应数据的权重 其他命令包括: max, min, median (中位数) , sort (递增排序) , range (级差), sum(向量 x 的元素总和 ) , cumsum (向量 x 的累计元素总和 )

Page 2: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

2

例 测得 8 组数据为(以 mm 计) 74.001 , 74.005 , 74.003 , 74.001 , 74.000 , 73.998 , 74.006, 74.002 。试求样本的均值。 d=[74.001 74.005 74.003 74.001 74.000 73.998 74.006 74.002] mean(d)例 设随机变量 X 的分布律见表 ,求 E ( X )和E ( 3 +5 )的值。 x -2 0 2 Pk 0.4 0.3 0.3 x=[-2 0 2];Pk=[0.4 0.3 0.3] sum(x.*pk)

Page 3: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

3

z=3*y+5

sum(z.*pk)

方差和标准差

方差:D(x)=E{[x-E(x)]2}

标准差:(x)=sqrt(D(X))

命令函数:var(x) %方差 var(x,1) var(x,w)

std(x) %标准差

std(x,1) %计算列标准差

Page 4: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

4

例 对例 1 中的样本值 d ,求其方差值、样本方差值、标准差、样本标准差的值

解:d=[74.0010 74.0050 74.0030 74.0010 74.0000

73.9980 74.0060 74.0020] x1=var(d,1) , x2=var(d), x3=std(d,1) , x4=std(d) x1 = 6.0000e-006 x2 = 6.8571e-006 x3 = 0.0024 x4 = 0.0026

Page 5: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

5

例 有 15 名学生的体重(单位为 kg )为 75.0 , 64.0 , 47.4 , 66.9 , 62.2 , 62.2 , 58.7 , 63.5 , 66.6 , 64 , 57.0 , 61.0 , 56.9 , 50.0 ,72.0 。计算此 15 名学生体重的均值、标准差

解: w=[75.0 , 64.0 , 47.4 , 66.9 , 62.2 , 62.2 ,

58.7 , 63.5 , 66.6 , 64 , 57.0 , 61.0 , 56.9 , 50.0 , 72.0];

mean1=mean(w)

std1=std(w)

Page 6: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

6

9.1.6 协方差和相关系数协方差 cov(x,y)=E{[x-E(x)][y-E(y)]}相关系数 cov(x,y) cov(x,0) cov(x,1) corrcoef(x,y) corrcoef(x)例 协方差矩阵函数和相关系数函数应用示例。 a=[1,2,1,2,2,1] var(a) cov(a) d=rand(2,6) cov1=cov(d) conzhi=cov1(2)

)()(

),cov(),(

yDxD

yxyxcof

Page 7: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

7

9.1.7 协方差矩阵例: c=rand(3,3)

cov(c)

corrcoef(c)

9.2 常用的统计分布量9.2.1 期望和方差例 求参数 0.12 和 0.34 的 分布的期望和方差。解: [m,v]=betastat(0.12,0.34)

例 按规定,某型号的电子元件的使用寿命超过 1500 小时为一级品,已知一样品 20 只,一级品率为 0.2 ,问样品中一级品元件的期望和方差为多少?

Page 8: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

8

[m,v]=binostat(20,.2)

例 求参数为 6 的泊松分布的期望和方差 [m,v]=poisstat(6)

9.2.2 概率密度函数 pdf(name,x,a,b,c)

例 计算正态分布 N(0 , 1) 下的在点 0.7733 的值。 pdf(‘norm’,0.7733,0,1)

normpdf(0.7733,0,1)

例 绘制卡方分布密度函数在 n 分别等于 1 , 5 , 15 的图 .

clf

x=0:0.1:30;

y1=chi2pdf(x,1);

plot(x,y1,’:’)

Page 9: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

9

hold on y2= chi2pdf(x,5); plot(x,y2,’+’) y3= chi2pdf(x,15); plot(x,y3,’o’) axis([0,30,0,0.21])9.2.3 概率值函数(概率累积函数)例 某一公安在长度为 t 的时间间隔内收到的紧急呼救次

数服从参数为 t/2 的泊松分布,而与时间间隔起点无关(时间以小时计)

求 ( 1 )在某一天中午 12 时至下午 3 时没有收到 1 呼救的概率

( 2 )在某一天中午 12 时至下午 5 时至少收到 1 次紧急呼救的概率

Page 10: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

10

解: poisscdf(0,1.5)

poisscdf(0,2.5)

例 设 X~N ( 3 ,) (1) 求 P{2<X<5},P {-4<X<10},P {|X|>2},P {X>3};

(2) 确定 c 使得 P {X>c}= P {X<c}.

P{2<X<5}

a1=normcdf(2,3,2)

a2=normcdf(5,3,2)

p=a2-a1

P {-4<X<10}

p=normcdf(10,3,2)-normcdf(-4,3,2)

22

Page 11: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

11

P {|X|>2}

p=1- normcdf(2,3,2)+ normcdf(-2,3,2)

P {X>3}

p= 1- normcdf(3,3,2)

9.2.4 分值点函数例 求上例的第 (2) 问 解 : 若要 P {X>c}= P {X<c}, 则 P {X>c}= P

{X<c}=0.5,

norminv(0.5,3,2)

例 在假设检验中常用到求分值点的问题 , 如当 时 , 求 Z(0.05/2) 和 T(0.05/2,10)05.0

Page 12: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

12

norminv(0.025,0,1)

tinv(0.025,10)

9.3.1 正态分布参数估计例 假设某种清漆的 9 个样品 , 其干燥时间 ( 以小

时计 ) 分别为 6.0.5.7,5.8,6.5,7.0,6.3,5.6,6.1,5.0.设干燥时间总体服从正态分布。

解 :time=[6..0 5.7 5.8 6.5 7.0 6.3 5.6 6.1 5.0] ;

[MUHAT,SIGMAHAT,MUCI,SIGMACI]=normfit(

time,0.05)

的和求 ),,( 2N

未知)的置信区间(置信度为 95.0

Page 13: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

13

例 分别使用金球和铂球测定引力常数(1) 用金球测定观察值为 :6.683,6.681,6.676,6.678,

6.679,6.672;

(2) 用铂球测定观察值为 :6.661,6.661,6.667,6.667,6.664.

解 :j=[6.683,6.681,6.676,6.678,6.679,6.672];

b=[6.661,6.661,6.667,6.667,6.664];

[MUHAT,SIGMAHAT,MUCI,SIGMACI]=normfit(

j,0.1)

[MUHAT,SIGMAHAT,MUCI,SIGMACI]=normfit(

b,0.1)

Page 14: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

14

9.3.2 指数最大似然参数估计例 已知以下数据为指数分布,求它的置信度为 0.0

5 的参数的估计值和区间估计。数据为 1 , 6 , 7 ,23 , 26 , 21 , 12 , 3 , 1 , 0 。

解: a=[1 , 6 , 7 , 23 , 26 , 21 , 12 , 3 ,1 , 0];

[MUHAT,MUCI]=expfit(a,0.05)

9.4 区间估计9.4.1 Gauss-Newton 法的非线性最小二乘数据拟合 nlinfit

nlinfit(X,Y,’MODEL’,BETA0)

[BETA,R,J]= nlinfit(X,Y,’MODEL’,BETA0)

Page 15: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

15

9.4.2 非线性拟合预测的交互图形工具 nlintool

nlintool (X,Y, MODEL,BETA0,ALPHA)

nlintool (X,Y, MODEL,BETA0,ALPHA,XNAME,

YNAME)

9.4.3 非线性最小二乘预测的置信区间 nlpredci

[YPRED, delta]=mlpredci(MODEL,INPUTS,XF,J)

9.4.4 非线性模型的参数置信区间 nlparci

CI=nlparci(X,F,J)

Page 16: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

16

9.4.5 非负最小二乘 nnls x=nnls(A,b) [x,w]=nnls(A,b)9.5 假设检验9.5.1 单个总体 均值 的检验例 设某车间用一台包装机包装葡萄糖,包得的袋

装糖重量是一个随机变量,它服从正态分布。当机器正常时,其值均为 0.5 公斤,标准差为 0.015 。某日开工后检验包装机是否正常,随机的抽取它所包装的糖 9 袋,称得净重为(公斤) 0.497 , 0.506 , 0.518 , 0.524 , 0.498 , 0.511 ,0.52 , 0.515 , 0.512

),( 2N

Page 17: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

17

x=[0.497 , 0.506 , 0.518 , 0.524 , 0.498 ,0.511 , 0.52 , 0.515 , 0.512]

[H,sig]=ztest(x,0.5,0.015,0.05,0)

2. 未知时的 检验( t 检验法)例 某种电子元件的寿命 X (以小时计)服从正态

分布, 均未知。现测得 16 只元件的寿命如下所示:

159 280 101 212 224 379 179 264

222 362 168 250 149 260 485 170

x=[159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170]

[H,sig]=ttest(x,225,0.05,1)

2,

Page 18: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

18

9.5.2 两个正态总体均值差的检验( t 检验)例 在平炉上进行一项试验以确定改变操作方法的

建议是否会增加钢的得率,试验是在同一只平炉上进行的。每炼一炉钢时除操作方法外,其他条件都尽可能做到相同。先用标准方法炼一炉,然后用建议的新方法炼一炉,以后交替进行,各炼10 炉,其得率分别为:

( 1 )标准方法 78.1 , 72.4 , 76.2 , 74.3 , 77.4 , 78.4 , 76.0 , 75.5 , 76.7 , 77.3

( 2 )新方法 79.1 , 81.0 , 77.3 , 79.1 , 80.0 , 79.1 , 79.1 , 77.3 , 80.2 , 82.1

设这两个样本相互独立,且分别来自正态总体

Page 19: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

19

221

22

21 ,),(),( ,,和NN 均未知。

问建议的操作方法能否提高得率(取 )?解: x=[78.1 , 72.4 , 76.2 , 74.3 , 77.4 , 78.4 ,76.0 , 75.5 , 76.7 , 77.3] y=[79.1 , 81.0 , 77.3 , 79.1 , 80.0 , 79.1 , 79.1 ,77.3 , 80.2 , 82.1][H,sig,ci]=ttest2(x,y,0.05,-1)9.5.3 秩和检验例 某商店为了确定向公司 A 或 B购买某种商品,将 A , B 公司以往的各次进货的次品率进行比较,数据如下,设两样本独立。问两公司的

05.0

Page 20: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

20

商品的质量有无显著差异。设两公司的商品的次品密度最多只差一个平移,取 。

A 7.0 3.5 9.6 8.1 6.2 5.1 9.4 4.0 2.0 10.5B 5.7 3.2 4.2 11.0 9.7 6.9 3.6 4.8 5.6 8.4

10.1 5.5 12.3分别以 记公司 A , B 的商品率总体的均值。

所需检验的假设为

a=[7.0 3.5 9.6 8.1 6.2 5.1 9.4 4.0 2.0 10.5] ; b=[5.7 3.2 4.2 11.0 9.7 6.9 3.6 4.8 5.6 8.4

10.1 5.5 12.3][p,H]=ranksum(a,b,0.05)

05.0

ba 、

ba

ba

H

H

:

:

1

0

Page 21: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

21

9.5.4 中值检验1 signrank 函数 signrank

P= signrank(x,y,ALPHA)

[P,H]= signrank(x,y,ALPHA)

2 signtest 函数 signtest

P= signtest (x,y,ALPHA)

[P,H]= signtest(x,y,ALPHA)

9.6 方差分析和回归诊断9.6.1 方差分析 anoval(x)

Page 22: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

22

例 设有三台机器,用来产生规格相同的铝合金薄板。取样、测量薄板的厚度精确至千分之一厘米。得结果如下:

机器 1 0.236 0.238 0.248 0.245 0.243

机器 2 0.257 0.253 0.255 0.254 0.261

机器 3 0.258 0.264 0.259 0.267 0.262

检验各台机器所产生的薄板的厚度有无显著的差异? x=[0.236 0.238 0.248 0.245 0.243;

0.257 0.253 0.255 0.254 0.261;

0.258 0.264 0.259 0.267 0.262];

anoval(x’)

Page 23: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

23

2 双因素试验的方差分析 anova2(X,REPS)例 一次火箭使用了 4 种燃料, 3 种推进器做射程试

验,每种燃料与每种推进器的组合各发射火箭两次,得到如下结果。

推进器( B ) B1 B2 B3 A1 58.2000 56.2000 65.3000 52.6000 41.2000 60.8000 A2 49.1000 54.1000 51.6000 燃料( A ) 42.8000 50.5000

48.4000 A3 60.1000 70.9000 39.2000 58.3000 73.2000 40.7000 A4 75.8000 58.2000 48.7000 71.5000 51.0000 41.4000

Page 24: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

24

解: a=[58.2000 56.2000 65.3000 52.6000 41.2000 60.8000 49.1000 54.1000 51.6000 42.8000 50.5000 48.4000 60.1000 70.9000 39.2000 58.3000 73.2000 40.7000 75.8000 58.2000 48.7000 71.5000 51.0000 41.4000 ]; anova2(a,2)9.6.2 回归分析例 为了研究某一化学反应过程中,温度 X 对产

品得率 Y 的影响,测得数据如下

Page 25: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

25

温度 x 100 110 120 130 140 150 160 170 180 190 得率 y 45 51 54 61 66 70 74 78 85 89试做 y=a+bx 型的回归。解: x=[100 110 120 130 140 150 160 170 180 190 ] y=[45 51 54 61 66 70 74 78 85 89] [a,b]=polyfit(x,y,1)9.7 统计图9.7.1 直方图 hist9.7.2 角度扇形图 rose9.7.3 正态分布图 h=normplot例: x=normrnd(0,1,100000,1); normplot(x)

Page 26: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

26

9.7.4 参考线 refline(SLOPE,INTERCEPT) refline(SLOPE)H= refline(SLOPE,INTERCEPT)9.7.5 显示数据采样的盒图例: x=normrnd(0,1,10000,1); boxplot(x,1,’+’,1)9.7.6 对离散图形加最小二乘法直线例: a=[0.1,0.3,0.4,0.55,0.7,0.8,0.95]; b=[15,18,19,21,22.6,23.8,26]; plot(a,b,”*”);lsline9.7.7 QQ 图 qqplot(x,y)

Page 27: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

27

例: plot(a,b,’*’)

qqplot(a,b)

Page 28: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

28

9.8 函数的最小值9.8.1 单变量函数的最小值 x=fmin(‘F’,x1,x2)

F 为目标函数, x 为返回的区间 [x1,x2] 内的 函数最小值所对应的自变量坐标。 例: 求函数 (x3+cosx+xlogx)/ex 在 (0,1) 区间的 最小值点。 fmin(‘(x^3+cos(x)+x*log(x))/exp(x)’,0,1)

Page 29: MATLAB 在概率统计中的应用 1 求平均值          一组数据用 x 表示          则  mean(x) 为各元素的 算术 平均

29

9.8.2 多变量函数的最小值 x=fmins(‘F’,x0)

F 为多变量目标函数 x0 为预估最小值对应的坐标 x 为 fmins返回的函数最小值对应的坐标值 F,x0,x 均为矩阵形式例: 求函数 2x1

3+4x1x23-10x1x2+x2

2 的最小值点