第二章 测验中的基本统计概念

102
第第第 第第第第第第 第第第 测测测测测测测测测 测测测测测 测测测测 测测测测 测测测测 测测 测测 测测测测

Upload: jadyn

Post on 09-Feb-2016

95 views

Category:

Documents


0 download

DESCRIPTION

第二章 测验中的基本统计概念. 测量水平与数据类型 频数表和图 正态分布 集中量数 差异量数 百分 等级 标准分数. 一、测量水平和数据类型. 称名量表 分类数据. 等级量表 等级数据. 等距量表 等距数据. 等比量表 等比数据. 四 种测量 尺度. 数据 的计量尺度. 分类尺度 ( 概念要点 ). 计量层次最低 对事物进行平行的分类 各类别可以指定数字代码表示 使用时必须符合类别穷尽和互斥的要求 数据表现为“类别” 具有 = 或  的数学特性. 等级尺度 ( 概念要点 ). 对事物分类的同时给出各类别的顺序 比分类尺度 精确 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第二章    测验中的基本统计概念

第二章 测验中的基本统计概念测量水平与数据类型频数表和图正态分布集中量数差异量数百分等级标准分数

Page 2: 第二章    测验中的基本统计概念

一、测量水平和数据类型

Page 3: 第二章    测验中的基本统计概念

四种测量尺度

数据的计量尺度

称名量表分类数据 等级量表等级数据 等距量表等距数据 等比量表等比数据

Page 4: 第二章    测验中的基本统计概念

分类尺度(概念要点 )

1. 计量层次最低2. 对事物进行平行的分类3. 各类别可以指定数字代码表示4. 使用时必须符合类别穷尽和互斥的要求5. 数据表现为“类别”6. 具有 = 或的数学特性

Page 5: 第二章    测验中的基本统计概念

等级尺度(概念要点 )

1. 对事物分类的同时给出各类别的顺序2. 比分类尺度精确3. 未测量出类别之间的准确差值4. 数据表现为“类别”,但有序5. 具有 > 或 < 的数学特性

Page 6: 第二章    测验中的基本统计概念

等距尺度(概念要点 )

对事物的准确测度 比等级尺度精确 数据表现为“数值” 没有绝对零点 具有 + 或 - 的数学特性

Page 7: 第二章    测验中的基本统计概念

等比尺度(概念要点 )

对事物的准确测度 与等距尺度处于同一层次 数据表现为“数值” 有绝对零点 具有 或 的数学特性

Page 8: 第二章    测验中的基本统计概念

四种计量尺度的比较

√等 比√√等 距√√√等 级√√√√分 类等比尺度等距尺度等级尺度称名尺度

Page 9: 第二章    测验中的基本统计概念

数据类型与统计方法 数据类型与统计方法

分类数据 等级数据品质数据 数量数据

等距数据 等比数据

参数方法非参数方法

Page 10: 第二章    测验中的基本统计概念

二、频数表和图

Page 11: 第二章    测验中的基本统计概念

频数分布表的编制(实例) 117 122 124 129 139 107 117

130 122 125 108 131 125 117 122 133 126

122 118 108 110 118 123 126 133 134 127

123 118 112 112 134 127 123 119 113 120

123 127 135 137 114 120 128 124 115 139

128 124 121

【例 2.3 】某大学物 理 系 50 名 新 生入 学 物 理 成 绩 如下。试采用单变量值 对 数 据 进 行 分组。

Page 12: 第二章    测验中的基本统计概念

单变量值分组表(实例)表 2-4 某校物理系 50 名新生入学物理成绩分组表

成绩 频数 成绩 频数 成绩 频数107108110112113114115117118

121211133

119120121122123124125126127

121443223

128129130131133134135137139

211122112

Page 13: 第二章    测验中的基本统计概念

组距分组(要点)1. 将变量值的一个区间作为一组2. 适合于连续变量3. 适合于变量值较多的情况4. 必须遵循“不重不漏”的原则5. 可采用等距分组,也可采用不等距分组

Page 14: 第二章    测验中的基本统计概念

等距分组表(上下组限重叠)表 2-5 某校物理系 50 名新生入学物理成绩分组表

按成绩分组 频数(人) 频率( % )105~110110~115115~120120~125125~130130~135135~140

358

141064

610162820128

合计 50 100

Page 15: 第二章    测验中的基本统计概念

等距分组表(上下组限间断)表 2-6 某校物理系 50 名新生入学物理成绩分组表

按成绩分组 频数(人) 频率( % )105~109110~114115~119120~124125~129130~134135~139

358

141064

610162820128

合计 50 100

Page 16: 第二章    测验中的基本统计概念

等距分组表(使用开口组)表 2-7 某校物理系 50 名新生入学物理成绩分组表

按成绩分组 频数(人) 频率( % )110 以下110~114115~119120~124125~129130~134135 以上

358

141064

610162820128

合计 50 100

Page 17: 第二章    测验中的基本统计概念

分组数据—直方图(直方图的制作)1. 用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布2. 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图 (Histogram)3. 直方图下的总面积等于 1

Page 18: 第二章    测验中的基本统计概念

分组数据—直方图(直方图的绘制)频数

( 人)

15

12

9

6

3

105 110 115 120 125 130 135 140入学物理成绩( 个 )

直方图下的面积之和等于 1

图 2-5 某校物理系新生入学物理成绩的直方图

Page 19: 第二章    测验中的基本统计概念

分组数据—直方图(直方图与条形图的区别)1. 条形图是用条形的长度 ( 横置时 ) 表示各类别频数的多少,其宽度 ( 表示类别 ) 则是固定的2. 直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3. 直方图的各矩形通常是连续排列,条形图则是分开排列

Page 20: 第二章    测验中的基本统计概念

分组数据—折线图(折线图的制作)1. 折线图也称频数多边形图 (Frequency polygon)2. 是在直方图的基础上,把直方图顶部的中点 ( 组中值 ) 用直线连接起来,再把原来的直方图抹掉。3. 折线图的两个终点要与横轴相交,具体的做法是

第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴。 折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的。

Page 21: 第二章    测验中的基本统计概念

未分组数据—茎叶图(茎叶图的制作)1. 用于显示未分组的原始数据的分布2. 由“茎”和“叶”两部分构成,其图形是由数字组成的3. 以该组数据的高位数值作树茎,低位数字作树叶4. 对于 n(20≤n≤300) 个数据,茎叶图最大行数不超过 L = [ 10 × log 10

n ] 5. 茎叶图类似于横置的直方图,但又有区别

直方图可大体上看出一组数据的分布状况,但没有给出具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息

Page 22: 第二章    测验中的基本统计概念

树茎 树叶788

022347778889

0012222333344466777889

0133445799

10

11

12

13

数据个数3

13

24

10茎叶图类似横置的直方图

未分组数据—茎叶图(茎叶图的制作)

图 2-7 某校物理系新生入学物理成绩的茎叶图

Page 23: 第二章    测验中的基本统计概念

未分组数据—茎叶图(扩展的茎叶图)树茎 树叶

10s10.11*11t11f11s11.12*12t12f12s12.13*12t13f13s13.

78 802 2 34 57 7 78 8 8 90 0 12 2 2 2 3 3 3 34 4 4 5 56 6 7 7 78 8 90 13 34 4 579 9

树茎 树叶10*10.11*11.12*12.13*13.

7 8 80 2 2 3 45 7 7 7 8 8 8 90 0 1 2 2 2 2 3 3 3 3 4 4 45 5 6 6 7 7 7 8 8 90 1 3 3 4 4 5 7 9 9

图 2-8 图 2.7 扩展后的茎叶图

Page 24: 第二章    测验中的基本统计概念

未分组数据—箱线图(箱线图的制作)1. 用于显示未分组的原始数据或分组数据的分布2. 箱线图由一组数据的 5 个特征值绘制而成,它由一个箱子和两条线段组成3. 其绘制方法是:

首先找出一组数据的 5 个特征值,即最大值、最小值、中位数 Me 和两个四分位数 ( 下四分位数QL 和上四分位数 QU )

连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接

Page 25: 第二章    测验中的基本统计概念

未分组数据—单批数据箱线图(箱线图的构成)

中位数

4 6 8 10 12

QUQL X最大值X最小值

图 2-9 简单箱线图

Page 26: 第二章    测验中的基本统计概念

未分组数据—单批数据箱线图(实例)最小值

107最大值

139

中位数123

下四分位数117.75

上四分位数128

105 110 115 120 125 130 135 140

图 2-10 50 名新生入学物理成绩的箱线图

Page 27: 第二章    测验中的基本统计概念

分布的形状与箱线图

对称分布

QL 中位数 QU

左偏分布

QL中位数 QU

右偏分布

QL 中位数 QU

图 2-11 不同分布的箱线图

Page 28: 第二章    测验中的基本统计概念

未分组数据—多批数据箱线图(实例)【例 2.4 】 从某校学生中随机抽取 11 人,对 8 门主要课程的考试成绩进行调查,所得结果如表 2-8 。 试 绘 制 各科考试成绩的批 比 较 箱 线图,并分析各科考试成绩的分布特征

表 2-8 11 名学生各科的考试成绩数据课程名称 学生编号

1 2 3 4 5 6 7 8 9 10 11

英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础

7665937468705585

9095818775739178

9751768570926881

7174886984657395

7078669073788470

9363798060878167

8691837776907082

8382928481706972

7875789188669480

8571867468796281

8155787075687177

Page 29: 第二章    测验中的基本统计概念

未分组数据—多批数据箱线图

图 2-12 8门课程考试成绩的箱线图Min-Max25%-75%Median value

45

55

65

75

85

95

105Ó

¢Óï

¾ ¼

ÃÊ

ýѧ

Î÷·½

¾ ¼

ÃÑ

§

ÊÐ

³¡Ó

ªÏúÑ

§

²ÆÎñ

¹ÜÀ

í

»ù´¡

»á¼

ÆÑ

§

ͳ¼Æ

ѧ

¼Æ

Ëã»

úÓ¦Ó

ûù

´¡

Page 30: 第二章    测验中的基本统计概念

图 2-13 11 名学生 8门课程考试成绩的箱线图Min-Max25%-75%Median value

45

55

65

75

85

95

105

学生 1学生 2学生 3学生 4

学生 5学生 6学生 7学生 8

学生 9学生 10学生 11

未分组数据—箱线图

Page 31: 第二章    测验中的基本统计概念

数据类型及图示(小结)数据类型与显示

数值型数据品质数据分组数据总计表

茎叶图条形图圆形图环形图

直方图箱线图

折线图

原始数据 时序数据线图

雷达图

多元数据

Page 32: 第二章    测验中的基本统计概念

三、正态分布

Page 33: 第二章    测验中的基本统计概念

频数分布的类型

对称分布 右偏分布 左偏分布

正 J 型分布 反 J 型分布 U 型分布图 2-17 几种常见的频数分布

Page 34: 第二章    测验中的基本统计概念
Page 35: 第二章    测验中的基本统计概念
Page 36: 第二章    测验中的基本统计概念
Page 37: 第二章    测验中的基本统计概念

四、集中量数

Page 38: 第二章    测验中的基本统计概念

 集中量数 所谓集中量数是以一个数值来描述统计数据,看那一个数值是最具代表性,或数据集中在那个中心位置。 最常见的集中量数主要有三种,即算术平均数

(Mean) 、中位数 (Median) 、和众数(Mode) ,到底用那一个集中量数和数据衡量尺度以及研究的目标有关。

此外,在某些情况下,还会用到一些其他的平均数。

Page 39: 第二章    测验中的基本统计概念

集中量数算术平均数 (mean)中数 (median)众数 (mode)加权平均数( weighted mean)几何平均数 (geometric mean)调和平均数 (harmonic mean)

Page 40: 第二章    测验中的基本统计概念

算术平均数、中数与众数

Page 41: 第二章    测验中的基本统计概念

算术平均数算术平均数常简称为平均数为所有数值总和除以所有数值的个数。

 1. 总体平均数 (μ)

2. 样本平均数 (  ) 

N

iix

1N1

n

iiXX

1n1

X

Page 42: 第二章    测验中的基本统计概念

算术平均数求法:

由原始数据计算 由分组数据计算--组中值法

Page 43: 第二章    测验中的基本统计概念

算术平均数意义:同一指标的多次测量值的平均数是“真值”的渐近、最佳估计值

Page 44: 第二章    测验中的基本统计概念

算术平均数优点:

• 反应灵敏• 便于理解• 计算严密• 较少受抽样变动的影响• ……

Page 45: 第二章    测验中的基本统计概念

算术平均数缺点:

• 易受极端数据的影响• 数据不全时无法计算

Page 46: 第二章    测验中的基本统计概念

算术平均数适用条件:

• 适用于同质数据 ( 例 )• 要求一组数据中每个数据都比较准确、可靠,若数据模糊不清或分组资料存在不确定的组限时,不能计算 ( 例 )• 无极端值出现 ( 例 )• 需要得到一个相对可靠的集中量数或进一步参与其他运算时

Page 47: 第二章    测验中的基本统计概念

中数将数据由小到大(或由大到小)顺序排列后,位于中心的数值称为中数( median ) ,也称中位数, 通常以 Md 表示。

Page 48: 第二章    测验中的基本统计概念

中数求法:

1. 未分组数据:将数据由小到大排序写成x(1), x(2), …, x(n)

为偶数如果

为奇数如果

n

n

Mnn

n

d

)12

()2

(

)2

1(

XX21

X

Page 49: 第二章    测验中的基本统计概念

中数例 3.1 :全班 12 位 学 生 的 体 重 分 别 为

38 、 46 、 43 、 51 、 54 、 50 、 40 、 48、 39 、 42 、 54 、 35千克 , 求 12 位学生的体重的中数。解:将 12 位学生的体重由小到大排序如下:

35 , 38 , 39 , 40 , 42 , 43 , 46 , 48, 50 , 51 , 54 , 54 ,因为 n=12 为偶数,故中位数为排序第六和第七位数值的平均,即 5.44464321

21

)7()6( XXM d

Page 50: 第二章    测验中的基本统计概念

中数求法:

2. 分组数据:

if

FN

LMb

bd

2

式中 Lb 为中数所在组的精确下限, Fb 为中数所在组的下限以下的累积次数, f 为中数所在组的次数, i 为组距, N 为总次数

Page 51: 第二章    测验中的基本统计概念

表 3-1 某校物理系 50 名新生入学物理成绩分组表按成绩分

组频数(人

)频率

( %)

105~109110~114115~119120~124125~129130~134135~139

358

141064

610162820128

合计 50 100

【例 3.2 】某大学物理系 50名新生入学物理成绩如下。求其中数。解: N= 50

7.122514

16255.1192

if

FN

LMb

bd

514

168535.119

252

ifFL

N

b

b

Page 52: 第二章    测验中的基本统计概念

中数特点:

• 计算简单,容易理解• 不受极端值的影响• 受抽样影响较大• 不能作进一步的代数运算

Page 53: 第二章    测验中的基本统计概念

中数适用条件:

• 当一组数据中有极端值出现时

Page 54: 第二章    测验中的基本统计概念

中数例 3.3 :某广告公司共有成员 5 人,他们的月工资如下:经理(老板) 5000元;策划

1800 元,美工: 1500 元;电脑技工:1400元,司机 1000元,求月工资的算术平均数和中数。

解: M= 2140  Md=1500哪一个数值更有代表性?

Page 55: 第二章    测验中的基本统计概念

中数适用条件:

• 当一组数据中有极端值出现时• 当一组数据两端有个别数据模糊不清或分组资料存在不确定的组限时

Page 56: 第二章    测验中的基本统计概念

中数表 2-2 某校物理系 50 名新生入学物理成绩分组表

按成绩分组 频数(人) 频率( % )110 以下110~114115~119120~124125~129130~134135 以上

358

141064

610162820128

合计 50 100

Page 57: 第二章    测验中的基本统计概念

中数适用条件:

• 当一组数据中有极端值出现时• 当一组数据中有极端值出现时当一组数据两端有个别数据模糊不清或分组资料存在不确定的组限时• 需要快速估计一组数据的代表值时

Page 58: 第二章    测验中的基本统计概念

众数1. 指数据中出现次数最多的数 (mode) ,通常以 Mo 表示。 2. 当数据或名称各只出现一次时,众数便不存在,但因次数可能相同,故众数可能不唯一。

Page 59: 第二章    测验中的基本统计概念

众数适用条件:

• 适用于分类数据• 当一组数据中有极端值出现时• 需要快速估计一组数据的代表值时

Page 60: 第二章    测验中的基本统计概念

众数求法:

1. 观察法2. 用公式求解

Page 61: 第二章    测验中的基本统计概念

平均数、中数与众数之间的比较1. 当数据是对称分布时,则平均数、中数及众数三者相等。2. 当数据是数量数据时,则适用平均数或中数。3. 当数据是品质数据时,则众数应为最佳选择。4. 就极端值而言,平均数受其影响最为明显,相比之下,中位数与众数则对极端值不敏感。5. 平均数易于作数学运算,但中数与众数则不能进行进一步的数学运算。

Page 62: 第二章    测验中的基本统计概念

平均数、中数与众数之间的关系M , Md 和 Mo 之间存在经验关系:   Mo =3 Md – 2M

Page 63: 第二章    测验中的基本统计概念

用计算机求集中量数

Page 64: 第二章    测验中的基本统计概念

集中量数的计算(实例) 117 122 124 129 139 107 117

130 122 125 108 131 125 117 122 133 126

122 118 108 110 118 123 126 133 134 127

123 118 112 112 134 127 123 119 113 120

123 127 135 137 114 120 128 124 115 139

128 124 121

【 例 3.5 】某大学物理系 50 名 新生入学物理成绩如下。求其算术平均数、中数和众数。

Page 65: 第二章    测验中的基本统计概念

五、差异量数

Page 66: 第二章    测验中的基本统计概念

例 4.1 :两个资料如下:   A : 1 3 5 7 9 11 13   B : 6 6 6 7 8 8 8 两资料均为对称分布,可选用均数描述平均水平,且均为 7 。但资料 A 的数据分布较资料 B 分散, 7对资料 A 的代表性相对较差。

Page 67: 第二章    测验中的基本统计概念

变异程度是指各观察值之间参差不齐的程度,反映资料的离散趋势。 反映平均水平和变异程度的指标结合起来,全面认识事物。表示变异程度常用指标:极差、四分位差、离均差平方和、方差、标准差、变异系数等。

Page 68: 第二章    测验中的基本统计概念

常用的差异量数 全距 (range) 四分位差 (quartile deviation) 平均差 (average deviation) 方差( variance ) 标准差 (standard deviation) 差异系数 (coefficient of variation)

Page 69: 第二章    测验中的基本统计概念

全距全距

  全距( range ):一组数列中最大和最小数值之间的差。R=XH-XL

其中 XH 为最大数值, XL 为最小数值。

Page 70: 第二章    测验中的基本统计概念

全距缺点:不够稳定;不能反映组内其他观察值的变异情况。

上例:   A : 1 3 5 7 9 11 13 R= 12    B : 6 6 6 7 8 8 8 R= 2 如上例资料 B改为: B : 1 6 6 7 8 8 13 R= 12 ,则无法区分它与资料 A 的变异程度谁大。  

Page 71: 第二章    测验中的基本统计概念

百分位数百分位数是量尺上的一个点。第 P 百分位数( P-percentile )就是指在其值为 P 的数据以下,包括分布中全部数据的 P% 。

if

FNP

LPb

bp

100

 式中 Lb 为 Pp 所在组的精确下限, Fb 为 Pp 所在组的下限以下的累积次数, f 为 Pp 所在组的次数, i为组距, N 为总次数。

Page 72: 第二章    测验中的基本统计概念

百分位差为避免极端数据的影响,去除分布两端各 10% 的数据,考虑中间 80% 的数据的分布范围,即 P10 与 P90 之间的距离,称为为百分位差。

Page 73: 第二章    测验中的基本统计概念

四分位差四 分 位 差 ( quartile   deviation) 是指在一个次数分布中,中间 50% 的次数的全距的一半。

22257513 PPQQ

Q

  式中 Q 为四分位差, Q1 = P25 称为第一四分 位 数 , Q3 = P75 称 为 第三四 分 位 数 。(中数 Md = P50 为第二四分位数)

Page 74: 第二章    测验中的基本统计概念

离均差离均差( deviate ) : 各个数据与平均数之差,称为各个数据的离均差。

XXx ii 由于一组数据的离均差有正有负,离均差之和肯定为 0 。为此,考虑其平方和能否用于描述数据的变异情况。

Page 75: 第二章    测验中的基本统计概念

A资料: 1 3 5 7 9 11 13 ( 1- 7 ) 2+( 3- 7 ) 2+……+( 13-7 ) 2= 112

B资料: 1 6 6 7 8 8 13 ( 1- 7 ) 2+( 6- 7 ) 2+……+( 13-7 ) 2= 72 把资料 B 作如下修改:

B : 1 6……6 7 8……8 13 (共 40 个 6 和40 个 8 ) 计算离均差平方和得:( 1- 7 ) 2+……+( 13- 7 ) 2= 152 离均差平方和不能消除观察值个数对指标的影响。   

Page 76: 第二章    测验中的基本统计概念

消除观察值个数对该指标影响的一个简单办法是用离均差平方和除以观察值的个数 N : A资料: 1 3 5 7 9 11 13 [ ( 1- 7 ) 2+ ( 3- 7 ) 2+……+( 13-

7 ) 2 ] ÷ 7 = 16 B资料: 1 6 6 7 8 8 13 [ ( 1- 7 ) 2+( 6- 7 ) 2+……+( 13-

7 ) 2 ] ÷ 7 = 10.3 修改后的资料 B : B : 1 6……6 7 8……8 13 (共 40 个 6 和

40 个 8 ) [ ( 1- 7 ) 2+……+( 13- 7 ) 2 ] ÷ 8 3 =

1.8    

Page 77: 第二章    测验中的基本统计概念

方差方差( variance ) : 各数据与平均数差数的平方和的平均值称为方差,也称为变异数。   

)()( 2

2 未分组数据NXX

S

)()( 2

2 分组数据N

XXfS c

Page 78: 第二章    测验中的基本统计概念

方差优点:

可以反映每个观察值对变异程度的影响; 考虑了观察值个数对指标的影响; 具有可加性。不足:单位是原观察值单位的平方。   

Page 79: 第二章    测验中的基本统计概念

标准差标准差( standard deviation ) : 即方差的算术平方根。   

)()( 2

未分组数据NXX

S

)()( 2

分组数据N

XXfS c

Page 80: 第二章    测验中的基本统计概念

标准差优点:

可以反映每个观察值对变异程度的影响; 考虑了观察值个数对指标的影响; 单位与观察值相同。标准差适用于对称分布的资料,通常与平均数结合使用。    

Page 81: 第二章    测验中的基本统计概念

标准差性质:

每一个观察值都加上相同的常数 C 后,标准差不变。 每一个观察值都乘上相同的非零常数 C 后,标准差变为原来的 C倍。

   

Page 82: 第二章    测验中的基本统计概念

切比雪夫定理任何分布落在均值周围 k倍标准差内的比例至少是 1- 1/k2 ( k> 1 )。如:

取 k=2 ,即在左右各 2倍标准差范围内至少包含有 75% 的数据。 取 k=3 ,即在左右各 2倍标准差范围内至少包含有 88.9% 的数据。注意,切比雪夫定理是对所有分布的保守估计。如果是正态分布,数据将以更大的比例分布在紧靠均值的两侧,其左右两个和三个标准差范围包含比例分别为

95.45% 和 99.7% 。   

Page 83: 第二章    测验中的基本统计概念

异常值的取舍三个标准差的法则:在正态分布中,如果数据较多,可将落在均值正负三个标准差之外的数据作为异常值舍弃。

Page 84: 第二章    测验中的基本统计概念

差异系数同一特质使用同一种测量工具得到的不同样本之间的离散度的比较可以通过直接比较标准差实现。不同特质样本之间的离散度比较可以通过比较差异系数( coefficient of variation, CV )来实现,差异系数大的则离散程度大。差异系数的公式为:

其中: S 为样本标准差, 为样本平均数。%100

XSCV

X

Page 85: 第二章    测验中的基本统计概念

 观察某地 100 名 8岁男孩: 身高均值= 123.4cm ,标准差=4.79cm; 体重均值= 23.46kg , 标准差=2.68kg 。 试比较两组资料的变异程度。 %89.3%100

XSCV身高:

%42.11%100 XSCV体重:

 体重变异较大。   

Page 86: 第二章    测验中的基本统计概念

差异系数的应用在资料是对称分布的情况下:

1. 比较不同性质的两组数据的差异程度。2. 比较均值差异很大的两组数据的差异程度。

Page 87: 第二章    测验中的基本统计概念

六、百分等级

Page 88: 第二章    测验中的基本统计概念

百分等级数据在次数分布中所处的地位,可用百分等级来表示。百分等级( percentile   rank )也称百分位,用记号 PR 表示。百分等级反映的是某个观测分数以下数据个数占总个数的比例的百分数,在 0~ 100 之间取值。

Page 89: 第二章    测验中的基本统计概念

百分等级的计算——未分组数据 第一步:把观测数据从大到小依次排列。 第二步:按不同的数据逐个地统计次数(不必分组归类),并把它们列表记录。 第三步:从低端开始向高端方向,计算各个观测点数据以下的累积次数(不包括本得分点的次数)。 第四步:计算各观测点数据的“以下累积相对次数” , 即比例数。计算方法是把以下累积次数除以数据总个数 N 。 第五步:确定各观测点数据的百分等级 PR 的计算方法,即把各数据的“以下累积相对次数”乘上 100即得之。

Page 90: 第二章    测验中的基本统计概念

百分等级的计算——未分组数据对于未分组数据,也可以用公式求得百分等级:

NRPR

50100100

 式中 R 为数据从高到低的排列的名次, N 为总次数。

Page 91: 第二章    测验中的基本统计概念

百分等级的计算——分组数据对于分组数据,可由前面的百分位数 Pp 的计算公式变形得到百分等级的计算公式:

iLXf

FN

P

if

FNP

LP

bbR

bR

bp

)(100

100

 式中 Lb 为 Pp 所在组的精确下限, Fb 为 Pp 所在组的下限以下的累积次数, f 为 Pp 所在组的次数, i为组距, N 为总次数。

Page 92: 第二章    测验中的基本统计概念

百分等级在教育测量中的应用对学生进行相对评价建立百分等级常模

Page 93: 第二章    测验中的基本统计概念

 七、标准分数 Z 分数 T 分数

Page 94: 第二章    测验中的基本统计概念

Z 分数标准分数( standard score )又称为 Z分数,是以标准差为单位表示一个数在团体中所处位置的相对位置量数。计算公式为:

  Z 分数表示其原分数在该组数据分布中,以平均数为中心时的相对位置。SXXZ

Page 95: 第二章    测验中的基本统计概念

Z 分数的性质和特点一组数据中所有由原分数转换得出的 Z 分数的和为零,平均数也为零。一组数据中 Z 分数的标准差为 1 。Z 分数是等单位的数据,所以具有可比性和可加性。原始分数转换为 Z 分数是线性变换,因此不会改变原始分数的分布形状,也不会改变原来的分数的位置次序。如果原始分数分布是正态的, Z 分数的范围大致为– 3~3 。

Page 96: 第二章    测验中的基本统计概念

Z 分数的应用 可用于比较分属性质不同的观测值在各自数据分布中的相对位置高低。当已知各不同质的观测值的次数分布为正态分布时,可用 Z 分数求不同观测值的总和或均值,以表示在团体中的相对位置。

Page 97: 第二章    测验中的基本统计概念

表:利用 Z 分数求总和

甲 乙 平均数 标准差 甲 乙语文 85 89 70 10政治 70 62 65 5外语 68 72 69 8数学 53 40 50 6理化 72 87 75 8合计 348 350

原始分数 全体考生 Z分数科目

Page 98: 第二章    测验中的基本统计概念

表:利用 Z 分数求总和

甲 乙 平均数 标准差 甲 乙语文 85 89 70 10 1. 5 1. 9政治 70 62 65 5 1 -0. 6外语 68 72 69 8 -0. 125 0. 375数学 53 40 50 6 0. 5 -1. 67理化 72 87 75 8 -0. 375 1. 5合计 348 350 2. 5 1. 505

原始分数 全体考生 Z分数科目

Page 99: 第二章    测验中的基本统计概念

标准分数的形式由于 Z 分数的数字不大且有正、负和 0 值,还带有多位小数,与人们的习惯不符,故在实际应用中常通过一些变换,使之便于理解。一般的变换公式是:  Z' = αZ + β

Page 100: 第二章    测验中的基本统计概念

TOFEL 分数取 α = 70 , β= 500 ,得      T= 70Z + 500 (若- 3≤Z ≤ 3 ,则 290≤Z ≤ 710 ) 

Page 101: 第二章    测验中的基本统计概念

CEEB 分数美国大学入学考试委员会使用的标准分数叫CEEB 分数,我国一些省份的高考也使用这种分数。取 α = 100 , β= 500 ,得      C= 100Z + 500 (- 4≤Z ≤ 4 , 100≤ C≤ 900 ) 

Page 102: 第二章    测验中的基本统计概念

离差智商韦克斯勒成人智力量表使用离差智商表示个人在团体中的相对智力:      IQ= 15Z + 100 一般认为, IQ> 130 为超常智力, IQ<70 为低常智力。