第二章 描述性统计分析过程
DESCRIPTION
第二章 描述性统计分析过程. 所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所代表的总体的特征。描述性统计分析的项目很多,常用的如平均数、标准差、中位数、频数分布、正态或偏态程度等等。这些分析是复杂统计分析的基础。. 平均数、标准误. 中位数、众数、全距. 标准差、方差. 四分位、十分位、百分位数. 频数分布、峰度、偏度. 标准分数及其线性转换. 探索分析. 交叉列联表分析. 1. 平均数、标准误. 返回本章首页. 中位数、众数、全距. 返回本章首页. 标准差、方差. - PowerPoint PPT PresentationTRANSCRIPT
所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所代表的总体的特征。描述性统计分析的项目很多,常用的如平均数、标准差、中位数、频数分布、正态或偏态程度等等。这些分析是复杂统计分析的基础。
所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所代表的总体的特征。描述性统计分析的项目很多,常用的如平均数、标准差、中位数、频数分布、正态或偏态程度等等。这些分析是复杂统计分析的基础。
平均数、标准误 中位数、众数、全距
标准差、方差 四分位、十分位、百分位数
频数分布、峰度、偏度 标准分数及其线性转换
探索分析 交叉列联表分析
第二章 描述性统计分析过程
1. 平均数、标准误
返回本章首页
中位数、众数、全距
返回本章首页
标准差、方差
返回本章首页
严格地讲,在方差和标准差的计算中,分母应取 n-1 ,因为数据变异的自由度是 n-1 。但在大样本情况下,使用 n 和 n-1 差别不大。
四分位、十分位、百分位数
返回本章首页
频数分布、峰度、偏度
频数 ( Frequency) 就是一个变量的各个观测值出现的次数。比如某班语文考试的成绩,可以统计出各分数值的人数。
频数 ( Frequency) 就是一个变量的各个观测值出现的次数。比如某班语文考试的成绩,可以统计出各分数值的人数。
峰度( Kurtosis) : 是描述某变量所有取值的分布形态陡缓程度的统计量,而峰度对陡缓程度的度量是与正态分布进行比较的结果。如果峰度等于 0 ,其数据分布的陡缓程度与正态分布相同 ;峰度大于 0 ,其数据分布比正态分布更陡峭;峰度小于 0 ,其数据分布比正态分布更平坦。
峰度( Kurtosis) : 是描述某变量所有取值的分布形态陡缓程度的统计量,而峰度对陡缓程度的度量是与正态分布进行比较的结果。如果峰度等于 0 ,其数据分布的陡缓程度与正态分布相同 ;峰度大于 0 ,其数据分布比正态分布更陡峭;峰度小于 0 ,其数据分布比正态分布更平坦。
返回本章首页实例演示实例演示
偏度( Skewness ) 是描述数据分布对称性的统计量 ,而且也是与正态分布的对称性相比较而得到的。如果分布的偏度等于 0 ,则其数据分布的对称性与正态分布相同 ;如果偏度大于 0 ,则其分布为正偏或右偏,即在峰的右边有大的偏差值,
使右边出现一个拖得较远的尾巴;如果偏度小于 0 ,则为负偏或左偏,即在峰的左边有大的偏差值,使左边出现一个拖得较远的尾巴。
偏度( Skewness ) 是描述数据分布对称性的统计量 ,而且也是与正态分布的对称性相比较而得到的。如果分布的偏度等于 0 ,则其数据分布的对称性与正态分布相同 ;如果偏度大于 0 ,则其分布为正偏或右偏,即在峰的右边有大的偏差值,
使右边出现一个拖得较远的尾巴;如果偏度小于 0 ,则为负偏或左偏,即在峰的左边有大的偏差值,使左边出现一个拖得较远的尾巴。
返回本章首页实例演示实例演示
标准分数及其线性转换
Z 分数:从平均数为,标准差为的总体中抽取一观测值,该观测值的 Z 分数是其距离总体平均值的标准差数。标准分数反映的是一观测值与其它分数相比的相对位置。比如 Z 分数为 1.5 ,则其比平均数大 1.5 个标准差。在实际应用中 ,为了避免小数的不便,可以对标准分数进行线性转换:
T = 10Z + 50
比如某人在艾森克人格问卷的测量中 ,其精神质得分比同年龄人的平均成绩高 2.0 个标准差,则其换算后的标准分数为 70 分 ;如果另一人的测试分数正好等于平均数,则其标准分数为 50 。
Z 分数:从平均数为,标准差为的总体中抽取一观测值,该观测值的 Z 分数是其距离总体平均值的标准差数。标准分数反映的是一观测值与其它分数相比的相对位置。比如 Z 分数为 1.5 ,则其比平均数大 1.5 个标准差。在实际应用中 ,为了避免小数的不便,可以对标准分数进行线性转换:
T = 10Z + 50
比如某人在艾森克人格问卷的测量中 ,其精神质得分比同年龄人的平均成绩高 2.0 个标准差,则其换算后的标准分数为 70 分 ;如果另一人的测试分数正好等于平均数,则其标准分数为 50 。
返回本章首页
探索分析
探索分析是对一组或多组数据的总体分布特征进行分析,以考察其中有无奇异值、极大或极小值等;考察各组数据或全部数据是不是正态或接近于正态分布;探索多组数据之间的方差是否齐性,以确定是否可以采用某种统计分析技术对数据进行检验等等。我们这里介绍:
1. 用直方图反映数据的分布直观形式;
2. 用箱图 (或叫框图)反映数据的集中趋势和特异值;
3. 用 Levene 检验考察多组间方差是否齐性 ;
4. 用 Q-Q 概率图检验数据是否正态分布。
探索分析是对一组或多组数据的总体分布特征进行分析,以考察其中有无奇异值、极大或极小值等;考察各组数据或全部数据是不是正态或接近于正态分布;探索多组数据之间的方差是否齐性,以确定是否可以采用某种统计分析技术对数据进行检验等等。我们这里介绍:
1. 用直方图反映数据的分布直观形式;
2. 用箱图 (或叫框图)反映数据的集中趋势和特异值;
3. 用 Levene 检验考察多组间方差是否齐性 ;
4. 用 Q-Q 概率图检验数据是否正态分布。
返回本章首页
1. 用直方图直观地反映数据的总体分布
调用数据文件并得到直方图
选择反应时间
600.0
575.0
550.0
525.0
500.0
475.0
450.0
425.0
400.0
375.0
350.0
325.0
300.0
HistogramFre
quency
30
20
10
0
Std. Dev = 48.43
Mean = 435.8
N = 120.00
选择反应时间
600.0
575.0
550.0
525.0
500.0
475.0
450.0
425.0
400.0
375.0
350.0
325.0
300.0
HistogramFre
quency
30
20
10
0
Std. Dev = 48.43
Mean = 435.8
N = 120.00
返回本章首页
直方图 : 是一种频数分布图 ,
它反映处在某一观测值范围内的个案数。图中每个直方条下部的中点坐标是该观测值范围的中点、直方条的宽度代表该观测值范围、直方条的高度代表该观测值范围内的个案数。
直方图 : 是一种频数分布图 ,
它反映处在某一观测值范围内的个案数。图中每个直方条下部的中点坐标是该观测值范围的中点、直方条的宽度代表该观测值范围、直方条的高度代表该观测值范围内的个案数。
2. 用箱图 (或叫框图)反映数据的集中趋势和特异值2. 用箱图 (或叫框图)反映数据的集中趋势和特异值
调用数据文件并得到箱图
30303030N =
不同颜色的灯光刺激
4321
选择
反应
时间
700
600
500
400
300
200
100
73
36
49
5520
27
30303030N =
不同颜色的灯光刺激
4321
选择
反应
时间
700
600
500
400
300
200
100
73
36
49
5520
27
返回本章首页
批注 : 箱图可以直观地反映一组观测值的集中趋势、离散趋势、不正常观测值(奇异值和极值,均可被排除后重新分析)。左图中箱图的高度代表了 25 % 位数到 75 % 位数的距离;箱图中的粗线代表中位数;箱图上下中央的垂直线叫触须线,触须线的上下截止线分别对于观测值的最大值和最小值;用 0 标记的是奇异值 ( 与框边距离超出框高 1.5倍 ) 、用 * 标记的为极大值或极小值 ( 与框边距离超出框高3倍 ) 。
批注 : 箱图可以直观地反映一组观测值的集中趋势、离散趋势、不正常观测值(奇异值和极值,均可被排除后重新分析)。左图中箱图的高度代表了 25 % 位数到 75 % 位数的距离;箱图中的粗线代表中位数;箱图上下中央的垂直线叫触须线,触须线的上下截止线分别对于观测值的最大值和最小值;用 0 标记的是奇异值 ( 与框边距离超出框高 1.5倍 ) 、用 * 标记的为极大值或极小值 ( 与框边距离超出框高3倍 ) 。
3. 用 Levene 检验方差是否齐性3. 用 Levene 检验方差是否齐性
方差齐性检验是统计分析中的一种常见过程,它是从样本方差以至样本各自所代表的总体方差是否相同而判断两个样本同质性( homogeneity) 的方法。简单地说,方差齐性检验就是检验各个方差是否存在显著性差异。一般采用 Levene 方法:先将各组观测值均转换为离差绝对值,然后对各组离差绝对值进行方差分析,如果方差分析的显著性水平大于 0.05 ,则认为方差齐性(即方差具有相同性);方差分析的显著性水平小于 0.05 ,则认为方差不齐性(即方差具有不同质性)。
方差齐性检验是统计分析中的一种常见过程,它是从样本方差以至样本各自所代表的总体方差是否相同而判断两个样本同质性( homogeneity) 的方法。简单地说,方差齐性检验就是检验各个方差是否存在显著性差异。一般采用 Levene 方法:先将各组观测值均转换为离差绝对值,然后对各组离差绝对值进行方差分析,如果方差分析的显著性水平大于 0.05 ,则认为方差齐性(即方差具有相同性);方差分析的显著性水平小于 0.05 ,则认为方差不齐性(即方差具有不同质性)。
方差齐性检验举例与 spss 过程演示
返回本章首页
4. 用 Q-Q 概率图检验数据是否正态分布4. 用 Q-Q 概率图检验数据是否正态分布
可以用正态概率 Q-Q 图和离散正态概率 Q-Q 图检验观测值的分布是否是或接近于正态分布。正态概率图是由观测值与按正态分布的预期值作出来的散点图 ,如果实际值为正态分布 ,则其与预期值具有线性对应关系,散点图回归一条斜线,该斜线是正态分布的标准线,散点图组成的回归线越接近于标准线,表示实际观测数据越接近正态分布;如果以观测值、其与正态分布期望值的离差值做散点图,则当散点近似随机地落在过原点的中间横线周围时,数据分布接近于正态分布。
可以用正态概率 Q-Q 图和离散正态概率 Q-Q 图检验观测值的分布是否是或接近于正态分布。正态概率图是由观测值与按正态分布的预期值作出来的散点图 ,如果实际值为正态分布 ,则其与预期值具有线性对应关系,散点图回归一条斜线,该斜线是正态分布的标准线,散点图组成的回归线越接近于标准线,表示实际观测数据越接近正态分布;如果以观测值、其与正态分布期望值的离差值做散点图,则当散点近似随机地落在过原点的中间横线周围时,数据分布接近于正态分布。
正态概率图( Normal Q-Q Plot) 的 SPSS 过程离散正态概率图( Detrended Normal Q-Q Plot) 的 SPSS 过程
返回本章首页
Normal Q-Q Plot of 选择反应时间
Observed Value
700600500400300200100
Expe
cted
Nor
mal
3
2
1
0
-1
-2
-3
Normal Q-Q Plot of 选择反应时间
Observed Value
700600500400300200100
Expe
cted
Nor
mal
3
2
1
0
-1
-2
-3
Detrended Normal Q-Q Plot of 选择反应时间
Observed Value
700600500400300200100
Dev
fro
m N
orm
al
1.5
1.0
.5
0.0
-.5
-1.0
-1.5
-2.0
Detrended Normal Q-Q Plot of 选择反应时间
Observed Value
700600500400300200100
Dev
fro
m N
orm
al
1.5
1.0
.5
0.0
-.5
-1.0
-1.5
-2.0
返回本章首页
描述性统计分析,是心理学研究、教育研究中资料分析的基本内容和进一步分析的基础。常用的除上述介绍之外,还包括交叉列联表分析,我们将交叉列联表的分析转入非参数检验部分讨论。 本章要熟练掌握:平均数(Mean )、标准差( Std. deviation )、标准误 (S.E.mean)、中位数(Median )、众数(Mode)、频数分布( Frequency)、标准分数 (Z)及其线性转换、峰度 (Kurtosis)计算、偏度 (Skewness)计算、奇异值 (Unusual values)和极值 (Extreme values)检测、方差齐性检验 (Levene tests)、正态分布检验 (Normal Q-Q Plot)等方面的 SPSS过程;准确理解直方图和箱图的各种特征及其所代表的含义。
描述性统计分析,是心理学研究、教育研究中资料分析的基本内容和进一步分析的基础。常用的除上述介绍之外,还包括交叉列联表分析,我们将交叉列联表的分析转入非参数检验部分讨论。 本章要熟练掌握:平均数(Mean )、标准差( Std. deviation )、标准误 (S.E.mean)、中位数(Median )、众数(Mode)、频数分布( Frequency)、标准分数 (Z)及其线性转换、峰度 (Kurtosis)计算、偏度 (Skewness)计算、奇异值 (Unusual values)和极值 (Extreme values)检测、方差齐性检验 (Levene tests)、正态分布检验 (Normal Q-Q Plot)等方面的 SPSS过程;准确理解直方图和箱图的各种特征及其所代表的含义。
返回本章首页本章练习题及数据表