第 1 章 数据整理

71
第 1 第 第第第第

Upload: hayes-snow

Post on 03-Jan-2016

64 views

Category:

Documents


6 download

DESCRIPTION

第 1 章 数据整理. 1.1 Excel 中的数据整理工具. 1. 数据排序 Excel 可以根据用户的要求对数据清单的行或列数据进行排序。排序时, Excel 将利用指定的排序顺序重新排列行、列或各单元格,从而使现象的规则性更加简洁地表现出来。. 2. 频数分布函数 频数分布函数是 Excel 的一个工作表函数,是编 制次数分布的主要工具,通过频数分布函数,可以对数据进行分组与归类,从而使数据的分布形态更加清楚地表现出来。 3. 数据透视表 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第 1 章 数据整理

第 1 章 数据整理

Page 2: 第 1 章 数据整理

1.1 Excel 中的数据整理工具 1. 数据排序

Excel 可以根据用户的要求对数据清单的行或列数据进行排序。排序时, Excel 将利用指定的排序顺序重新排列行、列或各单元格,从而使现象的规则性更加简洁地表现出来。

Page 3: 第 1 章 数据整理

2. 频数分布函数频数分布函数是 Excel 的一个工作表函数,是

编制次数分布的主要工具,通过频数分布函数,

可以对数据进行分组与归类,从而使数据的分布形态更加清楚地表现出来。

3. 数据透视表数据透视表是一种交互式工作表,用于对已有

数据清单、表和数据库中的数据进行汇总和分析的一种工具,这可用于单向表,双向表的制作,能够非常容易地展现数据的分布状况。

Page 4: 第 1 章 数据整理

4. 统计图Excel 可以绘制许多图表,其中大部分是统计图,可用于数据的整理与分析,能够直观形象地描述现象的数量规律性。5. 直方图分析工具直方图分析工具是 Excel 分析工具的一种,它在给定工作表中数据单元格区域和接收区间的情况下,计算数据的个别和累积频率,用于统计有限集合中某个数值元素的出现次数。

Page 5: 第 1 章 数据整理

1.2 数据排序与分组

Page 6: 第 1 章 数据整理

1.2.1 利用 Excel 进行数据排序

例 某集团公司欲在某地区投资于医疗卫生事业,为了减少风险,获得利润,该集团企划部门决定先了解一下市场潜力。企划部王经理随机访问了该地区几家医院中就医的 36 名患者,询问其等候看病的时间,根据这些数据,王经理会得到什么信息呢?

Page 7: 第 1 章 数据整理

对数据进行排序

① 打开 “第 1 章 数据整理 .xls” 工作簿,选定“等候时间”工作表。

② 利用鼠标选定单元格 A1:B37 区域。

Page 8: 第 1 章 数据整理

③在菜单中选择“数据”中的“排序”选项,则弹出排序对话框。

Page 9: 第 1 章 数据整理

④ 在排序对话框窗口中,选择“主要关键字”列表 中的“等候时间”作为排序关键字,并选择按“递增” 排序。由于所选取数据中 已经包含标题,所以在 “ 当前数据清单”中选择 “ 有标题行”,然后单击 “ 确定”按钮,即可得到 排序的结果如图所示。

Page 10: 第 1 章 数据整理

• 从数据排序结果可以看出,数据按等候时间从 1 分钟到 55 分钟的递增顺序排列,从而提供了患者等候时间的变动范围。

• “ 排序”功能不能对总体的分布状况进行描述。• 如果想知道每个时间段上有多少个患者等待,可利用

Excel 中的“分类汇总”功能完成这个任务。• 分类汇总不需要建立数学公式,只需在“数据”菜单

中选择“分类汇总”选项, Excel便会自动地创建公式,生成自动分级显示的数据清单。

• 但要注意在分类汇总前需要先对数据进行排序。

Page 11: 第 1 章 数据整理

在数据清单中使用分类汇总的方法如下: 先选择需要分类汇总 的数据区域 A1: B37 , 然后选择“数据”菜单 中的“分类汇总”选项, 则打开“分类汇总”对 话框如图所示。

上一页 下一页 返回本节首页

Page 12: 第 1 章 数据整理

在“分类字段”的下拉式列表中选择要进行分类的列标题, 在“汇总方式”的下拉式列表中选择进行汇总的方式,本例中选择

按 “ 等候时间”进 行分类,选择 按“计数”进行 汇总,单击“确 定”按钮,便得 到分类汇总的 结果如图所示。

上一页 下一页 返回本节首页

Page 13: 第 1 章 数据整理

在对数据进行了分类汇总之后,可以观察到等候时间为 1 分钟的人次为 1 ,等候时间为 3 分钟的人次为 2 等等。

尽管分类汇总可以给出各个数值所出现的次数,但从这些次数中还是无法得出其数据分布的规律性。这是因为没有将数值相近的数据进行合并,因而不能理想地抽象概括现象的数量特征。

上一页 下一页 返回本节首页

Page 14: 第 1 章 数据整理

1.2.2 利用 Excel频数分布函数进行分组

常用函数• 财务函数 • 日期与时间函数• 数学和三角函数 • 统计函数• 查找与引用函数 • 数据库函数• 文本函数 • 逻辑函数• 信息函数 • 工程函数统计函数模块中有 76 个统计函数,这些函数覆盖了统计基本理论与分析方法。频数分布函数是其中的一个。

Page 15: 第 1 章 数据整理

频数分布函数 ( FEQUENCY)

可以对一列垂直数组返回某个区域中数据的频数分布。

频数分布函数 ( FEQUENCY)的语法形式为 :

FREQUENCY(data_array,bins_array)

其中: Data_array 为用来编制频数分布的数据, Bins_a

rray 为频数或次数的接收区间。

Page 16: 第 1 章 数据整理

建立频数分布的步骤如下:• 先对数据进行排序,以了解全部数据的变动范围;• 选择全部数据的分组组数;• 确定分组的组限,• 最后对各组数值所出现的频数进行计数。

Page 17: 第 1 章 数据整理

① 打开“第 1 章 .xls” 工作簿,选择“等候时间”工作表。② 在单元格 C2 中输入“分组”,在单元格 D2 中输入“频数”。③在 C3: C8 区域中依次输入 10 , 20 , 30 , 40 , 50 , 60 ,

作为频数接受区域,它们分别表明 等候 时间在 10 分钟以下 的人数,等候时间在 10

分钟以上, 20 分钟以下 的人数等。④ 选定 D3: D8 区域,在 “插入”菜单中单击“函数” 选项,打开“粘贴函数”对 话框如图所示。

Page 18: 第 1 章 数据整理

⑤在“函数分类”列表中选择“统计”,在“函数名”列表中选择“ FREQUENCY” ,单击“确定”按钮, Excel 弹出“频数分布”对话窗口。

Page 19: 第 1 章 数据整理

⑥在数据区域“ Data_array” 中输入单元格 B2: B37 ,在数据接受区间 Bins_array 中输入单元格 C3: C8 ,在对话窗口中可以看到其相应的频数是 6 , 7 , 9 , 8 , 5 , 1 , 0 。

⑦由于频数分布是数组操作, 所以,此处不能直接单 击“确定”按钮,而应按 Ctrl +Shift 组合键,同时 敲“回车”键,得到频数分 布如图所示。

Page 20: 第 1 章 数据整理

另外,直接利用 Excel 函数公式也可以得到同样结果。用鼠标选定单元格 D3:D6 ,注意不要释放选定区域。在 D3 单元格中输入频数分布函数公式: =FREQUENCY(B2:B37,C3:C8)

在这个公式中,数据区域为 B2:B37 ,接受区间为C3:C8 ,按 Ctrl +Shift 组合键,同时敲“回车”键,得到频数分布与上面相同。从频数分布结果可以看出,大多数据患者的等候时间为 30 分钟,从整体来讲,分布是比较均匀的,即以 30

分钟为中心而对称分布。

Page 21: 第 1 章 数据整理

1.3 利用透视表进行数据整理

利用透视表进行数据整理可分为单变量表格与双变量表格,前者称为单向表,后者称为交叉表。

Page 22: 第 1 章 数据整理

1.3.1 单向表

例 某移动通讯公司要制定新一年的销售计划,需要向市场了解移动用户对数字移动电话类型的需求。

– 经过问卷设计,在该地区抽取了 1000 个样本进行问卷调查,获得关于移动电话用户消费行为的一些数据资料

– 试根据工作表中的数据分析该地区移动电话用户的电话类型偏好。

上一页 下一页 返回本节首页

Page 23: 第 1 章 数据整理

① 打开“第 1 章工作簿,选定“移动电 话调查”工作表

上一页 下一页 返回本节首页

Page 24: 第 1 章 数据整理

② 单击“数据”菜单中的“数据透视表和图表报告”选项, Excel 弹出数据透视表向导对话框如图所示。

上一页 下一页 返回本节首页

Page 25: 第 1 章 数据整理

③根据向导要求,第 1步是指定“数据源类型”和确定所需创建的“报表类型”。选择“数据清单或数据库”作为数据源,选择“数据透视表”作为报表类型。最后单击“下一步”。

上一页 下一页 返回本节首页

Page 26: 第 1 章 数据整理

④ 第 2步是确定数据区域,本例中数据所覆盖区域为 A1:D1001 单元格,单击“下一步”按钮,向导给出第 3步操作对话框窗口如图所示。

⑤第 3步确定数据透视表的位置。选择现有工作表,并利用鼠标将数据透视表的位置确定在 E1 单元格中,如果单击“完成”按钮,可以结束操作。

Page 27: 第 1 章 数据整理

⑥单击“版式”, Excel 弹出如图 对话框窗口,选择

右边的“数字移 动电话类型”字 段,并将它拖 到左边的“行” 区,再选择“数 字移动电话类型” 字段,将其拖放 在“数据”区域中, 显示为“计数项: 数字移动电话类 型”,以便进行数据汇总。

Page 28: 第 1 章 数据整理

⑦双击数据区域中的“计数项:数字移动电话类型”字段,打开“数据透视表字段”对话框,在“汇总方式”

列表中选择“计数”。

上一页 下一页 返回本节首页

Page 29: 第 1 章 数据整理

⑧如果想选择数据显示方式,可单击图右侧的 “选项”按钮,则 EXCEL 弹出“数据显示方式”。

在“数据显示方式”的下拉选

项中确定“占同列数据总和的百分比”选项 , 单击“确

定”按钮,则版式调整完毕。再单击 “确定”按钮,回到数据透视表步骤 3 ,如图所示。

Page 30: 第 1 章 数据整理

⑨单击数据透视表步骤 3 中的“完成”按钮,数字移动电话调查单向表如图所示。

• 单向表描述了各移动电话用户对移动电话类型偏好的分布情况。从图中可以看出“全球通”是该地区的主要消费特征,其次是“长白行”,因而该公司应当注重这两种电话类型的开发与服务。

Page 31: 第 1 章 数据整理

1.3.2 交叉表

交叉表用于表示两个用文字表示的品质变量之间的关系, 用于市场研究,进行市场机会、市场细分分析等。

Page 32: 第 1 章 数据整理

例 该公司市场部经理希望根据上例中的调查结果,确认不同性别的用户,其移动电话类型偏好是否存在着不同。

Page 33: 第 1 章 数据整理

① 打开“第 2 章 数据整理 .xls” 工作簿,选定“移动电话调查”工作表。

② 从“数据”菜单中选择“数据透视表和图表报告”选项,得到“数据透视表对话框”窗口。在第 1步之中选择“数据清单或数据库”与“数据透视表”,单击“下一步”按钮。

③在第 2步中,确定数据区域 A1:D1001 ,单击“下一步”按钮。

Page 34: 第 1 章 数据整理

④ 在第 3步中,确定数据透视表的位置,如图所示, 但将其位置 调整到“ H1” 单元格。然后,单击“版式”按钮,打开“版式”对 话框如图所示。

Page 35: 第 1 章 数据整理

⑤将对话框右边的“数字移动电话类型”字段拖到左边的

“ 行”区作为分组变量,再将右边的“性别” 字段拖到“列”

区,作为交叉分析的变量,最后将右边的“性别” 字段拖放到“数据”区域中,并选择计数项。如果希望结果是以百分比的形式显示,则可双击数据区域中的“计数项,性别”,则会弹出“数据透视表字段”对话框。选择“占同列数据总和的百分比”选项,来表示所出现的频率,最后,单击“确定”按钮,又回到“版式”对话框。

Page 36: 第 1 章 数据整理

⑥单击“确定”按钮,回到第 3步,要注意数据透视表的位 置定在单元格 H1 ,最后,单击“完成”按钮,得到交叉表如图

所示。

Page 37: 第 1 章 数据整理

从上面的交叉表中可以看出,对于移动电话类型来讲,其性别之间并无太大的差异,无论是“长白行”,还是

“全球通”,或是“神州行”,其男女之间的偏好程度都不

是特别大,这说明在移动电话类型的生产与营销过程中可以不考虑性别的差异。当然这只是一种数据整理的结果,要想准确地说明移动电话消费是否存在着性别差异,还需要使用推断统计方法进行假设检验。

Page 38: 第 1 章 数据整理

1.4 统计图

• 1.4.1 绘制统计图的基本步骤 • 1.4.2 条形图与柱形图 • 1.4.3 折线图 • 1.4.4 饼形图

Page 39: 第 1 章 数据整理

1.4.1 Excel 绘制统计图的基本步骤

Excel 提供“图表向导”工具,帮助创建适合于数据

信息和分析目的的各种图表,下面先简单描述一下图表操作的基本步骤。

① 使用“图表向导”工具制作图表之前,选定数据

所在的单元格,如果希望数据的行列标题显示 在图表中,则选定区域还应包括含有标题的单 元格。

Page 40: 第 1 章 数据整理

② 单击“插入”菜单中的“图表”选项,按照“图表向导” 中 4 个步骤的指令进行操作。 第 1步“图表类型”:每种类型的图表都有两种以上的子类型,选中所需要的图形以及它的子图形,单击“下一步”按钮。

第 2步“图表数据源”:选定包含数据和行列标志的工作表单元格,即便工作表包含多个行列标志,也能在图表中显示它们。生成图表时,应将各行列标志包含到选定区域中。若预览图表看去很合适,则表示所选数据区正确。单击“下一步” 按钮。

Page 41: 第 1 章 数据整理

第 3步“图表选项”:为选定的图表设置某些标准选项。修改这些设置时,随时查看预览图表可以帮助我们确定设置是否合适。单击“下一步” 按钮。

第 4步,“图表位置”:可以将图表放置在工作表上,或者单独置于一张新的图表工作表上,在这一步中,我们为图表工作表命名,或者选择现有工作表的名称,单击“完成”按钮。

Page 42: 第 1 章 数据整理

1.4.2 条形图与柱形图 条形图和柱形图可交换使用。 Excel 的条形图是水平条形, Excel柱形图为竖直条形。 两种图表都可以用来表示与一组或几组分类相关的数值,它

可用于不同现象的比较,也可以采用时间顺序描述现象的发展趋势。

在条形图或柱形图中,各长条或柱的宽度与各长条间的距离彼此均等,条的长度与所代表的变量值成比例。

Page 43: 第 1 章 数据整理

例 薪酬是众人所关心的主题,也更是当代经理人所 关心的主题。 北京、上海、深圳三个城市经理人的薪酬是我国经

理人“薪酬市场”的晴雨表。 1999年《经理人》杂志所作的薪酬调查发现:所调查的经理人中,平均月收入最高的是上海经理人,为 7767 元;其次是深圳经理人,为 7602 元;最后是北京经理人,为 7288 元。

结论应当是最高为上海经理人。那么此结论是否可以用图形来表示呢?

Page 44: 第 1 章 数据整理

① 打开“第 1 章 数据整理 xls“ 工作簿,选择“薪酬”工作表。

② 在 Excel 的“插入”菜单中选择 “ 图表”选项, Excel 会启动图

表向导, 弹出“图表向导”对话框窗口。

在 “图表类型”列表中选择 “柱形图”,在“子图表类型”列表中选择“三维簇状柱形图”,

单击“下一步” 按钮,进入数据源对话框。

Page 45: 第 1 章 数据整理

③在这步对话框中,主要是选择数据源如图所示。单击“数据区域”右端的“压缩对话框”按钮,打开工作表,在工作表上将鼠标

指向单元格 A1 ,按下鼠标左键,拖到 B4 单元格,再单击“压缩对

话框”

按钮,回到源数据对话框。确定 A1:B4 单元格作为此图的数据源,同时,也应注意数据系列是以行还是以列方式排列,如果正确,此时,便有一个预览的图形如图所示,如满意可单击“下一步”按钮,进入“图表选项”对话框。

Page 46: 第 1 章 数据整理

④ 如上图所示, 单击对话框上方 的“标题”页面, 在标题中输入“三 城市薪酬比较”; 在“图例”页面中选 择底部,至于其他 功能则不需改动与 填加,这些过程都 会在图表预览框中 看到,如果满意, 单击“完成”按钮结束, 得到图形如下图。 7000

7200

7400

7600

7800

上海 北京 深圳

三城市薪酬

平均月收入

Page 47: 第 1 章 数据整理

⑤双击所绘制的图形,则会得到如图的对话框。单击“字体”页面,在“字体”列表中选择“宋体”,在“字形” 列表中选择“常规”,在“字号”列表选择“ 10” 。

Page 48: 第 1 章 数据整理

⑥单击“图案”页面,选择“阴影”,选择“园角”,单击“ 确定”按钮结束,得图 2.25 所示。

从图中我们清楚地看到,就三个城市经理人的月收入来讲,上海位居首位,其次是深圳。而在 1998年的调查中,深圳位居榜首,这说明上海经济及其经理人收入在这一年内都有很大变化。

7000

7500

8000

上海 北京 深圳

三城市薪酬

平均月收入

Page 49: 第 1 章 数据整理

1.4.3 折线图

将平面中的交点相继联接起来所得图形称为折线图,它一般用于描述某一变量在一段时期内的变动情况。

例 已知 1990年至 1999年各月社会商品零售总额,

试观察一下社会商品零售总额的发展趋势及其变动规律。

Page 50: 第 1 章 数据整理

① 打开“第 1 章 数据整理 .xls” 工作簿,选择“零售额”工作表。

Page 51: 第 1 章 数据整理

② 在 B 列后插入一列以便输入年份与月份。先选择 B

列单元格,再打开“插入”菜单,选择“列”项,则自动在 B 列后填加一列 C ,原来 C 列的内容变成了 D 列。 ③在单元格 C1 中输入“时间”,在 C2 单元格中输入公式“ =a2&CHAR(13)&bA2” ,从单元格 C3 开始复制这个公式到 C117 。④ 打开 Excel“插入”菜单,选择“插入”菜单中的“图

表”选项, Excel 会启动“图表向导”。

Page 52: 第 1 章 数据整理

⑤在步骤 1“ 图表类型”中选择“折线图”,及 “数据点折线图”,单击“下一步”按钮,进入步骤 2 的向导 窗口。

Page 53: 第 1 章 数据整理

⑥在步骤 2 中的数据区域中输入 C1: D117 ,单击“下一 步”按钮,进入向导“步骤 3” 。

⑦在步骤 3 中单击图表“标题”页面,输入标题“社会消费 品零售额趋势图”;单击“图例”页面,取消显示图例, 如果通过图表预览,认为满意,即可单击“完成”按钮。 经过修饰,得到下图。

Page 54: 第 1 章 数据整理

1.4.4 饼形图 例 中国人如何看 WTO 。 由中国社会调查事务所组织的最新一次问卷调查显示: 有 58.4% 的被调查者对中国加入WTO 非常有信心;有 19.3

% 的被调查者没有态度;有 9.2% 的被调查者表示担心;有13.1% 的被调查者反对中国加入WTO

试用饼形图描述一下中国人对加入WTO 的看法。

Page 55: 第 1 章 数据整理

① 打开“第 2 章 数据整理 .xls” 工作簿,选择“ WTO”

工作表。 ② 打开 Excel“插入”菜单,并单击“插入”菜单中的 “ 图表”选项, Excel 会启动图表向导。 ③在步骤 1 的“图表类型”中选择“饼图”,并在

“子类 型图表”中选择“三维饼图”,单击“下一步”按

钮, 进入向导 2 。

Page 56: 第 1 章 数据整理

④ 如图所示,在步骤 2 中的数据区域中输入 A3: B6 单元格,

单击“下一步”按钮,进入向导 3 。

Page 57: 第 1 章 数据整理

⑤在步骤 3 中单击“标题”页面,输入标题“中国人看 WTO”;单击“图例”页面,取消显示图例;单击“数据标志”页面,在“数据标志”列表中选择“同时显示百分比及数据标志”。如图所示。

Page 58: 第 1 章 数据整理

⑥如果通过图表预览,认为满意,即可单击“完成”按钮。 经过修饰后,得饼形图如图所示。

WTO中国人看

很有信心59%

没有态度19%

担心9%

反对加入13%

Page 59: 第 1 章 数据整理

1.5 直方图分析工具

• 1.5.1 Excel分析工具与安装 • 1.5.2 直方图分析工具的内容 • 1.5.3 直方图分析工具的使用与解释

Page 60: 第 1 章 数据整理

1.5.1 Excel 分析工具与安装 1. 工作表函数与分析工具的区别 • 分析工具的分析结果和输出之间不存在动态联系,而工 作表函数输入项和输出结果之间则存在着动态联系。 • 工作表函数的输出结果只占用一个单元格,而分析工具 的输出结果则要根据分析内容与选项占用很多单元格。 • 工作表函数只能测定所要分析的一个内容,而大部分分 析工具则能够从事系列计算,所以可用于更加复杂的统 计分析。 • 分析工具必须单独安装、设置后方可使用,而工作表函 数可随时使用,勿需安装。

Page 61: 第 1 章 数据整理

2. 分析工具的安装 如果用户在 Excel 的“工具”菜单中没有找到“数据分析选项,说明用

户安装 Excel 不完整,必须在 Excel 中重新安装“分析工具库”内容。具体安装方法如下。

① 在“工具”菜单中, 单击“加载宏”选项, 则弹出对话框图所示。

Page 62: 第 1 章 数据整理

② 选中“分析工具库”和“分析工具库 -VBA” 复选框, 单击“确定”按钮,将会引导用户进行安装。如果用 户在安装 Excel 时选择的是“典型安装”,则需要使 用 CD-ROM 进行安装,如果用户在安装 Excel 时选 择的是“完全安装”,则 Excel 会从硬盘中直接进行 安装。 ③无论是何种情况,安装完毕后,“数据分析”选项 会自动出现在 Excel 的工具菜单中。

Page 63: 第 1 章 数据整理

直方图分析工具是一个用于确定数据的频

数分布、累计频数分布,并提供直方图的

分析模块。它在给定工作表中数据单元格

区域和接收区间的情况下,计算数据的频

数和累积频数。

1.5.2 直方图分析工具的内容

Page 64: 第 1 章 数据整理

① 在“工具”菜单中,单击“数据分析”选项,弹出数据分析

对话框,如图所示。

Page 65: 第 1 章 数据整理

② 在“分析工具”列表框中,单击“直方图”分析工具,则会

弹出“直方图”对话框如图所示。

Page 66: 第 1 章 数据整理

1.5.3 直方图分析工具的使用与解释

例 本世纪美国中小企业得到飞速发展。美国某杂志

1993发表了企业的数据。 这些企业的年销售收入在 5- 350 百万美元之间。

按前五年的平均投资回报率进行排序,得到 60家企业的总经理的年龄与薪酬(千元)资料

试用直方图描述这 60 家企业的总经理的薪酬分布情况。

Page 67: 第 1 章 数据整理

① 打开“第 1 章 数据整理 .xls” 工作簿中的“美国薪 酬”工作表,如图所示。

Page 68: 第 1 章 数据整理

② 打开“工具”菜单,选择“数据分析”选项,打开“数据分

析”对话框。

③选择“直方图”,打开直方图对话框如图所示 . 。

Page 69: 第 1 章 数据整理

④ 在“输入区域”中,输入 C1: C61 ,然后选定标志,并在

输出区域中输入单元格 D1 ,选定图表输出,表示需要 直方图与频数表。

⑤单击“确定”按钮,直方图分析工具便生成下图。

直方图

0102030

21 176 330 485 639 794 948 其他

接收

频率 频率

Page 70: 第 1 章 数据整理

② 在默认的直方图中,柱形彼此分开,现将其连接起来。单击某个柱形,单击鼠标右键,在弹出菜单中,选择“数据系列格式”选项,

弹出“数据系列格式”对话框如图所示。

Page 71: 第 1 章 数据整理

③打开“图案”页面,将分类间距从 150改成 0 。

④ 单击“确定”按钮, 得直方图如图所示。

直方图

0

5

10

15

20

25

21 176 330 485 639 794 948 其他

接收

频率