part 1 understanding data chapter 1 examining distributions chapter 2 examining relationships...

27
Part 1 Understanding Data • Chapter 1 Examining Distributions • Chapter 2 Examining Relationships • Chapter 3 Producing Data

Post on 19-Dec-2015

226 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

Part 1Understanding Data

• Chapter 1 Examining Distributions

• Chapter 2 Examining Relationships

• Chapter 3 Producing Data

Page 2: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

Chapter 1 Examining Distributions探討分配 ( 分佈、分布 )

• 1.1 Displaying Distributions with Graphs

• 1.2 Describing Distributions with Numbers

• 1.3 Normal Distributions

Page 3: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

數字會說話• 數字可以告訴我們事實真相,協助規劃,如何做決策。– 航空公司的班機延誤率。– 已修學分之統計資料可以協助未來修課計劃。

Page 4: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

數字如何說話,說什麼話• 統計是數字說話所用的語言。• 資料處理就是以整合、展示和問問題的方式幫助數字說話。

• 正確的資料,經過資料處理,產生的資料產品 ( 資訊 ) ,就可以用來做統計推論。

Page 5: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

數字說話過程圖示

數字

資料處理

數字產品

統計推論

基礎原理

進階推論正確資料來源

第一、二

章 第三

一般推論

第 4,5,6 章

第 7,8 章

第 9,10,11 章

Page 6: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

資料記錄• 資料多以試算表 (spreadsheet) 方式記錄。

– 包括個體 (Individual) :一筆資料所描述的對象 (object) 。電子試算表中鍵入在一列。

– 及變數 ( Variable ) :描述任何一個個體的特質,一個變數對不同的個體取用不同的數值 (value) 。電子試算表中鍵入在一行。

– 例:美國各州教育相關資料。

Page 7: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

變數• 變數分為類別 (categorical) 變數及數量 (q

uantitative) 變數。– 類別變數:將每個個體指定為數個組群或類別之一;例:性別或大學主修科目。

– 數量變數:將每個個體指定為一個有意義的數值,以便做數學運算;例:身高或平均成績點數 (GPA) 。

• 變數的取值,和該值發生的頻率,稱為該變數的分配 (distribution) 。

Page 8: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

State Region Population SAT SAT Percent Percent Teachers

-1000 verbal math taking no HS pay($1000)

AL ESC 4273 565 558 8 33.1 31.3AK PAC 607 521 513 47 13.4 49.6AZ MTN 4428 525 521 28 21.3 32.5AR WSC 2510 566 550 6 33.7 29.3CA PAC 31878 495 511 45 23.8 43.1CO MTN 3823 536 538 30 15.6 35.4CT NE 3274 507 504 79 20.8 50.3DE SA 725 508 495 66 22.5 40.5DC SA 543 489 473 50 26.9 43.7FL SA 14400 498 496 48 25.6 33.3GA SA 7353 484 477 63 29.1 34.1HI PAC 1184 485 510 54 19.9 35.8ID MTN 1189 543 536 15 20.3 30.9IL ENC 11847 564 575 14 23.8 40.9IN ENC 5841 494 494 57 24.4 37.7IA WNC 2852 590 600 5 19.9 32.4KS WNC 2572 579 571 9 18.7 35.1KY ESC 3884 549 544 12 35.4 33.1LA WSC 4351 559 550 9 31.7 26.8ME NE 1243 504 498 68 21.2 32.9MD SA 5072 507 504 64 21.6 41.2MA NE 6092 507 504 80 20 42.9MI ENC 9594 557 565 11 23.2 44.8MN WNC 4658 582 593 9 17.6 36.9MS ESC 2716 569 557 4 35.7 27.7MO WNC 5359 570 569 9 26.1 33.3

Page 9: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

Section 1.1

Displaying Distributions with Graphs

圖示分配

Page 10: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

圖示分配• 類別變數的圖示

– 長條圖 (bar Chart)– 圓形圖 (pie Chart)

• 數量變數的圖示– 直方圖 (histogram)– 莖葉圖 (stemplot 或 stem-and-leaf plot)

Page 11: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

製作方法• 先統計類別變數中各類別發生的次數,• 再計算百分比• 填寫表格包括次數及百分比• 長條圖 (Bar Chart)

– 橫軸為類別,縱軸為發生次數• 圓形圖 (Pie Chart)

– 在圓上呈現各類別之百分比

Page 12: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

表格

婚姻狀況 人數(百萬) 百分比未婚 43.9 22.9已婚 116.7 60.9寡居 13.4 7離婚 17.6 9.2

Page 13: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

長條圖婚姻狀況 人數(百萬) 百分比

未婚 43.9 22.9已婚 116.7 60.9寡居 13.4 7離婚 17.6 9.2

( )人數 百萬

0

20

40

60

80

100

120

140

未婚 已婚 寡居 離婚

Page 14: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

圓形圖婚姻狀況 人數(百萬) 百分比

未婚 43.9 22.9已婚 116.7 60.9寡居 13.4 7離婚 17.6 9.2 未婚

已婚

寡居

離婚

Page 15: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

Exercise

• Table 1.6 資料– 製作變數 Region 的長條圖與圓形圖– 提示 製作表格

Region 次數 百分比ENCESCMA

MTN.

Page 16: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

直方圖的製作• 適用於數量變數

– 例:各州 65 歲以上人口百分比資料• 製作方法

– 將資料適當分組, ( 多為等組距 )– 計算變數值落在各組的次數– 製作表格– 橫軸為各組,縱軸為發生次數畫圖

Page 17: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

各州 65 歲以上人口百分比資料135.2

13.214.410.511

14.312.818.59.9

12.911.412.512.615.213.712.6

11.413.911.414.112.412.412.313.813.213.811.412

13.811

13.412.514.5

13.413.513.415.915.812.114.412.510.28.8

12.111.211.615.213.311.2

Page 18: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

各州 65 歲以上人口百分比表格Class Count Class Count Class Count

5.1 to 6.0 1 10.1 to 11.0 4 15.1 to 16.0 46.1 to 7.0 0 11.1 to 12.0 8 16.1 to 17.0 07.1 to 8.0 0 12.1 to 13.0 13 17.1 to 18.0 08.1 to 9.0 1 13.1 to 14.0 12 18.1 to 19.0 19.1 to 10.0 1 14.1 to 15.0 5

Page 19: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

65 歲以上人口百分比直方圖Class Count5.5 16.5 07.5 08.5 19.5 1

10.5 411.5 812.5 1313.5 1214.5 515.5 41635 017.5 018.5 1

0

2

4

6

8

10

12

14

5.5 6.5 7.5 8.5 9.5 10.5 11.5 12.5 13.5 14.5 15.5 1635 17.5 18.5

Page 20: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

直方圖在說話• 直方圖描述資料的整體分佈型態

– 包括形狀 (shape) 、中心 (center) 及離散度 (spread) 等

• 直方圖也呈現資料的偏差 (deviation)– 離群值 (outliers) :與眾不同之個別值

Page 21: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

資料的整體分佈• 對稱資料 (Symmetric Data)

– 圖例 1.3

• 偏斜資料 (Skewed Data)– 右偏斜資料 (skewed to the right) :資料中線的右邊延伸較長。

– 左偏斜資料 (skewed to the left) :資料中線的左邊延伸較長。

Page 22: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

對稱資料 (Figure 1.3)Class Count

7 28 19 3

10 511 1212 2313 1114 315 416 117 2

0

5

10

15

20

25

7 8 9 10 11 12 13 14 15 16 17

Page 23: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

右偏斜資料 (Figure 1.4)letters percent

1 52 183 234 245 126 77 5.28 2.59 2

10 111 0.522 0.3

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11 22

Page 24: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

莖葉圖• 適用於資料較少之數量變數

– 例:各州 65 歲以上人口百分比資料– 例:期中考成績

• 製作方法– 將各資料分成莖 ( 最右一個數字以外的所有數 ) 及葉 ( 最右一個數字 ) 。

– 將莖由小到大排成一欄並在其右畫一垂直線– 將葉由小到大在對應莖的右排成一列

Page 25: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

65 歲以上人口百分比莖葉圖

1 5 2

1 6

1 7

2 8 8

3 9 9

5 10 25

14 11 002244446

(13) 12 0113445556689

23 13 0223444578889

10 14 13445

5 15 2289

1 16

1 17

1 18 5

Page 26: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

時間數列圖 (Time Plot)

• 蒐集資料的順序為 X 軸,觀察值為 Y 軸畫出的散佈圖– 例 1.6 :每十萬人癌症死亡數

Year 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995Deaths 134 139.8 146.5 149.2 153.5 162.8 169.7 183.9 193.3 203.2 204.7

Page 27: Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

每十萬人癌症死亡數時間數列圖1945 1341950 139.81955 146.51960 149.21965 153.51970 162.81975 169.71980 183.91985 193.31990 203.21995 204.7

130

140

150

160

170

180

190

200

210

1940 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000