2群の関係を把握する方法 - sas institute · 2群の関係を把握する方法...

50
Data Science Institute 1 2群の関係を把握する方法 2019年10月25日 株式会社データサイエンス研究所 伊藤嘉朗 Data Science Institute 2 散布図 積率相関係数 偏相関係数 順位相関係数 ◇単回帰分析 ◇対数目盛 ◇相関関係 本日の内容

Upload: others

Post on 09-Jan-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

1

2群の関係を把握する方法

2019年10月25日株式会社データサイエンス研究所

伊藤嘉朗

Data Science Institute

2

散布図

積率相関係数偏相関係数順位相関係数

◇単回帰分析

◇対数目盛

◇相関関係

本日の内容

Page 2: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

3

セールスマンの訪問回数と売上高

訪問回数 売上高38 52325 38473 75882 81343 49266 67838 49529 41871 723

相関分析(散布図)

Data Science Institute

4

相関関係

正の相関 負の相関 無相関

相関関係には正の相関、負の相関、無相関。点の集中度が関係の強さを測定する手がかり。

Page 3: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

5

散布図の作成法(SAS EG)

月 4 5 6 7 8 9 10 11 12 1 2 3

広告費 12 10 17 59 75 64 33 24 49 43 36 26

売上高 83 74 60 109125115 78 70 114 87 97 99

1. データを入力(「ファイル」→「新規作成」→「データ」)

EG

Data Science Institute

6

2. 「グラフ」→「散布図」を選択する。

EG

Page 4: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

7

3. 「データ」をクリックし、広告費を「X軸」に、売上高を「Y軸」に設定する。

EG

Data Science Institute

8

4. 「グラフ領域」をクリックし、「カスタムチャートサイズ」を指定する。

EG

Page 5: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

9

EG

Data Science Institute

10

相関係数(r)は相関関係の強さ

相関係数( r )

r=0.97 r=0.32

-1 ≦ r ≦ 1

0

50

100

150

200

250

300

350

50 150 250 350

100

120

140

160

180

200

220

240

80 90 100 110 120 130

Page 6: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

11

相関係数( r )の解釈

r=0 ⇒ 説明力は0%

r=1 ⇒ 説明力は100%

r=0.32 ⇒ 説明力は?%

0.32×0.32=0.1024説明力は、10.24%

Data Science Institute

12

積率相関係数(r)のしくみ

1 2 3 4 5

5

4

3

2

1X

Y

平均

平均

Page 7: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

13

X-平均 Y-平均 (X-平均)(Y-平均)

① + + +② - + -③ - - +④ + - -

計 合計

①、③の領域に点が多ければ正の相関②、④の領域に多く点があると負の相関全ての領域にあれば相殺され無相関

合計が大きければ相関が強い

Data Science Institute

14

積率相関係数(r)の計算式

Xの標準偏差×Yの標準偏差r= 共分散

相関が強い

「合計÷データ数」(共分散)が大きい

-1 <r < +1

共分散をXの標準偏差、Yの標準偏差で割る

Page 8: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

15

積率相関係数(r)の計算例

0

1

2

3

4

5

6

0 1 2 3 4 5 6

X Y1 1 2 2 3 4 4 3 5 5

平均 3 3

Data Science Institute

16

標準偏差の計算方法

2)偏差平方和2乗

1 - 3 = -2 42 - 3 = -1 13 - 3 = 0 04 - 3 = 1 15 - 3 = 2 4

1) 平均 : ( 1+2+ 3+4+5 )÷ 5 = 3

計 0 10

3)分散: 10 ÷ 5 = 2

4)標準偏差 : √ 2 = 1.414・・・

例)1,2,3,4,5

Page 9: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

17

Xの標準偏差×Yの標準偏差r= 共分散

=1.414 ×1.414

1.8 =0.900

X a(X-平均) Y b(Y-平均) a×b1 -2 1 -2 4.0 2 -1 2 -1 1.0 3 0 4 1 0.0 4 1 3 0 0.0 5 2 5 2 4.0

平均 3 3 合計 9.0標準偏差 1.414 1.414 合計÷5 1.8

万円 万円2万円

万円2

万円 万円

Data Science Institute

18

積率相関係数の求め方(SAS EG)

1.データを入力する。

EG

Page 10: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

19

2.「分析」-「多変量解析」-「相関分析」を選択する。

EG

Data Science Institute

20

3.「データ」をクリックし、「分析変数」を設定する。

EG

Page 11: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

21

4.「オプション」をクリックし、「ピアソン(Pearson)」を選択する。

EG

Data Science Institute

22

相関係数(r)=0.900

EG

P値=0.0374

Page 12: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

23

相関係数とP値

r=0.262

P値=0.4112

データ数:12組

Data Science Institute

24

r=0.262

P値=0.0434

データ数:60組

Page 13: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

25

積率相関係数(r)の検定

r=0ではないと判断したときの危険率

相関関係の強さ

Data Science Institute

26

r=0.949

Page 14: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

27

外れ値を含む場合

r=0.657 外れ値の影響を受ける

Data Science Institute

28

A支店の広告費と売上高

r=0.775

月 4 5 6 7 8 9 10 11 12 1 2 3広告費 42 26 35 68 103 90 88 58 79 80 48 60売上高 47 40 51 67 85 100 70 52 65 81 72 85

強い正の相関

0

20

40

60

80

100

120

0 20 40 60 80 100 120

Page 15: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

29

B支店の広告費と売上高

r=0.863

強い正の相関

月 4 5 6 7 8 9 10 11 12 1 2 3

広告費 12 10 17 59 75 64 33 24 49 43 36 26

売上高 83 74 60 109125115 78 70 114 87 97 99

0

20

40

60

80

100

120

140

0 20 40 60 80

Data Science Institute

30

(A支店+B支店)の広告費と売上高

r=0.272

???

0

20

40

60

80

100

120

140

0 20 40 60 80 100 120

Page 16: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

31

0

20

40

60

80

100

120

140

0 20 40 60 80 100 120

A支店

B支店

(A支店+B支店)の広告費と売上高

Data Science Institute

32

A支店の広告費と売上高

r=0.016

無相関

月 4 5 6 7 8 9 10 11 12 1 2 3

広告費 43 51 62 76 41 51 62 82 40 51 60 71

売上高 94 102 109 100 46 51 47 62 115 112 122 115

0

20

40

60

80

100

120

140

30 40 50 60 70 80 90

Page 17: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

33

B支店の広告費と売上高

r=0.040

無相関

月 4 5 6 7 8 9 10 11 12 1 2 3

広告費 92 102 111 122 88 102 112 132 89 99 110 121

売上高 152 160 167 175 147 146 142 157 210 207 217 210

0

50

100

150

200

250

80 90 100 110 120 130 140

Data Science Institute

34

(A支店+B支店)の広告費と売上高

r=0.823

???

0

50

100

150

200

250

20 40 60 80 100 120 140

Page 18: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

35

(A支店+B支店)の広告費と売上高

0

50

100

150

200

250

20 40 60 80 100 120 140

A支店

B支店

Data Science Institute

36

都道府県 売上高 広告費北海道 245 26

青森 123 14

・・・ ・・・ ・・・・・・ ・・・

東京 5,672 492 ・・・ ・・・ ・・・・・・ ・・・ ・・・沖縄 59 6

地域別の売上高と広告費

都道府県別広告費と売上高実績

Page 19: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

37

支店 広告費 売上高

北海道 92 44

東北 93 102

関東 332 288

北陸 78 54

中部 181 118

近畿 108 138

中国 113 138

四国 72 86

九州 243 152

沖縄 13 22

◇支店別広告費と売上高

Data Science Institute

38

相関係数(r)=0.902

EG

Page 20: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

39

売上高 宣伝広告費

宣伝広告費人口

売上高

交絡要因(人口)に注意が必要!

相関関係と因果関係

Data Science Institute

40

支店 広告費 売上高 人口

北海道 92 44 5,506

東北 93 102 9,335

関東 332 288 42,604

北陸 78 54 5,443

中部 181 118 18,127

近畿 108 138 12,912

中国 113 138 15,554

四国 72 86 3,976

九州 243 152 13,204

沖縄 13 22 1,393

◇支店別広告費、売上高、人口

Page 21: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

41

広告費と売上高人口と広告費人口と売上高

EG

r = 0.902

r = 0.895r = 0.951

Data Science Institute

42

売上高 宣伝広告費

宣伝広告費人口

売上高

広告宣伝費は売上高に貢献?

人口の影響を除いたときの広告費と売上高の

積率相関係数 偏相関係数

Page 22: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

43

1.データを入力し、「分析」-「多変量解析」-「相関分析」を選択する。

偏相関係数(SAS EG)EG

Data Science Institute

44

2.「データ」をクリックし、分析変数、及び部分変数(人口)を設定する。

EG

Page 23: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

45

偏相関係数=0.373

EG

Data Science Institute

46

◇都道府県別コンビニ件数、人口、甲子園の勝率

EG

Page 24: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

47

・コンビニ数と甲子園勝率 0.410?

・コンビニ数と人口 0.983

人口の多い都道府県はコンビニ件数が多い。

・人口と甲子園勝率 0.432

人口が多いと高校の数や高校生の数も多く、結果として

野球のレベルも上がる。

EG

人口の影響を除いた相関係数(偏相関係数)

Data Science Institute

48

EG

2.「データ」をクリックし、分析変数、及び部分変数(人口)を設定する。

1.データを入力し、「分析」-「多変量解析」-「相関分析」を選択する。

Page 25: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

49

偏相関係数 = -0.088

EG

Data Science Institute

50

◇10名の児童の算数と国語のテストの順位。

スピアマンの順位相関係数(rs)

算数 国語

1 3

2 2

3 4

4 1

5 8

6 5

7 6

8 7

9 10

10 9

Page 26: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

51

1.データを入力し、「分析」-「多変量解析」-「相関分析」を選択。2.「データ」をクリックし、「分析変数」の設定。3.「オプション」をクリックし、スピアマン(Spearman)を選択。

スピアマンの順位相関係数(SAS EG)EG

Data Science Institute

52

順位相関係数 -1 < rs < 1

1 に近いほど関係性が強く、0 に近いほど関係性が弱い

EG

順位相関係数 rs = 0.830

Page 27: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

53

EG

順位相関係数 rs = 0.830

積率相関係数 r = 0.830

Data Science Institute

54

◇男性10名

中性脂肪値とGOTの値

極端な値(外れ値)

GOTに極端な値

順位相関係数

№ 中性脂肪 GOT

1 77 21

2 103 29

3 125 34

4 119 19

5 89 27

6 157 35

7 146 32

8 173 42

9 130 28

10 164 345

Page 28: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

55

順位相関係数 rs = 0.843

積率相関係数 r = 0.437

EG

Data Science Institute

56

№ 中性脂肪 GOT

1 77 21

2 103 29

3 125 34

4 119 19

5 89 27

6 157 35

7 146 32

8 173 42

9 130 28

10 164 345

№ 中性脂肪 GOT

1 1 2

2 3 5

3 5 7

4 4 1

5 2 3

6 8 8

7 7 6

8 10 9

9 6 4

10 9 10

順位データ

Page 29: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

57

順位相関係数 rs = 0.843

積率相関係数 r = 0.843

Data Science Institute

58

例)売上高と売上高に影響を与える要因との関係

売上高⇐広告宣伝費、人口、セールスマン数、・・・

説明変数が1つ:単回帰説明変数が2つ以上:重回帰

従属変数⇐説明変数(独立変数)

回帰式(y=a+bx)を求める。

目的:回帰式を求め、予測する。

回帰分析

Page 30: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

59

走行距離と車両価格

価格:万円 距離:千km

車両価格 走行距離従属変数 説明変数

単回帰分析

№ 1 2 3 4 5 6 7 8 9

車両価格 119 89.9 78 169.6 98 26.8 43.8 33.8 105

走行距離 47 46 51 27 85 101 89 138 46

10 11 12 13 14 15 16 17 18

車両価格 105 113 79 75 59 89 55 49 31

走行距離 70 48 76 61 62 70 105 92 119

Data Science Institute

60

相関分析

r = -0.827

0

20

40

60

80

100

120

140

160

180

0 20 40 60 80 100 120 140 160

車両価格

走行距離

Page 31: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

61

0

20

40

60

80

100

120

140

160

180

0 20 40 60 80 100 120 140 160

車両価格

走行距離

回帰分析

回帰式(y=a+bx)を求める。

Data Science Institute

62

X

Y

各データと回帰直線との垂直距離の2乗和を最小

回帰直線の求め方(最小二乗法)

Page 32: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

63

1.データを入力する。

回帰分析(SAS EG )EG

Data Science Institute

64

2.「分析」-「回帰分析」-「線形回帰分析」を選択する。

EG

Page 33: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

65

3.「データ」をクリックし、車両価格を「従属変数」、走行距離を「説明変数」に設定する。

EG

Data Science Institute

66

・車両価格=155.98-1.042×走行距離

走行距離1千km増えると車両価格は約1万円低下する。

EG

Page 34: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

67

回帰式の信頼性

2)偏回帰係数のt検定

P値の確認

走行距離の偏回帰係数のP値<0.0001

0.5(50%)が目安

1)決定係数の大きさ

自由度調整済み決定係数=0.6635

⇒ 回帰式により約66.35%説明できる

偏回帰係数が0と違いがあるか?

Data Science Institute

68

男性 7.1 6.4 7.1 5.2 6.1 4.8 5.9 6.9 5.8 5.7 6.1 女性 6.6 4.5 5.1 5.3 6.1 4.9 5.7 6.2 4.4 4.2 5.3

(A) 商品のパッケージの好感度について、男女各10人に10点満点にて調査した。男女間に評価の差は見られるか。

2標本t検定と回帰分析

男女の好感度に違いは?

Page 35: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

69

2標本t検定(SAS EG)

1.データを入力する。

EG

Data Science Institute

70

2.「分析」-「分散分析」-「t検定」をクリックする。

EG

Page 36: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

71

3.「2標本に対する検定」を選択する。

EG

Data Science Institute

72

4.「分類変数」と「分析変数」を指定する。

EG

Page 37: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

73

◇分散が違うとは言えないとき有意確率=0.0394

◇分散が違うとき有意確率=0.0395

EG

Data Science Institute

74

「データ」をクリックし、評価を「従属変数」、性別を「説明変数」に設定する。

Page 38: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

75

評価 = 5.3 + 0.8 × 性別

Data Science Institute

76

3

3.5

4

4.5

5

5.5

6

6.5

7

7.5

0 0.2 0.4 0.6 0.8 1

評価 = 5.3 + 0.8 × 性別

Page 39: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

77

年 売上高 広告費

2012 8 6

2013 9 6

2014 13 7

2015 11 5

2016 14 8

2017 17 10

2018 ? 11

年度別広告費と売上高

Data Science Institute

78

散布図

Page 40: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

79

r=0.8686 強い正の相関関係

相関係数

EG

Data Science Institute

80

売上高=0.625+1.625×広告費

売上高 ⇐ 広告費

自由度調整済み決定係数=0.6931

予測値=0.625+1.625×11=18.5

EG

Page 41: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

81

「折れ線グラフ」、「重ね合わせの縦列折れ線グラフ」を選択。

「データ」をクリックし、年度を「X軸」に、広告費、売上高を 「Y軸」に設定。

EG折れ線グラフの作成(SAS EG)

Data Science Institute

82

年度別推移

EG

Page 42: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

83

売上高推移(設立~20年)

売上高は順調に伸びている!?

EG

Data Science Institute

84

・年度間の差に着目

年度 売上高1999 1 2000 2 2001 3 2002 4 2003 5 2004 6 2005 7 2006 8 2007 9 2008 10 2009 11 2010 12 2011 13 2012 14 2013 15 2014 16 2015 17 2016 18 2017 19 2018 20

・年度間の比に着目

+1

比率は年々減少!

前年比-

2.001.501.331.251.201.171.141.131.111.101.091.081.081.071.071.061.061.061.05

Page 43: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

85

折れ線グラフ

EG

Data Science Institute

86

0

50

100

150

200

250

300

4月 5月 6月 7月 8月 9月 10月 11月 12月

目の動きは棒をイメージして上下に動かすべき

目を斜めに動かすグラフは対数目盛

折れ線グラフと棒グラフの違いは何か?

Page 44: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

87

4月 5月 差 前月比東北 216 266 50 1.231関東 752 802 50 1.066沖縄 63 113 50 1.794

8月 9月 差 前月比東北 200 260 60 1.3関東 910 1183 273 1.3沖縄 50 65 15 1.3

1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月

東北 188 192 201 216 266 238 225 200 260 213 198 218

関東 730 648 813 752 802 868 856 9101183

1020 923 955

沖縄 41 40 55 63 113 42 53 50 65 48 45 47

支店(東北、関東、沖縄)別売上高

Data Science Institute

88

1.データを入力する。

EG

折れ線グラフの作成

Page 45: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

89

2.「重ね合わせの縦列折れ線グラフ」を選択する。

3.「データ」をクリックし、月を「X軸」に、東北、関東、沖縄を「Y軸」に設定する。

EG

Data Science Institute

90

普通目盛の折れ線グラフでは比較困難

EG

Page 46: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

91

対数目盛の設定法(SAS EG)

「Y軸・目盛」をクリックし、Y軸の目盛を「対数」、「Y軸の底」を「底10」に設定する。

EG

Data Science Institute

92

折れ線グラフ(対数目盛)EG

Page 47: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

93

訪問回数 売上高

1月 38 523

2月 25 384

3月 73 758

4月 82 813

5月 43 492

6月 66 678

7月 38 495

8月 29 418

9月 71 723

(単位:回、百万円)

◇セールスマンの訪問回数と売上高

Data Science Institute

94

1. データを入力する。

EG

Page 48: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

95

2.「重ね合わせの縦列折れ線グラフ」を選択する。

3.「データ」をクリックし、月を「X軸」に、訪問回数、売上高を「Y軸」に設定する。

EG

Data Science Institute

96

折れ線グラフ(普通目盛)EG

Page 49: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

97

折れ線グラフ(対数目盛)EG

Data Science Institute

98

人間の五感は対数に変換されている

◇ウェーバー・フェヒナーの法則弁別閾(気づくことができる最小の刺激差)は刺激の値に比例

手に重りを100gのせ、少しずつ重りを加え、重さの違いを感じたのが110gのとき、手に重りを200gのせ、1gずつ重りを加え、重さの違いを感じるのは220gのときである。

デシベル、PH、マグニチュード、等星・・・

Page 50: 2群の関係を把握する方法 - Sas Institute · 2群の関係を把握する方法 2019年10月25日 ... ・コンビニ数と人口 0.983 人口の多い都道府県はコンビニ件数が多い。

Data Science Institute

99

2群の関係を把握する方法

散布図交絡要因(疑似相関)

◇相関係数ピアソンの積率相関係数偏相関係数スピアマンの順位相関係数

◇単回帰分析

◇対数目盛の活用法

◇相関関係