統計学第３回　 10/11

1

統計学第３回　 10/11

担当：鈴木智也

2

前回のポイント

• 「記述統計」と「推測統計」。• データ自体の規則性を記述するのが「記述統計」、データを生み出した背景を推測するのが「推測統計」である。

• 推測統計は記述統計に基づくので、まずは記述統計から学ぶ。

• 以下、データの観測値をＸ１、Ｘ２・・・と表す。

3

講義の流れ

第１部：記述統計　←　今はここ第２部：確率論第３部：推測統計

• 第１部の構成一変数の規則性を記述する　←　こ

こ！規則性を視覚化する二変数の関係を記述する

4

今日のトピック

一変数ついて、規則性を数量的に把握。

三つの基本的な指標• 平均　←　データの代表値（の一つ）• 分散　←　標準偏差を出すために導出• 標準偏差　←　データの散らばり具合

5

平均（Ｍｅａｎ）

☆平均（小学校の算数で履修済み）

X のデータから、 m 個の観測値について、大体どれ位の値になるかの指標。

m

ii

m

mX

m

XXXX

1

21 }1

{

6

分散（Ｖａｒｉａｎｃｅ）

☆分散

Xi が概ね平均値からどのくらい離れているかを表す指標。（散らばり具合を記述）Ｑ：なぜ二乗しているのかを考えてみよう。

m

ii

m XXmm

XXXXs

1

222

12 )(1)()(

7

標準偏差（ Standard Deviation）

☆標準偏差　←　誤差の平均

これも散らばり具合を表す指標。　注：分散は二乗を取って計算しているので、元々の単位とは異なる。⇒分散の平方根を取って「標準化」することで、平均値と比較可能になる。

　　（分散の平方根）2ss

8

応用①：加重平均• 単純平均

• 加重平均（次の例題を参照のこと）

）。イト（に対して、等しいウェ全てのm

X

Xmm

XXXX

i

m

ii

m

1

1

1

21

ェイトを変える。の重要性に応じて、ウ

である。　ただし、

1 ,1 1

i

m

i

m

iiii

X

wXwX

9

例題（加重平均の使い方）

• 食堂が二つの定食を出しており、価格と一日あたりの売上げは以下の通りである。

Ａセット　５００円　７０食 /一日Ｂセット　６００円　３０食 /一日

　一食あたりの平均売上げはいくらになるのか計算せよ。

10

誤った解答の代表例

• ＡセットとＢセットの価格の単純平均

⇒単純平均では、売上げ全体について、Ａセットの貢献度：過小評価Ｂセットの貢献度：過大評価

（ＡセットとＢセットの売上げ比率は７：３。）

これは誤り。円

5502

600500

11

正しい解答

• ＡセットとＢセットの売上比率が 70%、30%なので、ウェイトを 0.7、 0.3に設定。

• 別解としては、全食の売上金額を合計し、売上件数 100で割る方法もある。

する。ウェイトの合計は１に　

。円　加重平均：

5306003.05007.0

。円　単純平均： 530100

3060070500

12

加重平均の適用例

• ＴＯＰＩＸ（東証平均株価）⇒上場株式数でウェイトづけ。

（注）日経平均株価は単純平均• 消費者物価指数⇒物価を品目別にウェイトづけして算出。• ファイナンス理論：期待収益率の計算⇒収益率を確率でウェイトづけする。

13

加重平均した場合の分散

• もしも平均を加重平均で算出するなら、分散も同じようにウェイトづけをして算出。

• これはファイナンスで「リスク」を計算する際に多用する（詳細は『金融論』等で）。

. )( 2

1

22

1

ssXXws

XwX

m

iii

m

iii

14

応用②：変動係数

• 例：先進国Ａと途上国Ｂ、どちらが貧富の差が激しいのか？

• 貧富の差は所得の散らばり具合を二国で比べればよい。⇒分散や標準偏差をそのまま比較すれば、平均所得の高い先進国の方が、単位が大きい分、所得のちらばりが大になる。

15

変動係数（続き）

⇒平均所得から概ねどのくらいの範囲に散らばっているかを比較可能にしたい。⇒標準偏差を平均値で割ってやる。

の略。は　 Variation t Coefficien , CVX

sCV

16

応用③：標準化変量

• ある観測値がデータ全体の中でどのくらいの位置にあるのかは、平均値と標準偏差を用いて、「標準化」した「変量」で測る。

• 標準化変量

（注）「標準化」の手順は統計学では頻出！.

s

XXz i

i

17

標準化変量の適用

• 学力テストの偏差値は、平均点を５０にして、標準化変量を 10倍して算出している。

• 異なるデータ間で学力を比較できる方法の一つ。

.10501050 zs

XX i

偏差値

18

付論

• 平均値以外の代表値の指標としては、次の二つがよく用いられる。（１）中位数（Ｍｅｄｉａｎ）データを大きさの順に並べたとき、ちょうど中央に位置する値。（２）最頻値（Ｍｏｄｅ）　最も多くのデータが集中している値。

統計学 第３回 10/11

Documents

統計学第３回　 10/11