統計学 第3回 10/11
DESCRIPTION
統計学 第3回 10/11. 担当:鈴木智也. 前回のポイント. 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが「記述統計」、データを生み出した背景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、まずは記述統計から学ぶ。 以下、データの観測値を X 1 、 X 2 ・・・と表す。. 講義の流れ. 第1部:記述統計 ← 今はここ 第2部:確率論 第3部:推測統計 第1部の構成 一変数の規則性を記述する ← ここ! 規則性を視覚化する 二変数の関係を記述する. 今日のトピック. - PowerPoint PPT PresentationTRANSCRIPT
1
統計学第3回 10/11
担当:鈴木智也
2
前回のポイント
• 「記述統計」と「推測統計」。• データ自体の規則性を記述するのが「記述統計」、データを生み出した背景を推測するのが「推測統計」である。
• 推測統計は記述統計に基づくので、まずは記述統計から学ぶ。
• 以下、データの観測値をX1、X2・・・と表す。
3
講義の流れ
第1部:記述統計 ← 今はここ第2部:確率論第3部:推測統計
• 第1部の構成一変数の規則性を記述する ← こ
こ!規則性を視覚化する二変数の関係を記述する
4
今日のトピック
一変数ついて、規則性を数量的に把握。
三つの基本的な指標• 平均 ← データの代表値(の一つ)• 分散 ← 標準偏差を出すために導出• 標準偏差 ← データの散らばり具合
5
平均(Mean)
☆平均(小学校の算数で履修済み)
X のデータから、 m 個の観測値について、大体どれ位の値になるかの指標。
m
ii
m
mX
m
XXXX
1
21 }1
{
6
分散(Variance)
☆分散
Xi が概ね平均値からどのくらい離れているかを表す指標。(散らばり具合を記述)Q:なぜ二乗しているのかを考えてみよう。
m
ii
m XXmm
XXXXs
1
222
12 )(1)()(
7
標準偏差( Standard Deviation)
☆標準偏差 ← 誤差の平均
これも散らばり具合を表す指標。 注:分散は二乗を取って計算しているので、元々の単位とは異なる。⇒分散の平方根を取って「標準化」することで、平均値と比較可能になる。
(分散の平方根)2ss
8
応用①:加重平均• 単純平均
• 加重平均(次の例題を参照のこと)
)。イト(に対して、等しいウェ全てのm
X
Xmm
XXXX
i
m
ii
m
1
1
1
21
ェイトを変える。の重要性に応じて、ウ
である。 ただし、
1 ,1 1
i
m
i
m
iiii
X
wXwX
9
例題(加重平均の使い方)
• 食堂が二つの定食を出しており、価格と一日あたりの売上げは以下の通りである。
Aセット 500円 70食 /一日Bセット 600円 30食 /一日
一食あたりの平均売上げはいくらになるのか計算せよ。
10
誤った解答の代表例
• AセットとBセットの価格の単純平均
⇒単純平均では、売上げ全体について、Aセットの貢献度:過小評価Bセットの貢献度:過大評価
(AセットとBセットの売上げ比率は7:3。)
これは誤り。円
5502
600500
11
正しい解答
• AセットとBセットの売上比率が 70%、30%なので、ウェイトを 0.7、 0.3に設定。
• 別解としては、全食の売上金額を合計し、売上件数 100で割る方法もある。
する。ウェイトの合計は1に
。円 加重平均:
5306003.05007.0
。円 単純平均: 530100
3060070500
12
加重平均の適用例
• TOPIX(東証平均株価)⇒上場株式数でウェイトづけ。
(注)日経平均株価は単純平均• 消費者物価指数⇒物価を品目別にウェイトづけして算出。• ファイナンス理論:期待収益率の計算⇒収益率を確率でウェイトづけする。
13
加重平均した場合の分散
• もしも平均を加重平均で算出するなら、分散も同じようにウェイトづけをして算出。
• これはファイナンスで「リスク」を計算する際に多用する(詳細は『金融論』等で)。
. )( 2
1
22
1
ssXXws
XwX
m
iii
m
iii
14
応用②:変動係数
• 例:先進国Aと途上国B、どちらが貧富の差が激しいのか?
• 貧富の差は所得の散らばり具合を二国で比べればよい。⇒分散や標準偏差をそのまま比較すれば、平均所得の高い先進国の方が、単位が大きい分、所得のちらばりが大になる。
15
変動係数(続き)
⇒平均所得から概ねどのくらいの範囲に散らばっているかを比較可能にしたい。⇒標準偏差を平均値で割ってやる。
の略。は Variation t Coefficien , CVX
sCV
16
応用③:標準化変量
• ある観測値がデータ全体の中でどのくらいの位置にあるのかは、平均値と標準偏差を用いて、「標準化」した「変量」で測る。
• 標準化変量
(注)「標準化」の手順は統計学では頻出!.
s
XXz i
i
17
標準化変量の適用
• 学力テストの偏差値は、平均点を50にして、標準化変量を 10倍して算出している。
• 異なるデータ間で学力を比較できる方法の一つ。
.10501050 zs
XX i
偏差値
18
付論
• 平均値以外の代表値の指標としては、次の二つがよく用いられる。(1)中位数(Median)データを大きさの順に並べたとき、ちょうど中央に位置する値。(2)最頻値(Mode) 最も多くのデータが集中している値。