麻雀心理学のための統計学序説① 標準偏差
Post on 20-Jul-2015
777 Views
Preview:
TRANSCRIPT
強豪校がそろうAブロック準決勝で
なぜ阿知賀女子学院はトップで通過できたのか?
阿知賀女子学院の強さの秘密
白糸台高校
言わずと知れた昨年と一昨日の優勝校インハイ史上最強チーム
北部九州最強の高校哩姫のコンボはプロでも破れない
全国ランキング2位過去35回出場激戦区北大阪を11年連続制覇
新道寺女子 千里山女子
2/23
阿知賀女子 の強み・弱み
強み…ひとりひとりが大きく沈まない(先鋒は例外)
弱み…準決勝レベルで25000点以上稼げる選手(強力なエース)がいない
つまり 全員がバラツキなく点数をとる総合力のチーム
ということがわかりました
なぜ阿知賀女子学院は準決勝をトップ通過できたのか
3/23
というわけで今日は
バラツキを測る統計的指標 を学びましょう
バラツキを示す指標
それが分散と標準偏差です
バラツキを測る統計的指標
n
xx
s
n
i
i
1
2
2
n
xx
s
n
i
i
1
2
分散
標準偏差
先生!
いきなり数式を出されても
さっぱりです…
わかりやすく教えてください!
4/23
このままだと数字が大きいので、さらにわかりやすくするために
100で割った(およその)値を例に考えます
-25 24 3 10 -4
96 -18
-19 -30 37 8 3
-52 15 -30 41 19
-25 -1 3 14 8
-9
96 87 77 18 0
-19 -49 -12 -4 -1
-52 -37
千里山の江口セーラや
新道寺の白水哩は
そこらの県代表エースを
しのぐ
強力なエースですね
照は96!さすがだね!
亦野せんぱいは…
私のためのハンデづけ
お疲れ様でーす
Aブロック準決勝で考える分散と標準偏差
-10 -59
-67 -26 -7 6/23
Aブロック準決勝で考える
チーム全体のバラツキと個人のバラツキ度
では阿知賀女子チーム全体の得点バラツキはどう表せるでしょうか?
チーム全体をみる前に
まずはひとりひとりのバラツキからみてみましょう
個人のバラツキ度合い は「平均値からどれだけ離れているか」
すなわち
個人のバラツキ度 =(個人の得失点-得失点のチーム平均)
として考えることができます
7/23
Aブロック準決勝で考える
個人のバラツキ度
個人のバラツキ =(個人の得失点-得失点のチーム平均)
これを具体的に計算してみましょう
阿知賀女子の得失点のチーム平均 =−25 + 24 + 3 +10+ (−4)
5= 1.8
松実玄のバラツキ度 = −25 − 1.8 = −𝟐𝟔. 𝟖
松実宥のバラツキ度 = 24 − 1.8 = 𝟐𝟑. 𝟑
新子憧のバラツキ度 = 3 − 1.8 = 𝟏. 𝟐
鷺森灼のバラツキ度 = 10 − 1.8 = 𝟖. 𝟐
高鴨穏乃のバラツキ度 = −4 − 1.8 = −𝟓. 𝟖
得失点のチーム平均 1.8(1800点)
コツコツ稼ぐチームですね
8/23
Aブロック準決勝で考える
チーム全体のバラツキ
なるほど
ではこの値を合計すればチーム全体のバラツキがわかるんですね(ドヤァ)
−26.8 + 23.3 + 1.2 + 8.2 + (−5.8) = 𝟎. 𝟎
って、合計すると0.0 … バラツキ 0.0 って一体何なんだよ!?
そんなコトしたらデコに油性や
個人のバラツキ度にはプラス・マイナスがあります
だからふつうに合計すると
プラス方向のバラツキとマイナス方向のバラツキが打ち消しあってしまうんです
個人のバラツキ
−26.8 23.3 1.2 8.2 −5.8 0.0
合計
9/23
Aブロック準決勝で考える
チーム全体のバラツキ:変動
調子狂う… … ではどうすればいいんですか?
2乗です
プラス・マイナスをなくすために2乗するんです
マイナスを2乗するとプラスになるやろ
それを合計してやるんです
つまり
チームのバラツキ = 個人のバラツキ度 𝟐 の 合計
= 個人の得失点 −得失点のチーム平均 2 の 合計
となります
10/23
Aブロック準決勝で考える
チーム全体のバラツキと欠点
チームのバラツキ = 個人のバラツキ 2 の 合計
これを具体的に計算してみましょう
阿知賀女子の得失点のバラツキ = −26.8 2 + 23.3 2 + 1.2 2 + 8.2 2 + −5.8 2
= 1358.8
これならチームのバラツキといえますね
ただしこのバラツキには、まだ欠点が2つあります
個人のバラツキ
−26.8 23.3 1.2 8.2 −5.8 0.0
11/23
Aブロック準決勝で考える
バラツキの改良①:分散 人数が異なる集団との比較が可能に
欠点① チームの人数が違う場合に比較できません
今の例ですとバラツキの2乗の5人分を合計しています
これだと人数が異なる集団のバラツキは比較できません
団体戦チーム同士の比較なら問題ないですけど
各高校全体の戦力を比較するときには不便ですね
そこで次のよう人数で割って数が異なる集団同士でも比較できるようにします
改良したチームのバラツキ =個人のバラツキ度
𝟐の合計
チームの人数= 分散
これを分散とよびます
12/23
欠点② 2乗しているので単位が異なる
これがもう一つの問題です
今まで計算してきたバラツキは点数を2乗しているので
単位が 点2
です
これでは「何点くらいバラツイてる」のような直観的な比較ができません
それは少し不便ですね
でもそこまで気にすることでは…
気にすることです
例えばチーム内の胸囲のバラツキを測るときに
バラツキを cm2(面積)の単位で表したらどうなると思いますか?
阿知賀のおもち狂が黙っとらんでしょう
Aブロック準決勝で考える
バラツキの改良②:標準偏差 単位をあわせてイメージしやすく
13/23
たしかにそれは怖いですね…
単位の2乗を外したいなら
分散のルートとればいいんじゃないですか?
誠子ちゃん それアタリや
分散のルートをとってバラツキを次のように改良します
分散を改良したチームのバラツキ =個人のバラツキ度
𝟐の合計
チームの人数= 標準偏差
これが標準偏差です
一般にバラツキは標準偏差で表します
単位があわせてあるのでイメージしやすいですからね
Aブロック準決勝で考える
バラツキの改良②:標準偏差 単位をあわせてイメージしやすく
14/23
Aブロック準決勝で考える
分散と標準偏差
では分散と標準偏差を計算してみましょう
※個人のバラツキ度 =(個人の得失点-得失点のチーム平均)
分散 =個人のバラツキ度
2の合計
チームの人数=
−26.8 2+ 23.3 2+ 1.2 2+ 8.2 2+ −5.8 2
5= 273
標準偏差 =個人のバラツキ度
2の 合計
チームの人数=
−26.8 2+ 23.3 2+ 1.2 2+ 8.2 2+ −5.8 2
5=16
※小数点以下は四捨五入しています
個人のバラツキ
−26.8 23.3 1.2 8.2 −5.8
白糸台も同様に計算すると
分散=2200 標準偏差=51
たしかに阿知賀の方がバラツキが
小さいといえますね
15/23
Aブロック準決勝で考える
分散と標準偏差 阿知賀女子学院の強さはバラツキの少なさ
各校の分散と標準偏差をまとめてみました
阿知賀の標準偏差が最も小さく
得点力にバラツキが少ないチームということがわかります
得失点合計 分散 標準偏差
9 272 16
0 2200 51
-1 450 23
-7 977 34
白糸台の標準偏差
高すぎ…
16/23
どうでしょう
これでバラツキを測る統計的指標 分散と標準偏差 を理解できたでしょうか?
はい!具体的にわかりました!
でも、1つ疑問があります。
何でしょう?
分散と標準偏差はわかりましたが
さっきの式の読み方がわかりません
Aブロック準決勝で考える分散と標準偏差
分散と標準偏差の数式
n
xx
s
n
i
i
1
2
2
n
xx
s
n
i
i
1
2
分散 標準偏差
17/23
今までの説明を理解できている誠子ちゃんならカンタンのわかるはずやで
では説明していきましょう
まずこれまでに出てきた式と見比べてみましょう
分散 =個人のバラツキ度
2の 合計
チームの人数標準偏差 =
個人のバラツキ度2の合計
チームの人数
これとさっきの式を比べてみましょう
とても似てますね?
Aブロック準決勝で考える分散と標準偏差
分散と標準偏差の数学的表現
n
xx
s
n
i
i
1
2
2
n
xx
s
n
i
i
1
2
分散 標準偏差
18/23
ところで個人のバラツキ度は次のように決めていました
個人のバラツキ度 =(個人の得失点-得失点のチーム平均)
これを当てはめて見比べてみましょう
分散 =個人の得失点-得失点のチーム平均
2の合計
チームの人数標準偏差 =
個人の得失点-得失点のチーム平均2の合計
チームの人数
だんだん同じ式に見えてきたでしょうか
Aブロック準決勝で考える分散と標準偏差
分散と標準偏差の数学的表現
n
xx
s
n
i
i
1
2
2
n
xx
s
n
i
i
1
2
分散 標準偏差
19/23
さらに色をつけてみました
分散 =個人の得失点-得失点のチーム平均
2の合計
チームの人数標準偏差 =
個人の得失点-得失点のチーム平均2の合計
チームの人数
共通点をみてみると
𝑛は チームの人数
𝑥𝑖 は 個人の得失点
𝑥 は チームの平均値
は チーム人数分の合計(n人分の足し算)
ということがわかりますね
Aブロック準決勝で考える分散と標準偏差
分散と標準偏差の数学的表現
n
xx
s
n
i
i
1
2
2
n
xx
s
n
i
i
1
2
分散 標準偏差
20/23
以上の理解で十分なのですが
せっかくなので最後に一般的な表現でまとめておきましょう
分散 =各データの値-データの平均値
2の総和
データの数標準偏差 =
各データの値-データの平均値2の総和
データの数
𝑛 は データの数
𝑥𝑖 は 各データの値
𝑥 はデータの平均値
は 総和(データ数分の合計)
一般的な
分散と標準偏差の数学的表現
n
xx
s
n
i
i
1
2
2
n
xx
s
n
i
i
1
2
分散 標準偏差
21/23
いかがでしょうか
今日はバラツキを測る統計的指標 として分散と標準偏差を学びました
①平均値からの差を個人のバラツキ度とし ← 偏差
②プラス・マイナスを打ち消すために2乗した合計をとり ← 変動
③人数が違っても比較できるように頭数で割り ← 分散
④そのルートをとって単位をそろえイメージしやすくしました ← 標準偏差
バラツキを示す指標としては標準偏差を用いるのが一般的です
また講義では説明しませんでしたが①と②も統計的指標として名前がついています
是非、統計の教科書等で確認してみてください
強力なエースがいない阿知賀女子の強さのカギは
得点力にバラツキがない(標準偏差が小さい)ことでした
全国優勝するためには失点を少なくする
または失点を上回るさらなる得点力が必要なりますね
今日のまとめ
22/23
小林立,” 咲-Saki- ” ,1-13巻,スクウェア・エニックス (2006-)
小林立,五十嵐あぐり,”咲-Saki-阿知賀編 episode of side-A” ,全6巻,スクウェア
・エニックス (2011-2013)
アニメ:咲-Saki- 阿知賀編 episode of side-A
-Saki-で東進CM, http://www.nicovideo.jp/watch/sm21265938
(Sakiスクールのロゴお借りしました)
皆さまありがとうございます
ごめんなさい…
※修正等ごさいましたらtwitter @matanoseiko までお願いいたします
問題ございましたら削除いたします
参考文献
23/23
top related