統計の基礎&62013/08/01 · 1 統計の基礎&6' r検定&対応のある母集団'...
TRANSCRIPT
2013/12/26
1
統計の基礎(6)
t 検定(対応のある母集団)
東北大学 微生物学 三村敬司
平成25年12月26日
平成25年度AIRIS
A中学校1年1組の男女の身長に有意差があるか、t検定で検証しよう。
番号 身長M-1 137
M-2 144
M-3 149
M-4 136
M-5 142
M-6 156
M-7 150
M-8 138
M-9 146
M-10 157
M-11 160
M-12 153
M-13 149
M-14 142
M-15 147
M-16 135
番号 身長F-1 155
F-2 154
F-3 152
F-4 146
F-5 152
F-6 148
F-7 151
F-8 148
F-9 145
F-10 144
F-11 146
F-12 155
F-13 148
F-14 160
F-15 162
F-16 162
男子生徒 女子生徒
まずは、復習! エクセル表の復習から出題
2013/12/26
2
t検定のまとめ
1 帰無仮説をたてる
2 帰無仮説の否定である対立仮説をたてる
3 有意水準をきめる
4 得られた標本をつかって、指標t値を計算する
5 標本の数から自由度を計算する
6 t分布表から該当する自由度の限界値をみる
7 求めたt値が棄却域に入っているかを判定し、帰無仮説を棄却するか、採択するか決定する
8 結論をきめる
身長に男女差なし
身長に男女差あり
有意水準5%
分析ツールを使うと便利です
A群
2つの群のデータ比較の流れ
B群平均不偏分散標準偏差信頼区間
平均不偏分散標準偏差信頼区間
帰無仮説「両者に差はない」を立てる
確率的に帰無仮説が採択されるか、棄却されるかを検討
帰無仮説が採択された場合は、「意味がある差(有意差)はない。」
帰無仮説が棄却された場合は、対立仮説を採択し、「有意差がある」と結論
適当な指標であるtttt値値値値を計算し、その指標が起こる確率を計算
両群に統計学的に「意味がある(有意)差」があるかどうかを検討
t検定
2013/12/26
3
エクセル表の復習から出題
(平均の差)と(差の標準誤差)からt値を求める
2013/12/26
4
(平均の差)と(差の標準誤差)からt値を求める
=(B23+C23)/30.0
=B21-C21
(平均の差)と(差の標準誤差)からt値を求める
2013/12/26
5
(平均の差)と(差の標準誤差)からt値を求める
t分布表から確率95%、確率99%の値を読み取り、t値と比較する
2.042もしくは2.750
結果
• 男群と女群の差の95%信頼区間は、下限が
( )で、上限が( )であり( )ことが分かった。
• t検定では、今回検証したt値の絶対値は95%
の限界値よりも大きく、99%の限界値よりも小さいため、有意水準5%で有意差はあるが、有意水準1%では有意差を認めない。
‐10.41 ‐0.47
有意有意有意有意にににに男群男群男群男群がががが低身長低身長低身長低身長であるであるであるである
2013/12/26
6
3 2 1 0 1 2 3- - -
自由度30のt分布
2.042 2.750-2.750 -2.042
-2.24
ここまでの面積=2.5%(左右で5%)
ここまでの面積=0.5%(左右で1%)
エクセルのデータ分析機能を用いてt検定
2013/12/26
7
この項目を選択して、右のOKボタンをクリックする
2013/12/26
8
t値
t境界値(両側)
t境界値(両側) < t値 であるため、有意差あり。
P(T<=t)両側< 0.05であるため、有意差あり。
もしくは、
t値の絶対値が境界値以上となる確率
データ分析機能t検定
• A中学校1年1組の男女の身長には有意差が
あり、男性は優位に女性より身長が低い。(有意水準5%)
2013/12/26
9
対応のあるt検定
• では同じA中学校の1年1組の夏休み前の国
語のテストの点数と、夏休み後の国語のテストの点数の結果を題材に、t検定をおこなってみます。
A群
2つの群のデータ比較の流れ
B群平均不偏分散標準偏差信頼区間
平均不偏分散標準偏差信頼区間
帰無仮説「両者に差はない」を立てる
確率的に帰無仮説が採択されるか、棄却されるかを検討
帰無仮説が採択された場合は、「意味がある差(有意差)はない。」
帰無仮説が棄却された場合は、対立仮説を採択し、「有意差がある」と結論
適当な指標であるtttt値値値値を計算し、その指標が起こる確率を計算
両群に統計学的に「意味がある(有意)差」があるかどうかを検討
対応のあるt検定
2013/12/26
10
夏休み前後の国語の点数
学生番号 休み前の点数 休み明けの点数M-1 80 95M-2 70 70M-3 85 80M-4 75 80M-5 90 95M-6 85 70M-7 85 75M-8 75 80M-9 70 70M-10 80 75M-11 75 80M-12 85 85M-13 75 70M-14 80 75M-15 85 70M-16 80 75F-1 95 90F-2 80 75F-3 80 75F-4 80 75F-5 75 80F-6 75 65F-7 80 75F-8 85 80F-9 90 85F-10 85 80F-11 85 75F-12 85 70F-13 80 75F-14 75 70F-15 85 65F-16 75 65
(平均の差)と(差の標準誤差)からt値を求める
データの数、平均、不偏分散、標準誤差を求める
2013/12/26
11
検定統計量t値
=(平均の差)/(差の標準誤差)
(差の標準誤差)=差の不偏分散
データの数
=
このとき、
差の分散
自由度
(平均の差)と(差の標準誤差)からt値を求める
2013/12/26
12
今回、5%有意水準でのt値は2.04で、観察されたt値である3.46のほうが大きい。つまり、帰無仮説(休み前後で点数に差は無い)が発生する確率は5%未満であり、休みの前後での点数には有意差を認める。
エクセルのデータ分析機能を用いてt検定
2013/12/26
13
今回はココを選択する!!
2013/12/26
14
今回、5%有意水準でのt値は2.04で、観察されたt値である3.46のほうが大きいつまり、帰無仮説(休み前後で点数に差は無い)が発生する確率は5%未満であり休みの前後での点数には有意差を認める。
またまたまたまたはははは
P((((T<=t)<=t)<=t)<=t)両側両側両側両側のののの値値値値は5は5は5は5%%%%有意有意有意有意
水準水準水準水準でのでのでのでの両側確率両側確率両側確率両側確率であるであるであるである。。。。これこれこれこれがががが今回今回今回今回はははは0.0016でありでありでありであり、、、、0.05よよよよ
りりりり小小小小さいさいさいさいためためためため、、、、休休休休みのみのみのみの前後前後前後前後でのでのでのでの点数点数点数点数にはにはにはには有意差有意差有意差有意差をををを認認認認めるめるめるめる。。。。