2017年度 夏季統計ゼミ 08.24
TRANSCRIPT
2017年度夏季統計ゼミ
内野 駿介[email protected]
はじめに
○ ちょっとだけ自己紹介
・ A09-0802
・ M13-1503
・ 東京都小学校教員
・ 専門研究員(「コア・カリキュラム」)
・ R17-4001 小学校・大学で非常勤講師/専門研究員(NGE)
はじめに
○ 統計ゼミのねらい
・それぞれの統計的手法(分析方法)の意味がなんとなくわかる
・それぞれの統計的手法(分析方法)の操作方法がある程度わかる
(テキストを見返したら操作できるレベル)
○ ゼミの進め方
・内野がひたすらしゃべるパート
・みんなで空欄を埋めていくパート
・演習問題(グループでのPC操作)
1.外国語教育研究の在り方と「統計」の位置づけ
○ 学術研究の種類
種類 アプローチ 研究を行う目的 探索/検証
文献
研究 1.先行研究を整理し内容を検討する
実証
研究
質的研究
2.文脈を考慮して事象を捉える 探索型
3.文脈を考慮して参加者の変容を捉える
4.参加者の経験や認識を捉える
5.先行研究の対象外の事象を明らかにする
6.研究の信憑性を高める
量的研究
7.事象の特徴や傾向を量的に記述する
8.事象の関連性を明らかにする
9.事象の差異や因果関係を捉える 検証型
(浦野他, 2017, p.8, 表1.1; 一部改編)
1.外国語教育研究の在り方と「統計」の位置づけ
○ データの収集法による分類
・ 事例研究
例: 授業のICT化の効果を明らかにするために、生徒が1人1台タブレット PCを持っている学校の英語の授業を3ヶ月間参観し、記録しました。
・ 調査研究
例: 語彙サイズと文法処理速度の関係が知りたいので、たくさんの大学生 に語彙サイズテストとSPSTを受けてもらいました。
・ 実験研究
例: 高校生がどのくらい速読をしたらwpmが向上するのかを明らかにする ため、実験群と統制群を設けて指導中のwpmの変化をそれぞれ測定 しました。
○ 外国語教育研究における論文の基本的な構成
(1) Introduction
(2) Background
(3) Research Design
(4) Result
(5) Discussion
(6) Conclusion
2.「統計」の基本的な考え方
渋谷さん
「統計を使うのはデータ分析の時だから、分析方法はあとから考えればいいや。」
分析方法によって必要なデータの種類が異なる
(=取ったデータの種類によって使える分析が異なる)
⇒データ収集の前に分析方法まで考えておく必要がある
データを取る前
データを取った後
←統計を使うのはココ
2.「統計」の基本的な考え方
母集団標本標本の抽出
標本の様子から母集団の様子を推測
<例>
高校1年生の速読力が知りたいので、附属高校の1年生100名に調査を行いました。
附属高校の1年生
(全国の)高校1年生
「母集団」の様子が知りたいのだが、母集団全体からデータを取るのは不可能
⇒「標本」のデータから母集団の様子を「推測」する
(佐藤, 2016, p.2,より; 一部改編)
2.「統計」の基本的な考え方
<例>
高校1年生の速読力が知りたいので、附属高校の1年生100名に調査を行いました。
Q: 「附属高校の1年生100人の読解速度は、平均125wpmでした。したがって、高校1年生の読解速度は平均して125wpmです。」本当ですか?
平均125wpmは記述統計量(「標本」の様子)。
母平均を明らかにするには推測統計を行わなくてはならない。
標本の抽出に偏りがあったかもしれない(「たまたま」125wpmだったのかも…)
○ 「ヒストグラム」と「棒グラフ」
3.基本統計量 ―記述統計①―
「ヒストグラム」
「棒グラフ」
「間隔・比例」尺度のデータに用いる
「名義・順序」尺度のデータに用いる
Q: A組からD組までの中間テストの点数一覧です。
大崎先生「平均点が全て同じだから、4クラスとも同程度の学力だね。」
本当ですか??
3.基本統計量 ―記述統計①―
Q: A組からD組までの中間テストの点数一覧です。
大崎先生「平均点が全て同じだから、4クラスとも同程度の学力だね。」
本当ですか??
3.基本統計量 ―記述統計①―
10
1
0
2
4
6
8
10
12
0- 10- 20- 30- 40- 50- 60- 70- 80- 90- 100
人数
得点
A組
1
10
0
2
4
6
8
10
12
0- 10- 20- 30- 40- 50- 60- 70- 80- 90- 100
人数
得点
B組
Mdn=45 Mdn=54「外れ値(outlier)」
Q: A組からD組までの中間テストの点数一覧です。
大崎先生「平均点が全て同じだから、4クラスとも同程度の学力だね。」
本当ですか??
3.基本統計量 ―記述統計①―
21
2 21 1
2
0
2
4
6
8
10
12
0- 10- 20- 30- 40- 50- 60- 70- 80- 90- 100
人数
得点
C組
1
4 4
2
0
2
4
6
8
10
12
0- 10- 20- 30- 40- 50- 60- 70- 80- 90- 100
人数
得点
D組
SD=30.68 SD=8.70「ばらつき」が異
なる「平均値」以外の確認するこ
と!!
演習問題①
① まず、raw dataを見てみる
② 「基本統計量」と「ヒストグラム」を出す
⇒ 結果を見て、 「3人の先生たちの意見に賛同できるか」をディスカッションして ください
⇒ 3人の先生たちに賛同できるかどうか、それぞれ○・△・×で答えてください。
演習問題① 補足
○ 「勝るとも劣らない」問題
推薦のほうが「ばらつき」が大きい
○ 内部進学>一般・推薦と本当に言えるのか?
演習問題① 補足
○ 習熟度別指導をしたいなら、単純に実力テストの得点でクラス分けすれば良い。
4
7
10
15 15
11
9
12
7
0
2
4
6
8
10
12
14
16
0- 10- 20- 30- 40- 50- 60- 70- 80- 90- 100
一般
内部
推薦
N=90
M=56.84
SD=22.17
30人ずつ上位・中位・下位に分ける
平均値+1SD以上を上位群、平均値-1SD未満を下位群とする
4.尺度
Q: 「中学校3年生100人に対し、持っている英検の級についてアンケートを取りまし た。準1級・準2級をそれぞれ『1.5』『2.5』、持っていない場合を『6』として基本統 計量を算出したところ、平均値は3.8でした。よって、中学3年生は平均して英検4級+α程度の英語力を持っています。」 本当ですか??
「尺度」によって計算して良い基本統計量や行って良い分析が異なる。
英検の級は「順序尺度」なので、平均値を計算してはいけない。
4.尺度
○ 尺度: データがどのような性質を持っているかを表すもの。
3つの基準を満たしているかによって尺度が決まる。
基準①
値が大小関係を表すか
1<2, A<Bのような関係があるか
基準②
値が等間隔か
1と2, 2と3の間が同じ間隔か
基準③
ゼロが固定か
0は存在が「無」であることを
意味するか
情報量
○ ○ ○ 多い
○ ○ ×
○ × ×(○)
× × × 少ない(佐藤, 2016, p.8,より; 一部改編)
比例尺度
間隔尺度
順序尺度
名義尺度
5.正規性・標準化
○ 正規分布: 左右対称で、中央に山が1つあり、両すそがなだらかに広がった分布 =歪度が0 =尖度が0
1SD
34.1% 13.6% 2.1% 0.1%
☆ 十分に大きい母集団を仮定していれば、母集団は正規分布していると考えてよい
☆ 十分に大きい母集団からランダムサンプリングをすれば、標本の分布は正規分布に近づく(中心
極限定理)
サンプルサイズが極端に小さい場合は正規性に注意!
5.正規性・標準化
○ 正規分布: 左右対称で、中央に山が1つあり、両すそがなだらかに広がった分布 =歪度が0 =尖度が0
1SD
34.1% 13.6% 2.1% 0.1%
☆ 十分に大きい母集団を仮定していれば、母集団は正規分布していると考えてよい
☆ 十分に大きい母集団からランダムサンプリングをすれば、標本の分布は正規分布に近づく(中心
極限定理)
サンプルサイズが極端に小さい場合は正規性に注意!
高山(2017):学生が発音した英単語を英語母語話者/非母語話者が聞き取る際に、発音時
の 「リズムパターンの有無」と評価者が「母語話者かどうか」で聞き取れる度に差があるか。
単語数が24個と少なく正規性が確認できなかったため、中央値の差の検定で比較
5.正規性・標準化
○ 標準正規分布:平均値を0、標準偏差を1に変換した正規分布
この分布になるように変換した得点のことをz得点と呼ぶ
1SD
34.1% 13.6% 2.1% 0.1%
データを標準化することで可能になること
異なるテストの結果の比較 分布中の個人の位置の相対的な把握 データの散らばり具合を考慮したレベル分け
0 1 32-3 -2 -1
平均値から「SDいくつ
分」「どちらに」離れているか
6.相関 ―記述統計②―
○ 相関(correlation):2つの変数(データ/得点)の間の関係の強さのこと
ピアソンの積率相関係数(r):
2つの量的変数の直線的関係の強さを数値で表したもの
-1 ≦ r ≦ 1 の値を取る 絶対値が大きいほど関係が強い
演習問題②
① まず、raw dataを見てみる
② 「相関係数」と「プロット」を出す(時間があれば「基本統計量」と「ヒストグラム」も)
⇒ 結果を見て、 八丁畷さんの仮説が正しいかをディスカッションしてください
⇒ それぞれの仮説に賛同できるかどうか、○・△・×で答えてください。
演習問題② 補足
① まず、raw dataを見てみる
② 「相関係数」と「プロット」を出す(時間があれば「基本統計量」と「ヒストグラム」も)
⇒ 結果を見て、 八丁畷さんの仮説が正しいかをディスカッションしてください
⇒ それぞれの仮説に賛同できるかどうか、○・△・×で答えてください。
語彙力と音読速度:「大学生よりも高校生のほうが関係が強いか?」
大学生:r=.481 高校生: r=.531
「語彙力は音読の正確性に影響しているか」
相関係数は r=.491 (中程度の正の相関)
演習問題② 補足
○ 相関係数の解釈における注意点
①相関関係は関係の強さを表すものなので、変数間の因果関係はわからない
相関係数の値から変数同士の関係性を解釈するのは研究者次第
「語彙力が音読速度/正確性に影響している」と言えるか??
偏相関の可能性(第3の変数)
例: ワーキングメモリの大きさが「語彙力」と「音読速度」にそれぞれ影響 しており、「語彙力」と「音読速度」の間には因果関係はない
演習問題② 補足
○ 相関係数の解釈における注意点
②相関係数は直線的関係の強さを表すものなので、曲線的関係についてはなにも わからない
③相関係数は外れ値の影響を受けやすい
0
10
20
30
40
50
60
70
80
90
100
0 50 100 150 200
音読正確さ
音読速度
N=30
r=.104
演習問題② 補足
○ 相関係数の解釈における注意点
②相関係数は直線的関係の強さを表すものなので、曲線的関係についてはなにも わからない
③相関係数は外れ値の影響を受けやすい
0
10
20
30
40
50
60
70
80
90
100
0 50 100 150 200
音読正確さ
音読速度
115
N=30
r=.104
外れ値含:r=.100
外れ値除:r=.580
外れ値含:r=-
.011
外れ値除:r=.-
837
プロットを必ず確認!外れ値→順位相関係数を計算すると数値が大きくなるこ
とも
演習問題② 補足
○ 相関係数の解釈における注意点
④相関係数は標本の大きさの影響を受けやすい
N=2の場合、必ずr=1かr=-1になる
だからといってたくさんデータを取ればいいわけではない
有意性の解釈は特に慎重に(有意確率よりもrの値を重視)
⑤相関係数は順序尺度である
数値の大小は、関係の強さの大小を表す
r=.20とr=.40では、後者の方が関係が強い。ただし、関係の強さが2倍であるとは言えない
演習問題② 補足
○ 相関係数の解釈における注意点
⑥部分相関・分割相関
データの一部分が全体とは異なる傾向を示しているケース
⑦切断効果・選抜効果
本来知りたいことの一部のデータしか分析できないケース
0
10
20
30
40
50
60
70
80
90
100
0 20 40 60 80 100 120
音読正確さ
語彙力
N=30
r=.491
下位2/3
N=20
r=.-032
上位1/3
N=10
r=.827
演習問題② 補足
○ 決定係数(𝑟2)
相関係数(r)の値を二乗した数値
p.8の例題では、𝑟2=0.487×0.487=0.237
「音読速度の変動の23.7%を語彙力の変動で説明できる」(もしくは逆)
=音読速度が変化した理由の23.7%は語彙力の変化である
𝑟2は比例尺度。𝑟2=.04と𝑟2=.16では後者のほうが4倍説明力が高いと言える
7.推測統計の考え方
Q: 「演習問題①(p.5)で一般入試・推薦入試・内部進学で中央高校に入学した生徒の実力テストの平均点はそれぞれ次のとおりでした[一般:55.0、推薦:55.5、 内部:60.0]。したがって、一般的な高校生の英語力は『内部進学の生徒>推薦 入試で入
学し た生徒>一般入試で入学した生徒』だと言えます。」 本当ですか??
55.055.5
60.0
52
53
54
55
56
57
58
59
60
61
一般 推薦 内部
平均点
データを取ったのは中央高校の生徒のみ
「一般と推薦の平均点の差」(0.5点)と 「推薦と内部の平均点の差」(4.5
点)は それぞれ本当に意味のある差なのか? 直感的には…
7.推測統計の考え方
母集団標本標本の抽出
標本の様子から母集団の様子を推測
○ 推測統計の目的:標本の様子から母集団の様子を推測すること
中央高校の生徒
一般的な高校生
◎ 推測統計は、基本的に差を見る検定か関係を見る検定のどちらか
(佐藤, 2016, p.2,より; 一部改編)
推測統計
7.推測統計の考え方
○ 推測統計の仕組み
例:一般入試で入学した生徒と推薦入試で入学した生徒の英語力に差があるか
①帰無仮説(𝐻0)と対立仮説(𝐻1)を立てる
𝐻0:一般入学の生徒と推薦入学の生徒で英語力に差がない
𝐻1:一般入学の生徒と推薦入学の生徒で英語力に差がある
②検定を行う
帰無仮説が正しいと仮定した場合に、今回のようなデータが得られる確率を 計算する。この確率のことを有意確率(p)と呼ぶ。
母集団の平均値には差がないのに、標本の平均値に0.5点の差が生まれる確率はどのくらいか??
どちらかは必ず正
7.推測統計の考え方
○ 推測統計の仕組み
例:一般入試で入学した生徒と推薦入試で入学した生徒の英語力に差があるか
③仮説の検証を行う今回のようなデータが得られる確率が高い(80%)→仮説は正しいと考えるのが妥当
今回のようなデータが得られる確率が低い(1%)→珍しいことが起こっている! →仮説は間違っていると考えるのが
妥当
外国語教育研究では通例、5%を下回ったら仮説は間違っていると判断する。
この確率のことを有意水準(α)という。
7.推測統計の考え方
○ 推測統計の仕組み
例:一般入試で入学した生徒と推薦入試で入学した生徒の英語力に差があるか
p<αの場合 ⇒ 「珍しいことが起こっている」
⇒帰無仮説を棄却し、対立仮説を採択する
⇒母集団において差がある (「有意差」がある)
p>αの場合 ⇒ 「珍しいことは起こっていない」
⇒帰無仮説を採択する
⇒母集団において差がない
今回のようなデータが得られる確率(p)は
93.1%有意水準(α)よりも大
きいので、帰無仮説を採択
演習問題③
【A】 下線部のデータは何尺度とするのが適切でしょうか。
【B】 空欄を埋めて推測統計の結果を確認してください。
演習問題③ 解答
【A】
①自分の体温(℃):間隔尺度 その日の歩数:比例尺度
②留学の前後:名義尺度 TOEFLの点数:間隔尺度
③英検の級:順序尺度 TOEICの点数:間隔尺度
④その日の飲酒量:比例尺度 発話語数:比例尺度
⑤小学校英語を受けたかどうか:名義尺度 小学校英語への賛否:名義尺度
演習問題③ 解答
【B】𝐻0:留学の前後TOEFLの点数の平均値に差がない
𝐻1:留学の前後TOEFLの点数の平均値に差がある
○ 推測統計を行った結果、「p=.045」という結果でした。
これは、帰無仮説が正しいと仮定した時に今回のようなデータが得られる確率が 4.5%であることを意味しています。
○ このpのことを有意確率と呼びます。
pの値は有意水準よりも低いので、帰無仮説を棄却して対立仮説を採択します。
○ 留学前のTOEFLの平均点は535点で、留学後のTOEFLの平均点は709点でした。したがって、留学の前後でTOEFLの平均点には有意な差があり、留学
前と比 べて留学後のTOEFLの点数は上昇しているといえます。
もしも留学前のTOEFLの平均点が709点で留学後のTOEFLの平均点が535点だった場合、留学の前後でTOEFLの得点は有意に下落したことになりま
8.差を見る推測統計の考え方
○ 差を見る推測統計(検定)の種類
差独立変数の数
独立変数の水準
対応の有無
代表的な分析
平均値
1つ
2つあり 対応ありのt検定(※)
なし 対応なしのt検定(※)
3つ以上あり 繰り返しありの一元配置分散分析(※)
なし 繰り返しなしの一元配置分散分析(※)
2つ以上各2つ以上
ありなし
二元配置分散分析(※)多元配置分散分析(※)
中央値 1つ
2つあり ウィルコクスンの符号付順位検定
なし マン=ホイットニーのU検定
3つ以上あり フリードマンの検定
なし クラスカル=ウォリスのH検定
分散 (略) (略) (略) F検定、Leveneの検定
比率 (略) (略)あり コクランのQ検定、マクネマー検定
なし カイ二乗検定
※正規性が保証されない場合には使えない。中央値の差の検定等に切り替えること。
(佐藤, 2016, p.11,より; 一部改編)
8.差を見る推測統計の考え方
○ 差を見る推測統計(検定)の種類
差独立変数の数
独立変数の水準
対応の有無
代表的な分析
平均値
1つ
2つあり 対応ありのt検定(※)
なし 対応なしのt検定(※)
3つ以上あり 繰り返しありの一元配置分散分析(※)
なし 繰り返しなしの一元配置分散分析(※)
2つ以上各2つ以上
ありなし
二元配置分散分析(※)多元配置分散分析(※)
中央値 1つ
2つあり ウィルコクスンの符号付順位検定
なし マン=ホイットニーのU検定
3つ以上あり フリードマンの検定
なし クラスカル=ウォリスのH検定
分散 (略) (略) (略) F検定、Leveneの検定
比率 (略) (略)あり コクランのQ検定、マクネマー検定
なし カイ二乗検定
※正規性が保証されない場合には使えない。中央値の差の検定等に切り替えること。
(佐藤, 2016, p.11,より; 一部改編)
【A】空欄を埋めましょう。
①推測統計ではまず[ ](𝐻0)と[ ](𝐻1)を立てる。𝐻0は差・関係 が[ ]という仮説、𝐻1は差・関係が[ ]という仮説である。
②帰無仮説が正しいと仮定した場合に標本のようなデータが得られる確率を[ ( )]という。この確率が[ ( )]より
も小さければ、帰無仮説を [ ]して対立仮説を[ ]する。つまり、差や関係が[ ]という結果になる。
③反対に有意確率が有意水準よりも大きければ、帰無仮説を[ ]する。つまり、差や関係が[ ]という結果になる。外国語教育研究では、通例有意水準を[ ]%に設定する。
④推測統計の結果、母集団において差があることを[ ]な差があると
復習問題①
【A】空欄を埋めましょう。
①推測統計ではまず[帰無仮説](𝐻0)と[対立仮説](𝐻1)を立てる。𝐻0は差・関係 が[ない]という仮説、𝐻1は差・関係が[ある]という仮説である。
②帰無仮説が正しいと仮定した場合に標本のようなデータが得られる確率を[ ( )]という。この確率が[ ( )]より
も小さければ、帰無仮説を [ ]して対立仮説を[ ]する。つまり、差や関係が[ ]という結果になる。
③反対に有意確率が有意水準よりも大きければ、帰無仮説を[ ]する。つまり、差や関係が[ ]という結果になる。外国語教育研究では、通例有意水準を[ ]%に設定する。
④推測統計の結果、母集団において差があることを[ ]な差があるという。
復習問題①
【A】空欄を埋めましょう。
①推測統計ではまず[帰無仮説](𝐻0)と[対立仮説](𝐻1)を立てる。𝐻0は差・関係 が[ない]という仮説、𝐻1は差・関係が[ある]という仮説である。
②帰無仮説が正しいと仮定した場合に標本のようなデータが得られる確率を[有意確率(p)]という。この確率が[有意水準(α)]よりも小さけれ
ば、帰無仮説を[棄却]して対立仮説を[採択]する。つまり、差や関係が[ある]という結果になる。
③反対に有意確率が有意水準よりも大きければ、帰無仮説を[ ]する。つまり、差や関係が[ ]という結果になる。外国語教育研究では、通例有意水準を[ ]%に設定する。
④推測統計の結果、母集団において差があることを[ ]な差があると
復習問題①
【A】空欄を埋めましょう。
①推測統計ではまず[帰無仮説](𝐻0)と[対立仮説](𝐻1)を立てる。𝐻0は差・関係 が[ない]という仮説、𝐻1は差・関係が[ある]という仮説である。
②帰無仮説が正しいと仮定した場合に標本のようなデータが得られる確率を[有意確率(p)]という。この確率が[有意水準(α)]よりも小さけれ
ば、帰無仮説を[棄却]して対立仮説を[採択]する。つまり、差や関係が[ある]という結果になる。
③反対に有意確率が有意水準よりも大きければ、帰無仮説を[採択]する。つまり、差や関係が[ない]という結果になる。外国語教育研究では、通例有意水準を[5]%に設定する。
④推測統計の結果、母集団において差があることを[ ]な差があるという。
復習問題①
【A】空欄を埋めましょう。
①推測統計ではまず[帰無仮説](𝐻0)と[対立仮説](𝐻1)を立てる。𝐻0は差・関係 が[ない]という仮説、𝐻1は差・関係が[ある]という仮説である。
②帰無仮説が正しいと仮定した場合に標本のようなデータが得られる確率を[有意確率(p)]という。この確率が[有意水準(α)]よりも小さけれ
ば、帰無仮説を[棄却]して対立仮説を[採択]する。つまり、差や関係が[ある]という結果になる。
③反対に有意確率が有意水準よりも大きければ、帰無仮説を[採択]する。つまり、差や関係が[ない]という結果になる。外国語教育研究では、通例有意水準を[5]%に設定する。
④推測統計の結果、母集団において差があることを[有意]な差があるという。
復習問題①
【B】「夏期講習の前後で実力テストの点数の平均値に差があるか」を明らかに するための推測統計の手順です。空欄を埋めましょう。
○ 帰無仮説、対立仮説はそれぞれ
帰無仮説[𝐻0]:夏期講習の前後で実力テストの点数の平均値に[ ]。
対立仮説[𝐻1]:夏期講習の前後で実力テストの点数の平均値に[ ]。
です。
○ 独立変数は[ ]つあり、[ ]です([ ]水準)。
従属変数は[ ]つあり、[ ]です。
同じ人のデータを比較しているので、対応[ ]の分析になります。
したがって、[ ]という分析方法を用います。
復習問題①
【B】「夏期講習の前後で実力テストの点数の平均値に差があるか」を明らかに するための推測統計の手順です。空欄を埋めましょう。
○ 帰無仮説、対立仮説はそれぞれ
帰無仮説[𝐻0]:夏期講習の前後で実力テストの点数の平均値に[差がない]。
対立仮説[𝐻1]:夏期講習の前後で実力テストの点数の平均値に[差がある]。
です。
○ 独立変数は[ ]つあり、[ ]です([ ]水準)。
従属変数は[ ]つあり、[ ]です。
同じ人のデータを比較しているので、対応[ ]の分析になります。
したがって、[ ]という分析方法を用います。
復習問題①
【B】「夏期講習の前後で実力テストの点数の平均値に差があるか」を明らかに するための推測統計の手順です。空欄を埋めましょう。
○ 帰無仮説、対立仮説はそれぞれ
帰無仮説[𝐻0]:夏期講習の前後で実力テストの点数の平均値に[差がない]。
対立仮説[𝐻1]:夏期講習の前後で実力テストの点数の平均値に[差がある]。
です。
○ 独立変数は[1]つあり、[テストの時期]です([2]水準)。
従属変数は[1]つあり、[実力テストの点数]です。
同じ人のデータを比較しているので、対応[あり]の分析になります。
したがって、[対応ありのt検定]という分析方法を用います。
復習問題①
【B】「夏期講習の前後で実力テストの点数の平均値に差があるか」を明らかに するための推測統計の手順です。空欄を埋めましょう。
○ 推測統計を行った結果、「p=.083」という結果でした。
これは、[ ]が正しいと仮定した時に今回のようなデータが得られる確率 が[ ]%であることを意味しています。
○ p値は有意水準よりも[ ]ので、[ ]を採択します。
つまり、有意な差は[ ]という結果になりました。
復習問題①
【B】「夏期講習の前後で実力テストの点数の平均値に差があるか」を明らかに するための推測統計の手順です。空欄を埋めましょう。
○ 推測統計を行った結果、「p=.083」という結果でした。
これは、[帰無仮説]が正しいと仮定した時に今回のようなデータが得られる確率が[8.3]%であることを意味しています。
○ p値は有意水準よりも[ ]ので、[ ]を採択します。
つまり、有意な差は[ ]という結果になりました。
復習問題①
【B】「夏期講習の前後で実力テストの点数の平均値に差があるか」を明らかに するための推測統計の手順です。空欄を埋めましょう。
○ 推測統計を行った結果、「p=.083」という結果でした。
これは、[帰無仮説]が正しいと仮定した時に今回のようなデータが得られる確率が[8.3]%であることを意味しています。
○ p値は有意水準よりも[大きい]ので、[帰無仮説]を採択します。
つまり、有意な差は[ない]という結果になりました。
復習問題①
復習問題① 補足
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
p=.03 p=.75
有意確率(p…
0.05
有意差あり
有意差なし
有意水準(α)
有意水準(α)よりも小さいので、
帰無仮説を棄却して対立仮説を採択する
Q: 総武大学4年生の八街さんは、小学生に対するフォニックスの指導の効果をテーマに卒業論文を執筆することにし、東金小学校の6年生30名に対してフォニックスの指導を行い、その前後で未習単語を発音するテストを行った(20語・20点満点)。
発音テストの結果から、フォニックスの指導は未習単語の読み上げに効果があっ たと言えるだろうか。
①「対応サンプルの検定」の表の『有意確率』が.05以下なら有意差あり。
9.対応ありのt検定― 「差」を見る推測統計①―
今回のようなデータが得られる確率(p)は0.1%よりも小
さい
有意差あり
演習問題④
① まず、raw dataを見て結果の予測を立てる
② SPSSで対応ありのt検定を行う
③ (時間があれば「相関係数」「プロット」「基本統計量」「ヒストグラム」を出す)
⇒ 結果を見て、 宝積寺さんの仮説が正しいかをディスカッションしてください
⇒ 宝積寺さんの仮説に賛同できるかどうか、○・△・×で答えてください。
演習問題④ 補足
① まず、raw dataを見て結果の予測を立てる
② SPSSで対応ありのt検定を行う
③ (時間があれば「相関係数」「プロット」「基本統計量」「ヒストグラム」を出す)
⇒ 結果を見て、 宝積寺さんの仮説が正しいかをディスカッションしてください
⇒ 宝積寺さんの仮説に賛同できるかどうか、○・△・×で答えてください。
フォニックス指導によって英単語を正しく書き取ることができるようになったか?
統計的には有意な差があった(プレ<ポスト)
演習問題④ 補足
0
2
4
6
8
10
12
14
0 2 4 6 8 10 12 14
ポスト
プレ
y=x
○ y=xの直線を引くと…
(2名を除いて)プレ≦ポストであることがわかる
プレの得点が低くても、ポストで上位の点数を取っている児童もいる
「対応あり」の分析の場合はプロットを確認しようなにかわかることがあるかも......
演習問題④ 補足
○ 論文への記載の仕方
プレテストとポストテストの得点の平均値を対応ありのt検定で比較したところ、 統計的に有意な差が認められた(t(29)=-6.360, p<.001)。
有意確率
t値
自由度(df)
Q: 身延大学の鰍沢さんは、自身の学習経験から「不規則動詞の過去形を覚えるには、1つ1つ現在形と 対応させて覚えるよりも多読を通してたくさんの過去形と出会うことが効果的だ」と考えている。この仮 説を検証するため、小海中学校の1年生の春期講習において1組に対しては不規則動詞表を用いた 指導を、2組に対しては多読の指導をそれぞれ3日間行った(人数は各30名ずつ)。
3日目の最後に行った事後テストの結果から、鰍沢さんの仮説は正しいと言えるだろうか。
①2標本の分散が等しくないとt検定はできない!
「独立サンプルの検定」の表の『等分散性のためのLeveneの検定』の部分を確認
10.対応なしのt検定― 「差」を見る推測統計②―
【Leveneの検定】
・ 帰無仮説(𝐻0):1組と2組でテストの分散に差がない
・ 対立仮説(𝐻1):1組と2組でテストの分散に差がある
「等分散=分散に差がない」ことなので、『有意確率』が.05よりも大きければ帰無仮説を採択して等分散であるとみなすことができる。
等分散性を仮定できる
Q: 身延大学の鰍沢さんは、自身の学習経験から「不規則動詞の過去形を覚えるには、1つ1つ現在形と 対応させて覚えるよりも多読を通してたくさんの過去形と出会うことが効果的だ」と考えている。この仮 説を検証するため、小海中学校の1年生の春期講習において1組に対しては不規則動詞表を用いた 指導を、2組に対しては多読の指導をそれぞれ3日間行った(人数は各30名ずつ)。
3日目の最後に行った事後テストの結果から、鰍沢さんの仮説は正しいと言えるだろうか。
②『2つの母平均の差の検定』の『有意確率(両側)』の数値を確認し、.05
以下なら有意差あり。
10.対応なしのt検定― 「差」を見る推測統計②―
等分散性を仮定できる
有意水準(α)よりも大きいので、
帰無仮説を採択する今回のようなデータが得られる確率(p)は
82.1%
有意差なし
演習問題⑤
① まず、raw dataを見て結果の予測を立てる
② SPSSで対応なしのt検定を行う
③ (時間があれば「基本統計量」「ヒストグラム」を出す)
⇒ 結果を見て、 広さんの研究結果についてディスカッションしてください
⇒ 「パラレルリーディングのほうが効果がある」
「シャドーイングのほうが効果がある」
「どちらともいえない」 で答えてください。
演習問題⑤ 補足
① まず、raw dataを見て結果の予測を立てる
② SPSSで対応なしのt検定を行う
③ (時間があれば「基本統計量」「ヒストグラム」を出す)
⇒ 結果を見て、 広さんの研究結果についてディスカッションしてください
⇒ 「パラレルリーディングのほうが効果がある」
「シャドーイングのほうが効果がある」
「どちらともいえない」 で答えてください。
パラレルリーディングとシャドーイングのどちらが効果があるか?
統計的に有意な差はなかった
演習問題⑤ 補足
○ 論文への記載の仕方
A組とB組の実力テストの得点の平均値を対応なしのt検定で比較したところ、 統計的に有意な差は認められなかった(t(53.331)=.980, p=.331)。
A組とB組の実力テストの得点の平均値を対応なしのt検定で比較したところ、 統計的に有意な差は認められなかった(t(53.331)=.980, ns)。
有意確率
t値
自由度(df)
not significant
11.繰り返しありの一元配置分散分析―「差」を見る推測統計③―
Q: 三次先生が勤務している芸備高校は進学校である。例年、三次先生は高校3年生の英語の授業では 大学入試対策として長文問題の読解を中心に指導を行ってきたが、迫りくる大学入試改革に向けて自身の指導法を転換する必要があると考えるようになった。そこで今年度は、技能統合的な活動の1つ としてディベートを授業に取り入れることにした。週3時間ある授業のうち2時間は従来の長文読解指 導を行い、残りの1時間でディベートを行う形式で1学期間授業を行った。5月・7月・8月に行われた実 力テストの結果から、ディベート活動は効果があったといえるだろうか。
①「Mauchlyの球面性検定」の表の『有意確率』の数値を確認。p>.05なら次へ。
p<.05の場合、『Greenhouse-Geisser』『Huynh-Feldt』『下限』の順に見ていき、 p>.05となるところをチェック
有意差なしならOK
① ② ③ ④
11.繰り返しありの一元配置分散分析―「差」を見る推測統計③―
②「被験者内効果の検定」の表で「テストの時期」の『有意確率』を確認。
p<.05ならば主効果あり。 Mauchlyの球面性検定でp>.05になったところを見る
11.繰り返しありの一元配置分散分析―「差」を見る推測統計③―
主効果があった場合にはどの水準の間に差があったかを確認する必要がある。
そのために多重比較を行う。
③「ペアごとの比較」の表で『有意確率』を確認。p<.05ならば有意差あり。
11.繰り返しありの一元配置分散分析―差を見る推測統計③―
③「ペアごとの比較」の表で『有意確率』を確認。p>.05ならば有意差あり。
p=.283
p<.001
p<.001
演習問題⑥
① まず、raw dataを見て結果の予測を立てる
② SPSSで繰り返しありの一元配置分散分析を行う
③ (時間があれば「相関係数」「プロット」「基本統計量」「ヒストグラム」を出す)
⇒ 結果を見て、 ディクトグロスの効果があったといえるかどうかついてディスカッ ションしてください
⇒ ディクトグロスの効果があったといえるかどうか、○・△・×で答えてください。
演習問題⑥ 補足
① まず、raw dataを見て結果の予測を立てる
② SPSSで繰り返しありの一元配置分散分析を行う
③ (時間があれば「相関係数」「プロット」「基本統計量」「ヒストグラム」を出す)
⇒ 結果を見て、 ディクトグロスの効果があったといえるかどうかついてディスカッ ションしてください
⇒ ディクトグロスの効果があったといえるかどうか、○・△・×で答えてください。
ディクトグロスの効果はあるか?
主効果があり、全てのテストの間で有意差があった
0
10
20
30
40
50
60
70
80
90
100
0 10 20 30 40 50 60 70 80 90 100
1月
9月
y=x
演習問題⑥ 補足
○ 3回のテストで全員の得点が純増していると言えるか?
0
10
20
30
40
50
60
70
80
90
100
0 10 20 30 40 50 60 70 80 90 100
11月
9月
y=x
0
10
20
30
40
50
60
70
80
90
100
0 10 20 30 40 50 60 70 80 90 100
1月
11月
y=x
演習問題⑥ 補足
○ 3回のテストで全員の得点が純増していると言えるか?
ns
sig.
ns
sig.
群によって変動の仕方に違いがあることも。プロットなどで確認しよう!
○ 論文への記載の仕方
3回のテストの平均値を繰り返しありの一元配置分散分析によって比較したところテストの時期の主効果が認められた(F(1.676, 48.590)=21.013,
MSE=68.244, p<.001; Greenhouse-Geisserにより調整)。
Bonferroni法による多重比較の結果、9月と11月(p=.013), 9月と1月(p<.001)
11月と1月(p=.002)のテスト結果の間にそれぞれ有意差が認められた。
☆ 他に、「分散分析表」という形で結果を載せる方法もある。
有意確率F値
要因の自由度 誤差の自由度
誤差の平均平方
演習問題⑥ 補足
12.繰り返しなしの一元配置分散分析―「差」を見る推測統計④―
Q: 日高大学の新冠先生、石勝大学の占冠先生、宗谷大学の音威子府先生は共同研究のチームを組ん でおり、研究テーマは「外国語活動の授業で使える英語力の向上」である。昨年度の前期は、学生の発音能力の向上に関する研究の一貫として、3人が各大学における『外国語活動・外国語科の指導』(非英語科対象、半期15コマ、自由選択)を担当し、それぞれ次のような指導を行った。 (指導内容は省略)
各講義の最終回(15回目)に行った発音テスト(20点満点)の得点から、どの指導法が最も効果的だっ たと言えるだろうか。
①等分散性が家庭できないとANOVAはできない!
「等分散性の検定」の表の『有意確率』を確認。p>.05なら等分散性が仮定できる。
主効果なしならOK
※等分散性が仮定できない場合…外れ値を検討/中央値の差の検定に切り替える☆ただし…
分散分析は正規性・等分散性に対する頑健性が高いので、等分散性をよほど 大きく逸脱していない限りはそのまま分析を進めてよい(という説もある)
12.繰り返しなしの一元配置分散分析―「差」を見る推測統計④―
②「分散分析」の表の『有意確率』の数値を確認。p<.05ならば主効果あり。
どこかに差がある
12.繰り返しなしの一元配置分散分析―「差」を見る推測統計④―
③「多重比較」の表の『有意確率』の数値を確認。
演習問題⑦
① まず、raw dataを見て結果の予測を立てる
② SPSSで繰り返しなしの一元配置分散分析を行う
③ (時間があれば「基本統計量」「ヒストグラム」を出す)
⇒ 結果を見て、 それぞれの指導法の効果についてディスカッションしてください
⇒ それぞれの指導法を効果があったと思う順に並べてください。
演習問題⑦ 補足
① まず、raw dataを見て結果の予測を立てる
② SPSSで繰り返しなしの一元配置分散分析を行う
③ (時間があれば「基本統計量」「ヒストグラム」を出す)
⇒ 結果を見て、 それぞれの指導法の効果についてディスカッションしてください
⇒ それぞれの指導法を効果があったと思う順に並べてください。
リキャストテストの得点に差はあるか?
主効果があり、「新冠クラス>占冠クラス」(それ以外は有意差なし)という 結果であった
演習問題⑦ 補足
○ 論文への記載の仕方
3クラスのリキャストテストの得点を繰り返しなしの一元配置分散分析で比較したところ、テスト得点の主効果が認められた( F(2, 87)=3.463,
MSE=23.740, p=.036 )
Tukey法による多重比較の結果、新冠クラスと占冠クラスの間に有意な差が認め られた(p=.029)が、新冠クラスと音威子府クラスの間(p=.223)、占冠クラスと音 威子府クラスの間(p=.625)には有意差がなかった。
☆ 他に、「分散分析表」という形で結果を載せる方法もある。
有意確率F値
要因(グループ間)の自由度
誤差(グループ内)
の平均平方
誤差(グループ内)の自由度
【A】「小学3年生・小学5年生・中学1年生の語彙サイズに差があるか」を明らかに するための推測統計の手順です。空欄を埋めましょう。
○ 帰無仮説、対立仮説はそれぞれ
帰無仮説[𝐻0]:3つの学年の語彙サイズには[ ]。
対立仮説[𝐻1]:3つの学年の語彙サイズには[ ]。
○ 独立変数は[ ]つあり、[ ]です([ ]水準)。
従属変数は[ ]つあり、[ ]です。
別の人のデータを比較しているので、繰り返し[ ]の分析になります。
したがって、[ ]という分析方法を用います。
復習問題②
【A】「小学3年生・小学5年生・中学1年生の語彙サイズに差があるか」を明らかに するための推測統計の手順です。空欄を埋めましょう。
○ 帰無仮説、対立仮説はそれぞれ
帰無仮説[𝐻0]:3つの学年の語彙サイズには[差がない]。
対立仮説[𝐻1]:3つの学年の語彙サイズには[どこかに差がある]。
○ 独立変数は[ ]つあり、[ ]です([ ]水準)。
従属変数は[ ]つあり、[ ]です。
別の人のデータを比較しているので、繰り返し[ ]の分析になります。
したがって、[ ]という分析方法を用います。
復習問題②
【A】「小学3年生・小学5年生・中学1年生の語彙サイズに差があるか」を明らかに するための推測統計の手順です。空欄を埋めましょう。
○ 帰無仮説、対立仮説はそれぞれ
帰無仮説[𝐻0]:3つの学年の語彙サイズには[差がない]。
対立仮説[𝐻1]:3つの学年の語彙サイズには[どこかに差がある]。
○ 独立変数は[1]つあり、[学年]です([3]水準)。
従属変数は[1]つあり、[語彙サイズ]です。
別の人のデータを比較しているので、繰り返し[なし]の分析になります。
したがって、[繰り返しなしの一元配置分散分析]という分析方法を用います。
復習問題②
【A】「小学3年生・小学5年生・中学1年生の語彙サイズに差があるか」を明らかに するための推測統計の手順です。空欄を埋めましょう。
○ 分析を行う前に[ ]が仮定できるかどうかを確認します。
[ ]の検定において有意確率が.05よりも[ ]ければ、分散分析を行ってよいです。
○ 推測統計を行った結果、「p=.003」という結果でした。
これは、[ ]が正しいと仮定した時に今回のようなデータが得られる確率 が[ ]%であることを意味しています。
p値は有意水準よりも[ ]ので、[ ]を採択します。つまり、[ ] があるという結果になりました。
復習問題②
【A】「小学3年生・小学5年生・中学1年生の語彙サイズに差があるか」を明らかに するための推測統計の手順です。空欄を埋めましょう。
○ 分析を行う前に[等分散性]が仮定できるかどうかを確認します。
[等分散性]の検定において有意確率が.05よりも[大き]ければ、分散分析を行ってよいです。
○ 推測統計を行った結果、「p=.003」という結果でした。
これは、[ ]が正しいと仮定した時に今回のようなデータが得られる確率 が[ ]%であることを意味しています。
p値は有意水準よりも[ ]ので、[ ]を採択します。つまり、[ ] があるという結果になりました。
復習問題②
【A】「小学3年生・小学5年生・中学1年生の語彙サイズに差があるか」を明らかに するための推測統計の手順です。空欄を埋めましょう。
○ 分析を行う前に[等分散性]が仮定できるかどうかを確認します。
[等分散性]の検定において有意確率が.05よりも[大き]ければ、分散分析を行ってよいです。
○ 推測統計を行った結果、「p=.003」という結果でした。
これは、[帰無仮説]が正しいと仮定した時に今回のようなデータが得られる確率が[0.3]%であることを意味しています。
p値は有意水準よりも[小さい]ので、[対立仮説]を採択します。つまり、[主効果]があるという結果になりました。
復習問題②
13.二元配置分散分析―「差」を見る推測統計⑤―
Q: 姫新大学の三日月講師は、サイレントポーズが学習者の聴解に与える影響について研究している。これまでの研究から、彼女は「サイレントポーズは学習者の聴解を手助けするが、特に習熟度の低い学習者に対して効果がある」という仮説を立てている。
(中略)結果から三日月講師の仮説は支持できるだろうか。
○ 独立変数: サイレントポーズの有無(2水準、繰り返しあり)
英語力 (2水準、繰り返しなし)
従属変数: フリーリコールテストの得点
☆ 二元配置の場合、確認すべきポイントは3つ!
①ポーズの有無によって点数に差が見られるか? →ポーズの主効果
②協力者の英語力によって点数に差が見られるか? →英語力の主効果
③「ポーズの有無」という独立変数が「点数」という従属変数に与える影響の 大きさ・方向は、「英語力」という別の独立変数によって影響されているか? (あるいはその逆) →
交互作用
13.二元配置分散分析―「差」を見る推測統計⑤―
①「Mauchlyの球面性検定」の表を確認。『有意確率』『Greenhouse-
Geisser』 『Huynh-Feldt』『下限』のどこでp>.05になるかを確認する。
繰り返しあり要因(ポーズの有無)が2水準だとこうなります。次表では「球面性の仮定」の欄を見ましょう。
13.二元配置分散分析―「差」を見る推測統計⑤―
②「被験者内効果の検定」の表を確認。
「ポーズ(対応あり要因)の主効果」(A欄)と「交互作用」(B欄)が有意であるかを 確認する。
A
B
13.二元配置分散分析―「差」を見る推測統計⑤―
③「被験者間効果の検定」の表を確認。
「英語力(対応なし要因)の主効果」が有意であるかを確認する。
☆ 対応あり要因/対応なし要因のそれぞれに主効果が認められた場合…
3水準以上なら多重比較の結果を見てどこに差があるかを確認
今回は両方とも2水準なのでナシ
13.二元配置分散分析―「差」を見る推測統計⑤―
☆ 有意な交互作用が認められた場合、独立変数同士がどこで特に強く作用しあって いるのかを確認する必要がある。これを単純主効果の検定という。
④「ペアごとの比較」の表(3, 4つ目)を見て、単純主効果があるところを確認する。
ポーズ「なし」のとき、英語力「高低」の間でテスト得点に差がある
英語力「低」のとき、ポーズ「有無」の間でテスト得点に差がある
13.二元配置分散分析―「差」を見る推測統計⑤―
ポーズ「なし」のとき、英語力「高低」の間でテスト得点に差がある
英語力「低」のとき、ポーズ「有無」の間でテスト得点に差がある
p=.480
p<.001
p=.121
p=.003
交互作用と主効果が両方とも認められた場合、交互作用を優先して解釈する
演習問題⑧
① まず、raw dataを見て結果の予測を立てる
② SPSSで二元配置分散分析(混合計画)を行う
⇒ 結果を見て、 それぞれの指導法の効果についてディスカッションしてください
⇒ 「多読」と「語彙リスト」のどちらがより効果があると思うかを答えてください。
演習問題⑧ 補足
① まず、raw dataを見て結果の予測を立てる
② SPSSで二元配置分散分析(混合計画)を行う
⇒ 結果を見て、 それぞれの指導法の効果についてディスカッションしてください
⇒ 「多読」と「語彙リスト」のどちらがより効果があると思うかを答えてください。
それぞれのクラスの得点はどのように変化した?
交互作用あり
指導法(学校)の主効果あり(飯田<篠ノ井)
時期の主効果あり(プレ<一ヵ月後<三ヵ月後)
演習問題⑧ 補足
○ 天井効果の可能性
テストは20点満点。
もしももっと問題数が多かったら…
多読クラスはもっと伸びたかもしれない
??
演習問題⑧ 補足
○ 論文への記載の仕方
「テストの時期」及び「指導法」を独立変数としてテストの得点について二元配置分散分析を行ったところ有意な交互作用が認められ(F(1.613, 93.554)=37.228, MSE=4.742,
p<.001; Greenhouse-Geisserにより調整)、テストの時期の主効果(F(1.613,
93.554)=836.700, MSE=4.742, p<.001; Greenhouse-Geisserにより調整)及び指導法の主効果 (F(1, 58)=47.286, MSE=4.513, p<.001)がそれぞれ認められた。
Bonferroni法による単純主効果の検定の結果、語彙リストクラスにおいては全ての水準間で有意な差があり(いずれもp<.001)、多読クラスにおいてはプレと一月後及びプレと三月後の間でそれぞれ有意な差があった(いずれもp<.001)。
また、一月後のテストにおいて語彙リストクラスと多読クラスの間に有意な差があった(p<.001)。
さらに時期の主効果についてBonferroni法による多重比較を行ったところ、全ての水準間で有意な差が認められた(いずれもp<.001)。
復習問題③
○ 空欄を埋めて読んでください。
復習問題③
①健康診断シリーズ。身長は[ ]尺度、体重は[ ]尺度、座高は[ ] 尺度。尿酸値(mg/dl)は[ ]尺度だが、「痛風かどうか」は[ ]尺度である。
復習問題③
①健康診断シリーズ。身長は[比例]尺度、体重は[比例]尺度、座高は[比例] 尺度。尿酸値(mg/dl)は[比例]尺度だが、「痛風かどうか」は[名義]尺度である。
復習問題③
②学校シリーズ。出席番号は[ ]尺度、クラス名は[ ]尺度である。また、 性別は[ ]尺度、学年は[ ]尺度である。
復習問題③
②学校シリーズ。出席番号は[名義]尺度、クラス名は[名義]尺度で ある。また、 性別は[名義]尺度、学年は[順序]尺度である。
復習問題③
③所属する卒論ゼミによって卒論のページ数に差があるかを調べたい。卒論の指 導教員は[ ]尺度、ページ数は[ ]尺度である。
なお、現在までに読んだ先行研究の数は[ ]尺度である。
復習問題③
③所属する卒論ゼミによって卒論のページ数に差があるかを調べたい。卒論の指 導教員は[名義]尺度、ページ数は[比例]尺度である。
なお、現在までに読んだ先行研究の数は[比例]尺度である。
復習問題③
④所属する部活動と好きな飲み物の関係を調べたい。部活動は[ ]尺度、好きな飲み物は[ ]尺度である。
ちなみにスポーツ飲料の売り上げランキングは[ ]尺度である。
復習問題③
④所属する部活動と好きな飲み物の関係を調べたい。部活動は[名義]尺度、好きな飲み物は[名義]尺度である。
ちなみにスポーツ飲料の売り上げランキングは[順序]尺度である。
復習問題③
復習問題③
⑤利用年月日: 月/日はそれぞれ[ ]尺度。
午前・午後は[ ]尺度。
ご利用回数: (今回の測り方だと)[ ]尺度。
復習問題③
⑤利用年月日: 月/日はそれぞれ[名義]尺度。
午前・午後は[名義]尺度。
ご利用回数: (今回の測り方だと)[順序]尺度。(名義尺度扱いの方が無難かも)
復習問題③
⑥ご性別:[ ]尺度。
ご年齢:(今回の測り方だと)[ ]尺度。
復習問題③
⑥ご性別:[名義]尺度。
ご年齢:(今回の測り方だと)[順序]尺度。
復習問題③
⑦満足度:(今回の測り方だと) [ ]尺度。
復習問題③
⑦満足度:(今回の測り方だと) [順序]尺度。
復習問題③
⑧本日お召し上がりいただいた商品:[ ]尺度。
輝いていた従業員: [ ]尺度
復習問題③
⑧本日お召し上がりいただいた商品:[名義]尺度。
輝いていた従業員: [名義]尺度
復習問題③
⑨また利用したいと思いますか:(今回の測り方だと)[ ]尺度。
復習問題③
⑨また利用したいと思いますか:(今回の測り方だと)[名義]尺度。
選択肢に順序性があると言えるか??
復習問題③
⑩ピアソンはどれでしょう。
A DCB
復習問題③
⑩ピアソンはどれでしょう。
A DCB
Karl Pearson Nation I.S.PRod Ellis高山 芳樹
復習問題③
⑪ピアソンがやっていないことは次のうちどれでしょう。
A: 「ヒストグラム」という語を作った
B: 「積率相関係数」を考案した
C: 「カイ二乗検定」を考案した
D: ANOVAの多重比較法を考案した
復習問題③
⑪ピアソンがやっていないことは次のうちどれでしょう。
A: 「ヒストグラム」という語を作った
B: 「積率相関係数」を考案した
C: 「カイ二乗検定」を考案した
D: ANOVAの多重比較法を考案した
復習問題③
⑫ボンフェローニはどれでしょう。
A DCB
復習問題③
⑫ボンフェローニはどれでしょう。
A DCB
金谷 憲 門田 修平Carlo Emilio
Bonferroni
Stephen
Krashen
復習問題③
⑬ Bonferroniの仲間を全て選んでください。
A: Pearson
B: Tukey
C: Scheffe
D: Levene
復習問題③
⑬ Bonferroniの仲間を全て選んでください。
A: Pearson
B: Tukey
C: Scheffe
D: Levene
14.「関係」を見る推測統計の考え方
Q: p.8のピアソンの積率相関係数についていた「*」の意味は…??
☆ 「*」…母集団同士に有意な関係があることを意味する
ピアソンの積率相関係数自体は標本の様子を表す記述統計量だが、有意確率を計算することで推測統計としても用いることができる
「母集団における相関係数が0でない」ことを意味する
14.「関係」を見る推測統計の考え方
○ 関係を見る推測統計の種類
変数の数 変数の尺度 代表的な分析
2つ
間隔・比例尺度同士ピアソンの積率相関係数(※1)
単回帰分析(※1)
順序尺度同士スピアマンの順位相関係数(ρ)ケンドールの順位相関係数(τ)
名義尺度同士 カイ二乗検定
3つ以上 ― 【多変量解析】
※1:正規性が保証されない場合には使えない。順位相関係数を用いること。
(佐藤, 2016, p.11,より; 一部改編)
15.カイ二乗検定―「関係」を見る推測統計①―
【𝑥2検定でできること】
① 適合度検定 … 標本の分布は母集団の分布と同じか(母集団の分布が 既に分かっている場合)/標本は正規分布しているか
② 比率の差の検定 … 2つ(以上)の変数の比率に差があるか(対応なしの場合)
③ 独立性の検定 … 2つの変数の間に連関があるか(独立しているか)
15.カイ二乗検定―「関係」を見る推測統計①―
Q: 豊肥大学の4年生である水前寺さんは、教師の授業における活動の選択に影響を与えている要因が 知りたいと考えた。そこで水前寺さんは高等学校の「コミュニケーション英語Ⅰ」を担当している教員 400名を対象とし、ポストリーディング活動(本文の意味確認後に行う活動)として最もよく行う活動と、 生徒に最も身に付けてほしいと思う力についてアンケートを実施した。下表から、どのような傾向が見て取れるだろうか。(表略)
①「~のクロス表で」で各セルの『期待度数』を確認。期待度数が5未満のセルがある場合、カイ二乗検定は適さない
変数同士が独立(偏りがない)の場合に各セルに入るべき度数
15.カイ二乗検定―「関係」を見る推測統計①―
Q: 豊肥大学の4年生である水前寺さんは、教師の授業における活動の選択に影響を与えている要因が 知りたいと考えた。そこで水前寺さんは高等学校の「コミュニケーション英語Ⅰ」を担当している教員 400名を対象とし、ポストリーディング活動(本文の意味確認後に行う活動)として最もよく行う活動と、 生徒に最も身に付けてほしいと思う力についてアンケートを実施した。下表から、どのような傾向が見て取れるだろうか。(表略)
②「カイ二乗検定」の表で『Pearsonのカイ2乗』の欄の『漸近有意確率』を確認。
p<.05ならばどこかに有意な関係あり
15.カイ二乗検定―「関係」を見る推測統計①―
「どこかに関係がある」→どのセルにおいて特に連関が強いのか?
③ 2×2のクロス表ではない場合、残差分析を行う。
「~のクロス表」で各セルの『調整済み残差』を確認。絶対値が1.96以上のセルに有意な関係あり。
各セルの度数が予測よりも多い/少ない
演習問題⑨
① まず、raw dataを見て結果の予測を立てる
② SPSSでカイ二乗検定を行う
⇒ 結果を見て、 校種と賛否の関係についてディスカッションしてください
⇒ 校種と賛否に関係があると言えると思うか、○・△・×で答えてください。
演習問題⑨ 補足
① まず、raw dataを見て結果の予測を立てる
② SPSSでカイ二乗検定を行う
⇒ 結果を見て、 校種と賛否の関係についてディスカッションしてください
⇒ 校種と賛否に関係があると言えると思うか、○・△・×で答えてください。
校種と賛否には関係があるか?
カイ二乗検定の結果、有意な関係あり
残差分析の結果、 小学校教員は「賛成」が多い
中学校教員は「どちらでもない」が少ない
高校教員は「賛成」が少なく、「どちらでもない」が多い
演習問題⑨ 補足
○ 論文への記載の仕方
「教員の校種」及び「小学校英語教科化への賛否」を変数としてカイ二乗検定を 行ったところ、両者の間に有意な関係が認められた(𝒙𝟐(4,
N=400)=11.705, p=.020; V=.121)
残差分析の結果、「小学校教員」では「賛成」の人数が予想よりも多く、「中学校教 員」では「どちらでもない」の人数が予想よりも少なく、「高等学校教員」では「賛 成」の人数が予想よりも少なく、「どちらでもない」の人数が予想よりも多かった (5%水準)。
自由度 𝑥2値
標本の大きさ
効果量有意確率
演習問題⑩
○ センター試験の英語(筆記)の問題は、かみのやま教授の考える「よい試験」の 条件を満たしているでしょうか?
「よい試験」の条件
① 英語の語彙・文法に関する知識が総合的に測定できること
② 英語力の4技能の多くの側面を測定できること
③ 英語力の高い生徒から低い生徒まで、どんな生徒の英語力も正しく測定できること
④ 同じ英語力の生徒なら、どの年度の試験を受験しても同様の得点になること
⑤ 同じ英語力の生徒なら、本試験と追試験のどちらを受験しても同様の結果になること
①~⑤から1つ選び、センター試験がその条件を満たしているかを検討してください。分析方法はグループで話し合い、最適と思われるものを選択すること。
演習問題⑩
2016年1月 2016年4月 2017年1月 2017年4月
高校3年 大学1年 大学2年
・ 2016年度本
試
・ TOEIC(合
計)
・ 2017年度本
試
・ 2017年度追
試
・ 2016年度追試
・ TOEIC
(Reading)
・ TOEIC
(Listening)
・ SPST
・ SRテスト
・ 望月テスト
・ 英検の級◎ 何と何の関係を見ればよいのか?何と何の差を見ればよいのか?
演習問題⑩
○ 条件①~⑤から1つ選び、センター試験がその要素を満たしていると言えるかど うかを○・△・×で答えてください。
分析方法(何と何を比べたのか)・結果・考察を1分程度で発表してもらいます。
引用文献・参考文献
○ 研究の考え方・研究デザインの立て方
浦野研・亘理陽一・田中武夫・藤田卓郎・髙木亜希子・酒井英樹(2017).『はじめて の英語教育研究―押さえておきたいコツとポイント』東京:研究社.
竹内理・水本篤(2014).『外国語教育研究ハンドブック―研究手法のより良い理解 のために 改訂版』東京:松柏社.
○ SPSSの操作方法
岸学(2012).『SPSSによるやさしい統計学 第2版』東京:オーム社.
竹原卓真(2013).『SPSSのススメ〈1〉2要因の分散分析をすべてカバー増補改訂版』京都:北大路書房.
○ 論文の体裁・引用の仕方など
American Psychological Association (2010). "Publication manual of the
American Psychological Association. - 6th ed." Washington DC:
American Psychological Association.
16.統計的帰無仮説検定の限界と今後の展望
17.効果量
復習問題④
○ 空欄を埋めて読んでください。
復習問題④
① 統計(記述統計・推測統計)は、主として[ ]的アプローチの研究で 用いる。
復習問題④
① 統計(記述統計・推測統計)は、主として[量]的アプローチの研究で 用いる。
復習問題④
② データの分析方法は、データ収集の[ ]に考える。
復習問題④
② データの分析方法は、データ収集の[前]に考える。
復習問題④
③ 研究を通して明らかにしたい事象を持つ対象全体のことを[
]、 その研究で実際にデータを取る対象のことを[ ]という。
復習問題④
③ 研究を通して明らかにしたい事象を持つ対象全体のことを[母集 団]、 その研究で実際にデータを取る対象のことを[標本]という。
復習問題④
④ 母集団の様子を知るためには[ ]を、標本の様子を記述 するためには[ ]を用いる。
復習問題④
④ 母集団の様子を知るためには[推測統計]を、標本の様子を記述 するためには[記述統計]を用いる。
復習問題④
⑤ ある値(またはある範囲)に該当するデータの数を[ ]といい、 [ ]や[ ]を用いて報告する。
復習問題④
⑤ ある値(またはある範囲)に該当するデータの数を[度数]といい、 [ヒストグラム]や[棒グラフ]を用いて報告する。
復習問題④
⑥ ヒストグラムは[ ]尺度と[ ]尺度のデータ、
棒グラフは[ ]尺度と[ ]尺度のデータに対して用いる。
復習問題④
⑥ ヒストグラムは[間隔]尺度と[比例]尺度のデータ、
棒グラフは[名義]尺度と[順序]尺度のデータに対して用いる。
復習問題④
⑦ 平均値は[ ]尺度以上、中央値は[ ]尺度以上のデータで 計算してよい。
復習問題④
⑦ 平均値は[間隔]尺度以上、中央値は[順序]尺度以上のデータで 計算してよい。
復習問題④
⑧ 平均値は[ ]の影響を受けやすいので、中央値も合わせて 確認すべきである。
また間隔尺度以上のデータであれば、散布度として[ ]も 合わせて報告する必要がある。
復習問題④
⑧ 平均値は[外れ値]の影響を受けやすいので、中央値も合わせて 確認すべきである。
また間隔尺度以上のデータであれば、散布度として[標準偏差]も 合わせて報告する必要がある。
復習問題④
⑨ 尺度は、データがどのような性質を持っているかを表すものである。 [ ]尺度、[ ]尺度、[ ]尺度、[ ]尺度の順に情報 量が多い。
復習問題④
⑨ 尺度は、データがどのような性質を持っているかを表すものである。 [比例]尺度、[間隔]尺度、[順序]尺度、[名義]尺度の順に情報 量が多い。
復習問題④
⑩ 左右対称で、中央に山が1つあり、両すそがなだらかに広がった分 布のことを[ ]という。
復習問題④
⑩ 左右対称で、中央に山が1つあり、両すそがなだらかに広がった分 布のことを[正規分布]という。
復習問題④
⑪ 平均値が0、標準偏差が1になるように変換した正規分布のことを [ ]という。また、この分布になるように変換した得点 のことを[ ]という。
復習問題④
⑪ 平均値が0、標準偏差が1になるように変換した正規分布のことを [標準正規分布]という。また、この分布になるように変換した得点 のことを[z得点]という。
復習問題④
⑫ ピアソンの積率相関係数は2つの量的変数の[ ]の強さ を数値で表すもので、[ ]≦r≦[ ]の範囲の値を取る。
復習問題④
⑫ ピアソンの積率相関係数は2つの量的変数の[直線的関係]の強さ を数値で表すもので、[ -1]≦r≦[ 1 ]の範囲の値を取る。
復習問題④
⑬ 0<r≦1であれば[ ]の相関、-1≦r<0であれば[ ]の相関が あるという。r=0のときは[ ]である。
復習問題④
⑬ 0<r≦1であれば[正]の相関、-1≦r<0であれば[負]の相関が あるという。r=0のときは[無相関]である。
復習問題④
⑭ 相関係数(r)を二乗した𝑟2のことを[ ]という。
𝑟2は、変量Aの変動の何%を変量Bの変動で説明できるかを表す。
rは[ ]尺度、𝑟2は[ ]尺度である。
復習問題④
⑭ 相関係数(r)を二乗した𝑟2のことを[決定係数]という。
𝑟2は、変量Aの変動の何%を変量Bの変動で説明できるかを表す。
rは[順序]尺度、𝑟2は[比例]尺度である。
復習問題④
⑮ 推測統計ではまず[ ](𝐻0)と[ ](𝐻1)を立てる。
𝐻0は差・関係が[ ]という仮説、 𝐻1は差・関係が[ ]という仮説である。
復習問題④
⑮ 推測統計ではまず[帰無仮説](𝐻0)と[対立仮説](𝐻1)を立てる。
𝐻0は差・関係が[ない]という仮説、 𝐻1は差・関係が[ある]という 仮説である。
復習問題④
⑯ 帰無仮説が正しいと仮定した場合に標本のようなデータが得られる 確率を[ ( )]という。
この確率が[ ( )]よりも小さければ、帰無仮説を[ ]して対立仮説を[ ]する。つまり、差や関係が[ ]という結果 になる。
復習問題④
⑯ 帰無仮説が正しいと仮定した場合に標本のようなデータが得られる 確率を[有意確率(p)]という。
この確率が[有意水準(α)]よりも小さければ、帰無仮説を[棄却] して対立仮説を[採択]する。つまり、差や関係が[ある]という結果 になる。
復習問題④
⑰ 本当は差がないのに差があるという結果を出してしまうことを[ ]、本当は差があるのに差がないという結果を出して しまうことを[ ]という。
復習問題④
⑰ 本当は差がないのに差があるという結果を出してしまうことを [第1種の誤り]、本当は差があるのに差がないという結果を出して しまうことを[第2種の誤り]という。
復習問題④
⑱ ツッコミをいれてください。
復習問題④
⑱ ツッコミをいれてください。
温度(℃)は間隔尺度。「2倍である」とは言ってはいけない。
復習問題④
復習問題④
⑲ 何尺度でしょう。
性別 :[ ]尺度
年齢 :[ ]尺度(今回の場合)
ご職業 :[ ]尺度
復習問題④
⑲ 何尺度でしょう。
性別 :[名義]尺度
年齢 :[順序]尺度(今回の場合)
ご職業 :[名義]尺度
復習問題④
⑳ 何尺度でしょう。
ご利用されたきっかけは? :[ ]尺度
何名様で? :[ ]尺度(今回の場合)
復習問題④
⑳ 何尺度でしょう。
ご利用されたきっかけは? :[名義]尺度
何名様で? :[順序]尺度(今回の場合)
復習問題④
㉑ツッコミをいれてください。
復習問題④
㉑ツッコミをいれてください。
回数を聞いているのに選択肢がほぼ頻度
eとfの関係
復習問題④
㉒何尺度ですか?
復習問題④
㉒何尺度ですか? 名義尺度
復習問題④
㉓間隔尺度と言えますか?
復習問題④
㉓間隔尺度と言えますか? ×
復習問題④
㉔間隔尺度と言えますか?
復習問題④
㉔間隔尺度と言えますか? △
復習問題④
㉕間隔尺度と言えますか?
復習問題④
㉕間隔尺度と言えますか? ○
復習問題④
㉖間隔尺度と言えますか?
復習問題④
㉖間隔尺度と言えますか? ×
まとめにかえて
○ 統計は手段であって目的ではありません。
結果の解釈・考察…「あなた」が研究する意味
○ 統計を使わなくても論文は書けます。
本当に必要な分析かどうかの見極め
目的・研究課題と分析方法の精査
○ 協力者に敬意を。
わざわざ時間を使って提供してくれたデータを無駄にしない
○ 早めに書き始めましょう。
データ収集の前にResearch Designを(Draftでも)
Backgroundを後回しにすると地味につらい
内野 駿介[email protected]
3日間おつかれさまでした全日程のスライドはこちら