ntt の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析...

24
NTT のののののの2 のののののののの ののののののののののののののの の 7 のののののののの ののののののの のののののののののの 3: のの のの の 200994 のののののの のののの

Post on 19-Dec-2015

215 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

NTT の実践的利用:2 段階モデルによる英語プレイスメントテストの分析

第 7 回日本テスト学会企画セッション3:ニューラルテスト理論2009年9月4日

新潟青陵大学 木村哲夫

Page 2: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

発表の概略

1. 英語プレイスメントテストの開発2. NTT と IRT による分析の比較3. 外部テスト結果との比較

4. 下位テストごとに能力を分析 → その結果をもとに総合力を分析

① 下位潜在ランク→ 順位数の和② 下位潜在ランク→ 段階ニューラルテスト

5. 結果の比較と考察6. 今後に向けて

2

“ ニューラルテスト理論による英語プレイスメントテストの作成と評価” ( 木村 ,2009) の概要

2 段階モデルによる英語プレイスメントテスト分析

Page 3: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

英語プレイスメントテスト作成の流れ

項目選択のための予備テスト

IRT : 1PLM による項目分析 (ZL

値 )NTT :項目参照プロファイル (IRP)

項目分析

misfit の除去

CTT :点双列相関係数 (P.BIS)

プレイスメントテスト完成

Misfit 除去の基準Misfit Person : ZL <-1.96Misfit Item : P.BIS <0.25

3

Page 4: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

4

予備テストの項目数と受験者数受験者数 項目数 準 1

級2 級 準 2

級3 級

文法語彙問題(vg)

222 80 25 20 20 15

会話問題 (dlg) 157 47 12 15 10 10

説明文問題 (mlg) 119 35 --- 15 10 10

受験者数 項目数 準 1級

2 級 準 2級

3 級

文法語彙問題(vg)

193 32 2 10 13 7

会話問題 (dlg) 142 13 0 7 2 4

説明文問題 (mlg) 112 19 --- 7 5 7

misfit の除去

Page 5: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

NTT の項目困難度 (β) と 1PLM の項目困難度 (θ) の比較

6

0 1 2 3 4 5-3.00

-2.00

-1.00

0.00

1.00

2.00

3.00 Vg

NTT (β)

1P

LM

)

0 1 2 3 4 5-3.00

-2.00

-1.00

0.00

1.00

2.00

3.00 Dlg

NTT (β)

1P

LM

)

0 1 2 3 4 5-3.00

-2.00

-1.00

0.00

1.00

2.00

3.00 Mlg

NTT (β)

1P

LM

)

rs

= .97rs

= .91rs

= .89

Page 6: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

疑似クラス分け予備テストで、プレイスメントテストに選ばれた 64 問すべてを回答した 75 人のデータをもとに、下位テストごとのランク数の単純和により、擬似的に5クラス分けを行った。

7

Rvg

Vg の潜在ランク( Q=10)

Rdlg

Dlg の潜在ランク

( Q=10)

Rmlg

Mlg の潜在ランク

( Q=10)

RT

総合評価( 下位テストのランクの単純

和 )3~30

Page 7: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

潜在ランク和 (RT) によるクラス分け

8

3 4 5 6 7 8 9 10111213141516171819202122232425262930Class01 Class02 Class03 Class04 Class05

0

1

2

3

4

5

6

潜在ランク和 (RT) とクラス

人数

n= 15 n= 15 n= 16 n= 14 n= 15

Page 8: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

各クラスの英語基礎力総合評価 (RT 、 θT 、 ST)の代表値と散布度の比較

9

Class n RT θT ST

Mdn Range M SD M SD

Class 01 15 6 5 -3.06 0.604 26.9 3.88

Class 02 15 11 5 -1.39 0.584 35.5 3.76

Class 03 16 17 4 0.11 0.652 42.6 3.66

Class 04 14 21 3 0.97 0.698 46.9 3.09

Class 05 15 26 6 2.89 1.204 54.3 4.84

Page 9: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

R 、 θ 、 S 間の相関係数

10

文法語彙 Rvg θvg Svg 会話 Rdlg θdlg Sdlg

Rvg ― .96 .96 Rdlg ― .90 .90

θvg ― .99 θdlg ― .98Svg ― Sdlg ―

説明文 Rmlg θmlg Smlg 総合評価 RT θT ST

Rmlg ― .93 .92 RT ― .96 .94

θmlg ― .92 θT ― .96Smlg ― ST ―

注: RT:θT と RT:ST はスピアマンの順位相関係数 (rs) を、   θT:ST はピアソンの積率相関係数 (r) を用いた。

Page 10: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

他の英語能力試験結果との比較 (CASEC)

11

0 5 10 15 20 25 300

100200300400500600700800900

1000

RT

CA

SE

C

-4.00 -2.00 0.00 2.00 4.00 0

100200300400500600700800900

1000

θTC

AS

EC

rs=.80 r =.76

n =55

n =55

Page 11: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

他の英語能力試験結果との比較 (TOEIC Bridge)

12

0 5 10 15 20 25 300

20

40

60

80

100

120

140

160

180

RT

TO

EIC

Bri

dg

e

-4.00 -2.00 0.00 2.00 4.00 0

20

40

60

80

100

120

140

160

180

θTT

OE

IC B

rid

ge

rs=.89 r =.90

n =13

n =13

Page 12: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

2 段階モデルによる英語プレイスメントテストの分析

13

NTT により求めた下位テストの潜在ランク(Rvg, Rdlg, Rmlg) の単純和 (SUM) で

本当によいのか?

NTT により求めた下位テストの潜在ランクを段階ニューラルテスト (graded neural test,

GNT) : LRT-SOM モデルにより分析すべきでは?

Page 13: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

2 段階モデルによる英語プレイスメントテストの分析

14

① 2008 疑似クラス分け (N=75)

② 2009 N 短大のクラス分け(N=125)

• NTT 分析は予備テストで得られた IRP を固定し、①は neutet 、②はexametrika を使  LRT-SOM モデルにより、潜在ランクの目標分布を指定せずに行った。• GNT の分析は exametrika を使い LRT-SOM モデルにより、 潜在ランクの目標分布を 一様分布として行った。

NTT(Q=10) により下位テストの潜在ランク(Rvg, Rdlg, Rmlg) を求め

潜在ランク (Rvg, Rdlg, Rmlg) の単純和 (SUM) をもとに5クラス分け

SUM

潜在ランク (Rvg, Rdlg, Rmlg) を項目としてGNT(Q=5) により5クラス分け

GTN

Page 14: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

SUM によるクラス分けとGNT によるクラス分けの相関

受験者数 第 1 段NTT

ランク数

第 2 段GNTランク数

順位相関係数

① 2008 75 10 5 0.93

② 2009 12510 5 0.95

10 10 0.92

15

•① の GNT を Q=10 とした場合は、弱順序配列を満たさなかった•順位相関係数はスピアマンの順位相関係数

Page 15: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

クラス分け結果の差異

年度 (受験者数 ) DGNT=SUM+

1GNT=SUM-1

GNT=SUM+2

① 2008 (N=75)

4 2 2 0

② 2009 (N=125)

43 23 18 2

16

② 2009 Class1 Class2 Class3 Class4 Class5

SUM 28 29 20 23 25GNT 27 26 26 23 23

① 2008 Class1 Class2 Class3 Class4 Class5

SUM 15 15 16 14 15GNT 15 15 16 14 15

分析方法によって推定ランクが異なるケース (D)

分析方法の違いによるクラス人数の差異

Page 16: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

GNT のテスト参照プロファイル(TRP)

18

1 2 3 4 50

2

4

6

8

10

12

14

潜在ランク

得点

1 2 3 4 50

2

4

6

8

10

12

14

潜在ランク

得点

① 2008 (N=75) ② 2009(N=125)

Page 17: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

1 2 3 4 5 6 7 8 9 100.0

0.1

0.2

0.3

0.4

0.5相対 LRD

相対 RMD

潜在ランク

相対

度数

1 2 3 4 5 6 7 8 9 100.0

0.1

0.2

0.3

0.4

0.5相対 LRD

相対 RMD

潜在ランク

相対

度数

1 2 3 4 5 6 7 8 9 100.0

0.1

0.2

0.3

0.4

0.5相対 LRD

相対 RMD

潜在ランク相

対度

1 2 3 4 5 6 7 8 9 100.0

0.1

0.2

0.3

0.4

0.5相対 LRD

相対 RMD

潜在ランク

相対

度数

1 2 3 4 5 6 7 8 9 100.0

0.1

0.2

0.3

0.4

0.5相対 LRD

相対 RMD

潜在ランク

相対

度数

1 2 3 4 5 6 7 8 9 100.0

0.1

0.2

0.3

0.4

0.5相対 LRD

相対 RMD

潜在ランク

相対

度数

19

下位テストの相対潜在ランク分布 (LRD) と相対ランク・メンバーシップ分布 (RMD)

Vg MlgDlg

① 2008 (N=75)

② 2009(N=125)

Vg MlgDlg

Page 18: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

GNT の相対潜在ランク分布 (LRD) と相対ランク・メンバーシップ分布 (RMD)

20

① 2008 (N=75) ② 2009(N=125)

1 2 3 4 50.00

0.06

0.12

0.18

0.24

0.30

相対 LRD

相対 RMD

潜在ランク

相対度数

1 2 3 4 50.00

0.06

0.12

0.18

0.24

0.30

相対 LRD

相対 RMD

潜在ランク相対度数

Page 19: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

21

GNT の項目参照プロファイル (IRP)

① 2008 (N=75) ② 2009(N=125)

1 2 3 4 50.0

1.0

2.0

3.0

4.0

5.0

RVgRDlgRMlg

LATENT RANK

1 2 3 4 50.0

1.0

2.0

3.0

4.0

5.0

RVgRDlgRMlg

LATENT RANK

Page 20: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

12345

1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

12345

1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

12345

1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

12345

1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

12345

1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

12345

22

RVg

RMlg

RDlg

RVg

RMlg

RDlg

GNT の境界カテゴリ参照プロファイル(BCRP) ① 2008 (N=75)

② 2009(N=125)

Page 21: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

12345

1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

12345

1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

12345

23

RVg

RMlg

RDlg

RVg

RMlg

RDlg

GNT の項目カテゴリ参照プロファイル(ICRP)

1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

12345

1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

12345

1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

12345

① 2008 (N=75)

② 2009 (N=125)

Page 22: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

2 段階モデルによる英語プレイスメントテストの分析(まとめ)

24

予備テストで識別力の高い項目を用意した場合SUM でも GNT でもほぼ同様のクラス分けができる。

NTT と GNT の 2 段階で分析することで、クラス( 能力)の境界を解釈・設定しやすくなる。

GNT で一様分布を指定することで、より均等なクラス分けが実現する。

SUM と GNT によるクラス分けで異なる結果が出るのは、 GNT は下位テストの識別力の差を考慮するためであろう。

Page 23: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

2 段階モデルによる英語プレイスメントテストの分析(今後に向けて)

25

下位テストに読解問題を加える (GNT による分析)

各下位テストに項目数を増やし ( 等化)アイテムバンクを構築・公開:学校 (教員 ) 間での共有

各下位テストを Moodle-based CAT にする

潜在ランクを何らかの Can-D0-Chartへ対応づける

英語基礎力の構成概念の妥当性の検討

Page 24: NTT の実践的利用: 2 段階モデルによる 英語プレイスメントテストの分析 第 7 回日本テスト学会 企画セッション3:ニューラルテスト理論

ご静聴ありがとうございました。

本英語プレイスメントテスト実施ご希望の方、本研究についてご質問のある方は、

[email protected]

あてにご連絡ください。

26