尤度の比較と仮説検定とを比較 する ~ P値のことなど~

58
尤尤尤尤尤尤尤尤尤尤尤尤尤尤尤尤 尤尤尤尤尤尤尤 ~P~ 尤尤尤尤尤尤 2011/02/19 尤尤 ( 尤 ) 尤尤尤尤尤尤尤尤尤 尤尤尤尤尤尤尤 尤尤 [email protected]

Upload: dane-neal

Post on 02-Jan-2016

60 views

Category:

Documents


5 download

DESCRIPTION

尤度の比較と仮説検定とを比較 する ~ P値のことなど~. 法数学勉強会 2011/02/19 京大 ( 医 ) ゲノム医学センター 統計遺伝学 分野 山田 亮 [email protected]. 今日 の内容. 確率と尤度 尤度を比較する 尤度比       ここまでが復習 尤度比を用いた「検定」:尤度比検定 仮説 検定 『 ○○が ×× であるという仮説は棄却されない 』. 確率と尤度. 色々な「仮説 ( 条件 ) 」があって 色々な「こと」が起きる. 確率と言えば「さいころ」か「トランプ」. 「トランプ」. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

尤度の比較と仮説検定とを比較する~P値のことなど~

法数学勉強会2011/02/19

京大 ( 医 ) ゲノム医学センター統計遺伝学分野

山田 亮[email protected]

Page 2: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

今日の内容• 確率と尤度• 尤度を比較する 尤度比

      ここまでが復習

• 尤度比を用いた「検定」:尤度比検定• 仮説検定– 『○○が ×× であるという仮説は棄却されない』

Page 3: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

確率と尤度• 色々な「仮説 ( 条件 ) 」があって• 色々な「こと」が起きる

Page 4: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

確率と言えば「さいころ」か「トランプ」

Page 5: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「トランプ」• (1,2,...,12,13) x (4 つのマーク )   = 52 枚• 6 人の人に配ります• マークは無視して、数字別の枚数を数えま

す 1 2 3 4 5 6 7 8 9 10 11 12 13 計H1

H2

H3

H4

H5

H6

Page 6: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「トランプ」• (1,2,...,12,13) x (4 つのマーク )   = 52 枚• 6 人の人に配ります• マークは無視して、数字別の枚数を数えま

す 1 2 3 4 5 6 7 8 9 10 11 12 13 計H1

H2

H3

H4

H5

H6

計 4 4 4 4 4 4 4 4 4 4 4 4 4 52

Page 7: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「トランプ」• 配りました

1 2 3 4 5 6 7 8 9 10 11 12 13 計H1 1 1 0 0 0 0 2 0 1 0 1 0 1 7H2 0 0 0 1 0 0 0 3 0 2 2 0 1 9H3 1 0 1 0 0 1 1 0 0 1 0 2 0 7H4 1 1 0 1 2 0 0 0 0 0 1 1 1 8H5 0 0 2 2 2 1 0 1 0 0 0 0 0 8H6 1 2 1 0 0 2 1 0 3 1 0 1 1 13合計 4 4 4 4 4 4 4 4 4 4 4 4 4 52

Page 8: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「トランプ」• H4 さんが 1 枚カードを選ぶとき、どの数字が出やすいか?

1 2 3 4 5 6 7 8 9 10 11 12 13 計H1 1 1 0 0 0 0 2 0 1 0 1 0 1 7H2 0 0 0 1 0 0 0 3 0 2 2 0 1 9H3 1 0 1 0 0 1 1 0 0 1 0 2 0 7H4 1 1 0 1 2 0 0 0 0 0 1 1 1 8H5 0 0 2 2 2 1 0 1 0 0 0 0 0 8H6 1 2 1 0 0 2 1 0 3 1 0 1 1 13合計 4 4 4 4 4 4 4 4 4 4 4 4 4 52確率

Page 9: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

確率は足し合わせると1

1 2 3 4 5 6 7 8 9 10 11 12 13 計H4 1 1 0 1 2 0 0 0 0 0 1 1 1 8

確率1/8, 1/8, 0, 1/8, 2/8,0,..., 1/8, 1/8, 1/8

Page 10: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「トランプ」• 誰が引いたカードかわからないけれど、「 2 」のカードが出されたと

いう。誰がカードを出したか?

1 2 3 4 5 6 7 8 9 10 11 12 13 計H1 1 1 0 0 0 0 2 0 1 0 1 0 1 7H2 0 0 0 1 0 0 0 3 0 2 2 0 1 9H3 1 0 1 0 0 1 1 0 0 1 0 2 0 7H4 1 1 0 1 2 0 0 0 0 0 1 1 1 8H5 0 0 2 2 2 1 0 1 0 0 0 0 0 8H6 1 2 1 0 0 2 1 0 3 1 0 1 1 13合計 4 4 4 4 4 4 4 4 4 4 4 4 4 52

Page 11: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「トランプ」• 誰が引いたカードかわからないけれど、「 2 」のカードが出されたと

いう。誰がカードを出したか?

1 2 3 4 5 6 7 8 9 10 11 12 13 計H1 1 1 0 0 0 0 2 0 1 0 1 0 1 7H2 0 0 0 1 0 0 0 3 0 2 2 0 1 9H3 1 0 1 0 0 1 1 0 0 1 0 2 0 7H4 1 1 0 1 2 0 0 0 0 0 1 1 1 8H5 0 0 2 2 2 1 0 1 0 0 0 0 0 8H6 1 2 1 0 0 2 1 0 3 1 0 1 1 13合計 4 4 4 4 4 4 4 4 4 4 4 4 4 52

Page 12: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

同じ「こと」を起こす確率を比べる• 1/4 1/4 2/4• 1/7 1/8 2/13  : 確率、尤度

1 2 3 4 5 6 7 8 9 10 11 12 13 計H1 1 1 0 0 0 0 2 0 1 0 1 0 1 7H2 0 0 0 1 0 0 0 3 0 2 2 0 1 9H3 1 0 1 0 0 1 1 0 0 1 0 2 0 7H4 1 1 0 1 2 0 0 0 0 0 1 1 1 8H5 0 0 2 2 2 1 0 1 0 0 0 0 0 8H6 1 2 1 0 0 2 1 0 3 1 0 1 1 13合計 4 4 4 4 4 4 4 4 4 4 4 4 4 52

Page 13: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

確率• 仮説 ( 条件 )H1• こと– D1,D2,.....

• H1 で D1,D2,... が起きる確率– Pr(H1)(D1),Pr(H1)(D2),...– P(D1|H1),P(D2|H1),... とも書きますが。

Page 14: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

確率 2

• 仮説 ( 条件 ) を変えてみよう H1→H2• こと– D1,D2,.....

• H1 ではなくて H2 で D1,D2,... が起きる確率– Pr(H2)(D1),Pr(H2)(D2),...– P(D1|H2),P(D2|H2),... とも書きますが。

Page 15: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

D1 D2 ... Dn 合計H1 Pr(H1)(D1) Pr(H1)(D2) ... Pr(H1)(Dn) 1

H2 Pr(H2)(D1) Pr(H2)(D2) ... Pr(H2)(Dn) 1

... ... ... ... ... ...

Hm Pr(Hm)(D1) Pr(Hm)(D2) ... Pr(Hm)(Dn) 1

合計

Page 16: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

確率と尤度• 確率を「仮説 ( 条件 ) 」について見る

• 確率を「こと」について見る:尤度

D1 D2 ... Dn 合計H1 Pr(H1)(D1) Pr(H1)(D2) ... Pr(H1)(Dn) 1

H2 Pr(H2)(D1) Pr(H2)(D2) ... Pr(H2)(Dn) 1

... ... ... ... ... ...

Hm Pr(Hm)(D1) Pr(Hm)(D2) ... Pr(Hm)(Dn) 1

合計

Page 17: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

同じ「こと」を起こす確率を比べる• 1/4 1/4 2/4• 1/7 1/8 2/13  : 確率、尤度

1 2 3 4 5 6 7 8 9 10 11 12 13 計H1 1 1 0 0 0 0 2 0 1 0 1 0 1 7H2 0 0 0 1 0 0 0 3 0 2 2 0 1 9H3 1 0 1 0 0 1 1 0 0 1 0 2 0 7H4 1 1 0 1 2 0 0 0 0 0 1 1 1 8H5 0 0 2 2 2 1 0 1 0 0 0 0 0 8H6 1 2 1 0 0 2 1 0 3 1 0 1 1 13合計 4 4 4 4 4 4 4 4 4 4 4 4 4 52

Page 18: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

同じ「こと」を起こす確率=尤度を比べる• 1/4 1/4 2/4• 1/7 1/8 2/13  : 確率、尤度

1 2 3 4 5 6 7 8 9 10 11 12 13 計H1 1 1 0 0 0 0 2 0 1 0 1 0 1 7H2 0 0 0 1 0 0 0 3 0 2 2 0 1 9H3 1 0 1 0 0 1 1 0 0 1 0 2 0 7H4 1 1 0 1 2 0 0 0 0 0 1 1 1 8H5 0 0 2 2 2 1 0 1 0 0 0 0 0 8H6 1 2 1 0 0 2 1 0 3 1 0 1 1 13合計 4 4 4 4 4 4 4 4 4 4 4 4 4 52

Page 19: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

同じ「こと」を起こす確率=尤度を比べる• 複数の「仮説 ( 条件 ) 」が• 同じ「こと」を起こす確率=尤度• を比較する

• 比率

• 「仮説1は仮説2の○倍」

Page 20: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

尤度を比べる• 尤度の比 『尤度比』 『○倍』

Page 21: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

『尤度比検定』• 尤度比は「○倍」

• ありそうなこと、ありそうもないことを「 P 値」で表す– 「 P 値」– 「その『仮説 ( 条件 ) 』を信じたら、こんな

『こと』はほとんど起きない ( 起きたとしてもその確率は『 P 値』未満でしょう」

Page 22: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

仮説を検定して P 値で答える• 「その『仮説 ( 条件 ) 』を信じたら、こん

な『こと』はほとんど起きない ( 起きたとしてもその確率は『 P 値』未満でしょう」

– 対象とする『仮説 ( 条件 ) 』が1つ• 比べる相手の『仮説 ( 条件 ) 』は一つではない

– 『こと』は観察されている

Page 23: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

1番簡単な仮説検定2x2分割表

検出 (A) 検出限界未満 (a) 合計

検査機器 P 75 21 96=75+21

検査機器 Q 54 15 69=54+15

合計 129=75+54 36=21+15 165=96+69 =129+36

Page 24: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

検査機器 P と Q とは同じくらい良い機器か?

検出 (A) 検出限界未満 (a) 合計

検査機器 P 75 21 96=75+21

検査機器 Q 54 15 69=54+15

合計 129=75+54 36=21+15 165=96+69 =129+36

Page 25: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

『検査機器 P と Q とは同じくらい良い機器だ』という『仮説 ( 条件 ) 』

検出 (A) 検出限界未満 (a) 合計

検査機器 P 75 21 96=75+21

検査機器 Q 54 15 69=54+15

合計 129 36 165

Page 26: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

『検査機器 P と Q とは同じくらい良い機器だ』という『仮説 ( 条件 ) 』

検出 (A) 検出限界未満 (a) 合計

検査機器 P 75 21 96=75+21

検査機器 Q 54 15 69=54+15

合計 0.78=129/165 0.22=36/165 165

『 P も Q も検出率が 0.78 である』という『仮説 ( 条件 ) 』で、『たまたま「 (75,21),(54,15) 」という観察をする」確率は?

Page 27: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

『 P も Q も検出率が 0.78 である』という『仮説 ( 条件 ) 』で、『たまたま「 (75,21),(54,15) 」という観察をする』確率は?

((75+21) から 75 を選ぶ選び方 ) x ((54+15) から 54 を選ぶ選び方 ) x

式は面倒くさいけれど、計算できなくはない

Page 28: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

確率か尤度か• 「仮説 ( 条件 ) 」を固定して、「こと」を

いろいろにして調べるか– 『確率』• よくある「仮説検定」はこちら

• 「こと」を固定して、「仮説 ( 条件 ) 」をいろいろにして調べるか– 『尤度』

Page 29: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「仮説 ( 条件 ) 」と「こと」• 「仮説 ( 条件 ) 」を固定する=「こと」を

色々に– 「 (75,21),(54,15) 」

Page 30: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「仮説 ( 条件 ) 」と「こと」• 「仮説 ( 条件 ) 」を固定する=「こと」を

色々に– 「 (75,21),(54,15) 」 – 「 (75+1,21-1),(54-1,15+1) 」– 「 (75+2,21-2),(54-2,15+2) 」– ...– 「 (75-1,21+1),(54+1,15-1) 」– 「 (75-2,21+2),(54+2,15-2) 」– ... ((75+21) から 75 を選ぶ選び方 ) x ((54+15) から 54 を選ぶ選び

方 ) x

計算できる

足して1になる

Page 31: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「 (75,21),(54,15) 」

Page 32: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「 (75,21),(54,15) 」

『 P も Q も検出率が 0.78 である』という『仮説 ( 条件 ) 』の下、『「 (75,21),(54,15) 」という観察をす

る』確率はそれ以外の観察をする確率

のどれよりも大きい

Page 33: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「 (80,16),(49,20) 」

『 P も Q も検出率が 0.78 である』という『仮説 ( 条件 ) 』の下、『「 (80,16),(49,20) 」という観察をす

る』のと同じか、それより、『珍しい』観察はどれ?

Page 34: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「 (80,16),(49,20) 」

『 P も Q も検出率が 0.78である』という『仮説 ( 条件 ) 』の下、『「 (80,16),(49,20) 」という観察をす

る』のと同じか、それより、『珍しい』観察はどれ?

『 P も Q も検出率が 0.78 である』という『仮説 ( 条件 ) 』の下、『「 (80,16),(49,20) 」という観察をす

る』『珍しさ』は、この場合たちの確率の和とする。それを P 値と呼ぶことにす

Page 35: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

『 P も Q も検出率が 0.78である』という『仮説 ( 条件 ) 』の下、『「 (80,16),(49,20) 」という観察をす

る』のと同じか、それより、『珍しい』観察はどれ?

『 P も Q も検出率が 0.78 である』という『仮説 ( 条件 ) 』の下、『「 (80,16),(49,20) 」という観察をす

る』『珍しさ』は、この場合たちの確率の和とする。それを P 値と呼ぶことにす

( フィッシャーの ) 正確確率検定

Page 36: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

• 計算が面倒くさい• 分割表が難しくなると、そもそも計算が

終わらない

• 何か簡単な方法はない?

((75+21) から 75 を選ぶ選び方 ) x ((54+15) から 54 を選ぶ選び方 ) x

Page 37: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

分割表の行と列とが無関係であるという

仮説のための( ピアソンの ) カイ二乗検定

• ちょちょっと、+- ×÷ の計算をするだけの便法

• 計算して出した値:「カイ二乗値」の大小で「 P 値」を求める

Page 38: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

カイ二乗値

Page 39: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

カイ二乗値

Page 40: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

カイ二乗値

Page 41: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

検出 (A) 検出限界未満 (a) 合計

検査機器 P 80 16 96

検査機器 Q 49 20 69

合計 129 36 165

Page 42: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

確率か尤度か• 「仮説 ( 条件 ) 」を固定して、「こと」を

いろいろにして調べるか– 『確率』• よくある「仮説検定」はこちら

• 「こと」を固定して、「仮説 ( 条件 ) 」をいろいろにして調べるか– 『尤度』

Page 43: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「仮説 ( 条件 ) 」と「こと」• 「こと」を固定する=「仮説」を色々に– P 、 Q ともに「成功率 =0.78 」– P 、 Q の成功率が、「 p 」と「 q 」– 「 p=0.78,q=0.78 」

Page 44: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「仮説 ( 条件 ) 」と「こと」• 「こと」を固定する=「仮説」を色々に– P 、 Q ともに「成功率 =0.78 」– P 、 Q の成功率が、「 p 」と「 q 」– 「 p=0.78,q=0.78 」 – 「 p=0.78+0.1,q=0.78-0.1 」– 「 p=0.78+0.2,q=0.78-0.2 」– ...– 「 p=0.78-0.1,q=0.78+0.1 」– 「 p=0.78-0.2,q=0.78+0.2 」– ...

– 「 p=0.78,q=0.78 」 – 「 p=0.78+0.01,q=0.78-0.01 」– 「 p=0.78+0.02,q=0.78-0.02 」– ...– 「 p=0.78-0.01,q=0.78+0.01 」– 「 p=0.78-0.02,q=0.78+0.02 」– ...

Page 45: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

「仮説 ( 条件 ) 」と「こと」• 「こと」を固定する=「仮説」を色々に– P 、 Q ともに「成功率 =0.78 」– P 、 Q の成功率が、「 p 」と「 q 」– 「 p=0.78,q=0.78 」 – 「 p=0.78+0.1,q=0.78-0.1 」– 「 p=0.78+0.2,q=0.78-0.2 」– ...– 「 p=0.78-0.1,q=0.78+0.1 」– 「 p=0.78-0.2,q=0.78+0.2 」– ...

– 「 p=0.78,q=0.78 」 – 「 p=0.78+0.01,q=0.78-0.01 」– 「 p=0.78+0.02,q=0.78-0.02 」– ...– 「 p=0.78-0.01,q=0.78+0.01 」– 「 p=0.78-0.02,q=0.78+0.02 」– ...

数えきれな

Page 46: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

数えきれない「仮説 ( 条件 ) 」• 「ここぞ」という仮説は何か?– P 、 Q ともに「成功率 =0.78 」• これは、外せない

Page 47: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

数えきれない「仮説 ( 条件 ) 」• 「ここぞ」という仮説は何か?– P 、 Q ともに「 p=q=0.78 」• これは、外せない

– もう1つの仮説をとるとしたら。• 「 p=80/96, q=49/69 」

検出 (A) 検出限界未満 (a) 合計

検査機器 P 80 16 96

検査機器 Q 49 20 69

合計 129 36 165

Page 48: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

数えきれない「仮説 ( 条件 ) 」• 「ここぞ」という仮説は何か?– P 、 Q ともに「 p=q=0.78 」• 『帰無仮説』

– もう1つの仮説 「 p=80/96, q=49/69 」• 『もっとも観察データを「尊重」した仮説』• 『最大限に動かした仮説』

Page 49: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

2つの「仮説 ( 条件 ) 」、1つの「こと」

• 2つの確率~尤度が計算できる• 2つの尤度は比較できる– 帰無仮説の尤度:– もっとも観察データを「尊重」した仮説の尤

度:• 尤度比 

Page 50: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

カイ二乗値

χ2 値からは P 値が出せる

Page 51: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

A a 合計P N(PA) N(Pa) N(P)Q N(QA) N(Qa) N(Q)

合計 N(A) N(a) N

• 仮説を固定、データを動かす• 正確確率検定• 独立性の検定:ピアソンのカイ二乗法

• データを固定、仮説を「最大限に」動かす• 尤度比検定

Page 52: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

尤度比検定はいつ使う?• 『帰無仮説』を棄却するための方法• 『もっとも観察データを「尊重」した仮

説』を考える– 『最大限に動かした仮説』

Page 53: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

尤度比検定はいつ使う?• 『帰無仮説』を棄却するための方法• 『もっとも観察データを「尊重」した仮

説』を考える– 『最大限に動かした仮説』

• 何を、動かした?– 変数• たとえば、 p と q の差

Page 54: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

変数とは?• 帰無仮説の変数– 世界には、たった1つの変数• P,Q に共通する『成功率』という変数

• 対立仮説の変数– 『もっとも観察データを「尊重」した仮説』

を扱うには、帰無仮説よりも変数を多く使う必要がある

– 変数の多い『モデル』• P,Q の中間的な『成功率』という変数と• P,Q の違いを説明するための変数

Page 55: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

変数• モデルの変数は、「いろいろな値」をとる• モデルを構成する変数の数はいくつでもよ

い• 変数の数が多いと– 「こと」が起きる尤度は高くなる

• 「こと」をもっともよくするような「値」がある– 変数の最尤推定値

Page 56: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

増やした変数の数を「自由度」と言う自由度が大きくなると、同じ χ2 値でも珍しく

なくなる

Page 57: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

仮説の変数が自由か不自由か• 仮説が複数の変数でできていて、その変数

の値が「固定」されている場合と、「動かしてもよい場合」とを比較したいときに、「棄却検定」

• 変数の値が固定された1個と、固定されたもう1個とで比較したいときには、「変数」が自由でないので、 χ2 分布に持ち込まれず、尤度比→「○倍」で考える

Page 58: 尤度の比較と仮説検定とを比較 する ~ P値のことなど~

実例…