Download - 話題1 タイプが同じならば、 同一人物由来の試料なのか?
話題1タイプが同じならば、
同一人物由来の試料なのか?
法数学勉強会2012/03/24
京都大学 医学研究科統計遺伝学分野
山田
タイプが同じならば、同一人物由来の試料なのか?
• 「同一タイプ」の人がこの世に1人ならば、「同一人物」と判定される
• 「同一タイプ」の人がこの世に複数いれば、「同一人物」と判定するのは、確率的になる
消しゴム事件• ある小学校では、すべての男子生徒300
人に「消しゴム屋」さんから1個ずつ消しゴムが配られた– 「ナルト」柄が50個、「ワンピース」柄が
100個、「ドラえもん」柄が150個
ある日、音楽室で• 1個の消しゴムの落し物が発見された• 「ナルト」柄だった(50個 / 300個)
「ほなみたまちゃん♥」
• その消しゴムには– 「ほなみたまちゃん♥」と書かれていた!
• さあ、この消しゴムは誰のものか?– 女子児童たちの捜査が始まった
らぶ
• 「消しゴム屋さん、『ナルト』柄の消しゴムを配った男子のリストを出しなさいよー」– リストが得られれば、『ナルト』所有者 50 名
に絞られる– 50 名は、 1/50 の確率で「たまちゃん♥」
• 「消しゴム屋さん、『ナルト』柄の消しゴムを配った男子のリストを出しなさいよー」– 「あいにく、個人情報保護法の規定により、
リストをお出しすることはできません」
• 「消しゴム屋さん、『ナルト』柄の消しゴムを配った男子のリストを出しなさいよー」– 「あいにく、個人情報保護法の規定により、
リストをお出しすることはできません」– 「特定の児童さんを指名していただけば、そ
の児童さんにどのタイプを渡したかはお答えできます」
「たまちゃん♥」の『犯人』って誰だと思う?「やっぱり、同じクラスの男子?」「クラブが一緒?」「委員会つながりかも?」「以前に同じクラスだった・・・とか」「帰り道が一緒だからだったりして」
「事前確率なんて考えるのはやめなさい」「下手な考え、休むに似たりって言うじゃない」
「そうとも、限らないのだが…」
音楽の先生 曰く• 「音楽室はいつも鍵がかかっていて、鍵は
私しか持っていないから、その日、音楽室に出入りできた児童は、その日に音楽の授業があったクラスの子、だけよ」
• 「その日、音楽の授業があったのは、3クラス、120人のうち、男子は、60人」
• 「300人のうち、60人」
• 「その日、音楽の授業があったのは、3クラス、120人のうち、男子は、60人」
• 「音楽の授業は、300人のうち、60人」
• 「『ナルト』柄は、300人のうち、50人」
• 「じゃあ、音楽のあったクラスで、『ナルト』消しゴムを持っていたのは何人?」
• 「その日、音楽の授業があったのは、3クラス、120人のうち、男子は、60人」
• 「音楽の授業は、300人のうち、60人」
• 「『ナルト』柄は、300人のうち、50人」
• 「じゃあ、音楽のあったクラスで、『ナルト』消しゴムを持っていたのは何人?」
• 60x50 / 300 =10人 くらいね!
• 「あいにく、個人情報保護法の規定により、リストをお出しすることはできません」
• 「特定の児童さんを指名していただけば、その児童さんにどのタイプを渡したかはお答えできます」
• 「あいにく、個人情報保護法の規定により、リストをお出しすることはできません」
• 「特定の児童さんを指名していただけば、その児童さんにどのタイプを渡したかはお答えできます」
絶対花輪君のを教えてもらうわ
誰も文句ないわよね!
「花輪君ですね、花輪君は、『ナルト』柄でした」
「花輪君ですね、花輪君は、『ナルト』柄でした」
• 「花輪君以外の男子 ( 59人 ) が、『ナルト』柄である確率は 50/300 = 1/6→49/299 」
• 「そのうちの誰かが、落とし主だとすると、それが『ナルト』柄である確率は 1/6 」
• 「花輪君が落としたのなら、それが『ナルト』柄である確率は 1 」
• 「誰かが落としたのなら、それが『ナルト』柄である確率は 1/6 」
• 「尤度比は 6 」• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「花輪君以外の男子 ( 59人 ) が、『ナルト』柄である確率は 50/300 = 1/6→49/299 」
• 「そのうちの誰かが、落とし主だとすると、それが『ナルト』柄である確率は 49/299 」
• 「花輪君が落としたのなら、それが『ナルト』柄である確率は 1 」
• 「誰かが落としたのなら、それが『ナルト』柄である確率は 1/6 」
• 「尤度比は 6 」• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「花輪君以外の男子 ( 59人 ) が、『ナルト』柄である確率は 50/300 = 1/6→49/299 」
• 「そのうちの誰かが、落とし主だとすると、それが『ナルト』柄である確率は 49/299 」
• 「花輪君が落としたのなら、それが『ナルト』柄である確率は 1 」
• 「誰かが落としたのなら、それが『ナルト』柄である確率は 1/6 」
• 「尤度比は 6 」• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「花輪君以外の男子 ( 59人 ) が、『ナルト』柄である確率は 50/300 = 1/6→49/299 」
• 「そのうちの誰かが、落とし主だとすると、それが『ナルト』柄である確率は 49/299 」
• 「花輪君が落としたのなら、それが『ナルト』柄である確率は 1 」
• 「誰かが落としたのなら、それが『ナルト』柄である確率は 49/299 」
• 「尤度比は 6 」• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「花輪君以外の男子 ( 59人 ) が、『ナルト』柄である確率は 50/300 = 1/6→49/299 」
• 「そのうちの誰かが、落とし主だとすると、それが『ナルト』柄である確率は 1/6 」
• 「花輪君が落としたのなら、それが『ナルト』柄である確率は 1 」
• 「誰かが落としたのなら、それが『ナルト』柄である確率は 49/299 」
• 「尤度比は 1/(49/299) = 299/49 = 6.10 」• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「花輪君以外の男子 ( 59人 ) が、『ナルト』柄である確率は 50/300 = 1/6→49/299 」
• 「そのうちの誰かが、落とし主だとすると、それが『ナルト』柄である確率は 1/6 」
• 「花輪君が落としたのなら、それが『ナルト』柄である確率は 1 」
• 「誰かが落としたのなら、それが『ナルト』柄である確率は 49/299 」
• 「尤度比は 1/(49/299) = 299/49 = 6.10 」• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「尤度比は 6.10 」• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「花輪君が落としたのなら、それが『ナルト』柄である確率は 1 」
• 「誰かが落としたのなら、それが『ナルト』柄である確率は 49/299 」
• 「尤度比は 1/(49/299) = 299/49 = 6.10 」
• 「候補の男子が 59 人もいるのに、いきなり、『 6.10 倍』っていうのは、おかしいんじゃねーか?」
• 「花輪君が落としたのなら、それが『ナルト』柄である確率は 1 」
• 「誰か1が落としたのなら、それが『ナルト』柄である確率は 49/299 」
• 「誰か2が落としたのなら、それが『ナルト』柄である確率は 49/299 」
• …• 「誰か 59 が落としたのなら、それが『ナルト』柄である確率は
49/299 」
• 「花輪君が落としたのなら、それが『ナルト』柄である確率は 1 」
• 「誰か1が落としたのなら、それが『ナルト』柄である確率は 49/299 」
• 「誰か2が落としたのなら、それが『ナルト』柄である確率は 49/299 」
• …• 「誰か 59 が落としたのなら、それが『ナルト』柄である確率は
49/299 」
• 「花輪君 vs. その他 59 人 は 1: 59x49/299 = 0.103 」
• 「花輪君が落としたのなら、それが『ナルト』柄である確率は 1 」
• 「誰か1が落としたのなら、それが『ナルト』柄である確率は 49/299 」
• 「誰か2が落としたのなら、それが『ナルト』柄である確率は 49/299 」
• …• 「誰か 59 が落としたのなら、それが『ナルト』柄である確率は
49/299 」
• 「花輪君 vs. その他 59 人 は 1: 59x49/299 = 0.103 」
• 「音楽の授業は、300人のうち、60人」• 「『ナルト』柄は、300人のうち、50人」• 「じゃあ、音楽のあったクラスで、『ナルト』消しゴムを持っていたのは何人?• 60x50 / 300 =10人 くらいね!
• 「本当のところは、音楽授業の60人中、何人が『ナルト』柄じゃったんかいのー」– 1人、2人、…、50人の場合がありえる– 1人だけが『ナルト』柄で、それが花輪君なら、「たまちゃん
♥」は花輪君で確定– 2人が『ナルト』柄なら、花輪君かもしれないし、もう1人か
もしれなくて、確率は 1/2– …– k 人が『ナルト』柄で、花輪君がそのうちの1人なら、確率は
1/k
• 「音楽の授業は、300人のうち、60人」• 「『ナルト』柄は、300人のうち、50人」• 「じゃあ、音楽のあったクラスで、『ナルト』消しゴムを持っていたのは何人?• 60x50 / 300 =10人 くらいね!
• 「本当のところは、音楽授業の60人中、何人が『ナルト』柄じゃったんかいのー」– 1人、2人、…、50人の場合がありえる– 1人だけが『ナルト』柄で、それが花輪君なら、「たまちゃん
♥」は花輪君で確定– 2人が『ナルト』柄なら、花輪君かもしれないし、もう1人か
もしれなくて、確率は 1/2– …– k 人が『ナルト』柄で、花輪君がそのうちの1人なら、確率は
1/k
• 「音楽の授業は、300人のうち、60人」• 「『ナルト』柄は、300人のうち、50人」• 「じゃあ、音楽のあったクラスで、『ナルト』消しゴムを持っていたのは何人?• 60x50 / 300 =10人 くらいね!
• 「本当のところは、音楽授業の60人中、何人が『ナルト』柄じゃったんかいのー」– 1人、2人、…、50人の場合がありえる– 1人だけが『ナルト』柄で、それが花輪君なら、「たまちゃん
♥」は花輪君で確定– 2人が『ナルト』柄なら、花輪君かもしれないし、もう1人か
もしれなくて、確率は 1/2– …– k 人が『ナルト』柄で、花輪君がそのうちの1人なら、確率は
1/k
• 「音楽の授業は、300人のうち、60人」• 「『ナルト』柄は、300人のうち、50人」• 「じゃあ、音楽のあったクラスで、『ナルト』消しゴムを持っていたのは何人?• 60x50 / 300 =10人 くらいね!
• 「本当のところは、音楽授業の60人中、何人が『ナルト』柄じゃったんかいのー」– 1人、2人、…、50人の場合がありえる– 1人だけが『ナルト』柄で、それが花輪君なら、「たまちゃん
♥」は花輪君で確定– 2人が『ナルト』柄なら、花輪君かもしれないし、もう1人か
もしれなくて、確率は 1/2– …– k 人が『ナルト』柄で、花輪君がそのうちの1人なら、確率は
1/k
• 『ナルト』柄の確率 : p = 50/300 = 1/6• 音楽 50 人中、 k 人が『ナルト』柄の確率
• k が大きい方が『ナルト』柄を落としやすいからその分を上乗せして
• 花輪君が「たまちゃん♥」である確率– k 人の場合
• =
– k=1,2,...,50 の場合の合計
• 『ナルト柄』の人数が0人の可能性は、もう、ないことがわかっているので、その分を割り引いて考えよう– (
k 50-k 50
60-k 190+k 250
60 240 300
• p=50/300=1/6• N=60• 『ナルト』柄の
人数は、何人の可能性が1番高いか
『ナルト』柄人数
60x50 / 300 =10人 くらいね!
• 『ナルト』柄の人数は、何人の可能性が一番高いか
• 「花輪君」が犯人だ、とみなされる可能性は、『ナルト』柄の保有者が何人のときに一番高いか
Pr (𝑘 )× 1𝑘
• 花輪君が「たまちゃん♥」である確率は– 0.100
• 花輪君が「たまちゃん♥」である尤度と、他の誰かが「たまちゃん♥」である尤度の比は– 0.111
• 花輪君が「たまちゃん♥」である確率は– 0.100
• 花輪君が「たまちゃん♥」である尤度と、他の誰かが「たまちゃん♥」である尤度の比は– 0.111
花輪君 vs. 誰か1人
花輪君 vs. 誰か 59人
花輪君が、『ナルト』柄の持ち主である比率
1/(49/299) = 299/49 = 6.10
1/(59x49/299) = 0.103
0.111
• p 「タイプ」の割合 1/6• N 「花輪君以外の対立候補者数」 59
人
• p, N を振ってみよう
対立候補者数 N = 1 のままp= を変える
p が小さければ尤度比は高い2つの方法に差はない
p
尤度
比
p=1/6 のまま対立候補者数 N = 1,2,...,100
対立候補者数によらず一定
対立候補者数が増えると下がる対立候補者数 N
尤度
比
花輪君 vs. 誰か1人
花輪君 vs. 誰か 59人
花輪君が、『ナルト』柄の持ち主である比率
1/(1/6) = 6
1/(59x49/299) = 0.103
0.111
Pr (𝑘 )= 50 !250 !60 ! 240 !300 !𝑘! (50−𝑘 )! (60−𝑘 )! (190+𝑘 )!
• N=59• p を変える
この2つの違い
p=1/60.103 vs. 0.111
• 「おれの数字とばあさんの数字が近いってことは、お互い、悪い意見じゃないってことか?!」
この2つの違い• N=59• p を変える
p=1/60.103 vs. 0.111
p が大きいときは大差がないが、p が小さくなると、差が出てくる
• N を変える• p=1/6
この2つの違い
• N を変える• p=1/6
この2つの違い
N=590.103 vs. 0.111
• N を変える• p=1/6
この2つの違い
N=590.103 vs. 0.111
N が大きいときは大差がないが、N が小さくなると、差が出てくる
この2つの違い
N=590.103 vs. 0.111
N が大きいときは大差がないが、N が小さくなると、差が出てくる
p=1/60.103 vs. 0.111
p が大きいときは大差がないが、p が小さくなると、差が出てくる p が小さいとき、 N が小さいとき
2つの方法の差が大きくなる
P N
• 「ばあさんの意見では、『ナルト』を持っているのが2人以上いても、花輪君が犯人の可能性を捨てないってことだぜ」
• 「ぜーったい、花輪君しかありえねぇ、ってことにしないと、花輪君に悪いだろう」
• 「確かに、 さんに責められるのはかわいそうかもしれない」
• 「じゃあ、残りの59人が全員、誰一人として、『ナルト』を持っていない確率を計算してみるよ」– 尤度比 6.9724e-05
• 「これは低すぎて、おかしいんじゃないかい?」
• 「 の意見と、ものすごく違うよ」
• 「ばあさんの意見では、『ナルト』を持っているのが2人以上いても、花輪君が犯人の可能性を捨てないってことだぜ」
めずらしいこと1• 町内会の福引、サイコロを振って1が出たらあたり
– p=1/6 の確率で起きること
• 山田さんと佐藤さんが1回ずつ実施した• 両家でそろって当たる確率
– p^2• 山田さんで当たって、佐藤さんで当たらない確率
– p• 山田さんで外れて、佐藤さんで当たる確率
– p• 両家でそろって外れる確率
– (1-p)^2
めずらしいこと1• 山田さんが喜んでいるのを聞いて、佐藤さ
んが思うこと• 「山田さん、おめでとう。うちも当てよ
う」
めずらしいこと2• 町内会のくじ、6本あって、1本が当たり
– p=1/6 の確率で起きること
• 山田さんと佐藤さんが1枚ずつ購入した• 両家でそろって当たる確率
– 0• 山田さんで当たって、佐藤さんで当たらない確率
– p• 山田さんで外れて、佐藤さんで当たる確率
– p• 両家でそろって外れる確率
– 1-2p
めずらしいこと2• 山田さんが喜んでいるのを聞いて、佐藤さ
んが思うこと• 「山田さん、おめでとう。うちは、もうだ
めだ」
消しゴム・ DNA鑑定はさてどっち
k 1000-k 1000
10-k 1億 -1010+k 1億 -1000
10 1億 -10 1億
集団には、そこそこ、同じタイプの人がいるかも
しれない
候補者数は場合によって増減する
フィッシャーの正確確率検定 ( とはちょっと違うけれど ) とかなり近い枠組み
人口を無限大にして、候補者数が少なすぎないという条件でなら、カイ自乗検定的な漸近近似計算も (多分 ) 可能
まとめ• 「容疑者のセット」の中に「同じタイプ
を持つ人数」を網羅する• その上で、特定の個人が「試料」を残し
た確率を計算する• 分割表的
分割表から正確確率を計算する
• 『ナルト』柄の確率 : p = 50/300 = 1/6• 音楽 50 人中、 k 人が『ナルト』柄の確率
• k が大きい方が『ナルト』柄を落としやすいからその分を上乗せして
• 花輪君が「たまちゃん♥」である確率– k 人の場合
• =
– k=1,2,...,50 の場合の合計
• 『ナルト柄』の人数が0人の可能性は、もう、ないことがわかっているので、その分を割り引いて考えよう– (
k 50-k 50
60-k 190+k 250
60 240 300
正確確率ではない、計算法も
• 『ナルト』柄の確率 : p = 50/300 = 1/6• 音楽 50 人中、 k 人が『ナルト』柄の確率
– • k が大きい方が『ナルト』柄を落としやすいからその
分を上乗せして–
• 花輪君が「たまちゃん♥」である確率– k 人の場合
• =
– k=1,2,...,50 の場合の合計
• 『ナルト柄』の人数が0人の可能性は、もう、ないことがわかっているので、その分を割り引いて考えよう– (