負の二項分布について
TRANSCRIPT
二項分布
• Binomial Distribution – ベルヌーイ試行において,成功率pで試行数n回中に
x回成功する確率
– 試行数nを固定すれば,パラメータは成功率pだけになる • パラメータpの共役事前分布はベータ分布
負の二項分布
• Negative Binomial Distribution
–離散分布
–成功率pで,r回成功するまでに必要な試行数の確率
–二項分布の成功数と試行数を入れ替えた分布
負の二項分布「私はあと2回の変身を残しています」
分布の実質科学的な意味
• 二項分布の試行数バージョン
–例えば裸眼の参加者を10人集めたい場合,何人に声をかければいいか
• 裸眼率がわかっていれば,95%以上の確率で裸眼10人集めるのに必要な人数がわかる
• ポアソン分布の過分散推定のため
–統計モデリングでは,ほぼこの目的で使われる
λの変動を考える
• λの確率的な変動を考慮したポアソン分布
– λがガンマ分布(gamma(φ, μφ-1))に従うとする
• このとき,混合した確率分布は
–負の二項分布になる
• 成功率: p = φ / (μ+φ), 成功数: r=φ
ポアソンと負の二項分布
• もともとの負の二項分布
–成功率pで,r回の成功までの失敗回数yの分布
• ポアソンのλが変動すると考えた分布
–成功率φ/(μ+φ)で, φ回の成功までの失敗回数yの分布
ポアソンと負の二項分布
• 負の二項分布の平均と分散は・・・ –平均= μ
–分散= μ + μ2 / φ
• 負の二項分布において・・・ – μ=λで,φ=∞のとき,ポアソン分布になる
–平均= λ
–分散= λ + λ2 / ∞ = λ • つまりφ(の逆数)が過分散パラメータになる
ポアソンと負の二項分布
• 負の二項分布 別バージョン
plot(x,dnbinom(x,mu=5,size = 1000000),type="b")
plot(x,dpois(x,5),type="b")
負の二項分布の使いどころ
• 分散がλより大きいポアソン分布 –ポアソン分布の過分散を考慮した分布
–ポアソンは負の二項分布に完全にネストされているので,AICなどの情報量規準による比較が可能 • 過分散を仮定するべきかどうかを知ることができる
• ポアソン過程のデータに使える –単位時間で平均λ回生じる事象が生起する回数についての確率分布 • ただし,λはガンマ分布に従って変動する
他の分布との関係
• 幾何分布
–成功率pにおいて,1回成功するまでに必要な試行数の分布
– r=1の場合の負の二項分布といえる
• 一般化ポアソン分布
–ポアソン分布の過小分散も考慮できる分布
–ほとんど使われることはない