負の二項分布について

19
負の二項分布 !!広島ベイズ塾 @simizu706

Upload: hiroshi-shimizu

Post on 12-Aug-2015

345 views

Category:

Education


1 download

TRANSCRIPT

負の二項分布

魁!!広島ベイズ塾

@simizu706

二項分布

• Binomial Distribution – ベルヌーイ試行において,成功率pで試行数n回中に

x回成功する確率

– 試行数nを固定すれば,パラメータは成功率pだけになる • パラメータpの共役事前分布はベータ分布

負の二項分布

• Negative Binomial Distribution

–離散分布

–成功率pで,r回成功するまでに必要な試行数の確率

–二項分布の成功数と試行数を入れ替えた分布

負の二項分布「私はあと2回の変身を残しています」

別の表現

• 負の二項分布

–ベルヌーイ試行において,成功率pでr回成功するまでに必要な失敗回数についての確率

–普通はこっちのバージョンを使う

連続変量に拡張

• ガンマ関数を用いて,成功数が整数でなくてもいけるように拡張

–ガンマ関数

分布感(謎

• Rで負の二項分布を描く

x <- rep(0:20)

plot(x,dnbinom(x,size = 5,prob=0.5),type="b")

分布感(謎

• Rで負の二項分布を描く

x <- rep(0:20)

plot(x,dnbinom(x,size = 5,prob=0.6),type="b")

分布感(謎

• Rで負の二項分布を描く

x <- rep(0:20)

plot(x,dnbinom(x,size = 5,prob=0.8),type="b")

分布の実質科学的な意味

• 二項分布の試行数バージョン

–例えば裸眼の参加者を10人集めたい場合,何人に声をかければいいか

• 裸眼率がわかっていれば,95%以上の確率で裸眼10人集めるのに必要な人数がわかる

• ポアソン分布の過分散推定のため

–統計モデリングでは,ほぼこの目的で使われる

ポアソン分布との関係

• ポアソン分布

–レアな確率で起こる事象がある時間内で起こる回数についての確率

• 1分で1回起こる事象が5分の間に何回起こるかについての確率は,λ=5のポアソン分布に従う

λの変動を考える

• λの確率的な変動を考慮したポアソン分布

– λがガンマ分布(gamma(φ, μφ-1))に従うとする

• このとき,混合した確率分布は

–負の二項分布になる

• 成功率: p = φ / (μ+φ), 成功数: r=φ

ポアソンと負の二項分布

• もともとの負の二項分布

–成功率pで,r回の成功までの失敗回数yの分布

• ポアソンのλが変動すると考えた分布

–成功率φ/(μ+φ)で, φ回の成功までの失敗回数yの分布

ポアソンと負の二項分布

• 負の二項分布の平均と分散は・・・ –平均= μ

–分散= μ + μ2 / φ

• 負の二項分布において・・・ – μ=λで,φ=∞のとき,ポアソン分布になる

–平均= λ

–分散= λ + λ2 / ∞ = λ • つまりφ(の逆数)が過分散パラメータになる

ポアソンと負の二項分布

• 負の二項分布 別バージョン

plot(x,dnbinom(x,mu=5,size = 1000000),type="b")

plot(x,dpois(x,5),type="b")

負の二項分布の使いどころ

• 分散がλより大きいポアソン分布 –ポアソン分布の過分散を考慮した分布

–ポアソンは負の二項分布に完全にネストされているので,AICなどの情報量規準による比較が可能 • 過分散を仮定するべきかどうかを知ることができる

• ポアソン過程のデータに使える –単位時間で平均λ回生じる事象が生起する回数についての確率分布 • ただし,λはガンマ分布に従って変動する

GLMMとの関係

• ポアソン+正規分布のGLMMとの違い

– GLMMではlog(λ)を正規分布で推定

–負の二項分布はλをガンマ分布で推定

–ほとんどAICはかわらない

Stanでの負の二項分布

• neg_binomial(α,β)

• neg_binomial2(μ, φ)

他の分布との関係

• 幾何分布

–成功率pにおいて,1回成功するまでに必要な試行数の分布

– r=1の場合の負の二項分布といえる

• 一般化ポアソン分布

–ポアソン分布の過小分散も考慮できる分布

–ほとんど使われることはない

まとめ

• 負の二項分布

–二項分布の成功数と試行数のパラメータを逆転させた分布

–ベルヌーイ試行において,成功率pでr回成功するまでに必要な失敗回数についての分布

• ポアソン分布+過分散 – GLMの文脈では,平均と分散が等しくない場合の分布として利用されることが多い