stanとrでベイズ統計モデリング読書会(osaka.stan) 第6章

156
統統統統統統統統統統統統統統統統統統 Osaka.Stan #3 統統統統 統統統統 Stan 統 R 統 統統統統統統統統統統統統統

Upload: shushi-namba

Post on 12-Apr-2017

694 views

Category:

Data & Analytics


1 download

TRANSCRIPT

Page 1: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

統計モデリングの視点から確率分布の紹介

Osaka.Stan #3広島大学 難波修史

Stan と R で ベイズ統計モデリング読書会

Page 2: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

自己紹介

• 難波修史 @Nsushi

• 広島大学教育学研究科心理学専攻 D 生• 専門:顔、感情、ド文系• 興味:ベイズ• 使用言語: Python, R• R 歴:初心者

Page 3: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

過去の発表

日本最大級の R のイベントで「にっこにっこにー」というアニメの決め台詞を口にし、ダダ滑りした人

Page 4: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

本発表の対象者

• 「数式に苦手意識あり」、「統計モデリング初学者」、「でも勉強しとかないとやばい気がする」という方々をメインにしています。

• 僕も上記の対象者に含まれます。

Page 5: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

これまでの Osaka.Stan( =本書で扱われてきたモデル

応答変数が正規分布に従う、という仮定

上図= Wiki より参照:https://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83

俗にいう「線形モデル」を扱ってきました!

Page 6: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

これまでの ( 心理 ) 統計

• 因子分析の前提=データが正規分布していること ( 松尾・中村、 2002)

• 分散分析の前提=データが正規分布していること(村山先生の HP

我々=すでに正規分布のフレンズ

Page 7: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

感想

正規

分布

© なん J

Page 8: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

今後の話

線形モデル( 正規分布がメイン

一般化線形モデル(Chapter 5 も含む

正規分布以外の確率分布を扱いたい。

このための準備 ( 正規分布以外の確率分布の知識 ) が必要!!

Page 9: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

正規分布以外の分布を使う必要性?

• 応答変数が明らかに正規分布しない 例:出席率 (5-2 等 ) 、履修登録 (5-4)

• データが少ない場合に推定がうまくいかない → 事前分布による調整が必要な場合も

例:コーシー分布や t 分布 (10 章等 )

Page 10: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

他の分布の理解は必要不可欠

• ベイズ統計モデリングでは、事前分布を選択する時にも確率分布に関する最低限の理解が必要

• 色んな分布と適用例を詳しく 知りたい人は豊田 (2015, 2017)  を読もう→

Page 11: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

この章の目的

• この本の読者 =統計モデリングがしたい!

• 基本的な道具を知っておかないと!(よく使われる)確率分布 をまずは知りましょう!!

Page 12: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

まだ

Page 13: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

分布の紹介時の注意①

• 本資料では松浦本と同様、数学的に扱いやすい分散でなく標準偏差を記載します。

• 理由 1 .平均と標準偏差は同じ単位で比較しやすく、モデリングを考察しやすい

• 理由 2 .正規分布を指定する関数では引数として、標準偏差をとるため

Page 14: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

分布の紹介時の注意②

関数や平均などの情報も一応記載していますが、基本的にはイ

メージをつかむことを優先して淡々と作成した資料です。

過度な期待はしないでください。( また、誤りがあれば適宜ご指摘ください

Page 15: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

分布勉強におすすめのアプリ

• http://statdist.ksmzn.com/• @ksmzn 様が作成した Shiny で確率分布を動かして遊べるページがあります。

• 6 章を読みながらパラメータをいじっていろんな確率分布とフレンドになりましょう!!

•右図= Interface

「確率分布いろいろ」でググる!

Page 16: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

分布勉強におすすめの…

Page 17: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

一様分布

Page 18: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

一様分布とは

•特定区間の確率が等しい分布

Page 19: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.1  一様分布

• 確率密度関数(確率変数を記述する関数

• Uniform (y | a,b) (a x b)≦ ≦0 上記以外

Page 20: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

一様分布

•パラメータ:実数 a, b (a < b)•範囲: y = [a, b] の範囲の実数• 平均: (a+b) / 2• 標準偏差: (b-a) / √12

Page 21: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

一様分布の例

a = -2, b = 1

Page 22: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

使用例:無情報事前分布

•無情報事前分布=事後分布を求める際に、影響を与えないような分布

一様分布=特定区間の確率が等しい分布

Page 23: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

Stan では?

• Stan :パラメータの事前分布を明示的に modelブロックで設定しない

 → とりうる範囲で一様な事前分布   が設定される!

Page 24: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

例: model4-5.stan

•右図では各パラメータ で明示的な事前分布が 設定されてない

a ~ uniform(-∞, ∞) b ~ uniform(-∞, ∞) sigma ~ uniform(0, ∞) ← 下限設定のため

modelブロックには以下が非明示的に設定される

Page 25: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ベルヌーイ分布

Page 26: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ベルヌーイ分布とは

•表裏があるコインの表が出る確率の分布

Page 27: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.2  ベルヌーイ分布

• 確率質量関数(離散だと密度ではなく質量

• Bernoulli (y | )    y = 1 の場合

y = 0 の場合

Page 28: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ベルヌーイ分布

•パラメータ: [0,1] の範囲の実数•範囲: y = 0 か 1 のいずれかの整数値• 平均: • 標準偏差:√ ()

Page 29: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ベルヌーイ分布の例

θ=0.2(例:けん玉 側面にのせる 成功確率

Page 30: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

例①:コイン

• コインの表・裏のような 2値を表現する際に用いる ( 他には薬が効く、効かないなど ) 。

Page 31: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

例②:出席率

•パラメータ θ = [0, 1] の範囲の実数

• 出席率 ( 欠席= 0 、出席= 1) のような応答変数に対して、ロジスティック関数と組み合わせて用いることが多い ( 具体例など詳しくは 5-3) 。

Page 32: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

二項分布

Page 33: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

二項分布とは

•ベルヌーイ分布に従う試行を N回行った結果の確率に関する分布

Page 34: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.3  二項分布

• 確率質量関数

• Binomial (y | )  

Page 35: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

二項分布

•パラメータ: [0,1] の範囲の実数•範囲: y = 0,1, … N のいずれかの整数値

• 平均: ベルヌーイ分布と一致• 標準偏差:√ N()

Page 36: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

二項分布の例

N = 10θ = 0.2

× 10

Page 37: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

二項分布の再生性

• N の異なる同じパラメータ θ の二項分布から確率変数 y1 と y2 が生成される

 →  y1 + y2 は Binomial (N1 + N2, θ) に従う

コイン表が出るパラメータ=多分 0.5× 10 × 6 = × 16

Binom (10, 0.5) Binom (6, 0.5) Binom (16, 0.5)

Page 38: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

• N が与えられた場合のベルヌーイと同様

• 具体的な例は 5-2

Page 39: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ベータ分布

Page 40: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ベータ分布とは

•ベルヌーイ・二項分布と共役な関係 ( 事後分布算出に都合のいい性質 ) を持つ分布

Page 41: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.4  ベータ分布

• 確率密度関数

• Beta ()  

Page 42: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ベータ分布•パラメータ: α 、 β の実数•範囲: θ = [0,1] の範囲の実数• 平均: • 標準偏差:

•範囲 0-1 の連続型分布=確率 θ 生成分布 → 尤度がベルヌーイ・二項分布時に利用可能+その他の [0, 1] の範囲の変数にも適用可能

Page 43: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ベータ分布の挙動①

α = 1, β = 1 → 標準一様分布と等価

α固定、 β 変化 →  β小さくなる  → 平均が 1へ

Page 44: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ベータ分布の挙動②

α = 0.5, β = 0.5 → 逆正弦分布と等価?逆正弦分布: http://physnotes.jp/stat/asin_d/

β固定、 α 変化 →  α 大きくなる  → 平均が 1へ

Page 45: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ベータ分布の挙動③

極めて多様な分布形状をとることができるのが特徴参照: http://www.ntrand.com/jp/beta-distribution/

Page 46: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

使用例:広島大学平川先生の資料より拝借 ( ベータ分布とは: http://www.slideshare.net/makotohirakawa3/nituite)

ベルヌーイ・二項分布におけるパラメータの場合が多い

Page 47: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

書籍内での例:故障率

•見たいパラメータ=故障率• M個中 Y個故障 ×N品目

イメージ図 [N = 1 :アンパン ]

モデル式θ ~ Beta(α 、 β) #故障率パラメータ

Y ~ Binomial (M, θ)

ジャムおじさんのパン工場

3つのアンパンと1つのこげパン

Page 48: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ジャムおじさん ( データ生成源 ) に関する事前情報を設定可能

• 書籍では N品目間の違いから弱情報事前分布をイメージ+設定

あのおじさんムラがはんぱないよね。

→ α 、 β にちょっとした情報を載せた解析

も可能まぁ、基本的には我々が科学的な用途で用いる場合、無情報を設定しましょう。

かばおくんリアルなジャムおじさん

Page 49: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

カテゴリカル分布、多項分布、

ディリクレ分布

Page 50: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

基本的に…

カテゴリカル分布・多項分布・ディリクレ分布

これらの分布はベルヌーイ分布・二項分布・ベータ分布を拡張した

ものです。

これらが分かっていれば理解は比較的簡単…なはず!!

Page 51: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

分布間の関係参考: http://machine-learning.hatenablog.com/entry/2016/03/26/211106

?共役=尤度関数 ( データ ) と掛けて事後分布を求めると関数系が同じになるやつ

Page 52: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

カテゴリカル分布

Page 53: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

カテゴリカル分布とは

•k の目が出る確率 ( 生起確率 ) がような K面を持つサイコロの分布

Page 54: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.5  カテゴリカル分布

• 確率質量関数

• Categorigal () = k

※Categorigal () ≠ Bernoulli ()

Page 55: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

カテゴリカル分布•パラメータ: K の整数  θ =長さ K のベクトル、各要素は [0,1] の 範囲の実数で合計すると 1 になる。•範囲: y = 1,2, … K のいずれかの整数• 平均: I[y = k] の平均 =• 分散共分散: I[y = k] の分散=  I[y = k] と I[y = k’] の共分散 (k ≠ k’) =

I[y = k] は y = k となる場合に 1 を返し、それ以外は 0 を返す関数

Page 56: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

カテゴリカル分布の例

•右図: K=5, = (0.1, 0.2, 0.25,0.35, 0.1)T

• 確率なので合計は 1

Page 57: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

使用例:ソフトマックス回帰

•店 A に 3つの商品 (チョコ、飴、グミ ) があるとする (K = 3) 。

•その選択に関わりそうな説明変数=性別のみとする。 すると以下のモデル式が提案可能。

• μ[n] = a + b*Sex[n] n = 個人• θ[n] = softmax (μ[n])    = ベクト

ル• Y[n] ~ Categorical(θ[n])

長さ K のベクトル= 3商品の選択に関する線形結合

※softmax 関数= exp を用いて [-∞, ∞] をとりうる値を正の値にしてから、合計が 1 になる

(カテゴリカル分布にあう ) ように規格化するもの

Page 58: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

多項分布

Page 59: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

多項分布とは

• k の目が出る確率がような K面を持つ (カテゴリカル分布に従う ) サイコロ投げを N回行ったときの、各目の出る確率を示す分布

• イメージ:二項分布の拡張 ( ただしK=2 の多項分布= y1, y2 をカウント⇔二項分布=生起回数のみカウント )

Page 60: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.6  多項分布

• 確率質量関数

• Multinomial () =

Page 61: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

多項分布•パラメータ: K の整数、  N =正の整数  θ =長さ K のベクトル、各要素は [0,1] の 範囲の実数で合計すると 1 になる。•範囲: y =長さ K のベクトル。各要素は 0,1,

… N のいずれかの整数で合計すると N になる• 平均: yk の平均 =N• 分散共分散: yk の分散=  yk と yk’ の共分散 (k ≠ k’) =

Page 62: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

多項分布の例

N=3 = (0.3, 0.3, 0.4)T

( 参照  http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/statdist.html

Page 63: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

使用例•N が与えられたカテゴリカル分布、で OK ⇔ 試行回数 1 の多項分布=カテゴリカル分布

•実際、平均や分散などもカテゴリカル分布のやつに N がかけられてるだけ(本参照)

(ベルヌーイ・二項分布も同じ関係

Page 64: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

式的な差異

•カテゴリカル分布

•多項分布

試行回数の要素

中身はほぼ一緒

Page 65: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ディリクレ分布

Page 66: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ディリクレ分布とは

=ベータ分布の多変量版。多項・カテゴリカル分布の共役事前分布 

=「合計すると 1 になる確率のベクトル」を生成する分布。

ゆえに重要!

Page 67: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.7  ディリクレ分布

• 確率密度関数

• Dirichlet () =

正規化定数 カーネル

Q. 正規化定数?カーネル?A. 前者は積分を 1 にするための定数 ( 定義は本家 )

 後者は確率分布の本質的な部分

Page 68: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ディリクレ分布•パラメータ: K の整数、  α =各要素は正の実数。•範囲: θ =長さ K のベクトル。各要素は

(0,1) の範囲の実数で合計すると 1 になる• 平均: θk の平均 =sum

• 分散共分散:

θk の分散= / θk と θk’ の共分散 (k ≠ k’) =

※とする

Page 69: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

視覚化① ( 参照: http://y-mattu.hatenablog.com/entry/2016/03/03/143451

• 我々にぎりぎり可視化できる 3次元の図

α が高い=確実性が高い

Page 70: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

視覚化②•歪んだパラメータ

平均をとると、 (0.09, 0.23,0.68)=わー!確率になります!!

Page 71: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

使用例:多項・カテ分布のパラメータ θ ベクトル生成

• θ をデータから推定する。 α は固定値を与えることもあれば、データから推定することもある。

• ディリクレ分布=どんな形のサイコロを生成しやすいかを決める分布ともいえる。

Page 72: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

具体例

•店 A の例 (3商品:チョコ、飴、グミ ) でいうとグミだけ選ばれやすい α の事前分布の例は以下。

• θ = Dirichlet (α1 = 1, α2 = 1, α3 = 8)• Y ~ Categorical(θ)

チョコ 飴 グミ

Page 73: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

指数分布

Page 74: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

指数分布とは

• 事象の生起間隔 ( ある事象が起こって次にまた発生するまでの間隔 ) の確率

•ランダムなイベントの発生間隔を表す分布

Page 75: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.8  指数分布

• 確率密度関数

• Exponential () =

超参照 ( 指数分布とポアソン分布のいけない関係 ) :http://www.slideshare.net/teramonagi/ss-11296227

※ 本家では λ ではなく β ですが、後でポアソン分布との関係をわかりやすくするためあえて λ としています。

Page 76: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

指数分布

•パラメータ: の実数•範囲: y = y 0≧ の実数• 平均: 1/λ• 標準偏差: 1/λ

ただ一つのパラメータだけで特徴づけられる

パラメータはいつも一つ+コナン君

Page 77: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

指数分布の例

Page 78: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

指数分布の無記憶性

•無記憶性を持つ連続型の確率分布• Pr(y > s+t | y > t) = P(y > s)

•次に事象が発生するまでの時間 は今まで待った時間と関係ない

指数分布の擬人化

記憶なくす人

Page 79: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

無記憶性の例

Pr(y > s+t | y > t) = P(y > s)

例 : 指数分布に従うワイングラス が壊れるまでの時間→ 3年 (t) 使っても壊れない → その先 1年 (s+t) で壊れる確率 = 使い始め 1年 (s) で壊れる確率

2日連続で記憶失う人

Page 80: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

データ・使用例

•パラメータ λ の解釈=ある時間中における事象の平均生起回数

 → 事故・地震の発生間隔など

• 正の実数を持つパラメータを生成する分布として使うことも( 10 章参照

Page 81: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

計算してみる

• 1 時間に平均 5 人が訪れる Webサイト→  次の訪問者が来るまでの間隔が 12 分  である確率を求めよ• λ = 5, y = 12 / 60 を公式に代入

• 確率“密度”= 1 を超える

tera-monagi 様の資料より参照: http://www.slideshare.net/teramonagi/ss-11296227

Page 82: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ポアソン分布

Page 83: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ポアソン分布とは

• 単位時間 (1 時間・ 1秒間など ) 当たりのある事象の生起確率

• 単位時間あたり平均 λ回起こるランダムな事象が単位時間中に y回起こる確率=

Page 84: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.9  ポアソン分布

• 確率密度関数

• Poisson () =

参照= tera-monagi 様の「指数分布とポアソン分布のいけない関係」: http://www.slideshare.net/teramonagi/ss-11296227

Page 85: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ポアソン分布

•パラメータ: の実数•範囲: y = 0,1,2… のいずれかの整数値• 平均: λ• 標準偏差:√ λ

ただ一つのパラメーターだけで特徴づけられる

パラメータ=平均なので「パラメータ λ のポアソン分

布」or 「平均 λ のポアソン分布」

呼び方

Page 86: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ポアソン分布の例

λ = 2.5

Page 87: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ポアソン分布の再生性

• 同じパラメータ λ のポアソン分布から確率変数 y1 と y2 が生成される

 → y1 + y2 は Poisson (λ1 + λ2) に従う

とあるアカウントがつぶやくパラメータ= 1 時間当たり2.5

y1 y2 y1+y2+ =2 時間に 5回

4 時間に 10回

6 時間に 15回

Page 88: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

指数分布とポアソンの関係①

• 単位時間あたり平均 λ 回起こるようなランダムなイベントに対して、

1 .一単位時間にイベントが起きる回数は平均 λ のポアソン分布に従う。

2 .イベントの発生間隔は平均 1 / λ の指数分布に従う。

Page 89: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

指数分布とポアソンの関係②

同一のある“事象”に対して•ポアソン分布=単位時間当たり平均 λ 回     → 回数に注目

• 指数分布=平均 1/λ 単位時間に一回     → 時間に注目!

シミュレーションは tera-monagi 様の資料を参照(指数分布とポアソン分布のいけない関係 ) : http://www.slideshare.net/teramonagi/ss-11296227

Page 90: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

二項分布とポアソンの関係

•N が大きく、 θ が小さい二項分布 → ポアソン分布に近似!!

証明の仕方は各自ググるなり、以下のスライドを参照するなりしてください( itoyan110 様の「ベルヌーイ分布からベータ分布までを関係づける」 http://www.slideshare.net/itoyan110/ss-69491897

すごーいって言ってるサーバルちゃん

Page 91: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

正規分布とポアソンの関係

•λ が大きいポアソン分布 → 正規分布に近似!!

証明の仕方は各自ググるなりしてください

すごーいって言ってるサーバルちゃん

Page 92: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

データ例①

• 1 日の間に観測される動物の個体数、 1時間の間に届くメールの数 ( 指数分布の解説も含むよい例が以下のサイトに (

http://www.ntrand.com/jp/poisson-distribution/) ) 、これらは背後に指数分布に従うイベントが考えられる。

例は「馬に蹴られてポアソン分布」でググれば一番上にでてきます (2017.2月現在 ) 。

Page 93: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

データ例②

•マンボウが卵を生んで、成魚になる数、これは背後に二項分布があって、 N が大きく θ が小さいと考えられる。

Page 94: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

使用例

•カウントデータに対して使う場合が多い

• 具体的な例は 5-4

Page 95: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ガンマ分布

Page 96: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ガンマ分布とは?

•流れ星の例で考える•流れ星が α個観測されるまでの時間 → ガンマ分布

 =母数 β の指数分布に従う事象が α回  生じるまでの時間の分布

お笑い芸人の流れ星のプロフィール画像

Page 97: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.10  ガンマ分布

• 確率密度関数

• Gamma() =

正規化定数 カーネル

正規化定数の定義は本家を参照

Page 98: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ガンマ分布

•パラメータ: α (shape), β (rate) の実数•範囲: y =正の実数• 平均: α/β• 標準偏差:√ α/β

Page 99: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

他の分布との関連

• おなじく流れ星の例

• 単位時間あたりに流れる流れ星の数 → ポアソン分布

•流れ星が初めて観測されるまでの時間 → 指数分布

Page 100: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

まとめ

ポアソン分布=回数、指数・ガンマ分布=時間に注目

ただし、指数分布の場合は最初の観測まで。ガンマ分布は α回数観測までの時間、ゆえに α が 1 の場合は指数分布と定義式が一致する(本書参

Page 101: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ガンマ分布の例

α固定で β 大きく → 平均が小さく

Page 102: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ガンマ分布の再生性

• ( 一部の分布同様 ), 同じパラメータ β のガンマ分布から確率変数 y1 と y2 が生成される

 それの和 →  Gamma(α1 + α2, β) に従う

具体

例を説

明で

きな

いベジ

ータ

思い浮かばなかっただけ。

Page 103: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

データ例: 広島大学山根先生の資料より拝借 (ガンマ分布: http://tyamane1969.net/?p=97)

Page 104: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

使用例:引き続き同資料より抜粋

• 正の実数を持つパラメータを生成する分布として使うことが多い。具体例は 10 章を参照。

Page 105: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

正規分布

Page 106: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

正規分布とは

•平均値 μ から正負の両方向に均等に広がる分布

• 色んな現象が N増やしたら概ね正規分布に近似する ( 中心極限定理 ) 、様々な分布と関連するなど、とにかく人気の分布・統計学における金字塔(多分

Page 107: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.11   (みんな大好き ) 正規分布

• 確率密度関数

• Normal() =

Page 108: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

正規分布

•パラメータ:実数、 σ =正の実数•範囲: y =実数• 平均: μ• 標準偏差: σ

親の顔よりも見慣れた景色

Page 109: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

正規分布の再生性

• 確率変数 y1 ~ Normal(μ1, σ1) と y2 ~ Normal(μ2, σ2) が独立で生成される → その和= Normal(μ1+ μ2, √ σ1 + σ2) に従う• 例:子供の身長+タケノコ

μ1 =100

μ2 = 30

+ =μ1 + μ2 =130

Page 110: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

データ例

• 色々。生成メカニズムがよくわかんなくてもとりあえず正規分布をあてはめることが多い。優秀すぎる。

• モデリングでは個人差や潜在変数なども正規分布を仮定する。

Page 111: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

正規分布の特徴

• ±2σ を超えたあたりから、確率密度関数の値が小さくなる(=裾が短い)

 → 外れ値に弱い → 後述するコーシー・ t 分布を使う ここら辺 ここら辺

Page 112: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

使用例

• 5-1 の重回帰

• グループ差や個人差が正規分布に従うと仮定する階層モデルを 8 章で扱う。

• また、 y 0≧ の部分だけを取り出して正規化する半正規分布はパラメータの弱情報事前分布として用いる場合が多い (10章

Page 113: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

こういう教材もあります。※キモオタ以外のご視聴はお勧めしておりません。

• ニコニコ動画より「月読アイの理系なお話『神様が愛した正規分布 [ 前編 ]』」

Page 114: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

対数正規分布

Page 115: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

対数正規分布とは:

• 対数正規分布の名前=“ある確率変数が対数正規分布に従うとき、その対数をとった確率変数は正規分布になる“という性質に由来する

広島大学山根先生の資料より拝借 (Hirodai.stan 発表非公開資料

「どういうことだってばよ?」って言ってる忍者

Page 116: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

つまり

•「低い値に分布が集中するが、まれに高い値も生じる」データ

 ⇒ 対数正規分布

Page 117: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.12  対数正規分布

• 確率密度関数

• LogNormal() =

Page 118: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

対数正規分布

•パラメータ:実数、 σ =正の実数•範囲: y =実数• 平均: exp(μ + σ2 / 2)• 標準偏差: exp(μ + σ2/2) √(eσ2-1)

Page 119: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

対数正規分布の例

Page 120: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

データ例・使用例

• 人間の体重、年収の金額など

• 上記のデータのほか、正の実数値をとるパラメータの弱情報事前分布として利用( 10 章参照

Page 121: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

多変量正規分布

Page 122: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

多変量正規分布とは

• 正定値対称行列である分散共分散行列を含む、 2つ以上 (m次元 ) の正規分布の同時密度関数である (多分 ) 。

2 変量の場合の例

Page 123: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.13  多変量正規分布

• 確率密度関数

• MultiNormal() =

Page 124: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

多変量正規分布•パラメータ:数、  μ =長さ K のベクトルで各要素は実数、  Σ = K×K の対称な正定値行列 ( 分散共分散行列•範囲: y =長さ K のベクトルで各要素は実数• 平均: yk の平均= μk

• 分散共分散: yk の分散= Σk,k

  yk と yk’ の共分散 (k ≠ k’) = Σk,k’

正定値行列=すべての固有値が正の実数であること、らしい。

ここがキモ!

Page 125: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

分散共分散行列:二変量の例

x1 =横軸:一次元目の正規分布

x2 =縦軸:二次元目の正規分布

※多変量正規分布は m次元正規分布

Page 126: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

他にもいろんな特徴が

•再生性あり 腕が生えてるピッコロさん

Page 127: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

すごいぞ!多変量正規分布!

•多変量正規分布に従う確率変数を線形結合 → 多変量正規分布に従う

•周辺化する → 多変量正規分布

•各変数の条件付き分布 → 多変量正規分布

驚いてる犬

Page 128: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

余談Q. 周辺化?A. 同時確率を足し合わせて特定の確率変数を消すこと。

Q. 条件付き確率?A. ある事象 Y が起こるという条件の下で別の事象 X が起きる確率: P(X|Y)

黄線のx1 の分布

p124 の例

Page 129: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

データ・使用例

•相関しそうなデータ

• 例:小学生の 50m走のタイムと走り幅跳びで飛んだ距離を並べたベクトルの分布

• 本書では 9.3.1項から扱っていく。

Page 130: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

コーシー分布

Page 131: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

コーシー分布とは

•時々とんでもない外れ値を出すことがある裾が重い分布 ( シミュレーション例:山口大学小杉先生の「 Cauchy 分布について」参照 http://www.slideshare.net/KojiKosugi/cauchy20150726)

⇒ この性質がモデリングに重宝

Page 132: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.14  コーシー分布

• 確率密度関数

• Cauchy() =

Page 133: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

コーシー分布

•パラメータ: μ =実数、 σ =正の実数•範囲: y =実数• 平均:存在しない(正確には定義されない• 標準偏差:存在しない

Page 134: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

コーシー分布の例

μ = 0, σ = 1 ⇒ 標準コーシー分布(自由度 1 の t 分布)

Page 135: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

使用例

• 分散パラメタの事前分布としてCauchy (0, 2.5), Cauchy (0, 5) など

• 外れ値を含むモデルとしてごくまれに出現する外れ値を許容するモデル y[n] ~ cauchy (a + b * X[n], σ)

Cf. y[n] ~ normal(a + b * X[n], σ)

広島大学平川先生の資料より拝借(Hirodai.stan 発表非公開資料

7.9節へ

Page 136: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

Student の t 分布

Page 137: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

Student のt分布とは

• 正規分布する母集団の平均と分散が未知で標本サイズが小さい場合に平均を推定する問題に利用される分布

•自由度によって裾の長さは大きく変化する。

  ⇒ この性質がモデリングに重宝

Page 138: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.15   Student のt分布

• 確率密度関数

• Studen_t() =   

Page 139: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

Student のt分布

•パラメータ: ν =正の実数(自由度  μ =実数、 σ =正の実数•範囲: y =実数• 平均: ν > 1 の場合は μ 、それ以外は存在しない

• 標準偏差: ν > 2 の場合は σ√ν/(ν-2).   1 < ν 2≦ の場合は∞、それ以外の場合は 存在しない。

Page 140: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

Student のt分布の例

自由度 (ν) によって裾が変化!!

Page 141: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

使用例

• コーシー分布ほどではないが、裾の重い分布を使いたいときに自由度2~8程度の t 分布が重宝される。

• ( コーシー同様 ) 外れ値を含むモデルや、回帰係数の弱情報事前分布として使う場合も。 7, 10, 12 章参照

Page 142: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

二重指数分布(ラプラス分布)

Page 143: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ラプラス分布とは

•正規分布と比べると裾が長め+ μ を中心とした鋭いピークを持つ分布

Page 144: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

6.16  二重指数分布 (ラプラス分布 )

• 確率密度関数

• DoubleExponential() =

• 指数分布を二つ貼り合わせたような分布=二重指数分布

← p75

Page 145: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ラプラス分布

•パラメータ: μ =実数、 σ =正の実数•範囲: y =実数• 平均: μ• 標準偏差:√ 2σ

Page 146: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

ラプラス分布の例

ラプラス分布のデータ例:下図

鼻が尖ってる人

Page 147: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

使用例

•鋭いピーク → 回帰係数の事前分布に設定  → 変数選択に適用可能

具体例は 7 章にて。

Page 148: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

R での作り方:http://cse.naro.affrc.go.jp/takezawa/r-tips/r/60.html

Page 149: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

このパッケージも推奨

逆ガンマ分布など本章にない確率分布もrIGAMMA(n, mu, sigma) などで簡単に求まります。

Page 150: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

まだまだあるぞ!モデリングで用いる分布!!

=ウィッシャート君:p, n, Σ をパラメータとして持つ分布の分布を表すモデル (wiki)

Page 151: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

おわりに

• 以上で 6 章で紹介された分布の解説を終わります。

• 関数同士の関係、累積分布関数、算出過程などの詳細は本家と同様に省いています。各自色々な資料を参照してください。

• 以下では個別学習に役立つと個人的に感じているものをさらに 2つ紹介します。

Page 152: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

1 .確率分布の包括的理解に

• Lawrence et al. (2008: title=Univariate Distribution Relationships)

• http://www.math.wm.edu/~leemis/chart/UDR/UDR.html

分布同士の関係が見れたり、分布の詳細を見れたり出来るゾ!

Page 153: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

2 .物足りないあなたへ

•世界最大級のオンライン学習プラットフォーム Udemy で Tamaki 先生が「ベイズ推定とグラフィカルモデル」というガチ講義を開講されています。

• 分布の知識から、コンピュータ科学への応用までお話ししてくれて興奮します。

本資料の一部もこれを参考にしてます!

Page 154: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

Enjoy R & Stan !And… Bayesian Modeling!!

Page 155: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

参考文献①•当然アヒル本•各ページに記載されてる URL や資料•各分布の Wiki• ややこしい離散分布に関するまとめ

http://machine-learning.hatenablog.com/entry/2016/03/26/211106

•多項分布とディリクレ分布のまとめと可視化http://y-mattu.hatenablog.com/entry/2016/03/03/143451

Page 156: StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章

参考文献②

• 松尾太加志・中村知靖( 2002 ) 誰も教えてくれなかった因子分析-数式が 絶対に出てこない因子分析入門- 北大路書房

• 村山先生による ANOVA に関する解説http://koumurayama.com/koujapanese/anova.htm

• 様々な確率分布 probability distributions - 数理的思考 - 中川雅央 【知と情報の科学】 http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/statdist.html