stanとrでベイズ統計モデリング読書会(osaka.stan) 第6章

Post on 12-Apr-2017

694 Views

Category:

Data & Analytics

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

統計モデリングの視点から確率分布の紹介

Osaka.Stan #3広島大学 難波修史

Stan と R で ベイズ統計モデリング読書会

自己紹介

• 難波修史 @Nsushi

• 広島大学教育学研究科心理学専攻 D 生• 専門:顔、感情、ド文系• 興味:ベイズ• 使用言語: Python, R• R 歴:初心者

過去の発表

日本最大級の R のイベントで「にっこにっこにー」というアニメの決め台詞を口にし、ダダ滑りした人

本発表の対象者

• 「数式に苦手意識あり」、「統計モデリング初学者」、「でも勉強しとかないとやばい気がする」という方々をメインにしています。

• 僕も上記の対象者に含まれます。

これまでの Osaka.Stan( =本書で扱われてきたモデル

応答変数が正規分布に従う、という仮定

上図= Wiki より参照:https://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83

俗にいう「線形モデル」を扱ってきました!

これまでの ( 心理 ) 統計

• 因子分析の前提=データが正規分布していること ( 松尾・中村、 2002)

• 分散分析の前提=データが正規分布していること(村山先生の HP

我々=すでに正規分布のフレンズ

感想

正規

分布

© なん J

今後の話

線形モデル( 正規分布がメイン

一般化線形モデル(Chapter 5 も含む

正規分布以外の確率分布を扱いたい。

このための準備 ( 正規分布以外の確率分布の知識 ) が必要!!

正規分布以外の分布を使う必要性?

• 応答変数が明らかに正規分布しない 例:出席率 (5-2 等 ) 、履修登録 (5-4)

• データが少ない場合に推定がうまくいかない → 事前分布による調整が必要な場合も

例:コーシー分布や t 分布 (10 章等 )

他の分布の理解は必要不可欠

• ベイズ統計モデリングでは、事前分布を選択する時にも確率分布に関する最低限の理解が必要

• 色んな分布と適用例を詳しく 知りたい人は豊田 (2015, 2017)  を読もう→

この章の目的

• この本の読者 =統計モデリングがしたい!

• 基本的な道具を知っておかないと!(よく使われる)確率分布 をまずは知りましょう!!

まだ

分布の紹介時の注意①

• 本資料では松浦本と同様、数学的に扱いやすい分散でなく標準偏差を記載します。

• 理由 1 .平均と標準偏差は同じ単位で比較しやすく、モデリングを考察しやすい

• 理由 2 .正規分布を指定する関数では引数として、標準偏差をとるため

分布の紹介時の注意②

関数や平均などの情報も一応記載していますが、基本的にはイ

メージをつかむことを優先して淡々と作成した資料です。

過度な期待はしないでください。( また、誤りがあれば適宜ご指摘ください

分布勉強におすすめのアプリ

• http://statdist.ksmzn.com/• @ksmzn 様が作成した Shiny で確率分布を動かして遊べるページがあります。

• 6 章を読みながらパラメータをいじっていろんな確率分布とフレンドになりましょう!!

•右図= Interface

「確率分布いろいろ」でググる!

分布勉強におすすめの…

一様分布

一様分布とは

•特定区間の確率が等しい分布

6.1  一様分布

• 確率密度関数(確率変数を記述する関数

• Uniform (y | a,b) (a x b)≦ ≦0 上記以外

一様分布

•パラメータ:実数 a, b (a < b)•範囲: y = [a, b] の範囲の実数• 平均: (a+b) / 2• 標準偏差: (b-a) / √12

一様分布の例

a = -2, b = 1

使用例:無情報事前分布

•無情報事前分布=事後分布を求める際に、影響を与えないような分布

一様分布=特定区間の確率が等しい分布

Stan では?

• Stan :パラメータの事前分布を明示的に modelブロックで設定しない

 → とりうる範囲で一様な事前分布   が設定される!

例: model4-5.stan

•右図では各パラメータ で明示的な事前分布が 設定されてない

a ~ uniform(-∞, ∞) b ~ uniform(-∞, ∞) sigma ~ uniform(0, ∞) ← 下限設定のため

modelブロックには以下が非明示的に設定される

ベルヌーイ分布

ベルヌーイ分布とは

•表裏があるコインの表が出る確率の分布

6.2  ベルヌーイ分布

• 確率質量関数(離散だと密度ではなく質量

• Bernoulli (y | )    y = 1 の場合

y = 0 の場合

ベルヌーイ分布

•パラメータ: [0,1] の範囲の実数•範囲: y = 0 か 1 のいずれかの整数値• 平均: • 標準偏差:√ ()

ベルヌーイ分布の例

θ=0.2(例:けん玉 側面にのせる 成功確率

例①:コイン

• コインの表・裏のような 2値を表現する際に用いる ( 他には薬が効く、効かないなど ) 。

例②:出席率

•パラメータ θ = [0, 1] の範囲の実数

• 出席率 ( 欠席= 0 、出席= 1) のような応答変数に対して、ロジスティック関数と組み合わせて用いることが多い ( 具体例など詳しくは 5-3) 。

二項分布

二項分布とは

•ベルヌーイ分布に従う試行を N回行った結果の確率に関する分布

6.3  二項分布

• 確率質量関数

• Binomial (y | )  

二項分布

•パラメータ: [0,1] の範囲の実数•範囲: y = 0,1, … N のいずれかの整数値

• 平均: ベルヌーイ分布と一致• 標準偏差:√ N()

二項分布の例

N = 10θ = 0.2

× 10

二項分布の再生性

• N の異なる同じパラメータ θ の二項分布から確率変数 y1 と y2 が生成される

 →  y1 + y2 は Binomial (N1 + N2, θ) に従う

コイン表が出るパラメータ=多分 0.5× 10 × 6 = × 16

Binom (10, 0.5) Binom (6, 0.5) Binom (16, 0.5)

• N が与えられた場合のベルヌーイと同様

• 具体的な例は 5-2

ベータ分布

ベータ分布とは

•ベルヌーイ・二項分布と共役な関係 ( 事後分布算出に都合のいい性質 ) を持つ分布

6.4  ベータ分布

• 確率密度関数

• Beta ()  

ベータ分布•パラメータ: α 、 β の実数•範囲: θ = [0,1] の範囲の実数• 平均: • 標準偏差:

•範囲 0-1 の連続型分布=確率 θ 生成分布 → 尤度がベルヌーイ・二項分布時に利用可能+その他の [0, 1] の範囲の変数にも適用可能

ベータ分布の挙動①

α = 1, β = 1 → 標準一様分布と等価

α固定、 β 変化 →  β小さくなる  → 平均が 1へ

ベータ分布の挙動②

α = 0.5, β = 0.5 → 逆正弦分布と等価?逆正弦分布: http://physnotes.jp/stat/asin_d/

β固定、 α 変化 →  α 大きくなる  → 平均が 1へ

ベータ分布の挙動③

極めて多様な分布形状をとることができるのが特徴参照: http://www.ntrand.com/jp/beta-distribution/

使用例:広島大学平川先生の資料より拝借 ( ベータ分布とは: http://www.slideshare.net/makotohirakawa3/nituite)

ベルヌーイ・二項分布におけるパラメータの場合が多い

書籍内での例:故障率

•見たいパラメータ=故障率• M個中 Y個故障 ×N品目

イメージ図 [N = 1 :アンパン ]

モデル式θ ~ Beta(α 、 β) #故障率パラメータ

Y ~ Binomial (M, θ)

ジャムおじさんのパン工場

3つのアンパンと1つのこげパン

ジャムおじさん ( データ生成源 ) に関する事前情報を設定可能

• 書籍では N品目間の違いから弱情報事前分布をイメージ+設定

あのおじさんムラがはんぱないよね。

→ α 、 β にちょっとした情報を載せた解析

も可能まぁ、基本的には我々が科学的な用途で用いる場合、無情報を設定しましょう。

かばおくんリアルなジャムおじさん

カテゴリカル分布、多項分布、

ディリクレ分布

基本的に…

カテゴリカル分布・多項分布・ディリクレ分布

これらの分布はベルヌーイ分布・二項分布・ベータ分布を拡張した

ものです。

これらが分かっていれば理解は比較的簡単…なはず!!

分布間の関係参考: http://machine-learning.hatenablog.com/entry/2016/03/26/211106

?共役=尤度関数 ( データ ) と掛けて事後分布を求めると関数系が同じになるやつ

カテゴリカル分布

カテゴリカル分布とは

•k の目が出る確率 ( 生起確率 ) がような K面を持つサイコロの分布

6.5  カテゴリカル分布

• 確率質量関数

• Categorigal () = k

※Categorigal () ≠ Bernoulli ()

カテゴリカル分布•パラメータ: K の整数  θ =長さ K のベクトル、各要素は [0,1] の 範囲の実数で合計すると 1 になる。•範囲: y = 1,2, … K のいずれかの整数• 平均: I[y = k] の平均 =• 分散共分散: I[y = k] の分散=  I[y = k] と I[y = k’] の共分散 (k ≠ k’) =

I[y = k] は y = k となる場合に 1 を返し、それ以外は 0 を返す関数

カテゴリカル分布の例

•右図: K=5, = (0.1, 0.2, 0.25,0.35, 0.1)T

• 確率なので合計は 1

使用例:ソフトマックス回帰

•店 A に 3つの商品 (チョコ、飴、グミ ) があるとする (K = 3) 。

•その選択に関わりそうな説明変数=性別のみとする。 すると以下のモデル式が提案可能。

• μ[n] = a + b*Sex[n] n = 個人• θ[n] = softmax (μ[n])    = ベクト

ル• Y[n] ~ Categorical(θ[n])

長さ K のベクトル= 3商品の選択に関する線形結合

※softmax 関数= exp を用いて [-∞, ∞] をとりうる値を正の値にしてから、合計が 1 になる

(カテゴリカル分布にあう ) ように規格化するもの

多項分布

多項分布とは

• k の目が出る確率がような K面を持つ (カテゴリカル分布に従う ) サイコロ投げを N回行ったときの、各目の出る確率を示す分布

• イメージ:二項分布の拡張 ( ただしK=2 の多項分布= y1, y2 をカウント⇔二項分布=生起回数のみカウント )

6.6  多項分布

• 確率質量関数

• Multinomial () =

多項分布•パラメータ: K の整数、  N =正の整数  θ =長さ K のベクトル、各要素は [0,1] の 範囲の実数で合計すると 1 になる。•範囲: y =長さ K のベクトル。各要素は 0,1,

… N のいずれかの整数で合計すると N になる• 平均: yk の平均 =N• 分散共分散: yk の分散=  yk と yk’ の共分散 (k ≠ k’) =

多項分布の例

N=3 = (0.3, 0.3, 0.4)T

( 参照  http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/statdist.html

使用例•N が与えられたカテゴリカル分布、で OK ⇔ 試行回数 1 の多項分布=カテゴリカル分布

•実際、平均や分散などもカテゴリカル分布のやつに N がかけられてるだけ(本参照)

(ベルヌーイ・二項分布も同じ関係

式的な差異

•カテゴリカル分布

•多項分布

試行回数の要素

中身はほぼ一緒

ディリクレ分布

ディリクレ分布とは

=ベータ分布の多変量版。多項・カテゴリカル分布の共役事前分布 

=「合計すると 1 になる確率のベクトル」を生成する分布。

ゆえに重要!

6.7  ディリクレ分布

• 確率密度関数

• Dirichlet () =

正規化定数 カーネル

Q. 正規化定数?カーネル?A. 前者は積分を 1 にするための定数 ( 定義は本家 )

 後者は確率分布の本質的な部分

ディリクレ分布•パラメータ: K の整数、  α =各要素は正の実数。•範囲: θ =長さ K のベクトル。各要素は

(0,1) の範囲の実数で合計すると 1 になる• 平均: θk の平均 =sum

• 分散共分散:

θk の分散= / θk と θk’ の共分散 (k ≠ k’) =

※とする

視覚化① ( 参照: http://y-mattu.hatenablog.com/entry/2016/03/03/143451

• 我々にぎりぎり可視化できる 3次元の図

α が高い=確実性が高い

視覚化②•歪んだパラメータ

平均をとると、 (0.09, 0.23,0.68)=わー!確率になります!!

使用例:多項・カテ分布のパラメータ θ ベクトル生成

• θ をデータから推定する。 α は固定値を与えることもあれば、データから推定することもある。

• ディリクレ分布=どんな形のサイコロを生成しやすいかを決める分布ともいえる。

具体例

•店 A の例 (3商品:チョコ、飴、グミ ) でいうとグミだけ選ばれやすい α の事前分布の例は以下。

• θ = Dirichlet (α1 = 1, α2 = 1, α3 = 8)• Y ~ Categorical(θ)

チョコ 飴 グミ

指数分布

指数分布とは

• 事象の生起間隔 ( ある事象が起こって次にまた発生するまでの間隔 ) の確率

•ランダムなイベントの発生間隔を表す分布

6.8  指数分布

• 確率密度関数

• Exponential () =

超参照 ( 指数分布とポアソン分布のいけない関係 ) :http://www.slideshare.net/teramonagi/ss-11296227

※ 本家では λ ではなく β ですが、後でポアソン分布との関係をわかりやすくするためあえて λ としています。

指数分布

•パラメータ: の実数•範囲: y = y 0≧ の実数• 平均: 1/λ• 標準偏差: 1/λ

ただ一つのパラメータだけで特徴づけられる

パラメータはいつも一つ+コナン君

指数分布の例

指数分布の無記憶性

•無記憶性を持つ連続型の確率分布• Pr(y > s+t | y > t) = P(y > s)

•次に事象が発生するまでの時間 は今まで待った時間と関係ない

指数分布の擬人化

記憶なくす人

無記憶性の例

Pr(y > s+t | y > t) = P(y > s)

例 : 指数分布に従うワイングラス が壊れるまでの時間→ 3年 (t) 使っても壊れない → その先 1年 (s+t) で壊れる確率 = 使い始め 1年 (s) で壊れる確率

2日連続で記憶失う人

データ・使用例

•パラメータ λ の解釈=ある時間中における事象の平均生起回数

 → 事故・地震の発生間隔など

• 正の実数を持つパラメータを生成する分布として使うことも( 10 章参照

計算してみる

• 1 時間に平均 5 人が訪れる Webサイト→  次の訪問者が来るまでの間隔が 12 分  である確率を求めよ• λ = 5, y = 12 / 60 を公式に代入

• 確率“密度”= 1 を超える

tera-monagi 様の資料より参照: http://www.slideshare.net/teramonagi/ss-11296227

ポアソン分布

ポアソン分布とは

• 単位時間 (1 時間・ 1秒間など ) 当たりのある事象の生起確率

• 単位時間あたり平均 λ回起こるランダムな事象が単位時間中に y回起こる確率=

6.9  ポアソン分布

• 確率密度関数

• Poisson () =

参照= tera-monagi 様の「指数分布とポアソン分布のいけない関係」: http://www.slideshare.net/teramonagi/ss-11296227

ポアソン分布

•パラメータ: の実数•範囲: y = 0,1,2… のいずれかの整数値• 平均: λ• 標準偏差:√ λ

ただ一つのパラメーターだけで特徴づけられる

パラメータ=平均なので「パラメータ λ のポアソン分

布」or 「平均 λ のポアソン分布」

呼び方

ポアソン分布の例

λ = 2.5

ポアソン分布の再生性

• 同じパラメータ λ のポアソン分布から確率変数 y1 と y2 が生成される

 → y1 + y2 は Poisson (λ1 + λ2) に従う

とあるアカウントがつぶやくパラメータ= 1 時間当たり2.5

y1 y2 y1+y2+ =2 時間に 5回

4 時間に 10回

6 時間に 15回

指数分布とポアソンの関係①

• 単位時間あたり平均 λ 回起こるようなランダムなイベントに対して、

1 .一単位時間にイベントが起きる回数は平均 λ のポアソン分布に従う。

2 .イベントの発生間隔は平均 1 / λ の指数分布に従う。

指数分布とポアソンの関係②

同一のある“事象”に対して•ポアソン分布=単位時間当たり平均 λ 回     → 回数に注目

• 指数分布=平均 1/λ 単位時間に一回     → 時間に注目!

シミュレーションは tera-monagi 様の資料を参照(指数分布とポアソン分布のいけない関係 ) : http://www.slideshare.net/teramonagi/ss-11296227

二項分布とポアソンの関係

•N が大きく、 θ が小さい二項分布 → ポアソン分布に近似!!

証明の仕方は各自ググるなり、以下のスライドを参照するなりしてください( itoyan110 様の「ベルヌーイ分布からベータ分布までを関係づける」 http://www.slideshare.net/itoyan110/ss-69491897

すごーいって言ってるサーバルちゃん

正規分布とポアソンの関係

•λ が大きいポアソン分布 → 正規分布に近似!!

証明の仕方は各自ググるなりしてください

すごーいって言ってるサーバルちゃん

データ例①

• 1 日の間に観測される動物の個体数、 1時間の間に届くメールの数 ( 指数分布の解説も含むよい例が以下のサイトに (

http://www.ntrand.com/jp/poisson-distribution/) ) 、これらは背後に指数分布に従うイベントが考えられる。

例は「馬に蹴られてポアソン分布」でググれば一番上にでてきます (2017.2月現在 ) 。

データ例②

•マンボウが卵を生んで、成魚になる数、これは背後に二項分布があって、 N が大きく θ が小さいと考えられる。

使用例

•カウントデータに対して使う場合が多い

• 具体的な例は 5-4

ガンマ分布

ガンマ分布とは?

•流れ星の例で考える•流れ星が α個観測されるまでの時間 → ガンマ分布

 =母数 β の指数分布に従う事象が α回  生じるまでの時間の分布

お笑い芸人の流れ星のプロフィール画像

6.10  ガンマ分布

• 確率密度関数

• Gamma() =

正規化定数 カーネル

正規化定数の定義は本家を参照

ガンマ分布

•パラメータ: α (shape), β (rate) の実数•範囲: y =正の実数• 平均: α/β• 標準偏差:√ α/β

他の分布との関連

• おなじく流れ星の例

• 単位時間あたりに流れる流れ星の数 → ポアソン分布

•流れ星が初めて観測されるまでの時間 → 指数分布

まとめ

ポアソン分布=回数、指数・ガンマ分布=時間に注目

ただし、指数分布の場合は最初の観測まで。ガンマ分布は α回数観測までの時間、ゆえに α が 1 の場合は指数分布と定義式が一致する(本書参

ガンマ分布の例

α固定で β 大きく → 平均が小さく

ガンマ分布の再生性

• ( 一部の分布同様 ), 同じパラメータ β のガンマ分布から確率変数 y1 と y2 が生成される

 それの和 →  Gamma(α1 + α2, β) に従う

具体

例を説

明で

きな

いベジ

ータ

思い浮かばなかっただけ。

データ例: 広島大学山根先生の資料より拝借 (ガンマ分布: http://tyamane1969.net/?p=97)

使用例:引き続き同資料より抜粋

• 正の実数を持つパラメータを生成する分布として使うことが多い。具体例は 10 章を参照。

正規分布

正規分布とは

•平均値 μ から正負の両方向に均等に広がる分布

• 色んな現象が N増やしたら概ね正規分布に近似する ( 中心極限定理 ) 、様々な分布と関連するなど、とにかく人気の分布・統計学における金字塔(多分

6.11   (みんな大好き ) 正規分布

• 確率密度関数

• Normal() =

正規分布

•パラメータ:実数、 σ =正の実数•範囲: y =実数• 平均: μ• 標準偏差: σ

親の顔よりも見慣れた景色

正規分布の再生性

• 確率変数 y1 ~ Normal(μ1, σ1) と y2 ~ Normal(μ2, σ2) が独立で生成される → その和= Normal(μ1+ μ2, √ σ1 + σ2) に従う• 例:子供の身長+タケノコ

μ1 =100

μ2 = 30

+ =μ1 + μ2 =130

データ例

• 色々。生成メカニズムがよくわかんなくてもとりあえず正規分布をあてはめることが多い。優秀すぎる。

• モデリングでは個人差や潜在変数なども正規分布を仮定する。

正規分布の特徴

• ±2σ を超えたあたりから、確率密度関数の値が小さくなる(=裾が短い)

 → 外れ値に弱い → 後述するコーシー・ t 分布を使う ここら辺 ここら辺

使用例

• 5-1 の重回帰

• グループ差や個人差が正規分布に従うと仮定する階層モデルを 8 章で扱う。

• また、 y 0≧ の部分だけを取り出して正規化する半正規分布はパラメータの弱情報事前分布として用いる場合が多い (10章

こういう教材もあります。※キモオタ以外のご視聴はお勧めしておりません。

• ニコニコ動画より「月読アイの理系なお話『神様が愛した正規分布 [ 前編 ]』」

対数正規分布

対数正規分布とは:

• 対数正規分布の名前=“ある確率変数が対数正規分布に従うとき、その対数をとった確率変数は正規分布になる“という性質に由来する

広島大学山根先生の資料より拝借 (Hirodai.stan 発表非公開資料

「どういうことだってばよ?」って言ってる忍者

つまり

•「低い値に分布が集中するが、まれに高い値も生じる」データ

 ⇒ 対数正規分布

6.12  対数正規分布

• 確率密度関数

• LogNormal() =

対数正規分布

•パラメータ:実数、 σ =正の実数•範囲: y =実数• 平均: exp(μ + σ2 / 2)• 標準偏差: exp(μ + σ2/2) √(eσ2-1)

対数正規分布の例

データ例・使用例

• 人間の体重、年収の金額など

• 上記のデータのほか、正の実数値をとるパラメータの弱情報事前分布として利用( 10 章参照

多変量正規分布

多変量正規分布とは

• 正定値対称行列である分散共分散行列を含む、 2つ以上 (m次元 ) の正規分布の同時密度関数である (多分 ) 。

2 変量の場合の例

6.13  多変量正規分布

• 確率密度関数

• MultiNormal() =

多変量正規分布•パラメータ:数、  μ =長さ K のベクトルで各要素は実数、  Σ = K×K の対称な正定値行列 ( 分散共分散行列•範囲: y =長さ K のベクトルで各要素は実数• 平均: yk の平均= μk

• 分散共分散: yk の分散= Σk,k

  yk と yk’ の共分散 (k ≠ k’) = Σk,k’

正定値行列=すべての固有値が正の実数であること、らしい。

ここがキモ!

分散共分散行列:二変量の例

x1 =横軸:一次元目の正規分布

x2 =縦軸:二次元目の正規分布

※多変量正規分布は m次元正規分布

他にもいろんな特徴が

•再生性あり 腕が生えてるピッコロさん

すごいぞ!多変量正規分布!

•多変量正規分布に従う確率変数を線形結合 → 多変量正規分布に従う

•周辺化する → 多変量正規分布

•各変数の条件付き分布 → 多変量正規分布

驚いてる犬

余談Q. 周辺化?A. 同時確率を足し合わせて特定の確率変数を消すこと。

Q. 条件付き確率?A. ある事象 Y が起こるという条件の下で別の事象 X が起きる確率: P(X|Y)

黄線のx1 の分布

p124 の例

データ・使用例

•相関しそうなデータ

• 例:小学生の 50m走のタイムと走り幅跳びで飛んだ距離を並べたベクトルの分布

• 本書では 9.3.1項から扱っていく。

コーシー分布

コーシー分布とは

•時々とんでもない外れ値を出すことがある裾が重い分布 ( シミュレーション例:山口大学小杉先生の「 Cauchy 分布について」参照 http://www.slideshare.net/KojiKosugi/cauchy20150726)

⇒ この性質がモデリングに重宝

6.14  コーシー分布

• 確率密度関数

• Cauchy() =

コーシー分布

•パラメータ: μ =実数、 σ =正の実数•範囲: y =実数• 平均:存在しない(正確には定義されない• 標準偏差:存在しない

コーシー分布の例

μ = 0, σ = 1 ⇒ 標準コーシー分布(自由度 1 の t 分布)

使用例

• 分散パラメタの事前分布としてCauchy (0, 2.5), Cauchy (0, 5) など

• 外れ値を含むモデルとしてごくまれに出現する外れ値を許容するモデル y[n] ~ cauchy (a + b * X[n], σ)

Cf. y[n] ~ normal(a + b * X[n], σ)

広島大学平川先生の資料より拝借(Hirodai.stan 発表非公開資料

7.9節へ

Student の t 分布

Student のt分布とは

• 正規分布する母集団の平均と分散が未知で標本サイズが小さい場合に平均を推定する問題に利用される分布

•自由度によって裾の長さは大きく変化する。

  ⇒ この性質がモデリングに重宝

6.15   Student のt分布

• 確率密度関数

• Studen_t() =   

Student のt分布

•パラメータ: ν =正の実数(自由度  μ =実数、 σ =正の実数•範囲: y =実数• 平均: ν > 1 の場合は μ 、それ以外は存在しない

• 標準偏差: ν > 2 の場合は σ√ν/(ν-2).   1 < ν 2≦ の場合は∞、それ以外の場合は 存在しない。

Student のt分布の例

自由度 (ν) によって裾が変化!!

使用例

• コーシー分布ほどではないが、裾の重い分布を使いたいときに自由度2~8程度の t 分布が重宝される。

• ( コーシー同様 ) 外れ値を含むモデルや、回帰係数の弱情報事前分布として使う場合も。 7, 10, 12 章参照

二重指数分布(ラプラス分布)

ラプラス分布とは

•正規分布と比べると裾が長め+ μ を中心とした鋭いピークを持つ分布

6.16  二重指数分布 (ラプラス分布 )

• 確率密度関数

• DoubleExponential() =

• 指数分布を二つ貼り合わせたような分布=二重指数分布

← p75

ラプラス分布

•パラメータ: μ =実数、 σ =正の実数•範囲: y =実数• 平均: μ• 標準偏差:√ 2σ

ラプラス分布の例

ラプラス分布のデータ例:下図

鼻が尖ってる人

使用例

•鋭いピーク → 回帰係数の事前分布に設定  → 変数選択に適用可能

具体例は 7 章にて。

R での作り方:http://cse.naro.affrc.go.jp/takezawa/r-tips/r/60.html

このパッケージも推奨

逆ガンマ分布など本章にない確率分布もrIGAMMA(n, mu, sigma) などで簡単に求まります。

まだまだあるぞ!モデリングで用いる分布!!

=ウィッシャート君:p, n, Σ をパラメータとして持つ分布の分布を表すモデル (wiki)

おわりに

• 以上で 6 章で紹介された分布の解説を終わります。

• 関数同士の関係、累積分布関数、算出過程などの詳細は本家と同様に省いています。各自色々な資料を参照してください。

• 以下では個別学習に役立つと個人的に感じているものをさらに 2つ紹介します。

1 .確率分布の包括的理解に

• Lawrence et al. (2008: title=Univariate Distribution Relationships)

• http://www.math.wm.edu/~leemis/chart/UDR/UDR.html

分布同士の関係が見れたり、分布の詳細を見れたり出来るゾ!

2 .物足りないあなたへ

•世界最大級のオンライン学習プラットフォーム Udemy で Tamaki 先生が「ベイズ推定とグラフィカルモデル」というガチ講義を開講されています。

• 分布の知識から、コンピュータ科学への応用までお話ししてくれて興奮します。

本資料の一部もこれを参考にしてます!

Enjoy R & Stan !And… Bayesian Modeling!!

参考文献①•当然アヒル本•各ページに記載されてる URL や資料•各分布の Wiki• ややこしい離散分布に関するまとめ

http://machine-learning.hatenablog.com/entry/2016/03/26/211106

•多項分布とディリクレ分布のまとめと可視化http://y-mattu.hatenablog.com/entry/2016/03/03/143451

参考文献②

• 松尾太加志・中村知靖( 2002 ) 誰も教えてくれなかった因子分析-数式が 絶対に出てこない因子分析入門- 北大路書房

• 村山先生による ANOVA に関する解説http://koumurayama.com/koujapanese/anova.htm

• 様々な確率分布 probability distributions - 数理的思考 - 中川雅央 【知と情報の科学】 http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/statdist.html

top related