~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/car.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基...

14
CARモデル ~空間的自己相関を考慮した統計モデル~

Upload: others

Post on 07-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

CARモデル~空間的自己相関を考慮した統計モデル~

Page 2: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

未知の要因によって空間的に近いところほど類似する傾向

⇒空間的自己相関

どうやってモデルに組み込めばよいのか?

Page 3: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

既知の要因の効果と同時に未知の効果を推定できるモデルが必要

~ + +

分布データ 係数1×要因1 係数2×要因2 係数3×要因3

+ 定数項+ ? 未知の効果

(空間的ランダム効果)

既知の要因(固定効果)

※空間的ランダム効果の平均は0に固定

(全体の平均を自由に変えることは、定数項を変えるのと同じ)

Page 4: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

ランダム効果

+

-

空間的ランダム効果: 測定できなかった環境要因、限られた散布能力などの効果の総和⇒近い場所ほど似たような値をとりそう

例:ベルトトランセクト上のランダム効果(平面だと作画しにくいため)

近い場所に似ていない=でこぼこ

近い場所に似ている=なめらか

Page 5: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

なめらかさをどう表現するか?ランダム効果 +

-

• 両どなりの平均との差でなめらかさを表現

両どなりの平均

両どなりの平均との差

条件付き分散小:なめらか

条件付き分散大: でこぼこ0

•差の頻度分布の分散(条件付き分散)を変えることで、滑らかさの程度を制御する

Page 6: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

平面上のなめらかさ

平面上では、周囲4セルまたは8セルを「となり」と定義し、その平均との差を考える場合が多い

Page 7: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

あてはまりとなめらかさのトレードオフ

● ●

● ● ●在

不在 ● ● ● ●

● ●

● ● ●在

不在 ● ● ● ●

● ●

● ● ●在

不在 ● ● ● ●

でこぼこ

なめらか

トランセクト上の在不在データを、空間的ランダム効果だけで説明してみる (説明を単純にするため、固定効果は無いと仮定)

当てはまりよい

当てはまり悪い

Page 8: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

あてはまりとなめらかさのトレードオフ

● ●

● ● ●在

不在 ● ● ● ●

● ●

● ● ●在

不在 ● ● ● ●

● ●

● ● ●在

不在 ● ● ● ●

でこぼこ

なめらか

トランセクト上の在不在データを、空間的ランダム効果だけで説明してみる (説明を単純にするため、固定効果は無いと仮定)

当てはまりよい

当てはまり悪い

トレードオフ

Page 9: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

当てはまり×なめらかさ・当てはまりの良いモデルを得たい

・未知の要因は空間的になめらかであってほしい

当てはまりの良さ×なめらかさ⇒モデルのよさの指標

この指標が大きくなるようなモデル

⇒適度に当てはまりがよく、適度になめらかなモデル

● ●

● ● ●在

不在 ● ● ● ●

Page 10: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

CAR(条件付自己回帰)モデル

~ + +

分布データ 係数1×要因1 係数2×要因2 係数3×要因3

+ 定数項+

空間的ランダム効果CARモデルの推定では、当てはまりの良さ×なめらかさが大きくなるように、各要因の係数、定数項、条件付き分散、全てのセルのランダム効果の値を同時に推定する

※CARモデルにもいろいろなものがあり、ここで紹介したのはその一種である「Intrinsic Gaussian CARモデル」と呼ばれているもの

Page 11: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

どこがベイズ?

尤度 × 事前確率∝事後確率

ベイズの定理

比例する

•事後確率が高くなるパラメータを推定するのがベイズ推定

モデルの良さ⇒当てはまりの良さ×なめらかさ

※事前確率はなめらかさだけでなく回帰係数や条件付き分散のパラメータの事前情報も含むため厳密な説明ではないが、普通それらは無情報とするので影響はほとんどない

Page 12: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

なめらかさを表す事前確率とは?

平均0, 条件付き分散が小さいほどとなりの地点間でのみ高い相関を持つ多変量正規分布から、全ての地点のランダム効果の値が同時に得られる確率

おのおののセルのランダム効果の値がとなりの平均に近いほど、この確率は高くなる

ランダム効果 +

- 両どなりの平均

Page 13: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

CARモデルのグラフィカルモデル

データ 在不在または個体密度

既知の要因 地点の位置情報

パラメータ

超パラメータ(パラメータを制御するパラメータ)

条件付き分散

個々の地点の空間的ランダム効果回帰係数

定数項

出現確率または平均個体密度

グラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基づいて要約したもの

ハイパー

Page 14: ~空間的自己相関を考慮した統計モデル~tombo.sub.jp/doc/esj55/CAR.pdfグラフィカルモデル:複雑な構造を持つベイズモデルをデータ、パラメータの関係に基

CARモデルの推定

• 推定には、マルコフ連鎖モンテカルロ法を使用⇒企画集会の後半で紹介

• フリーソフト”WinBUGS”で推定できる(http://www.mrc-bsu.cam.ac.uk/bugs/)

– S言語似の書式でモデルを記述– Rのパッケージ”R2WinBUGS”を使えば、データの準備、モデルの構築と推定の操作をRからできる