バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2...

53
バイオロギングデータの 解析方法 水産総合研究センター 遠洋水産研究所 岡村

Upload: others

Post on 29-Jun-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

バイオロギングデータの 解析方法

水産総合研究センター

遠洋水産研究所

岡村

Page 2: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

今日の話

• 統計モデル概観・最尤法,ベイズ法・仮説検定~モデル選択(AIC)

• 移動データの分析・

フラクタル次元

First-Passage Time・

Lévy walkモデル

状態空間モデル ~ スイッチングCRWモデル

• まとめ• 参考文献

Page 3: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

統計モデル

• P(x|θ)真の状態θからサンプルxを生成.

目的:xから真の状態θを推定してやる(逆問題).

例題1:森の鳥の数を数えました.

Aさん: 47,Bさん: 54,Cさん: 37森にいる鳥の数は何羽でしょうか?

解答:平均とって(47+54+37)/3 = 46羽統計モデル的でない

Page 4: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

統計モデル

統計モデル的解答:

鳥の数の観測はポアソン分布

P(x|θ) = exp(-θ)θx/x!に従うとする.

θの最尤推定量は平均なので,

θ(真の鳥の数)

= (47+54+37)/3 = 46羽

Page 5: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

0 20 40 60 80 100

-700

-600

-500

-400

-300

-200

-100

0

θ

log-

likel

ihoo

d

最尤法

P(x|θ)をθの関数とみなして,L(θ|x)=P(x|θ)が最大となるθを最も尤もらしい値として採用

する.

図1. さっきのポア ソンモデルの例

パラメータに対する対

数尤度曲線

MLE

Page 6: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

ベイズの公式

条件付確率

P(X, Y) = P(X|Y)P(Y) = P(Y|X)P(X)

ベイズの公式:

P(θ|x) = P(x|θ)P(θ)/P(x) ∝ P(x|θ)P(θ) (P(θ) ~ 1なら,P(θ|x)=尤度に等しい)

P(θ|x) = P(原因|結果) = P(結果|原因)P(原因)/P(結果)結果(データ)から原因(パラメータ,仮説)の推測へ

サンプル 自然現象

Page 7: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

θ

Prob

abilit

y

ベイズ法

• 最尤法ではパラメータをfixして考えたが,ベイ ズ法ではパラメータも確率変数と考える.

P(θ), P(θ|x)などは最 尤法では意味がない.

ベイズ法では,事前の 確信P(θ)がデータxを 得ることによってより確 信度の高いP(θ|x)に修 正される,というようなイ メージ.

事前分布

事後分布

Page 8: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

ベイズ法の利点

• 事前分布の使用

間接情報,専門家の意見などを取り込める

(しかし,諸刃の剣)

• 予測

p(y’|y) = ∫p(y’|θ)p(θ|y)dθ• 解釈の自然さ・理解しやすさ

• WinBUGSこれらはすべて反論されうる(e.g., Lele & Dennis 2009)

Page 9: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

事後分布からサンプルする

Pr(θ1 , θ2 , θ3 , …)θ1は重要.あとは必要だけど直接的じゃないというようなとき,

P(θ1 |x)=∫⋯∫P(θ1 , …, θn |x)dθ2 ⋯

dθn を計算したい.

モンテカルロ近似

(f(X)) = ∫f(x)π(x)dxを計算したい

(1/N)Σf(x(i)) → Eπ

(f(X)),

x(1), …, x(N) ~ π(x)

π(x)からデータを取り出せれば良い.しかし,状況が複雑に

なってくると,目的の確率分布からランダムにデータを取り出す

のは難しくなってくる

→ Sequential Monte Carlo, MCMC, etc.

Page 10: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

最尤法とベイズ法

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

Den

sity -4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

Den

sity

x

Freq

uenc

y

-4 -2 0 2 40

5000

1000

015

000

最尤法 ベイズ法

Page 11: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

2つの個体群トレンドデータ

2 4 6 8 10

0.0

1.0

2.0

Population 1

Year

Rel

ativ

e Po

pula

tion

Siz

e

2 4 6 8 10

0.0

1.0

2.0

Population 2

Year

Rel

ativ

e Po

pula

tion

Size

r = -0.02 (年に約2%減)

P-値 0.04 (t-検定)

r = -0.06 (年に約6%減)

P-値 0.23 (t-検定)

有意差のあるなしで,Pop. 1は減少している危険な個体群,Pop. 2は減少しているとは

言えない安心個体群と評価して良いだろうか?直感的にはPop. 2の方が危険そう.

Page 12: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

事後分布

事後確率 r < - 0.05 - 0.05 ≤ r < 0.0 r ≥ 0.0Population 1 0.000 0.996 0.004Population 2 0.604 0.361 0.035

Decision r < - 0.05 - 0.05 ≤ r < 0.0 r ≥ 0.0 E(Loss) forPop. 1

E(Loss) forPop. 2

Rapid decline 0 0.5 1 0.502 0.216

Slow decline 0.5 0 0.5 0.002 0.320

No decline 1 0.5 0 0.498 0.784

-0.20 -0.15 -0.10 -0.05 0.00 0.05 0.10

Posterior density

Den

sity

Population 2 Population 1

Page 13: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

階層ベイズモデル

P(parameters, process|data)∝P(data|process, parameters)×P(process|parameters)×P(parameters)

P(θ, φ, x|y) ∝P(y|x, θ)P(x|φ)P(θ)P(φ)

φ|x

θ,| xy

)(~ θθ P)(~ φφ P

Data

Process

Parameters

http://cse.fra.affrc.go.jp/okamura/bayes/index.html

Page 14: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

仮説検定

例題2:森の鳥の数を数えました.

青い鳥:Aさん: 47,Bさん: 54,Cさん: 37赤い鳥:Aさん: 55,Bさん: 54,Cさん: 59 青い鳥と赤い鳥の数に差はありますか?

解答(尤度比検定):

H0:

赤と青の鳥の数は等しい

H1:

赤と青の鳥の数は異なる

Page 15: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

仮説検定

解答(尤度比検定続き)

H0モデル:

θ1 = θ2

H1モデル:θ1≠θ2

LL0 <- sum(log(dpois(c(55,54,59,47,54,37),(56+46)/2)))LL1 <-

sum(log(dpois(c(55,54,59),56)))+sum(log(dpois(c(47,54,37),46)))1-pchisq(2*(LL1-LL0),1)[1] 0.0860954 # 5%より大きいので有意ではない

Page 16: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

AICはKL距離(の相対値)の期待値の推定量

AIC = -2log(L(θ*|x))+2Kθ*: MLE,K:パラメータ数

モデル1 g1 (x)

情報量規準 ~ AIC

0.0 0.5 1.0 1.5 2.0 2.5 3.0

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

θ

Prob

abilit

y

0.0 0.5 1.0 1.5 2.0 2.5 3.00.0

0.1

0.2

0.3

0.4

0.5

0.6

θ

Pro

babi

lity

0.0 0.5 1.0 1.5 2.0 2.5 3.0

0.0

0.2

0.4

0.6

0.8

θ

Pro

babi

lity

0.0 0.5 1.0 1.5 2.0 2.5 3.0

0.0

0.2

0.4

0.6

θ

Pro

babi

lity

真のデータ発生分布 f(x)

モデル2 g2 (x)

モデル3 g3 (x)

KL2 ~ AIC2

KL1 ~ AIC1

KL3 ~ AIC3

Page 17: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

AICの良いとこ

• 仮説検定はnest(

)している必要があるが, AICはnestの必要ない

• 有意か有意でないかという2者択一的考えの回避

• 多重比較(検定の繰り返し)の問題の回避

• 計算が容易

しかし,仮説検定の価値を否定するものではない

(e.g., Stephens et al. (2005) J. Appl. Eco. 42: 4-12)

10 H H ⊂

Page 18: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

ラッコの成長分析の例

ラッコの死体から,外部形態の測定(e.g. 頭長)

を行った.

各部位の成長と体長の成長との関係(相対成

長)を調べよ.

また相対成長に雌雄差はあるか?

清田ら (2008) 哺乳類科学 48 (2): 255-263.

Page 19: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

ラッコの成長分析の例

モデル: アロメトリー式

Y = bXa

Y:各部位の大きさ(cm),X: 体長(cm)

a = 1:等成長

a > 1:優成長

a < 1: 劣成長

ある部位は等成長か優成長か劣成長か?また,それ らは雌雄で異なるか? (nest していない複雑な仮説群)

Page 20: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

ラッコの成長分析の例

フルモデル: glm(log(y) ~ sex+log(x)+sex:log(x))性で同じ:glm(log(y) ~ log(x))性でbは異なるが,aは同じで等成長(a=1):glm(log(y) ~ sex+offset(log(x)))

性でbは異なり,aは雌では等成長: glm(log(y) ~ sex + offset(log(x))+I(sex*log(x)))

などなど

各モデルのAICを比較.nestなしや多重比較の問題の回避.

Page 21: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

Akaike weightモデル1のAIC = AIC1モデル2のAIC = AIC2

モデル1のAkaike weight = exp(-0.5AIC1 )/{exp(-0.5AIC1 )+exp(-0.5AIC2 )}

parameter数が等しいとき,尤度の相対比

例題2に対してAkaike weightを計算:AIC0 <- -2*LL0+2*1AIC1 <- -2*LL1+2*2> c(exp(-0.5*AIC0),exp(-0.5*AIC1))/(exp(-0.5*AIC0)+exp(-0.5*AIC1))[1] 0.3839175 0.6160825

Page 22: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

Rフリーの統計ソフト.多機能.例:最初の図1を描くpar(mar=c(5,5,3,3),las=1)f1 <- function(x) log(dpois(c(54,47,37),x))x1 <- seq(0,100,by=0.1)y1 <- colSums(sapply(x1,f1))plot(x1,y1,xlab=expression(theta),ylab="log-

likelihood",cex.lab=2)mle1 <- x1[which(y1==max(y1))]abline(v=mle1,lty=2,lwd=2,col=2)

Page 23: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

WinBUGS

フリーのMCMC計算ソフト.

プログラムコードはRと似ている.

R2WinBUGSなどを使ってRとリンクさせること

が可能.

Page 24: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

トラッキングデータ

• 動物に記録装置をとりつけて,移動に関する 情報(ある時間間隔ごとの位置や周囲の環

境の情報,何かイベント(採餌とか)が起こっ たときの時間など)を収集する.

Archival tag(記録型標 識):標識内にデータ蓄 積機能を有し,水温,水 深,照度を一定時間間

隔で記録する.

Page 25: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

トラッキングデータ解析の目的

•動物はどのような移動をしているか?

環境との交互作用,資源選択(生息地 選択),(時)空間分布,進化的応答(生 活史戦略,行動戦略),系統群,メタ個

体群,個体群管理・保護,…

Page 26: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

トラッキングデータの解析方法

1. フラクタル次元

2. First-Passage Time3. Lévy walkモデル

4. State-Space ModelSchick et al. (2008) Ecol. Let. 11: 1338-1350

Page 27: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

ランダムウォーク

x <- 0move.x <- rbinom(1000,1,0.5)move.x <- 2*(move.x-0.5)x <- x+cumsum(move.x)par(mfrow=c(1,1),mar=c(5,5, 5,5))plot(x,type="l",lwd=4,col=1,xl ab="Time",ylab="x",ylim=c(- 50,50),main="Random Walk“)

Page 28: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

フラクタル次元

考え方:動物がブラウン運動(ランダムウォーク の極限)している場合,どの場所も等しく通過す る可能性を持つので,移動軌跡の次元は2であ る.直線の場合は次元は1である.棒切れで,

移動軌跡の長さを測るという問題を考える.直 線ならどんな棒を使っても必ず同じ長さとなる. ブラウン運動の場合,棒が短いと(軌跡は複雑

なので)測定距離はどんどん長くなる.この考え を使って,移動軌跡の特徴を抽出する.

Page 29: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

フラクタル次元

L(λ) = kλ1-d

λ:物差しの長さ,L(λ):λで測った移動距離, d:フラクタル次元

(1 ≤

d ≤

2)

いくつかのλで移動距離を測ってやって, log(λ)に対してlog(L(λ))をプロット.傾きの大

きさ

1-dを計算してやる.

d = 1なら直線,d = 2ならブラウン運動.

Page 30: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

フラクタル次元分析の例

体サイズが小さい種のフラクタル次元は大きい傾向

フラクタル次元による方法はTurchin (1996)により批判された.でも,まだ

広く使用されている.

Page 31: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

First-Passage Time

考え方:軌跡の各点を中 心に半径rの円を描く.そ の円から最後に出て行っ た時間と最初に入ってき

た時間との差を考える. もし,ちょこまかジグザグ 移動していたら,半径の

大きい円を描くほど,こ の時間差は(指数的に) 長くなる.

Page 32: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

First-Passage Time

S(r) = Var[log t(r)]r:円の半径,

t(r): forward/backward FPTの差

半径を小さくするとlog t(r)は各点で似たような 値に,逆に大きくしてもlog t(r)は似たような値に

→ S(r)が最大になるようなrがあるはずだ.

S(r)のパターンから移動軌跡の特徴を抽出.

Page 33: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

FPTの例

S(r)

= Var[log t(r)]

r

Fauchald & Tverra (2003) Ecology 84: 282-288.

Barraquand & Benhamou (2008) がFPTを批判.

Page 34: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

Lévy walkモデル

移動の軌跡のstep長はpower law分布に従う

1 < μ ≤ 3:μ → 1:直線,

μ ≥

3:ブラウン運動

Viswanathan et al. (1996) ワタリアホウドリはLévy flight行動をしている

Viswanathan et al. (1999) μ= 2が餌探索に最適な 行動になっている.マルハナバチや鹿でもμ=2に近い.

μ−llP ~)(

Page 35: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

世の中power lawだらけ

Newman (2005)

Page 36: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

Power lawと生態系ネットワーク

• Power-lawネットワークはランダム除去には 強いが,選択的除去には弱い.

除去される種の割合

絶滅確率

Sole & Montoya (2001)

Page 37: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

Power lawの解析

• log-logプロットを描いて直線になるかどうか.

Logarithmic binning

Cumulative histogram

Page 38: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

Edwards et al. (2007)の批判

• Viswanathanが用いたワタリアホウドリのト ラッキングデータは島にいた時のデータを

誤って含んでいた.

Viswanathanデータ

補正したもの

Page 39: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

Edwards et al. (2007)の批判

• 他のモデルと比較してみると,Power lawが 尤もらしくもない

Page 40: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

Sims et al. (2008)

• 海洋生物の鉛直移動データはLévy walkに なっている.

Page 41: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

より詳細な分析へ

In Travis (2007) Science 318: 742-743:Lévyフライトモデルは少しこじつけっぽい.

Lévyフライトモデルや他のランダム探索モデル は動物が知能や経験に基づいて行動している

という事実を軽んじているのではないか?

-Steve Bucklandより詳しい分析ができる統計モデルへ

また海洋データは誤差が特に大きい

Page 42: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

状態空間モデル

• State-Space Model

Xt-1 Xt Xt+1

Yt-1 Yt Yt+1

プロセス方程式:

Xt = G(Xt-1 , wt )

観測方程式:

Yt = F(Xt , vt )

前の状態に依存:非独立性

Page 43: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

移動の状態空間モデル

ランダムウォークモデルは正規分布と関係して

いる.移動の最も単純なモデルは,次のような

状態空間モデルで書くことができる.

推移モデル

αt+1 = αt + ηt

観測モデル

yt = αt + εt

ηt ~ N(0, ση2), εt ~ N(0, σε

2)(ここで,それぞれは二次元ベクトル(緯度,経度)である).

Page 44: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

動物の移動を扱うモデル

• CRW(correlated random walk)モデル

0 < r < 1は前の速度の影響の大きさを決めるパラメータ.r = 0ならば,シンプルなランダムウォークと一致する.

⎟⎟⎠

⎞⎜⎜⎝

⎛+⎟⎟⎠

⎞⎜⎜⎝

⎛−−

⎟⎟⎠

⎞⎜⎜⎝

⎛ −+⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

+

+

ty

tx

tt

tt

t

t

t

t

yyxx

ryx

yx

,

,

1

1

1

1

cossinsincos

ηη

θθθθ

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛2

2

,

, ,00

~latlatlon

latlonlon

ty

tx Nσσρσσρσσ

ηη

前の位置 前の速度方向の変化

Page 45: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

スイッチングモデル

動物の行動によって移動のパターンは変わる

であろう

例:

索餌の時:角度を頻繁に変える,その 場所にとどまる

移動の時:角度を比較的一定に保ち,速 く移動

Morales et al. 2004, Jonsen et al. 2005

Page 46: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

スイッチングモデル

2つの行動パターンがあるとする

Pr(B1,t |B1,t-1 ) = α1

Pr(B2,t |B1,t-1 ) = 1-α1

Pr(B1,t |B2,t-1 ) = α2

Pr(B2,t | B2,t-1 ) = 1-α2

B1,t = B2,t = 1 or 0, B1,t + B2,t = 1先のCRWモデルで,行動パターンの違いはr,θの違いとして

表現される

⎟⎟⎠

⎞⎜⎜⎝

⎛−−

=⎟⎟⎠

⎞⎜⎜⎝

−−

−−

21

21

1,2,21,1,2

1,2,11,1,1

11)|Pr()|Pr()|Pr()|Pr(

αααα

tttt

tttt

BBBBBBBB

Page 47: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

例データ

-10 -5 0 5

010

2030

x

y

黒はあまり角度を 変えないmigration

status

赤は探索のためあ ちこち動き回る

foraging status

Page 48: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

階層ベイズモデルによる推定結果

-10 -5 0 5

010

2030

x

y

●:真の位置×:観測位置黒:回遊赤:索餌

真値(1:回遊,2:索餌)r1 = 0.8, r2 = 0.3θ1 = 0.03, θ2 = -1.8 α1 = 0.8, α2 = 0.1σlon = σlat = 1ρ = 0.7τ = 1

推定値(中央値)r1 = 0.90, r2 = 0.19 θ1 = 0.02, θ2 = -1.95 α1 = 0.80, α2 = 0.12σlon = 0.85, σlat = 0.97ρ = 0.49τ = 1.00

Page 49: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

環境データによる移動経路の推測

0 100 200 300

1618

2022

2426

28

0m

Day

Tem

pera

ture

0 100 200 300

-50

510

1520

25

80m

Day

Tem

pera

ture

0 100 200 300

-10

-50

510

1520

25

80m

Day

Tem

pera

ture

アーカイバルタグに記録された水温

データをcorrelated random walkを 用いた状態空間モデルで分析

(WinBUGS使用)

メカジキは夜間しか浮上しないので照度データが得られず,移動経路不明

120 130 140 150 160 170 180

1020

3040

Long

Lat

MCMC:

single- component Metropolis- Hasting法

海洋観測データ

アーカイバルタグデータ

メカジキ移動経路

Okamura et al. unpublished

Page 50: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

まとめ

• トラッキングデータの分析方法

~ Random Walk.

• Fractal次元,FPT,

Lévy walk,SSM• SSMは計算は困難だが,MCMCなどの武器

が開発されている

• さらに,それらを利用できるソフト(R,WinBUGS) が無料で入手可

• http://cse.fra.affrc.go.jp/okamura/main/index.html

Page 51: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

参考文献

• 統計推測基礎蓑谷千凰彦の本.

分かりやすい.入門.竹村 (1991) 現代数理統計学.

良書.難しい.Casella and Berger. (2001) Statistical Inference.

説明丁寧で分かりやすい.しかし,専門的.

• 統計モデル一般自然科学の統計学.

良書.結構,難しい.丹後 (2000) 統計モデル入門. 朝倉書店.

良書.しかし,難しい.Burnham and Anderson (2002) Model Selection and Multimodel Inference.

好き嫌いはあるだろうが,持っておかなければならないだろう.

• ランダムウォーク・移動寺本 (1999) ランダムな現象の数学.吉岡書店.

良書.丁寧な説明,品のある装丁.

Page 52: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

参考文献

• Lévy flight関係

Newman (2005) Power laws, Pareto distributions and Zipf’s law.素晴らしいレビュー.必読.

Viswanathan et al. (1996, 1999), Edwards et al. (2007), Sims et al. (2008) Natureに載った一連の論文

Reynolds and Rhodes (2009) Ecology 90: 877-887. 最新のレビュー.

Page 53: バイオロギングデータの 解析方法cse.fra.affrc.go.jp/okamura/memo/biologging.pdf0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 θ Probability ベイズ法 • 最尤法ではパラメータをfixして考えたが,ベイ

参考文献

• State-Space ~ CRW ~ Switchingモデル

Morales et al. (2004) Ecologyスイッチングモデル

Jonsen et al. (2003, 2005, 2006, 2007)SSM ~ CRW ~ SCRW

Schick et al. (2008) Eco. Let. 11: 1338- 1350. 最近のレビュー.