7.1 introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/ch7.pdf7.1...

12
1 2007/06/12 James Samuel Clark, Alan E. Gelfand 7 時空間統計モデルと環境プロセスの予測 (separable model) (stationary) (orthogonal) # 7.1 Introduction to spatial-temporal processes(時空間プロセスへの導入) MM5* *MM5 5th Generation Mesoscale Model Z D d sn s1 sn D T tn t1 tn T =(s,t) ^(d+1) d +1 Z(s,t) = Z( ) Z( ) Z 1 2 ( 1- 2) Z( ) cov{Z( ),Z( )} = C( 1- 2) C 2 2 ….. C( 1- 2) | 1- 2| Z( ) (isotropic) CS( ) CT( ) , T m m S n n V=(vij)m m U=(uij)n n

Upload: others

Post on 12-Mar-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 7.1 Introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/Ch7.pdf7.1 Introduction to spatial-temporal processes( 時空間 ... ... K

1

ベイズ輪読会 2007/06/12 山北 剛久 環境科学のための階層モデリング(James Samuel Clark, Alan E. Gelfand 編)

第 7 章 時空間統計モデルと環境プロセスの予測 時空間が分解可能なモデル(separable model)や、時空間構造が変化しないもの(stationary)を扱うのに強力なツールが地球統計学や時系列の分野には存在する。しかし、現実には分解できることはめったに無い。ここでは最近の時空間モデルをレビューし、不安定、分解不能な時空間プロセスについて、局所の安定、時空間過程と分解可能性を仮定しない直交な(orthogonal)混合モデルとして紹介する。また、ベイズ時空間予測のための、一般的な枠組みを提供する。実際にはこの方法をチェサピーク湾の風分布のモデルと予測に使用し、その結果、観測値によって風況の数値予想を改善した。 #勉強会での議論:クリーキングの知識が前提としてないと式の理解が難しく、また、キーとなる式がよくわからないために全体として、ポイントが見えづらい章でした。こういう予報への応用が使えそうという程度の理解でよいのでしょうか。

■ 7.1 Introduction to spatial-temporal

processes(時空間プロセスへの導入) 三次元で予測する時空間モデルの例に MM5*のようなものがある.このようなデータの解析には、セル間の空間の依存性を考慮する必要がある。さらに風況の場合は時間的にも独立でない。空間、時間相関を考慮した確率モデルを開発するにはどうしたらよいか? *MM5とは: 5th Generation Mesoscale Model.世界で最も多く利用されていると推定され,韓国、モンゴル、米国空軍等では予報業務のモデルとして使用されている.オープンソースの非静力学気象モデル. □定義:

Z:時空間プロセス D:対象とする空間(時間により d 次元内で変化) sn:地点(s1・・・sn∈D) T:対象の時間 tn:ある時間(t1・・・tn∈T) s=(s,t)∈R^(d+1) 時間と空間を表すベクトルsを d 次元+1 乗の実数空間内に定義。 Z(s,t) = Z(s) □弱い定常性のある場合

Z(s)が有限の2次のモーメントの時、関数は定数となり、Z の共分散はs1 からs2 の間の分離ベクトル(s1-s2)のみに依存する。ゆえに、Z(s)は弱い定常性の時空間過程といえ

cov{Z(s1),Z(s2)} = C(s1-s2) が成り立ち、点1と点2の共分散は点1-点2の共分散関数 C で表現できる。 →このことは、2 点におけるプロセスの値間の関係は場所と独立に 2点間の距離のベクトルのみに

依存することを意味する。…..しかし、いつも定常性が仮定できるわけではない。 □非定常で距離に比例する関数を持つ場合

C(s1-s2)がユーグリッド距離|s1-s2|にのみ依存すると仮定。この場合 Z(s )は等方向(isotropic)になる。

と書ける時に、CS( )は純粋に空間の共分散、CT( )は時間の共分散であり、時間と空間を分解できる。この時、別々にモデル化できること、計算がしやすいことなどのメリットがある。

ここで全時空間のZZZZを以下のように表示し、

Z,Σの共分散行列は共分散行列のクロネッカー積として書ける

ΣT は m×m の時間共分散行列 ΣS は n×nの空間共分散行列。 V=(vij)m×m U=(uij)n×n のクロネッカー積は以下の用に定義される。

これから、逆行列と行列式を容易に決定できる。 Σの逆行列は

Page 2: 7.1 Introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/Ch7.pdf7.1 Introduction to spatial-temporal processes( 時空間 ... ... K

2

Σの行列式は

しかし、時間と空間の構造を分割したモデルはいつも妥当とは限らず、時空間の相互作用が必要な場合がある。7.2 で時空間モデルの一部をレビューし、7.3 で非定常で分解不可能な時空間モデルを提示し、7.4 で異なる時空間データを合成したベイズ時空間予測を解説し、7.5 で風況への応用を示す。

■7.2 Recent approaches to

spatial-temporal process

(時空間プロセスへの近年のアプローチ) 時空間のモデルにも色々ある。古くは定常状態を仮定していたが、非定常状態を扱うものも多くなってきている。ここでは最尤推定法を用いたもの(7.2.1)、移動窓法を用いたもの(7.2.2)、ベイズ推定を用いたもの(7.2.3)、カルマンフィルターを用いたもの(7.2.4)、最後にいくからの時空間共分散モデルをレビューする。 ■■■■7.2.1 Maximum likelihood method (最尤推定最尤推定最尤推定最尤推定法法法法(Mardia and Goodall 1993) ) 場所がまばらで,長い時系列の場合に最尤推定法を多変量の時空間データへの適用した.m個の変数のある時空間データ Z を、m次の実数空間上にあらわす。 Z = Z(s,t)∈RRRRm 場所が興味のあるドメインの時に以下のように表記され,t が時間を示す. D⊂RRRRd このとき Z はつぎのように書くことができる

ここで, E(Z(s,t)) = μ(s,t)、 mのセットはトレンドサーフェイス、 εは平均0の共分散Σを伴う 2次の安定時空間ガウス過程. 時間を空間内の繰り返し測定データとしてその影響を除去する.そして,共分散Σの推定に,最尤法を適用する.得られた(7.1)式は以下の多変量

の空間モデルとみなすことができる. Z(s)=μ(s)+ε(s) モデルのトレンドはトレンドサーフェイスと同じ形状を仮定することで単純化されている.つまり、μ(s)=βTfとおき,fは係数βを伴う空間的場所の多項式関数とする. ここから共分散は次のようにモデル化される

ΣSは空間の共分散でΣVは多変量成分のための共分散行列. 最尤推定を繰り返しのアルゴリズムで計算し多変量予測を行う.その際空間の共分散には時空間の等方向性を必要としており,地理的空間から等方向性の空間へデフォルメを用いた方法についても議論がされている. 時間が等間隔である場合,このモデルに時間を入れることができる.

ΣTは時間の共分散行列. しかし、この式では時間と空間が分解可能な仮定の下に表現されており,時空間が従属的なモデルは扱えない. ■■■■7.2.2 Moving window method

(移動窓法移動窓法移動窓法移動窓法 after Haas(1990)) 空間的に静的でない状態を仮定し,Moving

Window Regression Residual Kriging(MWRRK)とし,その後次のように、非定常の時空間動態に拡張した。 ある空間の場合,各予測点の周りの円形の部分からのサンプルに限定して予測する(図 7.1).時空間の場合には予測点s0=(s0,t0)に対する円柱状の範囲になる. 円柱は次のように構成されている、まず、時間窓(t0-(mT/2),t0+(mT/2);mTは時間窓の幅の変数)の中からデータを選び、次にその窓の中で、空間の点を s0に近い順に一定のサンプリング率に達するまで選ぶ ( nc = nfc nはデータ数で fcはサンプリング率)。時間窓の幅(円柱の高さ)とサンプルリング率は、局所の時間的安定性や空間の均一性とともに一貫している。この方法を Moving cylinder spatial

temporal Kriging(MCSTK)と呼ぶ。

MCSTK は 2段階の非線形回帰で構成され、まず

Page 3: 7.1 Introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/Ch7.pdf7.1 Introduction to spatial-temporal processes( 時空間 ... ... K

3

各予測シリンダーの回帰モデルは以下である。

ここで、 s=(s,t)、μはβを変数にとる平均関数、 R(s)は安定の時空間残差過程、ψ(...)不均一な残差の分散。

2 つの段階は次のとおりである。まず、時空間の平均モデルの最小二乗法の残差を用いて、サンプルの時空間セミバリオグラムを算出する。時空間の分解可能なセミバリオグラムモデルをサンプルのセミバリオグラムに重み付け非線形最小二乗法(WLS)でフィットする。フィットされたセミバリオグラムのモデルは2次の一般化最小二乗法(GLS)の中で共分散行列にフィットされた。この段階からの残差は WLS 法を経由した2次の共分散構造の推定に使用された。これらの2つの段階では、不等分散の残差分散の関数ψ(・)は 1つであると仮定されている。 第 2段階からの平均と共分散の推定結果は予測に使われた。予測は推定された平均の合計と、推定されたψの乗算。そして、予測点 s0 で、通常のクリキングを行った。このψは s0 の近くで見られた 2段階目の残差のサンプルの分散から求められた。 □この手法の課題

MCSTK過程は各予測円柱の局所プロセスを定義するために、グローバルモデルが十分定義されない。ゆえに、グローバル共分散モデルは存在しない。すべての予測点について時空間のペアワイズ共分散行列を得ることができるが、それが正定値行列である保証がない。これに対して Haas は元の共分散の正ではない固有値を小さな正の値で置き換えることで、正定値行列を得た。これはペアワイズ共分散行列に近い近似である。予測場所の窓を動かすことで移動窓法は非定常性を扱った。しかし、正定値共分散行列を全サイトについて導くことは困難だった。 ■■■■7.2.3 Baysian method (ベイズベイズベイズベイズ法法法法) ベイズの方法は異なるスケールのモデリングに理想的である。また、興味のある量の事後分布を提供し、共分散構造を推定する最尤推定よりも完全な尤度地形を考慮する。時空間の階層的なベ

イズモデルにはいくつか例があり例えば、Wallerら(1997)の疫病の地図化がある。また複数人から一連の論文が大気科学分野で出ており、ここでは、Wikle ら(1998)のモデルを紹介する。

Y(s,t)がある時空間プロセスの値と仮定する。

s,t は時空間の格子ΜΜΜΜに含まれる( (s,t) ∈ ΜΜΜΜ) 解析は以下の 5段階で進められ、確率密度関数と条件付確率密度を Table7.1Table7.1Table7.1Table7.1 にまとめてある。 ■1 第一段階:測定 観測値を Z とすると誤差のモデルは[Z|Y,θ1] となる(θ1 は変数の集合)。時空間プロセス Y とθ1の条件下で Z(s,t)は独立で、Z(s,t)は平均 Y(s,t)分散σst2 の正規分布に従う(この場合θ1 は分散の集合)。 ■2 第二段階:大・小スケールの特性 海洋や大気は強い季節変化と地域の構造が期待されるため、次のモデルがそのプロセスと特に関係するとされる。

Y はμ,β,X={X(s,t):(s,t)∈ΜΜΜΜ} の 3 つのプロセスと変数の集合θ2 の条件下にあるとし、次の時空間の点とする。

ここで、 μ(s)は全時間の場所の平均、 Μ(…)はサイトごとに変数β(s)をもつ大スケールの時間モデル。 ν(s,t)は平均 0のランダム値のノイズ。

X のプロセスの役割は時間・空間の動態を長期間の平均と季節を越えて説明するプロセスである。 X のようなモデルの特性がνのプロセスの多くを説明するため、νをモデル化する代わりに、すべての条件に独立なランダム変数と仮定でき、Y は次のようなガウス分布となる。

■3 第三段階:空間の構造と動態 θ3の下で相互独立な各点の集合μμμμ,ββββとXを定義。 全体の空間構造を捉えるため、[μμμμ|θμ][ββββ|θβ]について空間モデルを考える。X には実験的/物理的動態のモデルが適用でき、最も一般的な [X|θ

Page 4: 7.1 Introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/Ch7.pdf7.1 Introduction to spatial-temporal processes( 時空間 ... ... K

4

X] の例は条件付ベクトル自己回帰モデルである。 ■4 第四段階:変数の priors すべてのモデル変数の prior をこの段階で特定する。θ4 をハイパーパラメーターとして、[θ1,θ2,θ3|θ4]を特定するために、まずθ4=(θ4(1),θ4(2),θ4(3))として各ステージと関連付けすると便利で、条件付独立性は式のようになる。

さらに stage3からθ4(3)はθ4(3)=(θ4(μ),θ4(β),θ4(X))と分けられ、次の条件付独立性が仮定される。

■5 第五段階:ハイパープライヤー 最後にハイパーパラメーターのプライヤーを定める。Stage4 から普通以下のようになる。

この式はθ1 とθ2 のプライヤーの分布が既知であるとすると、関連するθ4(1)とθ4(2)の項が空になり単純化される。 この階層的アプローチは柔軟なモデル作成できる。科学的知見をモデルに入れる自然な枠組みだけでなく、科学的推論に使うための興味のある量の事後分布を得るためにも使用できる。さらに、異なるソースのデータを統合するメカニズムもベイズ法にはある。しかし、時空間依存性のための共分散構造を見つけることが困難である。 ■■■■7.2.4 カルマンフィルターカルマンフィルターカルマンフィルターカルマンフィルター法法法法 時空間をモデルする多くの統計では決定論的な時空間の傾向と、ランダムな効果を時間、空間、時空間について考える。しかし、データが高次で複雑な動態の時にはこの方法は限られている。 そのため時間と空間を記述した統計モデルを作るほうが自然である。 時間動態と空間を記述した統計モデルを使用し、次元を減少する時空間予測の方法を Wikle とCressie1999 が提案している。この数式は観測方程式(measurement equation)を含み自然に時空間のカルマンフィルターが導かれる。データはZ(s1,t1)...Z(s1,tT)...Z(sn,t1)...Z(sn,tT)と仮定され、観測可能な連続的空間のプロセスから得らる、こ

の Z の観測プロセスを次のモデルとする。

εはエラー、γは背後の観測不可能な時空間プロセス。

7.2 式の観測できないプロセスγについては 7.3式でモデルする。ここで、以下を完全な直交の決定論的バイアス関数とする。 φ(s) = (φ1(s)…φp(s))T a(t) = (a1(t)…ap(t))T・{φi(・): i = 1,2,・・・・}

aj(・)は時系列。 ゆえに、背後のプロセスγは p個の支配的構成要素、φ(s)T a(t) の分解足す、時間構造を持たない小さなスケールの変動を示す分散δ(s,t)の要素

(空間的に説明される要素)でモデル化された。δと反対にφ(s)T a(t)は状態方程式 7.4 にしたがって徐々に発展することが仮定されている。 Φ=(φ(s1)...φ(sn))Tと定義すると、J =(ΦT Φ)-1 ΦTの p×n 行列となる(n は行列数)。 オペレーターH はアップデートの枠組みを提供する、H が p*p 行列で H=J B のとき、B は行列の未知の状態変数である。 η(t)=(η(s1,t)...η(sn,t))'と、η(s,t)は空間相関の誤差のプロセスである。加えて、εプロセスはすべてと無相関である。

時空間のカルマンフィルターの目標は、見えないプロセスγをデータ Z が与えられた状態で、予測することで、最適な予測値は E(γ(s0,t0)|Z)である。 ガウス分布の仮定のもと、この条件付の期待値は線形である、また帰納的な数式と、次元の減少を通して、効果的に得られる。 整数値 p が減少すると、予測の誤差の傾向はより単純なクリキングの分散に近づく。詳細は Wikleと Cressie1999参照

Mardia ら(1998)は時空間カルマンフィルターを2 つの式で表した。

h は直交である必要はない、

Page 5: 7.1 Introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/Ch7.pdf7.1 Introduction to spatial-temporal processes( 時空間 ... ... K

5

ξは一般の時空間エラー(7.3 式のδと同じ)。

Mardia らモデルに基づく予測は前述の Wikle とCresie のモデルの背後にあるプロセスの構成要素に h(s0) T α(t0)の部分である。つまり Mardiaらの予測は慣らされ過ぎているだろう。

Wikle と Cressie の方法は 7.4 式を通じて直接物理動態をモデルできた。そしてその動態が H とΙの構造を決定した。それゆえ、前の節で述べたように、プライヤーの情報を科学的知識に基づき与えれば、完全な階層ベイズの実行が可能である。しかし、式 7.4 ではδは時間的に相関していると仮定しているがそれはいつも現実的ではない。

7.3 節に提示する新しい統計のモデルはここのカルマンフィルターと同じ様式で構成されている。大スケールの構造を時空間動態の関数である係数を伴う共分散の関数としてモデルした。しかし、そこでは新しい非定常の分割できない共分散モデルを小スケールの時空間構造を考慮するために導入した。この新しい共分散モデルは 7.3 式のδの時空間構造の変わりになる表記である。7.4節では、ベイズ法の枠組みを新しいモデルの変数を推定するために提示する。これは、予測への直接 の 解 決策 と な るだ ろう 。 そ こ で は 、E(Y(s0,t0)|Z)の期待値を予測値として持たない代わりに事後予測分布を使用する。 ■■■■7.2.5 Models for nonseparable stationary

spatial-temporal covariance

(分割不可分割不可分割不可分割不可なななな安定時空間共分散安定時空間共分散安定時空間共分散安定時空間共分散モデルモデルモデルモデル) この節では、分割不可能な安定の時空間共分散モデルを扱う。パラメトリック共分散モデル開発の一般的なアプローチは、時空間共分散構造のスペクトル表示である。まず、安定の時空間共分散C(h,u)を以下のようにして、

h が d 次元の空間ベクトル u が時間要素のスカラーとし、

w が d 次元、t がスカラーの時、 関数 g(w,t)は共分散関数Cのスペクトル密度とする。関数 g は t においてスカラーのフーリエ変換

として書かれる。

逆に

7.7 と 7.8 式を合わせて、

次のステップでは

k(w)は純粋に空間過程のスペクトル密度、 ρ(w,u)はuの中での各wに対する適当な時間自己相関関数

7.9 、 7.10 の 2 式で、どんな時空間共分散関数もかける。また、以下の条件を課すことができる。 1、各 w,ρ(w,μ)は連続な時間自己相関関数、ρの積分は無限より小、k(w)は 0 より大 2、k(w)の積分は無限より小 これらの条件下では、次の一般式になる

w とρが独立の時(7.11)は分解可能なモデルに縮小される。ここで 7 つの特別なケースがある。例えば、

条件δ> 0は条件Ιがw=0を満たすことを確実にするために必要である。しかし、(7.12)の極限δ→0 も確実な時空間共分散関数であり以下の 3 つの変数群を導く、

Cressie と Huang のこの方法は強力で斬新だが、Rd内のフーリエ変換のペアに依存する。

Gneiting2002 はこの制限を避けて、一般的に有効な時空間共分散モデルを作成した。そのキーは以下である。

Page 6: 7.1 Introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/Ch7.pdf7.1 Introduction to spatial-temporal processes( 時空間 ... ... K

6

ψ(t), t ≧ 0, を完全な単調関数として、 φ(t), t ≧ 0 を完全な単調導関数を伴う正の関数とする。

7.13 は時空間共分散関数で、h∈R^d は d 次元のべくトル、u∈Rをスカラーの時間要素。

ψとΦを次のようにすると、

(7.13)は次のようになる。

このとき、(h,u) ∈ RRRRd × RRRR 純粋な時間の共分散関数との積は

この時、(h,u) ∈ RRRRd × RRRRで、a と c が負でない時空間スケーリング変数である、平滑化変数αとγは次の値をとる。[0,1]; β∈[0,1] , δ≧0 , σ2>0 βが 0 の時に分割可能な共分散関数が得られる。

■7.3 New models for nonseparable and

nonstationary processes

(分割不可で非定常プロセスの新モデル) ■■■■ 7.3.17.3.17.3.17.3.1 Mixture of local stationary Mixture of local stationary Mixture of local stationary Mixture of local stationary spacespacespacespace----time modelstime modelstime modelstime models Fuentesらの一連の研究が新しいモデルを提案している。それは局所の直交安定過程の混合である。この考えをわれわれは非定常時空間過程に一般化する。 非定常で分割不可能な Z(s)を仮定し、s=(s,t)を直交安定時空間過程の混合とする。

点 siはサブ地域 Siの中心で,{S1...Sk}を Di×T の興味のあるドメインとする。 分割することによって、Si の集合はドメインとなり(Ui=1k Si = D×T)、 Si と Sj とに共通するものはなく(Si∩Sj=φ)、 各 i と Zi はサブ地域 Si を

説明する安定な時空間過程となる。

K(s-si)は時間と空間のカーネル関数である。カーネル関数は Zi(s)にさらに重要な役割を果たす。s が sj に近いときに重要で、離れたときはあまり重要でなくなる。

7.14 の特殊な場合として、時空間プロセスが安定な場合を次の式で表す。(7.3.2 で使われる)

Zi がサブ地域 Di*T の局所の安定時空間過程の場合、K(s-si)は Di の重心 si を中心とした重み付け関数である。

7.14の特殊な場合の2つ目に、空間的に安定で、時間的に不安定な場合を次の式で表す。

ここで、Zi は局所の安定時空間過程で 7.15 と同様、K(t-ti)は Ti の重心 ti を中心とした重み付け関数である。 □k の決め方 (7.5 で使用する。)

k は安定なサブ地域の数であり、AIC か BIC を用いて選択される。ほかにも k を決める方法はいくつかある。 □7.14 に対応する関数。(分解可能な場合)

7.14 の Z を与えて、対応する共分散関数は

Zi に対応する Ci は安定共分散関数。分解可能性のテストを各 Ci の時空間依存性を調べるために行った。分解可能であれば、Matern モデルを空間の共分散に、指数モデルを時間に適用する。

Matern モデルは次の式で与えられる。

Κvは補正されたベッセル関数

||・||はユーグリッド距離を示す。 σ2はプロセスの分散、 r は自己相関の幅 v は空間の過程と関係するスムーズさの度合い(v が大きいほどなだらか)

Page 7: 7.1 Introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/Ch7.pdf7.1 Introduction to spatial-temporal processes( 時空間 ... ... K

7

Matern の共分散モデルは空間的共分散構造の一般クラスで、たとえば、v = 1/2 のとき、指数的な共 分 散 関 数 と な り ま す 。( C(s) = σ 2

exp(-||s||/r) )7.18 は v が大きくなるほど、ガウス分布に近づきます。 □分解可能でなかった場合 もし分解可能性の検定が Ci を分解できないとなった場合次のものを使用する。

Κviは補正されたベッセル関数 vi,σi,ρi,ri は共分散ベクトル変数で、安定性の欠如を説明するために場所ごとに変化する。 ri はレンジと呼ばれ、距離にしたがって相関がどのくらいなくなるのかを示す。 σ2iはランダムな分散で、var(Zi(s,t))であり、シルに相当する。 viは局所の安定な Ziでのスムーズさの度合い。 ρiは時空間のドメイン間での変化による回転係数 この Ci に関するパラメトリックなモデルは、d+1時限の Matern の共分散に時空間ドメインを外挿するρi を追加したものに相当する。

MCSTK と比べて、このモデルは同時にどこでも定義され、分解可能性を考えない。 ■■■■7.3.27.3.27.3.27.3.2 Spatial Spatial Spatial Spatial----temporal trendtemporal trendtemporal trendtemporal trend 時空間時空間時空間時空間ののののトレンドトレンドトレンドトレンド 前の節では平均 0 の分割不可能で非定常な時空間過程を紹介した。 ここでは、場所により変わる係数を伴う共変量を用いて、大スケール構造の時空間モデル(すなわちトレンド)を提供する。 一般的に、時空間過程は以下で与えられる

s は d 次の実数の集合 D に含まれ、t は実数の集合 Tに含まれる。 関数 u(s,t)はトレンドサーフェイスを示す。 残差 e(s,t)は平均0の小スケールの時空間構造を示す。e(s,t)には前節で示された統計モデル(7.15)が使える。 ここで、Z の大スケールの構造(トレンド)を時空間"動態"統計モデルを用いて示す。

この時

{fi}は時空間で変化する係数βi を伴う g 個の共変量 g はたとえばサインコサインや地理的データ 全体の時間要素を ri,t とし、時空間過程を ri(s,t)という形で、階層的なモデルで、係数βi をモデルする。

このとき

ηと u は独立のホワイトノイズ過程と仮定し、ri,tも ri(s,t)も一次の自己相関モデルの形である。

基本的にβi で代表される大スケールの構造を2 つの要素であらわす。1 つ目は全体の効果、2つ目は各サブ地域の違いである。サブ地域はe(s,t)のモデルを用いているので、まずトレンドサーフェイスは単純に 7.20 に代入して以下に示す。

ここで、Sj,j=1...k は e(s,t)のモデルに定義されるサブ地域。 ゆえに、単純化した{Z(s,t)}のモデルは次式、

(←7.15 より) Zj はサブ地域 Di*T 内の平均 0 の安定時空間過程。 K(s-si)は、Di の重心siに中心を持つ重み付け関数。 {fi(s,t)}は g の既知の共変量

■7.4 Combining spatial-temporal data

時空間データの統合 観測値はある場所ごとの風速をあらわし、MM5 では格子グリッド内の平均風速をあらわすように、異なる時空間解像度でのデータを統合する方法が必要である。 この問題には背後の真実をモデル化するベイズ推定法が理想的な方法である(Fig 7.2)。

Page 8: 7.1 Introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/Ch7.pdf7.1 Introduction to spatial-temporal processes( 時空間 ... ... K

8

異なるソースのデータは異なる時空間解像度があると仮定してこの章の議論を進める。 ■■■■7.4.1 Statistical models for disparate spatial

temporal data 不揃不揃不揃不揃いないないないな時時時時空間空間空間空間データデータデータデータののののモデルモデルモデルモデル 点の観測値と数値計算出力を考える。 □観測値のモデル(7.5.3 で使用) 観測された風速値は計測誤差があるので"グランドツルース"としない (観測値≠真値)。 観測されない背後の時空間プロセス Z(s,t)があり、観測値 Z (s,t)と誤差 e(s,t)があるとする。 ここで、

e(s,t)~N(0,σe2) で、Z(s,t)と独立 Z(s,t)は非定常、分割不可能な共分散を持つ時空間プロセスであり、Z(s,t)は平均値μ(s,t)、共分散 cov{Z(s1,t1),Z(s2,t2)} = C(s1,s2;t1,t2)と共に、

7.3章のモデルを適用できる。 →→→→ □数値計算の出力のモデル(7.5.3 で使用) 数値計算の出力 Z~

(s,t)は次のようにモデル化する。

数値計算の場所・時間で変わるバイアスを a(s,t)「相加的バイアス(additive bias)」((s,t)の多項式として使用)、

b(s,t)「乗法的バイアス(multiplicative bias)、」(定数として使用)とする。 δ(s,t)のプロセスは N(0,σδ2)の正規分布に従い、背後の真の風プロセス Z(s,t)のランダムな偏差をあらわし、Z や観測値の e とは独立。

数値計算(MM5)の出力は観測点ではなく、あるドメイン D のセル範囲を含むグリッドのセルである。そのため B1...Bmの平均値を積分で推定。

a(s,t)の関数は係数 a_0を伴う点(s,t)の多項式、 b(s,t)は未知の定数 b。

■■■■7.4.2 Change of support (担体担体担体担体のののの変化変化変化変化) 点の観測データ Σ {(si,ti),i=1,,,n}と モデルの出力 Σ~ {(Bj,tj),j=1...m}がある グリッドセルの平均値の共分散は

もし、Bi=siの点の時は共分散は

上記のように、数値モデルの出力の共分散は

観測と計算の出力との共分散は

■■■■ 7.4.3 7.4.3 7.4.3 7.4.3 Statistical assessment of Statistical assessment of Statistical assessment of Statistical assessment of numericalmodel performancenumericalmodel performancenumericalmodel performancenumericalmodel performance 数値数値数値数値モデルモデルモデルモデルのののの性能性能性能性能のののの統計的評価統計的評価統計的評価統計的評価 異なる時空間スケールの観測値と数値計算の出力とをどう比較するか? 観測値と数値モデル出力によって与えられた事後分布の予測とを比較する。 点のデータ: モデルの出力: 数値モデルの出力に基づいて、次の事後分布から観測値をシミュレートした。

7.23 7.25 のθの下でのΣ~ とΣの同時確率分布を推定する

ここで、ΣとΣ~ はそれぞれ、ΣとΣ~ の共分散、Σ~ˆ はクロス共分散。多変量正規分布の共分散を(Σ,Σ~ )T

Page 9: 7.1 Introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/Ch7.pdf7.1 Introduction to spatial-temporal processes( 時空間 ... ... K

9

とする。Σは(n+m)×(n+m)の行列。

(Mardia etal 1979)の結果より、Σ~ の条件下でのΣの条件付分布は次の正規分布である。 平均: 分散: ゆえに、

■■■■7.4.47.4.47.4.47.4.4 Baysian spatial temporal prediction Baysian spatial temporal prediction Baysian spatial temporal prediction Baysian spatial temporal prediction ベイズベイズベイズベイズ時空間予測時空間予測時空間予測時空間予測 我々の目的は、空間 s0,時間 t0 の Z での量をZ , Z

~ の条件の下で予想することである。データを与えた時の Z(s0,t0)についてここで考える。 ZZZZ=( Z , Z~)のデータと全変数θが与えられた時の

Z(s0,t0)について条件付分布が必要である。

P(Z(s0,t0)|ZZZZ,θθθθ)は以下の平均と分散をもつ 平均: 分散:

ゆえに、ZZZZ=( Z , Z~)T を与えた時の事後予想分布

Z(s0,t0)は

変数のベクトルθからの事前分布のシミュレーションに Gibbs sampling が使える。 事後分布は次のように近似される

既にθが変数の集合であるとしたように以下で構成される。θ=(θ1, θ2, θ3) θ1:背後の真プロセスを与えた点観測値の変数 θ2:背後の真プロセスを与えた数値モデル出力の変数 θ3:背後の真プロセスのモデルに使った変数の集合 θの事後分布 P(θ|Σ,Σ~

)は以下

この結果、multiple-stage Gibbs sampling を以下のように行う。1.定常性の無さ(θ3 stage1)、2.観測値の測定誤差(θ1 stage2)、3.数値モデルの出力の偏り(θ2 stage3) ■7.4.4.1 ギブスサンプリング stage1(θ3 定常性の無さ) θ3 について、Stage4で更新される Z の条件付事後分布を得る。 θ3 の事後分布は一度プライヤーを定めれば以下のために完全に特定される、

ここで[]は密度をあらわす。 背後にある時空間過程 Z は 7.37.37.37.3節節節節で提示された 2つの部分でモデルされる。トレンドサーフェイスは既知の共変量 g と共に 7.217.217.217.21 のモデルである。 残差の条件は 7.147.147.147.14 式式式式に示されている。カーネル関数 K(・)とサブ地域の数 k が既知であると仮定する。7.197.197.197.19式式式式に提示されたモデルが分割不可能な共分散 Ci に使われる。分割可能な共分散のためには、7.187.187.187.18式式式式の Matern の共分散モデルと指数モデルをフィットさせる ゆえに、以下のようになる。

Page 10: 7.1 Introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/Ch7.pdf7.1 Introduction to spatial-temporal processes( 時空間 ... ... K

10

変数は互いに独立と仮定し、β1 は平均モデルの全体の効果の g ベクトル。{β2i(s)}i は平均モデルのばらつきを表す変数。σ2(s)は分散。rs(s)は分解可能な共分散関数の時間の幅。ρ(s)は時間と空間の間の単位の変化を考慮するための変換因子で、分解不可能な共分散モデルでは新しい変数となる。v(s)は分解不可能な共分散の平滑化変数で、空間的なスムーズさをあらわす。θ3 のすべての変数はβ1 を除いて空間的に変化する。

Matern の空間共分散とトレンドを伴い空間的に変化する変数をモデル化する。 たとえばσ2を次のようにした

eσ(s)は Matern の共分散を伴う平均 0 の空間仮定で、(sill range v)を変数にもつ。 σ2 の値が正であることを保証するために log をとった。

Table7.2 にこのモデルのプライヤーが与えられている。

{β2i(s)}i、rs(s)、rt(s)、ρ(s)、vs(s)、vt(s)の priorはσ2(s)と同じように与えた。β1 はフラットなプライヤーを伴う g ベクトルの未知の変数。 ゆえに、条件付事後分布θ3 は[Z|θ3][θ3]となる。 ■7.4.4.2 stage2(θ1 観測値の測定誤差) 条件付事後分布θ1 は観測値の測定誤差σe^2 から得られる。 σe2の事後確率は、Z^と Z で与えられ、次の回帰式である。

σ2は e(s,t)の分散で、Z と e は独立。

σe2の事後確率は

となる。 ■7.4.4.3 stage3(θ2 数値モデルの出力の

偏り) 同様に、事後確率θ2 も、a0,b,σ_δ^2 を含み Z~と Z を条件として与えられ、次のように計算できる。

σ2はδ(v,t)の分散で、Z はδと独立である。

この時、 。 従って a0,b,σ2の事後分布の値は次の分布に従う、 このとき

ハイパープライヤーは a0 と b のプライヤーについて以上のように特定される。 ■7.4.4.4 stage4 例として、背後の真の風の値、(si,ti)で、i=1...nの Z の値をシミュレートする。 点観測値 Z と(Bj,tj),j=1...m の数値モデル出力 Z~があり、変数θ3 の条件下での出力Z

~ と、 Z を持つ(stage1)。

m の セ ル でシミュ レ ーション さ れ た 値(Bj,tj),j=1...m は Z の値を各グリッド内のサンプル地点でシミュレートすることで得られ、Z(Bj,tj)は以下で近似される。

vj1, …… vjLは Bj のサンプル地点 このアルゴリズムでは、サブ地域の数を k と固定し、カーネル関数が既知であると仮定している。

k についてのポアソンプライヤーとバンド幅につ

Page 11: 7.1 Introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/Ch7.pdf7.1 Introduction to spatial-temporal processes( 時空間 ... ... K

11

いて無情報のプライヤーを用いて推定した。

■7.5 Application チェサピーク湾の風のデータについてこれまでのモデルを適用することを通じ、湾上の風場の時空間動態を把握すると同時に、MM5 モデルの統計的な評価をし、観測データと数値モデルを合わせてよいモデルとする。 □□□□7.5.1 7.5.1 7.5.1 7.5.1 データデータデータデータについてについてについてについて 2002 年 7 月 21 日を対象。 観測値:Fig7.3 a に示す地点で測定し、10m 標高値に補正 モデル出力:Fig7.3 b の 15km 区画での、MM5 モデルの 30 時間積算値、 □□□□7.5.2 Exploratory analysis7.5.2 Exploratory analysis7.5.2 Exploratory analysis7.5.2 Exploratory analysis((((予備解予備解予備解予備解析析析析))))

MM5 による 2002年 7月 21日の 24 時間の流れのパターン(Fig7.4)(Fig7.4)(Fig7.4)(Fig7.4) : : : :東よりの風がほとんどで卓越し、例外として、3:00(7h 予報)に西からの風と合流が見られるが、6:00(10h 予報)には湾の中央で東西に分かれる流れになり、持続する。 ⇒ 観測では示されている海風循環を MM5 が捕らえている様子はほとんどない。 □□□□7.5.3 7.5.3 7.5.3 7.5.3 風速風速風速風速のののの時空間構造時空間構造時空間構造時空間構造 観測された風速と MM5 からの風速(真の観測されないプロセスの)のモデルを考える。

{Z(s,t) : s ∈ D ⊂ RRRR2, t ∈ T ⊂RRRR} D:空間のドメイン(Fig7.3の範囲) 観測された風速のモデルは(7.23 P1317.23 P1317.23 P1317.23 P131)

MM5 の出力の風速のモデルは(7.25 P1317.25 P1317.25 P1317.25 P131) 非定常で分解不可能な背後の真の風のプロセスモデルは(7.22 P1307.22 P1307.22 P1307.22 P130) (共変量は 1/周期の Sin と Cos の関数を使用。) トレンドサーフェイスを除外したあとの時系列の残差が均一なため、このモデルを使用した。 この時のトレンドは既知の共変量の関数でモデル化され、カーネル関数 K は以下で定義される

このとき K0(s)は2次の重み付け関数

s=(x,y) 場所 si は i 番目のサブ地域の中心 バンドの幅は i 番目のサブ地域の最大距離の半分

□7.5.3.1 風速の非定常性と不可分性 □□□□サブドメインサブドメインサブドメインサブドメインのののの分割分割分割分割 非定常的な環境データを扱う時、まず最初に大気の境界を考え水域と陸域の2つの空間のドメインにわける。風の構成要素μとνおよび、MM5からの 12:00 の風速を用い、K-means クラスター法によって、海・陸内をさらにサブドメインに分割するプロセスを AIC が有意な改善を示さなくなるまで繰り返した。最適なクラスターの数はAIC の基準値から5とされた(Fig7.5Fig7.5Fig7.5Fig7.5)。この地域の配置は妥当であった。また、本来はこの地域も時間変化するが、この調査では安定と考えられた。 □□□□各各各各サブサブサブサブ地域地域地域地域におけるにおけるにおけるにおける前提条件前提条件前提条件前提条件のののの確認確認確認確認

Fuentes 2003のスペクトル法に基づく検定で、各サブ地域内は安定で、地域 4 を除き分割可能だったが、地域1と5は等方向性が得られなかった。これは、距離だけでなく方向による共分散が見られたためで、s=(x、y)の座標を線形変換し(x',y')=(x,y)RT とした。R は回転行列、T は縮小行列(shrinking matrix)である。

□□□□時空間構造時空間構造時空間構造時空間構造のののの推定推定推定推定 ----> (7.4> (7.4> (7.4> (7.4 節参照節参照節参照節参照)))) 7.47.47.47.4 節節節節に提示されたアルゴリズムで、時空間構造を推定した。RとTのプライヤーは[0,π]と[1,5]上の一様分布を用いた。 □7.5.3.2 時空間の傾向 - > (7.3 節参照節参照節参照節参照)

7.37.37.37.3 節節節節を 2 つの部分に単純化して、1)場所によって変化しない全体の時間変化、2)サブ地域ごとに異なるサブ地域内の変動 を考える。 共変量は 1/周期の Sin と Cos の関数を使用し、24時間と 12 時間の周期を日周・半日周期とした。これら2つの部分の事後分布の平均は Fig 7.6Fig 7.6Fig 7.6Fig 7.6 に示されている。 □□□□Fig 7.6 Fig 7.6 Fig 7.6 Fig 7.6 変動変動変動変動のののの実例実例実例実例。。。。 FFFFig 7.6ig 7.6ig 7.6ig 7.6 は、全体の平均風況を示す。最大は日没後、最小は日の出前。1,3 は通常は負の値。4-5は正の値。2 は正負を行き来。日中の最大値は 5が、最小値は 1 が示した。

Page 12: 7.1 Introduction to spatial-temporal processes( 時空 …tombo.sub.jp/doc/bayes/Ch7.pdf7.1 Introduction to spatial-temporal processes( 時空間 ... ... K

12

□7.5.3.3 時空間共分散構造 サブ地域1,2,3、5は分割可能な時空間共分散関数が適合した(Mate'rn covariance modelMate'rn covariance modelMate'rn covariance modelMate'rn covariance model)。サブ地域 4 にはモデル(7.7.7.7.11119999)が適用された。 □□□□シルシルシルシル変数変数変数変数のののの分布分布分布分布 シル変数の事後分布の密度は Fig.7.7Fig.7.7Fig.7.7Fig.7.7 で示すとおりに、サブ地域による違いを反映している。最大の平均値が 4 で、最も均一性が 5 つの中で低い(4は多様な水域)。複雑な表面が大きな空間変動を生み出す。海と陸の異なる熱の影響も低空の大気の安定性の違いを生じる。サブ地域1の空間的多様性はこのためである。シル変数の有意な違いは時空間のドメインにおいて安定性が欠如していることを示すことも注意しておく必要がある。 □□□□レンジレンジレンジレンジのののの事後事後事後事後分布分布分布分布 Fig 7.8Fig 7.8Fig 7.8Fig 7.8 に空間の幅の事後分布のを示す。平均値が最大となるのは 5 であり、海岸に沿った深い海で、空間的連続性を示している。逆に連続性が弱い場所は平均値は低くなる。 □□□□スケールスケールスケールスケール変数変数変数変数

4 には分割不可能な時空間共分散モデル(7.197.197.197.19)が用いられた。Fig 7.9 は変換変数 (ρ)の事後分布を示している。このスケール変数は時空間ドメインによる単位の変化を考慮するものである。 □□□□そのほかのそのほかのそのほかのそのほかの値値値値 Fig 7.10Fig 7.10Fig 7.10Fig 7.10 は平滑化変数を示し、サブ地域によって変わらない値となった。共分散変数の事後平均はTable 7.3Table 7.3Table 7.3Table 7.3 にまとめた。推定されたベイズ共分散のプロットは Fig7.11Fig7.11Fig7.11Fig7.11.... ■■■■7.5.4 MM57.5.4 MM57.5.4 MM57.5.4 MM5 のののの性能性能性能性能のののの統計的評価統計的評価統計的評価統計的評価 MM5 モデルの出力から観測される風の値をシミュレートした(Fig 7.12, 7.13 7.14)。エラーバーはcredible interval、モデルがうまくいっている場合は SD=+-2 のバンド内に落ちる。半分以上がバンドに入らず左よりで、MM5 に過小評価のバイアスがある。 ■■■■7.5.5 7.5.5 7.5.5 7.5.5 風況風況風況風況マッピングマッピングマッピングマッピング Fig 7.15Fig 7.15Fig 7.15Fig 7.15 はもともとの MM5 によるコンター図を示し、観測値(白字)と大きな誤差がある。

Fig7.16Fig7.16Fig7.16Fig7.16 は観測値とモデルの出力を与えた真の背後にある風のプロセスの事後予測分布からシミュレートした風況の予測である。コンターは事後分布の平均値である。