コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β...

21
コンポジット(合成図)解析 3.0 コンポジット解析とは? Composite analysis? 3.1 母集団と標本 Population and sample 3.2 統計的検定と推定 パラメトリック法とノンパラメトリック法 3.2.1 母平均の検定 3.2.2 母平均の区間推定 3.3 コンポジット解析の実例

Upload: others

Post on 22-May-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

コンポジット(合成図)解析

3.0 コンポジット解析とは? Composite analysis?

3.1 母集団と標本 Population and sample

3.2 統計的検定と推定

パラメトリック法とノンパラメトリック法

3.2.1 母平均の検定 3.2.2 母平均の区間推定

3.3 コンポジット解析の実例

Page 2: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

3.2 統計的検定と推定 (統計的)検定とは、母集団から抽出された大きさN の標本の値 x1, x2, ∙ ∙ ∙, xN をもとにして、仮説 (hypothesis)H0

を棄却する(正しくないとして棄てる)かどうかを判断する作業。 仮説H0 が棄却されないときには、何ら積極的な結論を引

き出せず、無に帰すのみ。そこで、H0 を帰無仮説(null hypothesis) とよぶ。

この確率は非常に小さい(危険率)。

この確率は必ずしも小さくないので、 避けるように仮説を考える。

「仮説が正しい」ことでなく、

「仮説が正しくないとはいえない」ことを意味する。

検定における 2 種類の誤り 第1種の誤り: 仮説H0 が正しいにもかかわらず、これを誤りとして しまう。 第2種の誤り: H0 が偽りであるにもかかわらず、これを棄却しない。

Page 3: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

H0 :(帰無)仮説 H1 : 対立仮説

永田 (1996)

第2種の誤りの確率については、以下などを参照。 永田 (1996) 「統計的方法のしくみ」 P. 83-91 伊藤・見延 (2010) 「気象学と海洋物理学で用いられる データ解析法」P. 46-47

β: 0 ~ 1 − α

Page 4: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

例:2地点の平均気温の差を検定したい場合 (松山・谷本、2005)

1. 導きたい結論は「2地点の平均気温の間には有意な差がある」である。

2. 第2種の誤りを避けるため、検定にかける帰無仮説は

「2地点の平均気温の間には差が無い」となる。

3. 帰無仮説の棄却域をある確率(=危険率)のものと定める。 (例えば危険率5%とする。)

4. 判定する統計量が棄却域に入るかどうかを判定する。

5. 棄却域に入る場合、仮説は棄却される。

「危険率5%で2地点の平均気温の間には差が無いとは言えない。」

「危険率5%で2地点の平均気温の間には有意な差がある。」

Page 5: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

3.2 統計的検定と推定

(統計的)推定とは、限られたデータをもとに、母集団についての平均や分散などを推定する操作である。 点推定: パラメータを一つの値で推定 例:標本平均、標本分散 区間推定:信頼度を付けてパラメータを区間で推定

例:95%の確率で真の値を含む区間を推定 95%を信頼度 (confidence level)、区間を 信頼区間 (confidence interval)、区間の 上限と下限を信頼限界 (confidence limits) とよぶ。 95%の信頼度で統計的に有意。 危険率5%で有意。 有意水準 (significant level) 5%で有意。 (有意水準95%というのは誤り!)

Page 6: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

3.2.2 母平均の区間推定

母分散は未知 の場合

Page 7: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

例:pHの母平均値 ある溶液のpHを測定したところ、次の値を得た。

母平均の99%信頼区間は?

7.86 7.89 7.84 7.90 7.82

Page 8: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

自由度が4でα が1%(信頼区間が99%) となるt1 は?

同様に、自由度が4でα が5%(信頼区間が95%)となるt1 は?

Page 9: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

3.3 コンポジット解析の実例 バレンツ海の海氷の多寡と日本の冬季気温

バレンツ海の海氷が少ない 低気圧の経路が北上 北極海の温暖化と大陸 の寒冷化 寒気の日本への流入 (2005/06年や2011/12年 の厳冬) Inoue et al. (2012)

海洋研究開発機構ウェブサイト http://www.jamstec.go.jp/j/kids/press_release/20120201/

バレンツ海の海氷が少ない年の 気温と気圧の偏差

Page 10: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

まとめ

コンポジット解析とはデータをある基準にてらして平均する操作である。

統計的検定や推定には、母集団の性質になんらかの仮定をするパラメトリックな手法と仮定をしないノンパラメトリックな手法がある。

パラメトリックな手法では、母分散が未知の場合の母平均の検定や区間推定にはt 分布を用いる。

Page 11: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

4. 相関・回帰 (correlation/regression)

4.0 相関関係とは?

4.1 相関係数 correlation coefficient 4.2 自己相関 auto-correlation 4.3 相互相関 cross-correlation 4.4 相関解析の実例 applications 4.5 相関の有意性 significance of correlation

– 相関係数の検定 test of correlation coefficient – 有効自由度 effective degree of freedom

4.6 回帰 regressions – 回帰係数

– 回帰係数の区間推定

4.7 回帰分析の実例 applications

Page 12: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

4.1 相関係数 Correlation coefficient

共分散 covariance 分散 variance

相関関数は、-1 ≤ r ≤ 1の値を取る。

Page 13: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

相関係数と散布図

Page 14: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

x

y, z

例1:

+0∙0+

Page 15: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

例2:

相関係数がゼロだからといって、2つの変数の間に何も関係 が無い訳ではない。 相関係数は2つの変数の間の線形関係 (1次式)の強さを表している。

x と y の平均はそれぞれ 3と5だから、 相関係数 r の分子は、 (2-3)(2-5)+(5-3)(5-5)+(0-3)(10-5)+(4-3)(2-5) +(1-3)(5-5)+(6-3)(10-5)+(3-3)(1-5) = 3-15-3+15 = 0 r = 0

石村 (1989) より抜粋

Page 16: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

4.2 自己相関関数 auto-correlation function 自己相関関数とは

R(τ): R(τ)= R(-τ) τ= 0 について左右対称 |R(τ)| ≤ 1 ラグ相関 「メモリーの持続特性」を表す。

時間平均

τ:lag

Page 17: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

ずらす

ずらして

かけあわせる

x(t-τ)

日野 (1977) より一部修正

x(t)

Page 18: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

代表的な時系列関数と自己相関関数の形

日野 (1977)

2π -2π

Page 19: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

white noise

Cf.イサカの例

日野 (1977)

2 2

2

ある時点での結果が前の時点での結果に依存しないランダムな過程で生成されるもの

微小ラグ隔たるとき 前の性質をある割合 で保存

C(τ)

Page 20: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

自己相関関数の例:ニューヨーク州イサカの1987年 1月の日最高気温(華氏)

Wilks (2006)

上段:xi+τ 下段:xi

Page 21: コンポジット(合成図)解析 - 北海道大学€¦ · データ解析法」p. 46-47 β ... 第2種の誤りを避けるため、検定にかける帰無仮説は 「2地点の平均気温の間には差が無い」となる。

自己相関関数の例:ニューヨーク州イサカの1987年 1月の日最高気温(華氏)

(自己相関関数)= (ラグ自己共分散)/ (分散)

rxx(3): 平均からかなりずれた値が端にあると良くない。

rxx(2): 分母と分子の計算に異なるデータ範囲を使っているので、誤差が大きくなる

可能性がある。分子の計算に使われていない部分で、平均からのずれが小さい と、極端な場合には相関係数の絶対値が>1となることさえあり得る。

何を平均とし、何を分散とするかが一意的ではない!