arcsin√(y/n)kasuya.ecology1.org/stats/transform2.pdfarcsin√(y/n)...

37
arcsin√(y/n) 変換してから、分散分析・回帰 (パラメトリックな方法) 割合・比率などの分析に広く使われてきた 角度変換 © 2003

Upload: others

Post on 08-Jan-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

arcsin√(y/n)

変換してから、分散分析・回帰

(パラメトリックな方法)

割合・比率などの分析に広く使われてきた

角度変換

©粕谷英一2003

もっとも簡単な場合

2つの変数が影響を与える

2独立変数はそれぞれ0と1

2×2分散分析2独立変数の重回帰

独立変数1

独立変数2

0 10

確率が異なる

©粕谷英一2003

独立変数が2つある→変数の効果間の関係

乗法的(掛け算)

ロジスティック的

加法的(足し算) 和

オッズ比

’関係のモデル’ 2変数が独立に作用する

©粕谷英一2003

乱数を使って計算方法

確率φ

確率(1-φ)

1つの割合(分母n)

独立変数の組み合わせごとにm個の割合

交互作用の検定(5%水準)分散分析 重回帰

10000回繰り返し

’生存’

’死亡’n回 ’n個体の生死’

©粕谷英一2003

乗法的

・ ・

強弱

変数2の効果

0.2

0.4

0.6

0.4 0.20.6

0.9

0.05

0.1

0.7

0.5

0.3

変数1の効果©粕谷英一2003

ロジスティック的

弱 強

・ ・

・-1.5

-1.5

-2.5

-3.5

-3.5

-2.5

0.9

0.05

0.1

0.7

0.5

0.3

変数1の効果©粕谷英一2003

加法的

弱 強

・ ・ ・

-0.3

-0.2

-0.2

-0.3

-0.4

-0.4

変数1の効果

0.9

0.05

0.1

0.7

0.5

0.3

©粕谷英一2003

交互作用

どのモデルでも、独立なはずの変数(要因)間に高率

で有意な交互作用

©粕谷英一2003

交互作用があるとは?ある変数の効果の強さが

他の変数の効果によってちがう

変数1

変数2

目的変数本当は同じ効果

効果の強さが変化

効果の強さが変化したように見える

©粕谷英一2003

変数1の偏回帰係数

規準化

乗法的

JJJJJ

JJJJ

-1

-0.9

-0.8

-0.7

-0.6

-0.5

0 0.2 0.4 0.6 0.8 1

変数2の効果強©粕谷英一2003

ロジスティック的

JJ

J

JJ J-1

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-6 -5 -4 -3 -2 -1 0

変数1の偏回帰係数

規準化

変数2の効果©粕谷英一2003

JJJ

JJJJJJJJ

-1

-0.9

-0.8

-0.7

-0.6 -0.4 -0.2 0

変数2の効果 弱強

加法的変数1の偏回帰係数

規準化

©粕谷英一2003

変数1

変数2

目的変数本当は同じ効果

効果の強さが変化

効果の強さが変化したように見える

どのモデルでも

©粕谷英一2003

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

乗法的 加法的ロジスティック

有意な交互作用の検出率

10

10 10

20

2020

30

30

30

割合の個数(m)が大きいと交互作用の検出率が高い

©粕谷英一2003

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8有意な交互作用の検出率

10

20

30

1010

20

20

30

30

割合の分母( n)が大きいと交互作用の検出率が高い

©粕谷英一2003

割合の個数(m)

割合の分母(n)

サンプル数が大きいほど影響大

©粕谷英一2003

どのモデルでも高率で生じる有意な交互作用

他の変数の影響を受ける偏回帰係数

サンプルサイズが大きいほど悪化

角度変換を重回帰や二元以上の分散分析で使うこと

サンプルサイズを減らせ

変数の効果を小さくしろ(加法的モデルは複雑)

©粕谷英一2003

どのモデルでも高率で生じる有意な交互作用

他の変数の影響を受ける偏回帰係数

サンプルサイズが大きいほど悪化

角度変換を重回帰や二元以上の分散分析で使うこと

不適切

©粕谷英一2003

角度変換の特殊事情か

べき乗変換

©粕谷英一2003

ポアソン変数

単位時間あたりの発生率が一定

起こった回数

©粕谷英一2003

平方根変換

対数変換

√(y)

ポアソン変数

√(y+0.5)Freeman-Tukey変換

√(y+1)+√(y)

log(y+0.5)

log(y+1)©粕谷英一2003

乱数を使って計算方法

母数λ

独立変数の組み合わせごとにm個のデータ点

交互作用の検定(5%水準)分散分析 重回帰

10000回繰り返し

ポアソン乱数

関係:乗法、加法©粕谷英一2003

1.0

0

0.8

0.6

0.4

0.2

弱 強

+

0.5

0.5

+

0.5

0.5

変数1の効果

乗法的有意な交互作用の検出率

©粕谷英一2003

1.0

0

0.8

0.6

0.4

0.2

+

0.5

+

0.5

0.5

0.5

変数1の効果弱 強

加法的

有意な交互作用の検出率

©粕谷英一2003

加法的 乗法的

BBBBBB B B B B B

IIIIII I I I I I

HHHHHH

H H H H HJJJJJJ

J J J J J

FFFFFF F F F F F

0

0.5

1

1.5

-1 0 1 2 3 4 5 6

BBBBB B

B BB B

B

IIIIII I

I II I

HHHHHHHHHHH

JJJJJ J

J J J J J

FFFFF F F F

F F F

0

1

2

0 1 2 3 4 5 6 7 8

x3.3x1.7

x1.6

x1.9

他の変数の効果

B

I

H

J

F

平方根平方根(+0.5)Freeman-Tukey

対数(+0.5)対数(+1)

偏回帰係数は他の変数の効果

の強さによって変化する

©粕谷英一2003

加法的1.0

0

0.8

0.6

0.4

0.2

0.5

0.5

+

0.5

30

10

30

10

30

10

30

10

+

0.5

乗法的

サンプル数が大きいと交互作用は高率で検出される

©粕谷英一2003

どのモデルでも高率で生じる有意な交互作用

他の変数の影響を受ける偏回帰係数

サンプルサイズが大きいほど悪化

平方根変換をポアソン変数に対する重回帰や二元以上

の分散分析で使うこと

不適切©粕谷英一2003

ばらつきとしての分布を調整しようとすると、

同時に期待値にも影響

ばらつき(分散)と期待値の関係が両方同時に望んだ

ようになる幸運な場合のみ、複数独立変数の場合に変

数変換は機能する

原因

©粕谷英一2003

パラメトリックな方法へのこだわりは無用

計算量に極端な制約があった時代の名ごり

なんでもパラメトリックス

©粕谷英一2003

’関係のモデル’ 交互作用

’関係のモデル’

交互作用

各変数の効果の強さ

©粕谷英一2003

発芽率

要因1

要因2

(仮想的な例)

乗法的モデル要因1=0.8、要因2=0.6→0.48

加法的モデル

ロジスティックモデルを想定した統計的方法

誤った結果

©粕谷英一2003

誤差すなわちばらつき

あるタイプのデータ

誤差の分布をはっきりさせる

こういう研究への過小評価©粕谷英一2003

ばらつきとしての分布と期待値を分離する

対策原因

ーばらつきとしての分布を調整しようとすると、

同時に期待値にも影響

©粕谷英一2003

一般化線形モデル

linear predictor

(線形予測子)

link function

(リンク関数)

誤差構造

(Generalized Linear Models, GLM)

実際の従属変数はそ

のまわりにばらつく

(従属変数の期待値)の関数=独立変数の一次式

©粕谷英一2003

link function

(リンク関数)誤差構造

重回帰

分散分析

そのまま 等分散の正規分布

そのまま 等分散の正規分布

ロジスティック回帰 ロジット 二項分布

分割表 対数 ポアソン分布

期待値の関係 ばらつき

©粕谷英一2003

ばらつきとしての分布

期待値との関係

分離するためには

期待値との関係→独立性とは何かはっきりさせる

ばらつきとしての分布→データの量

実証的な関係の検討

©粕谷英一2003

従属変数の期待値と独立変数の関係

誤差分布

わかる

最尤法(含、GLM)ソフトウェア

©粕谷英一2003