医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較...

11
医学統計アドバンスコース 第1回⽬ 下川 敏雄 和歌⼭県⽴医科⼤学 臨床研究センター 医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較 医学統計アドバンスコース 第1回⽬ 2016年度 医学統計セミナー ベーシック・コース 基礎統計学 (615⽇・住⾦棟5F ⼤研修室) 量的データの解析 (727⽇・住⾦棟5F ⼤研修室) 質的データの解析 (824⽇・住⾦棟5F ⼤研修室) 共変量調整を伴う解析 (112⽇・病院棟4F 臨床講堂1) ⽣存時間・臨床検査データの解析(1116⽇・住⾦棟5F ⼤研修室) アドバンス・コース 多群・経時データの解析と多重⽐較 (1130⽇・病院棟4F 臨床講堂1) 臨床試験における症例数設定とガイドライン (1228⽇・住⾦棟5F ⼤研修室) アンケート調査データの解析 (21⽇・病院棟4F 臨床講堂1) 統計的因果推論と傾向スコア (222⽇・住⾦棟5F ⼤研修室) メタアナリシス (322⽇・病院棟4F 臨床講堂1) 医学統計アドバンスコース 第1回⽬ 本講義の概要 多群データの解析 分散分析とは︖ 多重⽐較とは︖ 経時データの解析 経時対応に対する統計分析⼿法 経時対応データに対する分散分析 混合効果モデル 医学統計アドバンスコース 第1回⽬ 多群データの解析

Upload: others

Post on 22-Jan-2021

2 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: 医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較 5F 4F …€¦ · 共変量調整を伴う解析(11⽉2⽇・病院棟4f 臨床講堂1)

医学統計アドバンスコース第1回⽬

下川敏雄和歌⼭県⽴医科⼤学臨床研究センター

医学統計セミナー アドバンスコース

多群・経時データの解析と多重比較

医学統計アドバンスコース第1回⽬

2016年度医学統計セミナー

■ベーシック・コース 基礎統計学 (6⽉15⽇・住⾦棟5F⼤研修室) 量的データの解析 (7⽉27⽇・住⾦棟5F⼤研修室) 質的データの解析 (8⽉24⽇・住⾦棟5F⼤研修室) 共変量調整を伴う解析 (11⽉2⽇・病院棟4F 臨床講堂1) ⽣存時間・臨床検査データの解析(11⽉16⽇・住⾦棟5F⼤研修室)

■アドバンス・コース 多群・経時データの解析と多重⽐較

(11⽉30⽇・病院棟4F 臨床講堂1) 臨床試験における症例数設定とガイドライン

(12⽉28⽇・住⾦棟5F⼤研修室) アンケート調査データの解析 (2⽉1⽇・病院棟4F 臨床講堂1) 統計的因果推論と傾向スコア (2⽉22⽇・住⾦棟5F⼤研修室) メタアナリシス (3⽉22⽇・病院棟4F 臨床講堂1)

医学統計アドバンスコース第1回⽬

本講義の概要

• 多群データの解析• 分散分析とは︖• 多重⽐較とは︖

• 経時データの解析• 経時対応に対する統計分析⼿法• 経時対応データに対する分散分析• 混合効果モデル

医学統計アドバンスコース第1回⽬

多群データの解析

Page 2: 医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較 5F 4F …€¦ · 共変量調整を伴う解析(11⽉2⽇・病院棟4f 臨床講堂1)

医学統計アドバンスコース第1回⽬

分散分析の基本︓⼀元配置の分散分析

1

2

差を⽐較

Outcome2標本t検定

1x

2x

1

2分散を評価する

Outcome

1x

2x

3

43x4x

⼀元配置分散分析(1way ANOVA)

■分散分析では,帰無仮説「H0︓⺟平均はすべて等しい」と定義する.これは,「⺟平均の分散(バラツキ)が0である」と定義することと同じ意味である.

■ちなみに,群数が2の場合の分散分析は,2標本t検定に⼀致する.

医学統計アドバンスコース第1回⽬

分散分析表■ ANOVAモデルの模式図

総平均

総平均

総平均

Outcome

BA C

AB

C

総平均= 薬の種類に関係ない効果

薬の効果= 薬の種類による影響

個⼈のバラツキ個⼈のバラツキ

個⼈のバラツキ

(薬(因⼦)の効果 [処理平均のバラツキ])と個⼈(誤差)のバラツキの⽐が評価される

評価するための表を分散分析表という

医学統計アドバンスコース第1回⽬

分散分析表(1/2)

⼦供の脳機能をタッピングスコアで計量化し,それを鉛の曝露の度合いで群別した3群で⽐較する(新⾕, 2016).

■MAXFWT︓右⼿と左⼿で別々に図ったタッピングスコアの⼤きいほうの値

■ lead_typ︓グループ変数―No Exposure (暴露無し)― Past Exposure (過去に曝露あり)― Current Exposure (現在も曝露)

STEP.1:「分析」→「2変数の関係」X,説明変数: lead_typ , Y,目的変数: MAXFWT

STEP.2:「▼」から「平均/ANOVA」を選択

JMPによる実行

医学統計アドバンスコース第1回⽬

分散分析表(2/2)

■因⼦(lead_typ)の⾃由度=⽔準の数‐1

■誤差の⾃由度=標本サイズ‐⽔準の数

■全体の⾃由度=標本サイズ‐1

■因⼦(lead_typ)の平⽅和=Σ(⽔準の平均―全体平均)2

■誤差の⾃由度=Σ(データ―⽔準の平均)2

■全体の⾃由度=Σ(データ―全体平均)2

当てはまりの良さ

当てはまりの悪さ

平⽅和⾃由度

因⼦平均平⽅和誤差平均平⽅和

分散分析とは,当てはまりの良さと当てはまりの悪さによって評価される

Page 3: 医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較 5F 4F …€¦ · 共変量調整を伴う解析(11⽉2⽇・病院棟4f 臨床講堂1)

医学統計アドバンスコース第1回⽬

⼀元配置の分散分析に対するノンパラメトリック検定︓Kruskal‐Wallis検定

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

⼩さい順に並べると

3種類の⾊がほぼ交互に出てくる3種類の⾊がほぼ交互に出てくる

3群それぞれの順位の平均値がほぼ同じ

になるはず

3群それぞれの順位の平均値がほぼ同じ

になるはず

有意でない状況

有意である状況

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

⼩さい順に並べると

3種類の⾊に偏りが⽣じる

3種類の⾊に偏りが⽣じる

3群それぞれの順位の平均値に違いが出

るはず

3群それぞれの順位の平均値に違いが出

るはず

Kruskal‐Wallis検定は,順位の平均値に違いがあるか否かを評価することで,ノンパラメトリック(正規分布に依らず)に⽐較している.

ABC

ABC

ABC

ABC

医学統計アドバンスコース第1回⽬

JMPによる実⾏

STEP.1:「分析」→「2変数の関係」X,説明変数: lead_typ , Y,目的変数: MAXFWT

STEP.2:「▼」から「ノンパラメトリック」→「Wilcoxon検定」を選択

JMPによる実行

データが正規分布に従わない,あるいは等分散性(すべての群(⽔準)で分散が同じでない)場合に適⽤することができる。

医学統計アドバンスコース第1回⽬

多重⽐較とは何か︖

「下⼿な鉄砲も数打てば当たる」では評価にならない

A B C

3種類のコレステロール治療の⽐較A vs. B,A vs. C,B vs. C (3回の⽐較)

有意⽔準α=0.05とは,違いがないのに(H0が正しい)のに,違いがある(H1が正しい)と誤ってしまう確率を表している.

つまり,コレステロール治療の効果に違いがないのに,20回検定すると,1回は有意差が出てしまう(H1と判断してしまう).

3回⽐較するということは,その可能性が増しているといえる.

これを多重性という

医学統計アドバンスコース第1回⽬

多重性を少し数理的に考えるいま,3種類の薬剤の有効性を考える.

VS

VS

VS

有意⽔準α

有意⽔準α

有意⽔準α

検定

検定

検定

有意⽔準とは「有意差がないのに有意差があると誤る確率(第1種の過誤)」をあらわす

有意差がないことを正しく判断できる確率︓Pr1

Pr1 = 1-α

有意差がないことを正しく判断できる確率︓Pr2

Pr2 = 1-α

有意差がないことを正しく判断できる確率︓Pr3

Pr3 = 1-α

3回の⽐較のすべてで,有意差がないことを正しく有意差がないと判断できる確率︓Pr0

Pr0 = Pr1×Pr2×Pr0

= (1-α)3

3回の⽐較のなかで1度でも,有意差がないのに有意差があると誤る確率

1 - Pr0 = 1-(1-α)3

1回の検定の有意⽔準αをα=0.05(1回の検定において有意差がないのに有意差があると誤る確率を0.05とする)

とし,3回の検定を繰り返した場合,3回の検定の中で1度でも有意差がないのに有意差があると誤る確率は,

1-(1-α)3 = 1-(1-0.05)3 = 1-(1-0.05)3 = 0.142となり,誤りの確率が増⼤してしまう.

BA

A

B

C

C

Page 4: 医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較 5F 4F …€¦ · 共変量調整を伴う解析(11⽉2⽇・病院棟4f 臨床講堂1)

医学統計アドバンスコース第1回⽬

多重⽐較はどのような場⾯で⽤いるか︖

■ 3群以上での⽐較の場⾯における対⽐較

A

B C

⽐較⽐較

⽐較

全て試験薬 対照群(Controlとの⽐較)

Control

B C

⽐較⽐較

■ 経時測定データにおいて,時点ごとに群間を⽐較する(下図なら5回⽐較)

Time

Outcome

⽐較⽐較

⽐較⽐較

⽐較

医学統計アドバンスコース第1回⽬

多重⽐較はどのような場⾯で⽤いるか︖

■臨床試験における中間解析

試験開始 ⽬標症例到達

中間解析 中間解析

⽐較 ⽐較 ⽐較

■中間解析とは,無作為化⽐較試験において,⽬標登録症例に到達する前に,中間評価を⾏い,早期に試験を中⽌するか否かを検討する.

■上図では,2回の中間解析を実施するため,合計3回の⽐較を⾏う.

■ 1例が終了する毎に中間解析を⾏ってしまうと,「下⼿な鉄砲も数打てば当たる」状況となるため,多重⽐較を⾏わなければならない.

医学統計アドバンスコース第1回⽬

多重⽐較の⽅法

Bonfferoniの⽅法 (JMPにはないが⼿計算できる)

A

B C

⽐較⽐較

⽐較

A群,B群,C群の対⽐較の場合で全体での有意⽔準がαの場合には

■ A群 対 B群■ A群 対 C群■ B群 対 C群

有意⽔準α/3と⽐較(or p値を3倍)

有意⽔準α/3と⽐較(or p値を3倍)

有意⽔準α/3と⽐較(or p値を3倍)

有意⽔準αを⽐較回数で割る(or p値を⽐較回数で掛ける)⽅法がBonfferoniの⽅法である.多重⽐較が簡単なため,最も⽤いられる⽅法の⼀つである.

医学統計アドバンスコース第1回⽬

多重⽐較の⽅法Holmの⽅法 (JMPにはないが⼿計算できる)最⼩のp値から並べ替え,シーケンシャルに⽐較する⽅法.いま,6回の⽐較のp値が次のように与えられているとする.

0

0.01

0.02

0.03

0.04

0.05

0.06

1 2 3 4 5 6

Bonfferoni

Holm

⽐較回数

Adjusted

 p‐value

0.001 0.006 0.011 0.012 0.032 0.045

順位 p値Bonfferoni法 Holm法

⽐較α 判定 ⽐較α 判定

1 0.001 0.05/6=0.008 有意 0.05/6=

0.008 有意

2 0.006 0.05/6=0.008 有意 0.05/5=

0.010 有意

3 0.011 0.05/6=0.008 ⾮有意 0.05/4=

0.013 有意

4 0.012 0.05/6=0.008 ⾮有意 0.05/3=

0.017 有意

5 0.032 0.05/6=0.008 ⾮有意 0.05/2=

0.025 ⾮有意

6 0.045 0.05/6=0.008 ⾮有意 0.05/1=

0.050 ⾮有意

以降はすべて有意でない

Page 5: 医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較 5F 4F …€¦ · 共変量調整を伴う解析(11⽉2⽇・病院棟4f 臨床講堂1)

医学統計アドバンスコース第1回⽬

多重⽐較の⽅法

BA C

データのバラツキ(各群同じと仮定)

データのバラツキ(各群同じと仮定)

データのバラツキ(各群同じと仮定)

⽐較 ⽐較

⽐較

データのバラツキよりも,ペアの平均値の差が⼤きいか否かを評価

⼀元配置分散分析において有意だった場合には,Tukeyの⽅法でもいずれかの対⽐較において有意になっている.

Tukeyの⽅法

医学統計アドバンスコース第1回⽬

多重⽐較の⽅法

Dunnettの⽅法

Control B C

⽐較

⽐較

Active

Controlとの⽐較のみを実施する多重⽐較がDunnettの⽅法である.

Dunnettの⽅法では,■正規分布に従うこと■すべてのグループ(群)のあいだで,分散が等しいこと

が仮定される.

医学統計アドバンスコース第1回⽬

JMPによる実⾏

STEP.1:「分析」→「2変数の関係」X,説明変数: lead_typ , Y,目的変数: MAXFWT

STEP.2:「▼」から「平均の比較」→(手法)を選択

JMPによる実行

JMPには,以下の⽐較が⽤意されている.■各ペア,Studentのt検定

→ 多重⽐較を実施せずにt検定を⾏う(Bonfferoniの多重⽐較, Holmの多重⽐較はこれをもとに⼿計算).

■すべてのペア,TukeyのHSD検定→ Tukeyの⽅法を⾏う(ANOVAの実施が必須).

■最適値との⽐較(HsuのMCB)→ 閾値に対する⽐較(単アーム試験と同様の⽐較)

■コントロール群との⽐較(Dunnett)→  Dunnettの多重⽐較で実施(コントロール群を設定する必要あり)

医学統計アドバンスコース第1回⽬

JMPの結果■ TukeyのHSD検定の結果

No exposureとCurrent Exposureで有意差あり(No Exposureのほうがタッピングスコアが⾼い)

■ Dunnettの多重⽐較(No Exposureとの⽐較)

Current Exposureとの間で有意差あり

Controlとの⽐較であるDunnettの多重⽐較のほうが⽐較回数が少ない分,p値が⼩さいことがわかる.

Page 6: 医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較 5F 4F …€¦ · 共変量調整を伴う解析(11⽉2⽇・病院棟4f 臨床講堂1)

医学統計アドバンスコース第1回⽬

JMPの結果■ Bonfferoniの多重⽐較,Holmの多重⽐較

「各ペア,Studentのt検定」を実施

p値 Bonferoni HolmNo Exposure - Current Exposure 0.0087 0.0087×3 = 0.0261 0.0087×3 = 0.0261

No Exposure - Past Exposure 0.0563 0.0563×3 = 0.1689 0.0563×2 = 0.1126(有意でないので終了)

Past Exposure - Current Exposure 0.6191 0.6191×3 = 1.8573(1を超えたので1.000)

-

いずれの多重⽐較においても,No Exposure – Current Exposureで有意差が認められる.

医学統計アドバンスコース第1回⽬

経時データの解析

医学統計アドバンスコース第1回⽬

JMPによる実⾏︓2元配置の分散分析の場合

11⼈の⼥の⼦の脳下垂体と翼突上顎裂の距離を8歳,10歳,12歳,14歳の時点で⽐較する研究である.

■ ID︓被験者番号■ Age︓年齢(8,10,12,14歳)

gt8,gt10,gt12,gt14

■ Distance︓距離

STEP.1:「分析」→「モデルのあてはめ」Y:Distance , モデル効果の構成:Age, ID

STEP.2:「▼」から「平均の比較」→(手法)を選択

JMPによる実行:2元配置の分散分析を用いる場合

JMPでは2種類の⽅法で繰り返し測定の分散分析を実⾏できる(1) 2元配置の分散分析⽤いる場合(Ageは順序尺度にすること)(2) 多変量分散分析(MANOVA)を⽤いる場合

医学統計アドバンスコース第1回⽬

JMPによる実⾏︓多変量分散分析の場合

STEP.1:「分析」→「モデルのあてはめ」Y:gt8,gt10,gt12,gt14を入れる

STEP.2:「手法」を「MANOVA」にする

JMPによる実行:多変量分散分析を用いる場合

STEP.3:「応答の指定」を「反復測定」にして「時間」を選択する.

(一変量検定も行うにチェックする)

Page 7: 医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較 5F 4F …€¦ · 共変量調整を伴う解析(11⽉2⽇・病院棟4f 臨床講堂1)

医学統計アドバンスコース第1回⽬

⼆つの結果

多変量分散分析

2元配置の分散分析

同じ

Greenhouse‐Geiser法Huynh‐Feldt法(上の改良版)

球⾯性の仮定︓多変量分散分析では被験者iのデータが左下のような形をしている.i

Time.1

Time.2

Time.3

Time.4

各時点では相関構造をもつことは明らかである.このとき,すべての時点での分散・共分散が等しい(つまり,互いの相関がすべて等しい)と仮定することを複合対称性という.経時データでは,この過程を満たすことがなく,それを弱めた仮定(相関

があると考えられるすべての⽔準対の「差」の分散が等しい)を球⾯性という.G-G調整およびH-F調整は球⾯性の仮定が崩れた場合における調整された

値である.

医学統計アドバンスコース第1回⽬

経時データに対する「⽐較」︓例⽰

8 9 10 11 12 13 14

2025

30

age

dist

ance

これは,正常⻭列者の脳下垂体と翼突上顎裂までの距離[以下,distance](mm)

を⼩児27名(男⼦16名,⼥⼦11名)に対して測定した経時データである(測定は8歳,10歳,12歳,14歳に測定されている).

男⼥とも年齢とともにdistanceが上昇しており,男性のほうが⼥性に⽐べて⾼いことが⽰唆される.

⻭列矯正の成⻑データ (Potthoff & Roy, 1964)

医学統計アドバンスコース第1回⽬

経時データに対する「⽐較」

□時点毎に⽐較する

□経時的な変動を⽐較する

・データをそのまま⽐較する

・変化量 or 変化率を⽐較する

・介⼊前後での⽐較(アーム毎で⽐較)-対応のあるt検定 or Wilcoxon符号付順位検定+多重⽐較 (時点‐1回の⽐較)

- 2標本t検定 or Wilcoxon符号付順位検定+多重⽐較 (時点‐1回の⽐較)

- 2標本t検定 or Wilcoxon符号付順位検定+多重⽐較 (時点‐1回の⽐較)

-共分散分析ANCOVA (介⼊前のデータで調整)

-共分散分析ANCOVA (介⼊前のデータで調整)

・介⼊前後での⽐較(アーム毎で⽐較)-反復測定の分散分析 or Friedman検定

・経時的な変化を群間で⽐較する-混合効果モデル

医学統計アドバンスコース第1回⽬

時点毎での⽐較

時点毎に⽐較する場合には,多重⽐較が必要になる.Wilcoxn検定に対してBonfferoniの多重⽐較調整を実施した場合,14歳のみ有意.

8 9 10 11 12 13 14

2025

30

8 9 10 11 12 13 14

-50

510

年齢

年齢

Distance

変化量

pvalue=0.047×4→ 0.141

pvalue=0.083×4→ 0.332

pvalue=0.014×4→ 0.057

pvalue=0.002×4→ 0.008**

pvalue=0.655×4→ 1.000

pvalue=0.411×4→ 1.000

pvalue=0.056×4→ 0.168

原データでの⽐較

減少量での⽐較

時点毎に⽐較する場合には,多重⽐較が必要になる.Wilcoxn検定に対してBonfferoniの多重⽐較調整を実施した場合,いずれの時点も有意でない.

Page 8: 医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較 5F 4F …€¦ · 共変量調整を伴う解析(11⽉2⽇・病院棟4f 臨床講堂1)

医学統計アドバンスコース第1回⽬

経時繰り返しデータでの分散分析︓データを⾒る

⼥⼦

男⼦

Aさん

Bさん

・・・

Zさん

aさん

bさん

・・・

zさん

8歳 10歳 12歳 14歳obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

・男⼦のなかのAさん ・⼥⼦のなかのaさん経過繰り返しデータでは,

のようになっている.このようなデータのことを巣篭もり型あるいは⼊れ⼦型(nested)という.

8歳 10歳 12歳 14歳

このとき,各年齢での個々の観測値には相関構造があり(つまり,Aさんの加齢による変化には相関がある),通常の分散分析で解析することは誤りである.

医学統計アドバンスコース第1回⽬

群間⽐較を想定しない場合︓先ほどの繰り返し測定の分散分析

Aさん

Bさん

・・・

Zさん

aさん

bさん

・・・

zさん

8歳 10歳 12歳 14歳obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

obsobs

8歳 10歳 12歳 14歳

男⼦ ⼥⼦

因⼦

1

因⼦2

因⼦

1

因⼦2

因⼦2において有意になれば,介⼊によって測定値(distance)が変動したことを意味する.

ただし,性差を評価できない

医学統計アドバンスコース第1回⽬

経時繰り返し測定の分散分析︓多変量分散分析

群jに割り付けられた個体iの測定値︓Xji群j

iさん Xji1Xji1 Xji2Xji2 XjiTXjiT・・・・・・

時点1 時点2 時点T

Xji

繰り返し測定の分散分析モデル︓ jik j k jk jikX 真値 薬剤

効果時点効果

薬剤

時点

治療jに対する個⼈の時間kによる変動をモデル化時間tに関係ない(全時間にわたっ

ての)平均的な薬剤効果(薬剤効果の差とは⾔い切れない)

薬剤kに関係ない(すべての薬剤に)平均的な時間効果(時間によって被験者のoutcomeはどのように推移するか)

薬剤kによって時間tの変化に対して平均的にどのような変動を表すか(変動プロファイル)を評価している.

個体内変動

個体間変動 誤差に群毎の時間に対す

る個体内変動(被験者個々がもつ時間tに対する変動)は,多変量正規分布で表現される.

医学統計アドバンスコース第1回⽬

12k

もう少しモデルを詳しく⾒る︓多変量分散分析

j i k j k j k j i kX 時間tk

真値

薬剤効果

1

薬剤効果

2

交互作⽤

1k

交互作⽤

2k

11k

11n k

22k

21k

22n k

時点効果

k

Page 9: 医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較 5F 4F …€¦ · 共変量調整を伴う解析(11⽉2⽇・病院棟4f 臨床講堂1)

医学統計アドバンスコース第1回⽬

経時繰り返し測定の分散分析における誤差構造

x1

x2

z

繰り返し測定の分散分析モデル︓ jik j k jk jikX

誤差は多変量正規分布︓ 2T

1( , , ),j i j i j i j ik ~ MVN(0, )ji kΣ,

時点効果

k

この時点効果は,任意の時点tkにおける平均的な効果を表している.実際には,個々の時点には相関があるが,このことは考えられていない.

そのため,経時繰り返し測定の分散分析では,誤差構造を多変量にすることで,時点間の相関構造を含めるようにしている.

医学統計アドバンスコース第1回⽬

より⼀般的な場合︓線形混合効果モデル

時間t

Outcome

Pre t1 t2 t3

いま,3名の患者に対して,ある薬剤を投与したときの効果を経時的に評価した結果を以下に⽰す.

その結果,各被験者の変化は,介⼊前の値(pre),すなわち切⽚に違いがあるものの,変化を表す直線(傾き)に違いがないように⾒える.つまり,

i番⽬の患者のOutcome

i番⽬の患者の切⽚ 傾き 時間 誤差

で表される.ただし,(被験者数分の切⽚)+(傾き)を考えると,パラメータが被験者数を上回ってしまう.そこで,切⽚を平均μ(全体平均)の確率変数とみなすことを考える.こうすれることで,パラメータ数を削減できる(具体的には,被験者数分の切⽚を平均μ,分散τ2で表すことができる).これが,線形混合効果モデルの動機である.

医学統計アドバンスコース第1回⽬

混合効果モデル︓ランダム切⽚モデル

j ik j k jk j ikX ANOVAモデル︓

回帰で書き換え 全体平均

j iky混合効果モデル︓(ランダム切⽚モデル)

0

治療効果

1 1ix

10 ,1 ,ix

女 性

男 性

時間効果

3

21

k jikk

z

10歳︓β2112歳︓β2214歳︓β23

3

3 11

k i jikk

x z

治療×時間

男性で10歳︓β21男性で12歳︓β22男性で14歳︓β23

0ib ji

固定効果 変量効果2~ N(0, )ji E

20 0~ N(0, )i Bb

個体間差

誤差

このモデルでは,個⼈によって・ベースラインが異なること(個⼈差によるベースラインのバラツキ)

をモデルのなかに組み込んでいる.これをランダム切⽚モデルという.

医学統計アドバンスコース第1回⽬

混合効果モデル︓ランダム傾き-切⽚モデル

j i k j k j k j i kX ANOVAモデル︓

回帰で書き換え 全体平均

j iky混合効果モデル︓(ランダム傾き-切⽚モデル)

0

治療効果

1 1ix

時間効果

3

21

)( i kkk jik

zb

3

3 11

k i jikk

x z

治療×時間

0ib ji

固定効果

固定効果

固定効果

変量効果

固定効果

変量効果

このモデルでは,個⼈によって・ベースラインが異なること(個⼈差によるベースラインのバラツキ)・時間tkにおける経時変化に対する個⼈差

をモデルのなかに組み込んでいる.これをランダム切⽚モデルという.

2~ N(0, )ji ET0 1 2 3( , , , ) ~ MV N(0, )i i i i ib b b b b ,

Page 10: 医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較 5F 4F …€¦ · 共変量調整を伴う解析(11⽉2⽇・病院棟4f 臨床講堂1)

医学統計アドバンスコース第1回⽬

ランダム切⽚モデル vs. ランダム切⽚‐傾きモデル

混合効果モデル(ランダム切⽚モデル)

混合効果モデル(ランダム傾き-切⽚モデル)

Time

obse

rvat

ion

Active

Conntrol

Time

obse

rvat

ion

Active

Conntrol

Qestion︓どちらのモデルが適切なのか︖Answer︓⾚池の情報量基準(AIC),尤度⽐検定を⽤いれば選択できる

Qestion︓どちらのモデルが適切なのか︖Answer︓⾚池の情報量基準(AIC),尤度⽐検定を⽤いれば選択できる

ランダム切⽚モデルAIC = 440.64

ランダム傾き-切⽚モデルAIC = 443.81

尤度⽐検定(ランダム傾き-切⽚モデル/ランダム切⽚モデルの尤度⽐検定の結果:0.659)

ランダム切⽚モデルが選択される

医学統計アドバンスコース第1回⽬

成⻑データでの結果経時測定データでの分散分析

混合効果モデルでの結果(ランダム切⽚モデル)

性別p値 = 0.502

年齢p値 <0.001***

性別×年齢p値 <0.012*

性別p値 = 0.518

年齢p値 <0.001***

性別×年齢p値 =0.024*

2022

2426

28

age

dist

ance

8 10 12 14

Male

Female

・年齢の主効果が優位(年齢により有意に上昇)・性別×年齢で有意︓成⻑するほど性差が出てくる.

医学統計アドバンスコース第1回⽬

「⽐較」の場⾯での解析JMPのサンプルデータ「Dogs」は,⽝に対して,morphine(モルヒネ)が投与された群と

trimeth(トリメタファン)が投与したときの,投与後1分後,投与後3分後,投与後5分後に計測されたヒスタミンの⾎中濃度を表している.ここでは,これらの対数値をとった下表の⼀部のデータのなかの

・log(ヒスタミン1)・log(ヒスタミン3)・log(ヒスタミン5)

を⽤いる.

STEP.1:「分析」→「モデルのあてはめ」Y:「log(ヒスタミン1),log(ヒスタミン3)」,「log(ヒスタミン5)」

モデル効果の構成:薬剤

STEP.2:「手法」を「MANOVA」にする

JMPによる実行:多変量分散分析(rmANOVA)を用いる場合

STEP.3:「応答の指定」を「反復測定」にして「時間」を選択する.(一変量検定も行うにチェックする)

医学統計アドバンスコース第1回⽬

MANOVAの結果を詳しく⾒てみる

球⾯性に対する,Mauchlyの検定結果(有意ならば球⾯性を満たさないとして,MANOVAの結果あるいはG‐G調整,H‐F調整の結果を⽤いる)

時間による違いはみられるものの,薬剤効果及び交互作⽤は認められなかった.

Page 11: 医学統計セミナー アドバンスコース 多群・経時データの解析と多重比較 5F 4F …€¦ · 共変量調整を伴う解析(11⽉2⽇・病院棟4f 臨床講堂1)

医学統計アドバンスコース第1回⽬

JMPによる線形混合効果モデルの略説「テーブル」→「積み重ね」でlog(ヒスタミン1),log(ヒスタミン3),log(ヒスタミン5)を「積み重ねる列」に選択し,「積み重ねたデータ列」に「log(ヒスタミン)」,「元の列のラベル」に「時間」を⼊⼒してOKボタンを押す.

[STEP.1]「列の選択」の「薬剤」「ID」を「モデル効果の構成」に移動,「log(ヒスタミン)」をYに移動(選択して「追加」ボタンを押す).

[STEP.2]「モデル効果の構成」のなかの「ID」を選択,「列の選択」の「薬剤」を選択し,「枝分かれ」ボタンを押す(「ID[薬剤]」に変わる).

[STEP.3] 「ID[薬剤]」を選択し,属性右の▼から「変量効果」を選択(「ID[薬剤]&変量効果」に変わる).

[STEP.4] 「列の選択」の「時間」を選択し追加,「時間」「薬剤」を同時に選択し,交差.

医学統計アドバンスコース第1回⽬

JMPによる線形混合効果モデルの略説︓相関構造を考えた場合

[STEP.1]「⼿法」を「混合モデル」にする.

[STEP.2]「固定効果」に「薬剤」「時間」を選択して「交差」ボタンを押す.

[STEP.3] 「反復構造」タブの「構造」に「AR(1)」を選択,反復に「時間」を選択,個体に「ID」を選択する.

時間は量的尺度とする

医学統計アドバンスコース第1回⽬

ご清聴ありがとうございました