mit白熱教室 これからの因果推論を考えよう
DESCRIPTION
旧題名"因果関係を考えよう。 医薬品の評価における疫学の役割を中心に。" 2013-09-21 ボストン日本人研究者交流会での発表。 http://www.boston-researchers.jp/wp/archives/1018TRANSCRIPT
因果関係を考えよう。医薬品の評価における疫学の役割を中心に。
2013-09-21 @MITKazuki Yoshida, M.D.
Kameda Medical CenterBrigham and Women’s Hospital
Harvard School of Public Health
唐突ですが、、
演題名を変更します
MIT白熱教室これからの因果推論の話をしよう
2013-09-21 @MITKazuki Yoshida, M.D.
Kameda Medical CenterBrigham and Women’s Hospital
Harvard School of Public Health
関節リウマチに関して
関節リウマチについて! 慢性炎症性疾患
! 主に関節に炎症が起こるが全身性疾患である
! 人口の0.5-5%
! 女性の方が数倍多い、30-40代ぐらいの発症が多い
関節リウマチ
http://www.disabilityinaction.com/rheumatoid-arthritis-definition-symptoms-treatment.html
早期 晩期
治療の進歩
生物学的製剤
! 免疫細胞同士/からの指令をブロックする
! 主に抗体などのタンパクを遺伝子組換えでデザインしている
http://www.nature.com.ezp-prod1.hul.harvard.edu/nri/journal/v10/n5/fig_tab/nri2761_F2.html
信号物質を回収
信号受信先を塞ぐ
信号受信先の細胞を殺す
情報提供を防ぐ
http://www.orencia.com/hcp/biologics.aspx
良く効く
注) 全員に必要な訳ではありません
http://www.med.osaka-u.ac.jp/pub/imed3/lab_2/page4/biologics.html
6万 7.3万 6.4万 8.5万 6.4万 8.5万 8.5万 4.6万
日本での2ヶ月あたりの自己負担(3割負担)
本当にお高い
実臨床での効果と有害事象について継続的に評価が必要
http://bokete.jp/boke/1912205
でも国が承認しているんでしょう?
薬剤の承認プロセス
http://www.nibio.go.jp/guide/page2.html
Phase 1: 少数の健康人志願者を対象に、安全性のテストを行う。Phase 2: 少数の患者を対象に有効で安全な投薬量や投薬方法などを確認する。Phase 3: 多数の患者で、「二重盲検試験」などにより、既存薬などと比較して新薬の有効性および安全性をチェックする。
市場へ
承認臨床試験(治験)
非臨床試験候補分子検索
効果を確認するには! 調子が良くなったのは、薬が原因かどうか?
! 因果推論の考え方
! 二重盲検ランダム化比較試験(double-blind,
randomized controlled trial, RCT)がgold standard
! A/B testと考え方は同じ
なんでそんなややこしいことをするのか
http://imagesci.com/mouse-animal-wallpaper-13246-hd-wallpapers.html
病気ネズミということに
http://imagesci.com/mouse-animal-wallpaper-13246-hd-wallpapers.html
数が少ないと偶然に左右されるので増やします。
http://imagesci.com/mouse-animal-wallpaper-13246-hd-wallpapers.html
http://imagesci.com/mouse-animal-wallpaper-13246-hd-wallpapers.html
注) 統計学的に必要な数を前もって検討します
全員に薬剤を投与する?
なにかそれっぽいスコアの経過
なにかそれっぽいスコアの経過
キタ━━━━━━━━m9( ゚∀゚)━━━━━━━━!!
自然経過と区別がつかない。
多くの病気で疾患活動性は変動する
悪めの人を集めると“平均への回帰”が起こる
病気が悪めの人を選択すると病気の波の悪いところにいる人を集めてしまう。このためこれらの人はしばらくすると全体的には波の良いところに向かって改善する傾向が見られる。
要は勝手に良くなることがある。
“比較”する必要がある
なにと比較する?
Counterfactual
Counter factual
反対 事実の
起こったことと起こらなかったことを比べる
Potential outcomeともいう
個体1
未来1 未来1’
未来2 未来2’
ある一個体の二つの未来
悠久の時の流れ
暴露:薬剤 アウトカム 比較
シナリオ1
同一個体
個体2
未来1 未来1’
未来2 未来2’
ある一個体の二つの未来
悠久の時の流れ
暴露:薬剤 アウトカム 比較
シナリオ2
同一個体
個体3
未来1 未来1’
未来2 未来2’
ある一個体の二つの未来
悠久の時の流れ
暴露:薬剤 アウトカム 比較
シナリオ3
同一個体
個体4
未来1 未来1’
未来2 未来2’
ある一個体の二つの未来
悠久の時の流れ
暴露:薬剤 アウトカム 比較
シナリオ4
同一個体
個体4
未来1 未来1’
未来2 未来2’
ある一個体の二つの未来
悠久の時の流れ
暴露:薬剤 アウトカム 比較
シナリオ4
二つの未来はそれぞれに対するCounterfactual
個体4
未来1 未来1’
未来2 未来2’
ある一個体の二つの未来
悠久の時の流れ
暴露:薬剤 アウトカム 比較
シナリオ4
一個体が二つの未来を経験することはできない
ある個体
未来1 未来1’
未来 未来’
ある一個体のたった一つの未来
悠久の時の流れ
暴露:薬剤 アウトカム
現実!
観察できない(実際には起こらないので)
比較
一個体内でCounterfactual
を比較することはできない
注) 一部例外あり
良く似た個体群を振り分けて、それぞれの未来を経験させる。
4匹のネズミの二つの未来
悠久の時の流れ
暴露:薬剤 アウトカム
1/4
3/4
未来1’
未来2’
未来1
未来2
知りたいこと
比較同一個体
A群
B群
8匹のネズミのそれぞれの未来
悠久の時の流れ
暴露:薬剤 アウトカム
1/4
3/4
知れること
比較似ている
A群
B群
8匹のネズミのそれぞれの未来
悠久の時の流れ
暴露:薬剤 アウトカム
1/4
3/4
知れること
比較似ている十分に似た二群であればお互いのCounterfactualと見なせる
Exchangeability交換可能。A群とB群を入れ替えて交換しても同じ。
ignorabilityともいう
交換可能にするにはどうやって振り分けるか?
案1: 副作用が心配だから調子が良さそうなネズミに薬を使おう。
A群
B群
8匹のネズミのそれぞれの未来
悠久の時の流れ
暴露:薬剤 アウトカム
1/4
3/4
比較似てない!
体調の悪いネズミ
体調の良いネズミ
A群
B群
8匹のネズミのそれぞれの未来
悠久の時の流れ
暴露:薬剤 アウトカム
1/4
3/4
比較似てない!
体調の悪いネズミ
体調の良いネズミ
薬の差なのかネズミの差なのか分からない。=お互いのCounterfactualになっていない。
図式化して考える方法Counterfactual同士のフェアな比較ができているか
Causal diagram
Directed acyclic graph (DAG)に因果関係の解釈を持たせたもの
A B C
悠久の時の流れ
Edge(矢印)は因果関係を示すNodeそれぞれの事象
四角囲みは選択/
層別化を示す
A B C
D F
E
A B C
D F E
共通原因は相関をもたらす
共通原因で選択/層化すると相関が切れる
“d-connected”
“d-separated”
共通結果は相関を作らない
“d-connected”
“d-separated”
共通結果(やその結果)で選択/
層化すると相関をもたらす
この場合の疑問
薬剤投与 ?Yes/No Yes/No
病気の改善
悠久の時の流れ
薬剤投与
ネズミの調子
?Yes/No Yes/No
病気の改善
ベースラインの健康状態は治療選択に影響する
薬剤投与
ネズミの調子
?Yes/No Yes/No
病気の改善
ベースラインの健康状態は治療選択に影響するアウトカムにも影響する可能性がある
薬剤投与
ネズミの調子
Yes/No Yes/No
統計学的に関連が見えてしまうCommon cause/共通原因の存在
Confounding/交絡と呼ぶ
病気の改善
相関 = 因果関係による相関 + 交絡による相関
?
ランダムに治療を割り付けたらどうか?
研究者は考えるのをやめた
薬剤を投与する 薬剤を投与しない
ランダムに二群にわける 両群の質がそろう
薬剤投与
ネズミの調子
?Yes/No Yes/No
病気の改善
矢印無し
統計学的に有意な関連があれば薬剤の効果Association = Causation
相関 = 因果
すべてこうすればよい?
ランダム化比較試験の問題点
! Feasibility(実現可能性)の問題
! Generalizability(外的妥当性/一般化)の問題
Feasibilityの問題
! 何でもかんでも実験はできない。
! お金や倫理の問題。
! プラセボ(偽薬)との比較の是非。
実現可能性
Generalizabilityの問題! 治験では除外規準がある。
! 治療対象の病気は重め、他は健康、みたいな人が好まれる。実際の診療ではむしろ逆。
! 期間が短めになる。実際の診療では治療が生涯にわたることも。
一般化可能性
そこで観察研究
! 世の中で現実に起こっていることを、ありのままに観察して因果関係を考える
! 薬剤の市販後の調査など
! ランダム化比較試験が不可能/困難な内容の研究
Observational study
観察研究の役割! 治験に入れなかった、高齢者、他にも病気がある人、妊娠中の人などで薬剤の効果/有害事象が違わないかどうか。
! (偽薬でなく) 治療薬同士の比較、あるいは治療方法(薬剤の投与のしかた)などの比較
comparative effectiveness
日常診療で治療の割り付けはランダムか?
医師がよく考えて治療を決めている。(はず)
http://www.slideshare.net/kaz_yos/20130921-talktojapanesescientists20130921a
Causal Diagramの説明はこちらを参考
薬剤投与
年齢
Yes/No Yes/No病気の改善?
性別重症度
統計学的な関連は直接薬剤の効果を意味しないAssociation ≠ Causation
相関 ≠ 因果相関 = 因果関係による相関 + 交絡による相関
よく考えて治療を決めた結果...
そのまま比較できない
薬剤投与
年齢
Yes/No Yes/No病気の改善?
性別
制限 (重症度、性別、年齢で絞り込む)
層別化 (いくつかのグループに分けてグループ内で比較)
統計学的な調節(原理的には層別化)
重症度
Restriction
Stratification
Adjustment
Propensity score
薬剤投与
年齢
Yes/No Yes/No病気の改善?
性別
これらを一つにまとめる
重症度
薬剤投与
PS
Yes/No Yes/No病気の改善?
Propensity score
複数の交絡因子がPropensity scoreとして一つにまとめられた。
注) 影響の強い交絡因子はすべて観測されている必要がある。
解釈: 同じような被験者が次に来たときに医師が治療を選ぶ確率
e.g., PS=0.25: このような被験者のうち25%が治療を受ける
以降の図解は有名なSwan-
Ganz cathのデータより
Dr. Frank Harrell. Right heart catheterization datasethttp://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/DataSets
治療じゃない!
治療戦略の一環ということで..
PS分布
治療群無治療群
PS: 確率なので0から1
合計
Propensity scoreの分布
注)グラフは描き方の関係で足が出ています
Propensity scoreの分布(左右に展開)
治療群
無治療群
縦軸がPS
治療群無治療群縦軸がPS
PS=0.50
PS=0.25
PS=0.75 75%が治療群25%が無治療群
25%が治療群75%が無治療群
薬剤投与
PS
Yes/No Yes/No病気の改善?
Propensity score
PS→薬剤投与の矢印がじゃま。PSを共通原因にしている。
じゃま
じゃまな矢印をなんとかしたい
! 両群のPSが同じところ同士に限定して比べる
! 両群のPS分布の形態をそろえて全体を比べる
治療群無治療群PS 層別化
層1
層2
層3
層5
層4
その層内で比較
PS層別化! 利点
! 分かりやすい
! 好きな効果量を測定(リスク比やリスク差)
! 層ごとに治療効果が異なるか評価できる
! 欠点
! いくつにわけるのか?幅が広すぎないか?
! 一番下と一番上の層は群間のバランスが悪い
治療群無治療群PS 調節
基本的にはモデルを使う層別化。無限に細かい階層内で無治療群、治療群を比較する。
PS調節! 利点
! ソフトウェアでやるのが楽
! 欠点
! 基本的にオッズ比しか出せない
! PSとアウトカムの関係を正しくモデル化する必要性
! PSの違いによる効果の違いをどうモデル化するか?
薬剤投与
PS
Yes/No Yes/No病気の改善?
これらはPSが同じ患者同士しか比べない
PSが同じ患者同士では治療の選択はランダムに起こっていると解釈できる。PSが同じ人の中ではPSは治療選択を予測しない。(定数は相関しない)
治療群無治療群PSマッチング
PS=0.50
PS=0.25
PS=0.75
同じぐらいのPSの治療群と無治療群の被験者を対にしていく。つまり、相方がいないところを切りすてる。
PSマッチング! 利点
! 分かりやすく一番人気。
! Marginal effect (RCTのような解釈)
! 好きな効果量を測定(リスク比やリスク差)
! PSの違いによる効果の違いは無視してもよいし、検討しても良い
! 欠点
! 一部の対象者のデータを捨てることになる
治療群無治療群PS 重みづけ(IPTW) 同じ形になるように対象
者をふくらます。自分のグループの割当確率の逆
数を掛ける。
75%が治療群。1/0.75倍すると全体の大きさ(1)になる。 1人が1.33
人になる。
25%が無治療群。1/0.25倍すると全体の大きさ(1)になる。1人が4
人になる。
25%が治療群。1/0.25
倍すると全体の大きさ(1)になる。 1人が4人
になる。
75%が無治療群。1/0.75倍すると全体の大きさ(1)になる。1人が1.33人になる。
Inverse probability of treatment weight (IPTW)
治療群無治療群
同じ形になるように対象者をふくらます。自分のグループの割当確率の逆数を掛ける。その後、それぞれの群が元の人数になるように圧縮する。治療群には治療群の元々の割合、無治療群には無治療群の元々の割合をかける。
Stabilized inverse probability of treatment
weight (Stabilized IPTW)
PS=0.50
PS=0.25
PS=0.75
PS 重みづけ(S-IPTW)
PS重みづけ(IPTW)! 利点
! Marginal effect (RCTのような解釈)
! コホート全体を治療した時の効果(IPTW)
! 欠点
! 対象者のインフレ。端の方の人が大きくなる
! “コホート全体を治療した場合”というシナリオは有効?
治療群無治療群PS 重みづけ(SMRW)
治療群はそのまま残す(重み1)。無治療群は1/(1-PS)をかけて全体の大きさまでふくらます。さらにPSをかけて、治療群の大きさにそろえる。
Standardized mortality ratio weighting (SMRW)
PS=0.50
PS=0.25
PS=0.75
PS重みづけ(SMRW)! 利点
! Marginal effect (RCTのような解釈)
! 治療群を治療した時の効果(SMRW)
! 欠点
! 対象者のインフレ。無治療群の上端の方の人が大きくなる
薬剤投与
PS
Yes/No Yes/No病気の改善?
これらはPSと薬剤投与の関連を断ち切る
これらの手法によるMatched cohortやPseudo-populationの中ではPSと治療選択の相関がなくなっている。
矢印無し
まとめ! 因果推論は比較することで行われる。
! Counterfactualを比較する。
! 一番理想的なのはランダム化比較試験。
! 観察研究の場合はいろいろ工夫が必要。
スライド: http://www.slideshare.net/kaz_yos/
コード: http://rpubs.com/kaz_yos/ps-rhc