ジャーナルの批判的吟味と委託研究について

91
ジャーナルを読んで エビデンスを手に入れる 委託研究は 批判的吟味に耐えるか? 勉強会 2016.7

Upload: k-kajiwara

Post on 16-Apr-2017

635 views

Category:

Health & Medicine


0 download

TRANSCRIPT

Page 1: ジャーナルの批判的吟味と委託研究について

ジャーナルを読んで

エビデンスを手に入れる

委託研究は

批判的吟味に耐えるか? 勉強会 2016.7

Page 2: ジャーナルの批判的吟味と委託研究について

ジャーナルを読む

掲載論文の

質の高いことが多いもの

海外一流紙

コクランレビュー

海外のメジャーな雑誌

国内学会誌(症例報告以外)

質の高くないものが混じりやすもの

商業誌

病院雑誌

Page 3: ジャーナルの批判的吟味と委託研究について

ジャーナルを読む

1. 国内学会の雑誌を読む

2. 海外のメジャーな雑誌を読む

3. 国内の商業誌を読む

Page 4: ジャーナルの批判的吟味と委託研究について

国内学会の雑誌を読む

• アレルギー学会,呼吸器学会など

• 査読は商業誌ほど緩くなく,原著の質は良いものが多い.

• 症例報告がほとんどで,原著が少ない

Page 5: ジャーナルの批判的吟味と委託研究について

新規ドライパウダー吸入器の性能. 田村 弦,栄 宏和,藤野 聡

日呼吸誌, 4(3): 223-226, 2015

評価項目 オーキシス® タービュヘイラーとオンブレス® ブリーズヘラー,

レルベア®100 エリプタのエアロゾル粒度分布とエアロゾル化率

結果 すべてのデバイスが 1 峰性の粒度分布.

ピークはタービュヘイラー® が 2~3 μm,ブリーズヘラー® が 3

~4 μm,エリプタ® がほぼ 4 μm であった.

エアロゾル 化率では,タービュヘイラーが最も高く,エリプタが

最も低かった.

臨床的意義 エリプタやブリーズヘラーはエアロゾル化率が低く咽喉頭部への

刺激に注意.タービュヘイラーは吸気流量が高いとエアロゾルか

率が高くなる.

Page 6: ジャーナルの批判的吟味と委託研究について

ジャーナルを読む

1. 国内学会の雑誌を読む

2. 海外のメジャーな雑誌を読む

3. 国内の商業誌を読む

Page 7: ジャーナルの批判的吟味と委託研究について

Do Patients of Subspecialist Physicians Benefit from Written Asthma Action

Plans? Am J Respir Crit Care Med. 2015 Jun 15; 191(12): 1374–1383.

Patients 407例の小児・成人難治性喘息

Exposure

Comparison アクションプランを明記した書面か,それ以外の指示かにランダ

ム割り付け.

Outcome 12ヶ月後の喘息症状スコア,緊急受診,Asthma quality of life

Results 両群とも改善し,割り付け群による差はなし

臨床的意義 「臨床試験に参加するだけで・患者指導を受けることだけで」も

改善する.書面形式のアクションプランの上乗せ効果は明らかで

はない.

Page 8: ジャーナルの批判的吟味と委託研究について

Long-Term Once-Daily Tiotropium Respimat® Is Well Tolerated and Maintains

Efficacy over 52 Weeks in Patients with Symptomatic Asthma in Japan: A

Randomised, Placebo-Controlled Study.

Ohta K, Ichinose M, Tohda Y, Engel M, Moroni-Zentgraf P, Kunimitsu S, Sakamoto

W, Adachi M. PLoS One. 2015 Apr 20;10(4):e0124109.

Patients 285例のICS±LABAで症状が残る気管支喘息

Exposure

Comparison tiotropium 5 μg, tiotropium 2.5 μg ,プラセボにランダム割り付

け.二重盲検,プラセボ比較.

Outcome 長期投与の安全性

Results 安全性は良好

臨床的意義 5μgが良い

Page 9: ジャーナルの批判的吟味と委託研究について

Efficacy of a House Dust Mite Sublingual Allergen Immunotherapy Tablet in

Adults With Allergic Asthma: A Randomized Clinical Trial. JAMA. 2016 Apr

26;315(16):1715-25.

Patients 834例のチリダニアレルギー関連で,吸入ステロイドなどで十分

コントロールされていない気管支喘息

Exposure

Comparison 二重盲検・ランダム割り付け・プラセボ比較

チリダニの舌下免疫療法(6 SQ-HDMまたは12 SQ-HDM)

Outcome 主要評価項目

ICSを減らしている期間に,中等度~重篤な急性増悪が起こるま

での時間

Results 6 SQ-HDMはHR 0.72(95%CI 0.52-0.99),12 SQ-HDMはHR

0.69(95%CI 0.50-0.96)で,プラセボと比べ急性増悪を減らした.

臨床的意義 ダニ舌下免疫療法はダニアレルギーの気管支喘息に有効かもし

れない

Page 10: ジャーナルの批判的吟味と委託研究について

Increased versus stable doses of inhaled corticosteroids for exacerbations of

chronic asthma in adults and children. Cochrane Database Syst Rev. 2016 Jun

7;(6):CD007524.

Studies 8つのランダム化比較試験

Exposure

Comparison 患者主導でICSを増量させる群と,固定容量で比較

Outcome 治療失敗,スケジュール外の受診,緊急受診・入院

Results 差はなし

臨床的意義 シムビコートAMDは効果があるかもしれない報告があるが,ICS

だけ足したのでは効果はないかもしれない

Page 11: ジャーナルの批判的吟味と委託研究について

なぜ,

コクランレビューが良いのか?

Page 12: ジャーナルの批判的吟味と委託研究について

異質性

複数の臨床研究で結論が一致しないこと

「飲むと血圧が10下がる」

という真実がある薬

真実は我々には分からない

我々は「血圧が10下がる」 というデータは必ずしも手に入らない

Page 13: ジャーナルの批判的吟味と委託研究について

異質性の評価

• 元の臨床研究のバイアス

• 偶然誤差

• 研究デザイン・患者背景の違い

複数の臨床研究で結論が一致しないことは,

むしろ当然

Page 14: ジャーナルの批判的吟味と委託研究について

(JAMA Intern Med; 175: 1301-9, 2015. より引用)

恣意的に「効く」論文を集めれば,メタアナリシスの結果は「効く」寄りに

なる.その逆も然り.

レビューも同様に,執筆者の意向に合わせた論文を集められてしまう.

コクランレビューは中立で系統立ったレビューをしており信頼性が高い

Page 15: ジャーナルの批判的吟味と委託研究について

Fluticasone/formoterolの

海外論文を探してみましょう

Page 16: ジャーナルの批判的吟味と委託研究について

Fluticasone/formoterol combination therapy versus budesonide/formoterol for

the treatment of asthma: a randomized, controlled, non-inferiority trial of

efficacy and safety. Bodzenta-Lukaszyk A, Buhl R, Balint B, Lomax M, Spooner K,

Dissanayake S. J Asthma. 2012 Dec;49(10):1060-70.

Patients 中等症~重症の気管支喘息279例

Exposure

Comparison 二重盲検・ランダム割り付け・ダブルダミー

Fluticasone/formoterol 500μg vs budesonide/formoterol800 μg

非劣勢試験

Outcome 主要評価項目は12週のpre dose FEV1変化量

Results Fluticasone/formoterolはbudesonide/formoterolと比べ,

-0.044L(-0.13,0.04)

臨床的意義 用法はいずれも2番目の用量で同じ.何のメリットを持って非劣

勢としたのかは不明.非劣勢ラインのFEV1 0.2Lはおよそ単剤の

気管支拡張剤で改善する値に等しい.

Page 17: ジャーナルの批判的吟味と委託研究について

Efficacy and safety profile of fluticasone/formoterol combination therapy

compared to its individual components administered concurrently in asthma: a

randomised controlled trial.

Bodzenta-Lukaszyk A, van Noord J, Schröder-Babo W, McAulay K, McIver T.

Curr Med Res Opin. 2013 May;29(5):579-88.

Patients 中等症~重症気管支喘息202例

Exposure

Comparison 非盲検ランダム割り付け 非劣性

Outcome 主要評価項目は12週のpre dose FEV1変化量

Results Fluticasone/formoterolは fluticasone + formoterolと比べ,-

0.061L(-0.161,0.040)

臨床的意義 用法はいずれも2番目の用量で同じ.非劣勢ラインのFEV1 0.2L

はおよそ単剤の気管支拡張剤で改善する値に等しい.

Page 18: ジャーナルの批判的吟味と委託研究について

Efficacy and safety of the single-capsule combination of fluticasone/formoterol

in patients with persistent asthma: a non-inferiority trial.

Antilla M, Castro F, Cruz Á, Rubin A, Rosário N, Stelmach R. J Bras Pneumol.

2014 Nov-Dec;40(6):599-608.

Patients 中等症~重症の気管支喘息243例

Exposure

Comparison 非盲検ランダム割り付け 非劣勢試験

FLU/FOR vs BUD/FOM vs FLU単剤

Outcome 主要評価項目は12週のFEV1

Results いずれも差なし(FLU/FORとBUD/FOMの差は0.22L)

臨床的意義 あまり有名ではない雑誌です.

グラフの書き方に作為があります.

FLU/FOMはぎりぎり差は有意ではない.変化量でみた方が良い

ように思いますが・・・.

Page 19: ジャーナルの批判的吟味と委託研究について

合剤同士で比較した試験は

少ない・・・.

Page 20: ジャーナルの批判的吟味と委託研究について

他の雑誌は,Lancet,BMJ,NEJM

呼吸器領域では,Chest,Thorax,Allergyなど

pubmedで探すのが大変なときは和文抄録

NEJM日本国内版,呼吸器内科医(Dr.倉原),呼吸器ドク

ターNのブログ,m3,日経メディカル,ケアネットなど.

Page 21: ジャーナルの批判的吟味と委託研究について

海外のメジャーな雑誌を読む

• 少数精鋭なので,これらの論文の結果だけでは診療領域

をとてもカバーしきれない.

• PLoS ONEはオープンジャーナルの中では信頼性が高い

• Abstractで概要が分かりやすい

• 旬な論文が多い

• 厳しい査読により,質の低い論文は掲載されにくい.

• 論文の信頼性を厳しい目で見なくて済む

Page 22: ジャーナルの批判的吟味と委託研究について

ところが・・・

Page 23: ジャーナルの批判的吟味と委託研究について

JIKEI study

• Lancetの論文が撤回

• 発表当時から「限りなく黒に近いグレー」と称されていた(山崎力. ドキドキワクワク論文☆吟味。医学統計ライブスタイル)

• データ不正と,利益相反の秘匿

(THE LANCET HPより引用)

Page 24: ジャーナルの批判的吟味と委託研究について

JIKEI studyの背景

• 「性善説」で書かれていると考えられることが多かった

• メタアナリシス・ランダム化比較試験の過大評価

• 統計学の軽視

• 企業との利益相反

• 試験デザインや統計解析を企業に任せきりの医師の体質

「性悪説」で論文を批判的に吟味

観察研究の再評価

医師の不勉強の是正

利益相反の厳格化

Page 25: ジャーナルの批判的吟味と委託研究について

利益相反は

• 費用のかかる臨床研究は企業の協力なしでは難し

いので,あってはいけないものではない.むしろ

医学の進歩に企業の協力は不可欠.

• 企業が営利目的で,試験デザイン・統計解析・結

果の解釈に問題が起きるリスクがある.

• 医師が企業任せで無責任になるリスクがある.

Page 26: ジャーナルの批判的吟味と委託研究について

演題発表に関連し,開示すべきCOI関係にある企業

などはありません

正当な報酬であれば

もらえば良いと思います

Page 27: ジャーナルの批判的吟味と委託研究について

ジャーナルを読む

1. 国内学会の雑誌を読む

2. 海外のメジャーな雑誌を読む

3. 国内の商業誌を読む

Page 28: ジャーナルの批判的吟味と委託研究について

国内商業誌を読む

• 誰でも投稿しやすい(エビデンスの一端を担える)

• 色々な日常診療についての研究がある

• 商業誌は統計解析や,試験デザインに大きな問題があって

も査読を通ることが多いので,論文の信頼性を厳しく評価

しなければならない.(Who's Afraid of Peer Review? John Bohannon Science 04

Oct 2013:Vol. 342, Issue 6154, pp. 60-65)

• 査読がないことも

Page 29: ジャーナルの批判的吟味と委託研究について

特に委託研究は

「性悪説」で読まれる

Limitationはどんな臨床試験にもあり止むを得ないが

穴が多い試験デザイン

誤った統計解析

偏った解釈

は,折角書かれた論文の評価を台無しにしてしまう

Page 30: ジャーナルの批判的吟味と委託研究について

Fluticasone/formoterolの

委託研究を

批判的吟味に耐えられるか

見てみましょう

Page 31: ジャーナルの批判的吟味と委託研究について

日本人成人気管支喘息患者を対象としたフルチカゾン/ホルモテロール配合剤(フル

ティフォームエアゾール)の有効性及び安全性の検討 フルチカゾン単剤を対照と

した第III相比較試験. アレルギー・免疫20巻11号 Page1671-1685(2013.10)

試験デザイン %PEFを共変量とした共分散分析

多施設共同無作為化単盲検実薬対照比較試験

主要評価項目の明記:○(mPEF)

平均への回帰の考慮:重要ではない

統計解析 サンプルサイズ設計:○

正規性の考慮:○

検定の多重性の考慮:不要

FAS解析

結果 FFCの方がmPEFが有意に高い 20.63 L/min (95%CI:15.47-25.80)

利益相反 杏林(企業の協力が必要な大規模試験)

臨床試験登録 JapicCTI:101340 主要評価項目など一致

統計学的にも臨床的にも有意な差で信頼性の高い試験と考えます.

Page 32: ジャーナルの批判的吟味と委託研究について

日本人成人気管支喘息に対するフルチカゾン/ホルモテロール配合剤(フルティ

フォームエアゾール)の長期投与時における安全性及び有効性の検討 第III相長

期投与試験.アレルギー・免疫20巻11号 Page1686-1704(2013.10)

試験デザイン 多施設共同無作為化非盲検非対照試験

主要評価項目の明記:安全性の評価

平均への回帰の考慮:観察期間あり

統計解析 サンプルサイズ設計:記載あり

正規性の考慮:不要

検定の多重性:不要

結果 重篤な副作用は少ない

利益相反 杏林,SkyePharma(企業の協力が必要な大規模試験)

臨床試験登録 JapicCTI:101341

有効性は具体的な評価項目の記載なし

安全性の評価目的の試験で,有効性は副次評価項目のよう.投与前にLABAは4

割は入っていないので,ICSの種類は同量でもLABAの分だけPEFが改善するかもしれません.

Page 33: ジャーナルの批判的吟味と委託研究について

SPINの問題 と臨床試験登録

• 主要評価項目に有意差が認められなかった論文で,タイト

ル,抄録,結論,discussionなど様々な方法で「SPIN(す

り替え)」が行われている (JAMA ; 26: 2058-2064, 2010)

• プロトコールと論文で内容が異なるものがある( JAMA; 291: 2457-

2465, 2004)

• 雑誌によっては,事前登録なしでは掲載不能.

• SPINを避け,negative studyが世に出ないバイアスを減ら

すため,登録が勧められる(本邦ではUMIN,JAPIC,

JMACCT)

Page 34: ジャーナルの批判的吟味と委託研究について

批判的吟味に耐えるために

SPINを疑われないように

臨床試験実施前に,臨床試験登録を行う

Page 35: ジャーナルの批判的吟味と委託研究について

新規MDI型吸入薬フルティフォームによる末梢気道炎症改善効果 無作為オープ

ン並行群間試験による検討.アレルギー・免疫21巻10号 Page1588-1596(2014.09)

試験デザイン 単施設無作為化非盲検実薬対照?試験

主要評価項目の明記:あり(喀痰ECP)

平均への回帰の考慮:重要ではない

統計解析 サンプルサイズ設計:記載なし

正規性の考慮:あり

検定の多重性の考慮:なし

直接比較? 間接比較?

Per Protocol解析(アドヒアランス不良を後から除外)

利益相反 杏林

臨床試験登録 UMIN,JAPIC,JMACCTで検索に引っかからず

遅発相でFFC群では統計学的に有意な差があるとしていますが,本来直接比較す

るべきところを,間接比較で解析しているような図に見えます.実際はどう解析

したのでしょうか?

Page 36: ジャーナルの批判的吟味と委託研究について

コントロール(対照群)

「ある人がある薬を飲んだら効くか?」は,

時間を戻したり未来が見えないと無理.

代替案として,「飲んだ」「飲まなかっ

た」という2群を,臨床試験で比べること

で,擬似的に未来を予測しようとしている

Page 37: ジャーナルの批判的吟味と委託研究について

治療なし

治療あり

結果

結果

変化の差を

効果と考える

「薬を飲んだ ⇒ 効く」という因果関係を考えると,

処置群と対照群で,結果に影響を与える背景が同じ

かどうか? 同じであれば,

効果=薬を飲んだら効くという因果関係

Page 38: ジャーナルの批判的吟味と委託研究について

治療なし

治療あり

結果

結果

この3ヶ所をそれぞれ比べるのではなく,それぞれの変化の

差を直接比較する.

同様の指摘はよくある. Effects of prophylactic subcutaneous fentanyl on exercise-induced breakthrough dyspnea in cancer patients: a preliminary

double-blind, randomized, controlled trial. Hui D, Xu A, Frisbee-Hume S, Chisholm G, Morgado M, Reddy S, Bruera E. J

Pain Symptom Manage. 2014 Feb;47(2):209-17.

Page 39: ジャーナルの批判的吟味と委託研究について

批判的吟味に耐えるために

統計解析は疑いの余地のないものに

Page 40: ジャーナルの批判的吟味と委託研究について

intent to treat(ITT)解析

ランダム割り付けを重視.中途脱落は初めに割り付けた群で,脱落直前の

値や,最悪のアウトカムとみなして計算する.

per protocol分析(PP)解析

試験を完遂した例のみを解析.ランダム化が崩れ,治療効果を過大に評価

しやすい.何か悪い理由があって脱落した症例を過小評価する.

Full analysis(FAS)解析

全く薬を服用していない患者や研究開始後のデータが全くない場合など,

よほど極端な例のみ除外.

比較試験での脱落例の扱い

Page 41: ジャーナルの批判的吟味と委託研究について

ITTの向き・不向き

per protocolは,ランダム化が崩れることによる差が

出やすい.ITTはランダム化を優先するので,差が出

にくくなる.

• 差が出ることを目標にする通常の試験にはITT.

• 差が出ないことを目標にする試験(非劣勢試験)は,Per

Protocolが良い.

Page 42: ジャーナルの批判的吟味と委託研究について

外れ値

観測されたデータの中でかけ離れた値

例)心拍数 8/min, K 8.9 mEq/L

ほとんどは記入ミス,入力ミスで訂正する

スミルノフ棄却検定で除外する方法もあるが,意味があっ

てかけ離れている場合がある(例えば重篤な副作用)ので,

むやみに除外してはいけない.

外れ値の影響を受けないノンパラメトリック検定を選ぶ方

法もある.

事前設計で客観的な基準で明言している場合以外は,外れ値は除外しない方

が無難です.相関分析や回帰分析だとずれるので,外れ値のありなし両方で

解析をします

Page 43: ジャーナルの批判的吟味と委託研究について

批判的吟味に耐えるために

通常はITT解析

解析時における除外は客観性のあるもののみに

Page 44: ジャーナルの批判的吟味と委託研究について

フルティフォームの吸入手技習得度と肺機能の評価.Prog.Med34巻Page1827-

1833(2014.10)

試験デザイン 単施設非対照介入試験

主要評価項目の明記:なし

平均への回帰の考慮:重要ではない

2013/11~2014/3

統計解析 サンプルサイズ設計:(下記)

正規性の考慮:あり

検定の多重性の考慮:不要

利益相反 杏林.

臨床試験登録 UMIN,JAPIC,JMACCTで検索に引っかからず

「臨床試験受託機関がデータ回収,データマネジメント,統計解析,データ解釈のサポー

トおよび論文執筆のサポートを実施した.」

本邦の第Ⅲ相試験(2013.10)後に「フルティフォームの実臨床での使用経験が少ない状

況に鑑みて,むやみに症例数は増やすべきではないと考えられた(中略)ACQ,FEV1に

与える影響を初めて調べる症例数として20例程度あれば,予備的に有意義なデータが得

られると考えられ,統計学的に有意な差は得られない可能性はあるが,20例を目標とす

ることで妥当と判断した.」と第Ⅲ相試験のFEV1の結果を否定してしまった.

Page 45: ジャーナルの批判的吟味と委託研究について

批判的吟味に耐えるために

探索的研究は大規模臨床試験の前に

Page 46: ジャーナルの批判的吟味と委託研究について

フルティフォームの吸入手技習得度と服薬アドヒアランスおよび喘息コント

ロールとの関連性.Prog.Med 34: 2001-2005(2014.11)

試験デザイン 単施設非対照介入試験

主要評価項目:アドヒアランス? FEV1?手技習熟度?

平均への回帰の考慮:なし

2013/11~2014/3

統計解析 サンプルサイズ設計:あり(FEV1で計算)

正規性の考慮:あり

検定の多重性の考慮:不要

利益相反 杏林.

臨床試験登録 UMIN,JAPIC,JMACCTで検索に引っかからず

「臨床試験受託機関がデータ回収,データマネジメント,統計解析,データ解釈のサポートおよび論文執筆のサポートを実施した.」

Page 47: ジャーナルの批判的吟味と委託研究について

コントロール不十分な喘息患者に対するICSまたはICS/LABAからフルティフォー

ムへの切り替え効果の検討.アレルギー・免疫21巻11号 Page1752-1759(2014.10)

試験デザイン 単施設非対照介入試験

主要評価項目:記載なし

平均への回帰の考慮:記載なし

2013/11~2014/3

統計解析 サンプルサイズ設計:(下記)

正規性の考慮:あり

検定の多重性の考慮:なし(ただし補正しても結果は不変)

利益相反 杏林(下記)

臨床試験登録 UMIN,JAPIC,JMACCTで検索に引っかからず

「臨床試験受託機関がデータ回収,データマネジメント,統計解析,データの解釈のサポー

ト及び論文執筆のサポートを実施した」とあり.

本邦の第Ⅲ相試験(2013.10)後に「本邦において,フルティフォームの実臨床での使用経

験が少ない状況を鑑みて,むやみに症例数を増やすべきではないと考えた。(中略)統計学

的に有意な差は得られない可能性はあるが20症例を目標とすることで妥当と判断した。」

Page 48: ジャーナルの批判的吟味と委託研究について

平均への回帰

1回目の結果が偏っていた対象について2回目の試験

結果を調べると,その平均値は1回目の測定値より

も1回目全体の平均値に近くなる.

例)

• カジノのビギナーズラック

• 1年目で大活躍した新人は2年目成績が落ちるジンクス

• いつもよりも血圧が高かった日の翌日は,前日よりは血圧が低くなり

やすい.

• 風邪を引いて体温が高かった日の1週間後の体温は,1週間前よりは体

温が低くなりやすい.

Page 49: ジャーナルの批判的吟味と委託研究について

平均への回帰

普段の血圧は120 昨日は過食して

今日の血圧は160 薬投与後の血圧は120

薬の効果で下がった?

投薬開始までに観察期間を設ける方法やプラセボ比較で平均

への回帰によるバイアスを減らすことができる.

Page 50: ジャーナルの批判的吟味と委託研究について

批判的吟味に耐えるために

比較対照をする

対照のない試験では観察期間を設ける

Page 51: ジャーナルの批判的吟味と委託研究について

好酸球性炎症残存末梢気道病変を有する喘息患者に対するフルチカゾン/ホルモテ

ロールエアゾールとフルチカゾン/サルメテロールディスカスとの治療効果の比較.

アレルギー・免疫21巻12号 Page1932-1940(2014.11)

試験デザイン 単施設非盲検無作為割付実薬対照試験

主要評価項目:記載なし

平均への回帰の考慮:不要

2013/11~2014/4

統計解析 サンプルサイズ設計:(下記)

正規性の考慮:あり

検定の多重性の考慮:なし(補正すると有意ではなくなる)

利益相反 杏林(下記)

臨床試験登録 UMIN,JAPIC,JMACCTで検索に引っかからず

「臨床試験受託機関によりデータ回収,データマネジメント,統計解析,データ解釈のサ

ポート及び論文執筆のサポートを受けた」.本邦の第Ⅲ相試験(2013.10)後に「まだ使用経

験は少なく,症例設定で参考となるデータが限られる。そのような条件下において,統計学

的有意差を得るには少ない症例ではあるが,最初の臨床研究としては有用な知見が得られる

ものとして,各群10例,合計20例を目標症例数とした。」

Page 52: ジャーナルの批判的吟味と委託研究について

盲検化

こちらの群は,

頻繁に検査して

薬を追加しよう・・・

こちらの群の薬じゃ

効かないと思うな・・・

Page 53: ジャーナルの批判的吟味と委託研究について

盲検化

被験者,医師,データ解析者が介入試験の割り付け

群を知ってしまうと,治療態度や内容に影響してし

まうかもしれない.

これを避けるための盲検化(blinding).

Double-blindは,被験者と医師への盲検化.

実臨床ではプラセボや二重盲検化は難しいので,作

為的にその他の治療内容を変更しないことが求めら

れる.

Page 54: ジャーナルの批判的吟味と委託研究について

批判的吟味に耐えるために

作為を疑われないよう可能な限り盲検化

盲検化が無理なら作為がないことを示す

Page 55: ジャーナルの批判的吟味と委託研究について

検定の多重性が問題となるとき

• 複数の群から2つだけを抜き出して検定する

• 主要評価項目を設けずに複数の項目を評価

する

• 途中解析をする,または差が出なければ症

例数を増やして再解析.繰り返すプール解

析.

Page 56: ジャーナルの批判的吟味と委託研究について

検定の多重性 複数の群のうち2つだけを抜き出して,2群間の比較を複数回

行うと,「差がないのを差がある」と判定するαエラーが増

えてしまう.

多重比較や,Bonferroni補正を使う.

(「もし20回測って5%の偶然が1回も起きない確率」は36%しかない).

v v

Page 57: ジャーナルの批判的吟味と委託研究について

主要評価項目を設けない問題

例外として,大規模試験の前の探索的研究・パイロットスタ

ディは良いとされる.

探索する回数が多ければ,

P<0.05はどこかで当たる.

それが意味のあるものなのかは

P値では分からない.

Page 58: ジャーナルの批判的吟味と委託研究について

Bonferroni補正

2群間の比較を使うが,比較する回数で危険率を割

る(またはp値に比較する回数をかける)

3回検定のとき,0.05/3= 0.017以下で有意差ありとする

または,p値を3倍にして記載する.

もう少しβエラーを減らす方法としてホルム法がある.

Page 59: ジャーナルの批判的吟味と委託研究について

批判的吟味に耐えるために

盲目的に探していると疑われないよう

主要評価項目を明記し

検定の多重性の問題を調整する

Page 60: ジャーナルの批判的吟味と委託研究について

喘息コントロールに対するフルティフォームとアドエア ディスカスの比較検討

アレルギー・免疫 (1344-6932)21巻12号 Page1924-1931(2014.11)

試験デザイン 単施設非盲検無作為割付実薬対照試験

主要評価項目の明記:なし

平均への回帰の考慮:重要ではない

2013/11~2014/5

統計解析 サンプルサイズ設計:(下記)

正規性の考慮:記載なし

検定の多重性の考慮:微妙

利益相反 杏林.杏林が用意したアンケート

臨床試験登録 UMIN,JAPIC,JMACCTで検索に引っかからず

本邦の第Ⅲ相試験(2013.10)後に「まだ使用経験は少なく,安全性など考慮するとむやみに大規模臨床を実施すべきではないが,(中略)24例では統計学的有意差は得られない症例数ではあるが,フルティフォームの治験に参加した経験より,特徴を見出しやすい項目を中心に,パイロット的に有用な知見が得られるものと考え設定した」 「臨床試験受託機関はデータ回収,データマネジメント,統計解析,結果の解釈のサポート及び論文執筆のサポートを受けた」

統計学的に有意ではないことも効果があったと解釈して書いている部分が多いのが残念.

Page 61: ジャーナルの批判的吟味と委託研究について

p値と差の大きさ

p値が低いことは,差の大きさを示さず,臨床的に意味のある

差かどうかも分からない.

要因2あり 要因2なし

要因1あり 10 9

要因1なし 10 5

要因2あり 要因2なし

要因1あり 100 90

要因1なし 100 50

p=0.01 p=0.64

p=0.61

比はそのまま

nを8倍に

p=0.12

nさえ増やせば,p値はどんどん下がっていく

Page 62: ジャーナルの批判的吟味と委託研究について

p=0.049 と p=0.051の間

• 解析前に有意水準を0.05にしたのなら,0.049は

有意であり,0.051は有意ではない.

• p > 0.05のときに,「統計的に有意な傾向があ

る」というのはダメ.差の信頼区間や効果量を

表記する

• p値自体はn数で変わるため,p=0.049であろう

が,p=0.051であろうが,臨床的に意味のある

差があるかどうかを考える.

Page 63: ジャーナルの批判的吟味と委託研究について

効果量 effect size

• 単位やnの大きさにかかわらず,差の大きさ

を示す

• p値と異なり,他の論文とも比較できる

• 事前設計のサンプルサイズの計算,事後の差

の大きさを示す,メタアナリシスに使われる.

Page 64: ジャーナルの批判的吟味と委託研究について

信頼区間

信頼区間(confidence interval)は真の値の範囲を表す際に

用いる.

推定値が比であれば,信頼区間が1をまたいでいなければ

差は有意と判定される

パラメトリック検定で求められる

日本人の平均身長は,

100~200 cmの中にあります

日本人の平均身長は,

167~169 cmの中にあります

Page 65: ジャーナルの批判的吟味と委託研究について

批判的吟味に耐えるために

p<0.05に固執せずに95%信頼区間を

記載する

Page 66: ジャーナルの批判的吟味と委託研究について

フルティフォームの効果発現に関する検討

アレルギー・免疫 (1344-6932)22巻1号 Page116-125(2014.12)

試験デザイン 単施設非盲検無作為割付実薬対照試験

主要評価項目の明記:なし

平均への回帰の考慮:重要ではない

2013/11~2014/7

統計解析 サンプルサイズ設計:(下記)

正規性の考慮:記載なし

検定の多重性の考慮:不要

利益相反 杏林.杏林が用意したアンケート

臨床試験登録 UMIN000012327(検索に引っかからず?)

本邦の第Ⅲ相試験(2013.10)後に「症例数設定で参考となるデータが限られる中,むやみに症例数は増やすべきではないと考えた。統計学的有意差を得るには少ない症例数であるが,最初の臨床研究としては十分な知見が得られるものとして各群10例,合計20例を目標症例数とした。」

呼吸機能に対する作用は,統計学的に有意ではないのに,結論では「呼吸機能及び症状の早期改善が示された。」と結論から先に書いているように見えるのが残念.

Page 67: ジャーナルの批判的吟味と委託研究について

そもそもEBMとは

① 目の前の患者さんの診療における

臨床的問題点・日常診療のギモン

(Clinical Question)を探す

② それを解決するための文献を探す

③ その文献の妥当性,信頼性,結果,臨床的意義を

検討する

④ 患者さんに説明し,方針を決める

Page 68: ジャーナルの批判的吟味と委託研究について

Evidence

医療統計

研究

Research Question

Clinical Question

医師主導

この薬が効くかどうかは

どのような試験が良いか

Page 69: ジャーナルの批判的吟味と委託研究について

?な 医療統計

?な 研究

Research Question

この薬が効くというには

どのような試験が良いか

委託研究

?な結果

Page 70: ジャーナルの批判的吟味と委託研究について

委託研究が悪いわけではないが

不適切な臨床試験は悪い

臨床試験の弊害

参加する患者さんは,原則メリットを受けられない.

参加する患者さん・医療者は費用・時間・労力などを要する.

結果が分かっている臨床試験(特にランダム化比較試験)は組

んではいけない.

間違った試験デザイン・統計解析・解釈は 禁忌

Page 71: ジャーナルの批判的吟味と委託研究について

批判的吟味に耐えるために

委託研究「だからこそ」批判的吟味に

耐えられる試験を

Page 72: ジャーナルの批判的吟味と委託研究について

気管支喘息治療におけるフルチカゾンプロピオン酸エステル/ホルモテロールフマ

ル酸塩水和物エアゾールの有用性の検討 吸入補助器具(スペーサー)による影響.

アレルギー・免疫 (1344-6932)22巻8号 Page1106-1118(2015.07)

試験デザイン 多施設非盲検試験クロスオーバー

主要評価項目の明記:あり

平均への回帰の考慮:あり

統計解析 サンプルサイズ設計:記載なし

検定の多重性の考慮:不要

結果 スペーサーの有無でFEV1は有意な差はない.

利益相反 杏林

臨床試験登録 UMIN,JAPIC,JMACCTで検索に引っかからず

結果を見ると,サンプルサイズ設計,効果量,95%信頼区間などについて記載す

ればnegative studyでも臨床的な差がないという結果を言えそうに見えるのだが,

記載が見当たらない.

Page 73: ジャーナルの批判的吟味と委託研究について

仮説検定

帰無仮説

H0

帰無仮説はタテマエで,

間違いだと疑っているもの

もし帰無仮説が正しいなら,観測され

たデータを得る確率は少ないことがわ

かった!

対立仮説

H1

それなら対立仮説の方が

正しいじゃないか!

Page 74: ジャーナルの批判的吟味と委託研究について

事前のサンプルサイズの計算

仮説検定の結果

差は有意 差は有意ではない

サンプル

サイズ

過多 差を過大評価

経費・患者負担過多

差はないと考えることが多い (本当は差があるともないとも言えない)

適切 ◎ 差はないと考えることがある (本当は差があるともないとも言えない)

過少 差があると

考えて良い

差があるともないとも言えない

経費無駄遣い

患者さん負担

negative studyの場合,仮説検定で統計学的に差が有意でなければ,臨床的に差

があるかどうかを考えて,論文中で「差がない」と記載することはある.

ただし,サンプルサイズ不足で統計学的に差が有意でないのは論外.

Page 75: ジャーナルの批判的吟味と委託研究について

p>0.05で

帰無仮説を棄却できなかったとき

帰無仮説が棄却できなければ,差があるともないとも言えない.

同等性を示したいのであれば,非劣勢試験.

差があっても小さいと示唆するには,効果量や信頼区間を示す.

十分なサンプルサイズがあれば信頼区間が狭くなるので,臨床

的な差がないと言えることがある.

p>0.05であり,同等と考えられました

という間違った評価をする方が後を絶ち

ません・・・.特に,都合に合わせて「同

等」,「有意な傾向」と言い分を代える

のは最悪です.

Page 76: ジャーナルの批判的吟味と委託研究について

批判的吟味に耐えるために

統計学的に有意な差と臨床的に有意な差

を分けて考える

Page 77: ジャーナルの批判的吟味と委託研究について

従来治療でコントロール不十分な喘息患者におけるアドエアからフルティフォー

ムへの切り替え効果 4試験のPooled解析 アレルギー・免疫 (1344-6932)23巻1号

Page110-118(2015.12)

試験デザイン Pooled解析

主要評価項目の明記:なし

平均への回帰の考慮:なし

統計解析 サンプルサイズ設計:記載なし

検定の多重性の考慮:なし(グラフも変)

利益相反 杏林

臨床試験登録 重要性は低い

4つの試験は同時期にアンケートも含めて杏林が計画した委託研究であり,サラミ

法と言われかねない.

元の論文で平均への回帰が考慮されていなければ,poolしても同じ.

主要評価項目を決めておらず,グラフと検定法がちぐはぐになっている.

Page 78: ジャーナルの批判的吟味と委託研究について

B薬

A薬

対応がある検定の場合,欠損値のある症例は全て

除外される.

グラフも,除外例は記載しない方が良い.

複数の群の中から2群だけを抜きだして検定する

のは,検定の多重性の問題がある.

100例 100例 100例

80例 80例 80例

Page 79: ジャーナルの批判的吟味と委託研究について

欠損データ

対応がある検定の場合

a) 欠損データのある症例を除外して解析する

b) 欠損データの多い測定項目を除外して解析する

相関の検定の場合

欠損データのある症例を除外して解析する

対応がない検定の場合

そのまま解析して良い

除外

欠損データは,完全情報最尤法,多重代入法など補完する方法もあります.

Page 80: ジャーナルの批判的吟味と委託研究について

批判的吟味に耐えるために

統計解析は疑いの余地のないものに

(大事なことなので2回言います)

Page 81: ジャーナルの批判的吟味と委託研究について

プール解析とメタ解析

プール解析

症例数が少ない検出力不足の試験を補える.

元となる試験デザインが良くなければあまり意味がない.

繰り返すと検定の多重性の問題がある.

シンプソンのパラドックスを克服していない.

メタ解析

「究極の後付け解析」と称される.ある条件を決めてデータ

を抽出し,フォレストプロットforest plotを作る.

元となる試験デザインが悪ければあまり意味がない.

Page 82: ジャーナルの批判的吟味と委託研究について

メタアナリシス

A 有効 無効 有効率

治療群 9 1 90%

対照群 17 3 85%

B 有効 無効 有効率

治療群 3 17 15%

対照群 1 9 10%

有効 無効 有効率

治療群 12 18 40%

対照群 18 12 60%

治療群の方が有効率が高いはずなのに?

~ シンプソンのパラドックス ~

データをそのまま足し合わせると,

パラドックスが起きる.

Page 83: ジャーナルの批判的吟味と委託研究について

メタアナリシス

サンプルサイズが多い試験の方が,偶然誤差による

ばらつきは小さい.

それぞれの試験の効果量を,サンプルサイズが大きい

試験により重みを置いて重み付け.

Page 84: ジャーナルの批判的吟味と委託研究について

従来治療で効果不十分な喘息患者におけるフルティフォームの有用性の検討 8試

験のPooled解析

Progress in Medicine (0287-3648)35巻12号 Page1929-1935(2015.12)

試験デザイン 2回目のPooled解析

主要評価項目の明記:なし

平均への回帰の考慮:なし

統計解析 サンプルサイズ設計:記載なし

検定の多重性の考慮:なし(ただし補正しても結果は大きく変わらない)

利益相反 杏林

臨床試験登録 重要性は低い

8つの試験は同時期の杏林の委託研究で,著者らが同じ.1回目のプール解析とほ

ぼ同じ評価項目.委託研究8つのうち,8つ使うか4つ使うかの違い.サラミ出版を

疑われかねない.

Page 85: ジャーナルの批判的吟味と委託研究について

サラミ論文

全て同一時期の,同じ製薬会社による委託研究

1

2

3 4 5 6

7 8 9 10,11

Page 86: ジャーナルの批判的吟味と委託研究について

批判的吟味に耐えるために

論文は数より質

Page 87: ジャーナルの批判的吟味と委託研究について

フルティフォーム(フルチカゾン/ホルモテロール)のデバイス操作性が呼吸機能および喘息コントロールへ与える影響.Prog Med 36: 383-387, 2016.

試験デザイン 「フルティフォームの効果発現に関する検討.アレルギー・免疫

(1344-6932)22巻1号 Page116-125(2014.12)」の追加解析

統計解析 正規性の考慮:なし

検定の多重性の考慮:あまり重要ではない

結果 フルティフォームではFEV1%の変化量と吸入器のアンケート変化

量が相関

利益相反 杏林

臨床試験登録 UMIN 000012327(検索に引っかからず?)

「臨床試験受託機関がデータ回収,データマネジメント,統計解析,データの解釈のサポー

ト及び論文執筆のサポートを実施した」

追加解析であることは明記され,引用もなされています.

正規分布かは微妙なので,ピアソンの相関係数の方が良いのでは.

相関関係と因果関係は別です.「吸入手技の改善とFEV1の改善は相関関係にある」以上のこ

とが言えないように見えるのですが・・・?

Page 88: ジャーナルの批判的吟味と委託研究について

統計的因果推論

相関の検定で分かるのは,何らかの直線的な関係が

あるかどうか.因果関係は分からない.

そもそも相関関係は因果関係の必要条件の1つ.

相関関係 ≠ 因果関係

Page 89: ジャーナルの批判的吟味と委託研究について

杏林・未発表?

医師主導・

未発表?

杏林・未発表?

今後?

KRP-AM1977X ⇒ 治験中

Ad-SGE-REIC ⇒ 治験中

KRP-AB1102F ⇒ 中止

Page 90: ジャーナルの批判的吟味と委託研究について

• 試験デザインから解析まで企業による委託研究?

• 第Ⅲ相試験の結果が出た後に主要評価項目のない

探索的研究?,結果を無視?

• サラミ論文?

• 委託研究の必要がない小規模臨床研究?

• 繰り返すプール解析?

Page 91: ジャーナルの批判的吟味と委託研究について

• Limitationのない研究はなく,Limitation自体が悪

いわけではない.

• 以前は「性善説」で片付けられてた所が,「性悪

説」で厳しく評価されるようになってきた.

• 他の製薬会社でも同様のものはある.

• 試験デザイン・統計解析など,患者さんに迷惑が

かからないように医師と製薬会社にはこれまで以

上のモラルが求められる.