栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎①...

25
1 栄養疫学の基礎① 栄養疫学の基礎① デザインと解析 デザインと解析 国立保健医療科学院 国立保健医療科学院 技術評価部 技術評価部 横山徹爾 横山徹爾 3回日本栄養改善学会「実践栄養学研究集中セミナー」 2008.1.12.名古屋 最終版資料 世の中にあふれる健康情報 世の中にあふれる健康情報 どれがどのくらい信用できるの??? どれがどのくらい信用できるの??? 血清総コレステロ-ルが高いと虚血性心疾患に罹 血清総コレステロ-ルが高いと虚血性心疾患に罹 患する危険が高い 患する危険が高い 抗酸化ビタミンをたくさん摂ると、がんに罹患する危 抗酸化ビタミンをたくさん摂ると、がんに罹患する危 険が下がる 険が下がる 赤ワインに多く含まれるポリフェノールは動脈硬化 赤ワインに多く含まれるポリフェノールは動脈硬化 を予防する を予防する 辛いものを食べると食道がんに罹患しやすい 辛いものを食べると食道がんに罹患しやすい 減塩して血圧が下がると脳卒中に罹患する危険が 減塩して血圧が下がると脳卒中に罹患する危険が 下がる 下がる コーヒーを飲む人は肝がんに罹患しにくい コーヒーを飲む人は肝がんに罹患しにくい 世の中にあふれる健康情報 世の中にあふれる健康情報 どれがどのくらい信用できるの??? どれがどのくらい信用できるの??? 「信用できる」とは? 「信用できる」とは? 偉い人が言った 偉い人が言った 新聞・テレビで報道された 新聞・テレビで報道された ・・・ではなくて、 ・・・ではなくて、 証拠(科学的根拠)が十分にある 証拠(科学的根拠)が十分にある こと こと では、証拠とは何? では、証拠とは何? 例:血清総コレステロールが高いと虚血性心疾患に罹患 例:血清総コレステロールが高いと虚血性心疾患に罹患 する危険が高い する危険が高い ということは誰でも知っている ということは誰でも知っている では、その証拠は何だか知っていますか? では、その証拠は何だか知っていますか? 証拠(科学的根拠) 証拠(科学的根拠) メカニズムを追求しようとするもの メカニズムを追求しようとするもの コレステロ-ルが高いとなぜ虚血性心疾患に罹患しやすいのだろう? コレステロ-ルが高いとなぜ虚血性心疾患に罹患しやすいのだろう? 緑黄色野菜を多く食べるとなぜがんに罹患しにくいのだろう? 緑黄色野菜を多く食べるとなぜがんに罹患しにくいのだろう? 動物実験 動物実験 試験管の中での(ヒトの細胞を使った)実験 試験管の中での(ヒトの細胞を使った)実験 ある現象が本当にヒトにおいて生じているかどうかを調べるもの ある現象が本当にヒトにおいて生じているかどうかを調べるもの コレステロ-ルが高いと虚血性心疾患になりやすいという現象が本当に コレステロ-ルが高いと虚血性心疾患になりやすいという現象が本当に 人間集団の中でおきているのだろうか? 人間集団の中でおきているのだろうか? 緑黄色野菜を多く食べるとがんに罹患しにくいという現象が本当に人間集 緑黄色野菜を多く食べるとがんに罹患しにくいという現象が本当に人間集 団の中でおきているのだろうか? 団の中でおきているのだろうか? 疫学研究(観察研究) 疫学研究(観察研究) じゃあ、コレステロ-ルを下げたら虚血性心疾患になりにくくなるのだろう じゃあ、コレステロ-ルを下げたら虚血性心疾患になりにくくなるのだろう か? か? ビタミン剤を摂取したらがんが予防できるだろうか? ビタミン剤を摂取したらがんが予防できるだろうか? 疫学研究(介入研究) 疫学研究(介入研究)

Upload: others

Post on 16-Aug-2020

11 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

1

栄養疫学の基礎①栄養疫学の基礎①デザインと解析デザインと解析

国立保健医療科学院国立保健医療科学院 技術評価部技術評価部

横山徹爾横山徹爾

第3回日本栄養改善学会「実践栄養学研究集中セミナー」2008.1.12.名古屋 最終版資料 世の中にあふれる健康情報世の中にあふれる健康情報

どれがどのくらい信用できるの???どれがどのくらい信用できるの???

血清総コレステロ-ルが高いと虚血性心疾患に罹血清総コレステロ-ルが高いと虚血性心疾患に罹患する危険が高い患する危険が高い

抗酸化ビタミンをたくさん摂ると、がんに罹患する危抗酸化ビタミンをたくさん摂ると、がんに罹患する危険が下がる険が下がる

赤ワインに多く含まれるポリフェノールは動脈硬化赤ワインに多く含まれるポリフェノールは動脈硬化を予防するを予防する

辛いものを食べると食道がんに罹患しやすい辛いものを食べると食道がんに罹患しやすい

減塩して血圧が下がると脳卒中に罹患する危険が減塩して血圧が下がると脳卒中に罹患する危険が下がる下がる

コーヒーを飲む人は肝がんに罹患しにくいコーヒーを飲む人は肝がんに罹患しにくい

世の中にあふれる健康情報世の中にあふれる健康情報どれがどのくらい信用できるの???どれがどのくらい信用できるの???

「信用できる」とは?「信用できる」とは?

–– 偉い人が言った偉い人が言った

–– 新聞・テレビで報道された新聞・テレビで報道された

・・・ではなくて、・・・ではなくて、

–– 証拠(科学的根拠)が十分にある証拠(科学的根拠)が十分にあることこと

では、証拠とは何?では、証拠とは何?

–– 例:血清総コレステロールが高いと虚血性心疾患に罹患例:血清総コレステロールが高いと虚血性心疾患に罹患する危険が高いする危険が高い

ということは誰でも知っているということは誰でも知っている

では、その証拠は何だか知っていますか?では、その証拠は何だか知っていますか?

証拠(科学的根拠)証拠(科学的根拠)メカニズムを追求しようとするものメカニズムを追求しようとするもの–– コレステロ-ルが高いとなぜ虚血性心疾患に罹患しやすいのだろう?コレステロ-ルが高いとなぜ虚血性心疾患に罹患しやすいのだろう?–– 緑黄色野菜を多く食べるとなぜがんに罹患しにくいのだろう?緑黄色野菜を多く食べるとなぜがんに罹患しにくいのだろう?

動物実験動物実験試験管の中での(ヒトの細胞を使った)実験試験管の中での(ヒトの細胞を使った)実験

ある現象が本当にヒトにおいて生じているかどうかを調べるものある現象が本当にヒトにおいて生じているかどうかを調べるもの–– コレステロ-ルが高いと虚血性心疾患になりやすいという現象が本当にコレステロ-ルが高いと虚血性心疾患になりやすいという現象が本当に

人間集団の中でおきているのだろうか?人間集団の中でおきているのだろうか?–– 緑黄色野菜を多く食べるとがんに罹患しにくいという現象が本当に人間集緑黄色野菜を多く食べるとがんに罹患しにくいという現象が本当に人間集

団の中でおきているのだろうか?団の中でおきているのだろうか?疫学研究(観察研究)疫学研究(観察研究)

–– じゃあ、コレステロ-ルを下げたら虚血性心疾患になりにくくなるのだろうじゃあ、コレステロ-ルを下げたら虚血性心疾患になりにくくなるのだろうか?か?

–– ビタミン剤を摂取したらがんが予防できるだろうか?ビタミン剤を摂取したらがんが予防できるだろうか?疫学研究(介入研究)疫学研究(介入研究)

Page 2: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

2

疫学的な研究論文の読み方疫学的な研究論文の読み方

疫学研究の主な結果は原著論文(主に英語)と疫学研究の主な結果は原著論文(主に英語)として発表されるして発表される

–– 英語が苦手だと読めない?英語が苦手だと読めない?

はい。でも、はい。でも、疫学の原理と方法疫学の原理と方法を知っていれば辞書を引きを知っていれば辞書を引きながら(ながら(時間を時間をかければ)読むことは可能。かければ)読むことは可能。

–– 日本語論文ならば(誰でも)読める?日本語論文ならば(誰でも)読める?

いいえ。いいえ。疫学の原理と方法疫学の原理と方法を知らない人が100回読んでを知らない人が100回読んでも、正しく理解することは不可能。も、正しく理解することは不可能。

つまり、「疫学的な研究論文を読む」ためにはつまり、「疫学的な研究論文を読む」ためには

–– 疫学の原理と方法を学ぶことが必須疫学の原理と方法を学ぶことが必須!!

疫学は人間集団を対象とし,病態すなわち疾病の結果をみるのではなく,疾病の原因を追究する学問である。

脳卒中

心筋梗塞

がん人間集団

原因?

脳卒中

心筋梗塞

がん

高血圧

高脂血症

喫煙

運動不足

肥満

過剰飲酒

これらの証拠は? ・・・ 多くは疫学研究の結果に基づく

食習慣

原因追及の過程原因追及の過程-疫学のサイクル--疫学のサイクル-

第1段階(記述疫学)第1段階(記述疫学)

–– 生態学的研究生態学的研究

–– 横断研究横断研究

第2段階(分析疫学)第2段階(分析疫学)

–– 症例・対照研究症例・対照研究

–– コホート研究コホート研究

第3段階(実験疫学)第3段階(実験疫学)

–– 介入研究介入研究

仮説設定の糸口を得る

仮説を検証する

因果関係を決定する

証拠能力

低い

高い

講義の目標:各研究デザインの原理と解析方法を理解する

Page 3: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

3

第1段階(記述疫学)第1段階(記述疫学)

–– 横断研究横断研究(cross(cross--sectional study)sectional study)地域レベルの横断研究地域レベルの横断研究

=生態学的研究=生態学的研究(ecological study)(ecological study)個人レベルの横断研究個人レベルの横断研究

第2段階(分析疫学)第2段階(分析疫学)

–– 症例・対照研究症例・対照研究(case(case--control study)control study)–– コホート研究コホート研究(cohort study)(cohort study)

第3段階(実験疫学)第3段階(実験疫学)

–– 介入研究介入研究(intervention study)(intervention study)

証拠能力

低い

高い

第1段階(記述疫学)第1段階(記述疫学)

人、場所、時、の変数について、疾病頻度を記述する人、場所、時、の変数について、疾病頻度を記述する。どん。どんな人が、どんな場所で、どんな時に疾病になるのか、克明にな人が、どんな場所で、どんな時に疾病になるのか、克明に記述することは、疫学的方法を用いて疾病の原因に接近す記述することは、疫学的方法を用いて疾病の原因に接近するための第1歩といえる。るための第1歩といえる。

ある要因と疾病との因果に関するある要因と疾病との因果に関する仮説を設定するための糸仮説を設定するための糸口口を得る。を得る。–– 食塩摂取量が多い地域ほど、高血圧者の有病率が高い食塩摂取量が多い地域ほど、高血圧者の有病率が高い

食塩多量摂取が血圧上昇の原因なの食塩多量摂取が血圧上昇の原因なのかもしれないかもしれない

–– 野菜・果物摂取量が多い地域ほど、循環器疾患・がん罹患率が低い野菜・果物摂取量が多い地域ほど、循環器疾患・がん罹患率が低い

野菜・果物(に含まれる何らかの成分)が循環器疾患・がんを予防する野菜・果物(に含まれる何らかの成分)が循環器疾患・がんを予防するかかもしれないもしれない

–– 送電線の近くでは小児白血病の罹患率が高い送電線の近くでは小児白血病の罹患率が高い

電磁波が、白血病に罹患する危険を高める電磁波が、白血病に罹患する危険を高めるかもしれないかもしれない

(次のスライドで用語チェック)

疾病頻度の表し方疾病頻度の表し方

有病率有病率(prevalence)(prevalence)–– ある一時点で疾病Aである者の割合(点有病率)ある一時点で疾病Aである者の割合(点有病率)

例:今年の国民健康・栄養調査では高血圧者が40%でした。例:今年の国民健康・栄養調査では高血圧者が40%でした。

罹患率罹患率(incidence rate)(incidence rate)–– ある期間中(1年間など)に疾病Aに罹患する人の割合ある期間中(1年間など)に疾病Aに罹患する人の割合

例:地域がん登録によると、今年の肺がん罹患率は人口10万対例:地域がん登録によると、今年の肺がん罹患率は人口10万対30でした。30でした。

死亡率死亡率(mortality rate, death rate)(mortality rate, death rate)–– ある期間中(1年間など)に疾病Aで死亡する人の割合ある期間中(1年間など)に疾病Aで死亡する人の割合

例:人口動態統計によると、今年の脳卒中死亡率は人口10万人例:人口動態統計によると、今年の脳卒中死亡率は人口10万人対100でした。対100でした。

※Morbidity rateという言葉が登場することがあり、罹患率を指すことが多いが、使

い方があいまいなので、本来は使うべきではない用語。

第1段階(記述疫学)第1段階(記述疫学)概念図概念図

個人の血圧(地域の高血圧有病率)など

現在

食塩摂取量

比較

時間軸

どちらが原因か 分からない

(1)横断研究(生態学的研究を含む)

(地域間で異なる要因は他にもいろいろある)

Page 4: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

4

(人口動態統計)

田中平三著疫学入門演習南山堂

フレンチ・パラドックスは生態学的研究から出てきた話

1人あたり乳脂肪摂取が多い、肉消費も多い、しかし虚血性心疾患死亡率は低い

S.Renaud et al.:The Lancet,339,1523(1992)

因果関係の逆転に注意!

値は年齢調整最小二乗平均と標準誤差

横断研究による血圧と肥満度・食塩摂取量の関係(40歳以上女性1347名)

110

115

120

125

130

135

140

Q1 Q2 Q3 Q4

肥満度(BMI)の四分位

収縮

期血

圧(m

mH

g)

P<0.001 for trend

110

115

120

125

130

135

140

Q1 Q2 Q3 Q4

食塩摂取量の四分位

収縮

期血

圧(m

mH

g)

P=0.005 for trend

個人レベルの横断研究の例個人レベルの横断研究の例

飲酒量が多い人ほど血圧が高い飲酒量が多い人ほど血圧が高い

肥満度が高い人ほど中性脂肪が高い肥満度が高い人ほど中性脂肪が高い

–– 相関、回帰分析相関、回帰分析

運動習慣がある人はHDLコレステロールが高い運動習慣がある人はHDLコレステロールが高い

喫煙者は血中ビタミンC濃度が低い喫煙者は血中ビタミンC濃度が低い

脳卒中患者は血圧が高い脳卒中患者は血圧が高い

–– 平均値の差の検定平均値の差の検定

肺がん患者は喫煙率が低い肺がん患者は喫煙率が低い

–– 割合の差の検定割合の差の検定

Page 5: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

5

横断研究でよく使われる解析方法1横断研究でよく使われる解析方法1

平均値を群間で比較する平均値を群間で比較する

–– 平均値と標準誤差(や標準偏差)を群毎に計算して、平均値と標準誤差(や標準偏差)を群毎に計算して、tt検定(2群の差、正規分布)、検定(2群の差、正規分布)、MannMann--Whitney UWhitney U検定(非正規分布)検定(非正規分布)

分散分析(3群以上の差)、分散分析(3群以上の差)、KruskallKruskall--WallisWallis検定(非正規分布)検定(非正規分布)

共分散分析(交絡変数で調整して2群以上の差)共分散分析(交絡変数で調整して2群以上の差)

割合を群間で比較する割合を群間で比較する

–– 割合(%)を群毎に計算して、割合(%)を群毎に計算して、

χχ22検定(2検定(2××3以上のクロス表)3以上のクロス表)

FisherFisherの正確な検定(2の正確な検定(2××2表、小標本)2表、小標本)

MantelMantel--HaenszelHaenszel検定(交絡変数で調整したクロス表)検定(交絡変数で調整したクロス表)

拡張拡張MantelMantel検定(2検定(2××3以上のクロス表で順序尺度の場合)3以上のクロス表で順序尺度の場合)

多重ロジスティックモデル(多変量解析)多重ロジスティックモデル(多変量解析)

統計

医学医学データの種類データの種類計量計量データ:量的に測定できる連続的な測定値データ:量的に測定できる連続的な測定値–– 連続データ連続データ (例)身長、体重、血圧、血清総コレステロー(例)身長、体重、血圧、血清総コレステロー

ルル、栄養素摂取量、栄養素摂取量–– 離散データ離散データ (例)(例)うう歯の本数歯の本数

計数計数データ:データ:カテゴリー型のものカテゴリー型のもの–– 2値2値 (例)性別の(例)性別の““男男””とと““女女””、既往歴の、既往歴の““有り有り””とと““なしなし””–– カテゴリーが3つ以上カテゴリーが3つ以上

順序尺度順序尺度ordinal scaleordinal scale:順序関係はあるが絶対量としての意味:順序関係はあるが絶対量としての意味はない測定値。はない測定値。

–– (例)(例)濃い味付けが好きですか:濃い味付けが好きですか: とても好き、好き、ふつう、嫌い、ととても好き、好き、ふつう、嫌い、とても嫌いても嫌い

名義尺度名義尺度nominal scalenominal scale:順序関係がない分類のための変数。:順序関係がない分類のための変数。–– (例)(例)喫煙の喫煙の““現喫煙現喫煙””,, ““非喫煙非喫煙””,, ““やめたやめた””, , などなど..

ポイント: 一見同じ質的データに見えても、順序尺度で量反応関係に注目する場合は、用いる統計手法が違う

基本

統計

データを整理するデータを整理する

いきなり平均・標準偏差を計算しない!いきなり平均・標準偏差を計算しない!

–– まず、まず、ヒストグラムヒストグラム等等を描いて分布を視覚的に確を描いて分布を視覚的に確認認

–– その後、適切なその後、適切な要約統計量要約統計量を決めて分布の特徴を決めて分布の特徴を表現するを表現する

いきなり検定しない!いきなり検定しない!

–– まず、まず、図や要約統計量で比較図や要約統計量で比較して特徴を確認して特徴を確認

–– その後、適切な方法で検定その後、適切な方法で検定

統計 分布型を確認分布型を確認統計学的方法統計学的方法のうち、よく使うのうち、よく使うパラメトリックな方法パラメトリックな方法(t検定など)で(t検定など)では、左は、左右対称な分布(右対称な分布(正規分布正規分布)を前提としている)を前提としているものが多い。ものが多い。従って、可能ならば、何らかの従って、可能ならば、何らかの変換変換によって正規分布に近似させてからによって正規分布に近似させてから処理すべきである。処理すべきである。–– 対数変換対数変換、平方根変換、、平方根変換、 BoxBox--CoxCox(べき)変換など(べき)変換など

正規分布に近似できない場合、正規分布に近似できない場合、ノンパラメトリックな方法ノンパラメトリックな方法を考慮(後述)。を考慮(後述)。

図3 対数正規分布

測定値

度数

右に歪んでいる(対数正規分布)

測定値を対数変換(横軸をlog[測定値]に)すると、左右対称になる

図2 正規分布

測定値

度数

左右対称でベル形(正規分布)

統計

Page 6: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

6

中性脂肪 (mg/dL)

0

20

40

60

80

100

120

34.0

-

68.3

-

102.6

-

136.9

-

171.3

-

205.6

-

239.9

-

274.2

-

308.5

-

342.8

-

377.2

-

411.5

-

445.8

-

480.1

-

514.4

-

548.7

-

583.1

-

617.4

-

651.7

-

686.0

-

度数

(人

log 中性脂肪 (log mg/dL)

0

5

10

15

20

25

30

35

40

45

50

3.5-

3.7-

3.8-

4.0-

4.2-

4.3-

4.5-

4.6-

4.8-

4.9-

5.1-

5.3-

5.4-

5.6-

5.7-

5.9-

6.1-

6.2-

6.4-

6.5-

度数

(人

対数正規分布の典型例対数正規分布の典型例–– 中性脂肪、ビタミン中性脂肪、ビタミンAA摂取量など摂取量など

正規分布の典型例正規分布の典型例–– 身長、体重、総エネルギー・主栄養素摂取量など身長、体重、総エネルギー・主栄養素摂取量など

医学データは、少し右裾が長いことが多い医学データは、少し右裾が長いことが多い

対数変換

統計

代表値(中心位置の指標)代表値(中心位置の指標)

平均値・・・左右対称な場合に有用平均値・・・左右対称な場合に有用

中央値・・・非対称等、歪んだ分布の場合中央値・・・非対称等、歪んだ分布の場合

幾何平均

最頻値

歪んだ分布(対数正規分布など)

中央値

平均値

図4 分布型と代表値

平均値

中央値

最頻値

左右対称の分布(正規分布など)

統計

代表値(中心位置の指標)代表値(中心位置の指標)とと散布度(バラツキ散布度(バラツキの指標)の指標)として、として、–– 「「平均と標準偏差平均と標準偏差」」

–– 「「中央値と四分偏差中央値と四分偏差」」

の組合せがよく用いられる。の組合せがよく用いられる。

図5 標準偏差はバラツキの指標

0 20 40 60 80 100 120 140 160 180 200

測定値

度数

平均=100標準偏差=20

平均=100標準偏差=40

平均±1標準偏差(全体の68%)

平均±2標準偏差(全体の95%)

箱ヒゲ図上側隣接値

75%点

中央値25%点

下側隣接値

統計

血清総コレステロール (mg/dL)

0

10

20

30

40

50

60

113

.0-

124

.6-

136

.3-

147

.9-

159

.5-

171

.2-

182

.8-

194

.4-

206

.1-

217

.7-

229

.3-

240

.9-

252

.6-

264

.2-

275

.8-

287

.5-

299

.1-

310

.7-

322

.4-

334

.0-

度数

(人

平均193, 標準偏差20 (mg/dL)平均193, 標準誤差3 (mg/dL)

血清総コレステロール (mg/dL)

標準偏差は、データのばらつき標準誤差は、標本平均の確からしさ

どちらを使うかは、何を言いたいかによる

どちらを示したか、必ず明記する

標準偏差と標準誤差を混同しない標準偏差と標準誤差を混同しない統計

Page 7: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

7

ところで、検定って何?ところで、検定って何?検定とは検定とは–– 観測された差(や関連)が観測された差(や関連)が偶然によるものか否か偶然によるものか否か

を判断を判断する方法する方法

検定の論法検定の論法–– 「真実(母集団)は差(や関連)がない」と仮定する「真実(母集団)は差(や関連)がない」と仮定する

(=(=帰無仮説帰無仮説HH00))

–– 帰無仮説が正しい場合に、標本において帰無仮説が正しい場合に、標本において観測され観測された差(や関連)が生じる確率(た差(や関連)が生じる確率(P値P値))を計算するを計算する

–– その確率が十分に小さければ(例えばその確率が十分に小さければ(例えばP<0.05P<0.05)、)、帰無仮説が正しい場合に偶然では起こりにくいこ帰無仮説が正しい場合に偶然では起こりにくいことが起きたということなので、帰無仮説を棄却してとが起きたということなので、帰無仮説を棄却して「真実は差(や関連)がある」(=「真実は差(や関連)がある」(=対立仮説対立仮説HH11 ))とと判断する。(一般に、「有意差がある」という)判断する。(一般に、「有意差がある」という)

統計

母集団血圧未知

母集団血圧未知

肥満者 正常体重者

標本20例平均=130mmHg

標本30例平均=120mmHg

帰無仮説(肥満と正常体重で母集団の血圧の平均は同じ)が正しい場合に標本平均に10mmHgの差が生じる確率は?→ t検定で1%(P=0.01)と計算された。→ 帰無仮説が正しければめったに生じない現象がおきたといえる。従っ

て、たぶん帰無仮説は正しくないのだろう。→ 対立仮説(肥満と正常体重で母集団の血圧の平均は異なる)を採用。

統計

差がある差がない(あるとはいえない)

差がある ○第2種の過誤(βエラー)

差がない第1種の過誤(αエラー)

真実

判断(検定結果)

検定における2種類の判断ミス検定における2種類の判断ミス

検定は万能ではなく、検定は万能ではなく、しばしばしばしば誤った判断に誤った判断に陥ることがある。陥ることがある。

P値は、第1種の過誤が生じる確率。判断の基準とする確率を有意水準という。

第2種の過誤が生じない確率のことを検出力(パワー)という

一般に、標本数が小さいほど検出力も小さい=第2種の過誤が生じやすい

→例数設計の必要性

統計 “有意差なし”“有意差なし”はは“差がない”“差がない”ことをことを積極的に示したわけではない!積極的に示したわけではない!

例1例1

–– 肥満者と正常体重者肥満者と正常体重者10人ずつ10人ずつの血圧を測った。平均値の血圧を測った。平均値の差はの差は10mmHg10mmHgで、で、有意差はなかった有意差はなかった。。

–– 肥満者と正常体重者肥満者と正常体重者100人ずつ100人ずつの血圧を測った。平均の血圧を測った。平均値の差は値の差は10mmHg10mmHgで、で、有意差があった有意差があった。。

「差がない」ことを証明するためには、ケチって小標「差がない」ことを証明するためには、ケチって小標本にすればいい???(そんな馬鹿な!)本にすればいい???(そんな馬鹿な!)

統計

Page 8: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

8

横断研究でよく使われる解析方法2横断研究でよく使われる解析方法2相関と回帰相関と回帰

相関係数相関係数–– --11~~+1+1の値の値をとり、2変数のをとり、2変数の直線的な関連の強さ直線的な関連の強さ

を表す。を表す。

–– 検定も行う(帰無仮説:母相関係数検定も行う(帰無仮説:母相関係数=0=0))

正相関

-3

3

-3 3

測定値A

測定値B

負相関

-3

3

-3 3

測定値A

測定値B

無相関

-3

3

-3 3

測定値A

測定値B

図7 正相関と負相関

統計 相関と回帰(続き)相関と回帰(続き)

相関係数の検定(帰無仮説:相関係数の検定(帰無仮説:母相関係数母相関係数=0=0))

回帰係数の検定(帰無仮説:回帰係数の検定(帰無仮説:母回帰係数母回帰係数=0=0))

両者の結果は一致する。両者の結果は一致する。

図8 回帰直線

-3

3

-3 3

測定値X(独立変数)

測定値Y

(従属変数

)αy=βx+α

この距離2の合計が最小になるように

直線を決める(最小二乗法)

回帰直線回帰直線–– 2つの連続量の関係を、2つの連続量の関係を、

y=y=ββx+x+ααの形の1次の形の1次式で表したもの。式で表したもの。

回帰係数回帰係数ββ

–– 相関係数と違い、相関係数と違い、単位単位があるがあるので、様々な値ので、様々な値をとる。独立変数が1をとる。独立変数が1増加した時の、従属変増加した時の、従属変数の増加量の期待値数の増加量の期待値を表す。を表す。

統計

第1段階(記述疫学)のポイント第1段階(記述疫学)のポイント

生態学的研究生態学的研究と、と、個人レベルの横断研究個人レベルの横断研究。。

比較的容易比較的容易にできる。にできる。

原因と結果の原因と結果の時間的順序関係を考慮してい時間的順序関係を考慮していないない。。

因果関係を証明する因果関係を証明する証拠能力は乏しい(最も証拠能力は乏しい(最も低い)低い)。。

ある要因と疾病との因果に関するある要因と疾病との因果に関する仮説を設仮説を設定するための糸口定するための糸口を得る。を得る。

因果関係があると結論してはいけない

第1段階(記述疫学)第1段階(記述疫学)

–– 横断研究横断研究(cross(cross--sectional study)sectional study)地域レベルの横断研究地域レベルの横断研究

=生態学的研究=生態学的研究(ecological study)(ecological study)個人レベルの横断研究個人レベルの横断研究

第2段階(分析疫学)第2段階(分析疫学)

–– 症例・対照研究症例・対照研究(case(case--control study)control study)–– コホート研究コホート研究(cohort study)(cohort study)

第3段階(実験疫学)第3段階(実験疫学)

–– 介入研究介入研究(intervention study)(intervention study)

証拠能力

低い

高い

Page 9: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

9

第2段階(分析疫学)第2段階(分析疫学)

原則的には原則的にはコホート研究(前向き研究)コホート研究(前向き研究)によっによって、まずある事象(要因)が起こり、これに続て、まずある事象(要因)が起こり、これに続いて他の事象(疾病)が起こることを記述する。いて他の事象(疾病)が起こることを記述する。

疫学的仮説を統計学的に検定して、ある要因疫学的仮説を統計学的に検定して、ある要因と疾病とのと疾病との因果関係を推理因果関係を推理する。する。

コホート研究が不可能な疾患(困難な場合)コホート研究が不可能な疾患(困難な場合)に関しては、に関しては、症例・対照研究(後向き研究)症例・対照研究(後向き研究)もも行われる。行われる。

喫煙群

非喫煙群

現在 将来(例、10年後)

肺がん罹患率

肺がん罹患率

比較

(3)コホート研究

(コホート)

肺がん患者

非患者

過去(患者は発病前) 現在

喫煙習慣

喫煙習慣

比較

(2)症例・対照研究

肺がん患者100名と健康な非患者(対照)の発病前(過去)の喫煙習慣を調べた。肺がん患者では8割が喫煙者だった。対照では4割が喫煙者だった。喫煙が肺がんの原因である可能性がある。

(対照=control)

(case)

健康な人々1万人の現在の喫煙状況を健診で調べた。その後10年間追跡調査したところ、喫煙群からの肺がん罹患率は非喫煙群からの肺がん罹患率の10倍だった。喫煙が肺がんの原因である可能性がある。

関連の強さの指標関連の強さの指標(相対危険(相対危険: relative risk: relative risk))

「喫煙していると肺癌になりやすくなる」・・・この意味をよく考えて「喫煙していると肺癌になりやすくなる」・・・この意味をよく考えてみたことがありますか?みたことがありますか?–– 「喫煙していると「喫煙していると5倍5倍、肺癌になりやすくなる」というのと、、肺癌になりやすくなる」というのと、–– 「喫煙していると「喫煙していると10倍10倍、肺癌になりやすくなる」というのでは、、肺癌になりやすくなる」というのでは、–– 後者の方が、より喫煙と肺癌の関連が強いと考えられる。後者の方が、より喫煙と肺癌の関連が強いと考えられる。

この、「この、「○○倍○○倍」の部分を「」の部分を「相対危険相対危険」と呼ぶ。」と呼ぶ。–– ある要因Yによる疾病Xの発生の相対危険度が5である、といある要因Yによる疾病Xの発生の相対危険度が5である、とい

うのは、要因Yに暴露されると、疾病Xになる確率が5倍に増うのは、要因Yに暴露されると、疾病Xになる確率が5倍に増加することを意味する。加することを意味する。

相対危険=曝露群の罹患率相対危険=曝露群の罹患率÷÷非曝露群の罹患率非曝露群の罹患率

–– 喫煙しなくても肺癌になる人がいるのも事実である。しかし、もし、あなたが喫煙して喫煙しなくても肺癌になる人がいるのも事実である。しかし、もし、あなたが喫煙していなければ、将来、肺癌になる確率はかなり小さい。一方、喫煙していれば、将来、いなければ、将来、肺癌になる確率はかなり小さい。一方、喫煙していれば、将来、肺癌になる確率は、喫煙しなかった場合に比べて、5~10倍程度に大きなものとな肺癌になる確率は、喫煙しなかった場合に比べて、5~10倍程度に大きなものとなる(相対危険が5~10程度)であろう。る(相対危険が5~10程度)であろう。

食物繊維多量摂取群

食物繊維少量摂取群

現在 将来(例、10年後)

大腸がん罹患率

大腸がん罹患率

比較

(3)コホート研究

(コホート)

大腸がん患者

非患者

過去(患者は発病前) 現在

食物繊維摂取量

食物繊維摂取量

比較

(2)症例・対照研究

症例・対照研究 コホート研究

方向 後向き 前向き

人数 100~数百症例+対照 数千~数十万人

費用・労力 比較的少ない 多大

要因曝露情報 信頼性やや低い 信頼性高い

疾病の診断 正確 やや不正確(診断基準が必要)

対照群の偏り 生じやすい -

稀な疾病 調査可能 調査不可能

相対危険 オッズ比で近似可能 直接計算可能

Page 10: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

10

第1段階(記述疫学)第1段階(記述疫学)

–– 横断研究横断研究(cross(cross--sectional study)sectional study)地域レベルの横断研究地域レベルの横断研究

=生態学的研究=生態学的研究(ecological study)(ecological study)個人レベルの横断研究個人レベルの横断研究

第2段階(分析疫学)第2段階(分析疫学)

–– 症例・対照研究症例・対照研究(case(case--control study)control study)–– コホート研究コホート研究(cohort study)(cohort study)

第3段階(実験疫学)第3段階(実験疫学)

–– 介入研究介入研究(intervention study)(intervention study)

証拠能力

低い

高い

大腸がん患者

非患者

過去(患者は発病前) 現在

食物繊維摂取量

食物繊維摂取量

比較

(2)症例・対照研究

患者と非患者(対照)の過患者と非患者(対照)の過去の要因曝露状況を比較。去の要因曝露状況を比較。

対照を集める際に偏りが対照を集める際に偏りが生じやすい。生じやすい。

要因曝露は記憶に頼るの要因曝露は記憶に頼るので偏る可能性あり。で偏る可能性あり。

性年齢構成を合わせるた性年齢構成を合わせるために、マッチド・ペア法も用めに、マッチド・ペア法も用いられる。いられる。

大腸がん患者

非患者

過去(患者は発病前) 現在

食物繊維摂取量

食物繊維摂取量

比較

(2)症例・対照研究

症例・対照研究では、相対危険の近似値としてオッズ比を計算。論文では主な結果を示す場面で、必ずオッズ比(とその信頼区間)が出てくる。

70

30

40

60

田中平三著 疫学入門演習 南山堂

自分で計算してみよう

症例対照研究で必ず使う解析方法症例対照研究で必ず使う解析方法答え

胃がん症例 対照喫煙 はい 70 40

いいえ 30 60計 100 100

オッズ比=(70/30)/(40/60)=3.5

Page 11: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

11

オッズ比のオッズ比の検定と信頼区間検定と信頼区間

オッズ比を計算するだけでなく、その信頼区間も同時オッズ比を計算するだけでなく、その信頼区間も同時に計算して示す。に計算して示す。–– 例:オッズ比例:オッズ比(95%(95%信頼区間信頼区間)=)=0.29 (0.160.29 (0.16--0.51)0.51)

研究結果は少数標本に基づくものなので、偶然によって関連が見ら研究結果は少数標本に基づくものなので、偶然によって関連が見られただけかもしれない。れただけかもしれない。そこで信頼区間を計算する。真の値そこで信頼区間を計算する。真の値がが0.160.16--0.510.51の範囲にあるの範囲にある可能可能性がとても高い性がとても高いと解釈する。と解釈する。関連の強さはこの範囲のどこかだろう。関連の強さはこの範囲のどこかだろう。これが例えばこれが例えば0.10.1--1.21.2だとすると、真の値はだとすると、真の値は11かも知れないので、関連かも知れないので、関連があるとは判断できない。があるとは判断できない。

検定することもある。検定することもある。–– 例:オッズ比例:オッズ比=0.29, =0.29, P=0.01P=0.01

本当は関連がない(母オッズ比本当は関連がない(母オッズ比=1=1)なのに、)なのに、偶然によってこのオッズ偶然によってこのオッズ比が得られる確率比が得られる確率ががPP値。値。P=0.01P=0.01ならば、偶然によってこのように小ならば、偶然によってこのように小さなオッズ比さなオッズ比0.290.29が得られる確率はが得られる確率は1%1%である。従って偶然とは考えである。従って偶然とは考えにくいので、関連があると判断する。にくいので、関連があると判断する。これが例えばこれが例えばP=0.2P=0.2だとすると、5回に1回は偶然で見られる関連とだとすると、5回に1回は偶然で見られる関連ということを意味する。だから偶然かも知れないので、いうことを意味する。だから偶然かも知れないので、関連があるとは関連があるとは判断できない判断できない。。

統計 交絡因子の調整交絡因子の調整

大腸がん患者

非患者

過去(患者は発病前) 現在

食物繊維摂取量

食物繊維摂取量

比較

(2)症例・対照研究

高齢者が多い喫煙者が多い

高齢者が少ない喫煙者が少ない

若年者、非喫煙者は食物繊維摂取量が多いとすると、

こういう状況では比較しても解釈不能。

この場合、年齢と喫煙のことを、大腸癌と食物繊維との関連における交絡因子という。交絡因子の影響を取り除くことを、「調整する」という。例えば、「年齢と喫煙で調整した(adjusted for age and smoking)」などという。何で調整しているか要注意。調整してオッズ比を計算するために、マッチングや、ロジスティック回帰(logistic regression)がよく用いられる。

交絡変数(交絡因子)交絡変数(交絡因子)注目している2変数間の関連に影響を及ぼして、そ注目している2変数間の関連に影響を及ぼして、その関連をの関連を見えにくくしたり見えにくくしたり、誤って、誤って見かけ上関連があ見かけ上関連があるように見せてしまうるように見せてしまう、第3の変数。、第3の変数。

食塩摂取量 血圧

年齢

見かけの関連

正相関正相関

=交絡変数

直接的な関係

Page 12: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

12

第1段階(記述疫学)第1段階(記述疫学)

–– 横断研究横断研究(cross(cross--sectional study)sectional study)地域レベルの横断研究地域レベルの横断研究

=生態学的研究=生態学的研究(ecological study)(ecological study)個人レベルの横断研究個人レベルの横断研究

第2段階(分析疫学)第2段階(分析疫学)

–– 症例・対照研究症例・対照研究(case(case--control study)control study)–– コホート研究コホート研究(cohort study)(cohort study)

第3段階(実験疫学)第3段階(実験疫学)

–– 介入研究介入研究(intervention study)(intervention study)

証拠能力

低い

高い

途中で脱落する人の情報も含めるために、人年法を途中で脱落する人の情報も含めるために、人年法を用いることが多い。用いることが多い。

性・年齢等の性・年齢等の交絡因子の調整交絡因子の調整を行って相対危険をを行って相対危険を推定するために、直接法、間接法、推定するために、直接法、間接法、CoxCox比例ハザー比例ハザー

ドモデルドモデルなどが用いられる。などが用いられる。

食物繊維多量摂取群

食物繊維少量摂取群

現在 将来(例、10年後)

大腸がん罹患率

大腸がん罹患率

比較

(3)コホート研究

(コホート)

健康な大勢の人々につい健康な大勢の人々について、現在の要因曝露状況をて、現在の要因曝露状況を比較(健診等)。比較(健診等)。

その後、長年追跡して、要その後、長年追跡して、要因曝露状況別の罹患率や因曝露状況別の罹患率や死亡率を比較する。死亡率を比較する。

コホート研究では、相対危険を直接計算。論文中で主な結果を示すために必ず相対危険(ハザード比など)が出てくる。

食物繊維多量摂取群

食物繊維少量摂取群

現在 将来(例、10年後)

大腸がん罹患率

大腸がん罹患率

比較

(3)コホート研究

(コホート)

田中平三著疫学入門演習南山堂

1000

2000

30

20

コホート研究で必ず使う解析方法コホート研究で必ず使う解析方法 疾病の罹患率は、多くの場合、「1年間に、人口1000人あたり2人」というような表現をする。コホート研究で、1000人の集団を10年間追跡したところ、20人の患者が発生したとすると、これは「10年間に、人口1000人あたり20人」と考えてよいのだろうか?(実は必ずしも正しくない!)

一般住民を10年も観察していれば、転居等によって、追跡不能となることもあるし、注目している疾病にはならなかったものの、他の理由で死亡してしまう者もいるだろう。つまり、集団の人口が10年の間に大きく変化する可能性がある。罹患率を計算するためには、分母である集団の人口が変わってしまっては困るので、前述の「10年間に、人口1000人あたり20人」は、必ずしも適切な表現ではない。そこで、以下のように罹患率を計算することがよく行われる。これを人時法(人年法)という。

Page 13: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

13

直接法による年齢調整死亡率で比較

基準集団 非喫煙群 喫煙群

年齢階級 人年※ 死亡率 期待死亡数 死亡率 期待死亡数

40歳代 700 5.0% 35 10.0% 70

50歳代 800 10.0% 80 20.0% 160

60歳以上 500 50.0% 250 70.0% 350

全年齢計 2000 365 580

年齢調整死亡率(直接法) 365÷2000=0.18 580÷2000=0.29

年齢調整相対危険 基準群(=1) 0.29÷0.18=1.59※非喫煙群+喫煙群の人年計とした

粗死亡率で比較

非喫煙群 喫煙群

年齢階級 人年 死亡数 死亡率 人年 死亡数 死亡率

40歳代 200 10 0.05 500 50 0.10

50歳代 600 60 0.10 200 40 0.20

60歳以上 400 200 0.50 100 70 0.70

全年齢計 1200 270 0.23 800 160 0.20

相対危険 基準(=1) 0.20÷0.23=0.89

統計

間接法・標準化死亡比(SMR)

基準集団 非喫煙群 喫煙群

年齢階級 死亡率※ 人年 期待死亡数 観測死亡数 人年 期待死亡数 観測死亡数

40歳代 0.086 200 17 10 500 43 50

50歳代 0.125 600 75 60 200 25 40

60歳以上 0.540 400 216 200 100 54 70

全年齢計 0.215 1200 308 270 800 122 160

標準化死亡比(SMR) 270÷308=0.877 (87.7) 160÷122=1.311 (131.1)

年齢調整相対危険 基準群(=1) 1.311÷0.877=1.50※非喫煙群+喫煙群計の死亡率とした

粗死亡率で比較

非喫煙群 喫煙群

年齢階級 人年 死亡数 死亡率 人年 死亡数 死亡率

40歳代 200 10 0.05 500 50 0.10

50歳代 600 60 0.10 200 40 0.20

60歳以上 400 200 0.50 100 70 0.70

全年齢計 1200 270 0.23 800 160 0.20

相対危険 基準(=1) 0.20÷0.23=0.89

統計

血中VC低値

脳卒中

脳卒中

発症率を比較する

追 跡1977年 2000年

新潟県新発田市

某地域

血中VC高値

コホート研究の例コホート研究の例血清ビタミンC濃度と脳卒中罹患リスク血清ビタミンC濃度と脳卒中罹患リスク 追跡期間中(20年間:1977-1997年)のイベント発生数追跡期間中(20年間:1977-1997年)のイベント発生数

男性 女性 男女計

全コホート対象者 880 1241 2121脳卒中罹患

  全脳卒中 91 105 196     脳梗塞 58 51 109     出血性脳卒中 18 36 54        脳出血 14 24 38        くも膜下出血 4 12 16     鑑別不能 15 18 33死亡による観察打ち切り 295 285 580市外転出による観察打ち切り 40 97 137

人数

Page 14: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

14

ベースライン時の血清ビタミンC濃度とベースライン時の血清ビタミンC濃度と追跡期間中の追跡期間中の全脳卒中全脳卒中罹患リスク罹患リスク

※多変量調整:性、年齢、平均血圧、血清総コレステロール、BMI、心房細動の有無、降圧剤服用の有無、虚血性心疾患既往歴の有無、身体活動度、喫煙の有無、飲酒量で調整。

性年齢調整

0

0.2

0.4

0.6

0.8

1

1.2

Q1 Q2 Q3 Q4

血清ビタミンC濃度(四分位)

相対

危険

男女計(トレンドP=0.002)

男性(トレンドP=0.051)

女性(トレンドP=0.014)

※多変量調整

0

0.2

0.4

0.6

0.8

1

1.2

Q1 Q2 Q3 Q4

血清ビタミンC濃度(四分位)

相対

危険

男女計(トレンドP=0.017)

男性(トレンドP=0.22)

女性(トレンドP=0.021)

第2段階(分析疫学)のポイント第2段階(分析疫学)のポイント

症例・対照研究とコホート研究症例・対照研究とコホート研究。。

原因と結果の原因と結果の時間的順序関係を考慮してい時間的順序関係を考慮しているる。。

因果関係を証明する因果関係を証明する証拠能力はやや高い証拠能力はやや高い(介入研究よりは低い)(介入研究よりは低い)。。

ある要因と疾病との因果に関するある要因と疾病との因果に関する仮説を検仮説を検定する定する。。

相対危険が大きい相対危険が大きいほど因果関係である可能ほど因果関係である可能性が高い。性が高い。

まだ、因果関係があると結論することはできない

第1段階(記述疫学)第1段階(記述疫学)

–– 横断研究横断研究(cross(cross--sectional study)sectional study)地域レベルの横断研究地域レベルの横断研究

=生態学的研究=生態学的研究(ecological study)(ecological study)個人レベルの横断研究個人レベルの横断研究

第2段階(分析疫学)第2段階(分析疫学)

–– 症例・対照研究症例・対照研究(case(case--control study)control study)–– コホート研究コホート研究(cohort study)(cohort study)

第3段階(実験疫学)第3段階(実験疫学)

–– 介入研究介入研究(intervention study)(intervention study)

証拠能力

低い

高い

第3段階(実験疫学)第3段階(実験疫学)

対象集団に積極的に干渉し、例えばビタミン対象集団に積極的に干渉し、例えばビタミン剤を投与し続けてみる。プラセボを投与した剤を投与し続けてみる。プラセボを投与した集団で肺癌の発生率が変わらず、ビタミン剤集団で肺癌の発生率が変わらず、ビタミン剤を投与した集団で肺癌の発生率が低下すれを投与した集団で肺癌の発生率が低下すれば、因果関係が確固たるものになる(実際にば、因果関係が確固たるものになる(実際には複数の介入研究で確認される必要あり)。は複数の介入研究で確認される必要あり)。

特に、「特に、「無作為化比較試験無作為化比較試験: randomized : randomized controlled trialcontrolled trial」の証拠能力は最も高い。」の証拠能力は最も高い。

Page 15: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

15

要因を保有している人要因を保有している人たちをたちを無作為に2群に無作為に2群に分ける(無作為配置)。分ける(無作為配置)。

一方に介入し、他方に一方に介入し、他方に介入せず、一定期間後介入せず、一定期間後の疾病罹患率を比較すの疾病罹患率を比較する。る。

交絡要因の影響は交絡要因の影響はほとほとんどんど受けない受けない(偶然の(偶然のバラツキ程度の小さなバラツキ程度の小さな影響が残る)影響が残る)。。

強力な降圧治療

通常の血圧管理

現在 将来(例、5年後)

脳卒中罹患率

脳卒中罹患率

比較

(4)介入研究

図2 介入研究による疾病罹患率の変化の比較

観察期間

疾病の累積罹患率

対照群

処理群

比較

罹患率ではなく、危険因子等の量的な変数の変化罹患率ではなく、危険因子等の量的な変数の変化を追う場合もある。を追う場合もある。

介入研究による危険因子の変化の比較

120

125

130

135

140

145

150

155

1 2 3 4 5 6 7

観察期間(年)

収縮

期血

圧(m

mH

g)

対照群

処理群

比較

A群

B群

血圧測定

血圧測定

比較(t検定など)

介入

非介入

並行法

A群

B群

血圧測定

血圧測定

比較(対応のあるt検定など)

介入

非介入

交叉法

介入

非介入

血圧測定

血圧測定

ウォッシュアウト期間

交叉法の方が、同じサンプルサイズで検出力が高い。ただし、前半の影響が後半に残る介入では不可能。

ウォッシュアウト期間

Multiple Risk Factor Intervention Trial (MRFIT)Multiple Risk Factor Intervention Trial (MRFIT)冠動脈心疾患の3大危険因子である高血圧、喫煙、高脂血症への介入効果冠動脈心疾患の3大危険因子である高血圧、喫煙、高脂血症への介入効果を評価するために米国で行われた大規模介入研究。を評価するために米国で行われた大規模介入研究。研究参加者:私企業や政府の従業員でスクリーニング検診を受けた約研究参加者:私企業や政府の従業員でスクリーニング検診を受けた約3636万万人の中から、血圧、喫煙本数、血清総コレステロール値がいずれも上位人の中から、血圧、喫煙本数、血清総コレステロール値がいずれも上位10%10%に入るに入る3535~~5757歳の男性(拡張期血圧≧歳の男性(拡張期血圧≧90mmHg90mmHg、喫煙≧、喫煙≧3030本/日、血清本/日、血清総コレステロ-ル≧総コレステロ-ル≧295mg/dl295mg/dl)。ただし、心疾患の既往がある者、心電図異)。ただし、心疾患の既往がある者、心電図異常を示した者、糖尿病の者、体重が標準体重の常を示した者、糖尿病の者、体重が標準体重の150%150%以上の者、血清総コレ以上の者、血清総コレステロール≧ステロール≧350mg/dl350mg/dlまたは拡張期血圧≧または拡張期血圧≧115mmHg115mmHgの者(直ちに治療をの者(直ちに治療を開始する必要があるため)、定住傾向のない者(追跡困難なため)は除外し開始する必要があるため)、定住傾向のない者(追跡困難なため)は除外した。最終的には、インフォームドコンセントを得られたた。最終的には、インフォームドコンセントを得られた12,86612,866名が研究に参加名が研究に参加した。した。無作為割り付け:研究参加者は介入群(無作為割り付け:研究参加者は介入群(special intervention: SIspecial intervention: SI群)と対照群)と対照群(群(usual care: UCusual care: UC群)に、無作為に割り付けられた。群)に、無作為に割り付けられた。SISI群は4カ月に1度、群は4カ月に1度、降圧治療、禁煙カウンセリング、高脂血症改善のための食事指導からなる強降圧治療、禁煙カウンセリング、高脂血症改善のための食事指導からなる強力な是正プログラムを受けた。力な是正プログラムを受けた。UCUC群は、年に1度の面接と検査を受けた。群は、年に1度の面接と検査を受けた。結果:平均7年の追跡期間中、結果:平均7年の追跡期間中、SISI群と群とUCUC群の両方で3つの危険因子の改善群の両方で3つの危険因子の改善が認められたが、その改善の程度はが認められたが、その改善の程度はSISI群の方が大きかった。冠動脈疾患に群の方が大きかった。冠動脈疾患による死亡率はよる死亡率はSISI群の方が少し低かったが、統計学的に有意ではなかった。群の方が少し低かったが、統計学的に有意ではなかった。文献:文献:Multiple Risk Factor Intervention Trial Research Group. MultipleMultiple Risk Factor Intervention Trial Research Group. Multiplerisk factor intervention trial. Risk factor changes and mortalitrisk factor intervention trial. Risk factor changes and mortality results. y results. JAMA 1982: 248:1465JAMA 1982: 248:1465--77.77.

Page 16: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

16

ββカロチン神話の崩壊カロチン神話の崩壊

中国河南省林県(3万人)中国河南省林県(3万人)19861986--9191–– ββカロチン、ビタミンE、セレン投与群で全カロチン、ビタミンE、セレン投与群で全がんがん死亡率死亡率

13%13%低下、胃低下、胃がんがん21%21%低下低下

フィンランド男性喫煙者(3万人)フィンランド男性喫煙者(3万人)19851985--9393–– ββカロチン投与群のカロチン投与群の肺肺がんがん罹患率が罹患率が18%18%増加増加

米国男性医師(2万2千人)米国男性医師(2万2千人)19821982--9595–– ββカロチンにカロチンにがんがんの予防効果も害もなしの予防効果も害もなし

米国喫煙・アスベスト作業者(1万8千人)米国喫煙・アスベスト作業者(1万8千人)19881988--9898–– ββカロチン投与群のカロチン投与群の肺肺がんがん罹患率が罹患率が28%28%増加増加

介入研究でよく使う解析方法介入研究でよく使う解析方法

死亡、罹患等のイベント発生をエンドポイント死亡、罹患等のイベント発生をエンドポイント

–– 相対危険度の推定相対危険度の推定CoxCox比例ハザードモデルなど比例ハザードモデルなど

平均値の差の検定平均値の差の検定tt検定、分散分析、共分散分析など検定、分散分析、共分散分析など

割合の差の検定割合の差の検定χχ22検定、検定、FisherFisherの正確な検定、多重ロジスティックモの正確な検定、多重ロジスティックモ

デルなどデルなど

試験実施計画書(プロトコール)試験実施計画書(プロトコール)中止基準中止基準

有害事象発生時の取扱有害事象発生時の取扱

実施計画書からの逸脱実施計画書からの逸脱の報告の報告

試験の終了、中止、中断試験の終了、中止、中断

実施計画書の変更実施計画書の変更

実施期間実施期間

統計解析統計解析

症例数と設定根拠症例数と設定根拠

背景背景目的目的治療法の概要治療法の概要対象患者(選択・除外基準)対象患者(選択・除外基準)同意取得法同意取得法試験の方法試験の方法評価項目評価項目観察・検査項目観察・検査項目

プロトコールが確定したら、対象を集め始める前に、臨床試験登録システム(UMIN-CTR等)に必ず登録する!

未登録だと、主要国際誌では受け付けてもらえない。

検証的な無作為化比較試験の統計解析検証的な無作為化比較試験の統計解析検証的な無作為化比較試験の統計解析検証的な無作為化比較試験の統計解析

事前に事前に以下の評価項目を明示しておく以下の評価項目を明示しておく–– 主要評価項目主要評価項目(Primary endpoint)(Primary endpoint)

最も重要な結果変数を具体的に、通常は1つ。最も重要な結果変数を具体的に、通常は1つ。

評価時点も明記。評価時点も明記。

統計解析方法も明記。統計解析方法も明記。

一般に、有効性の評価に関するもの。一般に、有効性の評価に関するもの。

–– 副次的評価項目副次的評価項目(Secondary endpoints)(Secondary endpoints)次に重要な結果変数を具体的に。次に重要な結果変数を具体的に。

評価時点も明記。評価時点も明記。

統計解析方法も明記。統計解析方法も明記。

有効性、安全性に関するもの有効性、安全性に関するもの

上記以外に、細かい検討を加えることもある(オプ上記以外に、細かい検討を加えることもある(オプション)ション)

Page 17: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

17

第3段階(実験疫学)のポイント第3段階(実験疫学)のポイント

積極的に介入する。積極的に介入する。

交絡要因の影響が入らない。交絡要因の影響が入らない。

因果関係を証明する因果関係を証明する証拠能力は高い(特に証拠能力は高い(特に無作為化比較試験)無作為化比較試験)。。

ある要因と疾病との因果関係を決定する。ある要因と疾病との因果関係を決定する。

因果関係があると結論する(ただし複数の研究で支持されること)

第1段階(記述疫学)第1段階(記述疫学)

–– 横断研究横断研究(cross(cross--sectional study)sectional study)生態学的研究生態学的研究(ecological study)(ecological study)個人レベルの横断研究個人レベルの横断研究

第2段階(分析疫学)第2段階(分析疫学)

–– 症例・対照研究症例・対照研究(case(case--control study)control study)–– コホート研究コホート研究(cohort study)(cohort study)

第3段階(実験疫学)第3段階(実験疫学)

–– 介入研究介入研究(intervention study)(intervention study)

証拠能力

低い

高い

複数の研究で支持されれば、より証拠は確固たるものになる。

健康・栄養食品アドバイザリースタッフ・テキストブック(第一出版)

考えてみよう考えてみよう

ココアには、がんや動脈硬化を予防する効果があるココアには、がんや動脈硬化を予防する効果があるという動物実験結果が示されました。どんな研究をという動物実験結果が示されました。どんな研究を行ったら人間でもそれを確かめられますか?行ったら人間でもそれを確かめられますか?あるコホート研究で、リコピンの摂取量が多い人であるコホート研究で、リコピンの摂取量が多い人では、がんの罹患率が低いことが報告されました。こは、がんの罹患率が低いことが報告されました。この結果から、一般の人にお勧めできることは何?の結果から、一般の人にお勧めできることは何?タバコを毎日20本吸いながら、野菜はあまり食べタバコを毎日20本吸いながら、野菜はあまり食べずにずにββカロチンを錠剤で摂取している人がいます。カロチンを錠剤で摂取している人がいます。どんなアドバイスをしますか?どんなアドバイスをしますか?タバコを吸っていても、肺癌にならない人がいるのタバコを吸っていても、肺癌にならない人がいるのは事実です。「だからタバコは肺癌の原因じゃない」は事実です。「だからタバコは肺癌の原因じゃない」と主張する人に対して、何と説明しますか?と主張する人に対して、何と説明しますか?

Page 18: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

1

栄養疫学の基礎②栄養疫学の基礎②評価方法とバイアスの取り扱い評価方法とバイアスの取り扱い

国立保健医療科学院国立保健医療科学院 技術評価部技術評価部

横山徹爾横山徹爾

交絡の調整と多変量解析交絡の調整と多変量解析

総エネルギー調整総エネルギー調整

栄養疫学における食事調査と誤差栄養疫学における食事調査と誤差

集団の摂取量分布を推定する集団の摂取量分布を推定する

交絡変数交絡変数注目している2変数間の関連に影響を及ぼして、そ注目している2変数間の関連に影響を及ぼして、その関連をの関連を見えにくくしたり見えにくくしたり、誤って、誤って見かけ上関連があ見かけ上関連があるように見せてしまうるように見せてしまう、第3の変数。、第3の変数。

食塩摂取量 血圧

年齢

見かけの関連

正相関正相関

=交絡変数

直接的な関係

偏相関と重回帰偏相関と重回帰

他の要因の影響を補正したうえで、2変数間他の要因の影響を補正したうえで、2変数間の直線的な関連を表す方法。の直線的な関連を表す方法。

食塩摂取量 血圧

年齢

見かけの関連(相関係数=0.3)(回帰係数=3.0)

正相関正相関

年齢の影響を除いたより直接的な関連(偏相関係数=0.2)(偏回帰係数=2.0)

=交絡変数

Page 19: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

2

重回帰分析重回帰分析

注目している連続量注目している連続量YYと、複数の要因と、複数の要因XX11,,XX22,, ...,...,XXnnとの関係を1次式の形で表したもの。との関係を1次式の形で表したもの。

YY==ββ11XX11++ββ22XX22++......ββnnXXnn+切片+誤差+切片+誤差

ββ11~~ββnnをを偏回帰係数偏回帰係数という。という。

YYは正規分布(正確には誤差が正規分布)は正規分布(正確には誤差が正規分布)

重回帰分析では、偏回帰係数と切片を最小二乗法で重回帰分析では、偏回帰係数と切片を最小二乗法で推定して解釈する。推定して解釈する。

どの程度よく説明できているかを表す指標として、どの程度よく説明できているかを表す指標として、決決定係数定係数RR22を参考にする。を参考にする。

多重ロジスティック回帰では多重ロジスティック回帰ではYYが疾病有無のが疾病有無のlogitlogit、、多変量多変量CoxCox回帰では回帰ではYYがハザードの形になっている。がハザードの形になっている。–– 従って、解釈のしかたは似ている。まずは重回帰から。従って、解釈のしかたは似ている。まずは重回帰から。

(単)回帰分析と重回帰分析の解釈の違い(単)回帰分析と重回帰分析の解釈の違い(多重ロジスティック回帰、多変量(多重ロジスティック回帰、多変量CoxCox回帰も同じ)回帰も同じ)

(単)回帰分析の解釈(単)回帰分析の解釈–– 飲酒量が飲酒量が1合多い1合多いと、血圧はと、血圧は

4mmHg4mmHg高い高いが、これに含まれるが、これに含まれる喫煙の影響は喫煙の影響はわからないわからない。。

–– 喫煙量が喫煙量が1箱多い1箱多いと、血圧はと、血圧は2mmHg2mmHg高い高いが、これに含まれるが、これに含まれる飲酒の影響は飲酒の影響はわからないわからない。。

重回帰分析の解釈重回帰分析の解釈–– 喫煙の影響を除いても(調整して喫煙の影響を除いても(調整して

も)も)、飲酒量が1合多いと、血圧は、飲酒量が1合多いと、血圧は4.1 mmHg4.1 mmHg高い。高い。

–– 飲酒の影響を除くと(調整すると)飲酒の影響を除くと(調整すると)、、喫煙量と血圧の関係は明らかでな喫煙量と血圧の関係は明らかでない。い。

収縮期血圧

(単)回帰分析 重回帰分析

回帰係数 標準誤差 P値 偏回帰係数 標準誤差 P値

飲酒量(合) 4.0 0.5 <0.001 4.1 0.5 <0.001

喫煙量(箱) 2.0 0.9 0.02 0.5 0.8 0.90

他の変数の影響を調整したうえで他の変数の影響を調整したうえで、2変数間の関連を調べる、2変数間の関連を調べるのが重回帰分析。のが重回帰分析。同時に用いた説明変数によって、解釈が少し変わる。同時に用いた説明変数によって、解釈が少し変わる。

重回帰分析の説明変数に関する注意重回帰分析の説明変数に関する注意(多重ロジスティック回帰、多変量(多重ロジスティック回帰、多変量CoxCox回帰も同じ)回帰も同じ)

全く同じ意味を持つ2変数全く同じ意味を持つ2変数を同時に使ってはを同時に使ってはいけない。いけない。

–– 例)2回測定した血圧を、2つとも同時に説明変例)2回測定した血圧を、2つとも同時に説明変数に入れるのはナンセンス!数に入れるのはナンセンス!

類似の理由で、類似の理由で、相関が非常に強い2変数相関が非常に強い2変数をを同時に使うのは、望ましくないことが多い。同時に使うのは、望ましくないことが多い。

変数のもつ変数のもつ医学的な意味医学的な意味が変わることがあるが変わることがあるので注意。ので注意。

–– 例)身長と体重を同時に入れると、身長で調整し例)身長と体重を同時に入れると、身長で調整した体重って・・・“肥満度みたいなもの”た体重って・・・“肥満度みたいなもの”

多重ロジスティックモデルによる飲酒・喫煙習慣と食道がんとの関連

正しい解釈はどれか?① 2合以上の飲酒者は、喫煙本数も多いので食道がんリスクが高い。② 年齢と喫煙の影響を調整しても、2合以上の飲酒者はそうでない者よりも食道がんリスクが高い。③ 20本以上の喫煙者が食道がんリスクが高いのは、喫煙者は飲酒することが多いからである。④ 年齢と飲酒の影響を調整しても、20本以上の喫煙者はそうでない者よりも食道がんリスクが高い。

説明変数 オッズ比※ (95%信頼区間)

飲酒量

なし 1.0 基準

少量 4.4 (1.6-12.6)

中等量 18.6 (6.9-50.0)

多量 39.4 (14.4-107)

やめた 26.4 (7.7-90.9)

喫煙

30pack年未満 1.0 基準

30pack年以上 3.0 (2.04-4.40)

※年齢もモデルに含めて調整してある

Page 20: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

3

交絡の調整と多変量解析交絡の調整と多変量解析

総エネルギー調整総エネルギー調整

栄養疫学における食事調査と誤差栄養疫学における食事調査と誤差

集団の摂取量分布を推定する集団の摂取量分布を推定する

総エネルギー調整総エネルギー調整

総エネルギー摂取量が多い人は総エネルギー摂取量が多い人は–– エネルギー源であるエネルギー源である糖質、糖質、たん白たん白質、総脂肪の摂取量も多質、総脂肪の摂取量も多

いい–– エネルギー源でないビタミンエネルギー源でないビタミンAA、ビタミン、ビタミンCC、カルシウム、食物、カルシウム、食物

繊維などとも正相関を示すとする報告が多い。繊維などとも正相関を示すとする報告が多い。–– これは、身体の大きさが大きく、身体活動が多く、代謝効率これは、身体の大きさが大きく、身体活動が多く、代謝効率

の低い人は、一般に多くの量の食物を摂取するため、総エの低い人は、一般に多くの量の食物を摂取するため、総エネルギー摂取量が多いのみならず、エネルギー源でない栄ネルギー摂取量が多いのみならず、エネルギー源でない栄養素の摂取量もまた多くなる傾向があるため。養素の摂取量もまた多くなる傾向があるため。

総エネルギーのことを考慮せずに、例えば“総エネルギーのことを考慮せずに、例えば“食塩摂取食塩摂取量が多い人は心疾患リスク他高かった量が多い人は心疾患リスク他高かった”という結果が”という結果が得られても、それは食塩ではなくて、“総エネルギー”得られても、それは食塩ではなくて、“総エネルギー”摂取量が多かったからかもしれない。摂取量が多かったからかもしれない。–– 総エネルギー摂取量を調整する必要性。総エネルギー摂取量を調整する必要性。

エネルギー調整エネルギー調整

栄養素摂取量と疾病罹患のリスク分析(コホート研究、栄養素摂取量と疾病罹患のリスク分析(コホート研究、症例対照研究など)を行う場合、“エネルギー調整”は症例対照研究など)を行う場合、“エネルギー調整”はほぼ必ず行われている。ほぼ必ず行われている。–– (Willett(Willettのの))残差法残差法

–– 重回帰分析重回帰分析

–– 栄養素密度法栄養素密度法

これらのうち、栄養素密度法は、エネルギーの影響をこれらのうち、栄養素密度法は、エネルギーの影響を完全には補正できない。完全には補正できない。–– 糖質、たん白質、脂質の糖質、たん白質、脂質のエネルギー比は、総エネルギー摂エネルギー比は、総エネルギー摂

取量と中等度の正相関を示すことが多取量と中等度の正相関を示すことが多い。い。

–– ビタミンCなど、総エネルギー摂取量と相関の弱い栄養素のビタミンCなど、総エネルギー摂取量と相関の弱い栄養素の栄養素密度は、総エネルギー摂取量と負相関を示すことが栄養素密度は、総エネルギー摂取量と負相関を示すことがあるある

(Willettの)残差法

総エネルギー調整栄養素摂取量= a + b

総エネルギーとは無相関になる

よく使う重回帰モデル

疾病Yのリスク=β1×総エネルギー調整栄養素摂取量+β2×総エネルギー摂取量+β3×性別+β4×年齢+・・・+切片+誤差

Page 21: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

4

交絡の調整と多変量解析交絡の調整と多変量解析

総エネルギー調整総エネルギー調整

栄養疫学における食事調査と誤差栄養疫学における食事調査と誤差

集団の摂取量分布を推定する集団の摂取量分布を推定する

食事調査と誤差食事調査と誤差

食習慣と疾病罹患との関連を調べるために、食習慣と疾病罹患との関連を調べるために、食事調査を行うとする。食事調査を行うとする。

調査法は?調査法は?

–– 習慣的摂取量習慣的摂取量

食物摂取頻度調査法食物摂取頻度調査法

食事歴法食事歴法

–– 数日間の摂取量数日間の摂取量

食事記録法食事記録法

24時間思い出し法24時間思い出し法

こちらが推奨されることが多いが、なぜだろう?

測定測定誤差誤差とは?とは?

測定の段階で生じる誤差測定の段階で生じる誤差

性質によって性質によって

系統的誤差・・・系統的誤差・・・測定値が真の値から測定値が真の値から特定の特定の方向に方向にずれて(偏って)いるずれて(偏って)いる

ランダム誤差ランダム誤差・・・・・・““ずれずれ””が、特定の方向にずが、特定の方向にずれない(偏らない=ずれの平均がゼロ)れない(偏らない=ずれの平均がゼロ)

真の値

目盛り

系統的誤差(とランダム誤差)

測定値

一定方向にずれている

測定を繰り返しても平均と真の値はずれたまま

測定の系統的誤差の例

被験者の測定条件被験者の測定条件–– 食事記録調査を週末だけ食事記録調査を週末だけ

行った、夏だけ行った行った、夏だけ行った

被検者の“くせ”被検者の“くせ”–– 肥満者の過少申告肥満者の過少申告

測定者の測定者の““くせくせ””–– 未熟なインタビューアによる未熟なインタビューアによる

24時間思い出し法24時間思い出し法–– コード付けの不統一コード付けの不統一

測定機器の測定機器の““くせくせ””–– 食品成分表食品成分表–– 絶対量の評価を想定してい絶対量の評価を想定してい

ないFFQないFFQ–– 伸びたメジャー伸びたメジャー

Page 22: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

5

真の値

目盛り

ランダム誤差

測定値

測定のランダム誤差の例

食事内容は毎日大きく変わ食事内容は毎日大きく変わるので、1日の食事調査でるので、1日の食事調査では習慣的な摂取量を把握は習慣的な摂取量を把握しているとはいえない。しているとはいえない。–– 複数日調査すれば、その平複数日調査すれば、その平

均が真の値(長期間の習慣均が真の値(長期間の習慣的な摂取量)に近づく。的な摂取量)に近づく。

ランダム誤差が大きいと、ランダム誤差が大きいと、–– 真実の関連が真実の関連が見えにくくなる見えにくくなる

(薄まって見える)(薄まって見える)。。

–– 真実の相対危険度=真実の相対危険度=2.02.0ななのに、のに、1.51.5とか、とか、1.21.2とかのよとかのように、関連が弱く見える。うに、関連が弱く見える。

摂取量の平均値(g/日)

30日

14日

7日

3日

2日

1日

食事記録による測定値は何を見ているのか?食事記録による測定値は何を見ているのか?測定値測定値

==真の(長期間の習慣的な)摂取量真の(長期間の習慣的な)摂取量

++日間変動(←調査日数を増やして平均をとると減少)日間変動(←調査日数を増やして平均をとると減少)

調査日数を増やすと、真の値からのバラツキが小さくなる。平均値のバラツキ(標準誤差)は、√日数に反比例。

(仮想データ例:個人内変動係数25%)

↓真の(長期間の習慣的な)摂取量

(+その他の誤差)

食事調査法と疫学研究食事調査法と疫学研究習慣的摂取量(習慣的摂取量(食物摂取頻度調査法など)食物摂取頻度調査法など)–– 長期間の平均的な値を推定しているので、ランダム誤差が長期間の平均的な値を推定しているので、ランダム誤差が

小さい。真実の関連が薄まりにくい。小さい。真実の関連が薄まりにくい。だからだからリスク分析で推奨される。リスク分析で推奨される。

–– ただし、系統的誤差は入る可能性があるので、(FFQは)絶ただし、系統的誤差は入る可能性があるので、(FFQは)絶対量の評価には向かない。対量の評価には向かない。

集団の摂取量の平均値を推定したい場合は不向き。集団の摂取量の平均値を推定したい場合は不向き。個人の順序づけはできる。個人の順序づけはできる。

数日間の摂取量(数日間の摂取量(食事記録法など)食事記録法など)–– 個人内変動(日々の摂取量の変動)が大きいため、個人の個人内変動(日々の摂取量の変動)が大きいため、個人の

習慣的摂取量からのぶれ(ランダム誤差)が非常に大きい。習慣的摂取量からのぶれ(ランダム誤差)が非常に大きい。真実の関連が薄まって見える。真実の関連が薄まって見える。

–– つまり、相対危険度が1に近い(関連がない)ように見える。つまり、相対危険度が1に近い(関連がない)ように見える。だからだからリスク分析で推奨されない。リスク分析で推奨されない。薄まった関連を統計学的に補正して、相対危険度の真実の(薄まっ薄まった関連を統計学的に補正して、相対危険度の真実の(薄まっていない)値を推定する方法もある。ただし、ていない)値を推定する方法もある。ただし、誤差も一緒に拡大され誤差も一緒に拡大されるる。。

交絡の調整と多変量解析交絡の調整と多変量解析

総エネルギー調整総エネルギー調整

栄養疫学における食事調査と誤差栄養疫学における食事調査と誤差

集団の摂取量分布を推定する集団の摂取量分布を推定する

Page 23: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

6

摂取量の平均値(g/日)

30日

14日

7日

3日

2日

1日

小数日の食事記録調査から、小数日の食事記録調査から、集団の摂取量分布を推定する。集団の摂取量分布を推定する。

測定値測定値

==真の(長期間の習慣的な)摂取量真の(長期間の習慣的な)摂取量

++日間変動(←調査日数を増やして平均をとると減少)日間変動(←調査日数を増やして平均をとると減少)

調査日数を増やすと、真の値からのバラツキが小さくなる。平均値のバラツキ(標準誤差)は、√日数に反比例。

(仮想データ例:個人内変動係数25%)

↓真の(長期間の習慣的な)摂取量

(+その他の誤差)

1日の食事記録では、個人の摂取量、および集団レベルでの摂取量の分布を把握困難

真の摂取量の分布

個人内変動(日間差)

ある個人●の摂取量の日々のばらつき

1日の測定値の分布

真の(長期間の平均的な)摂取量

(分散σb2)

日々のばらつき

(分散σw2)

1日の食事記録で把握される摂取量

(分散σb2+σw

2)

1日の測定値の分布

長期間の平均的な摂取量の分布

EAR

集団の評価において、EAR以下の人の割合は、1日調査ではこんなに過大評価

(先ほどの図)

集団において、1日調査のデータから集団において、1日調査のデータから習慣的な摂取量の分布を推定するには?習慣的な摂取量の分布を推定するには?

いろいろ試行錯誤されている。以下の2つが有名。いろいろ試行錯誤されている。以下の2つが有名。National Research Council : Nutrient Adequacy; Assessment National Research Council : Nutrient Adequacy; Assessment Using Food Consumption Surveys. National Academy Press, Using Food Consumption Surveys. National Academy Press, Washington DC, 1986Washington DC, 1986–– 分散分析を用いた分散分析を用いた比較的簡単・基本的比較的簡単・基本的な方法。な方法。

NusserNusser SM, SM, CarriquiryCarriquiry AL, Dodd KW, Fuller WA : A AL, Dodd KW, Fuller WA : A semiparametricsemiparametric transformation approach to estimating usual transformation approach to estimating usual daily intake distributions. J Am Stat Assoc 91: 1440daily intake distributions. J Am Stat Assoc 91: 1440--1449, 1449, 19961996–– かなり複雑かなり複雑だが、方法的にはだが、方法的にはより望ましいより望ましいと思われる。専と思われる。専

用ソフトが有料で提供されている。用ソフトが有料で提供されている。–– これの簡易版であるこれの簡易版であるBestBest--PowerPower法は、法は、日本語ソフトが無料日本語ソフトが無料

で提供されている(国立保健医療科学院)。で提供されている(国立保健医療科学院)。必要な情報必要な情報–– 1日の食事調査データ1日の食事調査データ–– 個人内変動を推定するための個人内変動を推定するための複数日の食事調査データ複数日の食事調査データ

(全員でなくてもよい)(全員でなくてもよい)

Page 24: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

7

基本的な考え方基本的な考え方個人間変動・個人内変動が正規分布の場合個人間変動・個人内変動が正規分布の場合

分散分析ANOVAによりσb

2とσw2を推定

真の分布を推定

1日調査の分布と平均値は変えずに、横幅を√(σb

2/(σb2+ σw

2))倍に圧縮する

真の摂取量の分布

個人内変動(日間差)

ある個人●の摂取量の日々のばらつき

1日の測定値の分布

真の(長期間の平均的な)摂取量

(分散σb2)

日々のばらつき

(分散σw2)

1日の食事記録で把握される摂取量

(分散σb2+σw

2)

1日の測定値の分布

調整摂取量=粗摂取量の平均+(粗摂取量-粗摂取量の平均)×(SD(個人間)÷SD(粗摂取量))

長期間の平均的な摂取量の分布(調整摂取量の分布)

(粗摂取量)

SD(粗摂取量)

SD(個人間)

1元配置分散分析による1元配置分散分析による個人間変動個人間変動σb

2 ・個人内変動・個人内変動σw2の推定の推定

分散分析分散分析(Analysis of Variance: ANOVA)(Analysis of Variance: ANOVA)

–– データのバラツキ(分散)を、ある要因で説データのバラツキ(分散)を、ある要因で説明できる成分と、それ以外の成分に分解す明できる成分と、それ以外の成分に分解する方法(要因が1個の場合を1元配置~)る方法(要因が1個の場合を1元配置~)

–– 例)複数日の食事調査を複数の人びとに例)複数日の食事調査を複数の人びとに行った場合の栄養素摂取量のバラツキ行った場合の栄養素摂取量のバラツキ

個人差(個人間変動)個人差(個人間変動)

それ以外(日間差=個人内変動)それ以外(日間差=個人内変動)

–– 最低2日以上の調査が必要最低2日以上の調査が必要

ID番号 調査日 たんぱく質1 1 64.91 2 118.81 3 102.12 1 85.92 2 94.32 3 53.43 1 57.73 2 40.83 3 37.14 1 16.14 2 36.84 3 13.0

200 1 86.8200 2 89.4200 3 88.8

・・・

・・・

・・・

例)200人を対象に3例)200人を対象に3日間食事記録調査日間食事記録調査

–– ““個体個体””を効果とした1を効果とした1元配置分散分析元配置分散分析

–– 個人間分散個人間分散σσbb22、、個人個人

内内分散分散σσww22を推定を推定

平均=76.2g/日標準偏差=24.6g/日

Page 25: 栄養疫学の基礎① デザインと解析 - niph.go.jp...1 栄養疫学の基礎① デザインと解析 国立保健医療科学院技術評価部 横山徹爾 第3回日本栄養改善学会「実践栄養学研究集中セミナー」

8

ID番号 調査日 たんぱく質 調整値1 1 64.9 68.51 2 118.8 105.11 3 102.1 93.82 1 85.9 82.82 2 94.3 88.52 3 53.4 60.73 1 57.7 63.73 2 40.8 52.23 3 37.1 49.74 1 16.1 35.44 2 36.8 49.44 3 13.0 33.3

200 1 86.8 83.4200 2 89.4 85.2200 3 88.8 84.8

1日の測定値の分布

長期間の平均的なたんぱく質摂取量の分布

SD=16.7 g/日

SD=24.6 g/日

76.2 g/日

・・・

・・・

・・・

・・・

調整摂取量=76.2+(粗摂取量-76.2)×(16.7÷24.6)

全分散-個人内分散=個人間分散としてもよい

専用ソフトのデモ専用ソフトのデモ

下記よりダウンロード可能(無料)下記よりダウンロード可能(無料)

http://http://www.niph.go.jp/soshiki/gijutsuwww.niph.go.jp/soshiki/gijutsu//download/download/habitdist/index_j.htmlhabitdist/index_j.html

このハンドアウトのこのハンドアウトのpdfpdfが欲しい方は、が欲しい方は、

http://http://www.niph.go.jp/soshiki/gijutsu/staffswww.niph.go.jp/soshiki/gijutsu/staffs//yokoyama/etc/kaizen2008jan.pdfyokoyama/etc/kaizen2008jan.pdf