자료분석론 - 국민건강영양조사...

49
자료분석론 - 국민건강영양조사 자료분석 서울대학교 보건대학원 홍 지 민 2014. 4. 19 (토)

Upload: others

Post on 02-Sep-2019

3 views

Category:

Documents


0 download

TRANSCRIPT

자료분석론 - 국민건강영양조사 자료분석

서울대학교 보건대학원

홍 지 민

2014. 4. 19 (토)

강의 순서

1) 국민건강영양조사 이해 (4/19)

- 자료의 개요 및 원시자료 DB

2) 가중치 및 자료 분석 개요 (4/26)

3) 국민건강영양조사 자료 활용 실습 (5/10)

2014-04-19 2

목차

• 보건의료 이차자료원

• 국민건강영양조사 자료의 구성

• 국민건강영양 조사 원시자료 받기

2014-04-19 3

DATA 형태

• 횡단면 자료(Cross-sectional Data)

• 시계열 자료(Time-series Data)

- 시간의 흐름에 따라 변화

• 패널 자료 (Panel Data)

- 특정 조사대상을 반복적으로 조사

2014-04-19 4

보건의료 이차자료원

• 이차자료원

- 특정한 연구목적으로 수집되지 않은 자료

- 연구 결과의 타당성 확보에 한계가 있을 수 있음

- 그러나 대규모 연구대상자 포함 가능

→ 일반화 용이, 회상 비뚤림 및 선택적 보고 감소

• ‘국내 보건의료 이차자료원 활용’

(황진섭 등, 한국보건의료연구원, 2013)

- 보건의료 관련 조사 항목 포함

- 원시자료 제공 가능한 자료원

2014-04-19 5

보건의료 이차자료원 현황

2014-04-19 6 자료원: 한구보건의료연구원

보건의료 이차자료원의 특성(1)

2014-04-19 7 자료원: 한구보건의료연구원

보건의료 이차자료원의 특성(2)

2014-04-19 8

2014-04-19 9

2014-04-19 10

2014-04-19 11

국민건강영양조사 자료의 구성

2014-04-19 12

국민건강영양조사 개요(1)

• 국민의 건강수준, 건강관련 의식 및 행태, 식품 및 영양섭취 실태에 대한 통계생산

• 국가 및 시도 단위의 통계 산출

- 국민의 건강 및 영양상태에 대한 현황 및 추이 파악하여 정책적 우선순위 집단을 선별

- 보건 정책과 사업의 효과적 수행 여부 평가를 위한 통계산출

2014-04-19 13

국민건강영양조사 개요(2)

• 국민건강증진종합계획의 목표 설정 및 평가 - 600여종의 지표생산

√ 건강행태: 흡연, 음주, 신체활동 등

√ 질병유병: 비만, 고혈압, 당뇨병, 구강질환, 폐질환,

안질환, 이비인후질환, 골다공증, 골관절염 등

√ 영양상태: 식품 및 영양소 섭취량, 식행태 등

• OECD, WHO 등 국제기구에 제공하는 건강지표 산출

- 흡연, 비만율 등 10여종의 OECD Health Data 제공

2014-04-19 14

조사연혁

2014-04-19 15

자료원: 2011년 국민건강영양조사 워크샵

수행체계

2014-04-19 16

조사설계

2014-04-19 17

조사대상

2014-04-19 18

표본추출틀 - 일반지역: 주민등록인구 자료 - 아파트지역: 아파트단지 자료

조사구 추출

가구추출 - 조사구별 20개 가구

- 매년 192개 조사구, 3,840 가구 - 만 1세 이상 가구원 약 10,000명

시도 제5기 1차년도(2010) 표본조사구

동 읍면 소계

아파트 일반 아파트 일반

전국 155 76 79 37 7 30 192

서울 40 16 24 - - - 40

부산 13 6 7 - - - 13

대구 9 4 5 - - - 9

인천 10 5 5 1 0 1 11

광주 5 3 2 - - - 5

대전 6 3 3 - - - 6

울산 3 1 2 2 1 1 5

경기 35 20 15 7 2 5 42

강원 4 1 3 2 1 1 6

충북 3 2 1 2 0 2 5

충남 3 2 1 5 1 4 8

전북 4 3 1 3 0 3 7

전남 4 2 2 4 0 4 8

경북 6 3 3 5 1 4 11

경남 8 4 4 4 1 3 12

제주 2 1 1 2 0 2 4

통계조사

• 전수조사(census)

- 모집단 모든 구성 단위 전부 조사

• 표본조사(sample survey)

- 전수조사 절차 + 표본 설계

표본 오차 계산

: 비용절감, 신속성, 심도 있는 조사 가능

2014-04-19 19

표본오차와 비표본오차

• 표본오차 - 표본에서 모집단 전체를 추론하는 과정에서 생기는

오차 - 표본조사에서만 존재 • 비표본오차 - 표본오차를 제외한 나머지 모든 오차 - 조사기획단계, 조사원 등에 의한 오차 예) 설문지 결함, 무응답에 의한 오차, 대상모집단과 추출모집단의 차

이, 조사원의 비성실성, 자료처리 과정의 오류 등

- 전수조사(Census)에서는 비표본오차만 존재 2014-04-19 20

확률추출법

• 단순임의 추출(Simple random sampling)

- 모집단의 각 추출단위가 표본 추출 가능성 동일

• 층화추출방법(Stratified sampling)

- 모집단을 서로 겹치지 않는 여러 층으로 분할한 후, 각 층에 배정된 표본을 단순임의추출법에 따라 추출

• 집락추출법(Cluster sampling)

- 서로 인접한 기본단위로 집락을 구성하여 집락을 추출한 후, 추출 집락 내 일부 또는 전체 조사

• 계통추출법(Systematic sampling)

- K번째(추출간격) 해당되는 단위들을 표본으로 선정

예) 5, 15, 25, 35, 45, 55, 65, 75, 85, 95

2014-04-19 21

국민건강영양조사의 표본설계(1)

• 모집단 : 대한민국에 거주하는 국민 - 양로원, 군대, 교도소 등에 입소한 자와 외국인 등 제외

• 표본추출틀 (제5기, 2010-2012) - 2009년 주민등록인구와 2008년 아파트시세조사 자료

이용 : 제1기~제4기의 경우 통계청 인구주택총조사 조사구와

신축아파트 조사구 - 2005년 인구주택총조사 이후 조사구 및 가구 변동을 반

영하기 위함 : 시도별 1차 층화 후, 일반지역은 성별, 연령대별 인구비율 기준 26

개 층, 아파트 지역은 단지별 평당가격, 평균평수 등 기준 24개 층으로 2차 층화한 후 표본조사구 추출

2014-04-19 22

2014-04-19 23

자료원: 국민건강영양조사 3회 자료활용 워크샵

국민건강영양조사의 표본설계(2)

• 순환표본 도입

- 독립적, 동질적인 개별 표본 추출

- 개별연도자료로 국가통계

- 2,3년 자료 통합 후 시도통계 산출

• 2단계 층화 표본추출

- 2단계 : 조사구, 가구

- 층화 : 시도 내 연령대별 인구수 기준(동질성 유지)

- 시도, 동읍면, 주택유형 기준

2014-04-19 24

기별 표본설계

2014-04-19 25

제 3기 제4기(2007~2009) 제5기(2010~2012)

조사방법 - 순환표본조사

조사시기 ‘05년 4~6월(3개월) 1~12월 연중조사 * 1차년(‘07년): 7월~12월

1~12월 연중조사

표본크기 건강면접조사 : 600개 조사구, 12,000가구 건강행태/검진/영양조사 : 200개 조사구, 4,000가구

총 600개 조사구, 13,800가구

총 576개 조사구, 11,400가구

추출틀 인구주택총조사(‘00) + 신축아파트 목록

인구주택총조사(‘05) 주민등록인구(‘09) +아파트시세조사(‘08)

추출단위 1차: 조사구 2차: 가구

1차: 동읍면 2차: 조사구 3차: 가구

1차: 조사구 2차: 가구

층화변수 시도, 동읍면, 주택유형 시도, 동읍면, 주택유형 시도, 동읍면, 주택유형

자료원: 2011년 국민건강영양조사 워크샵

DB구축 및 자료 공개 절차

2014-04-19 26

조사준비

통계청 승인

연구윤리심의위원회승인

’09. 12월

조사실시

조사수행 및

자료생산

’10. 1-2월

결과 및 자료공개

통계집 발간 원시자료공개

’11. 12월

피드백

DB구축

자료검토

자료정제

가중치부여

분석 DB 구축

’11. 1-5월

통계산출

조사결과 산출

검토회의 분석방법 및 결과 검토

’11. 6-9월

결과발표회 개최

’11. 11월

통계집 작성

통계집 작성

및 검토

통계집 심의 구성, 설명,

그래프 등 검토

’11. 9-12월

※ 2011년 조사 기준

자료원: 2011년 국민건강영양조사 워크샵

수행절차

2014-04-19 27

접수/동의

탈의/체뇨

신체계측

흉부X-선, 골관절염검사

혈압측정

채혈

구강검사

폐기능검사

안검사

이비인후검사

골밀도 및 체지방검사

건강설문조사

조사대상선정

선정통지서

검진 및 건강설문조사

영양조사

자료분석

검체운송

일일보고

검체분석

자료입력 및 분석

대상자 결과통보

1주일 후

자료원: 2011년 국민건강영양조사 워크샵

조사방법

2014-04-19 28

산출지표

2014-04-19 29

구분 영역 세부내용 항목 지표

계 36 - 525 576

검진 14

비만, 고혈압, 당뇨병, 이상지혈증,

간질환, 신장질환, 빈혈, 폐질환,

구강질환, 안질환, 이비인후질환,

골다공증, 골관절염, 중금속

95 112

건강설문 14

질병이환, 의료이용, 활동제한 및 삶의 질,

손상(사고중독), 예방접종 및 건강검진,

교육 및 경제활동, 가구조사,

흡연, 음주, 신체활동, 비만 및 체중조절,

정신건강, 안전의식, 여성건강

310 316

영양 8

음식 및 식품섭취내용, 식생활행태, 영양지

식, 식이보충제, 식품안전성, 수유현황, 이

유보충식, 주요식품별 섭취빈도

120 148

조사내용: 검진조사 구분 해당연령 제5기 조사

신체계측 만1세 이상 신장, 체중, 허리둘레

혈압 및 맥박 만10세 이상 수축기혈압. 이완기혈압, 맥박수

혈액검사 만10세 이상 총콜레스테롤, 중성지방, HDL-콜레스테롤, LDL –콜레스테롤,혈중요소질소, 크레아티닌, 미세알부민(11년 추가), 공복 혈당, 당화혈색소(당뇨병 유병 여부와 상관없이 전수 조사), B형간염표면항원, GOT, GPT, 헤모글로빈, 헤마토크릿, 페리틴, 철, 철결합능, 비타민D, 알칼라인 포스파테이즈 수은, 납, 카드뮴 : 매년 2,400명 표본조사

소변검사 만10세 이상 요단백, 요당, 요담혈, 유로빌리노겐, 케돈, 빌리루빈, 요비중, 요산도, 아질산염, 요크레아티닌, 코티닌(매년 2,000명)

구강검사 만1세 이상 치아상태 및 치료 필요, 보철물 상태 및 필요, 치주조직 상태, 저작불편경험, 구강검진수진, 칫솔질 실천 등

폐기능검사 만40세 이상 폐활량(FVC), 1초간노력성호기량(FEV1)

흉부X-선 검사 만15세 이상 결핵, 폐기종, 기흉

안검사 만3세 이상 사시, 안검하수, 시력 및 굴절이상, 세극등검사, 안압검사, 무산동안저촬영검사(필요시 산동후 안저촬영, 시야검사)

이비인후검사 만1세 이상 안면신경마비, 전이개누공, 외이기형, 고막검사, 수축전후비강검사, 후두내시경, 어지럼증검사, 청력검사

골관절염검사 만50세 이상 무릎관절, 엉덩관절

2014-04-19 30

조사내용: 건강설문

31

건강설문부문 면접조사 : 이환 및 의료이용

2014-04-19 32

건강설문부문 건강행태조사(자가기입)

2014-04-19 33

조사내용: 영양조사

2014-04-19 34

조사내용: 영양조사

2014-04-19 35

DB구축 및 자료 공개 절차

2014-04-19 36

조사준비

통계청 승인

연구윤리심의위원회승인

’09. 12월

조사실시

조사수행 및

자료생산

’10. 1-2월

결과 및 자료공개

통계집 발간 원시자료공개

’11. 12월

피드백

DB구축

자료검토

자료정제

가중치부여

분석 DB 구축

’11. 1-5월

통계산출

조사결과 산출

검토회의 분석방법 및 결과 검토

’11. 6-9월

결과발표회 개최

’11. 11월

통계집 작성

통계집 작성

및 검토

통계집 심의 구성, 설명,

그래프 등 검토

’11. 9-12월

※ 2011년 조사 기준

자료원: 2011년 국민건강영양조사 워크샵

결과발표

• 결과발표회

• 결과보고서 : 년도별 국민건강통계(홈페이지→자료실)

홈페이지 주요결과 다운로드

(건강행태, 만성질환, 영양섭취로 구분)

2014-04-19 37

결과발표

2014-04-19 38

국민건강영양조사 원시자료

2014-04-19 39

원시자료 구성

• 원시자료:

- 최초 수집된 자료에서 입력오류, 조사오류, 논리적 오류 등을 수정 ∙ 제거한 자료

- 자료이용지침서 및 DB로 구성됨

• 원시자료이용 지침서

- 원시자료의 구조 및 구성에 대한 내용

: 설문문항, 변수 구조 등 파악 가능

- 자료이용 및 해석시 유의사항 등 정리

- 자료 분석 전 DB 파악에 유용

- 자료통합 방법, 통합자료의 시계열 분석 관련 내용 수록

2014-04-19 40

DB 구성

• 공통변수(ID, 성, 연령, 층화변수, 가중치 등)는 모든 DB에 포함되어 있음

2014-04-19 41

DB명 DB 설명

HNYR_ALL 기본조사(가구조사, 건강설문조사, 검진조사, 영양조사)

HNYR_IJMT 손상 및 의료이용

HNYR_OE 구강검사

HNYR_ENT 이비인후검사

HNYR_EYE 안검사

HNYR_DXA 골밀도

HNYR_24RC 식품섭취빈도조사

※ YR은 해당연도 2자리 숫자 예) 제 5기 2차년도(2011) 구강검사 DB : HN11_OE

기별 자료의 특성

• 연도별, 조사별 대상연령에 차이가 있음

2014-04-19 42

자료원: 국민건강영양조사 3회 자료활용 워크샵

DB 건수

2014-04-19 43

자료원: 국민건강영양조사 원시자료이용지침서 제5기(2010-2012)

원시자료 이용방법

2014-04-19 44

원시자료 이용방법

2014-04-19 45

원시자료 DB 받기

2014-04-19 46

원시자료 이용 및 논문 현황

2014-04-19 47

Trends in the number of research papers using the Korea National Health and Nutrition

Examination Survey (KNHANES) data, results from electronic search on 26 March 2013 in

Pubmed and Korea Med.

자료원: Kweon S et al. Int. J. Epidemiol. 2014;43:69-77

References

• 국민건강영양조사 홈페이지 https://knhanes.cdc.go.kr/

• 국민건강영양조사 원시자료 이용지침서 제5기(2010-2012)

• 2011년 국민건강영양조사 자료활용 워크샵, 질병관리본부

• Kim, Hyun Ja, et al. "Trends in the prevalence of major cardiovascular disease risk factors among Korean adults: Results from the Korea National Health and Nutrition Examination Survey, 1998− 2012." International Journal of Cardiology (2014).

• Kweon, Sanghui, et al. "Data Resource Profile: The Korea National Health and Nutrition Examination Survey (KNHANES)." International journal of epidemiology 43.1 (2014): 69-77.

2014-04-19 48

다음 강의

1) 국민건강영양조사 이해 (4/19)

- 자료의 개요 및 원시자료 DB

2) 가중치 및 자료 분석 개요 (4/26)

3) 국민건강영양조사 자료 활용 실습 (5/10)

2014-04-19 49