지역과다수준분석 neighborhood effects and multilevel analysis°•의_지역과...
TRANSCRIPT
지역과 다수준 분석
Neighborhood effects and multilevel analysis
서울시의 구별 사망 수준: 성/연령 보정 표준화사망률, 2000-2004년도
1600
1800
2000
2200
2400
서초구강남구송파구동작구양천구
서대문구
영등포구도봉구광진구강동구
중구용산구종로구마포구관악구구로구강서구은평구성북구성동구노원구중랑구금천구강북구
동대문구
200
300
400
500
600
700
800
10 20 30 40 50 60 70 80 90
KC
KP
EYKY
SN KM
BCSW
AY KR
YI
YJAS
SHHN KP
NYJ
OS
DDC
PT YC
KPKJ
KAP
YP
PJYJANS
PCYE
YC
HS
Relationship btw the proportion of lower social class and age-standardized mortality
Source: Taeho YoonDeath per 100,000
Proportion of lower social class
서울시 424개 동의 지역박탈지수와 사망률(2005-2010년도)의 관련성
인구
10만명당사망률
지역박탈지수
원크기는동별초과사망자수(최저사망률동대비)를반영함.
“It is perhaps unsurprising that epidemiologists generally avoid such analyses (ecological analyses)…, though this is in my opinion a great shame. Most epidemiology courses or textbooks spend much time and effort elaborating the technical aspects of cohort or case–control studies but give little time or space to ecological studies and natural experiments and may or may not include statistical methods such as time series analysis.”
“Simple cross-sectional ecological associations are usually dismissed as mere hypothesis-generating exercises, confounded by the ecological fallacy and very weak evidence for causality. However, temporal ecological data or, where one is fortunate, a population-based natural experiment provides far more robust evidence.”
왜 지역에 관심을 갖는가?
• 정책의 진입 지점으로서의 지역
– 저소득층 밀집지역이 어디인가? 건강 수준이 좋지 않은 사람들은 어디에
모여 사는가?
– 자원배분을 위한 단위로서의 지역
• 지역의 효과에 대한 관심
– 질병의 원인이 개인이 아닌 지역에 위치할 경우
– 지역에 대한 투자개인에 대한 효과
What is the effect of neighborhood on health?
• Compositional effect– Non-causal association
• Contextual effect– Causal association
지역은 어떻게 건강에 영향을 미치는가?
• Non-causal explanation
– compositional effect
• Physical environment
– Pollutants, PM10, PM2.5
• Material factors
– Access to healthcare/social
services, housing, healthy food
• Behavioral factors
– Access to parks, commercial
stores (tobacco & alcohol)
• Psychosocial factors
– Social supports
• Cultural factors
Advertising of Candy, Breakfast Cereals, Fast Food and Drinks During Children’s Television Viewing Hours
0
10
20
30
40
50
SwedenNorw
ayDen
markAustriaBelg
iumGerm
any
Finland
Netherla
ndsFrance
Australia
Greece UK
USA NZ
# A
dver
tisem
ents
/ 20
hrs
* Comprises about 75% of all advertising in these time periods
Dibbs. UK Consumers Union, 1996
Advertising of Fresh Fruit and Vegetables During Children’s Television Viewing Hours
0
2
4
6
8
10
12
14
16
SwedenNorw
ayDen
markAustriaBelg
iumGerm
any
Finland
Netherla
ndsFrance
Australia
Greece UK
USA NZ
# A
dver
tisem
ents
/ 20
hrs
Dibbs. UK Consumers Union, 1996
Neighborhood matters:도시공원 분포의 형평성-성남시 사례
신지영. 한국환경복원기술학회지 2009
도시공원 분포의 형평성-성남시 사례
신지영. 한국환경복원기술학회지 2009
출생아 1,000명 당 산부인과 전문의 수의 시군구별 분포(전국)
출생아 1,000명 당 산부인과 전문의 수의 분포(서울과 부산)
지역 박탈 지수에 따른 출생건수당 산부인과 전문의 수 분포
전문의수
/출생아
1000명
(낮은박탈지수) 지역박탈지수 5분위 (높은박탈지수)
지역 박탈 지수에 따른 출생건수당 소아과 전문의 수 분포
전문의수
/출생아
1000명
(낮은박탈지수) 지역박탈지수 5분위 (높은박탈지수)
지역 박탈 지수에 따른 자살 사망자수 대비 정신건강의학과전문의 수 (2011년도 기준) 분포 – 하나의 점은 하나의 시군구를 의미
전문의수
/자살사망자수
(낮은박탈지수) 지역박탈지수 5분위 (높은박탈지수)
NEJM, 2001
Neighborhood Effect on CHD
Incidence, ARIC (Atherosclerosis
Risk in Communities) Study of Four
Study Site in US
Diez-Roux et al,N Engl J Med(2001)
Neighborhood Effect on CHD
Incidence, ARIC (Atherosclerosis
Risk in Communities) Study of Four
Study Site in US
Diez-Roux et al,N Engl J Med(2001)
지역/맥락에 대한 관심이 왜 필요한가?
Type III Error: Right Answer to Wrong
Question
Schwartz & Carpenter. The right answer for the wrong question: consequences of type III error for public health research. AJPH (1999)
Type III Error의 양상: Homeless• Homeless에 대한 기존의 연구
– Homeless인 사람과 아닌 사람들의 개인적 특성 individual risk factor 을 비교(남성,
알코올 중독자, 실직자, 정신질환자 등)
• 이들 연구는 homeless의 원인을 찾고 있는가?
• 이들 특성을 교정함으로써 homeless를 없앨 수 있는가?
• 아니라면, 이들 연구들이 밝힌 내용은 무엇을 의미하는가?
– Individual susceptibility
• 이들 susceptibility에 초점을 둔 intervention은 어떤 의미를 지닐 것인가?
– Population incidence of homelessness vs. individual adaptation skill
Ecologic Fallacy
Atomistic Fallacy
Fallacy of the Ecological Fallacy
• Individual-level models are more perfectly specified than ecological-level model.
• Ecological models are substitutes for individual-level models.
• Only characteristics of individuals cause disease.
Schwartz, AJPH (1994)
Rates of homicide in Chicago and England and Wales by age and sex of perpetrator
Relationship btw Population Average &
Population Variation
Distribution of SBP in Middle-aged Men in Two Populations
The Contrasting Distribution of Serum Cholesterol in South Japan and Eastern Finland
The Shifting Distributions of SBP and BMI of Five Population Groups Aged 20-59 Derived from 52 Surveys in
32 Countries: Intersalt Study
Alcohol
• 여러 연구 결과, 소량의 음주는 심혈관계질환 발생을 막는 효과가 있는 것으로
알려졌다.
• 그러면, 소량의 음주를 권하는 것이 좋은 공중보건 정책일까?
• 음주량에 대한 사회적인 권고량을 이동시키면, 어떤 일이 일어날까?
• 우리 나라에서 음주와 심혈관계질환의 관련성은 어떻게 되나? 간질환과의
관련성은? 총 사망과의 관련성은?
Role of Average Alcohol Consumption on Heavy Drinking in UK Males
Colhoun et al, BMJ (1997)
r=0.75
Role of Average Alcohol Consumption on Heavy Drinking in UK Females
Colhoun et al, BMJ (1997)
r=0.62
왜 multilevel analysis인가?
0
10
20
30
40
50
1st 2nd 3rd 1st 2nd 3rd 1st 2nd 3rd
Mor
talit
y R
ate
per 1
,000
Mortality according to Class of Street and House,Manchester (1844)
Engels (1845), p136Class of the Houses
No Houses
1st 2nd 3rd
Class of the Streets
용어
• Multilevel model
• Hierarchical model
• Random effect model
• Covariance components model
Income level
Math. Achievement
Income level
Math. Achievement
Public School
Catholic School
Multilevel Model: Example
Multilevel Analysis를 위한 통계 팩키지
• HLM, Scientific Software International Lincolnwood, IL
• MLn, Institute of Education, London, UK
• VARCL, iec ProGAMMA, The Netherlands
• MIXREG, MIXOR & MIXNO, University of Illinois, Chicago, IL
• SAS procedure MIXED & SAS GLIMMIX macro, SAS Institute, Cary, NC
• BMDP5-V, Statistical Solutions Ltd., Ireland, UK
왜 multilevel analysis를 해야 하는가?
• 집단내 상관성 Intraclass correlation (ICC) 이로 인한 표준오차의추정 오류
• 전체 분산 중에서 지역 수준의 분산이 차지하는 비율
• 로짓회귀분석– ICC = neighborhood variance / (neighborhood variance + π2/3)– π2/3 : 개인 간 분산
• 특정 변수에 의해 설명되는 분산의 분율– Vexplained = (Vunadjusted – Vadjusted)/ Vunadjusted * 100
동일한 관련성을 보이더라도 ICC의 크기에 따라 지역의영향력은 전혀 다른 양상을 보인다.
ICC = 21% ICC = 84%
Same β = 4.9 Merlo et al. JECH 2001
Merlo. JECH 2003
연구 사례
서울의 파워엘리트의 분포
김창석 (2002)
Age-adjusted smoking prevalence by the LQ levels of Power Elite distribution among male Seoul citizens aged 15+
(N=26,022)
김창석, 윤성철, 김혜련, 강영호. 예방의학회지 2006
%
김창석, 윤성철, 김혜련, 강영호. 예방의학회지 2006
Age-adjusted smoking prevalence by the LQ levels of Power Elite distribution among female Seoul citizens aged 15+
(N=28,007)
%
0.025 > 2*0.009지역에 따른 변이가통계적으로 유의미하다
0.0075=0.025/(0.025+3.142/3)
24.2=(0.033–0.025)/0.033*100개인의 소득은 흡연율의 지역간변이를 24.2% 설명한다
Men
교육수준 만으로 동단위변이를 상당부분 설명한다
Women
How to explain this pattern?
Changes in OR (by multilevel analysis) of smoking by location quotients (LQ) level of power elites for the 19,351 men aged 25-64 and residing in
the 504 dong: the 2001 Seoul Health Indicators Survey
김창석, 윤성철, 김혜련, 강영호. 예방의학회지 2006
OR
OR
Changes in OR (by multilevel analysis) of smoking by location quotients (LQ) level of power elites for the 19,982 women aged 25-64 and residing
in the 504 dong: the 2001 Seoul Health Indicators Survey
김창석, 윤성철, 김혜련, 강영호. 예방의학회지 2006
동일한 자료를 multilevel analysis로 분석하지않았다면?
0.118 > 2*0.020지역에 따른 변이가통계적으로 유의미하다
35.6%=(0.118-0.076)/0.118*100
65.3%%=(0.118-0.041)/0.118*10065.3%-35.6%=29.7%
87.3%%=(0.118-0.015)/0.118*10087.3%-65.3%=22%
박탈지역의 낮은교육계층과 육체직에서 더높은 손상 사망을 보인다.
다양한 방법론적 이슈들(1)
• 지역의 단위
– 읍면동, 시군구, 광역시도, 국가/행정적 단위, 생활권/주소, 실 거주지, 주 활동
장소중에서 어디를 측정하여야 하나?
• 개인 지표
– 얼마나 정확하게 개인 지표를 측정하여야 하나? Residual confounding
– 어떤 개인 지표가 추가되어야 하나?
• 지역 지표
– 어떤 지역 지표가 활용되어야 하나? 파워엘리트 집중도, 박탈지표는 무엇을
의미하는가? 이의 측정치는 정확한가?
– 현재의 지역 지표가 의미가 있는가? 아니면 과거의 지역 지표가 의미가 있는가?
다양한 방법론적 이슈들(2)
• 관련성의 크기
– 지역 지표의 관련성 크기 vs 개인 지표의 관련성의 크기
• 결과지표
– 모든 결과 지표에 동일한 지역지표, 동일한 개인 특성이 사용될 수 있는가?
여전히 중요한 것은 연구자의 문제설정이다.
왜 사람들의 건강과 행태는 지역단위 지표의 영향을
받는가?
지역단위 지표는 어떻게 인간의 건강과 행태에
영향을 미치는가?
흡연 – 지역 내의 광고, 담배 소매점수, 담배회사의 지역별 홍보 접근 전략, 지역의 금연
프로그램에의 접근성 등
손상 – 정비되지 않은 인도/차도, 도시설계 문제, 건축현장에의 아동의 접근성, 손상시
의료기관 접근성, 아동들의 놀 수 있는 공간에의 접근성, 지역별 손상 방지 대책, 아동들의
여가 활동에 대한 지역별 태도/문화의 차이
다수준 분석 결과의 유의성만이 중요한 것은
아니다.
다수준 분석 결과가 유의하게 나왔다면, 정작
문제는 왜 그러한 contextual effect가 있는가를
규명하는 것이다.
Chaix. Annu Rev Public Health 2009
Toward general models on social
determinants of health
건강의 결정 요인: Michael Marmot
건강의 결정 요인 모형: George Kaplan
건강의 결정요인: James S House
건강의 결정요인: John Lynch
SocialStructure
SocioeconomicPosition
MaterialPsychosocialBehavioral
Factors
BiologicalFactors
Morbidity Mortality
SocialStructure
SocialPosition
MaterialPsychosocialBehavioral
BiologicalFactors
Morbidity Mortality
Multilevel Causal Chains
Over the Lifecourse
Birth Old Ageaccumulation
Multilevel Causal ChainsOver the Lifecourse
of Different Generations
SocialStructure
SocialPosition
MaterialPsychosocial
Behavioral
BiologicalFactors
Morbidity Mortality
Birth Old Ageaccumulation
Birth Old Age
SocialPosition
MaterialPsychosocial
Behavioral
BiologicalFactors
Morbidity Mortality
accumulation
SocialStructure
Lifecourse Context
궁극적으로, 건강과 질병을어떻게 이해할 것인가?
MechanismsMulti-time point Accumulation
Biological, behavioral,
psychological translation
Multi-level Extra-individual
Prisoner of the Proximate