국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_spring/lm/본론2.1,2.2(2... ·...

12
국민 삶의 지표에 관한 통계 분석 ( 박지연 ) 2015/6/1 -1- 국민 삶의 지표에 관한 통계 분석 I. 서론 1.1 연구목적 삶의 질(EQ-5D)이라는 종속변수를 대상으로 하여 나머지 여러 개의 설명변수가 종속변수를 어떻게 설명하는지 , 어떠한 영향을 가져올 있으며 , 서로 어떠한 연관성을 가지는지에 대한 의문을 풀기 위하여 분석을 실시하고 , 이에 대하여 조사 목적이 있다 . 먼저 삶의 질이란 지역에 대하여 개인에 대한 건강한 삶의 질이 나아지면 , 자신의 행복이 지역들의 합으로 이어지기 때문에 시민들이 어느 변수에서 정신적으로나 또한 육체적으로 얼마나 건강한지에 대하 , 얼마나 연관성을 가지는지에 대하여 알아보기 위해 데이터를 사용해서 분석하고자 하는 것에 목적을 가지고 석과 조사를 것이다 . 이에 앞서 , 종속변수인 EQ-5D 지표에 대해 설명하자면 EQ-5D(삶의 질)은 , 국가 통계 포털 사이트인 www.kosis.kr 에서 수집하였으며 , 통계청 조사기획과에서 분석하였다 . 데이터는 도시 별로 78 개의 도시 데이터 가지고 있으며 , 또한 , , 보건소 단위로 생산된 통계자료이고 , 조율 값을 사용한다 . EQ-5D 정확한 정의 건강에 대한 삶의 질의 5 가지 차원의 기술체계를 종합한 지표로 , 수치가 1 가까울수록 건강에 대한 삶의 질이 다고 있다 . 또한 , 만성질환의 증가와 수명의 증가로 사망률뿐만 아니라 삶의 질을 포괄하는 건강지표의 필요성이 대두되었는데 , 한정된 자원의 효율적 사용과 근거중심의 보건정책을 위하여 경제성 평가의 필요성이 강조되고 있다 . 용효용 분석에 사용되는 QALY 근거중심 정책의 중요한 도구가 되며 이를 산출하기 위해서는 다양한 건강상태의 가치를 하나의 점수로 나타낼 있어야 한다. EQ-5D는 EuroQol 그룹에서 개발한 일반적 측정도구로 , ’운동능력’ , ’자기 관리’ , ’일상활동’ , ’통증 / 불편’ , ’불안 / 우울’의 5개 차원에 대해서‘문제없음’ , 다소 문제 있음’ , ‘심각한 문제 있음’의 3가지 준으로 평가하도록 구성되어 있다 . 그리고 EQ-5D는 가장 많이 사용되고 있는 일반적 측정도구로 , 이를 이용하면 보정수명을 구하는데 필요한 효용 가중치도 구할 있어 널리 사용되고 있다 . 삶의 질(EQ-5D)의 산출 식은 y = 1 - (0.05 + 0.096*M2 + 0.418*M3 + 0.046*SC2 + 0.136*SC3 + 0.51*UA2 + 0.208*UA3 + 0.037*PD2 + 0.151*PD3 + 0.043*AD2 + 0.158*AD3 + 0.05*N3) 이다. <표 1> EQ-5D 변수명 정 의 변수명 정 의 M2 운동능력이‘수준 2’인 경우 1; 그렇지 않으면 0 M2 운동능력이‘수준 2’인 경우 1; 그렇지 않으면 0 M3 운동능력이‘수준 3’인 경우 1; 그렇지 않으면 0 M3 운동능력이‘수준 3’인 경우 1; 그렇지 않으면 0 SC2 자기관리가‘수준 2’인 경우 1; 그렇지 않으면 0 SC2 자기관리가‘수준 2’인 경우 1; 그렇지 않으면 0 SC3 자기관리가‘수준 3’인 경우 1; 그렇지 않으면 0 SC3 자기관리가‘수준 3’인 경우 1; 그렇지 않으면 0 UA2 일상활동이‘수준 2’인 경우 1; 그렇지 않으면 0 UA2 일상활동이‘수준 2’인 경우 1; 그렇지 않으면 0 UA3 일상활동이‘수준 3’인 경우 1; 그렇지 않으면 0 UA3 일상활동이‘수준 3’인 경우 1; 그렇지 않으면 0 PD2 통증/불편감이‘수준 2’인 경우 1; 그렇지 않으면 0 PD2 통증/불편감이‘수준 2’인 경우 1; 그렇지 않으면 0 PD3 통증/불편감이‘수준 3’인 경우 1; 그렇지 않으면 0 PD3 통증/불편감이‘수준 3’인 경우 1; 그렇지 않으면 0 AD2 불안/우울이‘수준 2’인 경우 1; 그렇지 않으면 0 AD2 불안/우울이‘수준 2’인 경우 1; 그렇지 않으면 0 AD3 불안/우울이‘수준 3’인 경우 1; 그렇지 않으면 0 AD3 불안/우울이‘수준 3’인 경우 1; 그렇지 않으면 0 N3 ’수준3’이 하나라도 있을때 1, 나머지는 0 N3 ’수준3’이 하나라도 있을때 1, 나머지는 0 설명변수의 분야를 사회와 환경으로 가지의 분류를 하였다 . 삶의 지표에 영향을 같은 많은 변수들을 포괄적이게 분류를 하여 10개의 변수들을 소분류로 생각하고, 최종적으로 사회와 환경이라는 대 분류로 나누었다. 또한 자신이 종속변수에 영향을 줄 것 같은 10가지의 설명변수들을 중분류로 나누고 , 변수들의 실제 데이터를 찾아 보았다 . 데이터들 역시 국가 통계 포털 사이트인 www.kosis.kr 에서 모든 자료를 확보하였다 . 사이트에서 엑셀 자료를 다운받아 정리하였으며 , 변수의 단위는 국가 통계 포털 사이트에 있는 데이터 안에 들어있는 단위를 사용하였

Upload: others

Post on 24-Apr-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_Spring/LM/본론2.1,2.2(2... · 2015-06-01 · 국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

-1-

국민 삶의 질 지표에 관한 통계 분석 I. 서론

1.1 연구목적

삶의 질(EQ-5D)이라는 종속변수를 대상으로 하여 나머지 여러 개의 설명변수가 종속변수를 어떻게 설명하는지,

또 어떠한 영향을 가져올 수 있으며, 서로 어떠한 연관성을 가지는지에 대한 의문을 풀기 위하여 분석을 실시하고, 이에

대하여 조사 목적이 있다. 먼저 삶의 질이란 한 지역에 대하여 개인에 대한 건강한 삶의 질이 나아지면, 자신의 행복이

각 지역들의 합으로 이어지기 때문에 시민들이 어느 변수에서 정신적으로나 또한 육체적으로 얼마나 건강한지에 대하

여, 또 얼마나 연관성을 가지는지에 대하여 알아보기 위해 데이터를 사용해서 분석하고자 하는 것에 목적을 가지고 분

석과 조사를 할 것이다.

이에 앞서, 종속변수인 EQ-5D 지표에 대해 설명하자면 EQ-5D(삶의 질)은, 국가 통계 포털 사이트인

www.kosis.kr에서 수집하였으며, 통계청 조사기획과에서 분석하였다. 이 데이터는 각 도시 별로 78개의 도시 데이터

를 가지고 있으며, 또한 각 시, 군, 구 보건소 단위로 생산된 통계자료이고, 조율 값을 사용한다. EQ-5D의 정확한 정의

는 건강에 대한 삶의 질의 5가지 차원의 기술체계를 종합한 지표로, 수치가 1에 가까울수록 건강에 대한 삶의 질이 높

다고 할 수 있다. 또한, 만성질환의 증가와 수명의 증가로 사망률뿐만 아니라 삶의 질을 포괄하는 건강지표의 필요성이

대두되었는데, 한정된 자원의 효율적 사용과 근거중심의 보건정책을 위하여 경제성 평가의 필요성이 강조되고 있다. 비

용효용 분석에 사용되는 QALY는 근거중심 정책의 중요한 도구가 되며 이를 산출하기 위해서는 다양한 건강상태의

가치를 하나의 점수로 나타낼 수 있어야 한다. EQ-5D는 EuroQol 그룹에서 개발한 일반적 측정도구로,’운동능력’,’자기

관리’,’일상활동’,’통증/불편’,’불안/우울’의 5개 차원에 대해서‘문제없음’, 다소 문제 있음’, ‘심각한 문제 있음’의 3가지 수

준으로 평가하도록 구성되어 있다. 그리고 EQ-5D는 가장 많이 사용되고 있는 일반적 측정도구로, 이를 이용하면 질

보정수명을 구하는데 필요한 효용 가중치도 구할 수 있어 널리 사용되고 있다.

삶의 질(EQ-5D)의 산출 식은 y = 1 - (0.05 + 0.096*M2 + 0.418*M3 + 0.046*SC2 + 0.136*SC3 +

0.51*UA2 + 0.208*UA3 + 0.037*PD2 + 0.151*PD3 + 0.043*AD2 + 0.158*AD3 + 0.05*N3) 이다. <표 1> EQ-5D

변수명 정 의 변수명 정 의 M2 운동능력이‘수준 2’인 경우 1; 그렇지 않으면 0 M2 운동능력이‘수준 2’인 경우 1; 그렇지 않으면 0 M3 운동능력이‘수준 3’인 경우 1; 그렇지 않으면 0 M3 운동능력이‘수준 3’인 경우 1; 그렇지 않으면 0 SC2 자기관리가‘수준 2’인 경우 1; 그렇지 않으면 0 SC2 자기관리가‘수준 2’인 경우 1; 그렇지 않으면 0 SC3 자기관리가‘수준 3’인 경우 1; 그렇지 않으면 0 SC3 자기관리가‘수준 3’인 경우 1; 그렇지 않으면 0 UA2 일상활동이‘수준 2’인 경우 1; 그렇지 않으면 0 UA2 일상활동이‘수준 2’인 경우 1; 그렇지 않으면 0 UA3 일상활동이‘수준 3’인 경우 1; 그렇지 않으면 0 UA3 일상활동이‘수준 3’인 경우 1; 그렇지 않으면 0 PD2 통증/불편감이‘수준 2’인 경우 1; 그렇지 않으면 0 PD2 통증/불편감이‘수준 2’인 경우 1; 그렇지 않으면 0 PD3 통증/불편감이‘수준 3’인 경우 1; 그렇지 않으면 0 PD3 통증/불편감이‘수준 3’인 경우 1; 그렇지 않으면 0 AD2 불안/우울이‘수준 2’인 경우 1; 그렇지 않으면 0 AD2 불안/우울이‘수준 2’인 경우 1; 그렇지 않으면 0 AD3 불안/우울이‘수준 3’인 경우 1; 그렇지 않으면 0 AD3 불안/우울이‘수준 3’인 경우 1; 그렇지 않으면 0 N3 ’수준3’이 하나라도 있을때 1, 나머지는 0 N3 ’수준3’이 하나라도 있을때 1, 나머지는 0

설명변수의 대 분야를 사회와 환경으로 두 가지의 분류를 하였다. 삶의 지표에 영향을 줄 것 같은 많은 변수들을

포괄적이게 분류를 하여 총 10개의 변수들을 소분류로 생각하고, 최종적으로 사회와 환경이라는 대 분류로 나누었다.

또한 자신이 종속변수에 영향을 줄 것 같은 10가지의 설명변수들을 중분류로 나누고, 이 변수들의 실제 데이터를 찾아

보았다. 이 데이터들 역시 국가 통계 포털 사이트인 www.kosis.kr에서 모든 자료를 확보하였다. 이 사이트에서 엑셀

자료를 다운받아 정리하였으며, 변수의 단위는 국가 통계 포털 사이트에 있는 데이터 안에 들어있는 단위를 사용하였

Page 2: 국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_Spring/LM/본론2.1,2.2(2... · 2015-06-01 · 국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

-2-

다. 이 변수들은 두 가지의 설명변수인 사회분야 에서는, 의료 보장성, 복지 보장성, 사회 안전성, 도시 재정 건강성, 직업

안정성으로 정했고, 나머지 설명변수인 환경분야 에서는, 거주 환경 쾌적성, 교육 수준, 문화시설 접근성, 가정환경 안정

성, 교통 용이성으로 정하여 10개의 변수로 이루어져 있다. 이 데이터들은 모두 2013년도 의 자료를 사용하였으나, 부

득이하게도 2013년도의 자료가 없는 복지 보장성의 측정변수인 사회복지시설 수의 데이터는 2012년도의 데이터로

대체해서 분석하였다.

1.2 데이터 설명

먼저 첫 번째 설명변수인 사회에 대한 분야에서는 5가지의 설명변수를 조사한 뒤 정하였으며, 조사과정에 대한 데

이터 수집방법에 대하여 설명을 하겠다. 사회 분야에서의 측정변수로는 첫 번째의 변수로는 의료 보장성으로, 보건과

의료의 보장성이 높아지면 주민의 건강이 높아져 건강에 대한 삶의 질의 만족도가 높아지기 때문이다. 의료 보장성의

데이터로는 두 개의 데이터인 인구 천명당 의료 고가 장비 수와, 의료기관 종사 의사수로 정했다. 하지만 의료 고가 장

비 수를 정하는 기준을 명확하게 하기 어려움이 있고, 데이터도 정확하지 않기 때문에 인구 천명당 의료기관 종사 의사

수를 측정 변수로 정하여 분석 할 것이다. 의료기관에 종사하는 의사의 수가 많을수록 이에 따른 여러 종류의 의료 기

술을 가지고 있을 것이며, 또한 이에 대하여 좋은 품질의 진료를 받을 수 있고, 또한 자신의 건강을 알기 위해 좋은 환

경이기 때문에 의료에 대한 편의성이 보장된다고 설명할 수 있다. 또한 보건과 의료 보장성에서 긍정적인 영향을 미쳐

양의 효과를 가지고 올 수 있다고 생각하여 의료 보장성을 분석할 수 있다.

국가 통계 포털 사이트에서 가져온 데이터인 인구 천명당 의료기관 종사 의사 수(시)는, 78개의 시로 이루어져 있고

단위는‘명’이며, 인구 천명당 의료기관 종사 의사 수의 산출 식(계산 방법)은(의사+치과의사+한의사)/주민등록인구

*1000이다.

두 번째는 복지 보장성으로, 복지 보장성이 높아지면 주민들의 건강에 긍정적인 영향을 가져오기 때문에 건강에

대한 삶의 질이 좋아진다고 설명할 수 있다. 복지 보장성의 변수, 데이터로는 노인 복지시설 수, 또는 유아 인구 천명당

보육시설 수 인구 십만 명당 사회복지시설 수, 인구 십만 명 당 노인여가 복지시설로 정했지만, 유아 인구 천명당 보육

시설은 주민 전체의 건강의 삶의 질에 대한 설명과 분석이 어려울 것으로 생각되어 다른 복지 보장성의 변수인 인구

십만 명당 노인여가 복지시설 수로 측정변수로 정하여 분석을 할 것이다. 이 노인 여가 복지 시설들의 수가 많아질수록

도시에 대한 복지율도 높아지는 경향을 보일 수 있고, 또한 이에 따른 복지 보장성이 높아진다고 설명할 수 있다. 그러

므로, 시설에 의존을 해야 하는 사람들이 사용할 수 있는 노인 여가 복지시설의 수가 많을수록 건강에 대한 주민들의

삶의 질에 양의 효과를 가져올 수 있다고 생각하여 복지 보장성에 대한 설명을 할 수 있다고 생각한다.

국가 통계 포털 사이트에서 가져온 데이터인 인구 십만 명당 노인 여가 복지시설 수(시)는 77개의 도시로 이루어져

있고, 단위는‘개’이며, 행정자치부 주민등록인구-일부 자료가 없는 지역은 해당 출처기관에서 자료를 제공하지 않고 있

다고 한다. 노인여가복지시설은 노인복지관, 경로당, 노인교실, 노인휴양소를 포함한 수치이다.

세 번째는 사회 안전성으로, 사회에 대한 안전성이 낮아지면 주민들이 느끼는 삶의 대한 안전성이 낮아져서,건강에

대한 삶의 질에 부정적인 영향을 미쳐서 주민들의 건강성이 낮아진다고 생각된다. 사회 안정성의 측정 변수로는 범죄

발생건수, 소년 범죄 발생건수, 자동차 천대당 교통사고 발생건수로 정했지만 소년 범죄 발생건수로는 주민들 전체의

사회 안정성을 설명하고 분석하지 못할 것으로 생각되어 이 데이터를 선택하지 않았고, 범죄 발생건수의 데이터는 자

료가 분명하지 않고 시에 대한 데이터가 없기 때문에 자동차 천대당 교통사고 발생건수로 측정변수를 정해 분석을 할

Page 3: 국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_Spring/LM/본론2.1,2.2(2... · 2015-06-01 · 국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

-3-

것이다. 또한 이 데이터가 다른 데이터 보다 사회 안전성에 대하여 더욱 영향을 가져올 것으로 생각되어 교통사고 발생

건수로 측정변수를 정할 것이다. 교통사고 발생건수가 많을수록 사회 안정성에 대한 믿음이 낮아지기 때문이다. 그러므

로 건강에 대한 지수와 연관이 있을 것이라고 생각되어 음의 효과를 가져올 것이라고 생각한다. 그러므로 사회 안전성

을 설명할 수 있다고 본다.

국가 통계 포털 사이트에서 가져온 데이터인 자동차 천대당 교통사고 발생건수는, 78개의 시로 이루어져 있고, 단

위는‘건’이며, 제 1당사자 차 종별 교통사고 발생건수 이다. 이 데이터에는 승용차, 승합차, 화물차, 특수차가 포함되어

있으며, 자료는 도로교통공단에서 분석한 자료가 출처로 쓰였다.

네 번째는 도시 재정 건강성으로 도시 재정 건강성이 높아지거나, 주민들이 도시의 재정이 안정적이라고 느낄수록

주민들의 건강성이 높아져 삶의 질이 좋아질 것으로 예상된다. 도시면적당 공장업소 수와, 시 별 회계 중 사회복지예산

비중, 또는 재정자립도의 데이터로 정했으며 도시면적당 공장업소 수는 도시 재정 건강성과 환경에 대하여 서로 유사

변수라고 생각되고, 또한 재정자립도의 변수가 다른 변수인 공장업소 수보다 도시 재정 건강성으로 더욱 적합하고, 영

향을 많이 가져올 것이라고 생각되어 재정 자립도의 데이터로 측정변수로 정하여 분석을 할 것이다. 또한, 재정 자립도

가 높아질수록 시에서 건강에 투자하는 복지 예산이 많아지고, 이로 인하여 건강에 신경을 써야 하는 비중과 비율이 높

아지기 때문이라고 생각하여 도시 재정 건강성에 대하여 긍정적인 영향과 양의 효과를 동시에 가져올 것이라고 생각하

여 분석을 할 것이다.

국가 통계 포털 사이트에서 가져온 데이터인 재정 자립도는 총 78개의 시로 이루어져 있으며, 단위는‘%’이고, 행정

자치부의 지방재정연감이 분석해서 나온 자료가 출처로 쓰였다.

다섯 번째는 직업 안정성이다. 직업의 안정성이 높아지면 주민들이 느끼는 심리적 변화에 주민들의 건강성도 높아

질 것이고, 이에 따라서 삶의 질이 좋아질 것이라고 예상된다. 고용율과 실업률을 변수로 정했다. 하지만 고용률, 취업률

보다는 실업률이 직업 안정성에 대한 체감 효과가 더욱 많을 것이라고 생각되어 실업률을 최종으로 측정변수로 선택하

여 분석할 것이다. 실업률이 높을수록 심리적 여유가 없어지고 경제적으로도 불안해져 건강에 대한 부정적인 영향을

가져올 것이라고 생각한다. 또한 실업률이 높을수록 직업을 잃은 사람이 많다는 이야기로 이어지므로, 직업을 잃으면

수입이 없다는 것과 마찬가지라고 생각된다. 그러므로 정신적인 건강에 부정적인 영향을 미치고 스트레스를 받는 지수

가 높아질 것이며, 또한 육체적으로도 건강을 챙길 수 없다고 생각되어 건강에 대한 삶의 질에 대하여 부정적인 영향인

음의 효과를 가져올 것이라고 생각하여 분석할 것이다.

국가 통계 포털 사이트에서 가져온 자료인 실업률은, 총 78개의 도시로 이루어져 있으며 실업률의 구성으로는 실

업자가 경제활동인구(취업자+실업자)에서 차지하는 비율로 산출 식(계산 방법은) (실업자/경제활동인구)*100 이고, 단

위는‘%’이며, 이 자료는 통계청과 지역별고용조사에서 분석한 자료가 출처로 사용 되었다.

두 번째 설명변수인 환경에 대한 분야에서도 마찬가지로 5가지의 변수를 지정하였다. 이 환경 분야 역시 조사과정

에 대한 데이터 수집방법에 대하여 설명을 하겠다. 우선 첫 번째로는, 거주 환경 쾌적성으로, 거주 환경 쾌적성이 높아

지면 주민들이 느끼는 건강성도 같이 높아져 삶의 질이 좋아진다고 생각하였다. 도시면적당 폐수 배출업소 수는 폐수

를 배출하는 업소들이 많을수록, 또 폐수 배출율이 높을수록 거주 환경에 대한 쾌적성이 낮아질 것이라고 생각된다. 하

지만 인구 천명당 도시공원조성면적으로 측정 변수를 정하는 것이 폐수 배출업소 수로 분석하는 것 보다 거주 환경 쾌

적성에 더욱 영향을 미칠 것이라고 생각되어 인구 천명당 도시공원면적을 측정변수로 정하여 분석을 할 것이다.인구

천명당 도시공원조성면적이 넓을수록 대기에 대하여 직접적인 영향과, 이로 인하여 긍정적인 영향을 미칠 것이라고 생

각되고, 또한 면적이 넓을수록 대기에 대하여 양의 효과인 양의 영향을 가져올 것이기 때문에 거주 환경에 대한 쾌적성

Page 4: 국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_Spring/LM/본론2.1,2.2(2... · 2015-06-01 · 국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

-4-

에 대하여 긍정적인 영향을 주어 거주 환경 쾌적성이 높아질 것이라고 생각된다. 또한 도시공원조성면적이 넓을수록

그 주변에 있는 주민들은 공원을 더욱 자주 이용하게 되어 운동을 유도할 수 있다고 생각되고, 이러한 환경을 더욱 용

이하게 형성 할 수 있어 건강에 대한 삶의 질에 대하여 긍정적인 영향을 가져올 것이라고 생각된다.

국가 통계 포털 사이트에서 가져온 인구 천명당 도시공원조성면적 데이터는, 총 78개의 시로 이루어져 있고, 광역

자치단체 도시공원 조성면적은 시와 도청에서 관리하는 공원을 포함한 수치라고 한다. 또 공원의 도시자연공원 항목이

부분적으로 용도 구역의 도시자연공원구역 항목으로 변경되었으며, 단위는‘천㎡’이고, 이 자료는 국토교통부의 도시계

획현황과, 행정자치부의 주민등록인구가 분석한 출처이다.

두 번째로는 교육 수준으로, 교육 수준이 높아지면 주민이 느끼는 건강성도 같이 높아져 삶의 질에 긍정적인 영향

을 미친다. 인터넷 기사에서 교육 수준에 관한 자료를 찾아보았는데, 이 기사에 따르면 가톨릭 인천성모병원 사회 사업

팀은 다양한 프로그램을 통해 치료중인 환자 및 가족의 삶의 질을 높이며 일상으로의 빠른 복귀를 돕고 있다고 한다.

이렇게 많은 프로그램을 통하여 삶의 질을 높여 건강에 대한 삶의 질에 관련성이 있다고 생각하여 교육 수준에 대한

조건을 조사할 것이다. 사회복지정보교육은 인천성모병원 의료사회사업가가 각 질환의 특성에 맞는 질환 별 의료비 지

원정보부터 장애 등록 절차, 의료 급여 수급권 신청 방법, 노인장기요양보험 신청 방법, 기타 사회적인 혜택 등에 대해

안내한다. 이런 사회복지정보교육은 환자들이 질병으로 인한 사회와 경제적인 부담을 줄이고 일상생활로 빠른 복귀가

가능하도록 돕도록 하는데 초점을 맞추었다고 한다. 이 기사의 출처는

http://www.edaily.co.kr/news/NewsRead.edy?SCD=JG61&newsid=01787606609366624&DCD=A0

0706&OutLnkChk=Y 이다.

측정 변수로는 인구 천명당 사설 학원 수, 인구 천명당 전문대 및 대학교 수, 혹은 인구 천명당 초등학교 수로 정했

다. 하지만 인구 천명당 전문대 및 대학교 수는 데이터에 누락된 도시가 많아 데이터의 수가 적고, 사설 학원 수나 전문

대 및 대학교 수 보다 인구 천명당 초등학교 수가 더욱 교육 수준에 대하여 많은 설명할 할 수 있고, 영향을 미칠 것이

라고 생각되어 이 변수를 측정 변수로 정하여 분석을 할 것이다. 교육 수준에 대한 초등학교 수가 많아질수록 주민들의

교육에 대한 선택의 폭의 넓어져 자신의 생각대로 교육의 질을 선택할 수 있어, 교육 수준이 높아질 것이고 또한 물질

적으로도 저축할 수 있다고 생각된다. 이로 인하여 삶에 대한 여유가 생겨 건강에 대한 신경을 쓰는 비율이 연관이 되

어 양의 효과를 얻을 것이라고 생각된다. 또한 교육시설의 환경과 접근성이 높아질수록 더욱 건강에 대하여 지적인 삶

의 질을 얻을 수 있으며, 학교와 가까워질수록 정신적으로 받는 스트레스를 줄일 수 있어 건강에 대한 삶의 질이 높아

진다고 생각된다.

국가 통계 포털 사이트에서 가져온 초등학교 수의 데이터는 총 78개의 데이터를 가지고 있으며, 단위는 ‘개’이고,

초등학교 수에서 분교는 제외가 되었다. 이 자료는 한국교육개발원 교육통계연구센터에서 분석한 자료이고, 출처로 쓰

였다.

세 번째로는 문화시설 접근성으로, 문화시설 접근성이 높아지게 되면 주민들이 느끼게 되는 건강성이 높아져 삶의

질에 대하여 긍정적인 영향을 가져올 것이다. 측정 변수로는 인구 천명당 영화관 수, 혹은 미술관 수로 정했다. 하지만

인구 십만 명 당 문화시설 기반수의 데이터로 측정하는 것이 나머지 변수를 측정하여 분석하는 것 보다 문화시설 접근

성에 대하여 더욱 많은 영향을 가져올 것이라고 생각되어 인구 십만 명 당 문화시설 기반수의 데이터를 측정변수로 정

하여 분석할 것이다. 문화 시설 기반수가 많아질수록 삶의 대한 여유를 느끼며 건강에 대한 긍정적인 영향을 미칠 것이

라고 생각된다. 또한 정신적 스트레스를 줄이기 위해서, 또 문화생활을 즐기기 위해 문화기반시설로 인하여 주민들이

문화생활을 하는 시간이 많아져 정신건강에 대한 삶의 질이 높아질 것이라고 예상되어 분석을 할 것이다.

국가 통계 포털 사이트에서 가져온 인구 십만 명당 문화 기반 시설 수의 데이터는 총 78개의 시로 이루어져 있고,

Page 5: 국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_Spring/LM/본론2.1,2.2(2... · 2015-06-01 · 국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

-5-

단위는‘개’이며, 문화체육관광부의 전국 문화기반시설 총람, 행정자치부 주민등록인구, 통계청 조사 기획과가 분석한 자

료가 출처이다. 인터넷 기사에서 문화시설과 삶의 질에 대한 자료를 찾아 보았는데, 문화생활까지 원스톱으로 누릴 수

있는 주민편의시설 인근 아파트의 인기가 높아지며 입지의 중요성이 다시금 부각되고 있다. 특히 단지에서 멀더라도

시간과 비용을 들여서 이용하게 되는 수영장이나 농구장, 실내체육관 등을 도보로 이용할 수 있다면 주말 여가시간은

매우 풍성해 질 수 있다고 한다. 이 기사의 출처는

http://www.cnews.co.kr/uhtml/read.jsp?idxno=201406190925056100867이다.

네 번째로는 가정환경 안정성으로, 주민들이 가정환경에 대한 안정성이 낮아지면 이에 따른 건강성이 낮아져 삶의

질에 부정적인 영향을 가져올 것이다. 측정 변수는 결혼율과인구 천명당 이혼율로 정했지만, 결혼율에 대한 정확한 데

이터가 없고, 이혼율이 결혼율보다 더욱 가정환경에 대한 안정성에 대하여 많은 영향을 가져올 수 있고 가정환경에 대

한 안정성을 설명할 수 있다고 생각하여 이혼율을 측정변수로 정하여 분석을 할 것이다. 이혼율이 낮아지면 심리적으

로 가정 환경에 대한 만족성이 떨어지고 또한 정신적인 스트레스를 가져올 것으로 생각된다. 그러므로 가정환경에 대

한 안정성에 대하여 부정적인 영향을 미쳐 음의 효과를 가져올 것이다.

국가 통계 포탈 사이트에서 가져온 인구 천명당 이혼율(조이혼율)에 대한 데이터는 총78개의 도시로 이루어져 있

으며, 단위는‘건’이고, 이 자료는 통계청 조사기획과에서 조사한 인구동태통계에서 분석한 출처이다.

마지막으로 다섯 번째 변수는 교통 용이성으로, 교통에 대한 환경이 용이하면 심리적으로 긍정적인 영향을 받게

되어 주민들의 건강성에 대하여 양의 효과를 미칠 것이다. 이로 인하여 지역 소요 시간 별 통근, 통학인구 수로 측정하

려고 하였다. 하지만 시 별 소요시간 통근 통학인구 수는 데이터를 측정하기도 어렵고, 교통 용이성을 설명할 수 있는

기준을 정하기에는 어려움이 있을 것이라고 생각되어 적합하지 않다. 또한, 데이터가 시 별 데이터가 없는 관계로 도로

포장률 측정 변수를 분석하여 교통 용이성을 설명 할 것이다. 도로 포장률이 높을 수록 교통을 사용하는 사람들에게 좋

은 환경으로 인하여 건강에 대한 삶의 질에 긍정적인 영향을 주고, 또한 정신건강에 대하여 양의 효과를 가져와서 건강

에 대한 삶의 질이 높아질 것이라고 생각하여 도로 포장률을 측정 변수로 하여 교통 용이성에 대하여 설명할 것이다.

국가 통계 포털 사이트에서 가져온 데이터인 도로 포장률은 78개의 도시로 단위는‘%’이며, 국토 해양부 도로현황

조서가 분석한 출처 이다.

Page 6: 국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_Spring/LM/본론2.1,2.2(2... · 2015-06-01 · 국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

-6-

1.3 연구구성도

(사회)

의료 보장성(+)

복지 보장성(+)

사회 안전성(-)

도시 재정 건강성(+)

직업 안정성(-)

(환경)

거주 환경 쾌적성(+)

교육 수준(+)

문화시설 접근성(+)

가정환경 안정성(-)

교통 용이성(+)

Page 7: 국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_Spring/LM/본론2.1,2.2(2... · 2015-06-01 · 국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

-7-

II. 본론

2.1 데이터 클린징

정규 변환을 하는 이유는 분석 전 작업을 할 때, 즉 정규성 검정을 할 때 어느 한쪽으로의 치우침이 없어야 하는

분포로 모양이 정확해야 한다. 회귀분석의 가정을 만족시키지 못하거나, 또는 설명력이 기대했던 것보다 낮게 나올 경

우에 변환 여부를 결정해야 한다. 분석을 할 때에 평균은 치우침이나 이상치에 대하여 영향을 많이 받으므로, 평균과

평균 차이에 대한 분석을 하기 위해서는 치우침에 대한 정규성 변환과 이상치 진단으로 하여 이상치 제거를 해야 하고,

이를 바탕으로 하여 정확한 분석을 해야 한다. 분석 전에 치우침에 대한 것은 정규성 검정으로 본다. 이 정규성을 검정

하는 과정에서 히스토그램을 활용하면, 시각적인 판단으로 인하여 중위값과 평균에 대한 값이 일치해야 정규성을 띄고

있다고 본다. 시각적인 판단과 정규성 검정을 하여 중위값과 평균에 대한 값이 일치하는 조건이 나오면 변환을 하지 않

아도 된다.

회귀분석을 할 때, 회귀분석의 가정에는 3가지의 조건이 있다. 이 조건에는 모형 중에 오차 항인 e에 대하여 조건

이 있는데, 이 조건에는 오차 항은 등분산성을 따라야 하며, 독립성을 따라야 하고 또 정규성의 조건에도 따라야 한다.

이 3가지의 조건과 가정이 이루어져야 잔차를 검토해서 분석할 수 있다. 하지만, 만약에 모형이 등분산성의 내용을 충

족하지 않고, 즉 분산이 종속변수에 대하여 같은 값이 아니거나, 종속변수에 따라서 증가하거나 값이 변한다면 등분산

성의 가정이 충족되지 않고 어긋나기 때문에 가정에 대하여 충족할 수 없다.

예를 들어서, 회귀분석에 대하여 사용되는 데이터가 치우침이 있는 경우에는 종속변수와 설명변수의 선형 관계를

왜곡 시킬 수 있다. 이 이유로는 설명변수가 하나인 단순회귀에서는 종속변수와 설명변수의 선형변환을 적용하면 된다

고 한다. 하지만 이 논문에서는 다중회귀에 대하여 분석하고 있으므로 선형변환이 종속변수 변환을 요구하는 경우와,

종속변수와 다른 설명변수와의 관계에 대하여 영향을 미치기 때문에 정규성 검정을 해야 한다. 따라서 정규성 변환에

는 로그변환, 제곱변환, 제곱근 변환 등 여러 가지 방법으로 확률 변수에 변환을 취하면 정규분포를 따르기 때문에 데

이터를 분석할 수 있다. 만약에 사용되는 데이터가 정규성 검정을 하였을 때 우로 치우친 경우는 로그 변환, 또는 제곱

근 변환을 해야 하고, 다른 경우인 사용되는 데이터가 좌로 치우친 경우에는 제곱 변환을 해야 정규분포로 변환이 된다.

이 논문에서 사용되는 데이터들 중 변수들 중에서 몇 가지가 우로 치우쳐 있는 모양으로, 로그 변환을 하여 정규 변환

을 완성했다. 이 과정으로 분석 전 검정을 하였다.

아래에 변수들의 정규성 검정 및 정규변환에 대한 표가 그려져 있는데, 이 표에 대한 설명으로는 인구 천명당 의료

기관 종사 의사 수 변수인 X1은, 변환 전 유의확률이 거의 0.249로 작은 수 이며 정규성 검정을 했을 때 변환을 하지

않아도 된다고 생각하여 하지 않았다. 인구 십만 명 당 노인 여가 복지 시설 수인 변수 X는, 0.133로 작은 수이며, 위의

변수와 마찬가지로 정규성 검정을 했을 때 변환을 하지 않아도 되어 변환하지 않았다. 자동차 천대당 교통사고 발생 건

수인 X3은, 변환 전 유의확률이 0.238로 변환을 하지 않아도 된다. 재정 자립도인 X4도 마찬가지로 정규성 검정을 했

을 때 0.930으로 변환을 하지 않았다. 도시 별 실업률인 X5는, 0.607로 변환을 하지 않았고, 인구 천명당 도시공원면

적인 X6은 0.033으로 0.05보다 낮은 값으로 오른쪽으로 치우침이 있어 로그 변환을 하였다. 변환 후에는 0.547로

0.05보다 큰 값으로 만족으로 평가 되었다. 인구 천명당 초등학교 수 X7도 0.304로 변환을 하지 않았고, 인구 십만 명

당 문화기반 시설 수 X8도 정규성 검정을 해서 0.05보다 큰 값인 0.505로 변환을 하지 않았고, 나머지 변수들인 인구

천명당 이혼율 X9는, 0.078로 변환을 하지 않았고, 도시 별 도로포장률인 X10의 변수도 마찬가지로 0.195로 치우침

이 없어 변환을 하지 않았다.

Page 8: 국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_Spring/LM/본론2.1,2.2(2... · 2015-06-01 · 국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

-8-

<표 2> 변수들의 정규성 검정 및 정규변환

아래의 선형성 검정에서는 빨간선에 대하여 선의 모양을 따르는 것은 선형성을 따른다고 할 수 있는데, 아래의 표

중에서 모든 변수들이 대체로 선형성을 따르지만, 재정자립도 같은 경우는, 아래쪽으로 선이 치우쳐 있으므로 이상치

제거를 할 것이다. 또한 실업률도 마찬가지로, 아래쪽으로 선이 치우쳐 있으므로 이상치 제거를 해야 할 것이다. 또 다

른 변수들 중에서는, 도로 포장률이 가운데에 있는 변수가 이상치가 발견되어 있으므로 이상치 제거를 할 것이다.

(그림 1) 선형성 검정1

변수명 변환 전 유의확률 변환 후 유의확률 변환방법 변환 후 평가

EQ-5D Y 0.441

인구 천명 당 의료 기관 종사 의사 수 X1 0.249

인구 십만 명 당 노인 여가 복지시설 수 X2 0.133

자동차 천대당 교통사고 발생 건 수 X3 0.238

재정자립도 X4 0.930

도시 별 실업률 X5 0.607

인구 천명당 도시 공원 면적 X6 0.033 0.547 로그 변환 만족

인구 천명당 초등학교 수 X7 0.304

인구 십만 명 당 문화기반 시설 수 X8 0.505

인구 천명당 이혼율 X9 0.078

도시 별 도로포장률 X10 0.195

Page 9: 국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_Spring/LM/본론2.1,2.2(2... · 2015-06-01 · 국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

-9-

(그림 2) 선형성 검정2

(그림 3) 산점도 행렬(변환 후)

Page 10: 국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_Spring/LM/본론2.1,2.2(2... · 2015-06-01 · 국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

-10-

2.2상관분석

음과 양의 관계에서 연구구성도와 상관계수 부호 다른 것에 대한 이유를 설명하자면, 인구 천명당 의료 기관 봉사

의사 수(X1)의 데이터는 의료 보장성으로, 연구 구성도에서는 양의 효과를 낼 것이라고 생각했지만 프로그램을 돌려서

확인해 보니 음의 효과로 결과가 나왔다. 이것은 흔히 생각하기에 의사의 수가 많을수록 더욱 건강에 대한 삶의 질에

양의 관계가 있다고 연관을 지어 생각했지만, 실제로 데이터에 따라서 분석을 해 보면 의사 수가 많을수록 건강에 대하

여 많은 영향을 끼치지 않고 의사의 수가 많을수록 병이 무조건적으로 낫지 않고, 또한 주변에 병원을 가야 하는 사람

들이 많아 반대의 영향을 미칠 수 있다고 생각할 수 있기 때문에 결국 삶의 질에는 음의 효과로 나타나는 것을 알 수

있다.

또한 인구 십만 명 당 문화기반시설 수(X8)은 연구 구성도에서 문화시설 접근성이 양의 효과를 낼 것이라고 생각

했지만. 데이터를 돌려보니 음의 효과로 나타나는 것을 알 수 있다. 문화기반 시설 수는 영화관이나, 미술관 등 지역 안

의 주위에 있는 여러 가지의 주민들을 위한 편의시설을 기반으로 한 문화시설이라고 할 수 있다. 하지만 종속변수인 건

강에 대한 삶의 질에 대해서는 연관성이 없다고 결과가 나왔다. 이것은 우리가 건강에 대한 삶의 질에 대하여 사람들이

문화생활을 하며 생각하고 느끼는 것이 건강에 대해서는 양의 영향을 미치지 않는 것으로 보이므로. 건강에 대한 좋지

않은 효과가 나타난다고 해석 할 수 있다.

마지막으로, 도시 별 도로 포장률(X10)은 교통 용이성으로 종속변수인 건강에 대한 삶의 질에 대하여 양의 효과를

미칠 것이라고 생각했지만 데이터로 프로그램을 돌려보니 음의 효과로 나타나는 것으로 분석이 되었다. 이것은 교통

용이성, 즉 도로 포장률이 종속변수인 건강에 대한 삶의 질에 많은 영향을 미치지 않는 것으로 해석이 된다. 이것은 곧

도로 포장률이 높을수록 주민에 대한 삶의 질 지수가 올라가는 것이 아니고, 부호가 양으로 해석되는 것이 아니라 음의

효과가 나타나므로 건강에 대한 삶에 질에 대하여 영향을 미치지 않고 건강에 좋지 않는 효과가 나타나는 것으로 해석

을 할 수 있다.

<표 3> 부호 일치여부

변수명 연구 구성도 부호 상관계수 부호 일치여부

EQ-5D Y

인구 천명 당 의료 기관 종사 의사 수 X1 + - 불일치

인구 십만 명 당 노인 여가 복지시설 수 X2 + + 일치

자동차 천대당 교통사고 발생 건 수 X3 - - 일치

재정자립도 X4 + + 일치

도시 별 실업률 X5 - - 일치

인구 천명당 도시 공원 면적 X6 + + 일치

인구 천명당 초등학교 수 X7 + + 일치

인구 십만 명 당 문화기반 시설 수 X8 + - 불일치

인구 천명당 이혼율 X9 - - 일치

도시 별 도로포장률 X10 + - 불일치

Page 11: 국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_Spring/LM/본론2.1,2.2(2... · 2015-06-01 · 국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

-11-

설명변수들은 종속변수인 EQ-5D에 대하여 설명력이 있다고 말 할 수 있으며, *이 많을수록, 1%, 5%, 10%로 구

분을 하여 각 변수들은 종속변수에 더욱 유의한 영향을 미친다고 분석이 되고 있다. 즉 종속변수에 대한 설명력이 더욱

높아진다고 할 수 있다. 종속변수에 유의한 변수데이터는 인구 천명당 이혼율(X9)으로, *이 두 개인 5% 유의한 수치이

다. 나머지 변수들 중에서 유의수준 0.2에서 구분하면, 이것은 종속변수에 대하여 영향을 미치지 않는 것으로 해석되며

자동차 천대당 교통사고 발생 건 수(X3)는 0.582의 수치로 이것에 포함이 되고, 또 재정자립도(X4)는 0.331의 수치로

종속변수에 대하여 유의한 영향을 주지 않는다. 도시 별 실업률(X5)는 0.444의 수치이고, 인구 십만 명 당 문화기반 시

설 수(X8)의 변수는 0.941의 높은 값으로 이 변수들은 유의수준이 0.2가 넘는 수치로 종속변수에 유의한 영향을 주지

않는 것으로 해석할 수 있다.

유의확률이 높으면 높을수록 종속변수에 대하여 관련성이 없는 것이라고 분석할 수 있고, 예를 들면 자동차 천대

당 교통사고 발생 건 수는 건강에 대한 삶의 질에 대하여 관련이 없다고 분석된다. 교통사고 발생 건수 같은 경우는 교

통사고가 일어날수록 건강에 악영향을 미친다고 생각하여 종속변수에 영향을 미칠 것이라고 생각했지만, 데이터를 이

용해 프로그램을 돌려보니 종속변수에는 별다른 영향을 미치지 않는 것이라고 해석된다. 주민들에 대하여 직접적인 영

향이 없을 수도 있고, 실제 데이터와 주민들이 느끼는 체감도는 사람들마다 다르기 때문에 건강에 대한 삶에 대하여 관

련이 없을 수 밖에 없다고 생각된다. 재정자립도는, 도시에 대한 지방자치 단체의 전체 재원에 대한 자주재원의 비율을

말하는 것으로, 지방자치단체의 자율적 재정운영 능력을 말한다. 이 수치는 종속변수에 대하여 별다른 영향을 주지 않

는 것으로 분석된다. 지방자치단체의 자율적 재정능력에 대하여 주민들이 느끼는 것 즉 체감하는 것이 적거나, 자율적

재정 능력이 늘어나도 주민들의 건강에 관하여서는 별다른 영향을 미치지 않은 것으로 해석되어 유의한 영향을 미치지

않는 것으로 분석할 수 있다. 또 다른 변수인 도시 별 실업률은, 실업률의 수치가 올라갈수록 종속변수에 영향을 미치

지 않는 것으로 나타났다. 실업률이 높아지더라도 주민들이 느끼는 건강과 관련한 삶의 질이 관련이 없는 것으로 나타

났다. 그 이유는, 위와 같은 이유로 실업률이란 직장을 잃은 사람으로 심적으로 힘들 수는 있지만, 이 이유로 건강에 대

한 사람에 대하여 문제가 있을 수는 없다는 것이다. 즉 체감상 건강에 대하여 영향을 미치지 않는 것으로 분석할 수 있

다. 문화기반 시설 수는, 도시 자체의 문화기반 시설수가 많다고 하더라도 문화시설을 즐길 수 있는 사람은 한정되어

있고, 만약 가더라도 주민들에 따라서 만족도가 다를 수 밖에 없으므로 즉 만족도에 대하여 관련성이 없을 수도 있으므

로 건강에 대한 삶의 질에 대하여 연관이 없다고 생각 할 수 있다. 이 같은 이유로 종속변수인 건강에 대한 삶의 질에

대하여 영향이 없을 것으로 분석되고 있다.

<표 4> 상관계수 행렬

Y X1 X2 X3 X4 X5 X6 X7 X8 X9 X10

Y

-0.299 0.454 -0.116 0.203 -0.160 0.314 0.265 -0.015 -0.403 -0.300

X1

-0.093 0.371 -0.251 -0.094 0.208 0.159 -0.037 -0.322 0.022

X2

0.179 -0.432 -0.434 0.537 0.141 0.393 -0.090 -0.502

X3

-0.531 -0.076 0.281 -0.240 0.250 0.235 0.052

X4

** ***

0.385 -0.369 0.287 -0.494 -0.080 0.451

X5

**

-0.233 -0.241 -0.570 0.107 0.342

X6

***

-0.013 0.305 -0.280 -0.448

X7

0.068 -0.283 0.110

X8

** ***

0.147 -0.421

X9 **

0.187

X10

*

** * **

**

*:10%유의, **:5%유의, ***:1%유의

Page 12: 국민 삶의 질 지표에 관한 통계wolfpack.hnu.ac.kr/2015_Spring/LM/본론2.1,2.2(2... · 2015-06-01 · 국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

국민 삶의 질 지표에 관한 통계 분석 (박지연) 2015/6/1

-12-

설명변수들 중에서 서로 상관관계가 높은 변수는 다중공선성문제를 일으킬 것이다. 즉, 위의 표에서 *의 개수가 많

은 설명변수 군에서 서로 설명변수들끼리 겹치는 다중공선성의 문제가 일어난다고 볼 수 있기 때문에 분석을 할 때

주의해야 한다. 인구 천명당 이혼율(X9)를 기준으로 잡을 때, 변수들 사이에서 인구 천명당 의료기관 종사 의사 수(X1)

가 가장 상관계수가 높다고 설명할 수 있다. 이 다중공선성이 발생 이유는, 의사라는 직업만 보고 결혼을 하는 사람들

이 많기 때문에 생활을 하다 보면 서로 맞지 않아 부득이하게 이혼을 하게 될 경우가 생길 수도 있으므로 연관성이 제

일 높을 것이라고 분석되어 이런 이유로 인하여 변수들은 다중공선성에 대하여 문제가 일어날 경우, 즉 가능성이 높

기 때문에 분석을 해야 할 때 주의를 해야 한다.

2.3 변수선택

III. 결론