기술 통계학 ( descriptive statistics )

51
서서서서서 서서서서서 2 Descriptive Statis 2 Descriptive Statis tics tics 1 서서 서서서 서서 서서서 ( ( Descriptive Statistics Descriptive Statistics ) ) 수수수 수수수 수수수수 수수수수 수수수수 수수수 수수수 수수수

Upload: hiram-williams

Post on 03-Jan-2016

67 views

Category:

Documents


2 download

DESCRIPTION

기술 통계학 ( Descriptive Statistics ). 수집된 자료를 명료하고 유용하게 정리하는 문제를 다루는 통계학. 이슈 이를 입증하기 위해 자료를 수집하여 분석. 예 : 서강대학교 군 제대 학생 vs . 군 입대 전 남학생의 성적 비교. 군 제대 학생 의 성적 군 입대 전 남학생 성적. 성적 자료 수집. 자료의 형태. 양적 자료 vs. 질적 자료. 양적 자료 : 어떤 것을 세거나 측정하거나 혹은 수학적 계산에 의해 얻어진 자료 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 11

기술 통계학기술 통계학((Descriptive StatisticsDescriptive Statistics))

수집된 자료를 명료하고 유용하게 정리하는 문제를 다루는 통계학

Page 2: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 22

이슈 이를 입증하기 위해 자료를 수집하여 분석

예 : 서강대학교 군 제대 학생 vs. 군 입대 전 남학생의 성적 비교

군 제대 학생 의 성적

군 입대 전 남학생 성적성적 자료 수집

Page 3: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

자료의 형태자료의 형태

2 Descriptive Statistics2 Descriptive Statistics 33

양적 자료 vs. 질적 자료

양적 자료 : 어떤 것을 세거나 측정하거나 혹은 수학적 계산에 의해 얻어진 자료

예 : 3 월 중 자동차 사고 발생 건수 ( 예 X = 5,421 건 )

질적 자료 : 숫자 대신에 단어로 설명된다 .

예 : 자동차 스타일 (Y = 대형 , 중형 , 소형 , 경차 )

질적 자료도 숫자를 부여하여 나타낸다 (coding 이라 함 )

예 : 대형 = 1, 중형 = 2, 소형 = 3, 경차 = 4

Page 4: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 44

질적 자료와 양적 자료의 예

(1) 통계학 수강생들의 부모의 학력 자료 ? (2) 통계학 수강생들의 정치성향에 대한 자료 ? (3) 통계학 수강생들의 키 자료 ? (4) 통계학 수강생들의 전공 자료 ? (5) 통계학 수강생들의 성적 누계 자료 ? (6) 통계학 수강생들의 성별 자료 ?

Page 5: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 55

횡단면 (cross sectional ) 자료 vs. 시계열 (time series) 자료

횡단면 자료 (cross sectional data) : 동일 시점의 자료

예 : ’09 년도 가구별 소득과 소비지출 자료

시계열 자료 (time series data): 다른 시점에서 측정된 자료

예 : ’60 년부터 ’ 09 년까지 가구별 소득과 소비지출 자료

Page 6: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 66

횡단면 자료와 시계열 자료의 예

(1) ‘12 년 3 월 10 일 각 기업의 주식 종가 ? (2) 서강대학교 7,000 명 학생의 ’ 08 년 2 학기 성적 자료 ? (3) ’12 년도 S 은행 지점별 예금실적 ? (4) S 은행 신촌지점의 연도별 예금실적 ? (5) 길동이의 1 학년 1 학기부터 최근까지의 성적 자료 ? (6) ’90 년 1 월 3 일부터 ’ 12 년 3 월 10 일까지 종합주가지수 자료 ? (7) 각 도별 연말 기준 실업률 자료 ?

Page 7: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 77

이산 (discrete ) 자료 vs. 연속 (continous) 자료

측정 단위가 불연속적인 경우 , 그 변수를 이산 변수(discrete variable), 연속적인 경우 연속변수 (continuous variable) 라고 부른다 .

- 가족 수 , 결혼 여부 등 : 이산변수 - 키 , 몸무게 등 : 연속변수

Page 8: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 88

명목 (nominal ) 자료 vs. 실질 (real) 자료

명목자료 : 물가상승을 고려하지 않은 가격과 소득 자료

예 : ’60 년부터 최근까지의 임금 자료

실질자료 : 물가상승을 고려한 가격과 소득 자료

예 : ’60 년부터 최근까지의 실질임금 자료

명목자료실질자료 = X 100

물가 지표

Page 9: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 99

소비자 물가지수 가구당 소득 ( 월 )

지수 비율 소득 비율

1965 3.50931.26 배

7,320467.81 배2008 109.7 3,490,259

소비자 물가지수 : 2000 년 = 100 기준

2000 년 가치로 환산한 실질 소득 :

’65 년 실질 소득 (x) : 3.509 : 7,320 = 100 : x x = (7,320/3.509)X100 = 208,606 원 ’08 년 실질 소득 = (3,490,259/109.7)X100 = 3,181,640 원

Page 10: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 1010

자료의 수집자료의 수집

쉽게 구할 수 있는 자료쉽게 구할 수 있는 자료 http://kosis.kr http://kosis.kr ( 통계청 website)

- - 거의 대부분의 거시경제 자료포함거의 대부분의 거시경제 자료포함

조사조사 ((surveysurvey)) 를 통하여 구해야 하는 자료를 통하여 구해야 하는 자료

예를 들어예를 들어 , , 대통령 선거 조사대통령 선거 조사 , , 어느 특정 제품에 대한 선호도 어느 특정 제품에 대한 선호도 등등

Page 11: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 1111

조사를 통한 자료수집조사를 통한 자료수집

모집단을 가장 잘 대변할 수 있도록 표본을 수집모집단을 가장 잘 대변할 수 있도록 표본을 수집

최종보고서에 들어가야 하는 내용최종보고서에 들어가야 하는 내용 모집단 규명모집단 규명 , ,

표본추출방법표본추출방법 , ,

표본 수표본 수 , ,

조사방법조사방법 , ,

설문지설문지 (( 보통 부록보통 부록 ) ) 등 등

Page 12: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 1212

1.모집단 예를 들어 , 서강대학교 학생 혹은 경제학과 학생 혹은 경제 통계학을 수강하는 학생 등

2. 표본 추출법

단순무작위 추출법 단순무작위 추출법 ((simple random samplingsimple random sampling) ) 층화 표본 추출법 층화 표본 추출법 ((stratified samplingstratified sampling)) 군집 표본 추출법 군집 표본 추출법 ((clustered samplingclustered sampling)) 등등

앞으로 표본 추출은 단순무작위 추출법에 의해 추출

; 모든 사건이 표본으로 뽑힐 확률이 같고 , 서로 독립이다 .

Page 13: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 1313

3. 표본의 크기 ( 수 )

표본의 크기를 크게 하면 => 신뢰성이 높아지나 비용이 많이 소요

4. 조사 방법

전화조사 , 우편조사 , 면접조사 , 인터넷 조사 등

조사하고자 하는 내용에 따라 선택된다 예를 들어 , 여론 조사는 대부분 전화조사 ( 짧은 기간 실시 )

주의 : 조사방법에 따라 표본이 모집단을 잘 대변할 수 없을 수도 있다 .

Page 14: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 1414

5. 설문지 작성시 특히 주의할 점

- 설문지에 조사의 목적 , 조사기관 , 자료의 이용제한을 명시

- 쉽고 명확한 단어를 이용 - 다항문항인 경우 전체 집합이 되어야 하고 , 중복이 되어서는 안됨

- 유도하는 질문이 되어서는 안됨

- 개인적인 프라이버시를 질문할 경우 가능한 설문지 마지막에 삽입

Page 15: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 1515

자료의 입력자료의 입력

자료를 수집한 다음에는 수집한 자료를 입력자료를 수집한 다음에는 수집한 자료를 입력

대부분의 경우 대부분의 경우 EXCELEXCEL 프로그램프로그램을 이용하여 입력을 이용하여 입력

EXCEL 프로그램

자료 입력 후에는 자료를 정리자료 입력 후에는 자료를 정리 , , 요약하여 자료의 특성을 요약하여 자료의 특성을 보기 쉽게 표현한다보기 쉽게 표현한다 ..

그림그림 , , 표표 , , 평균평균 , , 분산 등분산 등

Page 16: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 1616

1. 1. 도수분포표와 누적도수표도수분포표와 누적도수표

자료의 구조를 이해하기 위해자료의 구조를 이해하기 위해 , , 관찰한 값들을 알기 관찰한 값들을 알기 쉽게 표로 정리한 것이다쉽게 표로 정리한 것이다 ..

최초에 얻은 정보의 일부는 분실되지만 관찰대상이 최초에 얻은 정보의 일부는 분실되지만 관찰대상이 전체적으로전체적으로

어떠한 양적 구조를 갖고 있는지 한 눈으로 볼 수 있다어떠한 양적 구조를 갖고 있는지 한 눈으로 볼 수 있다 ..

Page 17: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 1717

계급계급 1-1-

55

6-6-

1010

11- 11-

1515

16-16-

2020

21-21-

2525

26-26-

3030

31- 31-

3535

36-36-

4040

41-41-

4545

빈도수빈도수 66 77 66 88 88 1010 77 1010 88

계급 : 각 구간계급의 수 : 계급의 숫자계급구간 ( 계급간격 ) : 계급의 폭계급 값 : 계급의 중앙값계급도수 : 각 계급에 속하는 관찰단위의 수

lotto 당첨숫자 ( 총 70 개 )

1. 도수분포표

Page 18: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 1818

계급간격과 계급개수계급간격과 계급개수

보통 계급의 개수는 보통 계급의 개수는 66 개에서 개에서 2020 사이사이가 적당가 적당 ..

제일 큰 값제일 큰 값 ((MM)) 과 제일 작은 값과 제일 작은 값 ((mm)) 을 결정한 후을 결정한 후 , , 그 그 차이인 차이인 범위범위 ((rangerange)) 를 먼저 구한다를 먼저 구한다 ..

범위를 범위를 n n 으로으로 나누어 나누어 계급간격을 결정한다계급간격을 결정한다 ..

앞의 예 : range = 45-1=44, 70 = 70 = 약 약 8 8

=> => 계급간격 계급간격 = 44/8= 44/8 = 약 5 => 계급개수 = 9 개

계급간격 계급간격 = = rangerange//n n

Page 19: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 1919

2. 누적도수표

도수분포표도수분포표 누적도수표누적도수표

계급구간계급구간 빈도수빈도수 계급구간계급구간 빈도수빈도수

1- 51- 5

6-106-10

11-1511-15

16-2016-20

21-2521-25

26-3026-30

31-3531-35

36-4036-40

41-4541-45

66

77

66

88

88

1010

77

1010

88

5 5 이하이하10 10 이하이하15 15 이하이하20 20 이하이하25 25 이하이하30 30 이하이하35 35 이하이하40 40 이하이하45 45 이하이하

66

1313

1919

2727

3535

4545

5252

6262

7070

Page 20: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 2020

2. 2. 기술 통계량기술 통계량

많은 경우 주어진 자료의 특성을 하나의 숫자로 많은 경우 주어진 자료의 특성을 하나의 숫자로 표시하여 그 구조를 파악한다표시하여 그 구조를 파악한다 ..

중심중심 ((centercenter) ) 혹은 대표값을 표시하기 위해 혹은 대표값을 표시하기 위해 산술평균산술평균 , , 기하평균기하평균 , , 중앙값중앙값 ((medianmedian), ), 최빈값최빈값((modemode) ) 등을 사용한다등을 사용한다 ..

퍼짐정도퍼짐정도 ((dispersiondispersion)) 를 파악하기 위하여 를 파악하기 위하여 범위범위((rangerange), ), 분산분산 ((variancevariance), ), 표준편차표준편차 ((standard standard deviationdeviation) ) 등을 이용한다등을 이용한다 ..

Page 21: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 2121

대표값 대표값 : : 평균평균 ((meanmean))

도수분포표를 이용하는 경우도수분포표를 이용하는 경우

이 경우 평균은이 경우 평균은

키 155-159

160-164

165-169

170-174

175-179

180-185

인원 3 8 9 14 11 10

Page 22: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 22

nXX

X n1

n

Yf

ffYfYf

X

h

1ihi

h1

hh11

혹은

여기서 Y 는 계급값

; 원 자료

; 도수분포표

Page 23: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 2323

히스토그램은 평균을 중심으로 균형이 잡혀있다히스토그램은 평균을 중심으로 균형이 잡혀있다 ..

평균

평균의 의미

Page 24: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 24

1n

2n 2X

1X

21

2211nn

XnXn X

예 : 남자의 평균 점수 = 72 점 (200 명 ) 여자의 평균 점수 = 84 점 (100 명 )

남녀 모두의 평균점수 =

76300

800,22

300

1008420072

Page 25: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 25

표본평균 :n

XX

n

1ii

모평균 : N

XN

1ii

X

모집단N

표본n

Page 26: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

대표값 : 기하평균 ( geometric mean)

2 Descriptive Statistics 26

1/nn1 XXG

n

lnXGln i

혹은

- 거치식 펀드의 첫 해 수익률이 200%, 둘째 해 수익률이 800% 인 경우 연 평균 투자 수익률은 ?

억억 2781211 =++× ))((

?))(( 억억 3651511 =++×

Page 27: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 27

기하평균 : ‘율’로 나타낸 변수의 대표값으로 주로 이용

최초의 값과 마지막 값을 각각 ,0X

nX

)r(1)r)(1r(1XX n210n

각 ir 값들을 대표할 수 있는 r값을 찾고자 하는 것임

n0n r)(1XX

)r(1)r)(1r(1r)(1 n21n

; (n+1) 개 자료

)r(1 1 )r(1 2 )r(1 n, . . . , 들의 기하평균을 구하는 것임

1)/X(Xr 1/n0n

Page 28: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

대표값 : 메디안 ( 중앙값 )

2 Descriptive Statistics 28

변수의 크기 순으로 놓았을 때 두 집단으로 이등분하는 중앙값

n 이 홀수 : (n+1)/2번째의 수

n 이 짝수 : n/2번째와 n/2+1번째의 산술평균

Page 29: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

대표값 : mode( 최빈값 )

2 Descriptive Statistics 29

변수 중에 가장 많이 나타나는 값

1, 1, 2, 2, 2, 3, 3, 5, 7, 8 Mode = 2

Page 30: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 3030

퍼짐 퍼짐 dispersiondispersion

대표값은 관찰값의 대표값은 관찰값의 ““퍼진퍼진 ((disperseddispersed))”” 정도에 대한 정도에 대한 정보를 가지고 있지 않다정보를 가지고 있지 않다 ..

xx 빈도수빈도수 yy 빈도수빈도수

-1-1 11 -1,000,000-1,000,000 11

11 11 1,000,0001,000,000 11

평균 = 0 으로 같지만 같은 성질의 자료라고 할 수 없다

Page 31: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 31

분산도 : 제곱평균• 제곱평균은 각각의 표본을 제곱하여 평균한 값으로

이차적률 (second moment) 이라고도 부르며 , 표본의 퍼진 정도를 측정하는 기본적인 통계량 중의 하나이다 .

2iX

n1

Xs.m.

하지만 수준만이 변하였지만제곱평균 값이 서로 다르다 .

X

이를 보완하기위해 ‘편차’이용

Page 32: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

중앙에서 퍼짐 정도

( ) 0XXn

1i =∑ -

2 Descriptive Statistics 32

XXn1

i

편차 (deivation) = XX i

Note : 편차의 합은 항상 영의 값을 갖는다 .

• 절대편차의 평균 (absolute deviation)

Page 33: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 33

분산도 : 분산 variance

• 분산 (variance)

2N

1ii

2X )(X

N1

Var[X]

X ; 모분산

1n

)X(XS

n

1i

2i

2X

; 표본분산

Page 34: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 34

2i

n

1i

)XX(

22

i

2

i XnXXX

Page 35: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 35

• 분산의 단위는 단위의 제곱이 되어 해석에 문제가 생긴다 . 제곱근을 취하여 단위를 조정하여 준다 .

2XX SS

표준편차 (standard deviation)

2XX 혹은

표준편차도 측정되는 단위의 영향을 받는다 .

이를 극복하기 위해 변동계수 (coefficient of variation, CV )

XS

cv XX

X

XXCV

Page 36: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 3636

기타 분포에 대한 정보기타 분포에 대한 정보

집중 정도와 퍼짐 정도 이외에도 집중 정도와 퍼짐 정도 이외에도 대칭 정도를 측정하기 위해 대칭 정도를 측정하기 위해 왜도왜도 ((skewnessskewness),),

평균값을 중심으로 표본이 얼마나 집중되어 평균값을 중심으로 표본이 얼마나 집중되어 있는지를 보여주는 있는지를 보여주는 첨도첨도 ((kurtosiskurtosis))

등이 자주 사용된다등이 자주 사용된다 ..

Page 37: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 3737

두 개의 자료두 개의 자료

하나의 자료만을 다룰 경우하나의 자료만을 다룰 경우 , , 평균과 표준편차는 평균과 표준편차는 해당 자료의 기본적인 성질을 잘 설명해 준다해당 자료의 기본적인 성질을 잘 설명해 준다 ..

22 개 이상의 자료를 비교할 경우개 이상의 자료를 비교할 경우 , , 자료간의 자료간의 상관관계까지도 염두에 두어야 한다상관관계까지도 염두에 두어야 한다 ..

다음 슬라이드는 키와 몸무게의 관계를 표시한 다음 슬라이드는 키와 몸무게의 관계를 표시한 그래프그래프 ((scatter diagramscatter diagram)) 이다이다 ..

Page 38: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 3838

40

50

60

70

80

90

100

150 160 170 180 190

몸무

키와 몸무게

Page 39: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 3939

추세선추세선

Page 40: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 4040

공분산공분산 ((CovarianceCovariance))

이러한 자료간의 상관관계를 측정하기 위하여 이러한 자료간의 상관관계를 측정하기 위하여 공분산을 이용한다공분산을 이용한다 ..

공분산은공분산은 , , 중앙을 기준으로중앙을 기준으로 , , 한 변수의 크기가 한 변수의 크기가 증가증가 (( 감소감소 )) 함에 따라 다른 변수의 크기가 함에 따라 다른 변수의 크기가 증가하는 경향이 있는지 감소하는 경향이 있는지를 증가하는 경향이 있는지 감소하는 경향이 있는지를 보여준다보여준다 ..

Page 41: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 4141

X

Y

X

Y

III

III IV

I, III

II, IV

관계

Y 의 편차

X 의 편차

Page 42: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 42

점들이 주로 I, III 사분면 : 0)Y)(YX(X ii

점들이 주로 II, IV 사분면 : 0)Y)(YX(X ii

공분산 (covariance)

N

YXYXCov

N

iYiXi

XY

1

))((],[

; 모집단의 공분산

1

))((1

n

YYXXS

n

iii

XY; 표본의 공분산

Page 43: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 43

공분산 > 0 두 변수가 양의 관계

공분산 < 0 두 변수가 음의 관계

주의 : 공분산 =0 은 두 변수간에 아무런 관계가 없다는 것이 아니라 양의 관계나 음의 관계가 없는 것을 의미

X

Y

공분산 = 0

Page 44: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 44

=)Y)(YX(X ii --∑

YXiYX NYX))(Y(X iii

마찬가지로

Page 45: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 45

N

NYX XiiXY

Y

1n

YXnYXS ii

XY

모집단 공분산

표본 공분산

Page 46: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 4646

공분산의 단위

키를 키를 mmmm 단위로 측정할 경우단위로 측정할 경우 , , 공분산의 값은 공분산의 값은 1010 배로 늘어나게 된다배로 늘어나게 된다 ..

이러한 이유로 공분산은 두 변수의 관계에 대한 이러한 이유로 공분산은 두 변수의 관계에 대한 경향성만을 보여준다경향성만을 보여준다 ..

Page 47: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 4747

상관계수 상관계수 correlation coefficientcorrelation coefficient

공분산의 부호는 두 변수가 어떤 관계에 있는지를 공분산의 부호는 두 변수가 어떤 관계에 있는지를 보여준다보여준다 ..

상관관계의 정도를 알기 위해서는 단위를 통일시켜 상관관계의 정도를 알기 위해서는 단위를 통일시켜 비교해야 한다비교해야 한다 . . 이를 위해 정규화된 변수들을 이를 위해 정규화된 변수들을 비교한다비교한다 ..

Page 48: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics 48

상관계수

YX

XYXY SS

Sr

상관계수는 항상 -1 과 1 사이의 값을 가지며 , 두 변수가 선형관계일 때만 -1 이나 1 이 된다 .

YX

XYXY

표본의 상관계수

모집단의 상관계수

Page 49: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 4949

양의 상관계수양의 상관계수

상관계수가 1 에 가까운 경우

상관계수가 0 에 가까운 경우

Page 50: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 5050

음의 상관계수음의 상관계수

상관계수가 -1 에 가까운 경우상관계수가 0 에 가까운 경우

Page 51: 기술 통계학 ( Descriptive   Statistics )

서강대학교 경제통계학

2 Descriptive Statistics2 Descriptive Statistics 5151

주의 : 상관계수는 직선의 관계를 나타내는 것이기 때문에 직선의 기울기와는 관계가 없다

X

Y

X

Y

상관계수 =1 0 < 상관계수 < 1