ch6 correlation analysiselearning.kocw.net/contents4/document/lec/2012/konkuk_g... ·...

30
Rehabilitation Lab Ch6 Correlation analysis

Upload: ngodien

Post on 05-Jul-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Rehabilitation Lab

Ch6 Correlation analysis

Rehabilitation Lab

1. 상관관계 분석이란?

Ø Ch. 3(t-test)과 Ch. 4(One way ANOVA) : 집단간의 평균을 비교

Ø Ch. 5(χ2-test) : 범주형 자료의 분석

ØCh. 6(Correlation analysis) : 2개의 변수간의 밀접한 정도, 즉 상관관계를 분석하는 통계적 분석 방법

Ø Ch. 3(t-test)과 Ch. 4(One way ANOVA) : 집단간의 평균을 비교

Ø Ch. 5(χ2-test) : 범주형 자료의 분석

ØCh. 6(Correlation analysis) : 2개의 변수간의 밀접한 정도, 즉 상관관계를 분석하는 통계적 분석 방법

Rehabilitation Lab

1. 상관관계 분석이란?

Ø Correlation의 의미

- 한 변수가 증가 또는 감소할 때 다른 한 변수는 증가하는지, 또는 감소하는지경향을 나타냄

- 증가, 또는 감소의 경향을 나타내는 두 변수의 관계는 선형관계를 이룸

- 선형관계를 이루는 경향을 객관적으로 수치화한 것 : correlation coefficient

- Correlation coefficient의 절대값이 1에 근접 할 수록 두 변수 간에 상관성이 큼

Ø Correlation의 의미

- 한 변수가 증가 또는 감소할 때 다른 한 변수는 증가하는지, 또는 감소하는지경향을 나타냄

- 증가, 또는 감소의 경향을 나타내는 두 변수의 관계는 선형관계를 이룸

- 선형관계를 이루는 경향을 객관적으로 수치화한 것 : correlation coefficient

- Correlation coefficient의 절대값이 1에 근접 할 수록 두 변수 간에 상관성이 큼

Rehabilitation Lab

1. 상관관계 분석이란?

Ø 자료 형태에 따른 분석 방법 선택

※ 참고 : multiple correlation, canonical correlation 등

두 변수의 자료의 형태 분석 방법

Ø 자료 형태에 따른 분석 방법 선택

※ 참고 : multiple correlation, canonical correlation 등

양적 + 양적 Pearson's correlation

양적 + 순위 or 순위 + 순위 Spearman's correlation

Rehabilitation Lab

1. 상관관계 분석이란?

Ø 자료 형태에 따른 분석 방법 선택

Pearson’s correlation : ①, ②, ③, ⑤

spearman’s correlation : ④, ⑥

자 료 적합한 상관분석 방법

아버지의 혈압과 아들의 혈압의 관계 ①

입원기간과 수술시간의 관계 ②

Ø 자료 형태에 따른 분석 방법 선택

Pearson’s correlation : ①, ②, ③, ⑤

spearman’s correlation : ④, ⑥

혈압과 연령의 관계 ③

경제적 수입과 삶의 질의 정도와의 관계 ④

체중과 WHR과의 관계 ⑤

통증(5점 scale)과 암의 stage(5점 scale)와의 관계 ⑥

Rehabilitation Lab

2. 상관관계분석의 절차 및 상관계수

Ø Correlation analysis의 절차

- 자료의 속성 파악[p. 55]

- Scatter plot을 그려서 경향성 파악(선형관계임을 파악)[p. 112~113]

- 적합한 상관관계 분석방법 채택(Pearson , Spearman…)

• Correlation coefficient 계산

- 상관계수에 대한 가설검정과정(상관계수의 통계적 유의성 파악)

Ø Correlation analysis의 절차

- 자료의 속성 파악[p. 55]

- Scatter plot을 그려서 경향성 파악(선형관계임을 파악)[p. 112~113]

- 적합한 상관관계 분석방법 채택(Pearson , Spearman…)

• Correlation coefficient 계산

- 상관계수에 대한 가설검정과정(상관계수의 통계적 유의성 파악)

Rehabilitation Lab

2. 상관관계분석의 절차 및 상관계수

Ø Scatter plot

- 2가지 변수의 관계를 도시적으로 보여줌

Ø Scatter plot

- 2가지 변수의 관계를 도시적으로 보여줌

Rehabilitation Lab

2. 상관관계분석의 절차 및 상관계수

Ø Scatter plot

- Scatter plot을 통해 파악할 수 있는 사항

① Scatter plot은 관찰자의 주관이 개입된다는 단점이 있지만 직관적으로상관을 알아볼 수 있음

② 얼마나 큰 연관성이 있는지를 보여줌

Ø Scatter plot

- Scatter plot을 통해 파악할 수 있는 사항

① Scatter plot은 관찰자의 주관이 개입된다는 단점이 있지만 직관적으로상관을 알아볼 수 있음

② 얼마나 큰 연관성이 있는지를 보여줌

Rehabilitation Lab

2. 상관관계분석의 절차 및 상관계수

Ø Correlation coefficient

- Population correlation coefficient

- Sample correlation coefficient

Ø Correlation coefficient

- Population correlation coefficient

- Sample correlation coefficient

Rehabilitation Lab

2. 상관관계분석의 절차 및 상관계수

Ø Population Correlation coefficient (Pearson’s correlation)

- 두 개의 변수가 pair로 있어야 함

- 표기 : ρ (rho)

- 정의 : 모집단의 두 변수 사이에 존재하는 선형관계의 객관적인 측도

- 특징

① -1~1사의 값② 양의 선형관계 è 1, 음의 선형관계 è -1, 상관관계 약함 è 0

Ø Population Correlation coefficient (Pearson’s correlation)

- 두 개의 변수가 pair로 있어야 함

- 표기 : ρ (rho)

- 정의 : 모집단의 두 변수 사이에 존재하는 선형관계의 객관적인 측도

- 특징

① -1~1사의 값② 양의 선형관계 è 1, 음의 선형관계 è -1, 상관관계 약함 è 0

Rehabilitation Lab

2. 상관관계분석의 절차 및 상관계수

Ø Sample Correlation coefficient (Pearson’s correlation)

- 두 개의 변수가 pair로 있어야 함

- 표기 : r xy

- 정의 : 모집단으로부터 추출한 크기 n인 표본의 자료를 (x1, y1),…,(xn, yn)라고할 때 다음과 같이 정의

- 특징

① -1~1사의 값② 양의 선형관계 è 1, 음의 선형관계 è -1, 상관관계 약함 è 0

Ø Sample Correlation coefficient (Pearson’s correlation)

- 두 개의 변수가 pair로 있어야 함

- 표기 : r xy

- 정의 : 모집단으로부터 추출한 크기 n인 표본의 자료를 (x1, y1),…,(xn, yn)라고할 때 다음과 같이 정의

- 특징

① -1~1사의 값② 양의 선형관계 è 1, 음의 선형관계 è -1, 상관관계 약함 è 0

Rehabilitation Lab

2. 상관관계분석의 절차 및 상관계수

Ø Correlation coefficient에 대한 가설검정 (Pearson’s correlation)

- 가설설정

Null hypothesis : 두 변수간에 상관이 없다( ρ = 0 )

Alternative hypothesis : 두 변수간에 상관이 있다( ρ ≠ 0)

- 검정통계량의 설정 및 계산

- 유의수준설정 : α= 0.05 (계산된 t값으로 자유도가 n-2인 t-분포에서 p-value 계산)

- 결론 : p-value가 유의수준보다 작으면 null hypothesis를 기각

Ø Correlation coefficient에 대한 가설검정 (Pearson’s correlation)

- 가설설정

Null hypothesis : 두 변수간에 상관이 없다( ρ = 0 )

Alternative hypothesis : 두 변수간에 상관이 있다( ρ ≠ 0)

- 검정통계량의 설정 및 계산

- 유의수준설정 : α= 0.05 (계산된 t값으로 자유도가 n-2인 t-분포에서 p-value 계산)

- 결론 : p-value가 유의수준보다 작으면 null hypothesis를 기각

Rehabilitation Lab

2. 상관관계분석의 절차 및 상관계수

Ø Spearman’s rank correlation coefficient

- 자료의 속성이 순위변수인 경우 가장 대표적으로 사용

- 표기 :

- 모집단에서 추출한 크기 n인 표본의 자료를 (x1, y1),…(xn, yn)라고 하면 는다음과 같은 과정을 거쳐 계산 됨

① 자료 x1, x2, … , xn에 순위를 매긴다.

② 자료 y1, y2, … , yn에 순위를 매긴다.

③ xi의 순위와 yi의 순위 차 di를 구한다.

④ di의 제곱의 합 을 구한다.

⑤ 다음 수식에 의해 를 계산한다.

Ø Spearman’s rank correlation coefficient

- 자료의 속성이 순위변수인 경우 가장 대표적으로 사용

- 표기 :

- 모집단에서 추출한 크기 n인 표본의 자료를 (x1, y1),…(xn, yn)라고 하면 는다음과 같은 과정을 거쳐 계산 됨

① 자료 x1, x2, … , xn에 순위를 매긴다.

② 자료 y1, y2, … , yn에 순위를 매긴다.

③ xi의 순위와 yi의 순위 차 di를 구한다.

④ di의 제곱의 합 을 구한다.

⑤ 다음 수식에 의해 를 계산한다.

Rehabilitation Lab

SPSS 실습

1. Scatter plot

2. Correlation analysis

Rehabilitation Lab

1. Scatter plot

Rehabilitation Lab

1. Scatter plot

Rehabilitation Lab

1. Scatter plot

Rehabilitation Lab

1. Scatter plot

Rehabilitation Lab

1. Scatter plot

자료 속성이 다름!!

Rehabilitation Lab

1. Scatter plot

Rehabilitation Lab

1. Scatter plot

Rehabilitation Lab

1. Scatter plot

Rehabilitation Lab

1. Scatter plot

Rehabilitation Lab

1. Scatter plot

Rehabilitation Lab

1. Scatter plot

Rehabilitation Lab

2. Correlation analysis

Rehabilitation Lab

2. Correlation analysis

Rehabilitation Lab

2. Correlation analysis

자료 속성이 다름!!

Rehabilitation Lab

2. Correlation analysis

Rehabilitation Lab

2. Correlation analysis

Pearson’s correlation

Spearman’s correlation