확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected...

26
확률분포와 기대값

Upload: others

Post on 16-Feb-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

확률분포와 기대값

Page 2: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

2

기대값 (expected value : 평균)

기대값은 확률분포에서 분포의 무게중심을 말하며, 확률 값을 가중치로 하는확률변수의 가능한 값에 대한 가중평균이라고 할 수 있다. 확률변수 X 의 기대값은 E(X)로 표현하며 각각 다음과 같이 구한다

이산형 확률변수 X 의 가능한 값이 (x1, x2, … , xn) 이며,

n

i

iiPxXE1

)(

niPxXPii

,,2,1,)( === …

일 때, X 의 기대값 E(X) 는 다음과 같음

1. 이산형 확률변수

Page 3: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

3

2. 연속형 확률변수

연속형 확률변수 X 의 확률밀도함수를 f (x) 라 하면 X 의 기대값 E(X) 는 다음과 같음

dxxfxXE )()(

Page 4: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

4

두 개의 주사위를 던지는 실험에서 확률변수 X를 ‘두 주사위 눈금의 합’이라고정의하면 표본공간은 다음과 같다

첫번째 / 두번째 1 2 3 4 5 6

1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

예1 이산형 확률변수의 기대값 계산

Page 5: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

5

X의 가능한 값은 2,3,4,5,6,7,8,9,10,11,12이며, 위 표본공간에서 X의 확률분포는다음과 같다.

X 2 3 4 5 6 7 8 9 10 11 12

확률 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

Page 6: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

6

위 확률분포표를 이용하여 확률변수 X의 기대값을 계산해 보면 다음과 같다

Page 7: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

7

기대값의 특성

X, Y 를 확률변수, a, b 를 상수라고 할 때, 기대값은 항상 다음 조건을 만족한다.

)()()(.3

)()(.2

)(.1

YbEXaEbYaXE

bXaEbaXE

aaE

+=+

+=+

=

자체이다.그상수기댓값은상수의즉,

상수 a와 b를 제외할 때 E(X+Y)=E(X)+E(Y)가 되는데, 이는 두 확률변수의 합의기대값은 각 확률변수의 기대값의 합과 같음을 의미한다.

Page 8: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

8

분산(variance)

평균이 확률분포의 무게중심인 데 비하여 분산은 확률분포의 흩어진 정도를 측정하는것으로 평균이 같은 경우에도 분산의 크기에 따라서 분포의 모양이 달라진다.

Page 9: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

9

확률변수 X 의 분산(variance)은 E(X) = µ 라고 할 때, X 와 µ 의 편차의

제곱, 즉 ( X – µ )2 의 기대값으로 Var (X) 또는 σ X2 으로 표현되며,

2222 )()( XExEx

2

으로 구한다. 여기에서 확률변수 X 를 나타낼 필요가 없는 경우에는

σ X2 에서 X 를 없애고 σ 2 으로 표현한다. 분산의 양의 제곱근을

표준편차(standard deviation)라고 하며 σ 로 표현한다. 즉,

이다.

X2

Page 10: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

10

이산형 확률변수 X의 확률분포가 다음과 같을 때 X의 평균과 분산을 구해보자.

X 0 1 2 3

확률 1/8 3/8 3/8 1/8

5.18/138/328/318/10)( XE

38/198/348/318/10)( 2 XE

75.0)5.1(3)( 2222 XE

예2 이산형 확률변수의 분산 계산

2

2

Page 11: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

11

2

2

확률변수의 X의 분산 는 다음과 같이 정의된다. X2

표준편차 는 분산의 제곱근이다.X분산의 특성

1. Var(a)=0

2. Var(aX)=a Var(X)

3. Var(X+a)=Var(X)

4. 만약 X와 Y가 독립이면 Var(X+Y)=Var(X)+Var(Y) / Var(X-Y)=Var(X)+Var(Y)

5. 만약 X와 Y가 독립이 아니면 Var(aX+bY)=a Var(X)+b Var(Y)+2abCov(X,Y)2

Page 12: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

12

참고 기대 및 분산연산자를 이용한 자료의 선형변환

(1) 상수(c)를 더할 때 W=X+c

평균

분산

(2) 상수 곱했을때 W=cX

평균

분산

(3) 상수 더하고 곱했을때 W=cX + d

평균

분산

Page 13: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

공분산 및 상관계수

Page 14: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

14

주로 두 변수 사이의 관계의 밀접도를 측정하는 상관계수를 구하는 과정에서계산되는 경우가 많다.

공분산의 부호가 양수이면 두 변수들이 서로 같은 방향으로 변하고, 음수이면 두 변수들이 서로 반대 방향으로 변한다.

공분산은 두 변수의 측정단위에 따라 달라진다.

공분산(covariance)

두 확률변수의 결합분포를 알고 있는 경우에 구할 수 있는 모수

Page 15: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

15

두 확률변수 X 와 Y 의 공분산(covariance)은 Cov (X, Y) 또는 σXY 로 표현하며

다음과 같이 계산한다.

yx

yxxy

XYE

YXE

×

)(

))([( ]

(예: 키(X)와 몸무게(Y)의 공분산)

-측정단위( X1 (m), Y(kg)): Cov (X1, Y) =𝜎𝑥1,𝑦 = E[ 𝑋1 − 𝜇𝑥1 𝑌 − 𝜇𝑦 ]

-측정단위( X2 (cm), Y(kg)): Cov (X2, Y) =𝜎𝑥2,𝑦 = E 𝑋2 − 𝜇𝑥2 𝑌 − 𝜇𝑦

= E 100𝑋1 − 100𝜇𝑥1 𝑌 − 𝜇𝑦

= 100𝜎𝑥1,𝑦

Page 16: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

16

상관관계수의 부호가 양수이면 두 변수들이 서로 같은 방향으로 변하고, 음수이면 두 변수들이 서로 반대 방향으로 변한다.

상관계수는 두 변수의 측정단위에 영향을 받지 않는다.

상관계수(correlation coefficient)

두 변수 사이의 관계의 밀접도를 측정하는 통계량

Page 17: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

17

두 확률변수 X 와 Y 에 대하여 σ X2 , σY

2 을 각각의 분산이라 하고,

σXY 를 X 와 Y 의 공분산이라고 할 때, X 와 Y 의 상관계수는 ρ 로 표현한다.

YX

xy

YX

xy

22

Page 18: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

18

① 완전 선형인 경우

왼쪽 그림과 같이 (a), (b)와 같이( X , Y ) 의 관계가 완전선형Y=a+bX (b ≠0) 인 경우에는상관계수가 r=1(b>0)또는 r=-1(b<0)으로 나타난다.

Page 19: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

19

② 어느 정도 상관관계가 있는 경우

산포도의 분포 폭이 중심축으로부터 커질수록 ㅣrㅣ 값의 크기는

0에 가까워진다.

그림 (c) 와 (d) 를 비교할 때ㅣrㅣ=0.5인 경우가 ㅣrㅣ=0.7인 경우보다분포의 폭이 더 큰 것을 알 수 있다.

Page 20: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

20

③ 상관관계가 없는 경우

r=0인 경우는 두 변수 사이에 선형관계가 없음을 의미한다.

그림 (e), (f)와 같이 산포도가 하나의특정한 중심축을 그릴 수 없는 경우와관계식 Y=a+bX에서 b=0인 경우가여기에 해당된다.

Page 21: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

21

예 이산형 확률변수의 공분산 및 상관계수 계산

예 : 포트폴리오의 구성포트폴리오를 구성하고 있는 두 증권 X와 Y의 수익률에 대한 분포가다음의 표와 같고 투자금액을 X증권에 60%, Y증권에 40%투자할 때포트폴리오의 기대수익률과 분산 그리고 X,Y의 공분산 및 상관계수를 구하라.

-1 6 2 20 f(x)

5 0.1 0 0 0 0.1

7 0 0.4 0 0 0.4

-4 0 0 0.3 0 0.3

15 0 0 0 0.2 0.2

f(y) 0.1 0.4 0.3 0.2 1.0

x Y

Page 22: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

22

Page 23: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

23

두 확률변수 X와 Y가 서로 독립이면 cov(X,Y)=0이지만 cov(X,Y)=0이라고 해서반드시 X와 Y가 서로 독립인 것은 아니다.

즉, cov(X,Y)=0은 독립이기 위한 필요조건이지 충분조건은 아니다.

독립

cov=0

독립

Page 24: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

24

예 다음의 결합확률분포를 이용해 위의 내용을 보여라.

Y/X -1 0 1 Y의 주변확률

-1 1/6 1/3 1/6 2/3

0 0 0 0 0

1 1/6 0 1/6 1/3

X의 주변확률 1/3 1/3 1/3 1.0

Page 25: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

25

따라서, Cov(X,Y)=0이지만 X,Y는 서로 독립이 아니다.

Page 26: 확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected value : 평균) 기대값은확률분포에서분포의무게중심을말하며,

26

독립성

만약에 X와 Y가 서로 독립이면 다음의 관계가 성립한다.