이 산 확 률 분 포

69
이 이 이 이 이 이 4 1 2 3 초초초초초 초초초초초초 초초초초 4 초초초초초 초초초초초 5 초초초초초 6 초초초초

Upload: jesse-levine

Post on 01-Jan-2016

95 views

Category:

Documents


0 download

DESCRIPTION

4. 이 산 확 률 분 포. 1. 이산균등분포. 2. 초기하분포. 3. 이항분포. 4. 기하분포와 음이항분포. 5. 포아송분포. 6. 다항분포. 1. 이산균등분포 ( discrete uniform distribution ). 이산균등분포의 확률질량함수와 평균 , 분산에 대하여 알아본다. f(x) = , x = 1, 2, …, n. 1. 1. 1. 1. 1. n. n. n. n. n. n+1. n(n+1). =. =. 2. 2. n. n. - PowerPoint PPT Presentation

TRANSCRIPT

이 산 확 률 분 포이 산 확 률 분 포44

11

22

33

초기하분포초기하분포이산균등분포이산균등분포

이항분포이항분포

44 기하분포와 음이항분포기하분포와 음이항분포

55 포아송분포포아송분포

66 다항분포다항분포

11 이산균등분포 (discrete uniform distribution)이산균등분포 (discrete uniform distribution)

이산균등분포의 확률질량함수와 평균 , 분산에 대하여 알아본다 .이산균등분포의 확률질량함수와 평균 , 분산에 대하여 알아본다 .

1) 확률질량함수1) 확률질량함수☞

f(x) = , x = 1, 2, …, n

1n

2) 평균 2) 평균 ☞

E(X2) = x2 f(x) = x2

x=1 x=1

nn

= 1n

=n(n+1)(2n+1)6

(n+1)(2n+1)6

1n

E(X) = x f(x) = x

x=1 x=1

nn

= 1n

n(n+1)2

=n+1

2

1n

X ~ DU(n)

3) 분산 3) 분산 ☞

=(n+1)(2n+1)6

n+12

2 = Var(X) = E(X2) – E(X)2

2- =n2 -112

X : 1 에서 45 까지의 번호를 적은 동일한 모양의 공이 들어 있는 주머니에서

임의로 하나를 꺼내어 나온 공의 번호

(1) X 의 확률질량함수

(2) X 의 평균과 분산

(3) 40 번 이상의 번호가 적힌 공이 나올 확률

그림출처 : www.lotto.co.kr

f(x) = , x = 1, 2, …, 45

145

E(X) = = 23 ,

45+12

2 = Var(X) = = 168.67

452 -112

P(X≥ 40) = f(40)+f(41)+f(42)+f(43)+f(44)+f(45) = = 0.1333

645

(1)

(2)

(3)

초기하분포의 확률질량함수와 평균 , 분산을 비롯한 특성과 다변량 초기하분포에 대하여 알아본다 .초기하분포의 확률질량함수와 평균 , 분산을 비롯한 특성과 다변량 초기하분포에 대하여 알아본다 .

22 초기하분포 (hypergeometric distribution)초기하분포 (hypergeometric distribution)

흰색 바둑돌 r 개와 검은색 바둑돌 N-r 개로 구성된 용기 A 에서 임의로 바둑돌 n개를 꺼내어 다른 용기 B 안에 넣을 때 , 임의로 꺼낸 바둑돌 n 개 안에 포함된 흰색 바둑돌의 개수에 관한 확률분포

어떤 특정 품목 r 개를 포함하여 서로 상반되는 두 종목의 품목 N 개로 구성된 집단에서 임의로 n 개를 추출하여 , n 개 안에 포함된 특정 품목의 개수 (X) 에 관한 확률분포를 모수 N, r, n 인 초기하분포라 한다 .

N(N-1)(N-2)•••(N-n+1)n(n-1)(n-2) ••• 3•2•1

Nn

N!n!(N-n)!

==조합의 수 :

1) 확률질량함수1) 확률질량함수☞ X ~ H(N, r, n)

f(x) = , max(0, n+r-N) ≤ x ≤ min(n, r) N

n

rx

N-rn-x

모수에 따른 확률히스토그램의 개형

2) 평균 2) 평균 ☞ = E(X) = x f(x) = x

x=0 x=0

nn

Nn

rx

N-rn-x

= x=0

n

x•r!x!(r-x)!

(N-r)!(n-x)! [(N-r)-(n-

x)]!N!n! (N-

n)!

= x=1

n

r (r-1)!(x-1)! [(r-1)-(x-

1)]!

[(N-1)-(r-1)]![(n-1)-(x-1)]! [(N-r)-(n-x)]!N(N-1)!

n(n-1)! (N-n)!t = x-1 이라

하면 ,

= n t=0

n-1rN (N-1)!

(n-1)! (N-n)!

[(N-1)-(r-1)]![(n-1)-t]! [{(N-1)-(r-1)}-{(n-

1)-t}]!

(r-1)!t! [(r-1)-

t]!

= n t=0

n-1rN N-1

n-1

r-1t

(N-1)-(r-1)(n-1)-t

= n rN

모수 N-1, r-1, n-1 인 초기하분포 확률함수

=1

동일한 방법에 의하여r (r-1)

N(N-1)E[X(X-1)] = n(n-1)

E(X2) = E[X(X-1)] + E(X) =

nr N – n2r – nr2 +(nr)2

N(N-1)

3) 분산 3) 분산 ☞ 2 = Var(X) = E(X2) – E(X)2

N-nN-1

= n rN

rN

1 -

= nr N – n2r – nr2 +

(nr)2N(N-1)

n

rN

2-

50 개의 마이크로 칩이 들어 있는 상자 안에 4 개의 불량품이 섞여 있다고 한다 .

이 상자에서 임의로 칩 5 개를 선정할 때 ,

(1) 5 개 안에 포함될 불량품의 수 (X) 에 대한 확률질량함수

(2) 불량품이 한 개 또는 두 개 나올 확률

(3) X 의 평균과 분산

P(X=1 or X=2) = f(1)+f(2) = 0.30808 + 0.04299 = 0.35107

(1)

(2)

(3)

f(x) = , x = 0, 1, 2, 3, 4 50

5

4x

465-x

E(X) = 5• = 0.4,

2 = Var(X) = 5• = 0.33796

X 0 1 2 3 4

f(x) 0.64696

0.30808

0.04299

0.00195

0.00002

450

450

450

1 - 4549

다변량 초기하분포다변량 초기하분포

서로 다른 특성 A1, A2, …, Ak 를 갖는 품목이 각각 r1, r2, …, rk 개씩 들어 있는 용기에서 n 개를 추출할 때 , 각 특성을 가진 품목이 각각 X1, X2, …, Xk 인 확률분포

예다음 그림과 같이 추출된 10 개의 구슬 안에 포함된 노란색 , 빨간색 , 파란색 구슬의 개수에 대한 확률분포

확률질량함수확률질량함수☞

P(X1=x1, X2=x2, …, Xk=xk) =

Nn

r1

x1

r2

x2

rk

xk

…x1+x2+…+xk

= n,0≤xi≤ri , i=1,2,…,k

k=2 이면 , 초기하분포이다 .

주 의주 의

앞의 예 그림과 같이 빨간 공 8 개 , 파란 공 10 개 , 노란 공 10 개씩 들어 있는

주머니에서 임의로 공 10 개를 꺼내는 경우 ,

(1) X, Y, Z : 10 개 안에 포함된 빨간 공 , 파란 공 , 노란 공의 수

X, Y, Z 의 결합질량함수

(2) 빨간 공 3 개 , 파란 공 2 개 , 노란 공 5 개가 포함될 확률

(3) 10 개 중에 포함될 노란 공의 평균

P(X=x, Y=y, Z=z) = 28

10

8x

10y

10z x+y+z = 10,

x=0,1,…,8, y, z=0,1,…,10

(1) r1=8, r2=10, r3=10 이고 n=10 이므로 결합확률질량함수 :

P(X=3, Y=2, Z=5) = = 0.0484 28

10

83

102

105

(2)

(3) 노란 공의 수 : Z~H(28, 10, 10) 이므로 E(Z)= 10• = 3.57

1028

Bernoulli 분포 , 이항분포의 확률질량함수와 평균 , 분산 그리고 이항확률 구하는 방법을 비롯한 특성 , 초기하분포와 이항분포 사이의 관계에 대하여 알아본다 .

Bernoulli 분포 , 이항분포의 확률질량함수와 평균 , 분산 그리고 이항확률 구하는 방법을 비롯한 특성 , 초기하분포와 이항분포 사이의 관계에 대하여 알아본다 .

33 이항분포 (binomial distribution)이항분포 (binomial distribution)

1) 확률질량함수1) 확률질량함수☞ X ~ B(1, p)

Bernoulli 분포Bernoulli 분포

동전 던지기의 앞면과 뒷면 , 전기회로 스위치의 ON 과 OFF, 설문조사에서 YES 와 NO, 상품의 불량품과 양품 등과 같이 , 서로 상반되는 두 가지뿐인 실험 결과에 관한 확률분포

관심을 갖는 결과가 나오면 성공 ( 성공률 p) 그렇지 않으면 실패 (q=1-p)라 하고 , 성공이면 1 실패이면 0 으로 대응시키는 확률변수 (X) 의 확률분포를 모수 p 인 베르누이분포라 한다 .

1-p , x=0

f(x) = p , x=1 =

0 , 다른 곳에서

pxq1-x , x=0, 10 , 다른 곳에서

베르누이 시행 : 베르누이분포에 따르는 통계실험을 독립적으로 반복하여 시행하는 것

2) 평균2) 평균☞

3) 분산3) 분산☞

E(X) =x f(x) = 0•(1-p) + 1•p = p

E(X2) = x2 f(x) = 02•(1-p) +

12•p = p

2 =Var(X) = E(X2) – E(X)2 = p – p2 = p(1-p)

주사위를 한 번 던져서 “ 1” 또는 “ 6” 의 눈이 나오면 성공이라 하자 .

이때 , “1” 또는 “ 6” 의 눈이 나오는 사건에 대한 확률분포 = ?

평균 = ? 분산 = ?

“1” 또는 “ 6” 의 눈이 나올 확률 1/3, 이 경우 확률변수 X=1

X ~ B(1, 1/3)

X 의 확률질량함수 :

2/3 , x=0

f(x) = 1/3 , x=1

0 , 다른 곳에서E(X) =

1/3

2 = •

=

13

23

29

X 의 평균 :

X 의 분산 :

예제 1 의 실험을 독립적으로 3 번 반복시행

예제 1 의 실험을 독립적으로 3 번 반복시행

X1, X2, X3 : 첫 번째 , 두 번째 , 세 번째 실험 결과

(x1, x2, x3) : (0,0,0), (1,0,0), (0,1,0), (0,0,1), (1,1,0), (1,0,1), (0,1,1), (1,1,1)

나타날 수 있는 모든 경우 :

P(Xi = 0) = , P(Xi = 1) = , i = 1, 2, 3

13

23

각 경우의 확률 :

X = X1 + X2 + X3 이라 하면 , X 의 상태공간 :

SX = { 0, 1, 2, 3 }X 의 의미 :

독립적으로 주사위를 3 번 반복하여 던져서 “1” 또는 “6” 의 눈이 나온 횟수

{X1 =0, X2 = 0, X3 = 0 }

{X1 =1, X2 = 0, X3 = 0 } ∪ {X1 =0, X2 = 1, X3 = 0 } ∪ {X1 =0, X2 = 0, X3 = 1 }

{X1 =1, X2 = 1, X3 = 0 } ∪ {X1 =1, X2 = 0, X3 = 1 } ∪ {X1 =0, X2 = 1, X3 = 1 }

{X1 =1, X2 = 1, X3 = 1 }

X = 0

X = 1

X = 2

X = 3

X 의 확률질량함수 :

P(X=0) = P(X1 =0, X2 = 0, X3 = 0 ) = P(X1 =0) P(X2 = 0) P(X3 = 0 )

= = 13

13

13

13

3· ·

{X1 =1, X2 = 0, X3 = 0 }, {X1 =0, X2 = 1, X3 = 0 }, {X1 =0, X2 = 0, X3 = 1 } : 배반사건

P(X=1) = P({X1 = 1,X2 = 0,X3 = 0 } or {X1 = 0,X2 = 1,X3 = 0 } or {X1 = 0,X2 = 0,X3 = 1 })

= P(X1 = 1,X2 = 0,X3 = 0) +P(X1 = 0,X2 = 1,X3 = 0) + P(X1 = 0,X2

= 0,X3 = 1)

= P(X1 = 1) P(X2 = 0) P(X3 = 0) +P(X1 = 0) P(X2 = 1) P(X3 = 0)

+ P(X1 = 0) P(X2 = 0) P(X3 = 1)

= + + = 3•

23

13

2 23

13

2 23

13

2 23

13

2

{X1 =1, X2 = 1, X3 = 0 }, {X1 =1, X2 = 0, X3 = 1 }, {X1 =0, X2 = 1, X3 = 1 } : 배반사건

P(X=2) = P({X1 = 1,X2 = 1,X3 = 0 } or {X1 = 1,X2 = 0,X3 = 1 } or {X1 = 0,X2 = 1,X3 = 1 })

= P(X1 = 1,X2 = 1,X3 = 0) +P(X1 = 1,X2 = 0,X3 = 0) + P(X1 = 0,X2

= 0,X3 = 1)

= P(X1 = 1) P(X2 = 0) P(X3 = 0) +P(X1 = 0) P(X2 = 1) P(X3 = 0)

+ P(X1 = 0) P(X2 = 0) P(X3 = 1)

= + + = 3•

23

13

2 23

13

2 23

13

2 23

13

2

P(X=3) = P(X1 = 1, X2 = 1, X3 = 1 ) = P(X1 = 1) P(X2 = 1) P(X3 = 1 )

= = 32

323

23

23

· ·

· · · ·

X 의 확률질량함수 :

P(X=0) = 13

3 P(X=1) = 3•

23

13

2 P(X=2) = 3•23

13

2P(X=3) =

323

13

3

3•23

13

2

3•23

13

2

323

, x = 0

, x = 1

, x = 2

, x = 3

f(x) =

23

13

x( )

3x

3-x

f(x) = 0 , 다른 곳에서

, x = 0, 1, 2, 3

( )

30 =

1 ,( )

31 =

3 ,( )

32 =

3 ,( )

33 = 1

조합의 수를 이용

X 에 대한 다른 관찰X 에 대한 다른 관찰

표본점 FFF SFF, FSF, FFS SSF, SFS, FSS SSSX 의 값 0 1 2 3

경우의 수

각 경우의 확률

X 의 분포

( )

30 =

1( )

31 =

3( )

32 =

3( )

33 =

1

23

13

0( )

30

3 23

13

1( )

31

2 23

13

2( )

32

1 23

13

3( )

33

0

23

13

0 3 23

13

1 2 23

13

2 1 23

13

3 0

확률 히스토그램

예제 1 에 대하여 X = X1 + X2 + X3 이라 할 때 ,

X 의 평균 = ? 분산 = ?

“1” 또는 “ 6” 의 눈이 나올 확률 1/3, 이 경우 확률변수 Xi=1 , i = 1, 2, 3

Xi ~ B(1, 1/3)

13

E(Xi) =Xi 의 평균 :

Xi 의 분산 :2 =

29i

E(X) = E(X1 + X2 + X3)

= E(X1)+ E(X2) + E(X3)

= + + = 1

13

13

13

X 의 평균 :

X 의 분산 : X1 , X2 , X3 이 독립이므로

23

29

2 = Var(X1 + X2 + X3 ) = Var(X1) + Var(X2) + Var(X3 )

= + + =

29

29

1) 확률질량함수1) 확률질량함수☞

이항분포이항분포

매 회 성공률이 p 인 Bernoulli 실험을 n 번 독립적으로 반복 시행하여 성공한 횟수 (X) 에 관한 확률분포를 모수 n, p 인 이항분포라 하고 , X~B(n, p) 로 나타낸다 .

( )

nx

f(x) = 0 , 다른 곳에서

px (1-p)n-x , x = 0, 1, …, n

2) 평균2) 평균☞Xk ~ B(1, p), k=1,2,…,n 이고 독립이라 하면 ,

X = X1 + X2 +… + Xn 은 성공률이 p 인 Bernoulli 실험을 n 번 독립적으로 반복 시행하여 성공한 횟수이므로

3) 분산3) 분산☞

E(X) = E(X1 + X2 +… + Xn ) = E(X1) + E(X2) + … + E(Xn)

= p + p + … + p = np

n 번

2 =Var(X) = Var(X1 + X2 +… + Xn )

= Var(X1) + Var(X2) + … + Var(Xn)

= p(1-p) + p(1-p) + … + p(1-p) = np(1-p) =npq (q=1-p)

n 번

이항확률변수에 대한 확률의 성질이항확률변수에 대한 확률의 성질☞

(1) P(X ≥ a) = f(x)

(2) P(X = a) = P(X ≤ a) – P(X ≤ a-1)

(3) P(a ≤ X ≤ b) = P(X ≤ b) - P(X ≤ a-1)

(4) P(X ≤ a) = 1- P(X ≥ a+1),

P(X ≥ a) = 1- P(X ≤ a-1)

n

x=a

X~B(n, p) 이고 a, b = 0, 1, 2, … , n 일 때 ,

공정한 동전을 8 번 던질 때 , (1) 꼭 1 번 앞면이 나올 확률(2) 많아야 4 번 앞면이 나올 확률 (3) 적어도 5 번 이상 앞면이 나올 확률(4) 평균 = ? 분산 = ?

(1) X 의 확률질량함수 :

X : 앞면이 나온 횟수 X~B(8, 0.5)

( )

8x

f(x) = 0 , 다른 곳에서

0.5x (1-0.5)8-x , x = 0, 1, …, 8

P(X = 1) = f(1) =( )

81 0.51 (1-0.5)7 =

0.03125

(2)

P(X ≤ 4) = f(0) + f(1) + f(2) + f(3) + f(4)

X 의 분산 :

( )

81 0.51 (0.5)7(

)

80 0.50 (0.5)8 (

)

82 0.52 (0.5)6

( )

83 0.53 (0.5)5 (

)

84 0.54 (0.5)4

= + +

+ +

= 0.00391 + 0.03125 + 0.10938 + 0.21875 + 0.27344 = 0.63673

(3)

P(X ≥ 5) = 1 - P(X ≤ 4) = 1 – 0.63673 = 0.36327

(4) X 의 평균 :

= np = 8 • (0.5) = 4

2 = npq = 8 • (0.5) • (0.5) = 2

이항확률표 사용방법이항확률표 사용방법☞앞의 예제 3 에 대하여 확률 P(X ≤ 4) 을 구하는 방법

P(X = 1) = P(X ≤ 1) - P(X = 0) = 0.0352 – 0.0039 = 0.0313

5 지선다형으로 주어진 10 문제에서 임의로 답안을 선정

(1) 정답을 선택한 문제 수에 대한 확률질량함수

(2) 평균과 분산

(3) 꼭 2 문제에서 정답을 선택할 확률

(4) 적어도 4 문제 이상 정답을 선택할 확률

(1) X : 정답을 선택한 문제 수 X ~ B(10, 0.2)

X 의 확률질량함수 :

( )10xf(x) =

0 , 다른 곳에서

0.2x 0.810-x , x = 0, 1, …, 10

X 의 분산 : 2 = npq = 10 • (0.2) • (0.8) = 1.6

(2) X 의 평균 : = np = 10 • (0.2) = 2

(3) 이항확률표로부터 ,

P(X ≤ 1) = 0.3758, P(X ≤ 2) = 0.6778

P(X = 1) = P(X ≤ 2) - P(X ≤ 1) = 0.6778 - 0.3758 = 0.3020

(4) P(X ≤ 3) = 0.8791

P(X ≥ 4) = 1 - P(X ≤ 3) = 1 - 0.8791 = 0.1209

모수 p 에 따른 이항분포의 비교모수 p 에 따른 이항분포의 비교

대칭이항분포 (symmetric binomial distribution)

오른쪽 긴 꼬리 왼쪽 긴 꼬리

두 이항분포의 합성두 이항분포의 합성☞X ~ B(m, p), Y ~ B(n, p)

X , Y : 독립

X + Y ~ B(m+n, p)

P(X + Y = k) = P(X = x, x + Y = k)

= P(X = x) P(x + Y = k)

= P(X = x) P(Y = k - x)

= px (1-p)m-x pk-x (1-p)n-(k-x)

= pk (1-p)(m+n)-k

= pk (1-p)(m+n)-k ~ B(m+n, p)

mx

nk-x( ) ( )

mx

nk-x( )( )

m+nk( )

x=0

x=0

x=0

m

m

m

x=0

m

x=0

m

생산라인 A 와 B 에서 생산되는 TV 의 불량률 : 동일한 5%

A 에서 생산된 제품 “ 7” 대와 B 에서 생산된 제품 “ 13” 대가 섞여 있을 때 ,

(1) 불량품이 꼭 하나 있을 확률

(2) 적어도 하나 이상 있을 확률

X, Y : 각각 A 와 B 에서 생산된 불량품의 수

X ~ B(7, 0.05), Y ~ B(13, 0.05)

Z = X + Y ~ B(20, 0.05)

P(Z = 1) = P(Z≤ 1) – P(Z =0) = 0.7358 – 0.3585 = 0.3773

P(Z ≥ 1) = 1 – P(Z = 0) = 1 – 0.3585 = 0.6415

초기하분포와

이항분포의 관계

초기하분포와

이항분포의 관계☞

X ~ H(N, r, n)

p = : 일정

rNN → ∞

X ~ B(n, p)

5,000 개의 장난감 가운데 250 개가 불량품

10 개를 임의로 선정하여 수입하기로 계약을 맺었다 .

(1) 불량품이 2 개 미만일 확률 ( 계산기 또는 관련 프로그램 사용 ),

(2) 불량품이 2 개 미만일 이항분포에 의한 근사확률

(1) X : 불량품의 수

X 의 확률질량함수 :

f(x) = , x = 0, 1, …, 10

250x

475010-x(

)( )

500010( )

P(X < 2) = f(0) + f(1) = 0.59845 + 0.31557 = 0.91402

(2) p=250/5000=0.05 이므로 X ~ B(10, 0.05) 이고 , 이항확률표에 의하여

.

.

P(X < 2) = P(X≤ 1) = 0.9139

(mathematica 를 사용 )

기하분포 , 음이항분포의 확률질량함수와 평균 , 분산을 비롯하여 비기억성 성질에 대하여 알아본다 .기하분포 , 음이항분포의 확률질량함수와 평균 , 분산을 비롯하여 비기억성 성질에 대하여 알아본다 .

44 기하분포 (geometric distribution)음이항분포 (negative binomial distribution)기하분포 (geometric distribution)음이항분포 (negative binomial distribution)

1) 확률질량함수1) 확률질량함수☞f(x) = pqx-1 , x = 1, 2, 3, …, q=1-p

X ~ G(p)

매 시행에서 성공률이 p 인 베르누이 실험을 처음 성공할 때까지 독립적으로 반복 시행한 횟수 (X) 에 관한 확률분포를 모수 p 인 기하분포라 하고 , X ~ G(p)로 나타낸다 .

기하분포기하분포

3) 분산 3) 분산 ☞E[X(X-1)] =

2qp2

2) 평균 2) 평균 ☞ = E(X) = x f(x) = x pqx-1 = p xqx-1 x=0 x=0

∞∞

x=0

= p (qx ) = p

( qx )ddq

x=1

∞ ddq

x=1

= p ( )ddq

q1-q

p

(1-p)2=

=1p

동일한 방법에 의하여

= + -

2 = Var(X) = E(X2) – E(X)2 = E[X(X-1)] + E(X) – E(X)2

22qp2

1p

1p

=qp2

예앞면이 나올 때까지 공정한 동전을 던지는 실험에서 던진 횟수(X) 의 확률분포

X 1 2 3 4 5 6 7 …

P(X=x) 1/2 1/4 1/8 1/16 1/32 1/64 1/128 …

P(X≤x) 1/2 3/4 7/8 15/16 31/32 63/64127/1

28…

“1” 의 눈이 나올 때까지 반복해서 던지는 실험

X : 처음 “1” 의 눈이 나올 때까지 시행한 횟수

(1) X 의 확률질량함수

(2) X 의 평균과 분산

(3) 세 번째에서 처음으로 “ 1” 의 눈이 나올 확률

(1) 주사위 1 개를 던져서 “1” 의 눈이 나올 확률은 1/6 이므로 X ~ G(1/6)

X 의 확률질량함수 :f(x) = , x = 1, 2, 3, …

16

56

x-1.

(2) X 의 평균 : = 1/p = = 6

1

1/6

X 의 분산 : 2 = q/p2 = = 30

5/6

(1/6)2

(3) P(X = 3) = f(3) = = = 0.1157

16

56

3-1. 25

216

X ~ G(p) 에 대하여 다음이 성립한다 . P(X > n+m | X > n) = P(X > m)

정리 1 비기억성 성질 (memorylessness property)정리 1 비기억성 성질 (memorylessness property)

증명증명

증명 끝증명 끝

P(X > n+m | X > n) =P(X > n)

P(X > n+m)

P(X > n)

P(X > n+m, X > n)=

P(X > n+m) = P(X ≥ n+m+1) = pqx-1

x=n+m+1

= p • = qn+m 1-q

qn+m

P(X > n) = P(X ≥ n+1) = pqx-1

x=n+1

= p • = qn

1-q

qn

P(X > m) = P(X ≥ m+1) = pqx-

1x=m+1

= p • = qm 1-q

qm

P(X > n+m | X > n)

P(X > n)

P(X > n+m)

qn

qn+m

= qm==

= P(X > m)

X ~ G(0.35) 에 대하여

확률 P(X > 5|X > 2) = ? P(X > 3) = ?

X ~ G(0.35) 이므로 X 의 확률질량함수 :

f(x) = (0.35)•(0.65)x-1 , x = 1,2,3,…

P(X > 5| X > 2) =P(X > 2)

P(X > 5)

P(X > 2)

P(X > 5, X > 2)=

한편 ,

P(X > k) = (0.35)•(0.65)x-1 = (0.35)• = (0.65)k

(0.65)k

1 – (0.65)

x=k+1

이므로 P(X > 5) = (0.65)5 , P(X > 2) = (0.65)2 , P(X > 3) = (0.65)3

P(X > 5| X > 2) =P(X > 2)

P(X > 5) (0.65)5

(0.65)2= (0.65)3 = P(X > 3)

=

조건부확률의 정의로부터

매 시행에서 성공률이 p 인 베르누이 실험을 r 번째 성공이 있기까지 독립적으로 반복 시행한 횟수 (X) 에 관한 확률분포를 모수 r, p 인 음이항분포라 하고 , X ~ NB(r, p) 로 나타낸다 . 특히 r =1 이면 X ~ G(p) 이다 .

음이항분포음이항분포

예매 시행에서 성공률이 p 인 베르누이 실험을 3 번째 성공이 있기까지 독립적으로 반복 시행한 횟수 (X) 의 확률분포

P(X =3) = p3

P(X =4) = 3qp3 = qp3

32( )

경우의 수 : 1 가지

각 경우의 확률 : p3

경우의 수 : 3 가지

각 경우의 확률 : qp3

P(X =5) = 6q2 p3 = q2 p3

42( )

P(X =x) = qx-3 p3

x-12( )

경우의 수 : 6 가지

각 경우의 확률 : q2 p3

경우의 수 : 가지

각 경우의 확률 : qx-3 p3

x-12( )

x-1 번 중에 r-1 번 성공하고 , x 번째에서 r 번째 성공이 있을 확률 :

P(X = x) = P(x-1 번 중에 r-1 번 성공 )• P(x 번째에서 r 번째 성공 )

= pr-1 q(x-1)-(r-1) •

p

x-1r-1( )x-1r-1( )= pr qx-r

1) 확률질량함수1) 확률질량함수☞ X ~ NB(r, p)

f(x) = , x = r, r+1, r+2, …

x-1r-1( )pr qx-r

처음 성공이 있기까지 반복 시행한 횟수 : X1

처음 성공 이후 두 번째 성공이 있기까지 반복 시행한 횟수 : X2

r-1 번째 성공 이후 처음 성공할 때까지 반복 시행한 횟수 : Xr

X = X1 + X2 + … + Xr : r 번 성공할 때까지 독립적으로 반복 시행한 횟수

X1 X2 Xr-1 Xr

비기억성 성질에 의하여

E(Xi) = , Var(Xi) = , i = 1, 2, 3, …, r

3) 분산 3) 분산 ☞

1p

2) 평균 2) 평균 ☞ = E(X) = E(X1) + E(X2) + … + E(Xr )

2 = Var(X) = Var(X1) + Var(X2) + … + Var(Xr )

qp2

1p

1p

1p

rp= + + … +

=

= + + … + =

qp2

qp2

qp2

rqp2

신용카드 한 장을 판매할 확률이 0.1 인 카드 외판원이 하루 동안 3 장의 카드를

판매할 때까지 예상 구매자를 방문

X : 외판원이 만난 예상 구매자 수

(1) X 의 확률질량함수 : f(x)

(2) X 의 평균 = ? 분산 = ?

(3) 3 번째에서 처음으로 구매자를 만날 확률

(4) 10 번째에서 3 장의 카드를 모두 판매할 확률

(5) 8 번째부터 10 번째에 걸쳐 3 장의 카드를 모두 판매할 확률

(1) X 의 확률질량함수 :

신용카드 한 장을 판매할 확률이 0.1 이고 3 장의 카드를 판매할 때까지 예상 구매자를 방문하므로 , 그 사람이 방문한 예상 구매자의 수 X 는 모수

r =3, p = 0.1 인 음이항분포를 이룬다 .

f(x) = , x = 3, 4, 5, …

x-12( )(0.1)3 (0.9)x-

3

(2) X 의 평균 :

X 의 분산 :

= = = 30

rp

30.1

2 = = = 270

rqp2

3•(0.9)(0.1)2

(3) 3 번째에서 처음으로 구매자를 만날 확률은 모수 p=0.1 인 기하분포이므로

구하고자 하는 확률 :(0.1)•(0.9)2 = 0.081

f(10) =

10-12( )

(0.1)3 (0.9)10-3

92( ) (0.1)3

(0.9)7

= 0.0172

=(4)

(5) 8 번째에 처음 카드를 판매할 확률 : (0.1)•(0.9)7 = 0.0478

곧바로 두 번째 카드를 판매 (9 번째에서 2 번째 구매자 ) 할 확률 :

비기억성 성질에 의하여 0.1

9번째에 이어서 10 번째도 판매할 확률 0.1

카드 판매는 독립적으로 반복 시행되므로

구하고자 하는 확률 : (0.1)3•(0.9)7 = 0.000478

X ~ NB(3, 0.1) 의 확률질량함수 개형

포아송분포의 확률질량함수 , 평균 그리고 분산 및 포아송분포의 특성 , 확률표 사용방법 및 이항분포와의 관계를 비롯하여 포아송과정에 대한 개념 등에 대하여 알아본다 .

포아송분포의 확률질량함수 , 평균 그리고 분산 및 포아송분포의 특성 , 확률표 사용방법 및 이항분포와의 관계를 비롯하여 포아송과정에 대한 개념 등에 대하여 알아본다 .

55 포아송분포포아송분포

컨테이너 박스 안의 수입 물품에 포함된 불량품의 수 , 어떤 물질에 의하여 방출된 방사능 입자의 수 , 어떤 주어진 시간 안에 걸려온 전화의 수 또는 소설책의 한 면 당 오자의 수 등과 같이 한정된 단위 시간이나 공간에서 발생하는 사건의 수에 관련되는 확률

ez 에 대한 Maclaurin 급수식 :

z2

2!z3

3!zk

k!ez = 1 + z + + + … + + …

= zk

k!k=0

확률질량함수 조건을 만족

z = m, k = x 라 하면 ,

e-

m = 1

mx

x!x=0

mx

x!e-m f(x)

= , x = 0, 1,

2, …: 확률질량함수

1 = e-z = e-z

zk

k!k=0

∞ zk

k!k=0

1) 확률질량함수1) 확률질량함수☞ X ~ P(m)

mx

x!e-m f(x)

= , x = 0, 1,

2, …

2) 평균 2) 평균 ☞ = E(X) = x f(x) = x• =

m x=0 x=0

∞∞

x=1

∞mx

x!e-m

mx-1

(x-1)!

e-m

= m t=0

∞ mt

t!e-m

= m

x-1 = t 라 하면

3) 분산 3) 분산 ☞E[X(X-1)] = m2

동일한 방법에 의하여

2 = Var(X) = E(X2) – E(X)2 = E[X(X-1)] + E(X) – E(X)2

= m2 + m – m2

= m

포아송분포의 모수 m 이 평균 , 분산과 일치한다 .

참고

포아송 분포는 모수가 클수록 기대값이 커짐과 동시에

기대값을 중심으로 퍼지는 정도도 넓어지며 , 외형은 종 모양에 근접한다 .

포아송분포의 특성포아송분포의 특성☞

10 개들이 CD 1묶음에 평균 0.15 개의 결함이 있으며 , 결함이 있는 CD 의 수는

포아송분포에 따른다 . CD 10 묶음에 대하여

(1) 결함이 있는 CD 가 2 개일 확률

(2) 적어도 2 개 이상의 CD 에 결함이 있을 확률

(1) CD 1묶음에 평균 0.15 개의 결함이 있으므로 , 10묶음에는 평균 1.5 개

결함있는 CD 의 수 : X ~ P(1.5)

1.522!

P(X = 2) = e-1.5 = 0.251

1.5x

x!e-1.5 , x = 0, 1, 2, …

f(x) =

X 의 확률질량함수 :

구하고자 하는 확률 :

P(X ≥ 2) = 1 – P(X ≤ 1) = 1- f(0) – f(1)

= 1 - - 1.500!

e-1.5 1.511!

e-1.5

= 1- (0.223 + 0.335) = 0.442

(2)

포아송확률표 사용방법포아송확률표 사용방법☞X ~ P(1.5) 에 대하여 P(X ≤ 2) = ?

P(X = 2) = P(X ≤ 2) - P(X ≤ 1) = 0.809 – 0.558 = 0.251

P(X ≥ 2) = 1 – P(X ≤ 1) = 1 – 0.558 = 0.442

이항분포와

포아송분포의

관계

이항분포와

포아송분포의

관계

X ~ B(n, p)

= np : 일정

n → ∞

X ~ P)

어떤 기계에서 생산된 제품은 0.1 의 확률을 가지고 불량품이 독립적으로 나온다고 한다 . 이 기계에서 생산된 제품 20 개를 임의로 선정했을 때 ,(1) 1 개 이하의 불량품이 나올 확률 (2) 포아송분포에 의한 근사확률

(1) 불량품의 수 : X ~ B(20, 0.1)

이항확률표에 의하여 P(X ≤ 1) = 0.3917

(2) n = 20, p = 0.1 이므로 X ~ P(2)

.

.

포아송분포에 의한 근사확률 : P(X ≤ 1) = 0.406..

재학생 수가 300 명인 어느 학교에 신종 플루 바이러스에 걸린 학생이 3 명일 때 .임의로 선정된 1 명이 바이러스에 걸렸을 확률

(1) 바이러스에 걸린 학생 수 : X ~ B(300, 0.01)

n = 300, p = 0.01 이므로 X ~ P(3)

.

.

포아송분포에 의한 근사확률 :

P(X = 1) = P(X ≤ 1) – P(X = 0) = 0.199 – 0.05 = 0.149

.

.

▶ 포아송과정 (Poisson process) : 단위 구간에서 의 비율로특별한 사건이 관찰될 때 , 길이가 t 인 구간에서 이 사건이 관찰된수 X(t) 가 포아송분포에 따를 때 , 이 사건이 관찰되는 과정 {X(t) : t > 0} 을 모수 인 포아송과정이라 한다 .

포아송과정 (Poisson process) : 단위 구간에서 의 비율로특별한 사건이 관찰될 때 , 길이가 t 인 구간에서 이 사건이 관찰된수 X(t) 가 포아송분포에 따를 때 , 이 사건이 관찰되는 과정 {X(t) : t > 0} 을 모수 인 포아송과정이라 한다 .

P[X(t) = x] = e-t , x = 0, 1, 2, …

(t)xx!

(1) 임의의 양수 t 와 s에 대하여 , X(t+s) - X(t) 는 {X(u) : u ≤ t} 에 독립이다 . 즉 , 시구간 (t, t+s) 사이에 관찰된 횟수는 t 이전에 관찰된 횟수에 독립

(2) 임의의 양수 t 와 s에 대하여 , X(t+s) - X(t) 는 s에만 의존한다 . 즉 , 동일한 크기의 시구간 안에서 관찰된 횟수는 동일한 분포를 이룬다 .

포아송과정의 특성포아송과정의 특성☞

처음 2.5 시간 동안 어떤 사건이 17 건 관찰되고 , 처음 3.7 시간 동안 22 건 그리고 처음 4.3 시간 동안 36 건이 관찰됨을 의미

{X(2.5)=17, X(3.7)=22, X(4.3)=36}

{X(2.5) = 17, X(3.7) – X(2.5) = 5, X(4.3) – X(3.7) = 14}

동치관계

X(t) 가 = 8 인 포아송과정에 따를 때 , P[X(2.5)=17, X(3.7)=22, X(4.3)=36] = ?

특성 (2) 에 의하여

= 8, X(t)~P(t) 이므로

구하고자 하는 확률 :

P[X(3.7) – X(2.5) = 5] = P[X(1.2) = 5]

P[X(4.3) – X(3.7) = 14] = P[X(0.6) = 14]

X(2.5) ~ P(20), X(1.2) ~ P(9.6), X(0.6) ~ P(4.8)

(20)17

17!e-20

(9.6)5

5!e-9.6

(4.8)14

14!e-4.8• •=

P[X(2.5) = 17] P[X(3.7) – X(2.5) = 5] P[X(4.3) – X(3.7) = 14]

= (0.07595)•(0.04602)•(0.00033) = (1.15)•(10) -6

특성 (1) 에 의하여

P[X(2.5)=17, X(3.7)=22, X(4.3)=36]

= P[X(2.5) = 17, X(3.7) – X(2.5) = 5, X(4.3) – X(3.7) = 14]

= P[X(2.5) = 17] P[X(3.7) – X(2.5) = 5] P[X(4.3) – X(3.7) = 14]

다항분포의 결합확률질량함수에 대하여 알아본다 .다항분포의 결합확률질량함수에 대하여 알아본다 .

66 다항분포다항분포

매회 실험 결과가 k 개의 서로 배반인 사건 A1 , A2 , … , Ak 로 구성되고 , 각각의 사건이 매회 발생할 가능성이 pi =P(Ai), i = 1,2,…,k인 통계실험에서 사건 Ai 들의 발생 횟수 Xi 의 결합확률분포

결합확률질량함수결합확률질량함수☞ (X1 , X2 , … , Xk) ~ Mult(n, p1 , p2 , … , pk)

f(x1 , x2 , … , xk) = p1 p2 … pk ,

x2x1 xkn!

x1! x2! … xk!

0 ≤ xi ≤ n , i = 1, 2, …, k

x1 + x2 + …+ xk = n ,

p1 + p2 + …+ pk = 1

(1) k = 2 이면 이항분포이고 , 각 확률변수들은 독립이 아니다 .

(2) Xi ∼ B(n, pi ) E(Xi ) = n pi , Var(Xi ) = n pi(1-pi )

다항분포와 이항분포다항분포와 이항분포☞

공정한 주사위를 36 번 던져서 각각의 눈이 동일하게 6 번씩 나올 확률

Xi : 주사위를 던져서 나온 눈이 “i” 인 횟수

f(x1 , x2 , … , x6) = 36!x1! x2! … x6!

, x1 + x2 + …+ xk = 36

x116

x216

x616

(X1 , X2 , … , X6) ~ Mult(36, 1/6 , 1/6, … , 1/6)

P(X1 =6, X2 =6, … , X6 =6) = f(6, 6, 6, 6, 6, 6) 36

!x1! x2! … x6!

616

616

616

…=

= 0.00026

구하고자 하는 확률 :

제 4 장