Ⅴ. 주요 확률 분포함수wolfpack.hnu.ac.kr/2015_fall/is/통계학원론_5장.pdf5.3....

24
- 1 - . 주요 확률 분포함수 5.1. 확률 분포함수와 모수 5.2. 대표적인 이산형 확률 분포함수 5.3. 대표적인 연속형 확률 분포함수 5.4. 엑셀 실습 5.1 확률 분포함수와 모수 1. 특정 확률 분포함수 학습의 이유 · 통계 분석 과정에서는 수집된 데이터들이 특정 확률 분포함수를 따른다는 가정을 함 · 확률 분포함수을 알게 되면, 구하고자 하는 사건에 대한 확률과 각종 정보의 유추가 가능 · 따라서 많이 활용되는 확률 분포함수를 학습하고 해당 확률분포의 정의와 성질들을 학습하 는 것이 필요함 2. 확률 분포함수의 주요 학습 내용 · 확률 분포함수를 학습함에 있어 꼭 알아두어야 하는 사항은 다음과 같음 (1) 확률 변수의 정의 : 확률 변수가 어떤 상황에 대하여 정의하고 있는지 (2) 확률 변수의 범위 : 확률 변수가 취할 수 있는 값의 범위는 어떻게 되는지 (3) 확률 분포함수의 형태 : 확률 분포함수가 어떤 식으로 이루어져 있는지 (4) 확률 분포함수를 통한 확률의 계산 방법 (5) 확률 분포함수의 요약값 : 확률 변수의 기댓값과 분산은 어떻게 계산되는지 (6) 확률 분포함수의 모수 : 확률 분포함수의 모양, 형태 및 특성을 결정하는 값 · 통계 분석에서 미지의 모수에 대한 추정과 검정이 주요한 부분을 차지하게 됨 5.2 대표적인 이상형 확률 분포함수

Upload: others

Post on 10-Feb-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

- 1 -

Ⅴ. 주요 확률 분포함수

5.1. 확률 분포함수와 모수

5.2. 대표적인 이산형 확률 분포함수

5.3. 대표적인 연속형 확률 분포함수

5.4. 엑셀 실습

5.1 확률 분포함수와 모수

1. 특정 확률 분포함수 학습의 이유

· 통계 분석 과정에서는 수집된 데이터들이 특정 확률 분포함수를 따른다는 가정을 함

· 확률 분포함수을 알게 되면, 구하고자 하는 사건에 대한 확률과 각종 정보의 유추가 가능

· 따라서 많이 활용되는 확률 분포함수를 학습하고 해당 확률분포의 정의와 성질들을 학습하

는 것이 필요함

2. 확률 분포함수의 주요 학습 내용

· 확률 분포함수를 학습함에 있어 꼭 알아두어야 하는 사항은 다음과 같음

(1) 확률 변수의 정의 : 확률 변수가 어떤 상황에 대하여 정의하고 있는지

(2) 확률 변수의 범위 : 확률 변수가 취할 수 있는 값의 범위는 어떻게 되는지

(3) 확률 분포함수의 형태 : 확률 분포함수가 어떤 식으로 이루어져 있는지

(4) 확률 분포함수를 통한 확률의 계산 방법

(5) 확률 분포함수의 요약값 : 확률 변수의 기댓값과 분산은 어떻게 계산되는지

(6) 확률 분포함수의 모수 : 확률 분포함수의 모양, 형태 및 특성을 결정하는 값

· 통계 분석에서 미지의 모수에 대한 추정과 검정이 주요한 부분을 차지하게 됨

5.2 대표적인 이상형 확률 분포함수

- 2 -

· 대표적으로 많이 활용되는 이산형 분포함수에 대하여 소개

· 거장 간단하면서 많이 활용되는 가본적인 4개의 이산형 확률 분포를 소개

1. 균등(Uniform) 분포

(1) 균등 분포의 정의와 함수형태

· 균등 분포를 따르는 확률 변수의 정의

; 서로 다른 개의 이산점에서 발생하는 확률이

로 동일한 확률 확률 변수

· 균등 분포를 따르는 확률 변수의 표현

; ∼

· 균등 분포의 형태

;

; 확률 분포에서 확률 변수의 범위가 결정됨

; 확률 분포에서 모르는 값은 몇 개의 점으로 이루어져 있는지를 나타내는 이며, 이것이

이산형 균등 분포함수의 모수가 됨

; 따라서, 모수 만 알게 되면 확률 분포함수 전부를 아는 것과 동일함

· 균등 분포의 확률 계산

;

,

, ...,

; 확률 변수를 정의한 것과 같이 각각의 점에서 동일한 확률을 가진다는 의미임

(2) 기댓값과 분산

· 균등 분포의 기댓값과 분산

;

;

· 균등 분포의 기댓값과 분산의 유도과정

- 3 -

;

;

;

[예제 5.1] 주사위 던지기에서 나타나는 숫자를 나타내는 확률 변수의 분포함수를 구하고,

해당 분포의 기댓값과 분산을 구하시오

2. 베르누이(Bernoulli) 분포

(1) 베르누이 시행

· 베르누이 시행(Bernoulli Trial)이란 결과가 2가지로만 나타나는 경우를 의미함

; 동전던지기와 같이 앞면, 뒷면으로 나타나는 결과가 2가지 밖에 경우

; 통계 분석에서는 성공 또는 실패로 이루어진 실험에 많이 적용됨

(2) 베르누이 분포의 정의와 함수형태

· 베르누이 분포를 따르는 확률 변수의 정의

; 베르누이 시행에 나타나는 결과에 대하여 정의하는 확률 변수

· 베르누이 분포를 따르는 확률 변수의 표현

; ∼

· 베르누이 분포의 형태

;

; 확률 분포에서 확률 변수가 가질 수 있는 값의 범위는 정의에 따라 두가지만 존재

; 관심있는 결과(성공)에 1의 값을 부여하고, 다른 결과에 0의 값을 부여함

; 확률 분포에서 모르는 값은 이며, 이것이 베르누이 분포함수의 모수이며, 이것이 관심

있는 결과의 확률을 나타냄

; 따라서, 모수 만 알게 되면 확률 분포함수 전부를 아는 것과 동일함

- 4 -

· 베르누이 분포의 확률 계산

;

;

; 확률 변수의 값이 1인 경우, 즉 성공이 시현된 경우, 이에 대한 성공의 확률이 되며, 확

률 변수의 값이 0인 경우, 즉 실패가 시현된 경우, 실패에 대한 확률이 구하여 짐

(3) 기댓값과 분산

· 베르누이 분포의 기댓값과 분산

;

;

· 베르누이 분포의 기댓값과 분산의 유도과정

;

;

;

[예제 5.2] 동전 던지기에서 앞면이 나타나는 것을 성공이라고 정의하는 확률 변수의 분포

함수를 구하고, 해당 분포의 기댓값과 분산을 구하시오

3. 이항(Binomial) 분포

(1) 이항 분포의 정의와 함수형태

· 이항 분포를 따르는 확률 변수의 정의

; 베르누이 시행을 번 독립적으로 반복 시행한 경우에 나타나는 성공의 횟수에 대하여

정의하는 확률 변수

· 베르누이 분포와의 관계

; 첫 번째 시행, 두 번째 시행, 번째 시행 등 각각의 시행은 베르누이 시행으로 2가지 결

과 나오는 베르누이 분포와 같음

; 첫 번째 시행에서 성공이면, 확률변수는 1의 값을 가지고, 두 번째 시행에서 성공이면 1

의 값을 가지고, 이후 번째 시행까지 계속 실패를 하면, 모두 0의 값을 가지게 되

- 5 -

고, 번째 시행에서 성공이면 1의 값을 가지게 됨

; 따라서 성공의 횟수로 정의되는 이항 분포는 각각의 베르누이 분포에서 나타나는 결과의

합으로 이해할 수 있음

(위의 예에서 각각의 시행에서 나타나는 결과를 다 더하면 성공의 횟수인 3이 됨)

; 첫 번째 시행 ∼ , 두 번째 시행 ∼ ,.... 번째 시행

∼ 로 나타낼 수 있으며, 이를 수식으로 표현하면 다음과 같음

· 이항 분포를 따르는 확률 변수의 표현

; ∼

; 여기서 이항분포, Binomial의 약자 를 나타내는 것임

· 이항 분포의 형태

;

; 확률 분포에서 확률 변수가 가질 수 있는 값의 범위는 0부터 까지 이며, 이는 성공의

횟수의 0번에서 번까지 나타날 수 있다는 것을 보여줌

; 확률 분포에서 모르는 값은 시행행수와 성공확률을 나타내는 이며, 이것이 이항 분

포함수의 모수임

; 따라서, 모수 만 알게 되면 확률 분포함수 전부를 아는 것과 동일함

· 이항 분포에서 의 의미

; 3번의 베르누이 시행하여 성공의 횟수를 나타내는 이항분포의 확률을 구함

- 6 -

실 험 결 과

(성공의 횟수)확률

첫번째 두번째 세번째

성공 성공 성공 3

성공 성공 실패 2

성공 실패 성공 2

실패 성공 성공 2

성공 실패 실패 1

실패 성공 실패 1

실패 실패 성공 1

실패 실패 실패 0

합 1

; 확률 변수의 값에 대한 확률을 구하면

,

,

; 계산된 확률을 확인해 보면, 성공, 실패 각각의 확률의 곱과, 이러한 경우가 발생할 수

있는 경우의 수가 곱하여 지는 모습으로 나타나며, 이것이 이항 분포에서 발생할 수 있

는 경우의 수를 표현하여 주는 임

· 모수 이 1인 경우의 확률 분포함수

;

; 즉, 베르누이 분포와 동일한 형태가 된다. 1번 시행에서 성공, 실패를 나타내는 것이 베

르누이 분포이며, 이항 분포의 특수한 경우로 해석할 수 있음

· 이항 분포의 확률 계산

;

;

; 확률 변수의 값이 0인 경우, 즉 성공이 한 번도 시현되지 않은 경우, 실패의 확률이 실

패의 개수만큼 곱하여진 것이며, 확률 변수의 값이 인 경우, 즉 모든 시행에서 성공이

시현된 경우, 성공의 확률이 성공의 개수만큼 곱하여진 것임

- 7 -

(2) 기댓값과 분산

· 베르누이 분포의 기댓값과 분산

;

;

· 베르누이 분포의 기댓값과 분산의 유도과정

; 기댓값과 분산은 베르누이 분포와의 관계 및 베르누이 분포의 기댓값과 분산을 활용하여

쉽게 유도가 가능함

( 들은 베르누이 분포임)

;

;

[예제 5.3] 동전 던지기를 5번 시행하여 앞면이 나타나는 것을 성공이라고 정의하는 확률

변수의 분포함수를 구하고, 해당 분포의 기댓값과 분산을 구하시오

그리고 성공이 한 번도 일어나지 않을 확률을 계산하시오

(3) 이항 분포 확률 계산의 활용 방법

· 이항 분포의 확률 계산에서는 성공이 몇 번 이상 발생할 확률 또는 몇 번 이하 일어날 확

률도 관심의 대상임

; ∼ 인 경우

; 성공이 1번 이하로 발생할 확률은 다음과 같이 구할 수 있음

×

; 성공이 1번 이상 발생할 확률은 다음과 같이 구할 수 있음

- 8 -

; 하지만, 항의 개수가 너무 많아 계산이 복잡하고 어려워짐

; 따라서 확률의 성질, 즉 모든 가능한 값에 대한 확률의 합은 1 이다라는 성질을 활용하

면 다음과 같이 쉽게 구할 수 있음

[예제 5.4] 동전 던지기를 5번 시행하여 앞면이 나타나는 것을 성공이라고 정의하는 확률

변수, 즉 ∼ 인 경우에서 성공이 1번 이상 발생할 확률을 구하시오

4. 포아송(Poisson) 분포

(1) 포아송 분포의 정의와 함수형태

· 포아송 분포를 따르는 확률 변수의 정의

; 단위 구간 내에서 특정 사건이 발생하는 횟수에 대하여 정의하는 확률 변수

· 포아송 분포를 따르는 확률 변수의 표현

; ∼

· 포아송 분포의 형태

;

; 확률 분포에서 확률 변수가 가질 수 있는 값의 범위는 0부터 시작하고, 발생하는 횟수는

무한히 많이 발생할 수 있으므로 상한의 값이 존재하지 않음

; 확률 분포에서 모르는 값은 로, 이것이 포아송 분포함수의 모수이며, 단위 구간 내에

서 특정 사건이 평균적으로 발생하는 횟수를 의미함

; 따라서, 모수 만 알게 되면 확률 분포함수 전부를 아는 것과 동일함

· 포아송 분포의 확률 계산

- 9 -

;

;

;

(2) 기댓값과 분산

· 포아송 분포의 기댓값과 분산

;

;

; 평균과 분산이 동일

· 포아송 분포의 기댓값과 분산의 유도과정

;

×

여기서 을 로 바꾸어 쓰면

×

(포아송 분포함수가 가지는 모든 값에 대한 확률의 합은 1이 됨을 이용)

; 분산의 유도는 가 가지는 특성과 분산의 공식을 이용하여 유도하게 됨

;

×

;

;

;

[예제 5.5] 대전 시내에서 하루 평균 교통사고가 평균적으로 100건이 발생한다고 한다. 이

를 정의하는 확률 변수의 분포함수를 구하고, 해당 분포의 기댓값과 분산을 구하시오

- 10 -

(3) 포아송 분포 확률 계산의 활용 방법

· 포아송 분포도 이항 분포와 마찬가지로 사건이 몇 번 이상 발생할 확률이 관심의 대상이

될 수 있음

; 예를 들어 하루 사고 건수가 200건 이상 발생할 확률 등

; 포아송 분포는 상한이 없으므로 수식을 이용하여 몇 건 이상의 확률을 계산하는 것이 불

가능함

; 따라서 전체 확률인 1에서 관심있는 횟수 미만의 확률을 차감하여 계산함

; 사건이 1번 이상 발생할 확률은 다음과 같이 구할 수 있음

[예제 5.6] [예제 5.5]에서 정의한 확률 분포를 이용하여 사고가 1건 이상 발생할 확률을

구하시오

5.3 대표적인 연속형 확률분포 함수

· 대표적으로 많이 활용되는 연속형 분포함수에 대하여 소개

· 가장 간단하면서 많이 활용되는 4개의 연속 확률 분포를 소개

1. 균등(Uniform) 분포

(1) 균등 분포의 정의와 함수형태

· 균등 분포를 따르는 확률 변수의 정의

; 가장 간단한 형태의 연속형 확률 분포로 특정 구간에 속할 확률이 동일하도록 정의되는

확률 변수

· 균등 분포를 따르는 확률 변수의 표현

; ∼

- 11 -

; 이산형 균등 분포는 몇 개의 서로 다른 사건으로 정의된 반면 연속형 균등 분포는 일정

구간으로 정의되는 차이가 있음

· 균등 분포의 형태

;

≤ ≤

; 확률 분포에서 확률 변수의 범위가 결정되며, 이에 해당하지 않는 범위에서는 함수의 값

이 0임을 의미함

; 확률 분포에서 모르는 값은 구간의 시작점과 구간의 끝점이며, 이것이 연속형 균등 분포

함수의 모수가 됨

; 따라서, 모수 만 알게 되면 확률 분포함수 전부를 아는 것과 동일함

· 균등 분포함수 형태의 의미

; 연속형 확률 분포함수는 확률 변수가 취할 수 있는 범위 구간에 해당하는 면적이 전체

확률인 1이 됨

; 따라서 연속형 균등 분포함수의 경우 밑변의 길이가 이고 동일 구간에서 동일 확

률을 가져야 하는 변수의 정의에 따라, 분포 함수의 값은 동일하여야 함

; 결국은 사각형의 넓이가 1이 되야 하므로 이에 해당하는 높이가 바로 분포함수 형태인

이 되는 것으로 이해할 수 있음

· 균등 분포의 확률 계산

; 연속형 확률 분포함수의 확률 계산은 적분 과정을 통하여 구하여지지만, 직선으로 이루

어진 균등 분포의 경우 적분 과정을 거치지 않고 사각형의 넓이를 계산하는 것으로 계산

- 12 -

이 가능함

; ∼ , 즉

≤ ≤ 인 경우

; 에 대한 확률은 다음과 같이 구할 수 있음

×

즉, 밑변의 길이가 1이고 높이가

인 사각형의 넓이를 구하는 것과 동일

(2) 기댓값과 분산

· 균등 분포의 기댓값과 분산

;

;

· 균등 분포의 기댓값과 분산의 유도과정

;

;

;

[예제 5.7] 다음과 같은 분포함수가 주어진 경우 물음에 답하시오

≤ ≤

(1) 은?

(2) 은?

(3) 해당 분포함수의 기댓값과 분산은?

- 13 -

2. 정규(Normal) 분포

(1) 정규 분포의 정의와 함수형태

· 정규 분포를 따르는 확률 변수의 정의

; 통계학에서 가장 중요하고 많이 활용되는 확률 분포

; 평균을 중심으로 좌우 대칭인 종모양(Bell Shape)을 가지는 연속형 확률 변수로 정의

· 정규 분포를 따르는 확률 변수의 표현

; ∼

· 정규 분포함수의 형태

;

∞ ∞

; 확률 분포에서 확률 변수의 범위가 결정되며, 확률 변수가 가질 수 있는 값의 범위는 실

수 전체이며, 상한과 하한이 존재하지 않음

; 확률 분포에서 모르는 값은 평균과 분산을 의미하는 이며 정규 분포의 모수임

; 따라서, 모수 만 알게 되면 확률 분포함수 전부를 아는 것과 동일함

· 정규 분포함수 형태의 의미

; 정규 분포함수는 평균을 중심을 좌우 대칭인 형태를 나타냄

; 따라서 분산이 동일하고, 평균이 다른 경우 다음과 같은 그림과 같이 표현할 수 있음

; 즉 함수의 모양은 동일한 상태에서 중심의 위치만 평균에 따라 좌우로 이동하는 모습임

- 14 -

; 반대로 평균이 동일하고 분산이 다른 경우는 다음과 같은 그림과 같이 표현할 수 있음

; 즉 함수의 중심은 동일한 상태에서 분산이 작을수록 위로 더욱 볼록해지고, 분산이 클수

록 중심의 높이가 낮고 좌우로 더 퍼지는 형태로 표현됨

(분산은 분포의 퍼지는 정도를 측정해주는 도구)

· 정규 분포의 확률 계산

; 정규 분포함수는 함수의 형태가 복잡하여 직접적인 수식을 통하여 확률의 계산이 어려움

; 따라서 확률 계산을 하기 위한 다른 방법이 요구되며, 이는 표준 정규 분포함수의 확률

계산에서 설명하는 것으로 함

; 다만, 전체 확률은 1이고 좌우 대칭이라는 특성을 가지고 있기 때문에 직관적으로 다음

의 확률의 계산은 가능함

- 15 -

,

; 즉 평균을 중심으로 절반의 확률을 가지고 있는 것으로 이해할 수 있음

(2) 기댓값과 분산

· 정규 분포의 기댓값과 분산

;

;

· 정규 분포는 기댓값과 분산에 따라 결정되는 확률 분포함수이므로 별도의 평균 분산에 대

한 별도의 유도 과정이 필요하지 않음

[예제 5.8] 평균이 10이고 분산이 100인 정규 분포함수를 작성하시오

[예제 5.9] 다음과 같은 분포함수가 주어진 경우 기댓값과 분산을 구하시오

∞ ∞

3. 표준 정규(Standard Normal) 분포

(1) 표준 정규 분포의 정규 분포와의 관계

· 정규 분포에서 평균과 분산이 가질 수 있는 값은 무한개이고, 그러한 평균과 분산을 따르

는 정규 분포도 무한개가 존재하므로 이를 표준화하여 하나의 분포함수로 표현하고자 한

것이 표준 정규 분포임

· 정규 분포의 표준화 과정

; ∼ 일 경우, 다음과 같은 확률 변수로 정의되는 표준화를 고려

;

· 표준화된 확률 변수 의 기댓값과 분산의 계산

;

- 16 -

;

; 즉 표준화 과정을 거치면 평균이 0, 분산이 1 인 정규 분포가 됨

(2) 표준 정규 분포의 정의와 함수형태

· 표준 정규 분포를 따르는 확률 변수의 정의

; 평균이 0이고 분산이 1을 가지는 정규 분포로 정의되는 연속형 확률 변수

; 즉, 분포의 중심이 에서 1로 이동됨

· 표준 정규 분포를 따르는 확률 변수의 표현

; ∼

· 표준 정규 분포함수의 형태

;

∞ ∞

; 정규 분포함수에서 평균과 분산을 자리에 0과 1을 대입한 함수

; 따라서 표준 정규 분포함수에서 ,

(3) 표준 정규 분포의 확률 계산

· 정규 분포와 마찬가지로 표준 정규분포에서도 수식적인 과정을 통한 확률의 계산이 어려움

· 따라서, 표준 정규 분포표를 통하여 확률을 계산함

- 17 -

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.2580 0.2611 0.2642 0.2673 0.2703 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830

1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015

1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857

2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890

2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916

2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952

2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964

2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974

2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981

2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986

3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

· 표준 정규 분포표를 이용하여 확률을 확인하는 방법

; 좌측 열과 첫 번째 행은 확률 변수 가 위하는 값을 의미하며, 표의 내부에 있는 값들

은 확률 변수 값에 해당하는 확률을 나타냄

; 확률 변수 값에서 좌측 열은 소수점 첫째자리까지, 첫 번째 행은 소수점 둘째 자리 숫

자를 의미함

- 18 -

; 확률 변수 값이 1.96인 경우 좌측 열 1.9 첫 번째 행 0.06을 의미하는 것이며 두 숫

자가 교차하는 지점이 표에서 나타내고 있는 확률이며, 다음과 같은 수식으로 표현할 수

있음

; 즉 0부터 해당 값까지 해당하는 구간의 확률을 계산한 결과이며 이를 그림으로 표현하

면 다음과 그림에서 색깔로 표현한 부분과 같음

; 예를 들어 1.96에 해당하는 값은 0.4750으로 임을 나타냄

; 반대로 로 구할 수 있음

; 또한 분포의 대칭인 점을 이용하면 임을 구할 수 있음

; 표준 정규 분포표에서 활용되는 대표적인 확률 값들은 다음과 같으므로 표에서 직접 구

하여 연습하도록 함

(1)

(2)

(3)

(4)

(5)

(6)

(7)

; 확률 변수의 값들이 99% 이상 –3에서 3까지 범위 내에 존재함

; 위의 확률들은 90%, 95%, 99% 신뢰 구간 등을 의미하는 경우로 활용되는 확률임

- 19 -

· 표준 정규 분포표를 이용하여 정규 분포의 확률을 계산하는 방법

; 정규 분포가 가질 수 있는 평균과 분산은 무한개이므로, 이에 해당하는 정규 분포고 무

한개이며, 이에 대한 확률을 구하려면, 위와 같은 표가 무한개가 있어야 한다는 의미임

; 따라서 표준 정규 분포표를 이용하여 수많은 정규 분포의 확률을 계산하는 방법이 필요

정규분포 ∼ 인 경우, 표준 정규분포

정규분포를 따르는 확률 변수에 대하여 를 구하고자 한다

정규 분포의 확률이 표준 정규분포의 확률로 변경이 됨

따라서 해당하는 값에 해당하는 확률을 표준 정규 분포표를 통하여 구할 수 있음

; 실제 사례를 통한 정규 분포 확률의 계산

∼ 일 때 은?

[예제 5.10] 수능 시험 성적을 나타내는 확률 변수 ∼ 라고 힐 때, 다음 물

음에 답하시오

(1) 이 수험생의 성적이 200점 이상일 확률

(2) 이 수험생의 성적이 164점에서 점 사이일 확률

(3) 이 수험생의 성적이 240점 이상일 확률

(4) 이 수험생의 성적이 170점 이하 또는 240점 이상일 확률

(5) 상위 5% 학생들의 성적은 몇 점 이상인가 ?

(6) 상위 40% 학생들이 대학에 진학한다고 할 때, 몇 점 이상인 학생들이 대학에 진학한다

고 할 수 있나?

4. t-분포

- 20 -

· t-분포의 유도 과정, 함수형태 등은 생략하고 기본적인 개념과 활용 방식만 학습함

(1) 표준 정규 분포의 정의와 함수형태

· t-분포는 표준 정규 분포와 유사한 형태를 따르는 분포

; 0을 중심으로 좌우 대칭인 종 모양의 분포

; 정규 분포의 모수 중 분산을 모르는 경우 t-분포를 활용하여 사용함

· t-분포를 따르는 확률 변수의 표현

; ∼ 또는 ∼

; 정규 분포와 확률 변수가 취하는 값의 범위는 동일 (상한 하한 없음)

; 확률 분포에서 모르는 값은 데이터의 개수를 의미하는 이며, 이것이 t-분포 모수가 됨

; 을 자유도(Degree of Freedom) 라고 함

; 따라서, 모수 만 알게 되면 확률 분포함수 전부를 아는 것과 동일함

(2) 기댓값과 분산

· t-분포의 기댓값과 분산

;

;

; 분포함수가 0을 중심으로 좌우대칭이므로 이 됨

; 분산의 유도 과정은 생략하고 그 의미만 정규 분포와의 관계에서 추가 설명함

(3) t-분포와 표준 정규 분포와의 관계

· t-분포와 표준 정규 분포의 형태는 동일

; 종 모양, 좌우 대칭

· t-분포의 기댓값과 표준 정규 분포의 기댓값은 동일

;

· t-분포의 분산은 표준 정규 분포의 분산인 1보다 항상 큰 값을 가짐

;

· 따라서 동일한 형태에 동일한 중심을 가지면서 분산이 표준 정규분포보다 큰 분포함수

- 21 -

(표준 정규분포와 자유도가 10인 t-분포 비교)

· t-분포의 모수인 이 충분히 커지는 경우 1에 근접하게 되는 성질을 가짐

;

; 즉, 자료의 개수가 충분히 클 경우 표준 정규 분포와 거의 동일한 모습을 가짐

(4) t-분포의 확률 계산

· 표준 정규 분포와 마찬가지로 수식적인 과정을 통한 확률의 계산이 어려움

· 따라서, t-분포표를 통하여 확률을 계산함

- 22 -

T 0.25 0.20 0.15 0.10 0.05 0.025 0.01 0.005 0.0005

1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657 636.619

2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 31.598

3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 12.941

4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 8.610

5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6.859

6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 5.959

7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 5.405

8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 5.041

9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 4.781

10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 4.587

11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 4.437

12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 4.318

13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 4.221

14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 4.140

15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 4.073

16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 4.015

17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.965

18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.922

19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.883

20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.850

21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.819

22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.792

23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.767

24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.745

25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.725

26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.707

27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.690

28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.674

29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.659

30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.646

∞ 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576 3.291

· t-분포표를 이용하여 확률을 확인하는 방법

; 좌측 열은 확률 변수 의 모수인 자유도를 나타냄

; 첫 번째 행은 t-분포함수가 가지는 확률을 의미함

; 즉, 표시된 확률을 그림으로 표현하면 다음과 그림에서 색깔로 표현한 부분과 같음

이를 수식으로 표현하면 임

- 23 -

; 해당 자유도에 원하는 확률에 대한 값 가 표에 주어져 있음

; 예를 들어 자유도 5에 해당 확률이 10%에 해당하는 확률 변수의 값을 찾으면 3.365임

; 확률 값들을 구하는 과정에 대하여 직접 구하여 연습하도록 함

[예제 5.11] 확률 변수 ∼ 라고 힐 때, 다음 물음에 답하시오.

(1) 을 구하시오

(2) 를 만족하는 값을 구하시오

(3) 를 만족하는 값을 구하시오

- 24 -

5.4 엑셀 실습

1. 이항 분포의 확률 계산

(1) 수식을 이용하는 방식

(2) 엑셀 함수를 이용하는 방식

2. 포아송 분포의 확률 계산

(1) 수식을 이용하는 방식

(2) 엑셀 함수를 이용하는 방식

3. 정규 분포의 확률 계산

(1) 수식을 이용하는 방식

(2) 엑셀 함수를 이용하는 방식

4. t-분포의 확률 계산

(1) 수식을 이용하는 방식

(2) 엑셀 함수를 이용하는 방식