cÁc khÁi ni Ệm c Ơ b Ản vỀ xÁc...

92
1 Chương 1 CÁC KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT 1.1. GIẢI TÍCH TỔ HỢP 1.1.1. Các quy tắc đếm 1. Quy tắc cộng: Nếu một công việc được chia ra làm k trường hợp để thực hiện: trường hợp 1 có n 1 cách thực hiện xong công việc; trường hợp 2 có n 2 cách thực hiện xong công việc, . . ., trường hợp k n k cách thực hiện xong công việc và không có bất kỳ một cách thực hiện nào ở trường hợp này lại trùng với một cách thực hiện ở trường hợp khác, thì có n 1 + n 2 + . . . . + n k cách thực hiện xong công việc. 2. Quy tắc nhân: Nếu một công việc được chia ra làm k giai đoạn: giai đoạn 1 có n 1 cách thực hiện xong công việc; giai đoạn 2 có n 2 cách thực hiện xong công việc, . . ., giai đoạn k n k cách thực hiện xong công việc thì có n 1 n 2 . . .n k cách thực hiện xong công việc. 3. Tích Descartes: Cho hai tập hợp A B. Tích Descartes của A B, ký hiệu là A B là tập hợp tất cả các cặp (có thứ tự) (a; b) với a A, b B, nghĩa là: A B = {(a, b) / a A; b B} Nếu A B là hai tập hữu hạn thì số phần tử của tập hợp A B A B = . A B . Tương tự, tích Descartes của k tập hợp A 1 , A 2 , . . ., A k , ký hiệu là A 1 A 2 . . . A k là tập hợp tất cả các bộ có thứ tự (a 1 , a 2 , . . ., a k ) trong đó a i A i , mọi i = 1, 2, . . ., k. A 1 A 2 . . . A k = {(a 1 , a 2 , . . ., a k ) / a i A i , i = 1, 2, . . ., k} Nếu A 1 , A 2 , . . ., A k là k tập hữu hạn thì số phần tử của tập hợp A 1 A 2 . . . A k 1 2 ... k A A A = 1 A 2 A . . . k A . Ký hiệu k A = A A . . . A. k lần 1.1.2. Chỉnh hợp lặp Cho A là một tập hợp có n phần tử, nỗi phần tử của tập A k được gọi là một chỉnh hợp lặp n chập k.

Upload: doannhi

Post on 07-Feb-2018

220 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

1

Chương 1

CÁC KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT

1.1. GIẢI TÍCH TỔ HỢP

1.1.1. Các quy tắc đếm

1. Quy tắc cộng:

Nếu một công việc được chia ra làm k trường hợp để thực hiện: trường hợp 1 có n1

cách thực hiện xong công việc; trường hợp 2 có n2 cách thực hiện xong công việc, . . .,

trường hợp k có nk cách thực hiện xong công việc và không có bất kỳ một cách thực hiện

nào ở trường hợp này lại trùng với một cách thực hiện ở trường hợp khác, thì có n1 + n2 + .

. . . + nk cách thực hiện xong công việc.

2. Quy tắc nhân:

Nếu một công việc được chia ra làm k giai đoạn: giai đoạn 1 có n1 cách thực hiện xong

công việc; giai đoạn 2 có n2 cách thực hiện xong công việc, . . ., giai đoạn k có nk cách thực

hiện xong công việc thì có n1n2 . . .nk cách thực hiện xong công việc.

3. Tích Descartes:

Cho hai tập hợp A và B. Tích Descartes của A và B, ký hiệu là A B là tập hợp tất

cả các cặp (có thứ tự) (a; b) với a A, b B, nghĩa là:

A B = {(a, b) / a A; b B}

Nếu A và B là hai tập hữu hạn thì số phần tử của tập hợp A B là A B = .A B .

Tương tự, tích Descartes của k tập hợp A1, A2, . . ., Ak, ký hiệu là A1 A2 . . .

Ak là tập hợp tất cả các bộ có thứ tự (a1, a2, . . ., ak) trong đó ai Ai, mọi i = 1, 2, . . ., k.

A1 A2 . . . Ak = {(a1, a2, . . ., ak) / ai Ai, i = 1, 2, . . ., k}

Nếu A1, A2, . . ., Ak là k tập hữu hạn thì số phần tử của tập hợp A1 A2 . . . Ak là

1 2 ... kA A A = 1A

2A . . . kA .

Ký hiệu kA = A A . . . A.

k lần

1.1.2. Chỉnh hợp lặp

Cho A là một tập hợp có n phần tử, nỗi phần tử của tập Ak được gọi là một chỉnh hợp

lặp n chập k.

Page 2: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

2

Số các chỉnh hợp lặp n chập k là

Fk

n = n

k

Ví dụ 1.1.

a. Có bao nhiêu cách sắp xếp 5 quyển sách vào 3 ngăn?

b. Một đề thi trắc nghiệm khách quan gồm 10 câu, mỗi câu có 4 phương án trả lời.

Hỏi bài thi có tất cả bao nhiêu phương án trả lời?

Giải:

a. Mỗi cách sắp xếp 5 quyển sách vào 3 ngăn là một chỉnh hợp lặp 3 chập 5 của (mỗi

lần xếp 1 quyển sách vào 1 ngăn xem như chọn 1 ngăn trong 3 ngăn, do có 5 quyển sách

nên việc chọn ngăn được tiến hành 5 lần).

Vậy số cách sắp xếp là 5

3F = 35 = 243.

b. Mỗi phương án trả lời bài thi là một chỉnh hợp lặp 4 chập 10, nên số các phương án

trả lời bài thi đó là 10

4F = 410

.

1.1.3. Chỉnh hợp (không lặp)

Mỗi phần tử của Ak có thành phần đôi một khác nhau được gọi là một chỉnh hợp n chập

k (k n).

Số các chỉnh hợp (không lặp) n chập k là

Αk

n = n(n - 1). . .(n – k + 1) =

!

( )!

n

n k

Quy ước: 0! = 1.

Ví dụ 1.2. Cho 6 chữ số 2, 3, 4, 5, 6,7. Hỏi

a. Có bao nhiêu số tự nhiên gồm 3 chữ số được thành lập từ 6 chữ số này?

b. Có bao nhiêu số tự nhiên gồm 3 chữ số khác nhau được thành lập từ 6 chữ số này?

c. Có bao nhiêu số tự nhiên gồm 3 chữ số khác nhau và chia hết cho 5 được thành lập

từ 6 chữ số này?

Giải:

Page 3: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

3

a. Mỗi số gồm 3 chữ số thành lập từ 6 chữ số này là một chỉnh hợp lặp 6 chập 3. Vậy,

số các số gồm 3 chữ số lập từ 6 chữ số này là 3

6F = 63 = 216.

b. Số các số có 3 chữ số khác nhau lập thành từ 6 chữ số này là số các chỉnh hợp 6

chập 3 là 3

6A = 6!

3! = 4.5.6 = 120.

c. Số chia hết cho 5 được thành lập từ 6 chữ số này phải có tận cùng là chữ số 5. Do

đó, mỗi cách thành lập một số có 3 chữ số khác nhau và chia hết cho 5 là một cách thành

lập một số có 2 chữ số khác nhau từ 5 chữ số còn lại là 2, 3, 4, 6, 7.

Vậy, số các số có 3 chữ số khác nhau và chia hết cho 5 thành lập từ 6 chữ số này là 2

5A

= 5!

3! = 20.

Ví dụ 1.3. Có bao nhiêu từ gồm 2 hoặc 3 mẫu tự khác nhau được thành lập từ 6 mẫu tự của

từ “MATRIX” (các từ này có thể có nghĩa hoặc không có nghĩa)?

Giải: Số các từ gồm 2 mẫu tự khác nhau là số chỉnh hợp 6 chập 2, 2

6A = 6!

4! = 5.6 = 30. Số

các từ gồm 3 mẫu tự khác nhau là số chỉnh hợp 6 chập 3, 3

6A = 6!

3! = 4.5.6 = 120.

Vậy, số các từ gồm 2 hoặc 3 mẫu tự khác nhau thành lập từ 6 mẫu tự của từ

“MATRIX” là 2

6A + 3

6A = 30 + 120 = 150.

1.1.4. Hoán vị

Một chỉnh hợp (không lặp) n chập n được gọi là một hoán vị của n phần tử.

Số các hoán vị của n phần tử là

n = An

n = !n

Ví dụ 1.4.

Một đoàn khách du lịch dự định đi tham quan 7 địa điểm khác nhau A, B, C, D, E, G,

H của thành phố Huế. Họ đi tham quan theo một lộ trình nào đó, chẳng hạn là B → A → C

→ E → D → H → G. Như vậy, mỗi lộ trình là một hoán vị của tập hợp gồm 7 phần tử là

{A, B, C, D, E, G, H} nên đoàn khách có tất cả 7! lộ trình để lựa chọn.

Ví dụ 1.5.

Page 4: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

4

a. Một bàn gồm 4 sinh viên. Hỏi có bao nhiêu cách sắp xếp chỗ ngồi cho 4 sinh viên

đó?

b. Có bao nhiêu cách sắp xếp 3 nam và 4 nữ thành một hàng ngang sao cho nam và nữ

đứng xen kẽ nhau?

Giải:

a. Số cách sắp xếp là số hoán vị của 4 phần tử, 4 = 4! = 24.

b. Để 3 nam và 4 nữ đứng xen kẽ nhau thì bắt đầu của hàng ngang đó phải là nữ và

chỉ có 1 cách sắp xếp vị trí như vậy:

Nữ Nam Nữ Nam Nữ Nam Nữ

Trong đó, số cách sắp xếp vị trí cho 3 nam là 3 = 3! và số cách sắp xếp vị trí cho 4 nữ

là 4 = 4!. Vậy, có tất cả 3!.4! = 144 cách sắp xếp vị trí cho 3 nam và 4 nữ.

1.1.5. Tổ hợp

Mỗi tập con gồm k phần tử của một tập hợp gồm n phần tử được gọi là một tổ hợp n

chập k (k n).

Số các tổ hợp n chập k, ký hiệu là Ck

n và được tính bởi công thức

Ck

n =

A

!

k

n

k =

!

!( )!

n

k n k

Các tính chất:

a. Cn k

n

= Ck

n, k = 0,n

b. 1Ck

n = Ck

n + 1Ck

n

, k = 1,n (Hằng đẳng thức Pascal).

Nhận xét: Hai tổ hợp khác nhau khi có ít nhất một phần tử khác nhau. Tổ hợp khác chỉnh

hợp ở việc không lưu ý đến thứ tự sắp xếp của các phần tử.

Ví dụ 1.6.

a. Mỗi đề thi gồm 3 câu hỏi lấy trong 25 câu hỏi cho trước. Hỏi có thể lập được bao

nhiêu đề thi khác nhau?

b. Một đa giác lồi có n cạnh thì có bao nhiêu đường chéo?

Page 5: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

5

Giải:

a. Số đoạn thẳng có 2 đầu mút là 2 đỉnh của đa giác lồi n đỉnh chính bằng số tổ hợp n

chập 2, tức là 2Cn. Do đó, số đường chéo của đa giác là 2Cn

- n.

b. Số đề thi có thể lập nên là 3

25C = 25!

3!22! =

25.24.23

1.2.3 = 2300.

Ví dụ 1.7. Một hội đồng gồm 5 nam và 4 nữ được tuyển vào một ban quản trị gồm 4

người.

a. Hỏi có bao nhiêu cách tuyển chọn?

b. Hỏi có bao nhiêu cách tuyển chọn nếu có thêm điều kiện ban quản trị phải có ít

nhất một nam và một nữ?

Giải:

a. Số cách tuyển chọn là số tổ hợp 9 chập 4, 4

9C = 9!

4!5! = 126.

b. Số cách chọn ban quản trị là số cách chọn 1 tập {x, y, z, t) trong đó x là 1 người

được chọn từ 5 nam, y là 1 người được chọn từ 4 nữ và z, t là 2 người được chọn từ 7

người còn lại. Như vậy, số ban quản trị có thể có là 5.4. 27C = 420.

1.1.6. Nhị thức Newton

Chúng ta đã biết một số hằng đẳng thức đơn giản như

a + b = a1 + b

1

(a + b)2 = a

2 + 2ab + b

2

(a + b)3 = a

3 + 3a

2b + 3ab

2 + b

3

Newton đã chứng minh được công thức tổng quát sau (nhị thức Newton):

(a + b)n = 0C n

na + 1 1C n

na b + ... + Ck n k k

na b + ... + Cn n

nb = 0

Cn

k n k k

n

k

a b

.

1.2. PHÉP THỬ - BIẾN CỐ NGẪU NHIÊN

Trong thực tế, chúng ta gặp nhiều thí nghiệm, phép quan sát mà khi thực hiện thì kết

quả không dự đoán trước được và sự kiện chúng ta quan tâm có thể xảy ra hoặc không xảy

ra. Lý thuyết xác suất gọi những phép thử như vậy là những phép thử ngẫu nhiên và các sự

kiện xảy ra hay không xảy ra đó là các biến cố ngẫu nhiên.

1.2.1. Các khái niệm

Page 6: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

6

Khi tiến hành gieo một con xúc sắc, gieo một đồng xu, gieo thí điểm một loại hạt

giống, lấy một sản phẩm từ một lô hàng để kiểm tra hoặc quan sát trạng thái hoạt động của

máy móc . . . người ta nói chúng ta đã làm một phép thử.

Tiến hành một phép thử: là thực hiện một tập hợp các điều kiện xác định nào đó.

Tất nhiên là khi tiến hành phép thử là chúng ta nhằm nghiên cứu một sự kiện hoặc một

hiện tượng nào đó. Chẳng hạn, khi “gieo thí điểm một loại hạt giống”, chúng ta quan tâm

đến sự kiện “nảy mầm” của hạt giống.

Biến cố: là một kết quả của phép thử, còn được gọi là một sự kiện.

Ví dụ 1.8. Thực hiện phép thử T “gieo 1 con xúc sắc cân đối và đồng chất”.

T kết thúc bởi 1 trong 6 kết quả cụ thể: ωi = “xuất hiện mặt i chấm”, i = 1, 2, . . ., 6.

Khi đó, ωi (i = 1, 2, …, 6) là các biến cố của T.

Ngoài ra, các kết quả phức hợp : U = “số chấm xuất hiện ≤ 6”

V = “số chấm xuất hiện > 6”

A = “số chấm xuất hiện là chẵn”

B = “số chấm xuất hiện là lẻ”

cũng là các biến cố của T.

Khi nói đến biến cố thì phải gắn liền với một phép thử. Tùy theo tính chất xuất hiện

của các biến cố trong phép thử, ta có thể phân loại các biến cố:

Phân loại:

+ Biến cố chắc chắn, ký hiệu là , là biến cố nhất thiết xảy ra khi phép thử thực

hiện.

+ Biến cố không thể, ký hiệu là , là biến cố nhất thiết không xảy ra khi phép thử

thực hiện.

+ Biến cố ngẫu nhiên, ký hiệu là A, B, C, . . . hay ω, là biến cố có thể xảy ra hoặc

không xảy ra khi phép thử thực hiện.

Biến cố sơ cấp: là kết quả cụ thể của phép thử, có thể hiểu đó là biến cố nhỏ nhất

không thể phân chia được nữa.

Ví dụ 1.9. Trong ví dụ 1.8, các biến cố ω1, . . ., ω6 gọi là các biến cố sơ cấp và U, V, A, B

là các biến cố nhưng không phải là các biến cố sơ cấp.

Page 7: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

7

Không gian mẫu hay không gian các biến cố sơ cấp của một phép thử, ký hiệu , là

tập hợp tất cả các biến cố sơ cấp của phép thử. Mỗi biến cố A của phép thử được xem là

một tập con của .

Ví dụ 1.10. Trong phép thử “gieo đồng thời 2 đồng xu cân đối và đồng chất”, ta có =

{(SS), (SN), (NN), (NS)}.

Nếu gọi A là biến cố “xuất hiện 2 mặt giống nhau” và B là biến cố “xuất hiện 2 mặt

khác nhau” thì A và B không phải là biến cố sơ cấp, vì biến cố A xảy ra khi (SS) hay (NN)

xảy ra và biến cố B xảy ra khi (SN) hay (NS) xảy ra.

1.2.2. Các phép toán – Quan hệ giữa các biến cố

1. Quan hệ “kéo theo”

Biến cố A gọi là kéo theo biến cố B, ký hiệu A B, nếu và chỉ nếu A xảy ra thì kéo

theo B cũng xảy ra. Mô tả hình học của quan hệ này có thể hình dung A là tập con của B.

Nếu ω là một biến cố sơ cấp kéo theo biến cố A thì ω được gọi là một biến cố sơ

cấp thuận lợi cho A.

2. Tổng của các biến cố

Tổng của 2 biến cố A và B, ký hiệu A B, là biến cố xảy ra khi ít nhất một trong

hai biến cố A hay B xảy ra.

Tổng của n biến cố A1, A2, . . . , An (n 2), ký hiệu 1

n

i

i

A

, là biến cố xảy ra khi ít

nhất một trong n biến cố đó xảy ra.

3. Tích của các biến cố

Tích của 2 biến cố A và B, ký hiệu A B (hay AB), là biến cố xảy ra khi và chỉ khi

cả hai biến cố đó cùng xảy ra.

A

B

B A

B A

Page 8: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

8

Tích của n biến cố A1, A2, . . . , An (n 2), kí hiệu 1

n

i

i

A

(hay 1

n

i

i

A

), là biến cố xảy

ra khi và chỉ khi n biến cố đó cùng xảy ra.

Ví dụ 1.11. Hai xạ thủ bắn mỗi người một viên đạn vào cùng một bia. Gọi A, B tương ứng

là các sự kiện xạ thủ 1 và xạ thủ 2 bắn trúng bia. Có thể mô tả các biến cố A B, A ∩ B

như sau: A B là biến cố “có ít nhất một viên đạn trúng bia” và A ∩ B là biến cố “có hai

viên đạn trúng bia”.

4. Biến cố xung khắc

Hai biến cố A và B được gọi là xung khắc nếu A và B không đồng thời xảy ra trong

cùng một phép thử, ký hiệu A ∩ B = .

Lưu ý, trong trường hợp A và B xung khắc thì tổng của hai biến cố A và B còn được ký

hiệu là A + B.

Nhóm n biến cố {A1, A2, . . . , An} (n 2) được gọi là xung khắc từng đôi nếu bất kỳ

hai biến cố nào trong nhóm cũng xung khắc với nhau, nghĩa là Ai ∩ Aj = mọi i j.

5. Nhóm đầy đủ các biến cố

Nhóm n biến cố {A1, A2, . . . , An} (n 2) được gọi là một nhóm đầy đủ các biến cố nếu

có một và chỉ một biến cố trong n biến cố đó xảy ra khi phép thử thực hiện, nghĩa là

Ai ∩ Aj = (i j) và 1

n

i

i

A

.

Ví dụ 1.12. Một xí nghiệp dược phẩm có 3 cơ sở cùng sản xuất một loại thuốc A để điều

trị bệnh khớp. Lấy ngẫu nhiên một sản phẩm của xí nghiệp để sử dụng. Gọi Ai = “Sản

phẩm do cơ sở i sản xuất” (i = 1, 2, 3). Khi đó, {A1, A2, A3} có phải là một nhóm đầy đủ

các biến cố hay không?

A B

Page 9: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

9

Giải: Lấy ngẫu nhiên một sản phẩm của xí nghiệp thì chỉ xảy ra một trong 3 trường hợp:

sản phẩm do cơ sở 1 sản xuất; sản phẩm do cơ sở 2 sản xuất hoặc sản phẩm do cơ sở 3 sản

xuất. Nói cách khác, ta có Ai ∩ Aj = (i j) và 1

n

i

i

A

, rõ ràng {A1, A2, A3} là một

nhóm đầy đủ các biến cố.

6. Hiệu của hai biến cố

Hiệu của 2 biến cố, ký hiệu A \ B, là một biến cố xảy ra khi và chỉ khi A xảy ra và

B không xảy ra, nghĩa là A \ B = A ∩ B .

7. Biến cố đối lập

Biến cố đối lập của biến cố A, ký hiệu A , là biến cố xảy ra khi và chỉ khi A không

xảy ra.

Như vậy, A = Ω\A hay A + A =

A ∩ A = .

1.3. ĐỊNH NGHĨA XÁC SUẤT

Việc xảy ra hay không xảy ra của một biến cố ngẫu nhiên ta không thể dự đoán trước

được. Tuy nhiên bằng trực quan có thể nhận thấy các biến cố ngẫu nhiên khác nhau thường

có khả năng xảy ra khác nhau, một số biến cố thường hay xảy ra, một số khác lại thường ít

xảy ra. Từ đó nảy sinh vấn đề tìm cách “đo lường” khả năng xuất hiện của mỗi biến cố và

khái niệm xác suất ra đời. Xác suất của biến cố là một số không âm, đặc trưng cho khả

năng khách quan xảy ra của biến cố đó.

1.3.1. Định nghĩa xác suất theo quan điểm đồng khả năng

Ta xét ví dụ sau: Thực hiện phép thử “gieo đồng thời 2 đồng xu cân đối và đồng chất”.

Khi đó, = {SS, NN, SN, NS}.

B

A

A

Page 10: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

10

Nếu đồng xu được chế tạo cân đối thì các mặt của đồng xu có cùng khả năng xuất hiện

nên khả năng xảy ra của 4 kết quả này là ngang nhau, ta nói phép thử có 4 biến cố sơ cấp

đồng khả năng.

Gọi A là biến cố “xuất hiện 2 mặt khác nhau”, nghĩa là xuất hiện một sấp (S) và một

ngửa (N). Khi đó, có 2 trường hợp thuận lợi cho A hay có 2 biến cố sơ cấp thuận lợi cho A.

Như vậy, khả năng để biến cố A xảy ra là 2 1

4 2 .

1. Định nghĩa 1.1. (Theo quan điểm đồng khả năng)

Nếu trong một phép thử có tất cả n biến cố sơ cấp đồng khả năng, trong đó có m biến

cố sơ cấp thuận lợi cho A, thì xác suất của A, ký hiệu P(A) xác định bởi:

P(A) = Số biến cố sơ cấp thuận lợi cho A

Số biến cố sơ cấp đồng khả năng =

m

n

2. Tính chất 1.1.

1) 0 ≤ P(A) ≤ 1.

2) P(Ω) = 1, P() = 0.

3) Nếu A và B xung khắc thì P(A + B) = P(A) + P(B).

Chứng minh:

1) Với A là biến cố bất kỳ thì 0 m n. Từ đó suy ra 0 m

n 1 hay 0 P(A) 1.

2) Nếu Ω là biến cố chắc chắn của phép thử thì số biến cố sơ cấp thuận lợi cho Ω bằng

số biến cố sơ cấp đồng khả năng của phép thử. Do đó, P(Ω) = 1

3) Nếu A và B là hai biến cố xung khắc thì sẽ không có biến cố sơ cấp nào thuận lợi

cho cả A và B. Nói cách khác, số biến cố sơ cấp thuận lợi cho biến cố tổng A + B bằng

tổng số biến cố sơ cấp thuận lợi cho A và số biến cố sơ cấp thuận lợi cho B: m = m1 + m2

trong đó m1 là số biến cố sơ cấp thuận lợi cho A và m2 là số biến cố sơ cấp thuận lợi cho B.

Từ đó suy ra

P(A + B) = 1 2m m

n

= 1m

n + 2m

n = P(A) + P(B).

Hệ quả 1.1. P(A) = 1 – P(A).

Page 11: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

11

Ví dụ 1.13. Một hộp đựng 8 bi xanh và 4 bi trắng. Ta lấy ngẫu nhiên 3 bi, hãy tính xác suất

để lấy được 1 bi xanh và 2 bi trắng?

Giải: Ta lấy ngẫu nhiên 3 bi từ một hộp chứa 12 bi thì sẽ có 3

12C trường hợp đồng khả năng

hay số biến cố sơ cấp đồng khả năng là n = 3

12C = 220.

Gọi A là biến cố “lấy được 1 bi xanh và 2 bi trắng” thì sẽ có 1

8C . 2

4C trường hợp thuận

lợi cho A hay số biến cố sơ cấp thuận lợi cho A là m = 1

8C . 2

4C = 8.3 = 24.

Vậy, xác suất để A xảy ra là P(A) = m

n =

24

220 0,109.

Nhận xét: Định nghĩa xác suất theo quan điểm đồng khả năng đòi hỏi các biến cố sơ cấp

phải có tính đồng khả năng. Thường thì tính đồng khả năng được suy ra từ tính đối xứng,

chẳng hạn: khi gieo một xúc sắc hay gieo một đồng xu, chúng ta có thể giả thiết nó là cân

đối và đồng chất.Tuy nhiên, đây là điều kiện lý tưởng mà trên thực tế thì không có lý do

nào để đảm bảo được điều đó. Hơn nữa, những bài toán trong đó ta có thể đưa ra giả thuyết

về tính đối xứng thường rất hiếm gặp trong thực tế. Để khắc phục hạn chế của định nghĩa

này, người ta đưa ra định nghĩa xác suất theo quan điểm thống kê.

1.3.2. Định nghĩa xác suất theo quan điểm thống kê

Định nghĩa theo thống kê dựa trên tần suất xuất hiện của biến cố trong một lớp các

phép thử.

1. Tần suất xuất hiện của biến cố

Giả sử tiến hành n phép thử cùng loại và trong mỗi phép thử ta quan tâm đến sự xuất

hiện của biến cố A nào đó.

Xét ví dụ: Kiểm tra ngẫu nhiên lần lượt 100 sản phẩm do một nhà máy sản xuất, người

ta phát hiện thấy có 5 phế phẩm. Gọi A = “xuất hiện phế phẩm”.

Khi đó, tỉ số 5

100 gọi là tần suất xuất hiện của A trong 100 lần thử, ký hiệu:

100

5( ) 0,05

100f A .

Một cách tổng quát, ta có định nghĩa sau:

Định nghĩa 1.2. Tần suất xuất hiện của A trong n lần thử, ký hiệu là ( )nf A , được xác định

bởi:

Page 12: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

12

( )nf A k

n =

Số lần xuất hiện của A

Số phép thử

Nhận xét: Khi số phép thử n thay đổi thì tần suất xuất hiện biến cố cũng thay đổi. Người ta

nhận thấy nếu n nhỏ thì tần suất có sự dao động rất lớn. Tuy nhiên, nếu n khá lớn thì tần

suất xuất hiện biến cố thể hiện tính ổn định khá rõ ràng.

Ví dụ 1.14. Nghiên cứu khả năng xuất hiện mặt sấp khi gieo một đồng xu, Buffon và

K.Pearson đã tiến hành gieo một đồng xu nhiều lần liên tiếp và thu được kết quả sau

Người làm thí nghiệm Số lần gieo Số lần xuất hiện

mặt sấp (S) Tần suất

Buffon 4040 2048 0,5069

Pearson 12000 6019 0,5016

Pearson 24000 12012 0,5005

Quan sát bảng kết quả cho thấy tần suất xuất hiện mặt sấp của đồng xu trong n lần tung

ổn định dần về giá trị 0,5.

2. Định nghĩa xác suất (Theo quan điểm thống kê)

Định nghĩa 1.3. Khi số lần thực hiện phép thử n khá lớn, nếu tần suất của biến cố A ổn

định dần về một giá trị p nào đó thì ta nói A ổn định ngẫu nhiên và số p được gọi là xác

suất của biến cố A, ký hiệu P(A).

Từ định nghĩa xác suất theo quan điểm thống kê, ta có thể xấp xỉ P(A) với ( )nf A khi n

khá lớn.

P(A) ( )nf A khi n khá lớn.

1.3.3. Định nghĩa xác suất theo quan điểm hình học

Để khắc phục hạn chế của định nghĩa xác suất đòi hỏi phép thử phải có hữu hạn các

biến cố sơ cấp đồng khả năng, người ta đưa ra định nghĩa xác suất theo quan điểm hình

học. Định nghĩa này mở rộng cho trường hợp phép thử có vô hạn các biến cố sơ cấp đồng

khả năng.

Định nghĩa 1.4. ( Theo quan điểm hình học)

Page 13: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

13

Xét phép thử ngẫu nhiên mà không gian các biến cố sơ cấp được biểu diễn bằng một

miền hình học H nào đó trong không gian , 2hay

3 và tập các biến cố sơ cấp thuận

lợi cho biến cố A được biểu diễn bởi một miền G H.

Khi đó, nếu mọi điểm của là đồng khả năng thì xác suất của biến cố A là

P(A) = Độ đo miền G

Độ đo miền H

H : độ đo là độ dài.

H 2: độ đo là diện tích.

H 3: độ đo là thể tích.

Ví dụ 1.15. Gieo 1 chấm điểm một cách ngẫu nhiên vào mảnh vải hình vuông H cạnh a,

trong đó có một hình tròn G bán kính 4

ar . Tìm xác

suất để chấm điểm rơi vào trong hình tròn?

Giải:

Khi phép thử “gieo một chấm điểm vào mảnh vải

hình vuông H” thực hiện thì sẽ có vô hạn các trường hợp

có thể xảy ra. Tập các biến cố sơ cấp đồng khả năng có thể có được biểu diễn bởi miền

hình vuông H có cạnh a.

Gọi A là biến cố “chấm điểm rơi vào trong hình tròn G”. Khi đó, các biến cố sơ cấp

thuận lợi cho A cũng không thể xác định cụ thể. Tuy nhiên, ta nhận thấy rằng tập các biến

cố sơ cấp thuận lợi cho A được biểu diễn bởi miền hình tròn G có bán kính 4

ar .

Theo định nghĩa xác suất, ta có xác suất để A xảy ra là

hay P(A) =

2

2

16

a

a

=

16

.

Những biến cố có xác suất càng gần 1 thì rất dễ xảy ra và được xem là hầu như chắc

chắn. Ngược lại, những biến cố có xác suất rất nhỏ thì khả năng xảy ra rất ít và được xem

P( )A Diện tích G

Diện tích H

2

2

r

a

a

G

H

Page 14: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

14

là hầu như không thể xảy ra. Việc quy định một mức xác suất như thế nào để có thể xem là

hầu như chắc chắn hay hầu như không chắc chắn tùy thuộc vào từng bài toán cụ thể. Chẳng

hạn nếu xác suất máy bay rơi là 0,01 thì xác suất đó chưa thể xem là nhỏ, hầu như không

thể xảy ra. Nhưng nếu xác suất một chuyến tàu khởi hành chậm là 0,01 thì có thể xem xác

suất này là rất nhỏ.

1.4. CÁC QUY TẮC TÍNH XÁC SUẤT

1.4.1. Định lý cộng xác suất

Từ định nghĩa xác suất, ta đã suy ra được tính chất cơ bản sau của xác suất:

+ Nếu A, B là hai biến cố xung khắc thì

P(A + B) = P(A) + P(B). (1.1)

+ Tổng quát, nếu A1, A2, . . . , An là n biến cố xung khắc từng đôi thì

1 1

( ) ( )n n

i i

i i

A A

. (1.2)

Định lý 1.1. (Định lý cộng xác suất)

Nếu A, B là hai biến cố bất kỳ thì P(A B) = P(A) + P(B) – P(AB). (1.3)

Chứng minh:

Trường hợp A, B là hai biến cố bất kỳ, biến cố tổng của chúng có thể biểu diễn thành

tổng của 2 biến cố xung khắc là A B = A + BA . Khi đó, P(A B) = P(A) + P( BA ).

Mặt khác, B = ( )B A A = BA + BA nên P(B) = P(BA) +

P( BA ), suy ra P( BA ) = P(B) - P(BA). Từ đó, ta có

P(A B) = P(A) + P(B) – P(AB).

Mở rộng:

Nếu A, B, C là ba biến cố bất kỳ thì

P(A B C) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC)

Nếu A1, A2, . . . , An là một nhóm đầy đủ các biến cố thì 1

( ) 1n

i

i

A

.

Ví dụ 1.16. Trong một lớp học, tỉ lệ học sinh đạt điểm giỏi môn Toán là 10%, tỉ lệ học sinh

đạt điểm giỏi môn Anh là 9% và giỏi cả hai môn là 5%. Chọn ngẫu nhiên một học sinh

trong lớp. Tính xác suất để học sinh đó không đạt điểm giỏi cả môn Toán lẫn môn Anh?

A B

B A

Page 15: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

15

Giải: Gọi A là biến cố “Sinh viên đó đạt điểm giỏi môn Toán”, B là biến cố “Sinh viên đó

đạt điểm giỏi môn Anh”. Theo giả thiết thì

P(A) = 0,01, P(B) = 0,09 và P(AB) = 0,05

Gọi C là biến cố “Sinh viên đó không đạt điểm giỏi cả môn Toán lẫn môn Anh” thì C

là biến cố “Sinh viên đó đạt điểm giỏi môn Toán hoặc môn Anh” hay C = A B. Theo

định lý cộng xác suất (1.3), ta có

P(C ) = P(A B) = P(A) + P(B) – P(AB) = 0,01 + 0,09 – 0,05 = 0,14.

Suy ra, P(C) = 1- P(C ) = 1- 0,14 = 0,86.

1.4.2. Định lý nhân xác suất

1. Xác suất có điều kiện

Xét ví dụ: Một hộp chứa 10 viên bi giống nhau, trong đó có 6 bi xanh và 4 bi trắng.

Người thứ 1 lấy ngẫu nhiên 1 bi (không trả lại vào hộp).

Tiếp đó, người thứ 2 lấy 1 bi. Tính xác suất để người thứ 2

lấy được bi xanh nếu biết người thứ 1 đã lấy được bi xanh?

Giải:

Gọi A là biến cố “Người thứ 1 lấy được bi xanh”

B là biến cố “Người thứ 2 lấy được bi xanh”. Khi đó, xác suất P(B) sẽ phụ thuộc

vào việc A xảy ra hay không xảy ra.

+ Nếu A đã xảy ra thì xác suất của B là 5

9, ký hiệu

5( | )

9P B A .

+ Nếu A không xảy ra thì xác suất của B là 6

9, ký hiệu

6( | )

9P B A .

Như vậy, việc xảy ra hay không xảy ra của A đã ảnh hưởng đến khả năng xảy ra của B.

Xác suất của B trong điều kiện A đã xảy ra được gọi là xác suất có điều kiện của B trong

điều kiện A đã xảy ra, ký hiệu ( | )P B A .

Định nghĩa 1.5. Giả sử là không gian các biến cố sơ cấp và B là một biến cố ngẫu nhiên

của phép thử. Nếu P(B) > 0 thì xác suất có điều kiện của biến cố A với điều kiện B đã xảy

ra, ký hiệu ( | )A B , được xác định bởi:

Page 16: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

16

( )

( | )( )

ABA B

B

. (1.4)

Tính chất 1.2.

1) 0 ( | )A B 1.

2) ( | )B = 1.

3) ( | )B B = 1.

4) Nếu A ∩ C = thì (( ) | )A C B = ( | )A B + ( | )C B .

5) ( | )A B = 1 - ( | )A B .

Ví dụ 1.17. Trong một vùng dân cư, tỉ lệ người mắc bệnh tim là 9%, mắc bệnh huyết áp là

12%, mắc cả bệnh tim và huyết áp là 7%. Chọn ngẫu nhiên một người dân trong vùng, biết

người đó mắc bệnh tim, tìm xác suất để người đó không mắc bệnh huyết áp?

Giải:

Gọi A là biến cố “người đó bị mắc bệnh tim”

B là biến cố “người đó bị mắc bệnh huyết áp”.

Theo giả thiết, ta có

P(A) = 0,09 , P(B) = 0,12 và P(AB) = 0,07

Khi đó, ( | )B A là xác suất người chọn ra bị mắc bệnh

huyết áp biết người đó đã mắc bệnh tim. Vậy thì ( | )B A chính là xác suất người chọn ra

không bị mắc bệnh huyết áp biết người đó đã mắc bệnh tim.

Theo công thức xác suất có điều kiện (1.4)

( | )B A = ( )

( )

BA

A

=

0,07

0,09 0,667.

Do đó, ( | )B A = 1 - ( | )B A = 1 – 0,667 0,333.

Ví dụ 1.18. Để xét hiệu quả của một loại Vaccine, người ta điều tra tình hình mắc bệnh

trên 1000 người dân có và không tiêm phòng loại Vaccine này. Số liệu thu được như sau:

Mắc bệnh Không mắc bệnh Tổng số

Có tiêm phòng (A) 12 188 200

Không tiêm phòng (B) 288 512 800

9% 12%

7%

Page 17: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

17

Tổng số 300 700 1000

a. Chọn ngẫu nhiên một người trong số 1000 người này, biết người đó có tiêm phòng.

Xét xem khả năng người đó mắc bệnh là bao nhiêu?

b. Chọn ngẫu nhiên một người trong số 1000 người đó, biết người đó thuộc nhóm

không tiêm phòng. Xét xem khả năng người đó không mắc bệnh là bao nhiêu?

Giải:

a. Gọi A là biến cố “người đó có tiêm phòng”; B là biến cố “người đó không tiêm

phòng”; C là biến cố “người đó bị mắc bệnh” và D là biến cố “người đó không bị mắc

bệnh”.

Khi đó, P(A) 200

1000 = 0,2 P(B)

800

1000 = 0,8

P(C) 300

1000 = 0,3 P(D)

700

1000 = 0,7.

AC là biến cố “người đó có tiêm phòng và bị mắc bệnh”

AD là biến cố “người đó có tiêm phòng và không bị mắc bệnh”

BC là biến cố “người đó không tiêm phòng và mắc bệnh”

BD là biến cố “người đó không tiêm phòng và không bị mắc bệnh”.

P(AC) 12

1000 = 0,012 P(AD)

188

1000 = 0,188

P(BC) 288

1000 = 0.288 P(BD)

512

1000 = 0,512.

( | )C A là xác suất người được chọn bị mắc bệnh biết người đó có tiêm phòng, ta có

( | )C A = P( )

P( )

AC

A

12

200 = 0,06.

b. ( | )C B là biến cố người được chọn không bị mắc bệnh biết người đó thuộc nhóm

không tiêm phòng, ta có

( | )C B = P( )

P( )

BC

B

288

800 = 0,36.

2. Tính độc lập của các biến cố

Page 18: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

18

Định nghĩa 1.6. Hai biến cố A và B được gọi là độc lập với nhau nếu việc xảy ra hay

không xảy ra của biến cố này không ảnh hưởng đến khả năng xảy ra của biến cố kia và

ngược lại. Nói cách khác, hai biến cố A và B được gọi là độc lập với nhau nếu

( | ) ( )B A B hay ( | ) ( )A B A .

Mở rộng khái niệm độc lập cho n biến cố, ta có

Hệ A1, A2, . . . , An gọi là độc lập từng đôi nếu và chỉ nếu bất kỳ hai biến cố nào

trong nhóm cũng độc lập với nhau, nghĩa là ( | ) ( )i k iA A A (i k).

Hệ A1, A2, . . . , An gọi là độc lập trong toàn thể nếu và chỉ nếu bất kỳ biến cố nào

trong nhóm cũng độc lập với tích một số bất kỳ các biến cố trong (n – 1) biến cố còn lại.

Điều này có nghĩa là mọi dãy (i1, i2, . . ., ik) (1, 2, . . ., n),

1( | ... ) ( )

kj i i jA A A A , j {i1, i2, . . ., ik}.

3. Định lý nhân xác suất

Định lý 1.2. (Định lý nhân xác suất)

a. Với A, B là 2 biến cố bất kỳ, ta có ( ) ( | ). ( )AB A B B với P(B) > 0. (1.5)

b. Với A1, A2, . . . , An là n biến cố bất kỳ, ta có:

1 1 2 1 3 1 2 1 2 1P( ... ) P( )P( | )P( | )...P( | ... )n n nA A A A A A A A A A A A (1.6)

Từ định nghĩa về tính độc lập của các biến cố và định lý nhân xác suất, ta suy ra:

c. Hai biến cố A và B độc lập với nhau nếu và chỉ nếu ( ) ( ). ( )AB A B .

d. Nếu {A1, AI, . . . , An} độc lập trong toàn thể thì 1 2 1P( ... ) P( )...P( )n nA A A A A .

Ví dụ 1.19. Hai xạ thủ bắn mỗi người một viên vào cùng một mục tiêu. Xác suất trúng

đích của xạ thủ 1 là 0,7; của xạ thủ 2 là 0,6. Tính xác suất để mục tiêu bị trúng đạn?

Giải: Gọi A là biến cố “xạ thủ 1 bắn trúng mục tiêu”

B là biến cố “xạ thủ 2 bắn trúng mục tiêu”

H là biến cố “mục tiêu bị trúng đạn”.

Lúc đó, P(A) = 0,7, P(B) = 0,6 và H = A B. Theo công thức cộng xác suất,

P(H) = P(A B) = P(A) + P(B) – P(AB).

Mặt khác, do hai biến cố A và B độc lập với nhau nên ( ) ( ). ( )AB A B = 0,7.0,6 = 0,42.

Suy ra, xác suất để mục tiêu bị trúng đạn là

P(H) = 0,7 + 0,6 – 0,42 = 0,88.

Page 19: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

19

Ví dụ 1.20. Một người bắn liên tiếp vào một mục tiêu cho đến khi có một phát đạn trúng

mục tiêu thì ngưng bắn. Biết rằng xác suất trúng mục tiêu của mỗi lần bắn là như nhau và

bằng 0,6. Tính xác suất sao cho khi bắn đến phát thứ tư thì ngưng bắn.

Giải: Gọi Ai là biến cố “phát thứ i trúng mục tiêu”, i = 1, 2, 3, . . ., n.

A là biến cố “bắn đến phát thứ tư thì ngưng”

Ta có, A = 1A 2A 3A 4A . Theo định lý nhân xác suất thì:

P(A) = P(1A )

2 1( | )A A 3 1 2( | . )A A A 4 1 2 3( | . . )A A A A .

Trong đó, P(1A ) = 1 – 0,6 = 0,4.

Mặt khác, do 2A

1A ; 3A

2A 1A nên

1A 2A = 2A và

1A 2A 3A = 3A . Từ đó

suy ra 2 1( | )A A = 1 – 0,6

3 1 2( | . )A A A = 3 2( | )A A = 1 - 0,6

4 1 2 3( | . . )A A A A =

4 3( | )A A = 0,6.

Vậy, P(A) = 0,4.0,4.0,4.0,6 = 0,0384.

1.4.3. Công thức xác suất đầy đủ - Công thức Bayes

1. Công thức xác suất đầy đủ

Định lý 1.3. Giả sử {A1, A2, . . . , An} là một nhóm đầy đủ các biến cố, P(Ai) > 0 (i = 1, n)

và B là biến cố bất kỳ trong cùng phép thử. Khi đó,ta có

1

( ) ( | ). ( )n

i i

i

B B A A

(1.7)

Chứng minh: Cho {A1, A2, . . . , An} là nhóm đầy đủ các biến cố và B là một biến cố bất kỳ

của phép thử, ta có B = BA1 + . . . + BAn , ở đây {BA1, . . ., BAn}

xung khắc từng đôi nên theo công thức cộng xác suất

P(B) = P(BA1) + . . . + P(BAn).

Hơn nữa, theo công thức nhân xác suất ( ) ( | ). ( )i i iBA B A A với P(Ai) > 0. Do đó,

ta có 1

( ) ( | ). ( )n

i i

i

B B A A

.

Công thức này được gọi là công thức xác suất đầy đủ, nó cho phép tính xác suất của

biến cố B đối với toàn nhóm biến cố đầy đủ A1, A2, . . . , An.

2. Công thức xác suất Bayes

B

A1

A2

An

Page 20: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

20

Cho {A1, A2, . . ., An} là một nhóm đầy đủ các biến cố với P(Ai) > 0 và B là một biến cố

bất kỳ trong cùng phép thử, P(B) > 0.

Theo công thức nhân xác suất: ( . ) ( | ). ( )k kA B A B B (P(B) > 0)

( . ) ( | ). ( )k k kA B B A A (P(Ak) > 0)

Suy ra, ( | ). ( )

( | )( )

k kk

B A AA B

B

thay P(B) bằng công thức xác suất đầy đủ, ta có

1

( | ). ( )( | )

( | ). ( )

k kk n

i i

i

B A AA B

B A A

.

Ta có định lý sau

Định lý 1.4. Cho {A1, A2, . . ., An} là một nhóm đầy đủ các biến cố với P(Ai) > 0 và B là

một biến cố bất kỳ trong cùng phép thử, P(B) > 0. Khi đó,

1

( | ). ( )( | )

( | ). ( )

k kk n

i i

i

B A AA B

B A A

, k = 1, 2, . . ., n (1.8)

Công thức này được gọi là công thức xác suất Bayes. Các xác suất P(A1), P(A2), . . .,

P(An) được xác định trước khi phép thử được tiến hành, được gọi là các xác suất tiên

nghiệm. Các xác suất ( | )kA B được xác định sau khi phép thử được tiến hành và biến cố

B đã xảy ra, được gọi là các xác suất hậu nghiệm.

Ví dụ 1.21. Một trại chăn nuôi nhận 50 con giống từ ba cơ sở, trong đó 15 con thuộc cơ sở

1; 10 con thuộc cơ sở 2 và 25 con thuộc cơ sở 3. Tỉ lệ con giống không đạt tiêu chuẩn của

mỗi cơ sở tương ứng là 16%, 15% và 12%.

a. Hãy xác định tỉ lệ con giống đạt tiêu chuẩn của cả lô con giống?

b. Kiểm tra ngẫu nhiên 1 con từ trại chăn nuôi này thấy không đạt tiêu chuẩn. Hãy xét

xem trách nhiệm thuộc về cơ sở nào là lớn hơn?

Giải:

a. Khi thực hiện phép thử “kiểm tra một con giống của trại chăn nuôi” thì có một và

chỉ một trong 3 biến cố sau xảy ra:

Ai = “con giống thuộc cơ sở i” i = 1, 2, 3. Khi đó, {A1, A2, A3} là một nhóm đầy đủ

các biến cố.

Gọi B là biến cố “con giống không đạt tiêu chuẩn”. Theo giả thiết, ta có

Page 21: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

21

P(A1) = 0,3 P(A2) = 0,2 P(A3) = 0,5

1( | ) 0,16B A 2( | ) 0,15B A 3( | ) 0,12B A .

Cần tính P( B )?

Theo công thức xác suất đầy đủ, ta có 3

1

( ) ( | ) ( )i i

i

P B P B A P A

= 0,3 . 0,16 + 0,2 . 0,15 +

0,5 . 0,12 = 0,048 + 0,03 + 0,06 = 0,138. Từ đó suy ra, xác suất để một con giống đạt tiêu

chuẩn là P( B ) = 1 – P(B) = 1 - 0,138 = 0,862.

Vậy, tỉ lệ con giống đạt tiêu chuẩn của cả lô con giống là 86,2%.

b. B đã xảy ra, cần tính và so sánh 1( | )A B ,

2( | )A B , 3( | )A B ?

Áp dụng công thức xác suất Bayes

1 11

( | ). ( ) 0,3.0,16 0,048( | )

( ) 0,138 0,138

B A AA B

B

2 22

( | ). ( ) 0, 2.0,15 0,03( | )

( ) 0,138 0,138

B A AA B

B

3 33

( | ). ( ) 0,5.0,12 0,06( | )

( ) 0,138 0,138

B A AA B

B

.

Ta thấy 3( | )A B là lớn nhất nên nhiều khả năng nhất là con giống không đạt tiêu

chuẩn đó được nhận về từ cơ sở 3. Nghĩa là, trách nhiệm thuộc về cơ sở 3 là lớn hơn.

1.5. DÃY PHÉP THỬ BERNOULLI

Định nghĩa 1.7. Một phép thử trong đó biến cố A xảy ra với xác suất p và không xảy ra với

xác suất q = 1 – p được gọi là phép thử Bernoulli. Tiến hành lặp lại phép thử Bernoulli n

lần độc lập nhau, ta có dãy n phép thử Bernoulli hay còn gọi là lược đồ Bernoulli.

Chẳng hạn, tỷ lệ nảy mầm của một loại hạt giống là 75%, người ta gieo thí điểm 10 hạt.

Đó là dãy 10 phép thử Bernoulli.

1.5.1. Công thức Bernoulli

Bài toán đặt ra: Tìm xác suất để trong n phép thử Bernoulli, biến cố A xuất hiện k lần.

Định lý 1.5. Xác suất để trong n phép thử Bernoulli, biến cố A xuất hiện đúng k lần, ký

hiệu ( )n k , được tính theo công thức:

( ) Ck k n k

n nk p q với 0,k n . (1.9)

Chứng minh:

Page 22: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

22

Gọi B = “trong n phép thử, A xuất hiện k lần”.

B xảy ra theo nhiều phương thức khác nhau, trong đó việc xảy ra của A đúng k lần và A

đúng n – k lần có thể diễn ra theo các trình tự khác nhau. Nói cách khác, B là tổng của các

biến cố xung khắc có dạng sau

1 2 1 1 2 1... ... ... ... ...k k n n k n k nB A A A A A A A A A A

Mỗi biến cố thành phần của B là một cách chọn k phép thử trong đó A xảy ra từ n vị trí,

suy ra tổng số các biến cố thành phần của B là Ck

n.

Mặt khác, Ai và Aj độc lập với nhau nên mỗi biến cố thành phần của B có xác suất là

k n kp q .

Hơn nữa, các biến cố thành phần của B là các biến cố xung khắc từng đôi nên

( ) Ck k n k

nB p q .

Hệ quả 1.2. Xác suất để trong n phép thử Bernoulli có từ k1 đến k2 lần xuất hiện biến cố A,

kí hiệu 1 2( , )n k k , được tính theo công thức

2

1

1 2( , ) Ck

k k n k

n n

k k

k k p q

.

Ví dụ 1.22. Xác suất thành công của một thí nghiệm sinh học là 0,7. Một nhóm gồm 5 sinh

viên cùng tiến hành thí nghiệm trên một cách độc lập nhau. Tính xác suất để trong 5 thí

nghiệm:

a. Có đúng 3 thí nghiệm thành công.

b. Có từ 2 đến 4 thí nghiệm thành công.

c. Có ít nhất 1 thí nghiệm thành công.

Giải:

a. Gọi A là biến cố “thí nghiệm thành công”. Khi đó, P(A) = p = 0,7.

Xác suất để có đúng 3 thí nghiệm thành công được tính theo công thức Bernoulli là

5 (3;0,7) = 3 3 2

5C (0,7) .(0,3) = 0,3087.

b. Xác suất để có từ 2 đến 4 thí nghiệm thành công là 5 (2, 4) = 2 2 3

5C (0,7) .(0,3) +

3 3 2

5C (0,7) .(0,3) + 4 4 1

5C (0,7) .(0,3) = 0,80115.

c. Gọi B là biến cố “có ít nhất 1 thí nghiệm thành công”. Khi đó,

B là biến cố “không có thí nghiệm nào thành công”.

Page 23: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

23

Ta có, P( B ) = 5 (0;0,7) = 0 0 5

5C (0,7) .(0,3) = 0,00243.

Suy ra, P(B) = 1 - P( B ) = 0,99757.

1.5.2. Số có khả năng nhất

Bài toán đặt ra: Khi gieo thí điểm 10 hạt giống, khả năng lớn nhất là có bao nhiêu hạt

nảy mầm. Theo công thức Bernoulli, có thể tính được xác suất để trong 10 hạt được gieo

có k hạt nảy mầm (k = 0, 1, 2, ..., 10). Trong các xác suất này sẽ tồn tại số lớn nhất và k0

ứng với xác suất lớn nhất sẽ là số hay xảy ra nhất.

Định nghĩa 1.8. Cho một dãy n phép thử Bernoulli (độc lập), số k0 mà ứng với nó 0( )n k

lớn nhất được gọi là số có khả năng nhất:

00

( ) max ( )nk n

k k

.

Quy tắc tìm số có khả năng nhất:

a. Nếu (n + 1)p là số nguyên thì k0 = (n + 1)p và k0 = (n + 1)p – 1

b. Nếu (n + 1)p là số thập phân thì k0 là số nguyên lớn nhất thỏa mãn

k0 < (n + 1)p

Chứng minh: Xét sự biến thiên của ( )n k theo k để tìm k0.

Ta lập tỉ số ( 1)

( )

n

n

k

k

=

1 1 1C .

C .

k k n k

n

k k n k

n

p q

p q

=

( ).

( 1).

n k p

k q

.

Từ đây suy ra rằng, ( 1) ( )n nk k khi k < np - q hay k < (n+1)p – 1; ( 1) ( )n nk k

khi k = np – q hay k = (n+1)p – 1; ( 1) ( )n nk k khi k > np – q hay k > (n+1)p – 1.

Ta thấy khi k tăng từ 0 đến n, hàm ( )n k thoạt tiên tăng, sau đó đạt cực đại, rồi giảm

dần. Do vậy,

a. Nếu (n + 1)p là số nguyên thì (n+1)p – 1 cũng là số nguyên, khi đó ( )n k đạt cực

đại tại 2 giá trị của k là k0 = (n + 1)p và k0 = (n + 1)p – 1.

b. Nếu (n + 1)p là số thập phân thì (n+1)p – 1 cũng là số thập phân, khi đó ( )n k đạt

cực đại tại k = k0 với k0 là số nguyên thỏa mãn 0 0( ) ( 1)n nk k k0 – 1 (n+1)p – 1

hay k0 (n+1)p. Do k là số nguyên nên k0 < (n+1)p.

Ví dụ 1.23. Tỉ lệ nảy mầm của một loại hạt giống là 75%, người ta gieo thí điểm 10 hạt

giống loại này.

Page 24: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

24

a. Tính xác suất để có 9 hạt nảy mầm?

b. Tìm số hạt giống nảy mầm có khả năng nhất?

Giải:

a. Việc gieo mỗi hạt giống là một phép thử, ta có 10 phép thử độc lập. Trong mỗi

phép thử chỉ có 2 trường hợp: Hoặc hạt giống nảy mầm, hoặc hạt giống không nảy mầm.

Xác suất để một hạt giống nảy mầm là 0,75. Như vậy, bài toán thỏa mãn lược đồ Bernoulli

với n = 10 và p = 0,75.

Do đó, xác suất để có đúng 9 hạt nảy mầm được tính theo công thức Bernoulli là

10 (9) = 9

10C (0,75)9.(0,25)

1.

b. Ta có (n + 1)p = 10.0,75 = 7,5.

Gọi k0 là số hạt giống nảy mầm có khả năng nhất thì k0 là số nguyên lớn nhất thỏa k0 <

7,5 nên k0 = 7.

Vậy, số hạt giống nảy mầm có khả năng nhất là k0 = 7 hạt.

BÀI TẬP CHƯƠNG 1

Bài 1. Một hộp gồm 5 bi trắng và 3 bi xanh. Lấy từ hộp ra 2 bi, có 3 cách lấy:

Cách 1: lấy ngẫu nhiên đồng thời 2 bi.

Cách 2: lấy ngẫu nhiên lần lượt (không hoàn lại) 2 bi.

Cách 3: lấy ngẫu nhiên lần lượt có hoàn lại 2 bi.

Xét theo mỗi cách lấy:

a) Có bao nhiêu cách lấy 2 bi?

b) Có bao nhiêu cách lấy 2 bi trắng?

c) Có bao nhiêu cách lấy 1 bi trắng và 1 bi xanh?

Bài 2. Có bao nhiêu cách sắp xếp k quả cầu khác nhau vào n hộp khác nhau?

Bài 3. Có bao nhiêu cách phân phối 15 sản phẩm cho 3 cơ sở sao cho cơ sở 1 có 2 sản

phẩm, cơ sở 2 có 3 sản phẩm và cơ sở 3 có 10 sản phẩm?

Bài 4. Một lớp học có 50 sinh viên trong đó có 30 là nam. Có bao nhiêu cách chọn ra một

ban cán sự gồm 4 sinh viên nếu:

a) Có đúng 2 nam

b) Có nhiều nhất 2 nam

Page 25: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

25

c) Không có nam

d) Có ít nhất 1 nam.

Bài 5.

a) Có bao nhiêu cách sắp xếp 5 sinh viên và 2 giáo viên ngồi trên một chiếc ghế dài

sao cho 2 giáo viên luôn ngồi cạnh nhau?

b) Có bao nhiêu cách sắp xếp 5 sinh viên và 2 giáo viên ngồi quanh một chiếc bàn

tròn sao cho 2 giáo viên luôn ngồi cạnh nhau?

Bài 6. Lấy ngẫu nhiên trong một lô hàng ra 4 sản phẩm để kiểm tra, quan tâm đến số phế

phẩm trong 4 sản phẩm đó.

a) Xác định các biến cố sơ cấp, không gian mẫu.

b) Biễu diễn các biến cố sau theo các biến cố sơ cấp

A = “có nhiều nhất 1 phế phẩm”

B = “có ít nhất 1 phế phẩm”

C = “có ít nhất 2 phế phẩm”.

c) Chỉ ra các biến cố xung khắc, đối lập trong các biến cố thu được.

Bài 7. Ba xạ thủ cùng bắn, mỗi người 1 viên vào cùng một bia. Gọi A, B, C là các sự kiện

các xạ thủ tương ứng bắn trúng bia.

a) Nhóm các biến cố {A, B, C } có xung khắc từng đôi hay không?

b) Hãy biểu diễn các sự kiện sau theo A, B, C:

D = “có ít nhất 1 viên trúng bia”

E = “cả 3 viên đều trúng bia”

F = “chỉ 1 viên trúng bia”

G = “không viên nào trúng bia”.

Bài 8. Một phòng điều trị có 3 bệnh nhân nặng cùng nhập viện một lúc. Gọi A1, A2, A3 là

các sự kiện các bệnh nhân tương ứng cần cấp cứu trong vòng 1giờ. Hãy biểu diễn các sự

kiện sau:

a) Có 2 bệnh nhân cần cấp cứu trong vòng 1 giờ.

b) Có ít nhất một bệnh nhân cần cấp cứu trong vòng 1 giờ.

Bài 9. Có hai hộp đựng bi xanh, bi đỏ và bi trắng: Hộp 1 chứa 3 bi trắng, 2 bi đỏ và 4 bi

xanh; Hộp 2 chứa 4 bi trắng, 4 bi đỏ và 3 bi xanh. Lấy ngẫu nhiên ở mỗi hộp ra 1 bi. Gọi

Page 26: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

26

T1, T2; D1, D2 và X1, X2 lần lượt là các biến cố lấy được bi trắng, bi đỏ, bi xanh từ hộp 1 và

hộp 2.

a) Hãy biểu diễn các biến cố sau theo các biến cố sơ cấp:

A = “Lấy được 2 bi cùng màu”

B = “2 bi lấy ra không có bi xanh”

C = “2 bi lấy ra ít nhất có 1 bi xanh”.

b) Có bao nhiêu biến cố sơ cấp thuận lợi cho biến cố D = “Lấy được 2 bi khác màu”?

Bài 10. Có thể xem xác suất sinh con trai là bao nhiêu nếu theo dõi 88200 trẻ sơ sinh trong

một Quốc gia thấy có 45600 bé trai.

Bài 11. (Bài toán gặp nhau) Hai người X, Y thỏa thuận gặp nhau ở một địa điểm hẹn trước.

Mỗi người đến đó độc lập với nhau tại một thời điểm ngẫu nhiên từ 8 giờ đến 9 giờ và quy

ước người nào đến trước thì chờ trong 20 phút, nếu người kia không đến thì sẽ bỏ đi. Tìm

xác suất để hai người gặp nhau.

Bài 12. (Bài toán cây kim Buffon) Trên mặt phẳng có kẻ vô số các đường thẳng song song

và cách nhau một khoảng 2a. Tung ngẫu nhiên một cây kim có chiều dài 2l (l < a). Tính

xác suất để cây kim cắt một trong các đường thẳng bất kỳ.

Bài 13. Phát hành 100 vé số, trong đó có 5 vé trúng thưởng. Một người mua 3 vé. Tính xác

suất để có đúng 1 vé trúng thưởng?

Bài 14. Một hộp đựng 4 viên bi trắng và 6 viên bi đỏ, lấy ngẫu nhiên không hoàn lại lần

lượt 2 viên. Tính xác suất để lấy được:

a) 2 viên trắng

b) ít nhất 1 viên đỏ

c) viên thứ 2 đỏ.

Bài 15. Một lô thỏ có 48 thỏ có gen dị hợp tử Xt, 16 thỏ có gen dị hợp tử XX, trong đó X

là gen màu xám (gen trội) và t là gen màu trắng (gen lặn). Bắt ngẫu nhiên từng con một ra

2 thỏ.

a) Tìm xác suất để 2 thỏ cùng gen.

b) Giả sử 2 thỏ bắt được có một thỏ đực và một thỏ cái. Cặp thỏ này sinh được 4 thỏ

xám. Tìm xác suất để cặp thỏ bố mẹ cùng gen Xt, cùng gen XX.

Bài 16. Có 3 người cùng chơi bóng rổ, mỗi người ném một quả. Xác suất ném trúng rổ của

mỗi người lần lượt là 0,5; 0,6; 0,7. Tính xác suất để:

Page 27: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

27

a) Cả 3 người đều ném trúng rổ

b) Có ít nhất 1 người ném trúng rổ

c) Có ít nhất 1 người ném không trúng rổ

d) Có đúng 2 người ném trúng rổ.

Bài 17. Hãy chứng minh các khẳng định trong mở rộng của định lý cộng xác suất. Hãy viết

công thức tính xác suất của tổng 4 biến cố A, B, C, D.

Bài 18.

a) Hệ n biến cố độc lập từng đôi thì có độc lập trong toàn thể không?

b) Chứng minh nếu A và B độc lập thì A và B ; A và B; A và B cũng độc lập.

c) Chứng minh nếu A và B1 độc lập, A và B2 độc lập, B1 và B2 xung khắc, thì A và

(B1+B2) độc lập.

Bài 19. Nếu hệ {A1, A2, . . . , An} là độc lập từng đôi thì có thể khẳng định được rằng

1 2 1( ... ) ( )... ( )n nP A A A P A P A hay không?

Bài 20.

a) Chứng minh rằng nếu A và B xung khắc và có xác suất dương thì A và B không thể

độc lập với nhau. Cho ví dụ minh họa.

b) Có phải “nếu A và B không xung khắc thì chúng luôn độc lập với nhau” hay không?

Bài 21. Điều tra sở thích xem ti vi của các cặp vợ chồng trẻ trong một vùng, ta có các kết

quả sau: 50% các cô vợ thích xem phim Hàn Quốc, tỉ lệ này ở các ông chồng là 30%. Song

nếu thấy vợ thích xem thì xác suất để các ông chồng thích xem cùng là 40%. Gặp ngẫu

nhiên một cặp vợ chồng. Tính xác suất để:

a) Hai người cùng thích xem

b) Ít nhất một người thích xem

c) Cả hai người đều không thích xem

d) Nếu thấy chồng thích xem thì vợ cũng xem

e) Vợ không xem nhưng chồng vẫn xem.

Bài 22. Một công nhân đứng 3 máy, biết các máy hoạt động độc lập với nhau. Xác suất để

trong thời gian t = 5 năm máy 1, máy 2, máy 3 không bị hỏng tương ứng là 0,7; 0,8 và 0,9.

Tìm xác suất để ít nhất 1 trong 3 máy không bị hỏng trong khoảng thời gian đó.

Page 28: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

28

Bài 23. Một người có 3 con gà mái, 2 con gà trống nhốt chung trong cùng một lồng. Một

người đến mua, người bán gà bắt ngẫu nhiên ra một con. Người mua chấp nhận mua con

đó.

a) Tìm xác suất để người đó mua được con gà mái.

b) Người thứ hai đến mua, người bán gà lại bắt ngẫu nhiên ra một con. Tìm xác suất

để người thứ hai mua được gà trống.

c) Xác suất này sẽ bằng bao nhiêu nếu người bán gà quên mất rằng con gà bán cho

người thứ nhất là con gà mái hay trống.

Bài 24. Để dập tắt nạn sâu bệnh hại lúa, đội bảo vệ thực vật của Hợp tác xã đã tiến hành

phun thuốc 3 lần liên tiếp trong một tuần. Xác suất sâu bị chết sau lần phun thứ 1 là 0,5.

Nếu sâu sống sót thì khả năng bị chết sau lần phun thứ 2 là 0,7. Tương tự, sau lần phun thứ

3 là 0,9. Tìm xác suất sâu bị chết sau đợt phun thuốc.

Bài 25. Có 12 hộp thuốc trong đó có 3 hộp đã quá hạn sử dụng, được chia làm 3 gói mỗi

gói 4 hộp. Tính xác suất để trong mỗi gói đều có hộp thuốc đã quá hạn.

Bài 26. Trong điều trị bệnh lao có hiện tượng kháng thuốc. Gọi A là hiện tượng “kháng

INH của vi khuẩn lao”, B là hiện tượng “kháng PAS của vi khuẩn lao” và C là hiện tượng

“kháng Streptomycin của vi khuẩn lao”.

Qua theo dõi ta biết khả năng kháng INH của vi khuẩn lao là 20%, nghĩa là P(A) = 0,2.

Tương tự, P(B) = 0,4 và P(C) = 0,3. Việc kháng các loại thuốc khác nhau là độc lập với

nhau.

Nếu phối hợp cả 3 loại thuốc trên thì khả năng khỏi bệnh là bao nhiêu.

Bài 27. Một hộp kín đựng 3 quả cầu đỏ và 4 quả cầu xanh. Tính xác suất để khi chia hộp

cầu đó một cách ngẫu nhiên thành 3 phần bằng nhau thì:

a) Cả 3 quả cầu đỏ cùng ở trong một phần.

b) Mỗi một phần có một quả cầu đỏ.

Bài 28. Một dự án được triển khai ở một vùng nông thôn. Trong đó, có 40% số hộ vay vốn

dự án. Sau một chu kỳ sản xuất, kết quả điều tra cho thấy 70% số hộ vay vốn được nâng

cao thu nhập. Tỉ lệ này đối với hộ không vay vốn là 30%. Tính tỉ lệ hộ có nâng cao thu

nhập của toàn vùng?

Bài 29. Bắn 3 viên đạn vào cùng một mục tiêu một cách độc lập. Xác suất trúng mục tiêu

của mỗi viên là 0,2; 0,3 và 0,5. Nếu có 1 viên trúng thì mục tiêu bị phá hủy với xác suất

Page 29: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

29

0,4. Nếu có từ 2 viên trở lên trúng thì mục tiêu chắc chắn bị phá hủy. Tìm xác suất để mục

tiêu bị phá hủy khi bắn 3 viên đạn trên?

Bài 30. Một thiết bị gồm ba linh kiện loại 1, 2, 3; chúng chiếm tương ứng 35%, 25%, 40%

tổng số linh kiện của thiết bị. Tỉ lệ bị hỏng sau một khoảng thời gian hoạt động của các loại

linh kiện tương ứng là 15%, 25% và 5%. Thiết bị đang hoạt động bỗng nhiên có một linh

kiện bị hỏng. Tính xem linh kiện loại nào có nhiều khả năng bị hỏng nhất.

Bài 31. Một lô hạt giống được phân thành ba loại: loại 1 chiếm 2/3 số hạt của cả lô; loại 2

chiếm 1/4; còn lại là loại 3. Tỉ lệ nảy mầm tương ứng của mỗi loại là 80%, 60% và 40%.

Hãy xác định tỉ lệ nảy mầm chung của lô hạt giống?

Bài 32. Trong một trạm cấp cứu bỏng có 80% bệnh nhân bỏng do nóng, 20% bệnh nhân

bỏng do hóa chất. Loại bỏng do nóng có 30% bị biến chứng, loại bỏng do hóa chất có 50%

bị biến chứng.

a) Từ tập hồ sơ bệnh nhân, người ta chọn ngẫu nhiên ra một bệnh án. Tìm xác suất để

gặp một bệnh án của bệnh nhân bị biến chứng.

b) Rút ngẫu nhiên được một bệnh án của bệnh nhân bị biến chứng. Tìm xác suất để

bệnh án đó là của bệnh nhân bị biến chứng do bỏng gây ra.

Bài 33. Tỉ lệ người dân nghiện thuốc lá là 30%, biết rằng tỉ lệ người bị viêm họng trong số

người nghiện thuốc lá là 60%; còn tỉ lệ người bị viêm họng trong số người không hút thuốc

lá là 40%.

a) Chọn ngẫu nhiên một người, biết rằng người đó viêm họng. Tính xác suất để người

đó nghiện thuốc lá.

b) Nếu người đó không bị viêm họng, tính xác suất để người đó nghiện thuốc lá.

Bài 34. Có hai chuồng thỏ thí nghiệm: chuồng 1 có 12 thỏ trắng và 3 thỏ nâu; chuồng 2 có

16 thỏ trắng và 4 thỏ nâu. Tình cờ một con thỏ từ chuồng 2 nhảy sang chuồng 1. Từ

chuồng 1, người ta bắt ngẫu nhiên một con. Tính xác suất để thỏ bắt được là thỏ trắng.

Bài 35. Trong một vùng dân cư có tỉ lệ nam: nữ là 9: 11, một nạn dịch truyền nhiễm xuất

hiện trong vùng với khả năng mắc bệnh ở nam giới là 6% và ở nữ giới là 2%.

a) Khả năng gặp một người trong vùng bị mắc bệnh là bao nhiêu.

b) Chọn ngẫu nhiên một người trong vùng thì gặp phải người mắc bệnh. Xét xem khả

năng người được chọn đó là nam giới cao hơn hay nữ giới cao hơn.

Page 30: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

30

Bài 36. Ta biết rằng một cặp sinh đôi có thể là sinh đôi thật (do một trứng sinh ra), trong

trường hợp đó chúng cùng giới hoặc có thể là giả sinh đôi (do hai trứng sinh ra), trong

trường hợp này xác suất để chúng cùng giới là 0,5. Ta giả thiết rằng đã biết xác suất của

một cặp sịnh đôi là sinh đôi thật trong một họ nào đó là p.

a) Tìm xác suất để một cặp sinh đôi là sinh đôi thật biết rằng chúng cùng giới.

b) Tìm xác suất để một cặp sinh đôi là sinh đôi giả biết rằng chúng khác giới.

Bài 37. Tỉ lệ cha mắt đen và con mắt đen là 0,05; cha mắt đen và con mắt xanh là 0,079;

cha mắt xanh và con mắt đen là 0,089; cha mắt xanh và con mắt xanh là 0,782.

a) Tìm khả năng con mắt xanh biết rằng cha mắt xanh.

b) Tìm khả năng con mắt không đen biết rằng cha mắt đen.

Bài 38. Một người ốm vào bệnh viện, bác sỹ chẩn đoán sơ bộ người này có thể bị mắc

bệnh A với xác suất 70%, mắc bệnh B với xác suất 30%. Để có thêm thông tin chẩn đoán,

bác sỹ đã cho tiến hành xét nghiệm sinh hóa. Sau 3 lần xét nghiệm thấy có một lần dương

tính, biết rằng khả năng dương tính của mỗi lần xét nghiệm đối với bệnh A là 10%, đối với

bệnh B là 30%. Hãy cho biết nên chẩn đoán bệnh nhân mắc bệnh nào.

Bài 39. Có hai chuồng thỏ: chuồng 1 có 3 thỏ trắng và 3 thỏ nâu; chuồng thứ 2 có 6 thỏ

trắng và 4 thỏ nâu. Bắt ngẫu nhiên 4 con thỏ từ chuồng thứ nhất nhốt sang chuồng thứ hai.

Sau đó, bắt ngẫu nhiên ở chuồng thứ hai ra 1 con thỏ. Tính xác suất để bắt được thỏ nâu từ

chuồng thứ hai.

Bài 40. Theo dõi kết quả điều tra về bệnh lao, tỉ lệ người bị lao ở một vùng nọ là 0,001.

Tìm xác suất để khi khám cho 10 người:

a) Không ai bị lao

b) Có 5 người bị lao

c) Ít nhất 1 người bị lao

d) Tìm số người bị lao có khả năng nhất.

Bài 41. Xác suất để mỗi con lợn khi tiêm phòng bằng một loại vaccine được miễn dịch là

0,9. Người ta tiêm phòng cho 40 con. Tìm số lợn được miễn dịch có khả năng nhất?

Bài 42. Một lô hạt giống với tỉ lệ hạt lép là 5%. Ta phải lấy một mẫu cỡ bao nhiêu sao cho

xác suất để ít nhất có 1 hạt lép không nhỏ hơn 95%.

Page 31: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

31

Bài 43. Một bác sỹ có tiếng về chữa một loại bệnh với xác suất chữa khỏi bệnh là 0,8. Có

người nói rằng cứ 5 người đến chữa thì chắc chắn có 4 người khỏi bệnh. Điều đó có đúng

không? Tại sao?

Bài 44. Một người bắn liên tiếp 5 viên đạn vào một mục tiêu với xác suất trúng đích của

mỗi viên là 0,2. Để phá hủy mục tiêu cần từ 3 viên trúng mục tiêu trở lên. Tính xác suất để

mục tiêu bị tiêu diệt.

Bài 45. Một lô thuốc đóng chai có tỉ lệ phế phẩm là 10%. Lấy ngẫu nhiên 10 chai. Tìm xác

suất để trong số chai thuốc lấy ra:

a) Có đúng 4 phế phẩm

b) Có ít nhất 8 phế phẩm.

Bài 46. Trong một kho rượu số lượng chai rượu loại A và loại B là bằng nhau. Người ta lấy

ngẫu nhiên một chai rượu trong kho và đưa cho 4 người sành rượu nếm thử để xác định

xem đây là rượu loại nào. Giả sử mỗi người có khả năng đoán đúng là 80%. Có 3 người kết

luận chai rượu thuộc loại A và một người kết luận chai rượu thuộc loại B. Vậy chai rượu

được chọn thuộc loại A với xác suất bằng bao nhiêu.

Page 32: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

1

CHƯƠNG II:

BIẾN NGẪU NHIÊN VÀ QUY LUẬT PHÂN PHỐI XÁC SUẤT

2.1. Biến ngẫu nhiên

2.1.1. Khái niệm

a) Khái niệm: Biến ngẫu nhiên là một đại lượng nhận các giá trị của nó với xác suất tương

ứng nào đó.

- Biến ngẫu nhiên thường biểu thị giá trị kết quả của một phép thử ngẫu nhiên.

- Biến ngẫu nhiên thường được ký hiệu X Y Z hay

Ví dụ. - Tung một con xúc xắc cân đối, đồng chất. Gọi X là số chấm xuất hiện trên mặt con

xúc xắc thì X là một biến ngẫu nhiên.

- Ðo ngẫu nhiên chiều cao của 1 sinh viên. Gọi là chiều cao của sinh viên đó thì là một

bíến ngẫu nhiên.

b) Phân loại biến ngẫu nhiên:

- Biến ngẫu nhiên rời rạc

- Biến ngẫu nhiên liên tục

2.1.2. Biến ngẫu nhiên rời rạc và bảng phân phối xác suất

a) Ðịnh nghĩa: Biến ngẫu nhiên được gọi là rời rạc nếu tập các giá trị của nó là hữu hạn hoặc

đếm được.

Ví dụ. - Số chấm xuất hiện trên mặt con xúc xắc khi tung.

- Số tai nạn giao thông trong một ngày ở một vùng.

b) Bảng phân phối xác suất

- Giả sử biến ngẫu nhiên X nhận các giá trị 1 2 nx x x với xác suất tương ứng

( ) 1 2 i ip P X x i thì nó có thể được mô tả bằng bảng phân phối xác suất như sau:

Bảng 2.1: Bảng phân phối xác suất của biến ngẫu nhiên rời rạc

X 1x 2x ...

nx ...

p 1p 2p ...

np ...

trong đó 1 iip .

Ví dụ. Một chuồng có 10 con thỏ: 7 thỏ trắng, 3 thỏ nâu. Bắt ngẫu nhiên từ chuồng ra 3 con

thỏ. Gọi X là số thỏ trắng bắt ra được. Lập bảng phân phối xác suất của X và tính các xác

suất (0 2) ( 1) P X P X .

2.1.3. Biến ngẫu nhiên liên tục và hàm mật độ xác suất

a) Ðịnh nghĩa: Biến ngẫu nhiên được gọi là liên tục nếu tập các giá trị của nó là một khoảng

(hay một đoạn) trên trục số thực.

Page 33: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

2

Ví dụ. - Nhiệt độ không khí ở mỗi thời điểm nào đó.

- Chiều cao của con người.

- Thời gian sống của một loại cây trồng.

b) Hàm mật độ xác suất

- Ðể mô tả biến ngẫu nhiên liên tục ta dùng khái niệm hàm mật độ.

- Hàm ( )f x được gọi là hàm mật độ của biến ngẫu nhiên X nào đó nếu thỏa mãn 2 điều

kiện:

i. ( ) 0 f x x R .

ii. ( ) 1

f x dx .

- Khi đó, xác suất để X thuộc vào khoảng 1 2[ )x x được xác định như sau:

2

11 2( ) ( )

x

xP x X x f x dx

c) Ý nghĩa của hàm mật độ

- Từ định nghĩa của hàm mật độ, ta có ( ) ( ) P x X x x f x x .

- Xác suất để X nhận giá trị thuộc lân cận khá bé ( ) x x x gần như tỷ lệ với ( )f x .

Ví dụ. - Hàm ( )f x xác định bởi

1

0 nÕu [ ]( )

nÕu [ ]b a

x a bf x

x a b

gọi là hàm mật độ của phân phối đều trên [a b]

- Tuổi thọ (tính bằng tháng) của một loại côn trùng là một biến ngẫu nhiên liên tục có hàm

mật độ

2(4 ) nÕu [0 4]( )0 nÕu [0 4]

kx x xf xx

Xác định k và tính xác suất để loại côn trùng trên chết trước khi được 1 tháng tuổi.

2.1.4. Tính độc lập giữa hai biến ngẫu nhiên

Hai biến ngẫu nhiên X Y được gọi là độc lập nếu mọi biến cố liên quan đến X đều độc

lập với biến cố bất kỳ liên quan đến Y , tức là

1 2 1 2 1 2 1 2{ ( ) ( )} { ( )} { ( )} P X x x Y y y P X x x P Y y y

Ví dụ. Có 2 chuồng gà: chuồng I có 5 gà trống, 3 gà mái; chuồng II có 4 gà trống, 6 gà mái.

Gọi X là số gà trống trong 1 con gà bắt ra từ chuồng I, Y là số gà trống trong 2 con gà bắt

ra từ chuồng II. Lập bảng phân phối xác suất của X Y .

Page 34: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

3

2.2. Hàm phân phối xác suất

2.2.1. Ðịnh nghĩa

a) Định nghĩa: Hàm phân phối của biến ngẫu nhiên X tại x R xác định như sau:

( ) ( ) XF x P X x

b) Ý nghĩa:

- ( )XF x là xác suất để biến ngẫu nhiên nhận giá trị bên trái x

- Hàm phân phối phản ánh mức độ tập trung xác suất về bên trái điểm x .

Khi đó:

- Nếu X là biến ngẫu nhiên rời rạc nhận các giá trị 1 2 nx x x với xác suất tương ứng

( ) 1 2 i ip P X x i thì

: :

( ) ( )

i i

X i i

i x x i x x

F x P X x p

- Nếu X là biến ngẫu nhiên liên tục có hàm mật độ ( )f x thì

( ) ( )

x

XF x f t dt

- Trong trường hợp không cần đề cập đến biến ngẫu nhiên, ta có thể ký hiệu ( )F x là hàm

phân phối của biến ngẫu nhiên X nào đó.

Ví dụ. Gieo đồng thời 2 đồng xu cân đối đồng chất. Gọi X là số lần xuất hiện mặt sấp.

- Hàm phân phối ( )F x là:

0 nÕu 01 4 nÕu 0 1

( )3 4 nÕu1 21 nÕu 2

xx

F xxx

- Đồ thị F(x)

Page 35: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

4

Ví dụ. Cho biến ngẫu nhiên X có hàm mật độ:

0 nÕu [0 2]( )

sin2 nÕu [0 2]x

f xx x

- Hàm phân phối ( )F x là:

0 nÕu 01 cos2( ) nÕu 0 2

21 nÕu 2

xxF x x

x

- Đồ thị F(x)

2.2.2. Tính chất

a) Hàm phân phối có các tính chất sau:

i. 0 ( ) 1 F x x R .

ii. lim ( ) 0 lim ( ) 1

x x

F x F x .

iii. Nếu 1 2x x thì

1 2( ) ( )F x F x (tính không giảm).

iv. ( )F x liên tục trái tại mọi điểm.

v. Với a b thì ( ) ( ) ( ) P a X b F b F a .

b) Nhận xét:

- Nếu hàm mật độ ( )f x liên tục tại 0x x thì

0 0( ) ( ) F x f x .

- Nếu hàm phân phối của X liên tục tại 0x thì

0( ) 0 P X x .

Page 36: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

5

2.3. Các tham số đặc trưng của biến ngẫu nhiên

2.3.1. Kỳ vọng toán

a) Ðịnh nghĩa: Kỳ vọng của biến ngẫu nhiên X , ký hiệu ( )E X , được xác định bởi:

nÕu rêi r¹c ví i ( ) 1 2( )

( ) nÕu liªn tôc ví i hµm mËt ®é ( )

i i i iix p X P X x p i

E Xxf x dx X f x

trong trường hợp các đại lượng tổng chuổi và tích phân trên hữu hạn.

b) Ý nghĩa:

- Kỳ vọng của biến ngẫu nhiên là giá trị trung bình (theo xác suất) của biến ngẫu nhiên.

- Kỳ vọng phản ánh giá trị trọng tâm của phân phối xác suất của biến ngẫu nhiên.

c) Tính chất:

i. EC C C là hằng số.

ii. ( ) ( )E CX CE X .

iii. ( ) ( ) ( ) E X Y E X E Y .

iv. Nếu X Y độc lập thì ( ) ( ) ( ) E XY E X E Y .

v. Cho hàm số g . Khi đó

vi. ( ) nÕu rêi r¹c ví i ( ) 1 2( )

( ) ( ) nÕu liªn tôc ví i hµm mËt ®é ( )

i i i iig x p X P X x p i

Eg Xg x f x dx X f x

Ví dụ. Cho biến ngẫu nhiên X có bảng phân phối xác suất sau:

X 1 2 3 4

P 1/7 2/7 3/7 1/7

Tính 2( ) ( 3 2) E X E X X .

Ví dụ. Cho hai biến ngẫu nhiên X Y độc lập, cùng có hàm mật độ

22 nÕu [0 2]( )0 nÕu [0 2]

xe xf xx

Tính 3E(X) E(XY) E(X ) ( 2 3)E X Y

2.3.2. Trung vị (Median)

a) Ðịnh nghĩa: Trung vị của biến ngẫu nhiên X là đại lượng, ký hiệu ( )med X , được xác

định như sau:

1( ( )) ( ( ))

2 P X med X P X med X

b) Ý nghĩa: Trung vị là điểm phân đôi phân phối xác suất thành hai phần bằng nhau.

c) Nhận xét:

- Nếu hàm phân phối ( )F x của X liên tục thì ( )med X là nghiệm của phương trình

Page 37: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

6

( ) 1 2 F x .

- Một biến ngẫu nhiên có thể có một hoặc nhiều giá trị trung vị.

Ví dụ. Tìm các trung vị của các ví dụ trong phần 2.3.1.

2.3.3. Mode

a) Ðịnh nghĩa:

- Nếu X là biến ngẫu nhiên rời rạc thì Mode của X , ký hiệu ( )Mod X , là giá trị của X mà

tại đó xác suất tương ứng là lớn nhất.

- Nếu X biến ngẫu nhiên liên tục có hàm mật độ ( )f x thì ( )Mod X là giá trị 0x làm cực

đại hàm ( )f x .

b) Ý nghĩa: ( )Mod X là giá trị của biến ngẫu nhiên X có khả năng xuất hiện lớn nhất trong

một lân cận của nó.

Ví dụ. Tìm các Mode của các ví dụ trong phần 2.3.1.

c) Nhận xét:

- Một biến ngẫu nhiên có thể có một hoặc nhiều giá trị Mode.

- Nếu phân phối của biến ngẫu nhiên là đối xứng hoặc gần đối xứng thì dùng kỳ vọng để đặc

trưng là tốt nhất.

- Nếu phân phối của biến ngẫu nhiên là quá lệch thì dùng trung vị hoặc Mode để đặc trưng là

tốt nhất.

- Nếu phân phối của biến ngẫu nhiên là đối xứng và có một Mode thì 3 đặc trưng: kỳ vọng,

trung vị, Mode là trùng nhau.

2.3.4. Phương sai

a) Ðịnh nghĩa: Phương sai của biến ngẫu nhiên X , ký hiệu ( )Var X , là đại lượng không âm

được xác định bởi

2 2 2( ) ( ) ( ) Var X E X EX EX EX

trong đó

2

2

2

nÕu rêi r¹c ví i ( ) 1 2

( ) nÕu liªn tôc ví i hµm mËt ®é ( )

i i i iix p X P X x p i

EXx f x dx X f x

b) Ý nghĩa:

- Phương sai của biến ngẫu nhiên X dùng để đo mức độ phân tán của các giá trị của X

xung quanh giá trị trung bình EX của nó.

- ( )Var X nhỏ thì mức độ phân tán nhỏ, độ tập trung lớn.

- ( )Var X càng lớn thì độ phân tán càng cao.

c) Tính chất:

i. ( ) 0 Var C C là hằng số.

ii. 2( ) ( )Var CX C Var X .

Page 38: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

7

iii. Nếu X Y độc lập thì ( ) ( ) ( ) Var X Y Var X Var Y .

Ví dụ. Tính phương sai của các ví dụ trong phần 2.3.1.

2.3.5. Ðộ lệch chuẩn

a) Ðịnh nghĩa: Ðộ lệch chuẩn của biến ngẫu nhiên, ký hiệu ( ) X , được xác định bởi:

( ) ( ) X Var X

b) Ý nghĩa: Ðộ lệch chuẩn dùng để đánh giá mức độ phân tán các giá trị của biến ngẫu nhiên

theo đơn vị của biến ngẫu ngẫu nhiên.

2.3.6. Moment

a) Ðịnh nghĩa:

- Moment cấp k của biến ngẫu nhiên X là số ( ) k

k E X .

- Moment trung tâm cấp k của biến ngẫu nhiên X là số [ ( )] k

km E X E X .

b) Nhận xét:

- Moment cấp 1 của X là kỳ vọng của X .

- Moment trung tâm cấp 2 của X là phương sai của X .

2.4. Một số quy luật phân phối xác suất thông dụng

2.4.1. Phân phối 0-1 (Bernoulli)

a) Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối 0-1 với tham số (0 1) p p

nếu

( 0) ( 1) ( 1) P X q P X p p q

Ví dụ. Một loại hạt giống nảy mầm với xác suất p . Số hạt nảy mầm khi gieo 1 hạt có phân

phối 0-1.

b) Các đặc trưng: ( ) EX p Var X pq .

2.4.2. Phân phối nhị thức

a) Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối nhị thức với tham số

(0 1) n p p , ký hiệu ( )X B n p , nếu

( ) (1 ) 0 k k n k

nP X k C p p k n

Đồ thị:

Page 39: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

8

Hình 2.1: Đồ thị phân phối nhị thức

Ví dụ. Một xạ thủ bắn trúng mục tiêu với xác suất p . Cho xạ thủ đó bắn 10 viên đạn. Số viên

đạn anh ta bắn trúng có phân phối nhị thức (10 )B p .

b) Nhận xét:

- Phân phối 0-1 là phân phối nhị thức với 1n .

- Xét dãy n phép thử độc lập Bernoulli với xác suất thành công ( )p P A ( A là biến cố

quan sát của phép thử). Gọi X là số lần xuất hiện biến cố A trong n phép thử trên thì

( )X B n p .

c) Các đặc trưng: ( ) (1 ) EX np Var X np p .

2.4.3. Phân phối Poisson

a) Định nghĩa:Biến ngẫu nhiên X được gọi là có phân phối Poisson với tham số 0 , ký

hiệu ( )X P , nếu

( ) 0 1 2

keP X k k

k

Đồ thị:

Hình 2.2: Đồ thị phân phối Poisson

Page 40: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

9

Ví dụ. - Số cuộc điện thoại nhận được ở một trạm điện thoại trong một phút.

- Số tai nạn giao thông xảy ra trong một ngày.

- Số máy bị hỏng trong một năm, số lỗi in trong một tập sách ...

b) Các đặc trưng: ( ) EX Var X .

2.4.4. Phân phối đều

a) Định nghĩa:Biến ngẫu nhiên X được gọi là có phân phối đều (rời rạc) trên tập {1 2 } n ,

ký hiệu ( )U n , nếu

1( ) 1 2 P X k k n

n

Đồ thị:

Hình 2.3: Đồ thị phân phối đều.

Ví dụ. Số chấm xuất hiện khi tung một con xúc xắc.

b) Các đặc trưng: 21 1

( )2 12

n nEX Var X .

c) Định nghĩa: Biến ngẫu nhiên X gọi là có phân phối đều (liên tục) trên [ ]a b , ký hiệu

[ ]U a b , nếu có hàm mật độ dạng

1

0 nÕu [ ]( ) nÕu [ ]b a

x a bf x

x a b

Ví dụ. Thời điểm đến trạm của xe buýt trong thời gian từ 7h đến 7h30.

d) Các đặc trưng: 2( ) ( )

( )2 12

a b a bEX Var X .

2.4.5. Phân phối mũ

a) Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối mũ với tham số 0 , ký

hiệu ( )X Exp , nếu có hàm mật độ dạng

Page 41: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

10

0 nÕu 0( )

nÕu 0x

xf x

e x

Đồ thị:

Hình 2.4: Đồ thị phân phối mũ.

Ví dụ. - Thời gian một khách hàng cần phục vụ ở hiệu uốn tóc;

- Thời gian sống của bóng đèn điện

b) Các đặc trưng: 2

1 1( )

EX Var X .

2.4.6. Phân phối chuẩn

a) Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối chuẩn với tham số 2 , ký

hiệu 2( ) X N , nếu có hàm mật độ dạng

2( )

221

( ) ,2

x

f x e x R

Đồ thị:

Hình 2.5: Đồ thị phân phối chuẩn.

Page 42: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

11

Ví dụ. - Trọng lượng và chiều cao của người lớn, chiều cao của cây ...

- Ðiểm thi của các thí sinh.

- Hàm lượng và khoáng vật trong đất, đá ...

b) Chú ý: - Trường hợp 0 1 thì (0 1)N gọi là phân phối chuẩn tắc. Ðây là phân

phối quan trọng trong lý thuyết xác suất.

- Hàm phân phối chuẩn (0 1)N được ký hiệu là

2 / 21( )2

xtx e dt

còn gọi là hàm Laplace.

- Nếu 2( ) X N , bằng phép đổi biến

XY

thì (0 1)Y N . Khi đó

( ) ( ) ( ) ( )a X b b aP a X b P

c) Các đặc trưng: 2( ) EX Var X .

2.5. Vectơ ngẫu nhiên 2 chiều

2.5.1. Khái niệm

Giả sử 1 2 nX X X là các biến ngẫu nhiên. Khi đó:

- Bộ 1 2( ) nX X X được gọi là vectơ ngẫu nhiên n chiều

- 1 2 nX X X được gọi là các thành phần của vectơ ngẫu nhiên.

Trường hợp 2n , ta được vectơ ngẫu nhiên 2 chiều.

Ví dụ. Gọi X Y tương ứng là chiều cao, cân nặng của con người thì ( )X Y là một vectơ

ngẫu nhiên 2 chiều.

2.5.2. Vectơ ngẫu nhiên 2 chiều rời rạc và bảng phân phối xác xuất đồng thời

a) Ðịnh nghĩa: Vectơ ngẫu nhiên 2 chiều được gọi là rời rạc nếu các thành phần của nó là các

biến ngẫu nhiên rời rạc.

b) Bảng phân phối xác suất đồng thời:

- Giả sử biến ngẫu nhiên X nhận các giá trị 1 2 nx x x với xác suất tương ứng

( ) 1 i ip P X x i n

- Biến ngẫu nhiên Y nhận các giá trị 1 2 my y y với xác suất tương ứng

( ) 1 j jq P Y y j m .

- Ðặt ( ) ij i jp P X x Y y : gọi là xác suất đồng thời để X nhận giá trị ix và Y nhận

giá trị jy với 1 1 i n j m .

Page 43: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

12

Bảng phân phối xác suất đồng thời của vectơ ngẫu nhiên ( )X Y

Bảng 2.2: Bảng phân phối xác suất đồng thời của vectơ ngẫu nhiên 2 chiều.

Y

X 1y

2y … jy ... my

1x 11p 12p ... 1 jp ... 1mp

2x 21p

22p ... 2 jp ... 2mp

... ... ... ... ... ...

ix 1ip

2ip ... ijp ... imp

... ... ... ... ... ...

nx 1np

2np ... njp ... nmp

trong đó

1 1 1 1

1

n m m n

ij ij i ij j

i j j i

p p p p q

Ví dụ. Tung 1 đồng xu và 1 con xúc xắc cân đối, đồng chất. Gọi X là số lần xuất hiện mặt

sấp của đồng xu, Y là số chấm xuất hiện trên con xúc xắc. Ta có bảng phân phối xác suất của

vectơ ngẫu nhiên ( )X Y như sau:

Y

X

1 2 3 4 5 6 ip

0(N) 112 1

12 1

12 1

12 1

12 1

12 1

2

1(S) 112 1

12 1

12 1

12 1

12 1

12 1

2

jq 16 1

6 1

6 1

6 1

6 1

6 1

c) Chú ý: Nếu X Y độc lập thì ( ) ( ) ( ) i j i jP X x Y y P X x P Y y

2.5.3. Hàm phân phối xác suất đồng thời

a) Ðịnh nghĩa: Hàm phân phối xác suất của vectơ ngẫu nhiên ( )X Y , ký hiệu ( ) X YF x y

được xác định như sau:

( ) ( ) X YF x y P X x Y y

b) Tính chất

i. 20 ( ) 1 ( ) X YF x y x y R .

ii. lim ( ) ( ) lim ( ) ( )

X Y Y X Y Xx y

F x y F y F x y F x .

lim ( ) lim ( ) 0 lim ( ) 1

X Y X Y X Yx y x

y

F x y F x y F x y .

Page 44: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

13

iii. Nếu X Y độc lập thì ( ) ( ) ( ) X Y X YF x y F x F y .

- Trường hợp vectơ ngẫu nhiên ( )X Y là rời rạc thì

( ) ( )

i j

X Y i j

i x x j y y

F x y P X x Y y

Ví dụ. Tìm hàm phân phối xác suất đồng thời ở ví dụ phần 2.5.2.

2.5.4. Hàm mật độ xác suất đồng thời

a) Ðịnh nghĩa: Hàm mật độ xác suất đồng thời của vectơ ngẫu nhiên ( )X Y , ký hiệu

( ) X Yf x y , nếu thỏa 2 điều kiện:

i. 2( ) 0 ( ) X Yf x y x y R ,

ii. 2

( ) 1 X YR

f x y dxdy .

Khi đó:

- Hàm phân phối đồng thời ( ) ( )

x y

X Y X YF x y f x y dxdy .

- Hàm mật độ xác suất của các biến ngẫu nhiên thành phần:

( ) ( ) ( ) ( )

X X Y Y X Yf x f x y dy f y f x y dx

Ví dụ. Hàm mật độ chuẩn 2 chiều

2 2( ) 2 ( )( ) ( )1 1 1 2 22 2 21 22(1 )

1 2

2

1 2

[ ]1( )

2 1

x x y y

f x y e

trong đó 2 2

1 1 2 2( ) ( ) EX Var X EY Var Y là hệ số tương quan của X Y .

2.5.5. Các đặc trưng của vectơ ngẫu nhiên 2 chiều

2.5.5.1. Vectơ kỳ vọng

- Giả sử vectơ ngẫu nhiên ( ) Z X Y với các biến ngẫu nhiên thành phần X Y tồn tại kỳ

vọng.

- Vectơ kỳ vọng của Z là ( ) EZ EX EY .

2.5.5.2. Hiệp phương sai (covariance)

a) Định nghĩa: Hiệp phương sai (hay covariance) của 2 biến ngẫu nhiên X Y được xác định:

( ) [( )( )] cov X Y E X EX Y EY

nếu kỳ vọng ở vế phải tồn tại.

b) Nhận xét: Nếu tồn tại các kỳ vọng ( ) EX EY E XY thì

( ) ( ) cov X Y E XY EX EY

Ví dụ. Tìm hiệp phương sai của 2 biến ngẫu nhiên ở ví dụ phần 2.5.2.

Page 45: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

14

2.5.5.3. Hệ số tương quan

a) Định nghĩa: Hệ số tương quan của 2 biến ngẫu nhiên X Y được xác định:

( )( )

( ) ( )

cov X YX Y

X Y

nếu các đại lượng ở vế phải tồn tại.

b) Ý nghĩa:

- Hệ số tương quan đo mức độ tương quan, phụ thuộc tuyến tính giữa 2 biến ngẫu nhiên.

- Nếu ( ) X Y càng lớn thì sự phụ thuộc càng chặt chẽ.

- ( ) 0 X Y gọi là tương quan thuận, ( ) 0 X Y gọi là tương quan nghịch.

c) Tính chất:

i. ( ) 1 X Y .

ii. Nếu X Y độc lập thì ( ) 0 X Y .

iii. ( ) 1 X Y a b Y aX b .

Ví dụ. Tìm hệ số tương quan của 2 biến ngẫu nhiên ở ví dụ phần 2.5.2.

2.6. Luật số lớn

2.6.1. Luật số lớn Tchebyshev

Giả sử dãy các biến ngẫu nhiên 1 2 nX X X thỏa các điều kiện sau:

- Ðộc lập đôi một, tức là i jX X độc lập với i j .

- Kỳ vọng hữu hạn và phương sai giới nội đều, tức là ( ) nVar X C n

Ðặt n nnS X thì

( )lim { } 0 0

n n

n

S E SP

n

2.6.2. Luật số lớn Khintchin

Giả sử dãy biến ngẫu nhiên 1 2 nX X X thỏa các điều kiện sau:

- Ðộc lập đôi một,

- Có cùng phân phối và kỳ vọng hữu hạn.

Ðặt n i inS X EX thì

lim { } 0 0

n

n

SP

n

2.6.3. Luật số lớn Bernoulli

Xét dãy phép thử độc lập Bernoulli với biến cố quan sát A . Gọi nf là tần số xuất hiện biến

Page 46: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

15

cố A trong n phép thử và p là xác suất xuất hiện biến cố A trong mỗi phép thử thì

lim { } 0 0

nn

P f p

2.7. Các định lý giới hạn

2.7.1. Ðịnh lý giới hạn địa phương Moivre - Laplace

- Xét n phép thử độc lập Bernoulli với biến cố quan sát A có xác suất ( )p P A .

- ( )nP k là xác suất có k lần xuất hiện biến cố A trong n phép thử. Khi đó

( )lim 1

( )n

nk

npq P k

f x

trong đó

2 21( ) 1

2

x

k

k npf x e x p q

npq

- Công thức xấp xỉ: Khi n đủ lớn thì

1( ) ( )n kP k f x

npq

Ví dụ. Gieo 1800 lần một đồng xu cân đối đồng chất. Tính xác suất để có 10 lần đồng xu xuất

hiện mặt sấp.

2.7.2. Ðịnh lý giới hạn trung tâm

Giả sử dãy biến ngẫu nhiên 1 2 X X độc lập, cùng phân phối có phương sai hữu hạn khác

0. Khi đó

1

1lim { ( ) } ( )

n

kn

k

P X x x x Rn

trong đó

22 21 1

1( ) ( ) lµ hµm Laplace2

x tEX Var X x e dt

Khi đó, xét dãy các biến ngẫu nhiên ( )iX độc lập, cùng phân phối 0-1, tham số p . Theo

định lý giới hạn trung tâm, với iiX X , ta được

lim ( ) ( )

n

X npP x x x R

npq

Công thức xấp xỉ: Khi n đủ lớn thì

( ) ( ) ( ) ( )

a np X np b np b np a np

P a X b Pnpq npq npq npq npq

Ví dụ. Gieo 3200 lần một đồng xu cân đối đồng chất. Gọi X là số lần xuất hiện mặt sấp.

Tính (1600 1800) P X .

Page 47: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

16

2.7.3. Ðịnh lý Poisson

Giả sử dãy biến ngẫu nhiên ( )n nX B n p độc lập và lim

nn

np . Khi đó

lim ( ) ( 0 1 2 )

k

nn

eP X k k

k

Khi đó, nếu biến ngẫu nhiên ( )X B n p với n khá lớn, p khá bé thì theo định lý

Poisson, ta có công thức xấp xỉ:

( ) ví ikeP X k np

k

Ví dụ. Trong số 500 trang sách của một cuốn sách có 10 lỗi in. Tìm xác suất sao cho khi lấy

ngẫu nhiên một trang sách thì có đúng 2 lỗi in.

Page 48: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

17

Bài tập chương 2

1) Cho hàm số

cos nÕu 2( )

0 nÕu 2A x x

f xx

a) Tìm A để f là hàm mật độ của biến ngẫu nhiên X nào đó.

b) Xác định hàm phân phối F(x).

c) Tính các đặc trưng: E(X), Var(X).

2) Cho hàm số

2

2

0 nÕu 0 hoÆc 2( ) nÕu 0 1

(2 ) nÕu1 2

x xf x ax x

a x x

a) Tìm a để f là hàm mật độ.

b) Xác định hàm phân phối F(x) tương ứng.

3) Cho hàm số

2 2 nÕu 0( )0 nÕu 0

xAx e xf xx

a) Tìm A để f là hàm mật độ của biến ngẫu nhiên X nào đó.

b) Xác định hàm phân phối F(x) .

c) Tính các đặc trưng: E(X), Var(X).

4) Một hộp có 3 bi trắng, 4 bi đen. Lấy ngẫu nhiên lần lượt từng quả cho đến khi nào lấy được

bi trắng. Gọi X là số quả lấy được.

a) Tìm bảng phân phối xác suất của X, hàm phân phối F(x).

b) Tính 2( ) ( ) (3 2) (4 3) (1 3 ) E X Var X E X E X X Var X .

c) Tính 2(1 4) ( 3) ( 4 3) P X P X P X X .

5) Một hộp chứa 10 viên bi đỏ, 6 viên bi xanh. Lấy ngẫu nhiên 3 viên. Gọi X là số bi đỏ lấy

ra.

a) Tìm bảng phân phối xác suất của X và các đặc trưng E(X), Var(X).

b) Giả sử lấy mỗi viên bi đỏ được 5 điểm, mỗi viên bi xanh được 8 điểm. Gọi Y là số

điểm tổng cộng cho 3 viên bi lấy ra. Lập bảng phân phối xác suất của Y và

( ) ( )E X Var X

6) Hộp I có 1 bi trắng, 4 bi đỏ; hộp II có 4 bi trắng. Lấy ngẫu nhiên 2 bi từ hộp I sang hộp II.

Sau đó lấy từ hộp II 3 bi bỏ vào hộp I. Gọi 1 2X X là số bi trắng ở hộp I, II sau 2 lần chuyển

bi. Tìm phân phối xác suất của 1 2X X .

7) Cho 2 biến ngẫu nhiên độc lập X Y có bảng phân phối xác suất như sau:

Page 49: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

18

X 1 2 3

P 0,2 0,3 0,5

a) Tìm phân phối xác suất của Z X Y và tính ( ) ( )E Z Var Z .

b) Tìm phân phối xác suất của W X Y và tính ( ) ( )E W Var W .

8) Gieo 3 con xúc xắc cân đối, đồng chất. Gọi X là số điểm trên 3 con xúc xắc. Tính

( ) ( )E X Var X .

9) Một xấp bài gồm 7 quân đỏ và 3 quân đen. Trong một ván chơi, người chơi rút ngẫu nhiên

1 quân bài. Nếu được quân đen thưởng 20 đồng, nếu được quân đỏ bị phạt 8 đồng. Gọi X là số

tiền người chơi chơi trong 10 ván. Tính số tiền trung bình mà người chơi thu được.

10) Có 3 chuồng gà: chuồng I có 4 mái, 2 trống; chuồng II có 2 trống, 3 mái; chuồng III để

trống.

a) Từ mỗi chuồng bắt ngẫu nhiên 1 con gà. Sau đó dồn hết số gà còn lại vào chuồng

III. Từ chuồng III bắt ngẫu nhiên ra 2 con gà. Gọi X là số gà trống bị bắt ra. Tính

( ) ( )E X Var X .

b) Từ chuồng I bắt ngẫu nhiên 2 con gà bỏ vào chuồng II. Sau đó từ chuồng II bắt

ngẫu nhiên ra 2 con gà. Gọi Y là số gà trống còn lại trong chuồng II. Tính

( ) ( ) (5 8) E Y Var Y P Y .

11) Có 2 chuồng thỏ: chuồng I có 5 con (2 trắng, 3 nâu); chuồng II có 6 con (4 trắng, 2 nâu).

Ngẫu nhiên có 2 thỏ từ chuồng II chạy sang chuồng I. Sau đó, người ta bắt từ chuồng II ra 3

con. Gọi X là số thỏ trắng được bắt ra. Lập bảng phân phối xác suất của X. Tính các đặc trưng

( ) ( )E X Var X .

12) Gieo 3 hạt giống khác nhau I, II, III với xác suất nảy mầm của mỗi loại tương ứng là 0,8;

0,9; 0,85. Giả sử rằng sự nảy mầm của mỗi hạt là độc lập lẫn nhau. Gọi X là số hạt nảy mầm

sau khi gieo. Lập bảng phân phối xác suất của X và tính các đặc trưng ( ) ( )E X Var X .

13) Một thiết bị máy móc gồm 3 bộ phận I, II, III hoạt động độc lập với nhau. Xác suất để các

bộ phận bị hỏng trong khoảng thời gian 2 năm lần lượt là 0,3; 0,15; 0,2. Gọi X là số bộ phận

bị hỏng của thiết bị trên trong khoảng thời gian 2 năm. Lập bảngphân phối xác suất của X và

tính các đặc trưng ( ) ( )E X Var X .

14) Có 2 chuồng gà: chuồng I có 6 con (4 gà trống, 2 gà mái); chuồng II có 5 con (1 gà trống,

4 gà mái). Từ mỗi chuồng bắt ngẫu nhiên ra 2 con gà. Gọi X là số gà trống trong 4 con gà bắt

ra. Lập bảng phân phối xác suất của X và tính các đặc trưng ( ) ( )E X Var X .

15) Gọi X là số khách hàng vào 1 của hàng trong khoảng thời gian 1 giờ. Giả sử X có phân

phối Poisson với 6 5 . Tính

a) Trung bình 1 giờ có bao nhiêu khách hàng đến cửa hàng.

b) Tính xác suất để số khách hàng vào cửa hàng từ 4 đến 8 khách hàng.

c) Tính xác suất để có ít nhất 3 khách vào cửa hàng.

d) Khả năng vắng khách trong thời gian 1 giờ là bao nhiêu.

16) Gọi X là trọng lượng (kg) của con gà công nghiệp 4 tháng tuổi. Giả sử

(3 5 0 25) X N .

X 2 4

P 0,4 0,6

Page 50: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

19

a) Trọng lượng trung bình của mỗi con gà là bao nhiêu.

b) Tính tỷ lệ đàn gà có trọng lượng trên 2kg.

c) Gọi Y là số con gà nặng trên 2kg trong 100 con bắt ra. Lập bảng phân phối xác

suất của Y.

17) Giả sử (3 0 09) (2) X N Y Exp và X, Y độc lập. Tìm

a) (2 3 5) ( 5 3) E X Y Var X Y .

b) 2 2( 4 3 2) E X Y XY Y .

18) Có 2 hộp: hộp I đựng 6 bi (1 bi số 1, 2 bi số 2, 3 bi số 3); hộp II đựng 8 bi (2 bi số 1, 5 bi

số 2, 1 bi số 3). Rút ngẫu nhiên mỗi hộp 1 bi. Gọi X, Y là số ghi trên bi rút ra từ hộp I, II

tương ứng.

a) Lập bảng phân phối xác suất của vectơ ngẫu nhiên ( )X Y .

b) Tính hệ số tương quan ( ) X Y .

Page 51: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

CHƯƠNG 3

LÝ THUYẾT MẪU 3.1. Mẫu ngẫu nhiên

3.1.1. Ðịnh nghĩa

- Ðể nghiên cứu đại lượng ngẫu nhiên X của một tổng thể, ta quan sát một cách độc lập

(cân, đong, đo, đếm, ...) n lần về X. Gọi Xi là giá trị quan sát ở lần thứ i (i=1..n) thì (Xi) là

các biến ngẫu nhiên độc lập, cùng phân phối như X. Khi đó, mẫu 1 2( , , , )nX X X được

gọi là mẫu ngẫu nhiên sinh ra từ X, n gọi là cỡ mẫu hay số lần quan sát.

- Gọi xi là 1 kết quả cụ thể của Xi. Khi đó 1 2( , , , )nx x x là một giá trị cụ thể mà mẫu

ngẫu nhiên 1 2( , , , )nX X X nhận và được gọi là mẫu thực nghiệm. Dựa trên đó, ta sẽ

dùng các phương pháp và kết quả thống kê toán học để phân tích và rút ra những kết luận

cần thiết.

3.1.2. Bảng tần số mẫu, đa giác tần suất, tổ chức đồ

3.1.2.1. Bảng phân phối tần số thực nghiệm:

Giả sử mẫu thực nghiệm 1 2( , , , )nx x x có k giá trị khác nhau, ký hiệu

(1) (2) ( )< < < kx x x . Gọi ni là số các quan sát trong mẫu có giá trị xi Khi đó ta có bảng

tần số mẫu như sau

Hình 3.1. Biểu đồ tần số thực nghiệm

3.1.2.2. Bảng phân phối tần suất

Ða giác tần suất: Trên hệ trục tọa độ, biễu diễn các điểm có tọa độ ( , )i ix f . Ðồ thị gồm

các đường thẳng nối các điểm đó gọi là đa giác tần suất.

Page 52: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

Hình 3.2. Ða giác tần suất

- Trong trường hợp số k lớn, ta có thể chia các giá trị của mẫu thành các khoảng con

bằng nhau 1= ( , ]( = 1.. )i i iS a a i k với 1 =i ia a h (hằng số). Gọi ni là số các quan sát

trong mẫu có giá trị rơi vào khoảng Si. Khi đó ta có bảng tần số mẫu như sau

Tổ chức đồ: Trên hệ trục tọa độ, biểu đồ cột có chiều rộng h, chiều cao tương ứng mỗi

cột là =.

ii

nf

h n được gọi là tổ chức đồ.

Hình 3.3. Tổ chức đồ

- Ða giác tần suất và tổ chức đồ cho ta dáng điệu của hàm mật độ của biến ngẫu nhiên X.

3.1.3. Phân phối thực nghiệm

- Giả sử mẫu thực nghiệm 1 2( , , , )nx x x sinh từ X. Ta xây dựng hàm

( ) =nF x iSè c¸c gi¸ trÞ x < xn

được gọi là hàm phân phối thực nghiệm.

- Ðịnh lý Glivenco. Giả sử F(x) là hàm phân phối của biến ngẫu nhiên X mà ta cần tìm.

Fn(x) là hàm phân phối thực nghiệm nhận được từ mẫu ngẫu nhiên cỡ n sinh ra từ X. Khi

đó

{ | ( ) ( ) | 0 khi } = 1sup nx

P F x F x n

R

Như vậy hàm phân phối thực nghiệm là một xấp xỉ của hàm phân phối lý thuyết.

Với n cố định, hàm phân phối thực nghiệm cho ta hình ảnh hình học về phân phối lý

Page 53: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

thuyết cần tìm.

3.2. Các đặc trưng mẫu

- Giả sử 1 2( , , , )nX X X là mẫu ngẫu nhiên sinh ra từ X có 2= , =EX DX .

3.2.1. Thống kê

- Một hàm 1 2= ( , , , )nT T X X X được gọi là một thống kê.

Ví dụ: 1 2 1 2( , , , ) = { , , , }maxn nn

T X X X X X X là một thống kê.

3.2.2. Kỳ vọng mẫu (Trung bình mẫu)

- Thống kê, ký hiệu X , xác định bởi

=1

1=

n

i

i

X Xn

gọi là kỳ vọng mẫu.

- Kỳ vọng mẫu là một biến ngẫu nhiên có các đặc trưng

2

( ) = ; ( ) =E X D Xn

3.2.3. Phương sai mẫu

- Thống kê, ký hiệu 2

S , xác định bởi

2

2

=1

1= ( )

n

i

i

S X Xn

gọi là phương sai mẫu.

- Dùng các phép biến đổi, ta được

2 2

2

=1

1=

n

i

i

S X Xn

- Phương sai mẫu cũng là một biến ngẫu nhiên và 2

21=

nES

n

.

- Thống kê

2

2 2

=1

1= ( ) =

1 1

n

i

i

nS X X S

n n

gọi là phương sai mẫu điều chỉnh. 3.2.4. Ðộ lệch tiêu chuẩn mẫu

- Thống kê 2

=S S được gọi là độ lệch tiêu chuẩn mẫu.

- Thống kê 2=S S được gọi là độ lệch tiêu chuẩn mẫu điều chỉnh.

3.2.5. Cách tính 2

,X S

- Giả sử mẫu thực nghiệm 1 2( , , , )nx x x có bảng tần số mẫu:

Page 54: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

- Khi đó

2 2

2

=1 =1 =1

1 1= , = , =

k k k

i i i i i

i i i

n n X n x S n x Xn n

- Nếu các giá trị xi cách đều nhau thì ta có thể đơn giản tính toán bằng phép đổi biến

sau

0= ( = 1.. )ii

x xu i k

h

trong đó x0 là giá trị chọn nào đó, h là khoảng cách đều giữa các xi. Khi đó

2 2

2 2 2 2

0 0

=1 =1

1= = , = [ ] = .

k k

i i i i u

i i

hX n u x hu x S h n u u h s

n n

- Chú ý: Nếu bảng tần số của mẫu cho dưới dạng khoảng thì ta chọn giá trị đại diện xi cho

mỗi khoảng là giá trị trung bình của mỗi khoảng.

- Ví dụ: Tại một trang trại, điều tra trọng lượng của một loại trái cây, ta thu được kết quả

sau:

Tính 2,X S .

Thực hiện đổi biến: 0= ii

x xu

h

với 0 = 52,5; = 5x h .

Ta lập bảng tính như sau:

Khi đó:

2 2103 533

= 250; = = 0,412; = ( 0,412) = 1,962250 250

un u s

Suy ra

2 22 2 2

0= = 50,44; = = 49,06; = = 49, 251

u

nX hu x S h s S S

n

3.3. Một số phân phối trong thống kê

3.3.1. Phân phối 2

- Cho dãy biến ngẫu nhiên (Xi) độc lập, cùng phân phối chuẩn (0,1)N . Khi đó biến ngẫu

Page 55: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

nhiên

2 2 2 2

1 2( ) = nn X X X

gọi là có phân phối khi-bình phương với bậc tự do n.

- Hàm mật độ của phân phối 2 ( )n có dạng

xn/2-1 -2

n/2

0 nÕu x £ 0f(x) = x e nÕu x > 0

2 G(n/2)

trong đó 1

0

( ) = , > 0p xp x e dx p

là hàm Gamma.

3.3.2. Phân phối Student t

- Giả sử 2(0,1), ( )U N V n: : độc lập nhau. Khi đó phân phối của biến ngẫu nhiên

=/

UT

V n

gọi là phân phối Student t với n bậc tự do.

Hàm mật độ của phân phối Student t có dạng

12

2

1( )

2( ) = (1 )( /2)

nn

xf x

nn n

3.3.3. Phân phối Fisher F

- Giả sử 2 2( ), ( )U m V n : : độc lập nhau. Khi đó phân phối của biến ngẫu nhiên

/

=/

U mF

V n

gọi là phân phối F với m,n bậc tự do.

3.4. Phân phối của 2, nX S

- Giả sử mẫu ngẫu nhiên 1 2( , , , )nX X X sinh ra từ phân phối chuẩn 2( , )N . Khi đó

2

( , )X Nn

: hay

( )(0;1)

Xn N

: .

1X

nS

hoặc

Xn

S

có phân phối Student với n bậc tự do.

2

2

2( 1)

nSn

: hay

22

2

( 1)( 1)

n Sn

:

2

2

2=1

( )( )

ni

i

Xn

:

- Nếu mẫu 1 2( , , , )nX X X sinh từ 2

1 1( , )N và mẫu 1 2( , , , )mY Y Y sinh từ 2

2 2( , )N

thì

Page 56: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

2 2

1 21 2( , )X Y N

n m

: .

1 2

2 2

( ) ( )

( 1) ( 1)

2X Y

X Y

n S m S n m

n m nm

có phân phối Student với m+n-2 bậc tự do.

2 2

1

2 2

2

/( 1, 1)

/

X

Y

SF n m

S

: bậc tự do.

2 2

1 1

=1

2 2

2 2

=1

( ) /

( , )

( ) /

n

i

i

n

i

i

Xm

F n mn

Y

: ?bậc tự do.

- Chú ý: Nếu mẫu ngẫu nhiên 1 2( , , , )nX X X sinh ra từ một biến ngẫu nhiên bất kỳ có

phương sai hữu hạn khác không thì theo định lý giới hạn trung tâm, khi n lớn thì trung

bình mẫu X có phân phối tiệm cận chuẩn. Do đó các kết quả trên vẫn đúng đối với mẫu

ngẫu nhiên sinh ra từ một biến ngẫu nhiên bất kỳ.

Page 57: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

Bài tập

1. Ðo độ dài của 36 chi tiết được chọn ngẫu nhiên của một loại sản phẩm, ta được bảng

số liệu sau:

39 43 41 41 40 41 43 42 41 39 40 42

44 42 42 41 41 42 43 40 41 41 42 43

39 40 41 39 40 42 40 43 39 41 40 40

a) Lập bảng tần số thực nghiệm và hàm phân phối thực nghiệm.

b) Tìm các đặc trưng mẫu 2,X S .

2. Quan sát chiều cao của 1 loại cây dầu sau 6 tháng tuổi ở khu trồng trọt A, ta thu được

bảng số liệu sau:

a) Lập bảng tần số thực nghiệm và hàm phân phối thực nghiệm.

b) Tìm các đặc trưng mẫu 2,X S .

3. Kết quả đo chiều cao của sinh viên trường Ðại học A cho ở bảng số liệu sau:

Tìm các đặc trưng mẫu 2,X S .

4. Kết quả khảo sát về hàm lượng Vitamin C của một loại trái cây cho ở bảng số liệu sau:

Tìm hàm lượng Vitamin C trung bình của trái cây.

5. Có thể nói gì về mẫu có độ lệch tiêu chuẩn mẫu bằng 0?

Page 58: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

CHƯƠNG 4:

ƯỚC LƯỢNG THAM SỐ.

4.1. Các khái niệm cơ bản về ước lượng điểm và ước lượng khoảng.

Lập thống kê (X1, X2, ..., Xn) để ước lượng cho tham số .

4.1.1. Định nghĩa: Thống kê (X1, X2, ..., Xn) ước lượng cho tham số được

gọi là hàm ước lượng của .

Với mẫu cụ thể (x1, x2, ..., xn) thì ((x1, x2, ..., xn) là 1 điểm trên trục số R, điểm

đó dùng thay cho . (X1, X2, ..., Xn) được gọi là ước lượng điểm của .

4.1.2. Định nghĩa: Khoảng tin cậy ( 1, 2) của tham số số với độ tin cậy 1- là

1 khoảng ( 1, 2) với 1= 1 (X1, X2, ..., Xn); 2 = 2 (X1, X2, ..., Xn) sao cho P{1(X1,

X2, ..., Xn)} 2 (X1, X2, ..., Xn)} = 1 - .

4.2. Một số loại ước lượng điểm

4.2.1. Ước lượng không chệch

a. Hàm ước lượng (X1, X2, ..., Xn) được gọi là ước lượng không chệch của

nếu E (X1, X2, ..., Xn) = .

b. Giả sử (X1, X2, ..., Xn) là hàm ước lượng của

Nếu 1

ˆlim ( ,... )nn

E X X

= 0 thì được gọi là tiệm cận không chệch của .

Độ chệch của một ước lượng được đo bằng giá trị BS = )ˆ(E .

Giữa những ước lượng chệch thì ta chọn ước lượng có BS nhỏ nhất.

Ví dụ:

1. Trung bình mẫu X là ước lượng không chệch của EX = ..

Thật vậy: EX = EXi = ; EX = E

iX

n

1 =

2. VarX = E(X-EX)2 =

2

S2 =

1n

1

2S , S2 là ước lượng không chệch cho

2

Page 59: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

Thật vậy: ES2 = 22SE

1n

n

3. E(f) = P . Tần suất mẫu là ước lượng không chệch cho xác suất P.

4.2.2. Ước lượng vững

được gọi là ước lượng vững cho nếu >0: 1ˆlim ( ,..., )n

nP X X

= 1.

Ký hiệu P

Theo luật số lớn Chebyshev và luật số lớn Bernoulli thì X là ước lượng vững của

EX = ; tần suất mẫu f là ước lượng vững của xác suất P.

Định lý : Nếu (X1, X2, ..., Xn) là ước lượng tiệm cận không chệch của và

nlim var [ (X1, X2, ..., Xn)] = 0 thì (X1, X2, ..., Xn) là ước lượng vững của .

Chứng minh:

Theo bất đẳng thức chebyshev P ˆEˆ 1 - 2

ˆvar

lim P = 1 vì var 0

4.2.3. Ước lượng hiệu quả (ước lượng không chệch có phương sai tối thiểu)

Định nghĩa 1: Giả sử (X1, X2, ..., Xn) và T(X1, X2, ..., Xn) là các ước lượng

không chệch của .

Nếu var ( ) var T, T là ước lượng bất kỳ khác thì ước lượng không chệch

có phương sai tối thiểu (hay ước lượng hiệu quả của ).

Định nghĩa 2: (Lượng thông tin Fisher)

a) Giả sử biến ngẫu nhiên rời rạc X có hàm xác suất P(X=x) =P(x,) phụ thuộc

. Lượng thông tin Fisher về tham số chứa trong một quan sát được định nghĩa như

sau : I( ) = E

2( , )LnP x

=

2),x(LnP

P(x,)

b) Nếu X là biến ngẫu nhiên liên tục với hàm mật độ xác suất P(x,) thì

Page 60: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

I( ) = E

2,x(LnP

=

2),x(LnP

P(x,)dx

Định lý: Nếu mẫu (X1, X2, ..., Xn) lấy từ biến ngẫu nhiên X có hàm mật độ xác

suất P(x,) và là một ước lượng không chệch của thì:

Var( ) )(nI

1

),x(LnPnE

12

(bất đẳng thức Cramer - Rao)

Ý nghĩa: Không tồn tại một ước lượng nào có phương sai bằng 0 và cận dưới của

phương sai các ước lượng là )(nI

1

.

4.3. Phương pháp tìm ước lượng điểm

4.3.1. Phương pháp ước lượng hợp lý cực đại

Giả sử X là biến ngẫu nhiên có hàm mật độ xác suất p(x,), trong đó p đã biết còn

chưa biết. Để ước lượng , ta lấy mẫu (X1, X2, ..., Xn) và lập hàm

L()= p(X1, ). p(X2,)...p(Xn,)

Tìm (X1, X2, ..., Xn) sao cho : L( ) L(), T (1)

Hàm L() được gọi là hàm hợp lý của tham số ; giá trị của hàm hợp lý là mật độ

xác suất tại điểm (x1, x2, ..., xn). Giá trị của thống kê tại điểm đó được gọi là ước lượng

hợp lý cực đại của nếu ứng với giá trị này của , hàm hợp lý L() đạt cực đại (nghĩa là

mật độ xác suất tại (x1, x2, ..., xn) đạt cực đại). Do hàm L() và LnL() cùng đạt cực đại

tại 1 điểm nên người ta tìm cực đại của LnL bằng cách giải nghiệm của phương trình:

d

dLnL = 0; giả sử nghiệm là = = f (x1, x2, ..., xn).

Xét 2

2

d

LnLd

. Nếu tại = ,

2

2

d

LnLd

< 0 thì L() đạt cực đại tại .

Khi đó = f (x1, x2, ..., xn) là ước lượng điểm hợp lý tối đa cần tìm của .

Ví dụ: Cho X N( µ,2); giả sử đã biết

2 ,tìm ước lượng hợp lý cực đại của µ.

L() = L(µ) =

2

21

1( )

21

2

n

i

i

X

ne

Page 61: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

LnL() = LnL(µ) = nLn 2

1

1 1

22

n

i

i

Xn

2

n

1ii2

X1

d

dLnL

d

dLnL = 0

n

1iiX = 0

µ = n

Xn

1i

= X

Xét đạo hàm cấp hai

22

2 n

d

LnLd

< 0

LnL(µ) đạt cực đại tại X .

Vậy X là ước lượng hợp lý cực đại của µ.

Kết quả trên có thể mở rộng cho trường hợp tham số nhiều chiều, chẳng hạn

= (1,2). Để tìm , ta giải hệ

i

)(LnL = 0, i = 2,1

Nghiệm của hệ: = ( 1, 2) là ước lượng hợp lý cực đại của nếu thỏa mãn (1).

Ví dụ: Cho X N(µ,2), trong đó µ,

2 : chưa biết. Tìm ước lượng hợp lý cực đại

hợp lý cho (µ,2).

nX

1LnL i2

= 0 (3)

3

2n

1ii

2

)X(n)(LnL

= 0 (4)

22 S

X

Ta có: LnL() = 2

21

1 1( )

22

n

i

i

nLn X

Page 62: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

LnL(µ,2) = -nLn -

2

nLn(2 ) -

2

2

2

ˆ

2

nS n X

LnL( X ,S 2) = -nLn S -

2

nLn(2 ) -

2

n

Để LnLn(µ,2) LnLn( X , S 2

) -nLn -

2

22

2

XnSn

-nLn S -

2

n

0

SLn

2

1

2

S2

2

+

2

2

2

X

(5)

(5) luôn luôn đúng vì 2

1(x

2-1) Lnx, x>0.

Vậy X và S 2 là ước lượng hợp lý cực đại của µ và

2

4.3.2. Phương pháp Moment

Xét mẫu ngẫu nhiên (X1, X2, ..., Xn) lấy từ biến ngẫu nhiên X. Giả sử X có phân

phối F(x,1, 2,... m) và ta cần ước lượng m tham số này.

Các moment của X lần lượt là:

EX = g1(1, 2,... m)

EX2 = g2(1, 2,... m)

....

EXm = gm(1, 2,... m)

Gọi các moment mẫu cấp k là

n

1i

kiX

n

1 , k = m,1 .

Ước lượng = ( 1, ..., k) là nghiệm của hệ phương trình:

gk(1, 2,... m) =

n

1i

kiX

n

1, k = m,1 .

Hàm được gọi là ước lượng của bằng phương pháp moment.

Ví dụ: Cho X N(µ,2) với µ,

2 chưa biết. Hãyước lượng µ,

2 bằng phương

pháp moment.

Ta có EX = µ

EX2 =

2 + µ

2

Page 63: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

hệ phương trình :

n

1i

222i

n

1ii

Xn

1

Xn

1

có nghiệm là:

= X

2 =

n

1i

22iX

n

1 =

n

1i

22i XX

n

1 = S 2

Vậy, bằng phương pháp moment, ta tìm được: ước lượng của µ là X ; ước lượng

của 2 là S 2

4.4. Ước lượng khoảng.

4.4.1. Khái niệm

Mục đích của bài toán là tìm khoảng tin cậy ( 1, 2) của tham số với độ tin cậy

1- .

Với mẫu ngẫu nhiên (X1, X2, ..., Xn) ta xây dựng thống kê K = f (X1, X2, ..., Xn,)

sao cho quy luật phân phối xác suất của K hoàn toàn được xác định.

Với độ tin cậy 1 - , và với 1, 2 sao cho: 1 + 2 = , ta tìm được các giá trị

1 21 ,k k sao cho :

P(K>2

k ) = 2

P(K<11k ) = 1

P(11k < K <

2k ) = 1- 2 - 1 = 1-

Từ khoảng tin cậy (11k ;

2k ) của K ta suy ra khoảng tin cậy ( 1 , 2) của sao

cho P( 1<< 2) = 1- .

Trên một phép thử với mẫu ngẫu nhiên (X1, X2, ..., Xn), ta nhận được mẫu cụ thể

(x1, x2, ..., xn) và các giá trị của 1, 2 ứng với mẫu cụ thể này. Từ đó nhận được khoảng

tin cậy của ứng với mẫu thu được.

4.4.2. Ước lượng kỳ vọng toán µ của biến ngẫu nhiên phân phối chuẩn.

Page 64: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

Giả sử X là biến ngẫu nhiên phân phối chuẩn N(µ,2). Ta ước lượng µ theo 2

trường hợp sau:

1) Đã biết phương sai 2.

Ta dùng thống kê K = nX

, theo chương 3, ta đã biết K phân phối theo

quy luật chuẩn N(0;1)

Với : 1 + 2 = , ta tìm được 11u ,

2u sao cho:

P(U > 2

u ) = 2 và P(U<11u ) = 1

Do tính đối xứng của phân phối N(0;1) nên: 11u = -

1u .

Từ đó suy ra: P(-1

u < U < 2

u ) = 1- 2 - 1 = 1-

P

21

unX

u = 1 -

P

nuX

nuX

12 = 1 -

Khoảng tin cậy 1 - dành cho µ :

X - n

uXn

u12

* Với 1 = 2 = /2, ta có khoảng tin cậy đối xứng:

X -n

uXn

u

22

* Với 1 = 0, 2 = , ta có khoảng tin cậy phía phải:

X -

n

u

* Với 1 = , 2 = 0 , ta có khoảng tin cậy phía trái:

- ∞ < µ < X + un

2) Chưa biết phương sai 2:

Page 65: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

Xét thống kê K = nS

X , K phân phối theo quy luật Student với số bậc tự

do k = n-1.

Với = 1 + 2 , ta tìm các giá trị 21

t,t1 sao cho:

P (K> 2

t ) = 2

P(K < 11t ) = P(K< -

1t ) = 1.

P(-1

t < K < 2

t ) = 1-

P(-1

t < nS

X <

2t ) = 1-

khoảng tin cậy dành cho : X -2

tn

S < < X +

1t

n

S

Với 1 = 2 = 2

, ta có khoảng tin cậy đối xứng:

X -

2

t n

S < < X +

2

t n

S

* Với 1 = 0, 2 = , ta có khoảng tin cậy phía phải:

( X - tn

S ; + )

* Với 1 = , 2 = 0 , ta có khoảng tin cậy phía trái:

(-; X + tn

S )

4.4.3. Uớc lượng khoảng tin cậy phương sai của biến ngẫu nhiên phân phối

chuẩn (trường hợp chưa biết )

Cho biến ngẫu nhiên X N(, 2). Ta xây dựng khoảng tin cậy cho tham

số 2 .

Xét thống kê K = 2

2S)1n(

phân phối

2 với (n-1) bậc tự do.

Với 1 2 , tìm được các giá trị 21 1 ;

2

2 sao cho:

Page 66: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

P(K > 2

2 ) = 2

P(K > 21 1 ) = 1- 1

P (1 2

2 2

1 K ) = 1- 2 - 1 = 1 - .

P

2 1

2 2

2

2 2

1

1 1n S n S

= 1 - .

Khoảng tin cậy của 2 :

2 1

2 2

2

2 2

1

1 1n S n S

* 1 = 2 = 2

2 2

2

2 2

/ 2 1 / 2

1 1n S n S

* 1 = 0; 2 = 2

2

1;

n S

* 1 = ; 2 = 0

21

2S1n;0

4.4.4. Ước lượngkhoảng tin cậy xác suất p của biến ngẫu nhiên phân phối theo

quy luật 0 - 1:

Ta có: tần suất f = n

X

n

m i có kì vọng Ef = p, phương sai Df =

(1 )p p

n

(Df = 2 2

iDX npq

n n

).

Ta đã biết :

K = (1 )

f p

p p

n

có phân phối tiệm cận chuẩn N(0;1) khi n .

Trong thực tế:

* Nếu n lớn, p nhỏ thì f phân phối xấp xỉ quy luật Poisson.

* Nếu n lớn, p không nhỏ song thỏa mãn điều kiện:

n > 5 và

1

1

p p

p p

n

< 0,3.

Page 67: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

thì K =

(1 )

f p n

p p

phân phối xấp xỉ chuẩn N(0;1).

Với 1 = 2 = / 2, ta tìm được P (U>U /2 ) = / 2

P (U1- / 2 < U < U/2) = P (-U/2 < U < U/2 ) = 1 -

P(- U/2 <

(1 )

f p n

p p

< U/2 ) = 1- .

Việc giải p là phức tạp, nên trong thực tế nếu n ≥ 100, ta chọn thống kê:

K =

(1 )

f p n

f f

. Từ đó tìm được khoảng tin cậy đối xứng dành cho p:

f - u/2 n

)f1(f < p < f + u/2

n

)f1(f

Ví dụ: Gieo 1000 hạt giống thấy có 765 hạt nẩy mầm. Với độ tin cậy 95%, hãy

ước lượng khoảng tin cậy cho tỉ lệ nẩy mầm của loại hạt giống nầy.

BÀI TẬP

4.1. Theo dõi năng suất của 100 điểm trồng giống lúa A ở địa phương B, người ta thu

được kết quả sau:

Năng suất (tạ/ ha) Số điểm (ni)

25 - 30

30 - 35

35 - 40

40 - 45

45 - 50

50 - 55

55 - 60

60 - 65

65 - 70

3

5

12

18

26

20

8

5

3

1) Với độ tin cậy 98%, hãy ước lượng khoảng tin cậy cho tỉ lệ điểm trồng lúa có

năng suất cao hơn 50tạ/ha của địa phương B.

2) Với độ tin cậy 95%, hãy ước lượng khoảng tin cậy cho năng suất trung bình

của giống lúa A ở địa phương B.

Page 68: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

4.2. Với số liệu trong bài tập 3.2 chương III, hãy:

1) Ước lượng khoảng tin cậy cho tỉ lệ cây dầu có chiều cao lớn hơn 50 cm của

khu trồng trọt A với độ tin cậy 95%. Nếu muốn cho sai số của ước lượng không vượt quá

0,01 thì ta phải tăng kích thước mẫu lên bao nhiêu?

2) Với độ tin cậy 99%, hãy ước lượng khoảng tin cậy cho chiều cao trung bình

của cây dầu sau 6 tháng tuổi ở khu trồng trọt A.

4.3. Tại một khu rừng nguyên sinh, người ta đeo vòng cho 2000 con chim rồi thả vào

rừng. Sau một thời gian, bắt lại 500 con thì thấy có 92 con có đeo vòng. Với độ tin

cậy 98%, hãy ước lượng số lượng chim trong khu rừng.

4.4. Đường kính của 176 chi tiết máy do một máy sản xuất được cho trên bảng sau:

Đường kính (mm) Số chi tiết máy

9,5

9,6

9,7

9,8

9,9

10,0

10,1

10,2

10,3

10,4

5

8

15

22

34

38

26

15

7

6

Những chi tiết có đường kính từ 9,8mm đến 10,2mm được xem là đạt tiêu chuẩn

kỹ thuật.

1) Ước lượng tỉ lệ và ước lượng trung bình đường kính của những chi tiết đạt

tiêu chuẩn với cùng độ tin cậy 99%.

2) Để sai số ước lượng đường kính trung bình của các chi tiết đạt tiêu chuẩn là

0,02mm và sai số ước lượng tỉ lệ chi tiết đạt tiêu chuẩn là 0,05 với cùng độ

tin cậy 99% thì cần phải đo thêm bao nhiêu chi tiết nữa.

4.5. Người ta dùng một phương pháp đo để đo 5 lần đường kính của một chi tiết máy,

kết quả như sau: 4,89; 5,22; 5,15; 4,98 và 4,92mm. Với độ tin cậy 95%, hãy ước

lượng khoảng tin cậy cho phương sai của phương pháp đo này.

Page 69: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

NỘI DUNG CHI TIẾT

Chương 1: Các khái niệm cơ bản về xác suất.

1.1. Giải tích tổ hợp.

1.2. Biến cố ngẫu nhiên.

1.3. Xác suất của biến cố ngẫu nhiên.

1.4. Các định lý cơ bản về xác suất.

Chương 2: Biến ngẫu nhiên và qui luật phân phối xác suất.

2.1. Biến ngẫu nhiên.

2.2. Hàm phân phối xác suất.

2.3. Các đặc trưng của biến ngẫu nhiên.

2.4. Một số qui luật phân phối xác suất thông dụng.

2.5. Vectơ ngẫu nhiên 2 chiều.

2.6. Luật số lớn.

2.7. Các định lí giới hạn.

Chương 3: Lý thuyết mẫu.

3.1. Mẫu ngẫu nhiên.

3.2. Các đặc trưng của mẫu.

3.3. Một số phân phối trong thống kê.

Chương 4: Ước lượng tham số.

4.1. Các khái niệm.

4.2. Một số ước lượng điểm

4.3. Các phương pháp tìm hàm ước lượng.

4.4. Ước lượng bằng khoảng tin cậy.

Chương 5: Kiểm định giả thiết

5.1. Các khái niệm.

5.2. Kiểm định giả thiết về kì vọng toán của biến ngẫu nhiên phân phối chuẩn.

5.3. Kiểm định giả thiết về xác suất p của biến ngẫu nhiên phân phối theo qui

luật 0-1.

5.4. Kiểm định giả thiết về phương sai của biến ngẫu nhiên phân phối chuẩn.

5.5. So sánh hai kì vọng toán.

5.6. So sánh hai xác suất.

5.7. So sánh hai phương sai.

5.8. Kiểm định giả thiết về qui luật phân phối xác suất của biến ngẫu nhiên.

5.9. Kiểm định giả thiết về tính độc lập.

Chương 6: Tương quan và hồi qui.

6.1. Các khái niệm.

6.2. Phân tích hồi qui tuyến tính đơn.

Page 70: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

1

CHƯƠNG 5 :

KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ

5.1. CÁC KHÁI NIỆM CƠ BẢN

5.1.1. Giả thiết thống kê

Giả thiết thống kê là mệnh đề về dạng phân phối F(x, θ) của biến ngẫu nhiên X; về

tham số θ của X hoặc về tính độc lập của các biến ngẫu nhiên.

Giả thiết thống kê đưa ra được ký hiệu là H0.

Giả thiết đối lập của H0 được ký hiệu là H1.

Vấn đề đặt ra là hãy kiểm tra xem chấp nhận được hay không chấp nhận được giả thiết

H0. Việc kiểm định này được dựa vào thông tin của mẫu ngẫu nhiên (X1, X2, . . ., Xn) nên

được gọi là kiểm định thống kê.

5.1.2. Phương pháp chung

Gọi U là không gian các giá trị của mẫu ngẫu nhiên (X1, X2, . . ., Xn). Ta chia U thành 2

phần W và W sao cho W ∩ W = và W W = U. Sau đó, ta chọn quyết định theo quy

tắc sau:

+ Nếu (X1, X2, . . ., Xn) W thì ta bác bỏ giả thiết H0 và chấp nhận đối thiết H1.

+ Nếu (X1, X2, . . ., Xn) W thì ta chấp nhận giả thiết H0.

Miền W được gọi là miền tiêu chuẩn. Vấn đề là ta chọn miền W như thế nào?

Với phương pháp kiểm định nêu trên, ta có thể mắc hai loại sai lấm sau:

1) Sai lầm loại 1: Bác bỏ giả thiết H0 trong khi H0 đúng. Xác suất mắc sai lầm loại

này được ký hiệu là P(W /H0).

2) Sai lầm loại 2: Chấp nhận giả thiết H0 trong khi H0 sai. Xác suất mắc sai lầm loại

này được ký hiệu là P(W /H1).

Ta có, P(W /H0) + P(W /H0) = 1

P(W /H1) + P(W /H1) = 1.

Miền tiêu chuẩn W làm cực tiểu P(W /H0) nhưng chưa chắc đã làm cực tiểu P(W /H1),

nên ta không thể cùng một lúc làm cực tiểu cả 2 sai lầm. Thông thường, ta xác định miền

W sao cho:

Page 71: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

2

P(W /H0) = ( cho trước khá bé)

P(W /H1) = min.

Giá trị được gọi là mức ý nghĩa của tiêu chuẩn.

5.1.3. Thống kê kiểm định

Từ mẫu ngẫu nhiên (X1, X2, . . ., Xn) của biến ngẫu nhiên X, ta lập thống kê

K = f(X1, X2, . . ., Xn, θ), θ là tham số liên quan đến giả thiết kiểm định.

Điều kiện của thống kê K là nếu giả thiết H0 đúng thì quy luật phân phối xác suất của

K hoàn toàn xác định. Thống kê K được gọi là thống kê kiểm định.

5.1.4. Quy tắc kiểm định giả thiết thống kê

+ Với thống kê kiểm định K đã biết quy luật phân phối xác suất, ta xác định miền W

sao cho P(K W /H0) = với là một xác suất khá bé cho trước.

W được gọi là miền bác bỏ giả thiết.

+ Trên một phép thử cụ thể, ta nhận được mẫu cụ thể (x1, x2, . . ., xn).

Gọi K0 = f(x1, x2, . . ., xn, θ).

Nếu K0 W : ta bác bỏ H0, thừa nhận H1.

Nếu K0 W : ta nói chưa có cơ sở bác bỏ H0.

5.2. KIỂM ĐỊNH GIẢ THIẾT VỀ KỲ VỌNG TOÁN CỦA BIẾN NGẪU NHIÊN PHÂN

PHỐI CHUẨN

Giả sử X là biến ngẫu nhiên phân phối chuẩn N( ; 2 ). Ta dựa vào mãu ngẫu nhiên

(X1, X2, . . ., Xn) để kiểm định giả thiết H0: = 0 .

1. Trường hợp đã biết phương sai 2

Thống kê kiểm định K = 0( )X n

.

Nếu giả thiết H0 đúng thì K = ( )X n

phân phối theo quy luật chuẩn N(0; 1).

a. Kiểm định giả thiết H0: = 0 với đối thiết H1: 0

Page 72: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

3

Với xác suất cho trước, ta tìm được giá trị 2

U sao

cho P(K>2

U ) = 2

.

Miền bác bỏ giả thiết W = ( ; 2

U ) (2

U ; )

.

b. Kiểm định giả thiết H0: = 0 với đối thiết H1: >

0

Với cho trước, ta tìm được U sao cho P(K > U )

= P(K W /H0) = .

Miền bác bỏ giả thiết W = (U ; ).

c. Kiểm định giả thiết H0: = 0 với đối thiết H1: <

0

Với cho trước, ta tìm được 1U = U sao cho

P(K W /H0) = P(K < 1U ) = P(K < U ) = .

Miền bác bỏ giả thiết W = ( ; U ) .

Ví dụ 5.1. Theo hợp đồng giữa nhà cung cấp súc vật thí

nghiệm với bộ phận giáo tài, thỏ cung cấp để làm thí nghiệm phải nặng trên 1 kg. Cân ngẫu

nhiên 50 con trong trại thỏ, tính được cân nặng trung bình 1,1 kg. Hỏi với mức ý nghĩa

= 0,05, thỏ ở trại đã có thể cung cấp làm thí nghiệm được chưa? Giả sử cân nặng của thỏ là

biến ngẫu nhiên phân phối chuẩn với là = 0,1.

Giải: Gọi X là trọng lượng của thỏ. X N( ; 2 ).

Page 73: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

4

Bài toán kiểm định giả thiết của của biến ngẫu nhiên phân phối chuẩn trong trường

hợp đã biết phương sai.

Kiểm định giả thiết H0: = 1 với đối thiết H1: > 1.

Thống kê kiểm định K = ( 1) 50

0,1

X .

Nếu giả thiết H0 đúng thì K = ( ) 50

0,1

X phân phối theo quy luật chuẩn N(0; 1).

Với = 0,05, miền bác bỏ giả thiết là W = (u ; ) = (0,05u ; ) = (1,645; ).

Giá trị quan sát K0 = (1,1 1) 50

0,1

7,07.

Ta có, K0 W nên bác bỏ giả thiết H0, chấp nhận H1. Từ đó kết luận rằng thỏ ở trại đã

có thể cung cấp để làm thí nghiệm.

2. Trường hợp chưa biết phương sai 2

Thống kê kiểm định K = 0( )X n

S

.

Nếu giả thiết H0 đúng thì K = ( )X n

S

phân phối theo quy luật Student với số bậc tự do

(n – 1).

a. Kiểm định giả thiết H0: = 0 với đối thiết H1:

0

P(K W /H0) = P(K < 2

t ) + P(K > 2

t ) = .

Miền bác bỏ giả thiết W = ( ; 2

t ) (2

t ; ).

b. Kiểm định giả thiết H0: = 0 với đối thiết H1: > 0

P(K W /H0) = P(K > t ) = . Miền bác bỏ giả

thiết W = ( t ; ).

Page 74: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

5

c. Kiểm định giả thiết H0: = 0 với đối thiết H1: <

0

P(K W /H0) = P(K < t ) = . Miền bác bỏ giả

thiết W = ( ; t ).

Ví dụ 5.2. Trong điều kiện chăn nuôi bình thường, lượng sữa trung bình của một con bò là

14 kg / 1ngày. Nghi ngờ điều kiện chăn nuôi bò kém đi làm cho lượng sữa giảm xuống,

người ta đã điều tra ngẫu nhiên 25 conbò và tính được lượng sữa trung bình của một con

trong 1 ngày là 12,5 kg và độ lệch chuẩn mẫu là 2,5 kg . Với mức ý nghĩa = 0,05, hãy

kết luận về điều nghi ngờ nói trên. Giả thiết lượng sữa bò là biến ngẫu nhiên phân phối

chuẩn.

Giải: Gọi X là lượng sữa bò.

Bài toán kiểm định giả thiết của của biến ngẫu nhiên phân phối chuẩn trong trường

hợp chưa biết phương sai.

Kiểm định giả thiết H0: = 14 với đối thiết H1: < 14.

Thống kê kiểm định K = ( 14) 25X

S

.

Nếu giả thiết H0 đúng thì K = ( ) 25X

S

phân phối theo quy luật Student với số bậc tự

do là 24.

Với = 0,05, miền bác bỏ giả thiết là W = ( ; (24)t ) = ( ; -1,711) .

Từ mẫu cụ thể ta có, giá trị quan sát K0 = (12,5 14) 25

2,5

= -3. Ta có, K0 W nên

bác bỏ giả thiết H0, chấp nhận H1. Từ đó có thể kết luận rằng điều nghi ngờ nói trên là

đúng.

Page 75: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

6

5.3. KIỂM ĐỊNH GIẢ THIẾT VỀ XÁC SUẤT P CỦA BIẾN NGẪU NHIÊN PHÂN

PHỐI THEO QUY LUẬT 0_1

Giả sử (X1, X2, . . ., Xn) là mẫu ngẫu nhiên lập từ biến ngẫu nhiên X phân phối theo quy

luật 0_1 với tham số p.

Khi đó 1

n

i

i

X

phân phối theo quy luật nhị thức B(n, p) và tần suất 1

n

i

i

X

f Xn

phân phối tiệm cận chuẩn.

Ta kiểm định giả thiết H0: p = p0 trong trường hợp n khá lớn và p không quá bé:

Xét thống kê 0

0 0

( )

(1 )

f p nK

p p

Nếu H0 đúng thì ( )

(1 )

f p nK

p p

phân phối theo quy luật N(0; 1).

1) Kiểm định giả thiết H0: p = p0 với đối thiết H1: p p0

0

2

P( | ) P(| | )K W H K U

2 2

( ; ) ( ; )W U U

2) Kiểm định giả thiết H0: p = p0 với đối thiết H1: p > p0

0P( | ) P( )K W H K U

( ; )W U

3) Kiểm định giả thiết H0: p = p0 với đối thiết H1: p < p0

0P( | ) P( )K W H K U

( ; )W U

Ví dụ 5.3. Một tổng kết của thư viện cho biết có 75% sinh viên thường xuyên đến thư viện

dọc sách tham khảo. Một mẫu thăm dò cho thấy trong 200 sinh viên có 162 sinh viên

thường xuyên đến phòng đọc. Với mức ý nghĩa 5% hãy kiểm định báo cáo tổng kết của thư

viện.

Giải: Kiểm định giả thiết H0: p = 0,75 với đối thiết H1: p 0,75

Page 76: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

7

Xét thống kê ( 0,75)

0,75(1 0,75)

f nK

Nếu H0 đúng thì K phân phối theo quy luật N(0; 1).

Với = 0,05, miền bác bỏ giả thiết 0,025( ; )W u

0,025( ; )u = ( ; -1,96)

(1,96; ).

Giá trị quan sát 0

162( 0,75) 200200

0,75.0,25K

2,29. Ta có, K0 W nên bác bỏ giả thiết

H0, chấp nhận H1: p 0,75.

5.4. KIỂM ĐỊNH GIẢ THIẾT VỀ PHƯƠNG SAI CỦA BIẾN NGẪU NHIÊN PHÂN

PHỐI CHUẨN

Giả sử biến ngẫu nhiên phân phối theo quy luật chuẩn N(, 2).

Để kiểm định giả thiết H0: 2 2

0 , ta chọn thống kê kiểm định 2

2

0

( 1)n SK

.

Nếu giả thiết H0 đúng thì 2

2

( 1)n SK

phân phối theo quy luật 2 với (n-1) bậc tự do.

1) Kiểm định giả thiết H0: 2 2

0 với đối thiết H1: 2 2

0

2 2

01

2 2

P( | ) P( ) P( )K W H K K

2 2

12 2

(0; ) ( ; )W

2) H0: 2 2

0 , H1: 2 2

0

2( ; )W

3) H0: 2 2

0 , H1: 2 2

0

2

1(0; )W

Ví dụ 5.4. Để kiểm tra độ chính xác của một máy, người ta đo ngẫu nhiên kích thước của

15 chi tiết máy do máy đó sản xuất và tính được s2 =14,6. Với mức ý nghĩa = 0,01, hãy

kết luận máy móc có hoạt động bình thường không, biết rằng kích thước của chi tiết máy là

biến ngẫu nhiên phân phối chuẩn có dung sai theo thiết kế là 2 = 12.

Page 77: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

8

Giải: Gọi X là kích thước của chi tiết máy, theo giả thiết X tuân theo quy luật phân phối

chuẩn.

Kiểm định giả thiết H0: 2 = 12 với đối thiết H1: 2 > 12

Chọn thống kê kiểm định 214.

12

SK .

Nếu giả thiết H0 đúng thì 2

2

14.SK

phân phối theo quy luật 2 với 14 bậc tự do.

Với = 0,01, ta có 2(14)( ; )W = (29,14; ).

Giá trị quan sát 2

0

14.

12

SK =

14.14,6

12 = 17,033. Suy ra,

0K W nên chưa có cơ sở

để bác bỏ giả thiết H0 hay có thể kết luận máy móc vẫn hoạt động bình thường.

5.5. KIỂM ĐỊNH GIẢ THIẾT VỀ 2 KỲ VỌNG TOÁN CỦA 2 BIẾN NGẪU NHIÊN

PHÂN PHỐI CHUẨN

Giả sử 2 biến ngẫu nhiên X, Y cùng phân phối theo quy luật chuẩn.

2

1 1~ N( , )X

2

2 2~ N( , )Y

Ta kiểm định giả thiết H0: 1 2 dựa trên mẫu ngẫu nhiên (X1, X2, ..., Xn1) lấy từ biến

X và mẫu ngẫu nhiên (Y1, Y2, ..., Yn2) lấy từ biến Y.

5. 5. 1. Trường hợp đã biết các phương sai 2

1 , 2

2 .

Thống kê kiểm định 1 2

2 2

1 2

1 2

( ) ( )X YK

n n

Với giả thiết H0 đúng: 2 2

1 2

1 2

( )X YK

n n

phân phối N(0; 1).

1) Kiểm định giả thiết H0: 1 2 với đối thiết H1: 1 2

Miền bác bỏ giả thiết mức :

2 2

( ; ) ( ; )W U U

Page 78: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

9

2) Kiểm định giả thiết H0: 1 2 với đối thiết H1: 1 2

( ; )W U

3) Kiểm định giả thiết H0: 1 2 với đối thiết H1: 1 2

( ; )W U

5. 5. 2. Trường hợp chưa biết các phương sai 2

1 , 2

2 và có cơ sở để giả thiết 2

1 = 2

2

Thống kê kiểm định 1 2

1 2

( ) ( )

1 1

X YK

Sn n

với 2 2

2 1 1 2 2

1 2

( 1) ( 1)

2

n S n SS

n n

Nếu giả thiết H0 đúng thì

1 2

( )

1 1

X YK

Sn n

phân phối theo quy luật Student với (1 2 2n n )

bậc tự do.

1) Kiểm định giả thiết H0: 1 2 với đối thiết H1: 1 2

Miền bác bỏ giả thiết mức :

2 2

( ; ) ( ; )W t t

2) Kiểm định giả thiết H0: 1 2 với đối thiết H1: 1 2

( ; )W t

3) Kiểm định giả thiết H0: 1 2 với đối thiết H1: 1 2

( ; )W t

5. 5. 3. Trường hợp chưa biết các phương sai 2

1 , 2

2 và không có cơ sở để giả thiết

2

1 = 2

2

Thống kê kiểm định 1 2

2 2

1 2

1 2

( ) ( )X YK

S S

n n

Nếu giả thiết H0 đúng thì 2 2

1 2

1 2

( )X YK

S S

n n

phân phối theo quy luật Student với số bậc tự do

Page 79: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

10

1 2

2 2

2 1

( 1)( 1)

( 1) (1 ) ( 1)

n nk

n c c n

với

2

1

1

2 2

1 2

1 2

S

nc

S S

n n

Miền bác bỏ mức được xác định như sau:

1) H0: 1 2 ; H1: 1 2

2 2

( ; ) ( ; )W t t

2) H0: 1 2 ; H1: 1 2

( ; )W t

3) H0: 1 2 ; H1: 1 2

( ; )W t

Ví dụ 5.5. Người ta cân trẻ sơ sinh ở 2 khu vực thành thị và nông thôn, thu được bảng kết

quả sau

Khu vực Số trẻ được cân Trọng lượng trung bình Phương sai mẫu

Nông thôn n1 = 2500 1x = 3,0 2

Thành thị n2 = 500 2x = 3,1 3

Với mức ý nghĩa 0,01 có thể coi trọng lượng trung bình của trẻ sơ sinh ở hai khu vực là

bằng nhau được không?

Giải: Gọi trọng lượng trẻ sơ sinh ở nông thôn và thành thị tương ứng là X1 và X2. Lúc đó,

trọng lượng trẻ sơ sinh trung bình chính là 1 và

2 .

Đây là bài toán kiểm định giả thiết H0: 1 2 với đối thiết H1: 1 2 , trong trường

hợp chưa biết phương sai 2

1 , 2

2 và không có cơ sở để giả thiết 2

1 = 2

2 .

Thống kê kiểm định 1 2

2 2

1 2

( )

2500 500

X XK

S S

Do n1 > 30, n2 >30 nên nếu giả thiết H0 đúng thì K có phân phối xấp xỉ N(0; 1).

Với 0,01 , ta có 0,005( ; )W u

0,005( ; )u = ( ; -2,576) (2,576; ).

Page 80: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

11

Giá trị quan sát K0= (3,0 3,1)

2 3

2500 500

-1,21.

Vậy, K0W nên chưa có cơ sở để bác bỏ giả thiết H0 hay có thể coi trọng lượng của

trẻ sơ sinh ở nông thôn và thành thị là như nhau.

5.6. SO SÁNH 2 XÁC SUẤT

Giả sử X, Y là 2 biến ngẫu nhiên phân phối theo quy luật 0_1 với các tham số p1, p2.

Ta kiểm định giả thiết H0: p1 = p2 dựa trên 2 mẫu ngẫu nhiên (X1, X2, . . ., 1nX ) lấy từ

biến X và (Y1, Y2, . . ., 2nY ) lấy từ biến Y.

Để kiểm định giả thiết H0, ta dùng thống kê

1 2 1 2

1 1 2 2

1 2

( ) ( )

(1 ) (1 )

f f p pK

p p p p

n n

K phân phối xấp xỉ chuẩn N(0; 1) với n1 > 30, n2 > 30. Nếu giả thiết H0 đúng (p1 = p2 =

p) thì:

1 2

1 2

( )

1 1(1 )( )

f fK

p pn n

vì p chưa biết nên p được thay bằng 1 1 2 2

1 2

n f n ff

n n

1 2

1 2

( )

1 1(1 )( )

f fK

f fn n

phân phối xấp xỉ chuẩn N(0; 1) với n1 > 30, n2 > 30.

1) Kiểm định giả thiết H0: 1 2p p với đối thiết H1: 1 2p p

Miền bác bỏ giả thiết mức :

2 2

( ; ) ( ; )W U U

2) Kiểm định giả thiết H0: 1 2p p với đối thiết H1: 1 2p p

( ; )W U

3) Kiểm định giả thiết H0: 1 2p p với đối thiết H1: 1 2p p

Page 81: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

12

( ; )W U

Ví dụ 5.6. Có 2 loại thuốc A và B cùng điều trị một loại bệnh nào đó. Qua theo dõi trên số

bệnh nhân có dùng 2 loại thuốc này thu được các số liệu sau:

Loại thuốc Số bệnh nhân dùng thuốc Số bệnh nhân khỏi bệnh

A 160 120

B 56 40

Với mức ý nghĩa = 0,05, hỏi tác dụng của 2 loại thuốc trên trong việc chữa bệnh có

như nhau không?

Giải: Gọi p1, p2 tương ứng là tỉ lệ khỏi bệnh khi dùng thuốc A và B.

Đây là bài toán kiểm định giả thiết H0: 1 2p p với đối thiết H1: 1 2p p với n1, n2 khá

lớn.

Thống kê kiểm định 1 2

1 2

( )

1 1(1 )( )

f fK

f fn n

với 1 1 2 2

1 2

n f n ff

n n

K phân phối xấp xỉ chuẩn N(0; 1).

Với = 0,05, ta có 0,025( ; )W u

0,025( ; )u = ( ; 1,96) (1,96; ) .

Với 2 mẫu cụ thể ta có

f1 = 120

160 = 0,75 f2 =

40

56 0,714

1 1 2 2

1 2

n f n ff

n n

120 40

160 56

0,741.

Tính được K0 0,529.

Vậy, K0W nên chưa có cơ sở để bác bỏ giả thiết H0 , ta chấp nhận công dụng của 2

loại thuốc A, B đối với việc điều trị bệnh nào đó là như nhau.

5.7. SO SÁNH 2 PHƯƠNG SAI

Giả sử biến ngẫu nhiên X phân phối chuẩn N(, 2

1 )

biến ngẫu nhiên Y phân phối chuẩn N(, 2

2 )

Page 82: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

13

Ta kiểm định giả thiết H0: 2 2

1 2 dựa trên 2 mẫu ngẫu nhiên (X1, X2, . . ., 1nX ) lấy từ

biến X và (Y1, Y2, . . ., 2nY ) lấy từ biến Y.

Thống kê kiểm định 2 2

1 1

2 2

2 2

.

.

SK

S

nếu 2 2

1 2S S

Nếu H0 đúng thì 2

1

2

2

SK

S ( 2 2

1 2S S ) phân phối theo quy luật Fisher với (n1 - 1) và (n2–1)

bậc tự do.

Miền bác bỏ giả thiết mức được xác định như sau:

1) H0: 2 2

1 2 ; H1: 2 2

1 2

12 2

(0; ) ( ; )W f f

.

2) H0: 2 2

1 2 ; H1: 2 2

1 2

( ; )W f .

Ví dụ 5.7. Có 2 giống lúa có năng suất trung bình xấp xỉ như nhau song mức độ phân tán

về năng suất có thể khác nhau. Để kiểm tra điều đó, người ta gặt mẫu tại 2 vùng trồng 2

giống lúa đó và thu được kết quả sau:

Giống lúa Số điểm gặt Phương sai

A n1 = 41 s12 = 11,41

B n2 = 30 s22 = 6,52

Với mức ý nghĩa = 0,05 hãy kết luận về vấn đề trên, biết năng suất lúa là biến ngẫu

nhiên phân phối chuẩn.

Giải: Gọi X, Y là năng suất của 2 giống lúa A và B, X và Y có phân phối chuẩn.

Kiểm định giả thiết H0: 2 2

1 2 với đối thiết H1:2 2

1 2

Nếu H0 đúng thì thống kê kiểm định có dạng 2

1

2

2

SK

S ( 2 2

1 2S S ) phân phối theo quy

luật Fisher với 40 và 29 bậc tự do.

Page 83: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

14

Do = 0,05 nên (40,29)

2

f = (40,29)

0,025f = 2,03 và (40,29)

12

f

= (29,40)

2

1

f =

1

1,94 =0,52.

Vậy, miền bác bỏ là W = (0; 0,52) (2,03; ).

Giá trị quan sát Kqs = 11,41

6,52 1,75.

qsK W nên chưa có cơ sở để bác bỏ giả thiết H0 hay độ phân tán của năng suất hai

giống lúa nói trên là như nhau.

5.8. KIỂM ĐỊNH GIẢ THIẾT VỀ QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA BIẾN

NGẪU NHIÊN

Xét giả thiết H0: biến ngẫu nhiên X có quy luật phân phối xác suất xác định bởi hàm

phân phối F(x).

Dựa vào mẫu thực nghiệm để xét xem giả thiết H0 đúng không? Nói cách khác, các số

liệu thực nghiệm (x1, x2, . . ., xn) có phù hợp với giả thiết lý thuyết phân phối xác suất của X

là hàm F(x) hay không?

5. 8. 1. Trường hợp X là biến ngãu nhiên rời rạc

Giả sử mẫu thực nghiệm (x1, x2, . . ., xn) có bảng phân phối tần số thực nghiệm:

xi x1 x2 . . . . . . xk

ni n1 n2 . . . . . . nk

; 1

k

i

i

n n

Nếu H0 đúng, phân phối xác suất của X được xác định, ta tính được các xác suất lý

thuyết P(x = xi) = Pi, 1,i k

Từ đó suy ra tần số lý thuyết của giá trị xi là npi, 1,i k

Thống kê kiểm định 2

1

( )ki i

i i

n npK

np

có phân phối 2 với (k – 1) bậc tự do.

Miền bác bỏ giả thiết mức : 2( , ) .

5. 8. 2. Trường hợp X là biến ngẫu nhiên liên tục

Từ mẫu cụ thể (x1, x2, . . ., xn), ta có bảng phân phối tần số thực nghiệm dạng ghép lớp:

xi-1 - xi x0 - x1 x1 - x2 . . . . . . xk-1 - xk

ni n1 n2 . . . . . . nk

Page 84: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

15

Nếu H0 đúng, ta tính được các xác suất: P(xi-1 < x < xi) = Pi, 1,i k

Khi đó, tần số lý thuyết của lớp thứ i là npi, 1,i k

Ta kiểm định giả thiết H0 bằng cách thống kê kiểm định 2

1

( )ki i

i i

n npK

np

Ví dụ 5.8. Kiểm định giả thiết H0: X phân phối chuẩn N(, 2

2 ).

Khi đó P(xi-1 < x < xi) = 1( ) ( )i ix x

.

Thông thường ta chưa biết và nên chúng được thay bằng các ước lượng hợp lý tối

đa tương ứng là x và s .

1P ( ) ( )i ii

x x x x

s s

Nhận xét: Tiêu chuẩn 2 được sử dụng tốt khi n đủ lớn (n > 50) và ni 5, 1,i k .

5.9. KIỂM ĐỊNH GIẢ THIẾT VỀ TÍNH ĐỘC LẬP

Xét vectơ ngẫu nhiên 2 chiều (X, Y). Ta kiểm định giả thiết H0: X và Y độc lập với

nhau dựa vào mẫu ngẫu nhiên gồm n cặp quan sát từ vectơ ngẫu nhiên (X,Y)

(x1, y1), (x2, y2), (x3, y3)

Phân phối tần số thực nghiệm của mẫu được trình bày trên bảng hai chiều như sau:

Page 85: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

16

Yi

Xi y1 y2 . . . yj . . . ys

x1 n11 n12 . . . n1j . . . n1s n1.

x2 n21 n22 . . . n2j . . . n2s n2.

.

.

.

.

.

.

. . . . . .

xi ni1 ni2 nij . . . nis ni.

.

.

.

.

.

.

. . . . . .

xr nr1 nr2 . . . nrj . . . nrs nr.

n.1 n.2 . . . n.j . . . n.s n

Với X khá lớn thì theo định nghĩa thống kê về xác suất, ta có:

P{ ; }ij

i j

nX x Y y

n , 1, , 1,i r j s

.P( ) ii

nX x

n

.P( )

j

j

nY y

n

Nếu H0 đúng, nghĩa là X, Y độc lập thì

.. .

ij jin nn

n n n

Thống kê kiểm định được chọn là:

. . 22

. .1 1 1 1 . .

.( )

( 1). .

i jr s r sij

ij

i ji j i j i j

n nn nnK n

n n n n

n

Nếu giả thiết H0 đúng và n khá lớn thì thống kê K phân phối theo quy luật 2 với

Page 86: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

17

(r –1)(s –1) bậc tự do.

Miền bác bỏ giả thiết mức : 2( ; )W .

BÀI TẬP

5.1. Một công ty tuyên bố rằng tuổi thọ trung bình của một loại sản phẩm do công ty sản

xuất là 160 giờ . Biết rằng tuổi thọ của loại sản phẩm này là biến ngẫu nhiên phân phối

chuẩn với độ lêch chuẩn = 8 giờ. Kiểm tra ngẫu nhiên 45 sản phẩm của công ty, ta tính

được tuổi thọ trung bình là 152 giờ. Với mức ý nghĩa = 0,02, hãy kiểm định tuyên bố

của công ty có đúng không?

5. 2. Trong năm trước trọng lượng trung bình trước khi xuất chuồng của bò ở một trại chăn

nuôi là 380 kg. Năm nay, người ta áp dụng thử một chế độ chăn nuôi mới với hy vọng là

bò sẽ tăng trọng nhanh hơn. Sau một thời gian áp dụng thử, người ta lấy ngẫu nhiên 50 con

bò trước khi xuất chuồng đem cân và tính được trọng lượng trung bình của chúng là 390kg.

Vậy, với mức ý nghĩa = 0,01 có thể cho rằng trọng lượng trung bình của bò trước khi

xuất chuồng đã tăng lên hay không? Giả thiết trọng lượng của bò là biến ngẫu nhiên có

phân phối chuẩn với độ lệch chuẩn là 35,2 kg.

5. 3. Nhịp mạch trung bình của nam thanh niên là 72 lần /phút. Kiểm tra 84 nam thanh

niên làm việc trong hầm lò thấy nhịp mạch trung bình của họ là 75 lần/ phút với độ lệch

mẫu là 9. Hãy xét xem làm việc trong hầm lò có làm tăng nhịp mạch hay không? ( =0,04)

5. 4. Trọng lượng đóng bao của các bao gạo trong kho là bién ngẫu nhiên phân phối chuẩn

với trọng lượng trung bình theo quy định là 50 kg. Nghi ngờ bị đóng thiếu, người ta đem

cân ngẫu nhiên 25 bao và thu được các số liệu sau:

Page 87: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

18

Trọng lượng bao (kg) Số bao tương ứng

48,0 – 48,5 2

48,5 – 49 5

49,0 – 49,5 10

49,5 – 50,0 6

50,0 – 50,5 2

n = 25

Với mức ý nghĩa = 0,05 hãy kết luận về điều nghi ngờ nói trên.

5.5. Đối với người Việt Nam, lượng huyết sắc tố trung bình là 138 g/l. Khám cho 120

công nhân ở nhà máy có tiếp xúc hóa chất thấy huyết sắc tố trung bình là 125,8 g/l và

s=15 g/l. Từ kết quả trên có thể kết luận lượng sắc tố trung bình của công nhân nhà máy

này thấp hơn mức chung hay không ( = 0,01)?

5. 6. Năng suất trung bình của một giống lúa là 50 tạ / ha. Sau thời gian dài canh tác, người

ta nghi ngờ giống lúa đó bị thoái hóa, năng suất giảm.Dựa vào mẫu kích thước bằng 25 tìm

được năng suất trung bình từ mẫu là 48,7 tạ / ha và độ lệch chuẩn mẫu là 4,2 tạ / ha. Hãy

kết luận về điều nghi ngờ nói trên với ý nghĩa là = 0,05. Cho biết năng suất của giống

lúa đó là biến ngẫu nhiên tuân theo quy luật chuẩn.

5. 7. Một kho hạt giống có tỉ lệ nảy mầm xác định p0 = 0,9. Ngẫu nhiên có một thiết bị bị

hỏng làm thay đổi điều kiện bên trong của kho. Để có thông tin về tỉ lệ nảy mầm mới của

kho hạt giống, người ta làm thí nghiệm 400 hạt thấy có 290 hạt nảy mầm. Hỏi tỉ lệ nảy

mầm của kho hạt giống có còn giữ nguyên hay không ( = 0,05)?

5. 8. Trên lý thuyết, hàm lượng dầu của một loại cây bằng 0,5. Sau một thời gian chăm

bón, lấy ngẫu nhiên một mẫu gồm 100 cây, thấy có tỉ lệ dầu là 0,7. Với mức ý nghĩa 0,01

có thể kết luận tỉ lệ dầu của loại cây đó đã tăng lên?

Page 88: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

19

5. 9. Tỉ lệ phế phẩm của một nhà máy là 10%. Sau khi cải tiến kỹ thuật, điều tra 400 sản

phẩm thấy có 32 phế phẩm. Với = 0,01 hãy kết luận về việc cải tiến kỹ thuật có làm

giảm tỉ lệ phế phẩm hay không?

5. 10. Một nhà máy sản xuất thuốc chữa dị ứng thực phẩm tuyên bố rằng 90% người dùng

thuốc thấy thuốc có tác dụng trong vòng 8g. Kiểm tra 200 người bị dị ứng thức phẩm thì

thấy trong vòng 8g thuốc làm giảm bớt dị ứng đối với 160 người. Hãy kiểm định xem lời

tuyên bố trên của nhà sản xuất có đúng hay không với mức ý nghĩa = 0,01.

5. 11. Chủ một hãng sản xuất cho biết độ lệch chuẩn của sai số đo của thiết bị là 5 đơn vị.

Người ta kiểm tra 19 lần đo cùng một đối tượng thì thấy s2 = 33. Với = 0,05, có kết luận

gì về ý kiến của chủ hãng?

5.13. Điều tra trên một mẫu gồm 130 thanh niên lứa tuổi 18 ở vùng dân cư A ta tính được

chiều cao trung bình là 169 cm; độ lệch chuẩn 8cm. Trên một mẫu 80 thanh niên lứa tuổi

18 của vùng dân cư B thì chiều cao trung bình là 165cm; độ lệch chuẩn 9cm. Với mức ý

nghĩa = 0,05, có thể nói chiều cao trung bình của thanh niên vùng A là cao hơn vùng B

hay không?

5.14. Gieo một loại hạt giống theo 2 phương pháp khác nhau:

Phương pháp I: gieo 100 hạt thấy có 82 hạt nẩy mầm.

Phương pháp II: gieo 120 hạt thấy có 92 hạt nẩy mầm.

Với mức ý nghĩa = 0,01 có thể nói tỉ lệ nẩy mầm của 2 phương pháp là như nhau hay

không?

Page 89: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

1

CHƯƠNG VI

TƯƠNG QUAN VÀ HỒI QUY

6.1. Các khái niệm

6.1.1. Hệ số tương quan mẫu

- Giả sử ta có mẫu ngẫu nhiên 1 1{( ) ( )} n nX Y X Y là những quan sát đồng thời về hai biến

ngẫu nhiên X Y . Hệ số tương quan mẫu của X Y được xác định bởi:

X Y

X Y

XY X YR

S S

trong đó

1 1 1

1 1 1

n n n

i i i i

i i i

XY X Y X X Y Yn n n

2 22 2 2 2

1 1

1 1

n n

X i Y i

i i

S X S YX Yn n

Ý nghĩa: Hệ số tương quan được dùng để đo mức độ phụ thuộc tuyến tính giữa 2 biến ngẫu

nhiên. Nếu r càng lớn (càng gần 1) thì sự phụ thuộc tuyến tính càng rõ (khả năng xảy ra phụ

thuộc tuyến tính giữa X, Y càng cao). Nếu r càng gần 0 thì sự phụ thuộc tuyến tính càng

yếu (khả năng xẩy ra phụ thuộc tuyến tính giữa X, Y càng thấp).

- Ðối với một mẫu cụ thể và nhiều số liệu, ta thực hiện các bước tính hệ số tương quan mẫu như sau:

+ Gọi r là số các giá trị khác nhau của mẫu 1 2( ) nx x x với

(1) (2) ( ) rx x x .

+ Gọi s là số các giá trị khác nhau của mẫu 1 2( ) ny y y với (1) (2) ( ) sy y y .

+ Gọi ijn là số các quan sát từ mẫu ghép có giá trị

( ) ( )( ) ( 1 1 ) i jx y i r j s .

+ Tính các giá trị 1 1 1 1

s r r s

i ij j ij ij

j i i j

n n n n n n

- Khi đó

1 1 1 1

1 1 1

r s r s

ij i i i i j j

i j i j

XY n x y X n x Y n yn n n

2 22 2 2 2

1 1

1 1

r s

X i i Y j j

i j

S n x S n yX Yn n

6.1.2. Kỳ vọng có điều kiện

- Giả sử có vectơ ngẫu nhiên 2 chiều ( )X Y

- Kỳ vọng có điều kiện của biến ngẫu nhiên Y với điều kiện X x , ký hiệu ( )E Y x , xác định

bởi:

+ Nếu Y là rời rạc thì

Page 90: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

2

1

( ) ( )

m

j j

i

E Y x y P X x Y y

+ Nếu Y liên tục thì

( ) ( )

X YE Y x yf x y dy

6.1.3. Hàm hồi quy

- Hàm hồi quy của Y đối với X là ( ) ( ) f x E Y x .

- Hàm hồi quy của X đối với Y là ( ) ( ) g y E X y .

Ý nghĩa: Hàm hồi quy của Y đối với X có thể dùng để dự báo kì vọng giá trị của Y với một giá trị nào đó của X.

6.2. Hồi quy tuyến tính đơn

- Hai biến ngẫu nhiên X Y gọi là có hồi quy tuyến tính nếu hàm hồi quy của Y đối với X có

dạng:

( ) y E Y x ax b

6.2.1. ước lượng các hệ số a,b

- Giả sử ta có mẫu cụ thể 1 1{( ) ( )} n nx y x y là những quan sát đồng thời về 2 biến ngẫu

nhiên X, Y. Dựa vào phương pháp bình phương bé nhất, tức là tìm a, b sao cho hàm

2

1

( ) ( )

n

i i

i

F a b y ax b

đạt cực tiểu. Khi đó ta có các ước lượng sau:

Y

X Y

X

Sa R b Y a X

S

Page 91: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

3

Bài tập chương 6

6.1.Số vi khuẩn X (triệu) sinh sản sau thời gian Y (giờ) được ghi lại trong bảng sau qua một

thí nghiệm

X 0 1 2 3 4 5 6 7 8

Y 30 32 35 40 48 52 58 62 69

a) Xác định hệ số tương quan giữa X và Y.

b) Tìm đường hồi quy tuyến tính của X theo Y . Dự báo về số vi khuẩn có sau 10 giờ.

6.2. Ðo chiều cao X (cm) và trọng lượng Y (kg) của 100 học sinh, ta được kết quả sau:

Y X 145 - 150 150 - 155 155 - 160 160 - 165 165 - 170

35 - 40 3

40 - 45 5 10

45 - 50 14 20 6

50 - 55 15 12 5

55 - 60 6 4

c) Xác định hệ số tương quan giữa chiều cao và cân nặng.

d) Tìm đường hồi quy tuyến tính của chiều cao theo cân nặng.

6.3. Theo dõi lượng phân bón X (kg/ha) và năng suất lúa Y (tấn/ha) của 100 ha lúa ở một vùng, ta thu được kết quả sau:

Y X 120 140 160 180 200

2,2 2

2,6 5 3

3,0 11 8 4

3,4 15 17

3,8 10 6 7

4,2 12

e) Xác định hệ số tương quan giữa lượng phân bón và năng suất lúa.

f) Tìm đường hồi quy tuyến tính của năng suất lúa theo lượng phân bón.

Page 92: CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤTdspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4115/1/... · CÁC KHÁI NI ỆM C Ơ B ẢN VỀ XÁC SUẤT ... Cho A là m ột

4

6.4. Ðo chiều cao X (m) và đường kính Y (cm) của một loại cây, ta được kết quả sau:

Y X 6 8 10 12 14

30 2 17 9 3

35 10 17 9

40 3 24 16 13

45 6 24 12

50 2 11 22

g) Xác định hệ số tương quan giữa chiều cao và đường kính của cây.

h) Tìm đường hồi quy tuyến tính của đường kính theo chiều cao.