bai tapxstk tonghop

30
BÀI TẬP XÁC SUẤT THỐNG KÊ VÀ ỨNG DỤNG 1 Dữ liệu và một số thao tác tiền xử lí dữ liệu Bài 1 Giả sử bạn theo dõi số tiền trong hóa đơn diện thoại hàng tháng theo thứ tự từ tháng 1 đến tháng 12 trong năm vừa qua như sau (đơn vị nghìn đồng) 198 185 223 221 207 203 180 195 222 177 214 216 a. Nhập dữ liệu thành một vec tơ có tên TienDT. b. Tính tổng số tiền bạn phải trả cho phí điện thoại trong năm đó. c. Cho biết tháng nào có số tiền ít (nhiều) nhất, và số tiền là bao nhiêu? d. Cho biết những tháng bạn phải trả hơn 200 nghìn tiền điện thoại. Có bao nhiêu tháng như thế? e. Tính xem có bao nhiêu tháng mà tiền điện thoại không quá 190 nghìn. f. Tính xem có bao nhiêu tháng mà tiền điện thoại dao động trong khoảng [190, 210] nghìn. g. Tính số tiền điện thoại trung bình một tháng (dùng hàm mean).. Bài 2 Dùng dữ liệu TienDT trên để thực hiện tiếp những yêu cầu sau a. Lưu file dữ liệu này dưới dạng .rda b. Sửa tiền điện thoại tháng 2 thành 175. c. Nhập thêm vào dãy trên tiền điện thoại của 3 tháng tiếp theo nhưng bạn quên mất số tiền tháng thứ 13, biết tháng thứ 14, 15 số tiền lần lượt là 201, 185. Sau đó tính lại số tiền trung bình bạn phải trả mỗi tháng. Bài 3 Cho ba tập dữ liệu dạng véc tơ x = c(1, 3, 5, 7, 9), y = c(1, 2, 8, 6, 4, 5, 7), z = c(2, 8, 1, 0, 3) Hãy thực hiện các thao tác sau: a. z - x, x + z , x⋆z , z /x b. x +1, y 2, length(x), length(y), x + y c. sum(x> 5) và sum(x[x> 5]) Bài 4 Dưới đây là thông tin về 8 sinh viên mới ra trường của một khóa học

Upload: quang-truong

Post on 25-Jan-2015

15.203 views

Category:

Documents


0 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Bai tapxstk tonghop

BÀI TẬP XÁC SUẤT THỐNG KÊ VÀ ỨNG DỤNG

1 Dữ liệu và một số thao tác tiền xử lí dữ liệu

Bài 1 Giả sử bạn theo dõi số tiền trong hóa đơn diện thoại hàng tháng theo thứ tự từ tháng 1 đến tháng12 trong năm vừa qua như sau (đơn vị nghìn đồng)

198 185 223 221 207 203 180 195 222 177 214 216

a. Nhập dữ liệu thành một vec tơ có tên TienDT.

b. Tính tổng số tiền bạn phải trả cho phí điện thoại trong năm đó.

c. Cho biết tháng nào có số tiền ít (nhiều) nhất, và số tiền là bao nhiêu?

d. Cho biết những tháng bạn phải trả hơn 200 nghìn tiền điện thoại. Có bao nhiêu tháng như thế?

e. Tính xem có bao nhiêu tháng mà tiền điện thoại không quá 190 nghìn.

f. Tính xem có bao nhiêu tháng mà tiền điện thoại dao động trong khoảng [190, 210] nghìn.

g. Tính số tiền điện thoại trung bình một tháng (dùng hàm mean)..

Bài 2 Dùng dữ liệu TienDT trên để thực hiện tiếp những yêu cầu sau

a. Lưu file dữ liệu này dưới dạng .rda

b. Sửa tiền điện thoại tháng 2 thành 175.

c. Nhập thêm vào dãy trên tiền điện thoại của 3 tháng tiếp theo nhưng bạn quên mất số tiền tháng thứ13, biết tháng thứ 14, 15 số tiền lần lượt là 201, 185. Sau đó tính lại số tiền trung bình bạn phảitrả mỗi tháng.

Bài 3 Cho ba tập dữ liệu dạng véc tơ

x = c(1, 3, 5, 7, 9), y = c(1, 2, 8, 6, 4, 5, 7), z = c(2, 8, 1, 0, 3)

Hãy thực hiện các thao tác sau:

a. z − x, x + z, x⋆z, z/x

b. x + 1, y⋆2, length(x), length(y), x + y

c. sum(x > 5) và sum(x[x > 5])

Bài 4 Dưới đây là thông tin về 8 sinh viên mới ra trường của một khóa học

Page 2: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Thứ tự Lương khởi điểm Giới tính Xếp loại tốt nghiệp Tuổi

1 6 Nam K 222 5 Nu K 253 4.5 Nam TB 234 3.8 Nu K 225 8 Nu G 226 12 Nam G 237 4 Nam TB 228 5 Nu TB 24

a. Nhập dữ liệu vào một data frame (đặt tên là SV) gồm các cột TT, Luong, GioiTinh, TotNghiep,Tuoi.

b. Đưa ra dữ liệu về những sinh viên nữ.

c. Đưa ra dữ liệu về những sinh viên nam.

d. Đưa ra danh sách lương khởi điểm của nhóm sinh viên nữ.

e. Đưa ra danh sách tuổi của nhóm sinh viên nam.

f. Đưa ra danh sách những sinh viên có lương khởi điểm trên 6 triệu/tháng.

g Cho biết những thông tin về những người có lương cao nhất trong danh sách.

h. Thêm vào danh sách một sinh viên nam tốt nghiệp xếp loại giỏi, lương khởi điểm 7.5 triệu nhưngkhông có thông tin về tuổi.

i. Thêm vào data frame trên một cột điểm khóa luận tốt nghiệp của các sinh viên trên theo thứ tự nhưsau: 8, 7.5, 7, 7, 9, 9.5, 8, 8, 9.

j. Cho biết dữ liệu trong từng cột được đo bằng thang đo nào?

k. Loại đi số liệu trống không trong data frame. Nhận xét.

Bài 5 Cho file dữ liệu HocSinh.rda. Hãy lấy file dữ liệu và thực hiện các yêu cầu sau:

a. Cho biết tập dữ liệu này có bao nhiêu cột, bao nhiêu dòng?

b. Lấy ra dữ liệu ở cột thứ 3 (Tuoi).

c. Lấy ra toàn bộ dữ liệu ở dòng thứ 10.

d. Tính số học sinh nữ, nam.

e. Tính tỷ lệ học sinh có mức độ yêu thích thể thao là 4. Tính tỷ lệ này trong nhóm học sinh nam,trong nhóm học sinh nữ.

Bài 6 Trong fileHocSinh.rda, hãy chọn ngẫu nhiên 50 học sinh và lấy ra tất cả thông tin về 50 ngườiđó. Lưu dữ liệu dưới dạng file .rda.

P.T.Hồng, N.T.Nhung - Bộ môn Toán 2

Page 3: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Bài 7 a. Tạo dãy số từ 1 đến 100.

b. Tạo dãy số chẵn từ 0 đến 100.

c. Tạo dãy số trong đó 3 lặp 4 lần, 5 lặp 10 lần, 16 lặp 7 lần.

d. Tạo dãy số trong đó có các giá trị 1, 2, 3, 4 lần lượt lặp lại 10 lần.

e. Tạo dãy số mà cả cụm 1, 2, 3 lặp lại 8 lần.

f. Tạo biến thứ bậc gồm 3 bậc, mỗi bậc lặp 4 lần.

g. Tạo biến thứ bậc gồm 4 bậc, mỗi bậc lặp 4 lần, chiều dài biến bằng 15.

h. Tạo biến thứ bậc gồm 3 bậc, số lần lặp lại tương ứng là 2, 5, 8 với ký hiệu a, b, c.

Bài 8 Xác định loại thang đo trong các trường hợp sau

a. Thời gian chờ thang máy của một người tại một khu chung cư.

b. Số khối nước một gia đình sử dụng trong một tháng.

c. Xếp hạng 5 chiếc máy trong nhà máy theo đánh giá: rất tốt, tốt, trung bình, kém.

d. Mã vùng điện thoại của các địa phương.

e. Tuổi của các nhân viên trong công ty.

f. Doanh thu (VN đồng) của một cửa hàng bán báo trong một tháng

g. Mã sinh viên trong một trường đại học.

h. Điểm thi một môn của sinh viên một lớp.

i. Chiều cao của một người.

Bài 9 Chọn ngẫu nhiên 5 người từ danh sách gồm 40 người.

Bài 10 Tung một đồng xu 50 lần. Mô phỏng phép thử và đếm số mặt sấp.

Bài 11 Tung một con xúc sắc 100 lần. Mô phỏng phép thử và đếm số lần xuất hiện mặt 6 chấm.

Bài 12 Chọn ngẫu nhiên năm cây bài từ bộ bài tú lơ khơ. Mô phỏng phép thử và kiểm tra xem có bộđôi nào trong mẫu không? Hãy lặp lại cho đến khi có được một đôi trong 5 cây bài.

P.T.Hồng, N.T.Nhung - Bộ môn Toán 3

Page 4: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

2 Tóm tắt dữ liệu

Bài 13 Trong file dữ liệu có tên là SoLieu.csv chứa một số thông tin cá nhân của 100 người về giớitính (GioiTinh), tuổi (Tuoi), khu vực sống (KhuVuc) và tổng thu nhập (đơn vị triệu VND) trong năm2008 (ThuNhap). Hãy lấy file dữ liệu và thực hiện các yêu cầu sau:

a. Trong nhóm được điều tra có bao nhiêu nam và có bao nhiêu người sống ở thành phố.

b. Tính số nam sống ở hải đảo và nữ sống ở nông thôn trong nhóm những người được điều tra.

c. Trong số nữ được điều tra, hãy tính tỉ lệ nữ sống ở thành phố và miền núi.

d. Tiến hành phân tổ cột dữ liệu về tuổi thành các tổ với các điểm chia là 20, 30, 40, 50, 60, 70, 80 vàtính tỉ lệ những người được điều tra có độ tuổi không vượt quá 50.

e. Tiến hành phân tổ cột dữ liệu về thu nhập thành các tổ với các điểm chia là 20, 40, 60, 80, 100 vàtính:

i. tỉ lệ những người phải đóng thuế thu nhập nếu biết một người phải đóng thuế thu nhập nếutổng thu nhập trong năm của người đó vượt quá 60 triệu VND.

ii. tỉ lệ những người có thu nhập hơn 80 triệu nằm từ độ tuổi 40 đến 50.

Bài 14 Hãy phân tổ cho dữ liệu về điểm toán tuyển sinh khối D năm 2008 trong fileDiemToanKhoiD 2008.rda với số tổ thích hợp và lập bảng tần số tương ứng với số tổ vừa phân.

Bài 15 Dùng tham số mfrow hoặc mfcol trong hàm par để phân chia cửa sổ đồ họa thành 3 hàngvà 2 cột. Trên mỗi phần vừa phân chia này, hãy minh họa các kiểu vẽ khác nhau của tham số typethông qua hàm plot()

Bài 16 Dùng tham số mfrow hoặc mfcol trong hàm par để phân chia cửa sổ đồ họa thành 3 hàngvà 2 cột. Trên mỗi phần vừa phân chia này, hãy minh họa các kiểu vẽ khác nhau của đường bao quanhhình vẽ của tham số bty thông qua hàm plot()

Bài 17 Tập dữ liệu sau cho ta điểm thi của một số sinh viên (thang điểm 100):

61 27 26 37 30 47 87 9063 46 67 19 81 47 100 2545 60 65 53 35 28 80 9557 37 45 25 48 60 48 4730 47 60 61 55 48 60 90

(Dữ liệu có trong file DiemThi.xls)

a. Hãy tính các đại lượng mô tả độ tập trung của tập dữ liệu: trung bình cộng, trung vị và mode. Nêuý nghĩa của những giá trị này.

b. Tính các đại lượng mô tả độ phân bố của tập dữ liệu như: tứ phân vị, phân vị thứ 10, 60, 90 của tậpdữ liệu. Nêu ý nghĩa của những giá trị này.

c. Tính các đại lượng mô tả độ phân tán của tập dữ liệu: khoảng biến thiên, độ trải giữa, phương saivà độ lệch chuẩn.

P.T.Hồng, N.T.Nhung - Bộ môn Toán 4

Page 5: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

d. Vẽ biểu đồ hộp và râu cho tập dữ liệu và cho nhận xét.

Bài 18 Bảng tần số sau cho ta thông tin về chiều cao của 300 sinh viên:

Khoảng giá trị [150,155) [155,160) [160,165) [165,170) [170,175) [175,180)Tần số 30 45 55 100 40 30

Tính chiều cao trung bình, phương sai và độ lệch chuẩn của chiều cao của các sinh viên trong nhóm.

Bài 19 File ChiSoIQ.rda cho ta dữ liệu về chỉ số IQ của 200 người. Biết rằng dữ liệu tuân theo phânphối chuẩn, hãy lấy file dữ liệu và thực hiện các yêu cầu sau:

a. Lập bảng tần số của tập dữ liệu trên bằng cách phân tập dữ liệu thành các tổ có khoảng cách là 10.

b. Vẽ biểu đồ phân phối tần số và đa giác tần số tương ứng với bảng tần số trên.

c. Vẽ biểu đồ phân phối tần số và đa giác tấn số tương ứng với bảng tần số trên trên cùng một hình.

d. Dựa vào hình dáng của hai biểu đồ trên bạn có nhận xét gì hình dáng của phân phối chuẩn.

e. Tính trung bình x và độ lệch chuẩn sx của tập dữ liệu.

f. Tính tỉ lệ phần trăm những giá trị của tập dữ liệu rơi vào khoảng [x−sx, x+sx], [x−2sx, x+2sx],[x − 3sx, x + 3sx] và so sánh với qui tắc thực nghiệm.

Bài 20 Bảng sau đây cho ta cho ta bảng giá của chỉ số chứng khoán công nghiệp Dow Jones trong 30tuần khác nhau

2656 2301 2975 3002 24682742 2830 2405 2677 29902200 2764 2337 2961 30102976 2375 2602 2670 29222344 2760 2555 2524 28142996 2437 2268 2448 2460

(Dữ liệu có trong file ChiSoDowJones.xls)

a. Lập biểu đồ thân và lá cho 30 giá trị trên và đưa ra nhận xét.

b. Lập biểu đồ hộp và râu cho 30 giá trị trên và đưa ra nhận xét.

c. Từ hình dáng của hai biểu đồ ở câu a. và câu b. theo bạn biểu đồ thân và lá hay biểu đồ hộp và râuthể hiện tính đối xứng hay nghiêng trái, phải của tập dữ liệu rõ hơn?

Bài 21 Bảng dữ liệu sau cho số lượng album (triệu bản) được bán trong vài năm gần đây của một sốthể loại âm nhạc:

Thể loại Số lượngR&B 146.4Rock 102.6Rap 73.7Đồng quê 64.5Cổ điển 14.8Latin 14.5

P.T.Hồng, N.T.Nhung - Bộ môn Toán 5

Page 6: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

a. Lập biểu đồ thanh mô tả phân phối về số lượng album được bán ra của từng thể loại và cho nhậnxét.

b. Lập biểu tròn mô tả phân phối về số lượng album được bán ra của từng thể loại và cho nhận xét.

c. So sánh thông tin có được khi dùng biểu đồ thanh và biểu đồ tròn để mô tả phân phối về số lượngalbum.

Bài 22 Lấy lại file dữ liệu SoLieu.csv và thực hiện các yêu cầu sau:

a. Vẽ biểu đồ thân và lá cho cột tuổi và hãy đưa ra nhận xét về hình dáng của phân phối của tuổi trongnhóm được điều tra.

b. Vẽ biểu đồ phân phối tần số với độ rộng mỗi cột là 10 cho cột thu nhập. Biểu đồ này cho ta thôngtin gì về phân phối của thu nhập của nhóm được điều tra.

c. Vẽ biểu đồ thanh minh họa phân phối tần số của khu vực sống và đưa ra nhận xét.

d. Vẽ biểu đồ thanh minh họa phân phối tần số giới tính trong nhóm được điều tra theo khu vực sốngvà khu vực sống theo giới tính của nhóm được điều tra.

e. Hãy chọn một trong ba đại lượng là trung bình cộng, trung vị và mode mà bạn cho là thích hợpnhất để miêu tả độ tập trung cho mỗi cột dữ liệu và hãy tính những đại lượng này.

Bài 23 Điều tra tổng thu nhập (triệu VND) trong năm 2008 của một số chủ hộ gia đình được chọnngẫu nhiên trong một phường ở Hà Nội ta thu được bảng số liệu sau:

30 20 35 27 37 3038 40 42 35 38 4441 42 47 48 43 5055 60 70 45 47 4978 55 60 85 90 10075 80 85 95 105 47

(Dữ liệu có trong file ThuNhap.xls)

a. Tính các đại lượng mô tả độ tập trung của tập dữ liệu: trung bình cộng, trung vị và mode. So sánhcác giá trị này với nhau.

b. Lập biểu đồ thân và lá cho 30 giá trị trên và đưa ra nhận xét. Những nhận xét về phân phối của tậpdữ liệu này có phù hợp với những tính toán ở câu a. không?

c. Tính tỉ lệ phần trăm những giá trị của tập dữ liệu rơi vào khoảng [x−2sx, x+2sx], [x−3sx, x+3sx],[x− 4sx, x + 4sx], ở đây x, sx là trung bình cộng và độ lệch chuẩn của tập dữ liệu. So sánh kếtquả với định lí Chebyshev.

Bài 24 Thống kê tiền điện (nghìn VND) trong tháng 8 năm 2008 của một số gia đình trong một quậnở Hà Nội thu được bảng số liệu sau:

P.T.Hồng, N.T.Nhung - Bộ môn Toán 6

Page 7: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

5 30 100 150 600 21085 95 105 120 185 250310 1500 500 425 480 450550 175 180 285 350 450750 65 55 880 1350 270

(Dữ liệu có trong file TienDien.xls)

a. Tính các đại lượng đo độ phân tán của tập dữ liệu: khoảng biến thiên, độ trải giữa và độ lệch chuẩn.

b. Sử dụng đồ thị hộp và râu để minh họa sự phân bố của tập dữ liệu. Đồ thị này cho ta thông tin gìvề giá trị ngoại biên của tập dữ liệu.

c. Từ các tính toán ở câu a. và b. theo bạn khoảng biến thiên hay độ lệch chuẩn đo độ phân tán chotập dữ liệu trên tốt hơn.

Bài 25 Theo định lí Chebyshev:

a. ít nhất bao nhiêu phần trăm phần tử của tập dữ liệu rơi vào khoảng [µ− kσ, µ + kσ] với những giátrị k sau: k = 1.8, k = 3.5, k = 2.5 và k = 4.

b. trong vòng bao nhiêu độ lệch chuẩn từ trung bình chứa ít nhất 80% giá trị của tập dữ liệu.

Bài 16: Một tập dữ liệu số có phân phối xấp xỉ hình chuông đối xứng. Nếu trung bình của các số là125, độ lệch chuẩn là 12, hãy tìm khoảng giá trị mà:

a. 68% giá trị của tập dữ liệu rơi vào.

b. 95% giá trị của tập dữ liệu rơi vào.

c. 99.7% giá trị của tập dữ liệu rơi vào.

Bài 26 Cho một tập dữ liệu số có phân phối không tuân theo phân phối chuẩn. Nếu trung bình các sốlà 38 và độ lệch chuẩn là 6, hãy tính xem:

a. bao nhiêu phần trăm giá trị của tập dữ liệu rơi vào khoảng 26 và 50?

b. bao nhiêu phần trăm giá trị của tập dữ liệu rơi vào khoảng 14 và 62?

c. 89% giá trị của tập dữ liệu rơi vào khoảng hai giá trị nào?

3 Xác suất

Bài 27 Ba người cùng vào một cửa hàng trưng bày xe máy, mỗi người có thể mua một chiếc xe (M )hoặc không mua (K)

a. Liệt kê các biến cố sơ cấp của không gian mẫu về tất cả các khả năng có thể xảy ra về quyết địnhcủa ba người trên.

b. Liệt kê các biến cố sơ cấp thuận lợi cho những biến cố sau:

P.T.Hồng, N.T.Nhung - Bộ môn Toán 7

Page 8: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

1. Có đúng ba người mua xe.2. Không quá hai người mua xe.3. Ít nhất có một người mua xe.4. Bốn người có quyết định giống nhau.

c. Giả sử rằng xác suất của các biến cố sơ cấp bằng nhau, hãy tính xác suất của các biến cố trên.

Bài 28 Tiến hành phép thử tung một đồng xu ba lần liên tiếp. Hãy mô tả không gian mẫu của phépthử. Biến cố nào tương ứng với kết quả: số mặt sấp nhiều hơn số mặt ngửa?

Bài 29 Tung một con xúc xắc hai lần. Gọi E là biến cố tổng số chấm hai mặt trên là chẵn, F là biếncố mặt trên của con xúc xắc đầu là 1, G là biến cố tổng hai mặt trên bằng 5. Hãy mô tả những biến cốsau: EF , E ∪ F , FG, EF̄ , EFG.

Bài 30 Cho E, F , G là ba biến cố. Xét các biến cố sau:

1. Chỉ có E xảy ra.

2. E và G xảy ra nhưng F không xảy r.

3. Ít nhất hai trong ba biến cố xảy ra.

4. Ít nhất một trong ba biến cố xảy ra.

5. Cả ba biến cố xảy ra.

6. không biến cố nào xảy ra.

7. Nhiều nhất một trong ba biến cố xảy ra.

8. Đúng hai trong ba biến cố xảy ra.

9. Nhiều nhất cả ba biển cố xảy ra.

a. Hãy biểu diễn các biến cố trên qua E, F,G.

b. Cho P (E) = 0.5, P (F ) = 0.6, P (G) = 0.7. Tính xác suất của các biến cố trên.

Bài 31 Một hệ thống chữa cháy tại một toà nhà cao tầng có hai thiết bị báo cháy D1, D2 hoạt độngđộc lập. Khi xảy ra cháy nếu một trong hai thiết bị này báo động đúng thì hệ thống chữa cháy sẽ hoạtđộng. Giả sử rằng khi xảy ra cháy D1 báo động đúng với xác suất 0.95 và D2 báo động đúng với xácsuất 0.92. Tính xác suất khi có cháy

a. Cả D1, D2 báo động đúng.

b. Hệ thống chữa cháy hoạt động.

c. Hệ thống chữa cháy không hoạt động.

P.T.Hồng, N.T.Nhung - Bộ môn Toán 8

Page 9: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Bài 32 Trong một nhóm những người nghỉ hưu gồm 1000 người thì có 600 người theo Đảng Cộnghòa và số còn lại theo Đảng Dân chủ. Trong một cuộc bầu cử ở địa phương mà mọi người trong nhómnày đều tham gia bỏ phiếu, có 60 người theo Đảng Cộng hòa bỏ phiếu cho ứng cử viên Đảng Dân chủvà 50 người theo Đảng Dân chủ bỏ phiếu cho ứng cử viên Đảng Cộng hòa. Nếu chọn ngẫu nhiên ramột thành viên trong nhóm đã bỏ phiếu cho Đảng Cộng hòa, xác suất để người này theo Đảng Dânchủ là bao nhiêu?

Bài 33 Một người có 10 chiếc chìa khóa và có đúng một chìa mở được cửa.

a. Tính xác suất để người này mở được cửa ở lần thứ ba nếu như người này mở các chìa một cáchngẫu nhiên và bỏ ra ngoài những chìa không mở được.

b. Tính xác suất để người này mở được cửa ở lần thứ ba nếu như người này mở các chìa một cáchngẫu nhiên và không bỏ ra ngoài những chìa không mở được.

Bài 34 Rút từ bộ bài tây gồm 52 quân ra 5 quân:

a. Tính xác suất để rút được tứ quí át.

b. Tính xác suất để rút được cả 5 quân đều cùng một chất.

c. Tính xác suất để được một đôi (không nhất thiết cùng màu).

Bài 35 Một khách sạn có 10 tầng. Năm khách hàng cùng đi lên thang máy từ tầng một và chọn tầngra một cách ngẫu nhiên và độc lập. Tìm xác suất để xảy ra các tình huống sau:

a. Tất cả cùng ra ở tầng năm.

b. Tất cả cùng ra ở một tầng.

c. Mỗi người ra ở một tầng khác nhau.

d. Năm người ra ở bốn tầng khác nhau.

Bài 36 Tung lần lượt hai con xúc xắc. Gọi E là biến cố tổng số chấm hai mặt trên cùng bằng 7.

a. Chứng minh rằng E độc lập với biến cố mặt trên của con xúc xắc đầu tiên bằng 4.

b. Chứng minh rằng E độc lập với biến cố mặt trên của con xúc xắc thứ hai bằng 3.

Bài 37 Một bài thi thể dục tổng hợp gồm ba môn: chạy, nhảy cao, nhảy xa. Xét phép thử Nam vàTiến bốc thăm môn thi đầu tiên.

a. Mô tả không gian mẫu của phép thử.

b. Xét ba biến cố sau:

• Nam bốc môn thi đầu tiên là chạy.• Tiến bốc môn thi đầu tiên là chạy.• Tiến bốc môn thi đầu tiên là nhảy cao.

P.T.Hồng, N.T.Nhung - Bộ môn Toán 9

Page 10: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

1. Kiểm tra xem trong ba biến cố trên, cặp biến cố nào là xung khắc.2. Kiểm tra xem trong ba biến cố trên, cặp biến cố nào là độc lập.

Bài 38 Ở một trường đại học có 52% là sinh viên nữ, 5% sinh viên trong trường chuyên về khoa họcmáy tính, 2% sinh viên nữ và chuyên về khoa học máy tính. Chọn ngẫu nhiên một sinh viên ở trongtrường.

a. Tính xác suất để sinh viên này là nữ biết rằng đây là sinh viên chuyên về khoa học máy tính.

b. Tính xác suất để sinh viên này chuyên về khoa học máy tính biết rằng đây là sinh viên nữ.

c. Hai biến cố "sinh viên được chọn là nữ" và "sinh viên được chọn chuyên về khoa học máy tính" cóđộc lập với nhau không?

Bài 39 Theo một con số thống kê ởMỹ năm 2007, có khoảng 40% các vụ tai nạn xe cộ gây chết ngườilà có người lái xe say rượu. Giả sử tỉ lệ số người say rượu khi lái xe là 4%. Hỏi việc say rượu khi láixe làm tăng khả năng gây tai nạn chết người lên bao nhiêu lần?

Bài 40 Điều tra sở thích xem ti vi của các cặp vợ chồng cho thấy 30% các bà vợ thường xem chươngtrình thể thao, 50% các ông chồng thường xem chương trình thể thao, song nếu thấy vợ xem thì tỉ lệchồng xem cùng là 60%. Chọn ngẫu nhiên một cặp vợ chồng.

a. Tìm xác suất để có ít nhất một người thường xem chương trình thể thao.

b. Tìm xác suất để nếu chồng xem thì vợ xem cùng.

c. Tìm xác suất để nếu chồng không xem thì vợ vẫn xem.

d. Hai biến cố "Vợ xem chương trình thể thao" và "Chồng xem chương trình thể thao" có độc lập vớinhau không?

Bài 41 Thu nhập (triệu đồng) một năm của 500 cặp vợ chồng được ghi lại trong bảng sau:

Thu nhập chồngThu nhập vợ Dưới 60 Trên 60Dưới 60 212 198Trên 60 36 54

Chọn ngẫu nhiên một cặp vợ chồng.

a. Tính xác suất để người chồng có thu nhập trên 60 triệu một năm.

b. Tính xác suất để người chồng có thu nhập trên 60 triệu một năm biết người vợ có thu nhập dưới60 triệu một năm.

Bài 42 Giả sử một công ty bảo hiểm chia người dân ra ba nhóm: ít rủi ro, rủi ro trung bình, rất rủi ro.Số liệu thu thập được cho thấy trong một năm một người thuộc nhóm ít rủi ro, rủi ro trung bình, rấtrủi ro có thể gặp tai nạn với xác suất là 0.05, 0.15, 0.30. Cho biết 20% số người dân thuộc nhóm ít rủiro, 50% thuộc nhóm rủi ro trung bình, và 30% thuộc nhóm rất rủi ro.

a. Tỷ lệ số người gặp tai nạn trong một năm là bao nhiêu?

P.T.Hồng, N.T.Nhung - Bộ môn Toán 10

Page 11: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

b. Nếu một người nào đó không bị tai nạn trong năm 2009, xác suất để người đó thuộc nhóm ít rủi rolà bao nhiêu?

Bài 43 Xét nghiệm máu cho khả năng phát hiện đến 99% một loại bệnh (tức là một người mắc bệnhkhi đi xét nghiệm cho kết quả dương tính với xác suất là 0.99). Tuy nhiên xét nghiệm cũng cho nhữngkết quả "dương tính giả" cho 1% những người khỏe mạnh (tức là, khi một người khỏe mạnh được tiếnhành xét nghiệm thì xác suất là 0.01 để kết quả xét nghiệm cho thấy anh ta bị mắc bệnh). Cho biết0.5% dân số thực sự mắc loại bệnh này.

a. Một người xét nghiệm có kết quả dương tính, tính xác suất để anh ta mắc bệnh?

b. Một người đi xét nghiệm có kết quả âm tính, tính xác suất để anh ta không mắc bệnh.

Bài 44 Bạn nhờ hàng xóm của bạn tưới nước cho một cây hoa mới trồng của bạn khi bạn đi du lịch.Loại cây này nếu không tưới nước sẽ bị chết với xác suất 0.8, nếu được tưới nước thì xác suất bị chếtlà 0.15. Bạn tin rằng 90% người hàng xóm của bạn sẽ tưới nước cho cây.

a. Xác suất để cây hoa của bạn vẫn còn sống khi bạn trở về là bao nhiêu?

b. Nếu cây hoa của bạn bị chết, xác suất để người hàng xóm đã quên tưới là bao nhiêu?

Bài 45 Có ba ngăn kéo, một ngăn có hai đồng tiền vàng, một ngăn có hai đồng tiền bạc, và một ngăncó một đồng tiền vàng và một đồng tiền bạc. Rút ra một ngăn kéo một cách ngẫu nhiên và từ ngănkéo này lấy ngẫu nhiên ra một đồng tiền. Giả sử được một đồng tiền vàng. Hỏi xác suất để ngăn kéođược rút ra là ngăn kéo chứa hai đồng tiền vàng là bao nhiêu?

Bài 46 Năm 2001 Cộng đồng Châu Âu có một kiểm tra rất rộng rãi các con bò để phát hiện nhữngcon bị bệnh bò điên. Không có xét nghiệm nào cho kết quả chính xác 100%. Một loại xét nghiệm,mà ở đây ta gọi là xét nghiệm A, cho kết quả như sau: khi con bò bị bệnh bò điên, thì xác suất để raphản ứng dương tính trong xét nghiệm A là 70%, còn khi con bò không bị bệnh, thì xác suất để xảyra dương tính trong xét nghiệm A là 10%. Biết rằng tỉ lệ bò bị mắc bệnh bò điên ở Hà Lan là 1.3 contrên 100000 con. Hỏi rằng khi một con bò ở Hà Lan phản ứng dương tính với xét nghiệm A, thì xácsuất để nó mắc bệnh bò điên là bao nhiêu?

4 Biến ngẫu nhiên

Bài 47 Xác định trường hợp nào sau đây là bảng phân phối xác suất

a. X -1 0 1p(x) 0.2 0.6 0.2

b. X 1/2 3/4 1p(x) -1 0 2

c. X 2 4 6p(x) 0.25 0.35 0.5

d. X 0.1 0.7 0.8p(x) 2/5 1/5 2/5

P.T.Hồng, N.T.Nhung - Bộ môn Toán 11

Page 12: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Bài 48 Xét phân phối xác suất như sau:

X 0 1 2 3 4 5p(x) 0.15 0.35 0.2 0.1 0.15 0.05

Tìm trung bình và phương sai của X .

Bài 49 Gọi X là biến ngẫu nhiên chỉ chênh lệch giữa số mặt sấp và mặt ngửa khi tung một đồng xu4 lần.

a. Lập bảng phân phối xác suất của X .

b. Tính kì vọng và phương sai của X.

Bài 50 Mười quả bóng được chọn ngẫu nhiên từ một chiếc bình có 17 quả bóng trắng và 23 quả bóngđen. Gọi X là biến ngẫu nhiên chỉ số bóng trắng được lấy ra. Tính EX .

Bài 51 Trong một rổ có 99 quả bóng đánh số từ 1 đến 99. Nhặt ngẫu nhiên từ rổ ra 5 quả bóng. GọiX,Y tương ứng là số nhỏ nhất, lớn nhất hiện lên trên 5 quả bóng được nhặt ra.

a. Lập bảng phân phối xác suất của X,Y .

b. Tính kì vọng EX, EY .

Bài 52 Một công ty bảo hiểm bán một bảo hiểm nhân thọ với giá 20000 đô la và số tiền khách hàngphải đóng hàng năm là 300 đô la. Những bảng thống kê bảo hiểm cho thấy, một người mua bảo hiểmcó thể chết trong một năm với xác suất 0.001. Gọi X là biến ngẫu nhiên chỉ lợi nhuận của công tytrên mỗi bảo hiểm bán ra trong một năm.

a. Hãy cho biết phân phối xác suất của X .

b. Tìm lợi nhuận kỳ vọng trên mỗi bảo hiểm của công ty.

c. Nếu không có giả thiết số tiền khách hàng phải đóng hàng năm là 300 đô la thì số tiền công ty phảithu của khách hàng mỗi năm là bao nhiêu để lợi nhuận kỳ vọng trên mỗi bảo hiểm lớn hơn 0?

Bài 53 Một công ty thuê một luật sư trong một vụ kiện với hai phương án trả công như sau:

• Phương án 1: Trả 10 triệu đồng bất kể thắng hay thua kiện.

• Phương án 2: Trả 1 triệu đồng nếu thua kiện và 30 triệu đồng nếu thắng kiện.

Luật sư đánh giá khả năng thắng kiện của công ty này là 40%.

a. Lập bảng phân phối xác suất cho số tiền mà luận sư nhận được trong mỗi phương án.

b. Theo bạn luật sư nên chọn phương án nào?

Bài 54 Thống kê số khách trên một ôtô buýt tại một tuyến giao thông thu được số liệu như sau:

Số khách trên một chuyến 20 25 30 35 40Xác suất tương ứng 0.3 0.2 0.15 0.1 0.25

P.T.Hồng, N.T.Nhung - Bộ môn Toán 12

Page 13: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

a. Tìm kì vọng và phương sai của số khách đi mỗi chuyến và giải thích ý nghĩa của kết quả thu được.

b. Giả sử chi phí cho mỗi chuyến xe là 1,5 triệu VND không phụ thuộc vào số khách đi trên xe thì đểcông ty xe buýt có thể thu lãi bình quân cho mỗi chuyến xe là 300 nghìn VND thì phải qui địnhgiá vé là bao nhiêu?

Bài 55 Số lượng thuyền gỗ X mà một xưởng đóng thuyền có thể làm được trong một tháng có bảngphân phối xác suất như sau:

X 2 3 4 5 6 7 8PX 0.2 0.2 0.3 0.1 0.1 0.05 0.05

a. Số thuyền có khả năng nhiều nhất mà xưởng đó có thể đóng được trong tháng tới là bao nhiêu?

b. Giả sử việc đóng thuyền có chi phí cố định hàng tháng là 25 triệu đồng và chi phí bổ sung cho mỗicon thuyền là 15 triệu đồng. Hãy tìm chi phí bình quân hàng tháng của xưởng đó.

Bài 56 Trên một chuyến bay có 70 chỗ ngồi. Thực tế cho thấy đến giờ chót vẫn có khách bỏ chuyếnbay. Để tận dụng hết chỗ bay bằng cách bán thêm vé dự phòng người ta đã thống kê 20 chuyến bayvà thu được các số liệu sau:

Số khách bỏ chuyến bay 1 2 3 4 5 6 7 8 9 10Số chuyến bay tương ứng 1 4 0 4 2 5 1 1 0 2

a. Hãy tính xác suất để trong một chuyến bay nào đó có nhiều hơn 5 hành khách bỏ chuyến bay.

b. Tìm số hành khách bỏ chuyến trung bình của mỗi chuyến bay.

Bài 57 Thời gian sửa chữa một chiếc máy tính cá nhân (đơn vị: giờ) là biến ngẫu nhiên có hàm mậtđộ như sau:

f(x) =

{1/2, 0 < x < 20, trường hợp còn lại

a. Tìm thời gian trung bình để sửa chữa một chiếc máy.

b. Chi phí sửa chữa phụ thuộc vào thời gian theo công thức 40 + 30√

x trong đó x là thời gian sửachữa chiếc máy. Tìm chi phí kỳ vọng để sửa chữa một chiếc máy tính cá nhân.

Bài 58 Một bài thi trắc nghiệm gồm 50 câu hỏi, mỗi câu có 4 đáp án trả lời nhưng chỉ có một đáp ánlà đúng. Nam không học bài đi thi trả lời một cách ngẫu nhiên.

a. Tính xác suất để Nam trả lời đúng một nửa số câu hỏi.

b. Một sinh viên thi đỗ nếu trả lời đúng ít nhất một nửa số câu hỏi. Tính xác suất để Nam thi đỗ.

c. Số câu trả lời đúng trung bình của Nam là bao nhiêu? Tính xác suất để Nam trả lời đúng số câubằng số câu trung bình này và nhận xét.

Bài 59 Một bài thi trắc nghiệm gồm 12 câu hỏi, mỗi câu hỏi có 5 phương án trả lời, trong đó chỉ cómột đáp án đúng. Giả sử mỗi câu trả lời đúng được 4 điểm, mỗi câu trả lời sai bị trừ 1 điểm. Một sinhviên không học bài làm bài bằng cách trả lời ngẫu nhiên từng câu hỏi.

P.T.Hồng, N.T.Nhung - Bộ môn Toán 13

Page 14: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

a. Tính xem số câu trả lời đúng và số câu trả lời sai để sinh viên này được 13 điểm.

b. Tính xác suất để sinh viên này được 13 điểm.

c. Tính xác suất để sinh viên này bị điểm âm.

Bài 60 Cho X là biến ngẫu ngiên nhị thức với EX = 3, V X = 2.1. Tính các xác suất sau:

a. P (X = 7)

b. P (X ≤ 7)

c. P (X > 7)

d. P (X ≥ 7)

Bài 61 Một người tập ném bóng rổ, đứng từ một chỗ ném bóng vào rổ 6 lần. Xác suất ném trúng mỗilần là 2/3. Gọi X, Y tương ứng là số lần ném trúng và ném trượt, hãy tính E(X − Y ).

Bài 62 Nếu bạn mua 50 vé xổ số và cơ hội trúng thưởng của mỗi vé số là 1/100.

a. Tính xác suất để bạn trúng ít nhất một giải, đúng một giải, ít nhất hai giải.

b. Tìm số giải mà bạn có khả năng trúng cao nhất.

Bài 63 Số lần một người bị cảm lạnh trong một năm tuân theo phân phối Poisson với λ = 3.

a. Tính số lần bị cảm trung bình trong một năm của một người.

b. Tính xác suất để một người không bị cảm lạnh lần nào trong năm.

c. Tính xác suất để một người bị cảm lạnh không quá ba lần trong một năm.

Bài 64 Giả sử một người có mặt tại bến xe buýt lúc 10 giờ sáng, cho biết thời điểm xe buýt đỗ tại bếntuân theo phân phối đều giữa 10h và 10h30.

a. Tính xác suất người đó phải đợi trên 15 phút.

b. Nếu lúc 10h15 xe buýt vẫn chưa tới bến, tính xác suất để người đó phải đợi thêm ít nhất 5 phútnữa.

Bài 65 Cho X là biến ngẫu nhiên phân phối chuẩn với tham số µ = 8, σ2 = 25, tính các xác suất sau:

a. P (X > 5).

b. P (2 < X < 6).

c. P (X < 15).

d. P (X > 10).

e. Tìm x0 sao cho P (X < x0) = 0.4.

f. Tìm x0 sao cho P (X > x0) = 0.7.

P.T.Hồng, N.T.Nhung - Bộ môn Toán 14

Page 15: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Bài 66 Giả sử tuổi thọ của một chiếc đèn hình màu trong tivi tuân theo phân phối chuẩn với trungbình 8.2 năm và độ lệch chuẩn 1.4 năm. Chọn ngẫu nhiên một chiếc đèn hình màu.

a. Tính xác suất để chiếc đèn hình màu có tuổi thọ trên 10 năm.

b. Tính xác suất để một chiếc đèn hình màu có tuổi thọ ít hơn 4 năm.

c. Tính xác suất để một chiếc đèn hình màu có tuổi thọ từ 4 đến 10 năm.

d. Nếu qui định thời gian bảo hành là 5 năm thì tỉ lệ bảo hành là bao nhiêu?

e. Nếu muốn tỉ lệ bảo hành là 5% thì phải qui định thời gian bảo hành là bao nhiêu năm?

Bài 67 Chỉ số IQ của người tuân theo phân phối chuẩn với trung bình 100 và độ lệch chuẩn 14.2.Nhóm 10% những người có chỉ số IQ cao nhất có chỉ số IQ nằm trong phạm vi nào?

Bài 68 Giả sử lượng mưa hàng năm (mm) của một địa phương tuân theo phân phối chuẩn với trungbình là 1800, độ lệch chuẩn là 100. Tính xác suất để có 2 năm trong 4 năm có lượng mưa không quá1600 mm. Giả thiết rằng lượng mưa trong các năm khác nhau là độc lập.

Bài 69 Giả sử số dặm (nghìn dặm) một chiếc ôtô đi được cho đến khi không sử dụng được nữa tuântheo phân phối mũ với tham số λ = 1/20.

a. Tính số dặm trung bình mà một chiếc ô tô đi được.

b. Một người mua một chiếc xe mới, tính xác suất để người này đi được ít nhất 20 nghìn dặm.

c. Một người mua một chiếc ôtô cũ đã đi được 10 nghìn dặm, tính xác suất để anh ta có thể sử dụngnó để đi tiếp được ít nhất 20 nghìn dặm nữa.

Bài 70 Số lần động đất tại một địa phương có phân phối Poisson với tỷ lệ 5 trận mỗi năm

a. Xác suất có ít nhất 3 vụ động đất trong nửa năm đầu tiên của năm 2020 là bao nhiêu?

b. Giả sử sự kiện trên xảy ra, xác suất không có động đất ở địa phương trong năm 2020 là bao nhiêu?

c. Mới có một vụ động đất vào tháng 5 năm 2020. Tính xác suất để ít nhất một năm nữa không có vụđộng đất nào.

5 Ước lượng tham số tổng thể

Bài 71 Tại một ngân hàng, người ta muốn cải tiến hệ thống phục vụ để làm giảm thời gian chờ củakhách hàng đến giao dịch. Hiện tại trung bình khách hàng phải chờ từ 9 đến 10 phút. Họ tiến hànhchọn mẫu ngẫu nhiên 100 khách hàng trong vòng 1 tháng sử dụng hệ thống mới. Thời gian chờ củanhững người trong mẫu được lưu trong file ThoiGianCho.txt (đơn vị: phút).

a. Tìm một ước lượng điểm cho thời gian chờ trung bình của tất cả khách hàng khi ngân hàng dùnghệ thống mới.

b. Tìm khoảng tin cậy 99% cho thời gian chờ trung bình của khách hàng khi ngân hàng dùng hệ thốngmới.

P.T.Hồng, N.T.Nhung - Bộ môn Toán 15

Page 16: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Bài 72 Sử dụng file ThoiGianCho.txt hãy thực hiện các yêu cầu sau:

a. Tìm một ước lượng điểm cho cho tỷ lệ khách hàng phải chờ ít hơn 6 phút.

b. Tìm khoảng tin cậy 90% cho tỷ lệ khách hàng phải chờ ít hơn 6 phút.

Bài 73 Thành phần PCBs (đơn vị: ppm) (polychlorynated biphenyls-một nhóm những chất hóa họcnhân tạo có hại cho môi trường) trong một con cá tại một chiếc hồ được đo bởi một kỹ thuật mà kếtquả tuân theo phân phối chuẩn với trung bình chính là mức PCB thực sự của con cá và độ lệch chuẩnlà 0.08). Tiến hành đo thành phần này trên một con cá trong 8 lần với kỹ thuật đó được kết quả nhưsau

11.2 12.4 10.8 11.6 12.5 10.1 12.2 10.6

Tìm khoảng tin cậy cho mức PCB của con cá này với độ tin cậy 95%.

Bài 74 Một mẫu ngẫu nhiên gồm 20 điếu thuốc được chọn để xác định thành phần nicotin, kết quả thuđược hàm lượng nicotine trung bình của mẫu là 1.2 mg. Tìm khoảng tin cậy 99% cho lượng nicotinetrung bình của các điếu thuốc lá cho biết lượng nicotine trong một điếu thuốc tuân theo phân phốichuẩn với độ lệch chuẩn σ = 0.2 mg.

Bài 75 Hãy thực hiện yêu cầu của bài tập trên nếu không biết độ lệch chuẩn tổng thể, thay vào đó tabiết phương sai mẫu là 0.04.

Bài 76 Một mẫu ngẫu nhiên gồm 100 sản phẩm được chọn từ một dây chuyền sản suất thấy có 16 sảnphẩm phải loại. Tìm khoảng tin cậy 95% cho tỷ lệ sản phẩm bị loại của dây chuyền sản xuất đó.

Bài 77 Dùng dữ liệu trong fileHocSinh.rda trên hãy tìm khoảng tin cậy 99% cho tỷ lệ học sinh trongđộ tuổi được nghiên cứu (9-11) có mức độ yêu thích thể thao là 4.

6 Kiểm định tham số một tổng thể

Bài 78 Một công ty dược phẩm ở Anh, Glaxo Holdings, mới phát triển một loại thuốc điều trị chứngđau nửa đầu. Theo công ty dược này, thời gian trung bình để chất somatriptan, một thành phần củathuốc, đi vào máu ít hơn 10 phút. Để thuyết phục cơ quan quản lý về nhận định này, Glaxo tiến hànhmột thử nghiệm trên một nhóm bệnh nhân bị chứng đau nửa đầu được chọn ngẫu nhiên. Để chứngminh khẳng định của mình, họ cần đưa ra giả thuyết không và giả thuyết đối như thế nào?

Bài 79 Trong một quy trình sản xuất hoá học, điều rất quan trọng là một dung dịch được dùng cần cóPH chính xác là 8.20. Một phương pháp xác định PH cho dung dịch này được biết sẽ cho các số đophân phối chuẩn với trung bình là PH của dung dịch và độ lệch chuẩn là 0.02. Giả sử 10 mẫu dungdich độc lập đo được PH bằng phương pháp này như sau:

8.18 8.17 8.16 8.15 8.17 8.21 8.22 8.16 8.19 8.18

a. Để thực hiện bài toán trên, ta sử dụng loại phân phối nào?

b. Thực hiện kiểm định bằng phương pháp giá trị tới hạn tại mức ý nghĩa 0.05, giá trị kiểm định làbao nhiêu, giá trị tới hạn là bao nhiêu? Kết luận.

P.T.Hồng, N.T.Nhung - Bộ môn Toán 16

Page 17: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

c. Thực hiện kiểm định bằng phương pháp p - giá trị, cho biết p-giá trị của bài toán. Kết luận với mứcý nghĩa α = 5%.

Bài 80 Độ bền trung bình của một loại sợi đòi hỏi phải ít nhất bằng 200 psi. Những thí nghiệm trướcđây cho thấy rằng độ lệch chuẩn của độ bền là 5 psi. Một mẫu gồm 8 mẩu sợi được chọn và đo đượcđộ bền như sau:

210 198 195 202 197.5 196 199 195.5

Có thể kết luận, tại mức ý nghĩa 0.05 rằng loại sợi nói trên không đảm bảo tiêu chuẩn không?

Bài 81 Chiều cao trung bình của nam giới của một nước được cho là 1.78 m với độ lệch chuẩn 7.6cm. Để kiểm tra chiều cao của nam giới tại một thành phố có ở mức trung bình như trên toàn quốchay không, một mẫu ngẫu nhiên gồm 20 người là nam giới được chọn ra. Chiều cao của họ được ghilại trong file ChieuCao.csv.

Thứ tự Chiều cao Thứ tự Chiều cao1 1.83 11 1.792 1.73 12 1.933 1.76 13 1.844 1.85 14 1.885 1.81 15 1.826 1.83 16 1.777 1.80 17 1.928 1.88 18 1.799 1.68 19 1.9410 1.79 20 1.96

Cho biết chiều cao nam giới tại thành phố này tuân theo phân phối chuẩn, hãy kết luận ở mức ý nghĩa0.01.

Bài 82 Trọng lượng của cá hồi trưởng thành tại một khu vực ấp trứng tuân theo phân phối chuẩn vớiđộ lệch chuẩn 1.2 pound. Những người nuôi cá cho rằng vụ thu hoạch năm nay, trọng lượng trungbình của cá ít nhất là 7.6 pound. Một mẫu ngẫu nhiên gồm 16 con cá được chọn ra cân được trọnglượng trung bình là 7.2 pound. Tại mức ý ngĩa α = 1%, có đủ bằng chứng để bác bỏ giả thuyết củanhững người nuôi cá hồi không?

Bài 83 Một quảng cáo về một loại thuốc đánh răng mới cho rằng loại thuốc này làm giảm số răngsâu của trẻ em. Số lượng răng bị sâu trong một năm của nhóm tuổi này có phân phối chuẩn với trungbình 3 và độ lệch chuẩn là 1. Một cuộc nghiên cứu trên 2500 trẻ dùng loại thuốc đánh răng này thấysố răng sâu trung bình 2.95/một trẻ. Giả sử rằng độ lệch chuẩn của số răng sâu của trẻ em dùng loạithuốc này vẫn là 1. Tại mức ý nghĩa α = 5%, dữ liệu này có đủ để tin vào lời quảng cáo trên haykhông?

Bài 84 Một công ty xăng dầu khẳng định rằng tỷ lệ lưu huỳnh trong dầu diesel của họ nhiều nhất là0.15%. Để kiểm tra điều này, lượng lưu huỳnh trong mẫu gồm 40 mẫu dầu diesel được xác định vàtính được trung bình và độ lệch chuần là 0.162 và 0.04. Với mức ý nghĩa α = 1% ta có thể kết luậnrằng lời phát biểu của công ty có cơ sở hay không?

P.T.Hồng, N.T.Nhung - Bộ môn Toán 17

Page 18: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Bài 85 Một công ty sản xuất những tấm nhựa dụng trong công nghiêp mới đưa ra một sản phẩm mớivà cho rằng sản phẩm này có thể chịu được sức ép ít nhất là 30 (psi), ở đây khả năng chịu lực đươctính bằng số pound cần thiết làm vỡ tấm nhựa trên một diện tích 1 inch vuông. Dữ liệu sau đây chobiết khả năng chịu lực của một mẫu gồm 16 tấm nhựa (file dữ liệu Nhua.txt).

30.1 32.7 22.5 27.5 27.7 29.8 28.9 31.431.2 24.3 26.4 22.8 29.1 33.4 32.5 21.7

Giả thiết rằng khả năng chịu lực của tấm nhựa phân phối chuẩn. Dựa vào dữ liệu hãy kết luận vềkhẳng định của công ty với mức ý nghĩa α = 5% bằng cách dùng phương pháp

a. giá trị tới hạn.

b. p - giá trị.

Bài 86 Trọng lượng sản phẩm của một nhà máy tuân theo phân phối chuẩn với trung bình là 20 kg.Nghi ngờ máy hoạt động không bình thường người ta cân thử 100 sản phẩm và thu được kết quả nhưsau:

Trọng lượng 19 20 21 22 23Số sản phẩm 10 59 20 6 5

Với mức ý nghĩa 1% hãy kết luận về nghi ngờ nói trên.

Bài 87 Theo số liệu trước đây, dây chuyền sản xuất tại một nhà máy có tỷ lệ phế phẩm là 7%. Ngườita muốn kiểm tra xem tỷ lệ này có thay đổi không nên đã chọn ngẫu nhiên 250 sản phẩm đem kiểmtra thấy có 20 sản phẩm bị loại. Hãy tiến hành bài toán kiểm định tại mức ý nghĩa 1%.

Bài 88 Dùng file dữ liệu ThoiGianCho.csv kiểm định xem tỷ lệ khách hàng phải chờ trên 7 phútkhông vượt quá 25% hay không tại mức ý nghĩa 0.05.

7 Kiểm định tham số hai tổng thể

Bài 89 Trong một nghiên cứu về tác dụng của Vitamin C trong điều trị bệnh cảm lạnh, 22 người bịcảm lạnh tình nguyện được chia làm hai nhóm: nhóm 1 gồm 10 người được sử dụng một ngày 4 viênthuốc chứa 1 gram vitamin C. Nhóm 2 gồm 12 người còn lại cũng dùng thuốc bề ngoài tương tự nhưngkhông có vitamin C và vô hại. Thời gian bị cảm (đơn vị: ngày) của những người này được ghi lại nhưsau (VitaminC.xls)

P.T.Hồng, N.T.Nhung - Bộ môn Toán 18

Page 19: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Điều trị có Viatmin C Điều trị không có viatmin C5.5 6.56.0 6.07.0 8.56.0 7.07.5 6.56.0 8.07.5 7.55.5 6.57.0 7.56.5 6.0

8.57.0

Việc sử dụng 4 gram vitamin C mỗi ngày có làm giảm thời gian bị cảm lạnh hay không? Kiểm địnhở mức ý nghĩa 5%.

Bài 90 Một kỹ sư xây dựng muốn so sánh sức chịu nén của hai loại bê tông. Anh ta chọn ra một mẫugồm 10 tấm bê tông loại thứ nhất, dữ liệu về sức chịu nén (đơn vị: psi) của những tấm bê tông nàynhư sau:

3250 3268 4302 3184 3266 3297 3332 3502 3064 3116

Một mẫu ngẫu nhiên khác gồm 10 tấm bê tông loại thứ hai được chọn và có sức chịu nén như sau

3094 3106 3004 3066 2984 3124 3316 3212 3380 3018

Giả sử hai tổng thể phân phối chuẩn có phương sai bằng nhau. Hãy kiểm định ở mức ý nghĩa 5% xemkhả năng chịu lực của hai loại bê tông có khác nhau hay không?

Bài 91 Dữ liệu về trọng lượng của những bé sơ sinh trong hai mẫu ngẫu nhiên chọn ra từ các bé sơsinh tại hai thành phố A và B cho những kết quả sau

n1 = 55 n2 = 48x1 = 3.1 x2 = 3.3s21 = 1.07 s2

2 = 1.01

Kiểm định giả thuyết không: trọng lượng của trẻ sơ sinh ở hai thành phố như nhau ở mức ý nghĩa 5%.

Bài 92 Để nghiên cứu ảnh hưởng của một loại thuốc ngủ, người ta cho 12 bệnh nhân uống thuốc thậtvà một lần khác uống thuốc giả, số giờ ngủ của bệnh nhân được ghi lại như sau (file Thuoc.rda)

Bệnh nhân 1 2 3 4 5 6 7 8 9 10 11 12Số giờ ngủ (thuốc thật) 6.1 7.0 8.2 7.6 6.5 8.4 6.9 6.7 7.4 5.8 6.0 7.1Số giờ ngủ (thuốc giả) 5.2 7.9 3.9 4.7 5.3 5.4 4.2 6.1 3.8 6.3 4.1 5.3

Với mức ý nghĩa 5% có kết luận gì về ảnh hưởng của loại thuốc ngủ trên? Cho biết thời gian ngủ củacác bệnh nhân tuân theo quy luật chuẩn.

Bài 93 Để so sánh số hành khách đi xe bus trong giờ cao điểm buổi sáng và buổi chiều ở một thànhphố, trong một ngày người ta chọn ngẫu nhiên 9 chiếc xe với lộ trình khác nhau và thu thập số liệu vềsố hành khách đi xe lúc 7h45 và 16h45

P.T.Hồng, N.T.Nhung - Bộ môn Toán 19

Page 20: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Xe 1 2 3 4 5 6 7 8 9Sáng 43 51 37 24 47 44 50 55 46Chiều 41 49 44 32 46 42 47 51 49

Có sự khác biệt về số hành khách trên các chuyến xe giữa buổi sáng và chiều không? Kiểm định ởmức ý nghĩa 5% cho biết số hành khách đi xe phân phối chuẩn (làm bằng 2 cách).

Bài 94 Trong một cuộc điều tra người ta thấy 59% trong số 375 nam giới và 70% trong số 481 phụnữ nói rằng trọng lượng là một yếu tố quan trọng khi mua một chiếc máy tính xách tay. Điều đó cócho thấy tỷ lệ phụ nữ có ý kiến nói trên cao hơn nam giới hay không. Dùng mức ý nghĩa 0.05.

Bài 95 Dùng dữ liệu trong file HocSinh.rda để kiểm định xem có phải tỷ lệ học sinh rất thích thểthao (mức 4) trong nhóm học sinh nam cao hơn so với tỷ lệ này trong nhóm học sinh nữ hay không?Dùng mức ý nghĩa α = 1%.

Bài 96 Từ dây chuyền thứ nhất kiểm tra 110 chi tiết người ta loại đi 30 chi tiết, từ dây chuyền thứ haikiểm tra 150 chi tiết người ta loại đi 40 chi tiết. Ở mức ý nghĩa 5% có thể cho rằng chất lượng sảnphẩm của hai dây chuyền là như nhau không?

Bài 97 Người ta sử dụng hai phương pháp đo hàm lượng PCBs (polychlorynated biphenyls-một nhómnhững chất hóa học nhân tạo có hại cho môi trường) trên cá trong một chiếc hồ. Giả sử kết quả đocủa hai phương pháp tuân theo quy luật chuẩn. Hãy kiểm định giả thuyết phương sai của kết quả đobởi hai phương pháp bằng nhau dựa trên kết quả đo 8 lần tiến hành trên một con cá sau đây

Phương pháp 1 6.2 5.8 5.7 6.3 5.9 6.1 6.2 5.7Phương pháp 2 6.3 5.7 5.9 6.4 5.8 6.2 6.3 5.5

Bài 98 Điều tra về sự biến động của giá xăng tại hai thành phố, chọn ngẫu nhiên từ mỗi thành phố 10trạm bán xăng và ghi lại giá một gallon xăng bán tại những trạm này trong một ngày. Kết quả như sau

Thành phố 1 1.18 1.07 1.13 1.15 1.14 1.13 1.14 1.13 1.03 1.09Thành phố 2 1.08 1.05 1.19 1.17 1.21 1.12 1.14 1.14 1.13 1.11

Giả thiết giá xăng tuân theo phân phối chuẩn kiểm định về sự khác nhau về phương sai của giá xănggiữa hai thành phố với mức ý nghĩa α = 0.01.

Bài 99 Trong fileChiSoIQ CLBToanHoc.csv cho ta thông tin về một số thành viên được chọn ngẫunhiên từ một vài câu lạc bộ Toán học trong cả nước. Cho biết chỉ số IQ tuân theo phân phối chuẩn, tạimức ý nghĩa α = 5%, hãy kiểm định xem mức độ đồng đều về chỉ số IQ của nam thành viên và nữthành viên tham gia các câu lạc bộ Toán học trong cả nước có như nhau hay không?

8 Phân tích phương sai

Bài 100 Một công ty sản xuất sữa có 4 máy đổ sữa vào các bình. Để kiểm định xem lượng sữa cácmáy đổ vào bình có như nhau không, người ta chọn ngẫu nhiên 19 bình sữa sau khi được đổ sữa từ 4máy nói trên. Lượng sữa trong những bình này đo được như sau:

P.T.Hồng, N.T.Nhung - Bộ môn Toán 20

Page 21: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Máy 1 Máy 2 Máy 3 Máy 44.05 3.99 3.97 4.004.01 4.02 3.98 4.024.02 4.01 3.97 3.994.04 3.99 3.95 4.01

4.00 4.004.00 4.00

(Dữ liệu có trong file TrongLuongSua.xls)

a. Ở mức ý nghĩa α = 5% hãy kiểm tra xem trọng lượng sữa trong mỗi bình đổ từ 4 máy trên có nhưnhau không, nếu giả thiết trọng lượng sữa của các bình đổ từ mỗi máy đều tuân theo phân phốichuẩn và có phương sai bằng nhau. Trong trường hợp bác bỏ H0, hãy thực hiện bài toán phântích sâu để có những thông tin tốt hơn về sự khác nhau giữa trọng lượng sữa từ những máy trên.

b. Ở mức ý nghĩa α = 5% hãy kiểm tra xem trọng lượng sữa trong mỗi bình đổ từ 4 máy trên có nhưnhau không, nếu không có những thông tin về tổng thể trọng lượng sữa của các bình đổ từ mỗimáy.

Bài 101 Để kiểm tra ảnh hưởng của ba loại chất phụ gia (A, B, C) và ba loại xăng X1, X2, X3 đếnquãng đường đi được của ô tô, người ta chọn ra 9 xe mô tô giống nhau, mỗi xe sử dụng 20 lít một loạixăng có pha thêm một chất phụ gia nhất định. Số dặm đi được của các xe được ghi lại như sau:

Chất phụ giaLoại xăng A B C

X1 124.1 131.5 127X2 126.4 130.6 128.4X3 127.2 132.7 125.6

(Dữ liệu có trong file QuangDuong MotQuanSat.xls)

a. Dùng phương pháp phân tích phương sai, ở mức ý nghĩa α = 5% hãy kiểm định rằng loại xăngkhông ảnh hưởng đến quãng đường đi được.

b. Dùng phương pháp phân tích phương sai, ở mức ý nghĩa α = 5% hãy kiểm định rằng ảnh hưởngcủa các chất phụ gia là như nhau đến quãng đường đi được.

Bài 102 Trong bài tập trên, ứng với mỗi loại xăng và chất phụ gia người ta thử nghiệm trên 2 chiếcxe. Quãng đường đi được của những chiếc xe này như sau:

Chất phụ giaLoại xăng A B C

X1 126.2 130.4 127124.8 131.6 126.6

X2 127.2 142.1 129.5126.6 132.6 142.6

X3 127.2 132.4 125.2124.9 133.0 120.9

(Dữ liệu có trong file QuangDuong NhieuQuanSat.xls)

P.T.Hồng, N.T.Nhung - Bộ môn Toán 21

Page 22: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

a. Ở mức ý nghĩa α = 5% hãy kiểm định xem có sự tương tác giữa hai yếu tố loại xăng và chất phụgia không?

a. Ở mức ý nghĩa α = 5% hãy kiểm định rằng loại xăng không ảnh hưởng đến quãng đường đi được.

b. Ởmức ý nghĩa α = 5% hãy kiểm định rằng ảnh hưởng của các chất phụ gia là như nhau đến quãngđường đi được.

Bài 103 Để xét xem giá (đơn vị 100$) của một loại xe máy mới sản xuất có khác nhau khi được bántại thị xã, thành phố và nông thôn hay không, người ta chọn ngẫu nhiên một số cửa hàng tương ứngtại các khu vực trên và hỏi giá khách hàng đã mua xe. Biết rằng giá xe ở mỗi nơi bán tuân theo phânphối chuẩn và có phương sai bằng nhau, thực hiện bài toán phân tích phương sai mô hình một nhântố ta thu được kết quả sau:

Df Sum Sq Mean Sq F valueKhuVuc 2 15.53 7.76 0.38Residuals 13 266.71 20.52

a. Hoàn thành bảng phân tích phương sai sau:

Nguồn Tổng Bậc tự do Phương sai Tỉ sốbiến thiên bình phương (df) (MS) F

Giữa các nhóm SSG = k − 1 = MSG =SSG

k − 1= F =

MSG

MSW=

Nội bộ các nhóm SSW = n − k = MSW =SSW

n − k=

Toàn bộ SST = n − 1 =

b. Ở mức ý nghĩa α = 5%, hãy xét xem giá trung bình của loại xe trên tại ba khu vực thị xã, thànhphố và nông thôn có khác nhau không?

Bài 104 Một kĩ sư nông nghiệp đã tiến hành một cuộc thực nghiệm để thẩm định sự khác biệt về sảnlượng của 4 giống lúa (A, B, C và D) khi dùng 3 loại phân bón khác nhau (Loại 1, Loại 2 và Loại 3).Kĩ sư này đã ghi lại số tạ thóc trồng trên một hecta của từng giống lúa tương ứng với từng loại phânbón. Để xem xét sự khác biệt, kĩ sư thực hiện bài toán phân tích phương sai mô hình hai nhân tố, mộtquan sát trong một ô và thu được bảng kết quả sau:

Df Sum Sq Mean Sq F valuePhanBon 2 231.17 115.58 11.04GiongLua 3 22.92 7.64 0.73Residuals 6 62.83 10.47

a. Hãy hoàn thành bảng phân tích phương sai sau:

Nguồn Tổng Bậc tự do Phương sai Tỉ sốbiến thiên bình phương (df) (MS) F

Giữa các nhóm SSG = K − 1 = MSG = F1 =

Giữa các khối SSB = H − 1 = MSB = F2 =

Phần dư SSE = (K − 1)(H − 1) = MSE =

Tổng cộng SST = n − 1 =

P.T.Hồng, N.T.Nhung - Bộ môn Toán 22

Page 23: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

b. Tại mức ý nghĩa α = 5%, hãy kiểm định xem giống lúa có ảnh hưởng đến sản lượng lúa haykhông?

c. Tại mức ý nghĩa α = 5%, hãy kiểm định xem loại phân bón có ảnh hưởng đến sản lượng lúa haykhông?

Bài 105 Trong file TienVayKinhDoanh.txt cho ta số liệu về tiền vay kinh doanh (Tien) và loại hìnhsở hữu (CongTy) của một số công ty được chọn ngẫu nhiên trong cả nước. Tại mức ý nghĩa α = 5%,hãy xét xem số tiền vay trung bình của các công ty thuộc ba loại hình sở hữu liên doanh, nhà nước vàtư nhân có như nhau không, giả sử rằng số tiền vay của từng loại công ty tuân theo phân phối chuẩncó phương sai bằng nhau.

9 Kiểm định phi tham số

Bài 106 Một tổ chức sức khỏe công cộng cho rằng lượng nước dùng trung bình của mỗi một hộ giađình trong ngày là 350 gallons. Để kiểm định lại khẳng định này, một nghiên cứu đã được tiến hànhbằng cách chọn ngẫu nhiên ra 20 gia đình và ghi lại lượng nước trung bình họ dùng hàng ngày nhưsau:

340 344 362 375 356386 354 364 332 402340 355 362 322 372324 318 360 338 370

(Dữ liệu có trong file LuongNuocTrongNgay.xls)Tại mức ý nghĩa α = 5%, hãy kiểm định xem khẳng định của tổ chức sức khỏe công cộng trên là

có cơ sở không?

Bài 107 Nhà sản xuất một loại lốp xe mới khẳng định rằng tuổi thọ trung bình của những chiếc lốpnày ít nhất là 40000 dặm. Để kiểm định lại khẳng định này một mẫu ngẫu nhiên gồm 12 chiếc lốpđược đem ra thử nghiệm và tuổi thọ của chúng (đơn vị 1000 dặm) được ghi lại như sau:

Lốp 1 2 3 4 5 6 7 8 9 10 11 12Tuổi thọ 36.1 40.2 33.8 38.5 42 35.8 37 41 36.8 37.2 33 36

(Dữ liệu có trong file TuoiThoLopXe.xls)Tại mức ý nghĩa α = 5%, hãy kiểm định xem lời khẳng định của nhà sản xuất có cơ sở không?

Bài 108 Để xét xem giá (đơn vị 100$) của một loại xe máy mới sản xuất có khác nhau khi được bántại thị xã, thành phố và nông thôn hay không, người ta chọn ngẫu nhiên một số cửa hàng tương ứngtại các khu vực trên và hỏi giá khách hàng đã mua xe. Bảng số liệu sau cho ta giá của cùng một kiểuxe của ba khu vực đang điều tra:

Thị xã Thành phố Nông thôn158.0 163.0 160.0165.0 159.0 166.0157.5 159.0 168.0162.0 166.5 160.5156.0 158.0 152.5

165.5

P.T.Hồng, N.T.Nhung - Bộ môn Toán 23

Page 24: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

(Dữ liệu có trong file GiaXeMay.xls)

a. Để giá của loại xe mới này có khác nhau tại các khu vực thị xã, thành phố và nông thôn hay không,bạn sẽ dùng kiểm định tham số hay phi tham số.

b. Ở mức ý nghĩa α = 5%, hãy xét xem giá trung bình của loại xe trên tại ba khu vực thị xã, thànhphố và nông thôn có khác nhau hay không?

Bài 109 Người ta thử nghiệm một loại thuốc làm giảm hàm lượng albumin trong máu. Một mẫu gồm12 bệnh nhân có hàm lượng albumin cao trong máu được điều trị bởi loại thuốc thuốc này. Bảng saucho ta hàm lượng albumin trong máu của những bệnh nhân này trước và sau khi điều trị:

Hàm lượng albumin (g/100ml)Bệnh nhân Trước khi điều trị Sau khi điều trị

1 5.02 4.662 5.08 5.153 4.75 4.304 5.25 5.075 4.80 5.386 5.77 5.107 4.85 4.808 5.09 4.919 6.05 5.2210 4.77 4.5011 4.85 4.8512 5.24 4.56

(Dữ liệu có trong file HamLuongAlbumin.xls)Tại mức ý nghĩa α = 5%, hãy kiểm định xem loại thuốc này có công hiệu không?

Bài 110 Hai mác xe A và B được chọn một cách ngẫu nhiên để thử nghiệm độ bền của động cơ (tínhbằng số ngàn km sử dụng cho đến khi hỏng). Với số liệu đã cho sau đây, tại mức ý nghĩa α = 5% cóthể khẳng định mác xe A tốt hơn mác xe B không?

Mác xe A Mác xe B61 2630 3249 4048 3541 4145 4357 30

3641

(Dữ liệu có trong file DoBenDongCo.xls)

Bài 111 Để kiểm định tốc độ xử lí của hai phần mềm mới và hiện dùng, người ta tiến hành điều travà thu được thời gian xử lí của hai phần mềm đối với 10 lệnh như sau:

P.T.Hồng, N.T.Nhung - Bộ môn Toán 24

Page 25: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Lệnh 1 2 3 4 5 6 7 8 9 10Phần mềm đang dùng 9.98 9.98 9.84 9.99 9.94 9.84 9.86 10.12 9.9 9.91Phần mềm mới 9.88 9.86 9.75 9.8 9.87 9.84 9.87 9.86 9.83 9.86

(Dữ liệu có trong file TocDoXuLi.csv)Hãy kiểm chứng ở mức ý nghĩa 5% về sự khác biệt giữa tốc độ xử lí của hai phần mềm này.

Bài 112 Để đánh giá điều kiện kinh doanh theo một số nhân tố, người ta dùng một thang điểm để đo"mức độ lạc quan trong kinh doanh" (điểm càng cao thì mức độ lạc quan càng nhiều). Năm 2001,nhóm điều tra tiếp xúc với 10 người làm việc ở nhiều ngành khác nhau và đề nghị họ đưa ra điểmnhận định về điều kiện kinh doanh trong lĩnh vực của mình. Năm 2002, nhóm điều tra tiếp xúc với 10người trên và cũng đề nghị họ đưa ra nhận định như năm 2001. Bảng sau cho ta điểm của 10 ngườiđược phỏng vấn năm 2001 và 2002:

Năm 2001 63.1 67.1 65.5 68.0 66.6 65.7 69.2 67.0 65.2 60.7Năm 2002 57.4 66.4 61.8 65.3 63.5 66.4 64.9 65.2 65.1 62.2

(Dữ liệu có trong file DiemLacQuan.xls)Tại mức ý nghĩa α = 5%, trong mỗi trường hợp đưa ra dưới đây có thể khẳng định các nhà kinh

doanh năm 2002 kém lạc quan hơn các nhà kinh doanh năm 2001 không?

a. Giả sử rằng điểm của tổng thể các nhà kinh doanh trong mỗi năm trên tuân theo phân phối chuẩn.

b. Giả sử rằng điểm của tổng thể các nhà kinh doanh trong mỗi năm trên không tuân theo phân phốichuẩn.

Bài 113 Bốn qui trình hóa học chuẩn được sử dụng để xác định hàm lượng magiê trong một hợp chấthóa học. Mỗi qui trình được sử dụng năm lần trên cùng một hợp chất và thu được bảng dữ liệu sau:

Qui trình1 2 3 4

76.42 80.41 74.20 86.2078.62 82.26 72.68 86.0480.40 81.15 78.84 84.3678.20 79.20 80.32 80.6879.30 82.30 77.40 85.50

(Dữ liệu có trong file HamLuongMaGie.xls)Bằng cách thực hiện lần lượt các yêu cầu sau, hãy kiểm định xem có sự khác biệt về hàm lượng

magiê đo được theo các qui trình khác nhau không?

a. Hãy xét xem bạn nên sử dụng phương pháp tham số hay phi tham số.

b. Nêu cặp giả thuyết H0 và H1 thích hợp.

c. Dựa trên p− giá trị nêu kết luận tại mức ý nghĩa α = 5%.

P.T.Hồng, N.T.Nhung - Bộ môn Toán 25

Page 26: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

10 Kiểm định khi- bình phương

Bài 114 Một mẫu ngẫu nhiên gồm 100 phụ nữ ở thành phố Hồ Chí Minh được chọn ra để hỏi mức độưa thích về 5 loại xà phòng A, B, C, D và E thì thu được kết quả như sau:

Loại xà phòng A B C D E TổngSố phụ nữ chọn 18 16 23 20 23 100

Hãy kiểm tra xem 5 loại xà phòng này có được ưa thích như nhau đối với phụ nữ ở thành phố HCMở mức ý nghĩa 5% không.

Bài 115 Theo hồ sơ lưu trữ thì nếu qui trình sản xuất là bình thường thì có 93% số sản phẩm khôngbị sai sót, 5% có một sai sót và 2% có hơn một sai sót. Một mẫu ngẫu nhiên gồm 500 sản phẩm đượcchọn ra từ đợt sản xuất tuần qua thì thấy 458 sản phẩm không sai sót , 30 có một sai sót và 12 có hơnmột sai sót. Hãy kiểm chứng ở mức ý nghĩa 5% xem chất lượng sản phẩm tuần qua có bình thườngkhông.

Bài 116 Theo số liệu các năm trước, giải thưởng trúng được khi mua một loại xà phòng trong dịp tếtNguyên đán phân về ba miền Bắc, Trung, Nam theo tỉ lệ 3 : 2 : 2. Phỏng vấn 400 người trúng giảinhân lễ trao giải thưởng năm nay, thấy có 180 người miền Bắc, 100 người miền Trung và 120 ngườimiền Nam. Tại mức ý nghĩa α = 5% có thể kết luận tỉ lệ giải thưởng năm nay còn như mọi nămkhông?

Bài 117 Một nhân viên khách hàng mỗi ngày viếng thăm 5 khách hàng. Giả thiết cho rằng số lần bánđược hàng tuân theo phân phối nhị thức với p = 0.4. Kết quả trong nhiều ngày như sau:

Số lần bán trong ngày 0 1 2 3 4 5Số ngày 10 41 60 20 6 3

Ở mức ý nghĩa 5% ta có thể kết luận rằng phân phối số lần bán ra thực sự tuân theo phân phối đã giảthiết trên không?

Bài 118 Người ta muốn kiểm tra xem số người đến chi cục thuế ở một huyện có tuân theo phân phốiPoisson không. Thống kê số người đến trong một giờ trong một số ngày tại chi cục thuế này ta thuđược bảng số liệu sau:

Số người 0 1 2 3 4 5 trên 5Số giờ 8 12 20 25 15 15 5

Tại mức ý nghĩa α = 5%, hãy xét xem số người đến chi cục thuế trong một giờ có tuân theo phânphối Poisson với λ = 3 không?

Bài 119 Một trong những cách để quyết định ai là tác giả là so sánh tần số xuất hiện của một từ nàođó. Nghiên cứu số lần xuất hiện của từ "có thể" trong một đoạn văn dài xấp xỉ 200 từ người ta ghi lạiđược như sau:

Số lần xuất hiện 0 1 2 ≥ 3 TổngSố đoạn văn 156 63 29 14 262

P.T.Hồng, N.T.Nhung - Bộ môn Toán 26

Page 27: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Tại mức ý nghĩa α = 5% hãy xét xem phân phối tần số xuất hiện của từ "có thể" có tuân theo phânphối Poisson với λ = 0.6 không?

Bài 120 Các phương tiện giải trí ở TPHCM sẽ được đánh giá là tốt, vừa hay xấu. Một mẫu ngẫu nhiêngồm nhiều người có mức thu nhập trên trung bình, trung bình và dưới trung bình được chọn ra để hỏiý kiến. Kết quả xếp lớp chéo như sau:

Ý kiếnMức thu nhập Tốt Vừa XấuTrên trung bình 175 124 92Trung bình 118 110 126Dưới trung bình 127 82 147

Hãy kiểm chứng ở mức ý nghĩa 5% hãy kiểm định xem có mối liên hệ giữa mức thu nhập với thái độđối với phương tiện giải trí không?

Bài 121 Người ta nghiên cứu xem có mối liên hệ giữa thời gian tìm hiểu trước hôn nhân và tình trạnghiện tại của cuộc hôn nhân hay không. Bảng sau cho ta số liệu điều tra về 200 cặp vợ chồng có thờigian kết hôn trên 5 năm, với thời gian tìm hiểu trước hôn nhân được chia làm ba mức là ngắn, trungbình và dài và tình trạng hôn nhân được chia làm ba mức là hạnh phúc, không hạnh phúc và ly dị/lythân:

Thời gian tìm hiểuTình trạng hôn nhân Ngắn Trung bình DàiHạnh phúc 38 58 54Không hạnh phúc 12 14 4Ly dị/Ly thân 10 8 2

Tại mức ý nghĩa α = 5%, hãy kiểm định xem thời gian tìm hiểu trước hôn nhân có liên hệ với tìnhtrạng hôn nhân không?

Bài 122 Để tìm hiểu xem thời gian nằm bệnh viện của bệnh nhân có phụ thuộc vào các loại bảo hiểm(phần trăm chi phí được bảo hiểm chi trả) không, người ta thu thập một mẫu gồm 660 thời gian nằmviện và được xếp chéo với loại bảo hiểm như sau:

Số ngày nằm việnLoại bảo hiểm < 5 5 − 10 > 10

< 25% 40 75 6525%− 50% 30 45 75

> 50% 40 100 190

Tại mức ý nghĩa α = 5%, hãy kiểm định xem thời gian nằm viện và loại bảo hiểm có phụ thuộc vàonhau không?

11 Hồi qui tuyến tính

Bài 123 Để ước lượng giá bán của những chiếc ô tô cũ, người ta xây dựng mô hình hồi qui tuyến tínhcủa giá xe theo số km mà ô tô đã đi được. Bảng sau cho ta giá bán (đơn vị: 1000 euro) và số km (đơnvị 1000 km) của 15 chiếc BMW cũ tại thời điểm 08/11/2009:

P.T.Hồng, N.T.Nhung - Bộ môn Toán 27

Page 28: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Giá Số km Giá Số km Giá Số km31.0 24.0 21.0 52.0 11.0 150.012.5 115.0 18.5 75.0 13.0 156.015.5 80.0 8.6 126.0 11.0 124.06.7 195.0 9.0 138.0 9.0 180.030.0 53.0 18.0 70.0 8.0 143.0

(Dữ liệu có trong file GiaVaQuangDuong.xls)

a. Vẽ biểu đồ tán xạ giữa giá bán và số km đi được. Biểu đồ cho ta nhận xét gì?

b. Tính hệ số tương quan tuyến tính mẫu giữa giá bán và số km đi được. Hệ số tương quan tuyến tínhmẫu cho ta thông tin gì?

c. Giả sử phân phối xác suất đồng thời của giá bán và số km tuân theo phân phối chuẩn, tại mức ýnghĩa α = 5% hãy kiểm định xem có mối quan hệ tuyến tính âm giữa giá bán và số km đi đượchay không.

b. Tính hệ số tương quan thứ hạng spearman giữa giá bán và số km đi được. Hệ số tương quan thứhạng cho ta thông tin gì?

c. Giả sử phân phối xác suất đồng thời của giá bán và số km không tuân theo phân phối chuẩn, tạimức ý nghĩa α = 5% hãy kiểm định xem có mối quan hệ tuyến tính âm giữa giá bán và số kmđi được hay không.

Bài 124 Để xét xem lượng nước tiêu thụ trong một thành phố có thể được dự đoán theo nhiệt độ haykhông, người ta thu thập một mẫu gồm lượng nước tiêu thụ trong một ngày và nhiệt độ cao nhất tươngứng trong ngày đó ta được bảng dữ liệu sau:

Lượng nước dùng (triệu gallons) Nhiệt độ (độ F)219 10356 39107 77129 7868 50184 96150 90112 75

(Dữ liệu có trong file LuongNuocVaNhietDo.xls)Giả sử các giả thiết trong mô hình hồi qui tuyến tính đơn biến được thỏa mãn.

a. Tính hệ số tương quan tuyến tính giữa lượng nước và nhiệt độ cao nhất trong ngày và cho nhận xét.

b. Viết phương trình hồi qui tuyến tính tổng thể của lượng nước tiêu thụ (Y) trong ngày theo nhiệt độcao nhất (X). Nêu ý nghĩa các hệ số trong phương trình hồi qui.

c. Tìm phương trình hồi qui tuyến tính mẫu của lượng nước tiêu thụ trong ngày theo nhiệt độ cao nhấtcủa ngày đó. Hệ số độ dốc trong phương trình hồi qui cho ta thông tin gì?

P.T.Hồng, N.T.Nhung - Bộ môn Toán 28

Page 29: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

d. Tính hệ số xác định và cho nhận xét.

e. Biểu diễn các cặp điểm (x, y) và đường hồi qui mẫu trên cùng một hệ trục tọa độ. Những minh họahình học này phù hợp với những tính toán ở hai câu (a), (c), (d) như thế nào?

f. Tại mức ý nghĩa α = 5%, hãy xét xem nhiệt độ cao nhất trong ngày có là một yếu tố có ý nghĩacho lượng nước tiêu thụ trong ngày không?

g. Tìm khoảng tin cậy 95% cho hệ số độ dốc của phương trình hồi qui tổng thể và cho nhận xét.

h. Tìm một ước lượng điểm cho lượng nước trung bình trong ngày khi nhiệt độ cao nhất trong ngàylà X0.

i. Tìm khoảng tin cậy 90% cho giá trị trung bình của lượng nước tiêu thụ trong ngày E(Y |X0) khinhiệt độ trong ngày đó là X0 = 85. Theo bạn độ rộng của khoảng tin cậy này sẽ nhỏ nhất tạigiá trị X0 bằng bao nhiêu?

j. Tìm khoảng tin cậy 99% cho giá trị thật của lượng nước tiêu thụ trong ngày Y0, Y′0 khi nhiệt độ cao

nhất trong ngày là X0 = 90, X ′0 = 100. So sánh độ rộng của hai khoảng tin cậy này đưa ra lời

giải thích.

Bài 125 Để minh họa luật Galton về giả thuyết chiều cao của con trai đầu qui về chiều cao trung bìnhcủa dân chúng, nhà thống kê học người Anh Karl Pearson đã chọn ngẫu nhiên và đo chiều cao (đơnvị inches) của 10 cặp cha và con trai đầu thu được bảng dữ liệu như sau:

Chiều cao cha 60 62 64 65 66 67 68 70 72 74

Chiều cao con trai 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70

(Dữ liệu có trong file ChieuCaoChaVaCon.csv)Giả sử các giả thiết trong mô hình hồi qui tuyến tính đơn biến được thỏa mãn.

a. Tính hệ số tương quan tuyến tính mẫu giữa chiều cao của con trai và chiều cao của cha. Hệ sốtương quan này cho ta những thông tin gì?

b. Tìm phương trình hồi qui tuyến tính mẫu mô tả mối liên hệ giữa chiều cao của con trai đầu theochiều cao của cha. Giải thích ý nghĩa của các hệ số trong phương trình.

c. Tính hệ số xác định và cho nhận xét.

d. Vẽ biểu đồ tán xạ và đường hồi qui tuyến tính mẫu mô tả chiều cao của con trai đầu theo chiều caocủa cha trên cùng một biểu đồ và cho nhận xét.

e. Tìm khoảng tin cậy 95% cho hệ số độ dốc của phương trình hồi qui. Khoảng tin cậy này cho tanhận xét gì?

f. Nếu một người có chiều cao là 70 thì con trai anh ta sẽ cao khoảng bao nhiêu?

g. Tìm khoảng tin cậy 98% cho chiều cao trung bình của những người con trai khi chiều cao của chalà 68.

P.T.Hồng, N.T.Nhung - Bộ môn Toán 29

Page 30: Bai tapxstk tonghop

Bài tập xác suất thống kê và Ứng dụng

Bài 126 Bộ Nông nghiệp hàng năm công bố dữ liệu về sản lượng của nhiều loại nông sản khác nhau.Bảng dữ liệu dưới đây cho ta những sản lượng (triệu tấn) của ba loại nông sản là ngô, đậu tương vàlúa mì trong 7 năm:

Ngô Đậu tương Lúa mì4152 1127 13526639 1798 23814175 1639 24207672 1861 25958876 2099 24248226 1940 20917131 1938 2108

(Dữ liệu có trong file SanLuong.xls)Giả sử các giả thiết trong mô hình hồi qui tuyến tính đa biến được thỏa mãn.

a. Lập phương trình hồi qui tuyến tính mẫu của sản lượng ngô theo sản lượng đậu tương và lúa mì.Giải thích ý nghĩa của các hệ số trong mô hình.

b. Tính hệ số xác định bội, hệ số xác định hiệu chỉnh và cho nhận xét.

c. Bằng cách kiểm định các hệ số của phương trình hồi qui tổng thể bằng không một cách thích hợp,hãy xét xem sản lượng ngô có được giải thích một cách có ý nghĩa qua sản lượng đậu tương vàlúa mì hay không?

d. Tìm khoảng tin cậy 90% cho sản lượng ngô và sản lượng ngô trung bình khi sản lượng đậu tươnglà 1535 và sản lượng lúa mì là 2205. So sánh độ rộng của hai khoảng tin cậy này.

P.T.Hồng, N.T.Nhung - Bộ môn Toán 30