[mpkd2] xác suất và thống kê trong mô phỏng
TRANSCRIPT
XÁC SUẤT VÀ THỐNG KÊT R O N G M Ô P H Ỏ N G
NỘI DUNG
Phân phối xác suất của biến ngẫu nhiên
Một số phân phối thông dụng
Liên tục
Rời rạc
Chọn phân phối phù hợp
2
Phân phối xác suất
Biến ngẫu nhiên rời rạc (discrete random variable)Giá trị của biến có thể lập thành dãy rời rạc các số
Hàm khối xác suất (Probability Mass Function)
p(x)
Hàm xác suất tích lũy (Cumulative Probability Function)
P(x)
Biến ngẫu nhiên liên tục (continuous random variable)Giá trị của biến có thể lấp đầy một khoảng hay tập các khoảng
Hàm mật độ xác suất (Probability Density Function)
f(x)
Hàm phân phối tích lũy (Cumulative Distribution Function)
F(x)
3
Tổng tất cả các giá trị này phải bằng 1
Hàm khối xác suất của biến nhẫu nhiên rời rạc
p(x0) là xác suất để biến X có giá trị x0
0 p(xi) 1 và p(xi) = 1
3 4 5 6 7Parameter Value
0.00
0.10
0.20
0.30
0.40
0.50
Pro
bab
ilit
y
4
2 3 4 5 6 7 8Parameter Value
0.00
0.20
0.40
0.60
0.80
1.00
Pr o
bab
ilit
yo
fV
al u
e<
=X
Ax
isV
al u
e
Hàm xác suất tích lũy của biến ngẫu nhiên rời rạc
P(x0) là xác suất để biến X có giá trị x0
P(x0) = p(x) với x x0
0 P(xi) 1
x1 < x2 P(x1) P(x2)
5
0.0 10.0 20.0 30.0 40.0Parameter Value
0.00
0.04
0.08
0.12
0.16P
rob
ab
ilit
yHàm mật độ xác suất của biến ngẫu nhiên liên tục
f(x) có các đặc tính sau:
( ) 1f x dx
( ) 0 f x x
b
a
( ) ( )P a X b f x dx
6
0.0 10.0 20.0 30.0 40.0Parameter Value
0.00
0.20
0.40
0.60
0.80
1.00P
rob
ab
ilit
y o
f V
alu
e <
= X
Ax
is V
alu
e
Hàm phân phối tích lũy của biến ngẫu nhiên liên tục
F(x) là xác suất để biến X có giá trị x
( ) ( )x
F x f x dx
0 ( ) 1F x
( ) ( ) ( )P a X b F b F a
F(x) là hàm không giảm
7
8
Một số phân phối thông dụng
Phân phối liên tục (Continuous)
Phân phối đều (Uniform)
Phân phối chuẩn (Normal)
Phân phối tam giác (Triangular)
Phân phối mũ (Exponential)
Phân phối rời rạc (Discrete)
Phân phối Yes-No (Bernoulli)
Phân phối đều rời rạc (Discrete Uniform)
Phân phối nhị thức (Binominal)
Phân phối Poisson
Phân phối hình học (Geometric)
Phân phối siêu bội (Hypergeometric)
9
Phân phối đều (Uniform)
Tất cả các giá trị trong khoảng từ giá trị nhỏ
nhất tới giá trị lớn nhất đều xuất hiện với một
khả năng như nhau. Ví dụ: Giá bất động sản
Điều kiện
Giá trị nhỏ nhất (min) cố định
Giá trị lớn nhất (max) cố định
Mọi giá trị trong khoảng [min,max] đều có khả
năng xuất hiện như nhau
10
Mọi giá trị trong khoảng [500$,900$] đều có
khả năng xuất hiện như nhau
11
Phân phối chuẩn (Normal)
Mô tả nhiều hiện tượng tự nhiên như chỉ số IQ,
chiều cao con người, tỉ lệ lạm phát, sai số đo,…
Điều kiện
Một giá trị nào đó của biến có khả năng xuất
hiện nhiều (trung bình của phân phối)
Biến có thể lấy giá trị ở trên hay dưới giá trị trung
bình với khả năng như nhau (đối xứng qua trị
trung bình)
Biến thường lấy giá trị xung quanh giá trị trung
bình
12
Tỉ lệ lạm phát trung bình là 4%, có
thể cao hơn hoặc thấp hơn 4%. Có
khoảng 68% cơ hội mà tỉ lệ lạm
phát sẽ nằm trong khoảng lệch 2%
so với mức trung bình 4%
13
Phân phối tam giác (Triangular)
Mô tả một trạng thái mà ở đó biết được giá trị nhỏ nhất và lớn nhất và các giá trị xuất hiện thường xuyên nhất. Ví dụ:
Số xe hơi bán được trong 1 tuần
Chi phí tiếp thị
Lượng tồn kho
Điều kiện
Giá trị nhỏ nhất (min) cố định
Giá trị lớn nhất (max) cố định
Giá trị thường xảy ra nhất nằm giữa min và max tạo thành dạng tam giác cho thấy các giá trị của biến thường xảy ra ở gần mode hơn là ở hai đầu
14
Tồn kho lý tưởng là 25
hạng mục
15
Phân phối mũ (Exponential)
Mô tả lượng thời gian giữa các sự kiện. Ví dụ:
Thời gian giữa các lần hư hỏng của thiết bị điện tử
Thời gian giữa các chuyến hàng tại một trạm dịch vụ
Thời gian giữa các lần khách hàng ghé nơi giao dịch
Điều kiện
Mô tả khoảng thời gian giữa các biến cố
Những gì xảy ra trong quá khứ không ảnh
hưởng đến hiện tại
16
17
Số cuộc gọi trung bình trong vòng 10 phút
Phân phối Yes-No (Bernoulli)
Mô tả một tập các quan sát chỉ nhận một trong
hai giá trị. Ví dụ:
Yes/no
Thành công/thất bại
Đúng/sai
Sấp/ngửa
Điều kiện
Biến ngẫu nhiên chỉ nhận một trong hai giá trị: 0
hoặc 1.
Cơ hội của 1 bằng p, cơ hội của 0 bằng 1-p.
18
Phân phối đều rời rạc (Discrete Uniform)
Tất cả các giá trị nguyên nằm giữa giá trị nhỏ
nhất và lớn nhất có khả năng xuất hiện như
nhau. Ví dụ: Số nút khi tung 1 con xúc sắc
Điều kiện
Giá trị nhỏ nhất (min) cố định.
Giá trị lớn nhất (max) cố định.
Tất cả các giá trị nguyên nằm giữa giá trị min và
max có khả năng xuất hiện như nhau.
19
Phân phối nhị thức (Binominal)
Mô tả số lần xuất hiện của một biến cố cụ thể
trong một số lần thử nhất định. Ví dụ:
Số mặt ngửa trong 10 lần tung đồng tiền
Số hạng mục bị hư trong 50 hạng mục
Điều kiện
Mỗi lần thử chỉ có thể xảy ra hai kết quả
Kết quả của các lần thử là độc lập
Xác suất để một biến cố xảy ra sẽ không thay đổi
từ lần thử này đến lần thử khác
20
Điều tra 100 khách
hàng và 60% trong số
này chuộng sản phẩm
công ty hơn sản phẩm
của đối thủ
21
Phân phối Poisson
Mô tả số lần một biến cố xuất hiện trong một khoảng đã cho. Ví dụ: Số cuộc điện thoại trong một phút
Số lỗi trong một trang văn bản
Số sản phẩm khuyết tật trong một đơn vị diện tích
Điều kiện Số biến cố có thể xảy ra với bất kỳ một đơn vị tính
nào không bị giới hạn là số cố định
Các biến cố độc lập nhau. Số biến cố trong một đơn vị tính này không ảnh hưởng đến số biến cố trong các đơn vị khác
Số trung bình của các biến cố là không đổi từ đơn vị tính này đến đơn vị khác
22
Số cuộc gọi trung bình trong vòng 10 phút
23
Phân phối hình học (Geometric)
Mô tả số lần thử cho đến biến cố thành công
đầu tiên. Ví dụ:
Số lần quay kẹo kéo trước khi thắng kẹo
Số lần khoan trước khi tìm được giếng dầu
Điều kiện
Số lần thử là không cố định
Tiếp tục thử cho đến thành công đầu tiên
Xác suất thành công là như nhau qua các lần thử
24
Xác suất khoan trúng dầu là 10%
25
Phân phối siêu bội (Hypergeometric)
Tương tự như phân phối nhị thức, cả hai đều mô tả số
lần thành công trong một số lần thử cố định. Tuy nhiên,
các lần thử của phân phối nhị thức là độc lập, trong khi
các lần thử của phân phối siêu bội thay đổi xác suất cho
mỗi lần thử kế tiếp và các lần thử không thay thế cho
nhau.
Điều kiện
Tổng số phần tử (kích thước tổng thể) là một số cố định
(hữu hạn)
Kích thước mẫu (số lần thử) đại diện cho một phần của
tổng thể
Xác suất thành công đã biết ban đầu trong tổng thể sẽ
thay đổi một chút sau mỗi lần thử
26
Có 30 khách hàng
chuộng sản phẩm X
trong tổng số 40
khách hàng điều tra
20 người trong số 40
người này tỉ lệ
30/40 thay đổi mỗi lần
hỏi một người (phụ
thuộc vào sự ưa
chuộng của khách
hàng trước đó)
27
Buộc thẻ 100 con ngựa
trong tổng số 1000
con tìm những con
ngựa được buộc thẻ
trong mẫu 200 con
28
Tìm phân phối phù hợp
Các bước theo lý thuyết:
Xây dựng biểu đồ tần suất từ dữ liệu
Chọn phân phối xác suất có hình dáng hàm mật độ xác suất giống
với biểu đồ tần suất nhất
Ước lượng các tham số của phân phối xác suất
Kiểm định Goodness-of-Fit (Thích hợp tốt)
• Chi-Square (>0.5)
• Kolmogorov-Smirnov (<0.03)
• Anderson-Darling (<1.5)
Sử dụng công cụ cho nhanh: Crystal Ball, @RISK, EasyFit,…
Bài tập: Tìm phân phối xác suất phù hợp với dữ liệu trong file
C:\Program Files\Oracle\Crystal Ball\Examples\TESTDATA.txt
29
Tìm phân phối phù hợp
30
Lập bảng và vẽ biểu đồ tần số:
Data > Analysis >
Data Analysis > Histogram
Tìm phân phối phù hợp
31
Lập bảng tần số:
=FREQUENCY(data,bins)
Giới
hạn
trên
Tìm phân phối phù hợp
32
Lập bảng và vẽ biểu đồ tần số:
Insert > Tables > Pivot Table
33
Tìm phân phối phù hợp
Không có dữ liệu quá khứ
Kinh nghiệm, ý kiến chuyên gia. Ví dụ:
Phân phối Poisson thường được sử dụng để mô
tả các sự kiện độc lập xảy ra với cường độ là hằng
số. Ví dụ: Sinh viên đến trạm xe buýt với cường
độ 0.8 sinh viên/phút
Phân phối mũ thường được sử dụng để mô tả
thời gian phục vụ.
Biết cận trên và cận dưới [a,b] phân phối đều
Biết cận trên và cận dưới [a,b], một số c[a,b] có
khả năng xuất hiện cao phân phối tam giác
…
34
-HẾT-