[mpkd2] xác suất và thống kê trong mô phỏng

35
XÁC SUẤT VÀ THỐNG KÊ TRONG MÔ PHỎNG

Upload: nguyen-ngoc-binh-phuong

Post on 16-Apr-2017

1.725 views

Category:

Business


1 download

TRANSCRIPT

Page 1: [MPKD2] Xác suất và thống kê trong mô phỏng

XÁC SUẤT VÀ THỐNG KÊT R O N G M Ô P H Ỏ N G

Page 2: [MPKD2] Xác suất và thống kê trong mô phỏng

NỘI DUNG

Phân phối xác suất của biến ngẫu nhiên

Một số phân phối thông dụng

Liên tục

Rời rạc

Chọn phân phối phù hợp

2

Page 3: [MPKD2] Xác suất và thống kê trong mô phỏng

Phân phối xác suất

Biến ngẫu nhiên rời rạc (discrete random variable)Giá trị của biến có thể lập thành dãy rời rạc các số

Hàm khối xác suất (Probability Mass Function)

p(x)

Hàm xác suất tích lũy (Cumulative Probability Function)

P(x)

Biến ngẫu nhiên liên tục (continuous random variable)Giá trị của biến có thể lấp đầy một khoảng hay tập các khoảng

Hàm mật độ xác suất (Probability Density Function)

f(x)

Hàm phân phối tích lũy (Cumulative Distribution Function)

F(x)

3

Page 4: [MPKD2] Xác suất và thống kê trong mô phỏng

Tổng tất cả các giá trị này phải bằng 1

Hàm khối xác suất của biến nhẫu nhiên rời rạc

p(x0) là xác suất để biến X có giá trị x0

0 p(xi) 1 và p(xi) = 1

3 4 5 6 7Parameter Value

0.00

0.10

0.20

0.30

0.40

0.50

Pro

bab

ilit

y

4

Page 5: [MPKD2] Xác suất và thống kê trong mô phỏng

2 3 4 5 6 7 8Parameter Value

0.00

0.20

0.40

0.60

0.80

1.00

Pr o

bab

ilit

yo

fV

al u

e<

=X

Ax

isV

al u

e

Hàm xác suất tích lũy của biến ngẫu nhiên rời rạc

P(x0) là xác suất để biến X có giá trị x0

P(x0) = p(x) với x x0

0 P(xi) 1

x1 < x2 P(x1) P(x2)

5

Page 6: [MPKD2] Xác suất và thống kê trong mô phỏng

0.0 10.0 20.0 30.0 40.0Parameter Value

0.00

0.04

0.08

0.12

0.16P

rob

ab

ilit

yHàm mật độ xác suất của biến ngẫu nhiên liên tục

f(x) có các đặc tính sau:

( ) 1f x dx

( ) 0 f x x

b

a

( ) ( )P a X b f x dx

6

Page 7: [MPKD2] Xác suất và thống kê trong mô phỏng

0.0 10.0 20.0 30.0 40.0Parameter Value

0.00

0.20

0.40

0.60

0.80

1.00P

rob

ab

ilit

y o

f V

alu

e <

= X

Ax

is V

alu

e

Hàm phân phối tích lũy của biến ngẫu nhiên liên tục

F(x) là xác suất để biến X có giá trị x

( ) ( )x

F x f x dx

0 ( ) 1F x

( ) ( ) ( )P a X b F b F a

F(x) là hàm không giảm

7

Page 8: [MPKD2] Xác suất và thống kê trong mô phỏng

8

Page 9: [MPKD2] Xác suất và thống kê trong mô phỏng

Một số phân phối thông dụng

Phân phối liên tục (Continuous)

Phân phối đều (Uniform)

Phân phối chuẩn (Normal)

Phân phối tam giác (Triangular)

Phân phối mũ (Exponential)

Phân phối rời rạc (Discrete)

Phân phối Yes-No (Bernoulli)

Phân phối đều rời rạc (Discrete Uniform)

Phân phối nhị thức (Binominal)

Phân phối Poisson

Phân phối hình học (Geometric)

Phân phối siêu bội (Hypergeometric)

9

Page 10: [MPKD2] Xác suất và thống kê trong mô phỏng

Phân phối đều (Uniform)

Tất cả các giá trị trong khoảng từ giá trị nhỏ

nhất tới giá trị lớn nhất đều xuất hiện với một

khả năng như nhau. Ví dụ: Giá bất động sản

Điều kiện

Giá trị nhỏ nhất (min) cố định

Giá trị lớn nhất (max) cố định

Mọi giá trị trong khoảng [min,max] đều có khả

năng xuất hiện như nhau

10

Page 11: [MPKD2] Xác suất và thống kê trong mô phỏng

Mọi giá trị trong khoảng [500$,900$] đều có

khả năng xuất hiện như nhau

11

Page 12: [MPKD2] Xác suất và thống kê trong mô phỏng

Phân phối chuẩn (Normal)

Mô tả nhiều hiện tượng tự nhiên như chỉ số IQ,

chiều cao con người, tỉ lệ lạm phát, sai số đo,…

Điều kiện

Một giá trị nào đó của biến có khả năng xuất

hiện nhiều (trung bình của phân phối)

Biến có thể lấy giá trị ở trên hay dưới giá trị trung

bình với khả năng như nhau (đối xứng qua trị

trung bình)

Biến thường lấy giá trị xung quanh giá trị trung

bình

12

Page 13: [MPKD2] Xác suất và thống kê trong mô phỏng

Tỉ lệ lạm phát trung bình là 4%, có

thể cao hơn hoặc thấp hơn 4%. Có

khoảng 68% cơ hội mà tỉ lệ lạm

phát sẽ nằm trong khoảng lệch 2%

so với mức trung bình 4%

13

Page 14: [MPKD2] Xác suất và thống kê trong mô phỏng

Phân phối tam giác (Triangular)

Mô tả một trạng thái mà ở đó biết được giá trị nhỏ nhất và lớn nhất và các giá trị xuất hiện thường xuyên nhất. Ví dụ:

Số xe hơi bán được trong 1 tuần

Chi phí tiếp thị

Lượng tồn kho

Điều kiện

Giá trị nhỏ nhất (min) cố định

Giá trị lớn nhất (max) cố định

Giá trị thường xảy ra nhất nằm giữa min và max tạo thành dạng tam giác cho thấy các giá trị của biến thường xảy ra ở gần mode hơn là ở hai đầu

14

Page 15: [MPKD2] Xác suất và thống kê trong mô phỏng

Tồn kho lý tưởng là 25

hạng mục

15

Page 16: [MPKD2] Xác suất và thống kê trong mô phỏng

Phân phối mũ (Exponential)

Mô tả lượng thời gian giữa các sự kiện. Ví dụ:

Thời gian giữa các lần hư hỏng của thiết bị điện tử

Thời gian giữa các chuyến hàng tại một trạm dịch vụ

Thời gian giữa các lần khách hàng ghé nơi giao dịch

Điều kiện

Mô tả khoảng thời gian giữa các biến cố

Những gì xảy ra trong quá khứ không ảnh

hưởng đến hiện tại

16

Page 17: [MPKD2] Xác suất và thống kê trong mô phỏng

17

Số cuộc gọi trung bình trong vòng 10 phút

Page 18: [MPKD2] Xác suất và thống kê trong mô phỏng

Phân phối Yes-No (Bernoulli)

Mô tả một tập các quan sát chỉ nhận một trong

hai giá trị. Ví dụ:

Yes/no

Thành công/thất bại

Đúng/sai

Sấp/ngửa

Điều kiện

Biến ngẫu nhiên chỉ nhận một trong hai giá trị: 0

hoặc 1.

Cơ hội của 1 bằng p, cơ hội của 0 bằng 1-p.

18

Page 19: [MPKD2] Xác suất và thống kê trong mô phỏng

Phân phối đều rời rạc (Discrete Uniform)

Tất cả các giá trị nguyên nằm giữa giá trị nhỏ

nhất và lớn nhất có khả năng xuất hiện như

nhau. Ví dụ: Số nút khi tung 1 con xúc sắc

Điều kiện

Giá trị nhỏ nhất (min) cố định.

Giá trị lớn nhất (max) cố định.

Tất cả các giá trị nguyên nằm giữa giá trị min và

max có khả năng xuất hiện như nhau.

19

Page 20: [MPKD2] Xác suất và thống kê trong mô phỏng

Phân phối nhị thức (Binominal)

Mô tả số lần xuất hiện của một biến cố cụ thể

trong một số lần thử nhất định. Ví dụ:

Số mặt ngửa trong 10 lần tung đồng tiền

Số hạng mục bị hư trong 50 hạng mục

Điều kiện

Mỗi lần thử chỉ có thể xảy ra hai kết quả

Kết quả của các lần thử là độc lập

Xác suất để một biến cố xảy ra sẽ không thay đổi

từ lần thử này đến lần thử khác

20

Page 21: [MPKD2] Xác suất và thống kê trong mô phỏng

Điều tra 100 khách

hàng và 60% trong số

này chuộng sản phẩm

công ty hơn sản phẩm

của đối thủ

21

Page 22: [MPKD2] Xác suất và thống kê trong mô phỏng

Phân phối Poisson

Mô tả số lần một biến cố xuất hiện trong một khoảng đã cho. Ví dụ: Số cuộc điện thoại trong một phút

Số lỗi trong một trang văn bản

Số sản phẩm khuyết tật trong một đơn vị diện tích

Điều kiện Số biến cố có thể xảy ra với bất kỳ một đơn vị tính

nào không bị giới hạn là số cố định

Các biến cố độc lập nhau. Số biến cố trong một đơn vị tính này không ảnh hưởng đến số biến cố trong các đơn vị khác

Số trung bình của các biến cố là không đổi từ đơn vị tính này đến đơn vị khác

22

Page 23: [MPKD2] Xác suất và thống kê trong mô phỏng

Số cuộc gọi trung bình trong vòng 10 phút

23

Page 24: [MPKD2] Xác suất và thống kê trong mô phỏng

Phân phối hình học (Geometric)

Mô tả số lần thử cho đến biến cố thành công

đầu tiên. Ví dụ:

Số lần quay kẹo kéo trước khi thắng kẹo

Số lần khoan trước khi tìm được giếng dầu

Điều kiện

Số lần thử là không cố định

Tiếp tục thử cho đến thành công đầu tiên

Xác suất thành công là như nhau qua các lần thử

24

Page 25: [MPKD2] Xác suất và thống kê trong mô phỏng

Xác suất khoan trúng dầu là 10%

25

Page 26: [MPKD2] Xác suất và thống kê trong mô phỏng

Phân phối siêu bội (Hypergeometric)

Tương tự như phân phối nhị thức, cả hai đều mô tả số

lần thành công trong một số lần thử cố định. Tuy nhiên,

các lần thử của phân phối nhị thức là độc lập, trong khi

các lần thử của phân phối siêu bội thay đổi xác suất cho

mỗi lần thử kế tiếp và các lần thử không thay thế cho

nhau.

Điều kiện

Tổng số phần tử (kích thước tổng thể) là một số cố định

(hữu hạn)

Kích thước mẫu (số lần thử) đại diện cho một phần của

tổng thể

Xác suất thành công đã biết ban đầu trong tổng thể sẽ

thay đổi một chút sau mỗi lần thử

26

Page 27: [MPKD2] Xác suất và thống kê trong mô phỏng

Có 30 khách hàng

chuộng sản phẩm X

trong tổng số 40

khách hàng điều tra

20 người trong số 40

người này tỉ lệ

30/40 thay đổi mỗi lần

hỏi một người (phụ

thuộc vào sự ưa

chuộng của khách

hàng trước đó)

27

Page 28: [MPKD2] Xác suất và thống kê trong mô phỏng

Buộc thẻ 100 con ngựa

trong tổng số 1000

con tìm những con

ngựa được buộc thẻ

trong mẫu 200 con

28

Page 29: [MPKD2] Xác suất và thống kê trong mô phỏng

Tìm phân phối phù hợp

Các bước theo lý thuyết:

Xây dựng biểu đồ tần suất từ dữ liệu

Chọn phân phối xác suất có hình dáng hàm mật độ xác suất giống

với biểu đồ tần suất nhất

Ước lượng các tham số của phân phối xác suất

Kiểm định Goodness-of-Fit (Thích hợp tốt)

• Chi-Square (>0.5)

• Kolmogorov-Smirnov (<0.03)

• Anderson-Darling (<1.5)

Sử dụng công cụ cho nhanh: Crystal Ball, @RISK, EasyFit,…

Bài tập: Tìm phân phối xác suất phù hợp với dữ liệu trong file

C:\Program Files\Oracle\Crystal Ball\Examples\TESTDATA.txt

29

Page 30: [MPKD2] Xác suất và thống kê trong mô phỏng

Tìm phân phối phù hợp

30

Lập bảng và vẽ biểu đồ tần số:

Data > Analysis >

Data Analysis > Histogram

Page 31: [MPKD2] Xác suất và thống kê trong mô phỏng

Tìm phân phối phù hợp

31

Lập bảng tần số:

=FREQUENCY(data,bins)

Giới

hạn

trên

Page 32: [MPKD2] Xác suất và thống kê trong mô phỏng

Tìm phân phối phù hợp

32

Lập bảng và vẽ biểu đồ tần số:

Insert > Tables > Pivot Table

Page 33: [MPKD2] Xác suất và thống kê trong mô phỏng

33

Page 34: [MPKD2] Xác suất và thống kê trong mô phỏng

Tìm phân phối phù hợp

Không có dữ liệu quá khứ

Kinh nghiệm, ý kiến chuyên gia. Ví dụ:

Phân phối Poisson thường được sử dụng để mô

tả các sự kiện độc lập xảy ra với cường độ là hằng

số. Ví dụ: Sinh viên đến trạm xe buýt với cường

độ 0.8 sinh viên/phút

Phân phối mũ thường được sử dụng để mô tả

thời gian phục vụ.

Biết cận trên và cận dưới [a,b] phân phối đều

Biết cận trên và cận dưới [a,b], một số c[a,b] có

khả năng xuất hiện cao phân phối tam giác

34

Page 35: [MPKD2] Xác suất và thống kê trong mô phỏng

-HẾT-