chuong 5 thong ke mo ta · 5, 4 ²4 7k kl q y skkq wiq f gd g o ol x _ jl od f gd gm\ v q %l Çx...

32
THNG KÊ MÔ T

Upload: others

Post on 01-Nov-2019

1 views

Category:

Documents


0 download

TRANSCRIPT

THỐNG KÊ MÔ TẢ

Khuynh hướng tập trung (hội tụ)Trung bình Trung vò

ModeTứ phân vị

Trung bình hình hoïc

Tóm tắt dữ liệu

Độ phân tán

Phương sai

Độ lệch tiêu chuẩn

Hệ số biến thiênKhoảng biến thiên

Nội dung

Tham số tổng thểN, μ, σ2 , σThống kê mẫun, , S2 , Sx

Khuynh hướng tập trung

Trung bìnhsố học Trung vị Mode

Trung bình hình học1

1

ni

i

Ni

i

XX n

XN

n nxxxxGM ...321

Đặc trưng đo lường khuynh hướng tập trung

1. Trung bình mẫu Tính từ dữ liệu gốc

Trong đó: : trung bình mẫu xi : giá trị của quan sát thứ i n : kích thước mẫu

nx

xn

ii 1

x

Trung bình số học (Mean)

Ví dụ1. Tính trung bình cho dãy số sau3 8 3 7 4 6 4 6 4 5 52. Năng suất lao động của 10 công nhân

trong một ngày làm việc (đơn vị tínhkg/công nhân)

7.1; 6.6; 7.5; 7.2; 5.8; 7.1; 7.8; 6.6; 7.1; 7.2

Ví dụ Cho năng suất (tạ/ha) của 1 loại cây trồng tại

40 nơi thu hoạch. Tính năng suất trung bình153 154 156 157 158 159 159 160 160 160161 161 161 162 162 162 163 163 163 164164 164 165 165 166 166 167 167 168 168170 171 172 173 174 175 176 177 178 179

0 1 2 3 4 5 6 7 8 9 10 12 14 Trung bình = 5 Trung bình = 6

0 1 2 3 4 5 6 7 8 9 10

Trung bình số học chịu ảnh hưởng bởi các giá trị đột biến (outliers)

Trung bình số học

Là giá trị đứng ở vị trí giữa trong một dãysố đã được sắp xếp có thứ tự. Trước vàsau trị số trung vị sẽ có 50% quan sát. Ký hiệu: Me

Số trung vị (Median)

2122

nne

xxM

Định nghĩa 1. Dữ liệu mẫu n lẻ.

n chẵn.

Me=X(n+1)/2

Số trung vị (Median)

Ví dụ1. Tìm trung vị cho dãy số sau

3 8 3 7 4 6 4 6 4 5 5Sắp xếp theo thứ tự

3 3 4 4 4 5 5 6 6 7 8 => Me = 52. Năng suất lao động của 10 công nhân

trong một ngày làm việc (đơn vị tínhkg/công nhân). Tìm trung vị

7.1; 6.6; 7.5; 7.2; 5.8; 7.1; 7.8; 6.6; 7.1; 7.2

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Me = 5 Me = 5

Số trung vị không chịu ảnh hưởng bởi các giá trị đột biến (outliers)

Đặc điểm của số trung vị

• Đo lường khuynh hướng tập trung• Mode là giá trị có tần số lớn nhất• Mode không chịu ảnh hưởng bởi các giátrị đột biến• Một dãy số có thể có nhiều Mode• Một dãy số có thể không có Mode• Mode có thể xác định cho dữ liệu địnhtính• Ký hiệu: Mo

Mốt (Mode)

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Mode có hai trịsố: 9 và 12

0 1 2 3 4 5 6

Không có Mode

Mốt (Mode)

Tác dụng của MốtMo được dùng để nghiên cứu nhu cầu thị trườngvề kích cỡ sản phẩm. Ví dụ: Cửa hàng giày datrong tháng 9 đã bán được

Cỡ giày Lượng bán ra (đôi) 38 100040 500041 150043 500

Cộng 8000

Biến thiên

Phương sai Độ lệch chuẩn Hệ số biến thiên

Khoảngbiến thiên

Đo lường độ phân tán

Khoảng biến thiên (Range)Dữ liệu mẫu và Tổng thể

minmax xxR

Đo lường độ phân tán

Tứ phân vị (Quartiles)

Tứ phân vị đầu:

Tứ phân vị thứ 2:

Tứ phân vị thứ 3:

Q1=X(n+1)/4Q2=Me

Q3=X3(n+1)/4

Dữ liệu mẫu

Độ trải giữaRI = Q3 – Q1

Thể hiện độ phân tán của 50% dữ liệu ở giữa của dãy số

Biểu đồ hộp

Ví dụCho dãy số 6, 47, 49, 15, 42, 41, 7, 39, 43, 40,

361. Tìm khoảng biến thiên2. Tìm các tứ phân vị Q1, Q2, Q33. Tính độ trải giữa4. Vẽ biểu đồ hộp

Phương sai và độ lệch tiêu chuẩnPhương sai mẫu (Sample variance)

1)(

12

2

nxx

sn

ii

Độ lệch tiêu chuẩn (Standard Deviation) Là căn bậc 2 của phương sai.

1)(

12

n

xxs

n

ii

Ví dụTỷ lệ lãi trên vốn (%) của 2 ngành kinh

doanh như sau Ngành A: 10.5; 9; 12; 10; 8.5; 12.5; 9.5 Ngành B: 7; 11;14;10; 17; 9; 9Tỷ lệ lãi trên vốn của hai ngành có ổn định

giống nhau không biết trung bình lãi trênvốn của ngành A và ngành B là 11%?

ĐápTính độ lệch chuẩn

Độ lệch chuẩn tỷ lệ lãi ngành BTỷ lệ lãi trên

vốn (xi - Trung bình) |xi - Trung bình|^27 -4 1611 0 014 3 910 -1 117 6 369 -2 49 -2 4

trung bình = 11Tổng 70Phương sai 11.67Độ lệch chuẩn 3.41

Ví dụ độ lệch tuyệt đối trung bình ngành A là 1.68% độ lệch tuyệt đối trung bình ngành B là 3.41%. Công ty nào có tỷ lệ lãi trên vốn ổn định

hơn?

Phương sai tổng thể (Population variance)

Độ lệch tiêu chuẩn

NxN

ii

x

2

12

2xx

Trung bình = 15.5s = 3.33811 12 13 14 15 16 17 18 19 20 21

11 12 13 14 15 16 17 18 19 20 21Döõ lieäu B

Döõ lieäu A

Trung bình = 15.5s = .9258

11 12 13 14 15 16 17 18 19 20 21Trung bình = 15.5s = 4.57

Döõ lieäu C

So sánh 3 tập dữ liệu

Ví dụ: 1 công ty đang lựa chọn dựán

Dự án A Dự án B (a)Giá trị kỳ vọng 36,000 50,000 (b) Độ lệch tiêu chuẩn 27,000 32,000

Hệ số biến thiên (Coefficient of Variation): đo lường độ phân tán tương đối của dãysố

Dữ liệu mẫu

Tổng thể

%100xsCV

%100.CV

Ví dụ: 1 công ty đang lựa chọn dựán

Dự án A Dự án B (a)Giá trị kỳ vọng 36,000 50,000 (b) Độ lệch tiêu chuẩn 27,000 32,000 (c) Hệ số biến thiên 0.75 0.64