chuong 5 thong ke mo ta · 5, 4 ²4 7k kl q y skkq wiq f gd g o ol x _ jl od f gd gm\ v q %l Çx...
TRANSCRIPT
Khuynh hướng tập trung (hội tụ)Trung bình Trung vò
ModeTứ phân vị
Trung bình hình hoïc
Tóm tắt dữ liệu
Độ phân tán
Phương sai
Độ lệch tiêu chuẩn
Hệ số biến thiênKhoảng biến thiên
Nội dung
Khuynh hướng tập trung
Trung bìnhsố học Trung vị Mode
Trung bình hình học1
1
ni
i
Ni
i
XX n
XN
n nxxxxGM ...321
Đặc trưng đo lường khuynh hướng tập trung
1. Trung bình mẫu Tính từ dữ liệu gốc
Trong đó: : trung bình mẫu xi : giá trị của quan sát thứ i n : kích thước mẫu
nx
xn
ii 1
x
Trung bình số học (Mean)
Ví dụ1. Tính trung bình cho dãy số sau3 8 3 7 4 6 4 6 4 5 52. Năng suất lao động của 10 công nhân
trong một ngày làm việc (đơn vị tínhkg/công nhân)
7.1; 6.6; 7.5; 7.2; 5.8; 7.1; 7.8; 6.6; 7.1; 7.2
Ví dụ Cho năng suất (tạ/ha) của 1 loại cây trồng tại
40 nơi thu hoạch. Tính năng suất trung bình153 154 156 157 158 159 159 160 160 160161 161 161 162 162 162 163 163 163 164164 164 165 165 166 166 167 167 168 168170 171 172 173 174 175 176 177 178 179
0 1 2 3 4 5 6 7 8 9 10 12 14 Trung bình = 5 Trung bình = 6
0 1 2 3 4 5 6 7 8 9 10
Trung bình số học chịu ảnh hưởng bởi các giá trị đột biến (outliers)
Trung bình số học
Là giá trị đứng ở vị trí giữa trong một dãysố đã được sắp xếp có thứ tự. Trước vàsau trị số trung vị sẽ có 50% quan sát. Ký hiệu: Me
Số trung vị (Median)
Ví dụ1. Tìm trung vị cho dãy số sau
3 8 3 7 4 6 4 6 4 5 5Sắp xếp theo thứ tự
3 3 4 4 4 5 5 6 6 7 8 => Me = 52. Năng suất lao động của 10 công nhân
trong một ngày làm việc (đơn vị tínhkg/công nhân). Tìm trung vị
7.1; 6.6; 7.5; 7.2; 5.8; 7.1; 7.8; 6.6; 7.1; 7.2
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Me = 5 Me = 5
Số trung vị không chịu ảnh hưởng bởi các giá trị đột biến (outliers)
Đặc điểm của số trung vị
• Đo lường khuynh hướng tập trung• Mode là giá trị có tần số lớn nhất• Mode không chịu ảnh hưởng bởi các giátrị đột biến• Một dãy số có thể có nhiều Mode• Một dãy số có thể không có Mode• Mode có thể xác định cho dữ liệu địnhtính• Ký hiệu: Mo
Mốt (Mode)
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Mode có hai trịsố: 9 và 12
0 1 2 3 4 5 6
Không có Mode
Mốt (Mode)
Tác dụng của MốtMo được dùng để nghiên cứu nhu cầu thị trườngvề kích cỡ sản phẩm. Ví dụ: Cửa hàng giày datrong tháng 9 đã bán được
Cỡ giày Lượng bán ra (đôi) 38 100040 500041 150043 500
Cộng 8000
Tứ phân vị (Quartiles)
Tứ phân vị đầu:
Tứ phân vị thứ 2:
Tứ phân vị thứ 3:
Q1=X(n+1)/4Q2=Me
Q3=X3(n+1)/4
Dữ liệu mẫu
Ví dụCho dãy số 6, 47, 49, 15, 42, 41, 7, 39, 43, 40,
361. Tìm khoảng biến thiên2. Tìm các tứ phân vị Q1, Q2, Q33. Tính độ trải giữa4. Vẽ biểu đồ hộp
Ví dụTỷ lệ lãi trên vốn (%) của 2 ngành kinh
doanh như sau Ngành A: 10.5; 9; 12; 10; 8.5; 12.5; 9.5 Ngành B: 7; 11;14;10; 17; 9; 9Tỷ lệ lãi trên vốn của hai ngành có ổn định
giống nhau không biết trung bình lãi trênvốn của ngành A và ngành B là 11%?
Độ lệch chuẩn tỷ lệ lãi ngành BTỷ lệ lãi trên
vốn (xi - Trung bình) |xi - Trung bình|^27 -4 1611 0 014 3 910 -1 117 6 369 -2 49 -2 4
trung bình = 11Tổng 70Phương sai 11.67Độ lệch chuẩn 3.41
Ví dụ độ lệch tuyệt đối trung bình ngành A là 1.68% độ lệch tuyệt đối trung bình ngành B là 3.41%. Công ty nào có tỷ lệ lãi trên vốn ổn định
hơn?
Trung bình = 15.5s = 3.33811 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21Döõ lieäu B
Döõ lieäu A
Trung bình = 15.5s = .9258
11 12 13 14 15 16 17 18 19 20 21Trung bình = 15.5s = 4.57
Döõ lieäu C
So sánh 3 tập dữ liệu
Ví dụ: 1 công ty đang lựa chọn dựán
Dự án A Dự án B (a)Giá trị kỳ vọng 36,000 50,000 (b) Độ lệch tiêu chuẩn 27,000 32,000
Hệ số biến thiên (Coefficient of Variation): đo lường độ phân tán tương đối của dãysố
Dữ liệu mẫu
Tổng thể
%100xsCV
%100.CV