(1) giới thiệu về thống kê cho các ngành khoa học xã hội_bài giảng 1: giới...
Post on 18-Aug-2015
36 Views
Preview:
TRANSCRIPT
Giới thiệu về thống kê
DEPOCEN
Chương 1
Giới thiệu chung và cách thu thập số liệu
• Các phương pháp thống kê là gì?
• Tại sao chúng ta lại cần các phương pháp thống kê?
Các phương pháp thống kê được mô tả như việc định nghĩa các phương pháp sử dụng trong việc thu thập số liệu, biểu diễn, phân tích và làm sáng tỏ dữ liệu (Weinberg and Schumaker 1962)
Để hiểu việc biểu diễn các tính chất và mô tả các thông tin như thế nào?
Để biết việc vẽ minh họa về một tổng thể lớn mà chỉ dựa trên thông tin thu được từ các mẫu ra sao?
Để biết các dự báo thu được chắc chắn đến mức độ nào?
Để biết bằng cách nào cải tiến quy trình
Một công ty có kế hoạch giới thiệu một sản phẩm mới.
Lợi tức của một sản phẩm trong công ty giảm xuống nghiêm trọng trong sáu tháng gần đây.
Công ty muốn thay đổi mẫu mã của sản phẩm đã có. Giám đốc Marketing muốn kiểm tra xem mẫu mã mới ảnh hưởng đến thái độ của khách hàng với sản phẩm mới như thế nào?
Cổ điển và Bayesian Cổ điển: Fisher and PearsonBayesian: Thomas Bayes
Tham số và phi tham số (nửa tham số) Nguyên nhân (causal) và tương quan
Bước 1: Xác định bài toán
Bước 2: Thiết lập các đối tượng nghiên cứu.
Bước 3: Xác định dạng dữ liệu cần thu thập.
Bước 4: Xác định nguồn lấy thông tin.
Bước 5: Xác định cỡ mẫu và cách lấy mẫu.
Bước 6: Xác định phương pháp thu thập số liệu.
Bước 7: Tiến hành thu thập số liệu.
Bước 8: Mô tả số liệu.
Bước 9: Phân tích số liệu.
Bước 10: Chuẩn bị và diễn giải báo cáo kết quả.
Phân loại Thống kê
•Thống kê mô tả:
• Lấy số liệu từ mẫu.
• Mô tả số liệu.
•Thống kê suy luận:
•Phân tích số liệu.
•Đưa ra kết luận.
Thống kê mô tả
•Thu thập số liệu (khảo sát)
•Biểu diễn số liệu (bảng, đồ thị)
•Đặc trưng của số liệu: mức ý nghĩan
x i
Một đặc trưng: tổng thể: là một tham số Mẫu: là một thống kê
Các bước xác định bài toán:(1) Các vấn đề liên quan.
(2) Thông tin về công ty như:sản phẩm, dịch vụ, thị trường, khách hàng….
(3) Những thay đổi gần đây có thể làm ảnh hưởng đến công ty.
(4) Các hoạt động có thể làm giảm nhẹ bài toán.
Để thu được thông tin cơ bản, xác định giới hạn, làm rõ bài toán và giả thuyết, xác định nguyên nhân và tạo các câu “nếu … thì…”.
Các loại kế hoạch nghiên cứu:- Thăm dò- Mô tả- Nguyên nhân
Thiết kế cấu trúc số liệu thu thập được dựa trên các đối tượng nghiên cứu.
Bước 4: Các số liệu gốc
ChínhThu thập số liệu
PhụSố liệu phức tạp
Quan sát
Thí nghiệm
Khảo sát
Bản in hoặc điện tử
Tổng thể: là tất cả các đối tượng được quan sát.
Mẫu: là một phần của tổng thể được chọn để phân tích.
Các phương pháp lấy mẫu
Mẫu
Mẫu không có xác suất
Mẫu có xác suất
Mẫu ngẫu nhiên đơn
giản
Mẫu hệ thống
Mẫu phân tầng
Mẫu chùm
Mẫu có xác suất
Mẫu có xác suất
Mẫu ngẫu nhiên đơn
giảnMẫu hệ thống Mẫu phân tầng Mẫu chùm
Các đối tượng mẫu được chọn dựa trên những khả năng đã biết.
Mẫu ngẫu nhiên đơn giản
• Mọi đối tượng có khả năng được chọn như nhau.
• Việc chọn có thể hoàn lại hoặc không hoàn lại.
• Một trong các cách là sử dụng bảng số liệu ngẫu nhiên thu thập được từ mẫu.
Mẫu hệ thống
N = 64
n = 8
k = 8
Nhóm 1
Mẫu phân tầng• Tổng thể được chia thành 2 hoặc nhiều nhóm tùy theo một vài đặc trưng thông dụng.
• Mẫu ngẫu nhiên đơn giản được chọn từ các nhóm vừa phân chia.
• Hai hoặc nhiều mẫu được kết nối với nhau.
Mẫu chùm• tổng thể được chia thành một vài “chùm”, mỗi chùm biểu diễn lại tổng thể.• Mẫu ngẫu nhiên đơn giản được chọn từ các chùm.• Các mẫu đơn giản được kết nối làm một.
tổng thể chia làm 4 “chùm”.
Phương pháp định tính Phương pháp định lượng
Quan sát Nhóm trọng tâm Phân tích ban đầu Xác định kỹ thuật
Được sử dụng với cỡ mẫu lớn Các câu hỏi được xây dựng với các câu trả lời đã
có từ trước.
Phương pháp suy luận
Quản lý chất lượng Dự báo Kiểm định giả
thuyếtƯớc lượng
Hồi quy Chuỗi thời gian
Bước 10: Báo cáo kết quả
Giới thiệu về thống kê
DEPOCEN
Chương 2
Biểu diễn số liệu bằng bảng và biểu đồ
Các chủ đề•Tổ chức số liệu:
theo thứ tự mảng và hiển thị bằng biểu đồ hình cây-lá
•Bảng và đồ thị số liệu:
•Phân phối tần xuất : bảng, biểu đồ, đường gấp khúc
•Phân phối tích lũy: bảng, biểu đồ, hình cung
•Tổ chức số liệu định tính một chiều: tổng hợp các bảng
•Đồ thị của số liệu định tính 1 chiều:
cột, tròn…
•Bảng số liệu định tính 2 chiều:
Cột, bảng ngẫu nhiên
2 144677
3 028
4 1
Tổ chức số liệu
Số liệu
Thứ tự mảng
Biểu diễn hình cây-lá
Phân phối tần xuấtPhân phối tích lũy
Biểu đồ
Đường gấp khúc
Hình cung
Bảng
41, 24, 32, 26, 27, 27, 30, 24, 38, 21
21, 24, 24, 26, 27, 27, 30, 32, 38, 41
Biểu diễn hình cây-lá: là một kỹ thuật thống kê để hiển thị một tập số liệu. Mỗi giá trị số liệu được chia thành hai phần: phần chính là cây và phần phụ là lá cây.
2 1 4 4 6 7 7
Tổ chức số liệu:
•Số liệu biểu diễn hàng ngang:24, 26, 24, 21, 27, 27, 30, 41, 32, 38
•Số liệu biểu diến theo thứ tự từ nhỏ đến lớn: 21, 24, 24, 26, 27, 27, 30, 32, 38, 41
•Biểu diễn cây-lá:3 0 2 8
4 1
Một phân phối tần xuất là việc nhóm các số liệu thành các mục riêng biệt để chỉ ra số quan sát trong mỗi lớp.
Bảng số liệu: Phân phối tần xuất
Số liệu theo thứ tự mảng:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Lớp Tần xuất
10 đến 20 3 .15 15
20 đến 30 6 .30 30
30 đến 40 5 .25 25
40 đến 50 4 .20 20
50 đến 60 2 .10 10
Tổng số 20 1 100
Tỉ lệ tần xuất
Phần trăm
Tỉ lệ tần xuất: Là phần trăm của các quan sát trong mỗi lớp trong tổng thể. Ta lấy số lượng trong mỗi lớp chia cho tổng số quan sát.
Note: Tác dụng của biểu diễn cây-lá với một bảng phân phối tần xuất là không làm mất đi tính đồng nhất của mỗi quan sát.
Có ba dạng đồ thị thường được sử dụng là: biểu đồ, đường gấp khúc, và phân phối tần xuất tích lũy (dạng đường cong).
Biểu đồ: tạo nên bằng cách các lớp nằm trên trục ngang và tần xuất nằm trên trục thẳng đứng, tần xuất của mỗi lớp biểu diễn độ cao của hình cột và mỗi cột được vẽ cạnh nhau.
Một đường gấp khúc gồm các đoạn thẳng nối các điểm nằm chính giữa các lớp và tần xuất của lớp đó.
Được sử dụng để xác định tỉ lệ của các giá trị số liệu là nằm trên hay dưới một giá trị chắc chắn nào đó là bao nhiêu.
Histogram
0
3
65
4
2
001234567
5 15 25 36 45 55 More
Fre
qu
en
cy
Đồ thị số liệu: Biểu đồ
Số liệu theo hàng ngang:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Đồ thị số liệu :Đường gấp khúc
Frequency
0
1
2
3
4
5
6
7
5 15 25 36 45 55 More
Số liệu:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Lớp Tần số %
10 đến 20 3 15
20 đến 30 9 45
30 đến 40 14 70
40 đến 50 18 90
50 đến 60 20 100
Bảng số liệu:Tần số tích lũy
Số liệu:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Đồ thị số liệu:Dạng hình cung
Số liệu:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Ogive
0
20
40
60
80
100
120
10 20 30 40 50 60
Tổ chức số liệu định tính
Số liệu định tính
Bảng số liệu
Tổng kết thành bảng
Đồ thị số liệu
Hình quạt
Dạng khácDạng cột
Ví dụ: Tổng kết số liệu bằng bảng 1 chiều(với một nhà đầu tư)
Danh mục đầu tư Số lượng % (ngàn đôla)
Dự trữ 46.5 42.27
Cổ phần 32 29.09
Tiết kiệm 16 14.55
Chi phí khác 15.5 14.09
Tổng cộng 110 100
Biến định tính
Rất hữu ích trong việc thể hiện mối quan hệ của một phân phối tần: một hình tròn được chia tỉ lệ với các tần xuất của số liệu.
Dạng hình quạt
Tiết kiệm
15%
CP K 14%
Cổ phần 29%
Dự trữ
42%
Tổ chức số liệu định tính dạng bảng 2 chiều
•Bảng ngẫu nhiên
•Dạng cột
Tổ chức số liệu định tính dạng bảng 2 chiều
: Bảng ngẫu nhiên
Danh mục Nhà đầu tư A Nhà đầu tư B Nhà đầu tư C Tổng số đầu tư
Dự trữ 46.5 55 27.5 129
Cổ phần 32 44 19 95
Tiết kiệm 16 28 7 51
Chi phí khác 15.5 20 13.5 49
Tổng số 110 147 67 324
Biểu diễn số liệu được thiết kế tốt nếu: Bản chất Thống kê
Liên kết các ý tưởng với sự rõ ràng, chính xác và hiệu quả.
Yêu cầu đưa ra thông tin chính xác về số liệu.
Sử dụng ‘Biểu đồ gãy khúc’
Không liên hệ với giá trị chuẩn khi so sánh các mảng số liệu
Co các trục
Không có số 0 trên trục
Biểu diễn đúng
1960: $1.00
1970: $1.60
1980: $3.10
1990: $3.80
Minimum Wage Minimum Wage
0
2
4
1960 1970 1980 1990
$
Biểu diễn sai
Biểu diễn đúngBiểu diễn sai
0
200
300
FR SO JR SR
Freq.
10%
30%
FR SO JR SR
%
FR = Freshmen, SO = Sophomore, JR = Junior, SR = Senior
Biểu diễn đúngBiểu diễn sai
0
25
50
Q1 Q2 Q3 Q4
$
0
100
200
Q1 Q2 Q3 Q4
$
Biểu diễn đúngBiểu diễn sai
0
39
42
45
J F M A M J
$
36
39
42
45
J F M A M J
$
Graphing the first six months of sales.
36
top related