thu thẬp vÀ trÌnh bÀy dỮ liỆu - bai-giang.webnode.vn. thu thap... · được công bố...
TRANSCRIPT
THU THẬP VÀ TRÌNH BÀY
DỮ LIỆU
1
CHƢƠNG II
1. Phân loại và thu thập dữ liệu. 2. Trình bày dữ liệu: bảng và
các lọai biểu đồ thống kê.
Chương 2. Thu thập và trình bày dữ liệu
Dữ liệu định tính
Phản ánh tính chất (nam, nữ), sự hơn kém của đối tượng nghiên cứu (mức thu nhập).
Phân loại dữ liệu Dữ liệu định lượng
Phản ánh mức độ hay mức độ hơn kém (thu nhập, năng suất, doanh thu,…).
2
1. Phân loại và thu thập dữ liệu
Chương 2. Thu thập và trình bày dữ liệu
Dữ liệu là kết quả khảo sát của các biến. Hay gọi cách khác là giá trị của biến.
• Thông tin cần thu thập phải phục vụ cho vấn
đề và mục đích cần nghiên cứu.
• Xác định thông tin cần thu thập là xác định rõ
những dữ liệu nào, thứ tự ưu tiên của các dữ
liệu này và phạm vi dữ liệu cần thu thập.
Chương 2. Thu thập và trình bày dữ liệu 3
Ví dụ: Nghiên cứu mối liên hệ giữa vấn đề tự học với
kết quả học tập của sinh viên
Cần
thu
thập
Không
cần thu
thập
4
Nguồn dữ liệu
• Có 2 nguồn dữ liệu thường dùng: dữ liệu
được công bố rộng rãi trên các phương tiện
thông tin và dữ liệu thu thập từ các cuộc điều
tra hoặc thiết kế thực nghiệm.
Chương 2. Thu thập và trình bày dữ liệu 5
DỮ LIỆU SƠ CẤP DỮ LIỆU THỨ CẤP
Nguồn dữ liệu
Chương 2. Thu thập và trình bày dữ liệu 6
Dữ liệu sơ cấp
Là dữ liệu tự tiến hành, tổ chức thu thập, tự
tạo ra dữ liệu.
Chương 2. Thu thập và trình bày dữ liệu 7
Dữ liệu thứ cấp
- Là dữ liệu thu thập được từ những nguồn có sẵn.
- Đa dạng và phong phú. Đối với công ty, doanh nghiệp có thể sử dụng các nguồn sau:
• Nội bộ: báo cáo các phòng, ban công ty
• Cơ quan thống kê nhà nước, cơ quan chính phủ
• Báo đài, tổ chức, hiệp hội cung cấp thông tin
- Đặc điểm: thu thập nhanh, rẻ nhưng không có đủ dữ liệu theo mong muốn, thường ở tầm vĩ mô.
Chương 2. Thu thập và trình bày dữ liệu 8
Các phương pháp thu thập dữ liệu
Chương 2. Thu thập và trình bày dữ liệu 9
Trực tiếp
- Theo dõi
- Phỏng vấn
- Thực hành, thí nghiệm
Gián tiếp
- Thu thập thông tin qua
trung gian hay khai thác
dữ liệu sẵn có.
Các phương pháp thu thập dữ liệu
Chương 2. Thu thập và trình bày dữ liệu 10
a) Theo dõi
• Là thu thập dữ liệu bằng cách theo dõi các hành
động, thái độ, diễn tiến của đối tượng nghiên cứu
trong những tình huống nhất định và ghi nhận lại kết
quả xảy ra.
• Ví dụ: quan sát khách đến nơi trưng bày sản phẩm
công ty trong hội chợ triển lãm
• Phù hợp sự kiện, vấn đề tính chất tự nhiên, không có
sự tác động bên ngoài.
Các phương pháp thu thập dữ liệu
Chương 2. Thu thập và trình bày dữ liệu 11
b) Phỏng vấn
• Là trực tiếp hỏi đối tượng được chọn điều tra và tự
ghi chép dữ liệu vào bản câu hỏi hay phiếu điều tra.
• Phù hợp với những điều tra phức tạp cần thu thập
nhiều dữ liệu và đối tượng điều tra là con người.
• Dữ liệu thu thập đầy đủ theo nội dung điều tra và có
độ chính xác cao nhưng đòi hỏi chi phí lớn.
Các phương pháp thu thập dữ liệu
Chương 2. Thu thập và trình bày dữ liệu 12
c) Thực hành, thí nghiệm
• Tiến hành các thí nghiệm, thực hành và ghi nhận lại
các dữ liệu kết quả của mỗi lần thực hiện.
• Phù hợp với những vấn đề, sự kiện nghiên cứu lĩnh
vực kĩ thuật, khoa học thực nghiệm, công nghệ.
Các phương pháp thu thập dữ liệu
Tính chất Gửi thư Phỏng vấn qua
điện thoại
Phỏng vấn trực
tiếp
Mức độ linh hoạt Kém Tốt Tốt
Khối lượng thông tin Đầy đủ Hạn chế Đầy đủ
Tốc độ thu thập thông tin Chậm Nhanh Nhanh
Tỷ lệ câu hỏi được trả lời Thấp Cao Cao
Chi phí Tiết kiệm Tốn kém Tốn kém
Chương 2. Thu thập và trình bày dữ liệu 13
2. Trình bày dữ liệu
2.1. Bảng phân phối tần số
2.2. Biểu đồ
2.3. Phương pháp nhánh và lá
Chương 2. Thu thập và trình bày dữ liệu 14
2.1. Bảng phân phối tần số
Gồm có 2 phần
• Trị số của biến nghiên cứu (Xi)
• Số lần xuất hiện của trị số - Tần số (ni hay fi)
Hay tần số còn có thể thể hiện bằng hình thức %,
gọi là 𝑡ầ𝑛 𝑠ố 𝑡ươ𝑛𝑔 đố𝑖 (ℎ𝑎𝑦 𝑡ầ𝑛 𝑠𝑢ấ𝑡) =𝑓𝑖
𝑛
Chương 2. Thu thập và trình bày dữ liệu 15
Ví dụ 1
Dữ liệu về giới tính của công nhân ở xí nghiệp A
được ghi nhận:
Giới tính Số công nhân
Tần số tương đối (tần suất)
%
1. Nam 80 80%
2. Nữ 20 20%
Tổng 100 100%
Chương 2. Thu thập và trình bày dữ liệu 16
Ví dụ 2
Bảng phân bố tần số về nhóm ngành của 60 SV
được ghi nhận:
Chương 2. Thu thập và trình bày dữ liệu 17
Nhóm ngành Tần số (số SV) Tần suất
Tự nhiên 9 15%
Xã hội 22 36.67%
Kỹ thuật 19 31.67%
Kinh tế 10 16.67%
Tổng 60 100%
Ví dụ 3
Kết quả kiểm tra môn Toán ở lớp 12A như sau:
Điểm (Xi) Số HS
1 2
3 5
4 8
5 15
7 10
8 7
10 3
Tổng 50
Chương 2. Thu thập và trình bày dữ liệu 18
Ví dụ 4
Mức điện sinh hoạt tiêu thu hàng tháng của 100 hộ gia
đình ở Phường Tân Hưng được ghi nhận:
Lượng điện tiêu thụ (Kwh)
Số hộ gia đình
Tần suất %
≤100 14 14%
100-120 16 16%
120-140 28 28%
140-160 20 20%
160-180 9 9%
180-200 8 8%
≥ 200 5 5%
Tổng 100 100% Chương 2. Thu thập và trình bày dữ liệu 19
Ví dụ 5
Phân phối tần số năng suất (tạ/ha) của một
loại cây trồng được quan sát trên 40 điểm thu
hoạch như sau:
Năng suất ( tạ/ha) Số quan sát
152-159 7
159-166 19
166-173 8
173-180 6
Tổng 40
Chương 2. Thu thập và trình bày dữ liệu 20
Trong trường hợp phân nhóm có khoảng cách
đều nhau:
• Số nhóm 𝒌 = 𝟐𝒏 𝟏/𝟑
n: số đơn vị trong mẫu nghiên cứu
• Khoảng cách tổ
𝒉 =𝑿𝒎𝒂𝒙 − 𝑿𝒎𝒊𝒏
𝒌
Xmax : giá trị lớn nhất của biến
Xmin : giá trị nhỏ nhất của biến
Chương 2. Thu thập và trình bày dữ liệu 21
Ví dụ 1
Năng suất (tạ/ha) của một loại cây trồng được
quan sát trên 40 điểm thu hoạch như sau:
153 154 156 157 158 159 159 160 160 160
161 161 161 162 162 162 163 163 163 164
164 164 165 165 166 166 167 167 168 168
170 171 172 173 174 175 176 177 178 179
Hãy lập bảng phân bố tần số, tần suất với khoảng cách tổ đều nhau.
Chương 2. Thu thập và trình bày dữ liệu 22
Năng suất
(tạ/ha)
Tần số (ni)
Tần số tích lũy
Tần suất (%)
Tần suất tích lũy
(%)
152-159 7 7 17.5 17.5
159-166 19 26 47.5 65
166-173 8 34 20 85
173-180 6 40 15 100
Tổng 40 100
Chương 2. Thu thập và trình bày dữ liệu 23
24
VÍ DỤ 2
Một trường đại học tiến hành một cuộc điều tra xem
trung bình một sinh viên của trường tiêu hết bao nhiêu
tiền gọi điện thoại trong một học kỳ. Một mẫu ngẫu
nhiên gồm 59 sinh viên được chọn và số tiền chi cho
việc gọi điện thoại của họ như sau : (đvị:1.000đ)
• Hãy phân dữ liệu thành 5 tổ với khoảng cách tổ đều
nhau.
7 11 14 15 15 15 18 23 27 28
16 18 20 25 26 26 29 29 35 41
22 22 23 27 28 30 30 31 36 52
26 31 32 33 33 36 37 37 58 72
35 35 40 41 42 47 60 63 70 73
37 48 57 79 85 95 111 127 147
2.2. Biểu đồ
• Biểu đồ hình cột
• Biểu đồ hình gấp khúc
• Biểu đồ hình tròn
Chương 2. Thu thập và trình bày dữ liệu 25
• Những vấn đề chú ý khi xây dựng biểu đồ và đồ thị
thống kê: Yêu cầu của một đồ thị hay biểu đồ thống
kê là chính xác, đầy đủ, dễ hiểu và thể hiện tính thẩm
mỹ.
• Lựa chọn đồ thị cho phù hợp với nội dung, tính chất
của các số liệu cần diễn đạt.
• Xác định quy mô của đồ thị cho thích hợp.
• Các thanh đo tỷ lệ cần thống nhất và chính xác.
• Cần ghi số liệu, đơn vị tính, thời gian không gian
của hiện tượng nghiên cứu sao cho thích hợp với
từng loại đồ thị cụ thể. Đặc biệt cần ghi chú rõ các
ký hiệu, màu sắc quy ước được dùng trong đồ thị Chương 2. Thu thập và trình bày dữ liệu 26
Năng suất
(tạ/ha)
Tần số (ni)
Tần số tích lũy
Tần số tương
đối (%)
Tần số tương
đối tích lũy (%)
152-159 7 7 17.5 17.5
159-166 19 26 47.5 65
166-173 8 34 20 85
173-180 6 40 15 100
40 100
Ví dụ: Vẽ biểu đồ biểu diễn các dữ liệu sau:
Chương 2. Thu thập và trình bày dữ liệu 27
0
2
4
6
8
10
12
14
16
18
20
152-159 159-166 166-173 173-180
Biểu đồ phân phối tần số S
ố q
uan
sát
Chương 2. Thu thập và trình bày dữ liệu 28
0
2
4
6
8
10
12
14
16
18
20
152-159 159-166 166-173 173-180
Biểu đồ phân phối tần số S
ố q
uan
sát
Chương 2. Thu thập và trình bày dữ liệu 29
0
5
10
15
20
25
30
35
40
45
152-159 159-166 166-173 173-180
Biểu đồ tần số tích lũy Số
qu
an s
át
Năng suất (tạ/ha)
Chương 2. Thu thập và trình bày dữ liệu 30
0
20
40
60
80
100
120
152-159 159-166 166-173 173-180
Biểu đồ Tần số tƣơng đối tích lũy (%)
Tần
số t
ươ
ng đ
ối …
Năng suất (tạ/ha)
Chương 2. Thu thập và trình bày dữ liệu 31
17%
48%
20%
15%
Biểu đồ tần số tƣơng đối (%)
(tạ/ha) 152-159 159-166 166-173 173-180
Chương 2. Thu thập và trình bày dữ liệu 32
33
Ví dụ 2
Cho bảng phân bố tần số về số tiền điện thoại sử dụng trong tháng của 59 sinh viên.
Xi Fi
7-35 31
35-63 18
63-91 6
91-119 2
119-147 2
n = 59
Hãy vẽ biểu đồ tần số, tần số tích lũy, tần suất và tần suất tích lũy biểu diễn dữ liệu trên.
2.3. Phương pháp nhánh và lá
• Để trình bày dữ liệu theo PP nhánh và lá, mỗi
trị số được tách thành 2 phần:
Phần nhánh: Bao gồm một hay nhiều số đầu
tiên. Phần nhánh sẽ được đặt ở cột đầu tiên theo
thứ tự tăng dần. Số nhánh được chọn sao cho có
ít nhánh so với lá. (thông thường số nhánh
khoảng từ 5 - 20)
Phần lá: gồm các số còn lại. Lá ở một nhánh
cũng được sắp xếp theo thư tự tăng dần.
Chương 2. Thu thập và trình bày dữ liệu 34
Ví dụ 1
• Số liệu về tuổi của 30 công nhân trong Cty A
như sau:
28 19 19 23 24 30 21 33 32 34
28 29 19 30 31 32 32 18 20 22
22 25 26 27 29 28 29 30 38 39
Hãy trình bày dữ liệu theo PP nhánh và lá
Chương 2. Thu thập và trình bày dữ liệu 35
Ví dụ 2
• Số liệu về chiều dài(cm) của 40 sản phẩm như sau:
30 30,4 30,2 30,1 30 30,9 30,5 31 31 31
32 31,2 30,4 30,8 30,9 31,2 31,2 32 30,4 30,3
30,5 30,7 31,1 32 30,1 30,4 30,5 31,2 31,8 30,9
30,5 31,2 32 31,3 31 31,4 30,3 30,9 31 30,8
Chương 2. Thu thập và trình bày dữ liệu 36
a/ Hãy trình bày dữ liệu theo PP nhánh và lá
b/ Hãy lập bảng phân bố tần số, tần suất về chiều dài của SP
(theo khoảng cách tổ đều)
c/ Vẽ biểu đồ tần số, tần suất về chiều dài của SP
Chương 2. Thu thập và trình bày dữ liệu 37
BÀI TẬP Tập dữ liệu thô của một mẫu, gồm các biến sau: - Biến 1: Giới tính 1. Nữ 2. Nam - Biến 2: Tuổi - Biến 3: Mức độ hài lòng của người dân khi giao tiếp nơi công sở 1. Hài Lòng 2. Bình thường 3. Không hài lòng
Chương 2. Thu thập và trình bày dữ
liệu 38
STT Giới
tính
Tuổi Mức độ
hài lòng 1 1 32 2 2 1 28 1 3 2 24 2 4 2 31 3 5 2 27 1 6 1 32 2 7 2 32 2 8 2 31 3 9 1 32 1 10 2 33 2 11 1 28 3 12 1 32 2
Chương 2. Thu thập và trình bày dữ
liệu 39
Hãy thực hiện:
1. Lập bảng tần số cho biến Giới tính (Biến 1), biến
Tuổi (Biến 2), Biến Mức độ hài lòng ( Biến 3)
2. Lập bảng mô tả sự liên hệ giữa Mức độ hài lòng
của người dân khi giao tiếp nơi công sở (Biến 3)
với Giới tính (Biến 1).