chuong 1 gioi thieu - wordpress.com · &È& .+È, 1l Ê0 7 mqjwk [wk iqjnr oj w ±s k çs...
TRANSCRIPT
GiỚI THIỆUPHÂN TÍCH THÔNG TIN TRONG NGHIÊN CỨU KHOA HỌC
1
NỘI DUNG1. GIỚI THIỆU2. THỐNG KÊ MÔ TẢ3. CÁC PHƯƠNG PHÁP CHỌN MẪU4. KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH5. KIỂM ĐỊNH TRUNG BÌNH TỔNG THỂ6. KIỂM ĐỊNH PHI THAM SỐ7. TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH8. PHƯƠNG PHÁP THÍ NGHIỆM
2
CÁC KHÁI NiỆM1. Tổng thể thống kê: là
tập hợp các đơn vịhoặc phần tử cá biệtnhư người, vật, sựviệc… kết hợp vớinhau trên cơ sở mộtđặc điểm chung nàođó
2. Mẫu: là bộ phận đượcchọn ra từ tổng thể
3
CÁC KHÁI NiỆM3. Biến: đặc điểm của đơn vị tổng thể. Biến định tính: thể hiện loại hay tính chất của phần
tử khảo sát. Ví dụ giới tính, nghề nghiệp, nơi cưtrú…
Biến định lượng: thể hiện bằng con số, là kết quảcủa quá trình cân, đong, đo, đếm. Ví dụ thu nhập,tuổi, mức độ yêu thích sản phẩm…
4
CÁC KHÁI NiỆM4. Dữ liệu: kết quả quan sát của các biến. Dữ liệu định tính: phản ánh tính chất, sự hơn kém.
Ví dụ biến giới tính gồm hai biểu hiện (thể hiện) lànam và nữ; biểu hiện của biến kết quả học tập củasinh viên là giỏi, khá, trung bình, yếu.
Dữ liệu định lượng: phản ánh mức độ, mức độhơn kém và được thể hiện bằng con số. Ví dụ thunhập, cân nặng, tuổi…
5
6
Các biến
Dữ liệu vềnhữngngười trảlời (quansát, đốitượng)
Giới tính Tuổi Nghề nghiệp1 Nữ 21 Sinh viên2 Nam 32 Nhân viên VP3 Nam 30 Kỹ sư4 Nữ 27 Bác sĩ
…n Nam 45 Nghề khác
CÁC KHÁI NiỆM
Ví dụ: biến định tính, định lượng 1. Viện phí 2. Cách thức nộp viện phí 3. Thời gian chờ nhân viên phục vụ nhà hàng mang thựcđơn đến 4. Tầm quan trọng khi ăn tối với gia đình 5. Số biển báo giao thông trên đường Trần Phú 6. Màu tóc của du khách 7. Độ sạch của bãi biển Nha Trang 8. Mức độ yêu thích của du khách khi lặn biển Hòn Mun 9. Tỷ lệ khách nước ngoài đến Dốc Lết 10. Số lượng khách sạn 4 sao tại Nha Trang 11 Mức bón phân lân cho cây
CÁC KHÁI NiỆM5. Phân tích đơn biến thực hiện trên
một biến nhằm mục đích chủ yếu làmô tả.
Ví dụ: bảng phân phối tần số, đồ thịphân phối tần số; trung bình, trungvị, mode; phương sai, độ lệchchuẩn.
6. Phân tích đa biến (multivariateanalysis) bao gồm các kỹ thuậtphân tích dữ liệu hai biến trở lêncùng lúc.
Ví dụ: Học vấn có ảnh hưởng đến thunhập không?
8
CÁC KHÁI NiỆM7. Thang đo là một công cụ để đo lường đối tượng
nghiên cứu. Có 4 loại thang đo: thang đo danhnghĩa, thang đo thứ bậc, thang đo khoảng và thangđo tỉ lệ.
9
Dữ liệu
Dữ liệu định lượngDữ liệu định tính
Thang đodanh nghĩa
Thang đothứ bậc Thang đo
khoảng cách Thang đotỷ lệ
Thang đo danh nghĩa (thang đođịnh danh - nominal scale)
Dùng con số để phân loại đối tượng. Ví dụ 1: Thang đo về tình trạng hôn nhân gồm1 Độc thân2 Đang có gia đình3 Ở góa4 Ly thân hoặc ly dị Ví dụ 2: Bò nhiễm bệnh0 = không nhiễm bệnh1 = nhiễm bệnhCác phép toán thống kê sử dụng cho thang đo định danh:
đếm, tính tần suất của một biểu hiện nào đó, xác địnhgiá trị mode, thực hiện một số phép kiểm định. 10
Thang đo thứ bậc (thang đo thứ tự-ordinal scale)
Thể hiện quan hệ thứ tự giữa các đối tượng, xác địnhđược sự nhiều/ ít hơn của một thuộc tính nhưngkhông xác định được mức độ khác biệt .
Ví dụ: 1. Kết quả học tập của sinh viên gồm1 Xuất sắc 2 Giỏi 3 Khá4 Trung bình 5 YếuVí dụ 2: Mức độ dễ đẻ của bò1= đẻ thường2=đòi hỏi sự can thiệp ở một số khâu3= đòi hỏi sự can thiệp của bác sĩ thú y
11
12
Thang khoảng cách = Thang thứ bậc + điều kiện về“khoảng cách bằng nhau”
Số 0 là giá trị gán ghép chủ quanVí dụ: Thang đo khoảng cách đo tầm quan trọng đối với
cuộc sống của con người
Thang đo khoảng (interval scale)
Không quantrọng
Rất quan trọng
1. có nhiều tiền 1 2 3 4 5 6 72. đạt trình độ học vấn cao 1 2 3 4 5 6 73. có địa vị trong xã hội 1 2 3 4 5 6 74. gia đình hạnh phúc 1 2 3 4 5 6 75. có sức khỏe tốt 1 2 3 4 5 6 76. có nghề nghiệp thích hợp 1 2 3 4 5 6 7
13
Giống như thang đo khoảng, nhưng giá trị 0 khôngphải là giá trị gán ghép chủ quan, mà chỉ trạng thái“không tồn tại” của thuộc tính đang đo.
Các phép toán thống kê sử dụng cho thang đokhoảng và tỷ lệ: tần số, trung bình, độ lệch chuẩn,phương sai…
Ví dụ: 1. thu nhập có thể 10 triệu đồng/tháng hoặckhông có thu nhập (hay thu nhập là 0 đồng/tháng)
2. Trọng lượng cơ thể (kg); tỷ lệ nạc (%), số con sinhra trong một lứa
Thang đo tỷ lệ (ratio scale)
14
Thang đo Đặc điểm Đối tượngcó thể đo
Định danh Định nghĩa duynhất cho mỗi số:0, 1, 2…
Nhãn hiệu, giớitính, loại cửahàng…
Thứ tự Thứ tự các con số0<1<2<3…
Thái độ, tầng lớp,mức ưa thích…
Khoảng cách Khoảng cách bằngnhau (7-6) = (3-2)
Thái độ, ý kiến,các chỉ số…
Tỉ lệ Sự tương đượccủa các tỉ số 4/2 =10/5
Tuổi, chí phí,doanh thu, thịphần…
TÓM TẮT
15
1. Name: tên biến có độ dài không quá 8 ký tự,không có ký tự đặc biệt hoặc bắt đầu bằng số.
Ví dụ cách đặt tên biến đúng: Gioitinh, Noi_o, Cau_1Ví dụ cách đặt tên biến sai: 1_Cau, *Noi_o, Noi-o1. Type: kiểu của biến gồm kiểu số, ngày, chuỗi…2. Width: số ký tự hay ký số tối đa có thể nhập3. Decimals: số số lẻ4. Label: nhãn của biến, dùng để giải thích tên biến.5. Values: các giá trị mã hóa của biến
Cách khai báo biến trong SPSS
16
Cách khai báo biến trong SPSS
17
Các biếnNhững người trả lời (quan sát, đối tượng)
Giới tính Tuổi Nghề nghiệp1 Nữ 21 Sinh viên2 Nam 32 Nhân viên VP3 Nam 30 Kỹ sư4 Nữ 27 Bác sĩ
…n Nam 45 Nghề khác
Cách khai báo biến trong SPSSDữ liệu ban đầu
Mã hóa dữ liệu với quy ước cho biến Giớitính: 1 là Nữ, 0 là Nam; biến Nghề nghiệp:10 là Sinh viên, 11 là Nhân viên vănphòng, 12 là Kỹ sư…..
18
Cách khai báo biến trong SPSSNhập vào SPSS
Các biến
Những người trả lời
Giới tính Tuổi Nghề nghiệp1 1 21 102 0 32 113 0 30 124 1 27 13
…n 0 45 14
19
Câu hỏi chọn nhiều câu trả lờiDữ liệu ban đầuVí dụ: Trong ba năm qua, bạn đã đi nghỉ ở những bãi
biển nào dưới đây (có thể chọn nhiều câu trả lời)Có dữ liệu sau
Nha Trang Mũi Né Vũng Tàu
20
Câu hỏi chọn nhiều câu trả lờiNhập vào SPSS
Các biếnNhữngngườitrả lời
NhaTrang MuiNe VungTau1 1 0 1
Cách mã hóa 1: Ứng với mỗi biểu hiện tạo một biến mới.Biến mới có hai giá trịBiến Nhatrang (1 nếu người trả lời chọn, 0 nếu không
chọn)Biến Muine (1 nếu người trả lời chọn, 0 nếu không chọn)Biến Vungtau (1 nếu người trả lời chọn, 0 nếu không chọn)
21
Câu hỏi chọn nhiều câu trả lờiNhập vào SPSS
Các biếnNhữngngườitrả lời
Dulich1 5
Cách mã hóa 2: Chỉ tạo một biến và tạo các kết hợp giữacác biểu hiện và ứng với mỗi kết hợp thì gán một giá trị
1 Nha Trang2 Mũi Né3 Vũng Tàu4 Nha Trang và Mũi Né5 Nha Trang và Vũng Tàu6 Mũi Né và Vũng Tàu7 Nha Trang và Mũi Né và Vũng Tàu
Nha Trang Mũi Né Vũng Tàu
22
Phân tích thống kê không phảichỉ là việc mô tả các dữ liệu quansát được mà từ kết quả quan sátđược trong mẫu, nhà phân tích phảisuy rộng kết luận cho tổng thể.Kiểm định giả thuyết bao gồm cácthủ tục hay quy tắc để quyết địnhbác bỏ hay chấp nhận giả thuyết đãnêu.
KIỂM ĐỊNH GIẢ THUYẾT
23
1. Thiết lập giả thuyết H0 và H1. Hai giả thuyết đối lập nhautrong kiểm định giả thuyết là Giả thuyết Không (ký hiệu là H0) và Giảthuyết Đối (ký hiệu H1).
2. Tính giá trị kiểm định và p value3. Chọn mức ý nghĩa α, xác định giá trị tới hạn và miền bác bỏ
giả thuyết H04. Kết luận về mặt thống kê: ở mức ý nghĩa α, không bác bỏ hay
bác bỏ H0Quy tắc: Bác bỏ H0 nếu giá trị kiểm định > giá trị tới hạn hoặc p
value < α5. Kết luận cuối cùng về nội dung bài toán
THỦ TỤC KIỂM ĐỊNH GIẢ THUYẾT
24
CÁC KIỂM ĐỊNH GIẢ THUYẾTTên gọi Nội
dungLoại biến Đại
lượng kiểmđịnh
Các giảđịnh
Kiểm địnhmối liên hệ
Hai biến địnhdanh hoặc thứ bậc
Χ2 -Số quan sát đủlớn-Tối đa 20% sốô trong bảngchéo có tần sốlý thuyết nhỏhơn 5
Kiểm địnhtương quan ρPearson
Hai biến địnhlượng
t Tổng thểcó phân phốichuẩn
Kiểm địnhtương quan ρSpearman
Hai biến thứbậc hoặc hai biếnđịnh lượng
25
CÁC KIỂM ĐỊNH GIẢ THUYẾTTên gọi Loại biến Đại
lượng kiểmđịnh
Các giả định
Kiểm định sự bằngnhau giữa hai trung bìnhtổng thể
Môt biến địnhlượng và một biếnđịnh tính
t - Mẫu ngẫu nhiênđược rút từ tổng thể cóphân phối chuẩn
- Các phương sai củacác tổng thể bằng nhau
Phân tích phương saimột yếu tố (One wayANOVA): Kiểm định sựbằng nhau giữa k trungbình tổng thể
Một biến địnhlượng và một biếnđịnh tính
F - Mẫu ngẫu nhiênđược rút từ tổng thể cóphân phối chuẩn
- Các phương sai củacác tổng thể bằng nhau
Kiểm định phi tham số Áp dụng trong trườnghợp kiểm định các trungbình tổng thể mà khôngthỏa các giả định
26
CÁC KIỂM ĐỊNH GIẢ THUYẾTTên gọi Nội dung Loại biếnPhân tích hồi quy Phân tích mối
liên hệ phụ thuộcMột biến phụ thuộc định
lượng và một (hoặc nhiều) biếnđộc lập định lượng, định tính
Hồi quy binary logistic Phân tích mốiliên hệ phụ thuộc
Một biến phụ thuộc định tínhgồm hai biểu hiện và một (hoặcnhiều) biến độc lập định lượng,định tính
Phân tích cụm Phân loại cácđơn vị dựa vào mộtsố đặc tính của chúng
Phân tích nhân tố tóm tắt dữ liệubằng cách loại nhữngbiến dư và thay thếcác biến quan sátthành một số biếntổng hợp ít hơn.