การวิเคราะห ข อมูล...

Post on 26-Dec-2019

4 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

การวิเคราะหขอมลูสําหรบังานวิจัยเชงิปริมาณ

The art of data analysis

ดร.ฐณัฐ วงศสายเชื้อfedutnw@ku.ac.th, thanutw@hotmail.com

ภาควิชาการพัฒนาทรัพยากรมนุษยและชุมชนคณะศึกษาศาสตรและพัฒนศาสตร

มหาวิทยาลัยเกษตรศาสตร วิทยาเขตกําแพงแสน20150508-2h

The art of data analysis

แนะนําตวั

• ป.เอก (ประชากรศาสตร) มหิดล ดวยทุน RGJ โครงการปริญญาเอกกาจณาภิเษก โดยสํานักงานสนับสนุนการวจิัย

• ประสบการณทางดานงานวจิัยมากกวา 20 ป• ประสบการณเปนนักวิจัยโครงการวจิัยระหวางประเทศกับCarolina Population Center, University of NorthCarolina at Chapel Hill, USA. นาน 10 ป

• เปนนักวิจัยและมีความเช่ียวชาญงานวิจัยเชิงปริมาณ

• ป.เอก (ประชากรศาสตร) มหิดล ดวยทุน RGJ โครงการปริญญาเอกกาจณาภิเษก โดยสํานักงานสนับสนุนการวจิัย

• ประสบการณทางดานงานวจิัยมากกวา 20 ป• ประสบการณเปนนักวิจัยโครงการวจิัยระหวางประเทศกับCarolina Population Center, University of NorthCarolina at Chapel Hill, USA. นาน 10 ป

• เปนนักวิจัยและมีความเช่ียวชาญงานวิจัยเชิงปริมาณ

1. การเตรียมขอมูลเพื่อการวิเคราะห2. การเตรียมตัวแปรสําหรับการวิเคราะห3. การวิเคราะหขอมูล 1 ตัวแปร4. การวิเคราะหขอมูล 2 ตัวแปร5. การนําเสนอและแปลผล6. การฝกปฎบิติั

ขอบเขตและเนื้อหาในการบรรยายการจัดเตรียมขอมูลและการวิเคราะหขอมูลสําหรบังานวิจยัเชิงปรมิาณ

1. การเตรียมขอมูลเพื่อการวิเคราะห2. การเตรียมตัวแปรสําหรับการวิเคราะห3. การวิเคราะหขอมูล 1 ตัวแปร4. การวิเคราะหขอมูล 2 ตัวแปร5. การนําเสนอและแปลผล6. การฝกปฎบิติั

การเตรียมขอมูลเพื่อการวิเคราะหHow to prepare data for analysis

การทาํอาหารของเชฟใสใจในรายละเอียดเลือกสรรวตัถุดิบดีพิถีพิถันทุกข้ันตอน

How to prepare data for analysis

• สาเหตุที่ตองเตรียมขอมูลกอนการวิเคราะห

การเตรียมขอมูลเพื่อการวิเคราะห

เปรียบเทียบการผัดผักบุง กับ การวิเคราะหขอมูล

พื้นที่ศกึษาประชากรและกลุมตัวอยาง

แบบสอบถามที่มีการจดบันทึกขอมูลที่ศึกษา

การเตรียมขอมูลกอนการวิเคราะห

การวิเคราะหดวยโปรแกรมสําเร็จรูป

ผลการวิจัยเพื่อนําเสนอและเผยแพร

ผักบุงยังตองลางดินโคลน ตดัราก ตัดเอาเฉพาะสวนที่ใชได (ตดักานแกๆ ใบเหลืองๆ ใบใหญๆ ออก)

• การเตรียมขอมูล = Data Cleaning => Data Quality

Data management

1. Verify & Enrich2. Export data3. Import data4. Merge data sets5. Rebuild missing data6. Standardize data7. Normalize data8. De-Duplicate

การเตรียมขอมูลฯ

1. Verify & Enrich2. Export data3. Import data4. Merge data sets5. Rebuild missing data6. Standardize data7. Normalize data8. De-Duplicate

การ Clean dataเพ่ือใหได High-quality data

Data codingการเตรียมขอมูลฯ

• การตรวจสอบ/บรรณาธิการขอมูลในสนาม

1. ความสมบูรณ2. ความแมนยํา3. ความเปนเอกภาพ

คะแนนความพึงพอใจ5 4 3 2 1

คําถาม

1. xxxxx2. xxxxx

Verify & Enrich

1. ความสมบูรณ2. ความแมนยํา3. ความเปนเอกภาพ

2. xxxxx3. xxxxx4. xxxxx5. xxxxx6. xxxxx7. xxxxx8. xxxxx9. xxxxx10. xxxxx

เพศ ชาย หญิง ไมตอบเลยชาย หญิง ตอบท้ัง 2 ขอ!

ชาย หญิงเคย ไมเคย

เพศการทําแทง

ขอมูลไมสอดคลอง

ตอบเหมือนกันทุกขอ

Data codingการเตรียมขอมูลฯ

• การตรวจสอบ/บรรณาธิการขอมูลในสนามVerify & Enrich

Data codingการเตรียมขอมูลฯ

• ตัวแปรมาตฐานในงานวิจัย

1. หมายเลขตัวอยาง = id (Identification Number)2. ตัวแปรเพศ = gender หรือ sex3. ตัวแปรอายุ = age4. ตัวแปรการศึกษา = educ5. ตัวแปรอาชีพ = occup6. ตัวแปรรายได = income7. ตัวแปรสถานภาพสมรส = m_status

Variable name

1. หมายเลขตัวอยาง = id (Identification Number)2. ตัวแปรเพศ = gender หรือ sex3. ตัวแปรอายุ = age4. ตัวแปรการศึกษา = educ5. ตัวแปรอาชีพ = occup6. ตัวแปรรายได = income7. ตัวแปรสถานภาพสมรส = m_status

Data codingการเตรียมขอมูลฯ

• การกําหนดช่ือตัวแปรดวยลําดับขอคําถาม

1. หมายเลขตัวอยาง = id (Identification Number)2. คําถามขอที่ 1, 2, 3 = q01, q02, q03 หรือ

= v01, v02, v033. สวนที่ 1 คําถามที่ 1 = q1014. สวนที่ 1 คําถามที่ 2 = q1025. สวนที่ 2 คําถามที่ 5 = q2056. สวนที่ 2 คําถามที่ 14 = q214 เปนตน

Variable name

1. หมายเลขตัวอยาง = id (Identification Number)2. คําถามขอที่ 1, 2, 3 = q01, q02, q03 หรือ

= v01, v02, v033. สวนที่ 1 คําถามที่ 1 = q1014. สวนที่ 1 คําถามที่ 2 = q1025. สวนที่ 2 คําถามที่ 5 = q2056. สวนที่ 2 คําถามที่ 14 = q214 เปนตน

Data codingการเตรียมขอมูลฯ

• คําถามคําตอบในแบบสอบถามสูการกําหนดระดับการวัด1. การวัดแบบกลุม (Nominal scale) –แบงกลุมได เชน เพศ

คณะ สาขาวิชา ฯลฯ2. การวัดแบบอันดับ (Ordinal scale) –แบงกลุมและเรียงอันดับ

ได เชน ช้ันยศ ฯลฯ3. การวัดแบบชวง (Interval scale) –มีศูนยไมแท เชน อุณหภูมิ

0 องศา ระดับความสงูจากนํ้าทะเล ฯลฯ4. การวัดแบบอัตรา (Ratio scale) –มีศูนยแท เชน

จํานวนบุตร รายได ฯลฯ

1. การวัดแบบกลุม (Nominal scale) –แบงกลุมได เชน เพศคณะ สาขาวิชา ฯลฯ

2. การวัดแบบอันดับ (Ordinal scale) –แบงกลุมและเรียงอันดับได เชน ช้ันยศ ฯลฯ

3. การวัดแบบชวง (Interval scale) –มีศูนยไมแท เชน อุณหภูมิ0 องศา ระดับความสงูจากนํ้าทะเล ฯลฯ

4. การวัดแบบอัตรา (Ratio scale) –มีศูนยแท เชนจํานวนบุตร รายได ฯลฯ

Data codingการเตรียมขอมูลฯ

• ตัวแปร ลักษณะของคําตอบ และระดับการวัดตัวแปรลักษณะของคําตอบ

เพศ (Gender หรือ Sex)

ปจจุบันมีแนวโนมแปลงเพศมากข้ึนและกลุมนีม้ีลักษณะพิเศษแตกตางจากเพศชายและหญิง!

Note

ระดับการวดั

ชายหญิง

กลุม

ปจจุบันมีแนวโนมแปลงเพศมากข้ึนและกลุมนีม้ีลักษณะพิเศษแตกตางจากเพศชายและหญิง!

Data codingการเตรียมขอมูลฯ

• ตัวแปร ลักษณะของคําตอบ และระดับการวัดตัวแปรลักษณะของคําตอบ

อายุ (Age)

1. เกิดวันที.่..........เดือน...........ป พ.ศ............2. ทานเกิดป พ.ศ. ........................3. ทานอายุ..............ป4.ตํ่ากวา 20 ป 20-24 ป25-29 ป 30 ปข้ึนไป

Note

ระดับการวดั

1. เกิดวันที.่..........เดือน...........ป พ.ศ............2. ทานเกิดป พ.ศ. ........................3. ทานอายุ..............ป4.ตํ่ากวา 20 ป 20-24 ป25-29 ป 30 ปข้ึนไป

อัตรา, ชวง, อันดับ

การวันเดือนปเกิดถือวาละเอียดและแมนยําท่ีสุด

Note

Data codingการเตรียมขอมูลฯ

• ตัวแปร ลักษณะของคําตอบ และระดับการวัดตัวแปรลักษณะของคําตอบ

การศึกษา (Educ)

1. สําเร็จการศึกษาสงูสุด........................(นํามาคํานวณ ปที่ศึกษา ภายหลงั)

2.ประถมและตํ่ากวามัธยม ปริญญาตรีปริญญาโทข้ึนไป

ระดับการวดั

1. สําเร็จการศึกษาสงูสุด........................(นํามาคํานวณ ปที่ศึกษา ภายหลงั)

2.ประถมและตํ่ากวามัธยม ปริญญาตรีปริญญาโทข้ึนไป

อัตรา, อันดับ

Data codingการเตรียมขอมูลฯ

• ตัวแปร ลักษณะของคําตอบ และระดับการวัดตัวแปรลักษณะของคําตอบ

อาชีพ (Occup หรือ Occupation)

รับราชการเกษตรกรคาขายและอาชีพอิสระรับจางอื่นๆ

ระดับการวดั

รับราชการเกษตรกรคาขายและอาชีพอิสระรับจางอื่นๆ

กลุม

Data codingการเตรียมขอมูลฯ

• ตัวแปร ลักษณะของคําตอบ และระดับการวัดตัวแปรลักษณะของคําตอบ

รายได (Income)

1. รายไดตอเดือน........................2. รายไดตอป........................3.ตํ่ากวา 15,000 บาท15,000-19,999 บาท20,000 บาทข้ึนไป (ตอเดือน)

ระดับการวดั

1. รายไดตอเดือน........................2. รายไดตอป........................3.ตํ่ากวา 15,000 บาท15,000-19,999 บาท20,000 บาทข้ึนไป (ตอเดือน)

อัตรา, อันดับ

Data codingการเตรียมขอมูลฯ

• ตัวแปร ลักษณะของคําตอบ และระดับการวัดตัวแปรลักษณะของคําตอบ

ความพึงพอใจ (Satisfaction)1.พอใจ ไมพอใจ2.ไมพอใจมาก = 1 คะแนนไมพอใจ = 2 คะแนนเฉยๆ = 3 คะแนนพอใจ = 4 คะแนนพอใจมาก = 5 คะแนน

ระดับการวดั

1.พอใจ ไมพอใจ2.ไมพอใจมาก = 1 คะแนนไมพอใจ = 2 คะแนนเฉยๆ = 3 คะแนนพอใจ = 4 คะแนนพอใจมาก = 5 คะแนน

กลุม, ชวง

Data codingการเตรียมขอมูลฯ

• การจัดทําคูมือลงรหัส (Code book)

Data codingการเตรียมขอมูลฯ

• การจัดทําคูมือลงรหัส (Code book)

Data codingการเตรียมขอมูลฯ

• ขอตกลงในการลงรหัสขอมูล1. กรณี ไมทราบ/ไมตอบ ในแบบสอบถาม เชน

การสอบถามวันเดือนปเกิดกําหนดรหสั 9 สําหรบั 1 digit 99 สําหรับ 2 digit

2. กรณี ไมเขาขาย ผูตอบไมอยูในขายตองตอบ เชน สอบถามประวัติการต้ังครรภ ในกลุมเพศชายกําหนดรหสั 8 สําหรบั 1 digit 98 สําหรับ 2 digit

3. ไมวากรณีใดๆ ก็ตาม หามขามการลงรหัสเด็ดขาด

1. กรณี ไมทราบ/ไมตอบ ในแบบสอบถาม เชนการสอบถามวันเดือนปเกิดกําหนดรหสั 9 สําหรบั 1 digit 99 สําหรับ 2 digit

2. กรณี ไมเขาขาย ผูตอบไมอยูในขายตองตอบ เชน สอบถามประวัติการต้ังครรภ ในกลุมเพศชายกําหนดรหสั 8 สําหรบั 1 digit 98 สําหรับ 2 digit

3. ไมวากรณีใดๆ ก็ตาม หามขามการลงรหัสเด็ดขาด

Data codingการเตรียมขอมูลฯ

• การวัดที่ละเอียด ดีกวา เพราะสามารถ Recode ได1. เกิดวันที.่....เดือน.....ป พ.ศ.....2. ทานเกิดป พ.ศ. .......................3. ทานอายุ..............ป4.ตํ่ากวา 20 ป 20-24 ป25-29 ป 30 ปข้ึนไป

ละเอียดชัดเจน แตยุงยากลดความยุงยาก งายข้ึนนิยมตอบลงทาย 0, 5

1. เกิดวันที.่....เดือน.....ป พ.ศ.....2. ทานเกิดป พ.ศ. .......................3. ทานอายุ..............ป4.ตํ่ากวา 20 ป 20-24 ป25-29 ป 30 ปข้ึนไป

นิยมตอบลงทาย 0, 5

มีแนวโนมขอมูลเอียงไปอยูในบางกลุมและแกไขปรบัปรุงยาก

ขอมูลสําหรับการวิเคราะหที่ดีประการหนึ่งตองกระจายตัวแบบปกติ

Data codingการเตรียมขอมูลฯ

• การลงรหัส 1 คําถาม หลายคําตอบ

ตัวอยาง: ขอ 3. ทานเกิดวันที่........เดือน..........ป พ.ศ..............ควรแยก 1 คําถามสู 3 ตัวแปร-> วัน, เดือน, ปขอ 4. ทานสังกัดแผนก ......... เขต ..............ควรแยก 1 คําถามสู 2 ตัวแปร-> แผนก, เขตขอ 4. ทานสังกัดแผนก ......... เขต ..............ควรแยก 1 คําถามสู 2 ตัวแปร-> แผนก, เขต

รหัสที่ละเอียดสามารถ recode สรางตัวแปรใหมๆ ไดในอนาคต

ขอ 5. ภูมิลําเนา อําเภอ......... จังหวัด ..............ควรแยก 1 คําถามสู 2 ตัวแปร-> อําเภอ, จังหวัด

Data codingการเตรียมขอมูลฯ

• การลงรหัสคําถามปลายเปด1. กรณีเปนตัวเลข ปรับเปนมาตรฐานแลวบันทึกตามรายงาน2. กรณีเปนกลุม หารหัสมาตรฐานจากหนวยงานที่เชื่อถอืได

-รหัส จังหวัด อําเภอ ตําบล -> NSO-รหัส การจําแนกโรค/การเจ็บปวย ICD-10

3. กรณีเปนความคิดเห็น จดบันทึกในสมุดลงรหัส (Code book)จําแนกเปน –รหัสกวางๆ สถานที่, เจาหนาที,่ ขั้นตอนบริการ

–รหัสแคบ หองน้ํา, หองบรรยาย, หองพัก–รหัสรายละเอียด ไมสะอาด, ไมพอ, น้ําไมไหล

1. กรณีเปนตัวเลข ปรับเปนมาตรฐานแลวบันทึกตามรายงาน2. กรณีเปนกลุม หารหัสมาตรฐานจากหนวยงานที่เชื่อถอืได

-รหัส จังหวัด อําเภอ ตําบล -> NSO-รหัส การจําแนกโรค/การเจ็บปวย ICD-10

3. กรณีเปนความคิดเห็น จดบันทึกในสมุดลงรหัส (Code book)จําแนกเปน –รหัสกวางๆ สถานที่, เจาหนาที,่ ขั้นตอนบริการ

–รหัสแคบ หองน้ํา, หองบรรยาย, หองพัก–รหัสรายละเอียด ไมสะอาด, ไมพอ, น้ําไมไหล

คําถามปลายเปดยาก! แตชวยใหนักวิจัยทราบความคิดเห็นของผูตอบไดดี

Verify & Enrichการเตรียมขอมูลฯ

• การตรวจสอบ/บรรณาธิการขอมูลในสํานักงาน1. วิธีการตรวจ –คนเดียว/หลายคน, ตรวจบางสวน/ทั้งฉบับ/สุม2. การแกไขและปรับปรุงขอมูล –ไมตอบ ตอบซํ้า ตอบหลายขอ3. การกระจายตัว และ การตัดกรณีผิดปกติ (Outliner Cases)4. การเปรียบเทียบขอมูล –อายุ อายุแรกสมรส5. การถวงนํ้าหนักกลุมตัวอยาง6. การจําแนกประเภทและกลุม –อาชีพ อายุ รายได7. การดําเนินการทางคณิตศาสตร –คะแนน ดัชนี รายไดสุทธิ

1. วิธีการตรวจ –คนเดียว/หลายคน, ตรวจบางสวน/ทั้งฉบับ/สุม2. การแกไขและปรับปรุงขอมูล –ไมตอบ ตอบซํ้า ตอบหลายขอ3. การกระจายตัว และ การตัดกรณีผิดปกติ (Outliner Cases)4. การเปรียบเทียบขอมูล –อายุ อายุแรกสมรส5. การถวงนํ้าหนักกลุมตัวอยาง6. การจําแนกประเภทและกลุม –อาชีพ อายุ รายได7. การดําเนินการทางคณิตศาสตร –คะแนน ดัชนี รายไดสุทธิ

Verify & Enrichการเตรียมขอมูลฯ• การตรวจสอบความผิดพลาดของการบันทึกขอมูล

1. วิธีการสุมตัวอยางเพื่อตรวจสอบการลงรหัสใชคําสั่งData>Select cases>Random sample of cases> Sample>เลือกขนาดตวัอยางที่ตองการ ไดทั้งจํานวนและรอยละ

• การตรวจสอบความผิดพลาดของการบันทึกขอมูล

1. วิธีการสุมตัวอยางเพื่อตรวจสอบการลงรหัสใชคําสั่งData>Select cases>Random sample of cases> Sample>เลือกขนาดตวัอยางที่ตองการ ไดทั้งจํานวนและรอยละ

Verify & Enrichการเตรียมขอมูลฯ

• การตรวจสอบความผิดพลาดของการบันทึกขอมูล2. วิธีตรวจสอบชวงของขอมูลที่ควรจะเปน

ปกติปกติ

ผิดปกติ

Verify & Enrichการเตรียมขอมูลฯ

• การตรวจสอบความผิดพลาดของการบันทึกขอมูล3. วิธีตรวจสอบระหวางตัวแปร (Cross check)

อายปัุจจบุนั >อายปัุจจบุนั >

ตวัแปรใหม่ = อายปัุจจบุนั -

0

ข้อมลูผิดปกติ ข้อมลูอยูใ่นเกณฑ์ปกติ

Rebuild missing dataการเตรียมขอมูลฯ

• การปรับปรงุแกไขขอมูล1. ผูใหขอมูลไมตอบคําถาม เชนรอยละ 19 ไมตอบ ป พ.ศ. ที่เกิด

1.1 การใชคาเฉลี่ยแทน1.2 การใชคาฐานนิยม1.3 การใชคาเทียบเคียงอื่นๆ เชน

ประสบการณทํางาน ระดับการศึกษา

Rebuild missing dataการเตรียมขอมูลฯ

• การปรับปรงุแกไขขอมูล2. ผูใหขอมูลตอบมากกวาหน่ึงคําตอบ เชนวันที่เหมาะสมสําหรบัการจัดฝกอบรม

2.1 สรางตัวแปรแยกตามคําตอบตัวแปรวันจันทร, วันอังคาร, ..., วันอาทิตย

2.2 สรางรหัสเพิ่มข้ึนมารองรบัวันทําการของราชการ วันจันทร-พฤหัสบดีวันพุธ-พฤหัสบดี หรือ อื่นๆ

Standardize dataการเตรียมขอมูลฯ

• การปรับขอมูลมีมาตราฐานเดียวกันกรณีคําตอบที่มีการวัด/หนวยวัดทีแ่ตกตางกัน เชนตัวแปรรายไดตอเดือน – เก็บขอมูลในเกษตรกรซ่ึงมีรายไดจากการขายผลผลิตตามฤดูกาล หรืออาชีพอิสระรับเหมาหรือขายแรงงาน ฯลฯตัวแปรเงินสงกลับ –บาท US-dollar Euroตัวแปรการศึกษา – ปวช. ปวส. อนุปริญญา ป.บัณฑิตป.7, มศ.5 หรือ จบเปรียญธรรม 9 ประโยค

กรณีคําตอบที่มีการวัด/หนวยวัดทีแ่ตกตางกัน เชนตัวแปรรายไดตอเดือน – เก็บขอมูลในเกษตรกรซ่ึงมีรายไดจากการขายผลผลิตตามฤดูกาล หรืออาชีพอิสระรับเหมาหรือขายแรงงาน ฯลฯตัวแปรเงินสงกลับ –บาท US-dollar Euroตัวแปรการศึกษา – ปวช. ปวส. อนุปริญญา ป.บัณฑิตป.7, มศ.5 หรือ จบเปรียญธรรม 9 ประโยค

Merge data setsการเตรียมขอมูลฯ

• การรวมชุดขอมูลดวย Case และ Variablesการตอ file ดวย case (ตัวอยาง)1. ตองมีช่ือตัวแปรและจาํนวนตัวแปรเหมือนกัน2. ตรวจความซํ้าซอนหมายเลข id ปองกันการนับซํ้า

การตอ file ดวย variables (ตัวแปร)

1. ตองมีช่ือตัวแปรและจาํนวนตัวแปรเหมือนกัน2. ตรวจความซํ้าซอนหมายเลข id ปองกันการนับซํ้า

1. ตองเรียงหมายเลข id จากนอยไปมากทัง้ 2 ชุด กอน2. ใชช่ือ variable ตองไมเหมือนกันในทั้ง 2 ชุด3. หมายเลข id ตองเหมือนและตรงกัน

หาก merge ไมสมบูรณจะเกิด missing system ในชุดขอมูล

Standardize dataการเตรียมขอมูลฯ

• การปรับขอมูลมีมาตราฐานเดียวกันกรณีคําตอบมี Scale ที่ตางกันทางคณิตศาสตร• ตัวแปรที่มีคาตํ่าสุดและคาสูงสุดทีแ่ตกตางกัน• ตัวแปรที่มีชวงที่แตกตางกัน คาตํ่าสุดและคาสงูสุดที่ไม

เทากัน และคาเฉลี่ยไมใกลเคียง

กรณีคําตอบมี Scale ที่ตางกันทางคณิตศาสตร• ตัวแปรที่มีคาตํ่าสุดและคาสูงสุดทีแ่ตกตางกัน• ตัวแปรที่มีชวงที่แตกตางกัน คาตํ่าสุดและคาสงูสุดที่ไม

เทากัน และคาเฉลี่ยไมใกลเคียง

การเปรียบเทียบจะตองเปลี่ยนตัวแปรใหมีคาต่ําสุดและคาสูงสุดเหมือนกัน หรือไมก็ทําคามาตรฐาน หรือ standardizing โดยใหคาmean = 0 หรืออกีวิธีหนึง่คือ การ rescaling

Normalize dataการเตรียมขอมูลฯ

• ขอมูลกระจายตัวไมปกติใชสถิติ Nonparametric แทนวัตถุประสงคในการวิเคราะห

กระจายตัวปกติ(parametric statistics)

กระจายตัวไมปกติ(nonparametric statistics)

ความแตกตางระหวางสองกลุมอิสระ

t test Wald-Wolfowitz runs testMann-Whitney U testKolmogorov-Smirnov two sample Z test

ความแตกตางระหวางสองกลุมอิสระ

Wald-Wolfowitz runs testMann-Whitney U testKolmogorov-Smirnov two sample Z test

ความแตกตางมากกวาสองกลุมอิสระ

ANOVA และF test

Kruskal-Wallis analysis of ranksMedian test

ความแตกตางระหวางสองกลุม

t test fordependent samples

Sign test;Wilcoxon’s matched pairs test;McNemar’s chi-square test

Normalize dataการเตรียมขอมูลฯ

• ขอมูลกระจายตัวไมปกติใชสถิติ Nonparametric แทน(2)วัตถุประสงคในการวิเคราะห

กระจายตัวปกติ(parametric statistics)

กระจายตัวไมปกติ(nonparametric statistics)

สองตัวแปรวัดในกลุมตัวอยางเดียวกัน

Repeated measuresANOVA

Friedman’s two-way analysis of variance;Cochran Q test

สองตัวแปรวัดในกลุมตัวอยางเดียวกัน

Repeated measuresANOVA

Friedman’s two-way analysis of variance;Cochran Q test

ความสัมพันธระหวางสองตัวแปร

Pearson’s r(interval variables)

Spearman’s Rho,Kendell’s tau,Gamma,Chi-square; Phi; Fisher’s exact test

การเตรียมตัวแปรสําหรับการวิเคราะหHow to prepare variables for analysis

“การเปลี่ยนคําตอบในแบบสอบถามสูตัวแปรสําหรับ

การวิเคราะหขอมูล”

How to prepare variables for analysis

De-Duplicateการเตรียมตัวแปรฯ

• การสรางตัวแปรใหม ตัวช้ีวัดหรือดัชนีดัชนีการพัฒนามนุษย Human Development Index: HDIประกอบดวย 3 มิติ –สุขภาพ การศึกษา รายได

ดัชนีมวลกาย Body Mass Index: BMI (นํ้าหนัก,สวนสูง)BMI = Weight/Height2

ตัวแปรความพึงพอใจรวม และความพึงพอใจรายดานใชคะแนนเฉลี่ยเปนรายดาน และภาพรวม

ตัวแปรใหมเพื่อปรับโครงสรางการกระจายตัว

ดัชนีการพัฒนามนุษย Human Development Index: HDIประกอบดวย 3 มิติ –สุขภาพ การศึกษา รายได

ดัชนีมวลกาย Body Mass Index: BMI (นํ้าหนัก,สวนสูง)BMI = Weight/Height2

ตัวแปรความพึงพอใจรวม และความพึงพอใจรายดานใชคะแนนเฉลี่ยเปนรายดาน และภาพรวม

ตัวแปรใหมเพื่อปรับโครงสรางการกระจายตัว***ตัวช้ีวัด/ดชันีควรเปนสากล เปนที่ยอมรับและใชได

Export dataการเตรียมตัวแปรฯ

• การนําขอมูลจากชุดขอมูลหน่ึงไปใชสรางตัวแปรใหมโดยคําสั่ง Aggregate data

ฐานขอมูลระดับจุลภาค ตัวแปรระดับมหภาคExportdata

ขอมูลระดับครัวเรือน ตัวแปรระดับชุมชนขอมูล จปฐ.

ขอมูลจําเปนพ้ืนฐานครัวเรือนขอมูล กชช 2 ค.

ขอมูลพ้ืนฐานระดับหมูบาน

Exportdata

ความพ่ึงพอใจรายขอ ความพ่ึงพอใจรายขอของกลุมประชากรความพ่ึงพอใจรายดาน ความพ่ึงพอใจรายดานของกลุมประชากร

กรณี: นําไปใชสําหรับงานสํารวจความพึงพอใจในงานบริการ

Import dataการเตรียมตัวแปรฯ

• การนําขอมูลใน Excel นําไปใชในโปรแกรม SPSSกําหนดแถวแรกเปนช่ือตัวแปร

สรางตารางขอมูลใน Sheet1

กําหนดแถวแรกเปนช่ือตัวแปร

สรางตารางขอมูลใน Sheet1

Measurementการเตรียมตัวแปรฯ

• การกําหนดและเปลี่ยนแปลงระดับการวัดของตัวแปร• ตัวแปรกลุม อันดับ สามารถปรบัเปน ตัวแปรชวง

โดยใชตัวแปรหุน (dummy var. มีคา 0,1)• ตัวแปรอันดับ ความพึงพอใจ ปรับเปน คาคะแนน• ตัวแปรชวง ปรบัเปนตัวแปรกลุมหรือตัวแปรอนัดับ

เพื่อสะดวกในการนําผลวิจัยไปใชและแปลผล• การปรับตัวแปรชวงเปนกลุมเพื่อ recode กลุมใหมีการ

กระจายตัวเหมาะสมสําหรับการวิเคราะห

• ตัวแปรกลุม อันดับ สามารถปรบัเปน ตัวแปรชวงโดยใชตัวแปรหุน (dummy var. มีคา 0,1)

• ตัวแปรอันดับ ความพึงพอใจ ปรับเปน คาคะแนน• ตัวแปรชวง ปรบัเปนตัวแปรกลุมหรือตัวแปรอนัดับ

เพื่อสะดวกในการนําผลวิจัยไปใชและแปลผล• การปรับตัวแปรชวงเปนกลุมเพื่อ recode กลุมใหมีการ

กระจายตัวเหมาะสมสําหรับการวิเคราะห

Normalize dataการเตรียมตัวแปรฯ

• การกระจายตัวของกลุมตัวอยางตัวแปรท่ีมีระดับการวัดแบบชวงและอัตราสวนควรมีการกระจายตัวแบบปกติ หรือแบบระฆังควํ่า

ตัวแปรท่ีมีระดับการวัดแบบชวงและอัตราสวนควรมีการกระจายตัวแบบปกติ หรือแบบระฆังควํ่า

Source: mathsisfun.com

Skewness (ความเบ) = 0 สมมาตร/ไมเบมีคา 0-0.5 เบเล็กนอย, 0.5-1 เบกลางๆ, 1-2 อยูในเกณฑรับได, 3+ ขอมูลเบKurotosis (ความโดง) = 0 ไมโดง ใชเกณฑเดียวกันกับ Skewness

Normalize dataการเตรียมตัวแปรฯ

• การแกไขความเบ (Skewness) ของขอมูล

Skewnessมีคาเปนบวก เบขวามีคาเปนลบ เบซาย

การแกไขคือจะตอง Transformation ขอมูล-เบขวา มากๆ ใช negative reciprocal root = -1/sqrt(oldvar)-เบขวา กลางๆ ใช log = lg10(oldvar)-เบขวา เล็กนอย-กลางๆ ใช square root = sqrt(oldvar)-เบซาย เล็กนอย-กลางๆ ใช square = (oldvar)^2-เบซาย มากๆ ใช cube = (oldvar)^3

Source: Vaus, 2004

Skewnessมีคาเปนบวก เบขวามีคาเปนลบ เบซาย

Normalize dataการเตรียมตัวแปรฯ

• การตัดตัวอยางผิดปกติ(Outlier & Extreme cases)ตัวอยางที่ผดิปกติจะมีอิทธิพลตอผลการวิเคราะหขอมูลมาก!

ตัวอยางมีคาสูงหรือตํ่ากวาปกติตัวอยางที่มีคาสุดข้ัว

• การตัดตัวอยางผิดปกติ(Outlier & Extreme cases)ตัวอยางที่ผดิปกติจะมีอิทธิพลตอผลการวิเคราะหขอมูลมาก!

ตัวอยางมีคาสูงหรือตํ่ากวาปกติตัวอยางที่มีคาสุดข้ัว

Normalize dataการเตรียมตัวแปรฯ

2 ตัวอยางที่ผิดปกติในกรณี2 ตัวแปรที่ควรตัดออกกอนวิเคราะห

2 ตัวอยางที่ผิดปกติในกรณี2 ตัวแปรที่ควรตัดออกกอนวิเคราะห

Normalize dataการเตรียมตัวแปรฯ

• การกระจายตัวของกลุมตัวอยาง

สําหรบัตัวแปรกลุมและอันดับ

ตัวแปรที่มี 2 กลุม สัดสวน คือ 50% 50%ตัวแปรที่มี 2 กลุม สัดสวน คือ 50% 50%ตัวแปรที่มี 3 กลุม สัดสวน คือ 33% 33% 33%ตัวแปรที่มี 4 กลุม สัดสวน คือ 25% 25% 25% 25%

กลุมทีมี่ความถี่นอยเกินไปเม่ือเทียบกับกลุมอื่น ตองถกูยุบ!

Normalize dataการเตรียมตัวแปรฯ

• การตรวจสอบการกระจายตัวของขอมูล

ขอมูลที่มีระดับการวัดแบบกลุม หรือ อันดับ

Enrich & Normalize data

ขนาดตัวอยางมีความแตกตางกันมาก เกิดการเลอืกตัวอยางลาํเอยีง (Bias)

Normalize dataการเตรียมตัวแปรฯ

• การถวงนํ้าหนักกลุมตัวอยางEnrich & Normalize data

โดยทั่วไป นักวิจัยจะตองยุบนิสิตคณะวิทยาศาสตรการกีฬาไปรวมกับนิสิตคณะศึกษาศาสตร แตการยุบรวมทําใหเสียความหมาย!

Normalize dataการเตรียมตัวแปรฯ

• การถวงนํ้าหนักกลุมตัวอยาง

กําหนดขนาดตัวอยางทีต่องการ เชน 120 คนคาถวงนํ้าหนักของคณะเกษตร = 120/114 = 1.053คณะวิศวกรรม = 120/89 = 1.348คณะศึกษาศาสตร = 120/59 = 2.034คณะศิลปศาสตร = 120/94 = 1.277คณะวิทยกีฬา = 120/17 = 7.059

Enrich & Normalize data

กําหนดขนาดตัวอยางทีต่องการ เชน 120 คนคาถวงนํ้าหนักของคณะเกษตร = 120/114 = 1.053คณะวิศวกรรม = 120/89 = 1.348คณะศึกษาศาสตร = 120/59 = 2.034คณะศิลปศาสตร = 120/94 = 1.277คณะวิทยกีฬา = 120/17 = 7.059

Normalize dataการเตรียมตัวแปรฯ

• การถวงนํ้าหนักกลุมตัวอยางEnrich & Normalize data

เม่ือทําการถวงนํ้าหนักแลวสัดสวนของแตละกลุมจะใกลเคียงกันมาก

Rearrange Categoriesการเตรียมตัวแปรฯ

• วิธีการจาํแนกกลุมของตัวแปร

1. แตละคําตอบ ไมควรมีความถ่ีนอยกวา 25 ราย2. คําตอบที่มีความถ่ีราว 20% ข้ึนไปตองจัดเปนกลุมพิเศษ3. คําตอบที่มีความถ่ีนอยตองถูกรวบใหมีขนาดใหญข้ึน4. ความถ่ีในแตละคําตอบควรใกลเคียงกับคาเฉลี่ย5. การรวมกลุมตองมีความหมาย มีเหตุผลและเปนสากล-อาชีพ: กลุมวางงานไมสามารถรวบกับกลุมอื่นๆ ได-หลีกเลี่ยงการใช กลุมอื่นๆ ไมทราบ ไมตอบ เพราะเปนกลุมที่ไมมีความหมายตอการแปลผลการวิจัย

1. แตละคําตอบ ไมควรมีความถ่ีนอยกวา 25 ราย2. คําตอบที่มีความถ่ีราว 20% ข้ึนไปตองจัดเปนกลุมพิเศษ3. คําตอบที่มีความถ่ีนอยตองถูกรวบใหมีขนาดใหญข้ึน4. ความถ่ีในแตละคําตอบควรใกลเคียงกับคาเฉลี่ย5. การรวมกลุมตองมีความหมาย มีเหตุผลและเปนสากล-อาชีพ: กลุมวางงานไมสามารถรวบกับกลุมอื่นๆ ได-หลีกเลี่ยงการใช กลุมอื่นๆ ไมทราบ ไมตอบ เพราะเปนกลุมที่ไมมีความหมายตอการแปลผลการวิจัย

Rearrange Categoriesการเตรียมตัวแปรฯ

ขอมูลสวนใหญราว 60% อยูในกลุม <25 ป ทําใหความแปรปรวนนอย

ขอมูลกระจายตัวไมดีตองปรับขอมูลกอนวิเคราะหขอมูลกระจายตัวไมดีตองปรับขอมูลกอนวิเคราะห

ขอมูลกระจายตัวคอนขางดี

กลุมอายุ อิงสัดสวนของตัวอยาง

Rearrange Categoriesการเตรียมตัวแปรฯ

ขอมูลกระจายตัวคอนขางดีแตควรปรับเปน 3,001 บาทข้ึนไป

ขอมูลกระจายตัวไมคอยดี ตองจัดกลุมใหมออกแบบคําตอบไมดี เชน ไมมีชองคําตอบสําหรับรายได 3,001-3,999 บาทตอเดือน

ออกแบบคําตอบไมดีขอมูลไมกระจายตัว จัดกลุมใหมลําบาก

Rearrange Categoriesการเตรียมตัวแปรฯ

กลุมนี้ควรจะสามารถจําแนกออกอีก เชน ป.4, ป.6 หรือ ป.7

ขอมูลเกินครึ่งอยูในกลุม 3-5 คน

ทําใหความแปรปรวนนอยลักษณะขอมูลกระจายตัวไมดี และปรับขอมูลยากเนื่องเก็บขอมูลหยาบ

Missing valuesการเตรียมตัวแปรฯ

Case var1 var2 var3 var4 var5 var6 var7 Total01 x Missing x x Missing x Missing Missing

02 x x x Missing x x x Missing

03 x x x x x x Missing Missing

• Missing สะสมมีผลกระทบตอจาํนวนตัวอยาง

03 x x x x x x Missing Missing

04 x x x x x Missing x Missing

05 x x Missing Missing x Missing x Missing

06 x x x x Missing Missing x Missing

07 Missing x x x x x Missing Missing

กรณีวิเคราะห var6 กับ var7 จะมีเพียง 1 case เทานั้นท่ีใชวิเคราะหได

การวิเคราะหขอมูล 1 ตัวแปรHow to analyze a single variable

“ผูวิจัยมีหนาท่ีตองพรรณาถึงสภาพขอมูลกอนการนําเสนอผลการวิเคราะห”

How to analyze a single variable

• เหตุผลในการใชสถิติเบือ้งตนในงานวิจัย

1. เพื่อทราบถึงสภาพที่แทจริงของขอมูล2. เพื่อกําหนดวิธีทางสถิติเพื่อทดสอบสิ่งที่ตองการ3. เพื่อนําเสนอผลการวิเคราะหที่ไดมาตรฐานสากล4. เพื่ออานและตีความผลการวิเคราะหไดถูกตอง

การวเิคราะหขอมลู 1 ตัวแปร

1. เพื่อทราบถึงสภาพที่แทจริงของขอมูล2. เพื่อกําหนดวิธีทางสถิติเพื่อทดสอบสิ่งที่ตองการ3. เพื่อนําเสนอผลการวิเคราะหที่ไดมาตรฐานสากล4. เพื่ออานและตีความผลการวิเคราะหไดถูกตอง

การวเิคราะหขอมลู 1 ตัวแปร

ตารางการกระจายอาชีพอาชีพ จํานวน รอยละ

เกษตรกร 45 27.8

• ตารางความถ่ีและรอยละ (ตัวแปรนามบัญยัติ)

เกษตรกร 45 27.8

คาขาย 24 14.8รับราชการ 35 21.6กรรมกร 39 24.1

วางงาน 19 11.7รวม 162 100.0

Note: เรียงกลุมตามความถ่ี จากมากไปนอย

การวเิคราะหขอมลู 1 ตัวแปร

• ตารางความถ่ีและรอยละ (ตัวแปรอันดับ)ตารางระดับการศึกษา

ระดับการศึกษา จํานวน รอยละประถมศกึษา 83 41.5ประถมศกึษา 83 41.5มัธยมศึกษาตอนตน 31 15.5มัธยมศึกษาตอนปลาย 33 16.5ปริญญาตรี 37 18.5ปริญญาโทขึ้นไป 17 8.0

รวม 201 100Note: เรียงกลุมตามอันดับกอนหลังของตัวแปร

การวเิคราะหขอมลู 1 ตัวแปร• ตารางสัดสวนรอยละตารางคุณสมบัติของประชากรตัวอยางในเขต xxx

N=1,250คุณสมบตัิ รอยละ

เพศ-ชาย 37.5

เพศ

การศกึษา

-มัธยมศกึษาตอนตน 20.0-มัธยมศกึษาตอนปลาย 21.0-ปริญญาตรี 22.0-ปริญญาโทและสูงกวา 11.0

-ชาย 37.5

-ประถมศกึษาและต่ํากวา 19.0

การวเิคราะหขอมลู 1 ตัวแปร

• สถิติพรรณา สาํหรบัตัวแปรที่มีคาตอเน่ือง

ตารางสถิตพิรรณนาของตัวแปรที่ศึกษาตัวแปร

ขนาดพื้นที่เพาะปลกูการเปนลูกหนี้ ธกส.

X26.24 9.75

S.D.Min0

Max120ขนาดพื้นที่เพาะปลกู

การเปนลูกหนี้ ธกส.อายุของหัวหนาครัวเรือนการศึกษาหัวหนาครัวเรือน

26.24 9.750.78 0.3545.65 12.2510.25 3.25

0025

120165154

ส่ิงท่ีควรมี• หมายเลขและชื่อตาราง• ตัวแปรกลุม ตองมีปายชื่อแตละกลุม• หัวตารางตองมีรอยละของขอมูล

ที่สามารถวิเคราะหได• จํานวนขอมูลทั้งหมดที่วิเคราะหได• จํานวนขอมูลที่ขาด (Missing case)• แหลงขอมูล• หมายเหตุ (เชน ตัวอยางคําถาม)

การนําเสนอตารางความถี่ (Frequency table)

ส่ิงท่ีไมควรมี• ทศนิยม• จํานวนตัวอยางใน

แตละกลุม• รอยละรวม• จํานวนกลุมตวัอยาง

ทั้งหมด

ส่ิงท่ีควรมี• หมายเลขและชื่อตาราง• ตัวแปรกลุม ตองมีปายชื่อแตละกลุม• หัวตารางตองมีรอยละของขอมูล

ที่สามารถวิเคราะหได• จํานวนขอมูลทั้งหมดที่วิเคราะหได• จํานวนขอมูลที่ขาด (Missing case)• แหลงขอมูล• หมายเหตุ (เชน ตัวอยางคําถาม)

ส่ิงท่ีไมควรมี• ทศนิยม• จํานวนตัวอยางใน

แตละกลุม• รอยละรวม• จํานวนกลุมตวัอยาง

ทั้งหมด

Source: Vaus, 2002

การนําเสนอตารางความถี่ (Frequency table)

ตาราง 4 ความพงึพอใจในงาน

ความพึงพอใจไมพึงพอใจมาก

ความถี่ รอยละ1,109 17.33

ความพึงพอใจไมพึงพอใจมาก

%17

ตาราง 4 ความพงึพอใจในงานตารางใหมตารางท่ัวไป

ไมพึงพอใจมากไมพึงพอใจพอใจปานกลางพึงพอใจพึงพอใจมากรวม

1,109 17.331,268 19.811,393 21.771,406 21.971,224 19.136,400 100.00

ไมพึงพอใจมากไมพึงพอใจพอใจปานกลางพึงพอใจพึงพอใจมากรวม = 6,400

1720222219

การนําเสนอตารางความถี่ (Frequency table)ตาราง 5 จํานวนสมาชิกในครัวเรือนขนาดครัวเรือน

1234

ความถี่ รอยละ2,466 38.531,651 25.80786 12.28851 13.30

ตาราง 5 จํานวนสมาชิกในครัวเรือนขนาดครัวเรือน

12

%3926

ตารางใหม

3456

786 12.28851 13.30436 6.81154 2.41

7 45 0.708 10 0.169 1 0.02รวม 6,400 100.00

23456

26121372

7 ขึ้นไป 1รวม = 6,400

การนําเสนอกราฟแทง

17

2022 22

19

15

20

25Percent Job Satisfaction

เรียงอนัดบั 2

0

5

10

Highly dissatisfied Somewhatdissatisfied

Neutral Somewhat satisfied Highly satisfied

Figure 1: Job Satisfaction

Source: XXX servey, 2010

Level of Satisfactionเรียงอนัดบั 1

เรียงอนัดบั 2

การนําเสนอกราฟแทง

39

30354045

Number of people in householdPercent

26

12 13

72 1

05

1015202530

1 2 3 4 5 6 7 and up

Source: XXX servey, 2010Household size

การนําเสนอกราฟแทง

700

800

900

1,000

-

100

200

300

400

500

600

<=19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70 & up

N

Source: XXX servey, 2010Age group

• สถิติทดสอบ -เปรียบเทียบคาเฉลีย่

สถติิอางอิงสําหรบั 1 ตัวแปร

จํานวนประเภท

การวัดแบบกลุมและอันดบั

การวัดแบบชวงและอตัราสวน

2 Binormial test •Binormial test•Confidence interval for mean, skewness andkurtosis

2 Binormial test •Binormial test•Confidence interval for mean, skewness andkurtosis

มากกวา2

One-samplechi-square test

•One-sample t test•One-sample Kolmogorov-Smirnov Z test•Confidence interval for mean, skewness andkurtosis

การวิเคราะหสถิติทดสอบ One-Sample T test• หาทดสอบคาเฉลี่ยของตัวอยางกับคาทดสอบ เชนสมมุติฐาน: หลอดไฟมีอายุใชงาน= 50,000 ช่ัวโมง

• ตัวแปรตองมีระดับการวัดแบบชวงข้ึนไป• คําสั่ง Analyze>Compare Means>One-Sample T test• Significant หมายถึง มีความแตกตางกัน หรอืไมเทากับคาทดสอบที่กําหนดไว

สถติิอางอิงสําหรบั 1 ตัวแปร

• หาทดสอบคาเฉลี่ยของตัวอยางกับคาทดสอบ เชนสมมุติฐาน: หลอดไฟมีอายุใชงาน= 50,000 ช่ัวโมง

• ตัวแปรตองมีระดับการวัดแบบชวงข้ึนไป• คําสั่ง Analyze>Compare Means>One-Sample T test• Significant หมายถึง มีความแตกตางกัน หรอืไมเทากับคาทดสอบที่กําหนดไว

การวิเคราะหสถิติทดสอบ One-Sample T testสถติิอางอิงสําหรบั 1 ตัวแปร

สมมุติฐานหลัก ความสูง=167cm, สมมุติฐานรอง ความสูง167cm

การวิเคราะหสถิติทดสอบ Paired-Sample T test

• หาทดสอบคาเฉลี่ยของตัวอยาง 2 ชวงเวลา เชนนํ้าหนักกอนและหลังเขาโปรแกรมลดนํ้าหนัก

• ตัวแปรตองมีระดับการวัดแบบชวงข้ึนไป• คําสั่ง Analyze>Compare Means>Paired-Sample T test• Significant หมายถึง มีความแตกตางกัน

สถติิอางอิงสําหรบั 1 ตัวแปร

• หาทดสอบคาเฉลี่ยของตัวอยาง 2 ชวงเวลา เชนนํ้าหนักกอนและหลังเขาโปรแกรมลดนํ้าหนัก

• ตัวแปรตองมีระดับการวัดแบบชวงข้ึนไป• คําสั่ง Analyze>Compare Means>Paired-Sample T test• Significant หมายถึง มีความแตกตางกัน

การวิเคราะหสถิติทดสอบ Paired-Sample T testสถติิอางอิงสําหรบั 1 ตัวแปร

น้ําหนักกอนและหลังโปรแกรมลดน้าํหนักแตกตางกนัอยางมีนัยสาํคัญ

การวิเคราะหสถิติทดสอบ One-Way ANOVA

• หาทดสอบคาเฉลี่ยระหวางกลุมและภายในกลุม เชนระดับคุณภาพชีวิตของนิสิตแตละคณะ

• ตัวแปรมีระดับการวัดแบบกลุมหรอือันดับ• คําสั่ง Analyze>Compare Means>One-Way ANOVA>กําหนด Factor>กําหนด Dependent List:>Post Hoc>Bonferroni

• Significant หมายถึง มีความแตกตางกัน

การวเิคราะหดวยสถติิเบื้องตน

• หาทดสอบคาเฉลี่ยระหวางกลุมและภายในกลุม เชนระดับคุณภาพชีวิตของนิสิตแตละคณะ

• ตัวแปรมีระดับการวัดแบบกลุมหรอือันดับ• คําสั่ง Analyze>Compare Means>One-Way ANOVA>กําหนด Factor>กําหนด Dependent List:>Post Hoc>Bonferroni

• Significant หมายถึง มีความแตกตางกัน

การวิเคราะหสถิติทดสอบ One-Way ANOVA

คุณภาพชีวิตของนิสิต (5ระดับ)แตละคณะมีความแตกตางกันอยางมีนัยสําคัญ

การวเิคราะหดวยสถติิเบื้องตน

คุณภาพชีวิตของนิสิต (5ระดับ)แตละคณะมีความแตกตางกันอยางมีนัยสําคัญ

การวเิคราะหดวยสถติิเบื้องตน

ตัวอยางผลของ One-Way ANOVA

คณุภาพชีวิตของนิสติคณะเกษตร แตกตา่งกบั

คณะวิทยาศาสตร์การกีฬาอยา่งมีนยัสําคญั

การวิเคราะหขอมูล 2 ตัวแปรHow to analyze two variables

“Conceptual Framework Diagramใชแสดงของเขตเนื้อหาของงานวิจัยวาประกอบดวยปจจัยทางดานใดบางและมีตัวแปรท่ีใชในการศึกษาใดบาง”

How to analyze two variables

การวิเคราะหตารางไขว และ Chi-square

• หาไดทัง้ความแตกตาง/ความสัมพันธระหวาง 2 ตัวแปร• ตัวแปรตองมีระดับการวัดแบบกลุมหรืออันดับ• คําสั่ง Analyze>Descriptive Statistics>Crosstabs• Significant หมายถึงมีความแตกตางกัน หรอื มีความสัมพันธกัน

การวเิคราะหขอมลู 2 ตัวแปร

• หาไดทัง้ความแตกตาง/ความสัมพันธระหวาง 2 ตัวแปร• ตัวแปรตองมีระดับการวัดแบบกลุมหรืออันดับ• คําสั่ง Analyze>Descriptive Statistics>Crosstabs• Significant หมายถึงมีความแตกตางกัน หรอื มีความสัมพันธกัน

การวเิคราะหขอมลู 2 ตัวแปร• การวิเคราะหเปรียบเทยีบคาเฉลี่ยของกลุม

คาเฉลี่ย

ระดับคะแนนภาวะโภชนาการของบุตรทีบ่ิดามีอาชีพตางกัน

อาชีพของบดิาคาเบี่ยงเบนมาตรฐาน

จํานวน

4.0ไมไดประกอบอาชีพ 1.41 2

คาเบี่ยงเบนมาตรฐาน

F = 3.3658; Sig F = .0109

4.0ไมไดประกอบอาชีพ 1.41 25.0เกษตรกร 1.71 1196.3คาขาย 1.61 126.2รับราชการ 2.63 204.9กรรมกร 1.97 455.1รวม 1.92 198

การวเิคราะหขอมลู 2 ตัวแปร• การทาํตารางไขว (Cross tabulation)

เกษตรกร

ตารางระดับโภชนาการของบุตรตามอาชีพผูปกครองระดับโภชนาการ

ของบุตร42.9ระดับ 1

ระดับ 2

คาขาย

8.3

รับราชการ

25.0

อื่นๆ

42.2

รวม

39.4

ระดับโภชนาการของบุตร

42.9ระดับ 1ระดับ 2 13.4

4.2ระดับ 3ปกติ 39.5

8.316.70.075.0

25.010.00.065.0

42.220.04.433.3

39.414.63.542.4

100.0รวม 100.0 100.0 100.0 100.0119จํานวน 12 20 45 196

Chi-Squared = 16.754; Significance = .15591

การวิเคราะหตารางไขว และ Chi-square

ความรูสกึตอรูปรางตนเอง n=111 n=40

รวมหญิง ชาย

ตาราง 1 ความรูสึกตอรูปรางตนเองตามเพศของผูตอบ

การวเิคราะหขอมลู 2 ตัวแปร

ความรูสกึตอรูปรางตนเอง n=111 n=40

ผอม 4.5 30.0 11.3สมสวน 22.5 20.0 21.9อวน 73.0 50.0 66.9รวม 100.0 100.0 100.0

Chi-squared = 19.383 Significance = .000

การวเิคราะหขอมลู 2 ตัวแปร

• ตารางไขว สําหรบัระดับการวัดแบบกลุมตารางการกระจายอัตราการเกดิโรคจําแนกตามงบประมาณสาธารณสุขที่ไดรับ

ต่ํา สูงงบประมาณที่ไดรับ

79.2 23.1นอย

อัตราการเกดิโรคตารางการกระจายอัตราการเกดิโรคจําแนกตามงบประมาณสาธารณสุขที่ไดรับ

การใหงบประมาณสาธารณสุขมาก จะมีอัตราการเกิดโรคมากตามไปดวย ?

79.2 23.1นอย20.8 76.9มาก100.0 100.0รวม24 26จํานวน

การวเิคราะหขอมลู 2 ตัวแปร• ตารางไขว สําหรบัระดับการวัดแบบกลุม

งบประมาณที่ไดรับ ต่ํา สูง

อัตราการเกิดโรค

รวม

ต่ํา สูง

อัตราการเกิดโรค

ต่ํา สูง

อัตราการเกิดโรค

ความถี่ในการใชมากความถี่ในการใชนอย

อัตราการเกดิโรค จําแนกตามงบประมาณและความถีใ่นการใชบริการ

เม่ือควบคุมอัตราความถี่ในการใชบริการสถานพยาบาลแลว แตไมพบความสัมพันธ !

งบประมาณที่ไดรับ

นอย

มาก

รวม

จาํนวน

ต่ํา สูง

79.2 23.1

20.8 76.9

100.0 100.0

24 26

ต่ํา สูง

90.0 83.3

10.0 16.7

100.0 100.0

20 6

ต่ํา สูง

25.0 5.0

75.0 95.0

100.0 100.0

4 20

การวิเคราะหความสัมพันธระหวางตัวแปร

• การใชกราฟ (Scattle/Dot)• การหาสหสมัพันธระหวางตัวแปร (Correlation)• การหาสมการเสนถดถอย (Regression)

การวเิคราะหดวยสถติิหลายตัวแปร

• การใชกราฟ (Scattle/Dot)• การหาสหสมัพันธระหวางตัวแปร (Correlation)• การหาสมการเสนถดถอย (Regression)

การใชกราฟ (Scatter/Dot)

คนที่มี IQ สูงจะเรียนเกงหรือมีคะแนนเฉลี่ย(GPA) สูงดวย

IQ และ GPA มีความสัมพันธกันเชิงบวก

การวเิคราะหดวยสถติิหลายตัวแปร

คนที่มี IQ สูงจะเรียนเกงหรือมีคะแนนเฉลี่ย(GPA) สูงดวย

การใชสหสมัพันธ (Correlation)การวเิคราะหดวยสถติิหลายตัวแปร

คนที่มี IQ สูงจะเรียนเกง

IQ และ GPA มีความสัมพันธกันเชิงบวกr= .986, r2= .972 หรอื IQ อธิบาย GPA ได 97.2%

การใชสมการถดถอย (Regression)

Sig = พบความสัมพันธr2 อธิบายได 14.9%

การวเิคราะหดวยสถติิหลายตัวแปร

การใชสมการถดถอย (Regression)การวเิคราะหดวยสถติิหลายตัวแปร

สมการพบความสัมพันธทกุตัว ยกเวนพื้นทีถ่ือครองทางการเกษตร

การแปลผลและการนําเสนอผล

How to interpret and present

“การวิเคราะหขอมูลตองสามารถนําไปสูการใชประโยชนและ

มีความหมาย”

• นําเสนออยางมีเปาหมาย ตองการใหผูอานทราบเรื่องใด• เสนอตารางเพื่อสื่อเพียง 1 ประเด็นไมซับซอนหรือไมนําเสนอหลายๆ ประเด็นในตารางเดียวกัน

• ไมตัดตารางจาก Output มาใช/วางแปะในรายงาน• เสนอเฉพาะที่จําเปน ไมนําเสนอขอมูลซํ้าซอน• สะอาดตา และเรียบงายดีที่สุด• การนําเสนอตารางที่มีความสมบูรณในตารางมีช่ือตาราง หมายเลขตาราง หนวยวัด

การแปรผลและนําเสนอผลการวิจัย

• นําเสนออยางมีเปาหมาย ตองการใหผูอานทราบเรื่องใด• เสนอตารางเพื่อสื่อเพียง 1 ประเด็นไมซับซอนหรือไมนําเสนอหลายๆ ประเด็นในตารางเดียวกัน

• ไมตัดตารางจาก Output มาใช/วางแปะในรายงาน• เสนอเฉพาะที่จําเปน ไมนําเสนอขอมูลซํ้าซอน• สะอาดตา และเรียบงายดีที่สุด• การนําเสนอตารางที่มีความสมบูรณในตารางมีช่ือตาราง หมายเลขตาราง หนวยวัด

สถิติพรรณา จาํนวนรอยละของกลุมตัวอยางตามระดับทศันคติ

ซํ้าซอนและทําใหสับสน

ที่มา: จุฑามาศ ผุนลาวงษและคณะ. 2552. ปจจัยที่มีอิทธิพลตอความพึงพอใจของผูใชบริการในศูนยสุขภาพชุมชนจังหสัดนครสวรรค.J Nurs Sci S1 2009; 27(2): 92-102.

การเปรียบเทียบคาเฉลีย่ความพึงพอใจกอนหลังโปรแกรม

ที่มา: ดวงกมล สายเทพและพนิดา ดามาพงศ. 2550. ผลของการใชโปรแกรมการจัดการบรกิารตามมาตรฐานการพยาบาลผูปวยนอกตอความพึงพอใจในบริการของผูรับบริการและระยะเวลารอคอยในแผนกผูปวยนอกโรงพยาบาลเมืองสุมทรปูเจาสมิงพราย. วารสารพยาบาลศาสตร มหาวิทยาลัยนเรศวร ปที่ 1 ฉบับที่ 2 หนา 76-91.

การนําเสนอผลวิเคราะห Chi-Square

การวิเคราะหChi-square3 ตัวแปร

ที่มา: สุชาติ ประสิทธิ์รฐัสินธุ. 2546

การวิเคราะหANOVA ทีมี่ตัวแปรผันรวมและการวิเคราะหปฎิกิริยาสองทาง(Interaction)

การวิเคราะหANOVA ทีมี่ตัวแปรผันรวมและการวิเคราะหปฎิกิริยาสองทาง(Interaction)

ที่มา: สุชาติ ประสิทธิ์รฐัสินธุ. 2546

การนําเสนอผลสหสัมพันธ หรือ Correlation

หากตองการวิเคราะห Regression ตอไป r ไมควรเกิน 0.7

การนําเสนอผลสหสัมพันธ หรือ Correlationเพื่อดูความสมัพันธระหวางตัวแปรตางๆ กับตัวแปรที่สนใจ

การนําเสนอผลสมการเสนถดถอย หรือ Multiple regression

การนําเสนอผลสมการเสนถดถอย หรือ Multiple regression

การนําเสนอผลสมการเสนถดถอย หรือ Multiple regression

การฝกปฎิบัติHow to practice for data analysis

“Learning…How to Playwith Data”

How to practice for data analysis

การสํารวจพฤติกรรมบริโภคกับความรูสึกตอรูปรางตนเอง

หมายเลข..................1. เพศ [ ] ชาย [ ] หญิง2. น้ําหนัก ................... กิโลกรัม3. สวนสูง ................... เซนติเมตร4. อาหารชอบรับประทานสวนใหญ (เลือกตอบได 1 ขอ)

[ ] แปงและน้ําตาล [ ] ผักและผลไม [ ] เนื้อสัตวและไขมัน5. ความรูสึกกับรูปรางของตนเอง (เลอืกตอบได 1 ขอ)

[ ] ผอมไป [ ] พอดสีุดๆ [ ] อวนไป

การฝกปฎิบัติ

การสํารวจพฤติกรรมบริโภคกับความรูสึกตอรูปรางตนเอง

หมายเลข..................1. เพศ [ ] ชาย [ ] หญิง2. น้ําหนัก ................... กิโลกรัม3. สวนสูง ................... เซนติเมตร4. อาหารชอบรับประทานสวนใหญ (เลือกตอบได 1 ขอ)

[ ] แปงและน้ําตาล [ ] ผักและผลไม [ ] เนื้อสัตวและไขมัน5. ความรูสึกกับรูปรางของตนเอง (เลอืกตอบได 1 ขอ)

[ ] ผอมไป [ ] พอดสีุดๆ [ ] อวนไป

ตัวแปร

คูมือลงรหัส (Code Book)

ความหมาย รหัส สดมสid หมายเลข xx 2sex เพศ ชาย (male) =1,

หญิง (female) =21sex เพศ ชาย (male) =1,

หญิง (female) =21

weight น้ําหนัก น้ําหนักตัว (kg.) 3Height ความสงู สวนสูง (cm.) 3

ตัวแปร

คูมือลงรหัส (Code Book) ตอ

ความหมาย รหัส สดมสFood อาหารโปรด แปงและน้ําตาล (carbohydrate) =1

ผักและผลไม (fiber&fruit) =2เนื้อสัตวและไขมัน (protein&fat) =3

1แปงและน้ําตาล (carbohydrate) =1ผักและผลไม (fiber&fruit) =2เนื้อสัตวและไขมัน (protein&fat) =3

Shape ความรูสกึตอรูปรางตนเอง

ผอมไป (thin/slim) =1พอดีสมสวน (fit) =2อวนไป (fat) =3

1

การสรางตารางบันทึกขอมูล

การลงรหัส

ทดลองฝกกรอกขอมลูดวยตนเอง 10 ชุด

การตอขอมูล หรือ Data merge

Clean data

Transform>Compute Variables>

การสรางตัวแปรใหม Body mass index: BMI

สูตรคํานวณของBMI = Weight

Height2Height2

หมายเหตุน้ําหนัก (กิโลกรัม)สวนสูง (เมตร)

การประเมินดัชนมีวลกายสูสดัสวนรูปราง

BMI การประเมินดัชนีมวลกายคนเอเชีย< 18.5 น้ําหนักนอยกวามาตรฐาน Underweight

18.5-22.9 ปกติ Normal23-24.9 อวนระดับ 1 Obese class 123-24.9 อวนระดับ 1 Obese class 125-29.9 อวนระดับ 2 Obese class 2

มากกวา 30 อวนระดับ 3 Obese class 3

ท่ีมา: กองออกกําลังกายเพ่ือสุขภาพ กรมอนามัย กระทรวงสาธารณสุข

Transform>Recode into different variables>เลือกตัวแปร BMI เขา>ตั้งช่ือ Output variable>Change> Old and New Values>กําหนดคาเกาและคาใหม> Add>เมื่อครบแลว Continue

การเปลีย่นแปลงคาตวัแปรใหม(Recode ตัวแปร) BMI

Transform>Recode into different variables>เลือกตัวแปร BMI เขา>ตั้งช่ือ Output variable>Change> Old and New Values>กําหนดคาเกาและคาใหม> Add>เมื่อครบแลว Continue

ข้ันตอนตอไป คือ

• ทดลอง Recode นํ้าหนัก และ สวนสูงเปนตัวแปรที่มีระดับการวัดแบบอันดับ 3 กลุม

• วิเคราะหสถิติพรรณา ทุกตัวแปร• วิเคราะหตารางไขว และ Chi-squareเชน เพศ, นํ้าหนัก, สวนสูง, BMI, ดัชนีมวลกายเอเชีย

• วิเคราะห Correlation นํ้าหนัก สวนสูง และ BMI• วิเคราะห Regression

• ทดลอง Recode นํ้าหนัก และ สวนสูงเปนตัวแปรที่มีระดับการวัดแบบอันดับ 3 กลุม

• วิเคราะหสถิติพรรณา ทุกตัวแปร• วิเคราะหตารางไขว และ Chi-squareเชน เพศ, นํ้าหนัก, สวนสูง, BMI, ดัชนีมวลกายเอเชีย

• วิเคราะห Correlation นํ้าหนัก สวนสูง และ BMI• วิเคราะห Regression

ยินดีรับขอคาํถามและแลกเปลี่ยนความคิดเหน็ทานสามารถ Download เอกสารนี้ไดที่

www.pirun.ku.ac.th/~fedutnw

thanutw@hotmail.comfedutnw@ku.ac.th

QR code

ยินดีรับขอคาํถามและแลกเปลี่ยนความคิดเหน็ทานสามารถ Download เอกสารนี้ไดที่

www.pirun.ku.ac.th/~fedutnw

top related