data analysis for descriptive statistics - pirun web...
TRANSCRIPT
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentation
ดร.ฐณฐั วงศ์สายเชื อ20150402
da2008
Data Analysis for Descriptive Statistics
คณะศกึษาศาสตร์และพฒันศาสตร์Tel: 08-1923-0303E-mail: [email protected]: http://pirun.ku.ac.th/~fedutnw/
การวิเคราะห์ข้อมลูด้วยสถิตเชิงพรรณนา
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentation
การกระจายตวัแบบปกติ (Normal distribution)ปัญหาข้อมลูมีความเบ้ ?
• ข้อมลูมี Positive และ Negative skewness มีลกัษณะรูปร่างอยา่งไร?• กรณีทีข้อมลูมี Positive skewness ต้องแก้ไขปัญหาอยา่งไร?• กรณีทีข้อมลูมี Negative skewness ต้องแก้ไขปัญหาอยา่งไร?
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentation
ข้อมลูมีความเบ้
Positive Skew Negative SkewSymmetry
-1 ≤ Skewness ≥ 1Skewness > 1 Skewness < -1
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentation
การกระจายตวัแบบปกติ (Normal distribution): ปัญหาข้อมลูมีความเบ้
การแก้ไขความเบ้ วิธีหนึงคือต้อง Transformation ข้อมลู
1. หาก positive skew มากๆ ต้องใช้ negative reciprocal root = -1/sqrt(oldvar)2. หาก positive skew กลางๆ ต้องใช้ log = lg10(oldvar)3. หาก positive skew เลก็น้อย-กลางๆ ต้องใช้ square root = sqrt(oldvar)4. หาก negative skew เลก็น้อย-กลางๆ ต้องใช้ square = (oldvar)*(oldvar)5. หาก negative skew มากๆ ต้องใช้ cube = (oldvar)*(oldvar) *(oldvar)
Source: Vaus, 2002
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationงานวิจยัเชิงปริมาณทีผา่นมาของนิสติ
ให้นิสติเลา่ และแลกเปลียนถงึงานวิจยัของตนทีผา่นมา1. ชือเรือง โครงการวิจยั งานวิจยั วิทยานิพนธ์2. ความสําคญัและความเป็นมา3. งานวิจยัทีเกียวข้อง4. วตัถปุระสงค์5. ระเบียบวิธีวิจยั6. ขอบเขตการวิจยั7. ระยะเวลาทําวิจยั8. สถานทีทําการวิจยั หรือเก็บข้อมลู9. วิธีการวิเคราะห์ข้อมลูและนําเสนอ10. สรุปผลการวิจยั11. ประโยชน์ทีได้รับจากการวิจยั
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationการวิเคราะห์ข้อมลูด้วยสถิตเชิงพรรณนา
1. การกระจายตวั (Distribution)2. แนวโน้มเข้าสูส่ว่นกลาง (Central tendency)3. ความแปรปรวน (Variation)4. ความเบ้ (Skewness)
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationการนําเสนอสถิตเชิงพรรณนา
1. ตารางแจกแจงความถี (Frequency tables)2. กราฟ (Graphs)3. สถิติโดยภาพรวม (Summary statistics)
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationตารางความถี (Frequency table)
สิงทีควรมี1. มีหมายเลขตารางและชือตาราง2. ตวัแปรกลุม่ ต้องมีป้ายชือแตล่ะกลุม่3. หวัตารางต้องมีร้อยละของข้อมลู
ทีสามารถวิเคราะห์ได้4. จํานวนข้อมลูทั งหมดทีวิเคราะห์ได้5. จํานวนข้อมลูทีขาด (Missing case)6. แหลง่ข้อมลู7. หมายเหตุ (เช่น ตวัอยา่งข้อคําถาม)
Source: Vaus, 2002
สิงทีไมค่วรมี1. ทศนิยม2. จํานวนตวัอยา่งในแตล่ะกลุม่3. ร้อยละรวม4. จํานวนกลุม่ตวัอยา่งทั งหมด
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentation
ตวัอยา่งทีใช้ในรายวิชานี เป็นข้อมลูจากสํามะโนประชากรและเคหะ
ปี พ.ศ. 2543(ชดุข้อมลู 1%)
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationตาราง 1 จํานวนสมาชิกในครัวเรือน
Total member
14036 2.3 2.3 2.351958 8.7 8.7 11.0
107516 18.0 18.0 29.0170994 28.6 28.6 57.6123955 20.7 20.7 78.355542 9.3 9.3 87.632746 5.5 5.5 93.017896 3.0 3.0 96.010287 1.7 1.7 97.8
6400 1.1 1.1 98.82453 .4 .4 99.21944 .3 .3 99.61118 .2 .2 99.7
574 .1 .1 99.8375 .1 .1 99.9144 .0 .0 99.968 .0 .0 99.9
180 .0 .0 100.019 .0 .0 100.020 .0 .0 100.022 .0 .0 100.072 .0 .0 100.025 .0 .0 100.031 .0 .0 100.0
598375 100.0 100.0
123456789101112131415161718192022242531Total
ValidFrequency Percent Valid Percent
CumulativePercent
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationการใช้กราฟในแตล่ะประเภทข้อมลู
BarDot plotPie chartHistogramLine graphBox and whisker plot
Source: Vaus, 2002
FewFewFewManyManyMany
DiscreteDiscreteDiscreteContinuousContinuousContinuous
Usually nominal or ordinalUsually nominal or ordinalUsually nominal or ordinalIntervalIntervalOrdinal or interval
Type of graph # ofcategories
Discrete orcontinuous
Level of measurementof variable
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543
Bar graph
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543
Pie chart
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543
Histogram
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentation
Age group
0-45-910-1415-1920-2425-2930-3435-3940-4445-4950-5455-5960-6465-6970-7475-7980-8485-8990-9495-99Total
43,62150,00151,40852,57048,17451,63553,73853,22247,99738,36328,86822,58419,72014,99910,2495,8403,1641,493
512217
598,375
Frequency
สาํมะโนประชากรไทย ปี 2543
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543
Line graph
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543 Box plot
ยงัไมต่ดัoutlier cases
25%25%
25%
25%
Median
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543
Box plot
ตดัoutlier casesแล้ว
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and PresentationSummary statistics ในแตล่ะระดบัการวดั
Measure ofcentral tendency
Source: Vaus, 2002
Type of statistic
Measure ofdispersion
Mode Median Mean
Nominal Ordinal Interval
Variation ratio Range, decile range,Interquartile range
Variance,Standard deviation
Shape - - Skewness,Kurtosis
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543
Measures ofCentral Tendency
Statistics
Recode age598375
031.0030.00
35
ValidMissing
N
MeanMedianMode
Mode
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543
Measures ofDispersion
Variation ratio= 1-(31.4/100)= 0.69
Relationship to head of household
161920 27.1 27.1 27.1112631 18.8 18.8 45.9187600 31.4 31.4 77.230251 5.1 5.1 82.316810 2.8 2.8 85.1
44382 7.4 7.4 92.5
9688 1.6 1.6 94.130212 5.0 5.0 99.24881 .8 .8 100.0
598375 100.0 100.0
HH headWife/husbandUnmarried childrenMarried childrenChildren in-lawChildren of children,couples of childrenParents, grand parentsOther councilsOther residents, servantsTotal
ValidFrequency Percent Valid Percent
CumulativePercent
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543
Measures ofDispersion
= 98-0 = 98 yearsRange = Highest value – Lowest value
Range = 98 years
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543
Measures ofDispersion
10% Decile range (80%)
Decile range59 – 6 = 53 years
Statistics
Recode age598375
06.00
12.0018.0024.0030.0035.0041.0048.0059.00
ValidMissing
N
102030405060708090
Percentiles
10%
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543
Measures ofDispersion
25% Interquartilerange(50%)
Interquartile range44 – 15 = 29 years
25%
Statistics
Recode age598375
015.0030.0044.00
ValidMissing
N
255075
Percentiles
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentation
Statistics
598375 5983750 0
31.00 4.5119.513 1.955
380.776 3.82398 300 1
98 31
ValidMissing
N
MeanStd. DeviationVarianceRangeMinimumMaximum
Recode age Total member
Measures of Dispersion
sqrt (Variance) = Standard deviation
สาํมะโนประชากรไทย ปี 2543
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentation
Shape: Skewness & Kurtosisสาํมะโนประชากรไทย ปี 2543
Statistics
598375 5983750 0
31.00 4.5119.513 1.955
.445 1.592
.003 .003-.465 7.151.006 .006
ValidMissing
N
MeanStd. DeviationSkewnessStd. Error of SkewnessKurtosisStd. Error of Kurtosis
Recode age Total member
Positive Skew Negative SkewSymmetry
Positive Kurtosis Negative KurtosisNormal
-1 ≤ Skewness ≥ 1Skewness > 1 Skewness < -1
-1 ≤ Kurtosis ≥ 1Kurtosis > 1 Kurtosis < -1
Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development
190693 Data Analysis and Presentation