מצגת מסקנות לגבי סטטיסטיקה
TRANSCRIPT
מצגת סיכום "עד כאן" בסטטיסטיקה
עריכה: שחר עוז
מתוך: מצגות של ד"ר דורותי לנגלי וחומרים חיצוניים
2007 ביוני, 6
מדדי פיזורנטייה מרכזית
רמת מדידה
מובהקותקורלציההתפלגויותניתן ללחוץ על התפריט העליון
בכל שלב במצגת!
נספחים והבהרות יש אנימציה המדגישה את
הפרטים החשובים.
רווחסדרשמי / נומינלי
כמותי
יחס / מנה
איכותי
בדיד רציף
רציפות ללא מוגדר סדרמשמעות ליחס
בין ערכי המשתנה
רציפות ומשמעות ליחס
בין ערכי המשתנה
רמות המדידה
גיל, משקל, לחץ-דם
טמפ', מנת משכל
דרגות בצבא
מובהקות קורלציה התפלגויות מדדי פיזורנטייה מרכזית
רמת מדידה
ההפרשים בין סכוםערכי הסדרה לבין הממוצע הוא אפס.
ההפרשים מספרהחיוביים והשליליים בין
ערכי הסדרה לבין החציון שווה.
מדדי נטייה מרכזית
המסכם יחידהנטייה המרכזית היא ערך ומבליט תכונות מיוחדות של ההתפלגות
שכיחMode
חציוןMedian
ממוצעMean
הערך הנפוץ ביותר.
Xi-Mean) = 0 Median = n / 2
רמת מדידה
מובהקות קורלציה התפלגויות מדדי פיזור נטייה מרכזית
בחירת הערך המרכזי
רווח ומנה
סוג שמיסדרמשתנה
שכיח
חציון
ממוצע
שכיח
חציון
נטייה שכיחמרכזית מתאימה
, באופן מעשי נוהגים לחשב ממוצע גם למשתנה ברמת מדידה סדרהערה: למשל ממוצע עמדות בקשר להיגד מסוים. ניתן להצדיק פעולה זאת ככל שמספר הערכים שהמשתנה יכול לקבל גדול יותר ו/או אם המדגם גדול
(.30למדי )מעל
רמת מדידה
מובהקות קורלציה התפלגויות מדדי פיזור נטייה מרכזית
מדדי פיזור של הנתונים בהתפלגות
מושפע מהערכים הקיצוניים בלבד
מדד לא מקובל. יותר מקובל למדוד
את הסטיות המוחלטות מהחציון
כי הסכום מינימלי
abs(Xi-Mean)) /n
Xmax – X min
מדד המתאר פיזור ממוצע
סביב הממוצע של הסדרה. מדגיש את הערכים הקיצוניים
Xi – Xm) n-1(
מדד המתאר פיזור ממוצע
סביב הממוצע של הסדרה. מדגיש את הערכים הקיצוניים
תחוםRange
ערך יחיד המסכם את פיזור הנתונים
ממוצע סטיותMean spread
שונותVariance
סטיית תקןStandard deviation
abs(Xi-Median)) /n
Varp (RANGE)Stdevp (RANGE)
נטייה מרכזית
רמת מדידה
מובהקות קורלציה התפלגויות מדדי פיזור
צורות התפלגות נתונים
מטרה: להכין עקום המייצג הצגה רציפה של צורת ההתפלגות.
חשוב לזכור! השטח מתחת לעקום מייצג את סך המקרים שנבדקו.
מדדי פיזורנטייה מרכזית
רמת מדידה
מובהקות קורלציה התפלגויות
סוג שמיסדררווח ומנהמשתנה
שכיח
חציון
ממוצע
שכיח
חציון
נטייה שכיחמרכזית מתאימה
עמודוהסטוגרמהת
גרף עוגהמתאים
צורות גרפים
מדדי פיזורנטייה מרכזית
רמת מדידה
מובהקות קורלציה התפלגויות
לפי מספר השכיחים
לפי מידת הסימטריה
לפי פונקציהלפי צורה
צורות התפלגות נתוניםהאופן בו מתחלקת השכיחות של הערכים של המשתנה
הנמדד.
לא תמיד אפשרי.
דרכי איפיון
זנב שמאליזנב ימני התפלגות סימטריתהתפלגות חד שיאית
דו שיאית התפלגות התפלגות אחידה
מדדי פיזורנטייה מרכזית
רמת מדידה
מובהקות קורלציה התפלגויות
תכונות :התפלגות סימטרית, חד-שיאית ובצורת פעמון. •ממוצע וסטיית התקן מספיקים כדי לצייר את גרף •
ההתפלגות.השכיח = החציון = הממוצע.•
השכיחות של ערך מסוים של המשתנה מתוארת באמצעות הפונקציה:
2)(2
1
2
1)(
x
exf
ממוצע
סטיית התקן
= 3.14159
e= 2.71828
התפלגות נורמלית
מדדי פיזורנטייה מרכזית
רמת מדידה
מובהקות קורלציה התפלגויות
34%13.7%
2.15%0.15%
23 2 3
3210-3 -2 -1 Z
בתחום סטיית תקן 68.3%אחת בתחום שתי סטיות 95.4%תקן
בתחום שלש סטיות 99.7% בתחום סטיית התקן 34.13%תקן
הראשונה בתחום סטיית התקן השנייה13.59%
בתחום סטיית התקן 2.15%השלישית
בתחום סטיית התקן הרביעית0.15%
ממוצע סטיית התקן
Zציון התקן
התפלגות נורמלית
מדדי פיזורנטייה מרכזית
רמת מדידה
מובהקות קורלציה התפלגויות
תכונות :התפלגות סימטרית, חד-שיאית ובצורת פעמון. •ממוצע וסטיית התקן מספיקים כדי לצייר את גרף •
ההתפלגות.השכיח = החציון = הממוצע.•
x
z
כאשר:Z > 0הערך מעל לממוצע Z < 0הערך מתחת לממוצע Z = 0 הערך מתלכד עם
הממוצע
ציון התקןציון תקן מתאר מיקום יחסי של תצפית בסדרה
הסטטיסטית אליה היא שייכת ביחס לממוצע ולסטיית התקן.
)(מספר סטיות התקן )x(של ערך התצפית
.)(מהממוצע
הממוצע של ציון התקן הוא 0 ;
1וסטיית התקן שלו היא
מדדי פיזורנטייה מרכזית
רמת מדידה
מובהקות קורלציה התפלגויות
קשר שבין ציון התקן לשטח שמתחת לעקום 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.00.00000.00400.00800.01200.01600.01990.02390.02790.03190.0359
0.10.03980.04380.04780.05170.05570.05960.06360.06750.07140.0753
0.20.07930.08320.08710.09100.09480.09870.10260.10640.11030.1141
0.30.11790.12170.12550.12930.13310.13680.14060.14430.14800.1517
0.40.15540.15910.16280.16640.17000.17360.17720.18080.18440.18790.50.19150.19500.19850.20190.20540.20880.21230.21570.21900.22240.60.22570.22910.23240.23570.23890.24220.24540.24860.25170.2549
0.70.25800.26110.26420.26730.27040.27340.27640.27940.28230.2852
0.80.28810.29100.29390.29670.29950.30230.30510.30780.31060.3133
0.90.31590.31860.32120.32380.32640.32890.33150.33400.33650.3389
1.00.34130.34380.34610.34850.35080.35310.35540.35770.35990.3621
1.10.36430.36650.36860.37080.37290.37490.37700.37900.38100.3830
1.20.38490.38690.38880.39070.39250.39440.39620.39800.39970.4015
1.30.40320.40490.40660.40820.40990.41150.41310.41470.41620.4177
1.40.41920.42070.42220.42360.42510.42650.42790.42920.43060.4319
1.50.43320.43450.43570.43700.43820.43940.44060.44180.44290.4441
1.60.44520.44630.44740.44840.44950.45050.45150.45250.45350.4545
1.70.45540.45640.45730.45820.45910.45990.46080.46160.46250.4633
1.80.46410.46490.46560.46640.46710.46780.46860.46930.46990.4706
1.90.47130.47190.47260.47320.47380.47440.47500.47560.47610.47672.00.47720.47780.47830.47880.47930.47980.48030.48080.48120.4817
2.10.48210.48260.48300.48340.48380.48420.48460.48500.48540.4857
2.20.48610.48640.48680.48710.48750.48780.48810.48840.48870.4890
2.30.48930.48960.48980.49010.49040.49060.49090.49110.49130.4916
2.40.49180.49200.49220.49250.49270.49290.49310.49320.49340.4936
2.50.49380.49400.49410.49430.49450.49460.49480.49490.49510.4952
2.60.49530.49550.49560.49570.49590.49600.49610.49620.49630.4964
2.70.49650.49660.49670.49680.49690.49700.49710.49720.49730.4974
2.80.49740.49750.49760.49770.49770.49780.49790.49790.49800.4981
2.90.49810.49820.49820.49830.49840.49840.49850.49850.49860.4986
3.00.49870.49870.49870.49880.49880.49890.49890.49890.49900.4990
מדדי פיזורנטייה מרכזית
רמת מדידה
מובהקות קורלציה התפלגויות
x
z
התפלגויות
מתאם - קורלציהבין שני משתנים.עוצמת הקשר הליניארי מדד המתאר את
מתאים למשתנים ברמת רווח לפחות.
n
yyixxin 1
))((1 Cov (X,Y)
=
Pearsonמקדם המתאם של
Cov (X,Y)השונות היאהמשותפת של שני המשתנים:
y] [ Zx][1 .
1
Zn
n
rX,Y =
ממוצע של סכומי מכפלות ציוני התקן של שני המשתנים.
rxy = Cov (X,Y) / x y
רווח מתאים למשתנה מסוג .ומנה
מתאים למשתנה מסוג .סדר
הוא ההפרש בין הדרגות של Dכאשר ערכי המשתנים שביניהם מחפשים
קשר.
מקדם המתאם של Spearman
מדדי פיזורנטייה מרכזית
רמת מדידה
מובהקות קורלציה
קשר חיובי מושלם
r=1+r=1- r = 0
קשר שלילי מושלם אין קשר ליניארי
קשר שליליקשר חיוביחזקחלשחלש חזק
מתאם - קשר לינארי - עצמת הקשר הלינארי
ככל שהערך המוחלט של מקדם המתאם , עצמת הקשר הליניארי גדולה 1מתקרב ל
יותר.
התפלגויות מדדי פיזורנטייה מרכזית
רמת מדידה
מובהקות קורלציה
הן:Y=aX+bתכונות הישר סכום ריבועי הסטיות בין הערך
המחושב לערך התצפית יהיה מינימלי. סכום הסטיות בין התצפיות לערך
המחושב יהיה אפס.
מתאם - קשר לינארי - קו רגרסיה
הקו הישר המתאר את ההתפלגות בצורה הטובה ביותר.
הקשר בין נוסחת קו הרגרסיה לקורלציה:
b= Cov(X,Y) / x2
a= y-b*x
התפלגויות מדדי פיזורנטייה מרכזית
רמת מדידה
מובהקות קורלציה
NS
x
NS
xt
ˆˆ
1
)(2
ˆ2
N
XXiS
מותר לחשב רק עבור tאת אוכלוסיות המתפלגות באופן נורמלי,
אלא אם גודל המדגם הוא מעל נדגמים.100
t קטן ככל שהמדגם גדל )N ככל שההפרש בין ;(
הממוצע לתצפיות xהשונות קטן יותר
מובהקותקורלציה
- מובהקותtטבלת
S
נתונה אוכלוסייה נורמלית .2 ושונות בעלת ממוצע
ונחשב Nנוציא מדגם בגודל .השונות המתוקנתאת
מדד המסייע במדידת רמת הודאות של תוצאות קבוצות ולגבי אותו 2המחקר. המדד מחושב לגבי משתנה.
התפלגויות מדדי פיזורנטייה מרכזית
רמת מדידה
df\p0.40 40%
0.25 25%
0.10 10%
0.05 5%
0.025 2.5%
0.01 1%
0.005 0.5%
0.0005 0.05%
1 0.3249201.0000003.0776846.31375212.7062031.8205263.65674636.6192
2 0.2886750.8164971.8856182.9199864.302656.964569.9248431.5991
3 0.2766710.7648921.6377442.3533633.182454.540705.8409112.9240
4 0.2707220.7406971.5332062.1318472.776453.746954.604098.6103
5 0.2671810.7266871.4758842.0150482.570583.364934.032146.8688
6 0.2648350.7175581.4397561.9431802.446913.142673.707435.9588
7 0.2631670.7111421.4149241.8945792.364622.997953.499485.4079
8 0.2619210.7063871.3968151.8595482.306002.896463.355395.0413
9 0.2609550.7027221.3830291.8331132.262162.821443.249844.7809
10 0.2601850.6998121.3721841.8124612.228142.763773.169274.5869
11 0.2595560.6974451.3634301.7958852.200992.718083.105814.4370
12 0.2590330.6954831.3562171.7822882.178812.681003.054544.3178
13 0.2585910.6938291.3501711.7709332.160372.650313.012284.2208
14 0.2582130.6924171.3450301.7613102.144792.624492.976844.1405
15 0.2578850.6911971.3406061.7530502.131452.602482.946714.0728
16 0.2575990.6901321.3367571.7458842.119912.583492.920784.0150
17 0.2573470.6891951.3333791.7396072.109822.566932.898233.9651
18 0.2571230.6883641.3303911.7340642.100922.552382.878443.9216
19 0.2569230.6876211.3277281.7291332.093022.539482.860933.8834
20 0.2567430.6869541.3253411.7247182.085962.527982.845343.8495
21 0.2565800.6863521.3231881.7207432.079612.517652.831363.8193
22 0.2564320.6858051.3212371.7171442.073872.508322.818763.7921
23 0.2562970.6853061.3194601.7138722.068662.499872.807343.7676
24 0.2561730.6848501.3178361.7108822.063902.492162.796943.7454
25 0.2560600.6844301.3163451.7081412.059542.485112.787443.7251
26 0.2559550.6840431.3149721.7056182.055532.478632.778713.7066
27 0.2558580.6836851.3137031.7032882.051832.472662.770683.6896
28 0.2557680.6833531.3125271.7011312.048412.467142.763263.6739
29 0.2556840.6830441.3114341.6991272.045232.462022.756393.6594
30 0.2556050.6827561.3104151.6972612.042272.457262.750003.6460
inf0.2533470.6744901.2815521.6448541.959962.326352.575833.2905
NS
xt
ˆ
לפי tטבלת דרגות חופש
מובהקותקורלציה התפלגויות מדדי פיזורנטייה מרכזית
רמת מדידה
X2מבחן
מדד המתאר באיזה אופן התפלגות שכיחויות נתונה הייתה יכולה להתקבל באופן אקראי ממדגם גדול.
קשר בין זוג משתנים מסוג האם קיים מסייע בקביעה שמי ומעלה.
:X2מאפייני ההתפלגות של מקבלת רק מספרים חיוביים.•מאופיינת ע"י דרגות חופש.•. אסימטרית חיובית, חד שיאיתהתפלגות •ככל שדרגות החופש גדלות, הגבעה זזה •
ימינה. . 1כל השטח מתחת להתפלגות שווה ל-•
מובהקותקורלציה התפלגויות מדדי פיזורנטייה מרכזית
רמת מדידה
Chi-Square Dist
0 5 10 15 20 25 30
0.0
0.05
0.10
0.15
df=4df=5df=10df=13
X2:כתלות במספר דרגות החופש במדגם
ניתן לעשות זאת על-ידי שימוש בשכיח/ פתרון אחר
במקום הממוצע וסטיית התקן.
df\area
0.99599.5%
0.9999%
0.97597.5%
0.95095%
0.9090%
0.75075%
0.5050%
0.2525%
0.110%
0.055%
0.0252.5%
0.011%
0.0050.5%
1 0.000040.000160.000980.003930.015790.101530.454941.323302.705543.841465.023896.634907.87944
2 0.010030.020100.050640.102590.210720.575361.386292.772594.605175.991467.377769.2103410.59663
3 0.071720.114830.215800.351850.584371.212532.365974.108346.251397.814739.3484011.3448712.83816
4 0.206990.297110.484420.710721.063621.922563.356695.385277.779449.4877311.1432913.2767014.86026
5 0.411740.554300.831211.145481.610312.674604.351466.625689.2363611.0705012.8325015.0862716.74960
6 0.675730.872091.237341.635382.204133.454605.348127.8408010.6446412.5915914.4493816.8118918.54758
7 0.989261.239041.689872.167352.833114.254856.345819.0371512.0170414.0671416.0127618.4753120.27774
8 1.344411.646502.179732.732643.489545.070647.3441210.2188513.3615715.5073117.5345520.0902421.95495
9 1.734932.087902.700393.325114.168165.898838.3428311.3887514.6836616.9189819.0227721.6659923.58935
102.155862.558213.246973.940304.865186.737209.3418212.5488615.9871818.3070420.4831823.2092525.18818
112.603223.053483.815754.574815.577787.5841410.3410013.7006917.2750119.6751421.9200524.7249726.75685
123.073823.570574.403795.226036.303808.4384211.3403214.8454018.5493521.0260723.3366626.2169728.29952
133.565034.106925.008755.891867.041509.2990712.3397615.9839119.8119322.3620324.7356027.6882529.81947
144.074674.660435.628736.570637.7895310.1653113.3392717.1169321.0641423.6847926.1189529.1412431.31935
154.600925.229356.262147.260948.5467611.0365414.3388618.2450922.3071324.9957927.4883930.5779132.80132
165.142215.812216.907667.961659.3122411.9122215.3385019.3688623.5418326.2962328.8453531.9999334.26719
175.697226.407767.564198.6717610.0851912.7919316.3381820.4886824.7690427.5871130.1910133.4086635.71847
186.264807.014918.230759.3904610.8649413.6752917.3379021.6048925.9894228.8693031.5263834.8053137.15645
196.843977.632738.9065210.1170111.6509114.5620018.3376522.7178127.2035730.1435332.8523336.1908738.58226
207.433848.260409.5907810.8508112.4426115.4517719.3374323.8276928.4119831.4104334.1696137.5662339.99685
218.033658.8972010.2829011.5913113.2396016.3443820.3372324.9347829.6150932.6705735.4788838.9321741.40106
228.642729.5424910.9823212.3380114.0414917.2396221.3370426.0392730.8132833.9244436.7807140.2893642.79565
239.2604210.1957211.6885513.0905114.8479618.1373022.3368827.1413432.0069035.1724638.0756341.6384044.18128
249.8862310.8563612.4011513.8484315.6586819.0372523.3367328.2411533.1962436.4150339.3640842.9798245.55851
2510.5196511.5239813.1197214.6114116.4734119.9393424.3365929.3388534.3815937.6524840.6464744.3141046.92789
2611.1602412.1981513.8439015.3791617.2918820.8434325.3364630.4345735.5631738.8851441.9231745.6416848.28988
2711.8075912.8785014.5733816.1514018.1139021.7494026.3363431.5284136.7412240.1132743.1945146.9629449.64492
2812.4613413.5647115.3078616.9278818.9392422.6571627.3362332.6204937.9159241.3371444.4607948.2782450.99338
2913.1211514.2564516.0470717.7083719.7677423.5665928.3361333.7109139.0874742.5569745.7222949.5878852.33562
3013.7867214.9534616.7907718.4926620.5992324.4776129.3360334.7997440.2560243.7729746.9792450.8921853.67196
לפי X2טבלת דרגות חופש
מובהקותקורלציה התפלגויות מדדי פיזורנטייה מרכזית
רמת מדידה
באיזה אופן השתנה המשתנה בין הבדיקה הראשונה לבדיקה
השנייה.
באיזה אופן משפיע המשתנה על קבוצת הניסוי בהשוואה לקבוצת
הבקורת.
מדגמים מזווגיםPaired samples
מדגמים לא מזווגיםUnpaired samples
אותם נבדקים בשתי בדיקות (כל מבחנים).2נבדק עובר
נבדקים שונים (נבחרו באופן מקרי) בשתי בדיקות (כל נבדק
עובר מבחן אחד).
N-1=dfdf=)N1-1(+)N2-1(
קבוצות לא תואמות קבוצות תואמות
אופן ביצוע
המחקר:
אופי הבדיקה
עצמה:
חזרהנספחים והבהרות
dfסוגי מדגמים ודרגות החופש
כאשר בודקים תוצאות מחקר כלשהו ע"י בדיקת ממוצע ), ניתן לגלות כי הממוצעים Nמדגמים בגודל זהה (
יתפלגו באופן נורמאלי.
וטעות התקן של כל הממוצעים הוא הממוצע
גדול יותר, טעות התקן קטנה יותר . Nככל שהמדגם NN
נוכל להשתמש בתכונה זאת כאשר:
N≤30והתפלגות האוכלוסייה היא נורמאלית
30>N<100והתפלגות האוכלוסייה נוטה לסימטריה
N≥100.עבור כל אוכלוסייה
התפלגות הממוצעים בבדיקות חוזרות
חזרהנספחים והבהרות
סימולים מקובלים לתיאור מערך ניסוי
חזרהנספחים והבהרות
שלב הטיפול: ביצוע מניפולציה על המשתנה הבלתי תלוי
X
שלב התצפית: ביצוע מדידה של המשתנה התלוי
O
Rשל נבדקים בין הקבוצותהקצאה מקרית
של נבדקים בין הקצאה לא מקרית הקבוצות
- - - - -
מערך ניסויי אמיתי
מערך קדם-ניסויי
מערך דמוי-ניסויי
דוגמאות לרישומים כאלה:
Pre-Post without Control
ניתוח מקרהCase Study
Post with Control
X OO1 X O2X O1 - - - -
O2
חזרהנספחים והבהרותמערך ניסויי אמיתי
מערך קדם-ניסוי
י
מערך דמוי-ניסויי
הקצאה מקרית של נבדקים לקבוצות הניסוי והביקורת•
שליטה בעיתוי הפעלת הטיפול הניסויי, בבחירת מדדי המשתנה •התלוי, בזמן המדידה ואופייה.
R O1 X O2R O3 O4
R O1 X O2R O3 O4R X O5R O6
R X O1R O2
Solomon 4 group design
Post Only with Control
Pre-Post with Control
ביצוע של שתי ביצוע ניסוי על הגישות הללו יחד:
קבוצה )כולל קבוצת ביקורת(.
ביצוע בדיקה לפני הניסוי ובסופו )כולל קבוצת
ביקורת(.
חזרהנספחים והבהרות
מערך קדם-ניסויי
מערך דמוי-ניסויי
מערך ניסויי אמיתי
מערך קדם-ניסויי
Time Series ExperimentPre-Post with non equivalent Control
O1 O2 O3 O4 X O5 O6 O7 O8 O1 X O2 - - - - - - - -O3 O4
מחקר הערכה – מחקר שדה סיבתי
Evaluation Research
חזרהנספחים והבהרותמערך ניסויי אמיתי
מערך דמוי-ניסויי
הסוף
בהצלחה במבחן