בדיקת השערות על השוואת שני סטטיסטים

Post on 19-Jan-2016

58 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

בדיקת השערות על השוואת שני סטטיסטים. השוואה בין סטטיסטים שנלקחו מאוכלוסיות שונות, למשל ממוצע הכנסה של נשים לעומת ממוצע הכנסה של גברים. השוואה בין סטטיסטים שנלקחו מאותה אוכלוסיה, למשל ממוצע ציונים של תלמידים לפני קורס ואחריו. השוואת ממוצעים מאוכלוסיות שונות. - PowerPoint PPT Presentation

TRANSCRIPT

בדיקת השערות על השוואת שני סטטיסטים

השוואה בין סטטיסטים שנלקחו מאוכלוסיות •שונות, למשל ממוצע הכנסה של נשים לעומת

ממוצע הכנסה של גברים.

השוואה בין סטטיסטים שנלקחו מאותה •אוכלוסיה, למשל ממוצע ציונים של תלמידים

לפני קורס ואחריו.

השוואת ממוצעים מאוכלוסיות שונות

נניח כי יש שני מדגמים בלתי-תלויים )לא •בהכרח בגדלים שווים(:

נרצה לבדוק את השערת האפס שהממוצעים • (.0שווים )שהפרש הממוצעים הוא

),(~,...,),(~,..., 221

211 YmXn NYYNXX

השוואת ממוצעים מאוכלוסיות שונות

כאשר המדגמים גדולים ,או ששתי האוכלוסיות •מתפלגות בהתפלגות נורמלית, שני הממוצעים יתפלגו

בהתפלגות נורמלית, ואז גם הפרשם מתפלג בהתפלגות נורמלית.

mn

NYX YX22

21 ,~

השוואת ממוצעים מאוכלוסיות שונות

: השונויות של שתי האוכלוסיות, מקרה ראשון•ידועות והן מתפלגות נורמלית.

במקרה הראשון משתמשים בהתפלגות נורמלית לבדיקת השערות על הפרש

הממוצעים.

דוגמת הנורות

בבית חרושת לנורות נלקחו נורות משני פסי • 100יצור. מפס היצור הראשון נלקח מדגם של

נורות. 75נורות ומפס היצור השני מדגם של אורך החיים הממוצע של נורות מפס היצור •

שעות, ומפס היצור השני 1190הראשון היה שעות.1230

90ידוע כי, סטית התקן בפס היצור הראשון היא • שעות.120שעות ובפס היצור השני

באורך החיים 5%האם יש הבדל במובהקות של •הממוצע של נורות בשני פסי היצור?

דוגמת הנורות

השערות:•

ההשערה היא דו-צדדית ולכן, אם רמת • לכל 2.5%, נבדוק עבור 5%המובהקות היא

צד.

0:0 yxH

1 : 0x yH

דוגמת הנורות

40-הפרש הממוצעים הוא •

16.52271סטית התקן של ההפרש הוא •

•normdist)-40,0,16.52271,true( = 0.0077

דוחים את השערת 0.025>0.0077מאחר ו-•האפס שהממוצעים שווים.

היינו 1%אם היינו בודקים ברמת מובהקות של •0.005<0.0077מקבלים את השערת האפס כי

דוגמת הנורות

באופן הבא:norminvיכולנו לפתור בעזרת •

• 32.384 = -NORMINV)0.025,0,16.52271(

- דוחים את השערת 32.3839- > 40מאחר ו •האפס שהממוצעים שווים.

:1%אם רמת המובהקות הייתה •

• 42.6( = -NORMINV)0.005,0, 16.52271

- מקבלים את השערת 42.5997- < 40מאחר ו •האפס שהממוצעים שווים.

השוואת ממוצעים מאוכלוסיות שונות

: כאשר נלקחים מדגמים גדולים מקרה שני•מהתפלגויות נורמליות שהשונויות שלהן אינן

ידועות, ניתן להשתמש בשונויות שחושבו במדגמים כהערכה לשונויות של האוכלוסיות,

ושוב להשתמש בהתפלגות הנורמלית לבדיקת השערות על הפרשי הממוצעים.

החישובים זהים למקרה הקודם, אלא • במקום sשמשתמשים ב-

המדגמיםשניעבורב-

השוואת ממוצעים מאוכלוסיות שונות

: כאשר המדגמים אינם גדולים, מקרה שלישי•וידוע שהמדגמים נלקחו מהתפלגויות

-nx+ny עם tנורמליות, משתמשים בהתפלגות ( 2 דרגות חופש )סכום גדלי המדגמים פחות 2

השוואת ממוצעים מאוכלוסיות שונות

אם נניח שהשונויות, משני המדגמים, שוות, •נוכל לתאר את ההתפלגות באופן הבא:

mnNYX

11,~ 221

השוואת ממוצעים מאוכלוסיות שונות

סטיות התקן המדגמיות אומדות את סטיית •התקן. כאשר יש שני אומדים לשונות, ניתן ליצור אומד שהוא ממוצע משוקלל של שני

האומדים )השקלול הוא לפי גודל המדגם, כך שהאומד מהמדגם הגדול יותר יקבל משקל

גדול יותר(. הממוצע המשוקלל נקרא האומד (:pooled varianceהמשותף לשונות )

2

)1()1( 222

mn

smsns YXp

השוואת ממוצעים מאוכלוסיות שונות

, נסמן לבדיקת ההשערה ברמת מובהקות •את הערך המתוקנן שהתקבל במדגם:

mns

yx

mns

yxt

pp

11

)(

11

)()( 21

דוגמת הציונים

ציונים של תלמידים לתואר שני 4נתונים • , וחמישה ציונים 100,80,78,90בקורס מסוים:

באותו קורס לתלמידי תואר ראשון 95,70,60,99,96.

מניחים כי השונויות של הציונים עבור תלמידי •תואר ראשון ושני שוות, וכי התפלגות הציונים

היא התפלגות נורמלית לכל קבוצה.

רוצים לבדוק אם הממוצעים של תלמידי תואר •.95%ראשון ושני, שווים ברמת מובהקות של

דוגמת הציונים

הפתרון מופיע בגיליון.•

0:0 yxH

1 : 0x yH

excel של ttestהפונקציה

משמשת להשוואת שני ממוצעים של מדגמים ע"י • פרמטרים. 4. לפונקציה tהתפלגות

שני הפרמטרים הראשונים הם המערכים המכילים את •ערכי המדגמים, שאת הממוצעים שלהם רוצים להשוות.

.2 או 1הפרמטר השלישי הוא מספר הזנבות בהשערה, • אם המדגמים מזווגים ) הסבר 1הפרמטר הרביעי הוא •

בהמשך(. מדגמים ומניחים שונויות שוות2 אם יש 2ערכו • להניח שהשונויות אי אפשר מדגמים ו2 אם יש 3ערכו •

שוות.

spss

הנתונים של שני המדגמים שאת ממוצעיהם •רוצים להשוות, חייבים להופיע בעמודה אחת.

בעמודה נוספת יופיע קוד המציין לכל שורה, •לאיזה משני המדגמים שייכת השורה. זהו

משתנה החלוקה.

spss

ובתת ההוראה analyzeמשתמשים בתפריט •compare means בוחרים את

indepedent-samples T-test.

מעבירים את המשתנה המכיל את המדידות •ימינה. את משתנה החלוקה מעבירים ל

grouping variable ע"י לחיצה על . define groups קובעים מהם שני הערכים המציינים ,

השתייכות לשני המדגמים.

spss

בודקים אם ניתן להניח שהשונויות output ה בחלון •בשתי האוכלוסיות שמהן נלקחו המדגמים, שוות.

.Fבדיקה זו מתבצעת ע"י התפלגות והמובהקות Fמתקבלת טבלה בה מופיע ערכו של •

. אינן שוותשלו. מובהקות קטנה, אומרת שהשונויות , מסתכלים ב אינה קטנה F המופיע אחרי sigאם sig מובהקות( t המופיע אחרי )t בשורה הראשונה

(equal variances )assumed. sig, מסתכלים ב קטנה F המופיע אחרי sigאם •

equal) בשורה השניה t( המופיע אחרי t)מובהקות )variances not assumed.

השוואת ממוצעים ממדגמים מזווגים

כאשר שני מדגמים בנויים כזוגות של תצפיות •שיש ביניהם תלות הם נקראים מדגמים

מזווגים.דוגמאות: שכר של אנשים לפני שנה והשכר של •

אותם האנשים היום, משקל של אנשים לפני דיאטה ומשקלם אחרי הדיאטה, תוצאות

בדיקת דם לפני לקיחת תרופה ואחריה. אם המדידות נעשו על אותם נדגמים, יש •

ביניהן תלות ולכן נשתמש בשיטה שונה מאשר עבור מדגמים בלתי-תלויים.

השוואת ממוצעים ממדגמים מזווגים

.nמספר הערכים בשני המדגמים שווה ושווה ל-•נניח שנתוני המדגם "לפני" ונתוני המדגם "אחרי" •

מגיעים מהתפלגות נורמלית בעלת תוחלת וסטיית תקן לא ידועים.

נחשב את ממוצע המדגם "לפני" ואת ממוצע •המדגם "אחרי"

נוכל ליצור מ"מ שהוא ההפרש בין זוג של מדידות, •מדידת "לפני" פחות מדידת "אחרי".

ההפרש מתפלג נורמלית עם ממוצע וסטיית תקן • לא ידועים.

X

Y

iii YXD

השוואת ממוצעים ממדגמים מזווגים

יצרנו בעיה מסוג שאנו כבר מכירים: בדיקת • תצפיות, כאשר השונות nעם השערות ל

אינה ידועה.

נפתור את הבעיה באופן בו פתרנו בעיות •דומות

דוגמת התרופה

נבדקה השפעת תרופה להורדת לחץ-דם על • חולים. לכל חולה, לחץ הדם 10מדגם של

נמדד לפני לקיחת התרופה ולאחר חודש של שימוש. נניח כי לחץ הדם מתפלג נורמלית.

נבדוק את ההשערה שהתרופה הורידה את •. 5%תוחלת לחץ הדם ברמת מובהקות של

spss

רושמים את הנתונים בשתי עמודות spssב •שונות

בכל שורה צריכים להופיע שני הנתונים •המתייחסים לאותה נקודת מדגם.

ובתת ההוראה analyze משתמשים בתפריט •compare means בוחרים את paired-

samples T test. מעבירים ימינה את זוג המשתנים המזווגים •

שאת ממוצעיהם רוצים לבדוק.

spss + ttest

של sig מסתכלים במובהקות outputבחלון • המתקבל. tערך

ערך זה צריך להיות קטן מהמובהקות שהוגדרה •מראש, כדי לדחות את ההנחה ששני

הממוצעים שווים.

עם ttest משתמשים בפונקציה excelב •.1פרמטר רביעי

השוואת שתי שונויות

כאשר רוצים לבדוק השערה ששתי שונויות •שוות זו לזו משתמשים בהתפלגות חדשה

.Fהנקראת התפלגות

היא שם F, גם התפלגות tבדומה להתפלגות •קיבוצי לאינסוף התפלגויות, אלא שלהתפלגות

F.יש שני פרמטרים של דרגות חופש

השוואת שתי שונויות

הבדיקה היא, האם השונויות של שני מדגמים •שנלקחו משתי אוכלוסיות המתפלגות כל

אחת בהתפלגות נורמלית, הן שוות. בודקים , כלומר 1במקום זאת, האם היחס ביניהן הוא

:1השערת האפס תהיה2

2

0 y

xH

השוואת שתי שונויות

כאשר שני המדגמים נלקחו מהתפלגויות •נורמליות, היחס בין שתי השונויות מתפלג

עם שני פרמטרים – הראשון Fבהתפלגות ( 1מספר דרגות החופש )גודל המדגם פחות

, והשני- מספר דרגות במונהשל המשתנה ( של המשתנה 1החופש )גודל המדגם פחות

.במכנה

נסמן זאת •21 ,F

finvהפונקציה

•Finv)probability,degF1,degF2(

הם מספר דרגות degF2 ו- degF1הפרמטרים •החופש של המדגם שהשונות שלו במונה

ובמכנה בהתאמה.

הפונקציה תיתן את הערך, שההסתברות לקבל •ערך גדול או שווה לו, היא המשתנה הראשון.

אינה סימטרית Fפונקצית ההתפלגות •

דוגמת חוזק החומר

חוקר בודק חוזק של חומר משני פסי יצור. מפס • ושונות 13היצור הראשון נלקח מדגם בגודל

. מפס היצור השני נלקח 1.3החוזק התקבלה כ , והשונות של החוזק התגלתה כ- 9מדגם בגודל

. השאלה היא האם ניתן להניח כי 0.45השונויות בשני פסי היצור זהות?

פתרון בגיליון.•

top related