התפלגות בינומית ומבחן הבינום

21
ןןןןןןן ןןןןןןן ןןןןן ןןןןןן ןןןן: ןןןן ןן ןןןן ןןןןן ןןןןן ןןן ןןןןןן ןןןןןן ןןן0.7 . ןןןןןן ןןןןן5 ןןןןןן ןןןןןן ןןן ןןןן3 ןןןןן ןןןן3087 . 0 3 . 0 * 7 . 0 * ! 2 !* 3 ! 5 3 . 0 * 7 . 0 * 3 5 2 3 2 3 ןןןןן ןןןן: ןןןן ןןן ןןןןןןןן ןןןןןן ןןןןןןן ןןןןן ןןןp ןןןןןןןןן ןןןןןןן ןןןq = 1-p . ןןןןןן ןןןןןןk ןןןןן ןןןןn ןןןןןןןן ן"ן ןןןן ן:k n k q p k n * * ןןן ןן ןןןןןןןןBernoulli : ןןןןןןןן ן"ן, ןןןן ןןן ןןןןןן2 ןןןןןן ןןןןןןן.Bernoulli (1645-1705)

Upload: jane-dickson

Post on 30-Dec-2015

27 views

Category:

Documents


1 download

DESCRIPTION

התפלגות בינומית ומבחן הבינום. תזכורת: הסיכוי של שחקן מסוים לקלוע לסל בזריקת עונשין הוא 0.7. מה הסיכוי שמתוך 5 זריקות עונשין הוא יקלע 3 פעמים בדיוק?. באופן כללי: - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: התפלגות בינומית ומבחן הבינום

התפלגות בינומית ומבחן הבינום

תזכורת:.0.7הסיכוי של שחקן מסוים לקלוע לסל בזריקת עונשין הוא

פעמים בדיוק?3 זריקות עונשין הוא יקלע 5מה הסיכוי שמתוך

3087.03.0*7.0*!2!*3

!53.0*7.0*

3

5 2323

באופן כללי: pבמצב שבו ההסתברות להצלחה בניסיון מסוים היא

פעמים k. הסיכוי להצליח q = 1-pוההסתברות לכישלון היא ניסיונות ב"ת שווה ל:nמתוך

knk qpk

n

**

תוצאות 2: ניסיונות ב"ת, כאשר לכל ניסיון Bernoulliאלה הם ניסיונות אפשריות.

Bernoulli (1645-1705)

Page 2: התפלגות בינומית ומבחן הבינום

n )מספר הצלחות מתוך kאם נחשב פונקצית הסתברות של ניסיונות(, נקבל התפלגות בינומית.

זריקות עונשין.5לדוגמא: מספר הקליעות מתוך

Kp)k(pמס' קליעות

00.00243

10.02835

20.13230

30.30870

40.36015

50.16807

41 3.07.01

5

50 3.07.00

5

32 3.07.02

5

23 3.07.03

5

14 3.07.04

5

05 3.07.05

5

Page 3: התפלגות בינומית ומבחן הבינום

:דוגמא תוצאות אפשריות2 ניסיונות כשבכל ניסיון 4

0413223140 14641 qpqpqpqpqp

knk qpk

n

**

Page 4: התפלגות בינומית ומבחן הבינום

, דהיינו התפלגות דגימהכל פונקצית הסתברות היא בעצם התפלגות תיאורטית המבוססת על אינסוף חזרות.

p )מספר הניסיונות( ו-n פרמטרים: 2להתפלגות הבינומית )הסתברות להצלחה בכל ניסיון(.

),(~ pnBx

)7.0,5(~ Bx

זריקות עונשים כשבכל זריקה 5דוגמא: מספר הקליעות מתוך 0.7הסיכוי לקליעה

אם נצייר את ההתפלגות שקיבלנו:

x כ-kנסמן את

Page 5: התפלגות בינומית ומבחן הבינום

יצרנו התפלגות דגימה תיאורטית מתוך אוכלוסייה בעלת זריקות, סיכוי להצלחה בכל זריקה 5פרמטרים נתונים )לדוגמא :

0.7. )כרגע אם יגיע שחקן הטוען שרמת משחקו היא כמו זו של השחקן

שלעיל, אנו נוכל לבחון עד כמה ביצועיו תואמים לאלו של השחקן המקורי.

נשמע מוכר?

ניתן לחשב את אזורי הדחייה באופן מדויק: קצוות ההתפלגות ( אחוז מהמקרים.100 )כפול הכוללים

Page 6: התפלגות בינומית ומבחן הבינום

פעמים עץ. האם 9 פעמים והתקבלו 10הטלנו מטבע מסוים ?95%( ברמת בטחון של p=1/2סביר להניח שהמטבע הוגן )

2

1:

2

1:

1

0

H

H

=0.05

אין השערה מראש

קביעת אזורי הדחייה: בכל זנב )השערה דו-צדדית( נחשב את /2השטח של הערכים הקיצוניים הכוללים פרופורציה של

מהמקרים. לכן תמיד /2מאחר והערכים בדידים לא נוכל להגיע בדיוק ל- על לא עולהנחמיר ונמצא את הערכים שהפרופורציה שלהם

/2.

הנחות: אי תלות בין ההטלות

:דוגמא

-הסיכוי להצלחה באוכלוסייה. ברב הספרים מסומן כ=p גם ,אנחנו לפעמים נשתמש בסימון זה.

Page 7: התפלגות בינומית ומבחן הבינום

לפניאנו מסכמים את ההסתברות המצטברת של הערכים עד אזור הדחייה:/2.100שעוברים את 5.05.0

0

10)0(

p

p(x1)=0.0107</2p(x2)=0.0547>/2

.x 1לכן אזור הדחייה בזנב התחתון ההתפלגות סימטרית, לכן מספר האיברים באזור הדחייה התחתון =1/2כאשר

שווה למספר האיברים באזור הדחייה העליון, לכן לא צריכים לחשב הסתברויות p(x1)= p(x9)נוספות.

x1 x9 אזור הדחייה: x<9>1אזור אי הדחייה:

זנב תחתון:

ולומר ברמת H0 נופל באזור הדחייה, מכאן שנוכל לדחות את 9 )לפחות( שהמטבע אינו הוגן.95%בטחון של

=COMBIN(10,A1)*POWER(0.5,A1)*POWER(0.5,10-A1)

Page 8: התפלגות בינומית ומבחן הבינום

(, מספר האיברים באזור 1/2כאשר ההתפלגות אינה סימטרית )הדחייה העליון עלול להיות שונה ממספר האיברים שבאזור הדחייה

התחתון.

קטן מדי, עלול להיות מקרה שבו אין איברים באזור הדחייה nאם )"אם כזה מספר קטן של ניסיונות לא ניתן להגיע לשום מסקנה

מדעית"(.n=5, =1/2p(0)=0.03125>0.025דוגמא:

כפי שכבר למדנו אם יש השערה מראש, לפני איסוף הנתונים, ניתן לשער השערה חד-צדדית.

Page 9: התפלגות בינומית ומבחן הבינום

לא מצליחים לאחסן זיכרונות חדשים. proactive amnesiaחולים הסובלים מ-חוקר טוען שחולים אלו אכן זוכרים אך הם לא מודעים לכך. בניסוי שתכנן,

צמדים של פריטים. בשלב ב' החולה נחשף 50בשלב א' חולה נחשף ל- צמדים )שמחציתם חדשים ומחציתם לא( ונשאל האם כל צמד וצמד 20ל-

הופיע בשלב א'. הצמדים. האם ניתן לומר שהוא לא 20 מתוך 18החולה הצליח לזהות נכון

?95%מנחש את תשובותיו ברמת בטחון של

2

1:

2

1:

1

0

H

H=0.05

הנחות: אי תלות בין הצמדים

אזור הדחייה:

x<15אזור אי הדחייה:

x15אזור הדחייה:

ולומר ברמת H0 נופל באזור הדחייה, לכן ניתן לדחות את 18 שהחולה אינו מנחש.95%בטחון של

:דוגמא

Page 10: התפלגות בינומית ומבחן הבינום

במקום לקבוע מראש את אזור/י הדחייה, ואז לבדוק אם מספר ה"הצלחות" שקיבלנו במדגם נופל באזור הדחייה או האי דחייה,

של המדגם: מה ההסתברות לקבל pעדיף לחשב את ערך ה-. אם ערך H0ערך כמו של המדגם )כולל( או קיצוני יותר תחת

בהשערה /2 בהשערה חד-צדדית או מ- קטן מ-pה-.H0דו-צדדית נוכל לדחות את

:בדוגמא שלעיל צמדים.20 מתוך 18החולה הצליח לזהות נכון

)20()19()18()18( pppxp

05.00002.0)18( xp לכן ניתן לדחות אתH0...

)כולל ערך המדגם(לכוון הזנב הערכים כל: תמיד מחשבים את השטח של הערה

Page 11: התפלגות בינומית ומבחן הבינום

( נקודתית, נוכל לחשב את H1כאשר קיימת השערה חלופית ) הנופל באזור הדחייה, במילים אחרות את H1השטח של

.H1ההסתברות של האיברים הנמצאים באזור הדחייה תחת

:דוגמא מהחולי הסובלים מסכיזופרניה מגיבים לתרופות 30%ידוע שרק

אנטיפסיכוטיות טיפיקליות. חוקר מצא תרופה חדשה אשר לטענתו יעילה יותר. הוא בחן

חולים חדשים.7אותה על

עוצמה

?=0.05א( מהן השערות המחקר ואזורי הדחייה עבור

3.0:

3.0:

1

0

H

H07 7.03.07

7)7(

p

x5אזור הדחייה:

Page 12: התפלגות בינומית ומבחן הבינום

ב( אם מתברר שהתרופה החדשה אכן יעילה יותר, ועוזרת ל- מהחולים, מה הסיכוי שהחוקר יחליט בצדק שהתרופה 50%

אכן יעילה?.p=0.5 כאשר p(x5)עלינו לחשב את

07 5.05.0

7

7)7(

p

1-=0.22656

p(schizo) = 0.3

0.08235

0.24706

0.31765

0.22689

0.09724

0.025000.00357 0.00022

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0.35

0 1 2 3 4 5 6 7

איזור הדחיה

p(schizo)=0.5

0.00781

0.05469

0.16406

0.27344 0.27344

0.16406

0.05469

0.00781250.00

0.05

0.10

0.15

0.20

0.25

0.30

0 1 2 3 4 5 6 7

β-1עוצמה =

Page 13: התפלגות בינומית ומבחן הבינום

החולים הגיבו לתרופה, מה תהיה מסקנת 7 מתוך 4ג( אם ?95%החוקר ברמת בטחון של

. ברמת H0 נופל באזור אי הדחייה, לכן לא ניתן לדחות את 4 לא ניתן לומר שהתרופה החדשה יעילה יותר 95%בטחון של

מהתרופות הטיפיקליות.

Page 14: התפלגות בינומית ומבחן הבינום

קירוב נורמלי של הבינום

ישנם מקרים בהם צורת ההתפלגות הבינומית מזכירה לנו את צורת ההתפלגות הנורמלית

n=10, p =1/2

מספיק גדול חוסר הסימטריה שבין n, אם 1/2גם כאשר הזנבות יהיה זניח.

n=20, p =0.3

Page 15: התפלגות בינומית ומבחן הבינום

מספיק גדול?nמה זה גדול n כך דרוש 1/2 שונה יותר מ-p. ככל ש-pזה פונקציה של

יותר.

pnxEx *)(

פעמים, כמה פעמים אנו נצפה שייפול על עץ? 10לדוגמא אם זורקים מטבע 10*1/2=5

qpnx **

, המבוסס על:De Moivre-Laplaceזהו פיתוח של 22 )()()( xExExVar

ניתן להוכיח ש:

כמו כן ניתן להוכיח ש:

pnxppx

nxxpxE

n

x

xnxn

x

*...*)1(*)()(00

( ניתן q ו-p הוא הקטן מבין p )כאשר n*p5: אם כלל אצבעלבצע קירוב נורמלי של הבינום. זאת אומרת שקיימת עקומה

נורמלית שאם "נלביש" אותה על ההתפלגות הבינומית, הפער שבין שתי ההתפלגויות יהיה זניח.

מה יהיו הפרמטרים של העקומה הנורמלית?

Page 16: התפלגות בינומית ומבחן הבינום
Page 17: התפלגות בינומית ומבחן הבינום

ההתפלגות הבינומית היא בדידה ואילו ההתפלגות הנורמלית רציפה, לכן בקירוב הנורמלי אנו נבצע תיקון לרציפות )שימוש

בגבולות אמיתיים(.

n=10 p=0.5

55.0*10* pnx

58.15.0*5.0*10** qpnx

:דוגמא

?p(x7)למה שווה

לפי הבינום המדויק:

p(x7)=0.1719

לפי הקירוב הנורמלי:p(x6.5)

95.058.1

55.6

z

1-NORMSDIST(0.95)=0.1712

.z בטבלת Cאו לחלופין עמודת

.1/2בזנב התחתון נוסיף

Page 18: התפלגות בינומית ומבחן הבינום

דוגמא:

. 0.4ידוע כי בכלל האוכלוסייה ההסתברות להיות חולה בשפעת ביום נתון היא המורה שושנה חוששת שמאחר ותלמידיה לא אוכלים מספיק ירקות, מערכת

החיסונית שלהם פגיעה יותר ולכן סיכויים לחלות גבוה יותר. ביום מסוים, מתוך שמספר החולים 95%. האם ניתן לומר ברמת בטחון של 12 תלמידים חלו 15

גבוהה במיוחד?

לפי הבינום המדויק:

6:

6:

1

0

H

H

n*p=15*0.4=6>5לכן ניתן לבצע קירוב לנורמלי.

6897.16.0*4.0*15 4.0:

4.0:

1

0

H

H

=0.05

9.2897.1

65.11

z

1-NORMSDIST(2.9)=0.0019<0.05

...H0 ניתן לדחות את 95%לכן ברמת בטחון של

הנחות: אי תלות בין הילדים

p(x12)=

. אין לעשות זאת!!nטעות נפוצה: לחלק את סטיית התקן של הת' הדגימה בשורש

Page 19: התפלגות בינומית ומבחן הבינום

מהי עוצמת המבחן שביצעת אם ידוע שבקרב ילדים שלא אוכלים מספיק ?0.5ירקות הסיכוי לחלות בשפעת הוא

חישוב אזור הדחייה:

x

xcc

xZ

xcxc zx *

12.9897.1*645.16 cx

אבל חייבים לעבור למסברים בדידים. אם מספר נופל ב"חלקו" באזור הדחייה באזור אי הדחייה.כולוו"חלקו" באזור אי הדחייה הוא יהיה

נופל חלקו באזור אי הדחייה לכן הוא ישתייך לאזור אי הדחייה.9במקרה שלנו

.x10אזור הדחייה:

.H1 תחת x10עוצמת המבחן שווה להסתברות לקבל

הבינום של הנורמלי הקירוב של 10: במקרה HH

94.15.0*5.0*151

H 5.75.0*151

H

03.194.1

5.75.9

z1-=1-NORMSDIST(1.03)=0.15

Page 20: התפלגות בינומית ומבחן הבינום

מבחן לבדיקת הבדל בין שתי פרופורציות עבור מדגמים גדולים

? באוכלוסייה, מה קורה כאשר אנו לא יודעים את tכמו במבחן מדגמים 2 למדגמים בלתי תלויים, ניתן לדגום tבמקביל למבחן

ולהשוות את פרופורציית ההצלחה ביניהם. למרות שאנו נעבוד עם סטטיסטיים במקום פרמטרים, עדיין

.zנשתמש בהתפלגות

211

210

:

:

H

H

221

21

21

1 pnn

np

nn

npc

מחשבים את:

סטטיסטי המבחן יהיה:

21

21

)1()1(

n

pp

n

pp

ppz

cccc

Page 21: התפלגות בינומית ומבחן הבינום

דוגמאהמורה שושנה חוששת שתלמידים תל-אביבים אשר לא אוכלים מספיק

30ירקות, פגיעים יותר לשפעת מאשר קיבוצניקים. היא דגמה מקרית קיבוצניקים ובדקה ביום מסוים את מספר החולים בכל 20תל-אביבים ו-

שמספר החולים גבוהה 95%מדגם. האם ניתן לומר ברמת בטחון של חולים בקרב ילדי ת"א 12יותר בקרב ילדים תל-אביבים, אם היא מצאה

בקרב הקיבוצניקים?5ו-

תאקיבוץ

תאקיבוץ

H

H

"1

"0

:

:=0.05

34.020

5*

50

20

30

12*

50

302

21

21

21

1

pnn

np

nn

npc

097.1

20

)34.01(34.0

30

)34.01(34.020

530

12

)1()1(

21

21

n

pp

n

pp

ppz

cccc

1-NORMSDIST(1.097)=0.136>0.05

z=1.097, p=0.136 לכן לא נוכל לדחות את H0 95% ברמת בטחון של.

עבור מדגמים גדולים התיקון לרציפות זניח