זיהוי מנגנונים ברשתות לימוד מקוונות - open u · web viewאחוז...

159
ההההההההההה הההההה הההההה הההההההה ההההה ההההה ההההה הההההההה הההההה ההההה ההההההה ההההה ההה הה ההההה הההה הההההההה ההההה הההה ההההה ההההההM.Sc . ההההה ההההה ההההההההההה הההההה הההההה ההההה ההההה הה ההה ההההה ההה

Upload: others

Post on 06-Mar-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הפתוחה האוניברסיטההמחשב ומדעי למתמטיקה המחלקה

זיהוי מנגנונים ברשתות לימוד מקוונות

עבודת תזה זו הוגשה כחלק מהדרישות לקבלת תואר. במדעי המחשבM.Sc מוסמך למדעים

באוניברסיטה הפתוחה החטיבה למדעי המחשב

על ידי מאזוז משה

העבודה הוכנה בהנחייתו של פרופסור ראובן אביב

2009אוקטובר

Page 2: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

1

Page 3: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

תוכן עניינים6.............................................................................................................................תקציר

7.......................................................................................................................מבוא110...........................................................................הרשתות מחקר תחום על רקע2

10...................................................................הרשתות בתחום כלליים מושגים2.111.........................................................................................רשתות של תכונות2.2

Small World........................................................................11- קטן עולם2.2.1

Clustering......................................................................11 או טרנזיטיביות2.2.2

Degree Distribution.................................................13- דרגות התפלגות2.2.3

Network resilience..............................................14- רשתות של עמידות2.2.4

Mixing patterns............................................................15– תבניות עירוב2.2.5

Degree correlations......................................................16– דרגות תיאום2.2.6

Community structure..................................................16– קהילתי מבנה2.2.7

2.2.8Betweens Centrality...............................................1717.....................................................................................האקראי הגרף מודל2.3

18........................................................................................המודל הגדרת2.3.118.............הגרף מבנה על קודקודים בין p הקישור הסתברות השפעת2.3.219....................................אמפיריות רשתות לעומת האקראי הגרף מודל2.3.320....................הקונפיגורציה מודל – האקראי הגרף מודל של הרחבות2.3.4

20......................................................................................"קטן עולם" רשתות2.421........................................................................................המודל תכונות2.4.1

21............................................................"מועדף קישור "מנגנון בעלי מודלים2.5

Price.....................................................................................22 של המודל2.5.1Albert & Barabasi..........................................................24 של המודל2.5.2

28.........................................................קודקודים של ושינוי להעתקה מודלים2.628...........................................................................לקשתות קישור מנגנון2.6.129.......................................................................קודקודים העתקת מנגנון2.6.230.........................................................................הרשת על הליכה מנגנון2.6.3

31.....................................................................................................המחקר מטרת332.........................................................................................................המידע בסיס433.........................................................................................רשתות ליצירת מודלים5

33...............................................................הרשתות קישוריות לבחינת מודלים5.133..................................................................המכוון האקראי הגרף מודל5.1.134..................................................................סטטי" מועדף קישור" מודל5.1.235...................................................................דינמי" מועדף קישור" מודל5.1.3

2

Page 4: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

37......................................................משופר דינמי" מועדף קישור" מודל5.1.438.............................................................................דינמית העתקה מודל5.1.539...................................................מכוונת גרסה– " הקטן העולם "מודל5.1.6

40...................................................ברשתות הקשרים עוצמת לבחינת מודלים5.240................................................מודל הגרף האקראי הממושקל המכוון5.2.141...................................................ממושקל סטטי" מועדף קישור" מודל5.2.241...................................................ממושקל דינמי" מועדף קישור" מודל5.2.341......................................משופר ממושקל דינמי" מועדף קישור" מודל5.2.442.........................................ממושקל דינמי סטטי" מועדף קישור" מודל5.2.5

43............................................................................................................מתודולוגיה643.................................................................................................מסווגים בניית6.144..............................................................................המסווגים עמידות בדיקת6.244............................................................................................המסווגים בחירת6.344.....................................................................................הזוכה המודל מציאת6.445.........................................................................הסיווג תוצאות איכות בדיקת6.5

47.................................................................................................................תוצאות747................................................................הרשתות קישוריות בחינת תוצאות7.1

47...........................................................................................הסיווג ביצוע7.1.151.......................................................................המסווגים עמידות בדיקת7.1.253...................................................................ביותר המתאים המודל זיהוי7.1.355.................................................................הסיווג תוצאות איכות בדיקת7.1.4

Weighted Case....................................................57– הקשרים עוצמת בחינת7.257...........................................................................................הסיווג ביצוע7.2.160............................................ביותר הטובה ההתאמה בעל המודל זיהוי7.2.262.......................................................................המסווגים עמידות בדיקת7.2.364.................................................................הסיווג תוצאות איכות בדיקת7.2.4

66.........................................................................................................ומסקנות דיון869..........................................................................................להמשך וכיוונים סיכום9

.מימדי רב תכונות במרחב מורכבות רשתות לייצוג Middendorf שיטת' - א נספח . .7171...........................................................................................................השיטה תיאור

73.........................................................................................................השיטה יתרונות73.......................................................................................................השיטה חסרונות

74..................................הבדיקות לביצוע ששימשה התוכנה חבילת תיאור' - ב נספח

74......................................................... (Attribute Creator ) המאפיינים מחולל. 1.ב74.....................................................................................................................מבנה82.....................................................................................המאפיינים מחולל הרצת

3

Page 5: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

83...........................................................................................הרשתות קבצי תיאור83....................................................................................................התוצאות תיאור

84........................................................... (Networks Classifier ) הרשתות מסווג. 2.ב84.....................................................................................................................מבנה87..........................................................................................הרשתות מסווג הרצת88....................................................................................................התוצאות תיאור

90........................................................ (Significance Finder ) המובהקות בודק. 3.ב90.....................................................................................................................מבנה92.......................................................................................המובהקות בודק הרצת93....................................................................................................התוצאות תיאור

94.........................................................................................................................מקורות

4

Page 6: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

רשימת טבלאות49........................א – אחוזי דיוק ממוצעים של המסווגים עבור המקרה הבינארי1טבלה 52................................................... – עמידות המסווגים עבור המקרה הבינארי2טבלה 53..................................א – ריכוז תוצאות סיווג הרשתות האמפיריות למודלים.3טבלה 54.......................................ב – תוצאות הסיווג המפורטות של רשתות למודלים3טבלה נתונים מפורטים של הסתברות תוצאות הסיווג בהתאם לכמות השגיאות-4טבלה

56................................................................................................................המירבית.56..............................- כמות המסווגים שנבדקו במסגרת בדיקת המובהקות5טבלה מס'

58......................א - אחוזי דיוק ממוצעים של המסווגים עבור המקרה הממושקל6טבלה 59...............ב – אחוזי דיוק של המסווגים הטובים ביותר עבור המקרה הממושקל6טבלה 60..................................... - ריכוז תוצאות סיווג הרשתות האמפיריות למודלים.7טבלה 61..... - ריכוז תוצאות סיווג הרשתות האמפיריות למודלים, כולל המודל המשולב.8טבלה - ריכוז תוצאות סיווג הרשתות האמפיריות למודלים, כולל שינויי ערכי9טבלה

WSPA.................................................................................61הפרמטרים של מודל ה-63.............................................. – עמידות המסווגים עבור המקרה הממושקל10טבלה : נתונים מפורטים של הסתברות תוצאות הסיווג בהתאם לכמות השגיאות11טבלה

65................................................................................................................המירבית.65............................- כמות המסווגים שנבדקו במסגרת בדיקת המובהקות12טבלה מס'

5

Page 7: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

רשימת תרשימים19...................................................אקראיים בגרפים הפאזה מעבר תופעת – 1 תרשים51............................... – היסטוגרמת עמידות המסווגים עבור המקרה הבינארי2תרשים - הקשר בין כמות טעויות הסיווג המירבית לבין הסתברות תוצאות הסיווג עבור3תרשים

55...................................................................................................המסווגים השונים.62............................ - היסטוגרמת עמידות המסווגים עבור המקרה הממושקל4תרשים - הקשר בין כמות טעויות הסיווג המירבית לבין הסתברות תוצאות הסיווג עבור5תרשים

64.......................................................................המסווגים השונים במקרה הממושקל.

6

Page 8: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

תקציר רשתות לימוד מקוונות משמשות ככלי לבניית ידע. רשתות אלו נוצרות על ידיבאמצעות המקושרים לומדים לקהיליית השייכים אנשים בין אינטראקציה

על משפיעים אשר המנגנונים את לזהות זו תזה עבודת של האינטרנט. מטרתה באמצעות נוצר ייצוג של הרשתות העבודה במסגרת. אלו רשתות של היווצרותן

"מתחום בכלים שימוש ונעשה, מימדי רב מאפיינים ווקטור ) "מכונה לימוד Machine Learning ) ליצירתסטוכסטיים מודלים מגוון מבין מי לגלות מנת על

זו בעבודה. המקוונות הלמידה רשתות ליצירת ביותר המתאים הינו רשתות בין הקשרים ועוצמת הקודקודים בין הקישוריות: הרשתות של היבטים שני נבדקו

,ברשת הקישוריות בחינת של במקרה כי הבדיקה מראות תוצאות. הקודקודים סטטי" מועדף צימוד "מסוג הינו המקוונות הרשתות יצירת על המשפיע המנגנון

(Preferential Attachment ,) כלומר, המשתתפים ברשת מעדיפים ליצור קשרים עם משתתפים שהינם בעלי משקל גבוה, כאשר משקל זה נקבע בזמן יצירת

המשפיע המנגנון זה במקרה גם כי מגלה ברשת הקשרים עוצמת בחינת הרשת."מסוג הינו הרשתות יצירת על זה במקרה כי אם, סטטי" מועדף צימוד

מתחילים נוספים מנגנונים כי וייתכן יותר, החלש ההתאמה של המודל מעט. הרשת מבנה על ולהשפיע לפעולה להיכנס

חלקים מתוצאות עבודת תזה זו הוצגו בכנסים הבאים:1. Chais 2009האדם הלומד בעידן הטכנולוגי, כנס צ'ייס השנתי הרביעי –

.2009למחקרי טכנולוגיות למידה, האוניברסיטה הפתוחה, פברואר 2. WEB 2009- The Eighth IASTED International Conference on Web-based

Education 2009, פוקט תאילנד, מרץ.

7

Page 9: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

מבוא1 רשתות: כגון, רשתות באמצעות לייצוג ניתנות תחומים במגוון רבות תופעות

ציטוטי רשתות, WWW-ה רשת, האינטרנט רשת, ביולוגיות רשתות, חברתיות על השפיעו אשר התפתחויות מספר התרחשו האחרון בעשור. ועוד מאמרים

:הרשתות מחקר תחוםוהן כרשתות לייצוג הניתן מידע נאסף בהם בתחומים הן עצום גידול חל

רשתות למנות ניתן אלו תחומים בין. הרשתות של ובמורכבות בגודל על המבוססות רשתות וכן, האינטרנט רשת התפתחות על המבוססות

של הגנום מיפוי את השאר בין כללו אשר הביולוגיה בתחום ההתפתחויות הזמינות הרשתות כמות מכך כתוצאה. יצורים שונים ובכללם הגנום האנושי

.משמעותי באופן גדלה למחקרבעלי כליםב יצירה ושימוש אפשרה המחשוב בכוח המתמדת ההתפתחות

הרשתות של אנליטי ניתוח. אלו רשתות לחקור המאפשרים רבה עוצמה כתוצאה או הרשתות של ומורכבותן גודלן עקב אפשרי תמיד איננו

ניתן אלו במקרים. הרשתות את לייצג המתיימרים המודלים של מהמורכבות התכונות את לבדוק וכך הרשתות של ממוחשבות בסימולציות שימוש לבצע. מאידך בהן המתרחש על לתובנות ולהגיע, מחד שלהן

הקישוריות מאופי בעיקר מושפעות הרשת תכונות כי וההבנה אלו התפתחויות הרשתות תכונות השוואת. הרשתות תכונות את לנתח לניסיונות הובילו

הקלאסי האקראי הגרף במודל שימוש באמצעות הנוצרות לרשתות האמפיריות(Erdos & R'enyi, 1960 ,) כי העלתה, הרשתות מחקר בעולם מקובל שהיה

המאפיינות מהתכונות שונות האמפיריות הרשתות של התכונות רבים במקרים. זה מודל באמצעות מחוללות אשר רשתות

( : Newman, 2003 )את למנות ניתן אלו תכונות ביןהתפלגות דרגות הקודקודים בגרף.מקדם ה ערך-Clustering :שלישי לצומת המקושרים צמתים ששני הסיכוי

.ביניהם מקושרים

היבטים במספר התמקד אשר הרשתות בתחום ענף מחקר החל מכך כתוצאה:וביניהם

8

Page 10: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

ברשתות חדשות תכונות וגילוי מוכרות תכונות של הערכים מציאת.1האמפיריות.

.האמפיריות הרשתות בתוך ( יםMotif ) טריוויאליים לא מבנים-תתי זיהוי.2.הרשתות היווצרות על המשפיעים מנגנונים זיהוי.3.בה המתרחשים תהליכים על הרשת מבנה השפעת בדיקת.4

זיהוי תזה עבודת בתחום עוסקת היווצרות על המשפיעים המנגנונים זו מנסים אשר רשתות ליצירת מודלים פיתוח על הרשתות. תחום זה מבוסס

מגוון הוצע האחרונות בשנים. האמפיריות הרשתות של התכונות את לחקות שונים מנגנונים על רשתות. מודלים אלו מבוססים לבניית מודלים של נרחב

& Watts: כגון שונים חוקרים ומכילים מרכיב סטוכסטי. המודלים הוצעו ע"י

Strogatz ) 1998(, Krapivsky et al ) 2002(, Vazquez ) 2002(, Shen-

Orr ) 2002 ( נוספים ורבים.

תכונות את לחקות מצליח אכן רשתות ליצירת מודל האם לבדוק מנת על לרשתות המוצע המודל בין התאמה בדיקת מבוצעת, האמפיריות הרשתות

מספר השוואת על מבוססת זו בדיקה לביצוע המקובלת השיטה. האמפיריות באמצעות הנבנות רשתות של למאפיינים הרשת של מרכזיים מאפיינים:מהותיים חסרונות משני סובלת זו גישה אולם. המודלים

אשר מתמצומצ מאפיינים קבוצת בדיקת פ"ע נעשית המודל מציאת.1.הבדיקה למטרות מוטה להיות עשויה מראש ולכן נבחרה

כי ייראו ההתאמה בדיקת תוצאות כי ייתכן, השונים המודלים ריבוי עקב.2 שלא דמיון ברמת, הנדרשות התכונות את מספקים מודלים מספר

.ביניהם אבחנה תאפשר

ניתוח למטרת זו בשיטה התאמה שהראה מודל על הסתמכות, כך עקב השונים מנגנונים על מבוססיםשונים ה ומודלים הואיל בעייתי הינו הרשת

, עשויים לתת התאמה דומה.מזה זה מהותית

שיטה ) Middendorf et al ) 2004 י"ע הוצעה זו בעיה על להתגבר על מנת זו שיטה. מידע כריית של טכניקות על המבוססת, רשתות לסיווג כללית

:עיקריים מרכיבים שני על מבוססת.שיטתי באופן רשת כל עבור מימדי רב מאפיינים ווקטור יצירת.1

9

Page 11: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

) במסווגים שימוש.2 Classifiers ) לאחד האמפירית הרשת לשיוך .המודלים

המקושרים אנשים בין אינטראקציה ידי על נוצרות מקוונות לימוד רשתות בקהיליית פעולה הרשתות נוצרות כתוצאה משיתוף .האינטרנט באמצעות .הקהילה חברי י"ע המפורסמות להודעות מענה מתן באמצעות הלומדים

Aviv et)אשר בדקו רשתות אלו קודמות עבודות al., 2007a, Aviv et al.,

2007b ) (.יםMotif ) ברשתות טריוויאליים לא מבנים של קיומם את זיהו הגרף למודל מתאימות אינן אלו רשתות כי זיהו אלו עבודות, כן-כמו

.יותר מורכבים אחרים למודלים מתאימות שהן ייתכן אולם, האקראי

הסיווג שימוש נעשה זו בתזה Middendorf י"ע שהוצעה בשיטת

המודל את למצוא מנת על מקוונות לימוד רשתות לניתוח (2004) אחר ולהתחקות לנסות ובכך, אלו רשתות להתפתחות ביותר המתאים. התופעה בבסיס העומד המנגנון

נושאי המחקר בתחום על כללי רקע: כדלהלן הוא זו תזה עבודת של המבנה בחלק מתוארת המחקר מטרת ניסוח. 2 בחלק מתואר האקראיות הרשתות

בוצע בהם רשתות ליצירת והמודלים המידע בסיס מתואר 5-ו 4 בחלקים. 3 אשר המתודולוגיה מתוארת 6 בחלק. בהתאמה, המחקר במסגרת שימוש

דיון. התוצאות מתוארות 7 ובחלק, התוצאות וניתוח לבדיקת שימשה מחקר להמשך וכיוונים מופיע סיכום 9, ובחלק 8ומסקנות מופיעים בחלק

.עתידי

10

Page 12: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

רקע על תחום מחקר הרשתות2 בשנים לפריחה זכהאשר נרחב מאוד תחום הינו הרשתות מחקר תחום

בתחום המחקר נושאי של קצרה סקירה מובאת זה בחלק. האחרונות הסקירה עוסקת בתכונות של רשתות אשר נמצאות במוקד המחקר. הרשתות

וכן במודלים המרכזיים ליצירת רשתות אקראיות שפותחו במטרה לדמות את מקיפות סקירות מספר על, בעיקרה, מבוססת הסקירההרשתות האמפיריות.

,) Newman ) 2003 (, Barabasi ) 2002: האחרונות בשנים פורסמו אשרButs ( 2008( .

מושגים כלליים בתחום הרשתות2.1 לאורך העבודה ייעשה שימוש במספר מושגים מתחום הרשתות. להלן מובא תיאור קצר של המושגים השונים והסימונים בהם ייעשה שימוש. במידת הצורך יובא תיאור

נרחב יותר של המושג במקומות הרלבנטיים.

עם( Nodes,Verticesקבוצה של עצמים המכונים קודקודים ): Networkרשת - . 1 )Graph "גרף" ( נקראת גם (. (Edgesקשרים ביניהם המכונים קשתות )

בספרות המתמטית (.2 .N :.מספר הקודקודים ברשת אשר, קשתות של סדורה קבוצת :j לקודקוד i קודקוד ) ביןPath( מסלול . 3

.j לקודקוד i מקודקוד באמצעותן להגיע ניתן .המסלול את המרכיבות הקשתות קבוצת גודל :Length-מסלול- אורך . 4

מסלול של המינימאלי האורך :Distanceקודקודים- בין מרחק .ℓמסומן ב-.d מסומן ב-. הקודקודים בין

– קליקה . 5 Clique: י"ע ישירות מחובר מהם זוג כל אשר קודקודים קבוצת .קשת

Undirectedמכוונת- לא רשת . 6 Network/Graph: כיוון מוגדר לא בה רשת .לקשתות

,כיוון מוגדר קשת כל עבור בה רשת :-Directed Network/Graph-מכוונת רשת . 7.נכנסת היא אליו וקודקוד יוצאת היא ממנו קודקוד לקשת שיש כך

Weightedרשת ממושקלת – . 8 Network/Graph :מוגדר משקל לכל רשת בה אחת מהקשתות.

11

Page 13: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

- רכיב . 9 , אשר בין כלמקסימאלית קודקודים קבוצת :Componentקשירות .מסלול קייםשניים מהם

: רכיב קשירות ברשתStrongly connected component -רכיב קשירות חזק . 10מכוונת בו ישנו מסלול מכוון בין כל זוג קודקודים.

.קשירות רכיבי מספר ישנם בה רשת :קשירה לא רשת . 11 ישירות המקושרים ברשת הקודקודים כמות :Degreeהקודקוד- דרגת . 12

.לקודקוד היוצאות קשתות כמות, מכוונת ברשת :OutDegreeקודקוד- של יציאה דרגה. 13

.מהקודקוד הנכנסות הקשתות כמות, מכוונת ברשת :InDegree קודקוד- של כניסה דרגה. 14

.לקודקוד.ברשת קודקודים זוג בין ביותר הקצר המסלול :Geodesic Path-גיאודזי מסלול. 15 את מקיים אשר ברשתחזק קשירות רכיב :Giant Strong Componentענק- רכיב. 16

לכמות פרופורציונאלי מכיל שהוא הקודקודים מספר: הבאים התנאים סדר אותו את המכילים ברשת קשירות רכיבי קיימים ולא, ברשת הקודקודים

.מלבדו קודקודים של גודלמידה . 17 חסרת Scale– רשת Free Networkדרגות התפלגות בעלת רשת :

(.2.2.3קודקודים מעריכית. ) ראה פירוט בסעיף

תכונות של רשתות2.2 שזכו התכונות בין. האחרונות השנים במהלך נחקרו רשתות של רבות תכונות:הבאות התכונות את למנות ניתן המחקרים במוקד להיות

Small World - עולם קטן 2.2.1 ,Milgram)ע"י מילגרם מפורסם ניסוי נערך 20-ה המאה של 60-ה בשנות

מסוים, למען מכתבים להעביר סטודנטים התבקשו זה במהלך ניסוי(. 1967 לאנשים העברתם באמצעות להם. המכתבים הועברו מוכר היה לא אשר

טוב המשימה את לבצע יוכלו לדעתם אשר, אישית להם המוכרים, אחרים ועברו ליעדם הגיעו כרבע אולם הניסוי במהלך אבדו המכתבים רוב. יותר

"לכינוי זכתה זו תופעה. בלבד אנשים כששה דרך בממוצע " )קטן עולם Small World ) המרחק בהן רשתות המאפיינת התכונה היא כללי ובאופן

.ברשת הקודקודים לכמות יחסית קטן הינו הקודקודים זוגות כל בין הממוצע

12

Page 14: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

,קשירות לא ברשתות קודקודים בין ממוצע מרחק למדוד היכולת חוסר עקב .שונים קשירות לרכיבי השייכים קודקודים מזוגות זה בחישוב להתעלם נהוג

המרחק בהן לרשתות Small-World-ה תכונת את מייחסים, פורמאלי באופן לכמות יחסית לוגריתמי באופן גדל הקודקודים זוגות כל בין הממוצע

(, Scale Free" ) מידה חסרות "רשתות עבור. ברשת הקודקודים )הוכח Bollob´as & Riordan, 2002 ) שערכו זה יחס על עליון חסם log N / log log N,

הינו מספר הקודקודים ברשת.Nכאשר

Clustering טרנזיטיביות או 2.2.2 וקודקוד, B לקודקוד ישירות מקושר A קודקוד אם כי התגלה רבות ברשתות

B לקודקוד ישירות מקושר C שקיים קישור מוגברת הסתברות קיימת אזי קודקוד בין שתכונת לומר ניתן טופולוגית מבחינה. C לקודקוד A ישיר

.3 בגודל קליקות – ברשת" משולשים "בקיום ביטוי לידי באה הטרנזיטיביות קודקודים ששני ההסתברות הינו Clustering-מקדם ה ערך, אחרות במילים-ה ערך מקדם . בעצמם שכנים גם הם שלישי קודקוד של שכנים שהינם

Clustering הרשת ברמת והן הקודקוד ברמת הן להגדרה ניתן.

המקדם ערך, הבודד הקודקוד ברמת-Clustering כמספר מוגדר ,השכנים בין האפשריים הקשרים כלל חלקי הקודקוד שכני בין הקשרים

clustering-המקדם ערך מוגדר, 1 או 0 שדרגתם קודקודים עבור כאשר

.0 להיות שלהם

המקדם ערך-Clustering שאינן דרכים בשלוש להגדרה ניתן רשת של :שקולות

.הרשת קודקודי של Clustering-המקדם ערך ממוצעא.

המשולשים מספר כפול 3, דיוק ביתר או. ברשת" משולשים"ה אחוזב. אחד קודקוד לפחות בהן קודקודים של השלשות כמות חלקי ברשת מכך נובעת 3-ב להכפלה הסיבה. האחרים הקודקודים לשני קשור נספרת למשנהו מקושר קודקוד כל בהן קודקודים של שלשה שכל

לשני קשור אחד קודקוד לפחות בהם קודקודים של שלשות כשלוש-המקדם ערך את לנרמל מאפשרת זו הכפלה. האחרים הקודקודיםClustering ,1-ל 0 בין שיהיה כך.

13

Page 15: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

.2 באורך המסלולים כמות חלקי 6 כפול ברשת המשולשים מספרג..1-ל 0 בין הערך את לנרמל נועדה 6-ב החלוקה לעיל' ב בסעיף כמו

שונה' א בסעיף ההגדרה אולם, שקולות הינן' ג-ו' ב בסעיפים ההגדרות בעלי קודקודים עבור יותר גבוהות תוצאות נותן בה ששימוש בכך מהן

את לכן. נמוכה דרגה לציין -המקדם ערך של החישוב אופן חשוב Clustering טעויות למנוע מנת על.

אמפיריות ברשתות Clustering - מקדם ה ערכי רשתות של Clustering-מקדם ה ערך, החישוב לשיטת קשר ללא, כללי באופן

עבור המתקבלים Clustering-מקדמי ה מערכי משמעותית גדול אמפיריות)האקראי הגרף מודל באמצעות המחוללות רשתות Newman, 2002) .בעוד הרי, N−1-ל שואף Clustering-המקדם ערך אקראיות רשתות שעבור

) אמפיריות שברשתות ( אמפיריות רשתות לדמות המנסים מודלים או ערך C לקבוע שואף Clustering-המקדם ≠ הפער בין הערכים האמפיריים, ולכן, 0

.N של גודל לבין הערכים של מודל הגרף האקראי הוא מסדר

Clustering - ה מושג הכללת ניתן אולם. קודקודים של לשלשות מתייחס המקורי Clustering-ה מושג

ההכללה. יותר קצרים או ארוכים מסלולים על ולהגדירו זה מושג להכליל עשויים קודקודים זוג בין כאשר, 2 באורך מסלולים עבור היא ביותר הנפוצה

מכוונים גרפים של במקרה זו הכללה. קשתות מספר מוגדרות להיות) הדדיות בשם נקראת Reciprocity ) על במחקרים כ"בד נבדקת והיא (.(Scott, 2000 חברתיות רשתות

Degree Distribution - התפלגות דרגות 2.2.3 המתאימה הפונקציה ומציאת דרגותיהם לפי ברשת הקודקודים חלוקת את נגדיר אם. ברשת הקודקודים דרגות התפלגות נקראת זו חלוקה לתיאור

pk שדרגתם ברשת הקודקודים אחוז להיות k ,כי לכך שקולה זו הגדרה אזי

14

Page 16: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

pk שדרגתו קודקוד נקבל ברשת אקראי קודקוד שבבחירת ההסתברות הינה k .ה ערכי של תיאור-pk דרגות של היסטוגרמה יצירת י"ע לביצוע ניתן

הקודקודים דרגות התפלגות נקראת זו היסטוגרמה. ברשת הקודקודים.ברשת

מציאת פונקצית ההתפלגות2.2.3.1 ולכן, זהה בהסתברות קיימת לא או קיימת קשת כל האקראי הגרף במודל

) בינומית היא הקודקודים דרגות התפלגות ערכים עבור פואסונית או (. גדולים התפלגות חולקות אינן אמפיריות רשתות, המקרים ברוב אולם

באופן מוטה אלו ברשתות הקודקודים דרגות התפלגות רבים במקרים. זאת .מהממוצע בהרבה השונה דרגה ישנה הקודקודים לרוב כלומר, ניכר מרוכזים לא הערכים כלומר, ארוך" זנב "ישהאמפירית להתפלגות כן-כמו

.ערכים של נרחב טווח פני על מתפרשים אלא, בודדות נקודות במספר WWW, כגון רשת ה- אמפיריות גדולות ברשתות הדרגות התפלגות מדידת

משתי ונובעת בעייתית הינה, ) רשת הקישורים בין העמודים באינטרנט ( ההתפלגות את לחשב כ"בד ניתן לא הרשת של גודלה עקב מחד: סיבות

המדויקת הואיל ודבר זה מחייב מעבר על כלל הרשת –דבר שאיננו מעשימחושבת, להיות צריכה הקודקודים שדרגת העובדה עקב בין השאר (

הנרחב הערכים טווח עקב ומאידך, ולעיתים מדובר על תהליך מורכב ( תקף להיות מנת על דוגמאות מספיק מכיל לא כ"בד במדגם שימוש

.סטטיסטית מבחינה:לעקיפת בעיה זו מקובלות שיטות קיימות שתי

) תרמילים"ל חלוקה ישנה בה היסטוגרמה בנייתא. " bins )הגדלים בכל הקודקודים כמות, התוצאות את לנרמל מנת על. מעריכי באופן) התרמיל ברוחב ומחולקת נמדדת תרמיל הערכים כמות

(. מכיל" תרמיל"שה בו במקרה הינו זו שיטה של העיקרי השימוש תרמיל כל גודל ואז הואיל, לוגריתמי בסולם התוצאות את מציגים מתרחב התרמיל ההתפלגות" זנב"ל שמגיעים ככל, בנוסף. זהה נראה

. מצטמצמות הסטטיסטיות הבעיות ולכן) מצטברת התפלגות בפונקצית שימושב. cdf .) במקום כלומר

∑=Pk- ב משתמשים pk- ב להשתמשk '=k

pk' .יתרונות מספר זו לשיטה:

15

Page 17: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

ההתפלגות" זנב"ב הרעש כמות ושנית, מידע מאבדים לא אנו ראשית תצוגה לקבל ניתן לא: חסרונות גם ישנם זו לשיטה אולם. פוחתת .הפונקציה של הגרף ציור באמצעות עצמה ההתפלגות של ישירה

ולכן, סטטיסטית מבחינה תלויות בתרשים הסמוכות הנקודות כן-כמו. יותר מורכבת הינה למידע נכונה התאמה פונקצית מציאת

התפלגות דרגות בגרפים מכוונים2.2.3.2 ולכן יציאה ודרגת כניסה דרגת ישנה קודקוד לכל מכוונים גרפים עבור

–מכוונות רשתות על במחקרים זאת עם. ערכים בשני תלויה ההתפלגות או היציאה לדרגת רק התייחסות כ"בד קיימת, WWW-ה רשת למשל

)הקשתות של מהכיוון התעלמות שישנה או בלבד הכניסה Albert &

Barabasi, 1999, Broder et al, 2000 .)מחקרים ישנם זאת עם ( Newman et

al, 2002 ) היציאה לדרגות הכניסה דרגות בין חזק מתאם ישנו כי המראים .מסוימות רשתות עבור

Scale Free Networks - רשתות חסרות מידה 2.2.3.3 , Strogatz, 2000 )רבה להתעניינות זכו מעריכית דרגות התפלגות עם רשתות

Albert & Barabasi 2002 .)הקודקודים דרגות התפלגות אלו רשתות עבור P: מקיימת (k ) ≈ k−α כאשר , α ההסתברות כלומר,. חיובי ערך בעל הינו

נובע מכך. k−α היא פרופורציונית ל- k דרגה בעל יהיה ברשת שקודקוד .מעריכי באופן וקטנה הולכת גבוהות דרגות בעלי הקודקודים שכמות אולם. Scale Free Networks" - מידה חסרות "רשתות נקראות אלו רשתות

בכמות רשתות של" המידה חוסר" שלהן התלות חוסר כלומר אלו, הקודקודים דרגות להתפלגות רק כ"בד מתייחס ( Nהקודקודים ברשת )

רב במגוון התגלו זה מסוג רשתות. הרשת של אחרות לתכונות ולא שלהן) מקרים של Newman, 2002 ,) רשת, מאמרים של ציטוטים רשתות: כגון

.ועוד מטבוליות רשתות, WWW-וה האינטרנט

16

Page 18: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

Network resilience - עמידות של רשתות 2.2.4 דרגות להתפלגות קשורה קודקודים של הסרה בפני רשתות של העמידות

-שלהן בקישוריות תפקודן לצורך תלויות הרשתות רוב .ברשת הקודקודים מסירים כאשר. ברשת השונים הקודקודים בין מסלולים בקיום כלומר

שבשלב עד, וגדל הולך הקודקודים בין המסלול אורך, מהרשת קודקודים עמידות ישנה שונות לרשתות. קשירות רכיבי למספר מתפרקת הרשת מסוים בכמות רק לא תלויה אשר קודקודים הסרת של זה מצב כלפי שונה

למשל ניתן. להסרה שנבחרו בקודקודים גם אלא המוסרת הקודקודים כגון, מסוים מסוג קודקודים להסיר או אקראי באופן קודקודים להסיר

חשיבות בעלת היא רשתות עמידות. ביותר הגבוהות הדרגות עם הקודקודים .וכדומה מחשב-וירוסי, באוכלוסיה מחלות כגון, נזקים למשל בהתפשטות

אנשים של לחיסון למשל שקולה ברשת קודקודים של” הסרה “זה במקרה רק לא השפעה בעל הינו ספציפיים אנשים של וחיסון הואיל. המחלה כנגד

להתפשט המחלה של היכולת על להשפיע עשוי אלא אנשים אותם על התפשטות למנוע יכולה לחסן מי את ההחלטה כי מכך נובע, אחרים לאנשים. האוכלוסייה כלל את לחסן מבלי גבוהה ביעילות מחלות

השפעות על אורך המסלול הממוצע2.2.4.1 אורך השתנות את בדקו רשתות, עמידות לבדיקת נוספים, מחקרים אחד. ברשת קודקודים מהסרת כתוצאה קודקודים בין הממוצע המסלול

כמו ) מידה חסרות מסוג רשתות כי הראה ( Albert et al, 2000 ) המחקרים( האינטרנט רשת של אקראית הסרה בפני גבוהה עמידות בעלות הן

עקב ניכרת במידה הושפע לא הממוצע המסלול אורך כלומר,קודקודיםיוסרו, ברוב המקרים,הקודקודים הסרת זאת מכיוון שבהסרה אקראית ,

קטן אחוז הסרת אולם. קודקודים נפוצים, ואלו בעלי דרגה נמוכה מאוד לשיתוק במהרה מובילה הגבוהות הדרגות בעלי הקודקודים של יחסית

באופן. קשירות רכיבי למספר הרשת להתפרקות כלומר, ברשת התקשורת את לשתק מנת על כי הראה( Broder et al, 2000 )דומה מחקר מעניין–ומעלה חמש שדרגתם הקודקודים כל את להסיר יש, האינטרנט רשת קודקודים שישנם בעובדה בהתחשב דרסטי יותר הרבה נראה אשר צעד

כלומר, הפוכה מסקנה החוקרים הסיקו לכן .מאוד גבוהה שדרגתם אולם. גבוהה דרגה בעלי קודקודים של הסרה בפני עמידה מאוד שהרשת

17

Page 19: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הסיבה. סתירה בכך אין למעשה כי הראתה התוצאות של מעמיקה בחינה כמות, האינטרנט רשת כמו, מידה חסרות שברשתות מהעובדה נובעת לכך

להסיר מספיק לכן. מעריכי באופן קטנה הגבוהות הדרגות בעלי הקודקודים שדרגתם הקודקודים כל את להסיר מנת על הקודקודים של קטן אחוז

Jeong et al )נוספים מחקרים בוצעו אלו מחקרים בעקבות. מחמש גדולה

2001, Dunne et al עבורן וגם נוספות מידה חסרות רשתות על( 2002 .דומות תוצאות התקבלו

Mixing patterns – עירוב תבניות2.2.5 בשם "עירובNewman ( 2003 )היבט נוסף בתחום מחקר הרשתות הוגדר ע"י

אופן בחקירת עוסק תבניות" "עירוב הקודקודים של הקישור תבניות". כך, קודקודים של קבוצות שישנם לגלות ניתן שונות ברשתות. השונים ברשת

קבוצות בין קשרים ואילו נמוך הינו הקבוצה בתוך קשרים לקיום שהסיכוי –קודקודים סוגי שלושה להגדיר ניתן האינטרנט ברשת למשל,. נפוצים יותר

כלל בדרך הינם הקישורים כאשר, תשתית וספקי גישה ספקי, קצה משתמשי בתוך לא אך תשתית לספקי גישה ספקי ובין גישה לספקי קצה משתמשי בין

אולם, קשרים ישנם הקבוצה בתוך ובו הפוך גם להיות יכול המצב. הקבוצות– קשרים ואין כמעט הקבוצות בין מרוכזים חברתיות ברשתות למשל

"מכונה זו תכונה'. וכדו מוצא, עניין קבוצות לפי הקשרים " )מסודר עירוב Assortative mixing.)

Degree correlations – תיאום דרגות2.2.6Newman ( דרגות" מקרה2003 "תיאום בשם הגדיר ( "של פרטי עירוב

הדרגות לפי קודקודים בין הקשרים בין הקשר נחקר. במקרה זה "תבניות הם גם מקושרים גבוהה דרגה בעלי קודקודים האם, כלומר. שלהם

בעלי לקודקודים מקושרים הם שדווקא או, גבוהות דרגות בעלי לקודקודיםחד . נמוכות דרגות איננה לכך משני רשתות והתגלו משמעיתהתשובה

נכלל ולא עצמו בפני למעמד זוכה הדרגות" ש"תיאום הסיבה. הסוגים"בנושא במחקרים הינה הקודקודים שדרגת מכך נובעת", תבניות עירוב

מספר. הרשת מבנה על להשפיע יכולה ולכן, הרשת של מהטופולוגיה חלק )פשוטה בהיסטוגרמה משימוש החל, הדרגות תיאום לבדיקת הוצעו דרכים

18

Page 20: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

Maslov et al, לבין הקודקוד דרגת בין המתאימה פונקציה חישוב(, 2002 )שכניו של הממוצעת הדרגה Pastor-Satorras et al, בחישוב וכלה(, 2001 (.Newman et al , 2002 )הקשתות של צד בכל Pearson של ההתאמה מקדם עבור אולם, דרגות תיאום יש חברתיות רשתות עבור כי התגלה כללי באופן

(ביולוגיות רשתות, מידע רשתות, טכנולוגיות רשתות ) אחרים מסוגים רשתות יש אם ידוע לא כמו-כן ידועה לא עדיין זה להבדל הסיבה,. דרגות תיאום אין.יחיד הסבר לה

Community structure – מבנה קהילתי2.2.7 רשתות חברתיות הינן רשתות המורכבות מקבוצות של אנשים ביניהם קיימיםועוד. מקובל כגון קשרים אישיים, מקצועיים יותר, או קשרים מסוג אחד

( קהילתי מבנה בעלות הינן חברתיות רשתות כי ,Scottלהניח 2000( ,)Wasserman & Faust, רשתות1974 הינן מבנה קהילתי רשתות בעלות . )

,קשרים של גבוהה צפיפות יש ביניהם אשר קודקודים של קבוצות המכילות אולם רשתות חברתיות אינן. נמוכה הקשרים צפיפות הקבוצות שבין בעוד

מסוגים ברשתות גם להימצא יכול קהילתי מבנה היחידות בעלות מבנה זה. יכולות הקודקודים קבוצות מאמרים ציטוטי של ברשתות למשל. אחרים יחידות לייצג יכולות הקבוצות נוירונים ברשתות. שונים עניין תחומי להיות

.וכדומה תפקודיות

זיהוי המבנה הקהילתי2.2.7.1 י"ע ההינ, הרשת של הקהילתי המבנה לזיהוי ותהמקובל כיםאחת הדר

הקרויות לעיתים בשם )Everitt, 1974(ניתוח אשכולות של בטכניקות שימוש)היררכי אשכול Hierarchical Clustering .) זוג לכל נותנים זו בשיטה

המשקל ,כללי באופן. ביניהם הקשר חוזק את המייצג משקל קודקודים .קשת י"ע ביניהם הקשורים לקודקודים רק ולא קודקודים זוג לכל ניתן

אשכול הינו קודקוד כל כאשר להתחיל הינה האשכול לביצוע אחת שיטה הקשת י"ע המחוברים האשכולות שני את למזג שלב ובכל עצמו בפני

ורכיבי התוצאה את לבחון ניתן שלב בכל. ביותר הגבוה המשקל בעלת קשירות רכיב מתקבל התהליך בסיום. הקהילות הינם המתקבלים הקשירות

– "אחד )עץ תרשים באמצעות לייצוג ניתן כולו התהליך. אחת" קהילה Dendogram ,) לראות ניתן שלב בכל הקיימות הקהילות את כאשר

19

Page 21: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הקודקודים בין הקשר חוזק. העץ תרשים על אופקי חתך ביצוע באמצעות גודל, הקודקודים בין המרחקים: וביניהם, רבות בדרכים להגדרה ניתן

בגרפים )הקודקודים בין המסלול משקל, הקודקודים בין המינימאלי החתך.ועוד ( ממושקלים

2.2.8Betweens Centrality

המסלולים כמות קודקוד ברשת מוגדר להיות של Betweens Centrality- ה ) Goh et al ) 2002.זה קודקוד דרך העוברים ברשת קודקודים בין הגיאודזיים

.מעריכית התפלגות בעל הינו Betweens-ה ערך ,רבות רשתות עבור כי הראהזובהתפלגות המעריך של ערכו לפי הרשתות את לסווג הציעו זאת עקב . שהסרה במובן. הרשת של לעמידות כמדד גם לשמש יכול Betweens-ה ערך זוגות בין המסלול את יאריך גבוה Betweens centrality ערך בעל קודקוד של

.יותר רבים קודקודים

מודל הגרף האקראי2.3 רשת"ה היה גדולות רשתות אקראי עבור מודל ליצור הראשון הרציני הניסיון

Rapoport של " האקראית ( 1957 שוב, באופן עצמאי התגלה זה מודל. ( Erdos ע"י יותר מאוחר כעשור & R'enyi באופן אותו חקרו אשר, (1960) הוא בו ) Random Graph (" אקראי גרף "השם את לו ונתנו, ומפורט מעמיק

.כיום מוכר

אינן, האקראי הגרף מודל באמצעות הנוצרות הרשתות של רבות תכונות התפלגות למשל. אמפיריות ברשתות שהתגלו חשובות לתכונות מתאימות

המעריכית הדרגות מהתפלגות שונה האקראי הגרף במודל הקודקודים דרגות .דרכים במגוון המקורי המודל הורחב לכן. רבות אמפיריות ברשתות הקיימת דרגות התפלגות בעלות רשתות ליצור המאפשרות, המודל של הרחבות

"בשם הידועים מודלים של מחלקה ליצירת הובילה, שונה קודקודים גרפים "הקונפיגורציה מודל "או ( Generalized Random Graphs" ) מוכללים אקראיים

(Configuration Model.)

20

Page 22: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הגדרת המודל2.3.1 N הקודקודים מספר את בוחרים: הבא באופן מוגדר האקראי הגרף מודל

≥0 בהסתברות מחליטים, קודקודים זוג כל עבור. ברשת שיהיו שברצוננו p≤ 1 Erdos אשר אקראי גרף מגדיר זה תהליך. קשת באמצעות אותם לקשר האם

& R'enyi באמצעות סימנו GN , p .GN , p הגרפים כל של אוסףלמעשה הינו pm(1−p)M−m בהסתברות מופיע קשתות m בעל גרף בהם קודקודים N בעלי

=Mכאשר , N (N−1 )

2 & Erdos. בגרף המקסימאלי הקשתות מספר הינו

R'enyi בשם נוסף דומה מודל הגדירוGN ,m ,בעלי הגרפים כל אוסף שהינו N יש באוסף מהגרפים אחד לכל כאשר. קשתות m בדיוק יש בהם קודקודים לפתרון ניתנות האקראי הגרף של רבות תכונות. להופיע שווה הסתברות

.גבוה N קודקודים מספר בעלי גרפים עבור מדויק

קודקוד לכל כי מקבלים אנו, בזו זו תלוי בלתי במודל הקשתות וקיום הואילz=p בממוצע יש ( N−1 הינו מסוים שקודקוד הסיכוי כן-כמו. שכנים (

pk- ל שווה k דרגה בעל (1−p)N−k .הקודקודים דרגות התפלגות לכן ) בינומית היא (. N של גדולים ערכים עבור פואסונית או כלומר

pk=(Nk ) pk (1−p)N −k≅ e− z z

k !

k

הגבול עבור מדויק להיות הופך הקירוב , כאשר

. קבוע k- ו גדול N של

הגרף מבנה על קודקודים בין p הקישור הסתברות השפעת2.3.2 גדול p-ש ככל. p של לערכו בהתאם משתנה האקראי הגרף של המבנה

אחת. יותר גדולים קשירות רכיבי ונוצרים גדלה הקשתות כמות כך יותר כלומר. הפאזה מעבר תופעת היא אקראי גרף של ביותר החשובות התכונות

>p עוד שכל כך, pc - מסוים ערך קיים pc ,מסוימים מבנים מכיל לא הגרף, p- ש וברגע ≥ pc , 1 בתרשים לראות שניתן כפי. אלו מבנים בגרף מופיעים,

.(המקורי במאמר Fig. 6) . )Albert & Barabasi )2002- מ שנלקח

תופעת מעבר הפאזה בגרפים אקראיים –1תרשים

21

Page 23: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

עבור. אקראי בגרף שונים מבנים מופיעים בהן הסף הסתברויות : 1 תרשיםp<N−3 p עבור. מבודדים וקשתות קודקודים מכיל הגרף 2/ N−3 מופיעים, 2/

p שעבור בעוד. 3 בגודל עצים N−4 עבור. 4 בגודל עצים כבר מופיעים 3/p N−1 הסוגים מכל מעגלים מופיעים וכן, הסוגים מכל עצים כבר קיימים. p כאשר N−2 )4 בגודל שלמים גרפים תתי מופיעים 3/ (,4 בגודל קליקות p עבור ואילו N−1/2 5 בגודל שלמים גרפים תתי מופיעים.

אמפיריות רשתות לעומת האקראי הגרף מודל2.3.3 " )קטן עולם "של התכונה בעלות שהינן רשתות מייצר האקראי הגרף מודל

Small World ,) במרחק השכנים מספר. רבות אמיתיות רשתות המאפיינת l z-ל שווה מסוים מקודקוד l-כאשר מניחים ש ,z את לכלול מנת על קבוע. לכן

z לקיים צריך l עבור הנדרש הערך, הרשת קודקודי כלל l≅ N כאשר ,Nהוא קודקודים זוג בין האופייני המרחק כי נובע מכאן. מספר הקודקודים ברשת

l=log על עומד אקראי בגרף N / log z להגדרת הדרישה על העונה דבר "תכונת כבעלת הרשת שאר כל כמעט, זו תכונה מלבד אולם". קטן עולם

ברשתות הקיימות לתכונות תואמות אינן האקראי הגרף מודל של התכונות(Newman, 2002אמיתיות ) הינו קודקודים שני בין לקשר והסיכוי הואיל:

שלו האשכול מקדם קודקודים משותף שכן של בקיום תלוי ואינו, p תמיד שכבר כפי, בנוסף. גדולים. N ערכי עבור 0-ל שואף אשר., C=p והינו נמוך

דרגות מהתפלגויות השונה פואסונית דרגות התפלגות ישנה זה למודל הוזכר דרגות בין תיאום בו איןכמו-כן . אמפיריות רשתות עבור המוכרות הקודקודים שילוב בעל הוא, קהילתי מבנה בו אין, שכנים קודקודים של הקודקודים

רשתות של מודלים ליצור מנסים כאשר בקיצור. לחלוטין אקראי תבניות גדול חלק, זאת כל עם .טובה בחירה אינו האקראי הגרף מודל, אמפיריות הגרף מודל של מהלימוד נובע רשתות של הפעולה אופן לגבי שלנו מההבנה

22

Page 24: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

גם קיימים אשר, הענק הרכיב וקיום הפאזה מעבר נושא במיוחד. האקראי.יותר המתוחכמים במודלים

הקונפיגורציה מודל – האקראי הגרף מודל של הרחבות2.3.4 באמצעותו ליצור מנת על דרכים במספר להרחבה ניתן האקראי הגרף מודל

במודל לשלב ביותר שקל התכונה. האמפיריות לרשתות יותר הדומות רשתות מובילה אשר, פואסונית לא קודקודים דרגות התפלגות של התכונה הינה

".הקונפיגורציה מודל "הקרוי למודל

:הבא באופן פועלים, מסוימת קודקודים התפלגות בעל גרף לייצר מנת על אחוז הינו pk-ש כך, pk קודקודים דרגות התפלגות מגדירים ראשית

בגרף מהקודקודים אחד לכל. k דרגה בעלי שהינם ברשת הקודקודים בתחילה הקודקודים אינם. שבחרנו ההתפלגות פ"סופית ע דרגה משויכת

זוגות באקראי לבחור מתחילים כעת. 0מקושרים, כך שדרגתם הזמנית היא הסופיתמדרג שונה הזמנית שדרגתם קודקודים של אותם ומחברים, תם

מהקודקודים אחד כל דרגת אשר עד זה תהליך על חוזרים. קשת באמצעותששייכנו הדרגה הינה מייצר זה תהליך. ההתפלגות פ"ע לו הסופית

דרגות התפלגות בעלות האפשריות הרשתות כל את שווה בהסתברות שנוצרו הגרפים כל כאוסף מוגדר הקונפיגורציה מודל. שנבחרה קודקודים

.להיווצר שווה הסתברות אחד לכל כאשר זה באופן

רב של חוקרים מספר י"ע זה מודל נחקר 20-ה המאה של 70-ה שנות מאז(Bekessey et al,1972 , , Bender et al, 1978, Bollobas, 1980, Chung et al,

לקיומו pk במונחי המדויק התנאי: כגון רבות תכונות עבורו ועוד( וידועות2002 של הממוצעת הכמות, הענק הרכיב של המדויק הגודל, ענק רכיב של

זוגות בין האופייני המרחק, מרכזי מקודקוד מסוים במרחק קודקודים.ועוד קודקודים

" עולם קטן " רשתות 2.4 מקדםערך בעלת רשת של ומעקב לניתוח יותר קל אך פחות מתוחכם מודל

Clustering י"ע שהוצע" קטן עולם"ה מודל הינו גבוה Watts & Strogatz )1998(.

23

Page 25: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

משפיע אשר, גיאוגרפי מרכיב יש רבות שברשתות ההנחה על מתבסס המודל לקודקודים יש מיקום במרחב כלומר. ברשת הקודקודים בין הקשרים קיום על

.לזה זה מקושרים יהיו במרחב לזה זה הקרובים קודקודים כי להניח וסביר מסודרים ההתחלתי שבמצב בכך זו מנקודה מתחיל" הקטן עולם"ה מודל

מקושרים מסוים ממרחק קטן שמרחקם וקודקודים בשריג הרשת קודקודי ממימד שריג עבור זה ממודל רשתות לבנות ניתן תיאורטית. בקשת ביניהם ,זה במקרה. מימדי חד שריג של במקרה התמקד המחקר עיקר אולם, כלשהו

,מימדי חד סגור כשריג המסודרים קודקודים L ישנם בה ברשת מתחילים אנו המרוחקים הקודקודים לכל מקושר קודקוד כל ובה, טבעת בצורת כלומר מחדש מחווטים הבא בשלב. קשתות Lk ישנן בסך הכל ולכן, k עד ממנו י"ע מבוצע, מחדש החיווט תהליך. אקראי באופן הקיימות מהקשתות חלק

לקודקוד שלה הקצה מקושר p ובהסתברות מהקשתות אחת כל על מעבר שהוא היא מחדש החיווט תהליך על היחידה ההגבלה. באקראי שנבחר חדש

.כפולות קשתות או עצמיות קשתות ייצור לא

"למודל מאפשר הקשתות של מחדש החיווט תהליך בין לנוע" הקטן העולם .אקראי גרף של למצב זהה לא אך, הדומה מצב לבין מסודר שריג של המצב מקדם כי לראות קל זה מצב עבור. מסודר שריג מקבלים אנו p=0 כאשר

3- ל שואף אשר, C=(3k−3)/(4k−2) הינו האשכול .גדולים k ערכי עבור 4

"של התכונה את מציג אינו המסודר השריג, זאת עם כלומר", קטן עולם /l=L-ל שואף קודקודים בין הגיאודזי המרחק 4k ערכי עבור L כאשר. גדולים

p=1 כמעט היא המתקבלת והרשת חדש למיקום מחדש מחווטת קשת כל /l=LogL של גודל מסדר גיאודזי מרחק בעל אקראי גרף Logk ,בעלת אך

≅C נמוך מאוד אשכול מקדם 2k /L .קיימים אלו קיצוניים ערכים שני בין וגם נמוך גיאודזי מרחק בעלת הינה המתקבלת הרשת עבורם נרחבים טווחים

זוהי רשת "עולם קטן". .גבוה Clustering ערך מקדם

המודל תכונות2.4.1 .המודל של גרסאות מספר עבור חושבו" הקטן העולם "מודל של התכונות

הינו האשכול מקדם כי הוכח Watts & Strogatz של המקורית הגרסה עבור

C=3 (k−1 )

2 (2k−1 )(1−p)

3

תואמת אינה, במודל הקודקודים דרגות התפלגות.

24

Page 26: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הרשתות רוב עבור המוכרת הקודקודים דרגות התפלגות את היטב המודל מטרת הייתה לא וזו הואיל מפתיע אינו זה נתון אולם. האמפיריות השריג ממבנה כתוצאה, קשתות 2k לפחות ישנם קודקוד לכל. מלכתחילה

בעלת הינה כמותן אשר מחדש החיווט מתהליך הנובעות קשתות ועודp ההסתברות ולכן. בינומית התפלגות j דרגה יש שלקודקוד לכך j ל שווה :

p j={( Lj−2 k )[ 2kp

L ]j−2k

[1−2kpL ]

L− j+2k

j ≥2k

0 j<2k }.

בעלי מנגנון "קישור מועדף" מודלים2.5 הרשתות של ספציפיות תכונות המחקות רשתות לייצר מנסים, לעיל המודלים אלו תכונות נוצרו כיצד להבין מסייעים אינם אלו מודלים אולם. הקיימות

את להסביר היא העיקרית שמטרתם מודלים קיימים. ברשתות מלכתחילה התפתחות על האחראי מנגנון על מבוססים אלו מודלים. רשתות של התכונות

באופן וצלעות קודקודים של הוספה י"ע גדלה כ"בד הרשת כאשר הרשת ברשת קיים שאולי הגדילה תהליך את לשקף אמור זה מנגנון. הדרגתי

הכי בצורה שנחקרה הרשתות מחלקת. אלו תכונות ליצירת המוביל האמיתית מחלקת היא שלה היצירה תהליך את לגלות מנת על זה באופן מעמיקה (.Scale Free Networks ) המידה חסרות הרשתות

Price המודל של 2.5.1 בעלת התפלגות דרגות קודקודים ותלרשת אבטיפוסהינו Price של המודל

חקר Price . (Scale Freeמידה ) חסרותמעריכית, המוכרות גם בשם רשתות הוגדרו אלו רשתות. מדעיים מאמרים של ציטוטים רשתות 60-ה בשנות את ציטט' א ומאמר במידה. ברשת קודקוד י"ע מיוצג מאמר כל: הבא באופן Price'. ב לקודקוד' א מקודקוד מכוונת קשת הכילה הרשת אזי' ב מאמר

ברשתות הקודקודים של והכניסה היציאה דרגות התפלגות כי גילה )1965( המאמר של הציטוטים וכמות המאמר י"ע שצוטטו המאמרים מות)כ אלו

Price פרסם כ"אח שנים מספר. מעריכי באופן מתפלגות(אחרים במאמרים

)נוסף מאמר המקובל כהסבר כיום משמש אשר, הסבר הציע ובו( 1976 אשר, )Simon )1955 י"ע שפותחו רעיונות על מבוסס ההסבר. לתופעה

"כאשר מתקבלת מעריכית התפלגות כי הראה עשירים נעשים העשירים יש שכבר לכמות יחסית הינה מקבל שאתה הכמות כאשר כלומר", יותר

25

Page 27: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

"בשם זאת תכונה כינה Price. ברשותך )מצטבר יתרון "Cumulative

Advantage .)בשם יותר תכונה זו מוכרת כיום" Preferential" )מועדף חיבור

Attachment ) י"ע שנטבע שם Albert & Barabasi )1999(.

ובאופן הרשתות לתחום Simon של הרעיון החדרת הייתה Price של תרומתו שלו ההסבר. שלהן הדרגות והתפלגות ציטוטים רשתות של לתחום ספציפי

לכמות יחסי הינו חדשים מאמרים י"ע מצוטט מאמר בו שהקצב היה ככל: הגיונית מבחינה בקלות זאת להסביר ניתן כאשר. לו יש שכבר הציטוטים כאשר אותו קראו אנשים שיותר הסיכוי גדל כך יותר מצוטט מסוים שמאמר

אותו. הוא אף גדל יצוטט שהוא הסיכוי ולכן הרלבנטית הספרות את סקרו Price. האינטרנט רשת כמו נוספות רשתות עבור גם לשמש יכול הטיעון

אתSimon של בעקבותיו ,אימץ הציטוטים כמות בין הקשר כי ההנחה , לא זאת עם. ליניארית הינה חדש ציטוט להתווספות ההסתברות לבין הקיימת

.נכונה אכן זו אם הנחה ברור

שלו והפתרון Price של המודל תיאור2.5.1.1 רשת של למשל, קודקודים nבעלת מכוונת רשת לנו נתונה כי נניח

שלהם הכניסה שדרגת ברשת הקודקודים את אחוז pk- ב נסמן. ציטוטים

∑ מתקיים כי נקבל ולכן, k היאk

pk=1 .לרשת מתווספים חדשים קודקודים,

יציאה דרגת יש שמתווסף קודקוד לכל. קבוע בקצב בהכרח לא אך– מסוימת יצירת בזמן נקבעת אשר מצטט שהוא המאמרים כמות

מניחים אנו אולם, קודקודים בין להשתנות עשויה היציאה דרגת. הקודקוד .זמן לאורך קבועה היא m- ב שנסמנה ברשת, הממוצעת היציאה דרגת כי

m ומתקיים. בגרף הממוצעת הכניסה דרגת גם היא ∑k

kpk=m .הואיל

ערכים לקבל עשוי m, לקודקוד מקודקוד להשתנות עשויה היציאה ודרגת. 1-מ קטנים ערכים ואף, שלמים לא

"בעל תהליך של ביותר הפשוטה בצורה ההסתברות", מצטבר יתרון חדש שמאמר ההסתברות כלומר, קיים לקודקוד חדש קודקוד של לקישור

עם. הקיים הקודקוד של k הכניסה לדרגת יחסית היא, קיים מאמר יצטט ,0 כניסה דרגת עם מתחיל קודקוד וכל הואיל בעיה ישנה זה בתהליך זאת תהיה שלהם הצלעות את אליו יקשרו חדשים שקודקודים ההסתברות ולכן

כך התהליך את מעט לשנות Price הציע, זו בעיה על להתגבר מנת על. 026

Page 28: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

,k+k0 תהיה קיים לקודקוד חדש מקודקוד קשת של לקישור שההסתברותk כאשר k-ב Price השתמש, הציטוטים רשתות של במקרה. קבוע הינו 0 0=1

.שלו הראשון כציטוט המאמר הופעת את להחשיב שניתן בכך זאת והצדיק של לציטוט ההסתברות ולכן, חדש קודקוד בכל עצמית קשת קיימת כלומר כלשהו לקודקוד תקושר חדשה שקשת ההסתברות. k+1 הינה קיים מאמר

: היא, k כניסה דרגת בעל(k+1 ) pk

∑k

(k+1) pk

=(k+1) pk

m+1

ולכן, m היא גם קודקוד כל עבור קשתות של המוספת הממוצעת הכמות k כניסה דרגת בעלי לקודקודים המקושרות קשתות של הממוצעת הכמות

k+1) היא ) pk m(m+1)

קטנה, Npk שהינה, k כניסה דרגת בעלי הקודקודים כמות.

דרגת את המגדילה חדשה קשת מתווספת אלו ולקודקודים הואיל, זו בכמות,k כניסה דרגת בעלי הקודקודים כמות זאת עם. k+1-ל שלהם הכניסה

יוצאי. k-ל k−1-מ גדלה שלהם הכניסה שדרגת קודקודים שישנם בגלל גדלה בדרגת שחל הגידול ובהם, 0 הייתה שדרגתם קודקודים הם היחידים הדופן

pk- ב מסמנים אם. 1 בדיוק הינו הכניסה , N הערך את pk שהרשת בזמן שווה שמתווסף קודקוד כל עבור Npk-ב שחל השינוי אזי, קודקודים Nהכילה

(N+1) pk, N +1−N pk , N=[kp¿¿k−1, N− (k+1 ) pk , N ] mm+1

kכאשר ,¿ ≥ 1.

( N+1 ) p0 , N+1−N p0 ,N=1−p0 , N−( k+1 ) pk, N ¿ mm+1 , כאשר k=0.

גדולים n ערכי עבור כי מקבלים הזו משוואותמערכת ה את פותרים כאשר

pk: מתקיים k−(2+ 1

m עם מעריכית הינה הקודקודים דרגות התפלגות, כלומר. (

+α=−(2מעריך 1m

מעריכית יתפלגו הקודקודים דרגות כ"בד לכן .(

בעל הינו m בו במקרה רק 3-מ גדול יהיה )המעריך. 3-ל 2 בין מעריך עם למעריך זה ערכים תחום (. ציטוטים ברשת סביר שלא דבר, 1-מ קטן ערך .נוספות אמיתיות רשתות עבור שנצפו הערכים את תואם ההתפלגות של

27

Page 29: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

Price המתקבלת הציטוטים לרשת מתאימות שלו המודל תוצאות כי הראה . Science Citation Index- מ

המעריך, Price של המודל של במקרה כי הינה לציון הראויה נוספת נקודהk של ההתחלתי בערך תלוי לא המתקבל & Albert של למודל בניגוד זאת. 0

Barabasi בהמשך המתואר.

Price הואיל, מספריים ערכים לתת מבלי, שלולמודל אנליטי פתרון רק נתן המודלים על סימולציות ביצוע שאפשרו חישוביים משאבים היו לא ובתקופתו

. האחרונות בשנים חוקרים י"ע שנעשה כפי

"בעלי תהליכים בהבנת רבה התקדמות נעשתה האחרונות בשנים חיבור מודל על התבססה שנעשתה העבודה רוב זאת עם. רשתות וגידול" מועדף

.להלן המתואר Albert & Barabasi של המודל שהינו, שונה מעט

Albert & Barabasi של המודל 2.5.2"של המנגנון כהסבר כיום מקובל Price י"ע שהוצע" מצטבר יתרון

ברשתות רק לא שנצפתה הקודקודים דרגות של מעריכית להתפלגות של עבודתו זאת עם. תחומים במגוון אחרות רבות ברשתות גם אלא ציטוטים

Price עד תאוצה צבר לא זה מנגנון ולכן, המדעית בקהילה מוכרת פחות שם לו נתנו אשר Albert & Barabasi י"ע כ"אח עשורים מספר מחדש לגילויו שהם השפעה רב במאמר (. Preferential attachment" ) מועדף חיבור "חדש

לרשת גידול מודל הציעו הם )Science )Albert & Barabasi, 1999-ב פרסמו.אחד חשוב הבדל עם אך Price של למודל דומה מאוד שהינו האינטרנט

Albert של המודל & Barabasi של למודל זהה Price שהקודקודים בכך הקשת של השני והקצה כ"אח משתנה שאינה, m דרגה עם לרשת מוספים .הקודקוד לדרגת פרופורציונאלית בהסתברות קיים לקודקוד מתחבר Albert & Barabasi של במודל שהקשתות בכך הינו המודלים שני בין ההבדל

של היציאה לדרגת הכניסה דרגת בן הבחנה אין ולכן, מכוונות לא הינן רשת והן ציטוטים רשתות הן מחד. וחסרונות יתרונות יש זה לדבר. הקודקוד

מכוון לא שהינו מודל כל לכן, מכוונות רשתות במציאות הינן האינטרנט

28

Page 30: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

,הרשת של מהכיווניות ההתעלמות, מאידך. הרשת של מהותי מאפיין מחמיץ החדש הקודקוד איך – Price של במודל הבעיה את לעקוף למודל מאפשר

יש ולכן, m דרגה עם מתחיל חדש קודקוד כל. הראשון הקישור את מקבל .חדשות קשתות אליו שיקושרו לכך 0-מ גדולה הסתברות אוטומטי באופן לו באופן הרשת את לתאר מהיכולת חלק מקריב זה שמודל לומר שניתן כך

הינה זה הבדל של העיקרית התוצאה. המודל פישוט למען למציאות קרובAlbert של מודלה שעבור בכך & Barabasiהתפלגות הקודקודים דרגות

בהמשך שבוצעו הכללות אולם. α=3 יחיד ערך עם מעריכית היא ברשת תקושר חדשה שקשת ההסתברות המודל עבור. זו בנקודה טיפלו למודל

: היא k דרגה בעל לקודקודk pk

∑k

kpk

=k pk

2 m .לדרגת שווה במכנה הערך

2 שהינה ברשת הממוצעת הקודקודים m .קודקוד שלכל מכך נובע זה דבר קודקוד של הוספה כל, מכוונת איננה והרשת והואיל, קשתות m ישנם

2 תורמת m דרגה בעלי הקודקודים כמות. ברשת הקשתות לכמות k אליהם הינה לרשת חדש קודקוד מוסיפים כאשר נוספת קשת מקושרת

mk pk

2 m=0.5 k pk ,ב תלויה אינה אשר-m .דרגה בעלי הקודקודים כמות לכן k

מצד. k+1 דרגה בעלי להיות הופכים אלו וקודקודים הואיל. זו בכמות קטנה k−1 דרגה בעלי הקודקודים בגלל גדלה k דרגה בעלי הקודקודים כמות שני

pk-ב מסמנים אם. קשת התווספה אליהם , N הערך את pk שהרשת בזמן :הינו שמתווסף קודקוד כל עבור Npk-ב שחל השינוי אזי, קודקודים N הכילה

(N+1) pk, N+1−Npk , N=0.5 (k−1 ) pk−1 , N−0.5 pk , N כאשר k>m

(N+1)- ו pk, N +1−Npk , N=1−0.5 mpm ,N כאשר k=m בעלי קודקודים ואין .k<m דרגה

גדולים N ערכי עבור כי מקבלים הזו מערכת המשוואות את פותרים כאשרpk: מתקיים k−3.

תוצאות ידועות, הקודקודים דרגות התפלגות עבור הבסיסי הפתרון מלבד .זה מודל עבור נוספות רבות

ישנה כי )Krapivsky & Redner )2001 הראו למודל שעשו מעמיק בניתוח יותר ותיקים קודקודים כאשר, שלו הדרגה לבין הקודקוד" גיל "בין התאמה

של הקודקודים דרגות התפלגות ולכן, יותר גבוהה ממוצעת דרגה בעלי הינם

29

Page 31: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

Adamic. הקודקודים של מהוותק כתוצאה בעיקרה נובעת הגרף &

Hubberman הראו באמצעות בדיקת מידע (2000) כי איןWWWה- רשתמ הדבר נכון, והסבירו זאת בכך שישנה חשיבות למידת המשיכה של הקודקוד ) האתר (, כאשר קודקודים בעלי משיכה גבוהה יהיו בעלי דרגה גבוהה יותרכי נובע זו יותר בעלי משיכה נמוכה. מתוצאה ותיקים מאשר קודקודים

לכך סתירה בכך אין זאת עם. WWWה- רשת את לגמרי מדמה אינו המודל המיישם ממנגנון כתוצאה נובעת האינטרנט ברשת הקודקודים שהתפלגות

".מועדף חיבור"

Albert ושל Price של, המודלים בשני & Barabasi שימוש יש כי מניחים Newman, 2001 ,Jeong et al, 2003 ) מחקרים מספר. ליניארי" מועדף חיבור"ב

שונות רשתות של זמן לאורך הקודקודים בדרגת השינוי קצב את בדקו( .שחקנים בין פעולה שיתופי ורשתות ציטוטים רשתות, האינטרנט רשת: כגון

פרופורציונאלי די היה הקודקודים בדרגת השינוי כי הראו הבדיקה תוצאות תהליך עבר הרשת על כי למסקנה הגיעו ולכן שלהם ההתחלתית לדרגה

".ליניארי מועדף חיבור "על המבוסס

Albert & Barabasi של המודל של הרחבות2.5.2.1 לידי באה זו התעניינות. רבה להתעניינות זכה Albert & Barabasi של המודל

המכלילים רבים מודלים והצעת עצמו המודל של ניתוח: מישורים בשני ביטוי בעלת רשת יצירת לאפשר השאר בין הייתה ההכללות מטרת. הרעיון את

סקירה. 3-מ השונה חזקה עם מעריכית קודקודים דרגות התפלגותAlbert י"ע שפורסמה הרשתות תחום של מעמיקה & Barabasi )2002(

) ההכללות של ממצה סיכום השאר בין מכילה במאמר III טבלהראה (.ל"הנ

: היבטים למספר מתייחסות למודל ההכללות כללי באופןכך, קיים לקודקוד חדש קודקוד בין לקישור ההסתברות פונקצית שינוי

k הקודקוד דרגת על ליניארי באופן מבוססת תהיה שהיא שבמקוםk עבור k+k0 על למשל מבוססת תהיה היא, בלבד או, כלשהו קבוע 0

k כלומר, ליניארי באופן לא אך הקודקוד דרגת על מבוססת שתהיה α, .כלשהו קבוע α עבור

30

Page 32: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

כי לכך עדויות ישנם: הזמן לאורך הממוצעת הקודקודים דרגת שינוי אלא קבועה איננה WWW-ה ברשת הממוצעת הקודקודים דרגת

Dorogovtsev. זמן לאורך וגדלה הולכת & Mendes )2001( הציעו שקודקוד הקשתות כמות - m של ערכו את המשנה המודל של הכללה

- קיימים לקודקודים מקשר חדש m של בערכו השינוי. זמן לאורך m כלומר. הרשת בגודל התחשבות י"ע בעקיפין מבוצע הזמן לאורך

.כלשהו קבוע α עבור, Nα של כפונקציה Nהרשת לגודל בהתאמה גדל-ל פרופורציונאלית קיים לקודקוד חדשה קשת לקישור ההסתברות

k+BN α עבור B רשתות מתקבלות זה מודל עבור כי הראו הם. קבוע מעריך עם מעריכית קודקודים דרגות התפלגות עם

α=2+B(1−α )/(1−Bα ).של יצירה דינמי של קשתות: המודל Albert & Barabasi של והמודל

Price קיומן, אלו מודלים בשני. רשתות של התפתחות את לתאר מנסים .כ"אח משתנה ולא החדש הקודקוד יצירת ברגע נקבע הקשתות של

היא משתנות לא הקשתות כי ההנחה ציטוטים רשתות עבור בעוד אולם מתווספים חדשים קישורים. נכון אינו הדבר WWW-ה ברשת, הגיונית מודלים מספר. דינמי באופן נמחקים קיימים וקישורים קיימים לדפים

)הוצעו זו ביכולת התומכים Dorogovtsev & Mendes, 2000 , Tadi'c,

חלקם ואילו חדשות קשתות בהוספת תומכים חלקם כאשר(, 2001.קיימות קשתות מחיקת גם מאפשרים

של במודל, לעיל שתואר התחשבות בגורמי משיכה נוספים: כפי Albert

& Barabasi בין התאמה ישנה" בעוד, שלו הדרגה לבין הקודקוד" גיל הוצעו, בכך לתמוך מנת על. נכון בהכרח לא הדבר, WWW-ה שברשת)מודלים Bianconi & Barabasi, רמת i קודקוד לכל המעניקים( 2001

שההסתברות כך, p(η) מסוימת התפלגות מתוך הנבחרת ηi" משיכה" k הקודקוד דרגת של פונקציה היא קיים לקודקוד חדשה קשת לקישור

.ηi שלו המשיכה ורמת

מודלי גידול נוספים לרשתות2.5.2.2Albert של המודל & Barabasi ,ה רשת לתיאור כמודל-WWW ,בעל הינו :וביניהם, חסרונות מספר

ה בעוד, מכוונת לא רשת יוצר המודל-WWW מכוונת רשת הינה.

31

Page 33: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

ה רשת לעומת, אחד קשירות רכיב בעלת הינה הנוצרת הרשת-WWW

.רבים קשירות רכיבי מספר המכילהחסרות רשתות מקבלים אזי, מכוון שיהיה כך המודל את ומשנים במידה

.חלשים קשירות רכיבי עם, מעגליםה ברשת היציאה דרגות התפלגות-WWW עבור ואילו, מעריכית היא

.קבועה היא היציאה דרגת המודל

Price של המודל אולם, Price של המודל עבור גם נכונים החסרונות רוב

חסרונות, זה תחום ועבור הואיל. ציטוטים רשתות עבור מלכתחילה יועד.הגיוני דווקא המודל ולכן בעיה מהווים אינם אלו

:.חליפיים מודלים מספר הוצעו אלו בעיות עם להתמודד מנת על1Callaway et al )2001( ,של הבעיה על להתגבר שמטרתו מודל הציע

עם אך, Price של למודל זהה המוצע המודל. בודד קשירות רכיב קיום– אחד משמעותי הבדל בניגוד אך, חדש קודקוד מתווסף שלב בכל אלא החדש לקודקוד מקושרות לא הקשתות Price ,m של למודל

מאפשר זה מודל. באקראי הנבחרים קיימים לקודקודים מקושרות)קשירות רכיבי מספר בעלות רשתות ליצור (. m של לערך בהתאם

,האקראי הגרף למודל זהה זה מודל כי נראה שטחית שמבחינה למרות זה במודל, כך הדבר אין כי מגלה המודל של מעמיקה בדיקה

לרשתות. לשני אחד מקושרים להיות נוטים הותיקים הקודקודים הוא אולם, מעריכית דרגות התפלגות אין זה מודל באמצעות הנוצרות

,)Dorogovtsev et al )2001 י"ע" מועדף קישור"ב לתמוך מנת על הוכלל הקודקודים לדרגות בהתאמה הנבחרים לקודקודים הקשתות קישור י"ע

.מקושרים להיות בודדים לקודקודים גם סיכוי לתת מנת על, קבוע ועוד

2Krapivsky & Redner )2002( שלב בכל זה במודל. אחר מודל הציעו קודקודים זוג בין המקשרת מכוונת קשת או חדש קודקוד מתווסף

זה מודל. קבוע היסט ועוד שלהם והיציאה הכניסה דרגות פ"ע הנבחרים בעלות רשתות ומייצר הקודקודים יצירת לאחר קשתות הוספת מאפשר

בדרגות והן הכניסה בדרגות הן מעריכית קודקודים דרגות התפלגות התפלגות של במעריך לשלוט אף ניתן ההיסטים שינוי י"ע. היציאה מספר של קיום מאפשר זה מודל כן-כמו. השונות הקודקודים דרגות

32

Page 34: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

בכל תמך אשר, קודם מודל של בסיס על פותח זה מודל. קשירות רכיבי חדש קודקוד שכל בכך, בודד קשירות רכיב יצר אולם, לעיל האפשרויות

חלק הינם אלו מודלים )שני. ברשת הקודקודים לאחד מיד קושר שנוצר (.העבודה בהמשך שמתואר כפי, המחקר במסגרת שנבחנו מהמודלים

מודלים להעתקה ושינוי של קודקודים2.6 מעריכים כי הן לא אולם, מעריכית דרגות התפלגות מציגות אשר רשתות ישנן

"של נוצרו כתוצאה של שימוש במנגנון י"ע שהוצע מהסוג" מועדף קישור Albert & Barabasi (1999) .כגון, שונים מסוגים ביוכימיות רשתות הן לכך דוגמא

על משתנות . רשתות אלו'חלבונים בין האינטראקציות את המייצגות רשתות אבולוציוניים, ומניחים כי התהליך משינויים כתוצאה מאוד ארוכים זמן טווחי פני

.פשוט" מועדף קישור "מסוג מורכב יותר מאשר תהליך נוצרו באמצעותו הן:הוצעו אלו רשתות ליצירת אפשריים הסברים מספר

מנגנון קישור לקשתות2.6.1הפשוטים המנגנונים בעלות רשתות ליצירת, הנראה ככל, ביותר אחד

קישור"ב מפורש באופן משתמש אינו אשר, מעריכית דרגות התפלגותDorogovtsev et al י"ע הוצע" מועדף )2001a( .בכל המוצע במודל

בוחרים באקראי את אחת הקשתות הקיימות ברשת. לאחר בחירת שלבהקודקודים לשני אותו ומקשרים חדש קודקוד לרשת מוסיפים הקשת,

ההסתברות זה מהתהליך כתוצאה אליהם הייתה מקושרת הקשת שנבחרה. אחרות במילים. שלו לדרגה פרופורציונאלית מסוים לקודקוד תקושר שקשת

"צורה אותה בעלות הינן זה מודל באמצעות הנוצרות הרשתות קישור ביטוי לידי באה השאר בין אשר, Albert & Barabasi של המודל כמו" מועדף

. דומה שלהן הדרגות שהתפלגות בכך

מנגנון העתקת קודקודים2.6.2Kleinberg et al )1999( ה רשת ליצירת אפשרי הסבר הציע-WWW

"מנגנון באמצעות על מבוסס המוצע המודל". קודקודים של העתקה קישורים יעתיק מסוים בנושא העוסק WWW-ה ברשת חדש שעמוד ההנחה

מבוצעת המודל באמצעות הרשתות בניית. בנושא העוסקים קיימים מעמודים ובוחרים לרשת חדש קודקוד מוסיפים שלב בכל: הבא על ידי האלגוריתם

33

Page 35: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הקשתות של היעד. אחרים לקודקודים ממנו שיקושרו קשתות של m מספר ישמש אשר ברשת קיים קודקוד באקראי בוחרים: הבא באופן נבחר

מחליטהאלגוריתם האבטיפוס בקודקוד קשת כל עבור. כאבטיפוס≥0 בהסתברות α ≤ החדש מהקודקוד מכוונת קשת ליצור האם, 1

וליצור הקשת את להעתיק( α−1 בהסתברות ) או, ברשת אקראי לקודקוד עד זה בתהליך ממשיכים. הקשת של ליעד החדש מהקודקוד מכוונת קשת שנבחר ולקודקוד במידה. m היא החדש הקודקוד של היציאה דרגת אשר

נוסף קודקוד עם זה תהליך על חוזרים, קשתות m מקושרות היו לא באקראי בצורה. הקשתות כלל את שמקשרים עד הלאה וכך באקראי שנבחר

למחיקה מנגנונים גם כולל Kleinberg et al של המודלהכללית ביותר שלו .וקודקודים קשתות של

מהסיבה מעריכית דרגות התפלגות בעלות רשתות ליצירת מוביל זה מנגנון k כניסה דרגת בעל לקודקוד תוביל מקודקוד אקראית שקשת הסיכוי: הבאה

פרופורציונאלי הקודקוד דרגת גדלה בו הקצב ולכן, k-ל פרופורציונאלי קשתות יוסיף לא זה מודל Price של במודל כמו. שלו הנוכחית לדרגה

שהיעד לכך קבועה הסתברות במודל נכללת ולכן, 0 שדרגתם לקודקודים)המשך במאמר. 0 דרגה עם קודקוד יהיה חדשה קשת של Kumar et al,

קודקודים דרגות התפלגות בעלות רשתות מייצר זה מודל כי הוכח( 2000γ=(2−α-ל השווה מעריך בעלת מעריכית )/(1−α בין היחס הינו γ כאשר , (

שהיעד הקשתות מספר לעומת באקראי נבחר שלהן שהיעד הקשתות מספר0 של קטנים ערכים עבור. מהעתקה כתוצאה נבחר שלהן ≤ α ≤ מתקבלות 0.5

≥2 מעריך בעלות מעריכית קודקודים דרגות התפלגות בעלות רשתות γ ≤ 3 מנגנון אם ברור לא. האמפיריות הרשתות רוב עבור שנצפה הטווח שהינו

אולם, WWW-ה ברשת הקודקודים דרגות להתפלגות הגורם הינו ההעתקה ובמקרה הואיל, ביולוגיות רשתות של בהקשר רבה התעניינות עורר זה מודל

אחרים גנים של שכפול עקב להיווצר עשויים חדשים גנים כי הגיוני נראה זה השקול דבר, התפקוד אותו יהיו המשוכפלים לגנים. בטעות אחת מפעם יותר

גנים בין הבדל ייווצר כי ייתכן, זמן לאורך אולם., במודל הקישורים להעתקת.התפתחותיים מתהליכים כתוצאה אלו

34

Page 36: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

מנגנון הליכה על הרשת2.6.3 מתוך הוצע המנגנון. )Vasquez )2002 י"ע הוצע הרשת על ההליכה מנגנון כאשר, כללי באופן. ציטוטים ברשתות המתרחש התהליך לחיקוי ניסיון

מספר עםרק היכרותישנה לכותב, חדש בתחום מאמר לכתוב מתכננים מבוצעת נוספים רלבנטיים מאמרים מציאת. חשובים מאמרים של מצומצם

באופן נמשך זה תהליך. אלו במאמרים המופיעות בהפניות שימוש באמצעות באמצעות שהתגלו הפניות יכיל הסופי המאמר דבר של ובסופו, רקורסיבי

,התהליך את המחקה רשתות ליצירת אלגוריתם ניסח Vasquez. זה תהליך שלב בכל. בודד קודקוד בעלת רשת עם מתחילים: הבא באופן פועל אשר

.אקראי באופן נבחר אשר קיים לקודקוד מקושר אשר חדש קודקוד מוסיפים ברשימת קודקוד כל עבור. למעקב קודקודים לרשימת מתווסף זה קודקוד מקושר הוא אליהם מהקודקודים אחד כל עבור מחליטים המעקב

.זה לקודקוד החדש מהקודקוד מכוונת קשת ליצור האם p בהסתברות כאשר. המעקב לרשימת הם גם מתווספים קשר אליהם נוצר אשר קודקודים הוא המעקב ברשימת מסוים קודקוד של הקשרים כל על לעבור מסיימים

.עליהם לעבור נוספים קודקודים אין אשר עד נמשך זה תהליך. ממנה מוסר בעלי הינם גבוהה דרגה בעלי קודקודים כי לראות ניתן, p=1 בו במקרה

מכך כתוצאה. חדש קישור אליהם שייווצר לכך יותר גבוהה הסתברות מעריך בעלות מעריכית קודקודים דרגות התפלגות בעלות רשתות מתקבלות

γ=2 .כאשר p הראה , 1-ל 0 בין משתנהVasquezסימולציות , באמצעות >p עבור: פאזה מעבר ישנו כי שעשה, pc≅ הקודקודים דרגות התפלגות 0.4<p עבור ואילו, אקספוננציאלית בצורה דועכת pc מעריך עם מעריכית היא γ

כך. p=1 בו במקרה המתקבל הערך שהינו 2-ל מאוד קרוב ערך בעל"מפורש באופן כולל לא שהמודל שבעוד האחראי המנגנון" מועדף קישור

. זאת יוצר הקשתות יצירת על

35

Page 37: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

מטרת המחקר3 מקוונות לימוד רשתות של קבוצה האם לבדוק הייתה זה מחקר של מטרתו

) מודלים של מצומצם למספר לסיווג ניתנת אמפיריות (.יחיד מודל אולי אף זה למודל מתאים, מסוים למודל סווגו אשר הרשתות של שהמבנה אומרת זאת

של הדיוק רמת). המודלים לשאר מאשר יותר משמעותית ניכר באופן( המתודולוגיה בחלק מוגדרת ההתאמה מאוד רבים מודלים וישנם הואיל

מצומצם מודלים מספר נבחרו, כולם את לבדוק ניתן ולא, רשתות ליצירת ,אופנים בשני בוצעה הרשתות בחינת. רשתות ליצירת שונים מנגנונים המייצגים

:היבטים משני הרשתות נתוני את בחנו אשרהרשתות קישוריות בחינת – Binary Case: בחינה זו מתבססת על מבנה

עוצמת על במידע שימוש נעשה לא זו בבדיקה. בלבד ,ברשתות הקישוריות וקיים במידה למקושר נחשב קודקודים זוג. ברשת הקודקודים בין הקשרים

לפחות הינה הקודקודים זוג בין הקשר עוצמת כלומר, כלשהו קשר ביניהם1 .

הקשרים עוצמת בחינת – Weighted Case : של יותר מקיפה בדיקה זוהי מתבססת הן על מבנה הקישוריות ברשתות והן על אשר, הרשתות נתוני

של הקשרים. של עוצמתם בעבודתם הוזכר זה Middendorfרעיון et al

, אולם לא מומש עד כה(2004)

התועלות הצפויות של מחקר זה הן: התנהגות של יותר טובה להבנה יוביל רשתות ליצירת המתאים המודל זיהויא.

בכך יאפשר מחקר זה הבנה טובה .מקוונות לימוד ברשתות המשתמשיםיותר של התהליכים המתרחשים במהלך יצירת ידע משותף.

יכולה לכוון את מנחה רשתות הלימוד המקוונות בתכנוןב. תוצאת המחקר המשתתפים ברשת ותפקידיהם.

רשתותג. בהתנהגות לזיהוי המנגנונים השולטים תוכנה כלי יספק המחקר לימוד מקוונות על ציר הזמן.

36

Page 38: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

בסיס המידע4 בו הלימודים אשר, מרוחק ללימוד מוסד הינה ישראל הפתוחה האוניברסיטה

באוניברסיטה הלימוד אופי. לימודיות טכנולוגיות על משמעותי באופן מבוססים מטעם מנחה עם מפגשים ישנם מהמקרים בחלק כאשר, בעיקרו עצמאי הינו

העברת: כגון, הקורס של שונים בהיבטים מתמקדים המפגשים . האוניברסיטה שימוש ישנו קורס בכל, למפגשים בנוסף. לדוגמא בעיות ופתרון לימודי חומר

(.שבועות 16-כ ) בודד סמסטר לאורך כ"בד פעילה אשר, מקוונת לימוד ברשת של המטרות. הקורס מנחה של וכן הסטודנטים של כפורום משמשת זו רשת

הודעות העברת, הסטודנטים בין שיתופי ידע מבניית החל: להיות יכולות הרשת מענה של המנחה על שאלות הסטודנטים,, לקורס בנוגע לסטודנטים מהמנחה

לשרת יכולה מקוונת לימוד רשת אותה. חברתיות מטרות ואף, טכנית תמיכה ההשתתפות ותבנית התגובות קשרי, הרשת גודל. במקביל אחת ממטרה יותר

בין נעה ברשת המשתתפים כמות. לסמסטר ומסמסטר לקורס מקורס משתניםניתן. סטודנטים 50-כ על מדובר ברובן אולם, 150-ל 10 לכתוב בפורום

. בקורס המשתתפים כלל י"ע לצפייה ניתנות אשר, הודעות

של רשתות 500-כ מתוך מקוונות לימוד רשתות 35 נבחנו זה במחקר נכללו לא כאשר, באקראי נבחרו רשתותה. בישראל הפתוחה האוניברסיטה

שנבחר מהסף נמוכה הייתה בהם המשתתפים כמות אשר רשתות 5 בבחירה סמך על נבנה, שנבחנו הלימוד רשתות של הרשתי הייצוג. משתתפים 10 של

אשר, opus2sna בשם תוכנה באמצעות בסיס נתונים המכיל את ההודעות שנותח Aviv et)אלו הרשתות נתוני על נערכו אשר קודמים מחקרים במסגרת פותחה

al., 2007a, Aviv et al., 2007b .) בנויות התוכנה באמצעות הנוצרות הרשתות i מקודקוד מכוונת קשת. ברשת קודקוד י"ע מיוצג משתתף כל: הבא באופן

של להודעה הגיב j קודקוד י"ע המיוצג והמשתתף במידה נוצרת j לקודקוד את מגדיר משתתפים זוג בין התגובות מספר. i קודקוד י"ע המיוצג המשתתף

.ביניהם הקשר עוצמת

37

Page 39: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

מודלים ליצירת רשתות5 בדיקת: הרשתות נתוני של בדיקות שתי נערכו, המחקר במטרת שצוין כפי

קבוצה נבדקה מהבדיקות אחת כל עבור. הקשרים עוצמת ובדיקת הקישוריות עוצמת בדיקת של במקרה שנבדקו המודלים כללי באופן. מודלים של נפרדת

בבדיקת שנבדקו המודלים של( Weighted )הממושקלת הגרסה הינם הקשרים.הקישוריות

מודלים לבחינת קישוריות הרשתות5.1 האחרונות בשנים, זו עבודה בתחילת הרשתות תחום על בסקירה שתואר כפי

מתוך. שונים מנגנונים על המתבססים רשתות ליצירת נרחב מודלים מגוון הוצע רשתות ליצירת שונים מנגנונים המייצגים שונים מודלים שישה נבחרו זה מגוון

והם: מכוונות אקראיות

המכוון האקראי הגרף מודל5.1.1 & Erdos( אקראיים גרפים ליצירת הקלאסי המודל של המכוונת הגרסה זוהי

R'enyi, בסעיף בסקירה בהרחבה תואר אשר, ) 1960 זה מודל. 2.3.1 אקראי באופן נבחרים ברשת הקודקודים בין שהקשרים בכך מאופיין מסוימים קשרים ליצירת עדיפות הנותן כלשהו מנגנון שישנו מבלי, לחלוטין

.אחרים קשרים פני על

: הפרמטרים של המודלN - כמות הקודקודים ברשת.p - קודקודים זוג בין קשתות לייצר האם לקביעה המשמש פרמטר .

: הבא באופן מבוצע המודל באמצעות הרשת בניית תהליךברשת הקודקודים כמות את קובעים N ,הפרמטר של ערכו ואת p

≥0 בטווח p ≤ 1.ברשת שונים קודקודים זוג כל עבור i , j בהסתברות מחליטים p

. j לקודקוד i מקודקוד מכוונת קשת ליצור האם

: הבאות התכונות בעלות רשתות ליצירת מוביל זה תהליך

38

Page 40: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הינו ברשת הממוצע הקשתות מספר E≅ pN (N−1) .הקודקודים זוגות בין הממוצע המרחק L של כפונקציה גדל

L=log(N ). בינומית היא בגרף הקודקודים דרגות התפלגות.

39

Page 41: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

המודל עבור הפרמטרים בחירת אופן שווה להיות N את נבחר האמפיריות לרשתות הדומות רשתות ליצור מנת על

יהיה p של ערכו ואילו האמפירית ברשת הקודקודים למספרp=E / N (N−1) כאשר ,E.הינו מספר הקשתות ברשת האמפירית

סטטי " קישור מועדף " מודל 5.1.2 קישור"ה תכונת בעלי הסטטיים המודלים משפחת את מייצג זה מודל

)רבות גדולות רשתות של התכונות לתיאור הוצע המודל". המועדף Goh,

Khang, & Kim, 2001) .כמות בהן, סטטיות רשתות יצירת על מבוסס המודל רמות מקבלים אלו קודקודים. הרשת יצירת בזמן נקבעת ברשת הקודקודים

במהלך. נרחב ערכים טווח על המתפרסות אפריורי באופן שונות משיכה משיכה רמות בעלי קודקודים בין להיווצר" מעדיפים "הקשרים, הרשת בניית

. גבוהות

: הפרמטרים של המודלN – כמות הקודקודים ברשת.m – הקשתות מספר לקביעת פרמטר.α .ברשת הקשתות יצירת תהליך על השולט פרמטר - ¿∋¿α out∈¿ - ברשת הקשתות יצירת תהליך על השולט פרמטר.

: הבא באופן מבוצע המודל באמצעות הרשת בניית תהליךעד 1-מ ממוספרים הרשת קודקודי N.משקלים שני משויכים קודקוד לכל:

oקודקוד של הנכנס המשקל כאשר, נכנס משקל i הינו pi¿=i−α ¿

.oקודקוד של היוצא המשקל כאשר, יוצא משקל i הינו

piout=i−α out.

שונים קודקודים שני באקראי בוחרים.oהקודקוד את לבחור ההסתברות כאשר, מקור קודקוד

pi בהסתברות היא i שמספרוout /∑

k=1

k=N

pkout.

40

Page 42: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

oשמספרו הקודקוד את לבחור ההסתברות כאשר, יעד קודקוד

j בהסתברות היא p j¿ /∑

k=1

k=N

pk¿.

שנבחרו הקודקודים בין מכוונת קשת ברשת קיימת ולא במידה- .זו קשת לרשת מוסיפים אזי - j לקודקוד i מקודקוד

ל מגיעה ברשת הקשתות כמות אשר עד התהליך על חוזרים-mN.

41

Page 43: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

: הבאות התכונות בעלות רשתות ליצירת מוביל זה תהליךהיא ברשת קודקוד של הממוצעת הנכנסת הדרגה m.היא ברשת קודקוד של הממוצעת היוצאת הדרגה m.k i

: מקיימת i קודקוד של הנכנסת הדרגה - ¿

k i

¿

∑j

k j¿=

1−α¿

N1−α ¿iα ∑ כאשר , ¿j

k j¿=mN.

k iout - קודקוד של היוצאת הדרגה i מקיימת:

k i

out

∑j

k jout =

1−α out

N1−α outiα out, כאשר∑j

k jout=mN.

התפלגות בעלת היא הקודקודים של הכניסה דרגות התפלגות כי נובע מכךPD: הבאה מהצורה מעריכית

¿ (k )=kγ γ¿=(1+α¿)/α כאשר. ¿ התאמת י"ע לכן. ¿α הפרמטר בטווח ¿γ הפרמטר של שונים ערכים לקבל ניתן ¿ בטווח ¿2<γ¿<∞.

התפלגות בעלת היא הקודקודים של היציאה דרגות התפלגות כן-כמוPD: הבאה מהצורה מעריכית

out (k )=kγ out .כאשר γout=(1+α out)/αout .י"ע לכן α הפרמטר התאמת out הפרמטר של שונים ערכים לקבל ניתן ¿ בטווח γout

.∞>γout>2 בטווח

המודל עבור הפרמטרים בחירת אופן נבחר, האמפיריות לרשתות דומות רשתות המודל באמצעות ליצור מנת על m הפרמטר ואילו האמפירית ברשת הקודקודים למספר שווה להיות N את

כמות של ביותר הקרוב השלם לערך שווה תהיה הקשתות שכמות כך ייבחר. האמפירית ברשת הקשתותα הפרמטרים ערכי את במדויק לחשב ניתן, תיאורטית α-ו ¿ out התפלגות פ"ע

אפשרי איננו הדבר מעשי באופן אולם. האמפירית ברשת הקודקודים דרגות לכך גורמת אשר, האמפיריות ברשתות יחסית הנמוכה הקודקודים כמות עקב .הקודקודים דרגות התפלגות של מדויק לזיהוי מידע מספיק ברשותנו שאין פרמטרים עבור 0.5 הערך את שרירותי באופן בחרנו הבדיקה במסגרת לכן.אלו

42

Page 44: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

דינמי " קישור מועדף " מודל 5.1.3 קישור"ה תכונת בעלי המתפתחים המודלים משפחת את מייצג זה מודל

World-ה של ההתפתחות לתיאור הוצע זה מודל". המועדף Wide Web

)Krapivsky, Rodgers, & Redner, מוסיפים בו התפתחותי מודל זהו. ) 2001 . וקשתות קודקודם לרשת הדרגתי באופן

: הפרמטרים של המודלN – כמות הקודקודים ברשת.p – לרשת קשת או קודקוד להוספת ההסתברות על השולט פרמטר.a - שרוצים הקשת של הכניסה קודקוד בחירת על המשפיע פרמטר

.להוסיףb - שרוצים הקשת של היציאה קודקוד בחירת על המשפיע פרמטר

.להוסיף

: הבא באופן מבוצע המודל באמצעות הרשת בניית תהליךבהסתברות p מקושר זה קודקוד. חדש קודקוד לרשת מוסיפים

נבחר מקושר הוא אליו הקודקוד כאשר הקיימים הקודקודים לאחד כך. הקיימים הקודקודים של הכניסה דרגות פ"ע באקראי

היא i לקודקוד החדש הקודקוד את לקשר שההסתברותk i

¿

∑j

k j¿ +a,

k כאשר i.iקודקוד של הכניסה דרגת הינה ¿

1 בהסתברות−p קיימים קודקודים שני בין קשת לרשת מוסיפים כאשר

.שלהם והיציאה הכניסה דרגות פ"ע באקראי נבחרים הקודקודים הקשת של הכניסה כקודקוד i הקודקוד את לבחור ההסתברות

היא החדשהk i

¿

∑j

k j¿ +a ,כאשר k i

.i קודקוד של הכניסה דרגת הינה ¿

הקשת של היציאה כקודקוד i הקודקוד את לבחור ההסתברות

היא החדשהk i

out

∑j

k jout+b ,כאשר k i

out קודקוד של היציאה דרגת הינה i.

43

Page 45: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

והקשתות הקודקודים ימספר אשר עד מתמשך הרשת בניית תהליך.לערכיהם ברשת האמפירית מתאימים מכילה שהרשת

/1 היא בהם קודקודים של הממוצעת הדרגה אשר רשתות מייצר זה תהליך p

. הקשתות במספר במדויק לשלוט מאפשר לא הרשת בניית ותהליך הואיל

לכמות ישתווה הקודקודים מספר כאשר התהליך את נעצור, הנוצרות לרשת הדמיון את להגדיל מנת על, בנוסף. האמפירית ברשת הקודקודים/1- ש כך p את נבחר האמפירית p ברשת הממוצעת לדרגה שווה יהיה /1: מתקיים כי נקבל מכך כתוצאה. האמפירית p=2 E/ N ולכן p=N /2 E.

הפרמטרים של ערכם במסגרת עבודה זו קבענו את a ו-b 0-ל.

דינמי משופר " קישור מועדף " מודל 5.1.4 י"ע פותחה אשר, 3' מס מודל של יותר מאוחרת גרסה הינו זה מודל

) המקורי המודל של הממציאים Krapivsky, & Redner, 2002) זה מודל. לרשתות יותר דומות רשתות יצירת לאפשר מנת על, 3 מספר ממודל פותח

הנוצרות שהרשתות בכך, הינו המודלים בין ההבדל .במציאות הקיימות שהרשתות בעוד, קשירות רכיבי מספר להכיל עשויות זה מודל באמצעות נובע זה הבדל. בודד קשירות רכיב מכילות 3' מס מודל באמצעות המיוצרות

עם מייד קיימים לקודקודים מקושרים לא חדשים קודקודים זה שבמודל מכך. היווצרותם

: הפרמטרים של המודל

N – כמות הקודקודים ברשת.E – כמות הקשתות ברשת.a - שרוצים הקשת של הכניסה קודקוד בחירת על המשפיע פרמטר

.להוסיףb - שרוצים הקשת של היציאה קודקוד בחירת על המשפיע פרמטר

.להוסיף

44

Page 46: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

ההבדל .3' מס במודל הרשת בניית לתהליך בדומה מבוצעת הרשת בניית הוא, חדש קודקוד להוסיף האפשרות נבחרה בו שבמקרה בכך הינו היחיד

. אוטומטי באופן קיים לקודקוד מקושר אינו

עבור בוצע מאשר במקצת שונה באופן בוצעה הרשת בניית, מעשי באופן:הבא באופן הוגדר בפועל שימוש בו שבוצע התהליך. המקורי המודל

' א שלב.צלעות ללא קודקודים N בעלת רשת יוצרים ' ב שלב

את באקראי בוחרים קשת שמוסיפים פעם בכל. קשתות לרשת מוסיפים ההסתברות. שלהם והיציאה הכניסה דרגות פ"ע תקשר שהיא הקודקודים

עבור שהוגדרו כפי הינן הקשת של והכניסה היציאה קודקודי את לבחור. המקורי במודל הקשת הוספת מקרה

כאשר. ברשת קשתות E ישנם אשר עד הקשתות הוספת תהליך על חוזרים סמך עלבכל שלב נבחרים קשת תהיה ביניהם הקודקודים כי להדגיש חשוב

.שלהם העדכניות הדרגות

לאפשר מהרצון נבע הבנייה המקורי התהליך לעומת הבנייה בתהליך השוני איננו אשר דבר. ברשת המתקבלת הסופית הקשתות בכמות מדויקת שליטה ומעוניינים במידה (, 3' מס במודל לא וגם ) המקורית ההגדרה לפי אפשרי

.וקשתות קודקודים של מסוים מספר תכיל שהרשת

המתקבלות לרשתות דומות תכונות בעלות הינן המתקבלות הרשתות על משפיע לא, הבניה בתהליך שנעשה השינוי. 3' מס מודל באמצעות

של מחלקה תת הינן באמצעותו הנבנות והרשתות הואיל, אלו תכונות פשוטה בצורה זאת לראות )ניתן. המקורי המודל י"ע המתקבלות הרשתות

וכל במידה, אלו רשתות ליצור יכול המקורי שהמודל האבחנה י"ע (.קשתות נוצרו כ"ואח בהתחלה נוצרו הקודקודים

45

Page 47: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

מודל העתקה דינמית5.1.5 הוצע המודל. ההעתקה מנגנון בעלי המודלים משפחת את מייצג זה מודל

,Vasquez )Vazquez י"ע 2002 רשתות של התפתחותן את לתאר ונועד ) ומקושר חדש קודקוד מתווסף שלב בכל בו התפתחותי מודל זהו. ציטוטים

במודל" מועדף קישור "על המתבססים למודלים בניגוד. הקיימים לקודקודים ,הקיימים הקודקודים על חלקי מידע רק יש לרשת המתווסף קודקוד לכל זה

.שלו השכנים באמצעות הרשת על חדש מידע מגלה הוא כאשר

המודל של הפרמטרים החדש הקודקוד לקישור ההסתברות שהינו p בודד פרמטר יש זה למודל.קשר נוצר אליו הקודקוד של השכנים לאחד בקשת

: הבא באופן מבוצע המודל באמצעות הרשת בניית תהליך ' א שלבבודד קודקוד בעלת רשת יצירת ' ב שלב

- ברשת הקיימים הקודקודים לאחד שלו וקישור לרשת קודקוד הוספת v שיש הקודקודים לרשימת v הקודקוד את מוסיפים. אקראי באופן נבחר אשר

קודקוד כל ועבור שבנינו הקודקודים רשימת על עוברים. עליהם לעבור קשת כל עבור. אליו המקושרות הקשתות רשימת את בוחנים ברשימה קשת ליצור האם כלומר – הקשת את להעתיק האם p בהסתברות מחליטים

.מהרשימה הקודקוד את זו קשת מקשרת אליו לקודקוד, החדש מהקודקוד הקשת של היעד קודקוד את מוסיפים, הקשת את להעתיק ובחרנו במידה

כל על לעבור שסיימנו לאחר. עליהם לעבור שיש הקודקודים לרשימת זה תהליך. מהרשימה הקודקוד את מסירים מסוים קודקוד של הקשתות

.מתרוקנת למעבר הקודקודים רשימת אשר עד נמשך.הנדרשת הקודקודים כמות בעלת רשת ליצירת עד' ב שלב על חוזרים

שלב על מתבצעת חזרה, האמפיריות לרשתות דומות רשתות ליצור מנת על ברשת הקודקודים לכמות זהה תהיה ברשת הקודקודים כמות אשר עד' ב

.האמפירית.0.5 נבחר להיות p הפרמטר ערך זו עבודה במסגרת

46

Page 48: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הקטן" – גרסה מכוונת העולם " מודל5.1.6 ,Watts (Watts י"ע שהוצע הקטן העולם מודל של המכוונת הגרסה זוהי

שהתגלתה" הקטן העולם "לתופעת אפשרי כהסבר הוצע זה מודל. (1999 הסבר נוסף על המודל מופיע . המודל שם נובע ומכאן אמיתיות ברשתות.בסקירה

: הפרמטרים של המודלN – כמות הקודקודים ברשת.k – קודקוד כל של והיציאה כניסה דרגת.p – קשת של מחדש לחיווט ההסתברות על השולט פרמטר.

: הבא באופן מבוצע המודל באמצעות הרשת בניית תהליך . הרשת יצירת שלב ' – א שלב מכוונת בקשת מחובר קודקוד שכל כך. קודקודים N בעל טבעתי סריג בונים

מספור י"ע זאת בצענו, מעשי באופן. ביותר אליו הקרובים הקודקודים k-ל קודקוד עבור: הבא באופן הקודקודים וקישור, N−1 עד 0-מ הקודקודים

−i|: המקיים j קודקוד לכל מהקודקוד קשתות נוסיף, i שמספרו j|≤k /2 באפן שנבחר הצדדים מאחד נוסף קודקוד מקשרים זוגי-אי k-ו )במידה(.שרירותי

מחדש החיווט שלב ' – ב שלב מחליטים קשת כל עבור. ברשת הקשתות כל על מעבר מתבצע זה בשלב

,כן לעשות והוחלט במידה. שלה היעד קודקוד את לשנות האם p בהסתברות ישנה זאת עם. אליו הקשת את ומקשרים חדש יעד קודקוד באקראי בוחרים .כפולות קשתות או עצמיות קשתות ייווצרו שלא כך זה תהליך על הגבלה לכך הגורמים" דרך קיצורי "נוצרים המתקבלת שברשת לכך גורם זה תהליך

אחרות במילים או, קטן יהיה קודקודים זוג כל בין הממוצע שהמרחק"תכונת בעלת תהיה הנוצרת שהרשת גם תלוי זה דבר" ) הקטן העולם

(. p מחדש החיווט פרמטר של בערכו בעלת הינה הנוצרת הרשת כן-כמו .ההתחלתי הסריג על ההתבססות עקב גבוה clustering ערך מקדם

47

Page 49: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

מודלים לבחינת עוצמת הקשרים ברשתות5.2 רשתות יצירת של במודלים שימוש תוך בוצעה ברשתות הקשרים עוצמת בחינת

הרצון עקב בוצע זה דבר. ממושקלות רשתות ליצירת הותאמו אשר בינאריות להכללה ניתנות הקישוריות בחינת עבור שהתקבלו התוצאות האם לבחון מודלים ארבעה נבחנו כך לשם. הקשרים עוצמת את גם לבחון עוברים כאשר

על מבוססים אשר, מכוונות אקראיות רשתות ליצירת שונים מנגנונים המייצגים על התאמות בוצעו אלו מודלים עבור. הקישוריות בבחינת שנבחנו המודלים

ביניים מודל נבחן,הבדיקה במהלך, בנוסף. ממושקלות רשתות שייצרו מנת:הם שנבדקו המודלים. קיימים מודלים שני של מנגנונים המשלב נוסף

המכוון הממושקל האקראי הגרף מודל5.2.1 אשר המכוון האקראי הגרף מודל של הממושקלת הגרסה הינו זה מודל הינו המקורית הגרסה לבין זו גרסה בין היחיד ההבדל. הקודם בחלק תואר מן כתוצאה. קודקודים זוג בין אחת מקשת יותר ליצור ניתן זו שבגרסה בכך

אם. הרגיל במקרה מאשר קמעה שונה באופן מבוצעת הרשת בניית, השינוי.רגיל במקרה גם ליישום ניתנת זה במקרה הרשת נוצרת בה השיטה כי

: הבא באופן מבוצעת הרשת בנייתהקודקודים כמות את קובעים N הקשתות משקלי סכום ואת – W

.ברשתבעלת רשת מייצרים N קשתות ללא קודקודים.מ קטן שנוצרה ברשת הקשתות משקלי סכום עוד כל-W את מבצעים

:הבאים הצעדיםברשת שונים קודקודים זוג בוחרים i , j תלוי ובלתי אקראי באופן.

i.שנבחר הקודקודים זוג בין מכוונת קשת קיימת ולא במידה( לה ונותנים שכזו קשת לרשת מוסיפים (, j-ל i-מ מכוונת קשת

.1 המשקל אתii.מ המכוונת הקשת של המשקל את מגדילים אחרת-i

. 1-ב הקיימת j-ל

המודל עבור הפרמטרים בחירת אופן

48

Page 50: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

שווה להיות N את נבחר האמפיריות לרשתות הדומות רשתות ליצור מנת על משקלי סכום יהיה W של ערכו ואילו האמפירית ברשת הקודקודים למספר

.האמפירית ברשת הקשתות

סטטי ממושקל " קישור מועדף " מודל 5.2.2 בחלק אשר תואר סטטי" מועדף קישור"ה מודל של הרחבה הינו זה מודל

השוני. המקורי המודל של לפרמטרים זהים זה מודל של הפרמטרים. הקודם הקשת של המיקום שכאשר בכך הינו המקורי למודל זה מודל בין היחיד

מתעלמים לא אזי, בקשת מקושרים שכבר קודקודים זוג בין הינו להוספה. 1-ב הקשת משקל את מגדילים אלא הבינארי במקרה כמו מהבחירה

המודל עבור הפרמטרים בחירת אופן נבחר, האמפיריות לרשתות דומות רשתות המודל באמצעות ליצור מנת על m הפרמטר ואילו האמפירית ברשת הקודקודים למספר שווה להיות N את

. האמפירית ברשת הקשתות משקלי לסכום שווה יהיה שערכו כך ייבחר

α הפרמטרים עבור 0.5 בערך השתמשנו הבינארי למקרה בדומה α-ו ¿ out.

דינמי ממושקל " קישור מועדף " מודל 5.2.3 בחלק אשר תואר דינמי" מועדף קישור"ה מודל של הרחבה הינו זה מודל

השוני. המקורי המודל של לפרמטרים זהים זה מודל של הפרמטרים. הקודם קודקודים זוג נבחרים שכאשר בכך הינו המקורי למודל זה מודל בין היחיד. 1-ב הקשת משקל את מגדילים אזי, בקשת מקושרים שכבר

משקלי וסכום הקודקודים מספר אשר עד נמשך הרשת בניית תהליך.האמפירית הרשת של לערכים מתאים מכילה שהרשת הקשתות

לערכים דומים להיות נבחרו, זה במקרה שימושנעשה בהם הפרמטרים ערכי. הבינארי המקרה בבדיקת שנבחרו

49

Page 51: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

דינמי ממושקל משופר " קישור מועדף " מודל 5.2.4 משופר אשר תואר דינמי" מועדף קישור"ה מודל של הרחבה הינו זה מודל

המודל בין היחיד השוני כאן גם הקודמים במודלים כמו. הקודם בחלק שכבר קודקודים זוג נבחרים שכאשר בכך הינו הממושקלת לגרסה המקורי

. 1-ב הקשת משקל את מגדילים אזי, בקשת מקושרים

משקלי וסכום הקודקודים מספר אשר עד מתמשך הרשת בניית תהליך.האמפירית הרשת של לערכים מתאים מכילה שהרשת הקשתות

לערכים דומים להיות נבחרו, זה במקרה שימושנעשה בהם הפרמטרים ערכי. הבינארי המקרה בבדיקת שנבחרו

סטטי דינמי ממושקל " קישור מועדף " מודל 5.2.5 )ממושקל סטטי" מועדף קישור"ה מודל של המנגנונים את משלב זה מודל מודל (. 3' מס מודל ) ממושקל דינמי" מועדף קישור "ומודל ( 2' מס מודל

במודל לשימוש הסיבה. שנבדקה הראשונית המודלים מקבוצת חלק איננו זה על פירוט. המנצח המודל של ההתאמה איכות את לשפר בניסיון הייתה זה.בהמשך מופיע כך

הבינארי במקרה שנבחנו מהמודלים שניים עבור לראות שניתן כפי - מודל נבע זה דבר. ממושקלת גרסה ייצרנו לא - דינמית העתקה ומודל הקטן העולם

: משני גורמים למקרה טבעית הרחבה אין אלו מודלים עבור, המודלים לשאר בניגוד.1

.הממושקל במקרהלנתוני הרשתות האמפיריות מובהק התאמה חוסר הראו אלו מודלים.2

במקרה ביותר המתאים המודל את יהוו שהם הסבירות לכן הבינארי..נמוך הממושקל

50

Page 52: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

מתודולוגיה6 נעשה שימוש המקוונות הרשתות יצירת על האחראי המנגנון את לזהות מנת על

:הבאה במתודולוגיה

בניית מסווגים6.1:הבאות הפעולות בוצעו שנבחרו רשתות ליצירת מהמודלים אחד כל עבור

לפרמטרים בהתאם למודל השייכות רשתות לחולל המסוגל קוד כתיבת .הנדרשים

הרשתות של לפרמטרים בהתאם לדוגמא רשתות מספר יצירת . האמפיריות

י"ע שהוצעה בשיטה מימדי-רב מאפיינים ווקטור חישוב Middendorf et al

.שנוצרו מהרשתות אחת כל עבור' , א בנספח המתוארת, ) 2004(

: הבא באופן מסווג בינארי נבנה מודלים זוג וכל אמפירית רשת כל עבורוקבוצות אימון לקבוצות המודלים זוג של המאפיינים ווקטורי חלוקת

.מבחןמבחן קבוצת כל עבור גבוהה דיוק רמת בינארי בעל מסווג בניית,כאשר עבור, המתאימה הבדיקה קבוצת באמצעות המסווג איכות בדיקת

.1 בטבלה המופיעים הערכים חושבו מסווג כל

תוצאות חלוקת תיאור - 1 טבלה המסווג בדיקת

סיווג נכוןסיווג שגוי

AB

CD

שונות ובדיקה אימון קבוצות עם פעמים מספר התהליך על בוצעה חזרה, מקבוצת כתוצאה נובעת אינה, שנבנו המסווג איכות כי לוודא מנת על

.הספציפית האימוןסיווג המסווגים כלל באמצעות האמפיריות הרשתותשל בוצע

.המתאימים

51

Page 53: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

:הבאות ההגדרות מתקיימות 1 כפי שניתן לראות בטבלהקבוצת מתוך נכונה שסווגו הכללי הרשתות אחוז הינו המודל של הדיוק

Percsion=A+C- ל שווה ולכן, המבחן /(A+B+C+D).

ל שווה נכון סווגה' א למודל שסווגה רשת כי הסיכוי -Pא (True)= AA+D

ל שווה נכון לא סווגה' א למודל שסווגה רשת כי הסיכוי-

Pא (False)= DA+D

ל שווה נכון סווגה' ב למודל שסווגה רשת כי הסיכוי -Pב(True)= CB+C

ל שווה נכון לא סווגה' ב למודל שסווגה רשת כי הסיכוי-

Pב ( False )= BB+C

בדיקת עמידות המסווגים6.2 המדויק באופן מדמה שנבחרו המודלים מבין מי לקבוע הייתה המחקר מטרת שבחרנו מהמודלים אחד אף כי ייתכן זאת, עם. אמפירית נתונה רשת ביותר מי הינה הסיווג תוצאות של הפרשנות זה במקרה. הנכון המודל הינו מראש

. שגוי פחות הכי המודלים מבין

אזי, האמפירית הרשת את מדויק באופן מדמה אכן שנבחר והמודל במידה התוצאות שהתקבלו, שנבחר הרשת של מאפיינים של קבוצה תת כל עבור

ייתכן כי אף, אולם. ביותר הגבוהה הסבירות בעל המודל הינו זה יראו כי מודל הוא שנבחר והמודל מדמה במדויק את הרשת האמפירית אינו מהמודלים אחד הרשת של מהמאפיינים חלק כי ייתכן זה במקרה שגוי. פחות הכי המודל רק

.אחר למודל התאימו אחרים שמאפיינים בעוד אחד למודל התאימו האמפירית

ובדקנו האם בכל מאפיינים של שונות קבוצות תתי על אימנו מסווגים, לכן הנחנו, בסבירות. במידה ודבר זה התרחש, אזי התוצאה אותההתקבלה פעם

ואכן המאפיינים בקבוצת תלוי אינו סיווג הרשת האמפירית למודל כי גבוהה, אשר כמסווג עמיד מסווג הגדרנועל כן . האמפירית הרשת את במדויק מתאר

ערך. מאומן הוא עליהם מאפיינים של קבוצות תתי על עקביות תוצאות נותן הסיווגים כלל מתוך העקביות התוצאות כאחוז הוגדר המסווג של העמידות

.מאפיינים קבוצות תתי על שבוצעו

52

Page 54: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

בחירת המסווגים6.3 במסווגים רק השתמשנו גבוהה תהיה הסיווג תוצאות של שהסבירות מנת על

:הבאים בתנאים עמדו אשר.גבוה היה המסווג של העמידות ערך.1– הכולל המסווג י"ע האמפירית הרשת סיווג תוצאת.2 כלל על המסווג

תתי על המתאימים המסווגים של הסיווג לתוצאת זהה הייתה המאפיינים.המאפיינים קבוצות

מציאת המודל הזוכה6.4 במספר פעלנו, הרשתות את הטוב באופן המדמה המודל מהו לגלות מנת על

:שלבים"אשר המודל מיהו, אמפירית רשת כל עבור בדקנו.1 שאר כל את" ניצח

אחד בכל האמפירית הרשת סווגה אליו אשר המודל מיהו כלומר, המודלים. השתתף הוא הבינאריים בהם מהמסווגים

שאר את ניצח אשר מודל קיים האם בדקנו, המנצח המודל מציאת לאחר.2.שנבדקו הרשתות של מובהק ברוב המודלים

כי ההשערה של הסטטיסטית המובהקות את עבור כל מודל שכזה, בדקנו.3 שאר מאשר יותר טוב האמפיריות הרשתות את מדמה אכן זה מודל

התקבלו שקיבלנו שהתוצאות ההסתברות כי בדקנו כלומר, המודלים יהיה הסף שערך הייתה , כמובן, )השאיפה. שקבענו סף מערך נמוך באקראי

(. האפשר ככל נמוך

בדיקת איכות תוצאות הסיווג6.5 המסווגים שנבנו עשויים לעיתים לשגות ולסווג את הרשתות האמפיריות למודל הלא נכון. רצינו לקבל הערכה של איכות הסיווג, כפונקציה של אחוז הרשתות

האמפיריות שסווגו נכונה. על מנת לבצע זאת התבססנו על שני גורמים: ה-א. ( הדיוק בנייתPrecisionהערכת בעת שחושבה המסווגים של )

. 6.1המסווגים כפי שמתואר בסעיף שימוש בעובדה שהסיווג של הרשתות האמפיריות בין זוגות המודלים בוצעב.

עבור מספר רב של רשתות אמפיריות.

53

Page 55: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

סוג כל עבור :הבא באופן בוצעההסיווג האיכות של תוצאות בדיקת הסיווג שלו על כל הרשתות תוצאות שכלל המאורע הסתברות חושבה מסווג

בלתי הן והתוצאות הואיל. שלו נכון מסיווג כתוצאה נבעועליהם הוא הופעל עצמה בפני תוצאה שכל ההסתברויות למכפלת שווה ההסתברות אזי, תלויות שווה ל: ההסתברות כי קיבלנו לכן. המסווג של נכון מסיווג כתוצאה נבעה

P ( X )=∏x i∈ X

P(x i),כאשר X הרשתותהסיווגים של תוצאות כלל קבוצת הינה

P(x-ו האמפיריות i) ההרשת האמפירית של הסיווג כי ההסתברות הינה-i היה . כל מסווג הואi-ה התוצאה של הסיווג בתוצאת תלוי P(xi) של נכון. ערכו

ו-ב', כך ש i הרשת האמפירית ה- אםבינארי – מבחין בין שני מודלים: א' P כי נקבל אזי 'א למודל סווגה ( x i)=Pא (True) ,כי נקבל אחרת

P ( x i)=Pב(True) .

לא הספיקהבלבד זו בדיקה כי תוצאות הסיווג של מסווג להראות מנת על בחלק נכבד ,מחד: גורמים משני נובע דבר זה ספציפי הינן באיכות טובה.

P המסווגים איכותמהמקרים, ( x i)מושלמת הייתה לא הבדיקה ומאידך ,, מספר המסווגים איכות היות עקב לכן. תוצאות של גדולה כמות על הבוצע מהסף משמעותית הינה נמוכה שלהם המכפלה תוצאת, מאחד הקטן חיובי

.גבוהה סיווג איכות בעל היה עצמו בפני מסווג שכל למרות זאת, שקבענו תוצאות 20 וקיימים, 95% הינה מהמסווגים אחד כל שאיכות במקרה למשל

0.9520 של ערך נותנת החישוב תוצאת אזי, סיווג ≅ ערך הנמצא במרחק , 0.38מהסף אותו קבענו. רב מאוד

המודל עדיין אך, טעו מהמסווגים חלק בהם ההסתברויות את גם חישבנו, לכן בדקנו אם למשל. ברובם ולפחות המקרים של משמעותי באחוז זוכה המנצח

,מהמקרים 15-ב' א מודל לטובת הכריעו המסווגים כי וקיבלנו, רשתות 20 לכך ההסתברויות סכום את נחשב', ב מודל לטובת הכריעו המקרים ובשאר

זה במקרה שגם כך', א מודל לטובת בסיווג טעויות ארבע היותר לכל שהיו שחישבנו ההסתברויות את מהמקרים. סיכמנו 11/20-ב לפחות זוכה' א מודל

במקרה מערך הסף שנקבע. גבוהS הסכום שהתקבל שנסמנו ב- אם ובדקנו המייצג כמודל' ב מודל מאשר יותר טוב' א מודל מובהק באופן כיאמרנו זה

.S−1 ל- השווה שגיאה הסתברות עם האמפיריות הרשתות את

54

Page 56: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הייתה מובן כי שאיפתנו הנדרש המובהקות ציון בו למצב להגיעהמקורית 50%-מ יותר של רגיל ברוב לא הזוכה המודל של זכייה עבור יתקבל

.הניתן ככל גדול מכריע ברוב אלא מהמקרים,

55

Page 57: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

תוצאות7 .האמפיריות הרשתות נתוני על הופעלה הקודם בחלק שתוארה המתודולוגיה

זה מחקר למטרת שפותחה תוכנה באמצעות בוצע המתודולוגיה יישום לשימוש הניתנים חיצוניים בכלים שימוש באמצעות וכן', ב בנספח ומתוארת

.בהמשך יצוינו אשר האינטרנט ברשת חופשי

הרשתות קישוריות בחינת תוצאות7.1 ייעשה העבודה בהמשך, התוצאות של יותר נוחה הצגה לאפשר מנת על

.השונים המודלים עבור הבאים בקיצורים שימוש.DRG – המכוון האקראי הגרף מודל.1.SPA – סטטי" מועדף קישור "מודל.2.DPA – דינמי" מועדף קישור "מודל.3.IDPA – משופר דינמי" מועדף קישור "מודל.4.DC– מודל העתקה דינמית .5.DSW" – הקטן העולם "מודל של מכוונת גרסה.6

ביצוע הסיווג7.1.1 מהמודלים אימון דוגמאות חוללו, האמפיריות הרשתות את לסווג מנת על

ברשתות הקודקודים למספר זהה קודקודים מספר בעלות לעיל שתוארו לקביעה ניתנת לא מהמודלים בחלק הקשתות וכמות הואיל. האמפיריות

הקשתות מספר אשר רשתות רק שחוללו הדוגמאות מתוך נבחרו, מדויקת. האמפיריות ברשתות הקשתות מממספר 2%-ב היותר לכל סטה שלהן

כל עבור, דוגמארשתות- 500 חולל אנסמבל של, אמפירית רשת כל עבור אחת כל עבור חולל, רשתות-הדוגמא יצירת לאחר. המסווגים לאימון, מודל י"ע שהוצעה השיטה פ"ע מימדים 4680 בעל מימדי-רב תכונות ווקטור מהן

Middendorf et al על מבוססת כמות זו של מאפיינים . בנספח א' המתוארת ליצירתכמות מספקת זוהי כי, Middendorf et al של תוצאות הבחינה במאמר

כפי שאכן היה בפועל גם במקרה שלנו. בנוסף גבוה, דיוק בעלי מסווגים בוצעה בדיקה עצמאית שהראתה כי חילול של פחות מאפיינים יצר מסווגים

בעלי רמת דיוק נמוכה יותר.

56

Page 58: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

למרות זאת, כפי שניתן לראות מתוצאות בדיקת העמידות בהמשך, אין בפועל צורך בכל המאפיינים שנוצרו, אולם לא ניתן לייצר מראש אך ורק

ולכןMiddendorfאת המאפיינים הרלבנטיים באמצעות שימוש בשיטת , נדרשה כמות זו של מאפיינים.

.מבחן וקבוצת אימון קבוצת: קבוצות לשתי חולק אנסמבל רשתות-הדוגמא 1/5 כלומר, 1:4 של ביחס הייתה והמבחן האימון קבוצות בין החלוקה

. שלו הדיוק לבדיקת והשאר המודל לאימון שימשו מרשתות הדוגמא Support Vector מסוג גבוה דיוק בעל מסווג אומן, מודלים זוג כל עבור

Machine )Vapnik, קבוצת נתוני סמך על, בוצעה המסווג בניית. )1995 SVM-Light בשם C בשפת( freeware) חופשי מימוש באמצעות, האימון

(Joachims, 1999) .כי לוודא מנת על המבחן קבוצת על נבדקו המסווג ביצועי 5 בוצע זה תהליך. שלו הדיוק את ולחשב, טובה איכות בעל שנבנה המסווג מנת על (, fold Cross Validation-5 ) שונות ומבחן אימון קבוצות על פעמים האימון קבוצות על שאומנו המסווגים באיכות קיצוניות תנודות אין כי לוודא

כלל של המשוקללות התוצאות הן נבדקו התהליך של בסיומו. השונות הגבוהים הדיוק אחוזי בעל המסווג של הסיווג תוצאות והן שנוצרו המסווגים

.ביותר

של דומים ביישומים כי לציין יש Machine Learning קבוצות גדלי בין היחס .המבחן מקבוצת גדולה האימון וקבוצת שונה כ"בד והבדיקה האימוןMiddendorf-ב לראות ניתן לכך דוגמא et al בו(2004) בחינה בוצעה בעבודה. האימון לצורך מהדוגמאות 80%-ב שימוש בוצע הבמהלכ דומה

20%-כ של יחסית קטנה אימון קבוצת מלכתחילה נבחרה, זו התאמת של החשש את להקטין מטרה מתוך בוצע זה דבר. מהדוגמאות

) יתר Over fitting ) מוכרת בעיה הינה יתר התאמת .המסווגים של ,מסווגים בניית של במקרה, עשויה אשר, Machine-Learning של בתחום הספציפיות לדוגמאות המידה על יתר המותאמים מסווגים ליצירת להביא. טובה הכללה יכולת בעלי אינם אך, האימון במסגרת שניתנו

מבחן קבוצת שנותרת בכך הינו, קטנה אימון בקבוצת לשימוש נוסף יתרון איכות של יותר טובה הערכה קבלת מאפשרת אשר, יותר גדולה

57

Page 59: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

.המבחן בקבוצת הנכונים הסיווגים באחוז ביטוי לידי הבאה, המסווגיםובכך מאפשרת מתן ציון מדויק יותר עבור התוצאות.

למרותכי מתברר מעשי באופן ,הקטנה האימון בקבוצת השימוש בטבלאות לראות שניתן כפי, גבוהה איכות בעלי היו שנוצרו המסווגים

.ב1-ו א1

58

Page 60: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הבינארי המקרה עבור המסווגים של ממוצעים דיוק אחוזי – א 1 טבלה

59

Page 61: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

חמשת של הממוצע )הממוצעים הדיוק אחוזי את מכילה זו טבלה :א1 טבלה( רשת לכל סוג מכל שנבנו המסווגים אחת כל עבור השונים המסווגים של

. הבינארי המקרה עבור שהתקבלו כפי מהרשתות

60

Page 62: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

המקרה עבור ביותר הטובים המסווגים של דיוק אחוזי – ב 1 טבלההבינארי

61

Page 63: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הדיוק אחוזי בעלי המסווגים של הדיוק אחוזי את מכילה זו טבלה :ב1 טבלה. מהרשתות אחת כל עבור ביותר הטובים

השונים המסווגים של הדיוק אחוזי' ב1-ו' א1 בטבלאות לראות שניתן כפי חריגה ישנה זאת עם. 98% מעל על המקרים ברוב ועומדים, מאוד גבוהים

השונים המודלים בין לסווג שמטרתם המסווגים של במקרה לעין הבולטת ובמקרה יותר נמוכים הדיוק אחוזי אלו מסווגים עבור. IDPA המודל לבין

ברורה איננה לכך הסיבה. בממוצע 88%-כ על רק עומדים ביותר הגרוע יחסית הנמוכים הדיוק אחוזי בעלי המסווגים כי נראה זאת עם. לחלוטין בסיווג הקושי כי ייתכן ולכן, שנבדקו רשתות של מצומצם במספר התרחשו

השונים המודלים בין להבדיל המסווג של מהקושי רק לא נובע, אלו רשתות (. והקשרים הקודקודים כמות ) הרשת של מהפרמטרים כתוצאה גם אלא

בדיקת עמידות המסווגים7.1.2 בוצעה הבדיקה. המסווגים עמידות של בדיקה בוצעה מודלים זוג כל עבור

-כ ) אחת כל מאפיינים 500 בעלות קבוצות תתי 30 של בחירה באמצעות תת כל עבור. אקראי באופן נבחרו אשר ( הכוללת המאפיינים מכמות 10%

הרשת על שלו הסיווג תוצאות ונבדקו, SVM מסוג מסווג נבנה קבוצה ערכי את המתארת היסטוגרמה מוצגת 2 בתרשים. המתאימה האמפירית עליהם הערכים מוצגים 2 ובטבלה, המסווגים מן חמישה של העמידות העמידות ערכי את מכילה 2 )טבלה. פירוט ביתר ההיסטוגרמה מתבססת

(.בהיסטוגרמה המוצגים החמישה של רק ולא, המסווגים כל של

הבינארי המקרה עבור המסווגים עמידות היסטוגרמת – 2 תרשים

62

Page 64: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

1%001-%09%09-%08%08-%07%07-%06%06-%050

5

01

51

02

52

03

53

04

APS/GRDAPD/APSAPDI/APS

CD/APSWSD/APS

ערכי של השונות הכמויות את המציגה היסטוגרמה מכיל התרשים : 2 תרשים העמידות ערך הינו האופקי הציר. שנבדקו המסווגים מן חמישה של העמידות

) סוג מכל המסווגים כמות הינו האנכי והציר ( מסווגים 35 מתוך שערך . בטווח היה שלה העמידות

הבינארי המקרה עבור המסווגים עמידות – 2 טבלה

63

Page 65: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

המסווגים של העמידות בדיקת תוצאות פירוט את מכילה זו טבלה: 2 טבלה בעלי היו אשר המסווגים אחוז הינו השונים בתאים הרשום הערך. השונים אל סווגה הרשת כי משמעותו בתא שלילי/חיובי ערך. זהה סיווג תוצאת.המתאימה העמודה בכותרת שמופיע כפי בהתאמה ימני/השמאלי המודל

64

Page 66: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

עבור. מאוד גבוהה הייתה המסווגים שגילו העמידות, לראות שניתן כפי ,מושלמת עמידות בעלי היו 80%-מ למעלה בהיסטוגרמה שהוצגו המסווגים

דומים אלו נתונים .90% לפחות של עמידות הייתה 95%-מ למעלה ועבור בעלי היו המסווגים מהמקרים 80%-ב כמעט: המסווגים כלל עבור גם

הייתה המסווג מהמקרים עמידות 90%-מ למעלה ועבור מושלמת עמידות.90% הפחות לכל

זיהוי המודל המתאים ביותר7.1.3 כמות נבדקה, מודל כל עבור. ההצבעה בשיטת נעשה המנצח המודל זיהוי

מכילות ב3-ו א3 טבלאות.סווגו הרשתות האמפיריות למודל בהם המסווגים שניתן כפי. בהתאמה המפורטות הסיווג תוצאות ואת התוצאות ריכוז את

"המודל לראות - סטטי" מועדף קישור SPA ,היה בעל ההתאמה הטובה "המודל משתרך מאחוריו הרחק כאשר, משמעי חד באופן, ביותר קישור

.DPA - דינמי" מועדף

. למודלים האמפיריות הרשתות סיווג תוצאות ריכוז – א 3 טבלה

מסוומסווג/ג

הצבעDRGSPADPAIDPADCDSWות

DRG 3/5 -100.00%-71.43%57.14%100.00%91.43%

SPA 5/5100.00% 100.00%100.00%100.00%100.00%

DPA 4/571.43%-100.00% 91.43%100.00%80.00%

IDPA 2/5-57.14%-100.00%-91.43% 100.00%74.29%

DC 0/5-100.00%-100.00%-100.00%-100.00% -85.71%

DSW 1/5-91.43%-100.00%-80.00%-74.29%85.71%

שסיווגו המסווגים מספר את הצבעות בעמודה מכילה זו טבלה : א 3 טבלה נבדקו שישה מודלים, וכלבסה"כ הרשת למודל המופיע באותה שורה.את

הוא המקסימאלי הניצחונות ולכן מספר, מודל השתתף בחמישה מסווגים המודל שקיבל ההצבעות אחוז את מציגים בטבלה הערכים שאר. חמישה

היו כי כך על מצביע הדבר חיובי והערך במידה. האחרים המודליםלעומת בשורה המופיע מודליותר מסווגים אשר סיווגו את הרשתות האמפיריות ל

65

Page 67: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הערכים הםולהיפך. המתאימה בעמודה המופיע המתאימה מאשר למודל- הוא 100%-100%בטווח המופיע הערך אם למשל, לכן, .60%

מהמסווגים סיווגו את הרשתות האמפיריות למודל80%המשמעות הינה ש- המודל לראות שניתן כפי המופיע בשורה ולא למודל המופיע בעמודה.

SPA המקרים בכל המודלים שאר את ניצח.

66

Page 68: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

למודלים רשתות של המפורטות הסיווג תוצאות – ב 3 טבלה

הרשתות של הסיווג תוצאות את מסווג כל עבור מכילה זו טבלה : ב 3 טבלה המודל אל סווגה הרשת כי משמעותו בתא שלילי/חיובי ערך. האמפיריות

בסיום. המתאימה העמודה בכותרת שמופיע כפי בהתאמה ימני/השמאלי הפעמים בהם סווגו הרשתות האמפיריות כמות הממוצע של מופיע הטבלה

67

Page 69: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

השתתף מודל וכל הואיל. השתתף הוא בהם המסווגים בכלל מסוים למודל. 5 הינה המקסימאלית הניצחונות שכמות הרי בחמישה מסווגים

68

Page 70: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

בדיקת איכות תוצאות הסיווג7.1.4 ,סטטיסטית מובהקות בעלות אכן שהתקבלו התוצאות כי לוודא מנת על

של בדיקה בוצעה, בסיווג שגיאות עקב במקרה התקבלו לא הן כלומר ,זו בדיקה במסגרת. המתודולוגיה בחלק שתואר כפי התוצאות מובהקות

הרשתות של השגויים הסיווגים כמות בין הקשר, מסווג סוג כל עבור חושב בהם המסווגים עבור הבדיקה תוצאות. הסיווג של ההסתברות לבין השונות

(. SPA ) המנצח המודל השתתף 4 בטבלה ואילו, 3' מס בתרשים מוצגות . התרשים מתבסס עליהם הנתונים מוצגים

,גבוהה הסתברות בעלות תוצאות מתקבלות המקרים ברוב כי לראות ניתן לכל היו למסווג כי להניח מספיק, למעשה. לא גדול שגיאות מספר עבור

הסתברות בעלי הינן הסיווג תוצאות כי לקבל מנת על בסיווג שגיאות 3 היותר 90%-שכ לכך שקולה זו שגיאות כמותהנחה של . 99.9%-מ למעלה של

)נכונה סווגו מהרשתות ( SPA/DPA המסווג של במקרה שאר ועבור .יותר טובות אף התוצאות המסווגים

כפי. SPA/IDPA המסווג עבור הינו טובות פחות התוצאות בו היחיד המקרה הדיוק של מסווג זה היה נמוך משמעותית לעומת הדיוק7.1.1שצוין בסעיף

דיוק לעומת למעלה מ-88%של שאר המסווגים ) דיוק (. דבר זה95% של הסיווג כי ההסתברות להקטנת האמפיריותכללהביא הרשתות

באמצעות מסווג זה נכונה. או לחילופין מחייב להניח שמספר שגיאות הסיווגשגיאות לעומת 10היה רב יותר ) שגיאות (, על מנת לקבל הסתברות3

שבהסתברות שלעם כל זאת, עדיין מדובר על כך .95%סיווג של למעלה מ- סווגו רשתות ( 35 מתוך 25) מהרשתות71%מ- למעלה95%למעלה מ-

למרות שתוצאות אלו נמוכות יחסית לשאר המסווגים. SPAלמודל ה-נכונה מאשר הרשתות את יותר טוב מייצג SPA המודל כי להעיד בכך יש עדיין. IDPA-ה מודל

הסתברות לבין המירבית הסיווג טעויות כמות בין הקשר - 3 תרשים . השונים המסווגים עבור הסיווג תוצאות

69

Page 71: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

שגיאות

012345678901112100.001.002.003.004.005.006.007.008.009.000.1

APS/GRDAPD/APS

CD/APSWSD/APSAPDI/APS

טעויות כמות את שמגדילים ככל כיצד לראות ניתן זה בתרשים : 3 תרשים. וגדלה הולכת הכולל הסיווג של ההסתברות כך, האפשרית סיווג

בהתאם הסיווג תוצאות הסתברות של מפורטים נתונים - 4 טבלה . המירבית השגיאות לכמות

שגיאות /כמות DRG/SPASPA/DPASPA/DCSPA/DSWSPA/IDPAמסווג

00.6130.2191.0001.0000.001

10.9200.5901.0001.0000.010

20.9900.8581.0001.0000.043

30.9990.9671.0001.0000.123

41.0000.9951.0001.0000.259

51.0000.9991.0001.0000.437

61.0001.0001.0001.0000.620

7    0.775

8    0.883

9    0.947

10    0.979

11    0.993

12    0.998

טבלה:4 טבלה מסווג כל עבור המדויקת הסיווג הסתברות את מציגה זו הגענו המקרים ברוב כי לראות ניתן. המירבית השגיאות לכמות בהתאם

. ביותר מצומצם שגיאות מספר תוך 0.999 של מאוד גבוהה להסתברות

שערך במסווגים רק שימוש בוצע המובהקות בדיקת לצורך כי להזכיר חשוב בחלק כי לכך גרמה זו הגבלה .90% של הסף את עבר שלהם העמידות

70

Page 72: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

5' מס טבלה. תוצאות של יותר נמוך מספר על בוצעה הבדיקה מהמקרים.המובהקות בבדיקת בשימוש שהיו המסווגים כמות של פירוט מכילה

המובהקות בדיקת במסגרת שנבדקו המסווגים כמות - 5 ' מס טבלהכמות תוצאותמסווג

DRG/SPA35

SPA/DPA28

SPA/DC35

SPA/DSW34

SPA/IDPA35

המסווגים עמידות, המסווגים רוב עבור כי לראות ניתן בטבלה: 5 טבלה הדופן יוצא. תוצאות כל בכמעט שימוש היה לכך ובהתאם מושלמת הייתה היו מהמסווגים ( 35 מתוך 28 ) 80%רק בו SPA/DPA המסווג הינו היחיד.כנדרש עמידות בעלי

71

Page 73: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

Weighted Case – בחינת עוצמת הקשרים 7.2 ייעשה העבודה בהמשך, התוצאות של יותר נוחה הצגה לאפשר מנת על

:השונים המודלים עבור הבאים בסימונים שימוש.WDRG – המכוון הממושקל האקראי הגרף מודל.1.WSPA – ממושקל סטטי" מועדף קישור "מודל.2.WDPA – ממושקל דינמי" מועדף קישור "מודל.3.WIDPA – ממושקל משופר דינמי" מועדף קישור "מודל.4.WSDPA - ממושקל דינמי סטטי" מועדף קישור "מודל.5

ביצוע הסיווג7.2.1 לבדיקת דומה באופן בוצע הממושקל במקרה האמפיריות הרשתות סיווג

בעלי לעיל שתוארו מהמודלים אימון דוגמאות חוללו. הבינארי המקרה מתוך. האמפיריות ברשתות הקודקודים למספר זהה קודקודים מספר

לכל סטה שלהן הקשתות מספר אשר רשתות רק נבחרו שחוללו הדוגמאות רשת כל עבור. האמפיריות ברשתות הקשתות מממספר 2%-ב היותר

לאחר. המסווגים לאימון, מודל כל עבור, דוגמאות 500 חוללו, אמפירית בעל מימדי-רב תכונות ווקטור מהן אחת כל עבור חולל, הרשתות יצירתMiddendorf י"ע שהוצעה השיטה פ"ע מימדים 4680 et al המתוארת

. בנספח א'

שונה, הווקטור את יםהמרכיב מאפייניםה משמעות זה במקרה כי לציין יש בין הקשר לעוצמת ומתייחסים במידה זאת עם. הבינארי במקרה מאשר

,הקודקודים בין שונות קשתות מספר של קיומם כאל קודקודים זוגע"ס שנוצרו עוצמת הקשר ברשתות זוהי אכן המשמעות של ובפועל

במקרה למשמעותן זהה המאפיינים של המשמעות אזי המודלים, .הבינארי

חלוקת. מבחן וקבוצת אימון קבוצת: קבוצות לשתי חולקו הדוגמאות 1/5 כלומר, 1:4 של ביחס הייתה והמבחן האימון קבוצות בין הדוגמאות

זוג כל עבור . שלו הדיוק לבדיקת והשאר המודל לאימון שימשו מהדוגמאות בשם( freeware) חופשי מימוש באמצעות SVM מסוג מסווג אומן, מודלים

72

Page 74: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

SVMLight .קבוצת על נבדקו וביצועיו, האימון קבוצת על אומן המסווג את ולחשב, טובה איכות בעל שנבנה המסווג כי לוודא מנת על. המבחן-5 ) שונות ובדיקה אימון קבוצות על פעמים 5 בוצע זה לתהליך. שלו הדיוק

fold Cross Validation ,) באיכות קיצוניות תנודות אין כי לוודא מנת על הן נבדקו התהליך של בסיומו. השונות האימון קבוצות על שאומנו המסווגים של הסיווג תוצאות והן שנוצרו המסווגים כלל של המשוקללות התוצאות

את מציגות' ב6-ו' א6 טבלאותב. ביותר הגבוהים הדיוק אחוזי בעל המסווג. שנבנו המסווגים של הדיוק רמת

73

Page 75: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

המקרה עבור המסווגים של ממוצעים דיוק אחוזי - א 6 טבלה הממושקל

74

Page 76: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

)הממוצעים הדיוק אחוזי את מכילה זו טבלה :א6 טבלה של הממוצע כל עבור השונים המסווגים של ( רשת לכל סוג מכל שנבנו המסווגים חמשת

. הממושקל המקרה עבור שהתקבלו כפי מהרשתות אחת

המקרה עבור ביותר הטובים המסווגים של דיוק אחוזי – ב 6 טבלההממושקל

75

Page 77: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הדיוק אחוזי בעלי המסווגים של הדיוק אחוזי את מכילה זו טבלה :ב6 טבלה.הממושקל המקרה עברו. מהרשתות אחת כל עבור ביותר הטובים

76

Page 78: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

נמוכה הייתה זה מקרה עבור המסווגים איכות, בטבלאות לראות שניתן כפי שאיכות מכך בעיקר נובע הדבר. הבינארי המקרה בבחינת מאשר יותר

דבר למעשה. 50%-כ על ועמדה מאוד גרועה הייתה WDPA/IDPA המסווג משאר בחלק גם אולם. נכשלה WDPA/IDPA המסווג שבניית אומר זה

.87%-86%-כ על ועמדה טובה פחות הייתה שהתקבלה האיכות המסווגים תוצאות לקבל הצלחנו עדיין, המסווגים באיכות זו הירידה למרות, זאת עם

ההשלכות של הירידה ולכן. בהמשך שיתואר כפי גבוהה מובהקות בעלות היו בעלות משמעות נמוכה.שנעשתה הבדיקה על המסווגים באיכות

זיהוי המודל בעל ההתאמה הטובה ביותר7.2.2נעשה המודל זיהוי הבינארי למקרה בדומה ביותר בשיטת המתאים

אשר סיווגו את הרשתות המסווגים כמות נבדקה, מודל כל עבור. ההצבעהלמודל חד תוצאות היו לא הבינארי למקרה בניגוד הפעם. האמפיריות

.התוצאות ריכוז את מכילה 7 מספר טבלה. משמעיות

. למודלים האמפיריות הרשתות סיווג תוצאות ריכוז - 7 טבלהWDRGWSPAWDPAWIDPAהצבעותמודל/מודל

WDRG 0/3 -100.00%-80.00%-77.14%

WSPA 3/3100.00% 62.86%57.14%

WDPA 1/380.00%-62.86% -65.71%

WIDPA 2/377.14%-57.14%65.71%

שסיווגו המסווגים מספר את הצבעות בעמודה מכילה זו טבלה : 7 טבלה כלבסה"כ נבדקו ארבעה מודלים. הרשת למודל המופיע באותה שורה.את

מסווגים שלושה סווג באמצעות המקסימאלי הניצחונות ולכן מספר,מודל שקיבל ההצבעות אחוז את מציגים בטבלה הערכים שאר. שלושה הוא

כך על מצביע הדבר חיובי והערך במידה. האחרים המודליםלעומת המודלל כי סיווגו את הרשתות האמפיריות יותר מסווגים אשר המופיע מודלהיו

למודל בשורה מאשר ולהיפך. המתאימה בעמודה המופיע המתאימה . לכן, למשל, אם הערך המופיע הוא100%-100%הערכים הם בטווח -

המשמעות הינה ש-60% מהמסווגים סיווגו את הרשתות האמפיריות80% למודל המופיע בשורה ולא למודל המופיע בעמודה.

"המודל, בטבלה לראות שניתן כפי )ממושקל סטטי" מועדף קישור WSPA ,) "המודל של הרחבה שהינו שר היה בעלא סטטי" מועדף קישור

77

Page 79: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

בעל ההתאמה הטובה ביותר הוא, הבינארי ההתאמה הטובה ביותר במקרהזה במקרה חד בו הבינארי למקרה בניגוד אולם. גם הייתה ההתאמה בכל משמעותית מדובר הפעם, המסווגים משמעית פחות התאמה על

.WIDPA-ו WDPA שבדקו את ההתאמה שלו לעומת המודליםבמסווגים בכ-( במקום 80%התאמה מהמקרים, בדיקת100% של במקרה

הקישוריות בלבד(.

יותר שיתאים אחר מודל למצוא ניסיון בוצע מספקות הלא התוצאות בעקבות 'מס במודל שימוש באמצעות היה הראשון הניסיון .הממושקל במקרה

5WSDPAשתואר , – הקישורים ליצירת מנגנונים שני משלב אשר, לעיל המובילים המודלים של המנגנונים ששילוב, המחשבה היה לכך המניע. ברשת

.האמפיריות הרשתות לנתוני יותר טובה התאמה בעל מודל ליצירת יביא שניתן כפי למעשה. המקרה לא זה כי הראתה שנעשתה חוזרת בדיקה אולם

מבין ביותר הגרוע והיה ברור באופן כשל המשולב המודל, 8 בטבלה לראות.שנבחנו המודלים כל

כולל , למודלים האמפיריות הרשתות סיווג תוצאות ריכוז - 8 טבלה . המשולב המודל

WDRGWSDPAWSPAWDPAWIDPAהצבעותמודל/מודל

WDRG 1/4 88.57%-100.00%-80.00%-77.14%

WSDPA 0/4-88.57% -91.43%-94.29%-94.29%

WSPA 4/4100.00%91.43% 62.86%57.14%

WDPA 2/480.00%94.29%-62.86% -65.71%

WIDPA 3/477.14%94.29%-57.14%65.71%

שסיווגו המסווגים מספר את הצבעות בעמודה מכילה זו טבלה : 8 טבלהשורה.את באותה המופיע למודל האמפיריות נבדקו הרשתות בסה"כ

מודל.מודלים חמישה כל מספר. ולכן מסווגים, ארבעה באמצעות סווג דומה בטבלה הערכים משמעות. ארבע הוא המקסימאלי הצבעותה

.7 בטבלה למשמעותם

) 2 מודל כזכור. חדש כיוון נוסה המנגנונים בשילוב הכישלון עקב WSPA) α פרמטרים בעל הינו α-ו ¿ out ,בדקנו הז בניסיון. 0.5 היההמקורי שערכם

התאמה בעל להיות WSPA למודל יגרום אלו פרמטרים של ערכם שינוי האםבוצעו.האמפיריות לרשתות יותר טובה ערך שונה בהם ניסויים מספר

78

Page 80: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

α הפרמטרים α-ו ¿ out הניסוייםתוצאות. 0.7 ו- 0.66, 0.6-ל 0.5-מ בהדרגה .9 בטבלה מוצגות

כולל , למודלים האמפיריות הרשתות סיווג תוצאות ריכוז - 9 טבלה . WSPA - ה מודל של הפרמטרים ערכי שינויי

/מודלמודל

הצבעוWDRGWSPAWSPA6WSPA66WSPA7WDPAWIDPAת

WDRG 0/6 -100.0%-100.0%-100.0%-100.0%-80.0%-77.1%

WSPA 3/6100.0% -100.0%-100.0%-100.0%62.9%57.1%

WSPA6 4/6100.0%100.0% -100.0%-100.0%77.1%74.3%

WSPA66 5/6100.0%100.0%100.0% -100.0%82.9%82.9%

WSPA7 6/6100.0%100.0%100.0%100.0% 85.7%91.4%

WDPA 1/680.0%-62.9%-77.1%-82.9%-85.7% -65.7%

WIDPA 2/677.1%-57.1%-74.3%-82.9%-91.4%65.7%

הרשתשסיווגו את המסווגים מספר את הצבעות בעמודה מכילה זו טבלה : 9 טבלה סווג באמצעות שישה . כל מודלמודלים שבעהבסה"כ נבדקו למודל המופיע באותה שורה.

דומה בטבלה הערכים משמעות. שישה הוא מקסימאליה ההצבעות מסווגים, ולכן מספר המודל של הווריאציות הינם WSPA6,WSPA66,WSPA7 יםהמודל. 7 בטבלה למשמעותם

WSPA השונים הפרמטרים עם .(WSPA6 וכן, 0.6-ל שונה הפרמטרים שערך משמעותו (.הווריאציות שאר לגבי אכן הפרמטרים ערך שינוי כי הראו אלו ניסויים, בטבלה לראות שניתן כפי

ההתאמה הגדל כך עולה הפרמטר שערך וככל רמת ההתאמה את משפר הניצחונות לתוצאות הבדיקה אחוז השוואת. המודל לרשתות האמפיריותשל

ברמת ההתאמה לעומת 11.4% של דרמטי שיפור חל כי מראה הראשונית ברמת ההתאמה לעומת 17.15% של יותר גבוה שיפור ואף WDPAמודל ה-

. WIDPA ה- מודל

0.7 הערך עד רק בוצעה בפרמטרים כתלות בתוצאות השיפור בדיקת. שהצבנוהתקבלה זה ערך ועבור הואיל זאת ביעד העומדת תוצאה

. עם זאת, ייתכן כי90%התאמה של למעלה מ-לעצמנו מראש שהינו כיוונון נוסף של הפרמטרים יאפשר להשיג התאמה טובה יותר.

בדיקת עמידות המסווגים7.2.3 שוב בוצע משמעותיות, יותר תוצאות בעל מודל במציאת ההצלחה לאחר זוג כל עבור, הבינארי למקרה בדומה. המסווגים עמידות בדיקת של השלב

79

Page 81: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

) אחת כל מאפיינים 500 בעלות קבוצות תתי 30 נבחרו מודלים 10%-כ ,SVM מסוג מסווג נבנה קבוצה תת כל עבור (. הכוללת המאפיינים מכמות 4 בתרשים .המתאימה האמפירית הרשת על שלו הסיווג תוצאות ונבדקו .המסווגים מן ארבעה של העמידות ערכי את המתארת היסטוגרמה מוצגת.פירוט ביתר ההיסטוגרמה מתבססת עליהם הערכים מוצגים 10 טבלה

של רק ולא, המסווגים כלל של העמידות ערכי את מכילה 10 ) טבלה(. בהיסטוגרמה המוצגים הארבעה

הממושקל המקרה עבור המסווגים עמידות היסטוגרמת - 4 תרשים

1-%09%001

%09-%08%08-%07%07-%06%06-%050

5

01

51

02

52

03

53

7APSW/GRDW7APSW/APDSWAPDW/7APSWAPDIW/7APSW

ערכי של השונות הכמויות את המציגה היסטוגרמה מכיל התרשים : 4 תרשים ערך הינו האופקי הציר. שנבדקו המסווגים מן ארבעה של העמידות) סוג מכל המסווגים כמות הינו האנכי והציר העמידות (מסווגים 35 מתוך

. בטווח היה שלה העמידות שערך

80

Page 82: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

הממושקל המקרה עבור המסווגים עמידות – 10 טבלה

של העמידות בדיקת תוצאות פירוט את מכילה זו טבלה : 10 טבלה היו אשר המסווגים אחוז הינו השונים בתאים הרשום הערך. השונים המסווגים

אל סווגה הרשת כי משמעותו בתא שלילי/חיובי ערך. זהה סיווג תוצאת בעלי.המתאימה העמודה בכותרת שמופיע כפי בהתאמה ימני/השמאלי המודל

81

Page 83: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

עבור. מאוד גבוהה הייתה המסווגים שגילו העמידות, לראות שניתן כפי ,מושלמת עמידות בעלי היו 77%-מ למעלה בהיסטוגרמה שהוצגו המסווגים

דומים אלו נתונים .90% לפחות של עמידות הייתה 90%-מ למעלה ועבור בעלי היו המסווגים מהמקרים, 73% בכמעט: המסווגים כלל עבור גם

הפחות לכל הייתה המסווג עמידות 86%-מ למעלה ועבור מושלמת עמידות זה במקרה העמידות, המסווגים של הגבוהה העמידות למרות זאת עם. 90%. הבינארי במקרה מאשר יותר נמוכה מעט הייתה

בדיקת איכות תוצאות הסיווג7.2.4 ,סטטיסטית מובהקות בעלות אכן שהתקבלו התוצאות כי לוודא מנת על

בבדיקת שבוצעה לבדיקה בדומה התוצאות מובהקות של בדיקה בוצעה בין הקשר, מסווג סוג כל עבור חושב, זו בדיקה במסגרת. הבינארי המקרה

.הסיווג של ההסתברות לבין השונות הרשתות של השגויים הסיווגים כמות(WSPA7 ) המנצח המודל השתתף בהם המסווגים עבור הבדיקה תוצאות מתבסס עליהם הנתונים מוצגים 11 בטבלה ואילו, 5' מס בתרשים מוצגות

. התרשים

הסתברות לבין המירבית הסיווג טעויות כמות בין הקשר - 5 תרשים . הממושקל במקרה השונים המסווגים עבור הסיווג תוצאות

שגיאות

01234560

2.0

4.0

6.0

8.0

1

2.1

7APSW/GRDWAPDW/7APSWAPDIW/7APSW

82

Page 84: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

טעויות כמות את שמגדילים ככל כיצד לראות ניתן זה בתרשים: 5 תרשים. וגדלה הולכת הכולל הסיווג של ההסתברות כך, האפשרית סיווג

83

Page 85: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

בהתאם הסיווג תוצאות הסתברות של מפורטים נתונים : 11 טבלה . המירבית השגיאות לכמות

כמותWDRG/WSPA7WSPA7/WDPAWSPA7/WIDPAמסווג/שגיאות

00.99930.13210.1440

11.00000.46250.5005

21.00000.78270.8223

31.00000.94220.9598

41.00000.98950.9939

51.00000.99870.9993

61.00000.99990.9999

מסווג כל עבור המדויקת הסיווג הסתברות את מציגה זו טבלה-11 טבלה הגענו המקרים ברוב כי לראות ניתן. המירבית השגיאות לכמות בהתאם

. ביותר מצומצם שגיאות מספר תוך 0.999 של מאוד גבוהה להסתברות

שערך במסווגים רק שימוש בוצע המובהקות בדיקת לצורך כי להזכיר חשוב בחלק כי לכך גרמה זו הגבלה. 90% של הסף את עבר שלהם העמידות

12' מס טבלה. תוצאות של יותר נמוך מספר על בוצעה הבדיקה מהמקרים.המובהקות בבדיקת בשימוש שהיו המסווגים כמות של פירוט מכילה

המובהקות בדיקת במסגרת שנבדקו המסווגים כמות - 12 ' מס טבלה

מסווג כמות

תוצאותWDRG/WSPA734

WSPA7/WDPA27

WSPA7/WIDPA25

ובמקרה, טובה הייתה המסווגים עמידות כי לראות ניתן בטבלה: 12 טבלה) מהתוצאות 71%- מ בלמעלה שימוש היה ביותר הגרוע (35 מתוך 25

למקרה בהשוואה, צוין שכבר כפי אמנם. המובהקות בדיקת למטרת.יותר נמוכה הייתה העמידות הבינארי

מספר עבור, גבוהה הסתברות בעלות תוצאות מתקבלות כי לראות ניתן שגיאות 4 היותר לכל היו למסווג כי להניח מספיק, למעשה. נמוך שגיאות

84

Page 86: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

-מ למעלה של הסתברות בעלי הינן הסיווג תוצאות כי לקבל מנת על בסיווג 84%, ביותר הגרוע שבמקרה לכך שקולה זו שגיאות כמות .99.9%

) נכונה סווגו מהרשתות ( WSPA/WIDPA המסווג של במקרה שאר ועבור . יותר טובות אף התוצאות המסווגים

אנו המשקלים עם הרשתות בחינת של במקרה גם, הבינארי למקרה בדומה לכן קישור: "הוא האמפיריות לרשתות ביותר הקרוב המודל כי למסקנה מגיעים) ממושקל סטטי" מועדף WSPA) שונים בפרמטרים שימוש ישנו כי אם ,

במקצת.

דיון ומסקנות8 ( אינו מהווה מודל מתאים ליצירת רשתותDRGהעובדה כי מודל הגרף האקראי )

לימוד מקוונות, לא מפתיעה. דבר זה דומה לתוצאות שהתקבלו עבור רשתות (. כמו-כן עובדה זו הוכחה במחקרים קודמיםNewman, 2003אמפיריות נוספות )

Aviv etעל רשתות לימוד מקוונות אשר ניתחו מאפיינים ספציפיים של הרשתות )

al., 2007bבמחקר זה מחוזקת מסקנה זו באמצעות ניתוח ווקטור המאפיינים .) הרב מימדי של הרשתות.

( אינו מהווה מודל מתאיםDSWגם העובדה שמודל ה"עולם הקטן" המכוון ) ליצירת רשתות לימוד מקוונות, לא מפתיעה. אחד המאפיינים העיקריים של

. במקרה שלנו, משמעות הדברClusteringמודל זה הינו ערך גבוה של מקדם ה-איננו זה דבר להגיב בתוך קבוצות קטנות. נוטים היא שהמשתתפים ברשת למחקרים מתאימות אלו תוצאות המקוונות. הלימוד רשתות עבור מתרחש

(.Aviv et al., 2007aקודמים אשר בחנו את הנושא )

( מבוסס על לימוד של הקשרים ברשת. הלימודDCמודל ה"העתקה דינמית" ) זה גילוי השכנים של קודקודים אחרים. מודל הינו חלקי בלבד ומתבסס על מוצלח בתיאור רשתות ביולוגיות וטכניות ) רשתות ציטוטים (. אולם נראה כילימוד רשתות של ההתפתחות בתהליך חלק לוקח אינו זה, לימוד מנגנון מקוונות. ניתן להסביר זאת בכך שברשתות הלימוד המקוונות המידע על כללשל ההחלטות לכן המשתתפים. לכלל נוחה, יחסית בצורה נגיש, הרשת

המידע על מבנה הרשת.כללהמשתתפים האם ולמי להגיב מבוססות על

85

Page 87: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

( ( מתאים כמעט באופן מושלם ליצירתSPAמודל ה"קישור מועדף" סטטי הרשתות האמפיריות. מודל זה מניח כי ישנה, מראש, השמה לא אחידה של הסתברויות ליצירה וקבלת תגובות לכל אחד מהמשתתפים השייכים לקבוצת רשת הלימוד המקוונת. התוצאה היא התפלגות לא אחידה של ההסתברותשל הראשונית התפקיד/העמדה לכן, ברשת. תגובות לקבל או ליצור המשתתפים ברשת הינו בעל חשיבות מרובה, כאשר משתתף מחליט האם ולמילהגיב. חשיבות זו אינה משתנה במהלך התפתחות הרשת אלא נשארת קבועה.

( דינמי זו הינה בניגוד למודל ה"קישור מועדף" זהDPAהתנהגות (. במודל המשתתפים מתעדכנים לגבי מצב הרשת באופן דינמי. בכל פעם שהם מחליטים להגיב, הם "מסתכלים" ובודקים את עוצמת המשיכה של המשתתפים השונים.

ישנה עדיפותההחלטה על יצירת או קבלת התגובות מושפעת בהתאם, כאשר . נראה כי תהליך למידה דינמי של מצב הרשתלהגיב לבעלי "משיכה" גבוהה

איננו מתרחש במקרה של רשתות לימוד מקוונות.

( טובות מעט יותרIDPAהתוצאות עבור מודל ה"קישור מועדף" דינמי משופר ) (. כזכור, ההבדל ביןDPAמאשר התוצאות עבור מודל ה"קישור מועדף" דינמי )

שני המודלים הינו ביכולתו של המודל המשופר ליצור רשתות בעלות מספר רכיבי קשירות. השיפור בתוצאות בא לידי ביטוי בכך שיש צורך להניח קיום שלמודל ניצחון של המובהקות שרמת מנת על בסיווג, אפשריות טעויות יותר

( על מודל זה תהיה גבוהה כמו עבור שאר המקרים.SPAהקישור מועדף סטטי ) דבר זה נובע, בעיקר מהעובדה שאיכות המסווגים עבור מודל זה הייתה נמוכה יותר מאשר המודלים של שאר המסווגים. מהמידע לגבי קישוריות הרשתות בלבד נראה כי התשובה לשאלה "האם למודל ישנה עדיפות לעומת המודל

( בתיאור רשתות הלימוד המקוונות?" היא חיובית. אולם כאשרDPAהמקורי ) בוחנים את התוצאות של בדיקת עוצמת הקשרים ברשת ניתן לראות כי דבר זה

אינו חד משמעי , כפי שיתואר בהמשך.

כאשר עוברים לבחון את התוצאות של בחינת עוצמת הקשרים ברשתהתמונה משתנה מעט.

86

Page 88: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

( עדיין ניתן לראות בבירורWDRGבמקרה של מודל הגרף האקראי הממושקל ) כי מודל זה אינו מהווה מועמד מתאים ליצירת רשתות הלימוד המקוונות בדומה

לתוצאות בחינת הקישוריות.

אולם הפעם ישנה תחרות עזה יותר בין הגרסאות הממושקלות של המודלים( דינמי מועדף )WDPA,WIDPAלקישור סטטי מועדף לקישור המודל לבין )

WSPAאמנם עדיין המודל הסטטי מנצח, אך מדובר על ניצחון פחות משמעותי .) ניצחון בכ- יותר שהוא עשוי80%) ( שקיימת הסתברות גבוהה מהמקרים

להתרחש עקב טעויות בסיווג.

שיפור במצב מתקבל כתוצאה משינוי של הפרמטרים של המודל קישור מועדףוקבלת ליצירה שולטים על ההשמה של ההסתברויות סטטי. פרמטרים אלו המקוונת. הלימוד רשת לקבוצת השייכים מהמשתתפים אחד לכל תגובות

ו-0.6 דרך 0.5הבדיקה שנערכה הראתה כי הגדלת ערכי הפרמטרים האלו מ- מראה כי מתקבל שיפור ברמת ההתאמה של המודל. כאשר0.7 ועד ל-0.66

( ישנו שיפור משמעותי ברמת ההתאמה שלWSPA7 ) המודל 0.7עבור השינוי ל-בין כי חלוקת ההסתברויות גורם לכך זה המודל לרשתות האמפיריות. שינוי של ההשפעה כי מראה ולמעשה יותר, קיצונית תהיה המשתתפים

הינה ברשת של המשתתף יותרהתפקיד/עמדה שסברנומשמעותית ממה בתחילה בבחינת הקישוריות בלבד.

כמו-כן ניתן לראות כי ההבדלים שנצפו בבחינת הקישוריות בין המודל "קישור מועדף" דינמי ו"קישור מועדף" דינמי משופר מטשטשים וניתן אף לראות היפוך מגמה ככל שערכי הפרמטרים של מודל ה"קישור מועדף" סטטי הולכים וגדלים

(. חיזוק לכך ניתן לראות גם באיכות הסיווג של המסווג בין שני9) ראה טבלה ב' (.6א' ו-6 ) ראה טבלאות 50% ( אשר הינה כ-WDPA/WIDPAמודלים אלו )

בין שני המודלים כאשר מתייחסים לעוצמת הקשריםאין כמעט הבדלכלומר, ברשתות הלימוד המקוונות.

הקביעה מראש של הסתברויות התגובה של המשתתפים במודל המנצח – מודל( סטטי מועדף" ממאפייניםSPA,WSPA7ה"קישור הנראה, כפי מושפעת, - )

,Aviv, Erlich, Ravid, & Gevaחיצוניים של המשתתפים. למעשה במקרה מסוים )

( הראו כי בנייה מתוכננת של רשת לימוד מקוונת, הביאה לכך כי קבוצת200387

Page 89: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

סטודנטים הפכה לגורם מעורר ) גורם ליצירת תגובות ( ומגשר ברשת. כתוצאה מכך בניית הידע ברשת הגיעה לשלב מתקדם. ללא סטודנטים אלו, ייתכן כיטוב, כפי שהיה והתהליך הלימודי היה פחות יותר מבנה הרשת היה מפוצל ברשת לא מובנית שנבחנה. שינוי תפקידים זה גרם לכך כי למנחה של הקורסבין התחלקה זו השפעה הלימוד. רשת על יותר מועטה השפעה הייתה מהסטודנטים ובכך יצרה חלוקה לא אחידה של ההסתברות ליצור או לקבל

תגובות ברשת.

88

Page 90: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

סיכום וכיוונים להמשך9

המטרה של עבודת תזה זו הייתה למצוא את המנגנון השולט על יצירת רשתות לימוד מקוונות. בניגוד לעבודות קודמות, בעבודה זו זיהוי המודל לא התבסס על מספר מצומצם של מאפיינים, אלא נעשה שימוש בווקטור מאפיינים רב-מימדי.מוטה. ולא שיטתי באופן שנוצרו הרשתות של מאפיינים הכיל זה ווקטור מאפיינים אלו שימשו ליצירת מסווגים בעלי דיוק ועמידות גבוהים, בהם נעשה שימוש על מנת לסווג בין מספר מודלים ליצירת רשתות, אשר מיישמים מנגנוניםוהן בהתבסס על שונים. הסיווג נעשה הן בהתבסס על הקישוריות ברשתות המודל גבוהה מובהקות ברמת כי הראו הסיווג תוצאות הקשרים. עוצמת מראש זה מקצה מנגנון סטטי. מועדף" "קישור מסוג הינו ביותר המתאים אחיד. לא באופן הרשת למשתתפי תגובות וקבלת ליצירה הסתברויות של ההתחלתי שהמעמד הינה זה מנגנון של המעשית המשמעות המשתתף ברשת משפיע באופן ניכר מאוד על כמות התגובות שמשתתף

. מנחה של רשת לימוד מקוונת יכול להשתמש בתוצאה זוזה ייצור או יקבלעל מנת לתכנן את הרכב הרשת על מנת לקבל רמת תגובתיות רצויה.

עם זאת למחקר זה היו מספר מגבלות. המגבלה הברורה ביותר הינה בכמותייצגו "משפחות" של המוגבלת של מודלים שנבחנו. אמנם המודלים שנבחנו מודלים המיישמים מנגנונים שונים, וההתאמה שקיבלנו כבר עכשיו הינה ברמה טובה מאוד, אך עדיין קיימת האפשרות כי קיים מודל אחר המתאר בצורה טובה יותר את הרשתות. עם זאת התוצאות שהתקבלו, נותנות בידינו את האפשרות לבחון בצורה יעילה יותר האם מודל חדש הוא בעל פוטנציאל התאמה גבוה

יותר או לא, באמצעות התמקדות בהשוואה למודל הזוכה הנוכחי.

מגבלה נוספת במחקר טמונה בהנחה כי המודל המייצר את הרשתות מבוססזו איננה בהכרח נכונה. אמנם הניסיון שעשינו לשלב על מנגנון בודד. הנחה

(, נכשל מבחינתWSPDAמנגנונים, בבחינת עוצמת הקשרים ברשת ) מודל ה- התאמתו לנתוני הרשתות, אולם אין מן הנמנע שמודל אחר בעל שילוב מנגנונים

שונה או בעל פרמטרים שונים יצליח יותר.

89

Page 91: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

רובם המכריע של המודלים שבדקנו הראו רמה גבוהה מאוד של דיוק ועמידות. דבר זה מרמז על כך שההסתברויות המותנות של מגוון המאפיינים של המודלים השונים יהיו בעלי התנהגות דומה. כלומר, ערכי המאפיין ברשת האמפירית, יהיו בעלי ערך מקסימאלי עבור אותו מודל. דבר זה מעלה את האפשרות שאין צורך להשתמש בכל המאפיינים על מנת להבדיל בין המודלים, הואיל וכולם משפיעים על המסווג כך שיסווג את הרשת לאותו מודל. על מנת להעריך את רמת ההשפעה של כל מאפיין יש לחשב את ההסתברות המותנית של כל מאפיין

לסיווג רשת למודל, בהינתן שלמאפיין זה יש ערך מסויים.

זיהוי המאפיינים הדומיננטיים יאפשר מספר דברים:בניית מסווגים בעלי איכות גבוהה המשתמשים במספר מאפיינים מצומצם

יותר. ) עם זאת לא נראה שיש בכך תועלת מעשית (.בחינה בצורה מעמיקה יותר האם אכן יש אמת בהשערה שהועלתה לעיל

כי שילוב של מספר מנגנונים הינו הגורם ליצירת הרשת. דבר זה ניתן לביצוע בדיקה האם המאפיינים הדומיננטיים, נוצרו ע"י מודל בודד או ע"יהמאפיינים את המייצרים מודלים מספר של קיומם מודלים. מספר הדומיננטיים, יאפשר לנו לנסות וליצור מודל משולב אשר מייצר רשתות

בעלות מאפיינים אלו.

בבדיקה זמן. לאורך הרשת התפתחות את לבחון הינו נוסף מחקר כיוון שנעשתה במחקר זה, בדקנו את הרשת הסופית, אולם ייתכן כי בדומה לקיומו של מעבר פאזה ברשתות אקראיות, קיים שלב דומה במהלך ההתפתחות של רשתות לימוד מקוונות. כלומר, ישנם מספר מנגנונים הנכנסים לפעולה בשלבי התפתחות שונים של הרשת. במידה ותופעה זו קיימת ייתכן כי ניתן לגלות אותה רק במידה והרשת קיימת לפרקי זמן ארוכים יותר, למשל אם מדובר על רשת

של קורס שנתי ולא קורס סמסטריאלי.

90

Page 92: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

לייצוג Middendorf שיטת ' - א נספח מימדי רב תכונות במרחב מורכבות רשתות

הרשתות מבנה את לאפיין ניסיון הינו הרשתות מחקר בתחום מהעיסוק ניכר חלק אשר שונים סטטיסטיים מאפיינים באמצעות מבוצע הרשתות איפיון. הנחקרות

- מקומיים הינם הנבדקים המאפיינים. 2 בפרק מתוארים חלקם על מבוססים המקומיים המאפיינים בין. הרשת כלל על מבוססים - גלובליים או, קודקודים קבוצת

לעומת הנתונה ברשת גרפים תתי של שכיחות השוואת את למנות ניתן שנבדקו את למנות ניתן הגלובליים המאפיינים בין. מסוימת התפלגות בעלי בגרפים שכיחותם.ועוד, בגרף הקודקודים דרגות התפלגות

.k-subgraph census-ה מושג פותח רשתות של מקומיים מאפיינים לבדוק מנת על ,בגרף קודקודים k בעלי גרפים של הווריאציות כל של הכמויות בדיקת משמעותו שיטה .אקראיים בגרפים אלו גרפים תתי של להתפלגות שלהן ההתפלגות והשוואת

:זו בעייתית משתי בחינות) השונים הגרפים מחלקת גדלה כך, גדל k-ש ככל : חישובית.1 שאינם

בשיטה השימוש, מכך כתוצאה. NP-Complete בעיה זוהי(. איזומורפייםk כ"בד )קטנים k לערכי מצטמצם ≤ ,בתוצאות להטיה גורם זה דבר אולם (, 4

.יותר גדולים במבנים התחשבות ואין הואיל ולא מכוונים" ) פשוטים "לגרפים ורק אך מוגדרת זו שיטה : הכללה יכולת חוסר.2

( מכוונים של נוספים סוגים עבור השיטה להכללת ברורה דרך קיימת ולא . ממושקלים גרפים כמו, גרפים

במקום למשל. בסיס בהנחות שימוש לעיתים נעשה, אלו בעיות על להתגבר מנת על הוא מסוימים גרפים שתתי מראש מניחים, k בגודל הגרפים תתי כל את לבדוק

Shen-Or של המפורסם במאמר לראות ניתן לכך דוגמא. נבדקים הם ורק החשובים

et al )2002( ,של הגנטית ברשת משמעות בעלי גרפים תתי שלושה שזיהה E. Coli. לזיהוי אחידה שיטה הייתה שלא בכך היא זה מאמר בבחינת המתגלה נוספת בעיה"שזוהה גרף תת כל עבור ולמעשה יעיל באופן הרלבנטיים הגרפים תתי "נתפר

על להתגבר דרך מציע )Middendorf et al )2004 .שלו למציאה מיוחד אלגוריתם. הגרף עבור מאפיינים של שיטתית בנייה באמצעות אלו בעיות

91

Page 93: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

השיטה תיאור המסלולים כמות באמצעות הגרף את לאפיין שניתן כך על מבוססת השיטה

באופן האלו המסלולים כמויות את לחשב מנת על. בו הקיימים והסגורים הפתוחים כלומר, הגרף של השכנות מטריצת A תהי: הבאה באבחנה השיטה משתמשת, יעיל

Aij=1 מקודקוד קשת קיימת אם i לקודקוד j .המטריצה הכפלת A בעצמה ] עבורה חדשה מטריצה מייצרות A2 ]ij מקודקוד 2 באורך המסלולים מספר הינו i

כי נקבל פעמים n בעצמה A המטריצה של הכפלה עבור כללי באופן,. j לקודקוד]- ה במקום הערך An ]ij באורך המסלולים לכמות שווה n מקודקוד i לקודקוד j .

מגדירים אנו, כלשהו באורך והסגורים הפתוחים המסלולים כמות את לחשב מנת על: הבא באופן הסמיכויות מטריצת של היטלים שני

)D המטריצה.1 A) של האלכסוני ההיטל באמצעות מתקבלת A ,באופן המוגדר :הבא

D ( A )={Aij i= j0 i≠ j } ,

U המטריצה.2 ( A) של המשלים שהינה D( A) ,כלומר U ( A )=A−D ( A).

במטריצה גם משתמשים, בגרף שונים בכיוונים מסלולים בין להבדיל מנת על, בנוסףT- ב המסומנת ( Transposed ) המשוחלפת ( A )=AT .

האותיות ארבעת בן הבסיסי האלפבית את מגדירות אלו מטריצות ארבעת{ A , T , D ,U "יוצרים אנו זה אלפבית של מהאותיות. { באורך רצף שהינן", מילים

.המתאימות המטריצות של הכפלות של רצף המייצגות האלפבית אותיות של כלשהו תורמת שאינה, DU=UD=0: כגון, 0-ה מטריצת את יוצרים מהרצפים וחלק הואיל רצפים מספר מורידים אלא הבסיסי באלפבית ישיר שימוש מבוצע לא, הגרף לאפיון

הרצפים מקבוצת המורכב מילים ליצירת" מבצעי אלפבית "מקבלים ובכך מיותרים}: הבאה A , AT , AD , AU , AUT }.

מנת על.המבצעי האלפבית אותיות של כלשהו אותיות מרצף המורכבת מילה W תהיF פונקציה מגדירים אנו, מייצגת זו מילה אותה במטריצה להשתמש שנוכל (WA ) → R

. ממשי למספר המתקבלת המטריצה את מתרגמת אשר,

שניתן להפעיל על המטריצה המתקבלת: מתאימות פונקציות שתי הוגדרו במאמר

92

Page 94: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

1.Nnz :הזוגות הסדורים של קודקודים ברשת ביניהם יש מסלול. מספר.0-מ שונה שערכם במטריצה האיברים מניית י"פונקציה זו ניתנת לחישוב ע

2.Sum :יש לשים לב לכך כיהמסלולים השונים בין זוגות הקודקודים ברשת. כמות בין כל זוג קודקודים יכול להיות יותר ממסלול אחד.

.המטריצה איברי סכימת י"ע לחישוב ניתנת פונקציה זו

באופן ולכן, פתוחים ומסלולים סגורים מסלולים בין אבחנה בוצעה במאמר כן-כמו :הבאות הפונקציות בקבוצת שימוש שם בוצע מעשי

{nnz , nnzU , nnzD ,∑ , sumU , sumD } .nnzU , sumU הפונקציות הפעלת את מייצגות Nnz ו–Sum שייכים שאינם המטריצה איברי על כלומר, הפתוחים המסלולים על

nnzD. לאלכסון , sumD הפונקציות הפעלת את מייצגות Nnz ו–Sum המסלולים על השונים הערכים אמנם. המטריצה של האלכסון איברי על כלומר כלומר, הסגורים

∑ למשל, תלויים בלתי אינם ¿ sumU +sumD בהם השימוש את נימקו במאמר אולם .הבסיסיים מהפרמטרים יותר טובה אבחנה לתת יוכל מורכב שפרמטר שייתכן בכך

עד הרצפים כל את שיטתי באופן מייצרים, והפונקציות האלפבית הגדרת לאחר ערך את ומחשבים (, האורך על הגבלה אין תיאורטית ) מסוים לאורך

בווקטור מימד מהווה אלו מערכים אחד כל. שהתקבלו המילים עבור הפונקציות. הגרף את המייצג מימדי-הרב המאפיינים

השיטה יתרונות:יתרונות שלושה ישנן זו לשיטה

k-census-ה שיטת: חישובית מבחינה יותר יעילה השיטה.1 graph בעלת הינה הצפיפות כגון הגרף במאפייני תלויה אשר, NP-Complete של סיבוכיות

:הבא הביטוי י"ע חסומה הסיבוכיות זו בשיטה. הקודקודים דרגות והתפלגותN3∑

i(li−1 האותיות מספר הינו li, בגרף הקודקודים מספר הינו N כאשר, (

.שיוצרו המילים כל על מבוצעת והסכימה, i-ה המילה של (הבסיסי )מהאלפבית הביטוי אולם, האותיות במספר כתלות אקספוננציאלית גדלה הסיבוכיות אמנם

כאשר עדיפה זו שיטה לכן. הגרף של במאפיינים תלוי אינו האקספוננציאלי"או צפופים בגרפים מדובר (. Scale Free" ) מידה חסרי מהיעילות כתוצאה

) החישובית ( היחסית לעומת ברשת בולטים מאפיינים למצוא ניתן השיטה של

93

Page 95: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

, רשתות של אקראי אוסף ערכי של כלשהי התפלגות מראש להניח מבלי .מקובל שהיה כפי, בעולם המאפיין

. ממושקלים גרפים: כגון, נוספים מסוגים גרפים עבור להכללה ניתנת השיטה.2 אשר הרשת של מאפיינים מוטה ולא שיטתי באופן לייצר מאפשרת זו שיטה.3

.הרשת את המייחדות חדשות תכונות מציאת לאפשר עשויים

חסרונות השיטהכל התכונות הסטטיסטיות של הרשתות.1 לבדוק את אינה מאפשרת זו שיטה

למשל חישוב מקדם האשכול של הגרף לא ניתן לביצוע באופן פשוט. באופן ישיר.באמצעות השיטה הואיל והוא מחייב חישוב עבור כל קודקוד בנפרד

94

Page 96: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

תיאור חבילת התוכנה ששימשה ' - ב נספחלביצוע הבדיקות

במסגרת עבודת תזה זו בוצע שימוש בחבילת תוכנה אשר שימשה לביצוע הבדיקות..Visual Studio 2008 ( Express Edition )חבילת התוכנה פותחה באמצעות

חבילת התוכנה מורכבת משלושה יישומים: AttributesCreator מחולל המאפיינים - .1

שיטת פי על רשתות של המאפיינים ווקטורי יצירת על אחראי זה יישום Middendorf .'המתוארת בנספח א

מסווג הרשתות.2 יישום זה אחראי על סיווג הרשתות האמפיריות החל משלב בניית המסווגים ביןבסיווג וכלה המסווגים של והעמידות הדיוק בדיקת דרך השונים, המודלים

מתבצע זה דבר האמפיריות. )חופשי מימוש באמצעותהרשתות freeware) SVM-Light (Joachims, 1999) בשם SVMשל מסווג מסוג C בשפת

בודק המובהקות.3 יישום זה אחראי לבדוק מהי רמת המובהקות של תוצאות הסיווג שהתקבלו ע"י

מסווג הרשתות עבור רמות שונות של שגיאות בסיווג.

) Attribute Creator . מחולל המאפיינים ( 1 ב. מבנה

המבנה של מחולל המאפיינים מורכב מן המחלקות הבאות:

המחלקה Model יורשים כל המחלקות הממשות מודלים זו הינה מחלקת האב ממנה מחלקה

ליצירת רשתות.

המחלקה מכילה את האיברים הבאים:1.mModelName .מחרוזת המתארת את שם המודל :

95

Page 97: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

2.mRand אובייקט מסוג :Random.המשמש ליצירת ערכים אקראיים שונים במודלים המבוצעות האקראיות הבחירות למימוש משמש זה אובייקט

השונים, בהתאם להגדרת המודל.3.mMatrices .השונים המודלים ע"י שנוצרו את הרשתות המכילה רשימה :

הרשימה מכילה את הרשתות כשהם מיוצגות ע"י מטריצת סמיכויות דלילה. )SparseMatrix.)

המחלקה מכילה את השיטות הבאות:: משמש לאתחול המשתנים השונים של המחלקה. בנאי.12.Create זו ממומשת ע"י המחלקות היורשות וירטואלית. שיטה זוהי שיטה :

. השיטה אחראית על היצירה בפועל של הרשתות. השיטהModelמהמחלקה מקבלת כפרמטר את כמות הרשתות שיש לייצר.

3.CreateVectors של הסמיכויות מטריצות הפיכת על אחראית זו שיטה : בשיטת מאפיינים לווקטורי השונים המודלים ע"י שנוצרו הרשתות

Middendorf:לשיטה זו מועברים מספר פרמטרים .a.maxLength .אורך המילים המרבי שיש לייצר :b.path.מיקום שמירת התוצאות :c.normalize.האם לנרמל את התוצאות :d.useWeights.האם להתייחס למשקלים של הקשרים ברשת :e.typeבאיזו שיטה לייצר את המאפיינים. פרמטר זה לא בשימוש והוא :

מיועד להרחבות עתידיות של היישום.4.WriteMatrices שיטה זו משמשת לכתיבת מטריצות הסמיכויות של הרשתות :

שנוצרו ע"י המודל לתיקיה המועברת כפרמטר לשיטה.5.GetMatrices זו משמשת להחזרת רשימת מטריצות הסמיכויות של : שיטה

הרשתות שנוצרו ע"י המודל.6.Normalize ( זוהי שיטה פנימית :privateשיטה זו מנרמלת ווקטור המייצג את .)

במידה וישCreateVectorsהמאפיינים של רשת, השיטה מופעלת ע"י השיטה צורך בכך. בפועל לאחר ביצוע ניסויים עם ובלי שימוש בשיטה הוחלט לוותר

על השימוש בה.

המחלקה Matrix מחלקה זו משמשת לייצוג מטריצת הסמיכויות של רשת. המחלקה מייצגת את

(. המחלקה מכילה שיטותdenseהרשת באמצעות מטריצה ריבועית צפופה )96

Page 98: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

שונות לחישוב תכונות שונות של הרשת וכן שיטות לביצוע פעולות על המטריצה,הנדרשות לחישוב מאפייני הווקטור .

המחלקה מכילה את האיברים הבאים:1.mRows .כמות השורות במטריצה :2.mColumns.כמות העמודות במטריצה :3.mMatrix.מערך דו-מימדי המכיל את ערכי המטריצה :

97

Page 99: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

המחלקה מכילה את השיטות הבאות: : השיטה מקבלת את כמות השורות והעמודות ומייצרת מטריצה בגודל בנאי.1

. 0המתאים אשר ערכיה מאותחלים ל-התו בנאי.2 ואת מטריצה, המכיל קובץ של מיקומו את מקבלת השיטה :

המפריד בין הערכים ומייצרת מטריצה על סמך נתוני הקובץ.3.Read התו ואת מטריצה, המכיל קובץ של מיקומו את : השיטה מקבלת

המפריד בין הערכים ומייצרת מטריצה על סמך נתוני הקובץ.4.Write בין ואת התו המפריד יעד, מיקומו של קובץ : השיטה מקבלת את

הערכים וכותבת את המטריצה הקיימת לתוך הקובץ. 5.Report השיטה כותבת נתונים על המטריצה. הנתונים נכתבים לתוך אובייקט :

המועבר כפרמטר. ניתן לשלוט על רמת פירוט הנתוניםTextWriterמסוג באמצעות שני פרמטרים נוספים הקובעים האם לכתוב רק נתונים סיכומיים,

והאם לכתוב את היסטוגרמת התפלגות דרגות הקודקודים.6.Clustering -השיטה מחזירה את ערך מקדם ה :Clustering.של המטריצה 7.SmallWorld -השיטה מחזירה את ערך ה :SmallWorld.של המטריצה 8.NodesInOutDegrees מסוג אובייקט לתוך כותבת השיטה :TextWriter

והיציאה של דרגות הכניסה היסטוגרמת התפלגות המועבר כפרמטר את הקודקודים.

9.RunBFS השיטה ע"י בשימוש הנמצאת פרטית שיטה זוהי :SmallWorld. באלגוריתם משתמשת מקודקודBFSהשיטה המרחקים חישוב למטרת

.SmallWorldמסויים לכל שאר הקודקודים ברשת, כשלב בחישוב ערך ה-10.Get .שיטה זו מחזירה את הערך של איבר מסויים במטריצה :11.Set .שיטה זו קובעת את הערך של איבר מסויים במטריצה :12.Print שיטה זו כותבת את המטריצה לתוך :TextWriter.המועבר כפרמטר 13.Convert2Sparse של לייצוג המטריצה של הייצוג את ממירה זו שיטה :

(.SparseMatrixמטריצה דלילה )14.Copy .שיטה זו מחזירה העתק של המטריצה :15.Transpose ( שיטה זו מחזירה את המטריצה המשוחלפת :Transpose.)16.Diagonal .שיטה זו מחזירה את האלכסון של המטריצה :17.UnDiagnoal .שיטה זו מחזירה את המשלים לאלכסון של המטריצה :18.Mult שיטה זו מכפילה את המטריצה במטריצה אחרת המתקבלת כפרמטר :

ומחזירה את תוצאת המכפלה.

98

Page 100: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

19.Edges .שיטה זו מחזירה את כמות הקשתות ברשת :20.EdgesWeighted .שיטה זו מחזירה את סכום משקלי הקשתות ברשת :21.AverageDegree .שיטה זו מחזירה את הדרגה הממוצעת ברשת :22.AverageWeightedDegree ברשת מחזירה את המשקל הממוצע זו שיטה :

ממושקלת.23.InDegreeHist של הכניסה דרגות היסטוגרמת את מחזירה זו שיטה :

הקודקודים ברשת.24.OutDegreeHist של היציאה דרגות היסטוגרמת את מחזירה זו שיטה :

הקודקודים ברשת.25.Sum .שיטה זו מחזירה את סכום איברי המטריצה :26.SumD .שיטה זו מחזירה את סכום איברי האלכסון במטריצה :27.SumU .שיטה זו מחזירה את סכום איברי המשלים לאלכסון במטריצה :28.Nnz .שיטה זו מחזירה את כמות האיברים השונים מאפס במטריצה :29.NnzD באלכסון מאפס השונים האיברים כמות את מחזירה זו שיטה :

המטריצה.30.NnzU שיטה זו מחזירה את כמות האיברים השונים מאפס במשלים לאלכסון :

במטריצה.31.Rows .שיטה זו מחזירה את כמות השורות במטריצה :32.Columns .שיטה זו מחזירה את כמות העמודות במטריצה :33.Convert2Binary שיטה זו ממירה את המטריצה הניתנת כפרמטר למטריצה :

(. השיטה נועדה להמרת מטריצות1 או 0בינארית )מטריצה שערכי איבריה ווקטור המאפיינים, במקרה שיש צורך לחשב את ממושקלות טרם חישוב עוצמת של המאפיינים את ולא בלבד, ברשת הקשרים של המאפיינים

הקשרים.

המחלקה SparseMatrix דלילה, כלומר לייצוג רשת באמצעות מטריצת סמיכויות זו משמשת מחלקה מטריצה בה נשמרים רק הערכים השונים מאפס. מחלקה זו נועדה לייעל את ייצור ווקטורי המאפיינים. הואיל וייצור ווקטורי המאפיינים מחייב פעולות רבות מאוד של הכפלת מטריצות, כאשר ישנו שימוש במטריצות דלילות, פעולות אלו מבוצעות באופן יעיל יותר מאשר ע"י שימוש בייצוג רגיל של המטריצה. עם זאת

, לצורך חישוב ערכים שונים אשר לא מבוצעיםMatrixעדיין ישנו שימוש במחלקה

99

Page 101: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

בצורה אינטנסיבית מחד, ומאידך נוחים יותר לביצוע בצורת הייצוג הרגילה שלהמטריצה.

המחלקה מכילה את האיברים הבאים:1.mRowsAmount .כמות השורות במטריצה :2.mColumnsAmount .כמות העמודות במטריצה :3.mRows .רשימה המכילה עבור כל שורה מיפוי בין העמודה לבין הערך :4.mColumns רשימה המכילה עבור כל עמודה מיפוי בין המיקום בשורה לבין :

הערך.

המחלקה מכילה את השיטות הבאות: : השיטה מקבלת את כמות השורות והעמודות ומייצרת מטריצה בגודל בנאי.1

המתאים ללא ערכים.התו בנאי.2 ואת מטריצה, המכיל קובץ של מיקומו את מקבלת השיטה :

המפריד בין הערכים ומייצרת מטריצה על סמך נתוני הקובץ.3.InitRowsAndColumns .השיטה מאתחלת את מבני הנתונים של המחלקה :4.Read התו ואת מטריצה, המכיל קובץ של מיקומו את : השיטה מקבלת

המפריד בין הערכים ומייצרת מטריצה על סמך נתוני הקובץ.5.Write בין ואת התו המפריד יעד, מיקומו של קובץ : השיטה מקבלת את

הערכים וכותבת את המטריצה הקיימת לתוך הקובץ. ) המטריצה נכתבתכמטריצה רגילה, ולא כמטריצה דלילה (.

6.Report לתוך נכתבים הנתונים המטריצה. על נתונים כותבת השיטה : TextWriterהמועבר כפרמטר. ניתן לשלוט על פירוט הנתונים באמצעות שני

פרמטרים נוספים הקובעים האם לכתוב רק נתונים סיכומיים, והאם לכתובאת היסטוגרמת התפלגות דרגות הקודקודים.

7.Get .שיטה זו מחזירה את הערך של איבר מסוים במטריצה :8.Set .שיטה זו קובעת את הערך של איבר מסוים במטריצה :9.Convert2Matrix של לייצוג המטריצה של הייצוג את ממירה זו שיטה :

(.Matrixמטריצה רגילה )10.Transpose ( שיטה זו מחזירה את המטריצה המשוחלפת :Transpose.)11.Diagonal .שיטה זו מחזירה את האלכסון של המטריצה :

100

Page 102: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

12.UnDiagnoal .שיטה זו מחזירה את המשלים לאלכסון של המטריצה :13.Mult שיטה זו מכפילה את המטריצה במטריצה אחרת המתקבלת כפרמטר :

ומחזירה את תוצאת המכפלה.14.Sum .שיטה זו מחזירה את סכום איברי המטריצה :15.SumD .שיטה זו מחזירה את סכום איברי האלכסון במטריצה :16.SumU .שיטה זו מחזירה את סכום איברי המשלים לאלכסון במטריצה :17.Nnz .שיטה זו מחזירה את כמות האיברים השונים מאפס במטריצה :18.NnzD באלכסון מאפס השונים האיברים כמות את מחזירה זו שיטה :

המטריצה.19.NnzU שיטה זו מחזירה את כמות האיברים השונים מאפס במשלים לאלכסון :

במטריצה.20.Rows .שיטה זו מחזירה את כמות השורות במטריצה :21.Columns .שיטה זו מחזירה את כמות העמודות במטריצה :22.Convert2Binary שיטה זו ממירה את המטריצה הניתנת כפרמטר למטריצה :

(. השיטה נועדה להמרת מטריצות1 או 0בינארית )מטריצה שערכי איבריה את לחשב שרוצים במקרה המאפיינים, ווקטור חישוב טרם ממושקלות עוצמת של המאפיינים את ולא בלבד, ברשת הקשרים של המאפיינים

הקשרים.

המחלקה NodeInfo קודקוד מידע על נתונים המשמש להחזקת הינה למעשה מבנה זו מחלקה לצורך המודלים מן בחלק שימוש מבוצע זה במידע מרוכז. באופן ברשת

ההחלטה אלו קודקודים יקושרו זה לזה.

המחלקה מכילה את האיברים הבאים:1.mNodeIndex .המספר הסידורי של הקודקוד ברשת :2.mNodeInDegree .דרגת הכניסה של הקודקוד :3.mNodeInWeight המשקל היחסי של דרגת הכניסה של הקודקוד מסכום :

דרגות הכניסה ברשת.4.mNodeOutDegree .דרגת היציאה של הקודקוד :5.mNodeOutWeight המשקל היחסי של דרגת היציאה של הקודקוד מסכום :

דרגות היציאה ברשת.

101

Page 103: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

.עבור כל משתנה, קיימת במחלקה שיטה לקביעת/קבלת ערכו

המחלקה ModelVectors תפקידה של מחלקה זו הינו להחזיק את רשימת המאפיינים של הרשתות אשר

.Singletonחוללו במהלך הרצת היישום. מחלקה זו ממומשת ע"י התבנית של ) קיים רק מופע יחיד של המחלקה, הנגיש לכלל חלקי היישום (.

המחלקה מכילה את האיברים הבאים:1.mAttributes .רשימה המכילה את המאפיינים של הווקטורים הנוצרים :

המחלקה מכילה את השיטות הבאות:1.Attributes שיטה זו מאפשרת גישה לרשימת המאפיינים. השימוש בה הינו :

בהוספת מאפיינים לרשימה תוך כדי החישוב שלהם. 2.writeAttributes מיקום לקובץ. המאפיינים רשימת את כותבת זו שיטה :

הקובץ ניתן כפרמטר של השיטה.

המחלקה TrueNetModelWrapper (Wrapping. המחלקה משמשת לעטיפה )Modelמחלקה זו יורשת מהמחלקה

.Modelשל רשת קיימת, כך שיהיה ניתן להפעיל עליה את השיטות של המחלקה זו ווקטור המאפיינים עבור הרשת. במחלקה ייצור זאת על מנת לאפשר את

נעשה שימוש על מנת לייצר את ווקטור המאפיינים של הרשתות האמפיריות.

המחלקה מכילה את השיטות הבאות:בצורת בנאי.1 ( קיימת ומוסיף אותהSparseMatrix: הבנאי מקבל רשת )

, ממנה יורשת המחלקה. Modelלרשימת הרשתות, המוגדרת במחלקה

המחלקה VectorGenerator מחלקה זו אחראית על יצירת ווקטור התכונות של הרשתות.

המחלקה מכילה את האיברים הבאים:

102

Page 104: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

1.mOrigMatrix משתנה זה מחזיק את המטריצה המקורית עליה יש לבצע את : כל הפעולות.

2.mWordMatrices מילה" לבין המטריצה" בין מיפוי הינו מסוג זה : משתנה שהיא מייצגת. משתנה זה מיועד לייעל את חישוב המילים ע"י שמירת תוצאות

ביניים שחושבו בשלבים מוקדמים יותר.

המחלקה מכילה את השיטות הבאות:: מאתחל את המשתנים של המחלקה. בנאי.12.Create שיטה זו מקבלת את אורך המילים המרבי ואת סוג המאפיינים שיש :

לעכשיו השיטה נכון של הרשת. ווקטור המאפיינים ומייצרת את ליצור, .Middendorfתומכת רק ביצירת המאפיינים לפי שיטת

3.EvaluateMiddendorf ,"שיטה זו מקבלת רשימת "מילים" ) רצף של "אותיות : כאשר כל אות מייצגת פעולה על המטריצה של הרשת (, ומפעילה אותה על המטריצה של הרשת המקורית, על מנת לקבל את מטריצת התוצאה. לאחר קבלת מטריצת התוצאה, מופעלות עליה פונקציות שונות על מנת לייצר את הערכים של המאפיינים השונים. ה"אותיות" והפונקציות הן ע"פ השיטה של

Middendorf et al ( 2004.'המתוארת בנספח א ( 4.GenerateMiddendorf "זו מקבלת את האורך המרבי של ה"מילים : שיטה

שיש לייצר ומייצרת אותם. ייצור ה"מילים" מבוצע באופן רקורסיבי.5.ApplyOperation ,שיטה זו מקבלת מטריצה ואת הפעולה שיש לבצע עליה :

ומחזירה את מטריצת התוצאה.

6.GetMatrixByOperation זו ממירה את המטריצה המקורית בהתאם : שיטה לפעולה שיש לבצע בהתאם לאלפבית המבצעי. כלומר, היא ממירה את

המטריצה המקורית לאחת המטריצות הבאות:a. – המטריצה המשוחלפת T.b. – המטריצה האלכסוניתD.c. – המטריצה המשלימה למטריצה האלכסוניתU.d.– המשולבת כאשר AUTהמטריצה ,A.המקורית המטריצה היא

, על מנת שיהיה ניתן לייצג את כלC) בקוד מסומנת מטריצה זו ב-אחת מהפעולות באמצעות תו בודד (.

103

Page 105: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

מחלקות ליצירת רשתות על פי מודלים היורשות מהמחלקה רבות מחלקות עוד מכיל היישום מחלקות אלו מלבד

Modelאשר כל אחת מהן מסוגלת לייצר רשתות על פי מודל ליצירת רשתות , אשר אחראית לייצר אתRunמסוים. מחלקות אלו כוללות שיטה סטטית בשם

ווקטורי המאפיינים של המודל.

לשיטה זו ישנם מספר פרמטרים:1.nExamplesAmount.כמות הרשתות שיש לייצר באמצעות המודל :2.nMaxWordLengthהאורך המרבי של מילים שיש ליצור על מנת לייצר את :

ווקטור המאפיינים.3.ResultDir.התיקיה אליה יישמרו התוצאות :4.bNormalize.האם לנרמל את ווקטורי המאפיינים :5.bWriteMatrices.האם לשמור את הרשתות שנוצרו :6.NodesAmount.כמות הקודקודים ברשת אשר המודל מנסה לחקות :7.EdgesAmount.כמות הקשתות ברשת אשר המודל מנסה לחקות :פרמטרים נוספים הנדרשים עבור המודלים השונים..8

שיטה זו פועלת באופן הבא: מתבצעת בדיקה האם קובץ היעד המכיל את ווקטורי המאפיינים של המודל.1

קיים. במידה והקובץ כבר קיים, השיטה מסיימת את פעולתה מבלי לעשותדבר.

מיוצר מופע של המודל הרלבנטי, עם הפרמטרים המתאימים. .2 של מופע המודל.Createמתבצעת קריאה לשיטה .3 , הועבר פרמטר המבקש לשמור את הרשתותRunבמידה ובקריאה לשיטה .4

.ResultDirשנוצרו, אזי הן נשמרות לספרייה של מופע המודל ,אשר יוצרת אתCreateVectorsמתבצעת קריאה לשיטה .5

.ResultDirווקטורי המאפיינים ושומרת אותו לתיקיה המחלקה Program

אחראית על הפעולה שייבצע היישום.Programהמחלקה

המחלקה מכילה את השיטות הבאות:1.Main קריאת הפרמטרים איתם הורץ היישום והחלטה על ביצוע הפעולה :

המתאימה.2.CreateTrueNetVector רשת של ווקטורי המאפיינים את מייצרת זו שיטה :

אמפירית על סמך קובץ המכיל את מטריצת השכנות של הרשת. ווקטור זה

104

Page 106: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

נדרש על מנת לסווג את הרשת האמפירית למודלים באמצעות המסווגיםשנבנו.

3.CreateModelsVectors ווקטורי המאפיינים באמצעות זו מייצרת את : שיטה המודלים ליצירת רשתות מכוונות.

4.CreateModelsWeightedVectors המאפיינים ווקטורי את מייצרת זו שיטה : באמצעות המודלים ליצירת רשתות מכוונות ממושקלות.

הרצת מחולל המאפייניםהרצת היישום ניתנת לביצוע באופן הבא:

AttributesCreator -a <TR,TW,D,W> -s <networks dir> -d <destination dir> -l <max word length> -n <0,1> -e <vectors to create> -w <0,1>

יש לשים לב לנקודות הבאות:ההרצה משתמשת בזוגות של פרמטרים: הראשון מצביע על סוג הפרמטר והשני

על הערך שלו..אין חשיבות לסדר הזוגות של הפרמטרים.יש להוסיף רווח בין סוג הפרמטר לבין הערך שלואין חובה לרשום את כל הפרמטרים. במידה ופרמטר לא נרשם יבוצע שימוש

בערך ברירת המחדל שלו. )את ערכי ברירת המחדל ניתן לראות בקוד המחלקהProgram.)

משמעות הפרמטרים היא:1.- a :סוג הפעולה שיש לבצע, כאשר האפשרויות הן :

a.TR ווקטורי המאפיינים של הרשתות האמפיריות, תוך התייחסות ייצור : אליהם כאל רשתות לא ממושקלות.

b.TW ווקטורי המאפיינים של הרשתות האמפיריות, תוך התייחסות ייצור : אליהם כאל רשתות ממושקלות.

c.D .ייצור ווקטורי המאפיינים של המודלים המכוונים הלא ממושקלים :d.W .)ייצור ווקטורי המאפיינים של המודלים הממושקלים )המכוונים :

2.- s .מיקום קבצי הרשתות האמפיריות :3.- d .תיקית היעד לכתיבת התוצאות :4.- l .אורך ה"מילים" המרבי על פיהן ייווצרו המאפיינים :5.- n ( 1- לא לנרמל, 0: האם לנרמל את ווקטורי המאפיינים.)לנרמל -6.- e כמות הווקטורים שיש לייצר עבור כל מודל )במידה ובוחרים את האפשרויות :

T או D– עבור הפרמטר a.)7.- w ( 1-לא לשמור, 0: האם לשמור את הרשתות שנוצרו.)לשמור -

דוגמא: ווקטורי מאפיינים לא מנורמלים המבוססים על המילים500הפקודה הבאה תייצר

ייווצרו על סמך קבצי הרשתות5עד אורך עבור כל מודל ממושקל. הווקטורים

105

Page 107: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

בספריה (C:\Networksהנמצאות עצמן הרשתות עם יחד ( יישמרו התוצאות . .C:\Resultsבספריה

AttributeCreator –a W –s c:\Networks –d c:\Results –l 5 –n 0 –e 500 –w 1

תיאור קבצי הרשתות תיקיית הרשתות מכילה קבצים המכילים את מטריצת השכנות של הרשתות אותן

ברצוננו לבדוק.כל קובץ של רשת הינו קובץ טקסטואלי בעל המבנה הבא:

הקובץ מכיל מספר שורות, כאשר כל שורה מייצגת את השכנים של.1קודקוד מסויים ברשת.

כל שורה מכילה מספר עמודות. מספר העמודות חייב להיות זהה.2למספר השורות. בקובץ.

בכל עמודה מופיע מספר חיובי שלם. מספר זה מייצג את עוצמת הקשר.3בין הקודקוד המיוצג ע"י השורה לקודקוד המיוצג ע"י העמודה.

בין העמודות מפריד תו רווח בודד..4סדר הקודקודים בעמודות וסדר הקודקודים בשורות חייב להיות זהה..5

דוגמא: 4השורות הבאות מייצגות מטריצת שכנות של רשת מכוונת המכילה קליקה בגודל

) רשת בעלת ארבעה קודקודים שכל אחד מהם מקושר לכל האחרים (

0 1 1 11 0 1 1 1 1 0 11 1 1 0

תיאור גרפי של הרשת

תיאור התוצאותווקטורי המאפיינים של הרשתות האמפיריות, נוצרים בתוך יצירת במקרה של

תיקיית התוצאות קבצים נפרדים עבור כל רשת אמפירית. כל קובץ שכזה מכילאת ווקטור המאפיינים של הרשת הרלבנטית.

ווקטורי המאפיינים של המודלים, עבור כל רשת אמפירית יצירת במקרה של נוצרת תחת תיקיית התוצאות, תיקיה ששמה כשם הרשת האמפירית. לתיקיה זומודל, כאשר שם כל של ווקטורי המאפיינים נכתבים הקבצים המכילים את

106

Page 108: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

תיקיה זו נוצרת תחת תיקיה כמו-כן מכיל את שם המודל הרלבנטי. הקובץ המכילה את הרשתות שנוצרו ) במידה ובחרנו לשמור אותן (. למשל במידה

עלNוהשתמשנו באפשרות זו על מנת ליצור ווקטור מאפיינים עבור רשת בשם N, אזי תחת תיקיית התוצאות תיווצר תיקיה בשם DRGסמך המודל שנקרא

.DRG.vectorsובתוכה יהיה קובץ בשם :קובץ ווקטור המאפיינים, הינו קובץ טקסטואלי בעל המבנה הבא

בכל שורה יש ווקטור נפרד. 1מופיעים רק האיברים של הווקטור2 מיוצג בצורה דלילה, כלומר הווקטור

השונים מאפס והאינדקס שלהם. האיברים של הווקטור מסודרים לפי האינדקס שלהם בסדר עולה.3

7:104 6:216 5:21 4:237 3:205 2:11 1:216לדוגמא:

) Networks Classifier ( . מסווג הרשתות 2 ב. מבנה

המבנה של מסווג הרשתות מורכב מן המחלקות הבאות:

המחלקה Handler מחלקה זו היא מחלקת אב, ממנה יורשות מספר מחלקות. המחלקה מכילה

איברים ושיטות הנמצאות בשימוש משותף ע"י המחלקות היורשות ממנה.

המחלקה מכילה את האיברים הבאים:1.SVMLearnLocation זהו איבר סטטי של המחלקה המכיל את מיקומו של :

משמש svm_learn.exeהיישום זה יישום מתבססיםללימוד. עליו המודל המסווגים.

2.SVMClassifyLocation זהו איבר סטטי של המחלקה המכיל את מיקומו של : באמצעות המסווגים.לסיווג. יישום זה משמש svm_cassify.exeהיישום

המחלקה מכילה את השיטות הבאות:1.GetNetsModelVectorFile ווקטורי של המיקום את מקבלת זו שיטה :

המאפיינים ומחזירה מבנה נתונים המכיל מיפוי משם הרשת לקבצי ווקטוריהמאפיינים שלה.

2.ReadVectorsFile .שיטה זו קוראת את ווקטורי המאפיינים מקובץ לזיכרון :

107

Page 109: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

3.ReadAttributesLine .שיטה זו קוראת ווקטור מאפיינים בודד מקובץ לזיכרון :4.NormalizeIfNeeded .שיטה זו מנרמלת את ווקטור המאפיינים במידה ונדרש :

) בפועל השיטה לא בשימוש (.5.RunSVM -שיטה זו משתמשת במסווג ה :SVMשנבנה, על מנת לסווג קובץ

לקובץ נכתבות הסיווג תוצאות רשתות. של מאפיינים ווקטורי המכיל ומנותחות בשלב מאוחר יותר.

6.CheckTestResult שיטה זו בודקת את תוצאות הסיווג, וכותבת את הסיכום : שלהן לקובץ.

7.ComputeTestPrecision זו מחשבת את הדיוק של מסווג מסוים על : שיטה סמך תוצאות הסיווג.

8.WriteNetSummaryFile שיטה זו מייצרת קובץ המכיל תוצאות מסוכמות של : דיוקי כלל המסווגים.

9.DeleteTrainTest זו מוחקת את קבצי האימון והבדיקה לאחר סיום : שיטה הבדיקות.

המחלקה SimpleHandler מחלקה זו אחראית על בניית ובדיקת המסווגים של כלל המודלים. המחלקה

.Handlerיורשת מהמחלקה

המחלקה מכילה את השיטות הבאות:1.TrainAndTestClassifiers .המחלקה של העיקרית השיטה היא זו שיטה :

ובדיקת ליצירת הנדרשות הפעולות כלל ביצוע על אחראית השיטה המסווגים.

2.CreateModelsTrainTestData האימון קבצי ייצור על אחראית זו שיטה : והבדיקה של כלל המסווגים.

3.AlreadyDone יצירה ובדיקה מחודשת של זהי שיטת עזר. מטרתה מניעת : הסיווג תוצאות קבצי כמות השוואת על מסתמכת השיטה המסווגים.

לשיטה. שהועבר בכמותלפרמטר תלוי זה פרמטר כי לב לשים יש המסווגים הנבדקים. לכן במידה וכמות המסווגים משתנה, יש לבצע

לערכו של הפרמטר המועבר הנדרשות ולכלאת ההתאמות הואיל . מסווג שנבדק נוצרים שני קבצי תוצאות, ערכו של הפרמטר המועבר צריך

להיות שווה לפי שניים מכמות המסווגים הנבדקים.

108

Page 110: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

4.TrainSVMs שיטה זו מאמנת את המסווגים השונים, באמצעות קבצי האימון : .svm_learnהרלבנטיים. למטרה זו השיטה משתמשת ביישום

5.TestSVMs הבדיקה בקבצי המוכלים הווקטורים את מסווגת זו שיטה : ומשמשות לקובץ נכתבות הסיווג תוצאות שאומנו. המסווגים באמצעות

להערכת הדיוק של המסווגים.6.CreateBestClassifiersDir את להכיל המיועדת תיקיה מייצרת זו שיטה :

נוצרו מספר ועבור כל מסווג המסווגים הטובים ביותר מכל סוג ) במידה (.cross validationמסווגים למטרת

7.WriteNetsSummaryFile שיטה זו מייצרת קובץ המכיל את סיכום הנתונים על : רמות הדיוק של המסווגים השונים.

8.WriteNetsBestClassifiersFile סיכום את המכיל קובץ מייצרת זו שיטה : הנתונים על רמות הדיוק של המסווגים הטובים ביותר.

9.checkTrainLoss אימון במהלך שנוצרו הלוג בקבצי משתמשת זו שיטה : (. הפלט נכתב לקובץtrain lossהמסווגים לחישוב כמות השגיאות שהיו )

.csvמסוג

המחלקה RobustnessHandler ( של המסווגיםrobustnessמחלקה זו אחראית לבצע את בדיקת העמידות )

השונים שנבנו. אופן הביצוע של פעולה זו דומה מאוד לתהליך יצירת ובדיקתהמחלקה ע"י עצמם בכךSimpleHandlerהמסווגים הינו העיקרי ההבדל .

שהסיווג נעשה על תתי קבוצות של המאפיינים

המחלקה מכילה את השיטות הבאות:1.CheckRobustness היא השיטה העיקרית של המחלקה. השיטה זו שיטה :

אחראית על ביצוע כלל הפעולות הנדרשות לבדיקת העמידות של המסווגים.2.AlreadyDone שיטת עזר. מטרתה מניעת חישוב מחדש של עמידות זוהי :

מסווגים במידה והעמידות חושבה כבר. השיטה מסתמכת על השוואת כמות . יש לשים לב כי פרמטר זהקבצי תוצאות הסיווג לפרמטר שהועבר לשיטה

המסווגים וכמות במידה לכן הנבדקים. המסווגים בכמות תלוי יש לעשות את ההתאמות הנדרשות לערכו של הפרמטר השתנתה,

הואיל ולכל מסווג שנבדק נוצרים שני קבצי תוצאות, ערכו שלהמועבר. הפרמטר המועבר צריך להיות שווה לפי שניים מכמות המסווגים הנבדקים.

109

Page 111: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

3.CreateTrainTestData שיטה זו אחראית על ייצור קבצי האימון והבדיקה של : כלל המסווגים עבור תת קבוצה מסוימת של מאפיינים. הביצוע נעשה ע"י

עם הפרמטרים המתאימים. CreateTrainTestSetקריאה לשיטה 4.CreateTrainTestSet שיטה זו מייצרת את קבצי האימון והבדיקה של מסווג :

מסוים עבור תת קבוצה מסוימת של מאפיינים. 5.CreateAttributesLine תת המאפיינים, מווקטור לייצר מאפשרת זו שיטה :

ווקטור המכיל רק את המאפיינים שנבחרו לשימוש.6.TrainSVMs שיטה זו מאמנת את המסווגים השונים, באמצעות קבצי האימון :

.svm_learnהרלבנטיים. למטרה זו השיטה משתמשת ביישום 7.TestSVMs הבדיקה בקבצי המוכלים הווקטורים את מסווגת זו שיטה :

ומשמשות לקובץ נכתבות הסיווג תוצאות שאומנו. המסווגים באמצעות להערכת הדיוק של המסווגים.

המחלקה NetworkClassifiers מחלקה זו אחראית על סיווג הרשתות האמפיריות באמצעות המסווגים שנבנו.

לאחר ביצוע הסיווג נכתבים סיכומים שונים של תוצאות הסיווג.

המחלקה מכילה את השיטות הבאות:1.ClassifyNets זוהי השיטה הראשית במחלקה. השיטה אחראית על ביצוע :

כלל הפעולות הנדרשות לסיווג הרשתות וכתיבת סיכום התוצאות.2.CollateClassificationResults לקיבוץ התוצאות של כלל זו אחראית : שיטה

הסיווגים של הרשתות, על מנת שיהיה ניתן לכתוב אותם באופן סיכומי.3.WriteResultSummary שיטה זו משמשת לכתיבת תוצאות הסיווג הסיכומיות :

עבור כל מסווג.4.WriteSummary של בצורה הסיווג תוצאות לכתיבת משמשת זו שיטה :

כמה מודליםמודל, מטריצת הצבעות. במטריצה זו ניתן לראות עבור כל הוא "ניצח", ומה אחוז הניצחונות שלו מול כל מודל מכלל המסווגים בהם

הוא השתתף.110

Page 112: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

המחלקה Program אחראית על הפעולה שייבצע היישום.Programהמחלקה

המחלקה מכילה את השיטות הבאות:1.Main קריאת הפרמטרים איתם הורץ היישום והחלטה על ביצוע הפעולה :

המתאימה.

הרצת מסווג הרשתותעל מנת להשתמש ביישום ניתן להריץ אותו באופן הבא:

NetworksClassifiers –a <A,B,R,N,L> -sm <model vectors dir>

-sn <networks vectors dir> -d < destination dir> -v <vectors amount>

-t <train examples amount> -c < cross Validation amount> -rs <robustness samples>

-ra <robustness attributes amount> -n <0,1>

יש לשים לב לנקודות הבאות:ההרצה משתמשת בזוגות פרמטרים: הראשון מצביע על סוג הפרמטר והשני על

הערך שלו..אין חשיבות לסדר הזוגות של הפרמטרים.יש להוסיף רווח בין סוג הפרמטר לבין הערך שלואין חובה לרשום את כל הפרמטרים. במידה ופרמטר לא נרשם יבוצע שימוש

בערך ברירת המחדל שלו.:יישום זה כבד מאוד מבחינת משאבים. הן מבחינת זמן הריצה והן חשוב לזכור

מבחינת המקום הפנוי הנדרש בדיסק הקשיח. רצוי מאוד לנטר מפעם לפעם אתפעילות היישום ולוודא שהוא לא נתקל בבעיות.

היישום נכתב כך שתהיה לו יכולת התאוששות מסויימת. כלומר, במידה והיישום יינסה להמשיך את יורץ הוא "נפל" מסיבה כלשהי, אזי בפעם הבאה שהוא

פעולתו מנקודת הנפילה. :ישנן תלויות בין הפעולות השונות שיישום זה מבצע. הפעולה חשוב לזכור

להיות בניית המסווגים. אח"כ רצוי להריץ את בדיקת העמידותחייבתהראשונה ורק לבסוף את סיווג הרשתות.

משמעות הפרמטרים היא:1.- a :סוג הפעולה שיש לבצע, כאשר האפשרויות הן :

a.B .בניית המסווגים ובדיקת האיכות שלהם :b.R .בדיקת עמידות המסווגים :c.N .סיווג הרשתות האמפיריות :d.L ( בדיקת אובדן האיכות :train loss.במהלך בניית המסווגים )e.A .בצע את כל הפעולות :

2.– sm : .מיקום התיקייה המכילה את ווקטורי המאפיינים של המודלים 3.– sn .מיקום התיקייה המכילה את ווקטורי המאפיינים של הרשתות האמפיריות :

111

Page 113: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

4.– d .מיקום התיקייה אליה ייכתבו התוצאות :5.– v כמות ווקטורי המאפיינים שיש בכל קובץ )היישום מניח כי כמות ווקטורי :

המאפיינים זהה עבור כל המודלים(.6.– t מספר ווקטורי מאפיינים בהם יש להשתמש עבור אימון המסווגים )הווקטורים :

הנותרים ישמשו לבדיקת המסווג שנבנה (.7.– c ( כמות הבדיקות המוצלבות :cross validationשיש לעשות. הערכים )

. ערכים גדולים יותר ייגרמו לכךv/t ל 1האפשריים הם מספרים שלמים בין שהבדיקות תחזורנה על עצמן.

8.– rs כמות בדיקות העמידות שיש לבצע עבור כל מסווג. בכל בדיקת עמידות : נבדקת תת קבוצה שונה של מאפיינים הנבחרת באקראי.

9.– ra .גודל תת קבוצת המאפיינים הנבדקת בכל בדיקת עמידות :10.– n ( .1-לא, 0: האם לנרמל את ווקטורי המאפיינים.) כן -

דוגמא:הפקודה הבאה תגרום ליישום לבצע את כל הפעולות עם הנתונים הבאים:

ווקטורי המאפיינים נמצאים בספריהC:\ModelVectors . התוצאות יישמרו בספריהC:\Results. הינה קובץ בכל הווקטורים מהם 500כמות והשאר100, לאימון ישמשו

לבדיקה. פעמים על קבוצות שונות. 5הבדיקה תבוצע מאפיינים.500 בדיקות עמידות, כל אחת על 30למסווגים שנבנו יבוצעו בתיקיה הנמצאות האמת רשתות יסווגו התהליך C:\NetworkVectorsבסיום

באמצעות המודלים שנבנו ותוצאות הסיווג יירשמו לקובץ.

NetworksClassifiers –a A –sm c:\modelVectors –sn c:\networkVectors –d c:\Results –v 500 –t 100 –c 5 –rs 30 –ra 500 -n 0

התוצאות תיאור

בחירה לבנות את המסווגים תייצר תחת תיקיית היעד את עץ התיקיות הבא:TrainTest תיקיה זו אמורה להיות ריקה בסוף ריצת התוכנית. במהלך התוכנית :

נכתבים לתיקיה זו קבצים זמניים המשמשים ללימוד ובדיקת המסווגים.SVMModels -תיקיה זו מכילה את המודלים של המסווגים שנוצרו באמצעות ה :

svm_learn-בנוסף מכילה התיקייה את קבצי הלוג של תהליך ה .svm_learnאם ( . כי אין בהם מידע מעניין (.

BestSVMModels תיקיה זו מכילה עבור כל זוג מודלים, את המסווג הטוב ביותר : מודלים לשם בדיקה זוג כל ליצור מספר מסווגים עבור ניתן )כזכור, ביניהם

(.cross validationמוצלבת ) SVMTestResult תיקיה זו מכילה את תוצאות הבדיקה של המסווגים שנבנו על :

קבצי שני התיקייה מכילה בנוסף, הבדיקה. בשם:csvקבצי הראשון

112

Page 114: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

Classifiers.Summary.Result.csv( הדיוק את המכיל precisionאחד כל של ) מכיל את תוצאותBestClassifiers.Summary.Result.csvמהמסווגים והשני בשם:

הדיוק של המסווגים הטובים ביותר.

העמידות בדיקת את לבצע בשםבחירה תיקיה היעד תיקיית תחת תייצר Robustnessייווצר עץ תיקיות הדומה לעץ התיקיות שנוצר עבור זו . תחת תיקיה

בניית המסווגים. ההבדל בין שני עצי התיקיות הינו בכך שעבור בדיקת העמידות לא ייווצרו תיקיות עבור המסווגים הטובים ביותר הואיל ובמקרה זה לא מתבצעת בדיקה

( ייווצרוcross validationמוצלבת ( ולכן דבר שכזה הינו חסר משמעות. כמו-כן, בתיקיה קבצים המכילים את רשימת המאפיינים שהייתה בשימוש עבור כל אחת

מבדיקות העמידות.

בחירה לסווג את הרשתות תייצר תחת תיקיית היעד את עץ התיקיות הבא:TrueNetsClassificationResult תיקיה זו מכילה את תוצאות הסיווג של הרשתות :

:csvהאמפיריות באמצעות כלל המסווגים. כמו-כן מכילה התיקייה שני קבצי הראשון עם תוצאות מפורטות על תוצאות הסיווג לפי כל מודל והשני עם ריכוז

כמות הניצחונות של כל מודל.TrueNetsBestClassificationResult של הסיווג תוצאות את מכילה זו תיקיה :

הרשתות האמפיריות באמצעות המסווגים הטובים ביותר. כמו-כן מכילה התיקייה : הראשון עם תוצאות מפורטות על תוצאות הסיווג לפי כל מודלcsvשני קבצי

והשני עם ריכוז כמות הניצחונות של כל מודל.

) Significance Finder . בודק המובהקות ( 3 ב.מבנה

המבנה של בודק המובהקות מורכב מן המחלקות הבאות:

המחלקה ClassifierPercision מחלקה זו מחזיקה נתונים על הדיוק של מסווג מסוים. על מנת להבין יותר את משמעות האיברים של המחלקה , יש לזכור כי כל מסווג מבחין בין שני מודלים.

113

Page 115: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

והמודל ה"ימני". נקרא להם המודל ה"שמאלי" בין המודלים לצורך אבחנה הסיווג של דוגמת בדיקה ע"י המסווג ניתן ע"י ערך מספרי. ערך חיובי משמעו כישלילי ערך ואילו ה"שמאלי", למודל שייכת הבדיקה שדוגמת קובע המסווג

משמעו כי המסווג קובע שדוגמת הבדיקה שייכת למודל ה"ימני".

המחלקה מכילה את האיברים הבאים:1.Precision .הדיוק של המסווג על כלל קבוצת הבדיקה :2.PositivePrecision הדיוק של המסווג על הווקטורים בקבוצת הבדיקה שהיו :

שייכים למודל ה"שמאלי"3.NegativePrecision הדיוק של המסווג על הווקטורים בקבוצת הבדיקה שהיו :

שייכים למודל ה"ימני"4.TruePositive אחוז דוגמאות הבדיקה שהיו שייכות למודל ה"שמאלי" וסווגו :

נכונה.5.FalsePositive אחוז דוגמאות הבדיקה שהיו שייכות למודל ה"שמאלי" וסווגו :

באופן שגוי.6.TrueNegative וסווגו שייכות למודל ה"ימני" דוגמאות הבדיקה שהיו : אחוז

נכונה.7.FalseNegative וסווגו : אחוז דוגמאות הבדיקה שהיו שייכות למודל ה"ימני"

באופן שגוי.

המחלקה מכילה את השיטות הבאות:ה- בנאי.1 ערכי את מקבל הבנאי :Precision,PositivePrecision-ו

NegativePrecision.ומחשב את שאר איברי המחלקה שיטות לקבלת ערכי האיברים של המחלקה..2

המחלקה SignificanceFinder זוהי המחלקה העיקרית של היישום. המחלקה מקבלת את קבצי המידע שלשל המובהקות את ומחשבת המסווגים, ואיכות העמידות הסיווג, תוצאות

התוצאות.

המחלקה מורכבת מהשיטות הבאות:1.Run לחישוב הנדרשות הפעולות כלל את לבצע אחראית זו שיטה :

המובהקות. השיטה מקבלת את מיקום קבצי הנתונים, קוראת אותם, מסננת

114

Page 116: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

את נתוני המסווגים שלא היו בעלי ערכי עמידות גבוהים כנדרש, ומחשבת אתהמובהקות של הסיווג עבור כל אחד מהמסווגים.

2.ReadResultFile .שיטה זו קוראת את קובץ תוצאות הסיווג לזיכרון :3.ReadPrecisions שיטה זו קוראת את הקובץ המכיל את הדיוק של המסווגים :

השונים לזיכרון.4.FilterClassifications שיטה זו מנפה מכלל תוצאות הסיווג את התוצאות של :

המסווגים שלא עמדו בתנאים הבאים: a.מועבר כפרמטר ע"י( ערך העמידות שלהם לא היה מספיק גבוה

המשתמש(.b..תוצאת הסיווג הייתה שונה מתוצאת הסיווג של תתי המסווגיםc. רוב ( לתוצאת הסיווגברורהיה )מועבר כפרמטר ע"י המשתמש

) סעיף זה רלבנטי רק למקרה של טיפול במסווגים מרובים הנוצרים (.cross validationכתוצאה מביצוע

5.AssignNetIds .שיטה זו מבצעת מיפוי של שמות הרשתות שסווגו למספרים : מיפוי זה נדרש על מנת שיהיה ניתן לבחור תתי קבוצות של רשתות בצורה

יותר נוחה.6.CalculateSignificance שיטה זו מבצעת בפועל את חישוב מובהקות הסיווג :

של כלל המסווגים.7.CalcClassifierSignificance ,שיטה זו מחשבת את המובהקות של מסווג מסוים :

עבור כמות שגיאות מרבית מסוימת.8.GetAvgPrecisions .המסווגים של הממוצע הדיוק את מחשבת זו שיטה :

חישוב זה נדרש במקרה בו חישוב המובהקות מבוצע על מספר מסווגים שנוצרו כתוצאה מיצירת מספר מסווגים השייכים לאותו סוג ועל אותה רשת.

(.cross validationמסווגים אלו נוצרים עקב ביצוע בדיקה מוצלבת ) 9.CalcSubsetsSignificance כאשר המובהקות, ערך את מחשבת זו שיטה :

מניחים כי חלק מתוצאות הסיווג היו שגויות. החישוב נעשה ע"י מעבר על כל תתי הקבוצות של סיווגים בגדלים הרלבנטיים ובמידה ומניחים כי הסיווג היה

מוטעה, משתמשים בדיוק של המקרה המשלים.10.GetGroupSignificance שיטה זו מחשבת את ציון המובהקות של תת קבוצה :

מסוימת של סיווגים.11.GetGroup שיטה זו מחזירה את ערכי הדיוק, של קבוצת סיווגים מסוימת, על :

מנת שיהיה ניתן לחשב את ציון המובהקות שלה.

115

Page 117: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

12.Advance שיטה זו עוברת לתת הקבוצה הבאה של סיווגים. השיטה מחזירה : false.במקרה וסיימנו לעבור על כל תת הקבוצות

המחלקה Program אחראית על קריאת הפרמטרים איתם הורץ היישום, ניתוחםProgramהמחלקה

.SignificanceFinder של המחלקה Runוקריאה לשיטה

המחלקה מכילה את השיטות הבאות:1.Main קריאת הפרמטרים איתם הורץ היישום והחלטה על ביצוע הפעולה :

המתאימה.

הרצת בודק המובהקותעל מנת להשתמש ביישום ניתן להריץ אותו באופן הבא:

SignificanceFinder –cr <filename> -cp <filename> -r <filename> -o <filename>

-mm <max mistakes> -mr <min robustness>

יש לשים לב לנקודות הבאות:ההרצה משתמשת בזוגות של פרמטרים: הראשון מצביע על סוג הפרמטר והשני

על הערך שלו..אין חשיבות לסדר הזוגות של הפרמטרים.יש להוסיף רווח בין סוג הפרמטר לבין הערך שלוככל שכמות השגיאות המרבית גדלה, כך זמן הריצה של היישום חשוב לזכור :

מתארך. זמן הריצה גדל גם כתלות בכמות הרשתות עליהן מתבצעת הבדיקההואיל ויש צורך לעבור על יותר תת קבוצות.

משמעות הפרמטרים היא:1.- cr .מיקום הקובץ המכיל את תוצאות סיווג הרשתות :2.– cp : .מיקום הקובץ המכיל את הדיוק של המסווגים 3.– r .מיקום הקובץ המכיל את תוצאות בדיקת העמידות של המסווגים :4.– o .שם קובץ הפלט אליו ייכתבו התוצאות :5.– mm .כמות שגיאות הסיווג המירבית עבורה רוצים לבדוק את רמת המובהקות :6.– mr .ערך העמידות המינימאלי לפיו יש לסנן את תוצאות הסיווג :

דוגמא:הפקודה הבאה תגרום להרצת היישום כך ש:

-קובץ תוצאות הסיווג יילקח מC:\ClassificationResults.-קובץ דיוק המאפיינים יילקח מC:\ClassifierPercisions.-קובץ תוצאות בדיקת העמידות יילקח מC:\RobustnessResults.

116

Page 118: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

-התוצאות יכתבו לC:\SignificanceResults. שגיאות סיווג3תיבדק המובהקות של לכל היותר 90%ערך העמידות המינימאלי יהיה.

SignificanceFinder –cr c:\ClassificationResults –cp c:\ClassifiersPercisions

–r C:\RobustnessResult –o C:\SignificanceResults –mm 3 –mr 0.9

תיאור התוצאות הפלט של היישום הינו קובץ המכיל את מובהקות הסיווג עבור המסווגים השונים.

המורכב ממספר עמודות:csvקובצי התוצאות הינו קובץ שם המסווג..1מובהקות הסיווג..2כמות שגיאות סיווג מרבית..3 כמות נתונים עליהם בוצעה הבדיקה – כלומר כמות הנתונים שעברו את הסינון.4

בהתאם להגבלות על עמידות המסווגים.כמות הנתונים מתוך אלו עליהם בוצעה הבדיקה בהם ניצח המודל המנצח.5שם המודל המנצח..6

דוגמא למבנה קובץ התוצאות

ClassifierSignificanceMaxMistakesExamplesAmountWinsWinner

DRG/SPA0.61316618603535SPA

SPA/DPA0.21944838902828SPA

SPA/DC103535SPA

SPA/DSW103434SPA

SPA/IDPA0.00111241303535SPA

DRG/SPA0.92019392213535SPA

SPA/DPA0.58990575212828SPA

SPA/DC113535SPA

SPA/DSW113434SPA

SPA/IDPA0.00991051613535SPA

117

Page 119: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

מקורות

1. Adamic, L. A. and Huberman, B. A., (2000). Power-law distri-bution of the world wide web, Science 287, 2115.

2. Albert, R., Jeong, H., and Barabasi, A.-L., (1999). Diameter of the world-wide web, Nature 401, 130–131.

3. Albert, R. And Barabasi, A.-L., (1999). Emergence of scaling in random networks, Science 286, 509–512.

4. Albert, R., Jeong, H., and Barabasi, A.-L., (2000). Attack and error tolerance of complex networks, Nature 406, 378–382.

5. Albert, R., & Barabasi, A. L. (2002). Statistical Mechanics of Complex Networks. Review of Modern Physics, 74, 47-97.

6. Aviv, R., Erlich, Z., Ravid, G., & Geva, A. (2003). Network Analysis of Knowledge Construction in Asynchronous Learning Networks. Journal of Asynchronous Networks, 7(3), 1-23.

7. Aviv, R., Erlich, Z., & Ravid, G. (2007a). Analysis of Reciprocity and Transitivity in Online Collaboration Networks. Connections.

8. Aviv, R., Erlich, Z., & Ravid, G. (2007b). Randomness and Clustering of Responses in Online Learning Networks. Paper presented at the IASTED International Conference on Communication, Internet and Information Technology.

9. Bekessey, A., Bekessey, P., and Komlos J., (1972). Asymptotic enumeration of regular matrices, Stud. Sci. Math. Hugar. 7, 343-353.

10. Bender, E. A., and Canfield, E. R., (1978). The asymptotic number of labeled graphs with given degree sequences. Journal of Combinatorical Theory A 24, 296-307.

11. Bianconi, G. and Barabasi, A.-L., (2001). Competition and multiscaling in evolving networks, Europhys. Lett. 54, 436–442.

12. Bollob´as, B. (1980). A probabilistic proof of an asymptotic formula for the number of labeled regular graphs, European Journal on Combinatorics 1, 311-316.

13. Bollob´as, B. and Riordan, O. (2002). The diameter of a scale-free random graph, Preprint, Department of Mathematical Sciences, University of Memphis.

14. Broder, A., Kumar, R., Maghoul, F., Raghavan, P., Rajagopalan, S., Stata, R., Tomkins, A., and Wiener, J., (2000). Graph structure in the web, Computer Networks 33, 309–320.

15. Buts, C. T., (2008), Social Network Analysis, A Methodological Introduction, Asian Journal of Soc. Psych, 11, 13-41

16. Callaway, D. S., Hopcroft, J. E., Kleinberg, J. M., Newman, M. E. J., and Strogatz, S. H., (2001). Are randomly grown graphs really random?, Phys. Rev. E 64, 041902.

17. Chung, F. and Lu, L., (2002). The average distances in random graphs with given expected degrees, Proc. Natl. Acad. Sci. USA 99, 15879–15882.

18. Dorogovtsev, S. N. and Mendes, J. F. F., (2000). Scaling behaviour of developing and decaying networks, Europhys. Lett. 52, 33–39.

19. Dorogovtsev, S. N. and Mendes, J. F. F., (2001). Effect of the accelerating growth of communications networks on their structure, Phys. Rev. E 63, 025101.

20. Dorogovtsev, S. N., Mendes, J. F. F., and Samukhin, A. N., (2001). Anomalous percolation properties of growing networks, Phys. Rev. E 64, 066110.

118

Page 120: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

21. Dunne, J. A., Williams, R. J., and Martinez, N. D., (2002). Food-web structure and network theory: The role of connectance and size, Proc. Natl. Acad. Sci. USA 99, 12917–12922.

22. Erdos, P., & R'enyi, A. (1960). On the Evolution of Random Graphs. Publ. Math. Inst. Hung. Acad. Sci., 5, 17–61.

23. Everitt, B., (1974). Cluster Analysis, John Wiley, New York.24. Goh, K.-I., Khang, B., & Kim, D. (2001). Universal behavior of load distribution

in scale free networks. Phys. Rev. Lett., 87(27).25. Goh, K.-I., Oh, E., Jeong, H., Kahng, B., and Kim, D., (2002). Classification of

scale-free networks, Proc. Natl. Acad. Sci. USA 99, 12583–12588.26. Jeong, H., Mason, S., Barabasi, A.-L., and Oltvai, Z. N. (2001). Lethality and

centrality in protein networks, Nature 411, 41–42.27. Jeong, H., N´eda, Z., and Barabasi, A.-L., (2003). Measuring preferential

attachment in evolving networks, Europhys. Lett. 61, 567–572.28. Joachims, T. (1999). Making large-scale SVM Learning Practical. In B. Schlopf,

C. Burges & A. Smola (Eds.), Advances in Kernel Methods - Support Vector Machines: MIT-Press.

29. Kleinberg, J. M., Kumar, S. R., Raghavan, P., Rajagopalan, S., and Tomkins, A., (1999). The Web as a graph: Measurements, models and methods, in Proceedings of the International Conference on Combinatorics and Computing, no. 1627 in Lecture Notes in Computer Science, pp. 1–18, Springer, Berlin.

30. Krapivsky, P. L. and Redner, S., (2001). Organization of growing random networks, Phys. Rev. E 63, 066123.

31. Krapivsky, P. L., Rodgers, G. J., & Redner, S., (2001). Degree distributions of growing networks. Phys. Rev. Lett., 86(23), 5401-5404.

32. Krapivsky, P. L. and Redner, S., (2002). A statistical physics perspective on Web growth, Computer Networks 39,261–276.

33. Kumar, R., Raghavan, P., Rajagopalan, S., Sivakumar, D., Tomkins, A. S., and Upfal, E., (2000). Stochastic models for the Web graph, in Proceedings of the 42st Annual IEEE Symposium on the Foundations of Computer Science, pp. 57–65, Institute of Electrical and Electronics Engineers, New York.

34. Maslov, S. and Sneppen, K., (2002). Specificity and stability in topology of protein networks, Science 296, 910–913.

35. Middendorf, M., Ziv, E., Adams, C., Hom, J., Koytcheff, R., Levovitz, C., et al. (2004). Discriminative Topological Features Reveal Biological Network Mechanisms. BMC Bioinformatics, 5, 181.

36. Milgram, S. (1967). The small world problem, Psychology To-day 2, 60–67.37. Newman, M. E. J., (2001). Clustering and preferential attachment in growing

networks, Phys. Rev. E 64, 025102.38. Newman, M. E. J., (2002). Assortative mixing in networks, Phys. Rev. Lett. 89,

208701.39. Newman, M. E. J., Forrest, S., and Balthrop, J., (2002). Email networks and the

spread of computer viruses, Phys. Rev. E 66, 035101.40. Newman, M. E. J. (2003). The Structure and Function of Complex Networks.

SIAM Review, 45(2), 167-256.41. Pastor-Satorras, R., V´azquez, A., and Vespignani, A., (2001). Dynamical and

correlation properties of the Internet, Phys. Rev. Lett. 87, 258701.42. Price, D. J. de S., (1965). Networks of scientific papers, Science 149, 510–515.43. Price, D. J. de S., (1976). A general theory of bibliometric and other cumulative

advantage processes, J. Amer. Soc. Inform. Sci. 27, 292–306.

119

Page 121: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

44. Rapoport, A., (1957). Contribution to the theory of random and biased nets, Bulletin of Mathematical Biophysics 19, 257–277.

45. Scott, J., (2000). Social Network Analysis: A Handbook, Sage Publications, London, 2nd Ed.

46. Shen-Orr, S., Milo, R., Mangan, S., & Alon, U. (2002). Network motifs in the transcriptional regulation network of Escherichia coli, Nature Genetics, 31, 64-68.

47. Simon, H. A., (1955). On a class of skew distribution functions, Biometrika 42, 425–440.

48. Strogatz, S. H., (2001). Exploring complex networks, Nature 410, 268–276.49. Tadi´c, B., (2001). Dynamics of directed graphs: The World-Wide Web, Physica

A 293, 273–284.50. Vapnik, V., (1995). The Nature of Statistical Learning Theory. NY: Springer-

Verlag.51. Vazquez, A. (2002). Knowing a network by walking on it: Emergence of scaling.

arXiv.org: cond-mat/0006132.52. Watts, D. & Strogatz, S., (1998). Collective dynamics of small-world networks,

Nature 363, 202–204.53. Wasserman, S & Faust, K., (1994). Social Network Analysis, Cambridge

University Press, Cambridge.

120

Page 122: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

The Open University of IsraelDepartment of Mathematics and Computer Science

Thesis submitted as partial fulfillment of the requirements towards an M.Sc. degree in Computer Science

The Open University of Israel Computer Science Division

ByMoshe Mazuz

Prepared under the supervision of Prof. Reuven Aviv

October 2009

121

Revealing Mechanisms in Online Learning Networks

Page 123: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

ContentAbstract..........................................................................................................................11 Introduction............................................................................................................22 Complex networks research background...............................................................5

2.1 General definitions...................................................................................52.2 Properties of networks.................................................................................6

2.2.1 Small World......................................................................................62.2.2 Transitivity or clustering.................................................................62.2.3 Degree Distribution..........................................................................82.2.4 Network resilience............................................................................92.2.5 Mixing patterns...............................................................................102.2.6 Degree correlations.........................................................................112.2.7 Community structure......................................................................112.2.8 Betweens Centrality.........................................................................12

2.3 The Random graph model..........................................................................122.3.1 Model definition.............................................................................132.3.2 The effect of connection probabily on the graph structure.............132.3.3 The Random graph model Vs Networks in real world...................142.3.4 Generalized random graphs - Configuration model ......................15

2.4 Small world model.....................................................................................152.4.1 Model properties.............................................................................16

2.5 Preferential attachment models..................................................................162.5.1 The Price model..............................................................................172.5.2 The Barabasi & Albert model.........................................................19

2.6 Vertex copying and change models.......................................................232.6.1 Attaching to edges mechanism.......................................................232.6.2 Vertex copying mechanism............................................................242.6.3 Walking on a network.....................................................................25

3 Research goal.......................................................................................................264 The database.........................................................................................................275 Network generation models.................................................................................28

5.1 Connectivity testing models – Binary models...........................................285.1.1 Directed randon graph model.........................................................285.1.2 Static preferentail attachment model..............................................295.1.3 Dynamic preferentail attachment model.........................................305.1.4 Improved Dynamic preferentail attachment model........................32

122

Page 124: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

5.1.5 Dynamic copying model.................................................................335.1.6 Small world model ( direced version )...........................................34

5.2 Weighted models....................................................................................355.2.1 Weighted directed random graph...................................................355.2.2 Weighted static preferentail attachment model..............................365.2.3 Weighted dynamic preferentail attachment model.........................365.2.4 Weighted improved dynamic preferentail attachment model.........365.2.5 Weighted static dynamic preferentail attachment model...............37

6 Methodology........................................................................................................386.1 Classifiers creation.....................................................................................386.2 Classifiers robustness check......................................................................396.3 Choosing classifiers...................................................................................396.4 Identifying the winning model...................................................................396.5 Results confidence level............................................................................40

7 Results..................................................................................................................427.1 Connectivity results...................................................................................42

7.1.1 Classifying......................................................................................427.1.2 Robustness check............................................................................467.1.3 Identifying the winning model........................................................487.1.4 Results confidence level ................................................................50

7.2 Weighted Case.......................................................................................527.2.1 Classifying......................................................................................527.2.2 Identifying the winning model........................................................557.2.3 Robustness check............................................................................577.2.4 Results confidence level.................................................................59

8 Discussion............................................................................................................619 Summary and directions for future research........................................................64Appendix A: Network representation in multi dimensional space............................66

Description...............................................................................................................66Advantages...............................................................................................................68Disadvantages..........................................................................................................68

Appendix B: Software description...............................................................................69 B.1: Attributes Creator............................................................................................69 Structure.............................................................................................................69 Running the AttributesCreator...........................................................................77 Description of the networks files.......................................................................78 Results description................................................................................................78

123

Page 125: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

B.2: Networks Classifier...........................................................................................79 Structure...............................................................................................................79 Running the NetworksClassifier..........................................................................82 Results description...............................................................................................83 B.3: Significance Finder...........................................................................................85 Structure..............................................................................................................85 Running the Significance Finder.........................................................................87 Results description..............................................................................................88References....................................................................................................................89

124

Page 126: זיהוי מנגנונים ברשתות לימוד מקוונות - Open U · Web viewאחוז ה"משולשים" ברשת. או ביתר דיוק, 3 כפול מספר המשולשים

AbstractOnline Learning Networks are used as knowledge building tool. These

networks are created by interaction between people belong to a learning

community connected through the Internet. The goal of this research is to

identify response mechanisms in these networks. We ask whether actors

choose their response partners at random or whether certain special

mechanisms are at work. In that case, we would like to discover what

mechanism is most descriptive of the networks. While previous studies

checked a few selective attributes of the networks, in this research, we

capture their rich complex feature space by mapping them into a high-

dimensional feature space. A Multi-way Support Vector Machine

algorithm is used to classify 35 observed response networks of online

learners. The networks are classified twice: first, they are classified into a

set of six representative stochastic network generation models, by using

the connectivity information only. Second, they are classified into a set of

five representative stochastic network generation models, by using the

connection weights information. The results show that in the connectivity

check, all the response networks were classified into a preferential

response model in which actors tend to respond to partners who are a-

priori equipped with response attraction power. The results were similar

when we checked the connection weights, though this time small part of

the networks where classified to other models. We provide a possible

explanation for this behavior, based on the nature and goal of the online

learning networks, and discuss ways in which the study can continue.

Parts of this work were presented at the following conferences:

1. Chais 2009: Learning in the Technological Era, Chais Conference on

Instructional Technologies Research, Open University of Israel,

February, 2009.

2. WBE 2009 - The Eighth IASTED International Conference on Web-

based Education, Phuket, Thailand, March 2009.

125