מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

48
ךךךךךך ךךךךךך: ךךךךך ךךךךךךךך ךךךךךךךך ךךךךך ךךךך ךךך

Upload: ranae

Post on 08-Feb-2016

55 views

Category:

Documents


7 download

DESCRIPTION

מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע. יורם עשת. האינטרנט: חלום הבלהות של מחפש המידע המודרני. סדר: המידע מצוי ללא סדר וארגון לוגי הֶקשר : המידע מופיע ללא הקשר רחב תוכן: המידע הנו ill defined מבחינת תחום התוכן אליו הוא שייך - מה שמקשה על החיפוש איכות: לא תמיד ברורה איכות המידע - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

יורם עשת

Page 2: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

האינטרנט: חלום הבלהות של מחפש המידע המודרני

המידע מצוי ללא סדר וארגון לוגיסדר:•: המידע מופיע ללא הקשר רחבֶהקשר• מבחינת תחום ill defined המידע הנו תוכן:•

התוכן אליו הוא שייך - מה שמקשה על החיפוש לא תמיד ברורה איכות המידעאיכות:•אין קנוניזציה של הידעידע: •

Page 3: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

בהרצאה אדון בשלושה נושאים:במאפייני החיפוש בעשור שחלומגמות השינוי •

האחרון הנדרשות ממחפשי הרשתמיומנויות• בחסות מידע חופשי אינדוקטרינציה•

Page 4: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

בתור פתיח: הבה נתבונן במחפשי מידע מלפני עשר שנים )כמעט(

Nachmias & Gilad (2002). Needle in the hyperstack: Searching information in the Web

Page 5: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

האתגר: למצוא פריטים באינטרנטתמונת מונה ליזה-הספר דויד קופרפילד-מרשם לעוגת תפוחים עם תמונה-

Page 6: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

התוצאות כללי:

הצליחו בכל המטלות15%רק • מהשלוש. 2 הצליחו ב- 39%• הצליחו רק באחת מהמטלות. 40%• לא הצליחו באף אחת.6%•

זמן חיפוש )ממוצע( ד' חיפוש כושל20 ד' חיפוש מוצלח. 12•

אסטרטגיות חיפוש31%כתיבת מילת מפתח בודדת: ••Browsing :25% בקטלוגים וספריות14%חיפוש מורכב )שימוש ביותר ממילת מפתח אחת: •0.3%חיפוש בוליאני: •

Page 7: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מחקרון משווה שערכתי לקראת ההרצאה

סטודנטים10•משימות זהות•לא נבחנו אסטרטגיות ונמדדו זמנים•

Page 8: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

תוצאות הצלחה100%•ביצוע תוך פחות מחמש דקות•שימוש במילת מפתח אחת•אסטרטגיה מובילה: גוגל + שימוש באופציה "תמונות•

Page 9: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מה התרחש בעשור האחרון באוטוסטרדת המידע?

חדירת האינטרנט •צמיחה בקצב ייצור המידע•שיפור ביצועים במחשבים•שיפור ביצועים במנועי החיפוש•

Page 10: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

חדירת האינטרנט חדירה לרוב הבתים והארגונים•חיפוש מידע הפך לפעילות אנושית טריויאלית• 70%למעלה ממחצית הגולשים המבוגרים בארה"ב מעבירים •

מהזמן בחיפוש מידע. מהגולשים תלמידי התיכון בישראל נעזרים באינטרנט 90%•

לחיפוש מידע.

Page 11: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

"התפוצצות" בכמות המידע

Page 12: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

האצה בקצב הכפלת המידע

יום7650

Page 13: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

,Sweeney)גידול בנפח האחסון לנפש 2001)

Page 14: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

(Chatell, 2007)שיפור ביצועים במחשבים

Page 15: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מנועי חיפוש: שתי מגמות שיפור ביצועים

מתחביר לסמנטיקהמכאוס לסדר

Page 16: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מתחביר לסמנטיקה

Page 17: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מנועים ראשונים: נדרש ידע תחבירי

עומס קוגניטיבי גבוה•זכירת תחביר כתיבת מחרוזות•הבנת לוגיקה בוליאנית•

Page 18: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

1990s נסיונות ראשונים בעיצוב סביבת חיפוש :אינטואיטיבית

נחסך הצורך בזכירה תחבירית•עדיין נדרשת הבנת הלוגיקה הבוליאנית•

Page 19: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

ממשקים עכשויים: לצקת לחיפוש סמנטיקה מלאה

Page 20: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מכאוס לסדר

Page 21: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מסתם רשימה אקראית לדירוג לפי מידת רלונטיות

Page 23: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

משמעות השינויים שראינו לעיל: הצפת המחפשים במידע

יותר אנשים מוצאים יותר עליה בכמות ממצאי החיפוש: •(.Hobs, 2006 )1000מידע )הסיכוי למצוא מידע כלשהו עלה פי

האיכות הממוצעת של מידע ירדה ירידה באיכות המידע: •(80% - בלמעלה מ- Brand-Guell, 2008באופן דרמטי )לפי

רוב ממצאי החיפוש אינם מספיק רלונטים ירידה ברלונטיות: •(Hobs, 2006)

Page 24: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

Filter-feeding האסטרטגיה המנצחת :בעידן של היצף

אם פעם היה האתגר למצוא משהו, כעת האתגר הוא לסנן החוצה את הגודש, שרובו אינו רלונטי או אינו אמין.

Page 25: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מיומנויות סינון: מיומנויות הישרדות בעידן המידע

סינון מידע מוטעה, מניפולטיבי ושקרי חשיבה ביקורתית:•בכדי להישאר עם המידע האמין

יישום קריטריונים של איכות•כיצד מנותחת המידע ע"י המנוע? הבנת מגבלות החיפוש: •יכולות הבניית ידע•

Page 26: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מיומנויות סינון: חשיבה ביקורתית בתנאי היצף

Page 27: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

הבעיה: באיזו מידה אנו מסוגלים לקריאה ביקורתית של מידע מניפולטיבי?

Page 28: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

International Business Times, May, 19th, 2007

Page 29: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

נמצאה ירידה לאורך שנים בחשיבה ביקורתית(Eshet & Chajut, 2007)

Page 30: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

האם תרבות של טיפשים בעידן של ידע חופשי?

Page 31: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מיומנויות סינון: הבנת מגבלות התישאול

Page 32: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מיומנויות סינון: הבנת מגבלות התשאול הסדר לעיתים דווקא קובע

Page 33: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע
Page 34: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מיומנויות סינון: יישום קריטריונים של איכות

(reliabilityאמינות )•(usabilityשמישות )•verifiabilityאימּות )•

, רוב המחפשים אינם Brand-Gruwel, 2008לפי מיישמים קריטריונים של איכות בחיפוש

Page 35: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מהם הקריטריונים לזיהוי אתר המוקדש לסילוף?

Page 36: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מיומנויות סינון: יכולת הבניית ידע

Page 37: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מסנן המידע האנושי: מה סיכוייו לשרוד באוטוסטרדה?

קוים לדמותו של מחפש המידע העכשוי מתוך המחקר:

ההיטים הראשונים10בוחר מבין •מסתפק בחיפוש פשוט•אינו מייחס משמעות לאופן ניסוח השאילתא•אינו מנסה ניסוח שאילתא אלטרנטיבית•מייחס ערך מוחלט לתוצאות החיפוש •אינו מיישם קריטריונים של איכות•מייחס ערך גבוה לעיצוב המידע •

Page 38: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

אינדוקטרינציה בעזרת מידע חופשי

נעשתה לאדם אינדוקטרינציה בניגוד 1984"בספר לרצונו, ואילו בעידן המודרני, האדם מקבלה על

עצמו ברצון".(, "ברוכים הבאים למדבר של הממשי"2002סלבוי ז'יז'ק )

Page 39: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

על כוחו של מידע בתנאי אי-ודאות

לפי תיאוריית האינפורמציה, מידע מוגדר ככל גירוי המצמצם •אי-ודאות

המידע אליו אנו נחשפים, מהווה המכשיר העיקרי שלנו •בצמצום אי-ודאות ובקביעת ידע ועמדות כלפי נושאים שונים.

כלומר: כמות וסוגי הידע אליהם ניחשף, משפיעים על העמדות •שנאמץ.

Page 40: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

העולם לפי שטיינברג: האדם קרוב אצל עצמו

אנו נוטים לגבש ידע ועמדות מתוך מה שמוכר וקרוב לנו

Page 41: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

האם הרוב קובע?הידע כפונקציה של כמות ההמידע הזמין בשפתנו

פרויקט העתקת ספריית הקונגרס לאינטרנט"הפצצת" האינטרנט במקורות מידע המציגים בעיקר

פרספקטיבה אחת, תגרום להטיית הידע הזמין לכיוון .פרו-אמריקאי

Page 42: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מחט בערימת שחת: ידע כפונקציה של כמות (Ruger, 2008)מעובד מתוך המידע הזמין

Page 43: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

אבל הידע שלנו תלוי במידה רבה גם בעיקר במה שמאפשרים לנו למצוא בחיפוש

Page 44: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

או:מה מאפשרים לנו למצוא בחיפוש, האם יש דבר כזה "חיפוש טהור"?

)don’t be evil?Elinor Mills, 2006 )Cnetומה בדבר סיסמת גוגל

Page 45: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מישהו מחליט בשבילך מי אתה•Enteen 2008:

( מכיל בראש הרשימה הגדרות רציניות של google.com בגוגל ארה"ב )gayחיפוש המונח –המונח ואתרים על חיי גייז. המחפש מזוהה כמי שמבקש ללמוד על גייז או לפגוש גייז. אם

, נקבל אתרים על שירותי מין+ המחפש מזוהה כצרכן שירותי מיןthailandנכתוב גם (, המחפש מזוהה כצרכן המחפש שירותי מין ומקבל co.th בגוגל תאילנד )gayבחיפוש –

בעיקר אתרים המספקים שירותים אלה.

Page 46: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

האח הגדול והכיס הקטן )שלי(

Page 47: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

לסיכוםשיפור מנועי החיפוש והגדלת כמות המידע •

הובילו לגידול בכמות המידע שמוצאים מחפשיםהגידול, לצד הירידה באיכות המידע הזמין •

ברשת, מחייבים שליטה במיומנויות סינון מידע.סינון יעיל של מידע מאפשר לגולש לגבש מידע •

אמין ולהתגונן מפני אפקטים של אינדוקטרינציה בעזרת מידע חופשי.

Page 48: מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

בתקווה שתצאו מכאן עם כמה מחשבות מקוריות

תודה