מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

Post on 08-Feb-2016

55 Views

Category:

Documents

7 Downloads

Preview:

Click to see full reader

DESCRIPTION

מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע. יורם עשת. האינטרנט: חלום הבלהות של מחפש המידע המודרני. סדר: המידע מצוי ללא סדר וארגון לוגי הֶקשר : המידע מופיע ללא הקשר רחב תוכן: המידע הנו ill defined מבחינת תחום התוכן אליו הוא שייך - מה שמקשה על החיפוש איכות: לא תמיד ברורה איכות המידע - PowerPoint PPT Presentation

TRANSCRIPT

מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

יורם עשת

האינטרנט: חלום הבלהות של מחפש המידע המודרני

המידע מצוי ללא סדר וארגון לוגיסדר:•: המידע מופיע ללא הקשר רחבֶהקשר• מבחינת תחום ill defined המידע הנו תוכן:•

התוכן אליו הוא שייך - מה שמקשה על החיפוש לא תמיד ברורה איכות המידעאיכות:•אין קנוניזציה של הידעידע: •

בהרצאה אדון בשלושה נושאים:במאפייני החיפוש בעשור שחלומגמות השינוי •

האחרון הנדרשות ממחפשי הרשתמיומנויות• בחסות מידע חופשי אינדוקטרינציה•

בתור פתיח: הבה נתבונן במחפשי מידע מלפני עשר שנים )כמעט(

Nachmias & Gilad (2002). Needle in the hyperstack: Searching information in the Web

האתגר: למצוא פריטים באינטרנטתמונת מונה ליזה-הספר דויד קופרפילד-מרשם לעוגת תפוחים עם תמונה-

התוצאות כללי:

הצליחו בכל המטלות15%רק • מהשלוש. 2 הצליחו ב- 39%• הצליחו רק באחת מהמטלות. 40%• לא הצליחו באף אחת.6%•

זמן חיפוש )ממוצע( ד' חיפוש כושל20 ד' חיפוש מוצלח. 12•

אסטרטגיות חיפוש31%כתיבת מילת מפתח בודדת: ••Browsing :25% בקטלוגים וספריות14%חיפוש מורכב )שימוש ביותר ממילת מפתח אחת: •0.3%חיפוש בוליאני: •

מחקרון משווה שערכתי לקראת ההרצאה

סטודנטים10•משימות זהות•לא נבחנו אסטרטגיות ונמדדו זמנים•

תוצאות הצלחה100%•ביצוע תוך פחות מחמש דקות•שימוש במילת מפתח אחת•אסטרטגיה מובילה: גוגל + שימוש באופציה "תמונות•

מה התרחש בעשור האחרון באוטוסטרדת המידע?

חדירת האינטרנט •צמיחה בקצב ייצור המידע•שיפור ביצועים במחשבים•שיפור ביצועים במנועי החיפוש•

חדירת האינטרנט חדירה לרוב הבתים והארגונים•חיפוש מידע הפך לפעילות אנושית טריויאלית• 70%למעלה ממחצית הגולשים המבוגרים בארה"ב מעבירים •

מהזמן בחיפוש מידע. מהגולשים תלמידי התיכון בישראל נעזרים באינטרנט 90%•

לחיפוש מידע.

"התפוצצות" בכמות המידע

האצה בקצב הכפלת המידע

יום7650

,Sweeney)גידול בנפח האחסון לנפש 2001)

(Chatell, 2007)שיפור ביצועים במחשבים

מנועי חיפוש: שתי מגמות שיפור ביצועים

מתחביר לסמנטיקהמכאוס לסדר

מתחביר לסמנטיקה

מנועים ראשונים: נדרש ידע תחבירי

עומס קוגניטיבי גבוה•זכירת תחביר כתיבת מחרוזות•הבנת לוגיקה בוליאנית•

1990s נסיונות ראשונים בעיצוב סביבת חיפוש :אינטואיטיבית

נחסך הצורך בזכירה תחבירית•עדיין נדרשת הבנת הלוגיקה הבוליאנית•

ממשקים עכשויים: לצקת לחיפוש סמנטיקה מלאה

מכאוס לסדר

מסתם רשימה אקראית לדירוג לפי מידת רלונטיות

משמעות השינויים שראינו לעיל: הצפת המחפשים במידע

יותר אנשים מוצאים יותר עליה בכמות ממצאי החיפוש: •(.Hobs, 2006 )1000מידע )הסיכוי למצוא מידע כלשהו עלה פי

האיכות הממוצעת של מידע ירדה ירידה באיכות המידע: •(80% - בלמעלה מ- Brand-Guell, 2008באופן דרמטי )לפי

רוב ממצאי החיפוש אינם מספיק רלונטים ירידה ברלונטיות: •(Hobs, 2006)

Filter-feeding האסטרטגיה המנצחת :בעידן של היצף

אם פעם היה האתגר למצוא משהו, כעת האתגר הוא לסנן החוצה את הגודש, שרובו אינו רלונטי או אינו אמין.

מיומנויות סינון: מיומנויות הישרדות בעידן המידע

סינון מידע מוטעה, מניפולטיבי ושקרי חשיבה ביקורתית:•בכדי להישאר עם המידע האמין

יישום קריטריונים של איכות•כיצד מנותחת המידע ע"י המנוע? הבנת מגבלות החיפוש: •יכולות הבניית ידע•

מיומנויות סינון: חשיבה ביקורתית בתנאי היצף

הבעיה: באיזו מידה אנו מסוגלים לקריאה ביקורתית של מידע מניפולטיבי?

International Business Times, May, 19th, 2007

נמצאה ירידה לאורך שנים בחשיבה ביקורתית(Eshet & Chajut, 2007)

האם תרבות של טיפשים בעידן של ידע חופשי?

מיומנויות סינון: הבנת מגבלות התישאול

מיומנויות סינון: הבנת מגבלות התשאול הסדר לעיתים דווקא קובע

מיומנויות סינון: יישום קריטריונים של איכות

(reliabilityאמינות )•(usabilityשמישות )•verifiabilityאימּות )•

, רוב המחפשים אינם Brand-Gruwel, 2008לפי מיישמים קריטריונים של איכות בחיפוש

מהם הקריטריונים לזיהוי אתר המוקדש לסילוף?

מיומנויות סינון: יכולת הבניית ידע

מסנן המידע האנושי: מה סיכוייו לשרוד באוטוסטרדה?

קוים לדמותו של מחפש המידע העכשוי מתוך המחקר:

ההיטים הראשונים10בוחר מבין •מסתפק בחיפוש פשוט•אינו מייחס משמעות לאופן ניסוח השאילתא•אינו מנסה ניסוח שאילתא אלטרנטיבית•מייחס ערך מוחלט לתוצאות החיפוש •אינו מיישם קריטריונים של איכות•מייחס ערך גבוה לעיצוב המידע •

אינדוקטרינציה בעזרת מידע חופשי

נעשתה לאדם אינדוקטרינציה בניגוד 1984"בספר לרצונו, ואילו בעידן המודרני, האדם מקבלה על

עצמו ברצון".(, "ברוכים הבאים למדבר של הממשי"2002סלבוי ז'יז'ק )

על כוחו של מידע בתנאי אי-ודאות

לפי תיאוריית האינפורמציה, מידע מוגדר ככל גירוי המצמצם •אי-ודאות

המידע אליו אנו נחשפים, מהווה המכשיר העיקרי שלנו •בצמצום אי-ודאות ובקביעת ידע ועמדות כלפי נושאים שונים.

כלומר: כמות וסוגי הידע אליהם ניחשף, משפיעים על העמדות •שנאמץ.

העולם לפי שטיינברג: האדם קרוב אצל עצמו

אנו נוטים לגבש ידע ועמדות מתוך מה שמוכר וקרוב לנו

האם הרוב קובע?הידע כפונקציה של כמות ההמידע הזמין בשפתנו

פרויקט העתקת ספריית הקונגרס לאינטרנט"הפצצת" האינטרנט במקורות מידע המציגים בעיקר

פרספקטיבה אחת, תגרום להטיית הידע הזמין לכיוון .פרו-אמריקאי

מחט בערימת שחת: ידע כפונקציה של כמות (Ruger, 2008)מעובד מתוך המידע הזמין

אבל הידע שלנו תלוי במידה רבה גם בעיקר במה שמאפשרים לנו למצוא בחיפוש

או:מה מאפשרים לנו למצוא בחיפוש, האם יש דבר כזה "חיפוש טהור"?

)don’t be evil?Elinor Mills, 2006 )Cnetומה בדבר סיסמת גוגל

מישהו מחליט בשבילך מי אתה•Enteen 2008:

( מכיל בראש הרשימה הגדרות רציניות של google.com בגוגל ארה"ב )gayחיפוש המונח –המונח ואתרים על חיי גייז. המחפש מזוהה כמי שמבקש ללמוד על גייז או לפגוש גייז. אם

, נקבל אתרים על שירותי מין+ המחפש מזוהה כצרכן שירותי מיןthailandנכתוב גם (, המחפש מזוהה כצרכן המחפש שירותי מין ומקבל co.th בגוגל תאילנד )gayבחיפוש –

בעיקר אתרים המספקים שירותים אלה.

האח הגדול והכיס הקטן )שלי(

לסיכוםשיפור מנועי החיפוש והגדלת כמות המידע •

הובילו לגידול בכמות המידע שמוצאים מחפשיםהגידול, לצד הירידה באיכות המידע הזמין •

ברשת, מחייבים שליטה במיומנויות סינון מידע.סינון יעיל של מידע מאפשר לגולש לגבש מידע •

אמין ולהתגונן מפני אפקטים של אינדוקטרינציה בעזרת מידע חופשי.

בתקווה שתצאו מכאן עם כמה מחשבות מקוריות

תודה

top related