משוב ושיתופיות במנועי חיפוש relevance feedback and social filtering...

Post on 21-Dec-2015

238 Views

Category:

Documents

6 Downloads

Preview:

Click to see full reader

TRANSCRIPT

משוב ושיתופיות במנועי חיפושמשוב ושיתופיות במנועי חיפושRelevance feedback and social Relevance feedback and social

filteringfiltering

יהודית בר אילן

לימודי מידע, אוניברסיטת בר-אילן

בי"ס לספרנות, האוניברסיטה העברית

ניסוח המידע בשפה טבעית

Index

Collections

Rank

Query

בעיית מידעחיפוש מידעחיפוש מידע

אי ודאות בתהליך האחזוראי ודאות בתהליך האחזור

מה בדיוק בעיית •המידע?

כיצד לתרגם •אותה לשאילתה

המתאימה למערכת?

איזה סוג מידע •ניתן בכלל לקבל

מהמערכת?

...... קשה לנסח שאילתות, אבלקשה לנסח שאילתות, אבל

קל יותר לזהות מידע שימושי •)רלוונטי( עבור הבעייה כאשר

המידע מוצג בפנינוכיצד נשיג מידע כזה?•

על ידי שאילתה ראשונית על הנושא–

כיצד ממשיכים הלאה?•על ידי שינוי השאילתה–תהליך זה נקרא–

•Query modification•Relevance feedback

תהליך כזה נעשה באופן טבעי ע"י תהליך כזה נעשה באופן טבעי ע"י המשתמשיםהמשתמשים

דוגמה: שאלה מהמוקדמות •2005של אליפות החיפוש

מה תפקידו הנוכחי וכתובת •מקום עבודתו של חוקר

? Andrei Broderהאינטרנט

של אחד logנעקוב אחרי ה •המתחרים

:10תוצאה מספר

Answer: IBM ResearchAnswer: IBM Research

A more successful query would have been:A more successful query would have been:

Berrypicking – Marcia BatesBerrypicking – Marcia Bates

Relevance Feedback Relevance Feedback ArchitectureArchitecture

RankingsIR

System

Documentcorpus

RankedDocuments

1. Doc1 2. Doc2 3. Doc3 . .

1. Doc1 2. Doc2 3. Doc3 . .

Feedback

Query String

Revised

Query

ReRankedDocuments

1. Doc2 2. Doc4 3. Doc5 . .

QueryReformulation

From: www.cs.utexas.edu/users/ mooney/ir-course/slides/QueryOps.ppt

Relevance FeedbackRelevance Feedback

הרעיון המרכזי הוא לשנות את השאילתה •המקורית כתוצאה משיפוטי המשתמש

מצא מונחים מרכזיים במסמכים שצוינו כטובים –והוסף אותם לשאילתה

תן משקלות חדשים למונחים המקוריים–זרוק מונחים שנמצאים רק במסמכים בלתי –

רלוונטיים

גם בשלב זה ניתן להתייעץ עם המשתמש •ולהציע לו רשימה של מונחים להוספה/השמטה

נראה מספר דוגמאות•

Cortina - http://sobel.ece.ucsb.edu/Cortina - http://sobel.ece.ucsb.edu/

Relevance feedback: two maps markedRelevance feedback: two maps marked

Direct search: Jerusalem mapDirect search: Jerusalem map

related:www.infoplease.com/ce6/world/A0811353.htmlrelated:www.infoplease.com/ce6/world/A0811353.html

סיכום בינייםסיכום בינייםמחקרים מראים ששיטות •

משוב משפרות את איכות Koennemanהאחזור )למשל & Belkin 1996)

הבעיה היא שלמשתמשים אין •סבלנות

לכן גם כלי החיפוש מזניחים •את הכיוון הזה

פתרון אפשרי: משוב ללא •מעורבות המשתמש

Pseudo Feedback Architecture

RankingsIR

System

Documentcorpus

RankedDocuments

1. Doc1 2. Doc2 3. Doc3 . .

Query String

Revised

Query

ReRankedDocuments

1. Doc1 2. Doc2 3. Doc4 . .

QueryReformulation

1. Doc1 2. Doc2 3. Doc3 . .

PseudoFeedbac

k

Collaborative/social filteringCollaborative/social filtering

שיפור האחזור באופן אוטומטי על סמך המסמכים •המוחזרים הראשונים, מניח מראש שהמסמכים

הראשונים רלוונטיים לחיפושרעיון אחר הוא לנסות למצוא אנשים בעלי טעם דומה •

לשלנוהנחה בסיסית: אני אוהב את מה שהם אוהבים–ניתן לשאול את המשתמשים על דעותיהם–ניתן להסתפק רק במעקב אחר פעילויותיהם –

Collaborative Filtering (Social Filtering)Collaborative Filtering (Social Filtering)

• If Pam liked the paper, I’ll like the paper• If you liked Star Wars, you’ll like

Independence Day• Rating based on ratings of similar people

– Ignores the text, so works on text, sound, pictures, etc.

Sally Bob Chris Lynn KarenStar Wars 7 7 3 4 7Jurassic Park 6 4 7 4 4Terminator II 3 4 7 6 3Independence Day 7 7 2 2 ?

http://www.sims.berkeley.edu/academics/courses/is202/f04/

Example:Ringo Collaborative Filtering for MusicExample:Ringo Collaborative Filtering for Musicמשתמשים במערכת מדרגים •

מוסיקה – 1 = detest – 4 = ambivalent– 7 = can’t live without

מהדירוגים הנ"ל מרכיבים פרופיל •המשתמש )דינאמי(

המערכת מחשבת דמיון בין •הפרופילים

לצורך המלצה, מתחשבת •בפרופילים הדומים בלבד

כאשר משתמש חדש מצטרף • 125למערכת הוא מתבקש לדרג

אומנים רינגו הייתה אחת המערכות •

הראשונות )מערכת ניסיונית(, Alexlit.comאינה פעילה יותר.

פועלת בשיטה דומה

Social FilteringSocial Filteringסינון חברתי מתעלמת מהתכנים, ומתבססת •

רק על משתמשים בעלי "טעם" דומהמתאים במיוחד למוסיקה, סרטים, ספרי קריאה–

ישנן מערכות המצליחות לפעול גם ללא שיפוט •פעיל באמצעות מעקב אחר פעילויות

המשתמשים במערכת

סיכוםסיכוםניתן להשתמש בשיטות •

משוב וסינון כדי לבנות מערכות פרסונליזציה

כל מידע הקשור –למשתמש ולטעמו יכול

לעזור

בכל השיטות המטרה •היא לשפר את חווית

userהשימוש -experience

top related