Transcript
Page 1: Collaborative Filtering.. für automatische Empfehlungen

   

1

Page 2: Collaborative Filtering.. für automatische Empfehlungen

   

2

Page 3: Collaborative Filtering.. für automatische Empfehlungen

   

3Definition

● Collaborative Filtering schneidet Informationen automatisch auf den Betrachter zu

● Zeit der Informationsbeschaffung wächst im Alltag durch Menge verfügbarer Informationen

● Aussagen basieren auf Wissen über Ähnlichkeit zwischen Benutzern oder zwischen Items

● Genutzt zur Minimierung ungewollter oder zur Empfehlung neuer Items

Page 4: Collaborative Filtering.. für automatische Empfehlungen

   

4Informationsfilter

Page 5: Collaborative Filtering.. für automatische Empfehlungen

   

5Aggregation

Page 6: Collaborative Filtering.. für automatische Empfehlungen

   

6Funktionsweise

Page 7: Collaborative Filtering.. für automatische Empfehlungen

   

7Aggregation

● Aggregieren   Daten sammeln≈

● Explizit durch Abgabe einer Bewertung

– zum Beispiel durch Sterneleiste– Mehraufwand für Anwender

● Implizit durch Kauf oder Weblog

– Komfortabel für Benutzer– Vertrauen in System? Transparenz?

AggregationKorrelationEmpfehlung

Page 8: Collaborative Filtering.. für automatische Empfehlungen

   

8Korrelation

● Korrelation   ≈ Beziehung zwischen Präferenzen● Amazon Paradigma: „Ähnliche Produkte“

AggregationKorrelationEmpfehlung

Page 9: Collaborative Filtering.. für automatische Empfehlungen

   

9Korrelation

AggregationKorrelationEmpfehlung

Page 10: Collaborative Filtering.. für automatische Empfehlungen

   

10Korrelation

AggregationKorrelationEmpfehlung

Page 11: Collaborative Filtering.. für automatische Empfehlungen

   

11Korrelation

AggregationKorrelationEmpfehlung

Page 12: Collaborative Filtering.. für automatische Empfehlungen

   

12Empfehlungen

AggregationKorrelationEmpfehlung

Page 13: Collaborative Filtering.. für automatische Empfehlungen

   

13Empfehlungen

AggregationKorrelationEmpfehlung

Page 14: Collaborative Filtering.. für automatische Empfehlungen

   

14Empfehlungen

AggregationKorrelationEmpfehlung

Page 15: Collaborative Filtering.. für automatische Empfehlungen

   

15Modellierung

● Grundsätzliche Unterscheidung:●  Memory Based: Alle Bewertungen live●  Model Based: Verschiedene Abstraktionen

●  Clusterverfahren●  Singulärwertzerlegung (SVD)

● Vergleich verschiedener Ansätze durch   Prognosefehler

Page 16: Collaborative Filtering.. für automatische Empfehlungen

   

16Model Based CF

● Clusterverfahren● K­Means = „partitionierendes Verfahren“

1) Clusterzentren werden zufällig platziert2) Bei jeder Iteration werden sie verschoben

Page 17: Collaborative Filtering.. für automatische Empfehlungen

   

17Model Based CF

● Singulärwertzerlegung

1) Zerlegung in 3 spezielle Matrizen

2) Ränge eliminieren

„S“ Matrix als Gewichtung absteigend sortiert

Page 18: Collaborative Filtering.. für automatische Empfehlungen

   

18Model Based CF

● Singulärwertzerlegung

Page 19: Collaborative Filtering.. für automatische Empfehlungen

   

19

Page 20: Collaborative Filtering.. für automatische Empfehlungen

   

20Normierung

● Mehrzahl der Bewertungen orientieren sich am Durchschnitt

● Normierung = Näherung an Durchschnittswerte

– Benutzerdurchschnitt (+6.6% Optimierung)– Itemdurchschnitt (+6.8 % Optimierung)– usw...

Page 21: Collaborative Filtering.. für automatische Empfehlungen

   

21Nachbarschaft

● weniger Nachbarn = weniger Verschwimmen● Auswahl nach Mindestähnlichkeit oder Grenze

Quelle: HERL02, 235

Page 22: Collaborative Filtering.. für automatische Empfehlungen

   

22Nachbarschaft

● Bestes Resultat: Sortierte Liste mit Limit=60

Page 23: Collaborative Filtering.. für automatische Empfehlungen

   

23Varianz

Item Varianz (­0.4%)● hohe Kontroverse = 

hohe Aussage

Benutzer Varianz (+0.7%)● hohe Varianz einer 

Bewertung = ...

a) hohe Aussage?

b) Manipulation?

Page 24: Collaborative Filtering.. für automatische Empfehlungen

   

24Cross Domain

● Korrelation einer Domain (z.B. „News“) nutzen, um in anderer Domain (z.B. „Sport“) Empfehlungen zu geben

● Zentrale Plattform im Hintergrund● Domains besitzen getrennte Items● Überschneidungen nur bei Benutzern● Konfiguration je Domain möglich (z.B. Zeitlimit)

Page 25: Collaborative Filtering.. für automatische Empfehlungen

   

25Cross Domain

Page 26: Collaborative Filtering.. für automatische Empfehlungen

   

26Schlussbetrachtung

● plista!

BASIS

Test am MovieLens Datensatz [ML]

Normierung auf Schnittmenge

Limit auf 60 Nachbarn Vektoren

Distanz

Normierung an Skala

Nischenproduktezur Usersim

Anzahl gemeinsamerBewertungen als Faktor

● Normierung auf Schnittmenge● Limit auf 60 Nachbarn● Anzahl gemeinsamer Bewertungen als Auswahl

Page 27: Collaborative Filtering.. für automatische Empfehlungen

   

27Quellen

● [HERL02] Jonathan L. Herlocker, Joseph A. Konstan, Al Borchers, John Riedl, 1999, http://portal.acm.org/citation.cfm?id=312624.312682

● [ML] MovieLens­Projekt, Universität Minnesota (USA), Datensatz mit 1 Mio Bewertungen, http://www.movielens.org (Stand 12.09.2008)

● [BELL2] Robert M. Bell and Yehuda Koren, 2007, http://www.cs.uic. edu/liub/KDD­cup2007/proceedings/Neighbor­Koren.pdf

● [RESNICK] P. Resnick, N. Iacovou, M. Suchak, P. Bergstrom, J. Riedl An Open Architecture for Collaborative Filtering of Netnews, 1994

● [BREESE] John S. Breese, David Heckerman, Carl Kadie, 1998, http://research.microsoft.com/research/pubs/view.aspx?tr_id=166  (Stand: 29.09.2008)


Top Related