evaluación e integración de toma de decisiones en los...

Post on 09-Oct-2020

0 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Evaluación e Integración de Toma de Decisiones en Sistemas de Recomendación

Autor: Rus María Mesas Jávega Tutor: Alejandro Bellogín Kouki

Índice

Introducción

Estado del Arte

Evaluación de Algoritmos que Toman Decisiones

Experimentos y Resultados

Conclusiones y Trabajo Futuro

Toma de Decisiones en Algoritmos de Recomendación

2

1. Introducción - Motivación

Interacciones Pasadas de los Usuarios

Recomendaciones

Sistema de Recomendación

3

1. Introducción - Hipótesis

4

Es mejor no recomendar que fallar

1. Introducción - Objetivos

Introducir la toma de decisión en algoritmos de recomendación

Analizar cómo influye la toma de decisión en diferentes dimensiones

Estudiar cómo evaluar los nuevos sistemas y proponer nuevas métricas

1

2

3

5

2. Estado del Arte

Sistemas de Recomendación

Filtrado Colaborativo

Basado en Contenido

Híbridos

K Vecinos Próximos

Factorización de Matrices

Basado en Usuarios

Variational Bayesian

6

2. Estado del Arte – Evaluación

Sistema de Recomendación

Precisión

Cobertura

Diversidad Novedad

Serendipia

Confianza

Eficiencia Robustez

7

3. Toma de Decisión en Algoritmos de Recomendación

Estimaciones

Interacciones Pasadas de los Usuarios

Estimaciones

Sistema de Recomendación

8

3. Toma de Decisión en Algoritmos de Recomendación

Taxonomía de Técnicas de Toma de Decisión

Independiente del Modelo

Según el Soporte de la Predicción

Según la Incertidumbre de la Predicción

KNN Basado en Usuarios

KNN Basado en Usuarios

Variational Bayesian

9

3. Toma de Decisión en Algoritmos de Recomendación

Independiente del modelo

IDEA: Recomendar ítem cuyo valor de rating sea mayor que un umbral

Aplicable a cualquier algoritmo de recomendación

Estimación

10

3. Toma de Decisión en Algoritmos de Recomendación

Según el Soporte de la Predicción IDEA: Cuantas más opiniones se conocen sobre un ítem más confianza genera la estimación final

Aplicable a KNN

¿El ítem ha sido votado por al menos n de los k

vecinos del usuario?

Estimación aplicando KNN

basado en usuarios

11

3. Toma de Decisión en Algoritmos de Recomendación

Según la Incertidumbre IDEA: La desviación típica es sinónimo de incertidumbre. A mayor desviación típica mayor incertidumbre en la estimación y menor confianza en ella.

Aplicable algoritmo que proporcionan fórmula para σ

Estimación

12

3. Toma de Decisión en Algoritmos de Recomendación

Según la Incertidumbre

K Vecinos Próximos (KNN)

Variational Bayesian

Media Ponderada

13

Toma de Decisión

2,5 3,1 4, 5

4,5 3,1 3, 5

4,1 2,1 3, 7 4,1 3,7

Lista Recomendación @2

3,5

4. Evaluación de Algoritmos que Toman Decisiones

Precisión vs Cobertura

HIPÓTESIS:

Integración Toma de Decisión

PRECISIÓN

COBERTURA

P@N

USC

Usuario sin recomendación

Usuario lista incompleta

Usuario lista completa

4. Evaluación de Algoritmos que Toman Decisiones

Precisión vs Cobertura

Combinar P@N y USC

F-score:

G-score: 15

HIPÓTESIS:

Integración Toma de Decisión

PRECISIÓN

COBERTURA

P@N

USC

4. Evaluación de Algoritmos que Toman Decisiones

Métricas Correctness IDEA: Crear una métrica que premie no recomendar a fallar

P@N = TP/N NR/N

P@N

R@N

Para la lista de recomendación de cada usuario calculamos:

16

4. Evaluación de Algoritmos que Toman Decisiones

Métricas Correctness IDEA: Aplicar la misma idea pero desde el punto de vista de ítem

Para cada ítem calculamos: TP/|U| NR/|U|

17

5. Experimentos y Resultados - Implementación

RankSys

Rival RankSys

Implementación Evaluación

Implementación Algoritmos

Modificaciones KNN

Implementación completa y modificaciones Variational Bayesian

18

5. Experimentos y Resultados - Datasets

943 1,7K 100K 1,33% [1, 5] ML100K

6,0K 3,9K 1M 4,26% [1, 5] ML1M

59,1K 150 1,7M 1,33% [-10, 10] Jester

Dataset Usuarios Ítems Ratings Densidad Rango

Se han utilizado diferentes conjuntos de distintos dominios para poder obtener conclusiones consistentes de los algoritmos sin depender del conjunto que se haya usado

19

5. Experimentos y Resultados

20

Experimentos realizados

Independiente del Modelo

Según el Soporte de la Predicción

Según la Incertidumbre de la Predicción

KNN Basado en Usuarios

KNN Basado en Usuarios

Variational Bayesian

KNN Basado en Usuarios

Variational Bayesian

5. Experimentos y Resultados

Según la incertidumbre de la predicción Variational Bayesian

Precisión vs Cobertura de Usuario

21

Estimación

5. Experimentos y Resultados Según la incertidumbre de la predicción Variational Bayesian

Detalle evaluación ML100K

Mejora del 250%

22

5. Experimentos y Resultados Según la incertidumbre de la predicción Variational Bayesian

Novedad y Diversidad

23

5. Experimentos y Resultados Según la incertidumbre de la predicción Variational Bayesian

24

Var

iati

on

al B

ayes

ian

K

Vec

ino

s P

róxi

mo

s

25

5. Experimentos y Resultados Según el soporte de la predicción (KNN)

Precisión vs Cobertura de Usuario

26

¿El ítem ha sido votado por al menos n de los k vecinos del

usuario?

Estimación

5. Experimentos y Resultados Según el soporte de la predicción (KNN)

Mejora del 562%

27

5. Experimentos y Resultados Según el soporte de la predicción (KNN)

Novedad y Diversidad

28

6. Conclusiones y Trabajo Futuro

Propuesta de taxonomía de técnicas para incorporar la toma de decisión. Con mejoras en P@N de hasta el 560% disminuyendo cobertura, novedad y diversidad.

Propuesta de cómo combinar P@10 y USC a través de métricas parametrizables.

Creación de métricas Correctness: UC, RUC, IC y RIC. Métricas que premian no contestar frente a fallar y que no necesitan parametrización

29

6. Conclusiones y Trabajo Futuro

Ampliar experimentos con nuevos datasets y métricas

Estudiar nuevas formas de incorporar la toma de decisión en nuevos algoritmos de recomendación

Realizar estudios con usuarios

Estudiar cómo combinar otras métricas

30

4. Evaluación de Algoritmos que Toman Decisiones

Métricas Correctness EJEMPLO

5. Experimentos y Resultados Independiente del modelo KNN

Precisión vs Cobertura de Usuario

5. Experimentos y Resultados

34

Independiente del modelo KNN

5. Experimentos y Resultados

Novedad y Diversidad

35

Independiente del modelo KNN

5. Experimentos y Resultados Independiente del modelo Variational Bayesian

Precisión vs Cobertura de Usuario

5. Experimentos y Resultados Independiente del modelo Variational Bayesian

5. Experimentos y Resultados

Novedad y Diversidad

38

Independiente del modelo Variational Bayesian

5. Experimentos y Resultados

39

Según la incertidumbre de la predicción KNN

5. Experimentos y Resultados

40

Según la incertidumbre de la predicción KNN

Mejora del 95%

Mejora del 322%

5. Experimentos y Resultados

41

Según la incertidumbre de la predicción KNN

Novedad y Diversidad

top related