Transcript
Page 1: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Я.Субботник, Алматы, 15 октября 2011 года

Руководитель группы асессоров Ольга Мегорская

Качество поиска: экспертные оценки и исследование пользовательского поведения

Page 2: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Оценка качества поиска

2

Page 3: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Зачем это нужно?

• Как наши внедрения влияют на качество?

• Улучшили по одному классу: не испортили ли по другому?

• Где есть «проблемные точки»?

3

Page 4: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Что для этого нужно?

• «Человеческие» оценки качества выдачи

• Формальные метрики качества поиска

• Понимание пользователя

4

Page 5: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Экспертные оценки: асессоры

5

Page 6: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Кто такие асессоры? • Обычные пользователи

• Есть в каждом регионе присутствия Яндекса

• В Казахстане у нас тоже есть команда

6

Page 7: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

• Случайные запросы из потока

• Документы, нашедшиеся по этим запросам

• Оценки

Как работают асессоры?

7

Page 8: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Как работают асессоры?

8

Page 9: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Шкала релевантности Vital однозначно на первом месте

Useful дает авторитетный, очень полный и полезный ответ на запрос

Relevant+ отвечает на запрос

Relevant- имеет отношение к запросу, но в полной мере на запрос не отвечает

Irrelevant не отвечает на запрос

9

Page 10: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Для чего используются оценки асессоров? • Настройка поисковых алгоритмов

• Оценка качества поиска

10

Page 11: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Настройка поиска

11

Page 12: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Обучаем робота отличать хорошие документы от плохих

1. У нас есть набор для обучения – N яблок и M груш.

2. У Робота есть факторы: форма; цвет; вкус

12

Page 13: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Определяем признаки для набора

13

Page 14: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

OMG! 14

Page 15: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Аналогично с релевантностью документов:

1. У робота – факторы

2. У нас - оценки асессоров

3. Робот ищет закономерности

4. Для любого неоцененного документа из Веба робот знает факторы:

Документ Х: Есть слова запроса; на документ кликают; на документ ссылаются.

Вероятно, Документ Х Релевантен запросу

15

Page 16: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Оценка: метрики качества поиска

16

Page 17: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Пример метрики: Pfound • Гипотеза:

• Пользователь идет сверху вниз

• Останавливается, если:

Нашел

Устал.

17

Правильно, левый!

Page 18: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Исторический график Pfound

Показывает, как внедрения влияют на качество поиска

Опечаточная врезка

18

Page 19: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Что не улавливает Pfound? • Проблему разнообразия выдачи

19

Page 20: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Разнообразие объектов: [Наполеон]

artclassic.edu.ru 20

Page 21: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Разнообразие потребностей:

[Название фильма]

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Старые

фильмы

Фильмы в

прокате

Будущие

фильмы

Другое

Отзывы/рецензии

Кадры/фото

Трейлер

Общая информация

Смотреть онлайн

Скачать

21

Page 22: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Понимание пользователей

22

Page 23: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Исследование пользовательского поведения:

• Пользовательские сессии

• Переформулировки и клики

• Эксперименты на выдаче

• Классификация запросов

23

Page 24: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Анализ сессий: Что хотел этот пользователь?

24

Page 25: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

А этот?

25

Page 26: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Эксперименты на выдаче: • Выкатываем экспериментальный алгоритм на n% пользователей

• Смотрим на несколько метрик:

— Доля некликнутых

— Средняя позиция первого клика

— Еще 100500 других

26

Page 27: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Выделение тематик запросов: • Выбираем интересующие нас группы пользователей

• Составляем автоматический классификатор запросов

• Смотрим на распределение разных тематик запросов для разных групп пользователей

27

Page 28: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Выделение тематик запросов:

Пользователи Android VS пользователи IPhone

Android

IPhone

28

Page 29: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Битва титанов: Android vs. iPhone :

29

Page 30: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Битва титанов: iPhone vs. Android :

30

Page 31: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Спасибо!

31

Page 32: Ольга Мегорская "Качество поиска: экспертные оценки и исследование пользовательского поведения"

Руководитель группы асессоров

[email protected]

Ольга Мегорская


Top Related