как работают яндекс.пробки

Post on 16-Jun-2015

426.032 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Леонид Медников Аналитик сервиса Яндекс.Пробки

Яндекс.Пробки и статистика

О чём?

•  Как работают Яндекс.Пробки

•  Как сделать лучше

•  Статистика

Принцип работы Яндекс.Пробок

55.749071 37.634781

Принцип работы Яндекс.Пробок

55.749071 37.634781

Посмотрим подробнее

• Где ехала машина? • Машина ли? J • Как ехали другие? • Что же здесь на самом деле? • И всё это в реальном времени на потоке от сотен тысяч машин

Схема работы Яндекс.Пробок

Посчитаем ручные затраты

Только в Москве длина дорог >4000 км Если закрашивать грубо, участками длиной 1 км И тратить на изучение ситуации и изменение статуса участка

10 секунд

На обновление всей карты потребуется

40 000 секунд т.е. >10 час

Чтобы обновлять карту каждые 4 минут нужно

> 150 человек

Как сделать лучше?

• Где ехала машина? • Машина ли? • Что же здесь на самом деле? • Ваши идеи…

Как проверить, что стало лучше?

Чтобы проверить, что стало лучше, нужно научиться измерять это «лучше». Как измерить качество пробок? Нужно сравниться с действительностью.

Сравниваем с действительностью

• Где ехала машина? • Машина ли? • Что же здесь на самом деле? • Метрика качества – посчитаем…

Уверены, что лучше?

Новый  алгоритм  1   Число  раз   %  от  всех  

Лучше   54   81%  Хуже   13   19%  

Новый  алгоритм  2   Число  раз   %  от  всех  

Лучше   5   83%  Хуже   1   17%  

Статистика

Случайные значения

Поиграем…

Статистика. Бросили монетку 3 раза. I   II   III   Σ  

0   0   0   0  

0   0   1   1  

0   1   0   1  

0   1   1   2  

1   0   0   1  

1   0   1   2  

1   1   0   2  

1   1   1   3  

Суммарно  выпало   раз   Вероятность  

0   1   0,125  

1   3   0,375  

2   3   0,375  

3   1   0,125  

Сумма   8   1  

Формула  для  суммы   2N   Всегда  1  

N – число бросков, ���в нашем случае 3

Статистика. Случайные значения Пример. Сколько раз выпал «орёл» при N-кратном броске монеты. Любая комбинация равновероятна, всего 2N различных комбинаций, а значит вероятность любой комбинации 1 раз на 2N случаев. Получить в сумме 0 можно только одним способом. Получить в сумме 1 можно N способами. Получить в сумме k можно CN

k способами

Статистика

• Случайные значения • Среднее и наблюдаемое среднее

Посмотрим…

Статистика. Вероятность отклонения

Чтобы оценить, насколько вероятно такое отклонение, нужно посчитать сумму всех вероятностей в «хвосте». Например, здесь нужно посчитать сумму вероятностей выпадения 0, 1, 2, 3 раза.

Уверены, что лучше?

Новый  алгоритм  1   Число  раз   %  от  всех  

Лучше   54   81%  Хуже   13   19%  

Новый  алгоритм  2   Число  раз   %  от  всех  

Лучше   5   83%  Хуже   1   17%  

Статистика

• Случайные значения • Среднее и наблюдаемое среднее • Правильная (репрезентативная) выборка • Причинно-следственные связи

Итого

•  Как работают Яндекс.Пробки GPS данные от водителей + алгоритмы

•  Как сделать лучше Измеряем качество, сравнивая с действительностью

•  Статистика Чем меньше измерений, тем больше случайная ошибка

Леонид Медников

Аналитик сервиса Яндекс.Пробки

mednikov@yandex-team.ru

Вопросы?

top related