Дмитрий Тумайкин (Яндекс) - "Макросы на бинарном...
TRANSCRIPT
Бинарный поиск в Excel: применение в интернет-маркетинге
• Принцип работы• Почему такой быстрый (визуальное и мат. обоснование)• Бинарный поиск в Excel, или тайна 4-го параметра ВПР• Где и почему нужен в контекстной рекламе?• Пример 1: Лемматизация• Пример 2: Кластеризация по маркерам• Пример 3: Капитализация имен собственных
Обо мне• ~3 лет в контекстной рекламе• Недавно: perfomance в контекстной рекламе, автоматизация
контекстной рекламы для e-commerce в агентстве• Сейчас: PPC-специалист в Яндексе (performance)
Что такое бинарный (двоичный) поиск?
Почему бинарный поиск такой быстрый?
Slin(x)≈x/2•Slin(10)=5•Slin(100)=50•Slin(1.000.000)=500.000
Sbin(x)≈ /2S(8)=1.5
S(128)=3.5
S(1024)=5
S(4096)=6
S(65535)= (XLS)
S()= !!! (XLSX)
А при чем тут Excel?
ВПР(VLOOKUP)
Как искать быстро, и только то, что нужно
Плюсы• Тысячекратный прирост скорости• Работает, как обычный ВПР• Открываются много новых возможностей
Минусы• Непривычный синтаксис (нужно потренироваться)
Окей, а при чем тут
контекстная реклама?
В моем СЯ на n сотен (тысяч) фраз все города – с маленькой
буквы
В моем СЯ (было) много неявных дублей• Розовые слоны• Розовый слон• Слоны розовые• И слоны, и розовые
• -----Все фразы выше – неявные дубли друг друга.
В моем СЯ (было) много неявных дублейНеявные дубли = избыточность, лишняя работа, лишняя конкуренция между ключевыми фразами.
Текущие инструменты для удаления неявных дублей:Директ.Коммандер. Удаляет что хочет, без спросаК50-Лемматизатор. Не понимает стоп-словаPy7.ru – знает не все стоп-слова, и нет экспорта в CSV.Все крэшатся на больших объемах.Не работают офлайн (кр. Коммандера)
Я хотел посмотреть, какие запросы в моем СЯ относятся:• к категории А • к категории Б • и к А, и к Б• Ни к одной из категорий
Не нашел таких решений
IT’S OPEN, AND IT’S FREE!Папка с несколькими примерами применения:https://yadi.sk/d/eiCPN-YQozHmHПрофиль в FB (обновления): https://www.facebook.com/tumaykin.d
Спасибо за внимание!