найди 10 отличий

Post on 15-Jun-2015

1.199 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Доклад «Найди 10 отличий. Решение задачи наполнения на примере интернет-магазина электроники»

АвторБелоусов Евгений Витальевич

Интернет-магазин электроники

АвторБелоусов Евгений Витальевич

Критерии ранжирования многостаничных сайтов?

• Юзабилити• Дизайн• Текстовая составляющая

АвторБелоусов Евгений Витальевич

Текстовая составляющая многостраничного сайта

• Проработанная внутренняя структура, перелинковка

• Высокий информационный вес, высокая средняя уникальность

АвторБелоусов Евгений Витальевич

Пример «рабочего» запроса для Интернет-магазина

АвторБелоусов Евгений Витальевич

1. Обзоры2. Карточки товаров с

расширенным описанием3. Стандартные карточки

товаров, содержащие лишь технические характеристики

Самый популярный тип страниц

АвторБелоусов Евгений Витальевич

Найди 10 отличий

Стандартные решения для повышения разнообразия карточек товаров?

• Мета-данные (title, keywords, description ) – автогенератор

• URL – ЧПУ через modrewrite• Хлебные крошки

АвторБелоусов Евгений Витальевич

Обшая информация

АвторБелоусов Евгений Витальевич

Для ipod nano 6 16gb Silver

Для ipod nano 6 16gb Green

Общая информация

АвторБелоусов Евгений Витальевич

Для ipod nano 6 16gb Silver

Для ipod nano 6 16gb Green

Вы можете купить «название товара», позвонив по телефону указанному на сайте …

Где взять уникальные тексты?

• Написать – долго, требуется специалист

• Купить – дорого, нет гарантий качества материала

• Генерировать - относительно быстро, специалист требуется на этапе настройки

АвторБелоусов Евгений Витальевич

Что отдает страница?

АвторБелоусов Евгений Витальевич

Что отдает страница?

АвторБелоусов Евгений Витальевич

Минимальный набор данных

Что еще можно использовать?

Для поиска - транзакционные маркеры запросов для SEO

Для посетителя – наименование, категория товара, характеристики, стоимость.

АвторБелоусов Евгений Витальевич

Создаем шаблон

АвторБелоусов Евгений Витальевич

Результаты работы генератора

• 17 000 000 000 – вариантов текста• Время работы генератора – 3 года.• Более 90% сгенерированных текстов

практически не отличаются друг от друга.

АвторБелоусов Евгений Витальевич

Как проверить тексты на уникальность Между собой?

– Алгоритм шинглов– Фильтрация на этапе генерации– Генерация текстов по шаблонам в случайном порядке,

отдельно для каждой категории

АвторБелоусов Евгений Витальевич

Алгоритм шинглов

АвторБелоусов Евгений Витальевич

Постепенный перебор отрезков текста, сравнении их между собой. Шаг между отрезками выбирается равным одному слову.

Сравнение осуществляется уже на этапе генерации.

Случайный порядок генерации

АвторБелоусов Евгений Витальевич

Отказываемся от последовательного перебора вариантов при генерации в пользу случайного перебора.

Это позволяет получить до 80% уникальных текстов уже на третьем часе работы алгоритма.

Результаты работы алгоритма

АвторБелоусов Евгений Витальевич

С заданными параметрами уникальности текстов в 95%, на выходе мы получаем чуть более 500 вариантов.

Количество обусловлено вкраплениями в шаблоне служебных переменных, которые снижают общий параметр уникальности.

Чтобы увеличить число вариантов, раскрыть потенциал шаблона, мы будем учитывать наличие служебных слов, стоп-слов при определении допустимого параметра уникальности.

Допустимый процент схожести

Допустимый процент схожести рассчитывается по принципу:

ДПС=95% - КСП/(ОЧС-СС)

где ДПС- допустимый процент схожести текстов, КСП – общее количество служебных слов параметров, ОЧС – общее число слов, СС –стоп слова.

АвторБелоусов Евгений Витальевич

Отсев дублей

АвторБелоусов Евгений Витальевич

При средних 100 словах на выходе, 25 стоп словах и 6 служебных, допустимыйПроцент схожести текстов составляет 85%.

Количество текстов на выходе ~1000

Размещение на сайте

– Одна страница – один текст навсегда– Каждый текст уникален– Новая страница получает текст– Для каждой группы товаров работают

свои шаблоны

АвторБелоусов Евгений Витальевич

Размещение на сайте

АвторБелоусов Евгений Витальевич

Результаты

– технология быстрого наполнения сайта с большим количеством страниц, без потери качества.

– собраны необходимые данные для будущих модулей, перелинковки.

– увеличена средняя уникальность карточек товаров и, как следствие, всего сайта.

– использование транзакционных связок в текстах увеличило показатели видимости сайта по средне- и низкочастотным запросам

АвторБелоусов Евгений Витальевич

top related