Урок 8: Лемматизация - Леонид Гроховский
DESCRIPTION
Содержание: - Понятие лемматизации - Приведение слова к лемме - Лексема - Нормализация анкоров - Стемминг - Тезаурус - Обработка запросов - Обработка текстов - Каноническая форма слова Более подробную информацию Вы можете получить на полном курсе SEO: http://www.topexpert.pro/seo-kurs.htmlTRANSCRIPT
ЛемматизацияЛеонид Гроховский, руководитель учебного центра ТопЭксперт
Леонид Гроховский
Леонид Гроховский В SEO с 2005 года
Опыт работы – более 500 проектов, среди которых panasonic.ru, championat.com, komandirovka.ru, cian.ru, automobile.ru, rabota.ru, aforex.ru.
Работая в агентстве ArrowMedia, создал с нуля отдел SEO и вывел компанию в топ-5 рейтинга качества продвижения от SeoNews по оценке клиентов
Леонид Гроховский
ТопЭксперт – это Учебный центр по SEO с
эффективной программой обучения.
Образовательный сайт, содержащий справочную информацию.
Группа экспертов, оказывающих услуги аудита, консультаций и продвижения сайтов.
Леонид Гроховский
Миссия
Повышать квалификацию участников отрасли интернет-маркетинга, соединяя специалистов, экспертов и работодателей в образовательную среду и упорядочивая и структурируя информацию в доступные масштабируемые образовательные продукты, адаптированные для дистанционного обучения.
• Для специалистов: предоставить возможность получения доступного дистанционного профессионального образования в сфере IT.
• Для компаний: поставлять квалифицированные кадры, обучать сотрудников.
• Для экспертов: предоставить возможность экспертам быть понятыми и услышанными, способствовать повышению дохода и востребованности.
• Для технологий: создать среду для роста специалистов, способных создавать новые технологии.
Леонид Гроховский
Объяснить, что такое лемматизация и как её применять
Цели вебинара
Леонид Гроховский
ЛемматизаS ция — процесс привода словоформы к лемме — её нормальной (словарной) форме.
Понятие лемматизации
Леонид Гроховский
В русском языке нормальными формами считаются следующие морфологические формы:• для существительных — им. падеж, ед. ч.;• для прилагательных — им. падеж, ед.ч., м. род;• для глаголов, причастий, деепричастий — глагол в инф.
Нормальная форма слова (лемма)
Леонид Гроховский
- http://macrocosm.narod.ru/lingvo.html- http://lemmatizer.org/
Приведение слова к лемме
Леонид Гроховский
Приведение слова к лемме
Источник – http://macrocosm.narod.ru/lingvo.html
Леонид Гроховский
ЛексеSма в лингвистике — слово как абстрактная единица морфологического анализа. В одну лексему объединяются разные парадигматические формы (словоформы) одного слова. Например, окна, окнами, окном — это формы одной и той же лексемы, по соглашению пишущейся как ОКНО
Лексема
Леонид Гроховский
- http://morphology.ru/
Словарь словоформ
Леонид Гроховский
Приведение слов к леммам
*Из практических заданий профессионального курса ТопЭксперт
Леонид Гроховский
Нормализация анкоров
Леонид Гроховский
Стемминг
СтемматизаS ция (стеSмминг) — это процесс нахождения основы слова для заданного исходного слова.
Леонид Гроховский
Стемминг
- Источник – http://snowball.tartarus.org/algorithms/russian/stemmer.html
Леонид Гроховский
Тезаурус
Тезаурус – словарь, собрание сведений, корпус, полномерно охватывающий понятия, определения и термины специальной области знаний или сферы деятельности.
- Источник – http://ru.wikipedia.org/wiki/Тезаурус
Леонид Гроховский
Тезаурус
- http://ru.wiktionary.org/wiki/Индекс:Русский_язык - http://speakrus.ru/dict/index.htm
Леонид Гроховский
Изучайте, внедряйте, зарабатывайте!»
Леонид Гроховский, руководитель учебного центра ТопЭксперт
• skype:grohovskiy
• http://гроховский.рф/
«