Индексирование семантическими моделями

35
Яковлева М.В. "Крым-2008" Индексирование семантическими моделями

Upload: gurit

Post on 08-Jan-2016

49 views

Category:

Documents


0 download

DESCRIPTION

Индексирование семантическими моделями. О чем. Семантическая модель: модель типа "объект-свойство" Зачем: Поиск смысла. Объекты – это…. - тип объекта (например, организация) - конкретный объект (например, «Российская государственная библиотека»). Свойства – это…. МОЙ БАНК. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Индексирование семантическими моделями

Яковлева М.В. "Крым-2008"

Индексирование семантическими моделями

Page 2: Индексирование семантическими моделями

О чем

• Семантическая модель: модель типа "объект-свойство"

Зачем:

• Поиск смысла

Page 3: Индексирование семантическими моделями

• Объекты – это…

МОЙ БАНК

Меня зовут АнтонУ меня есть дочь Я работаю в банке

- тип объекта (например, организация)- конкретный объект (например, «Российская государственная библиотека»)

• Свойства – это…

Page 4: Индексирование семантическими моделями

Объекты и свойства

• Объекты – все, из чего состоит мир - материальные и идеальные сущности

• Свойства – описание характеристик объектаСвойства принимают значения в виде: текста, даты, числа, ссылки

Москва

Дата основания: 1147 г.

Основатель: Юрий Долгорукий

Находится в стране:

Страна Россия

Глава государства: президент

Численность населения: 148 000 000

Столица:

объекты:

сво

йст

ва

сво

йств

а

ссылка

Page 5: Индексирование семантическими моделями

Объект - свойство

Когда мы говорим объект, то подразумеваем, что описан объект с набором свойств. Без свойств объекта не бывает.

Что такое объект «журнал»?

Журнал

наименование издательство ISSN гл.редактор ….

Page 6: Индексирование семантическими моделями

Какие бывают свойства

• Текстовые Фамилия

• Дата (дд.мм.гг) Дата рождения

• Числовые Масса тела

• Ссылка Имеет ребенка – Является ребенком (от объекта Петух к объекту Цыпленок)

СЫН

ОТЕЦ

Page 7: Индексирование семантическими моделями

Ссылка. Пример:

Тип объекта

Организация

...… ….. продукция свойство

Тип объекта

Изделие ….. …... производитель свойство

Page 8: Индексирование семантическими моделями

Объекты – какие могут быть• Информационный объект: книги, статьи, сайты, изображения,

видео-клипы, фильмы (то, что содержит информацию о других объектах)

• Функциональный объект: вещь, существо (о них может идти речь в информационном объекте)

• Информационный объект («книга о Ленине») является Источником для функционального объекта («Ленин»)

• Типовой объект – общий для конкретного. Например,

организация – типовой (функц.) объектмагазин № 40 – конкретный (функц.) объект

книга – типовой (инф.) объект«Война и мир» - конкретный (инф.) объект

Page 9: Индексирование семантическими моделями

Чем индексируем, чтобы понять «о чем текст?»

• ББК, УДК,…

• Тематические рубрики

• Ключевые слова

• Теги / метки

Как еще можно индексировать

• Выделение из текста смысловых единиц (объектов) и связей между ними

Page 10: Индексирование семантическими моделями

Пример семантической модели.Текст по географии Европы

Европа

Население: 732 млн.чел.Площадь: 10 млн. кв. км….Омывается:Находятся страны:

Атлантический океан

Макс. глубина: 8742 мСр. глубина: 3600 м…..Омывает части света:Входящие в состав моря:

Балтийское море

Кр.северная точка: 65град.40 мин. с.ш.Кр.южная точка:

53град. 45мин. в.д …..Принадлежит океану:Включает острова:Омывает страны:

Остров Готланд

…..Находится в море:Принадлежит стране:

Швеция

Столица: СтокгольмПлощадь: 449964 кв. кмИмеет выход к морю:Включает острова:Находится в части света:

Page 11: Индексирование семантическими моделями

Индексация текста по географии

• ББК – 26.8

• Ключевые слова:- Европа- География

Если повезет, то:- Атлантический океан- Швеция-…

Page 12: Индексирование семантическими моделями

Важная роль источника

объект «Махно»

свойство значение

Место рождения с. Гуляйполе

Источник: Большая советская энциклопедияИсточник: Энциклопедия «Кругосвет»

Политические взгляды анархист

Источник: Большая советская энциклопедия

Политические взгляды анархист-коммунист

Источник: Учебник Отечественная история. IX-XX вв.Источник: Энциклопедия «Кругосвет»

Фамилия Махно

Имя Нестор

Отчество Иванович

Дата рождения 17.10.1889

источники:

Свойства объекта со ссылкой на источник:

Учебник Отечественная история. IX-XX вв.

Большая советскаяэнциклопедия

Энциклопедия«Кругосвет»

Page 13: Индексирование семантическими моделями

Особенности / плюсы метода семантического индексирования

• Индексация всего документа (текста) и/или его части

• Достаточно содержательный индекс• Использование индекса в качестве

справочника фактической информации• Индексирование во времени, начиная с

простого, дополняя подробностями в течение времени

Page 14: Индексирование семантическими моделями

Профессиональные библиотечные мероприятия

Page 15: Индексирование семантическими моделями
Page 16: Индексирование семантическими моделями

Запрос:Найти все библиотечные мероприятия в июне

Page 17: Индексирование семантическими моделями

Найдено 9 событий (конференции, семинары и пр.) В т.ч. междунар. конференция «Крым-2008»

Page 18: Индексирование семантическими моделями

Свойства объекта «Крым-2008»: название, место, кто проводит, даты и пр.

Page 19: Индексирование семантическими моделями

Информационный источник: Сводный план на 2008 год

Page 20: Индексирование семантическими моделями

Описание источника: комментарий, название, автор, где опубликован

Page 21: Индексирование семантическими моделями

Запрос:Найти конференции, которые пройдут в Иркутске в июне

Page 22: Индексирование семантическими моделями

Описание конференции. Связь ‘конференция «Растим патриотов…» – организатор – РГДБ’

Page 23: Индексирование семантическими моделями

Описание объекта РГДБ (название, адрес, телефон…). Связь ‘РГДБ – директор – Жаркова Л.М.’

Page 24: Индексирование семантическими моделями

Объект Жаркова Л.М. Свойства: фамилия, имя, отчество, место работы... Связь-ссылка на фото

Page 25: Индексирование семантическими моделями
Page 26: Индексирование семантическими моделями

Пример запроса: Профессиональные мероприятия в июне, организатором которых является РБА (5 мероприятий)

Page 27: Индексирование семантическими моделями

Семантическая Библиотека «География Урала»

Page 28: Индексирование семантическими моделями

Запрос: Оленьи ручьи.Найденные объекты – парк Оленьи ручьи и связанные с ним хребты, пещеры, реки, скалы.

Page 29: Индексирование семантическими моделями

Свойства объекта Бардымский хребет: входит в состав Уральских гор, высота, направление… Связь-ссылка ‘Бардымский хребет – на территории имеется – скала Дыроватый камень’

Page 30: Индексирование семантическими моделями

Описание объекта «скала Дыроватый камень» (комментарий, свойства). Связь-ссылка ‘Дыроватый камень - располагается на территории – парк Оленьи ручьи’

Page 31: Индексирование семантическими моделями

Парк Оленьи ручьи: комментарий, свойства, присоединенные файлы

Page 32: Индексирование семантическими моделями

Файл – цитаты из учебника. (doc)

Page 33: Индексирование семантическими моделями

Объект «Пещера Смолинская». Файл – изображение (jpg)

Page 34: Индексирование семантическими моделями

Информационный источник:

Информация для описания свойств объектов берется из источника. В данном случае – Учебник «География Свердловской области». / Источников может быть несколько /

Page 35: Индексирование семантическими моделями

«Семантическая Cеть может способствовать эволюции всего человеческого знания в целом»

Тим Бернерс-Ли