Индексирование семантическими моделями

Post on 08-Jan-2016

49 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Индексирование семантическими моделями. О чем. Семантическая модель: модель типа "объект-свойство" Зачем: Поиск смысла. Объекты – это…. - тип объекта (например, организация) - конкретный объект (например, «Российская государственная библиотека»). Свойства – это…. МОЙ БАНК. - PowerPoint PPT Presentation

TRANSCRIPT

Яковлева М.В. "Крым-2008"

Индексирование семантическими моделями

О чем

• Семантическая модель: модель типа "объект-свойство"

Зачем:

• Поиск смысла

• Объекты – это…

МОЙ БАНК

Меня зовут АнтонУ меня есть дочь Я работаю в банке

- тип объекта (например, организация)- конкретный объект (например, «Российская государственная библиотека»)

• Свойства – это…

Объекты и свойства

• Объекты – все, из чего состоит мир - материальные и идеальные сущности

• Свойства – описание характеристик объектаСвойства принимают значения в виде: текста, даты, числа, ссылки

Москва

Дата основания: 1147 г.

Основатель: Юрий Долгорукий

Находится в стране:

Страна Россия

Глава государства: президент

Численность населения: 148 000 000

Столица:

объекты:

сво

йст

ва

сво

йств

а

ссылка

Объект - свойство

Когда мы говорим объект, то подразумеваем, что описан объект с набором свойств. Без свойств объекта не бывает.

Что такое объект «журнал»?

Журнал

наименование издательство ISSN гл.редактор ….

Какие бывают свойства

• Текстовые Фамилия

• Дата (дд.мм.гг) Дата рождения

• Числовые Масса тела

• Ссылка Имеет ребенка – Является ребенком (от объекта Петух к объекту Цыпленок)

СЫН

ОТЕЦ

Ссылка. Пример:

Тип объекта

Организация

...… ….. продукция свойство

Тип объекта

Изделие ….. …... производитель свойство

Объекты – какие могут быть• Информационный объект: книги, статьи, сайты, изображения,

видео-клипы, фильмы (то, что содержит информацию о других объектах)

• Функциональный объект: вещь, существо (о них может идти речь в информационном объекте)

• Информационный объект («книга о Ленине») является Источником для функционального объекта («Ленин»)

• Типовой объект – общий для конкретного. Например,

организация – типовой (функц.) объектмагазин № 40 – конкретный (функц.) объект

книга – типовой (инф.) объект«Война и мир» - конкретный (инф.) объект

Чем индексируем, чтобы понять «о чем текст?»

• ББК, УДК,…

• Тематические рубрики

• Ключевые слова

• Теги / метки

Как еще можно индексировать

• Выделение из текста смысловых единиц (объектов) и связей между ними

Пример семантической модели.Текст по географии Европы

Европа

Население: 732 млн.чел.Площадь: 10 млн. кв. км….Омывается:Находятся страны:

Атлантический океан

Макс. глубина: 8742 мСр. глубина: 3600 м…..Омывает части света:Входящие в состав моря:

Балтийское море

Кр.северная точка: 65град.40 мин. с.ш.Кр.южная точка:

53град. 45мин. в.д …..Принадлежит океану:Включает острова:Омывает страны:

Остров Готланд

…..Находится в море:Принадлежит стране:

Швеция

Столица: СтокгольмПлощадь: 449964 кв. кмИмеет выход к морю:Включает острова:Находится в части света:

Индексация текста по географии

• ББК – 26.8

• Ключевые слова:- Европа- География

Если повезет, то:- Атлантический океан- Швеция-…

Важная роль источника

объект «Махно»

свойство значение

Место рождения с. Гуляйполе

Источник: Большая советская энциклопедияИсточник: Энциклопедия «Кругосвет»

Политические взгляды анархист

Источник: Большая советская энциклопедия

Политические взгляды анархист-коммунист

Источник: Учебник Отечественная история. IX-XX вв.Источник: Энциклопедия «Кругосвет»

Фамилия Махно

Имя Нестор

Отчество Иванович

Дата рождения 17.10.1889

источники:

Свойства объекта со ссылкой на источник:

Учебник Отечественная история. IX-XX вв.

Большая советскаяэнциклопедия

Энциклопедия«Кругосвет»

Особенности / плюсы метода семантического индексирования

• Индексация всего документа (текста) и/или его части

• Достаточно содержательный индекс• Использование индекса в качестве

справочника фактической информации• Индексирование во времени, начиная с

простого, дополняя подробностями в течение времени

Профессиональные библиотечные мероприятия

Запрос:Найти все библиотечные мероприятия в июне

Найдено 9 событий (конференции, семинары и пр.) В т.ч. междунар. конференция «Крым-2008»

Свойства объекта «Крым-2008»: название, место, кто проводит, даты и пр.

Информационный источник: Сводный план на 2008 год

Описание источника: комментарий, название, автор, где опубликован

Запрос:Найти конференции, которые пройдут в Иркутске в июне

Описание конференции. Связь ‘конференция «Растим патриотов…» – организатор – РГДБ’

Описание объекта РГДБ (название, адрес, телефон…). Связь ‘РГДБ – директор – Жаркова Л.М.’

Объект Жаркова Л.М. Свойства: фамилия, имя, отчество, место работы... Связь-ссылка на фото

Пример запроса: Профессиональные мероприятия в июне, организатором которых является РБА (5 мероприятий)

Семантическая Библиотека «География Урала»

Запрос: Оленьи ручьи.Найденные объекты – парк Оленьи ручьи и связанные с ним хребты, пещеры, реки, скалы.

Свойства объекта Бардымский хребет: входит в состав Уральских гор, высота, направление… Связь-ссылка ‘Бардымский хребет – на территории имеется – скала Дыроватый камень’

Описание объекта «скала Дыроватый камень» (комментарий, свойства). Связь-ссылка ‘Дыроватый камень - располагается на территории – парк Оленьи ручьи’

Парк Оленьи ручьи: комментарий, свойства, присоединенные файлы

Файл – цитаты из учебника. (doc)

Объект «Пещера Смолинская». Файл – изображение (jpg)

Информационный источник:

Информация для описания свойств объектов берется из источника. В данном случае – Учебник «География Свердловской области». / Источников может быть несколько /

«Семантическая Cеть может способствовать эволюции всего человеческого знания в целом»

Тим Бернерс-Ли

top related