Концептуальные модели представления гетерогенных данныхданных
Гарипов Олег E-mail: [email protected]
Содержание доклада
Что есть концептуальное моделирование
Виды концептуальных моделей данных
Достоинства и недостатки различных КМД
Чему должны удовлетворять новые модели?
Концептуальное моделирование
•КМ - деятельность формального описания некоторых аспектов физического и социального мира вокруг нас для понимания этих аспектов и коммуникации [Малопулос]
•Концептуальное моделирование (КМ) предметной области (ПО) – моделирование понятий (концептов) и концептуальных структур ПО [Когаловский]
Концептуальное моделирование
•Концептуальная модель ПО в технологиях БД - это концептуальная схема (КС) базы данных
•Инструмент представления концептуальной схемы - концептуальная модель данных.
Концептуальные модели данных
• Модель «сущностей-связей »(ER-модель) ( Чен ).
• Модель «объектов-ролей» ORM ( Фалкенберг ) / NIAM ( Найсен )
• Расширенная реляционная модель RM/T ( Кодд )
• Функциональная модель DAPLEX ( Шипмана ).
• Семантические сети
• Онтологии
• И т.д
ER модель (пример)
ER – модель• Предложена Ченом в 1972 году• Наиболее распространенная модель.• Фрагменты ПО представляются как
множество сущностей с множеством связей.• Удобный способ представления структуры
данных• Недостатки
▫Отсутствие аппарата формальных преобразований
▫Чувствительна к изменению атрибутов▫Влияет на реализацию▫Далека от естественного языка
Модель Object-Role (ORM) (пример)
Модель Object-Role (ORM)
• Модель, основанная на фактах• Факты рассматриваются как отношения• Недостатки:
▫Факты из взаимосвязей фактов не вытекает взаимосвязь типов объектов
▫Семантически не полная модель• Плюсы:
▫Близки к естественному языку▫Понятны не техническим специалистам▫Богатая графическая нотация▫Семантическая стабильность
Более подробно: www.orm.com
Функциональные модели
•Первые разработки Sibley и Kershberg [1977]
•Модель Shipman’а. Язык DAPLEX [1979]
•Разработка языка FDL. Poulovassilis [1990]
Функциональная модель
СУЩНОСТИ И ОТНОШЕНИЯ -
ФУНКЦИИ
Функциональные модели•Достоинства:
▫Позволяет смотреть рассматривать объекты по отдельности и в «совокупности»
▫Динамическая▫Строгая типизация▫Математическая основа
•Недостатки▫Тяжелая для понимания▫Необходимо знание теории функций
Модели на семантических сетях
•В основе моделей – семантическая сеть.
•Общий случай: 𝑆=(𝑂,𝑅1,𝑅2,…,𝑅𝑘)
Пример семантической сетиРасширенная семантическая сеть:
Every parents loves their childs
Семантические сети•Достоинства:
▫Наглядность▫Возможность описывать данные в виде
связей структур▫Преобразования в логику первого порядка
•Недостатки▫Трудное графич. представление больших
сетей▫Трудность обработки информации▫Трудность получения знания▫Сложность поиска в сети
Онтологии•МакГраф: онтология – теория о
существующих понятиях, независимых от определенного языка или языков, которым они описаны.
•2 вида▫Формальные▫Лингвистические
Проблемы интеграции средствами онтологий
•Конфликты измерений▫«Цена продукта» ( Доллар vs. Рубль )
•Конфликты контекста▫«Вес человека» (зависит от времени
взвешивания)•Конфликты представления
▫«Студент» ( «Имя» + «Фамилия» vs. «ФИО» )
•Конфликты имен▫«Статус человека» ( тип занятости vs.
семейный статус)
Онтологии•Достоинства:
▫Распределенное создание▫Возможность трактовки понятий с
различных точек зрения•Недостатки
▫Сохранение целостности в процессе развития
▫Сложность интеграции▫Неточность, избыточность информации
Требования к модели гетерогенных данных
•Строгая типизация
•Легкость развития модели
•Независимость от реализации ИС
•Совместить модель данных и модель знаний
•Модель данных должна иметь удобную нотацию представления.
Требования к моделям гетерогенных данных
•Должны существовать механизмы проверки целостности, непротиворечивости и избыточности данных
•Должна позволять рассматривать данные с различных точек зрения
•Повторное использование.