begrebsarbejde som forudsætning for...

45
Begrebsarbejde som forudsætning for datamodellering Højnelse af datakvalitet og øget effektivitet i it-systemer Copenhagen Business School, mandag den 5. december 2016 Bodil Nistrup Madsen & Hanne Erdman Thomsen 1

Upload: duongdung

Post on 11-Jul-2019

218 views

Category:

Documents


0 download

TRANSCRIPT

Begrebsarbejde som

forudsætning for

datamodellering

Højnelse af datakvalitet og øget effektivitet i

it-systemer

Copenhagen Business School, mandag den

5. december 2016

Bodil Nistrup Madsen & Hanne Erdman Thomsen

1

Oversigt

1. Begrebsmodellering

Metode

Når myndigheder taler forskelligt dansk

2. Begrebsmodellering versus

datamodellering

Modellernes formål og indhold

Det ideelle modelleringsforløb

Eksempel på problemer i datamodel

Konklusion

3. Behov for samarbejde

2

1. Begrebsmodellering

3

Metode

4

Eksempel fra

http://sundhedsdata.iterm.dk/ 5

Udsnit af Medicineringsbegreber Associativ

relation

Del-

helhedsrelation

Typerelation

Begreb

Inddelingskriterium

6

Tilføjelse af træk v. bnm

INTERVAL:

fastlagt

INTERVAL:

efter behov

ADMINISTRATION:

gentagen dosering

ADMINISTRATION:

enkeltstående dosering

MÅDE:

i henhold til skriftlig anvisning

Karakteristisk træk:

ATTRIBUT:VÆRDI

7

Tidligere og nuværende

version

9

Når myndigheder taler forskelligt

dansk

10

Udsnit af diagrammet

JM-Sag

(Justitsministeriet)

11

Udsnit af diagrammet

Forvaltningsbegreber (Socialstyrelsen)

12

Sammenstilling af begreber fra

Justitsministeriet og Socialstyrelsen

13

myndighedssag sag hvori der træffes en afgørelse

Justitsministiet Socialstyrelsen

myndighedssag sag som ligger inden for en forvaltningsenheds primære forretningsområde reguleret af særlig lovgivning

2. Begrebsmodellering versus

datamodellering

16

Modellernes formål og indhold

17

Problemstilling

Der er mange lighedspunkter mellem

begrebsmodellering og datamodellering.

MEN!

Der er ingen en-til-en korrelation mellem

begrebsmodel og datamodel, dvs. der er ikke

fuldstændig overensstemmelse mellem

henholdsvis begreber og karakteristiske træk

i begrebsmodellen og klasser og attributter i

datamodellen.

18

Illustration af modellernes indhold Terminologisk ontologi:

Klasse

Attribut

Datamodel (UML):

SourceReference

OralSourceReference

WrittenSourceReference

ref: Integer pk

type: String

suppl: String

ref: Integer pk fk

job: String

name: String

ref: Integer pk fk

year: String

publisher: String

author: String

title: String

Typerelation mellem

begreber Begreb

Inddelingskriterium

Trækspecifikation:

attribut-værdi-par

Specialisering Origin

Diskriminator

19

Modellernes formål og

indhold

MODELTYPE FORMÅL INDHOLD

Terminologisk

ontologi

At skabe

begrebsafklaring og

enighed om

indholdet af en term

og brugen af

fagudtryk

Oplysninger om begreber i form af

karakteristiske træk (trækspecifikation)

og begrebsrelationer

Datamodel At fastlægge hvilke

oplysninger, der skal

indgå i et it-system,

og hvordan de

hænger sammen

Oplysninger om databasens klasser i

form af attributter og relationer mellem

klasser

20

Begrebsforvirring - Klip fra

Kriminalforsorgens

modelleringsvejledning

Der er ikke enighed om indholdet af og

betegnelserne for de forskellige

datamodelleringsniveauer.

En ofte anvendt betegnelse er fx

informationsmodel. Denne anvendes både om

konceptuel datamodel og logisk datamodel.

21

Det ideelle modelleringsforløb

22

• Konceptuel datamodellering Udarbejdelse af en datamodel der afspejler typer af entiteter og deres indbyrdes relationer, og som udgør en abstrakt repræsentation af data.

• Fysisk datamodellering Udarbejdelse af en datamodel der afspejler den fysiske struktur i et it-system

• Terminologisk begrebsmodellering Udarbejdelse af en terminologisk ontologi der indeholder oplysninger om begreber i form af karakteristiske træk og begrebsrelationer - BEGREBSAFKLARING! 1

2

3

4

• Logisk datamodellering Udarbejdelse af en datamodel der specificerer organiseringen af data på en måde, som afspejler den logiske struktur i et it-system.

Ideelt modelleringsforløb

23

Eksempel på ideelt

modelleringsforløb

Udvikling af et it-system med en

bagvedliggende relationel

database til

konferenceadministration

Case fra Mathiassen et al.: Objektorienteret

analyse & design

24

Beskrivelse af databasen - udsnit

• Konferencesystemet skal bruges til forberedelse og administration af

en konference, dvs. udarbejdelse af konferenceprogram og

administration af deltagere og artikler. Det skal ikke bruges i

forbindelse med budgetlægning, regnskab samt hotel- og

lokalereservationer. Målgruppen er programkomiteen,

organisationskomiteen og det administrative personale.

• Personer kan overordnet opdeles i to kategorier: personer, som er

tilmeldt og derfor deltager i konferencens aktiviteter, og personer som

ikke er tilmeldt, men som alligevel kan optræde i forbindelse med

forberedelsen af konferencen. Sidstnævnte personer er typisk

reviewere, som bedømmer artikler indsendt til programkomiteen,

samt forfattere, der har skrevet artiklerne.

• I forbindelse med artikler er det vigtigt at holde styr på, hvem der

bedømmer en given artikel, hvad bedømmelsen er, om artiklen

udvælges til konferencen, og hvornår artiklen skal fremlægges.

25

Eksempel på modelleringsforløb -

Identifikation af relevante begreber

26

Udkast

27

ledsager, deltager forfatter, reviewer

Inddelingskriterium

bliver til klasse

Her kommer

multipliictet

28

Her kommer attributter,

primærnøgle,

fremmednøgle og datatyper

29

Processen fra terminologisk ontologi til logisk datamodel

Her kommer

multiplicitet på

Kan ‘genereres’ på basis af

terminologisk ontologi

(uden multiplicitet)

30

Jf. den

terminologiske

ontologi

Svarer til typerelation i

terminologisk ontologi

Svarer til to mere specifikke roller:

ROLLE IFT KONFERENCE og

ROLLE IFT ARTIKEL

Den oprindelige konceptuelle datamodel fra Mathiassen et al.

31

Den oprindelige konceptuelle datamodel fra Mathiassen et al.

Versus den konceptuelle datamodel baseret på ontologien

ledsager, deltager forfatter, reviewer

Bliver til de to mere

specifikke roller på

grundlag af den

terminologiske

ontologi

Bliver associativ relation til

to specifikke roller

32

Eksempel på

problemer i

datamodel

33

Udsnit af Fødevareministeriets begrebsmodel for Kontrol

Problemer i datamodel

datamodel for Kontrol

http://www.fvm.dk/Files/Filer/Ministeriet/Udvalg%20og%20partnere/Standarder/kontrol/begrebsmodel_kontrol.htm

FVM omtalte den som

begrebsmodel Linket er ikke

længere aktivt

34

35

Oprindelig (logisk) datamodel –

oversat til engelsk

Er her gentegnet i

en mere

overskuelig form

Er ikke typer af

‘control type’ ,

men typer af

‘control’ Se forslag til ændret

konceptuel

datamodel, slide 41

Begreberne ‘sampling’ og

‘analysis’ indgår i ‘on site

control’. De er ikke typer af

‘on site control’.

37

Terminologisk ontologi for kontrol,

engelsk, justeret version

Her er ikke noget begreb ‘control type’, kun

‘control’. Begrebet ‘on site control’ er en

type ‘control’, ikke en type ‘control type’.

Begreberne ‘sampling’ og

‘analysis’ indgår i ‘on site

control’. De er ikke typer af

‘on site control’.

Her er tale om to

begreber:

kontrolansvarlig og

udførende myndighed.

rekvireret

kontrol regelfast

kontrol

prøveudtagning

kontrol på

stedet

40

Oprindelig konceptuel datamodel for kontrol versus

ny konceptuel datamodel baseret på ontologi

Fødevareministeriets model Ny konceptuel datamodel

Fødevareministeriets beskrivelse

af administrativ kontrol

Description

Som udgangspunkt foretages administrativ kontrol på materiale som myndigheden har til

behandling. Dette indebærer kontrol af oplysninger, som kunden har afgivet til en myndighed

gennem en ansøgning, indberetning af produktionsdata eller lignende.

Administrativ kontrol foretages som udgangspunkt udelukkende internt hos myndigheden.

Administrativ kontrol kan foretages på samtlige oplysninger i forbindelse med sagsbehandling

og udbetaling eller anden aktivitet rettet mod kunde, produkt eller aktivitet.

I forbindelse med sagsbehandling af støtteansøgninger foretages både en administrativ kontrol

og en fysisk kontrol.

Den administrative kontrol kan være en systematisk kontrol af alle oplysninger eller en

stikprøveudvalgt del af oplysningerne.

Den administrative kontrol kan ved behandling af eksempelvis ansøgninger opsættes som en

systematisk maskinel udfør kontrol.

Short description

Ved administrativ kontrol forstås den kontrol, der foretages ved at sammenholde modtagne

oplysninger og data vedrørende kunder, produkt eller aktivitet med gældende regler og andre

relevante oplysninger.

Dannede udgangspunkt

for karakteristisk træk i

den terminologiske

ontologi

41

BEGREB FVM DANTERM

kontrol på

stedet

Aktiviteten kontrol på stedet

udføres som en kontrol hos

en kunde eller dennes

leverandør/aftager.

kontrol der udføres hos en

kunde eller dennes

leverandør eller aftager

administrativ

kontrol

Ved administrativ kontrol

forstås den kontrol, der

foretages ved at

sammenholde modtagne

oplysninger og data

vedrørende kunder, produkt

eller aktivitet med gældende

regler og andre relevante

oplysninger.

kontrol der foretages hos

en kontrolmyndighed

DANTERMcentrets definitioner for

kontrol på stedet og administrativ kontrol:

Definitionerne er

ikke diskuteret med

Fødevarestyrelsen.

42

• Konceptuel datamodellering Udarbejdelse af en datamodel der afspejler typer af entiteter og deres indbyrdes relationer, og som udgør en abstrakt repræsentation af data.

• Fysisk datamodellering Udarbejdelse af en datamodel der afspejler den fysiske struktur i et it-system

• Terminologisk begrebsmodellering Udarbejdelse af en terminologisk ontologi der indeholder oplysninger om begreber i form af karakteristiske træk og begrebsrelationer - BEGREBSAFKLARING! 1

2

3

4

• Logisk datamodellering Udarbejdelse af en datamodel der specificerer organiseringen af data på en måde, som afspejler den logiske struktur i et it-system.

Ideelt modelleringsforløb

43

Konklusion

For at kunne udvikle en hensigtsmæssig

database må man kende begrebsmodellen

for det domæne der ligger bag datamodellen

(databasestrukturen).

Viden om begreberne i et domæne findes i

oplysninger om begrebsrelationer,

karakteristiske træk og definitioner

(semantisk viden – terminologisk ontologi).

44

3. Behov for samarbejde

45

Topontologi - FORVIR

• Udarbejdet af en arbejdsgruppe under FORVIR, Forum

for Videndeling i Offentligt Regi, med deltagelse af mange

medlemmer

• Formål: fælles definition af de generelle begreber, der

bruges i definitioner af mere specifikke fællesoffentlige

begreber

• Vision: udarbejdelse af begrebsmodeller for

fællesoffentlige begreber – ressourcer?

• Work in progress

46

Forvir topontologi – øverste top

47

FORVIR: Udsnit af

topontologi – Aktivitet

http://forvir.iterm.dk/

48

49

Dagens opgave

Referencer

• Madsen, Bodil Nistrup (2012): Vejledning for begrebsarbejde i Kriminalforsorgen.

Kriminalforsorgen og DANTERMcentret. Hentet 22-01-2014 på

http://kriminalforsorgen.iterm.dk/search/filer/H%C3%A5ndbog%20i%20begrebsarbejde

%202012-09-18.pdf

• Madsen, Bodil Nistrup, and Hanne Erdman Thomsen (2009). Terminological Concept

Modelling and Conceptual Data Modelling. International Journal of Metadata,

Semantics and Ontologies (IJMSO) 4(4): pp 239-249.

• Madsen, Bodil Nistrup and Hanne Erdman Thomsen (2015): Concept Modeling vs.

Data modeling in Practice. Handbook of Terminology. (eds.) Hendrick J. Kockaert;

Frieda Steurs. Vol. 1 Amsterdam: John Benjamins Publishing Company, pp 250-275.

• Madsen, Bodil Nistrup og Hanne Erdman Thomsen (2015): Når danske myndigheder

taler forskelligt dansk: Begrebsafklaring med terminologiske ontogier, Globe: A Journal

of Language, Culture and Communication, Special Issues 1, 2246-8838, s. 7-25.

https://journals.aau.dk/index.php/globe/issue/download/142/17

50