datamodellering en –verwerking 8c020 college 1ste week
Post on 03-Jan-2016
39 Views
Preview:
DESCRIPTION
TRANSCRIPT
Datamodellering en –verwerking8C020
college 1ste week
docent:
Dragan Bošnački
Biomodellering en Bioinformatica, BMT
WH 3.101
Tel. 5159
Dragan@win.tue.nl ,
D.Bosnacki@tue.nl
Inhoud, Motivatie
• Datamodellering/Databases– Waarom?
• Bioinformatica– Veel databases gebruikt in academia en bedrijfsleven:
» GenBank, SwissProt, KEGG, Reactome, …• Alledaagse leven:
– geldautomaat, via Internet kopen en reserveren, studentenadministratie, …
• Processmodellering– Waarom?
• databewerking• Parallelle programma’s
– Keerpunt: Multi-core processoren• Biologische processen-processen in informatica• Systeembiologie
Doel van het vak
• kennis en inzicht in– elementaire concepten met betrekking tot
informatiesystemen/databases – ontwikkeling van informatiesystemen/databases
• kennis van moderne methoden voor het specificeren en ontwerpen van databases – datamodelleren– procesmodelleren
• ervaring met het modelleren van informatiesystemen en de manipulatie van gegevens met behulp van een querytaal
• ervaring met het ontwikkelen van een relationele database met Microsoft Access
• Modelleren van- en redeneren over biologische processen
Onderwerpen college
• Informatiesystemen, Databases
• Datamodelleren, Entiteit-relatie model
• Database modelleren, Relationeel model
• Querytalen, SQL
• Database implementeren, Microsoft Access
• Procesmodelleren,
– formele modelen, Petri netten, verificatie
– Analogie biologische – computationele/berekenings processen
• http://www.win.tue.nl/~dragan/8C020
• http://www.win.tue.nl/~dragan/8C020/8C020-2006.html
(vorig jaar)
Literatuur
• Collegedictaat– Datamodellering en –verwerking 8C020
G.J. Houben en N. H. L. Kuijpers
• Boek– Database Systems Concepts
A. Silberschatz, H.F. Korth, S. Sudarshan
McGrow-Hill, 2002
Data, Cijfers, Mededelingen
• Afronding: – opdracht deel A – opdracht deel B– schriftelijk tentamen
• Cijfer:– 50% tentamen– 50% opdracht– Allebei voldoende
Voorbeeld Datamodelleren
• We willen records/rijen over genen met records/rijen over clusters koppelen
• Elk cluster kan met één of meer genen gekoppeld worden
• Elk gen is gekoppeld met hoogstens één cluster
• De koppeling is geimplementeerd door introductie van nieuwe velden in de rijen (nieuwe kolommen in de tabel)
• Vraag: Waar willen we nieuwe kolomen introduceren – in de gentabel of in de clustertabel?
• Antwoord: in de gentabel– Efficienter oplossing
• we weten het aantal kolomen van te voren• Slechts een extra kolom
Voorbeeld Procesmodelleren
Prog/Proc A:
Print A1;
Print A2
Prog/Proc B:
Print B1;
Print B2
Outcomes:
A1;A2;B1;B2
A1;B1;B2;A2
Voorbeeld Procesmodelleren
Proc A: Proc B:
X=1; Y = 0
Y=4 ;
X = X+Y
We want X == 5 after Proc A has ended
Solution:
Proc A: Proc B:
Block(Y);
X=1; Y = 0
Y=4 ;
X = X+Y;
Release(Y)
Voorbeeld Procesemodelleren
Proc A: Proc B:
X= … ; Y=… ;
Y=… ; X=… ;
Proc A: Proc B:
Block X; Block Y;
Block Y; Block X;
X= … ; Y=… ;
Y=… ; X=… ;
Release Y; Release X;
Release X Release Y
Voorbeeld procesmodeleren
Proc A: Proc B:
Block X; Block Y;
Block Y; Block X;
X= … ; Y=… ;
Y=… ; X=… ;
Release Y; Release X;
Release X Release Y
Trouble – besides the “normal” execution
A: Block X; A: Block Y; A: Release Y; A: Release X; B: …
there is also a blocking one
A: Block X; B: Block Y; Deadlock!
Informatiesystemen
• van gegevens naar informatie
• Informatiesysteem– Een systeem voor opslaan en processeren van informatie
Algoritmen + Datastructuren = Programmeren
Processen + Informatie (Data) = Information System ?
• Belangrijk in alledagse leven
Voorbeelden:– WWW – a gigantisch (gedistribueerd) informatiesystem– ATM machinens– Mobile phone– studyweb
Databases
• Database – centraal concept (onderdeel) van een informatie systeem– Georganiseerde gerelateerde informatie
• DataBase Management System (DBMS)
Bieden aan de gebruikers een efficiente manier voor processeren van informatie
Conceptueel model
• het maken van een conceptueel model - één van de belangrijkste stappen in de ontwikkeling van een informatiesysteem
• conceptueel model – een abstracte beschrijving van de functionaliteit
• een conceptueel model bevat twee aspecten– statische eigenschappen: data– dynamische eigenschappen: processen
Benadering
• de data en het proces zijn allebei belangrijk:– samen geven zij een integrale beschrijving
• het ontwerp van een volledig conceptueel model is niet eenvoudig– het ontwikkelen van het model gebeurt stap voor stap
• twee mogelijke benaderingen– datagericht: eerst de data, dan het proces – procesgericht: eerst het proces, dan de data
Datamodelleren
• de datagerichte benadering stelt de data centraal:– het proces wordt beschreven in termen van de data
• datamodelleren (gegevensmodelleren) – het beschrijven van welke gegevens relevant zijn– hoe die gegevens met elkaar in verband staan
• in het ontwikkelingstraject van een informatiesysteem is datamodelleren het maken van een conceptueel model waarbij de ontwerper zich concentreert op de data
Entity Relationship Model
• Entity-Relationship Model (ER Model, ERM) [Chen, 1976]– één van de meest gebruikte technieken
• ERM gebruikt twee concepten:– entiteit: object uit de relevante belevingswereld– relatie: verband tussen entiteiten
• ERM Communicatiemiddel tussen ontwerpers en gebruikers:– eenvoudig te gebruiken– veel CASE-tools beschikbaar voor ondersteuning
– de modelleerconcepten blijken intuïtief
ER-Diagram
• conceptueel model voor een specifieke situatie– bestaat formeel uit een ER-model en een ER-diagram
• ER-model – een gedetailleerde, logische representatie van gegevens
• ER-diagram – grafische representatie van een ER-model
• vaak gebruikt men een ER-diagram en drukt daarmee eenvoudige belangrijkste onderdelen van een ER-model uit
Entiteit
• entiteit - een relevant begrip uit het objectsysteem– een concept in de gebruiksomgeving waarover we gegevens
willen bijhouden
(persoon)
werknemer, student, patiënt
(plaats)
woonplaats, stad, land
(object)
machine, gebouw, auto
(gebeurtenis)
verkoop, registratie, verlenging
(concept)
rekening, cursus, afdeling
Entiteit-type
• een entiteit-type (entiteit-klasse) – een collectie van entiteiten met gemeenschappelijke
eigenschappen
• representatie van entiteit-types in ER-diagram:
WERKNEMER CURSUS REKENING
Entiteit-instantie
• een entiteit-instantie (van een entiteit-type) – (het bestaan van) een enkel element van het entiteit-type
• een entiteit-type geeft een generieke beschrijving van hoe de specifieke entiteit-instanties van het entiteit-type er uit kunnen zien
• relevante eigenschappen van entiteit-type PERSONEELSLID :– PERSONEELSNUMMER– NAAM– ADRES– WOONPLAATS– JAAR-IN-DIENST– GEBOORTEDATUM
Entiteit-instantie (2)
twee instanties van PERSONEELSLID
324-6678-3 324-9853-1
Anna Baanders Carla Derks
Markt 3 Groenplein 2
Eindhoven Eindhoven
1987 1993
25-9-70 4-2-65
Atribuut-type
• een attribuut(-type) (van een entiteit-type) – beschrijft een karakteristieke eigenschap van een entiteit-
instantie van dat entiteit-type die van belang is binnen het objectsysteem
attribuut-typen van het entiteit-type STUDENT:
STUDENTNUMMER, NAAM, ADRES,
TELEFOONNUMMER
attribuut-typen van het entiteit-type AUTO:
VOERTUIGIDENTIFICATIE, KLEUR, GEWICHT, VERMOGEN
attribuut-typen van het entiteit-type WERKNEMER:
WERKNEMERSNUMMER, NAAM, ADRES,
VAARDIGHEDEN
Entiteit-type met atribuut-typen
STUDENT
NAAM STUDENTNUMMER ADRES TELEFOONNUMMER
Kandidaat-sleutel
• een kandidaat-sleutel (van een entiteit-type)– attribuut-type (of verzameling van attribuut-typen) dat elke
instantie van het type uniek identificeert en onderscheidt van de andere instanties van dat type
STUDENT:
STUDENTNUMMER
AUTO:
VOERTUIGIDENTIFICATIE
WEDSTRIJD:
combinatie van THUIS-TEAM en UIT-TEAM
WERKNEMER:
combinatie van NAAM en ADRES, of WERKNEMERSNUMMER
Primaire-sleutel
STUDENT
NAAM STUDENTNUMMER ADRES TELEFOONNUMMER
•primaire sleutel (van een entiteit-type) -
–één van de kandidaat-sleutels van dat type: het is de kandidaat-sleutel waarvan is bepaald dat die de entiteit-instanties uniek identificeert
Primaire sleutel (2)
• richtlijnen voor primaire sleutels:– kies sleutels met waarden die niet veranderlijk zijn in de tijd– kies geen sleutels met (ook) waarden als onbekend of niet
van toepassing– kies in plaats van grote samengestelde sleutels één
kunstmatig attribuut-type: surrogaat-sleutel
Meervwaardig atribuut-type
WERKNEMER
NAAM WERKNEMERS- NUMMER
ADRES VAARDIGHEDEN
•een meerwaardig attribuut-type -•een attribuut-type dat meer dan één waarde kan hebben voor elke entiteit-instantie
Relatie-type
WERKNEMER CURSUS Volbrengt
•een relatie-type •een verband tussen entiteit-instanties van één of meer entiteit-typen dat van belang is binnen het objectsysteem
Voorbeeld
WERKNEMER CURSUSVolbrengt
Werknemer1
Werknemer2
Werknemer3
Werknemer4
Cursus1
Cursus2
Cursus3
Atribuut-type van relatie
WERKNEMER CURSUSVolbrengt
DATUM-AFRONDING
ook een relatie-type kan attribuut-typen (eigenschappen) hebben
Graad van relatie-type
• de graad van een relatie-type duidt het aantal aan van de verschillende entiteit-typen betrokken in de relatie
– (1) unair– (2) binair– (3) ternair– zelden hoger dan 3
Unair relatie-type
PERSOON
Is-
getrouwd-met
WERKNEMER
Geeft-
leiding-aan
Unair relatie-type
PRODUKT Bestaat-uit
HOEVEELHEID
A
X V Y
U V
A
Y X
U V
Z
V W
(1) (2) (1) (1) (1)
(1)
(2)
(2) (2) (2) (3) (3)
Binair relatie-type
WERKNEMER PARKEERPLAATSHeeft
PRODUKTGROEP PRODUKTBevat
STUDENT CURSUSNeemt-deel-aan
Ternair relatie-type
LEVERANCIER KLANTLevert
HOEVEELHEID
PRODUKT
Cardinaliteit
SPEELFILM EXEMPLAARIs-
voorradig-als
•cardinaliteit van een relatie-type•het aantal entiteit-instanties van een entiteit-type die geassocieerd kunnen zijn met elke entiteit-instantie van een ander entiteit-type
voorbeeld van “veel”
Minimum/maximum/vrij/verplicht
SPEELFILM EXEMPLAARIs-
voorradig-als
PATIENT OPNAMEDOSSIERHeeft
WERKNEMER PROJECTWerkt-in
PERSOON
Is-getrouwd-
met
top related