advies databankarchivering cop documentbeheer en archivering iii 25 november 2008

20
Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Upload: guido-coppens

Post on 24-May-2015

212 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Advies databankarchivering

COP Documentbeheer en archivering III25 november 2008

Page 2: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Inleiding

• Nog niet goedgekeurd door stuurgroep strategisch archief of SOBO

• Ontwerptekst• Graag uw feedback!

Page 3: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Wat zijn databanken?

• Databank bestaat uit verschillende onderdelen:– Gestructureerde gegevens– DBMS (beheer van de databank)– Toepassing

• Verschillende datamodellen– Bekendste is het relationele model

Page 4: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Wettelijke aspecten• Decreet Openbaarheid van bestuur

– Databank = bestuursdocument• Archiefwet• Auteurswet

– Beschermt de auteur van de databank– Uitzonderingen voor archivering

• Privacywet– Legt beperkingen op voor de verwerking van gegevens

• Databankwet– Beschermt de auteur van de databank– Geen uitzondering voor archivering

=> onderzoeken wettelijke aspecten voor het archiveren=> overeenkomst met de ontwikkelaar van de databank

Page 5: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Wat archiveren? (1)

• Niet éénduidig– Gegevens?– Structuur?– Toepassing?– DBMS? (enkel emulatie)

• Bepaald door de archiefvormer

Page 6: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Wat archiveren? (2)

• Enkele richtlijnen– Plaats van de databank in de organisatie– Extra informatie in de databank (tov afgeleiden)?– Wordt de informatie in een ander formaat bewaard?– Laat wetgeving de archivering toe?– Kan de integriteit en authenticiteit voldoende

gegarandeerd worden?– Gebruikscontext: project/kerntaak– Authentieke bron?

• Ga bij de creatie van de databank na of deze gearchiveerd moet worden

=> Stel een archiefbeheersplan op

Page 7: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Eisen archiveringsoplossing (1)

• de authenticiteit en integriteit behouden door de betekenisvolle onderdelen van de databank en metadata over de databank te bewaren

• de metadata moeten toegankelijk en begrijpbaar zijn op lange termijn

• de databank moeten bruikbaar en verwerkbaar zijn door toekomstige systemen

Page 8: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Eisen archiveringsoplossing (2)

• de databank moet onafhankelijk worden van het DBMS, hardware en besturingssysteem

• er moet gebruikgemaakt worden van open standaarden die breed geaccepteerd zijn.

• het beheer en onderhoud van het archief moet onafhankelijk zijn van specifieke software (vendor lock-in vermijden)

Page 9: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Bewaarstrategieën - overzicht

• Migratie• Emulatie• Alternatieve bewaarstrategie• Conversie

Page 10: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Bewaarstrategie (1) - Migratie

• Langetermijnbewaring (> 5 jaar - …)• Omzetten naar een standaardformaat:

– Gebruik XML– Of een combinatie van standaarden:

• Platte tekst (data, liefst Unicode)• XML (enkel metadata over de databank)• SQL (opgelet ISO SQL!)

– Zowel structuur als zoekvragen e.d.

Page 11: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Migratie

Eisen voor het behoud van authenticiteit

Inhoud • De inhoud kan goed bewaard worden. Het is belangrijk dat er wel een validatiestap is om na te kijken of de migratie geslaagd is.

Context • De context moet bewaard worden door beschrijvende en technische metadata toe te voegen.

Structuur • De structuur kan bewaard blijven, maar zal meer beschreven moeten worden in een taal begrijpbaar door de computer.

Uiterlijk • Het uiterlijk kan niet bewaard worden en moet beschreven worden• De beste oplossing is het bewaren van functionele of technische analyse.

Gedrag • Het gedrag kan niet bewaard worden en moet best beschreven worden. • De beste oplossing is het bewaren van functionele of technische analyse.

Page 12: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Bewaarstrategie (2) - Emulatie

• Langetermijnbewaring (> 5 jaar - …)• Aangewezen als de toepassing ook

bewaard moet worden

Page 13: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Emulatie

Eisen voor het behoud van authenticiteit

Inhoud • De oorspronkelijke inhoud blijft bewaard

Context• De context moet toegevoegd worden door beschrijvende en technische metadata toe te voegen.

Structuur • De structuur van de oorspronkelijke databank wordt bewaard.

Uiterlijk • De oorspronkelijke applicatielaag blijft bewaard. • Het kan snel complex worden als er extra programma’s bewaard moeten worden. Bijvoorbeeld bij databanken met een webinterface moet er naast de databanksoftware een webserver, een programmeertaal,... bewaard blijven.

Gedrag • Het gedrag blijft bewaard omdat de oorspronkelijke databank bewaard blijft.

Page 14: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Bewaarstrategie (3) - Conversie

• Aangewezen voor kortetermijnbewaring (≤ 5 jaar)

• Naar nieuwere, hogere versie• Opgelet: vergeet de metadata over de

databank niet!

Page 15: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Conversie

Eisen voor het behoud van authenticiteit

Inhoud • Wordt goed bewaard. Het resultaat moet nagekeken worden

Context • De context moet toegevoegd worden door beschrijvende en technische metadata toe te voegen.

Structuur • Wordt goed bewaard. Het resultaat moet nagekeken worden

Uiterlijk • Kan bewaard worden. De verschillende componenten zijn vaak gemaakt met leveranciersspecifieke programma’s en daarom is het conversieproces afhankelijk van deze programma's.

Gedrag • Kan bewaard wordt. Het is het belangrijk om te testen of de omzetting naar de nieuwe versie geslaagd is.

Page 16: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Bewaarstrategie (4) - Alternatief

• Alternatieve bewaarstrategie– Vaak zijn databanken een bron en is enkel de

output belangrijk (vb. documenten gegenereerd uit een databank)

– De output moet wel op een goede manier bewaard worden

• Interactiviteit van de databank vervalt

Page 17: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Alternatieve bewaarstrategie

Eisen voor het behoud van authenticiteit

Inhoud • Niet de databank, maar de output van de databank wordt bewaard• Het gevolg is dat de inhoud niet op een gestructureerde manier bewaard wordt.• Geen mogelijkheid tot bevraging van de gegevens.

Context • Door de beschrijvende en technische metadata toe te voegen voor de gekozen oplossing.

Structuur • Wordt niet bewaard, omdat het in een andere vorm wordt bewaard.

Uiterlijk • Wordt ook niet bewaard, omdat de databank niet bewaard wordt.

Gedrag • Wordt ook niet bewaard, omdat er een andere vorm wordt gebruikt

Page 18: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Conclusie bewaarstrategie (1)

Voordelen Nadelen

Migratie + Volledige neutraliteit en onafhankelijkheid+ Getrouwe representatie

- Kans op beperkt gegevensverlies bij oorspronkelijke migratiebewerking- Geen eenvoudige bewerking-Niet alles kan behouden worden, bijvoorbeeld de applicatielaag en hierdoor moet er veel beschreven worden

Conversie + Zeer getrouwe representatie+ Relatief eenvoudige ingreep+ Beperkte kans op gegevensverlies op korte termijn

- Volledige afhankelijkheid van platform en producent- Hoe langer gewacht wordt met de conversie, hoe meer kans op gegevensverlies

Emulatie + Zeer getrouwe representatie+ Alle oorspronkelijke functionaliteiten werken

- Arbeidsintensieve ontwikkeling- Meerdere configuraties moeten geëmuleerd worden- Licenties van de verschillende programma’s nodig- Geen emulator voor recente databanksoftware

Page 19: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Conclusie bewaarstrategie (2)

Kortetermijnbewaring≤ 5 jaar

Langetermijnbewaring> 5 jaar - …

Permanente bewaring

Migratie - X X

Conversie X - -

Emulatie(nu moeilijk haalbaar)

- X X

Page 20: Advies databankarchivering COP Documentbeheer en archivering III 25 november 2008

Vervolgtraject

• Goedkeuring door (advies wordt strategie!)– stuurgroep strategisch archief– SOBO

• Voorstel piloot: archivering van Vlimpers– Concrete toepassing van de strategie