advies databankarchivering cop documentbeheer en archivering iii 25 november 2008
TRANSCRIPT
Advies databankarchivering
COP Documentbeheer en archivering III25 november 2008
Inleiding
• Nog niet goedgekeurd door stuurgroep strategisch archief of SOBO
• Ontwerptekst• Graag uw feedback!
Wat zijn databanken?
• Databank bestaat uit verschillende onderdelen:– Gestructureerde gegevens– DBMS (beheer van de databank)– Toepassing
• Verschillende datamodellen– Bekendste is het relationele model
Wettelijke aspecten• Decreet Openbaarheid van bestuur
– Databank = bestuursdocument• Archiefwet• Auteurswet
– Beschermt de auteur van de databank– Uitzonderingen voor archivering
• Privacywet– Legt beperkingen op voor de verwerking van gegevens
• Databankwet– Beschermt de auteur van de databank– Geen uitzondering voor archivering
=> onderzoeken wettelijke aspecten voor het archiveren=> overeenkomst met de ontwikkelaar van de databank
Wat archiveren? (1)
• Niet éénduidig– Gegevens?– Structuur?– Toepassing?– DBMS? (enkel emulatie)
• Bepaald door de archiefvormer
Wat archiveren? (2)
• Enkele richtlijnen– Plaats van de databank in de organisatie– Extra informatie in de databank (tov afgeleiden)?– Wordt de informatie in een ander formaat bewaard?– Laat wetgeving de archivering toe?– Kan de integriteit en authenticiteit voldoende
gegarandeerd worden?– Gebruikscontext: project/kerntaak– Authentieke bron?
• Ga bij de creatie van de databank na of deze gearchiveerd moet worden
=> Stel een archiefbeheersplan op
Eisen archiveringsoplossing (1)
• de authenticiteit en integriteit behouden door de betekenisvolle onderdelen van de databank en metadata over de databank te bewaren
• de metadata moeten toegankelijk en begrijpbaar zijn op lange termijn
• de databank moeten bruikbaar en verwerkbaar zijn door toekomstige systemen
Eisen archiveringsoplossing (2)
• de databank moet onafhankelijk worden van het DBMS, hardware en besturingssysteem
• er moet gebruikgemaakt worden van open standaarden die breed geaccepteerd zijn.
• het beheer en onderhoud van het archief moet onafhankelijk zijn van specifieke software (vendor lock-in vermijden)
Bewaarstrategieën - overzicht
• Migratie• Emulatie• Alternatieve bewaarstrategie• Conversie
Bewaarstrategie (1) - Migratie
• Langetermijnbewaring (> 5 jaar - …)• Omzetten naar een standaardformaat:
– Gebruik XML– Of een combinatie van standaarden:
• Platte tekst (data, liefst Unicode)• XML (enkel metadata over de databank)• SQL (opgelet ISO SQL!)
– Zowel structuur als zoekvragen e.d.
Migratie
Eisen voor het behoud van authenticiteit
Inhoud • De inhoud kan goed bewaard worden. Het is belangrijk dat er wel een validatiestap is om na te kijken of de migratie geslaagd is.
Context • De context moet bewaard worden door beschrijvende en technische metadata toe te voegen.
Structuur • De structuur kan bewaard blijven, maar zal meer beschreven moeten worden in een taal begrijpbaar door de computer.
Uiterlijk • Het uiterlijk kan niet bewaard worden en moet beschreven worden• De beste oplossing is het bewaren van functionele of technische analyse.
Gedrag • Het gedrag kan niet bewaard worden en moet best beschreven worden. • De beste oplossing is het bewaren van functionele of technische analyse.
Bewaarstrategie (2) - Emulatie
• Langetermijnbewaring (> 5 jaar - …)• Aangewezen als de toepassing ook
bewaard moet worden
Emulatie
Eisen voor het behoud van authenticiteit
Inhoud • De oorspronkelijke inhoud blijft bewaard
Context• De context moet toegevoegd worden door beschrijvende en technische metadata toe te voegen.
Structuur • De structuur van de oorspronkelijke databank wordt bewaard.
Uiterlijk • De oorspronkelijke applicatielaag blijft bewaard. • Het kan snel complex worden als er extra programma’s bewaard moeten worden. Bijvoorbeeld bij databanken met een webinterface moet er naast de databanksoftware een webserver, een programmeertaal,... bewaard blijven.
Gedrag • Het gedrag blijft bewaard omdat de oorspronkelijke databank bewaard blijft.
Bewaarstrategie (3) - Conversie
• Aangewezen voor kortetermijnbewaring (≤ 5 jaar)
• Naar nieuwere, hogere versie• Opgelet: vergeet de metadata over de
databank niet!
Conversie
Eisen voor het behoud van authenticiteit
Inhoud • Wordt goed bewaard. Het resultaat moet nagekeken worden
Context • De context moet toegevoegd worden door beschrijvende en technische metadata toe te voegen.
Structuur • Wordt goed bewaard. Het resultaat moet nagekeken worden
Uiterlijk • Kan bewaard worden. De verschillende componenten zijn vaak gemaakt met leveranciersspecifieke programma’s en daarom is het conversieproces afhankelijk van deze programma's.
Gedrag • Kan bewaard wordt. Het is het belangrijk om te testen of de omzetting naar de nieuwe versie geslaagd is.
Bewaarstrategie (4) - Alternatief
• Alternatieve bewaarstrategie– Vaak zijn databanken een bron en is enkel de
output belangrijk (vb. documenten gegenereerd uit een databank)
– De output moet wel op een goede manier bewaard worden
• Interactiviteit van de databank vervalt
Alternatieve bewaarstrategie
Eisen voor het behoud van authenticiteit
Inhoud • Niet de databank, maar de output van de databank wordt bewaard• Het gevolg is dat de inhoud niet op een gestructureerde manier bewaard wordt.• Geen mogelijkheid tot bevraging van de gegevens.
Context • Door de beschrijvende en technische metadata toe te voegen voor de gekozen oplossing.
Structuur • Wordt niet bewaard, omdat het in een andere vorm wordt bewaard.
Uiterlijk • Wordt ook niet bewaard, omdat de databank niet bewaard wordt.
Gedrag • Wordt ook niet bewaard, omdat er een andere vorm wordt gebruikt
Conclusie bewaarstrategie (1)
Voordelen Nadelen
Migratie + Volledige neutraliteit en onafhankelijkheid+ Getrouwe representatie
- Kans op beperkt gegevensverlies bij oorspronkelijke migratiebewerking- Geen eenvoudige bewerking-Niet alles kan behouden worden, bijvoorbeeld de applicatielaag en hierdoor moet er veel beschreven worden
Conversie + Zeer getrouwe representatie+ Relatief eenvoudige ingreep+ Beperkte kans op gegevensverlies op korte termijn
- Volledige afhankelijkheid van platform en producent- Hoe langer gewacht wordt met de conversie, hoe meer kans op gegevensverlies
Emulatie + Zeer getrouwe representatie+ Alle oorspronkelijke functionaliteiten werken
- Arbeidsintensieve ontwikkeling- Meerdere configuraties moeten geëmuleerd worden- Licenties van de verschillende programma’s nodig- Geen emulator voor recente databanksoftware
Conclusie bewaarstrategie (2)
Kortetermijnbewaring≤ 5 jaar
Langetermijnbewaring> 5 jaar - …
Permanente bewaring
Migratie - X X
Conversie X - -
Emulatie(nu moeilijk haalbaar)
- X X
Vervolgtraject
• Goedkeuring door (advies wordt strategie!)– stuurgroep strategisch archief– SOBO
• Voorstel piloot: archivering van Vlimpers– Concrete toepassing van de strategie