duurzaam digitaliseren: praktijk

33

Upload: heemkunde-vlaanderen

Post on 25-Jul-2015

114 views

Category:

Government & Nonprofit


1 download

TRANSCRIPT

DUURZAAM

DIGITALISEREN:

PRINCIPES &

STRATEGIEEN

Rony Vissers & Bert Lemmens | PACKED vzw

6 mei 2015 | Heemkunde Vlaanderen

HUISWERK - KNELPUNTEN

● Bewaarstrategie:

Ik weet niet waar ik moet

beginnen om mijn bestanden

langdurig toegankelijk te maken.

● Kwaliteitscontrole:

Ik weet niet hoe ik moet

controleren of een bestand

duurzaam is of niet.

● Opslagbeheer:

Mijn bestanden zijn niet veilig

opgeslagen.

● Opnameprocedure:

Ik krijg geen overzicht over de

massa bestanden in mijn

collectie.

● Toegang:

Ik weet niet hoe ik al die

bestanden toegankelijk moet

maken via het web

HUISWERK - OPDRACHT

● Wat beschouw je op basis van je eigen ervaring als de grootste

bedreiging m.b.t. duurzame digitale toegankelijkheid in je eigen

organisatie?

Maak een rangorde op van 1 tot 5.

● Beschrijf voor de twee grootste bedreigingen een concrete situatie die

problematisch is voor je organisatie en die je aan PACKED vzw en je

medecursisten wil voorleggen tijdens de volgende bijeenkomst.

Formuleer in je eigen woorden ook zelf een mogelijke oplossing.

HUISWERK - OPDRACHT

• 2. Onbetrouwbare en

vergankelijke dragers

• 1. Verouderde technologie

• 3. Onduidelijke en uitdijende

omvang

• 4. Rechten en patenten

• 5. Gebrek aan toegang

22 (3x nr. 1)

23 (4x nr. 1)

25 (2x nr. 1)

34 (0x nr. 1)

40 (1x nr. 1)

5 THEMA’S / 15 VRAGEN

• Digitalisering

• Verouderde technologie

• Onbetrouwbare & vergankelijke dragers

• Onduidelijke en uitdijende omvang

• Toegang

I. DIGITALISERING

1. Digitalisering audiovisuele collecties / archieven

Is DVD een goed formaat om video’s of filmpjes naar te

digitaliseren?

2. Fotografie / scanning

Is JPEG een goed formaat om foto’s te maken/scannen? Wat

is het onderscheid tussen JPEG en TIFF? Is PDF een

alternatief?

1. AUDIOVISUELE COLLECTIES?

• doelstelling: digitale archivering, ontsluiting, …?

• onderscheid tussen dragerformaat en bestandsformaat

• onderscheid tussen bewaring dragers, formaten en inhoud

• open formaten / propriëtaire formaten

• geen compressie / lossless compressie / lossy compressie

• ondersteuning door meerdere fabrikanten

• eenvoud, documentatie

• onderscheid tussen scannen naar beeldensequentie en

omzetten naar videosignaal

2. FOTOGRAFIE & SCANNING?

• doelstelling: digitale archivering, ontsluiting, …?

• open formaten / propriëtaire formaten

• geen compressie / lossless compressie / lossy compressie

• ondersteuning door meerdere fabrikanten

• eenvoud, documentatie

• relatie RAW - DNG / TIFF / JPEG

• waar op letten bij TIFF: TIFF v6.0 uncompressed baseline

RGB

• voor- en nadelen van PDF als alternatief: PDF/A,

bewerkingsmogelijkheden

II. VEROUDERDE TECHNOLOGIE

3. Wat zijn duurzame bestandsformaten?

4. Wat te doen met audiovisuele collecties / archieven op

magnetische dragers?

5. Wat te doen als foto’s al zijn opgeslagen in JPEG? Alsnog

omzetten naar TIFF?

6. Zijn Access en Excell goede, duurzame oplossingen? Wat

kan er verloren gaan bij evolutie in de software? Hoe kun je

Excell overzetten naar Access? Wat zijn de voor- en nadelen

van registratie in Acces en Excell? Hoe kun je de veroudering

van deze softwarepakketten opvolgen? Wat zijn

alternatieven?

7. Verantwoord uniform softwarepakket <> brede waaier aan

software? Onderscheid tussen software en bestandsformaat:

kies bestandsformaat dat niet afhankelijk is van een bepaald

softwarepakket.

3. WAT ZIJN DUURZAME

BESTANDSFORMATEN?

• ongecomprimeerde of mathematisch lossless gecodeerde

inhoud

• geen patenten op de gebruikte technologie

• ondersteuning door verschillende software tools

• eenvoudig en goed gedocumenteerd

3. WAT ZIJN DUURZAME

BESTANDSFORMATEN? CODERING FORMAAT

TEKST utf-8 XML

BEELD

TIFF v6.0 uncompressed baseline

lossless JPEG2000 pt.1 jp2

BEWEGEND

BEELD

JPEG2000 MXF

FFV1 MKV

GELUID LPCM

WAV

AIFF

FLAC

4. AUDIOVISUELE COLLECTIES OP

MAGNETISCHE DRAGERS?

• magnetische dragers hebben beperkte levensduur:

samenstelling + afspeelapparatuur

• (voorlopige) uitzondering: film

• digitaliseren in functie van preservering en ontsluiting

• behoud van informatie uit het origineel > vermijden van

lossy compressie

• keuze van duurzame containerformaat en codecs

5. JPEG OMZETTEN NAAR TIFF?

•JPEG en TIFF: patenten zijn vervallen

•grote onderscheid is lossy compressie

•omzetting van lossy compressie formaat in lossless

compressie formaat heeft geen zin zolang JPEG

ondersteund wordt > geen winst aan informatie, meer

opslagcapaciteit vereist

•wanneer transcodering / migratie wel aan de orde is, dan

naar lossless formaat > want opeenvolging van lossy

compressie op lossy compressie kan resulteren zichtbaar

kwaliteitsverlies

•opvolgen ondersteuning formaat is vereist (daarom aantal

archiveringsformaten beperkt houden)

6. ACCESS & EXCELL

• Bewerkingssoftware: complexe formaten

• veel functionaliteit

• nood aan nieuw snufjes > evalueert snel

• commercieel product > korte levensduur

• Excel > Access

• niet automatisch: van ‘plat’ naar ‘relationeel’

• handwerk

• Duurzaamheidsstrategie?

• gebruik eenvoudige generieke formaten (CSV, XML,

JSON)

• gebruik standaard data structuuren (DC, EAD,

MARC, etc…)

• open source software: ‘terugwaarts compatibel’

(leest ook oude formaten)

• Alternatieven?

• open databanksystemen:

• open/libre office calc/base

• mySQL/mariaDB

7. UNIFORM SOFTWAREPAKKET <>

WAAIER AAN SOFTWARE

•brede waaier aan software: geen kostendeling, moeilijk om

druk uit te oefenen op producent

•onderscheid tussen software en bestandsformaat

•openheid van software: kan data geëxporteerd worden?kan

de export in een bruikbaar formaat gebeuren?

•uniform uitwisselformaat is belangrijker dan uniforme

software

IV. ONBETROUWBARE &

VERGANKELIJKE DRAGERS

8. Regelmatige vaststelling dat digitale fotobestanden op

harde schijven beschadigd zijn? Hoe detecteren? Hoe

voorkomen?

9. Foto’s op CD-r’s overzetten op harde schijven?

Alle digitale bestanden op harde schijven? Hoe het risico op

verlies beperken? Wat zijn de alternatieven?

8. BESCHADIGDE FOTOBESTANDEN?

•maak checksums (MD5) in zo’n vroeg mogelijk stadium,

voor opslag op harde schijven

•controleer checksums onmiddellijk na opslag, en daarna

periodiek

•maak back-up kopieën op andere harde schijven, server, in

de cloud, … en doe ook daar controle op checksums

•wanneer een probleem opduikt met checksum, grijp dan

terug naar back-up

9. FOTO’S BEWAREN OP CD-r?

•CD-r’s en harde schijven zijn onbetrouwbare dragers

•back-ups maken

•checksums creëren en regelmatig controleren

•wanneer een probleem opduikt met checksum, grijp dan

terug naar back-up

•procedure efficiënter bij harde schijven, servers, in de cloud,

•ook cloud maakt gebruik van harde schijven, denk ook aan

paswoord, voorwaarden dienstverlening, …

•gecombineerde oplossing?

IV. ONDUIDELIJKE EN UITDIJENDE

OMVANG

10. Hoe kun je in Excel linken naar een pdf-afbeelding?

11. Grote hoeveelheid dragers en collecties die verspreid zijn

> inventariseren? Afspraken maken over wie wat bewaart?

12. Hoe bewaar je e-mails en bijlagen?

13. Hoe groeiende aantal schenkingen (documenten, boeken

en foto’s) te archiveren? Per dossier, per onderwerp of

overdragen aan andere instellingen?

10. LINKS IN EXCEL

• bestanden NIET plakken in EXCEL

• plak een path of webadres

• http:// link (file op een webserver)

• file:\\192.168.1.2\mijnhuiswerk.pdf (op een netwerklocatie)

• file:\\mijnhuiswerk.pdf (in dezelfde map)

11. VERSPREIDING DRAGERS &

COLLECTIES

• goed beheer vereist goede metadata

• minimale registratie > 12 CIDOC velden

• collectiebeschrijving > 27 COMETA BASIS velden

• identificeer coherente verzamelingen en collecties

• maak afspraken over beheer per verzameling of

collectieverantwoordelijkheid beheer afspreken

12. E-MAILS & ATTACHMENTS

BEWAREN?

• opslaan als eml, attachments en e-mails bij elkaar houden

• in cloud zetten biedt oplossing voor bewaarprobleem >

cloud service neemt die zorg over maar creëert ook

afhankelijkheid > export als eml is niet mogelijk

• e-mails binnentrekken in desktop e-mail client, hierin

oplossing om e-mails en attachments samen te houden bij

omzetting naar eml

13. (DIGITALE) SCHENKINGEN

• ‘oude’ orde bewaren

• verpakken in een digitale container (zip, bagit)

• checksum maken voor het pakket (MD5)

• schenking beschrijven (COMETA) in csv bestand

• opslaan in een netwerk met back-up

V. GEBREK AAN TOEGANG

14. Hoe bibliotheek in PDF te ontsluiten als eigen website

beperkt is?

15. Hoe best documenten publiceren op het web?

14. PDF PUBLICEREN ZONDER

WEBSITE

DIY:

•file-server (HTTP)

•op een specifiek domein

•mappen: titel-jaargang-volume

•persistente ID’s: titel-jaargang-volume

Publiek domein materiaal:

•wikisource.org > primaire bronnen

•gutenberg.org > literatuur

15. DOCUMENTEN PUBLICEREN OP

HET WEB?

1. Maak de beschrijvingen uniek en persistent

identificeerbaar

• verzeker voor elk object uniek identificatienummer

• gebruik enkel alfanumerieke tekens, hyphens en

underscores

• maak voor elk object een URI, bepaalt hoe object

op web genoemd wordt.

• leg syntax van URI formeel vast.

• gebruik een domeinnaam die je instelling

controleert

• maak gebruik van het HTTP-protocol om de URI te

koppelen aan een webpagina (landing page) met

de identificatiegegevens van het object

15. DOCUMENTEN PUBLICEREN OP

HET WEB?AAN TOEGANG

2. Geef aan welke intellectuele eigendomsrechten berusten

op het object

• bij elk object Credit Line die aangeeft of er

intellectuele rechten op object rusten en wie

rechten beheert

• bij elke digitale representatie Credit Line die

aangeeft wie intellectuele rechten op digitale

representatie beheert

• Geef aan onder welke voorwaarden inhoud van

webpagina beschikbaar gesteld wordt

15. DOCUMENTEN PUBLICEREN OP

HET WEB?

3. Maak website leesbaar voor verschillende browsers

• codeer inhoud van webpagina's in valide HTML

4.01 of later

• codeer vormgeving door gebruik van Cascading

Stylesheets

• gebruik voor digitale representaties

bestandsformaat dat goed leesbaar is en door

gangbare browsers wordt ondersteund

• zorg dat website toegankelijk is voor mensen met

fysieke beperking

4. Maak de webpagina vindbaar op het web

• correct gebruik van beschikbare HTML-elementen

• Plaats belangrijkste identificatiegegevens van

collectiestuk de hoofding van pagina.