introductie pdf(/a) voor stadsarchief amsterdam
TRANSCRIPT
PDF(/A): een introductie16 en 23 maart 2009
Stadsarchief
Door: Robèrt Gillesse
Doel van deze cursus
Inzicht geven in het PDF(/A) formaat Zelf een PDF/A kunnen herkennen en
maken
Opzet van deze cursus
Wettelijk kader Wat is een PDF en een PDF/A? Hoe te lezen, herkennen, maken? Beperkingen en problemen PDF(/A) Beveiliging en digitale handtekening Toekomst PDF(/A) Oefening: herkennen en maken PDF/A
Wettelijk kader Artikel 25 van concept (2008) van de nieuwe ministeriële
regeling Geordende en toegankelijke staat archiefbescheiden : 1. Digitale archiefbescheiden worden, uiterlijk op het tijdstip
van overbrenging, opgeslagen in een gevalideerd en volledig gedocumenteerd open standaard formaat, tenzij dit redelijkerwijs niet van de zorgdrager kan worden verlangd. Alsdan vindt met de beheerder van de voor overbrenging aangewezen archiefbewaarplaats overleg plaats over een alternatief bestandsformaat. 2. Gebruikmaking van encryptietechniek is niet toegestaan. 3. Gebruikmaking van compressietechniek is slechts
toegestaan, voor zover daarbij geen informatieverlies ontstaat.
Actieplan Nederland Open in Verbinding NOiV (EZ)Overheidsstreven gebruik open
standaarden Van dit actieplan beveelt actielijn 6 ODF
aan voor reviseerbare documentenNaar aanleiding van deze actielijn heeft
het Forum Standaardisatie PDF/A-1a geselecteerd als formaat voor niet reviseerbare, te archiveren documenten
Wat is een PDF?Een uitwisselbestand voor niet-
reviseerbare documenten Reviseerbare documenten: ODF, DOCStamt uit 1992 Ontwikkeld vanuit postscript door AdobePDF 1.7 sinds begin 2008 een ISO normDus niet langer eigendom AdobeAchterwaartse comptabiliteit: een PDF
uit 1993 is nog zonder problemen leesbaar
Mogelijkheden PDFMogelijkheden PDF inmiddels enorm
uitgebreid:Soorten documenten (office, cad, 3d, digitaal geboren, gescand)NavigatieInteractiviteit (multi media, formulieren) en JavascriptLagen en transparantieBeveiliging en authenticatieOpname andere bestanden binnen 1 PDF
PDF op basis digitaal geboren document
Digitaal geboren (bv Ms Word .doc) document wordt “bevroren” Inhoud, opmaak en functionaliteit zoveel
mogelijk bewaardEventueel voorzien van extra
functionaliteit (navigatie, beveiliging)
PDF op basis gescande documenten
Gescande documenten kunnen worden opgeslagen als losse afbeeldingen (Archiefbank) maar ook als PDFVoordelen: één bestand ipv talloze
afbeeldingen, volgorde vastgelegd, OCR kan in PDF worden opgenomenNadelen: verhoogde complexiteit, PDF
op basis afbeeldingen kan heel zwaar worden, “bevroren” staat probleem wanneer er fouten zijn gemaakt
Subsets PDF
PDF kent meerdere “subsets”, m.a.w. gespecialiseerde PDF’s: PDF/X (drukwerk)PDF/E (engineering)PDF/A (archivering)
Idee achter PDF/A
Onafhankelijkheid van hard- en software
Self-contained (bevat alle bronnen voor betrouwbare weergave)
Zelfbeschrijvend
Voorbeeld ingesloten fontsZie in Acrobat:documenteigenschappen
Twee “conformance levels” PDF/A
PDF/A-1a: Voldoet aan volledige eisen van de standaard. Logische structuur (koppen, paragrafen etc) van tekst zijn bewaard. Ook wel ‘tagged PDF’. Elk karakter verwijzing naar Unicode.
PDF/A-1b: Voldoet aan minimale eisen van de standaard. Correcte weergave, maar geen onderliggende structuur.
Voorbeeld PDF/A-1a:documentstructuurZie in Acrobat:Linkermenu tagsof codes
Restricties PDF/A t.o.v. reguliere PDFGeen multimedia (audio, video, 3D)Geen ingebedde bestandenGeen transparantie of lagenBeperkte kleurruimtesGeen beveiliging en encryptieGeen externe referenties naar benodigde
viewersoftware of fonts Geen interactiviteit (‘Form Fields’,
Javascript)Geen LZW en JPEG 2000 compressie
Maken van een PDF/ASoftware nodig die PDF/A kan maken:
vaak is de creatie van PDF/A een optieHet creëren van een PDF/A kan op
verschillende manierenDesktop: via printfunctie of via applicatieVia Adobe Acrobat of een vergelijkbare
tool. PDF’s dan ook in batches te maken.Op een server
Maken van een PDF/A via de printopdracht. Op deze manier gecreëerde bestanden zijn altijd PDF/A-1b.
Maken van een PDF-A via Adobe Maker in MsWord. Op deze manier gecreërde PDF/A’s zijn PDF/A-1a.
Hoe een PDF/A te herkennen
Geen aparte extensie: gewoon .pdfGeen rechter muisknop / eigenschappenNiet in Adobe ReaderWel in Adobe Acrobat (vanaf versie 7):
blauwe balk en PreflightVia “ingest” software die
bestandsformaten kunnen herkennen: JHOVE
Controle na migratie naar PDF/A
Let op inhoud en opmaak goed is overgekomen. In uitzonderlijke gevallen gaat dit niet
goed. Let op regeleindes, vreemde tekens, tabellen, kolommen etcEventueel te testen met complex
opgemaakte bestanden (‘torture’ files)
Problemen en beperkingen PDF/A
Grootste probleem op dit moment is het ontbreken van eenheid aan welke technische eisen een PDF/A precies moet voldoenValidatie: Ene tool is strenger dan de
andereConversie PDF naar PDF/A ook
problematischBestaande PDF collecties als zodanig
opslaan
Beveiliging PDF(/A)
Uitgebreide set aan mogelijkheden voor beveiliging (DRM) In PDF kan beduidend meer dan PDF/APrint en of kopieer beveiliging (PDF)Encryptie en wachtwoordbeveiliging
(PDF)Digitale handtekening (PDF/A)
Voorbeeld beveiligingin PDF PDF/A-1aZie in Acrobat:documenteigenschappen
Voorbeeld digitale handtekening
Toekomst PDF(/A)
Nu versie PDF/A-12010 versie PDF/A-2 (ISO 19005-2):Gebaseerd op PDF versie 1.6Transparantie en lagenJPEG2000Geen 3D en multimedia (PDF/A-3)
Software: Hopelijk verbetering van validatieVerwachting: PDF een archief standaard
waar PDF/A niet kan voldoen
Food for thought
Misschien is het beter PDF/A conversie gecontroleerd – bijv via DMS - te laten plaatsvinden ipv via desktop applicaties.Gebruik goede toolsVoer controle uit na conversieHet herkennen van een PDF/A is
moeizaamHet belang van goed en
gestandaardiseerd opgemaakte documenten is groot
Verder lezen PDF/A Competence Centre: http://pdfa.org/ PDF naar PDF/A conversie: Franks L.Walker ea, PDF File Migration
To PDF/A: Technical Considerations IS&T Conference 2007. http://lhncbc.nlm.nih.gov/lhc/docs/published/2007/pub2007020.pdf Advies Forum Standaardisatie betreffende PDF/A:
http://www.forumstandaardisatie.nl/fileadmin/OVOS/2_Expertadvies_PDFA-1_v1.0.PDF Advies hoe een goed archiefdocument aan te maken: Judith Rog,
PDF Guidelines, Recommendations for the creation of PDF files for long-term preservation and access (2007). http://www.kb.nl/hrd/dd/dd_links_en_publicaties/PDF_Guidelines.pdf
Binnenkort te publiceren door Stadsarchief Amsterdam: Richtlijn standaard bestandsformaten voor tekstdocumenten Aanbevelingen migratie tekstdocumenten naar PDF/A