u vraagt, wij scannen grootschalig digitaliseren van archivalia op verzoek van de klant vgi...
Post on 08-Jun-2015
214 Views
Preview:
TRANSCRIPT
U vraagt, wij scannen
Grootschalig digitaliseren van archivalia op
verzoek van de klant
VGI Studiemiddag 12 sep 2008
Marc Holtman Stadsarchief Amsterdam
Alle inhoud is geïndexeerd door zoekmachines zoals Google
Zijn we nu klaar?
De aanleiding
Sinds 2004 zijn alle inventarissen van het SAA online via website beschikbaar
Het zoeksysteem werd al meteen na lancering intensief gebruikt
Online inventarissen
Voor inzage in de stukken moet nog steeds een bezoek worden gebracht aan de studiezaal
“Waar zit de knop om de plaatjes te bekijken”?
De Archiefbank
Inventarissen zijn vanuit het oogpunt van de gebruiker beperkt
De meest gestelde vraag van onze gebruikers was dan ook
“Waar zijn de plaatjes?”
En zij er 25.000 geregistreerde Archiefbank gebruikers
Oftewel, de Archiefbank:
In 2006 hebben we besloten om die knop te ontwikkelen
Op dit moment bevat de Archiefbank meer dan 5.000.000 scans
De eerste versie is in juli 2007 gelanceerd
De Archiefbank
Een systeem voor het raadplegen en downloaden van archivalia via het web
“Waar zijn de plaatjes?”
Als we alle aanvragen voor digitalisering kunnen verwerken dan kunnen we concluderen dat er geen achterstand is in digitalisering en dat de doelstelling dat de gebruiker stukken digitaal kan raadplegen is gehaald
Waar dus mee te beginnen?
Het SAA beheert 32 kilometer archief
Alle openbare inventarisnummers kunnen voor digitalisering worden aangevraagd
Uit een onderzoek naar aanvragen van originelen op studiezaal blijkt: er zijn geen publieksfavorieten
U vraagt
Digitaliseren op verzoek van de klant
In de Archiefbank stelt de gebruiker daarom de prioriteiten in digitalisering
Hoeveel tijd kost het om 32 km archief te digitaliseren?
1 meter archief = 7.000 scans
Bij een productie van 10.000 scans per week
is na 431 jaar elk stuk gedigitaliseerd
Dit kan alleen maar worden gerealiseerd wanneer aan twee voorwaarden wordt voldaan:
De levertijd moet zo kort als mogelijk zijn
U vraagt
Korte levertijd
1. Een gestroomlijnd, efficiënt georganiseerd werkproces voor grootschalige digitalisering
2. Een snelle, gebruikersvriendelijke webapplicatie
We hebben daarom een nieuw werkproces ontwikkeld, met
De gebruiker zal dus vaak een groot aantal scans nodig hebben
Archiefonderzoek loopt al snel in de tientallen, tot honderden documenten
Dit betekent dat de productiekosten zo laag als mogelijk moeten blijven
De prijs moet in het verlengde liggen van de prijs van een eenvoudige kopie op studiezaal
U vraagt
Lage kosten
Grootschaligheid en kwaliteit afgestemd op het gebruiksdoel als uitgangspunten
Voorbeeld aanvragen
He, betalen voor scans?
Het probleem met raadplegen van scans van archivalia is dat een kwaliteit “minder dan leesbaar” geen nut heeft
Het SAA stelt levering van een reproductie via het web gelijk aan levering van een kopie op studiezaal
En méér dan leesbaar ook niet
Maar wat vindt het publiek hiervan?
Bijvoorbeeld Aad en Jan?
Toch heeft digitalisering natuurlijk wel een conserveringsfunctie: de originelen hoeven het depot in principe niet meer te verlaten
En NIET als a substituut voor de originelen
De scans gemaakt in dit reproductieproces zijn gemaakt voor raadplegen door de gebruiker
Wij scannen
Voor archiefonderzoek via het web
Conservering van de originelen blijft de belangrijkste zorg
De documenten die in dit proces worden gedigitaliseerd zijn
Wij scannen
Een breed spectrum aan documenttypen
Klein en groot formaat (tot formaat krant)Klein en groot formaat (tot formaat krant)
Losse en vastbladige eenhedenLosse en vastbladige eenheden
KaartsystemenKaartsystemen
Oud en modern materiaalOud en modern materiaal
Laag en hoog contrast documentenLaag en hoog contrast documenten
Tekst, en tekst en beeldTekst, en tekst en beeld
Hybride vormenHybride vormen
Voor alle documenttypen geldt dezelfde kwaliteitsstandaard
Om de kosten zo laag als mogelijk te houden volgt de kwaliteitsstandaard uit het gebruiksdoel
De kwaliteitsstandaard luidt als volgt
Wij scannen
Met een kwaliteitsstandaard gebaseerd op het gebruiksdoel
Raadplegen van gedigitaliseerde archivalia via het scherm of in print
Informatie leesbaar in het origineel moet leesbaar zijn in de scan
Een punt op de i moet als zodanig herkenbaar zijnEen punt op de i moet als zodanig herkenbaar zijn
Reproductie papierstructuur en exacte kleurreproductie niet van hoogste belangReproductie papierstructuur en exacte kleurreproductie niet van hoogste belang
Prijsvergelijking (gemiddeld)
Foto : 2 – 4 Euro
Archivalia, Metamorfoze: 0,65 Euro
Archivalia, Archiefbank: 0,20 Euro
Om ook de opslagkosten zo laag als mogelijk te houden slaan we geen ongecomprimeerde bestanden op
Wij bewaren
Geen aparte, ongecomprimeerde scans
Kleurruimte RGB
Bittdiepte 8 bits per kanaal
Curve (“contrast”)zodanig dat de scans op zowel een beeldscherm als print leesbaar zijn
Opslagformaat JPEG
Compressie kwaliteit 10 (Photoshop)
Dit resulteert in een scan met:
Op de webserver worden afgeleiden gemaakt voor inzoomen en contrastfilter
voorbeeld
De scans worden opgeslagen in ons interne digitaal depot én op de webserver (alle images zijn online beschikbaar)
Wij bewaren
Geen aparte, ongecomprimeerde scans
Een relatief kleine bestandsgrootteEen relatief kleine bestandsgrootte
Uitstekende leesbaarheid op scherm en printUitstekende leesbaarheid op scherm en print
Genoeg flexibiliteitGenoeg flexibiliteit
Wij hebben een reproductieproces ontwikkeld waarin we ongeveer 10.000 scan per week op basis van klantaanvragen (plus aanvulling eigen selecties) kunnen verwerken
Bovendien hebben we in-huis een workflowsysteem ontwikkeld dat optimaal aansluit op de bestaande systemen en procedures
Maar ook grootschalige digitalisering op projectbasis volgt dit proces
Er zijn nauwelijks richtlijnen en best practices voor grootschalige digitalisering
Het reproductieproces
Ontwikkeling van het reproductieproces
Aanvragen voordigitalisering
Einde
Reproductieproces: overview
Selectiebestand
ToegangsnrInventarisnummer
Selecties SAA
Controle,uitleenregis en
aanmakenorders
Orderbestand
ToegangsnrInventarisnummer
VindplaatsOrdernummer
Niet gehonoreerd
ToegangngnrInventarisnummer
Reden
Orderbonnenmaken
Beoordelingoriginelen
voorbewerkingoriginelen
Logistiekevoorbereiding
Transport
Scanning
Originelenretour depot
Registratiebestandsn
Export EAD
Import enverwerking
Scanrapport
OrdernrAantal scans
Transport
Ordersannuleren
Einde
1
we
ek
1
we
ek
2
da
ge
n
Vo
or
be
re
id
in
gS
ca
nn
in
g
(e
xt
er
n)
Or
ig
in
el
en
r
et
ou
r,
u
pl
oa
d
im
ag
es
e
n
re
gi
st
ra
ti
e
Verwijderenorderbonnenen registratie
ordernrs
Originelen retour
Ordernr
Nietok
Nietok
Ok
Ok
Upload images
Archiefbank
Analoog
Beheer-systemen
Rapportage
Tekstbestand
Extern
Uitleenregisstukken retour
L e g e n d a
Orderbonnen
Totaaloverzicht
Einde
Bericht aanklant
Bericht aanklant
Einde
Bergen DVDsin depot
Identificatie op basis van orderbonnen
Uitgangspunten
Uitgaan van bestaande metadata
Het complete inventarisnummer wordt altijd gescand
Constante productie (10.000 scans, +/- 1,4 meter)
Customerrequest
SelectionsSAA
Order-numbers
Checkoriginals
Preparation
Scanning
Originals torepositry
Registrfilenames
ExportEAD
Import
Cancelorder
End
Notok
Ok
Uploadimages
Ordertickets
Workflow (simplified)
Customerrequest
SelectionsSAA
Order-numbers
Checkoriginals
Preparation
Scanning
Originals torepositry
Registrfilenames
ExportEAD
Import
Cancelorder
End
Notok
Ok
Uploadimages
Ordertickets
Workflow (simplified)
Betekenisloze bestandsnamen
Identificatie op basis van orderbonnen
Uitgangspunten
Uitgaan van bestaande metadata
Het complete inventarisnummer wordt altijd gescand
Constante productie (10.000 scans, +/- 1,4 meter)
Customerrequest
SelectionsSAA
Order-numbers
Checkoriginals
Preparation
Scanning
Originals torepositry
Registrfilenames
ExportEAD
Import
Cancelorder
End
Notok
Ok
Uploadimages
Ordertickets
Workflow (simplified)
Customerrequest
SelectionsSAA
Order-numbers
Checkoriginals
Preparation
Scanning
Originals torepositry
Registrfilenames
ExportEAD
Import
Cancelorder
End
Notok
Ok
Uploadimages
Ordertickets
Workflow (simplified)
Archiefbank aanvraag Beheersystemen
A03764000001
Order
Orderbon
Filename
A03764
A03764000001
Order number
Serial number
Scanning order
A03764000001
A03764000002
A03764000003
Range:A03764000001 – A03764999999
Archief 195
Invnr 836
Order
A03764
A03764000004
A03764000005
Scanrapport
A03764000001
A03764000002
A03764000003
A03764000004
A03764000005
12 digits
Barcode
registration
Na registratie komt de betekenis van het ordernummer te vervallen
We kunnen daarom spreken van betekenisloze bestandsnamen
Import
Intensieve samenwerking met digitaliseerder
Betekenisloze bestandsnamen
Identificatie op basis van orderbonnen
Uitgangspunten
Uitgaan van bestaande metadata
Het complete inventarisnummer wordt altijd gescand
Constante productie (10.000 scans, +/- 1,4 meter)
Geen kwetsbaar of op onconventionele wijze verpakt materiaal
Scanning is uitbesteed
Customerrequest
SelectionsSAA
Order-numbers
Checkoriginals
Preparation
Scanning
Originals torepositry
Registrfilenames
ExportEAD
Import
Cancelorder
End
Notok
Ok
Uploadimages
Ordertickets
Workflow (simplified)
Customerrequest
SelectionsSAA
Order-numbers
Checkoriginals
Preparation
Scanning
Originals torepositry
Registrfilenames
ExportEAD
Import
Cancelorder
End
Notok
Ok
Uploadimages
Ordertickets
Workflow (simplified)
Eenvoudige voorbewerking
Het reproductieproces is gestroomlijnd, efficiënt is georganiseerd, en geautomatiseerd waar mogelijk
De back- en frontofficesystemen gebruikersvriendelijk zijn en optimaal aansluiten op de behoeften van klant en medewerker
De kwaliteit van de scans, compressie en bestandsformaat zijn afgestemd op het gebruiksdoel
Conclusies
Grootschalig digitaliseren van archivalia voor lage kosten en met een korte levertijd is mogelijk wanneer:
En tenslotte…
De Archiefbank is genomineerd voor de Computable “ICT project van het jaar” Award
De andere kandidaten zijn grote commerciële giganten
Degene met de meeste stemmen wint
Help ons daarom om deze prijs te winnen en breng uw stem uit:
http://www2.computable.nl/computableawards/stem/
top related