imamo li repozitorij i što učiniti da bismo ga imali (i nakon kvara opreme)
DESCRIPTION
Imamo li repozitorij i što učiniti da bismo ga imali (i nakon kvara opreme). Zoran Svrtan, viši informatičar voditelj Informatičke službe Muzeja za umjetnost i obrt, Zagreb. Repozitorij – definicija. AKM repozitorij. Čuvanje i zaštita. Za kraj. vrlo popularna riječ - PowerPoint PPT PresentationTRANSCRIPT
Imamo li repozitorij i što učiniti da bismo ga imali (i nakon kvara opreme)
Zoran Svrtan, viši informatičarvoditelj Informatičke službe
Muzeja za umjetnost i obrt, Zagreb
Repozitorij – definicijaRepozitorij – definicija
AKM repozitorijAKM repozitorij
Čuvanje i zaštita Čuvanje i zaštita
Za kraj ...Za kraj ...
vrlo popularna riječ repository – 51 milijun odgovora repositories – 10 milijuna repozitorij – 91 tisuća
za usporedbu museum – 224 milijuna culture – 600 milijuna library – 700 milijuna sex – 663 milijuna
3/150
Repozitorij je spremište digitalnog, elektroničkog materijala.
sužena definicija, primijenjena na specifični predmet prikupljanja:
Repozitorij je zbirka digitalnog materijala koja omogućuje sustavno upravljanje procesima objavljivanja, pristupa i pohrane (tog specifičnog) sadržaja.
4/150
brojni repozitoriji prisutni na mreži – Internetu prikupljaju i daju mogućnost korištenja različitih sadržaja knjižničari, informacijske znanosti
sadržaj institucijski, orijentirani na arhive pojedinih institucija ili
organizacija tematski, okupljaju najrazličitije dokumente vezane uz određeno
interesno područje.
dostupnost mrežni, manje ili više javno dostupni repozitoriji institucijski, lokalno dostupni repozitoriji, obično bogatiji
sadržajima, najčešće nisu javno dostupni
5/150
Pitanja koja bi se mogla postaviti:
1.Trebaju li nam AKM repozitoriji?
2.Imamo li AKM repozitorije?
3.Što učiniti da bismo ih (i dalje) imali?
6/150
repozitoriji - vodeća uloga u nastupajućem informacijskom društvu
repozitorijske platforme mijenjaju samu prirodu obrazovnih procesa
"ex katedra" vs proces stalnog dopunjavanja znanja i samopoučavanja iz raznih izvora
klasični izvori znanja vs digitalni sadržaji digitalni sadržaji dostupni na medijima za lokalnu
upotrebu - CD, DVD ili na Internetu
Internet - medij koji svima daje podjednaku mogućnost pristupa informacijama
7/150
AKM zajednica, kao jedan od najvećih imaoca raznih kulturnih, povijesnih, arhivskih, itd. podataka idealni je izvor znanja, a znanje je "roba" koja se sve više cijeni.
Sumnje nema - trebaju nam - repozitoriji mogu pružiti mnoge potrebne informacije velikom broju korisnika.
8/150
pogledamo li na Internetu, naći ćemo: repozitorij hrvatskih školskih knjižničara Instituta Ruđer Bošković raznih fakulteta razne informatičarske stranice koje spominju
repozitorije
ni traga muzejskim ili arhivskim repozitorijima ne znači da ih nema ... samo ih nisam našao ili
nisu imenovani repozitorijima, nego bazama podataka, arhivima i slično.
9/150
u smislu spremišta digitalnog materijala - sva naša računala i podaci na njima mogla bi se shvatiti kao repozitorij, malo neorganiziran, ali ipak - repozitorij.
10/150
stvaranje repozitorija ozbiljan proces definiranja podataka koji se
pohranjuju, odabira softvera za realizaciju projekta, definiranja formata i metapodataka, razrješavanja autorskih prava, popunjavanje početnim podacima, objava (puštanje u rad)
onda možemo reći da imamo repozitorij.
11/150
Ministarstvo kulture RH pokrenulo je 2005. Nacionalni program digitalizacije arhivske, knjižnične i muzejske građe.
Prijedlog programa završen je u listopadu 2006.
u 2007. godini pokrenut je projekt "Hrvatska kulturna baština"
u 2008. javnosti je prikazan portal projekta www.kultura.hr
12/150
kooperativnost - zajednički rad na prezentaciji hrvatske baštine
svaka AKM institucija pomaže u slaganju mozaika hrvatske kulture
da bi se digitalizacija mogla provoditi standardizirano, osnovane su radne grupe za definiranje smjernica za pripremu projekta, odabir građe, odabir formata itd.
13/150
Zašto se uopće materijalna građa digitalizira?digitalizacija radi zaštite izvornikadigitalizacija radi poboljšanja dostupnostidigitalizacija radi stvaranja nove ponudedigitalizacija radi upotpunjavanja fonda
14/150
rezultat projekta – repozitorij (pa i ako se tako ne bude zvao)
preporučeno štivo: Nacionalni program digitalizacije arhivske,
knjižnične i muzejske građe smjernice za
odabir i pripremu građe norme i postupke u digitalizaciji formate za dugoročnu pohranu oblikovanje digitalnih zbirki
15/150
Uloga je repozitorija da pruži pouzdan, dugotrajan pristup digitalnim resursima, sada i u budućnosti.
brojni autori zabrinuti čuvanjem, održavanjem, pouzdanošću i trajnošću repozitorija
nakon stvaranja – održavanje i očuvanje
16/150
digitalna građa – lagana za čuvanje i multipliciranje, može se lako izgubiti, oštetiti ili nepovratno uništiti
kvar opreme (računala ili medija) bez odgovarajuće, unaprijed promišljene strategije čuvanja može dovesti do katastrofalnih posljedica
jednostavno rješenje - redovna izrada pričuvnih kopija može uspješno vratiti podatke.
17/150
Što je s promjenama tehnologije? Što kada se pokvare uređaji? Što kada mediji ne budu čitljivi?
18/150
Koji su mogući scenariji gubitka podataka u računalnom svijetu?
Ljudski faktor – neodržavanje, slučajno brisanje Zastarijevanje
Zastarijevanje hardvera Zastarijevanje softvera Zastarijevanje formata Zastarijevanje medija
Kvarovi Kvar hardvera (izuzev diskovnog podsustava) Kvar diskova Kvar kontrolera Kvar medija za backup
19/150
ljudski faktor - stalna edukacija i kontrola bez obzira na uloženi trud greške uzrokovane
ljudskim faktorom ne mogu se izbjeći
zastarijevanje - trajno investiranje i usvajanje najnovijih tehnologija
stalni veliki tehnološki napredak oprema koja je danas nova i u pogonu, zapravo je već
na rubu zastarjelosti zastarjevanje softvera zastarjevanje formata
20/150
mediji za pohranu diskete ZIP drive diskete magneto-optički diskovi - WORM (Write Once Read
Many) CD i DVD potreba za sve većim kapacitetima medija, razvijaju
su novi mediji i standardi nasljednik DVD-a - Blu-ray disk u razvoju su holografski mediji gdje je granica ?
21/150
nove tehnologije, glad za sve većim i boljim digitalnim fotografijama, dovode do potrebe za pohranjivanjem sve većih količina podataka
digitalizacija materijalne građe danas uobičajeni, lako dostupni, ne
preskupi, fotoaparati, sa slikom od 10 megapixela proizvode TIFF fotografiju od 28,5 MB.
24 fotografije popuniti će jedan CD22/150
Glavni “krivac” za rast količine podatakanesretan spoj dobre digitalne kamere i neobuzdanog korisnika
mediji za pohranu sve više i više nedostatni, bez obzira na svoj kapacitet.
Problem količine podataka, s tehničke strane, nije nerješiv.
Progres u elektronici dozvoljava stalno širenje kapaciteta za pohranu uz sve manju i manju cijenu po megabajtu podataka.
24/150
odabir medija za pohranu repozitorij dostupan preko weba mora biti negdje pohranjen
naš poslužitelj poslužitelj nekog od pružatelja internetskih usluga
Za pretpostaviti je da se podaci na tim poslužiteljima (bilo našim ili tuđim) redovito spremaju (bekapiraju) na odgovarajući način.
spremanje podataka našeg „neurednog repozitorija“ svatko na računalu ima važnih podataka trenutak spremanja na neki medij i odlaganje odabir medija jednostavan i lagan – CD ili DVD razočaranje – spremljeni podaci ne mogu se pročitati s medija! Zašto? Kupili smo najpovoljniji (čitaj: najjeftiniji) medij, snimili smo ga
maksimalnom brzinom, na gornju površinu napisali smo sadržaj, ostavili medij u košuljici na stolu nekoliko dana i nakon toga ugurali u kutiju u nekom ormaru ili ladici.
25/150
početne tvrdnje proizvođača – 50 - 100 godina korisnici često istiću kako su mediji koje su
snimili već nakon kraćeg vremena (nekoliko mjeseci do nekoliko godina) postali djelomično nečitljivi, i to unatoč, naoko, besprijekornom stanju i pažljivom rukovanju
OSTA (Optical Storage Technology Association) ne preporuča vrijeme skladištenja nesnimljenih medija duže od 5 do 10 godina
pretpostavka - niti snimljeni medij ne bi trebao biti skladišten duži period
26/150
najnovija istraživanja trajnost procjenjuju na samo godinu dana
ne znači da će svaki medij potpuno propasti nakon godinu dana, ali statistički gledano povećana je vjerojatnost pojave grešaka na mediju
trajnost medija može se povećati odgovarajućim skladištenjem - potrebna je posebna prostorija, s klimatizacijom, kontrolom vlage ... ali garancije nema.
27/150
Zašto tako drastični pad procijenjene trajnosti CD i DVD medija?
vjerojatno je zbog smanjivanja cijene proizvodnje došlo do promjena u tehnologiji proizvodnje i materijalima koji se koriste što je rezultiralo smanjenom trajnosti medija
pokazalo se da su jeftini mediji znatno nepouzdaniji od skupljih medija, što bi trebalo potvrditi prethodnu tvrdnju
28/150
preporuka – koristiti “zlatne” medije snimljene medije redovito kontrolirati nakon godinu dana presnimiti (ako je
potrebno i ranije) očuvanje digitalnog sadržaja ne ovisi o
mediju na kojem se čuva, tj. o očekivanom vijeku trajanja medija, nego o mogućnosti transfera sadržaja s jednog medija na drugi, i to što je češće moguće
29/150
kvar CD ili DVD medija, ili hard diska – postoje razni programi koji su u stanju pročitati sve ili dio podataka i sa oštećenih medija i uspješno ih spremiti
usluge poduzeća za spašavanje podataka s oštećenih medija
vrlo spor i mukotrpan posao potrebno je procijeniti da li se isplati spašavanje
podataka u Hrvatskoj postoji samo jedno poduzeće koje se
bavi ovim vrlo skupim i osjetljivim poslom
30/150
kvar računala investicija u novo računalo instalacija softvera rekonstrukcija podataka
kvar diskovnog podsustava (diskova ili kontrolera) problem pronalaženja odgovarajućih
komponenti
31/150
poslužiteljska računala - SCSI (Small Computer Serial Interface) diskovi spojeni na odgovarajuće kontrolere
RAID (Redundant Array of Independent Disks) funkcije
diskovi povezani, podaci se zapisuju tako da se podatak razdijeli i istovremeno spremi na više diskova koristeći usput i algoritme za zaštitu i povrat podatka u slučaju kvara bilo kojeg od diskova
moguće su razne RAID konfiguracije, najčešće su: RAID 0, RAID 1, RAID 5
32/150
SCSI standard - mnoge revizije i unaprijeđenja.
postoji i nekoliko različitih vrsta konektora na diskovima.
ukoliko se pokvari kontroler na vašem 5 godina starom poslužiteljskom računalu i želite ga zamijeniti – bad luck
ako nemate sreće (niti backup) – podaci su izgubljeni.
33/150
ako se pokvari disk u istom takvom računalu – ista priča
potreban vam je disk istog ili većeg kapaciteta, ali obavezno istog konektora.
u današnje vrijeme brzog napretka elektronike, teško je nabaviti novi, ispravan, tehnološki nekoliko godina star uređaj
danas se u elektronici uređaji proizvode godinu dana (ako i toliko) i nakon toga se prodaju - kako to vole reći - do isteka zaliha.
34/150
do gubljenja podataka vrlo često dolazi zbog nepažnje
pazite da u „velikom spremanju“ ne obrišete i ono što niste namjeravali
ono što vam ne treba nemojte brisati – radije to preselite u mapu koju ćete nazvati Staro ili Nepotrebno ili Arhiva
ako vam treba još diskovnog prostora – kupite dodatni disk, kapaciteti diskova danas su dovoljno veliki, a diskovi su jeftini
35/150
jedini siguran način zaštite od gubitka podataka je izrada sigurnosnih kopija – backupa
backup je ime za redoviti periodični postupak izrade sigurnosnih kopija pomoću nekog od za tu svrhu namijenjenih programa ili za ručno kopiranje podataka
backupova ima nekoliko vrsta – Normal, Copy, Incremental, Differential, Daily
36/150
Normalni backup spremiti će odabrane datoteke i označiti ih kao spremljene,
copy će ih spremiti, ali ih neće označiti kao spremljene,
inkrementalni način će pogledati što se promijenilo od prošlog backupa, spremiti samo promjene i te datoteke će označiti kao spremljene,
diferencijalni backup će učiniti isto, ali neće obilježiti datoteke,
dnevni backup će spremiti samo ono što se promijenilo ili dodalo danas.
37/150
datoteke spremljene nekim od programa za backup, obično su spremljene u pakiranom obliku (zbog uštede prostora, poboljšane kontrole spremanja na medij i slično) i nisu direktno čitljive, nego ih istim alatom treba vratiti natrag (restore)
potreban velik oprez - da ne bi vratili i ono što nam ne treba - recimo starije verzije datoteka na kojima smo u međuvremenu radili
38/150
za naša poslovna računala možemo pojednostaviti stvar - uzmimo potpuni ili djelomični backup
potpuni backup će presnimiti kompletni sadržaj diska. To najčešće nije nužno, jer možda nije sve podjednako važno.
djelomični backup će presnimiti samo odabrane dijelove diska – recimo samo mapu s dokumentima
najjednostavnije učiniti običnim kopiranjem - postupak je jednostavan, a podaci su uvijek dostupni u obliku u kakvom su bili i na našem disku. Još jedna korist - ne trebaju nam posebni programi za backup.
39/150
preporučljiva minimalna strategija – kad osjetite potrebu (dakle ne radi se o redovnom postupku), napravite kopiju onoga za što mislite da vam je izuzetno važno (ne kopija svega i ne kopija cijelog određenog dijela)
srednja strategija bila bi redovito, periodično (ovisno o tempu stvaranja sadržaja) spremanje kompletne mape s podacima (ili svih mapa s podacima, ovisno o strukturiranosti spremanja podataka na disku).
maksimalna strategija, svakodnevno spremanje svega, ali taj pristup nema (uvijek) svoje opravdanje
40/150
da bi naši podaci bili sigurni, trajno dostupni i zaštićeni, potrebna je:
unaprijed promišljena strategija čuvanja i održavanja, kako podataka, tako i softverske i hardverske opreme
unaprijed osigurati sredstva dostatna za provedbu te strategije
potrebno se te strategije i pridržavati.
To je jedini način na koji možemo biti sigurni da će naši podaci, naši repozitoriji biti trajno dostupni nama i drugim korisnicima.
A jel ima još puno ?
PPPP