a könyvtári és egyéb szabványok vérpezsdítő világa

27
Miként lehet régi online kiadványokat automatikusan frissíteni a könyvtárban? Helyett: A könyvtári és egyéb szabványok vérpezsdítő világa

Upload: kiraly-peter

Post on 14-Dec-2014

1.086 views

Category:

Documents


1 download

DESCRIPTION

A Bárczi Ildikó emlékére rendezett konferencián (ELTE BtK, 2009. április 24. http://hipertext.hu/story/az-iim-konferenciat-rendez-barczi-ildiko-emlekere-meghivo) tartott előadásomban szerettem volna röviden ismertetni a MARC utáni világot. Azt hiszem nem sikerült ;-) Az első négy slide arról szól, hogy az úgynevezett qqq-kódolással készült kritikai kiadást hogyan lehet automatikusan szabványos TEI XML-lé, és abból HTML-lé konvertálni. De nem hiszem, hogy ez 3 emberen kívül többnek mondana bármit is. Viszont nem tudom, hogy az RDA-ról született-e más prezentáció magyarul ezen kívül.

TRANSCRIPT

Page 1: A könyvtári és egyéb szabványok vérpezsdítő világa

Miként lehet régi online kiadványokat automatikusan

frissíteni a könyvtárban?

Helyett:A könyvtári és egyéb szabványok

vérpezsdítő világa

Page 2: A könyvtári és egyéb szabványok vérpezsdítő világa

automatikus frissítés

1. Módosítsd a dokumentumot a kedvenc szövegszerkesztődben

2. Ha nem friss szövegszerkesztőd van, akkor tölts le egy ingyenes OpenOffice.org-ot, nyisd meg a dokumentumodat és mentsd el ood-ként.

3. Futtasd le az XSLT programokat4. Az eredményt töltsd fel.

Page 3: A könyvtári és egyéb szabványok vérpezsdítő világa

magyarázat #1

Az OpenOffice.org, a Word 2003, Word 2007 (egymással nem kompatibilis) XML fájlokat állít elő, csak be vannak zip-elve és át vannak nevezve.

Két XSLT konverziós lépés:.ood/.docx -> TEITEI -> navigálható XHTML (erre vannak kész

stíluslapok)

Page 4: A könyvtári és egyéb szabványok vérpezsdítő világa

magyarázat #2

XSLT: kiterjeszthető stíluslap, ami tranzformációs szabályokat tartalmazhat, pl.

<cím/> → <title/><cím>Egri Csillagok</cím> → <title>Kogallisc

Irge</title>XSLT 2.0: több funkció (pl. szabványos

kifejezések/regular expression), kiterjesztett modell, de alacsony támogatottság (Javára: Saxon)

Page 5: A könyvtári és egyéb szabványok vérpezsdítő világa

nehézségek

qqq típusú jegyzetek (nincs explicit szöveghatároló, hanem mintaillesztéssel kell megtalálni a szöveg elejét)

debug (programfolyamat leállítása/állapotellenőrzés/újraindítás) hiánya

unit test (előre megírt automatikus tesztek) hiánya

Mindkettőre van workaround

Page 6: A könyvtári és egyéb szabványok vérpezsdítő világa

szabványok

Mottók:Content is king!*MARC must die!** (Roy Tennant, ex-California

Digital Library, OCLC [Library Journal, 2002 Oct. 15])

* Minden szabványnak az a célja, hogy a tartalomhoz hozzáférjenek az olvasók

** és alkalmazkodniuk kell a kurrens elvárásokhoz

Page 7: A könyvtári és egyéb szabványok vérpezsdítő világa

szabványokmetaadatok MARC és a posztmodern EAD, EAC, ISAG(G), ISAAR(CFP), ISDF (International

Standard for Describing Functions), ISDIAH (International Standard for Describing Institutions with Archival Holdings)

szolgáltatások Web service Z39.50 és a posztmodern (SRW/SRU) OAI-PMH OpenSearch

Page 8: A könyvtári és egyéb szabványok vérpezsdítő világa

Mi a baj a MARC-kal?

„There are only two kinds of people who believe themselves able to read a MARC record without referring to a stack of manuals: a handful of our top catalogers and those on serious drugs.”

szerkezet (formátum, kódolás, karakterkódolás, 200 mező, 1800 almező (és mindig kiderül, hogy ez kevés: Farkas-Keveházi vita, vagy „hova tegyük a borítóképeket?”), nyelvváltozatok: MARC21, OCLC MARC, USMARC, HUNMARC stb.)

tartalom (kapcsolatok hiánya, "cédulás" megközelítés, 'pontozás‘, inkompatibilis mezők)

Page 9: A könyvtári és egyéb szabványok vérpezsdítő világa

RDF formális ajánlat: RDF (Resource Description Framework) Matematikai modell: a és b dolog között fenn áll valamilyen definiált, rögzített kapcsolat, pl. „ a

Toldi szerzője Arany János”. Lehetőleg mind a három rész azonosítaható legyen, hogy más állításokkal össze lehessen vetni. Az

azonosítás formája az URI, ami mögött állhat (de nem kötelezően) tényleges erőforrás (pl. WordNet definíció), de például egy „lámpának is lehet URI-je”.

Az RDF-nek egy szintaxisa az XML Az RDF kiterjesztései:

RDF séma (tulajdonságok definiálása) Ontológia (OWL nyelv) – a kapcsolatok, entitások formális leírása (magyarul pl. Családszerkezti ontológia)

RDF alkalmazások: Fényképezőgépek RSS feed SKOS (Simple Knowledge Organization System – tezauruszokra Ontológiák, pl. MarcOnt LoC rekordok RDF-ben

távlat: következtető struktúrák (ha A és B között fennáll x, és B és C között fennáll y, és x és y között fennáll k, akkor A és C között fennáll l, pl. A gép számára is érthetővé válhat „menj fogat mosni” – „még nem vagyok álmos” – „de holnap ovi” párbeszéd mögött húzódó gondolati szerkezet)

Page 10: A könyvtári és egyéb szabványok vérpezsdítő világa

FRBRelvi ajánlat: FRBR (Functional Requirements for Bibliographic Records) – avagy Káldos János régi elképzeléseA MARC nem számol azzal, hogy a könyvnek nem csak kiadása van, hanem vannak példányai (megkülönböztethető egyedi tulajdonságokkal, ld. A Gutenberg-bibliás viccet) és van a mű, amit kiadtak, aminek általános tulajdonságai vannak. Az FRBR ajánlata:

Work - a "mű", pl. Egri csillagokExpression - kifejezési formája (interpretációja), pl. film változatManifestation - tárgyiasulása (könyvkiadás) - a MARC szintjeItem - az egyedi példány (pl. az, amelyiket a gyerekek kiszínezték)

Az egyes szintek között relációk állnak fenn

Page 11: A könyvtári és egyéb szabványok vérpezsdítő világa

FRBR #2

Egyéb entitások:

2. csoport:PersonCorporate bodyFamily

3. csoport:ConceptObjectEventPlace

Egyéb kapcsolatok:

isPartOf

isOwnedByisCreatedByisRealizedByisProducedBy

hasAsSubjecthasAGenreisKnownBy

Page 12: A könyvtári és egyéb szabványok vérpezsdítő világa

FRBR-izálás (förbörizálás)

"FRBR-izálás": a MARC rekordokból FRBR struktúrákat kialakítani.OCLC algoritmus.Open Source változat: XC algoritmus

Az FRBR fogalmi keretrendszer. Konkrét megvalósítás a jelenleg vázlat-szintű RDA (Resource Description and Access).Az RDA első impementációja: XC schema

Page 13: A könyvtári és egyéb szabványok vérpezsdítő világa

RDA (Resource Description and Access)

FRBR-alapúnagyban épít az URI-kre (vagyis az FRBR és RDF

szerelemgyermeke)hangsúly a források közti kapcsolatokon és szerepekena szöveges azonosítóknak és könyvtárosi

megjegyéseknek kis szerep jutonline termék (esetleges nyomtatott „derivatívákkal”)cél: a weben legyenek jelen a katalógus-adatoktöbbféle kódolási sémával használható (MODS, MARC,

DC stb.) felhasználóra fókuszál (Find, Identify, Select, Obtain)

Page 14: A könyvtári és egyéb szabványok vérpezsdítő világa

RDA #2 keretrendszerként használható, a DC, MARC stb. sémákat ki lehet

egészíteni új funkcionalitásokkal, pl. a rekordok közti kapcsolatokkal könyvtárosok találták ki, de a levéltári, múzeumi alkalmazás épp

ilyen kézenfekvő formátum-, hordozó- és (számítógépes-) rendszerfüggetlen források: FRBR, FRAD (Functional Requirements for Authority Data),

AACR2 (Anglo-American Cataloguing Rules), Párizsi elvek ("Statement of International Cataloguing Principles" 2009), és a jó öreg ISBD (International Standard Bibliographic Description), DE az RDA nem követi az ISBD sorrendjét és (végre) agyő pont-pont-vesszőcske

Page 15: A könyvtári és egyéb szabványok vérpezsdítő világa

Részlet az RDA entitás diagramjából

Page 16: A könyvtári és egyéb szabványok vérpezsdítő világa

az RDA ellen

Az RDA túlságosan szélsőségesAz RDA nem elég szélsőséges

Page 17: A könyvtári és egyéb szabványok vérpezsdítő világa

az RDA túlzóaz ISBD mellőzése visszalépésaz FRBR csak elmélet, nem gyakorlatérthetetlen a nyelvezeteaz igért előnyök nem szavatolják a befektetéstmás szakmák nem veszik hasznáta szabályok egyszerűsítése minőségromlással jára sokféle közönségnek való megfelelési kényszer

„összepiszkítja” a könyvtári szabványokatátképzési költségek, zavarodottság3-ik utas megközelítés (1.) szabványok 2.) tagelők +

Google fiúk)

Page 18: A könyvtári és egyéb szabványok vérpezsdítő világa

az RDA túl óvatos sok a szöveg (több URI-t a leírásba!) túl hosszú és specifikus: csak könyvtárosok olvassák el, más

nem fogja használni, születése pillanatában a „múlt szabványa”

a visszafelé kompatibilitás gátja az igazi változásoknak az RDBR integrációja csak felszíni kísérlet nem lehet analóg és digitális dolgokat egy szabvánnyal

leírni, választani kell! a felhasználók (és az implementátorok) nem veszik hasznát

a túlstruktúráltságnak, kevesebb több megmaradtak olyan agyrémek, mint az "elsődleges"

"másodlagos" besorolás, vagy az "egységesített cím"

Page 19: A könyvtári és egyéb szabványok vérpezsdítő világa

ISAD(G)

ISAD(G) (General International Standard Archival Description) – a levéltári iratok leírása, kb. mint a könyvtári leíró rekord: ki, mikor, hol hozta létre az iratot, mi a jelzete, státusza. Párhuzamos történet: EAD.

Page 20: A könyvtári és egyéb szabványok vérpezsdítő világa

ISAAR(CFP)

ISAAR(CFP) (International Standard Archival Authority Record for Corporate Bodies, Persons, and Families) – a levéltári „azonosító leírás” (authority record).Célja az, hogy a fontosabb személyek, családok, szerverezet/testületek egyetlen iratai elérési ponton keresztül hozzáférhetőek legyenek. (A könyvtárban csak a névalakot ellenőrzik)

Page 21: A könyvtári és egyéb szabványok vérpezsdítő világa

ISDF

ISDF (International Standard for Describing Functions) – a levéltárban őrzött iratokban előforduló funkciók leírása, pl. válóper, telekkönyvezés, birtokadomány, végrendelkezésA kutató számára értelmesek lesznek olyan

terminusok, mint az „árvaszéki irat”, átlátja a hivatali ügymenetet

Page 22: A könyvtári és egyéb szabványok vérpezsdítő világa

ISDIAHISDIAH (International Standard for Describing

Institutions with Archival Holdings) – a levéltárként működő intézmények leírása (speciális magyar haszon a régi (városi, egyházi, testületi, testvérületi stb.) levéltárak és az utóintézmények kapcsolatainak azonosítása)

Ezek a szabványok nem foglalkoznak az implementációval, fogalmi készletet adnak. Legfontosabb implementáció az EAD és EAC.

Page 23: A könyvtári és egyéb szabványok vérpezsdítő világa

levéltári szabványok: forma EAD (Encoded Archival Description) – a levéltári leírás XML

szabványa. Érdekesség a levéltári szintek kezelése (fond, állag stb.)Párhuzamos és megfeleltethető az ISAD(G)-vel

EAC (Encoded Archival Context) – az azonosító leírás XML szabványa. Nem pusztán authority (vagyis azonosítás), hanem kontextus.Párhuzamos és megfeleltethető az ISAAR(CFP)

Az EAC és az ISAAR(CFP) nem csak levéltárban alkalmazható, hanem nagyon jó eszköz névterek számára.

Vannak EAD-megfeleltetési táblázatok az ISAD(G)-hez, MARC-hoz, minősített Dublin Core-hoz, vagyis (bizonyos megszortásokkal) konvertálhatóak a rekordok ide-oda.

Page 24: A könyvtári és egyéb szabványok vérpezsdítő világa

szolgáltatási szabványok:

webszolgáltatásA webszolgáltatás olyan gépek közötti kommunikáció, amely bizonyos szabványokra épül. Általában XML-re épülnek, de lazább, alternatív formák is léteznek.Erősödik a szemantikus web hatása ezen a területen is.Technológiai (hogyan?) és tartalmi (mit?) szabványok

Page 25: A könyvtári és egyéb szabványok vérpezsdítő világa

Z39.50, SRW/SRU

Z39.50: HTTP protokollra épülő web 0.1-es szolgáltás

bonyolult szintaxissalCélja elsősorban a keresésKötött szintaxis

SRW/SRU (Zing): Z39.50 + web szolgáltatási szabványok + XML

Page 26: A könyvtári és egyéb szabványok vérpezsdítő világa

OAI-PMHNagy tömegű rekord átadása másik félnek weben

keresztülEgyszerű-de-nagyszerű eszköz az adatok

megosztásáraA metadatat formátumát nem szabályozza, lehet

bármilyen XML (MARCXML, EAD, DC)Inkrementális betakarítás: csak t dátum utáni

rekordokat kéremMagyar* implementáció: NDA• * nem az örkényi értelemben

Page 27: A könyvtári és egyéb szabványok vérpezsdítő világa

OpenSearch Ipari szabvány a keresési találatok megosztására

(tartalom-szindikálás, aggregálás) Az Amazon találta ki, gyorsan átvette a Google, Sun,

IBM, MS OneBox típusú keresés, sok paraméter a találati listára Nincs megkötve a keresőkérdés szintaxisa Sem a válasz szintaxisa (csak annyira, mint az OAI

esetében) Felhasználás: elosztott keresés, előfizetés hírolvasóba,

inkrementális találati lista, böngésző plugin