Transcript
Page 1: Netextové objekty jako součást databáze kvalifikační prací AMU

Horová, Chvála: Netextové objekty jako součást databáze VŠKP

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

Netextové objekty jako součást databáze kvalifikační prací AMU

Iva Horová

Radim Chvála

Page 2: Netextové objekty jako součást databáze kvalifikační prací AMU

Horová, Chvála: Netextové objekty jako součást databáze VŠKP

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

1.Praxe tvorby dokumentů na AMU2.Budování repositáře3.Úpravy repositáře4.Vazby repositáře na okolí5.Praktická ukázka6.Co dál?

Netextové objekty jako součást databáze kvalifikační prací AMU

Page 3: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

3

1. 1 Výchozí situace: na AMU jako jinde

Produkce textových i netextových materiálů

Bakalářské práceDiplomové

práceDisertační práceSeminární

práceRočníkové práceSemestrální

práceA jiné práce (výukové materiály)

Page 4: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

4

Běžná situace na vysokých školách

Textová část(povinná)

Různé přílohy

NázevVedoucíOponentiAnotaceKlasifikace…….

1. 2. porovnání situace na AMU s jinými VŠ

Závěr studia – JEDNA kvalifikační práce

Page 5: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

5

Situace na AMU

Textová část(povinná)

Závěr studia – „kvalifikační výkon“ tj. NĚKOLIK prací

Název VedoucíOponenti AnotaceKlasifikace…….

„Kvalifikační výkon“ 1

Různé přílohyNázev jinýVedoucí jinýOponenti jiníAnotace jináKlasifikace jináÚčinkující jiní apod.…….

„Kvalifikační výkon“ 2

Různé přílohyNázev jinýVedoucí jinýOponenti jiníAnotace jináKlasifikace jináÚčinkující jiní apod.…….

1. Výchozí situace na AMU1. 2. porovnání situace na AMU s jinými VŠ

Různé přílohy

Page 6: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

6

PŘÍKLADY:• teoretická práce + scénář hry (text)• teoretická práce + film• teoretická práce + soubor fotografií• teoretická práce + role v divadel. představení• teoretická práce + interpretační výkon• teoretická práce + pedagogický výstup• teoretická práce + scénografická dokumentace

různá technická kvalitavelké objemy dat ….

Specifika závěrečných prací AMU

1. 2. porovnání situace na AMU s jinými VŠ

Page 7: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

7

KOS: základní typy kvalifikačních prací:

• Teoretická tj. textová „hlavní“ práce – typ A • Hra, scénář (textová, ale ne „hlavní“) – typ B • Film, videozáznam – typ C • Interpretační výkon – typ D • Skladba – typ E

Pro každý typ: • zvláštní formulář• vytvářen SAMOSTATNÝ metadatový záznam

2. Budování repositáře:1. 2. porovnání situace na AMU s jinými VŠ

Pracovní třídění VŠKP na AMU

Page 8: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

8

Vybudovat pro AMU institucionální repositář

s některými archivními funkcemi.

ZADÁNÍ:

Cílem je operativní nástroj sloužící k rychlému nalezení dokumentů a snadnému posouzení jejich

zajímavosti a dostupnosti.

Vybudovat pro zpřístupňování institucionální repositář

s některými archivními funkcemi.

Page 9: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

9

• Vnější a vnitřní legislativa• Výběr zpřístupňovaných typů souborů• Výběr SW pro repositář a jeho úpravy• Workflow

2. Budování repositáře

Page 10: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

10

Vnější legislativa

Zákon 111/1998, § 47b – novela požaduje zveřejňování VŠKP:

• Výnos rektora AMU č. 2/2006 o zveřejňování závěrečných prací;

• Výnos rektora AMU č. 3/2006 – Metodika zpracování, ukládání a zpřístupňování VŠKP;

• Výnos rektora AMU č. 4/2006 – Pokyn pro tvorbu a jednotnou úpravu VŠKP;

• Autorsko-právní problematika• Popisná metadata - standard MS-EVSKP (eVŠKP)• Standardy bibliografického popisu (knihovna)

2.1 Budování repositáře – legislativa

Page 11: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

11

Vnitřní legislativa

Autorsko-právní problematika:

• AMU uzavírá licenční smlouvy s autory• Definováno několik stupňů• Autor přiděluje konkrétní práva ke konkrétní práci• Přiděluje práva v okamžiku odevzdávání práce ve

studijním informačním systému (KOS)• Autor má možnost zpřístupnění zamítnout – pak

budeme jen archivovat• Konkrétní přidělená práva se zobrazují i v repositáři

2.1 Budování repositáře – legislativa

Page 12: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

12

Další východiska – interní zásady AMU

- Knihovní katalog je prvním místem pro uživatele- Systém musí zajišťovat:

• exporty i do knihovního katalogu• vazby z katalogu do repositáře• vyhledat informace o souvisejících dokumentech• komfort i pro „nestandardní“ uživatele

- Textová práce je „nadřazená“ i když obvykle není rozhodující pro kvalifikaci

- Hierarchie záznamů (matka, dcery)

- Dopracování metadat a bibliografického popisu

2.1 Budování repositáře – legislativa

Page 13: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

13

V roce 2008 přijat systém Dspace

Výhody:• Malá finanční náročnost (open source)• Jednoduchá instalace a administrace, úpravy, lokalizace• Podpora standardů (XML, DC, METS…)• Podpora interoperability - OAI-PMH server • Podporuje volný i zabezpečovaný přístup (LDAP,…)• Výkonný vyhledávací mechanismus, i fulltext• Nejsme osamoceni, řada VŠ, (web, setkání VŠB TUO,…)

Perzistentní identifikátor - Handle

2.2 Výběr vhodného SW

Page 14: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

14

Workflow metadata

• Výchozí systém pro sběr – Studijní inf. systém - KOS• Export metadat, vznik záznamu v Dspace• Přidělení perzistentního identifikátoru Handle• Export do Tinlibu• Doplnění věcného popisu v Tinlibu (předmětové

skupiny, klíčová slova,…) - knihovníci• Přidání (import) věcného popisu do Dspace

• Vystavení pro harvest (zatím pro theses.cz - MU)

2.3 Workflow

Page 15: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

15

Formáty digitalizovaných dokumentů

• Textové, statické obrazové a kombinované dokumenty

• Zvukové dokumenty

• Videozáznamy

PDF/A-1a

mp3

flv, 720 x 576px D1-PAL, 1500 kbps

Plné verze netextových prací budou k dispozici na katedrách

Výběr formátů se vyvíjí - např. usnesení Vlády ČR č. 1338 ze dne 3. 11. 08

„NÁHLEDOVÉ“ FORMÁTY:

2.3 Workflow – volba formátů

Page 16: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

16

Workflow plné verze (spolupráce s ČVUT)

• Převod plných „textů“ do stanovených formátů:• texty, statické obrázky – PDF/A-1a – (nutná

standardizace pro fulltextové vyhledávání) nástroj: print2pdf - S602

• Audio – mp3 – není problém• Video – FLV - problém obecně, ani AMU nemá jasno,

FAMU nechce „YouTube“ – sledujeme trendy• Nahrávání do Dspace – zatím ručně• Zpřístupnění v souladu s licenční smlouvu v Dspace

Plné verze mimo AMU nepředáváme

2.3 Workflow

Page 17: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

17

• Struktura metadat• Vazby mezi souvisejícími záznamy• Extrakce pro fulltext. vyhledávání (pdf)• Další úpravy (vzhled, …)

3. Úpravy repositáře Dspace:

Page 18: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

18

1. NameSpace: Dublin Core ze základní instalace

2. NameSpace: AMU – elementy chybějící do MS-EVSKP:a. Autor IDb. Datum nar. autorac. Kód katedryd. Název katedrye. ID studia, ke kterému patří prácef. Typy práce (formuláře A, B, C)

Metadatový soubor je rozšiřitelný za provozu

3.1 Úpravy Dspace – struktura metadat

DC AMU

MS eVŠKP

Page 19: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

19

3.1 Úpravy Dspace – struktura metadat – přidané prvky

Page 20: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

20

- Vytvořit virtuální objekt - „závěr studia“, fiktivní záznam, URI a k němu pospojovat související objekty

- Využít vztahů „nadřízená / podřízená“ práce

3.2 Úpravy Dspace – vazby mezi příbuznými záznamy

Je několik možností:

Page 21: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

21

- Vytvořit virtuální objekt - „závěr studia“, fiktivní záznam, URI a k němu pospojovat související objekty

- Využít vztahů „nadřízená / podřízená“ práce „Obsahuje / Je částí“

3.2 Úpravy Dspace – vazby mezi příbuznými záznamy

Je několik možností:

Page 22: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

22

Textová část (A) – NADŘÍZENÝ ZÁZNAM

– dc.relation.hasPart – „Obsahuje“

Ostatní typy (B, C) – PODŘÍZENÉ ZÁZNAMY - dc.relation.isPartOf - „Je částí“

3.2 Úpravy Dspace – vazby mezi příbuznými záznamy

Použit prvek dc.relation hasPart / isPartOfatributy

Page 23: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

23

3.2 Úpravy Dspace – vazby mezi příbuznými záznamy

Textová práce (A) – nadřízený záznam

Page 24: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

24

3.2 Úpravy Dspace – vazby mezi příbuznými záznamy

Ostatní práce (B, C) – podřízený záznam

Page 25: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

25

3.2 Úpravy Dspace – vazby mezi příbuznými záznamy

Ostatní práce (B, C) – podřízený záznam

Dspace – browse:

Page 26: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

26

3.3 Úpravy Dspace – extrakce textu pro fulltext. hledání

Page 27: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

27

3.3 Úpravy Dspace – extrakce textu pro fulltext. hledání

Mediafilter: pdfBox pdfToText

Page 28: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

28

3.4 Úpravy Dspace – další úpravy – vzhled, en. mutace

Page 29: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

29

4. Vazby repozitáře na okolí

• Interoperabilita – OAI-PMH• Úpravy pro knihovní systém Tinlib• Možnosti vystavení metadat pro jiné

harvestory

Spolupráce s okolními systémy

Page 30: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

30

4.1 interoperabilita - OAI PMH

• Dspace má vlastní server OAI (podpora protokolu OAI-PMH), který zajišťuje vystavení metadat pořízených v Dublin core

• Java plugin byl upraven aby zpracovával též přidaná metadata (MS eVSKP)

• Úprava jsou ve stabilní části kódu, nebude ovlivněna případnými dalšími upgrade

Harvest (zatím) pro „theses.cz“ (MU)

Page 31: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

31

Na základě hodnoty elementu worktype<dcvalue element="worktype" qualifier="none">A</dcvalue>

Textová práce (A) – NADŘÍZENÝ ZÁZNAMMonografie

Netextová práce (B, C, …) – PODŘÍZENÝ ZÁZNAM Článek

4.2 Úpravy pro Tinlib

XML soubor získaný exportem z Dspace je konvertován technologií XML/XLST ( + procesor SAXON) na importní soubor pro Tinlib

Page 32: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

32

4.3 Možnosti vystavení metadat pro jiné repozitáře (UK)

Dspace obsahuje modul pro vystavení dat ve formátu METS/MODS, kontejnerování souvisejících záznamů

Page 33: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

33

4.3 Možnosti vystavení metadat pro jiné repozitáře (UK)

Dspace obsahuje modul pro vystavení dat ve formátu METS/MODS, kontejnerování souvisejících záznamů

Page 34: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

34

4.3 Možnosti vystavení metadat pro jiné repozitáře (UK)

Pokus s UVT UK - DigiTool

Page 35: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

35

A nyní praxe…

Page 36: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

36

Studijní Informační Systém KOS

Zadání práce- katedra

Údaje o práci - student

Repozitář AMU -> Dspace

Knihovní systém knihovníci -> Tinlib

Knihovní systém čtenáři -> Tinweb

Ruční zpracování

Národní registr VŠKP„theses“ MU Brno -> veřejnost

Plný text - student

Soubor PDF/A

PLNĚNÍ ZÁZNAMŮ O VŠKP

Harvest OAI PMH

Page 37: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

37

Studijní Informační Systém KOS

Zadání práce- katedra

Údaje o práci - student

Repozitář AMU -> Dspace

Knihovní systém knihovníci -> Tinlib

Knihovní systém čtenáři -> Tinweb

Ruční zpracování

Národní registr VŠKP„theses“ MU Brno -> veřejnost

Plný text - student

Soubor PDF/A

PLNĚNÍ ZÁZNAMŮ O VŠKP

Harvest OAI PMH

Page 38: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

38

Studijní Informační Systém KOS

Zadání práce- katedra

Údaje o práci - student

Repozitář AMU -> Dspace

Knihovní systém knihovníci -> Tinlib

Knihovní systém čtenáři -> Tinweb

Ruční zpracování

Národní registr VŠKP„theses“ MU Brno -> veřejnost

Plný text - student

Soubor PDF/A

PLNĚNÍ ZÁZNAMŮ O VŠKP

Harvest OAI PMH

Page 39: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

39

VYHLEDÁVÁNÍ ZÁZNAMŮ

Repozitář AMU

Dspace

Knihovní systém Tinweb

Vše z AMU

Národní registr VŠKP - THESES

Vše z vysokých škol

v ČR

Uživatel

Plná verze – text/náhled

Page 40: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

40

VYHLEDÁVÁNÍ ZÁZNAMŮ

Repozitář AMU

Dspace

Knihovní systém Tinweb

Vše z AMU

Národní registr VŠKP - THESES

Vše z vysokých škol

v ČR

Plná verze – text/náhled

Uživatel

Page 41: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

41

Prostor pro ukázky

on line…

Page 42: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

42

Dále…

Ve spolupráci s Komisí eVŠKP a komunitou Dspace:- Terminologie- Archivace – technicky- Relations zapracovat do Metadatového standardu MS-

EVSKP

Komunita Dspace:- Přístupová práva – struktura- Zobrazení hierarchie záznamů

Co dále:

Page 43: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

43

pro NETEXTY - PLNÉ VERZE?:• Umělecký výkon• Umělecké dílo• Praktická částapod.pro CELEK:• Kvalifikační výkon• Diplomový úkol

Bude mít o tyto záznamy zájem theses.cz ?

Terminologie

Příspěvek do diskuse

Page 44: Netextové objekty jako součást databáze kvalifikační prací AMU

Horová, Chvála: Netextové objekty jako součást databáze VŠKP

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

Děkuji za pozornost

Dotazy?

[email protected]

[email protected]

Page 45: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

45

Page 46: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

46

Page 47: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

47

Page 48: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

48

Page 49: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

49

Page 50: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

50

Page 51: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

51

Page 52: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

52

Page 53: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

53


Top Related