přenos vŠkp pomocí protokolu oai-pmh
DESCRIPTION
Přenos VŠKP pomocí protokolu OAI-PMH. Ing. Jan Mach Vysoká škola ekonomická v Praze. The Open Archives Initiative Protocol for Metadata Harvesting. - PowerPoint PPT PresentationTRANSCRIPT
Systémy pro zpřístupňování eVŠKP 2008, 7.9.2008 Brno
Ing. Jan Mach, [email protected] Vysoká škola ekonomická v Praze
Přenos VŠKP pomocí protokolu OAI-PMH
Ing. Jan Mach
Vysoká škola ekonomická v Praze
Systémy pro zpřístupňování eVŠKP 2008, 7.9.2008 Brno
Ing. Jan Mach, [email protected] Vysoká škola ekonomická v Praze
The Open Archives Initiative Protocol for Metadata Harvesting
„OAI-PMH je jednoduchý protokol, umožňující „poskytovatelům služeb“ automatické získávání (sklízení) metadat nabízených „poskytovateli dat“. Díky těmto vlastnostem a díky mnoha volně dostupným softwarovým komponentám je protokol možné snadno implementovat do stávajících systémů digitálních knihoven.“
Žabička, Petr. OAI-PMH: Protokol pro metadatovou imperoperabilitu
Systémy pro zpřístupňování eVŠKP 2008, 7.9.2008 Brno
Ing. Jan Mach, [email protected] Vysoká škola ekonomická v Praze
Výchozí zadání• Databáze MySQL, metadata EVSKP-MS 0.1
– www.vse.cz/vskp
• Export ve formátu EVSKP-MS verze 1.1– www.evskp.cz/standardy/evskp
• Export protokolem OAI-PMH 2.0http://www.openarchives.org/OAI/openarchivesprotocol.html
Systémy pro zpřístupňování eVŠKP 2008, 7.9.2008 Brno
Ing. Jan Mach, [email protected] Vysoká škola ekonomická v Praze
Základní pojmy• Harvester
– NR VŠKP
• Repozitář– www.vse.cz/oai
• Jednotka• Unikátní identifikátor
– oai:vse.cz:vskp/4367
• Záznam– Dublin Core a EVSKP-MS
v. 1.1
• Sada– 100: Vysokoškolské
kvalifikační práce
• ResumptionToken– volitelné pro dlouhé
seznamy záznamů, nebylo na VŠE využito
Systémy pro zpřístupňování eVŠKP 2008, 7.9.2008 Brno
Ing. Jan Mach, [email protected] Vysoká škola ekonomická v Praze
OAI-PMH dotazy statické• Identify
– http://www.vse.cz/oai?verb=Identify– jméno repozitáře, e-mail administrátora, podpora smazaných
záznamů, složení identifikátoru aj.• List Metadata Formats
– http://www.vse.cz/oai?verb=ListMetadataFormats – seznam metadatových formátů
• povinný nekvalifikovaný DC (oai_dc)• EVSKP-MS (oai_evskpms)
• List Sets– http://www.vse.cz/oai?verb=ListSets – seznam datových sad, např. pro VŠE 100 = VŠKP
Systémy pro zpřístupňování eVŠKP 2008, 7.9.2008 Brno
Ing. Jan Mach, [email protected] Vysoká škola ekonomická v Praze
OAI-PMH dotazy s parametry• List Identifiers
– http://www.vse.cz/oai?verb=ListIdentifiers&from=2008-01-01&until=2008-01-03&metadataPrefix=oai_evskpms
– seznam identifikátorů záznamů dle daného období a metadatového formátu
<header> (opakující se prvek pro každý záznam z daného období) <identifier>oai:vse.cz:vskp/4823</identifier> <datestamp>2008-01-02T11:04:55Z</datestamp></header>
Systémy pro zpřístupňování eVŠKP 2008, 7.9.2008 Brno
Ing. Jan Mach, [email protected] Vysoká škola ekonomická v Praze
OAI-PMH dotazy s parametry• List Records
– http://www.vse.cz/oai?verb=ListRecords&from=2008-01-01&until=2008-01-02&metadataPrefix=oai_evskpms
– obdoba List Identifiers, navíc vrací metadata
• Get Record– http://www.vse.cz/oai/?verb=GetRecord&metadataPr
efix=oai_evskpms&identifier=oai:vse.cz:vskp/4840– vrací metadata pro zadaný formát a jeden identifikátor
Systémy pro zpřístupňování eVŠKP 2008, 7.9.2008 Brno
Ing. Jan Mach, [email protected] Vysoká škola ekonomická v Praze
Ukázka záznamuhttp://www.vse.cz/oai?verb=GetRecord&metadataPrefix=oai_evskpms&identifier=oai:vse.cz:vskp/4840
…<record> (opakující se prvek se záhlavím a metadaty) <header> (záhlaví, viz List Identifiers) <identifier>oai:vse.cz:vskp/4840</identifier> <datestamp>2008-0102T10:10:35Z</datestamp> </header> <metadata> (vnořená metadata v daném formátu) <evskp:metadata …> <dc:title xml:lang="cs">Finanční deriváty</dc:title> <dcterms:created>2007-12-20</dcterms:created>
<evskp:transfer accessRights="domain" fileID="14998">http://www.vse.cz/vskp/id/14998</evskp:transfer> </evskp:metadata> </metadata></record>…
Systémy pro zpřístupňování eVŠKP 2008, 7.9.2008 Brno
Ing. Jan Mach, [email protected] Vysoká škola ekonomická v Praze
Realizace na VŠE• Práce programátora na 1 týden včetně
nastudování OAI-PMH a EVSKP-MS• Programováno v PHP vůči stávající databázi
MySQL s metadaty• Defaultní stránka index.php
+6 stránek pro jednotlivé příkazy• Stahování plných textů podle prvku
<evskp:transfer />, nutno povolit externí IP
Systémy pro zpřístupňování eVŠKP 2008, 7.9.2008 Brno
Ing. Jan Mach, [email protected] Vysoká škola ekonomická v Praze
Realizace na VŠE• BaseURL: http://www.vse.cz/oai• Validace EVSKP-MS pomocí validator.nu a
Relax NG schéma• Testováno pomocí Repository Explorer
http://re.cs.uct.ac.za/• V současné době naimportováno
do NR VŠKP z VŠE přes OAI-PMH téměř 7000 záznamů EVSKP-MS verze 1.1
Systémy pro zpřístupňování eVŠKP 2008, 7.9.2008 Brno
Ing. Jan Mach, [email protected] Vysoká škola ekonomická v Praze
1) http://www.vse.cz/oai1) http://www.vse.cz/oai
4) funkce, zdeList Identifiers
1) http://www.vse.cz/oai
2) Raw XML, none
3)2008-01-012008-01-03oai_evskpms
http://re.cs.uct.ac.za/
Systémy pro zpřístupňování eVŠKP 2008, 7.9.2008 Brno
Ing. Jan Mach, [email protected] Vysoká škola ekonomická v Praze
Přenos VŠKP pomocí protokolu OAI-PMH
Ing. Jan Mach
Vysoká škola ekonomická v Praze