europeana newspapers: novo mesto susreta korisnika digitalnih sadržaja
TRANSCRIPT
“Europeana Newspapers”- novo mesto susreta korisnika digitalnih sadržaja -
Nataša Dakić, Aleksandra TrtovacUniverzitetska biblioteka “Svetozar Markovic”, Beograd
Deveti međunarodni susreti bibliotekara slavista Sarajevo, april, 14.–17. 2013
2
Projekat “Europeana Newspapers”
Zašto novine?• relevantan izvor informacija za sve građane• visoko relevantan izvor informacija za istraživače
Stanje novina u bibliotekama između raja i pakla• solidni kompletni originali, izuzetne kopije na
mikrofilmovima• krti, lomljivi originali, nekompletni brojevi, suplementi
3
Projekat “Europeana Newspapers”
• Projekat traje od februara 2012. do januara 2015.
• Finansiran je od strane Evropske komisije u okviru petog poziva Programa podrške razvoju politike informaciono-komunikacionih tehnologija (CIP ICT-PSP Best Practice Network 5thCall)
• Koordinator projekta je Državna biblioteka u Berlinu(Staatsbibliothek zu Berlin)
4
Partneri u projektu
• 17 partnera iz 12 zemalja:• Nacionalne biblioteke• Univerzitetske biblioteke• LIBER i CSS
5
Partneri u projektu
• Državna biblioteka u Berlinu • Nacionalna biblioteka Estonije • Univerzitet u Helsinkiju • Nacionalna biblioteka Francuske • Nacionalna biblioteka Letonije• Univerzitet u Beogradu • Biblioteka dr Fridrih Tesman • Univerzitet u Salfordu• CCS Content Conversion
Specialists GmbH
• Nacionalna biblioteka Holandije • Austrijska nacionalna biblioteka • Univerzitet u Hamburgu • Nacionalna biblioteka Poljske • Nacionalna biblioteka Turske • Univerzitet u Insbruku • Britanska biblioteka • The European Library (TEL)• LIBER fondacija
Pridruženi partneri u projektu
• Nacionalna biblioteka Češke• Nacionalna i univerzitetska biblioteka, Ljubljana, Slovenija• Nacionalna i univerzitetska biblioteka Islanda• Nacionalna i univerzitetska biblioteka, Zagreb, Hrvatska• Nacionalna biblioteka „Sveti Ćirilo i Metodije“, Bugarska• Centralna univerzitetska biblioteka Lucian Blaga, Rumunija• Nacionalna biblioteka Velsa• Nacionalna biblioteka Portugala• Nacionalna biblioteka Španije• Nacionalna biblioteka Belgije• Nacionalna biblioteka Luksemburga
7
Ciljevi projekta “Europeana Newspapers”
• Europeana će postati najveći provajder panevropskih novinskih kolekcija
• Istražiti stanje novinskih zbirki u evropskim bibliotekama
• Obezbediti kvalitetne kopije i doneti preporuke za dalji rad što se tiče digitalizacije, prečišćavanja teksta, metapodataka...
• Poboljšati pristup zbirkama novina u Evropi
8
Ciljevi projekta “Europeana Newspapers”
• Tokom projekta Evropskoj biblioteci (TEL – The European Library) i Europeani će biti dostavljeno oko 18 miliona digitalizovanih strana novina od kojih su mnoge u punom tekstu
9
Agregacija i prečišćavanje teksta
• Korišćenje metoda za optičko prepoznavanje teksta (OCR -Optical Character Recognition) je predviđeno za 10 miliona strana
• Segmentacija članaka (OLR - Optical Layout Recognition) je predviđena za 2 miliona strana
• Prepoznavanje imenovanih entiteta (NER - Named Entity Recognition) obezbeđuje Nacionalna biblioteka Holandije za sve materijale na nemačkom, engleskom i holandskom jeziku
NER - Named Entity Recognition
Metapodaci
• Razvoj i unapređenje standarda za opis tehničkih metapodataka za optičko prepoznavanje teksta -METS/ALTO
• Dalji razvoj Evropskog modela za metapodatke (EDM -European Data Model) i usaglašavanje sa METS/ALTO standardom
• Transformacija lokalnih metapodataka u EDM model
Pristup do punog teksta
• Složena pretraga sadržaja punog teksta preko:• Ključnih reči• Imenovanih entiteta• Zbirki novina• Datuma, godine...
• Pregledanje svake pojedinačne stranice• Povezivanje sa relevantnim bibliotečkim izvorom
Univerzitetska biblioteka “Svetozar Marković” kao partner u projektu
• Preko 400.000 digitalizovanih strana listova i novina na srpskom jeziku, izdatih pre 1945. godine.
• Neki od naslova su Nova iskra, Podunavka, Srbadija, Beogradske opštinske novine, Zora, Balkanski rat u slici i reči, Ilustrovana ratna kronika, Pastir, Sion, Težak, Peštansko-budimski skoroteča, Zemunski glasnik, Srđ, Branič, Zvezda, Starmali, Starmladi, Stražilovo, Šumadinka
Насловне стране новина - слике
Kriterijumi za izbor građe
• Naslovi koje nije digitalizovalaNarodna biblioteka Srbije
• Očuvanost novina
• Tehnička ograničenja
Dosadašnji rezultati projekta
• ustanovljeni su određeni radni tokovi i tehnički procesi• preciziran je obim i broj digitalizovanih novina koje su
predviđene za obradu naprednim tehnologijama• izvršena je procena kvaliteta ovih materijala• definisani su mogući modeli metapodataka koji će se koristiti
prilikom agregacije kao i načini prikaza digitalizovanihsadržaja
• urađena je i specifikacija zahteva za optičko prepoznavanjekaraktera (OCR)
Dosadašnji rezultati projekta
• Anketa• Sprovedena je anketa koja je imala za cilj identifikaciju i analizu svih
novinskih kolekcija koje su digitalizovale nacionalne, akademske i javne biblioteke u Evropi do 2012. godine. U anketi je učestvovalo 47 institucija
• Rezultati:• Pristup digitalizovanim novinama je skoro uvek besplatan u 85%
slučajeva• 36% biblioteka nije koristilo nijednu vrstu optičkog prepoznavanja
karaktera (OCR) na digitalizovanom novinskom sadržaju
Planovi za naredni period
• U toku svoje druge godine projekatće nastaviti da razvija postojećaiskustva i da objavljuje rezultate u cilju promocije projekta i obezbeđivanja vidljivosti što većekoličine materijala na portaluEuropeana.
• U tom cilju planirano je održavanjenekoliko info dana i radionica.
Informativni dani
• Nacionalna biblioteka Turske biće domaćin prvog info dana3. maja 2013 u Ankari. Na ovom skupu na nacionalnomnivou projektni partneri i turski govornici po pozivu će udružitisnage da pokažu najnovija dostignuća u projektu vezanaprevashodno za prečišćavanja teksta u digitalizovanim starim turskim novinama.
Radionice
• Prva radionica će imati za temu obradu digitalizovanihnovinskih materijala
• Druga radionica će specifikovati probleme vezane za agregaciju i prikaz objekata
• Treća, završna radionica će se baviti evropskim novinskimkolekcijama, kao i digitalnom agendom za Evropu
Radionice
• Prva radionica će se održati u Beogradu, u Univerzitetskojbiblioteci “Svetozar Marković”, 13. i 14. juna 2013.
• Planirano je da se kroz prezentacije i demonstracije uživoučesnici radionica upoznaju sa radom na OCRu, i NERu, instrumentima za evaluaciju korišćenih tehnika, procenomkvaliteta obrađenih sadržaja, kao i da razmene iskustva i moguća rešenja na ovom polju delovanja.
• Budući da je proj učesnika radionice limitiran molimozainteresovane da se registruju na sledećoj adresi: http://eurnews.eventbrite.com/
23
Zaključak
• Budući da se novine nisu analitički obrađivale u bibliotekama, osim u izuzetnim slučajevima, ovakav novi pristup pretraživavanju i pronalaženju informacija umnogome će doprineti osvetljavanju sadržaja novinskih kolekcija.
• Korisnici najrazličitijih interesovanja moći će da pronađu relevantne informacije bilo da su one iz domena zabave, sporta ili svakodnevnog života.
• Ova digitalna kolekcija će, nadamo se, postati i baza za naučno-istraživački rad, proučavanje istorijskih i političkih prilika kao i kulturne istorije određene regije.
• Detaljnije informacije na:
http://www.europeana-newspapers.eu/