europeana newspapers: novo mesto susreta korisnika digitalnih sadržaja

25
“Europeana Newspapers” - novo mesto susreta korisnika digitalnih sadržaja - Nataša Dakić, Aleksandra Trtovac Univerzitetska biblioteka “Svetozar Markovic”, Beograd Deveti međunarodni susreti bibliotekara slavista Sarajevo, april, 14.–17. 2013

Upload: europeana-newspapers

Post on 11-May-2015

130 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

“Europeana Newspapers”- novo mesto susreta korisnika digitalnih sadržaja -

Nataša Dakić, Aleksandra TrtovacUniverzitetska biblioteka “Svetozar Markovic”, Beograd

Deveti međunarodni susreti bibliotekara slavista Sarajevo, april, 14.–17. 2013

Page 2: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

2

Projekat “Europeana Newspapers”

Zašto novine?• relevantan izvor informacija za sve građane• visoko relevantan izvor informacija za istraživače

Stanje novina u bibliotekama između raja i pakla• solidni kompletni originali, izuzetne kopije na

mikrofilmovima• krti, lomljivi originali, nekompletni brojevi, suplementi

Page 3: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

3

Projekat “Europeana Newspapers”

• Projekat traje od februara 2012. do januara 2015.

• Finansiran je od strane Evropske komisije u okviru petog poziva Programa podrške razvoju politike informaciono-komunikacionih tehnologija (CIP ICT-PSP Best Practice Network 5thCall)

• Koordinator projekta je Državna biblioteka u Berlinu(Staatsbibliothek zu Berlin)

Page 4: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

4

Partneri u projektu

• 17 partnera iz 12 zemalja:• Nacionalne biblioteke• Univerzitetske biblioteke• LIBER i CSS

Page 5: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

5

Partneri u projektu

• Državna biblioteka u Berlinu • Nacionalna biblioteka Estonije • Univerzitet u Helsinkiju • Nacionalna biblioteka Francuske • Nacionalna biblioteka Letonije• Univerzitet u Beogradu • Biblioteka dr Fridrih Tesman • Univerzitet u Salfordu• CCS Content Conversion

Specialists GmbH

• Nacionalna biblioteka Holandije • Austrijska nacionalna biblioteka • Univerzitet u Hamburgu • Nacionalna biblioteka Poljske • Nacionalna biblioteka Turske • Univerzitet u Insbruku • Britanska biblioteka • The European Library (TEL)• LIBER fondacija

Page 6: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Pridruženi partneri u projektu

• Nacionalna biblioteka Češke• Nacionalna i univerzitetska biblioteka, Ljubljana, Slovenija• Nacionalna i univerzitetska biblioteka Islanda• Nacionalna i univerzitetska biblioteka, Zagreb, Hrvatska• Nacionalna biblioteka „Sveti Ćirilo i Metodije“, Bugarska• Centralna univerzitetska biblioteka Lucian Blaga, Rumunija• Nacionalna biblioteka Velsa• Nacionalna biblioteka Portugala• Nacionalna biblioteka Španije• Nacionalna biblioteka Belgije• Nacionalna biblioteka Luksemburga

Page 7: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

7

Ciljevi projekta “Europeana Newspapers”

• Europeana će postati najveći provajder panevropskih novinskih kolekcija

• Istražiti stanje novinskih zbirki u evropskim bibliotekama

• Obezbediti kvalitetne kopije i doneti preporuke za dalji rad što se tiče digitalizacije, prečišćavanja teksta, metapodataka...

• Poboljšati pristup zbirkama novina u Evropi

Page 8: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

8

Ciljevi projekta “Europeana Newspapers”

• Tokom projekta Evropskoj biblioteci (TEL – The European Library) i Europeani će biti dostavljeno oko 18 miliona digitalizovanih strana novina od kojih su mnoge u punom tekstu

Page 9: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

9

Agregacija i prečišćavanje teksta

• Korišćenje metoda za optičko prepoznavanje teksta (OCR -Optical Character Recognition) je predviđeno za 10 miliona strana

• Segmentacija članaka (OLR - Optical Layout Recognition) je predviđena za 2 miliona strana

• Prepoznavanje imenovanih entiteta (NER - Named Entity Recognition) obezbeđuje Nacionalna biblioteka Holandije za sve materijale na nemačkom, engleskom i holandskom jeziku

Page 10: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

NER - Named Entity Recognition

Page 11: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Metapodaci

• Razvoj i unapređenje standarda za opis tehničkih metapodataka za optičko prepoznavanje teksta -METS/ALTO

• Dalji razvoj Evropskog modela za metapodatke (EDM -European Data Model) i usaglašavanje sa METS/ALTO standardom

• Transformacija lokalnih metapodataka u EDM model

Page 12: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Pristup do punog teksta

• Složena pretraga sadržaja punog teksta preko:• Ključnih reči• Imenovanih entiteta• Zbirki novina• Datuma, godine...

• Pregledanje svake pojedinačne stranice• Povezivanje sa relevantnim bibliotečkim izvorom

Page 13: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Univerzitetska biblioteka “Svetozar Marković” kao partner u projektu

• Preko 400.000 digitalizovanih strana listova i novina na srpskom jeziku, izdatih pre 1945. godine.

• Neki od naslova su Nova iskra, Podunavka, Srbadija, Beogradske opštinske novine, Zora, Balkanski rat u slici i reči, Ilustrovana ratna kronika, Pastir, Sion, Težak, Peštansko-budimski skoroteča, Zemunski glasnik, Srđ, Branič, Zvezda, Starmali, Starmladi, Stražilovo, Šumadinka

Page 14: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Насловне стране новина - слике

Page 15: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja
Page 16: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Kriterijumi za izbor građe

• Naslovi koje nije digitalizovalaNarodna biblioteka Srbije

• Očuvanost novina

• Tehnička ograničenja

Page 17: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Dosadašnji rezultati projekta

• ustanovljeni su određeni radni tokovi i tehnički procesi• preciziran je obim i broj digitalizovanih novina koje su

predviđene za obradu naprednim tehnologijama• izvršena je procena kvaliteta ovih materijala• definisani su mogući modeli metapodataka koji će se koristiti

prilikom agregacije kao i načini prikaza digitalizovanihsadržaja

• urađena je i specifikacija zahteva za optičko prepoznavanjekaraktera (OCR)

Page 18: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Dosadašnji rezultati projekta

• Anketa• Sprovedena je anketa koja je imala za cilj identifikaciju i analizu svih

novinskih kolekcija koje su digitalizovale nacionalne, akademske i javne biblioteke u Evropi do 2012. godine. U anketi je učestvovalo 47 institucija

• Rezultati:• Pristup digitalizovanim novinama je skoro uvek besplatan u 85%

slučajeva• 36% biblioteka nije koristilo nijednu vrstu optičkog prepoznavanja

karaktera (OCR) na digitalizovanom novinskom sadržaju

Page 19: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Planovi za naredni period

• U toku svoje druge godine projekatće nastaviti da razvija postojećaiskustva i da objavljuje rezultate u cilju promocije projekta i obezbeđivanja vidljivosti što većekoličine materijala na portaluEuropeana.

• U tom cilju planirano je održavanjenekoliko info dana i radionica.

Page 20: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Informativni dani

• Nacionalna biblioteka Turske biće domaćin prvog info dana3. maja 2013 u Ankari. Na ovom skupu na nacionalnomnivou projektni partneri i turski govornici po pozivu će udružitisnage da pokažu najnovija dostignuća u projektu vezanaprevashodno za prečišćavanja teksta u digitalizovanim starim turskim novinama.

Page 21: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Radionice

• Prva radionica će imati za temu obradu digitalizovanihnovinskih materijala

• Druga radionica će specifikovati probleme vezane za agregaciju i prikaz objekata

• Treća, završna radionica će se baviti evropskim novinskimkolekcijama, kao i digitalnom agendom za Evropu

Page 22: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Radionice

• Prva radionica će se održati u Beogradu, u Univerzitetskojbiblioteci “Svetozar Marković”, 13. i 14. juna 2013.

• Planirano je da se kroz prezentacije i demonstracije uživoučesnici radionica upoznaju sa radom na OCRu, i NERu, instrumentima za evaluaciju korišćenih tehnika, procenomkvaliteta obrađenih sadržaja, kao i da razmene iskustva i moguća rešenja na ovom polju delovanja.

• Budući da je proj učesnika radionice limitiran molimozainteresovane da se registruju na sledećoj adresi: http://eurnews.eventbrite.com/

Page 23: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

23

Zaključak

• Budući da se novine nisu analitički obrađivale u bibliotekama, osim u izuzetnim slučajevima, ovakav novi pristup pretraživavanju i pronalaženju informacija umnogome će doprineti osvetljavanju sadržaja novinskih kolekcija.

• Korisnici najrazličitijih interesovanja moći će da pronađu relevantne informacije bilo da su one iz domena zabave, sporta ili svakodnevnog života.

• Ova digitalna kolekcija će, nadamo se, postati i baza za naučno-istraživački rad, proučavanje istorijskih i političkih prilika kao i kulturne istorije određene regije.

Page 24: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

• Detaljnije informacije na:

http://www.europeana-newspapers.eu/

Page 25: Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja

Hvala na pažnji!

[email protected]

[email protected]