problematika velkého indexu
DESCRIPTION
Problematika velkého indexu. Martin Vojnar [email protected]. Obsah. předehra: jednotné prostředí velký index vs. metavyhledávání vytváření velkého indexu a jeho vlastnosti velký index a český obsah malá úskalí velkého indexu praktické ukázky otázky / diskuse. 1a: jednotné prostředí. - PowerPoint PPT PresentationTRANSCRIPT
![Page 2: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/2.jpg)
2 Problematika velkého indexu, 30.3. 2011
Obsah
• předehra: jednotné prostředí• velký index vs. metavyhledávání• vytváření velkého indexu a jeho vlastnosti• velký index a český obsah• malá úskalí velkého indexu• praktické ukázky
• otázky / diskuse
![Page 3: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/3.jpg)
3 Problematika velkého indexu, 30.3. 2011
1a: jednotné prostředí
![Page 4: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/4.jpg)
4 Problematika velkého indexu, 30.3. 2011
Jednotné prostředí
• pro vyhledávání informací a dokumentů• pro dodávání informací a dokumentů• pro objevení nového
• používáte ho každý den
• ukázka
![Page 5: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/5.jpg)
5 Problematika velkého indexu, 30.3. 2011
Proč ?
• v rámci vyhledávání a dodávání informací zahájily před ca 5 lety nástup nové nástroje
• byly původně označovány jako katalogy nové generace (next-gen OPACs)
• postupně se vyvinuly v tzv. „discovery“ systémy
• jejich hlavní důraz je kladen na koncového uživatele, jeho potřeby a prostředí, samostatnost a spokojenost
• užitečný nástroj v kontextu informační gramotnosti
![Page 6: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/6.jpg)
6 Problematika velkého indexu, 30.3. 2011
Cíle jednotného prostředí
• každý dotaz musí být prováděn ve všech zdrojích knihovny (tištěné, elektronické, digitalizované, …)
• výsledky jsou zobrazeny v jedné výsledkové množině s jednotnou relevancí a s úplnou navigací
• zobrazení plného textu na jedno kliknutí• podpora SSO, integrace objednávání a čtenářského
konta
![Page 7: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/7.jpg)
7 Problematika velkého indexu, 30.3. 2011
Co není jednotné prostředí
• pokud uživatel musí přecházet do jiných systémů• pokud se musí uživatel opakovaně přihlašovat• pokud uživatel ztrácí kontinuitu svého vyhledávání• pokud uživatel musí začínat v „discovery“ systému
(příklad)
• pokud rozhraní nenabízí jednotné výsledky• pokud rozhraní neumožňuje začlenění libovolného
zdroje
![Page 8: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/8.jpg)
8 Problematika velkého indexu, 30.3. 2011
1b: „discovery“ systémy
![Page 9: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/9.jpg)
9 Problematika velkého indexu, 30.3. 2011
Očekávání ze strany uživatelů*
• rychlé, jednoduché, intuitivní používání• jediné rozhraní• navigace pomocí faset• DYM, návrhy/našeptávání• RSS• pokrytí relevantního obsahu
• základní přehled „discovery“ systémůhttp://www.librarytechnology.org/discovery.pl
*Marshall Breeding
![Page 10: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/10.jpg)
10 Problematika velkého indexu, 30.3. 2011
Přidaná hodnota „discovery“
• jedno společné rozhraní = méně práce s lepším výsledkem
• konec informačního přehlcení díky:
• konfigurovatelné relevanci (zlato vs. šum)• personalizaci výpočtu relevance• seskupování výsledků (FRBR)• doporučení
• zapojení uživatelů• integrace s jejich prostředím• komentáře / hodnocení• čtenářské konto• sledování novinek• virtuální knihovnička
![Page 11: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/11.jpg)
11 Problematika velkého indexu, 30.3. 2011
Typické zdroje pro „discovery“
• knihovní fond• licencované databáze• volně dostupné dokumenty a data (open access)• digitální knihovny• institucionální repozitáře … a další dle potřeb
uživatelů
• různé formáty, různé oprávnění, různé instituce, různý význam
• discovery také může být zdrojem pro vyšší třídu vyhledávačů
![Page 12: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/12.jpg)
12 Problematika velkého indexu, 30.3. 2011
UIdiscovery
discovery index
![Page 13: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/13.jpg)
13 Problematika velkého indexu, 30.3. 2011
UI discovery
discovery index obsahuje různé zdroje
![Page 14: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/14.jpg)
14 Problematika velkého indexu, 30.3. 2011
UI discovery
včetně elektronických zdrojů
![Page 15: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/15.jpg)
15 Problematika velkého indexu, 30.3. 2011
![Page 16: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/16.jpg)
16 Problematika velkého indexu, 30.3. 2011
Anatomie vyhledávání
• index lokálních zdrojů• index elektronických zdrojů (tzv. velký index)
• paralelní vyhledávání (tzv. metavyhledávání) – více v kapitole 2
• externí vyhledávání (sám sebe, Solr, API, …)
• zadávání dotazů a jejich typy
![Page 17: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/17.jpg)
17 Problematika velkého indexu, 30.3. 2011
1c: ukázka ~ Primo od Ex Libris
![Page 18: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/18.jpg)
18 Problematika velkého indexu, 30.3. 2011
Ukázka systému Primo (naživo později)
• elektronické zdroje:• získání plného textu (přímé linkování, více zdrojů)• doporučení, citovanost
• dostupnost• seskupení (FRBR)• čtenářské konto a objednávání z knihovního fondu• otevřenost (aktuální články)
• lokální obsah (wikipedie, www stránky, české zdroje)• metavyhledávání vs. velký index• filozofie velkého indexu
• webové rozhraní pro administrátora
![Page 19: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/19.jpg)
19 Problematika velkého indexu, 30.3. 2011
1d: konec úvodu
![Page 20: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/20.jpg)
20 Problematika velkého indexu, 30.3. 2011
Výzva pro knihovny
• sjednocení vyhledávacího prostředí• sjednocení služeb na něj navázaných
• výsledek:• efektivnější využívání zdrojů knihovny• častější využívání zdrojů knihovny• získání nových uživatelů• opakované využívání zdrojů knihovny
![Page 21: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/21.jpg)
21 Problematika velkého indexu, 30.3. 2011
UI discovery
včetně elektronických zdrojů
ukázka: video
![Page 22: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/22.jpg)
22 Problematika velkého indexu, 30.3. 2011
2: velký index vs. metavyhledávání
![Page 23: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/23.jpg)
23 Problematika velkého indexu, 30.3. 2011
Změna filozofie velkého indexu
• paralelní vyhledávání = ve sbírkách• velký index = v obsahu
• oddělení fáze vyhledávání a dodávání
• nepřihlášeným uživatelům:• povoleno obojí• povoleno jen vyhledávání• není povoleno ani vyhledávání
• dodávání na základě elektronických holdingů (dostupnost)
![Page 24: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/24.jpg)
24 Problematika velkého indexu, 30.3. 2011
Příklad dostupnosti
• např. ve formátu pro Google Scholar
<item type="electronic"> <sfx_id>954921333005</sfx_id> <object_type>JOURNAL</object_type> <title>Abacus</title> <title>ABACUS A JOURNAL OF ACCOUNTING FINANCE AND BUSINESS
STUDIES</title> <title>ABACUS OXFORD</title> <issn>0001-3072</issn> <eissn>1467-6281</eissn> <coverage> <from> <year>1965</year> </from> <to></to> <embargo> <days_not_available>365</days_not_available> </embargo> </coverage> </item>
![Page 25: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/25.jpg)
25 Problematika velkého indexu, 30.3. 2011
Pro uživatele Metalibu
• význam paralelního vyhledávání
• velký index jako cíl v paralelním vyhledávání (obrat 180°)
• paralelní vyhledávání jako doplňková metoda přístupu v UI rozhraní velkého indexu
• příklad
![Page 26: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/26.jpg)
26 Problematika velkého indexu, 30.3. 2011
3: jak vzniká velký index
![Page 27: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/27.jpg)
27 Problematika velkého indexu, 30.3. 2011
Plnění velkého indexu
• Ex Libris vs. tradiční agregátoři• open aktivity v rámci JISC (RDTF, KBART, lis-oss aj.)
• smlouvy s poskytovateli různého typu (typicky na 3 roky)
• rozsah získávaných metadat:• základní metadata• + věcný popis• + abstrakt• + plný text
![Page 28: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/28.jpg)
28 Problematika velkého indexu, 30.3. 2011
Váš obsah ve velkém indexu (dnes)
• sbírky vs. tituly• profil velkého indexu• dostupnost na úrovni instituce
• analýza procentuálního zastoupení titulů• počet elektronických titulů (ISSN/ISBN/název)• počet předplácených titulů• počet recenzovaných titulů
![Page 29: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/29.jpg)
29 Problematika velkého indexu, 30.3. 2011
Váš obsah ve velkém indexu (zítra)
• plnění je nekonečný proces• řídí se podle cestovní mapy (ukázka)
• nikdy nebude 100%-ně úplný• nikdy nebude 100%-ně aktuální
• petice IGELU
![Page 30: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/30.jpg)
30 Problematika velkého indexu, 30.3. 2011
Důraz na otevřenost velkého indexu
• během plnění (open discovery)• jeho obsahu (open access, open data)• jeho dostupnosti (open platform)• zařazení do jiných rozhraní (open source)
• v budoucnu lze očekávat i kombinování více velkých indexů (např. lokální/globální, více globálních apod.), bude-li úspěšně vyřešena normalizace relevance
![Page 31: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/31.jpg)
31 Problematika velkého indexu, 30.3. 2011
Co je nejdůležitější na velkém indexu ?
• pokrytí• relevance• dostupnost• rychlost odezvy• neutralita• možnosti konfigurace (jaké?)
• jak moc je důležité pokrytí lokálního obsahu ?
![Page 32: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/32.jpg)
32 Problematika velkého indexu, 30.3. 2011
4: český obsah ve velkém indexu
![Page 33: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/33.jpg)
33 Problematika velkého indexu, 30.3. 2011
Dvě dimenze obsahu velkého indexu
• (nějaký) obsah je k dispozici online• dostupnost obsahu pro daného uživatele (tj.
instituci)
• jaký český obsah je k dispozici ?
![Page 34: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/34.jpg)
34 Problematika velkého indexu, 30.3. 2011
Potenciál českého obsahu
• SK ČR, ANL, registr digitalizace• oborové bibliografie• národní digitální knihovny (M+K+W)• oborové digitální knihovny (DML-CZ)• NUŠL• placené zdroje
(Anopress IT, Newton Media, Infobanka ČTK, Beck online, ASPI, …)
• nová média: wiki, archivy vysílání, e-knihy• publikační činnost / výstupy VaV• nástroje pro podporu vzdělávání, doporučená
literatura• institucionální repozitáře
(DSpaceCZ, digitalizace KNAV ČR, …)
• a další (?)
![Page 35: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/35.jpg)
35 Problematika velkého indexu, 30.3. 2011
Potenciál českého obsahu – pár čísel
• experiment v testovacím prostředí UK:• katalog + kvalifikační práce ca 1 mil. záznamů• ostatní ca 800 tis. záznamů, v tom:
• cswiki ca 200 tis. záznamů• manuscriptorium ca 200 tis. záznamů• ANL (online) ca 200 tis. záznamů• BMČ (online), BDÚ (online), ZPB (online),
GEOBIBLINE ca 60 tis. záznamů• DML-CZ a NUŠL ca 100 tis. záznamů• různé ca 50 tis. záznamů (Forum, Anopress IT,
Kramerius NKP, …)
![Page 36: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/36.jpg)
36 Problematika velkého indexu, 30.3. 2011
Oborové bibliografie
• hlavní zdroj: oborové bibliografie• týká se ANL• týká se národních digitálních knihoven (K)• týká se institucionálních repozitářů (digitalizace
KNAV ČR)
• ukončení plnění ANL v NK ČR, udržování pro další knihovny
• průzkum stavu oborových bibliografií
![Page 37: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/37.jpg)
37 Problematika velkého indexu, 30.3. 2011
Oborové bibliografie - výběr
![Page 38: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/38.jpg)
38 Problematika velkého indexu, 30.3. 2011
Spojení českého obsahu
• opravdu na jednom místě
• praktické zkušenosti: jednání, vysvětlování, …• licencovaný obsah limitován předchozími smlouvami
• jak a kdo [bude chtít | by měl | může] tuto službu nabízet (knihovny vs. dodavatelé, licence, smlouvy, …)
• bylo by velmi vhodné zahrnout do strategie knihoven
• pár ukázek
![Page 39: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/39.jpg)
39 Problematika velkého indexu, 30.3. 2011
5: ukázka ~ Primo od Ex Libris
![Page 40: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/40.jpg)
40 Problematika velkého indexu, 30.3. 2011
Ukázka systému Primo
• elektronické zdroje:• získání plného textu (přímé linkování, více zdrojů)• doporučení, citovanost
• dostupnost• seskupení (FRBR)• čtenářské konto a objednávání z knihovního fondu• otevřenost (aktuální články)
• lokální obsah (wikipedie, www stránky, české zdroje)• metavyhledávání vs. velký index• filozofie velkého indexu
• webové rozhraní pro administrátora
![Page 41: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/41.jpg)
41 Problematika velkého indexu, 30.3. 2011
6: shrnutí
![Page 42: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/42.jpg)
42 Problematika velkého indexu, 30.3. 2011
Pár zajímavých odkazů
• přehled nejlepších v analýze „Web Scale Discovery Services“ (Jason Vaughan, obsah není volně dostupný)http://www.alatechsource.org/taxonomy/term/106/web-scale-discovery-services
• Federated Search blog (Sol Lederman)http://federatedsearchblog.com/2011/01/21/must-read-article-on-discovery-services/
• Informační gramotnost uživatelů vs. vyhledávací nástroje nové generace (Vilém Sklenák, ProInflow)http://pro.inflow.cz/informacni-gramotnost-uzivatelu-vs-vyhledavaci-nastroje-nove-generace
![Page 43: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/43.jpg)
43 Problematika velkého indexu, 30.3. 2011
Jedno prostředí pro uživatele
• vyhledávací nástroje nové generace se na Vás tlačí
• velký index je toho součástí (jak moc je důležitý?)
• každý velký index jde svou cestou
• důraz na otevřenost
• jak velká míra kontrola ze strany knihovny je třeba?
![Page 45: Problematika velkého indexu](https://reader035.vdocuments.pub/reader035/viewer/2022062221/5681373b550346895d9ecc76/html5/thumbnails/45.jpg)
45 Problematika velkého indexu, 30.3. 2011
Některé z otázek
• je velký index luxus ?• záleží na velikosti indexu ?• jak otestovat rozsah indexu ?• má smysl podpořit Open Discovery ?• co to stojí a kdo to platí ?• proč si to knihovny neudělají samy a lépe ?• jakou míru kontroly chci mít nad velkým indexem ?• jaké z mých sbírek jsou ve velkém indexu ?• jaké zdroje / jaký obsah by tam mí uživatelé rádi viděli ?