metasearch
• wat is het probleem bij de oplossing?
• welke oplossing bij welk probleem?
behoefte aan integreren van meer bronnen / zoeksystemen
waarom wil je dat voor je gebruikers?
• het is onhandig als ze dezelfde zoekvraag aan elk afzonderlijk systeem telkens weer opnieuw moeten stellen
• het is gebruikersonvriendelijk dat die systemen vaak allemaal verschillende zoekinterfaces hebben
© eric sieverts, UB Utrecht
behoefte aan integreren van meer bronnen / zoeksystemen
waarom wil je dat voor je gebruikers?
• het is onhandig als ze dezelfde zoekvraag aan elk afzonderlijk systeem telkens weer opnieuw moeten stellen
• het is gebruikersonvriendelijk dat die systemen vaak allemaal verschillende zoekinterfaces hebben
© eric sieverts, UB Utrecht
integreren van meer bronnen / zoeksystemen
globaal twee soorten aanpak:
• alle bronnen zelf in je eigen centrale systeem (zoekmachine) indexerende OMEGA-aanpak
• meta-zoeksysteem dat de bij de afzonderlijke bronnen behorende zoeksystemen in één keer parallel bevraagt (gedistribueerde zoekactie)de METALIB-aanpak
© eric sieverts, UB Utrecht
indexer
internet
tekstbestanden(metadata) tekstbestanden
centrale index
zoekengeïntegreerd systeemvia lokale centrale index
indexeer-regels voor
targets
full-text links
mega
eigen centrale index
voorbeelden:UB Utrecht - Omega-systeem• metadata van artikelen uit groot aantal
tijdschriften van diverse leveranciers
OAIster • via Open Archive protocol “ge-harveste”
metadata (volgens Dublin Core), uit ruim 400 “institutionele archieven” met wetenschappelijke publikaties
© eric sieverts, UB Utrecht
eigen centrale index
voordelen:
• garantie van uniforme zoekmogelijkheden
• geavanceerde zoekfunctionaliteit mogelijk, want we hebben zelf in de hand welke zoekmachine we kiezen en hoe we die configureren
nadelen:
• zwaar systeem (eigen zoekmachine) te hosten en beheren
• kan niet voor alle “content”© eric sieverts, UB Utrecht
wanneer eigen index ?
als je zelf beheer kunt krijgen over te doorzoeken “content”
– wel bij materiaal van (sommige / grote) uitgevers (zoals Elsevier, JStor, etc)
– niet bij materiaal van uitgevers die dat (nog) niet willen / kunnen / begrijpen
– niet bij databases waar bijbehorend zoek-systeem al verweven is met (de ontsluiting van) de gegevens (zoals Ovid, CSA, Pubmed, etc)
© eric sieverts, UB Utrecht
meta-search oplossing
daarvoor is nodig:
• het betreffende materiaal / content moet al een eigen zoeksysteem hebben
• dat zoeksysteem moet extern (via internet) te benaderen zijn
• met dat zoeksysteem moet via gestructureerde interactie gecommuniceerd kunnen worden (opdrachten versturen, antwoorden binnenhalen)
© eric sieverts, UB Utrecht
internet
zoekengeïntegreerd systeemvia meta-zoekmethode
index
be-stand
zoek
query-generator / antwoord-inzamelaar
index
be-stand
zoek
index
be-stand
zoek
index
be-stand
zoek
index
be-stand
zoek
index
be-stand
zoek
Z39.50
Z39.50 Z39.50
internapi
http http xml
Z39.50 http
configuratiegegevens
van targets
meta-search oplossing
metasearch software (zoals Metalib) kan communiceren met verschillende soorten zoeksystemen:
– Z39.50 protocol (vooral bibliografische databases)redelijk gestandaardiseerd, maar weinig geavanceerd
– interactie op basis van xml (o.a. nieuw SRU-protocol)redelijk flexibel, maar nog geen ruime ondersteuning
– http-protocol / web-formulieren ("screen-scraping")wijd verbreid, maar niet gestructureerd / weinig stabiel
– lokale “legacy”-systemen © eric sieverts, UB Utrecht
meta-search oplossing
voordelen:– geen zwaar eigen systeem te beheren
– ook geschikt voor niet zelf indexeerbare content
nadelen: – grootste gemene deler van zoekfunctionaliteit
– geen geavanceerde zoekfuncties beschikbaar
– soms ingewikkeld configuratie-werk (zowel voor Z39.50 als voor http:url-syntax en screen-scraping)
© eric sieverts, UB Utrecht
meta-search toepassingen UBU
wat we zelf niet makkelijk kunnen indexeren en wel een bijbehorend zoeksysteem heeft
– full-text tijdschriften die we (nog) niet in Omega-zoekmachine hebben kunnen krijgen
– bibliografische databases, catalogi etc. die we niet zelf kunnen indexeren én niet tot de eigen full-text collectie behoort (dus eigenlijk niet in Omega-zoeksysteem thuishoort)
© eric sieverts, UB Utrecht
meta-search bij Omega
uitgevers die (nog) geen metadata leveren
mogelijke problemen:
– meestal web-interfaces die configuratie met screen-scraping nodig maken
– meeste waarschijnlijk (nog) niet standaard ondersteund door Metalib (ExLibris)
© eric sieverts, UB Utrecht
bibliografische meta-search
al die verschillende niet-fulltext zoeksystemen
mogelijke problemen bij Metalib:
– veel “native” interfaces bieden veel betere / geavanceerder zoekmogelijkheden
– niet meer dan 10 tegelijk doorzoekbaar te maken– samenvoegen van op relevantie geordende
zoekresultaten geeft problemen– nog niet allemaal standaard ondersteund door
Metalib– …..
© eric sieverts, UB Utrecht
mogelijke scenario’s voor toepassen van meta-search
scenario 1:
we bieden gebruikers twee systemen:
– metasearch systeem dat alle bibliografische bronnen tegelijk doorzoekbaar maakt (in groepjes van maximaal 10)
– Omega-systeem dat alle full-text materiaal tegelijk doorzoekbaar maakt via:Omega-zoekmachine + metasearch van “overige” uitgevers
© eric sieverts, UB Utrecht
internet
“biblio”metasearch
scenario 1
index
Aleph
zoek
index
biblograf.
zoek
index
ncc
zoek
index
bibliograf.
zoek
index
fulltext
zoek
index
fulltext
zoek
omegaindex
“full-text”metasearch
omegazoekmach.
bibliografisch zoeken omega zoeken
full-textzoeken
mogelijke scenario’s voor toepassen van meta-search
scenario 2:
we bieden gebruikers één systeem:
– systeem dat “alles” tegelijk doorzoekbaar maakt via metasearch (opgedeeld in groepjes van maximaal 10)
daarónder native interfaces van alle individuele systemen; daarbij behalve Pubmed, Psycinfo, catalogus enz., óók Omega dat alle full-text materiaal tegelijk doorzoekbaar maakt
© eric sieverts, UB Utrecht
internet
“alles”metasearch
scenario 2
index
Aleph
zoek
index
biblograf.
zoek
index
ncc
zoek
index
bibliograf.
zoek
index
fulltext
zoek
index
fulltext
zoek
omegaindex
“full-text”metasearch
omegazoekmach.
alles zoekenomega
full-text zoeken
index
bibliograf.
zoek
pubmed
catalogus