2d2 parallelsessie week digitaal erfgoed: roeland ordelman / beeld en geluid / utwente

27
Alternatieve toegangsmodellen HOE KIETEL JE DE GEBRUIKER

Upload: netwerkdigitaalerfgoed

Post on 08-Aug-2015

27 views

Category:

Government & Nonprofit


0 download

TRANSCRIPT

Alternatieve toegangsmodellen

HOE KIETEL JE DE GEBRUIKER

Uitgangspunt

• Huishoudbeursmodel: op grote schaal publiek bereiken maar dan zonder fysiek ergens naar toe te gaan.

ONLINE

Koppelen

Waarmee koppelen?

• M.a.w. wat zijn de online equivalenten van de huishoudbeurs?

• Waar zijn online gebruikers?

Naïve inventarisatie

• Social Media (Twitter, Facebook, …)• Apps: nieuws (nu.nl, etc.)• Websites: homepages, blogs

Waaraan voldoen?

• Veel traffic• Potentiele interesse in BG content• Koppelmechanisme

Wat is een anchor?

• Startpunt van een koppeling• Dat wat op een webpagina een link heeft• In algemeen taalgebruik: de hyperlink– Maar hyperlink is eigenlijk zowel anchor als target

• Kan een woord zijn (named entity, concept)• Kan een stuk tekst zijn (onderwerp)• Kan multimodaal zijn (een plaatje, audio)• “semantic, multimodal representation”

Via-Via(bv. ARTIS – BEELD EN GELUID)

Multimodale anchor

Beeld anchor

Tekst anchor

Audiovisueel Anchor

Wat is een “target”?

• Eindpunt van een koppeling• Internet: typisch een andere tekst (link naar

andere pagina)• In multimedia context:– Beeld (plaatje)– Audiovisueel document / fragment

Document versus fragment

• Linken naar video:– Juiste fragment meestal van groot belang– Segmentatie nodig: jump-in/jump-out (optioneel)– In theorie: oneindig aantal mogelijke links,

oneindig aantal mogelijke segmentaties.

Retrieval perspectief

Semantic Web perspectief

Koppelingen maken

Semantic Web (vereenvoudigd)

Labels gekoppeld aan “Media Fragments”

Semantic Web

• In potentie heel krachtig: alles kan met alles worden verbonden:– Publiceer collectie als open data in een

herbruikbaar formaat met open standaarden (Linked Open Data)

– laat (derden) applicaties bouwen die collecties aan elkaar verbinden

• Semantic Web benadering in o.a. Europana projecten, LinkedTV

Retrieval (zoeken)

In principe hettraditionele zoekproces

Retrieval

• Koppeling meer inhoudelijk dan in SW:– SW: semantische labels (persoon, locatie, object)

zijn simplificatie van inhoud – RE: probeert inhoud te vatten in “representaties”

bv op basis van voorkomen woorden (tf.idf: welke woorden zijn belangrijk)

Semantic Web

Retrieval

representatierepresentatie

VOORBEELD TOEPASSING

1. Genereer een zoekvraag op basis “actualiteit”

2. Zoek in BG archief voor gerelateerde content

3. Krijg lijst gerelateerde content terug

4. Cureer en toon

3. Krijg lijst gerelateerde content terug

1. Genereer een zoekvraag op basis “actualiteit”

Wat zijn de belangrijke concepten om te gebruiken voor zoeken?

2. Zoek in BG archief voor gerelateerde content

Hoe kan het zoekproces zo worden ingericht dat zoekresultaten op fragmentniveau optimaal zijn

Niet alleen uit BG archief maar ook andere open bronnen (bv op basis federated search)

4. Cureer en toon

Liefst volautomatisch: welke fouten moet je vermijden?

Toeristen Amsterdam ziek “heroine als coke”

3. Krijg lijst gerelateerde content terug

1. Genereer een zoekvraag op basis “actualiteit”

Wat zijn de belangrijke concepten om te gebruiken voor zoeken?

2. Zoek in BG archief voor gerelateerde content

Hoe kan het zoekproces zo worden ingericht dat zoekresultaten op fragmentniveau optimaal zijn

Niet alleen uit BG archief maar ook andere open bronnen (bv op basis federated search)

4. Cureer en toon

Liefst volautomatisch: welke fouten moet je vermijden?

Toeristen Amsterdam ziek “heroine als coke”

3. Krijg lijst gerelateerde content terug

1. Genereer een zoekvraag op basis “actualiteit”

Wat zijn de belangrijke concepten om te gebruiken voor zoeken?

2. Zoek in BG archief voor gerelateerde content

Hoe kan het zoekproces zo worden ingericht dat zoekresultaten op fragmentniveau optimaal zijn

Niet alleen uit BG archief maar ook andere open bronnen (bv op basis federated search)

4. Cureer en toon

Liefst volautomatisch: welke fouten moet je vermijden?