okroadshow mikkeli 13.10.2014: sovelluksia ja viisautta avoimesta tekstidatasta

Post on 26-May-2015

56 Views

Category:

Business

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Avoimen tiedon kuntakiertue - Open Knowledge Roadshow - Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta / Timo Honkela, Helsingin yliopisto, Kansalliskirjasto

TRANSCRIPT

Timo Honkela, 13.10.2014

Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela

Mikkeli, 13.10.2014Helsingin yliopistoNykykielten laitos

KansalliskirjastoDigitointi- ja

konservointikeskus

Timo Honkela, 13.10.2014

VALUES POWER

Timo Honkela, 13.10.2014

VALUES POWER

Timo Honkela, 13.10.2014

NEEDS ECONOMY

Timo Honkela, 13.10.2014

NEEDS ECONOMY

Timo Honkela, 13.10.2014

UNDERSTANDING KNOWLEDGE

Timo Honkela, 13.10.2014

UNDERSTANDING KNOWLEDGE

Timo Honkela, 13.10.2014

Kansalaiset

Kuluttajat

Äänestäjät

AsiakkaatOppijat

TutkijatPäättäjät

Yritykset

Matkailijat

Kuntoilijat

VALTAVATTEKSTIMASSAT

Timo Honkela, 13.10.2014

TEKSTINLOUHINTA

Timo Honkela, 13.10.2014

Example:

Complexity ofFinnish at thelevel of wordforms

Kimmo Koskenniemi (2013):Johdatus kieliteknologiaan,sen merkitykseen ja sovelluksiin(Introduction to language technology, its significance andapplications)

https://helda.helsinki.fi/bitstream/handle/10138/38503/kt-johd.pdf?sequence=1

Timo Honkela, 13.10.2014

Kemia

Fysiikka, muut luonnon-ja insinööritieteet

Bio- jaympäristö-tieteet

Terveyden tutkimus

Kulttuurin jayhteiskunnan

tutkimus

Suomen tieteen kartta

(Honkela & Klami 2007)

Timo Honkela, 13.10.2014

Quality texts

OCR texts

Language model

Evaluation

CorrectionBettertexts

Productionsystem

DIGRA project / OCR-tulostenjatkojalostus (Mikkeli+Helsinki)

http://www.ifla.org/files/assets/newspapers/Geneva_2014/s6-honkela-en.pdf

Timo Honkela, 13.10.2014

Text mining for peer support

TOPIC ANALYSIS SENTIMENT ANALYSIS

Discussion forum postings, etc.

Selected stories

STYLEANALYSIS

MULTICRITERIA SELECTION PROCESS

User modelingand analysis of

feedback

EVALUATION

User'sinput

(Hon

kela

, Iz

zatd

ust,

Lag

us 2

012)

Timo Honkela, 13.10.2014

ICA of wellbeing-related termsin Reddit texts

(Honkela, Izzatdust, Lagus 2012)

Timo Honkela, 13.10.2014

GICA: Grounded IntersubjectiveConcept Analysis

Hon

kela

et

al.

IJC

NN

201

2

Timo Honkela, 13.10.2014

Analysis of “health” in theState of the Union addresses

Subjects on objects in contexts: Using GICA method to quantify epistemological subjectivity. Timo Honkela, Juha Raitio, Krista Lagus, Ilari T. Nieminen, Nina Honkela, and Mika Pantzar.Proc. of IJCNN 2012.

Timo Honkela, 13.10.2014

KIITOS!KIITOS!

top related