timo honkela, kansalliskirjasto | digitalmikkeli-aamukahvit 11.3.2014

Post on 11-Nov-2014

456 Views

Category:

Business

6 Downloads

Preview:

Click to see full reader

DESCRIPTION

Digitalmikkeli-aamukahvitilaisuudessa 11.3.2014 esitetty materiaali: TIMO HONKELA, digitaalisten aineistojen professori, Helsingin Yliopisto, Kansalliskirjaston digitointi- ja konservointikeskus

TRANSCRIPT

Timo Honkela, 11.3.2014

Digitaalisen humanismin tutkimuksesta ja

uusista liiketoiminta-mahdollisuuksista

Timo Honkela

11.3.2014

-esitelmä

Helsingin yliopistoNykykielten laitos

KansalliskirjastoDigitointi- ja

konservointikeskus

Timo Honkela, 11.3.2014

Digitaalinen humanismi

● Humanististen tieteiden tutkimusta tietokoneiden avulla– Digitaaliset aineistot

– Laskennalliset mallit

● Teesit:– Paperia osataan jo valmistaa ja kuuhun osataan

lentää

– Tärkeimmät ratkaisemattomat kysymykset maailmassamme liittyvät humanististen ja sosiaalitieteiden alueelle

Timo Honkela, 11.3.2014

Digitaalisten aineistojentutkimuksesta

Timo Honkela, 11.3.2014

Arkistot

Kirjastot

Yliopistot

Kansalaiset

Tutkijat

Media

DIGITAALISETAINEISTOT

Museot

Opettajat

Taiteilijat

Yritykset

Yhdistykset

Kunnat

ValtioPäätöksen-

tekijät

Toimittajat

Informaatikot

Timo Honkela, 11.3.2014

Tekstit

Kuvat

Videot

Laskennallisetmallit

Numeerisetaineistot

DIGITAALISET AINEISTOT

Ääni-tallenteet

Monimedia-dokumentit

Vuorovaikutteisetjärjestelmät

Tietokone-ohjelmat

Timo Honkela, 11.3.2014

Aineisto

Sisältö- jainformaatio-

ammattilaiset

Aineistoistakiinnostuneetmaallikot ja

asianharrastajat

Koneoppimis- jahahmontunnistus-

järjestelmät

Formaali metadata

Kieliteknologisetresurssit jajärjestelmät

Sisällönkuvailun muut muodot

Timo Honkela, 11.3.2014

Lähiaikojentutkimusaiheita

Timo Honkela, 11.3.2014

Skannattujen tekstienlaadun parantaminen

lääniiT firtgemööriltö pyytänyt, että Satvonlinnan tailvlingin poliisilaitokseen määrättäisiin paltuelemaon Mikkelin poliisilaitokssei!...

määräyksestä tilapäifesil Sawonlinnasta muuannekin lähettää, Siltä »aralta, ettei pyydettyä mieliistöä saada Mikkelistä riittämään, anoo maistraatti, että sille myönnettäisiin siitä määrärahasta, jola Mik» kelin lääniä warten on...

Timo Honkela, 11.3.2014

Laatutekstiä

OCR-tekstiä

Kielimalli

Tunnistin

KorjainParempaa

tekstiä

Tuotanto-Järjestelmä

Ocricola-osahanke (Helsinki+Mikkeli)

Timo Honkela, 11.3.2014

Sisältöanalyysi:

ihmiset paikat

tapahtumatteemat

sentimentit

Paukkeri, Nieminen, Pöllä & Honkela. A language­independent approach to keyphrase extraction and evaluation. Coling 2008.

Honkela, Korhonen, Lagus & Saarinen. Five­dimensional 

sentiment analysis of corpora, documents and 

words. WSOM 2014 (to appear).

Menetelmiä

Timo Honkela, 11.3.2014

Haasteita:

Sisältökuvauksien käytettävyyden jayhtenäisyyden tavoitteen

ja

kielen ja tulkinnan moninaisuuden,muuttumisen, laji- ja tyylivariaation,

yksilöllisyyden ja kulttuurisidonnaisuuden

välinen jännite

Timo Honkela, 11.3.2014

Tulkinnan moninaisuusja kontekstisidonnaisuus

“Shall I Compare Thee To A Summer's Day”

Pieni norsu versus suuri hiiri

Kaunis rantamaisema, maalaus tai sävellys

Demokratia, tasa-arvo, yhdenvertaisuus,kestävä kehitys, oikeudenmukaisuus, ...

Timo Honkela, 11.3.2014

Mahdollisuuksia

Kontekstitiedon tallentaminenaiempaa suuremmassa mittakaavassa

Inhimillisen tulkinnananalysointi ja tulosten

hyödyntäminen aineistojenmerkkaamisessa

Sisältöanalyysikoneoppimisen ja

hahmontunnistuksenkeinoin

Timo Honkela, 11.3.2014

Chemistry

Physics andengineering

Biosciences

Medicine

Culture and society

Tuotettu automaattisesti ilman ihmisluokitteluita Suomen Akatemialle osoitetuista3324 hakemuksesta käyttäen tilastollista termi-irrotusta ja itseorganisoivaa karttaa.

Tila

stol

linen

ter

mi-i

rrot

us:

ks.

Pau

kker

i et a

l. 20

08

Hon

kela

& K

lam

i 200

7Suomen tieteen kartta

Timo Honkela, 11.3.2014

Analyzing Emotional Semantics of Abstract Art Using Low-Level Image Features.He Zhang , Eimontas Augilius , Timo Honkela, Jorma Laaksonen, Hannes Gamper and Henok Alene, Proceedings of IDA 2011.

Timo Honkela, 11.3.2014

Kysymys:

Milloin apuvälineet ovatkehittyneet niin pitkälle, että

voimme tunnistaa uutislähetyksestäuutislukijan tai haastateltavankasvoista tai äänensävystä,

päätellä aihealueenvideokuvasta ja muuttaa

eri puhujien äänen tekstiksi?

Timo Honkela, 11.3.2014

Timo Honkela, 11.3.2014

Kiitän Jorma Laaksosta ja Mikko Kurimoa tutkimusryhmineen mahdollisuudesta esittää

seuraava esimerkki automaattisen sisällönkuvailun nykytilasta

users.ics.aalto.fi/jorma/scholar.google.com/citations?user=suHzeyIAAAAJ&hl=en

users.ics.aalto.fi/mikkok/elec.aalto.fi/en/about/careers/professors/mikko_kurimo/

Timo Honkela, 11.3.2014

Puhujan-tunnistus

Videokuva-analyysi

Puheentunnistus(puheesta tekstiksi)

Timo Honkela, 11.3.2014

Videokuva-analyysi

Puhujan-tunnistus

Puheentunnistus(puheesta tekstiksi)

Tekstin-tunnistus(OCR)

Timo Honkela, 11.3.2014

Mahdollisuuksia:

Tulkinnan kontekstisidonnaisuudenja yksilöllisyyden

mallintaminen

Timo Honkela, 11.3.2014

GICA: Grounded IntersubjectiveConcept Analysis

Sanat,fraasit,tulkinnat tms.

Kontekstit

Yksilöt

Timo Honkela, 11.3.2014

Sanan “health” käytön analyysiState of the Union -puheissa

Subjects on objects in contexts: Using GICA method to quantify epistemological subjectivity. Timo Honkela, Juha Raitio, Krista Lagus, Ilari T. Nieminen, Nina Honkela, and Mika Pantzar.IJCNN 2012.

Timo Honkela, 11.3.2014

Mikkelin ja Helsingintyönjako professuurin

puitteissa

Dynaaminen suunnitelma: sisältö elää ja kokonaistavoitteiudenaikatauluja ei anneta, koska se aiheuttaa tehottomuutta ja

vääränlaista kaavamaisuutta!

(vrt.kommunismin ja suunnitelmatalouden epäonnistuminen)

Timo Honkela, 11.3.2014

MIKKELI Tutkimus Opetus Soveltaminen

Kansalliskirjasto

MUC Vierailuesitelmät

MAMK

Otavan opisto

DigitalMikkeli

Digitaalisten aineistojen

jalostaminen ja sisältöanalyysi;

Koneoppimisen ja joukkoistamisen soveltaminen;

Kirjastojen kehittyvä rooli ja

toimintatavat

Soveltuvin osin siirrot tuotanto-

järjestelmiin

Kansalais- ystävällinen

tietoyhteiskunta

Joukkoistaminen ja koneoppiminen

tietoyhteis- kunnan välineiksi;

Merkitys- ja vuorovaikutus-

teoria; Kansalais- ystävällinen

tietoyhteiskunta

Tutkimukseen liittyvien

opinnäytetöiden ohjaus

Tietoyhteis-kuntasovellukset

(erit.kunnallis- hallinto)

Osallistuva tutkimus

Tietoyhteis-kuntasovellukset

(erit.itse- ohjautuvuus)

Erilaiset sovellukset (erit. KK:n ja MAMKin

kautta)Versio 0.51

Timo Honkela, 11.3.2014

HELSINKI Tutkimus Opetus Soveltaminen

Nykykielten laitos

Filosofian laitos Työpajat

Aalto-yliopisto

Merkitys- ja vuorovaikutus-

teoria; Tekstilouhinnan menetelmät ja sovellukset; Monikielinen

kieliteknologia; Variaation tutkimus

Digitaalisen humanismin seminaari- ja luento-opetus (mahdollisuus

etäläsnäoloon); Tilastollisen

kieliteknologian ja siihen liittyvän

filosofian opetus

Tietojenkäsittely- tieteen laitos

Teksti- ja sisältö-louhinnan

menetelmät ja sovellukset;

Koneoppimisen menetelmät

Digital Humanities Hackathon (mukana

humanistinen tiedekunta)

Merkitys- ja vuorovaikutus-

teoria;

Kuluttajatutkimus- laitos

Rikkaiden kontekstien tutkimus;

Hyvinvointi- sovellukset

Helsingin yliopisto kokonaisuutena

Tietoyhteis-kuntasovellukset (erit.hyvä hallinto ja vuorovaikutus)

Koneoppiminen ja sovellukset; Monimedia-

analyysi (puhe, video);

Sentimentti- analyysi

Seminaarit, joissa sisältö- ja/tai osallistuja- yhteistyö

Versio 0.51

(osa HY:a 2015)

' '

Timo Honkela, 11.3.2014

Tämän lisäksi

● Muu kansallinen yhteistyö– Digitaalisuus opetuksessa

(mm. uudistuva ylioppilastutkinto)

– Tampereen, Jyväskylän ja Turun yliopisto

● Kansainvälinen yhteistyö ja verkostoituminen– Muistiorganisaatiot

– Digitaalinen humanismi

– Koneoppiminen ja hahmontunnistus

Timo Honkela, 11.3.2014

Liiketoimintaympäristöstäja -mahdollisuuksista

Timo Honkela, 11.3.2014

Toimintaympäristön kokonaisvaltainen muutos on käynnissä, 1

● Digitaaliset välineet ovat muuttaneet sisältö-tuotannon työnjakoa ja kustannusrakennetta

● Tietoverkko on mahdollistanut sisältöjen jakelun ja jakamisen

● Ihmisten odotukset ja vaatimukset sisältöjen ja hinnan suhteet ovat muuttuneet olennaisesti

● Personointi- ja suosittelutekniikat ovat muokanneet tuotteiden ja palvelujen myynnin tapoja

Timo Honkela, 11.3.2014

Toimintaympäristön kokonaisvaltainen muutos on käynnissä, 2

● Ansaintalogiikoissa on tapahtunut todennäköisesti peruuttamattomia muutoksia

● Suositut palvelut ovat ilmaisia ja keräävät tehokkaasti mainosdollarit ja -eurot

● Tekijänoikeus- ja ipr -lainsäädäntö suojaa käytännössä vain suuria ja taloudellisesti vahvoja toimijoita sekä hidastaa innovaatiosykliä

● Yksityisyydensuoja on pitkälti murentunut – tai: palannut takaisin kyläyhteisön tapaiseen tilanteeseen

Timo Honkela, 11.3.2014

Toimintaympäristön kokonaisvaltainen muutos on käynnissä, 3

● Pääomien suhteellisen vapaan liikkuvuuden takia investoinnit valuvat tarpeettomankin laajasti rajojemme ulkopuolelle (suomalaisten käänteinen NIH-ilmiö)

● Esimerkiksi mediasektorilla suurimmatkin kansalliset toimijat ovat vaarassa jäädä kansainvälisen kilpailun jalkoihin

Timo Honkela, 11.3.2014

Toimintaympäristön kokonaisvaltainen muutos on käynnissä, 4

● Valtaosa suomalaisesta investointikapasiteetista(eläkevakuutukset) sijoitetaan kilpailijoiden aseman parantamiseen Suomen rajojen ulkopuolelle riskien hajauttamisen nimissä

● Automaatio ja robotisaatio muuttavat työn tekemisen puitteita niin, että 20-30 vuoden tähtäimellä koneet pystyvät ainakin periaatteessa korvaamaan ihmisen hyvin suuressa osassa nykyisistä työtehtävistä

Timo Honkela, 11.3.2014

Timo Honkela, 11.3.2014

Mitä jää jäljelle?

IHMINEN PALJON TÖITÄ&

Yrityksille

Lainsäätäjille

“Isojenkin laivojen” kulkiessa olkoot itsemääräämisoikeus ja inhimillinen yhteistyö kehityksen keskiössä

top related