timo honkela, kansalliskirjasto | digitalmikkeli-aamukahvit 11.3.2014
Post on 11-Nov-2014
456 Views
Preview:
DESCRIPTION
TRANSCRIPT
Timo Honkela, 11.3.2014
Digitaalisen humanismin tutkimuksesta ja
uusista liiketoiminta-mahdollisuuksista
Timo Honkela
11.3.2014
-esitelmä
Helsingin yliopistoNykykielten laitos
KansalliskirjastoDigitointi- ja
konservointikeskus
Timo Honkela, 11.3.2014
Digitaalinen humanismi
● Humanististen tieteiden tutkimusta tietokoneiden avulla– Digitaaliset aineistot
– Laskennalliset mallit
● Teesit:– Paperia osataan jo valmistaa ja kuuhun osataan
lentää
– Tärkeimmät ratkaisemattomat kysymykset maailmassamme liittyvät humanististen ja sosiaalitieteiden alueelle
Timo Honkela, 11.3.2014
Digitaalisten aineistojentutkimuksesta
Timo Honkela, 11.3.2014
Arkistot
Kirjastot
Yliopistot
Kansalaiset
Tutkijat
Media
DIGITAALISETAINEISTOT
Museot
Opettajat
Taiteilijat
Yritykset
Yhdistykset
Kunnat
ValtioPäätöksen-
tekijät
Toimittajat
Informaatikot
Timo Honkela, 11.3.2014
Tekstit
Kuvat
Videot
Laskennallisetmallit
Numeerisetaineistot
DIGITAALISET AINEISTOT
Ääni-tallenteet
Monimedia-dokumentit
Vuorovaikutteisetjärjestelmät
Tietokone-ohjelmat
Timo Honkela, 11.3.2014
Aineisto
Sisältö- jainformaatio-
ammattilaiset
Aineistoistakiinnostuneetmaallikot ja
asianharrastajat
Koneoppimis- jahahmontunnistus-
järjestelmät
Formaali metadata
Kieliteknologisetresurssit jajärjestelmät
Sisällönkuvailun muut muodot
Timo Honkela, 11.3.2014
Lähiaikojentutkimusaiheita
Timo Honkela, 11.3.2014
Skannattujen tekstienlaadun parantaminen
lääniiT firtgemööriltö pyytänyt, että Satvonlinnan tailvlingin poliisilaitokseen määrättäisiin paltuelemaon Mikkelin poliisilaitokssei!...
määräyksestä tilapäifesil Sawonlinnasta muuannekin lähettää, Siltä »aralta, ettei pyydettyä mieliistöä saada Mikkelistä riittämään, anoo maistraatti, että sille myönnettäisiin siitä määrärahasta, jola Mik» kelin lääniä warten on...
Timo Honkela, 11.3.2014
Laatutekstiä
OCR-tekstiä
Kielimalli
Tunnistin
KorjainParempaa
tekstiä
Tuotanto-Järjestelmä
Ocricola-osahanke (Helsinki+Mikkeli)
Timo Honkela, 11.3.2014
Sisältöanalyysi:
ihmiset paikat
tapahtumatteemat
sentimentit
Paukkeri, Nieminen, Pöllä & Honkela. A languageindependent approach to keyphrase extraction and evaluation. Coling 2008.
Honkela, Korhonen, Lagus & Saarinen. Fivedimensional
sentiment analysis of corpora, documents and
words. WSOM 2014 (to appear).
Menetelmiä
Timo Honkela, 11.3.2014
Haasteita:
Sisältökuvauksien käytettävyyden jayhtenäisyyden tavoitteen
ja
kielen ja tulkinnan moninaisuuden,muuttumisen, laji- ja tyylivariaation,
yksilöllisyyden ja kulttuurisidonnaisuuden
välinen jännite
Timo Honkela, 11.3.2014
Tulkinnan moninaisuusja kontekstisidonnaisuus
“Shall I Compare Thee To A Summer's Day”
Pieni norsu versus suuri hiiri
Kaunis rantamaisema, maalaus tai sävellys
Demokratia, tasa-arvo, yhdenvertaisuus,kestävä kehitys, oikeudenmukaisuus, ...
Timo Honkela, 11.3.2014
Mahdollisuuksia
Kontekstitiedon tallentaminenaiempaa suuremmassa mittakaavassa
Inhimillisen tulkinnananalysointi ja tulosten
hyödyntäminen aineistojenmerkkaamisessa
Sisältöanalyysikoneoppimisen ja
hahmontunnistuksenkeinoin
Timo Honkela, 11.3.2014
Chemistry
Physics andengineering
Biosciences
Medicine
Culture and society
Tuotettu automaattisesti ilman ihmisluokitteluita Suomen Akatemialle osoitetuista3324 hakemuksesta käyttäen tilastollista termi-irrotusta ja itseorganisoivaa karttaa.
Tila
stol
linen
ter
mi-i
rrot
us:
ks.
Pau
kker
i et a
l. 20
08
Hon
kela
& K
lam
i 200
7Suomen tieteen kartta
Timo Honkela, 11.3.2014
Analyzing Emotional Semantics of Abstract Art Using Low-Level Image Features.He Zhang , Eimontas Augilius , Timo Honkela, Jorma Laaksonen, Hannes Gamper and Henok Alene, Proceedings of IDA 2011.
Timo Honkela, 11.3.2014
Kysymys:
Milloin apuvälineet ovatkehittyneet niin pitkälle, että
voimme tunnistaa uutislähetyksestäuutislukijan tai haastateltavankasvoista tai äänensävystä,
päätellä aihealueenvideokuvasta ja muuttaa
eri puhujien äänen tekstiksi?
Timo Honkela, 11.3.2014
Timo Honkela, 11.3.2014
Kiitän Jorma Laaksosta ja Mikko Kurimoa tutkimusryhmineen mahdollisuudesta esittää
seuraava esimerkki automaattisen sisällönkuvailun nykytilasta
users.ics.aalto.fi/jorma/scholar.google.com/citations?user=suHzeyIAAAAJ&hl=en
users.ics.aalto.fi/mikkok/elec.aalto.fi/en/about/careers/professors/mikko_kurimo/
Timo Honkela, 11.3.2014
Puhujan-tunnistus
Videokuva-analyysi
Puheentunnistus(puheesta tekstiksi)
Timo Honkela, 11.3.2014
Videokuva-analyysi
Puhujan-tunnistus
Puheentunnistus(puheesta tekstiksi)
Tekstin-tunnistus(OCR)
Timo Honkela, 11.3.2014
Mahdollisuuksia:
Tulkinnan kontekstisidonnaisuudenja yksilöllisyyden
mallintaminen
Timo Honkela, 11.3.2014
GICA: Grounded IntersubjectiveConcept Analysis
Sanat,fraasit,tulkinnat tms.
Kontekstit
Yksilöt
Timo Honkela, 11.3.2014
Sanan “health” käytön analyysiState of the Union -puheissa
Subjects on objects in contexts: Using GICA method to quantify epistemological subjectivity. Timo Honkela, Juha Raitio, Krista Lagus, Ilari T. Nieminen, Nina Honkela, and Mika Pantzar.IJCNN 2012.
Timo Honkela, 11.3.2014
Mikkelin ja Helsingintyönjako professuurin
puitteissa
Dynaaminen suunnitelma: sisältö elää ja kokonaistavoitteiudenaikatauluja ei anneta, koska se aiheuttaa tehottomuutta ja
vääränlaista kaavamaisuutta!
(vrt.kommunismin ja suunnitelmatalouden epäonnistuminen)
Timo Honkela, 11.3.2014
MIKKELI Tutkimus Opetus Soveltaminen
Kansalliskirjasto
MUC Vierailuesitelmät
MAMK
Otavan opisto
DigitalMikkeli
Digitaalisten aineistojen
jalostaminen ja sisältöanalyysi;
Koneoppimisen ja joukkoistamisen soveltaminen;
Kirjastojen kehittyvä rooli ja
toimintatavat
Soveltuvin osin siirrot tuotanto-
järjestelmiin
Kansalais- ystävällinen
tietoyhteiskunta
Joukkoistaminen ja koneoppiminen
tietoyhteis- kunnan välineiksi;
Merkitys- ja vuorovaikutus-
teoria; Kansalais- ystävällinen
tietoyhteiskunta
Tutkimukseen liittyvien
opinnäytetöiden ohjaus
Tietoyhteis-kuntasovellukset
(erit.kunnallis- hallinto)
Osallistuva tutkimus
Tietoyhteis-kuntasovellukset
(erit.itse- ohjautuvuus)
Erilaiset sovellukset (erit. KK:n ja MAMKin
kautta)Versio 0.51
Timo Honkela, 11.3.2014
HELSINKI Tutkimus Opetus Soveltaminen
Nykykielten laitos
Filosofian laitos Työpajat
Aalto-yliopisto
Merkitys- ja vuorovaikutus-
teoria; Tekstilouhinnan menetelmät ja sovellukset; Monikielinen
kieliteknologia; Variaation tutkimus
Digitaalisen humanismin seminaari- ja luento-opetus (mahdollisuus
etäläsnäoloon); Tilastollisen
kieliteknologian ja siihen liittyvän
filosofian opetus
Tietojenkäsittely- tieteen laitos
Teksti- ja sisältö-louhinnan
menetelmät ja sovellukset;
Koneoppimisen menetelmät
Digital Humanities Hackathon (mukana
humanistinen tiedekunta)
Merkitys- ja vuorovaikutus-
teoria;
Kuluttajatutkimus- laitos
Rikkaiden kontekstien tutkimus;
Hyvinvointi- sovellukset
Helsingin yliopisto kokonaisuutena
Tietoyhteis-kuntasovellukset (erit.hyvä hallinto ja vuorovaikutus)
Koneoppiminen ja sovellukset; Monimedia-
analyysi (puhe, video);
Sentimentti- analyysi
Seminaarit, joissa sisältö- ja/tai osallistuja- yhteistyö
Versio 0.51
(osa HY:a 2015)
' '
Timo Honkela, 11.3.2014
Tämän lisäksi
● Muu kansallinen yhteistyö– Digitaalisuus opetuksessa
(mm. uudistuva ylioppilastutkinto)
– Tampereen, Jyväskylän ja Turun yliopisto
● Kansainvälinen yhteistyö ja verkostoituminen– Muistiorganisaatiot
– Digitaalinen humanismi
– Koneoppiminen ja hahmontunnistus
Timo Honkela, 11.3.2014
Liiketoimintaympäristöstäja -mahdollisuuksista
Timo Honkela, 11.3.2014
Toimintaympäristön kokonaisvaltainen muutos on käynnissä, 1
● Digitaaliset välineet ovat muuttaneet sisältö-tuotannon työnjakoa ja kustannusrakennetta
● Tietoverkko on mahdollistanut sisältöjen jakelun ja jakamisen
● Ihmisten odotukset ja vaatimukset sisältöjen ja hinnan suhteet ovat muuttuneet olennaisesti
● Personointi- ja suosittelutekniikat ovat muokanneet tuotteiden ja palvelujen myynnin tapoja
Timo Honkela, 11.3.2014
Toimintaympäristön kokonaisvaltainen muutos on käynnissä, 2
● Ansaintalogiikoissa on tapahtunut todennäköisesti peruuttamattomia muutoksia
● Suositut palvelut ovat ilmaisia ja keräävät tehokkaasti mainosdollarit ja -eurot
● Tekijänoikeus- ja ipr -lainsäädäntö suojaa käytännössä vain suuria ja taloudellisesti vahvoja toimijoita sekä hidastaa innovaatiosykliä
● Yksityisyydensuoja on pitkälti murentunut – tai: palannut takaisin kyläyhteisön tapaiseen tilanteeseen
Timo Honkela, 11.3.2014
Toimintaympäristön kokonaisvaltainen muutos on käynnissä, 3
● Pääomien suhteellisen vapaan liikkuvuuden takia investoinnit valuvat tarpeettomankin laajasti rajojemme ulkopuolelle (suomalaisten käänteinen NIH-ilmiö)
● Esimerkiksi mediasektorilla suurimmatkin kansalliset toimijat ovat vaarassa jäädä kansainvälisen kilpailun jalkoihin
Timo Honkela, 11.3.2014
Toimintaympäristön kokonaisvaltainen muutos on käynnissä, 4
● Valtaosa suomalaisesta investointikapasiteetista(eläkevakuutukset) sijoitetaan kilpailijoiden aseman parantamiseen Suomen rajojen ulkopuolelle riskien hajauttamisen nimissä
● Automaatio ja robotisaatio muuttavat työn tekemisen puitteita niin, että 20-30 vuoden tähtäimellä koneet pystyvät ainakin periaatteessa korvaamaan ihmisen hyvin suuressa osassa nykyisistä työtehtävistä
Timo Honkela, 11.3.2014
Timo Honkela, 11.3.2014
Mitä jää jäljelle?
IHMINEN PALJON TÖITÄ&
Yrityksille
Lainsäätäjille
“Isojenkin laivojen” kulkiessa olkoot itsemääräämisoikeus ja inhimillinen yhteistyö kehityksen keskiössä
top related